在4月11日阿里云峰会后的媒体见面会上,阿里云CTO周靖人表示,通义千问可给企业提供一键生成式服务,结合自身能力帮助企业实现专属大模型。他表示,打造一款人工智能大模型,不是将算力芯片简单堆叠,更是一个系统的工程。目前GPT4仍处于领先地位,但阿里云的通义千问每周都在迭代,每周都在进步,期待下一阶段能贡献技术方面的创新。
几行代码就可以调用生成自己的AI大模型
在阿里云峰会现场,周靖人表示:“所有软件都值得接入大模型升级改造,我们将开放通义千问的能力,帮助每家企业打造自己的专属大模型。”
在现实情况中,尽管对大模型的应用需求将井喷,但训练大模型的门槛极高。随着AI模型变大,AI产业正从“手工作坊”组成的轻工业走向集约化生产,需要高性能、低成本的体系化基础设施才能完成工业化生产。国内绝大部分中小公司没有能力自建动辄需千卡甚至万卡以上的大模型基础设施,即便对于很多头部企业,从0到1不断训练、优化大模型也并不经济,各行各业都需要成本足够低的AI基础设施。
如何帮助企业来打造自己的大模型,在会后的媒体采访中,周靖人做了进一步的解释,所有的企业数据,不需要做任何的数据预处理,不管是ppt、文字、图片、视频,都可以授权到数据空间里,通义千问一键式生成企业的专属大模型。“企业通过几行代码就可以调用模型,不需要从头开始训练,把个性化诉求加入到模型里,所有的模型都能通过自动化生成。我们还可以提供完善的API开发流程,所有这一系列都能自动化探索和创新,真正意义上把通义千问的能力发挥出来,解决各行业的实际问题。只需要基于通义千问模型,二次开发就可以。”
GPT4还处于领先地位但通义千文每周都在进步
谈到人工智能大模型,ChatGPT是一个绕不开的坎。周靖人表示,对于ChatGPT的一夜爆红,他一点都不意外,这是人工智能进步的必然一步。
他承认,OpenAI是目前全球大模型研究领域的引领者,ChatGPT是非常优秀的模式,通义千问目前还在不断学习和成长中。尤其GPT-4在推理、数学等方面有了非常不错的表现,通义千问尚不能及。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面。“我们需要去取长补短,弥补我们中间的不足。通义千问每周都在进步,过一段时间,你会发现他又学会了很多东西,进步很大。”他期待,下一阶段阿里云可以贡献技术的创新。
算力不是简单的GPU叠加而是一项系统性工程
在目前的AIGC赛道中,算力是制约行业也发展的一大难题。周靖人表示,动辄超千亿参数的大模型研发,不是单一的算法问题,也不是靠简单堆积GPU就能实现的,这是囊括了底层算力、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,需要AI-云计算的全栈技术能力。阿里是全球少数在这几个领域都有深度布局、长久积累的科技公司之一,也是为数不多拥有超万亿参数大模型研发经验的机构。
事实上,阿里云从2019年开始投入大模型研发,是国内大模型领域最早的先行者,其曾训练完成全球首个10万亿参数AI大模型,近期又推出实测效果接近ChatGPT的大模型“通义千问”,阿里云已通过自身实践锤炼出了国内唯一支撑过万亿参数以上大模型的“飞天智算基础设施”。
网站建设开发|APP设计开发|小程序建设开发