阿里云CTO周靖人:GPT4处于领先地位 通义千问每周迭代进步

2023-04-12 14:27:57 凤凰网 

凤凰网科技讯 4月12日消息(作者/蒋浇) 4月11日,在2023阿里云峰会上,阿里版ChatGPT通义千问正式亮相。阿里云智能首席技术官周靖人提出,所有的软件都值得接入大模型升级改造,阿里将开放通义千问的能力,帮助每家企业打造专属大模型。

在如火如荼的生成式AI浪潮面前,国内已有不少科技企业顺势推出大模型,这些大模型免不了与ChatGPT做比较。

谈及这一话题,周靖人接受凤凰网科技等媒体采访时表示,圈内人对于ChatGPT的走红并不感到意外,阿里在19年就启动了大模型的研发,通义千问并不是为了针对ChatGPT而做的,它并不是终态,未来还会有更多的预训练大模型出现。

此前,阿里云已推出“通义”系列模型,包括通义-M6、通义-AliceMind和通义-视觉模型,而近期发布的超大规模语言模型通义千问,也是该系列的延续。据悉,通义千问具备多轮对话能力、文案创作能力,包括小说续写、邮件编写、企业策划等,同时具备多语言能力和多模态能力。

周靖人坦言,OpenAI是目前全球大模型领域的引领者,GTP4在各个方面都处于一个领先地位,尤其在推理、数学方面都有非常不错的表现,通义千问还不能及。而在文本对话、阅读理解方面,通义前问较为擅长,它每周都在迭代,每周都有进步。

在他看来,AI技术竞争处于一个你追我赶的态势,这是科技进步的一个必然阶段,大家需要取长补短,阿里希望在下一阶段能够贡献自己的技术创新。

同时,周靖人表示,阿里体系所有产品完成AI升级改造未有明确时间表,目前还有许多探索性的工作。可以确定的是,天猫精灵、钉钉会率先接入测试,将在评估认证后发布新功能。

AIGC竞赛中,算力通常被认为科技企业比拼的重点。周靖人对此表示,不要迷信参数,打造一款人工智能大模型,并不是依靠算力芯片的简单堆叠,这是囊括了底层算力、存储、大数据、AI框架的系统性工程,需要A+云计算的全栈技术能力。阿里是全球少有在几个领域都有深入布局和积累的科技公司之一。

对于科技大厂而言,除了继续追赶大模型训练和进行安全评估外,如何降低成本也是难题,这也是阿里云需要重点攻克的方向。

周靖人表示,如何对专属模型进行进一步成本的降低,能够有效的把真正解决行业问题所需要的那部分智能保留,把其他部分的智能能够节省下来,这中间有非常多的技术的创新和技术的突破,这正是阿里云在这方面比较有优势的地方。

云计算能带来极大的算力资源节约,周靖人指出,当前国内数据中心的CPU平均利用率在10%左右,而云数据中心内的CPU平均利用率,可以达到传统数据中心的5到10倍。阿里云对主售产品价格的大幅调低,将会促进云计算渗透率进一步提升,更好地满足智能化时代对的算力需求。

(责任编辑:周文凯 )
看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读