AIGC系列之29:商汤SENSENOVA5.0发布 全面接近GPT-4TURBO水平

2024-04-30 07:55:03 和讯  申万宏源研究洪依真/刘洋
  本期投资提示:
  2024 年4 月23 日,商汤科技技术交流日上发布日日新SenseNova5.0 大模型体系,完成云、端、边全栈布局,大模型综合能力全面对标GPT-4 Turbo,聚焦数学、推理、编程和多模态能力上的提升。
  持续探索知识-推理-执行的三层大模型能力架构。模型架构上:商汤日日新5.0 采用了GPT4 等万亿参数模型试用的MoE 机制。数据上:超10TB tokens 中英文预训练数据结合数千亿tokens 逻辑型合成数据,解决大模型对客观知识和世界初级认知的基础上提升高阶知识推理能力。
  基础模型能力升级:综合、语言、常识能力超GPT-4 Turbo。此前国内大模型在复杂逻辑、数学等能力上较海外仍有差距,日日新5.0 的发布聚焦于这类高阶知识能力的提升,数学、代码能力在GSM8K、GPQA、HumanEval 测试集上有所超越。多模态能力升级:国内大模型在“文生图”能力上均有迭代,但“图生文”能力展示较少,此前主流模型中仅阿里Qwen-VL 暂时能力位居前列。日日新5.0 展现了图文感知能力的提升,在多模态大模型权威综合基准测试MMBench 中综合得分排名首位,且在OpenCompass 多模态大模型榜单中位居第二,仅次于GPT-4v。
  云、端、边全栈大模型布局。商汤端侧大模型能够用于手机、车载等终端设备,端侧大语言模型推理速度在中端平台能够实现18.3 字/秒的平均生成速度,旗舰平台能够实现78.3字/秒;扩散模型推理速度现场演示小于1.5 秒,支持输出1200 万像素及以上的高清图片。
  边缘产品则推出了面向金融、医疗、政务、代码等垂类领域的商汤企业级大模型一体机,支持企业级千亿模型加速和知识检索硬件加速。
  根据我们内部测评:日日新5.0 中文文字能力达GPT-4 Turbo 水平;推理能力提升,但国产大模型的复杂推理能力整体较GPT4 仍有差距;多模态能力上展现较强图生文能力,属于国内领先水平;办公助手产品定位数据分析能力,非常适用于非技术人士进行无代码数据分析。
  此次发布启示:1)国内中文文字模型生成能力水平、上下文长度已经达到GPT-4 Turbo水平,复杂推理能力上较GPT-4 仍有差距。2)国内模型多模态能力正在来临。3)2024大模型在垂直场景的应用将持续深入。
  整体来看,市场可能认为海外大模型迭代放缓,但我们认为 2024 年模型能力仍然快速迭代,包括Open AI 以外的其他模型能力追赶、Llama3 多模态等开源大模型发布、下半年OpenAI 的新模型迭代等。市场可能认为国产大模型能力与海外差距极大,无法支撑任何应用,我们认为商汤日日新、kimi 等热度表明了国产大模型能力在文字方面已经达到GPT4 水平,高阶推理、多模态能力正在进行。
  推荐标的:金山办公、新致软件、同花顺、虹软科技、万兴科技、星环科技、润达医疗、科大讯飞、福昕软件、萤石网络、商汤科技、云从科技? 风险提示:大模型技术中美仍存在差异,部分技术尚处于早期实验室阶段,存在落地风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读