计算机行业点评报告-中泰科技:AI大模型群星闪耀 解锁全新体验

2024-05-20 15:00:08 和讯  中泰证券孙行臻
  Open AI:多模态生成模型GPT-4o 发布,带来全新多模态交互体验。
  1)价格:GPT-4o 发布,现阶段对所有用户提供有限次免费试用机会,付费可无限使用;后期将在ChatGPT Plus 中面向合作伙伴推出带有GPT-4o 的新版本语音模式GPT-4o alpha。
  2)性能:GPT-4o 性能显著提高,成本降低,GPT-4o 的运行速度是GPT-4 Turbo的两倍,价格仅为其一半且能实现五倍的速率限制。文本、推理、编码智能方面的性能与GPT-4 Turbo 持平,多语言、音频、视觉功能上有显著突破。
  3)应用能力:具备实时的视频理解能力和多模态的集成能力,推动实时AI 视频通话;视觉能力显著提升;实时推理响应,能在232 毫秒内响应音频输入,平均响应时间为320 毫秒;语音交互能力提升,语种和情绪理解加强。
  谷歌I/O 大会发布AI 全家桶,AI 模型、多模态生成模型、AI 延展产品、硬件全面开花。
  1)AI 模型:升级版大模型Gemini1.5 Pro 支持100 万tokens 输入输出,API 版本支持150 万以上tokens 输入输出,私人预览版上下文窗口则已达200 万tokens;轻量模型Gemini 1.5 Flash 支持100 万tokens 上下文,且性价比高,成本低至0.35 美元/百万Tokens。
  2)多模态生成模型:文生视频大模型VEO 能制作1 分钟以上的1080p 视频,未来可能直接引入YouTube Shorts;文生图模型Imagen 3 生成图形视觉干扰减少,开源模型Gemma2 具备270 亿参数,性能提升两倍。
  3)AI 延展产品:Project Astra 智能助手具备摄像视频识别功能,Gemini Live 可以实现流畅的对话功能,对标GPT-4o;端侧Gemini Nano 也支持多模态支。
  4)硬件:第六代Trillium TPU 新发布,性能和能源效率显著提升,计算性能提高4.7 倍,HBM 容量和带宽增加一倍,ICI 带宽增加一倍,预计于2024 年底推出。
  字节:自研大模型“豆包”亮相,低价策略推出大模型家族,应用侧落地成果显著。
  1)性能:9 款豆包大模型发布,具备多模态能力,基于场景对模型能力做垂直细分,通过字节跳动内部50+业务场景实践验证,每日千亿级Token 大使用量持续打磨,提供多模态能力;豆包大模型身处第二梯队,计算方面创下高分,长文本处理差距较大但。
  2)价格优势:面通用模型Pro 的价格设定为小于32K 窗口尺寸,0.008 元/千tokens,低于行业均价99.3%;128K 窗口尺寸0.005 元/千tokens,比行业价格低95.8%,低价策略驱动豆包大模型迅速抢占C 段市场;3)应用:AI 对话助手“豆包”位列国内AIGC 应用榜一,语音功能是亮点;企业级AI 应用开发平台“扣子”支持1 万+生态插件。
  投资标的:国产大模型新玩家持续入局,应用层落地有望加速。随着多模态模型的“理解能力”和“实时交互能力”不断加强,AI 在C 端创意软件类应用和营销类应用以及B 端金融、教育、医疗、法律等领域的落地相对更加容易,掌握行业knowhow的B 端应用厂商目前依旧具备模型的选择权,AI 应用侧建议关注:金山办公、科大讯飞、万兴科技等。
  风险提示:技术迭代不及预期风险;行业竞争加剧风险;研究报告中使用的公开资料可能存在信息滞后或更新不及时的风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读