计算机行业周报:大模型内卷升级 国内外发布会精彩纷呈

2024-05-20 12:05:07 和讯  华福证券钱劲宇
  投资要点:
  本周AI 新闻速递:
  国内AI:( 1)混元文生图大模型开源,可免费商用。 2)零一万物开源Yi-1.5 系列模型。( 3)MOE 模型再突破,专家激活率显著提升。
  4)百度发布Robotaxi 成果与L4 级自动驾驶大模型Apollo ADFM。
  5)未来智能发布讯飞会议耳机Pro 2、iFLYBUDS 2 和Kit 2。( 6)联发科发布新一代AI 芯片,端侧落地加速。
  国外AI:( 1)打破Decoder-Only 架构壁垒,Decoder-Decoder 架构YOCO)横空出世。( 2)OpenAI 推出端到端人工智能模型 GPT-4o,并免费开放。( 3)美国加州正测试CHATGPT 等生成式AI 在四大部门的应用。谷歌DeepMind 发布了一款全新的AI 代理 Agent)产品ProjectAstra。( 4)谷歌发布第六代TPU 芯片Trillium。 5)谷歌DeepMind 发布了一款全新的AI 代理 Agent)产品Project Astra。 6)英伟达与谷歌合作发布大模型Gemma 2 和 PaliGemma。
  大模型内卷升级,国内外发布会精彩纷呈
  OpenAI:发布端到端大模型GPT-4o。GPT-4o 支持文字、音频、图像任意组合的输入和输出。GPT-4o 对于音频的响应时间平均为320毫秒,对比GPT 3.5( 2.8 秒)与GPT 4( 5.4 秒)显著缩短,与人类的响应时间基本一致。综合能力达到第一梯队,多模态及代码能力上领先显著。定价上,GPT-4o 相对GPT-4 Turbo,输入/输出价格分别减半,分别为$5/$15/百万tokens。同时,GPT-4o 的速率限制支持每分钟最多1000 万tokens。
  Google:公布了22 项AI 产品及技术,软硬件全栈生态均有升级。
  Gemini 1.5 Pro 上下文长度翻倍至200 万tokens,能够处理1500 页PDF,30000 行代码或者1 小时的视频,在代码生成、逻辑推理和规划、多轮对话、音频与图像理解能力等多项能力上也有升级,支持35 种语言。
  字节跳动:发布豆包大模型9 大家族产品。其中pro 版上下文长度达128K,全系列可精调;lite 版具备较快的响应速度,延迟降低50%。
  定价再创新低。32K 上下文长度,pro 版价格为0.0008 元/千tokens,比行业低99.3%;128K 上下文长度,pro 版价格为0.005/千tokens,比行业价格低95.8%。
  腾讯:正式推出混元pro、standard、lite 等多种尺寸模型。综合性能上,模型较上一代提升50%,部分中文能力追平GPT-4,图像、视频、3D 等多模态能力都具备且有一定升级。目前已在600 多个腾讯内部业务和场景中落地。知识管理引擎借助LLM+RAG,显著降低大模型幻觉,帮助企业快速搭建企业知识库及应用。
  风险提示
  大模型迭代不及预期的风险;大模型商业落地不及预期的风险等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

有问必答- 持牌正规投资顾问为您答疑解惑

    热门阅读

      和讯特稿

        推荐阅读