计算机行业研究:CHATGPT重大升级 多模态拓宽应用边界

2023-10-09 18:20:04 和讯  上海证券吴婷婷
  市场回顾
  过去一周(9.25-9.28)上证综指下跌0.70%,创业板指下跌0.47%,沪深300 指数下跌1.32%,计算机(申万)指数上涨0.21 %,跑赢上证综指0.91pct,跑赢创业板指0.68pct,跑赢沪深300 指数1.54pct,位列全行业第6 名。
  周观点
  ChatGPT 迎语音、图像功能,多模态打开广阔应用空间。9 月25 日,OpenAI 官宣将在ChatGPT 推出新的语音和图像功能,其中新的语音功能由新的文本转语音模型提供支持,图像理解由多模态GPT-3.5 和GPT-4 提供支持;上述功能允许用户展开语音对话或向ChatGPT 展示其正在谈论的内容;未来两周内Plus 和企业用户即可体验ChatGPT 的上述功能。同时,OpenAI 发布《GPT-4V(ision) system card》,该论文概述了OpenAI 为GPT-4 部署视觉功能的方式,以及分析GPT-4V的安全属性。论文指出GPT-4V 的训练在2022 年完成,并在2023 年3 月开始提供早期访问系统。9 月29 日,微软发布166 页GPT-4V 说明书《The Dawn of LMMs: Preliminary Explorations with GPT-4V(ision)》,对GPT-4V 在十大任务上的表现进行详细测评,具体包括开放世界视觉理解、视觉描述、多模态知识、常识、场景文本理解、文档推理、写代码、时间推理、抽象推理、情感理解,并给出了使用GPT-4V 的新提示词技巧。我们认为,多模态赋能之下,AI 应用落地将加速推进,大模型应用场景将有效丰富。
  多模态拓宽应用边界,算力需求迎指数级增长。1)多模态大模型涌现、渐成趋势。10 月3 日,微软官网宣布将图像生成工具DALL-E3 集成在Bing Chat 和Bing Image Create 中,并免费提供给用户使用。
  Midjourney 宣布今年之内将会推出性能对标DALL·E 3 的图像生成工具Midjourney V6;10 月4 日,澳大利亚设计软件公司Canva 与AI 视频初创公司 Runway 合作推出新的视频生成工具 Magic Studio,允许用户输入文字或上传静态图片生成长达18 秒视频。2)多模态对算力需求大幅攀升。语音、图像、视频数据大小显著高于文本,相对于文字交互有数个量级的提升。据SemiAnalysi 分析师Dylan Patel 和Daniel Nishball 透露,谷歌多模态大模型Gemini 算力高达~1e26FLOPS,是训练GPT-4 所需算力的5 倍。3)科技巨头自研AI 芯片,以减少对英伟达的依赖。10 月7 日,据外媒透露,微软将于下个月推出其首款人工智能芯片“雅典娜”,雅典娜将与英伟达H100 GPU 竞争;OpenAI 正探索自研AI 芯片,并且已经开始评估潜在收购目标。
  投资建议
  建议关注:1)AI 龙头:金山办公、科大讯飞、同花顺等,2)AI 应用/工具:鼎捷软件、软通动力、致远互联、拓尔思、星环科技、万兴科技、汉得信息等,3)AI 算力:工业富联、浪潮信息、神州数码、拓维信息、烽火通信、云赛智联等。
  风险提示
  下游景气度不及预期;政策推进不及预期;技术创新不及预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读