计算机行业研究：CHATGPT重大升级多模态拓宽应用边界

2023-10-09 18:20:04 和讯上海证券吴婷婷

　　市场回顾
　　过去一周（9.25-9.28）上证综指下跌0.70%，创业板指下跌0.47%，沪深300 指数下跌1.32%，计算机（申万）指数上涨0.21 %，跑赢上证综指0.91pct，跑赢创业板指0.68pct，跑赢沪深300 指数1.54pct，位列全行业第6 名。
　　周观点
　　ChatGPT 迎语音、图像功能，多模态打开广阔应用空间。9 月25 日，OpenAI 官宣将在ChatGPT 推出新的语音和图像功能，其中新的语音功能由新的文本转语音模型提供支持，图像理解由多模态GPT-3.5 和GPT-4 提供支持；上述功能允许用户展开语音对话或向ChatGPT 展示其正在谈论的内容；未来两周内Plus 和企业用户即可体验ChatGPT 的上述功能。同时，OpenAI 发布《GPT-4V（ision） system card》，该论文概述了OpenAI 为GPT-4 部署视觉功能的方式，以及分析GPT-4V的安全属性。论文指出GPT-4V 的训练在2022 年完成，并在2023 年3 月开始提供早期访问系统。9 月29 日，微软发布166 页GPT-4V 说明书《The Dawn of LMMs: Preliminary Explorations with GPT-4V（ision）》，对GPT-4V 在十大任务上的表现进行详细测评，具体包括开放世界视觉理解、视觉描述、多模态知识、常识、场景文本理解、文档推理、写代码、时间推理、抽象推理、情感理解，并给出了使用GPT-4V 的新提示词技巧。我们认为，多模态赋能之下，AI 应用落地将加速推进，大模型应用场景将有效丰富。
　　多模态拓宽应用边界，算力需求迎指数级增长。1）多模态大模型涌现、渐成趋势。10 月3 日，微软官网宣布将图像生成工具DALL-E3 集成在Bing Chat 和Bing Image Create 中，并免费提供给用户使用。
　　Midjourney 宣布今年之内将会推出性能对标DALL·E 3 的图像生成工具Midjourney V6；10 月4 日，澳大利亚设计软件公司Canva 与AI 视频初创公司 Runway 合作推出新的视频生成工具 Magic Studio，允许用户输入文字或上传静态图片生成长达18 秒视频。2）多模态对算力需求大幅攀升。语音、图像、视频数据大小显著高于文本，相对于文字交互有数个量级的提升。据SemiAnalysi 分析师Dylan Patel 和Daniel Nishball 透露，谷歌多模态大模型Gemini 算力高达~1e26FLOPS，是训练GPT-4 所需算力的5 倍。3）科技巨头自研AI 芯片，以减少对英伟达的依赖。10 月7 日，据外媒透露，微软将于下个月推出其首款人工智能芯片“雅典娜”，雅典娜将与英伟达H100 GPU 竞争；OpenAI 正探索自研AI 芯片，并且已经开始评估潜在收购目标。
　　投资建议
　　建议关注：1）AI 龙头：金山办公、科大讯飞、同花顺等，2）AI 应用/工具：鼎捷软件、软通动力、致远互联、拓尔思、星环科技、万兴科技、汉得信息等，3）AI 算力：工业富联、浪潮信息、神州数码、拓维信息、烽火通信、云赛智联等。
　　风险提示
　　下游景气度不及预期；政策推进不及预期；技术创新不及预期、行业竞争加剧。
【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

（责任编辑：王丹）

【免责声明】本文仅代表第三方观点，不代表和讯网立场。投资者据此操作，风险请自担。

看全文

写评论已有条评论跟帖用户自律公约

提交还可输入500字

计算机行业研究：CHATGPT重大升级多模态拓宽应用边界

最新评论

相关推荐

热门阅读

和讯特稿

计算机行业研究：CHATGPT重大升级 多模态拓宽应用边界

最新评论

相关推荐

热门阅读

和讯特稿

推荐阅读

计算机行业研究：CHATGPT重大升级多模态拓宽应用边界