春节期间,全球AI 热点涌现,利好频出。OpenAI 带头执行AI 芯片投资计划并发布文生视频新品Sora,英伟达正式发布此前已经有所展示的AI 本地部署RAG 工具Chat with RTX,谷歌更新Gemini 至1.5 版本。
OpenAI 宏伟投资计划,剑指改革全球半导体。据华尔街日报消息,OpenAI正在打造全球芯片供应链,来彻底重塑全球半导体行业,Altman 一直在关注AI 芯片的供需问题,2018 年,Altman 个人投资了一家AI 芯片初创公司Rain Neuromorphics,2019 年,OpenAI 花费5100 万美元购买Rain 的芯片;去年11 月,Altman 为一家代号为“Tigris”的芯片企业寻求数十亿美元的资金。我们认为,从远期来看,算力需求或持续超出我们的想象,如果仅依靠台积电的先进制程产能进行供应,或难以满足未来AI 用户持续增长带来的供应缺口,而另起炉灶,构建一套由OpenAI 自己领导的算力产业链,当下来看是OpenAI 切入基础设施领域的可行方案。
文生视频大模型Sora 横空出世,其能够理解并呈现物理定律,影视动画行业的颠覆性时刻到来。Sora 虽然仍旧使用Transformer 架构和基于扩散模型,但最大变化在于其能够在生成的视频中展现出火焰反光、物体运动惯性等自然界规律;同时相较于其他扩散模型,视频可以保持相当高的稳定性和一致性,因此,Sora 呈现的AI 视频给用户一种连续性强、符合逻辑、具有一定观赏性的感觉。最重要的是,Sora 依旧符合AI 缩尺律(Scaling Law),OpenAI 在技术文档中说明,随着训练计算量的增加,样本质量明显提高,进一步佐证了多模态时代,算力需求将成为最核心的瓶颈之一。
Gemini 1.5 将实现大模型最大的上下文窗口。相较于Gemini 1.0,1.5 最主要的改进是处理大文件的能力,Gemini 1.5 Pro 每次可以处理100 万个token,结合原生多模态能力,其可以一次性处理大量信息,例如1 小时的视频、11 小时的音频、超过3 万行(或70 万个单词)的代码。Gemini 基于MoE(Mixture-of-Experts)专家网络,根据给定的输入,MoE 模型将选择性地激活其神经网络中最相关的专家路径,从而极大提高模型效率。
Chat with RTX——AI 助理的一小步,边缘推理的一大步。该工具可以使用Mistral、Llama 2 等开源模型,帮助用户阅读文档/视频并通过检索增强生成(RAG)总结文件内容,全程由本地RTX 显卡进行推理。我们认为,边缘推理是AI 触及广大潜在用户的“毛细血管”,世界经济论坛在最近的一份报告中预测,能够离线运行生成式AI 模型的设备将“大幅增长”,其中包括个人电脑、智能手机、物联网设备等,原因在于,本地模型不仅更加私密,而且与云托管模型相比,本地模型的延迟更低,成本效益更高。
总结来看,近期的AI 行业新闻,在模型层面各家激战正酣,同时在ScalingLaw 不断应验的事实下,我们此前对算力需求充分乐观的观点将持续被验证,AI 算力有望继2023 年后,继续成为新一年的热门投资方向。
2 月22 日(下周四)早6:00 英伟达将公布上季度财报,建议密切关注。
算力——
光通信:中际旭创、新易盛、天孚通信、太辰光、腾景科技、光库科技、光迅科技、德科立、联特科技、华工科技、源杰科技、剑桥科技、铭普光磁。
算力调优/调度/租赁:恒为科技、思特奇、中科金财、东方材料、博睿数据、中贝通信、中科曙光、中国移动、中国联通、中国电信。算力设备:中兴通讯、紫光股份、锐捷网络、盛科通信、菲菱科思、工业富联、沪电股份、寒武纪。液冷:英维克、申菱环境、高澜股份、佳力图。边缘算力承载平台:
美格智能、广和通、移远通信。卫星通信:中国卫通、中国卫星、震有科技、华力创通、电科芯片、海格通信。
数据要素——
运营商:中国电信、中国移动、中国联通。数据可视化:浩瀚深度、恒为科技、中新赛克。BOSS 系统:亚信科技、天源迪科、东方国信。
风险提示:AI 发展不及预期,算力需求不及预期,市场竞争风险。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:王丹 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
最新评论