小米在AI 耕耘多年,全力拥抱生成式AI 发展浪潮。小米创始人/董事长雷军表示,在AI 团队建设方面,小米自2016 年组建AI 团队以来,到2023 年4 月第一时间成立专职大模型团队,经过多次扩展,小米AI 团队相关人员规模已达3000 多人,逐步建立了视觉、语音、声学、知识图谱、NLP、机器学习、多模态等AI 技术能力。目前,小米不断加码AI 人才与资金投入,对未来AI 与算力发力愈发明显。人才方面,据第一财经去年12 月报道,DeepSeek 开源大模型DeepSeek-V2 的关键开发者之一罗福莉将加入小米,或供职于小米AI 实验室,领导小米大模型团队;算力方面,据界面新闻,小米正在着手搭建自己的GPU 万卡集群,将对AI 大模型大力投入。小米大模型团队在成立时已有6500 张GPU 资源;研发投入方面,在去年12 月举行的小米人车家全生态合作伙伴大会上,小米集团总裁卢伟冰表示,预计2024 年小米研发费用将达到240 亿元,2025 年更是将攀升至300 亿元,主要聚焦于AI、OS、芯片三大底层技术的研发。
小米大模型主攻轻量化、本地部署,二代大模型MiLM2 全面提升云、端大模型能力。2023 年,小米凭借独特的技术洞察,开创性地提出了将"轻量化、本地部署"作为突破点,业界第一个在手机芯片NPU 上跑通十亿参数规模大语言模型,验证了端侧小模型在部分目标场景可以取得媲美云端大模型的效果。2024 年11 月,小米大模型已经实现了从一代到二代(MiLM2)的升级迭代:1)第二代大语言模型丰富了模型的参数矩阵,参数规模同时向下和向上扩充,实现了云边端结合,参数尺寸最小为0.3B,最大为30B;在10 大能力维度上,相比于第一代模型平均提升超过45%,其中指令跟随、翻译、闲聊等对于智能助手而言比较关键的能力上,效果处于业界前列;在端侧部署上支持3 种推理加速方案,包括大小模型投机、BiTA、Medusa,并且自研量化方案相比于业界标准高通方案,量化损失降低78%;支持的最长窗口为200k(第一代为4k),在长文本评测中,效果处于业界前列。
小米大模型力图与自身业务深度协同,云边端结合模型矩阵赋能“人车家全生态”。
MiLM2 模型矩阵主要在参数规模和模型结构两个方面打造纵深,目的是为了适应多元化的业务场景并在小米生态中挖掘更多的落地场景。大模型的参数规模灵活扩展至0.3B、0.7B、1.3B、2.4B、4B、6B、13B、30B 等多个量级,以适应不同场景下的需求,其中 4B 模型端侧落地,30B 模型云端部署。小米的AI 技术能力已逐步接入手机、汽车、AIoT、机器人等业务板块,端侧赋能加速。2023 年10 月,小米发布全球首个人车家全生态操作系统澎湃OS,60 亿参数自研大模型在端侧部署运行,部分场景性能媲美极大参数量云端大模型;2024 年10 月,小米发布澎湃OS 2,带来三项核心技术革新——HyperCore、HyperConnect、HyperAI,升级后的HyperAI,将端云大模型矩阵、多设备端侧感知、跨端执行能力全面整合,拥有更多AI 功能,包括AI 写作、AI 识音、AI 字幕,以及小米平板上可使用的AI妙画等;此外,小米还推出了全生态AI 智能助手——超级小爱,利用多模态能力,简化用户面对海量设备时复杂的操作,打通感知-理解-执行的全链路操作。
投资建议。建议关注小米链相关公司:小米集团、金山云、金山办公、世纪互联、金山软件、虹软科技、寒武纪、海光信息、恒玄科技、火炬电子、润欣科技、中微半导等。
风险提示:技术落地不及预期、AI 端侧渗透不及预期、算力采购不及预期等。
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:刘畅 )
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
【广告】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论