小米:开源语音模型 MiMo-Audio 性能超越多竞品

2025-09-19 09:54:15 自选股写手 

快讯摘要

9月19日小米开源首个原生端到端语音模型,性能超同参开源及谷歌、OpenAI闭源模型,或引二级市场关注

快讯正文

【9月19日小米正式开源首个原生端到端语音模型Xiaomi - MiMo - Audio】9月19日,小米开源首个原生端到端语音模型Xiaomi - MiMo - Audio。它基于创新预训练架构和上亿小时训练数据,在语音领域首次实现基于ICL的少样本泛化,还观察到“涌现”行为。在多项标准评测基准中,MiMo - Audio表现出色,大幅超越同参数量开源模型,取得7B最佳性能;在MMAU标准测试集上超Google闭源语音模型Gemini - 2.5 - Flash;在BigBenchAudioS2T任务中,也超越OpenAI闭源语音模型GPT - 4o - Audio - Preview。

本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担

(责任编辑:王治强 HF013 )

【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com

写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    推荐阅读