9月19日小米开源原生端到端语音模型Xiaomi - MiMo - Audio,多项评测超越同行,或提升其科技竞争力与市场价值。
【9月19日小米开源首个原生端到端语音模型Xiaomi - MiMo - Audio】 9月19日,小米正式开源首个原生端到端语音模型Xiaomi - MiMo - Audio。它基于创新预训练架构和上亿小时训练数据,首次在语音领域实现基于ICL的少样本泛化,还在预训练观察到明显“涌现”行为。 在通用语音理解及对话等多项标准评测基准中,MiMo - Audio大幅超越同参数量的开源模型,取得7B最佳性能。 在音频理解基准MMAU的标准测试集上,它超过Google闭源语音模型Gemini - 2.5 - Flash;在面向音频复杂推理的基准BigBenchAudioS2T任务中,也超越了OpenAI闭源的语音模型GPT - 4o - Audio - Preview。
本文由 AI 算法生成,仅作参考,不涉投资建议,使用风险自担
【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com
最新评论