上海朴器营销策划有限公司 小米开源首个原生端到端语音大模子
发布日期:2025-09-24 09:51 点击次数:181
据Xiaomi MiMo微信公众号音尘,9月19日,小米隆重开源首个原生端到端语音模子——Xiaomi-MiMo-Audio,它基于立异预教师架构和上亿小时教师数据,初度在语音规模罢了基于ICL的少样本泛化,并在预教师不雅察到彰着的“显现”算作。
据先容,在通用语音清爽及对话等多项表率评测基准中,MiMo-Audio大幅超过了同参数目的开源模子,赢得7B最好性能;在音频清爽基准MMAU的表率测试集上,MiMo-Audio跨越Google闭源语音模子Gemini-2.5-Flash;在面向音频复杂推理的基准Big Bench Audio S2T任务中,MiMo-Audio通常超过了OpenAI闭源的语音模子GPT-4o-Audio-Preview。

拖累裁剪:王翔 上海朴器营销策划有限公司