罗福莉宣布小米新模型将开源 三大自研模型亮相

3月19日,小米宣布推出三款自研大模型:Xiaomi MiMo-V2-Pro、Xiaomi MiMo-V2-Omni和Xiaomi MiMo-V2-TTS。其中,MiMo-V2-Pro 和 MiMo-V2-Omni 已正式开放API服务。

罗福莉宣布小米新模型将开源

据小米官方介绍,MiMo-V2-Pro 是旗舰文本基座,专为高强度Agent工作场景设计,主打推理、规划与工具调用。MiMo-V2-Omni 是全模态Agent基座,原生融合文本、视觉与音频感知,打通从理解到执行的完整链路。MiMo-V2-TTS 则是语音合成大模型,旨在为Agent赋予有温度、有情感的声音表达能力,构成全栈的最后一环。

罗福莉宣布小米新模型将开源 三大自研模型亮相

MiMo-V2-Pro作为旗舰基座模型,针对复杂多样的智能体架构进行了监督微调和强化学习,具备更强的工具调用与多步推理能力。该模型总参数规模突破1万亿,激活参数为42B,采用改进后的混合注意力机制,在保证推理效率的同时大幅提升模型容量。其上下文窗口扩展至100万Token,支持超长任务链和复杂工作流。

罗福莉宣布小米新模型将开源 三大自研模型亮相

同步亮相的MiMo-V2-Omni与MiMo-V2-TTS则补齐了感知与表达的两块拼图。前者实现了音频、图像、视频的对齐,后者支持细粒度控制的情感表达引擎,使Agent具备更接近人类的表达能力。

在定价方面,MiMo-V2-Pro的API价格相对较低。256K上下文以内,输入每百万tokens定价1美元,输出3美元;1M上下文范围内,则为输入2美元,输出6美元。MiMo-V2-Omni也已开放API,支持256K上下文长度,输入定价每百万tokens 0.4美元,输出2美元。

小米还联合OpenClaw、OpenCode、KiloCode、Blackbox及Cline五大Agent框架团队,提供为期一周的限时免费接口支持,进一步推动其在开发者社区的渗透。这被视为小米全面押注智能体时代的重要信号。

当天一早,小米创始人雷军在社交平台发文称,在AI领域,今年的研发和资本投入将超过160亿元。雷军透露,万亿参数大模型MiMo-V2-Pro在全球大模型综合智能排行榜Artificial Analysis上位列全球第八,按大模型品牌排名全球第五。他表示,未来一段时间,模型还会快速迭代增强。

值得一提的是,小米MiMo大模型负责人罗福莉也在社交平台公开表示,此前上线的“Hunter Alpha”正是旗舰模型MiMo-V2-Pro的内部测试版本。罗福莉曾主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。她曾在阿里达摩院、幻方量化和DeepSeek任职,参与研发了多个重要模型。

去年12月,在小米“人车家全生态”合作伙伴大会上,罗福莉首次公开亮相。同月,小米集团合伙人、集团总裁卢伟冰宣布小米自研AI大模型Xiaomi MiMo-V2-Flash正式开源上线。卢伟冰透露,小米已在AI领域启动“压强式投入”,大模型与应用进展远超预期,未来将聚焦“AI与物理世界的深度结合”这一核心方向。

返回顶部