摘要
小米发布了其开源模型MiMo-V2-Flash,该模型以309B总参数实现了高能效,推理速度提升2.6倍,API成本仅为竞品Claude 4.5 Sonnet的2.5%。在多项权威评测中表现突出,其代码能力在SWE-Bench Verified上以73.4%的分数超越DeepSeek-V3.2,位列开源模型第一梯队。该模型被定位为小米“人车家全生态”迈向Agent时代的语言基座,旨在通过高性价比的AI能力驱动其硬件生态,标志着小米正加速向拥有独立核心技术的“大模型公司”转型。
线索
投资机会的核心在于小米AI模型与其庞大硬件生态的深度协同效应。如果MiMo系列模型能成功部署于手机、汽车、智能家居等数十亿设备中,将构建起强大的软硬件护城河,将硬件流量转化为高价值的AI服务收入,实现从硬件公司到AI生态平台的跃迁。其极致的性价比策略可能抢占开发者市场,并降低自身AI应用的运营成本。然而,风险同样显著:将大模型高效整合到海量终端设备的技术执行难度极高;AI领域竞争激烈,技术领先优势能否维持尚不确定;超2000亿元的五年投入计划若无法产生预期回报,将对公司财务构成压力。这是一场高投入、高周期、高不确定性的战略转型,其成败将直接决定小米在下一代智能技术浪潮中的核心地位。
正文
2025年12月18日,在小米“人车家全生态”合作伙伴大会上,小米发布了其开源大模型MiMo-V2-Flash。
模型规格与定位
MiMo-V2-Flash是一个总参数量为309B、激活参数量为15B的模型。官方将其定义为“迈向Agent时代的全新语言基座”,旨在为智能体应用提供高效的语言处理核心。
核心技术架构
该模型采用了一系列关键技术以实现高效率和高性能:
– MoE架构与动态激活:模型包含256个专家,但每次推理仅动态激活8个专家,降低了推理成本。
– 5:1混合注意力机制:结合了滑动窗口注意力(SWA)与全局注意力(GA)。SWA机制将Token的注意力视野限制在局部窗口,将计算复杂度从平方级降低至线性级,提升了长文本处理效率。为解决SWA可能导致的语义断层问题,模型引入了可学习的注意力汇聚偏置技术,确保模型在快速滑动时仍能保持对全文脉络的把握。
– MTP(多层Token预测):通过一次前向传播并行预测多个后续Token,再由主模型进行并行验证,实现了2至2.6倍的推理加速。
– MOPD(多教师在线策略蒸馏):通过构建教师模型网络,利用反向KL散度为学生模型提供密集的Token级奖励信号,以较低的算力消耗快速追平甚至超越教师模型的能力。
性能评测与实测
在多项权威基准测试中,MiMo-V2-Flash取得了优异的成绩:
– 综合能力:在Arena-Hard基准测试中得分86.2,在MMLU-Pro中得分84.9。
– 代码能力:在SWE-Bench Verified评测中得分73.4%,超越DeepSeek-V3.2(73.1%)和Kimi-K2 Thinking(71.3%)。在SWE-Bench Multilingual测试中解决了71.7%的问题。
– Agent能力:在衡量工具使用能力的Tau2-Bench中得分80.3。
在代码生成的实测中,该模型能够一次性生成包含复杂功能的完整前端代码。例如,在构建一个网页版macOS操作系统的任务中,生成的网页实现了文件管理、编辑和命令行浏览等功能,其完整度和功能性优于对比的闭源模型。模型还能生成支持基于摄像头手势控制的交互式网页和二维码扫描工具。
在非技术交互方面,模型对开放性问题和情感议题的回应也展现了逻辑性和细致度。
成本与效率
MiMo-V2-Flash的推理成本极低,仅为Claude 4.5 Sonnet的2.5%左右。其API定价为每百万输入Token 0.7元、每百万输出Token 2.1元。模型生成速度可达每秒150个Token。
小米的AI战略与投入
MiMo-V2-Flash的发布是小米AI战略的一部分。小米认为AI进化的方向需要与真实物理环境交互,因此其AI发展有两个主要方向:一是轻量化模型,通过端侧部署升级智能终端(如“超级小爱”和澎湃OS);二是以大模型为基座,提升自动驾驶能力。
2025年,小米在AI领域动作频繁:
– 4月:开源MiMo-7B系列。
– 5月:发布多模态模型MiMo-VL-7B。
– 11月:推出具身智能大模型MiMo-Embodied,旨在打通自动驾驶与机器人操作的知识迁移。
– 12月:发布MiMo-V2-Flash。
为支撑这一战略,小米计划2025年研发投入超过300亿元,其中约75亿元用于AI领域,并计划未来五年投入超过2000亿元。组织上,小米已搭建AI Infra平台并着手建设GPU万卡集群。人才方面,除罗福莉负责基础大模型外,还引入了智驾领域专家陈龙。
未来愿景
小米的最终目标是通过统一的AI逻辑驱动其庞大的硬件生态,实现从硬件公司向AI生态公司的转型。其长远构想是打造一个具备物理一致性和时空连贯性的虚拟宇宙,让AI成为连接数字世界与物理世界的智能中枢。
发布时间
2025-12-18 08:06:38



评论 ( 0 )