MiniMax推出全球首个开源混合架构推理模型

2025-06-19

数据：

全球首个开源大规模混合架构推理模型MiniMax-M1发布，参数规模为4560亿，参数激活459亿，原生支持100万上下文输入和最长8万token推理输出。

线索：

MiniMax-M1的发布拓宽了长文本处理的能力，对于希望在推理模型领域竞争的公司来说，可能带来显著的投资机会。但相较于DeepSeek-R1，MiniMax-M1在某些输入输出价格方面并无明显优势，市场竞争仍然激烈。未来随着开源模型的不断扩展和应用，需要关注MiniMax如何保持自身的技术优势以及市场份额。

正文：

近日，MiniMax推出了全球首个开源的大规模混合架构推理模型MiniMax-M1。该模型具有4560亿参数，每个token激活459亿参数，支持100万token的上下文输入，且推理输出长度可达8万token，相较于现有的一些闭源模型，表现突出。在长文本处理能力上，MiniMax-M1与谷歌的Gemini 2.5 Pro持平，并在性能上优于多个开源模型如DeepSeek-R1和Qwen3-235B。

该模型通过强化学习阶段的实验，显示出使用512块H800 GPU训练的相对高效，成本仅为53.74万美元，远低于预期。MiniMax-M1使用新的API定价结构，输入和输出的成本相对较低，但与DeepSeek-R1相比，在部分输入范围内，定价并未形成明显优势。

在技术上，MiniMax-M1集成了闪电注意力机制与混合专家架构，通过新的强化学习算法CISPO提升效率，表明其在长输入和复杂任务处理上的潜力。

尽管MiniMax在推理模型领域取得了显著成就，但与竞争对手DeepSeek-R1的比较显示，仍需增强某些数学和编程能力。作为一项开源举措，其未来在开发者社区的接受程度，以及是否能够建立良好的用户口碑，将直接影响其市场表现。

值得一提的是，MiniMax在发布M1的同时也开启了为期五天的技术发布周，计划展示多模态模型的更多技术进展。

发布时间：

2025-06-17 16:13:57

MiniMax推出全球首个开源混合架构推理模型

相关推荐

评论 ( 0 )

取消回复

MiniMax推出全球首个开源混合架构推理模型

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站