ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

MiniMax推出全球首个开源混合架构推理模型

2025-06-19

数据:

全球首个开源大规模混合架构推理模型MiniMax-M1发布,参数规模为4560亿,参数激活459亿,原生支持100万上下文输入和最长8万token推理输出。

线索:

MiniMax-M1的发布拓宽了长文本处理的能力,对于希望在推理模型领域竞争的公司来说,可能带来显著的投资机会。但相较于DeepSeek-R1,MiniMax-M1在某些输入输出价格方面并无明显优势,市场竞争仍然激烈。未来随着开源模型的不断扩展和应用,需要关注MiniMax如何保持自身的技术优势以及市场份额。

正文:

近日,MiniMax推出了全球首个开源的大规模混合架构推理模型MiniMax-M1。该模型具有4560亿参数,每个token激活459亿参数,支持100万token的上下文输入,且推理输出长度可达8万token,相较于现有的一些闭源模型,表现突出。在长文本处理能力上,MiniMax-M1与谷歌的Gemini 2.5 Pro持平,并在性能上优于多个开源模型如DeepSeek-R1和Qwen3-235B。

该模型通过强化学习阶段的实验,显示出使用512块H800 GPU训练的相对高效,成本仅为53.74万美元,远低于预期。MiniMax-M1使用新的API定价结构,输入和输出的成本相对较低,但与DeepSeek-R1相比,在部分输入范围内,定价并未形成明显优势。

在技术上,MiniMax-M1集成了闪电注意力机制与混合专家架构,通过新的强化学习算法CISPO提升效率,表明其在长输入和复杂任务处理上的潜力。

尽管MiniMax在推理模型领域取得了显著成就,但与竞争对手DeepSeek-R1的比较显示,仍需增强某些数学和编程能力。作为一项开源举措,其未来在开发者社区的接受程度,以及是否能够建立良好的用户口碑,将直接影响其市场表现。

值得一提的是,MiniMax在发布M1的同时也开启了为期五天的技术发布周,计划展示多模态模型的更多技术进展。

发布时间:

2025-06-17 16:13:57

相关推荐

评论 ( 0 )

2.9 W

文章

43.9 W

点赞

回顶部