数据:
MiniMax发布了名为MiniMax-M1的推理模型,算力成本仅为53.47万美元,支持最高100万上下文的输入和80,000个token的输出。
线索:
MiniMax-M1作为一款开源推理模型,性价比超过DeepSeek,且在许多基准测试中表现优异。投资者应关注其在AI领域的新机会,特别是在长文本处理和编程能力方面的表现。但是,由于技术创新与不确定性并存,可能会影响投资安全性。
正文:
MiniMax在6月17日发布了其新模型MiniMax-M1,称之为世界上首个开源的大规模混合架构推理模型。该模型在复杂生产力任务中表现上佳,预计将超越国内许多闭源模型,并接近海外顶尖模型的能力,同时保持业界最高性价比。
MiniMax-M1能够支持最高达100万token的上下文输入,与谷歌的Gemini 2.5 Pro相当,也大幅领先DeepSeek R1,其输出长度为80,000个token,是当前所有开源模型中最长的。
在训练效率方面,MiniMax-M1使用了512块H800 GPU在短短三周内完成强化学习训练,算力成本仅为53.47万美元,远低于同类模型的成本。MiniMax声称,其基于混合架构的闪电注意力机制使得长文本输入和深度推理的计算效率显著提升。
此外,M1在多项基准测试中表现突出,特别是在长上下文理解、工具使用等复杂任务上展现了强大的能力。尤其是在代码能力上,MiniMax-M1显著高于大多数开源模型,性能几乎与DeepSeek R1持平。
MiniMax还推出了一些范围广泛的API定价策略,适用于不同输入长度的应用场景。当前,其定价模式为:0-32k输入0.8元/百万token,32k-128k输入1.2元/百万token,以及128k-1M输入2.4元/百万token。
未来几天,MiniMax预计还将发布更多更新,包括与文本、语音和视觉相关的新技术进展。这为投资者提供了多样化的投资机会,尤其是在关注长上下文处理、编程能力,以及多模态AI应用开发的领域。
发布时间:
2025-06-17 15:20:36
评论 ( 0 )