数据:
英伟达团队在第二届人工智能数学奥林匹克竞赛(AIMO2)中破解34道题,使用14B小模型。清华和微软联合团队获得第二名,Nokron团队第三,得分分别为30和29分。总奖金为211.7152万美元,第一名奖金26.2144万美元。
线索:
此次竞赛展示了开源大语言模型(LLM)在数学推理方面的新进展。英伟达团队的胜利可能促使投资者关注小模型的潜力,以及在数学推理能力研发上的投资机会。同时,参赛团队的多样性也反映了人工智能领域的合作机遇与竞争压力。投资者需警惕推进技术应用中存在的风险,例如技术开发进展不及预期或市场需求变化。
正文:
第二届人工智能数学奥林匹克竞赛(AIMO2)已经落幕,英伟达团队的AI系统成功破解了34道题目,占总题目的68%。此次比赛总共有50道题,相较于第一届,难度有所增加,并要求更高的抗暴力破解能力。参赛者需使用开源大语言模型(LLM),在有限的算力条件下进行解题。
截至目前,最终成绩仍在审核中,但英伟达团队的表现已被广泛认可。他们仅用一个14B参数的小模型在比赛中获得第一名,而403B参数的DeepSeek R1在相同测试数据上表现不佳,仅得分约20分。英伟达的14B模型经过微调,支持CoT推理,并且在仅使用四个L4 GPU的情况下,5小时内解决了34道题目。
参赛团队由七位成员组成,包括学术界和工业界的研究员。紧随其后的是清华大学和微软联合组成的团队,他们在公榜上得分34/50(第一名)以及在私榜上得分31/50(第二名),并且是Top-5中唯一提交了解决方案的团队。他们的方案包括推理导向训练、效率优化和推理时策略等。
第三名是Nokron团队,得分30,之后是Søren Ravn Andersen和一名来自浙江的匿名选手,两者皆得29分。
AIMO竞赛的目的是激励开发能够在数学推理表现上达到国际数学奥林匹克水平的开源AI模型。本届比赛设有211.7152万美元的总奖金,第一名的奖金为26.2144万美元。此外,获得总体进步奖的团队将至少可获158.9248万美元,鼓励团队在公开与私有测试集上的表现。
发布时间:
2025-04-14 08:28:09
评论 ( 0 )