ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

全球多家机构复现DeepSeek AI模型引发讨论

2025-02-03

数据:

全球复现DeepSeek的数量激增,包括UC伯克利、港科大和HuggingFace在内的多个机构通过强化学习简单复现该模型,成本仅为30美元。这标志着全球AI模型发展可能迈入一个新的阶段,开放源代码的胜利引发了对大规模投资的必要性及行业未来的讨论。

线索:

文章讨论了人工智能领域的中心是否正在向中国转移,并指出中国量化基金天才可能对市场产生影响。模型的复现和成本的降低,似乎表明AI技术的普及将使更多人能够接触并利用这些强力工具。然而,市场对这些技术的反响和潜在泡沫风险依然是一个值得关注的问题。

正文:

近期,全球范围内出现了一股复现DeepSeek的热潮。来自UC伯克利的研究生潘家怡和两名合作者成功以强化学习复现该模型,并以低于30美元的成本展示了令人惊喜的结果。他们的项目名为TinyZero,利用R1-Zero算法在CountDown游戏中进行实验。尽管基础模型的性能差异显著,研究团队发现从1.5B规模起,模型学会了自我验证和搜索策略。

同时,港科大的研究团队也在7B模型上复刻DeepSeek,利用仅8K样本进行训练,结果显示出模型在复杂数学推理问题上的强劲表现。这一系列的努力正在树立一个信号,即强性能的模型不再只是算力巨头的专利,而是普遍可用的资源。

研究人员还发现,不同强化学习算法对模型的影响相似,且特定任务对模型的推理行为有着显著的影响。这也表明,部分长思维链和自我反思能力的出现与模型的复杂性之间存在关系。

研究团队利用简单的PPO算法以及自我反思机制在训练中的涌现,标志着一次自我验证能力的突破。而HuggingFace团队的跟进复刻,将进一步推动此类技术的扩大应用。

随着这种新型模型如DeepSeek R1的成功复刻,许多机构和研究人员开始转向这一技术,为AI研究的未来开辟了新的方向。

发布时间:

2025-01-26 15:51:00

相关推荐

评论 ( 0 )

3.2 W

文章

56.1 W

点赞

回顶部