ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

DeepSeek公司推出语言模型R1 成为OpenAI模型竞争对手

2025-02-05

数据:

中国研制的大型语言模型DeepSeek-R1被认为是OpenAI的o1等推理模型的强有力竞争对手,其初步测试结果表明在化学、数学和编码任务上表现相当。

线索:

DeepSeek-R1的开放性和相对低廉成本可能会对整个人工智能研究和应用领域产生重要影响。低成本的利用可能会使更多研究人员能够使用和改进该模型。同时,它的成功也显示出中国在人工智能领域逐渐缩小与美国的差距,涉及到的合作机会和投资领域将成为未来关注的重点。

正文:

2025年1月31日,Nature自然杂志发表了关于中国研发的深度学习模型DeepSeek-R1的文章,认为该模型令科学家们激动不已,被视为OpenAI的o1模型的经济实惠且开放的竞争者。DeepSeek-R1模拟人类推理的生成过程,在解决科学问题方面表现出色,可能在研究中具备潜在应用价值。

1月20日发布的初步测试结果显示,R1在化学、数学和编码任务上的表现和OpenAI的o1相当。而R1的开放发布意味着研究人员可以自由研究和构建该算法,虽然训练数据未被公开,但依据麻省理工学院的许可证发布,可以自由使用。德国的一位人工智能科学家称赞DeepSeek的开放性,与OpenAI的闭源黑箱模型形成对比。

DeepSeek尚未披露R1的全部训练成本,但其使用成本仅为o1的三十分之一。DeepSeek还推出了R1的迷你版本,以便计算能力有限的研究人员使用。专家指出,使用o1的实验成本超过370美元,而使用R1的成本不到10美元,这样的差距将对其未来的使用有显著影响。

DeepSeek的成功在于其在低预算情况下研发出竞争强劲的模型,与美国出口管制形势并存。R1的管理者指出,高效利用资源可能比单纯依赖计算能力更为重要。对此,行业专家呼吁中美应采取合作方式推动人工智能进步,而不是直接竞争。

LLM(大型语言模型)通过学习文本样本中的模式来生成语言,但也容易产生错误,例如幻觉现象。R1通过使用思路链方法提升了解决复杂任务的能力,且团队在强化学习中估算进度,这些策略有助于降低培训和运行成本。DeepSeek-R1在多项测试中表现优异,显示出与o1模型相仿的能力,使研究人员能够深入理解其推理过程,虽然在形势上还需进一步观察其真实的推理与概括能力。

科学家们已开始测试R1在多项任务中的表现,初步结果显示其在某些量子光学计算上超越o1,表明R1的能力值得进一步探讨。

发布时间:

2025-01-31 13:18:00

相关推荐

评论 ( 0 )

3.3 W

文章

60.5 W

点赞

回顶部