中国初创公司发布新型推理模型DeepSeek-R1引发关注

2025-01-26

数据：

中国初创公司深度求索发布了大模型DeepSeek-R1，其性能可与OpenAI的最新模型o1相媲美。DeepSeek V3的训练费用为558万美元，仅为硅谷竞争对手的十分之一。R1的训练成本是o1的三十分之一。

线索：

深度求索的成功显示出中国AI技术快速发展的潜力，同时也反映出在全球技术限制背景下的创新能力。投资者可以关注中美科技竞争中的新兴企业尤其是AI和云计算领域的机会。然而，技术和数据的开放程度可能影响商业模式的可持续性。

正文：

中国初创公司深度求索于1月20日发布了其最新的推理模型DeepSeek-R1，该模型在多个基准测试项目中表现超越了美国OpenAI的最新模型o1。DeepSeek公司在训练DeepSeek V3语言模型时，经历了两个月的训练，耗资558万美元，这一金额仅是硅谷竞争者的十分之一。

深度求索的模型R1不仅在性能上表现优越，其训练成本也是o1的三十分之一。此外，R1在开源开放程度上具有优势，它允许用户参与二次开发且可以更改算法，但由于训练数据尚未公开，某些限制仍然存在。

在达沃斯世界经济论坛上，微软首席执行官纳德拉表示，深度求索的新模型极为出色，尤其是构建开源模型和推理计算的效率。他强调，必须认真看待中国人工智能的发展。

美国科技界对深度求索的成就感到震惊，尤其是在面临美国对中国出口先进科技限制的情况下。深度求索的开发团队被迫使用更智能的算法来克服这一限制。他们指出，尽管ChatGPT需要一万台英伟达的图像处理器来处理训练数据，R1的研发团队仅用2000台图像处理器便取得相似效果。

发布时间：

2025-01-25 23:58:16

ReadCai财经资讯站