ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

中国初创公司发布新型推理模型DeepSeek-R1引发关注

2025-01-26

数据:

中国初创公司深度求索发布了大模型DeepSeek-R1,其性能可与OpenAI的最新模型o1相媲美。DeepSeek V3的训练费用为558万美元,仅为硅谷竞争对手的十分之一。R1的训练成本是o1的三十分之一。

线索:

深度求索的成功显示出中国AI技术快速发展的潜力,同时也反映出在全球技术限制背景下的创新能力。投资者可以关注中美科技竞争中的新兴企业尤其是AI和云计算领域的机会。然而,技术和数据的开放程度可能影响商业模式的可持续性。

正文:

中国初创公司深度求索于1月20日发布了其最新的推理模型DeepSeek-R1,该模型在多个基准测试项目中表现超越了美国OpenAI的最新模型o1。DeepSeek公司在训练DeepSeek V3语言模型时,经历了两个月的训练,耗资558万美元,这一金额仅是硅谷竞争者的十分之一。

深度求索的模型R1不仅在性能上表现优越,其训练成本也是o1的三十分之一。此外,R1在开源开放程度上具有优势,它允许用户参与二次开发且可以更改算法,但由于训练数据尚未公开,某些限制仍然存在。

在达沃斯世界经济论坛上,微软首席执行官纳德拉表示,深度求索的新模型极为出色,尤其是构建开源模型和推理计算的效率。他强调,必须认真看待中国人工智能的发展。

美国科技界对深度求索的成就感到震惊,尤其是在面临美国对中国出口先进科技限制的情况下。深度求索的开发团队被迫使用更智能的算法来克服这一限制。他们指出,尽管ChatGPT需要一万台英伟达的图像处理器来处理训练数据,R1的研发团队仅用2000台图像处理器便取得相似效果。

发布时间:

2025-01-25 23:58:16

相关推荐

评论 ( 0 )

2.2 W

文章

13.9 W

点赞

回顶部