数据:
中国初创公司深度求索发布了大模型DeepSeek-R1,其性能可与OpenAI的最新模型o1相媲美。DeepSeek V3的训练费用为558万美元,仅为硅谷竞争对手的十分之一。R1的训练成本是o1的三十分之一。
线索:
深度求索的成功显示出中国AI技术快速发展的潜力,同时也反映出在全球技术限制背景下的创新能力。投资者可以关注中美科技竞争中的新兴企业尤其是AI和云计算领域的机会。然而,技术和数据的开放程度可能影响商业模式的可持续性。
正文:
中国初创公司深度求索于1月20日发布了其最新的推理模型DeepSeek-R1,该模型在多个基准测试项目中表现超越了美国OpenAI的最新模型o1。DeepSeek公司在训练DeepSeek V3语言模型时,经历了两个月的训练,耗资558万美元,这一金额仅是硅谷竞争者的十分之一。
深度求索的模型R1不仅在性能上表现优越,其训练成本也是o1的三十分之一。此外,R1在开源开放程度上具有优势,它允许用户参与二次开发且可以更改算法,但由于训练数据尚未公开,某些限制仍然存在。
在达沃斯世界经济论坛上,微软首席执行官纳德拉表示,深度求索的新模型极为出色,尤其是构建开源模型和推理计算的效率。他强调,必须认真看待中国人工智能的发展。
美国科技界对深度求索的成就感到震惊,尤其是在面临美国对中国出口先进科技限制的情况下。深度求索的开发团队被迫使用更智能的算法来克服这一限制。他们指出,尽管ChatGPT需要一万台英伟达的图像处理器来处理训练数据,R1的研发团队仅用2000台图像处理器便取得相似效果。
发布时间:
2025-01-25 23:58:16
评论 ( 0 )