DeepSeek生成式AI系统发布引发市场关注

2025-02-05

数据：

DeepSeek在发布后的18天内实现1600万次下载，几乎是ChatGPT同期的两倍。DeepSeek的V3模型训练成本仅为557.6万美元，而OpenAI的GPT-4训练成本超过1亿美元。

线索：

DeepSeek的快速崛起和低成本训练策略可能对AI芯片市场造成冲击，尤其是对英伟达的垄断地位构成威胁。若大型科技公司开始采用DeepSeek的解决方案，可能会导致对英伟达芯片需求的减少，同时也可能在成本和技术创新上产生竞争。

正文：

近两周，来自中国的生成式人工智能系统DeepSeek迅速成为全球关注的焦点，尤其在西方世界引发了热烈讨论。自发布以来，DeepSeek在18天内实现1600万次下载，这一数字是竞争对手OpenAI的ChatGPT在同一时期下载量的近两倍，展现了其强大的市场吸引力和用户基础。

根据市场分析公司Appfigures的数据，DeepSeek的应用程序于1月26日首次登顶苹果App Store，并自那时起在140个国家持续保持全球下载榜首。DeepSeek能够获得如此关注，除了其卓越的性能，训练成本的低廉也是关键因素。

DeepSeek团队于2024年8月发表的论文中介绍了一种新型负载均衡器，旨在优化其混合专家（MoE）模型的元素连接。该团队发现，负载不均会导致模型的计算开销增加，他们推行了一种无损平衡策略，以避免在训练中引入干扰梯度。

DeepSeek-V3模型采用多头潜在注意力（MLA）架构和DeepSeekMoE，支持低精度训练以提高效率。团队利用FP8混合精度训练优化了GPU内存使用，并设计了DualPipe算法，实现流水线并行训练，以提高训练效率。

DeepSeek-V3的预训练过程所需的180K H800 GPU小时16天内完成，总训练成本为557.6万美元。相较之下，OpenAI的GPT-4训练成本超过1亿美元。

在低成本技术方面，DeepSeek使用了256个服务器节点，每节点装备8个H800 GPU。分析师推测，这表明DeepSeek采用的是英伟达的H800 SXM5版本，具有出色的性能和连接能力。

即便DeepSeek取得了显著成就，一些外国分析师对此提出质疑，但也承认其效率提升和训练过程的优化方法。他们认为DeepSeek的算法创新和硬件兼容性提升了模型的推理能力。

英伟达对此回应积极，称DeepSeek的进展展示了AI模型的新操作方式。然而，著名投资人和分析师担心，如果大型科技公司开始模仿DeepSeek，可能会影响英伟达的市场地位。实际上，DeepSeek的低成本方案和创新方法已经引起了投资者对英伟达的担忧。

此外，DeepSeek的成功正在重新定义AI市场的竞争格局，尤其是在硬件需求和技术创新方面。业内专家认为，尽管DeepSeek展现了强劲的竞争力，但对英伟达的影响是否长期存在还有待观察。

发布时间：

2025-02-04 15:09:00

ReadCai财经资讯站