ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

DeepSeek生成式AI系统发布引发市场关注

2025-02-05

数据:

DeepSeek在发布后的18天内实现1600万次下载,几乎是ChatGPT同期的两倍。DeepSeek的V3模型训练成本仅为557.6万美元,而OpenAI的GPT-4训练成本超过1亿美元。

线索:

DeepSeek的快速崛起和低成本训练策略可能对AI芯片市场造成冲击,尤其是对英伟达的垄断地位构成威胁。若大型科技公司开始采用DeepSeek的解决方案,可能会导致对英伟达芯片需求的减少,同时也可能在成本和技术创新上产生竞争。

正文:

近两周,来自中国的生成式人工智能系统DeepSeek迅速成为全球关注的焦点,尤其在西方世界引发了热烈讨论。自发布以来,DeepSeek在18天内实现1600万次下载,这一数字是竞争对手OpenAI的ChatGPT在同一时期下载量的近两倍,展现了其强大的市场吸引力和用户基础。

根据市场分析公司Appfigures的数据,DeepSeek的应用程序于1月26日首次登顶苹果App Store,并自那时起在140个国家持续保持全球下载榜首。DeepSeek能够获得如此关注,除了其卓越的性能,训练成本的低廉也是关键因素。

DeepSeek团队于2024年8月发表的论文中介绍了一种新型负载均衡器,旨在优化其混合专家(MoE)模型的元素连接。该团队发现,负载不均会导致模型的计算开销增加,他们推行了一种无损平衡策略,以避免在训练中引入干扰梯度。

DeepSeek-V3模型采用多头潜在注意力(MLA)架构和DeepSeekMoE,支持低精度训练以提高效率。团队利用FP8混合精度训练优化了GPU内存使用,并设计了DualPipe算法,实现流水线并行训练,以提高训练效率。

DeepSeek-V3的预训练过程所需的180K H800 GPU小时16天内完成,总训练成本为557.6万美元。相较之下,OpenAI的GPT-4训练成本超过1亿美元。

在低成本技术方面,DeepSeek使用了256个服务器节点,每节点装备8个H800 GPU。分析师推测,这表明DeepSeek采用的是英伟达的H800 SXM5版本,具有出色的性能和连接能力。

即便DeepSeek取得了显著成就,一些外国分析师对此提出质疑,但也承认其效率提升和训练过程的优化方法。他们认为DeepSeek的算法创新和硬件兼容性提升了模型的推理能力。

英伟达对此回应积极,称DeepSeek的进展展示了AI模型的新操作方式。然而,著名投资人和分析师担心,如果大型科技公司开始模仿DeepSeek,可能会影响英伟达的市场地位。实际上,DeepSeek的低成本方案和创新方法已经引起了投资者对英伟达的担忧。

此外,DeepSeek的成功正在重新定义AI市场的竞争格局,尤其是在硬件需求和技术创新方面。业内专家认为,尽管DeepSeek展现了强劲的竞争力,但对英伟达的影响是否长期存在还有待观察。

发布时间:

2025-02-04 15:09:00

相关推荐

评论 ( 0 )

3.3 W

文章

59.7 W

点赞

回顶部