数据:
美股三大指数普遍下跌,英伟达股价暴跌近17%,市值蒸发近6000亿美元。DeepSeek模型使用2048张H800 GPU可实现与16000张H100 GPU相当的效果,刺激算力过剩担忧。此外,Meta将2025年资本支出增至600亿-650亿美元。
线索:
DeepSeek的出现引发市场对AI算力及相关半导体行业的恐慌,可能导致投资者重新评估对英伟达和类似公司的投资策略。尽管英伟达坚持市场仍需更多AI芯片,低成本算力技术的推广可能打击新芯片的需求,影响行业长期利润。
正文:
中国AI初创公司DeepSeek引起了美国科技界的关注,尤其是在其推出的V3模型,能够以不到十分之一的算力训练出与硅谷巨头相当的AI模型。1月27日,美股三大指数受到影响,英伟达在短短一个交易日内股价下跌16.86%,市值蒸发约6000亿美元,创造了美股单日最大跌幅纪录。
DeepSeek的低成本算力模式引发市场对算力过剩泡沫的担忧。根据DeepSeek的论文,V3模型只使用了2048张H800 GPU,达到了竞争对手需要16000张H100 GPU才能实现的效果。这一现象令市场质疑,科技公司是否还需要大量采购英伟达的AI芯片。
尽管英伟达对市场的恐慌表示反对,并指出技术上依然需要更多AI芯片,但DeepSeek的成就已在中美科技界激起讨论。尤其是Meta内部的反应相当激烈,Meta的管理层对高昂的训练成本感到困惑,多个小组正在研究DeepSeek的技术细节。
此外,各大科技公司的资本支出计划显示,AI基础设施的投资并没有减缓,反而在增加。Meta首席执行官公布的2025年资本支出预算将近600亿美元,显示出市场对AI技术的持续信心。
DeepSeek技术上引发的风潮在于其使用的创新方法,如模型压缩、专家并行训练和FP8混合精度训练等技术,使得算力训练成本大幅降低。然而,FP8技术在提高计算效率的同时,可能造成模型性能的波动。
行业内对于如何在FP8训练中保持模型计算精度的探索在加速,许多公司也在引入FP8技术,以期望降低开发成本,改善算力使用效率。
发布时间:
2025-01-28 11:22:06



评论 ( 0 )