ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

DeepSeek开源模型R1澄清技术与成本误解

2025-02-08

数据:

围绕DeepSeek的谣言较多,R1模型的技术能力 引起广泛讨论;成本600万美元的训练引发质疑。

线索:

DeepSeek的出现可能改变AI领域的竞争格局,对投资者来说,关注其技术创新和模型表现将是价值所在。此外,投资在技术人才和硬件资源方面也需审慎评估,以规避过度依赖单一公司的风险。

正文:

围绕DeepSeek的谣言层出不穷。DeepSeek的R1模型似乎一夜之间吸引了全球的关注,争论集中于其模型能力及训练费用是否如公司所说的550万美元。此外,关于研究团队的身份和意图的种种猜测也层出不穷。

尽管R1是开源的,针对其性能与算力的各种指责依然不断,甚至有人怀疑DeepSeek的目标是做空市场。然而,前Stability AI研究主管Tanishq Abraham对此进行了辩驳,指出许多关于DeepSeek的负面评论其实是误解。

DeepSeek并非突如其来的公司,早在2025年1月,全球的AI研究人员就已对其有所了解。它在之前就已发布多个模型,包括在2023年11月发布的DeepSeek-Coder。DeepSeek的进展与AI行业快速发展相符,创新团队的能力也显而易见。

关于训练成本的质疑也被指出为误解。有些人认为600万美元的成本无法置信,但实际上这个数字源于早前的DeepSeek-V3论文,虽然其中未包含强化学习训练的额外开支,然而根据分析,模型的训练成本在市面上是合理的。研究团队的薪酬也比其他顶尖实验室相当。在比较不同模型的成本时,有关训练以外的开销常常被忽略,这影响了公正性。

对于DeepSeek的效率,Tanishq认为其在训练效率上的表现优于许多其他公司。许多AI公司仍在努力实现扩展,争夺更多的计算资源,预期会带来更好的性能。此外,对DeepSeek的创新能力的攻击也不乏误解,其在模型设计及训练过程中的多项创新使其在业内独树一帜。

关于DeepSeek是否从ChatGPT中吸取知识的问题也存在争议。虽然OpenAI曾声称DeepSeek在使用“蒸馏”技术,但并未提供证据,喝水也不能完全证明DeepSeek的成就只来源于此。

最后,尽管中美AI领域的竞争趋势在变化,中国的技术正在迅速发展,但美国仍有一批优秀的公司保持竞争力。DeepSeek的出现使得全球对中国AI能力的认识加深,但同时也促使美国AI实验室继续推进创新。

发布时间:

2025-02-06 07:34:59

相关推荐

评论 ( 0 )

2.4 W

文章

15.5 W

点赞

回顶部