当前位置：首页 » 13. 科技 » 人工智能

DeepSeek开源模型R1澄清技术与成本误解

2025-02-08

人工智能

数据：

围绕DeepSeek的谣言较多，R1模型的技术能力引起广泛讨论；成本600万美元的训练引发质疑。

线索：

DeepSeek的出现可能改变AI领域的竞争格局，对投资者来说，关注其技术创新和模型表现将是价值所在。此外，投资在技术人才和硬件资源方面也需审慎评估，以规避过度依赖单一公司的风险。

正文：

围绕DeepSeek的谣言层出不穷。DeepSeek的R1模型似乎一夜之间吸引了全球的关注，争论集中于其模型能力及训练费用是否如公司所说的550万美元。此外，关于研究团队的身份和意图的种种猜测也层出不穷。

尽管R1是开源的，针对其性能与算力的各种指责依然不断，甚至有人怀疑DeepSeek的目标是做空市场。然而，前Stability AI研究主管Tanishq Abraham对此进行了辩驳，指出许多关于DeepSeek的负面评论其实是误解。

DeepSeek并非突如其来的公司，早在2025年1月，全球的AI研究人员就已对其有所了解。它在之前就已发布多个模型，包括在2023年11月发布的DeepSeek-Coder。DeepSeek的进展与AI行业快速发展相符，创新团队的能力也显而易见。

关于训练成本的质疑也被指出为误解。有些人认为600万美元的成本无法置信，但实际上这个数字源于早前的DeepSeek-V3论文，虽然其中未包含强化学习训练的额外开支，然而根据分析，模型的训练成本在市面上是合理的。研究团队的薪酬也比其他顶尖实验室相当。在比较不同模型的成本时，有关训练以外的开销常常被忽略，这影响了公正性。

对于DeepSeek的效率，Tanishq认为其在训练效率上的表现优于许多其他公司。许多AI公司仍在努力实现扩展，争夺更多的计算资源，预期会带来更好的性能。此外，对DeepSeek的创新能力的攻击也不乏误解，其在模型设计及训练过程中的多项创新使其在业内独树一帜。

关于DeepSeek是否从ChatGPT中吸取知识的问题也存在争议。虽然OpenAI曾声称DeepSeek在使用“蒸馏”技术，但并未提供证据，喝水也不能完全证明DeepSeek的成就只来源于此。

最后，尽管中美AI领域的竞争趋势在变化，中国的技术正在迅速发展，但美国仍有一批优秀的公司保持竞争力。DeepSeek的出现使得全球对中国AI能力的认识加深，但同时也促使美国AI实验室继续推进创新。

发布时间：

2025-02-06 07:34:59

DeepSeek开源模型R1澄清技术与成本误解

相关推荐

评论 ( 0 )

取消回复

DeepSeek开源模型R1澄清技术与成本误解

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站