ReadCai财经资讯
当前位置:首页 » 13. 科技 » 人工智能

DeepSeek-R1模型超越OpenAI,展示创新潜力

2025-02-03

数据:

中国人工智能公司深度求索推出的大型推理模型DeepSeek-R1在多个基准测试中表现优越,训练成本仅为OpenAI的模型o1的三十分之一,显示出大模型创新不必依赖最新硬件。

线索:

本次事件可能为投资者提供关注中国AI技术的机会,特别是那些寻找低成本高效模型的企业。同时,行业面临的风险在于如何保持模型的适应性和稳定性,以及可能的技术瓶颈,尤其是在不同应用场景中的表现。

正文:

中国人工智能公司深度求索于1月20日推出了名为DeepSeek-R1的新推理模型,受到广泛关注。最新报道显示,该模型在测试表现、训练成本和开源开放程度等多个指标上超越了美国OpenAI公司的最新模型o1,其训练成本只有o1的三十分之一。

中国官媒《经济日报》评论称,DeepSeek-R1的成功表明,大模型的创新并不必依赖最先进的硬件,而是可以通过智能的工程设计和高效的训练方法来实现。评论指出,模型的优秀不仅在于其规模和复杂性,还在于其精细和适应性。因此,所谓的大模型“瘦身”实际上促进了人工智能技术的创新和突破。

然而,评论也提出,如何在保障模型性能的前提下最大程度地进行“瘦身”是当前亟需解决的关键问题。此外,“瘦身”后的模型在不同场景下的适应性和稳定性同样需要进一步验证和优化。

西方媒体对DeepSeek-R1的表现给予了积极评价。有评论指出,美国及其盟友通过出口管制削弱中国获取先进芯片的能力,这反而激发了中国的创新潜力。

清华大学计算机系副教授刘知远表示,DeepSeek的成功突显了中国在利用有限资源实现高效利用方面的竞争优势。然而,他也提醒需警惕舆论从极度悲观向极度乐观的转变,并强调在已有技术路线上的追随相对简单,未来在不确定环境中开拓创新才是更大的挑战。

发布时间:

2025-01-26 22:32:36

相关推荐

评论 ( 0 )

3.2 W

文章

56.4 W

点赞

回顶部