数据:
在最近的DeepSeek发布中,其R1-0528模型的性能与OpenAI的o3和Google的Gemini 2.5 Pro相当,使DeepSeek成为全球第二大AI实验室。该模型在多项基准测试中表现出色,数学、编程和通用逻辑能力显著提升。
线索:
DeepSeek的崛起展现了开源AI在技术进步和市场竞争中的潜力。投资者或开发者可以把握开源AI的发展机遇,关注其与闭源模型的竞争情况,以及DeepSeek未来R2模型的可能性。与此同时,虽然DeepSeek的性能提升显著,但仍需谨慎评估与实际应用之间的差距。
正文:
DeepSeek于5月30日官宣其R1-0528版本模型的升级,性能已接近OpenAI的o3与Google的Gemini 2.5 Pro,并且确认DeepSeek在开源模型领域的领导地位。该版本的更新不仅在数学、编程、通用逻辑性能上相对以往版本有显著提高,还在前端代码生成能力、幻觉率(降低45%-50%)及支持JSON输出和函数调用等方面进行了增强。
在基于Qwen3-8B Base微调的DeepSeek-R1-0528-Qwen3-8B版本中,其性能在AIME 2024中与DeepSeek-R1-0528接近,显现出开源模型的强大潜力。
DeepSeek R1模型升级后的推理能力提升,尤其是在数学和编程方面表现突出,在各种基准测试中,该模型的准确率从70%提高至87.5%。这次更新给与了AI模型更深思维和推理能力的支持。
值得注意的是,DeepSeek强化了工具调用功能,使得模型可以通过爬虫插件主动获取信息并进行总结,提高了模型的适用性和实用价值。
DeepSeek因其R1-0528版本收获良好评价,进而成为全球第二大AI实验室,与Google并列。该模型在不同的AI智能评估中获得68分,迅速缩小了与OpenAI的差距,并在诸如编程能力和数学能力方面均有出色表现。DeepSeek的发布和更新标志着开源和闭源AI模型能力上差距的缩小,同时中国的AI实验室逐步追上,美国同行的技术优势正受到更大挑战。
发布时间:
2025-05-30 10:57:25
评论 ( 0 )