数据:
2025年AI领域DeepSeek团队以2048张H800 GPU成功训练出一款顶尖模型,挑战NVIDIA的算力主导地位。翟季冬教授认为,算力优化需通过系统软件创新实现高效利用。
线索:
DeepSeek的成功可能导致行业在算力投资时更关注系统层面的创新而非单纯增加硬件数量,这为投资者在AI基础设施、系统软件开发及高性能计算领域提供了新的机遇。同时,国内智算中心算力资源短缺与闲置矛盾,可能孕育对国产解决方案需求的增长。
正文:
2025年全球AI行业迎来了DeepSeek的技术突破。该团队利用2048张H800 GPU,在短短两个月内训练出了与全球顶尖水平相当的模型,迅速让DeepSeek在业内引发热议。这一成就不仅质疑了传统依赖算力规模的发展模式,也促使整个行业反思:在追求通用人工智能(AGI)的过程中,是否过于依赖算力,而忽视了别的创新可能性。
与2023年时“越大越好”的发展观不同,2025年AI行业的发展可能会转向利用有限资源最大化模型效能。DeepSeek的成功展示了如何通过系统软件的深度创新提升算力效能。翟季冬教授指出,DeepSeek提升算力性价比的一个关键因素就是在系统软件层面的技术突破。
他强调,算力优化是一个持续的过程,尤其在中国面临算力资源挑战的同时,推动系统软件创新是行业突围的重要手段。这要求在编程语言、编译器、通信库及编程框架等多个技术层面同步推进,同时构建完善的基础软件体系。
当今一个值得注意的现象是,尽管AI算力需求上升,国内许多智算中心却面临算力资源的闲置状态,暴露出基础软件体系的不足。这一矛盾暗示了从应用到系统软件,再到自主芯片的完整链路有待打通,从而为符合中国实际的发展路径提供了探索机遇。
在算力主导AI竞争的背景下,如何释放每一分计算资源的最大价值,已成为行业关注的焦点。对此,翟季冬教授在访谈中指出,当前面临的几个技术挑战包括并行策略的选择、通信优化、容错机制设计以及单卡性能的提升等,这些都需要通过合理的系统软件架构设计来加以解决。
他提到,在后训练阶段,不同阶段的并行策略需要动态调整,确保每个阶段的算力资源都能高效利用。最后,翟教授认为,中国要在算力利用及系统软件优化方面迎头赶上,需要建立相关标准,促进国产算力资源的有效整合与应用。
发布时间:
2025-01-31 14:30:12
评论 ( 0 )