ReadCai财经资讯
当前位置:首页 » 13. 科技 » 芯片制造

摩尔线程上市发布新GPU架构,生态仍有差距

2025-12-23

摘要:摩尔线程在上市后首次公开活动中,发布了新一代全功能GPU架构“花港”,其算力密度提升50%,能效提升10倍,支持十万卡以上智算集群。基于此架构,将推出AI训推一体芯片“华山”和高性能图形渲染芯片“庐山”。同时,其夸娥(KUAE 2.0)万卡集群在Dense大模型和MoE大模型上的训练算力利用率分别达到60%和40%。在推理侧,基于MTT S5000运行DeepSeek R1 671B模型,单卡吞吐量表现突出。公司还发布了面向开发者的AI算力笔记本MTT AIBOOK,预售价9999元,并升级了其全栈软件平台MUSA至5.0版本。行业数据显示,全球AI服务器市场持续增长,2025年上半年中国加速服务器市场规模约160亿美元。

线索:摩尔线程通过发布新一代硬件架构和展示大规模集群效率,展示了在AI计算领域追赶国际领先者的技术实力。其核心策略是以自主的全栈软件生态(MUSA)来构建竞争壁垒,并试图通过开发者工具(如AIBOOK)降低生态接入门槛。短期机会在于中国庞大的AI服务器市场需求和进口替代趋势,其产品在特定推理场景下已具备成本效益。主要风险在于,其硬件性能、软件生态成熟度与国际巨头(如英伟达CUDA生态)仍存在代际差距,且构建开发者社区和实现大规模可靠交付需要持续巨额投入,面临激烈的国内外竞争。

正文

2025年12月20日至21日,GPU开发商摩尔线程在北京举办了首届MUSA开发者大会。这是该公司上市后的首次重大公开亮相。创始人兼CEO张建中在会上公布了以公司自主MUSA统一架构为核心的全栈技术路线图。

本次发布的核心是新一代全功能GPU架构“花港”。该架构支持从FP4到FP64的全精度计算,计算密度提升50%,能效提升10倍,并设计用于支持超过十万个GPU的智能计算集群。基于“花港”架构,摩尔线程规划了两款产品:专注于AI训练和推理一体化的“华山”芯片,以及专注于高性能图形渲染的“庐山”芯片。

在计算集群方面,摩尔线程公布了其夸娥(KUAE 2.0)计算集群在万卡规模下的关键效率指标。数据显示,在密集型大模型上的训练算力利用率达到60%,在混合专家模型上达到40%。有效训练时间占比超过90%,训练线性扩展效率接近95%。

在推理性能方面,摩尔线程与AI基础设施公司硅基流动合作,在其MTT S5000加速卡上运行了DeepSeek R1 671B全量模型。测试结果显示,单卡预填充吞吐量超过每秒4000个token,解码吞吐量超过每秒1000个token。

此外,张建中还介绍了面向下一代超大规模智算中心的MTT C256超节点架构规划,并提及了在具身智能、科学智能以及6G人工智能等领域的长期布局。

除了数据中心产品,摩尔线程推出了一款面向开发者的AI算力笔记本MTT AIBOOK。该笔记本搭载公司自研的“长江”系统级芯片,提供50 TOPS的异构AI算力,运行基于Linux内核的MT AIOS操作系统,并预装了完整的AI开发工具链。该设备32GB内存加1TB存储的版本在京东平台的预售价为9999元。公司研发人员表示,该设备旨在将硬件、驱动和软件栈集成于一体,作为全链路的验证工具,以降低合作伙伴的采用风险。

软件生态是摩尔线程战略的重点。公司将MUSA平台升级至5.0版本,将其定位为一个涵盖架构、指令集、运行时库和驱动的全栈替代方案。张建中表示,生态系统是GPU行业的核心壁垒,长期价值越来越由软件和开发者采用度驱动,而非仅靠硬件。他透露,MUSA在关键AI操作上的效率已得到提升,并计划逐步开源其核心计算加速库、通信库和系统管理框架等组件。

行业背景方面,TrendForce预计全球AI服务器出货量在2026年将保持两位数增长。IDC数据显示,2025年上半年中国加速服务器市场规模约为160亿美元。

在谈及与国际产品的差距时,有合作伙伴表示,国产GPU在性能和生态系统成熟度上,与国际领先产品相比大约有一到两代的差距。然而,对于许多实际推理工作负载而言,国产方案已被认为具备成本效益。合作伙伴普遍认为,将现有业务从成熟的CUDA生态迁移至MUSA,需要工具链更顺畅、适配更广泛,这需要厂商持续投入大量工程资源。

张建中总结称,公司希望利用全功能GPU构建基础设施,赋能各行业的开发者和研究人员。对于摩尔线程而言,上市之后面临的挑战是将技术路线图转化为可靠的交付能力,并在国际巨头和日益激烈的国内市场竞争中,成功构建起自己的生态系统。

发布时间:2025-12-22 09:59:00

相关推荐

评论 ( 0 )

3.4 W

文章

64.4 W

点赞

回顶部