ReadCai财经资讯
当前位置:首页 » 13. 科技 » 芯片制造

英伟达并购+许可补齐调度软件强化AI生态壁垒

2026-01-14

摘要

英伟达近期与推理芯片初创公司Groq达成非独家许可协议,Groq创始人兼CEO、总裁及核心团队将加入英伟达。此举被视为英伟达在AI竞争重心从训练转向推理的关键节点,吸纳潜在威胁。同时,英伟达通过收购Bright Computing(集群管理)、Run.ai(GPU资源调度)和SchedMD(Slurm工作负载管理器),系统性地构建了涵盖集群调度、工作负载定义和企业级支持的完整软件生态体系。其核心战略是从硬件供应商转变为通过AI Enterprise软件栈提供集成系统能力的生态主导者,旨在提高客户迁移成本,巩固市场地位。

线索

* 投资机会:英伟达通过构建软硬一体的全栈生态,正在从一家芯片公司转型为AI计算基础设施的定义者和控制者。这种生态壁垒如果持续巩固,可能为其带来长期、稳定的高利润率和难以撼动的市场地位,构成核心投资价值。关注其AI Enterprise软件收入的增长及生态内合作伙伴的发展。

* 潜在风险

1. 反垄断监管:英伟达在AI加速市场的绝对优势及一系列旨在巩固控制权的收购,可能引发全球主要市场的反垄断审查。

2. 技术路线竞争:推理市场碎片化,云厂商自研芯片(如AWS Inferentia、Google TPU)、AMD及定制ASIC仍在持续竞争,可能从特定场景突破。

3. 客户反制与多元化需求:大型云客户和企业在成本与供应链安全考量下,有动力推动硬件多元化,可能扶持英伟达的竞争对手或加速替代方案的成熟。

4. 执行与整合风险:将Groq的技术理念、Run.ai的云原生调度与Slurm的HPC传统进行深度融合存在技术与管理挑战。

5. 生态锁定的反噬:过度强调控制与迁移成本可能促使部分客户更积极地寻求开源替代方案或转向其他更开放的平台。

正文

近期,英伟达与专注于推理的芯片初创公司Groq达成一项“非独家许可协议”。根据协议,Groq的创始人兼CEO Jonathan Ross、总裁Sunny Madra及多名核心成员将加入英伟达,参与授权技术的推进与规模化。此举发生在AI芯片竞争重心从训练向推理转移的敏感时期。英伟达的GPU统治训练市场,但在推理端面临AMD、定制ASIC及云厂商自研芯片的竞争。Groq的核心技术是自研的LPU架构,采用静态调度和确定性设计,依托SRAM技术,在某些场景下能实现极致的低延迟。2024年,Groq展示其系统运行Llama 2-70B模型时,生成速度超过每秒300个Token。该公司已转向推理即服务方向,通过GroqCloud平台提供API服务。

分析认为,此次交易的关键在于英伟达借此获得了对执行路径的强约束、对延迟的可预测性以及编译器主导的算力使用方式等系统层能力,以应对推理市场碎片化的趋势。

更早之前,英伟达已通过一系列收购构建其软件与系统生态。2022年1月,英伟达收购了集群管理软件公司Bright Computing,将其工具更名为Base Command Manager(BCM),并纳入AI Enterprise软件堆栈。AI Enterprise以许可证模式销售,每个GPU每年的费用为4500美元。对于8个GPU以内的集群,英伟达提供免费的BCM许可证,但不提供技术支持。在BCM之上,英伟达部署了Mission Control工具,用于自动化部署集成框架、工具、模型的“AI工厂”,并进行健康检查与功耗优化。

2024年,英伟达收购了Run.ai。该公司的技术核心是实现GPU资源的抽象化管理,支持多租户、弹性调度和GPU虚拟化,允许将物理GPU分割为多个虚拟实例。

2025年12月,英伟达收购了SchedMD公司,从而获得了在超级计算领域作为事实标准的工作负载管理器Slurm的核心团队和技术支持权。Slurm以GNU GPL v2.0许可证开源,过去十年中Top500超算约有60%使用它。英伟达表示将继续开发和分发Slurm作为开源、厂商中立的软件。收购SchedMD后,英伟达能更深度地将Slurm的商业支持、系统集成与AI方向演进与其AI Enterprise体系绑定。

2024年10月,英伟达停止了Bright Cluster Manager的单独销售,仅将其作为AI Enterprise Stack的一部分提供。

综合来看,英伟达通过近年来的交易与收购,系统性地构建了一个多层次的生态体系:

1. 集群资源调度权:通过Mellanox的网络技术、Bright Computing的集群管理及SchedMD的Slurm调度器,控制算力连接、分配与执行的链条。

2. 工作负载执行路径定义权:通过Run.ai的GPU虚拟化、Mission Control的自动化部署及Slurm的作业调度,定义任务运行的方式与资源分配。

3. 企业级支持与系统复杂度掌控权:通过AI Enterprise许可证将工具打包成商业服务,提供集成的系统能力、优化经验与企业级支持。

这一战略标志着英伟达的商业模式从销售硬件芯片转变为提供以GPU为入口的完整计算生态,旨在通过系统整合与优化,显著提高客户转向其他硬件方案的迁移成本和学习曲线,从而巩固其市场主导地位。

发布时间

2026-01-13 10:37:29

相关推荐

评论 ( 0 )

3.7 W

文章

73.0 W

点赞

回顶部