摘要:苹果正与博通合作开发其首款代号为“Baltra”的AI服务器芯片,旨在满足AI推理需求,以减少对英伟达产品的依赖。该芯片采用台积电3nm工艺,预计2026年量产,2027年实际部署。此战略决策源于苹果已放弃自研大模型训练,转而与谷歌合作使用其Gemini模型,因此Baltra将专注于优化AI推理任务的延迟与吞吐量,并可能采用64颗芯片互连及高带宽内存的架构以控制成本。
线索:此事件揭示了苹果在AI领域的核心战略:通过垂直整合掌控关键硬件,以降低成本和对外部供应商的依赖。投资机会在于,若苹果成功,其长期AI服务成本将显著下降,软硬件协同优化带来的性能提升可能增强其产品竞争力,利好其生态发展。博通和台积电作为合作伙伴,也将直接受益。然而,风险同样显著:自研芯片投入巨大,若Baltra项目延期或性能未达预期,将拖累苹果AI部署进度,使其在与依赖成熟英伟达方案的竞争对手的较量中处于不利地位。此外,苹果放弃自研大模型训练,转而每年向谷歌支付巨额费用,意味着其在AI基础层面对谷歌形成新的依赖,这也是一个潜在的战略风险点。
正文:
苹果公司正在开发其首款代号为“Baltra”的人工智能服务器芯片,并与博通公司合作开发关键的网络技术。此举旨在避免从英伟达公司购买芯片。
苹果是垂直集成的倡导者,倾向于在内部保留关键技术节点。新芯片Baltra将采用台积电的3纳米工艺制造,预计于2026年进入量产阶段,其实际部署时间预计在2027年。苹果已于2024年10月开始出货其在美国本土制造的服务器。
关于Baltra芯片的应用方向,预计苹果不会自己训练大模型,而是选择与谷歌达成协议。根据协议,苹果将每年支付约10亿美元,使用谷歌定制的拥有1.2万亿参数的Gemini模型来驱动其智能功能。基于此,推测苹果将主要使用Baltra芯片来满足其庞大的AI推理需求。
AI推理芯片的架构与用于训练模型的芯片架构不同,前者更注重延迟与吞吐量的优化,并采用基于低精度运算的架构设计,例如INT8精度。这可能是苹果和博通在推进Baltra整体设计时会重点关注的方面。
有观点认为,苹果大概率不会打造大规模的算力集群,反而可能会推出一种采用64颗芯片互连,并搭配更大容量高带宽LPDDR内存的架构方案。这种方案的成本预计会比目前市面上多数芯片低,同时又能精准匹配实际需求。
苹果公司于去年3月提交了一项名为“基于光学的分布式统一内存系统”的专利,该专利可能暗示了其未来的发展方向。该专利公开了若干与硅光子学计算系统相关的技术方案。在部分案例中,该计算系统包含多个计算芯片封装单元,其内置处理器可执行程序指令,对存储于分布式内存中的数据进行运算。分布式内存通过统一内存架构实现访问。该系统还配备多个内存芯片封装单元以搭建统一内存架构。具体而言,每个内存芯片封装单元均集成一组光接口与内存控制器,前者负责接收处理器发出的内存访问请求,后者则根据请求完成对分布式内存对应分区的读写操作。
发布时间:2025-12-17 10:45:53



评论 ( 0 )