ReadCai财经资讯
当前位置:首页 » 13. 科技 » 芯片制造

苹果M3 Ultra芯片表现超越8张A100显卡

2025-03-17

数据:

满血版苹果M3 Ultra在DeepSeek R1模型测试中超越8张A100显卡,速度为19.17 Tokens/s(使用MLX格式),相比预估A100的16.41 Tokens/s更为高效。

线索:

M3 Ultra虽在某些模型推理场景下表现优越,但在多用户推理和大模型训练时,无法完全达到A100的性能。这表明虽然M3 Ultra为普通用户提供了高性价比选择,但专业领域的需求依然需要高性能的A100显卡。投资者需关注M3 Ultra的市场动态及对高性能显卡市场的潜在影响,同时考虑相关技术的进步可能导致的风险和机遇。

正文:

最近,B站UP主分享了一段关于满血版苹果M3 Ultra运行6710亿参数的DeepSeek R1模型的测试结果,显示其速度甚至超过了8张A100显卡,其成本却明显低得多。运行DeepSeek R1模型所需的专业服务器通常由6-8张A100显卡构成,总价通常超过百万,几乎是普通用户难以承担的。然而,满血版M3 Ultra仅需一台Mac Studio即可实现类似性能,性价比非常高。

具体测试结果显示,8张A100显卡的性能为16.41 Tokens/s,而满血版M3 Ultra在GGUF格式下达到了15.78 Tokens/s。当切换到更能展示统一内存优势的MLX格式时,速度提升至19.17 Tokens/s,超越了8张A100显卡。此外,在运行DeepSeek V3 6710亿参数模型时,M3 Ultra的速度也达到了19.66 Tokens/s。

然而,这并不意味着M3 Ultra在所有场景下都能超越A100。在单用户运行单一模型推理时,其性能主要依赖内存带宽和容量,无法完全发挥A100显卡的潜力。在多用户推理和大模型训练方面,M3 Ultra的表现则无法与A100相比。此外,M3 Ultra在多个大语言模型的推理速度测试中表现卓越,无论是Llama 3.1 70B、Gemma2 27B还是Qwen 2.5 14B模型,其速度相较于M2 Ultra芯片均有所提升,分别为13%、34%和18%。

此次测试中的满血版M3 Ultra配备了512GB的统一内存,总价为74249人民币。对于大多数用户来说,如果不需要运行如此规模的模型,可以考虑降低统一内存的容量,从而节省成本。

发布时间: 2025-03-12 17:12:00

相关推荐

评论 ( 0 )

2.6 W

文章

27.4 W

点赞

回顶部