苹果M3 Ultra芯片表现超越8张A100显卡

2025-03-17

数据：

满血版苹果M3 Ultra在DeepSeek R1模型测试中超越8张A100显卡，速度为19.17 Tokens/s（使用MLX格式），相比预估A100的16.41 Tokens/s更为高效。

线索：

M3 Ultra虽在某些模型推理场景下表现优越，但在多用户推理和大模型训练时，无法完全达到A100的性能。这表明虽然M3 Ultra为普通用户提供了高性价比选择，但专业领域的需求依然需要高性能的A100显卡。投资者需关注M3 Ultra的市场动态及对高性能显卡市场的潜在影响，同时考虑相关技术的进步可能导致的风险和机遇。

正文：

最近，B站UP主分享了一段关于满血版苹果M3 Ultra运行6710亿参数的DeepSeek R1模型的测试结果，显示其速度甚至超过了8张A100显卡，其成本却明显低得多。运行DeepSeek R1模型所需的专业服务器通常由6-8张A100显卡构成，总价通常超过百万，几乎是普通用户难以承担的。然而，满血版M3 Ultra仅需一台Mac Studio即可实现类似性能，性价比非常高。

具体测试结果显示，8张A100显卡的性能为16.41 Tokens/s，而满血版M3 Ultra在GGUF格式下达到了15.78 Tokens/s。当切换到更能展示统一内存优势的MLX格式时，速度提升至19.17 Tokens/s，超越了8张A100显卡。此外，在运行DeepSeek V3 6710亿参数模型时，M3 Ultra的速度也达到了19.66 Tokens/s。

然而，这并不意味着M3 Ultra在所有场景下都能超越A100。在单用户运行单一模型推理时，其性能主要依赖内存带宽和容量，无法完全发挥A100显卡的潜力。在多用户推理和大模型训练方面，M3 Ultra的表现则无法与A100相比。此外，M3 Ultra在多个大语言模型的推理速度测试中表现卓越，无论是Llama 3.1 70B、Gemma2 27B还是Qwen 2.5 14B模型，其速度相较于M2 Ultra芯片均有所提升，分别为13%、34%和18%。

此次测试中的满血版M3 Ultra配备了512GB的统一内存，总价为74249人民币。对于大多数用户来说，如果不需要运行如此规模的模型，可以考虑降低统一内存的容量，从而节省成本。

发布时间： 2025-03-12 17:12:00

苹果M3 Ultra芯片表现超越8张A100显卡

相关推荐

评论 ( 0 )

取消回复

苹果M3 Ultra芯片表现超越8张A100显卡

相关推荐

评论 ( 0 )

取消回复

ReadCai财经资讯站