GPU 精度对比

34 组精度正面对比,涵盖 DeepSeek V4 Pro 1.6T, DeepSeek R1, Kimi K2.5/K2.6/K2.7-Code 1T, GLM 5/5.1, MiniMax M3 428B, MiniMax M2.5/M2.7, Qwen 3.5 397B-A17B, and Llama 3.3 70B。查看 FP4、FP8、BF16、INT4 等多种量化精度如何影响同一 GPU 上的吞吐量、成本和交互性——每个页面展示推理图表及插值对比表格。

DeepSeek V4 Pro 1.6T

1 组精度对比具有 DeepSeek V4 Pro 1.6T 的基准测试数据。

DeepSeek R1

5 组精度对比具有 DeepSeek R1 的基准测试数据。

GB200 NVL72

NVIDIA · Blackwell

GB300 NVL72

NVIDIA · Blackwell

Kimi K2.5/K2.6/K2.7-Code 1T

3 组精度对比具有 Kimi K2.5/K2.6/K2.7-Code 1T 的基准测试数据。

GLM 5/5.1

4 组精度对比具有 GLM 5/5.1 的基准测试数据。

GB300 NVL72

NVIDIA · Blackwell

MiniMax M3 428B

3 组精度对比具有 MiniMax M3 428B 的基准测试数据。

MiniMax M2.5/M2.7

5 组精度对比具有 MiniMax M2.5/M2.7 的基准测试数据。

GB200 NVL72

NVIDIA · Blackwell

GB300 NVL72

NVIDIA · Blackwell

Llama 3.3 70B

2 组精度对比具有 Llama 3.3 70B 的基准测试数据。