MiniMax M3 基准测试已上线最新
NVIDIA 和 AMD GPU 的首批推理数据,点击探索。
受吉瓦级 token 工厂信赖的开源持续推理基准测试
“在模型与推理技术栈协同演进的今天,厂商中立、持续更新的基准测试不可或缺。MiniMax M3 在设计之初就兼顾了前沿能力与实际部署效率,而社区第一时间对 vLLM 的支持也体现了我们引以为豪的协作精神。InferenceX 正是生态所需的透明、可复现的数据平台。”
完整仪表板
覆盖所有模型、GPU、框架与指标。完全可配置的推理基准测试图表,支持日期范围、并发扫描与原始数据导出。
跨 DeepSeekv4 Pro、Qwen、Kimi、GLM、MiniMax、gpt-oss、Llama 等模型,对比 NVIDIA GB300 NVL72、GB200 NVL72、B300、B200、H200、H100、AMD MI355X、MI325X、MI300X,以及即将上线的 VR200 NVL72、AMD MI455X UALoE72、TPUv7 Ironwood 等硬件。
每一条结果都通过公开的 GitHub Actions 自动化流程透明产生
仪表板上的每个数据点都由公开的 GitHub Actions 工作流运行产生。配置方案(recipe)保存在公开仓库中,运行在真实目标硬件上执行,完整日志与产物公开可查。点击图表上的任意数据点即可跳转到生成它的那次运行。一切都可复现、可审计、开源。
平均每周新增 1,000+ 条基准测试数据点。 第一时间浏览每个新上线的模型、GPU、框架与配置。
快速对比
一键进入最热门的 GPU 推理基准测试对比,精选视图开箱即用。
MiniMax M3 — 首发基准测试New
涵盖所有可用 GPU 的 MiniMax M3 首批基准测试结果。新配置上线后将在此同步更新。
GB200 NVL72 vs B200 — 多节点 vs 单节点
GB200 NVL72 Dynamo TRTLLM vs B200 Dynamo TRTLLM,基于 DeepSeek R1 (8k/1k),FP4 精度。
B200 vs H200 — Blackwell vs Hopper
Blackwell B200 vs Hopper H200 Dynamo TRTLLM 每 GPU 吞吐量对比,基于 DeepSeek R1 (8k/1k),FP8 精度。
AMD MI300X → MI325X → MI355X
AMD Instinct 三代产品在 SGLang FP8 下的对比。DeepSeek R1 (8k/1k) 代际吞吐量提升趋势。
H100 vs GB300 分离式推理 — DeepSeek
H100 FP8 分离式 vs GB300 FP8 分离式 vs GB300 FP4 分离式,基于 DeepSeek R1 (8k/1k)。
分离式 B200 SGLang vs MI355X vs B200 TRTLLM
分离式 B200 Dynamo SGLang vs MI355X MoRI SGLang vs B200 Dynamo TRTLLM,基于 DeepSeek R1 (8k/1k),FP8 精度。
MI355X SGLang 分离式推理历史趋势 — DeepSeek (FP8)
MI355X SGLang 分离式推理在 DeepSeek R1 (8k/1k) FP8 下的表现,追踪吞吐量随时间的提升。