InferenceXbySemiAnalysis logo
首页仪表板GPU 对比支持者数据集文章关于
Star1,206EN

文章

关于 AI 推理基准测试、GPU 性能与 ML 基础设施的深度洞见。

全部amdannouncementb200b300benchmarkdeepseekdisaggdynamofp4gb200gb300glm5gpuh100h200huaweiinferencekimimi355xminimaxnvfp4nvidianvl72qwenrocmsglangtrtllmvllmwide-ep
2026年2月16日·55 分钟阅读

InferenceX v2:NVIDIA Blackwell 对决 AMD 与 Hopper — 前身为 InferenceMAX

GB300 NVL72、MI355X、B200、H100、分离式推理、宽专家并行、大规模混合专家、SGLang、vLLM、TRTLLM

benchmarkgpuinferenceannouncement
2025年10月9日·44 分钟阅读

InferenceMAX:开源推理基准测试

NVIDIA GB200 NVL72、AMD MI355X、每 GPU 吞吐量 Token、延迟 Tok/s/user、性价比、每百万 Token 成本、每配置兆瓦 Token 数、DeepSeek R1 670B、GPTOSS 120B、Llama3 70B

benchmarkgpuinferenceannouncement
SemiAnalysis logo

持续的开源推理基准测试。真实、可复现、可审计的性能数据,获得 OpenAI、Meta、Oracle、Microsoft 等万亿美元级 AI 基础设施运营方的信赖。

SemiAnalysis官方网站订阅通讯关于我们
法律信息土地致谢隐私政策Cookie 政策
参与贡献基准测试仓库前端仓库
更多GPU 可靠性每美元性能English

如果这些数据对您的工作有帮助,欢迎在 GitHub 上为我们加星或分享给您的同事。

© 2026 semianalysis.com. 保留所有权利。