选择图表

LLM 评估结果

本页面展示 LLM 评估（evaluation）结果：使用标准化评估集对比各模型与部署配置的准确率，验证推理优化不会损害模型质量。

图表中的模型、GPU、框架与指标名称均沿用业界通用英文名称。

准确率评估

基准测试结果展示不同 GPU、量化精度和推理配置下，模型质量与吞吐量之间的权衡。

模型

基准测试

精度

各硬件配置的评估得分

DeepSeek-V4-Pro • FP4 • • 来源：SemiAnalysis InferenceX™

No data available for the current filters.