LLM 评估结果

本页面展示 LLM 评估(evaluation)结果:使用标准化评估集对比各模型与部署配置的准确率,验证推理优化不会损害模型质量。

图表中的模型、GPU、框架与指标名称均沿用业界通用英文名称。

准确率评估

基准测试结果展示不同 GPU、量化精度和推理配置下,模型质量与吞吐量之间的权衡。

各硬件配置的评估得分

DeepSeek-V4-Pro FP4 来源:SemiAnalysis InferenceX™

No data available for the current filters.