LLM 评估结果
本页面展示 LLM 评估(evaluation)结果:使用标准化评估集对比各模型与部署配置的准确率,验证推理优化不会损害模型质量。
图表中的模型、GPU、框架与指标名称均沿用业界通用英文名称。
准确率评估
基准测试结果展示不同 GPU、量化精度和推理配置下,模型质量与吞吐量之间的权衡。
各硬件配置的评估得分
DeepSeek-V4-Pro • FP4 • • 来源:SemiAnalysis InferenceX™
No data available for the current filters.