GPU 投机解码对比

49 组投机解码对比,涵盖 DeepSeek V4 Pro 1.6T, DeepSeek R1, GLM 5/5.1, MiniMax M3 428B, and Qwen 3.5 397B-A17B。每个页面对比同一模型和 GPU 上投机解码方法(MTP、EAGLE 等)开启与关闭的推理性能——在相同交互性水平下的吞吐量、成本和交互性。