[HELP] 求好心人帮忙量化 `DeepSeek-R1-Distill-Qwen-32B` 到 `int8` #3200

SolomonLeon · 2025-03-01T19:33:50Z

我的设备配置是 4 x V100 ，虽然理论上四卡显存足够量化，但 LMDeploy 目前不支持多卡量化（ #3145 ）。也尝试过 SGLang 但其并不支持 V100 显卡。

请问有好心人能帮忙使用 LMDeploy 量化 DeepSeek-R1-Distill-Qwen-32B 到 int8 并上传到 Huggingface 吗？非常感谢！

The text was updated successfully, but these errors were encountered:

lvhan028 · 2025-03-03T05:06:40Z

你是指 w8a8 吗

Provide feedback