deepseek r1 微调后我应该怎么加载lora参数推理呢 #7185

joyyyhuang · 2025-03-06T07:42:31Z

Reminder

I have read the above rules and searched the existing issues.

System Info

llamafactory version: 0.9.2.dev0
Platform: Linux-5.4.241-1-tlinux4-0017.7-x86_64-with-glibc2.28
Python version: 3.12.9
PyTorch version: 2.5.1+cu124 (GPU)
Transformers version: 4.48.3
Datasets version: 3.2.0
Accelerate version: 1.2.1
PEFT version: 0.12.0
TRL version: 0.9.6
GPU type: NVIDIA H20
GPU number: 8
GPU memory: 95.00GB
DeepSpeed version: 0.16.4
vLLM version: 0.7.2

Reproduction

我尝试了

使用 vllm serve 加载 lora 权重

vllm serve /root/modelzoo/DeepSeek-R1-BF16 \
    --tensor-parallel-size 8 \
    --pipeline-parallel-size 2 \
    --trust-remote-code \
    --max-num-seqs 16 \
    --max-model-len 16384 \
    --enable-lora \
    --lora-modules lora1=LLaMA-Factory/saves/deepseek-r1

结果报错

2. 使用 llamafactory export 合并lora权重，下面是我使用的配置文件

### Note: DO NOT use quantized model or quantization_bit when merging lora adapters

### model
model_name_or_path: /root/modelzoo/DeepSeek-R1-BF16
adapter_name_or_path: saves/deepseek-r1
template: deepseek3
trust_remote_code: true

### export
export_dir: output/DeepSeek-R1-SFT
export_size: 5
export_device: cpu
export_legacy_format: false

但是速度比较慢，我想问下这里的 export_size=5 的具体含义，以及部署训练后 R1 的正确方法。

Others

No response

The text was updated successfully, but these errors were encountered:

hiyouga · 2025-03-06T07:45:42Z

export_size 是导出每个分块 weight 文件的大小（GB）

yoshi315 · 2025-03-07T02:00:50Z

请问您用了多少机，每机多少卡。感谢

joyyyhuang · 2025-03-07T02:14:53Z

7机8卡 H20

joyyyhuang added bug Something isn't working pending This problem is yet to be addressed labels Mar 6, 2025

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

deepseek r1 微调后我应该怎么加载lora参数推理呢 #7185

deepseek r1 微调后我应该怎么加载lora参数推理呢 #7185

joyyyhuang commented Mar 6, 2025

hiyouga commented Mar 6, 2025

yoshi315 commented Mar 7, 2025

joyyyhuang commented Mar 7, 2025

deepseek r1 微调后我应该怎么加载lora参数推理呢 #7185

deepseek r1 微调后我应该怎么加载lora参数推理呢 #7185

Comments

joyyyhuang commented Mar 6, 2025

Reminder

System Info

Reproduction

Others

hiyouga commented Mar 6, 2025

yoshi315 commented Mar 7, 2025

joyyyhuang commented Mar 7, 2025