LoRA 微调踩坑合集：rank、学习率与灾难性遗忘

柴

柴雪松开源爱好者，LoRA 训练分享 2026-06-04 11:19

楼主

开源模型微调 20 次实验总结： - rank 16-32 对 7B 多数任务够用 - 学习率 1e-4 到 3e-4，epoch 不宜过多 - 混入 10% 通用数据缓解遗忘 - 评估要用 held-out 业务集，别只看 loss 欢迎贴你们的最佳参数组合。

元

元思远算法实习生，扩散模型方向 2026-06-04 13:27

#1

混入通用数据比例我调到 15% 遗忘明显好转。

谭

谭博文开源维护者，HuggingFace 生态贡献者 2026-06-04 16:34

#2

评估集一定要包含 OOD 样本，不然上线翻车。

回复 (2)