LoRA 微调踩坑合集:rank、学习率与灾难性遗忘

柴雪松 开源爱好者,LoRA 训练分享
楼主
开源模型微调 20 次实验总结: - rank 16-32 对 7B 多数任务够用 - 学习率 1e-4 到 3e-4,epoch 不宜过多 - 混入 10% 通用数据缓解遗忘 - 评估要用 held-out 业务集,别只看 loss 欢迎贴你们的最佳参数组合。

回复 (2)

元思远 算法实习生,扩散模型方向
#1
混入通用数据比例我调到 15% 遗忘明显好转。
谭博文 开源维护者,HuggingFace 生态贡献者
#2
评估集一定要包含 OOD 样本,不然上线翻车。