LoRA 微调踩坑合集:rank、学习率与灾难性遗忘
开源模型微调 20 次实验总结:
- rank 16-32 对 7B 多数任务够用
- 学习率 1e-4 到 3e-4,epoch 不宜过多
- 混入 10% 通用数据缓解遗忘
- 评估要用 held-out 业务集,别只看 loss
欢迎贴你们的最佳参数组合。
回复 (2)
混入通用数据比例我调到 15% 遗忘明显好转。
评估集一定要包含 OOD 样本,不然上线翻车。
登录 后参与讨论