0. 引言
微调是指在预训练模型的基础上,使用少量的标注数据对模型进行微调,以提高模型在特定任务上的性能。
常见的需要进行微调的原因:
- LLM在特定任务上的性能还需要微调来提升: 通用模型训练数据覆盖面广,但难以深入垂直领域的知识体系和专业术语,例如医学争端需要理解病理特征、法律咨询需要熟悉法条逻辑;当模型在专业领域知识不够时会有明显的幻觉。
- 让模型掌握”特定风格“: 例如训练模型以幽默风格撰写广告文案、心理咨询场景需要调整输出为引导性提问还不是结论性的判断
长上下文 vs 知识库 vs 微调
长文本表示模型可以处理很长的文本内容理解,其优点是:
- 连贯性强:能够生成或者
核心的问题:
- 微调的各种参数怎么调?
- 微调的过程怎么观察?
- 微调后的模型如何部署?
- 如何评估模型微调后的效果?
1. 模型微调实操
以大模型算命大师为例,