LLM微调

June 26, 2025 · 352 words · compasty

0. 引言

微调是指在预训练模型的基础上，使用少量的标注数据对模型进行微调，以提高模型在特定任务上的性能。

常见的需要进行微调的原因：

LLM在特定任务上的性能还需要微调来提升: 通用模型训练数据覆盖面广，但难以深入垂直领域的知识体系和专业术语，例如医学争端需要理解病理特征、法律咨询需要熟悉法条逻辑；当模型在专业领域知识不够时会有明显的幻觉。
让模型掌握”特定风格“: 例如训练模型以幽默风格撰写广告文案、心理咨询场景需要调整输出为引导性提问还不是结论性的判断

长上下文 vs 知识库 vs 微调

长文本表示模型可以处理很长的文本内容理解，其优点是：

连贯性强：能够生成或者

核心的问题:

微调的各种参数怎么调？
微调的过程怎么观察？
微调后的模型如何部署？
如何评估模型微调后的效果？

1. 模型微调实操

以大模型算命大师为例，

参考

deepseek微调