LLM微调
0. 引言 微调是指在预训练模型的基础上,使用少量的标注数据对模型进行微调,以提高模型在特定任务上的性能。 常见的需要进行微调的原因: LLM在特定任务上的性能还需要微调来提升: 通用模型训练数据覆盖面广,但难以深入垂直领域的知识体系和专业术语,例如医学争端需要理解病理特征、法律咨询需要熟悉法条逻辑;当模型在专业领域知识不够时会有明显的幻觉。 让模型掌握”特定风格“: 例如训练模型以幽默风格撰写广告文案、心理咨询场景需要调整输出为引导性提问还不是结论性的判断 长上下文 vs 知识库 vs 微调 长文本表示模型可以处理很长的文本内容理解,其优点是: ...