LLM微调

0. 引言 微调是指在预训练模型的基础上,使用少量的标注数据对模型进行微调,以提高模型在特定任务上的性能。 常见的需要进行微调的原因: LLM在特定任务上的性能还需要微调来提升: 通用模型训练数据覆盖面广,但难以深入垂直领域的知识体系和专业术语,例如医学争端需要理解病理特征、法律咨询需要熟悉法条逻辑;当模型在专业领域知识不够时会有明显的幻觉。 让模型掌握”特定风格“: 例如训练模型以幽默风格撰写广告文案、心理咨询场景需要调整输出为引导性提问还不是结论性的判断 长上下文 vs 知识库 vs 微调 长文本表示模型可以处理很长的文本内容理解,其优点是: ...

June 26, 2025 · 352 words · compasty

MCP开发指北

基础 MCP(Model Context Protocol): 是Anthropic于2024年11月推出的开放的模型上下文协议,标准化了应用向AI Agent提供上下文的方式,可以视作AI应用的USB-C接口,提供了一种将AI Agent连接到不同数据源和工具的标准化方式。 ...

March 22, 2025 · 2023 words · compasty