Skip to content

微调与模型定制

当 Prompt Engineering 和 RAG 不够时

学习目标

  • 理解何时需要微调
  • 掌握 LoRA/QLoRA 参数高效微调
  • 建立数据准备与评估流程

1. 何时微调

1.1 决策框架

1.2 适用场景

1.3 不适用场景

2. 数据准备

2.1 数据收集

2.2 数据格式

2.3 数据质量

2.4 数据规模

3. 微调方法

3.1 全量微调

3.2 LoRA

3.3 QLoRA

3.4 关键超参数

4. 训练平台

4.1 本地训练

4.2 云端训练

4.3 API 微调

5. 评估与迭代

5.1 评估指标

5.2 基准对比

5.3 迭代策略

6. 部署

6.1 模型合并

6.2 量化部署

6.3 推理服务


练习

  1. 用 QLoRA 微调一个 7B 模型完成特定任务
  2. 对比微调前后的任务表现
  3. 将微调模型部署为 API 服务

延伸阅读