RAG（检索增强生成）

让 LLM 基于你的数据回答问题

学习目标

理解 RAG 的完整架构与工作流程
掌握分块、检索、生成各环节的优化方法
了解高级 RAG 模式与评估框架

1. RAG 基础架构

1.1 为什么需要 RAG

1.2 基本流程

1.3 RAG vs 微调 vs 长上下文

2. 文档加载与预处理

2.1 数据源

2.2 文档解析

2.3 数据清洗

3. 分块策略

3.1 固定大小分块

3.2 递归分块

3.3 语义分块

3.4 分块大小选择

4. 嵌入与索引

4.1 嵌入模型选型

4.2 索引构建

5. 检索策略

5.1 向量搜索

5.2 关键词搜索（BM25）

5.3 混合检索

5.4 Reranking

5.5 查询改写

6. 生成与后处理

6.1 上下文构建

6.2 上下文压缩

6.3 引用追踪

7. 高级 RAG 模式

7.1 GraphRAG

7.2 Agentic RAG

7.3 多模态 RAG

7.4 Self-RAG

8. 评估

8.1 评估维度

8.2 RAGAS 框架

8.3 评估数据集构建

9. 常见问题与优化

9.1 检索质量差

9.2 幻觉问题

9.3 延迟过高

练习

构建一个基础 RAG 管道（PDF → 分块 → 向量存储 → 问答）
对比固定分块与语义分块的检索质量
实现混合检索 + Reranking 并用 RAGAS 评估

延伸阅读