Retrieval 检索概览
Retrieval 是 RAG 的核心。RAG 全称 Retrieval-Augmented Generation,即“检索增强生成”。它的基本思想是:先从知识库里找到相关内容,再把这些内容作为上下文交给模型回答。
为什么需要 RAG
大模型自身参数里不一定包含你的企业私有知识,也可能不知道最新业务规则。RAG 通过外部知识库补充上下文,减少胡编乱造。
基本流程
text
用户问题
↓
问题向量化
↓
向量库召回相关片段
↓
重排 / 过滤
↓
拼接上下文 Prompt
↓
模型生成回答
↓
返回答案和引用来源关键组件
- Document Loader:加载 PDF、网页、Markdown、数据库内容。
- Text Splitter:把长文档切成小片段。
- Embedding:把文本转向量。
- Vector Store:存储和检索向量。
- Retriever:封装检索策略。
- Generator:基于上下文生成答案。
质量关键点
RAG 的效果不只取决于模型,更多取决于文档质量、切分策略、召回策略、重排和 Prompt 设计。
非官方声明
本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。
参考来源
- LangChain / LangGraph 官方文档:
https://docs.langchain.com/ - LangChain API Reference:
https://reference.langchain.com/ - 本站内容为中文学习整理,不做官方身份声明。