Skip to content

Retrieval 检索概览

Retrieval 是 RAG 的核心。RAG 全称 Retrieval-Augmented Generation,即“检索增强生成”。它的基本思想是:先从知识库里找到相关内容,再把这些内容作为上下文交给模型回答。

为什么需要 RAG

大模型自身参数里不一定包含你的企业私有知识,也可能不知道最新业务规则。RAG 通过外部知识库补充上下文,减少胡编乱造。

基本流程

text
用户问题

问题向量化

向量库召回相关片段

重排 / 过滤

拼接上下文 Prompt

模型生成回答

返回答案和引用来源

关键组件

  • Document Loader:加载 PDF、网页、Markdown、数据库内容。
  • Text Splitter:把长文档切成小片段。
  • Embedding:把文本转向量。
  • Vector Store:存储和检索向量。
  • Retriever:封装检索策略。
  • Generator:基于上下文生成答案。

质量关键点

RAG 的效果不只取决于模型,更多取决于文档质量、切分策略、召回策略、重排和 Prompt 设计。

非官方声明

本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。

参考来源

  • LangChain / LangGraph 官方文档:https://docs.langchain.com/
  • LangChain API Reference:https://reference.langchain.com/
  • 本站内容为中文学习整理,不做官方身份声明。

本站为非官方中文学习站点,不代表 LangChain 官方。部分内容参考官方文档并重新整理为中文学习笔记。