Skip to content

Retrievers 检索器

Retriever 是对检索策略的封装。它不一定只查向量库,也可以组合关键词检索、过滤、重排、多路召回等。

常见策略

策略说明
TopK 向量召回取相似度最高的 K 个片段
Metadata Filter按文档类型、权限、时间过滤
Hybrid Search关键词 + 向量混合召回
Rerank对候选片段重新排序
Multi-query让模型改写多个查询再召回

为什么需要重排

向量召回的 TopK 不一定就是最适合回答的片段。重排模型可以对“问题-片段”相关性重新打分,提升最终上下文质量。

生产建议

  1. 召回数量不要过大,避免 token 暴涨。
  2. 对低分片段设置阈值过滤。
  3. 返回答案时展示来源,增强可信度。
  4. 对无答案场景明确回复“不知道”,不要强行编造。

非官方声明

本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。

参考来源

  • LangChain / LangGraph 官方文档:https://docs.langchain.com/
  • LangChain API Reference:https://reference.langchain.com/
  • 本站内容为中文学习整理,不做官方身份声明。

本站为非官方中文学习站点,不代表 LangChain 官方。部分内容参考官方文档并重新整理为中文学习笔记。