Retrievers 检索器
Retriever 是对检索策略的封装。它不一定只查向量库,也可以组合关键词检索、过滤、重排、多路召回等。
常见策略
| 策略 | 说明 |
|---|---|
| TopK 向量召回 | 取相似度最高的 K 个片段 |
| Metadata Filter | 按文档类型、权限、时间过滤 |
| Hybrid Search | 关键词 + 向量混合召回 |
| Rerank | 对候选片段重新排序 |
| Multi-query | 让模型改写多个查询再召回 |
为什么需要重排
向量召回的 TopK 不一定就是最适合回答的片段。重排模型可以对“问题-片段”相关性重新打分,提升最终上下文质量。
生产建议
- 召回数量不要过大,避免 token 暴涨。
- 对低分片段设置阈值过滤。
- 返回答案时展示来源,增强可信度。
- 对无答案场景明确回复“不知道”,不要强行编造。
非官方声明
本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。
参考来源
- LangChain / LangGraph 官方文档:
https://docs.langchain.com/ - LangChain API Reference:
https://reference.langchain.com/ - 本站内容为中文学习整理,不做官方身份声明。