Skip to content

Vector Stores 向量库

向量库负责存储文本向量,并提供相似度检索能力。

常见选择

向量库特点
FAISS本地快速验证,适合原型
Chroma开发体验简单
Milvus大规模向量检索,适合生产
Elasticsearch适合已有 ES 体系,支持混合检索
pgvectorPostgreSQL 扩展,适合中小规模

生产关注点

  1. 数据规模:百万、千万、亿级向量的方案不同。
  2. 更新频率:文档是否频繁更新。
  3. 权限过滤:检索时是否要按用户、租户、部门过滤。
  4. 混合检索:是否需要关键词 + 向量一起召回。
  5. 运维能力:团队是否能维护 Milvus / ES / PostgreSQL。

metadata 很重要

向量库里不应只存文本和向量,还要存:

json
{
  "source": "xxx.md",
  "doc_id": "doc_001",
  "chunk_id": "chunk_001",
  "title": "LangGraph 概览",
  "permission": "public"
}

这样才能做引用、删除、更新和权限控制。

非官方声明

本站为个人维护的非官方中文学习文档,不代表 LangChain 官方。页面内容是基于公开文档、源码实践和中文开发者视角重新整理的学习资料。涉及 API 细节时,请以官方文档和实际安装版本为准。

参考来源

  • LangChain / LangGraph 官方文档:https://docs.langchain.com/
  • LangChain API Reference:https://reference.langchain.com/
  • 本站内容为中文学习整理,不做官方身份声明。

本站为非官方中文学习站点,不代表 LangChain 官方。部分内容参考官方文档并重新整理为中文学习笔记。