开源云原生向量库:面向数十亿规模相似度检索
Milvus 在 milvus.io/docs 文档化高性能向量数据库,用于存储、索引与检索嵌入向量,支持元数据过滤与混合检索。部署含 Milvus Lite(pip install pymilvus,笔记本/边缘)、Milvus Standalone(单 Docker 镜像)、Kubernetes 上 Milvus Distributed(见 install-overview)。官方 SDK 含 PyMilvus、Go、Java、Node.js、C#;Zilliz Cloud 提供托管 Milvus。架构分层接入/协调/工作/存储,对象存储后端含 MinIO、S3、Azure Blob。
使用场景
- Kubernetes 上数十亿向量规模生产 RAG
- 向量相似度+结构化过滤的推荐系统
- Milvus Lite 原型后迁移 Standalone/Distributed
- 与 zilliztech/mcp-server-milvus 搭配的 Agent 记忆层
- 结合外部嵌入器的多模态向量检索
主要功能
- HNSW、DiskANN 等 ANN 索引与标量/JSON 元数据过滤
- Milvus Lite、Standalone、Distributed 三种部署
- 混合稠密-稀疏与多向量支持
- PyMilvus MilvusClient 集合/写入/检索 API
- LF AI & Data 基金会项目,Zilliz 为核心维护方
相关推荐
相关推荐
3 收录条目
Weaviate
Weaviate 在 docs.weaviate.io/weaviate 文档化开源向量数据库,存储对象与向量嵌入,支持语义、关键词与混合检索、RAG、重排与 Agent 工作流。生态含 Docker/Kubernetes 自托管、Weaviate Cloud、Query Agent 与 Weaviate Embeddings。客户端含 Python(weaviate-client v4,需 1.23.7+)、TypeScript、Go、Java,经 REST/gRPC/GraphQL API。
Qdrant
Qdrant 在 qdrant.tech/documentation 文档化 AI 原生向量搜索引擎,用于存储、索引与查询高维向量及可选 payload,支持稠密、稀疏与多向量配置。官方指南涵盖 Docker/Kubernetes 自托管、Qdrant Cloud(AWS/GCP/Azure)、Hybrid/Private Cloud 与 Qdrant Edge 嵌入式检索。客户端含 Python(qdrant-client)、JavaScript/TypeScript(@qdrant/js-client-rest)、Rust、Go、Java、.NET,经 REST/gRPC API(见 api.qdrant.tech)。
Chroma
Chroma 在 docs.trychroma.com 文档化开源嵌入向量数据库,供 Python/JavaScript 存储与查询向量、元数据与全文字段;涵盖内存/持久化客户端、自托管 HTTP 服务、Chroma Cloud 与 API Key;支持集合 CRUD、嵌入函数集成与混合检索,面向 RAG 与 Agent 记忆。