AI 原生多模态 Lakehouse:基于 Lance 的向量、全文与混合检索
LanceDB 在 docs.lancedb.com 文档化多模态 lakehouse,基于 Lance 格式在统一表存储向量、元数据与嵌入。LanceDB OSS 为嵌入式库(Python/TypeScript/Rust);LanceDB Enterprise 为分布式托管方案。支持向量/语义、BM25 全文、SQL 过滤混合检索与对象存储集成。
使用场景
- 本地 Agentic RAG
- 多模态训练数据
- PB 级特征库
- Notebook 到生产扩展
- 与 DuckDB/MotherDuck 混合检索
主要功能
- Lance 多模态存储与版本化
- 向量/全文/混合检索 + SQL
- OSS 嵌入式与 Enterprise 分布式
- Python/TS/Rust SDK 与 REST API
- Lance 扩展对接 DuckDB
相关推荐
相关推荐
3 收录条目
Chroma
Chroma 在 docs.trychroma.com 文档化开源嵌入向量数据库,供 Python/JavaScript 存储与查询向量、元数据与全文字段;涵盖内存/持久化客户端、自托管 HTTP 服务、Chroma Cloud 与 API Key;支持集合 CRUD、嵌入函数集成与混合检索,面向 RAG 与 Agent 记忆。
Weaviate
Weaviate 在 docs.weaviate.io/weaviate 文档化开源向量数据库,存储对象与向量嵌入,支持语义、关键词与混合检索、RAG、重排与 Agent 工作流。生态含 Docker/Kubernetes 自托管、Weaviate Cloud、Query Agent 与 Weaviate Embeddings。客户端含 Python(weaviate-client v4,需 1.23.7+)、TypeScript、Go、Java,经 REST/gRPC/GraphQL API。
Qdrant
Qdrant 在 qdrant.tech/documentation 文档化 AI 原生向量搜索引擎,用于存储、索引与查询高维向量及可选 payload,支持稠密、稀疏与多向量配置。官方指南涵盖 Docker/Kubernetes 自托管、Qdrant Cloud(AWS/GCP/Azure)、Hybrid/Private Cloud 与 Qdrant Edge 嵌入式检索。客户端含 Python(qdrant-client)、JavaScript/TypeScript(@qdrant/js-client-rest)、Rust、Go、Java、.NET,经 REST/gRPC API(见 api.qdrant.tech)。