Rust 原生向量库:语义检索、RAG 与混合检索规模化
Qdrant 在 qdrant.tech/documentation 文档化 AI 原生向量搜索引擎,用于存储、索引与查询高维向量及可选 payload,支持稠密、稀疏与多向量配置。官方指南涵盖 Docker/Kubernetes 自托管、Qdrant Cloud(AWS/GCP/Azure)、Hybrid/Private Cloud 与 Qdrant Edge 嵌入式检索。客户端含 Python(qdrant-client)、JavaScript/TypeScript(@qdrant/js-client-rest)、Rust、Go、Java、.NET,经 REST/gRPC API(见 api.qdrant.tech)。
使用场景
- 构建带元数据过滤的生产 RAG 目录
- 数十亿嵌入规模的推荐系统
- 与官方 Qdrant MCP 搭配的 Agent 记忆层
- Qdrant Edge 端侧/离线检索
- 从 Chroma/Pinecone 原型迁移至自托管 Qdrant
主要功能
- 集合、点、payload 与 HNSW 索引
- 混合稠密-稀疏检索、过滤与多阶段查询
- 标量/乘积/二进制量化与 on-disk 存储
- Qdrant Cloud 内 Cloud Inference 生成嵌入
- 分片水平扩展与托管云部署
相关推荐
相关推荐
3 收录条目
Chroma
Chroma 在 docs.trychroma.com 文档化开源嵌入向量数据库,供 Python/JavaScript 存储与查询向量、元数据与全文字段;涵盖内存/持久化客户端、自托管 HTTP 服务、Chroma Cloud 与 API Key;支持集合 CRUD、嵌入函数集成与混合检索,面向 RAG 与 Agent 记忆。
Deepgram
Deepgram 在 developers.deepgram.com 提供 `/v1/listen`(Nova-3 流式转写)与 `/v2/listen`(Flux 对话式回合检测);SDK 含 listen.v1/v2.connect;文档对比 Agent 与会议场景并支持自建 Flux。
LangSmith
LangSmith 是 LangChain 提供的云端/可自建平台,用于追踪、监控与改进大模型应用。docs.langchain.com 说明可通过环境变量、框架集成(文档集成页列出的 OpenAI、Anthropic、CrewAI、Vercel AI SDK、Pydantic AI 等)或 LangSmith SDK 接入,以便查看多步 run、对比 Prompt 版本、构建数据集、运行离线与在线评测、配置自动化并收集反馈队列。