开源搜索引擎:容错关键词、分面与混合检索
Meilisearch 在 meilisearch.com/docs 文档化开源搜索引擎,提供快速容错全文检索、分面、过滤与排序。Meilisearch Cloud 提供托管部署;自托管含 Docker 与原生二进制,REST API 与官方 SDK(JavaScript、Python、Rust、PHP、Java、.NET、Dart、Go)。近期文档与博客说明语义/混合检索、AI 搜索体验及官方 meilisearch-mcp 供 LLM 客户端使用。Meilisearch 定位为开发者友好、强调亚 50ms 搜索体验与简洁索引/文档 API。
使用场景
- 站点与应用即时搜索体验
- 带分面过滤与排序的电商目录
- 生产调优前的 keyword+语义混合原型
- 中等规模目录自托管替代较重 Elasticsearch 栈
- 开发期经 meilisearch-mcp 的 Agent 索引操作
主要功能
- 可配置排序规则的全文容错检索
- 分面、过滤与 geo 检索
- REST API 与多语言 SDK 管理索引与文档
- Meilisearch Cloud 分析与团队功能
- 官方 meilisearch-mcp 支持开发工作流自然语言索引管理
相关推荐
相关推荐
3 收录条目
Typesense
Typesense 在 typesense.org/docs 文档化开源搜索引擎,支持容错关键词检索、分面与向量检索。向量搜索见 typesense.org/docs/30.2/api/vector-search:KNN、OpenAI/PaLM 或 ts/* 内置模型 auto-embedding、混合 rank fusion、按 ID 相似查询、HNSW 与 flat_search_cutoff。Typesense Cloud 或自托管,REST API 与官方客户端。
turbopuffer
turbopuffer 在 turbopuffer.com/docs 文档化基于对象存储(S3、GCS、Azure)的快速搜索引擎,NVMe/内存缓存算力。WAL、SPFresh 质心 ANN、BM25、原生元数据过滤、branching namespace。API 含 ANN、全文、混合、regex;观测规模 4T+ 文档、10M+ writes/s;权衡为写入延迟与冷查询。
Chroma
Chroma 在 docs.trychroma.com 文档化开源嵌入向量数据库,供 Python/JavaScript 存储与查询向量、元数据与全文字段;涵盖内存/持久化客户端、自托管 HTTP 服务、Chroma Cloud 与 API Key;支持集合 CRUD、嵌入函数集成与混合检索,面向 RAG 与 Agent 记忆。