发生了什么

搜索和爬取工具开始以不同 MCP 组件的形式出现。Exa 帮 Agent 通过搜索和研究接口找候选来源,Firecrawl 把混乱网页转成更干净的内容,Tavily 这类工具则覆盖相邻的搜索与 grounding 任务。放在一起看,它们不像一个搜索框,更像一套检索栈。

这点重要,因为 Agent 通常不只是要一串链接。它要决定搜什么、哪些页面值得读、抽取多少正文,以及最终回答里哪些证据能用。

为什么重要

检索质量很容易被说得太简单。一个产品可能排序不错,但正文抽取弱;另一个很会爬页面,却需要更好的发现层;还有一些产品答案写得短,但来源链藏得太深。AI 工作流一旦进入真实业务,这些差异都不是装饰。

MCP 让这些部件更容易组合,至少方向上是这样。团队可以给 Agent 一个工具找候选来源,再用另一个工具清理页面。相比一个「研究 Agent」黑盒按钮,这种组合更容易调试。

对站内读者

AIasdf 里,Exa 和 You.com 继续放在 AI Tools;Exa MCP、Firecrawl MCP、Tavily Search MCP、Browserbase MCP 则应该作为检索层互链。页面要让读者快速看出每个组件负责哪一段:搜索、爬取、浏览器执行、来源检查,还是流程自动化。

这里最该关联的 Skill 是 source-verification。工具链能更快带回更多页面,人还是要检查来源主体、发布日期,以及说法是不是来自一手来源。

接下来观察什么

重点看限流、抽取质量、robots 处理、引用保真度,以及 Agent 能不能展示它为什么选了某个来源、从里面拿了什么。好用的检索栈不是工具最多的那条,而是审阅者能顺着证据链看明白的那条。