Anthropic 进行了一个名为 Project Deal 的封闭实验,AI 代理在市场中代表买方和卖方,完成了 186 笔真实交易,价值超过 4,000 美元。该实验是面向 69 名 Anthropic 员工的试点,每人获得一个预算,代理代表他们进行谈判。Anthropic 形容自己对 Project Deal 的效果"感到震惊"——但结果也提出了关于模型质量如何影响真实经济结果的问题。
Project Deal 如何运作
Anthropic 运行了四个不同的市场配置,配备不同的模型层级。在"真实"条件下,每个人都由公司最先进的模型代表。在其他条件下,参与者由较旧或能力较弱的模型代表。
结果是:当用户由更先进的模型代表时,他们获得了"客观上更好的结果"——卖方获得更高价值,买方获得更低价格。但引人注目的是:用户似乎没有注意到实验中途代理升级时的差异。他们接受了更好的结果,却没有意识到质量差异。
这引发了一个对 AI 开发者不舒服的问题:如果更好的 AI 模型的经济影响对用户不可见,市场将如何为 AI 能力定价?如果买方和卖方无法判断自己何时获得了更好的交易,通常推动竞争的市场信号可能会减弱。
对 AI Agent 的意义
Project Deal 是关于 AI 代理将如何参与经济活动的更广泛问题的一个数据点。实验表明,AI 对 AI 的商业交流在技术上是可行的——代理可以谈判、就价格达成一致并完成真实交易。
更复杂的问题涉及在大规模时会发生什么:代理如何代表用户偏好和约束?来自不同提供商的代理相互谈判时会发生什么?现有的监管框架如何适用于 AI 对 AI 的交易?
Anthropic 将 Project Deal 定位为内部研究实验,而非产品。但结果为该公司思考 Agent 商业化提供了参考——这可能是未来几年 AI 部署的一个可能前沿。