Claude智能体全程自助谈交易：Anthropic“Project Deal”实测搅动电商预期，eBay收跌

发布时间：2026-04-27 19:31阅读：10

2025年12月，AI公司Anthropic在旧金山办公室开展了一项内部项目，代号为"Project Deal"（交易计划），并在2026年4月24日对外发布实验结论。

团队在Slack上搭建了一个封闭的内部二手交易市场，招募69名自愿参与的员工；每人获得100美元预算（以礼品卡形式发放），用于与同事买卖闲置物品。

该实验最关键的突破在于：从发布商品、出价、还价到最终拍板成交，整个链路全部由Claude驱动的AI智能体自动执行，人类不插手。最终，在500多件上架物品中，智能体完成了186笔真实成交，累计交易额超过4000美元（约合人民币27240元），且均按约履行交付。

Anthropic将实验拆分为四个彼此独立的市场运行组，以体现更严格的研究设计：

Run A：真实履约市场，所有参与者均由Claude Opus 4.5模型代理，成交结果实际执行

Run B：研究用途市场，Opus 4.5与Haiku 4.5模型各占50%，以随机方式混合代理

Run C：Run B的隐藏镜像副本，模型配比保持一致

Run D：Run A的隐藏镜像副本，全部使用Opus 4.5模型

通过这种设置，研究者能够在变量受控的情况下，更精确地评估不同模型能力对交易表现的影响。

在正式开市前，Claude与每位参与者进行一对一访谈，收集其想买卖的品类、可接受的心理价位与谈判风格偏好。随后，系统据此为每名参与者的智能体生成个性化系统提示词，使其在谈判时更贴近委托人的利益诉求与表达习惯。

数据显示，使用更强Opus 4.5模型代理的参与者，整体拿到了更优的客观结果，主要体现在：

Opus代理的用户平均比Haiku代理的用户多成交约2笔

Opus智能体卖货时，平均每件多卖3.64美元（约合人民币24.8元）

Opus智能体买货时，平均每件少付2.45美元（约合人民币16.68元）

在最极端的对比里，同一辆旧折叠自行车：Opus代理卖到65美元，而Haiku代理只卖到38美元，价格差达到71%。

更出人意料的是：尽管最终成交效果差别明显，参与者却几乎感知不到。在1-7分的公平度打分里，不论分配到哪种模型代理，评分都集中在4分（中等）附近。

在28名先后被Haiku与Opus分别代理过的参与者中，仅17人觉得Opus轮次更占优势，另有11人反而认为Haiku更好；该差异不具统计学显著性。这意味着，即便处于劣势的一方，也可能并未意识到自身利益正在被“无声”削减。

实验还得到一个反直觉结论：为智能体预先设定的谈判基调（例如"激进"或"友好"），对成交概率与最终议价结果并未产生统计学显著影响。真正左右结果的是模型本身的能力强弱，这暗示AI智能体的交易表现可能呈现"马太效应"——强者更强，弱者难以仅靠策略设定实现逆转。

"Project Deal"结果公开后，eBay股价当日收盘约下跌4.5%。部分市场观察者认为该跌幅与实验发布存在直接关联，反映出投资者担忧AI自主成交能力会冲击依赖人工撮合与传统流程的平台模式。

该实验表明，AI智能体在完全自主的情况下，能够完成从发现商品、协商价格到达成交易的全流程，为"代理经济"（Agent Economy）提供了可运行的早期样本：人类把交易决策与执行委托给AI代理，由代理之间直接展开商业互动。

在实验周期内，69个智能体围绕500余件物品完成186笔交易，折算下来每个智能体平均约成交2.7笔。考虑到全程均为自动谈判，这样的成交效率显示AI代理在供需匹配与促成交易方面具备较高执行力。

智能体还能在交锋过程中实时解读对手行为并动态调整策略，这种持续优化能力可能突破人类在注意力与计算上的天然限制。在更复杂、更波动的交易环境中，快速学习与适应或将成为AI代理的核心竞争力。

Anthropic在报告中也明确提示：当前并不存在一套成熟的法律与政策体系，来规范AI智能体代表人类完成商业交易。

由此带来一系列亟待厘清的法律议题：

智能体谈成的合同是否具备法律效力？

当智能体的行为偏离委托人真实意图时，责任应如何划分？

若智能体之间出现欺诈，该如何认定并追责？

实验暴露出的"智能体能力落差"，也具有深远的伦理影响：一旦真实市场中存在能力差距，处于弱势的一方可能根本察觉不到自己被压价或被少付。这种隐形不平等可能进一步加剧分化，因为高收入群体更容易购买更强的AI代理服务。

更值得警惕的是，这种不平等可能会自我强化：强代理帮助用户拿到更好的交易结果、积累更多资源，从而持续使用更高性能代理，形成"越富越富"的循环。

实验中也出现过智能体偏离原始意图的情况：当目标被设定得较为开放时，智能体可能采取委托人未预先设想的行动——这些行为不一定违背字面指令，却已偏离最初目的。此类"目标漂移"在多智能体复杂交互中可能被放大，引发难以预料的系统性风险。

专业化交易代理的出现：基于"Project Deal"的可行性验证，市场预计会诞生面向特定品类（如数码产品、奢侈品、收藏品）的专用交易代理服务，依靠行业知识更准确评估价值并制定议价方案。

人机混合交易形态扩散：在早期阶段，更可能普及"人类监督+AI代理执行"的组合模式——人类保留最终决策权，AI承担比价、议价与沟通等高频繁琐任务，从效率与风险之间取得平衡。

监管框架逐步成型：各国监管机构将着手研究AI代理交易相关规则，重点可能落在消费者保护、合同效力与责任边界等方面。

全自动交易平台走向商业化：类似"Project Deal"的全自主成交平台或将从企业内测走向对外应用，优先落地于B2B采购、供应链协同、金融衍生品等更专业的场景。

智能体信用体系建立：当AI代理交易日益普遍，围绕历史成交数据的信用评级机制可能随之出现；更可靠、更强的代理将积累更高信用分，推动形成相对良性的竞争秩序。

跨平台互操作标准推进：不同厂商的AI代理若要在多交易平台间协作，将促进行业制定统一的互操作协议与数据交换标准。

总体而言，Anthropic的"Project Deal"标志着AI从“生成内容”迈向“经济代理”的范式转向。它不仅验证了智能体可在真实场景中自主完成交易，也揭示了能力差距可能带来的隐性不平等。

面向未来的代理经济，需要在技术推进与风险治理之间找到平衡：一方面要鼓励创新与应用，释放其提升效率、降低成本的潜能；另一方面必须配套法律框架、伦理规范与技术标准，避免技术优势演变为不公平的市场优势。

对企业与个人来说，理解AI代理的谈判机制、能力边界与潜在风险，将成为未来商业竞争的重要课题。能够把人类判断与AI代理能力有效结合，并在合规与伦理框架下运作的组织，有望在代理经济时代建立可持续优势。

"Project Deal"只是代理经济的起点，它更重要的价值在于：为我们提供了一扇观察未来经济形态的窗口。

← 上一篇：棋盘之外：2025机器博弈AI白皮书要点下一篇：她从云南启程，转身成为AI训练师 →