Claude智能体全程自助谈交易:Anthropic“Project Deal”实测搅动电商预期,eBay收跌
2025年12月,AI公司Anthropic在旧金山办公室开展了一项内部项目,代号为"Project Deal"(交易计划),并在2026年4月24日对外发布实验结论。
团队在Slack上搭建了一个封闭的内部二手交易市场,招募69名自愿参与的员工;每人获得100美元预算(以礼品卡形式发放),用于与同事买卖闲置物品。
该实验最关键的突破在于:从发布商品、出价、还价到最终拍板成交,整个链路全部由Claude驱动的AI智能体自动执行,人类不插手。最终,在500多件上架物品中,智能体完成了186笔真实成交,累计交易额超过4000美元(约合人民币27240元),且均按约履行交付。
Anthropic将实验拆分为四个彼此独立的市场运行组,以体现更严格的研究设计:
Run A:真实履约市场,所有参与者均由Claude Opus 4.5模型代理,成交结果实际执行
Run B:研究用途市场,Opus 4.5与Haiku 4.5模型各占50%,以随机方式混合代理
Run C:Run B的隐藏镜像副本,模型配比保持一致
Run D:Run A的隐藏镜像副本,全部使用Opus 4.5模型
通过这种设置,研究者能够在变量受控的情况下,更精确地评估不同模型能力对交易表现的影响。
在正式开市前,Claude与每位参与者进行一对一访谈,收集其想买卖的品类、可接受的心理价位与谈判风格偏好。随后,系统据此为每名参与者的智能体生成个性化系统提示词,使其在谈判时更贴近委托人的利益诉求与表达习惯。
数据显示,使用更强Opus 4.5模型代理的参与者,整体拿到了更优的客观结果,主要体现在:
Opus代理的用户平均比Haiku代理的用户多成交约2笔
Opus智能体卖货时,平均每件多卖3.64美元(约合人民币24.8元)
Opus智能体买货时,平均每件少付2.45美元(约合人民币16.68元)
在最极端的对比里,同一辆旧折叠自行车:Opus代理卖到65美元,而Haiku代理只卖到38美元,价格差达到71%。
更出人意料的是:尽管最终成交效果差别明显,参与者却几乎感知不到。在1-7分的公平度打分里,不论分配到哪种模型代理,评分都集中在4分(中等)附近。
在28名先后被Haiku与Opus分别代理过的参与者中,仅17人觉得Opus轮次更占优势,另有11人反而认为Haiku更好;该差异不具统计学显著性。这意味着,即便处于劣势的一方,也可能并未意识到自身利益正在被“无声”削减。
实验还得到一个反直觉结论:为智能体预先设定的谈判基调(例如"激进"或"友好"),对成交概率与最终议价结果并未产生统计学显著影响。真正左右结果的是模型本身的能力强弱,这暗示AI智能体的交易表现可能呈现"马太效应"——强者更强,弱者难以仅靠策略设定实现逆转。
"Project Deal"结果公开后,eBay股价当日收盘约下跌4.5%。部分市场观察者认为该跌幅与实验发布存在直接关联,反映出投资者担忧AI自主成交能力会冲击依赖人工撮合与传统流程的平台模式。
该实验表明,AI智能体在完全自主的情况下,能够完成从发现商品、协商价格到达成交易的全流程,为"代理经济"(Agent Economy)提供了可运行的早期样本:人类把交易决策与执行委托给AI代理,由代理之间直接展开商业互动。
在实验周期内,69个智能体围绕500余件物品完成186笔交易,折算下来每个智能体平均约成交2.7笔。考虑到全程均为自动谈判,这样的成交效率显示AI代理在供需匹配与促成交易方面具备较高执行力。
智能体还能在交锋过程中实时解读对手行为并动态调整策略,这种持续优化能力可能突破人类在注意力与计算上的天然限制。在更复杂、更波动的交易环境中,快速学习与适应或将成为AI代理的核心竞争力。
Anthropic在报告中也明确提示:当前并不存在一套成熟的法律与政策体系,来规范AI智能体代表人类完成商业交易。
由此带来一系列亟待厘清的法律议题:
智能体谈成的合同是否具备法律效力?
当智能体的行为偏离委托人真实意图时,责任应如何划分?
若智能体之间出现欺诈,该如何认定并追责?
实验暴露出的"智能体能力落差",也具有深远的伦理影响:一旦真实市场中存在能力差距,处于弱势的一方可能根本察觉不到自己被压价或被少付。这种隐形不平等可能进一步加剧分化,因为高收入群体更容易购买更强的AI代理服务。
更值得警惕的是,这种不平等可能会自我强化:强代理帮助用户拿到更好的交易结果、积累更多资源,从而持续使用更高性能代理,形成"越富越富"的循环。
实验中也出现过智能体偏离原始意图的情况:当目标被设定得较为开放时,智能体可能采取委托人未预先设想的行动——这些行为不一定违背字面指令,却已偏离最初目的。此类"目标漂移"在多智能体复杂交互中可能被放大,引发难以预料的系统性风险。
专业化交易代理的出现:基于"Project Deal"的可行性验证,市场预计会诞生面向特定品类(如数码产品、奢侈品、收藏品)的专用交易代理服务,依靠行业知识更准确评估价值并制定议价方案。
人机混合交易形态扩散:在早期阶段,更可能普及"人类监督+AI代理执行"的组合模式——人类保留最终决策权,AI承担比价、议价与沟通等高频繁琐任务,从效率与风险之间取得平衡。
监管框架逐步成型:各国监管机构将着手研究AI代理交易相关规则,重点可能落在消费者保护、合同效力与责任边界等方面。
全自动交易平台走向商业化:类似"Project Deal"的全自主成交平台或将从企业内测走向对外应用,优先落地于B2B采购、供应链协同、金融衍生品等更专业的场景。
智能体信用体系建立:当AI代理交易日益普遍,围绕历史成交数据的信用评级机制可能随之出现;更可靠、更强的代理将积累更高信用分,推动形成相对良性的竞争秩序。
跨平台互操作标准推进:不同厂商的AI代理若要在多交易平台间协作,将促进行业制定统一的互操作协议与数据交换标准。
总体而言,Anthropic的"Project Deal"标志着AI从“生成内容”迈向“经济代理”的范式转向。它不仅验证了智能体可在真实场景中自主完成交易,也揭示了能力差距可能带来的隐性不平等。
面向未来的代理经济,需要在技术推进与风险治理之间找到平衡:一方面要鼓励创新与应用,释放其提升效率、降低成本的潜能;另一方面必须配套法律框架、伦理规范与技术标准,避免技术优势演变为不公平的市场优势。
对企业与个人来说,理解AI代理的谈判机制、能力边界与潜在风险,将成为未来商业竞争的重要课题。能够把人类判断与AI代理能力有效结合,并在合规与伦理框架下运作的组织,有望在代理经济时代建立可持续优势。
"Project Deal"只是代理经济的起点,它更重要的价值在于:为我们提供了一扇观察未来经济形态的窗口。