标签

Claude上线顾问策略:小模型主攻,大模型支援,成本直降85%

发布时间:2026-04-10 06:17来源:微信阅读:15

昨天Claude才把AI Agent智能体的开发效率提升到10倍,原本以为已经足够强势。

结果今天凌晨2点20,Claude又正式推出了一项重磅能力——The Advisor Strategy(顾问策略)。

说白了,它就像一个AI版的诸葛亮。日常那些繁琐执行工作,先交给Sonnet或Haiku这类轻量模型冲在前面处理;只有碰到真正棘手的复杂问题,才请顶级的Opus在后方出谋划策。

最终呈现出来的效果,居然已经接近全程使用顶级大模型的水平,但整体成本却一下子削减了85%。对于每天都在为智能体运行费用发愁的人来说,这套方案确实相当炸裂。

更厉害的是,Claude直接把它封装成了现成能力,在API中只需改动一行代码就能接入,使用门槛低得惊人。

顾问策略核心玩法

大家都明白,如今运行AI智能体,如果从头到尾都调用最强的大模型,token消耗会非常夸张,成本高得让人难以承受。

但如果全部换成便宜的小模型,一旦遇到更复杂的任务,又很容易出现判断失误。这个新策略,正是针对这一痛点给出了一种非常务实的解决思路。

而Claude这次采取的方式恰好反过来,不按传统思路出牌,让Sonnet或Haiku这类高性价比模型承担从头到尾的主要执行工作。

像平常的信息检索、工具调用、分步骤处理问题,基本都由它们完成;只有碰到难以决定的关键节点时,才会把Opus这位高阶顾问请出来提供建议。

并且Opus也不会越俎代庖,不直接参与具体落地,而是基于共享的任务上下文,提出解法、修正前面的方向,或者判断任务是否应当停止,真正执行仍然交给前台模型完成,它也不会直接面向用户输出内容,只负责幕后参谋角色。

这就像请来一位顶尖专家担任顾问,平时无需为其全程买单,只有在真正卡住的时候才咨询一次,而大量基础事务仍由更划算的员工完成,既保证效率,也能节省可观开支。

测试数据

官方给出的测试结果也相当直接,Sonnet接入Opus顾问后,在SWE-bench Multilingual上的成绩提升了2.7%,而且单个智能体任务的成本还下降了11.9%。

至于Haiku搭配Opus顾问,成本更是直接压低了85%,真正实现了低价模型也能打出高阶表现,能力上升、成本下降,这种优化确实非常戳开发者需求。

另外,不同模型组合在这个工具下呈现出的效果和成本差异也很值得关注,无论你是希望在性能与费用之间取得平衡,还是单纯追求高吞吐、极致控本,都能找到对应方案,基本不用再反复纠结。

如果由Sonnet担任执行者,接入Opus顾问之后,在BrowseComp和Terminal-Bench 2.0这两项主流测试中,分数都高于单独使用Sonnet,同时成本反而更低,可以说是全面增强。

它非常适合那些既希望智能体能力足够可靠,又希望把成本控制住的应用场景,不必投入更多预算,就能获得接近Opus的表现。

要是让Haiku作为执行者,提升幅度会更夸张,堪称一次典型逆袭。在BrowseComp中,成绩直接从19.7%提升到41.2%,不止翻了一番。

虽然它仍略低于单独使用Sonnet的得分,但单次任务成本却能大幅削减85%,即便算上少量调用Opus的费用,总价依然显著低于Sonnet。

对于那些需要大规模批量执行任务、对成本高度敏感、但又不必追求最顶级能力的高吞吐场景来说,这个组合几乎就是最佳答案,用更少的预算完成更多的任务,性价比直接拉到最高。

如何使用顾问策略

顾问策略的接入方式也很简洁,不需要额外发起API调用,也不需要开发者自行维护上下文,只要在常规的Messages API请求中加入相应配置即可。

执行者模型会自行判断何时需要向Opus求助,触发调用时系统会自动把关键上下文同步给Opus,待Opus返回建议后,执行者会在同一次请求中继续完成后续步骤,整个过程非常顺畅,基本无需额外操心。

只要先指定执行者模型为Sonnet或Haiku,再在工具列表中加入advisor_20260301,同时把顾问模型设定为Opus即可。

还可以通过设置max_uses来限制每次请求中调用Opus的次数,避免一不小心预算超标,毕竟使用这项工具的核心目标就是控本。

同时,这个工具与大家平时常用的网页搜索、代码执行等能力完全兼容,智能体可以一边检索信息、运行代码,一边在遇到难题时向Opus咨询,不会打断现有流程,接入后就能直接使用。

再来看大家最在意的价格机制,其实规则非常明确:调用Opus时产生的token按Opus费率计费,而Sonnet或Haiku执行阶段的token则分别按照各自较低的费率来计算。

关键在于,Opus作为顾问时,每次通常只输出简短建议,一般只需要400到700个文本token,消耗很有限;而真正大部分的文本输出和任务执行,仍由执行者完成,本身价格就低。

因此,整体花费相比全程调用Opus会低出很多,这也是它能够实现成本骤降85%的关键所在。

另外,Claude还会把顾问环节的token消耗单独列出,顾问花了多少、执行花了多少,都能清楚看到,便于进行成本管理,不至于在预算上失去控制。

目前,这项顾问工具已经在Claude Platform开启原生公测,有兴趣体验的用户只需三步就能上手。

首先在请求头中加入公测特性标识anthropic-beta: advisor-tool-2026-03-01,然后在Messages API请求中增加advisor_20260301配置,最后再根据自己的实际业务场景,稍微调整系统提示词即可。

这里也补充一个小建议,刚开始接入时,可以先用自己的评估套件分别测试单独使用Sonnet、Sonnet配合Opus顾问,以及单独使用Opus的表现,对比它们在效果和成本上的差异,再依据结果来优化配置。