Claude上线顾问策略：小模型主攻，大模型支援，成本直降85%

发布时间：2026-04-10 06:17阅读：50

昨天Claude才把AI Agent智能体的开发效率提升到10倍，原本以为已经足够强势。

结果今天凌晨2点20，Claude又正式推出了一项重磅能力——The Advisor Strategy（顾问策略）。

说白了，它就像一个AI版的诸葛亮。日常那些繁琐执行工作，先交给Sonnet或Haiku这类轻量模型冲在前面处理；只有碰到真正棘手的复杂问题，才请顶级的Opus在后方出谋划策。

最终呈现出来的效果，居然已经接近全程使用顶级大模型的水平，但整体成本却一下子削减了85%。对于每天都在为智能体运行费用发愁的人来说，这套方案确实相当炸裂。

更厉害的是，Claude直接把它封装成了现成能力，在API中只需改动一行代码就能接入，使用门槛低得惊人。

顾问策略核心玩法

大家都明白，如今运行AI智能体，如果从头到尾都调用最强的大模型，token消耗会非常夸张，成本高得让人难以承受。

但如果全部换成便宜的小模型，一旦遇到更复杂的任务，又很容易出现判断失误。这个新策略，正是针对这一痛点给出了一种非常务实的解决思路。

而Claude这次采取的方式恰好反过来，不按传统思路出牌，让Sonnet或Haiku这类高性价比模型承担从头到尾的主要执行工作。

像平常的信息检索、工具调用、分步骤处理问题，基本都由它们完成；只有碰到难以决定的关键节点时，才会把Opus这位高阶顾问请出来提供建议。

并且Opus也不会越俎代庖，不直接参与具体落地，而是基于共享的任务上下文，提出解法、修正前面的方向，或者判断任务是否应当停止，真正执行仍然交给前台模型完成，它也不会直接面向用户输出内容，只负责幕后参谋角色。

这就像请来一位顶尖专家担任顾问，平时无需为其全程买单，只有在真正卡住的时候才咨询一次，而大量基础事务仍由更划算的员工完成，既保证效率，也能节省可观开支。

测试数据

官方给出的测试结果也相当直接，Sonnet接入Opus顾问后，在SWE-bench Multilingual上的成绩提升了2.7%，而且单个智能体任务的成本还下降了11.9%。

至于Haiku搭配Opus顾问，成本更是直接压低了85%，真正实现了低价模型也能打出高阶表现，能力上升、成本下降，这种优化确实非常戳开发者需求。

另外，不同模型组合在这个工具下呈现出的效果和成本差异也很值得关注，无论你是希望在性能与费用之间取得平衡，还是单纯追求高吞吐、极致控本，都能找到对应方案，基本不用再反复纠结。

如果由Sonnet担任执行者，接入Opus顾问之后，在BrowseComp和Terminal-Bench 2.0这两项主流测试中，分数都高于单独使用Sonnet，同时成本反而更低，可以说是全面增强。

它非常适合那些既希望智能体能力足够可靠，又希望把成本控制住的应用场景，不必投入更多预算，就能获得接近Opus的表现。

要是让Haiku作为执行者，提升幅度会更夸张，堪称一次典型逆袭。在BrowseComp中，成绩直接从19.7%提升到41.2%，不止翻了一番。

虽然它仍略低于单独使用Sonnet的得分，但单次任务成本却能大幅削减85%，即便算上少量调用Opus的费用，总价依然显著低于Sonnet。

对于那些需要大规模批量执行任务、对成本高度敏感、但又不必追求最顶级能力的高吞吐场景来说，这个组合几乎就是最佳答案，用更少的预算完成更多的任务，性价比直接拉到最高。

如何使用顾问策略

顾问策略的接入方式也很简洁，不需要额外发起API调用，也不需要开发者自行维护上下文，只要在常规的Messages API请求中加入相应配置即可。

执行者模型会自行判断何时需要向Opus求助，触发调用时系统会自动把关键上下文同步给Opus，待Opus返回建议后，执行者会在同一次请求中继续完成后续步骤，整个过程非常顺畅，基本无需额外操心。

只要先指定执行者模型为Sonnet或Haiku，再在工具列表中加入advisor_20260301，同时把顾问模型设定为Opus即可。

还可以通过设置max_uses来限制每次请求中调用Opus的次数，避免一不小心预算超标，毕竟使用这项工具的核心目标就是控本。

同时，这个工具与大家平时常用的网页搜索、代码执行等能力完全兼容，智能体可以一边检索信息、运行代码，一边在遇到难题时向Opus咨询，不会打断现有流程，接入后就能直接使用。

再来看大家最在意的价格机制，其实规则非常明确：调用Opus时产生的token按Opus费率计费，而Sonnet或Haiku执行阶段的token则分别按照各自较低的费率来计算。

关键在于，Opus作为顾问时，每次通常只输出简短建议，一般只需要400到700个文本token，消耗很有限；而真正大部分的文本输出和任务执行，仍由执行者完成，本身价格就低。

因此，整体花费相比全程调用Opus会低出很多，这也是它能够实现成本骤降85%的关键所在。

另外，Claude还会把顾问环节的token消耗单独列出，顾问花了多少、执行花了多少，都能清楚看到，便于进行成本管理，不至于在预算上失去控制。

目前，这项顾问工具已经在Claude Platform开启原生公测，有兴趣体验的用户只需三步就能上手。

首先在请求头中加入公测特性标识anthropic-beta: advisor-tool-2026-03-01，然后在Messages API请求中增加advisor_20260301配置，最后再根据自己的实际业务场景，稍微调整系统提示词即可。

这里也补充一个小建议，刚开始接入时，可以先用自己的评估套件分别测试单独使用Sonnet、Sonnet配合Opus顾问，以及单独使用Opus的表现，对比它们在效果和成本上的差异，再依据结果来优化配置。