标签

Claude军师模式上线:一行代码激活Opus幕后智囊,成本大幅降低

发布时间:2026-04-10 17:38来源:微信阅读:4

简而言之,这是将强大的Opus模型定位为幕后顾问,而将轻量级的Sonnet或Haiku模型定位为执行者。这种组合允许开发者在极低的成本下赋予其智能体接近Opus级别的顶级智能。

过去,开发者为了在AI智能和成本之间取得平衡,自行开发了一种大小模型协同工作的策略。今天,Anthropic官方将这一经验直接转化为Claude平台上的一个现成工具,只需更改API调用中的一行代码即可启用。

该策略的运作机制非常巧妙。

在军师策略下,Sonnet或Haiku作为执行者负责处理所有事务。它们从头到尾运行任务,调用各种工具,读取结果,并不断尝试解决问题。然而,当执行者遇到极其困难的关键决策并感到无能为力时,它会呼叫Opus寻求指导。

在接收到呼叫后,Opus读取双方共享的上下文信息,然后提供一个明确的计划、纠正建议或停止信号,随后执行者使用这些信息继续工作。在此过程中,军师绝不亲自调用任何工具,也不生成用户看到的最终输出;其职责仅限于为执行者提供高层指导。

这种方法颠覆了目前行业中最常见的子智能体模式。过去,人们习惯使用一个巨大的模型作为控制节点,将任务分解并分配给底层的较小模型。相反,在军师策略中,一个小巧且极其省钱的模型承担主导和汇报职责,完全不需要复杂的任务分解逻辑或庞大的工人池。最顶尖的推理算力被用于最关键的地方,仅在执行者真正卡住时才介入,其余大部分运行时间都保持在极低的成本线上。

在SWE benchmark Multilingual测试集中,带有Opus军师的Sonnet执行者的得分比单独工作的Sonnet高出了2.7个百分点,而每个任务的平均成本反而降低了11.9%。

在BrowseComp和Terminal benchmark 2.0测试中,拥有Opus作为军师的Sonnet不仅在得分上显著提升,其花费也比单独使用Sonnet时更低。

如果将执行者换成尺寸最小的Haiku模型,效果更加明显。在BrowseComp测试中,带有军师的Haiku获得了41.2%的高分,这几乎是它自己单独工作19.7%的两倍。虽然这个组合的最终得分比单独使用Sonnet低29%,但单次任务成本下降了85%。虽然引入军师确实给Haiku增加了一些开销,但总体成本仍然只是单独运行Sonnet的一小部分。对于那些既需要一定智能又面临海量高并发需求的应用场景来说,这是一个极具成本效益的选择。

目前,该军师工具已在Claude平台上启动Beta测试。

开发者只需在Messages API请求中声明advisor 20260301,模型的切换就会在同一个API请求内自动完成。这不需要额外的网络往返,也无需开发者手动管理复杂的上下文。

执行者模型会自行判断何时需要军师。一旦触发,系统会在后台自动将整理好的上下文发送给军师,获取计划后,执行者无缝衔接继续推进,整个过程非常顺畅。

核心代码配置非常简单:

计费方式也很清晰。军师消耗的Token按其大容量费率计算,而执行者消耗的Token按其轻量级费率计算。由于军师通常只吐出一份包含400到700个Token的简短指导计划,而耗尽大量Token的最终长文本完全交给价格低廉的执行者处理,因此总体成本被控制在低于全量运行大模型之下。

此外,官方还内置了成本控制功能。您可以通过设置max_uses参数来限制每次请求中军师的调用次数。系统还会在使用明细中将军师消耗的Token单独列出,以便您追踪每一分钱的去向。

这个新工具与您现有的技术栈完全兼容。军师工具本质上只是您API请求列表中的一个新增条目。您的智能体可以完全一边搜索信息一边编写代码测试,遇到死胡当时顺手向Opus请教,所有动作都在同一个循环中完美闭环。

要立即体验,只需按照以下三个步骤操作:

首先在请求头中添加Beta功能声明:anthropic-beta: advisor-tool-2026-03-01

然后在您的Messages API请求中添加advisor_20260301

最后根据您的具体业务场景调整系统提示词。

Anthropic官方强烈建议开发者现在使用自己的评估数据集运行对比测试,以查看单独运行Sonnet、使用军师策略组合以及单独运行Opus的具体效果差异。