Claude军师模式上线：一行代码激活Opus幕后智囊，成本大幅降低

发布时间：2026-04-10 17:38阅读：13

简而言之，这是将强大的Opus模型定位为幕后顾问，而将轻量级的Sonnet或Haiku模型定位为执行者。这种组合允许开发者在极低的成本下赋予其智能体接近Opus级别的顶级智能。

过去，开发者为了在AI智能和成本之间取得平衡，自行开发了一种大小模型协同工作的策略。今天，Anthropic官方将这一经验直接转化为Claude平台上的一个现成工具，只需更改API调用中的一行代码即可启用。

该策略的运作机制非常巧妙。

在军师策略下，Sonnet或Haiku作为执行者负责处理所有事务。它们从头到尾运行任务，调用各种工具，读取结果，并不断尝试解决问题。然而，当执行者遇到极其困难的关键决策并感到无能为力时，它会呼叫Opus寻求指导。

在接收到呼叫后，Opus读取双方共享的上下文信息，然后提供一个明确的计划、纠正建议或停止信号，随后执行者使用这些信息继续工作。在此过程中，军师绝不亲自调用任何工具，也不生成用户看到的最终输出；其职责仅限于为执行者提供高层指导。

这种方法颠覆了目前行业中最常见的子智能体模式。过去，人们习惯使用一个巨大的模型作为控制节点，将任务分解并分配给底层的较小模型。相反，在军师策略中，一个小巧且极其省钱的模型承担主导和汇报职责，完全不需要复杂的任务分解逻辑或庞大的工人池。最顶尖的推理算力被用于最关键的地方，仅在执行者真正卡住时才介入，其余大部分运行时间都保持在极低的成本线上。

在SWE benchmark Multilingual测试集中，带有Opus军师的Sonnet执行者的得分比单独工作的Sonnet高出了2.7个百分点，而每个任务的平均成本反而降低了11.9%。

在BrowseComp和Terminal benchmark 2.0测试中，拥有Opus作为军师的Sonnet不仅在得分上显著提升，其花费也比单独使用Sonnet时更低。

如果将执行者换成尺寸最小的Haiku模型，效果更加明显。在BrowseComp测试中，带有军师的Haiku获得了41.2%的高分，这几乎是它自己单独工作19.7%的两倍。虽然这个组合的最终得分比单独使用Sonnet低29%，但单次任务成本下降了85%。虽然引入军师确实给Haiku增加了一些开销，但总体成本仍然只是单独运行Sonnet的一小部分。对于那些既需要一定智能又面临海量高并发需求的应用场景来说，这是一个极具成本效益的选择。

目前，该军师工具已在Claude平台上启动Beta测试。

开发者只需在Messages API请求中声明advisor 20260301，模型的切换就会在同一个API请求内自动完成。这不需要额外的网络往返，也无需开发者手动管理复杂的上下文。

执行者模型会自行判断何时需要军师。一旦触发，系统会在后台自动将整理好的上下文发送给军师，获取计划后，执行者无缝衔接继续推进，整个过程非常顺畅。

核心代码配置非常简单：

计费方式也很清晰。军师消耗的Token按其大容量费率计算，而执行者消耗的Token按其轻量级费率计算。由于军师通常只吐出一份包含400到700个Token的简短指导计划，而耗尽大量Token的最终长文本完全交给价格低廉的执行者处理，因此总体成本被控制在低于全量运行大模型之下。

此外，官方还内置了成本控制功能。您可以通过设置max_uses参数来限制每次请求中军师的调用次数。系统还会在使用明细中将军师消耗的Token单独列出，以便您追踪每一分钱的去向。

这个新工具与您现有的技术栈完全兼容。军师工具本质上只是您API请求列表中的一个新增条目。您的智能体可以完全一边搜索信息一边编写代码测试，遇到死胡当时顺手向Opus请教，所有动作都在同一个循环中完美闭环。

要立即体验，只需按照以下三个步骤操作：

首先在请求头中添加Beta功能声明：anthropic-beta: advisor-tool-2026-03-01

然后在您的Messages API请求中添加advisor_20260301

最后根据您的具体业务场景调整系统提示词。

Anthropic官方强烈建议开发者现在使用自己的评估数据集运行对比测试，以查看单独运行Sonnet、使用军师策略组合以及单独运行Opus的具体效果差异。

← 上一篇：AI陪伴潜藏心理隐患教育智能化提速升级下一篇：贵州省人工智能学会赴省人工智能实验室开展调研 →