AI模型成本激增,企业需掌握“模型调度”策略
最近两条新闻放在一起看,很有意思。
5 月 28 日,Anthropic 发布 Claude Opus 4.8。按照官方说法,这是一次面向 coding、推理、金融分析和知识工作能力的升级,价格保持不变,而且 Mythos 级别模型也会在未来几周面向更多客户开放。
同一天,Anthropic 又宣布完成 650 亿美元融资,投后估值达到 9650 亿美元。
另一边,Axios 在 5 月 29 日写道,企业 CEO 们正在开始“AI bargain hunting”,也就是给 AI 找更便宜的用法。
这两件事看起来有点矛盾。
一边是模型公司估值越来越高,旗舰模型越来越强。
另一边是企业客户开始精打细算,不想所有任务都用最贵的模型,也不想被单一供应商锁死。
这背后其实是企业 AI 进入新阶段的信号。
过去大家问的是:哪个模型最强?
接下来企业更该问的是:每个任务,到底该用哪个模型?
这就是模型路由。
先说一个很现实的问题。
企业刚开始用 AI 时,通常会走一条很简单的路:选一个最强模型,然后让所有人都用。
写方案,用它。
做总结,用它。
客服回复,用它。
代码生成,用它。
知识库问答,用它。
数据分析,也用它。
这种方式在试点阶段很舒服。采购简单,体验统一,管理成本低。
但一旦 AI 真正进业务,账单很快就会变得不舒服。
原因很简单:企业内部的任务价值差异太大。
有些任务值得用最强模型。
比如战略分析、复杂代码重构、法律合同审查、重大客户方案、财务异常解释、生产故障诊断。
这类任务错一次成本很高,值得多花钱买更强推理、更低幻觉、更高可靠性。
但还有很多任务不值得。
比如会议纪要初稿、普通邮件润色、客服知识库检索、简单分类、标签生成、格式转换、常规报表摘要。
这些任务如果全部交给旗舰模型,效果可能确实不错,但经济性很差。
就像公司不会让 CTO 亲自处理每一张报销单,也不应该让最贵模型处理每一个低风险任务。
模型路由解决的,就是这个问题。
它的基本思路很简单:
不同任务,交给不同模型。
高复杂度、高风险、高价值任务,用旗舰模型。
中等复杂度任务,用性价比模型。
低风险、标准化任务,用轻量模型或本地模型。
如果第一个模型失败,再 fallback 到更强模型。
如果任务涉及敏感数据,就走私有化或本地模型。
如果任务对时延敏感,就优先选择响应更快的模型。
如果任务对成本敏感,就优先选择便宜模型。
这听起来像技术优化,但本质是企业 AI 的资源调度问题。
模型不再是一个统一入口,而变成一组可调度的能力池。
企业要做的,不是迷信某一个模型,而是建立一个“模型调度层”。
为什么这个话题现在变得重要?
因为模型能力正在快速分层。
Anthropic 这次发布 Opus 4.8,就是一个很好的信号。它不是最终的 Mythos,但已经在 coding、知识工作和 agentic reasoning 上继续往前推。与此同时,市场还在等待更强的 Mythos 级别模型开放。
这意味着未来企业会面对一个更复杂的模型货架。
同一家厂商内部,就会有快模型、强模型、便宜模型、专业模型。
不同厂商之间,还会有 OpenAI、Anthropic、Google、通义、开源模型、垂直模型、本地模型。
这不是“谁赢谁输”的简单游戏。
对企业来说,真正的问题是:怎样把这些模型组合成一套稳定、便宜、可治理的系统。
就像云计算时代,企业不会只问“哪台服务器最强”。
它会做弹性伸缩、冷热分层、负载均衡、容灾切换、成本优化。
AI 模型也会走到这一步。
模型路由的第一层,是成本路由。
任务进来以后,系统先判断它的复杂度和风险等级。
如果只是简单摘要,就用便宜模型。
如果摘要结果需要进入董事会材料,就升级模型。
如果是代码改动建议,先用中等模型生成方案,再让强模型审查。
如果是生产故障分析,直接用强模型,并接入日志、指标和历史事故库。
这背后的思路不是抠门,而是把钱花在刀刃上。
企业 AI 最大的问题不是“用不用得起最强模型”,而是“不知道什么时候该用最强模型”。
当 AI 使用量扩大以后,模型调用会变成基础设施成本。
如果没有路由机制,AI 账单会像早期云账单一样失控。
第二层,是质量路由。
不是所有任务都只看价格。
有些任务便宜模型也能做,但稳定性不够。
比如合同审查。
便宜模型可能能找出明显问题,但漏掉一个关键条款,成本就很高。
比如代码修复。
便宜模型可能能改出能跑的代码,但引入隐性架构债。
比如金融分析。
便宜模型可能能总结表格,但对异常值解释不够稳。
所以模型路由不能只做“省钱”。
它必须同时看质量、风险和责任。
企业需要为任务建立分级:
什么任务可以低成本快速完成。
什么任务需要强模型复核。
什么任务必须人类确认。
什么任务不能交给外部模型。
这才是模型路由的核心。
不是把请求发给最便宜的模型,而是把任务发给“足够好且成本合理”的模型。
第三层,是供应商路由。
Axios 的报道里有一个很重要的点:企业不想标准化在单一供应商上。
原因不难理解。
如果所有 workflow 都深度绑定一个模型平台,短期体验可能很好,但长期会形成锁定。
价格涨了怎么办?
模型质量波动怎么办?
服务不可用怎么办?
某个地区或行业合规要求变化怎么办?
供应商路线变了怎么办?
过去企业已经在云计算时代吃过一次锁定成本。
到了 AI 时代,大家不会完全没有记忆。
所以未来的企业 AI 架构,很可能会从“一家模型供应商”走向“多模型、多供应商、多策略”的组合。
这不是为了同时追热点,而是为了掌握议价权、连续性和风险控制。
模型路由,会变成企业避免 AI 供应商锁定的一层基础设施。
第四层,是数据路由。
企业 AI 最敏感的部分,不是模型能力,而是数据边界。
同一个任务,如果输入的是公开信息,可以走外部模型。
如果输入的是客户隐私、财务数据、源代码、合同条款、员工信息,就要换一套策略。
有些可以脱敏后再调用外部模型。
有些必须走私有云。
有些只能走本地模型。
有些必须全程留审计记录。
这意味着模型路由不只是“按价格分发请求”,还要理解数据分类和合规策略。
未来企业的 AI 网关,很可能会像今天的数据安全网关一样,先判断数据级别,再决定能不能调用某个模型。
如果没有这一层,AI 使用越广,数据风险越大。
第五层,是任务路由。
这和前面几篇 Harness Engineering 很相关。
企业真正要做的不是“把一句 prompt 丢给某个模型”,而是把任务拆成多个步骤,然后每一步选择合适的模型和工具。
比如一项市场分析任务,可以拆成:
资料搜索。
信息去重。
结构化摘要。
趋势判断。
风险分析。
报告写作。
事实核查。
不同步骤未必要用同一个模型。
搜索和整理可以用便宜模型。
关键判断用强模型。
最终事实核查用专门工具或另一个模型。
写作润色可以再换一个更擅长表达的模型。
这就是任务级路由。
它比请求级路由更重要。
因为企业真正关心的不是一次模型调用,而是一个业务结果。
模型路由听起来很好,但也会带来新的问题。
第一个问题,是可解释性。
如果同一个员工今天问一个问题,系统背后用了模型 A;明天类似问题用了模型 B;后天又经过了两个模型协作,那结果出了问题,责任怎么追?
所以模型路由必须有 route receipt。
也就是路由记录。
这次任务为什么选择这个模型?
输入数据属于什么级别?
成本是多少?
有没有 fallback?
有没有人工确认?
最终结果由谁负责?
没有路由记录,模型路由会变成新的黑箱。
第二个问题,是质量评估。
模型路由不能只看厂商 benchmark。
企业要建立自己的任务集。
客服场景看解决率和升级率。
销售场景看转化和合规。
研发场景看测试通过率、回滚率、代码 review 反馈。
财务场景看错误率和审计通过率。
没有企业自己的 eval,路由策略就只能靠感觉。
第三个问题,是成本反噬。
有些团队为了省钱,会把太多任务路由到便宜模型,结果人类返工成本上升。
表面上 token 省了,实际上总成本更高。
所以模型路由不能只算 API 账单。
还要算返工、等待、审核、事故和机会成本。
我觉得未来企业会逐步建立三层 AI 成本治理。
第一层,是看得见。
每个部门、每个应用、每类任务用了多少 token、花了多少钱、调用了哪些模型。
这是最基础的 FinOps。
第二层,是管得住。
给不同任务设置预算、模型白名单、数据边界和调用阈值。超过预算要告警,高风险数据要拦截,低价值任务不能默认用旗舰模型。
第三层,是调得优。
系统根据任务效果、成本、时延和风险,持续优化路由策略。
这时企业 AI 就不再是“买模型”,而是一套持续运营的资源系统。
从这个角度看,模型路由不是一个可选插件,而是企业 AI 规模化的必经阶段。
这里也有一个容易被忽略的变化:模型路由会改变企业采购逻辑。
过去采购 AI,像买软件。
选一家供应商,谈价格,开账号,做培训。
未来采购 AI,更像采购云资源。
企业会比较不同模型的单位成本、时延、可靠性、数据合规、生态工具、迁移成本。
也会要求供应商提供更透明的定价、更稳定的 SLA、更好的路由接口、更清晰的数据边界。
模型公司之间的竞争,也会从“我的模型最强”变成“我的模型在你的任务组合里性价比最高”。
这会让市场更理性。
旗舰模型当然还会重要。
但企业不会愿意把所有任务都交给旗舰模型。
就像不是所有工作都需要专家会诊。
多数业务需要的是分诊系统。
那么企业现在该做什么?
我建议先做四件事。
第一,给 AI 任务分级。
把公司内部 AI 使用场景分成高风险高价值、中风险常规、低风险批量三类。不要所有任务一个待遇。
第二,建立模型使用账本。
至少知道谁在用、用什么、做什么任务、花多少钱、结果是否被采用。
没有账本,就没有治理。
第三,建设小型模型路由策略。
不用一上来做很复杂的平台。可以先从 3 到 5 类任务开始:摘要、问答、代码、分析、写作。给每类任务设默认模型和升级条件。
第四,把路由接入 Harness。
也就是说,模型选择不是孤立发生的,而要和任务规格、数据权限、验证标准、人工审批结合。
高风险任务不只是换强模型,还要加强验证。
低风险任务不只是换便宜模型,还要限制数据范围。
模型路由只有和企业治理结合,才有意义。
回到这几天的新闻。
Anthropic 估值接近万亿美元,说明市场仍然相信旗舰模型和企业需求的巨大价值。
CEO 们开始寻找更便宜的 AI 用法,说明企业客户已经从尝鲜进入经营阶段。
这两件事并不矛盾。
模型会继续变强,也会继续变贵。
企业会继续用 AI,也会越来越在意 ROI。
中间缺的,就是模型路由。
它让企业不必在“全用最强模型”和“全用便宜模型”之间二选一。
它让 AI 能力像电力一样被调度:关键设备用高可靠线路,普通照明用标准线路,临时负载按需扩容。
未来真正成熟的企业 AI 系统,大概率都会长出这一层。
所以我觉得,接下来企业做 AI,不能只问模型能力。
还要问五个问题:
每类任务应该用哪个模型?
什么时候需要升级到更强模型?
哪些数据不能出边界?
每次路由有没有记录?
路由策略能不能根据结果持续优化?
如果这些问题答不上来,AI 用得越多,成本和风险越会失控。
如果这些问题答得上来,企业才算真正进入了 AI 运营阶段。
不是人人都用最强模型。
而是每个任务都用最合适的模型。
这就是模型路由的价值。
AI 时代,最贵的不一定是模型。
最贵的是不会调度模型。