企业AI支出疯狂增长,业界如何应对成本危机?
“这简直是一场噩梦,”一位美国大型科技公司的高管如此描述企业使用人工智能正面临的新困境。AI智能体——能够阅读、理解并执行任务的程序——消耗大量算力资源,账单数字正在飞速攀升。随着这类技术不断普及,问题只会愈发严峻。这位高管指出,大企业通常运行着数百个软件系统。倘若每个系统都配备智能体(这几乎是必然趋势),AI开支将很容易失控。
预算管控已成为AI应用者新的心病。回想不久之前,员工们还被怂恿尽情拥抱这项技术,因为管理层和投资者将高额投入视为创新能力的象征。大量消耗token——模型处理的文本单位,也是主要计费依据——甚至成为一种炫耀的资本;技术人员美其名曰"tokenmaxxing"。企业通过内部排行榜展示员工的AI使用情况,Meta的页面给活跃用户冠以"Token传奇"等头衔。
这种激励机制在一定程度上推动了AI支出的爆发式增长。另一个关键因素是企业使用方式的转变。高资源消耗型应用,比如推理模型和智能体,正变得越来越受青睐。在某些场景下,智能体甚至能自主生成新的智能体,导致成本进一步膨胀。企业信用卡服务商Ramp通过分析客户交易数据研究AI使用模式,估计其客户整体支出在过去一年增长了13倍。今年4月,优步透露其已将全年AI预算在四个月内耗尽。众多企业面临同样困境,据悉某公司单月AI token支出就高达5亿美元。OpenAI掌门人萨姆·奥尔特曼坦言,客户成本不断攀升是"一个严峻问题"。
眼下,这个问题主要集中在特定领域。烧钱最多的大多是科技企业,因为他们是最早的尝鲜者,而且AI在代码编写方面确实表现出色。Ramp数据显示,在人均AI支出最高的那1%客户中,平均每人每月账单约7450美元,而Ramp客户的中位数仅为11美元。尽管与旧金山雇佣一名开发人员相比,这些AI账单算不上什么,但与德里的人力成本相比,就显得相当惊人了。
企业正纷纷采取对策。Tokenmaxxing的风潮已经退烧。Meta和亚马逊等公司已经关停了内部排行榜。很多企业开始更加审慎地挑选模型。事实上,大量任务根本不需要那些价格高昂的顶级模型。Archera.ai(帮助企业降低云服务开销)的Aran Khanna指出,某些情况下,Anthropic的入门级模型Sonnet成本仅为旗舰模型Opus的二十分之一。而中国初创公司月之暗面推出的开源模型Kimi,成本又是Sonnet的二十分之一。
另一种策略是设定支出上限。优步将员工每个编程工具的月度token配额限定在1500美元。咨询公司Thoughtworks的Rachel Laycock认为,企业如何分配token资源,取决于哪里能从AI中获得最大收益。她补充道,这通常意味着把最多的资源配置给核心业务部门,比如科技公司的工程团队。
部分将AI集成到产品中的软件厂商正在试验新型定价模式,比如按效果计费,以消除客户对成本的焦虑。客服软件供应商Intercom推出了一项服务,客户只为IT支持智能体成功解决的问题付费。大型云服务商也纷纷上线成本管理工具,包括预算控制功能和智能路由机制,将查询请求分配到最合适的模型。
对于模型开发商而言,平衡的艺术更加复杂。他们希望客户尽可能多地使用token,但又不想因价格吓跑用户。当前,AI服务的提供成本由各实验室补贴。实际上,据悉OpenAI从Anthropic争夺客户的策略就包括大幅降价。但长远来看,模型商必须实现盈利,这意味着终将提价。如果Anthropic和OpenAI如预期在年内上市,这种涨价压力只会更加巨大。届时,客户们恐怕要面对更多令人震惊的AI账单了。