廉价AI时代或将终结
眼下每月几十到几百元,就能让全球顶尖的AI帮你写策划、改代码、整理数据、翻译文献。 听起来像是赶上了好时候。 但细想之下:这份低廉的代价,背后是谁在买单?
有些账单,起初并不像账单。
比如你第一次订阅AI会员,可能只是觉得:花一杯咖啡的钱,换一个随时待命的写作助手、编程帮手、语言老师,似乎挺划算。
随后它开始渗透进日常工作。
用它写工作日志。用它做演示文稿。用它查资料。用它改简历。甚至遇到复杂的邮件、合同、方案,也会习惯性丢给它先过一遍。
再后来,最尴尬的情况出现了:
不是你离不开AI。
而是发现,周围所有人都默认你应该用AI。
老板问:“这个为什么不让AI先出一版?” 同事说:“你让模型跑一下不就行了?” 工具栏里也悄悄多了几个按钮:AI摘要、AI润色、AI生成、AI分析。
它从新奇玩具,变成了办公必需品。
可必需品有个特点:便宜的时候,你不会天天惦记;一旦涨价,所有人都会抬头看价签。
最近Hacker News上有一条讨论,标题很直白:Why current LLM costs are not sustainable。原文作者Aditya Patadia的观点是,当前大模型的成本结构并不稳固,不少企业正被AI账单困扰。
他在文中举了几个案例:Uber据传4个月就烧光了全年的AI预算;Microsoft、Salesforce和GitHub也在采取措施控制员工的AI使用支出。作者还提到,GPT-5.5这类前沿模型的价格可以达到每百万输入token 5美元、每百万输出token 30美元;他本人只是用模型修复50个文件里的TypeScript类型问题,一个下午就花了54美元。
这不是“AI没用”的故事。
恰恰相反,正因为它太有用了,账单才开始变得刺眼。
很多人对AI价格的感受,其实被订阅制掩盖了。
你每月付一笔固定会员费,似乎就能无限制使用一个强大的模型。它像视频会员、网盘会员、音乐会员一样,被包装成一个轻便的小订阅。
但大模型不是普通应用。
你每问一次,它背后都要消耗算力。模型越强,回答越长,推理越复杂,费用就越高。
HN评论区里有位开发者的说法很有代表性:如果直接按token付费,某些高强度使用可能会非常昂贵;但如果用官方订阅套餐,同样的重度使用可能被压到每月一百多欧元。换句话说,我们看到的订阅价,未必是真实成本的完整面貌。
这有点像早期的网约车和外卖。
刚开始,补贴满天飞,打车比公交还便宜,外卖比自己做饭还划算。那时候你会觉得,这就是新生活。
后来补贴少了,配送费涨了,会员规则复杂了,平台开始精打细算。
用户才意识到:原来那些“便宜”,不是因为服务本来就这么便宜,而是因为平台、投资人、商家和骑手一起分担了成本。
AI也可能经历类似的阶段。
现在很多人习惯了“低价用最强模型”。但前沿模型背后有训练成本、推理成本、数据中心、芯片、电力、工程团队、合规和安全投入。企业可以短期补贴用户,也可以把价格藏在订阅、限额、降速和分层套餐里。
但账不会消失。
它只是在等一个合适的时机,重新浮现。
AI产品接下来很可能会分成几层。
第一层,是便宜、够用、限制比较多的日常模型。
它可以写邮件、总结文档、调整语气、做轻量搜索。普通用户会觉得还不错,企业也愿意大规模铺开,因为成本可控。
第二层,是更贵、更强、但不会轻易放开的前沿模型。
它能处理复杂推理、长代码库、科学问题、多步骤Agent任务,也能在关键场景里减少一些低级错误。问题是,这类能力不可能永远按“白菜价”卖。
第三层,则是本地模型和开源模型。
它们不一定总是最强,但胜在便宜、可控、隐私感更强。HN评论区里就有人提到,未来企业和个人可能会把一部分任务迁回本地,尤其是那些不需要最强模型、但每天都要跑很多次的小任务。
这意味着一个很现实的变化:
以后我们不会再简单地问,“你有没有AI?”
而是会问:
你用的是哪一层AI? 你把最贵的模型用在什么地方? 哪些任务可以交给小模型? 哪些任务必须请“最强大脑”出场?
这就像企业用人。
不是所有事都要老板亲自做。打印文件、整理资料、初筛表格,交给实习生就够了。真正复杂的判断、谈判、关键决策,才需要高级专家。
AI时代也一样。
如果你让最贵的模型去做所有琐事,就像请一个年薪百万的顾问天天帮你贴发票。不是不能做,是账很难看。
个人用户对AI成本的感知,往往是“这个会员贵不贵”。
企业不是。
企业看到的是一张更复杂的表:多少员工在用,调用了多少次,输出了多少token,有多少任务是重复的,有多少回答需要重试,有多少代码还要返工,有多少数据不能上云。
于是一个微妙的变化会发生。
刚开始,企业鼓励大家多用AI,因为这代表“拥抱新技术”。
再往后,财务和IT部门会开始问:
谁在用? 用在哪? 为什么这个团队的调用量这么高? 这些使用到底带来了交付,还是只是让大家生成了更多需要审核的东西?
这时AI的问题就不再是“会不会提示词”。
它变成了管理问题。
一个团队如果没有清楚的工作流,没有评价标准,没有复盘机制,就很容易把AI用成新的浪费:生成更多文档,制造更多版本,产出更多看起来很完整、但没人真正负责的内容。
老板以为买的是效率。
最后买到的可能是一堆token烟花。
HN那条成本讨论里,有人提到自己用免费的DeepSeek Flash加上不错的工具壳,已经能处理很多简单任务。这个评论很有意思,因为它指向了一个被忽略的事实:
很多时候,真正值钱的不只是模型本身,而是模型外面的工作流。
任务怎么拆?上下文怎么给?什么时候让模型停下来?输出怎么验?错了怎么回滚?
这些东西做好了,便宜模型也能办不少事。做不好,最强模型也可能只是更贵地犯错。
这篇不是要劝你少用AI。
相反,现在正是普通人最应该练AI工作流的时候。因为补贴期也好,竞争期也好,总之我们确实能用相对低的价格,接触到过去难以想象的能力。
但用法要变聪明一点。
第一,不要把所有任务都交给最强模型。
写一封普通邮件、改一个标题、整理会议纪要,不一定非要上最贵的模型。把任务按难度分层,简单任务用便宜模型,关键任务再用强模型,这是未来很重要的基本功。
第二,别只看“模型聪不聪明”,也要看“流程省不省钱”。
同样一个任务,你直接把一堆资料全塞进去,可能又贵又乱。先整理材料、删掉无关内容、明确输出格式,再让模型处理,成本会低很多,结果也更稳。
第三,给高频任务做模板。
如果你每天都让AI帮你写小红书标题、整理读书笔记、改公众号段落,那就不要每天重新解释一遍需求。把固定要求写成模板,减少来回试错。省下来的不是几句话,是长期的token和注意力。
第四,关注本地模型和开源模型。
它们现在不一定能替代最强云端模型,但会越来越适合处理私人、重复、轻量的任务。尤其是涉及隐私、企业资料、长期知识库的场景,本地化不只是省钱,也是一种边界感。
第五,也是最重要的一点:别让AI替你制造更多工作。
很多人用了AI以后,表面上效率提高了,实际上只是生成了更多需要自己确认、修改、背锅的东西。真正好的AI使用,应该减少返工,而不是把返工包装得更高级。
大模型企业现在面对的是一场艰难的平衡。
它们要继续证明模型越来越强,也要让用户觉得价格可以接受;要吸引个人用户,也要说服企业买单;要投入天价算力训练下一代模型,又要想办法让每一次推理不要亏得太难看。
所以未来的AI价格,大概率不会只是“越来越便宜”或者“越来越贵”这么简单。
更可能发生的是分化。
普通任务会越来越便宜,甚至便宜到你感觉不到它的存在。 复杂任务会越来越贵,贵到你必须认真判断值不值得。 本地模型会吃掉一部分日常需求。 前沿模型会变成关键时刻才请出的专家。
对普通人来说,这其实不完全是坏事。
它会逼我们从“把AI当许愿池”,变成“把AI当资源来调度”。
你会开始问:这个任务真的需要最强模型吗?我给它的上下文是不是太脏了?它的回答能不能被验证?我花出去的这部分成本,换回来的到底是省时间,还是省心,还是只是图个新鲜?
AI最便宜的时候,大家容易把它当魔法。
等价格和限制慢慢浮出水面,我们反而会更接近它真实的样子:
它不是免费劳动力。
它是一种很强、很贵、正在被重新定价的生产资料。
眼下的便宜,可能只是窗口期。
而窗口期最适合做的事,不是无脑多用,而是尽快学会:哪些地方值得用,哪些地方不值得用,哪些地方应该让AI停下来,把判断权还给自己。