标签

廉价AI时代或将终结

发布时间:2026-06-28 14:09阅读:3

眼下每月几十到几百元,就能让全球顶尖的AI帮你写策划、改代码、整理数据、翻译文献。 听起来像是赶上了好时候。 但细想之下:这份低廉的代价,背后是谁在买单?

有些账单,起初并不像账单。

比如你第一次订阅AI会员,可能只是觉得:花一杯咖啡的钱,换一个随时待命的写作助手、编程帮手、语言老师,似乎挺划算。

随后它开始渗透进日常工作。

用它写工作日志。用它做演示文稿。用它查资料。用它改简历。甚至遇到复杂的邮件、合同、方案,也会习惯性丢给它先过一遍。

再后来,最尴尬的情况出现了:

不是你离不开AI。

而是发现,周围所有人都默认你应该用AI。

老板问:“这个为什么不让AI先出一版?” 同事说:“你让模型跑一下不就行了?” 工具栏里也悄悄多了几个按钮:AI摘要、AI润色、AI生成、AI分析。

它从新奇玩具,变成了办公必需品。

可必需品有个特点:便宜的时候,你不会天天惦记;一旦涨价,所有人都会抬头看价签。

最近Hacker News上有一条讨论,标题很直白:Why current LLM costs are not sustainable。原文作者Aditya Patadia的观点是,当前大模型的成本结构并不稳固,不少企业正被AI账单困扰。

他在文中举了几个案例:Uber据传4个月就烧光了全年的AI预算;Microsoft、Salesforce和GitHub也在采取措施控制员工的AI使用支出。作者还提到,GPT-5.5这类前沿模型的价格可以达到每百万输入token 5美元、每百万输出token 30美元;他本人只是用模型修复50个文件里的TypeScript类型问题,一个下午就花了54美元。

这不是“AI没用”的故事。

恰恰相反,正因为它太有用了,账单才开始变得刺眼。

很多人对AI价格的感受,其实被订阅制掩盖了。

你每月付一笔固定会员费,似乎就能无限制使用一个强大的模型。它像视频会员、网盘会员、音乐会员一样,被包装成一个轻便的小订阅。

但大模型不是普通应用。

你每问一次,它背后都要消耗算力。模型越强,回答越长,推理越复杂,费用就越高。

HN评论区里有位开发者的说法很有代表性:如果直接按token付费,某些高强度使用可能会非常昂贵;但如果用官方订阅套餐,同样的重度使用可能被压到每月一百多欧元。换句话说,我们看到的订阅价,未必是真实成本的完整面貌。

这有点像早期的网约车和外卖。

刚开始,补贴满天飞,打车比公交还便宜,外卖比自己做饭还划算。那时候你会觉得,这就是新生活。

后来补贴少了,配送费涨了,会员规则复杂了,平台开始精打细算。

用户才意识到:原来那些“便宜”,不是因为服务本来就这么便宜,而是因为平台、投资人、商家和骑手一起分担了成本。

AI也可能经历类似的阶段。

现在很多人习惯了“低价用最强模型”。但前沿模型背后有训练成本、推理成本、数据中心、芯片、电力、工程团队、合规和安全投入。企业可以短期补贴用户,也可以把价格藏在订阅、限额、降速和分层套餐里。

但账不会消失。

它只是在等一个合适的时机,重新浮现。

AI产品接下来很可能会分成几层。

第一层,是便宜、够用、限制比较多的日常模型。

它可以写邮件、总结文档、调整语气、做轻量搜索。普通用户会觉得还不错,企业也愿意大规模铺开,因为成本可控。

第二层,是更贵、更强、但不会轻易放开的前沿模型。

它能处理复杂推理、长代码库、科学问题、多步骤Agent任务,也能在关键场景里减少一些低级错误。问题是,这类能力不可能永远按“白菜价”卖。

第三层,则是本地模型和开源模型。

它们不一定总是最强,但胜在便宜、可控、隐私感更强。HN评论区里就有人提到,未来企业和个人可能会把一部分任务迁回本地,尤其是那些不需要最强模型、但每天都要跑很多次的小任务。

这意味着一个很现实的变化:

以后我们不会再简单地问,“你有没有AI?”

而是会问:

你用的是哪一层AI? 你把最贵的模型用在什么地方? 哪些任务可以交给小模型? 哪些任务必须请“最强大脑”出场?

这就像企业用人。

不是所有事都要老板亲自做。打印文件、整理资料、初筛表格,交给实习生就够了。真正复杂的判断、谈判、关键决策,才需要高级专家。

AI时代也一样。

如果你让最贵的模型去做所有琐事,就像请一个年薪百万的顾问天天帮你贴发票。不是不能做,是账很难看。

个人用户对AI成本的感知,往往是“这个会员贵不贵”。

企业不是。

企业看到的是一张更复杂的表:多少员工在用,调用了多少次,输出了多少token,有多少任务是重复的,有多少回答需要重试,有多少代码还要返工,有多少数据不能上云。

于是一个微妙的变化会发生。

刚开始,企业鼓励大家多用AI,因为这代表“拥抱新技术”。

再往后,财务和IT部门会开始问:

谁在用? 用在哪? 为什么这个团队的调用量这么高? 这些使用到底带来了交付,还是只是让大家生成了更多需要审核的东西?

这时AI的问题就不再是“会不会提示词”。

它变成了管理问题。

一个团队如果没有清楚的工作流,没有评价标准,没有复盘机制,就很容易把AI用成新的浪费:生成更多文档,制造更多版本,产出更多看起来很完整、但没人真正负责的内容。

老板以为买的是效率。

最后买到的可能是一堆token烟花。

HN那条成本讨论里,有人提到自己用免费的DeepSeek Flash加上不错的工具壳,已经能处理很多简单任务。这个评论很有意思,因为它指向了一个被忽略的事实:

很多时候,真正值钱的不只是模型本身,而是模型外面的工作流。

任务怎么拆?上下文怎么给?什么时候让模型停下来?输出怎么验?错了怎么回滚?

这些东西做好了,便宜模型也能办不少事。做不好,最强模型也可能只是更贵地犯错。

这篇不是要劝你少用AI。

相反,现在正是普通人最应该练AI工作流的时候。因为补贴期也好,竞争期也好,总之我们确实能用相对低的价格,接触到过去难以想象的能力。

但用法要变聪明一点。

第一,不要把所有任务都交给最强模型。

写一封普通邮件、改一个标题、整理会议纪要,不一定非要上最贵的模型。把任务按难度分层,简单任务用便宜模型,关键任务再用强模型,这是未来很重要的基本功。

第二,别只看“模型聪不聪明”,也要看“流程省不省钱”。

同样一个任务,你直接把一堆资料全塞进去,可能又贵又乱。先整理材料、删掉无关内容、明确输出格式,再让模型处理,成本会低很多,结果也更稳。

第三,给高频任务做模板。

如果你每天都让AI帮你写小红书标题、整理读书笔记、改公众号段落,那就不要每天重新解释一遍需求。把固定要求写成模板,减少来回试错。省下来的不是几句话,是长期的token和注意力。

第四,关注本地模型和开源模型。

它们现在不一定能替代最强云端模型,但会越来越适合处理私人、重复、轻量的任务。尤其是涉及隐私、企业资料、长期知识库的场景,本地化不只是省钱,也是一种边界感。

第五,也是最重要的一点:别让AI替你制造更多工作。

很多人用了AI以后,表面上效率提高了,实际上只是生成了更多需要自己确认、修改、背锅的东西。真正好的AI使用,应该减少返工,而不是把返工包装得更高级。

大模型企业现在面对的是一场艰难的平衡。

它们要继续证明模型越来越强,也要让用户觉得价格可以接受;要吸引个人用户,也要说服企业买单;要投入天价算力训练下一代模型,又要想办法让每一次推理不要亏得太难看。

所以未来的AI价格,大概率不会只是“越来越便宜”或者“越来越贵”这么简单。

更可能发生的是分化。

普通任务会越来越便宜,甚至便宜到你感觉不到它的存在。 复杂任务会越来越贵,贵到你必须认真判断值不值得。 本地模型会吃掉一部分日常需求。 前沿模型会变成关键时刻才请出的专家。

对普通人来说,这其实不完全是坏事。

它会逼我们从“把AI当许愿池”,变成“把AI当资源来调度”。

你会开始问:这个任务真的需要最强模型吗?我给它的上下文是不是太脏了?它的回答能不能被验证?我花出去的这部分成本,换回来的到底是省时间,还是省心,还是只是图个新鲜?

AI最便宜的时候,大家容易把它当魔法。

等价格和限制慢慢浮出水面,我们反而会更接近它真实的样子:

它不是免费劳动力。

它是一种很强、很贵、正在被重新定价的生产资料。

眼下的便宜,可能只是窗口期。

而窗口期最适合做的事,不是无脑多用,而是尽快学会:哪些地方值得用,哪些地方不值得用,哪些地方应该让AI停下来,把判断权还给自己。