廉价AI时代或将终结

发布时间：2026-06-28 14:09阅读：3

眼下每月几十到几百元，就能让全球顶尖的AI帮你写策划、改代码、整理数据、翻译文献。听起来像是赶上了好时候。但细想之下：这份低廉的代价，背后是谁在买单？

有些账单，起初并不像账单。

比如你第一次订阅AI会员，可能只是觉得：花一杯咖啡的钱，换一个随时待命的写作助手、编程帮手、语言老师，似乎挺划算。

随后它开始渗透进日常工作。

用它写工作日志。用它做演示文稿。用它查资料。用它改简历。甚至遇到复杂的邮件、合同、方案，也会习惯性丢给它先过一遍。

再后来，最尴尬的情况出现了：

不是你离不开AI。

而是发现，周围所有人都默认你应该用AI。

老板问：“这个为什么不让AI先出一版？” 同事说：“你让模型跑一下不就行了？” 工具栏里也悄悄多了几个按钮：AI摘要、AI润色、AI生成、AI分析。

它从新奇玩具，变成了办公必需品。

可必需品有个特点：便宜的时候，你不会天天惦记；一旦涨价，所有人都会抬头看价签。

最近Hacker News上有一条讨论，标题很直白：Why current LLM costs are not sustainable。原文作者Aditya Patadia的观点是，当前大模型的成本结构并不稳固，不少企业正被AI账单困扰。

他在文中举了几个案例：Uber据传4个月就烧光了全年的AI预算；Microsoft、Salesforce和GitHub也在采取措施控制员工的AI使用支出。作者还提到，GPT-5.5这类前沿模型的价格可以达到每百万输入token 5美元、每百万输出token 30美元；他本人只是用模型修复50个文件里的TypeScript类型问题，一个下午就花了54美元。

这不是“AI没用”的故事。

恰恰相反，正因为它太有用了，账单才开始变得刺眼。

很多人对AI价格的感受，其实被订阅制掩盖了。

你每月付一笔固定会员费，似乎就能无限制使用一个强大的模型。它像视频会员、网盘会员、音乐会员一样，被包装成一个轻便的小订阅。

但大模型不是普通应用。

你每问一次，它背后都要消耗算力。模型越强，回答越长，推理越复杂，费用就越高。

HN评论区里有位开发者的说法很有代表性：如果直接按token付费，某些高强度使用可能会非常昂贵；但如果用官方订阅套餐，同样的重度使用可能被压到每月一百多欧元。换句话说，我们看到的订阅价，未必是真实成本的完整面貌。

这有点像早期的网约车和外卖。

刚开始，补贴满天飞，打车比公交还便宜，外卖比自己做饭还划算。那时候你会觉得，这就是新生活。

后来补贴少了，配送费涨了，会员规则复杂了，平台开始精打细算。

用户才意识到：原来那些“便宜”，不是因为服务本来就这么便宜，而是因为平台、投资人、商家和骑手一起分担了成本。

AI也可能经历类似的阶段。

现在很多人习惯了“低价用最强模型”。但前沿模型背后有训练成本、推理成本、数据中心、芯片、电力、工程团队、合规和安全投入。企业可以短期补贴用户，也可以把价格藏在订阅、限额、降速和分层套餐里。

但账不会消失。

它只是在等一个合适的时机，重新浮现。

AI产品接下来很可能会分成几层。

第一层，是便宜、够用、限制比较多的日常模型。

它可以写邮件、总结文档、调整语气、做轻量搜索。普通用户会觉得还不错，企业也愿意大规模铺开，因为成本可控。

第二层，是更贵、更强、但不会轻易放开的前沿模型。

它能处理复杂推理、长代码库、科学问题、多步骤Agent任务，也能在关键场景里减少一些低级错误。问题是，这类能力不可能永远按“白菜价”卖。

第三层，则是本地模型和开源模型。

它们不一定总是最强，但胜在便宜、可控、隐私感更强。HN评论区里就有人提到，未来企业和个人可能会把一部分任务迁回本地，尤其是那些不需要最强模型、但每天都要跑很多次的小任务。

这意味着一个很现实的变化：

以后我们不会再简单地问，“你有没有AI？”

而是会问：

你用的是哪一层AI？你把最贵的模型用在什么地方？哪些任务可以交给小模型？哪些任务必须请“最强大脑”出场？

这就像企业用人。

不是所有事都要老板亲自做。打印文件、整理资料、初筛表格，交给实习生就够了。真正复杂的判断、谈判、关键决策，才需要高级专家。

AI时代也一样。

如果你让最贵的模型去做所有琐事，就像请一个年薪百万的顾问天天帮你贴发票。不是不能做，是账很难看。

个人用户对AI成本的感知，往往是“这个会员贵不贵”。

企业不是。

企业看到的是一张更复杂的表：多少员工在用，调用了多少次，输出了多少token，有多少任务是重复的，有多少回答需要重试，有多少代码还要返工，有多少数据不能上云。

于是一个微妙的变化会发生。

刚开始，企业鼓励大家多用AI，因为这代表“拥抱新技术”。

再往后，财务和IT部门会开始问：

谁在用？用在哪？为什么这个团队的调用量这么高？这些使用到底带来了交付，还是只是让大家生成了更多需要审核的东西？

这时AI的问题就不再是“会不会提示词”。

它变成了管理问题。

一个团队如果没有清楚的工作流，没有评价标准，没有复盘机制，就很容易把AI用成新的浪费：生成更多文档，制造更多版本，产出更多看起来很完整、但没人真正负责的内容。

老板以为买的是效率。

最后买到的可能是一堆token烟花。

HN那条成本讨论里，有人提到自己用免费的DeepSeek Flash加上不错的工具壳，已经能处理很多简单任务。这个评论很有意思，因为它指向了一个被忽略的事实：

很多时候，真正值钱的不只是模型本身，而是模型外面的工作流。

任务怎么拆？上下文怎么给？什么时候让模型停下来？输出怎么验？错了怎么回滚？

这些东西做好了，便宜模型也能办不少事。做不好，最强模型也可能只是更贵地犯错。

这篇不是要劝你少用AI。

相反，现在正是普通人最应该练AI工作流的时候。因为补贴期也好，竞争期也好，总之我们确实能用相对低的价格，接触到过去难以想象的能力。

但用法要变聪明一点。

第一，不要把所有任务都交给最强模型。

写一封普通邮件、改一个标题、整理会议纪要，不一定非要上最贵的模型。把任务按难度分层，简单任务用便宜模型，关键任务再用强模型，这是未来很重要的基本功。

第二，别只看“模型聪不聪明”，也要看“流程省不省钱”。

同样一个任务，你直接把一堆资料全塞进去，可能又贵又乱。先整理材料、删掉无关内容、明确输出格式，再让模型处理，成本会低很多，结果也更稳。

第三，给高频任务做模板。

如果你每天都让AI帮你写小红书标题、整理读书笔记、改公众号段落，那就不要每天重新解释一遍需求。把固定要求写成模板，减少来回试错。省下来的不是几句话，是长期的token和注意力。

第四，关注本地模型和开源模型。

它们现在不一定能替代最强云端模型，但会越来越适合处理私人、重复、轻量的任务。尤其是涉及隐私、企业资料、长期知识库的场景，本地化不只是省钱，也是一种边界感。

第五，也是最重要的一点：别让AI替你制造更多工作。

很多人用了AI以后，表面上效率提高了，实际上只是生成了更多需要自己确认、修改、背锅的东西。真正好的AI使用，应该减少返工，而不是把返工包装得更高级。

大模型企业现在面对的是一场艰难的平衡。

它们要继续证明模型越来越强，也要让用户觉得价格可以接受；要吸引个人用户，也要说服企业买单；要投入天价算力训练下一代模型，又要想办法让每一次推理不要亏得太难看。

所以未来的AI价格，大概率不会只是“越来越便宜”或者“越来越贵”这么简单。

更可能发生的是分化。

普通任务会越来越便宜，甚至便宜到你感觉不到它的存在。复杂任务会越来越贵，贵到你必须认真判断值不值得。本地模型会吃掉一部分日常需求。前沿模型会变成关键时刻才请出的专家。

对普通人来说，这其实不完全是坏事。

它会逼我们从“把AI当许愿池”，变成“把AI当资源来调度”。

你会开始问：这个任务真的需要最强模型吗？我给它的上下文是不是太脏了？它的回答能不能被验证？我花出去的这部分成本，换回来的到底是省时间，还是省心，还是只是图个新鲜？

AI最便宜的时候，大家容易把它当魔法。

等价格和限制慢慢浮出水面，我们反而会更接近它真实的样子：

它不是免费劳动力。

它是一种很强、很贵、正在被重新定价的生产资料。

眼下的便宜，可能只是窗口期。

而窗口期最适合做的事，不是无脑多用，而是尽快学会：哪些地方值得用，哪些地方不值得用，哪些地方应该让AI停下来，把判断权还给自己。

← 上一篇：AI集群算力版图重构：CPU告别边缘化，重返舞台中央下一篇：2026 年 6 月 AI 动态速递：上市、管制与超级入口 →