大模型竞争新阶段:Token利润趋零,行业出路何在
人民锐评:新能源车过度堆砌、Token消耗惊人?盲目叠加不如智慧创新
5月22日晚,DeepSeek未举办发布会,未公布新闻稿,仅在官方平台悄然发出一则通知。
通知内容十分简练,重点仅一句话:全线API(应用程序编程接口)输入成本下调。尤其是高端模型DeepSeek-V4系列,限时叠加四分之一优惠,实质上永久降价75%。
若将DeepSeek-V4 Pro的新价格与OpenAI和Claude同级模型相比较,其间产生的Token(词元)输出费用差距超过100倍。可以说,DeepSeek这一举措,创下全球顶级大模型报价的历史新低。
“如果你的模型性价比无法超越DeepSeek,你的市场角色是什么?”一位国内领先云厂商AI产品负责人深夜在社交平台发出深刻提问。
而这股冲击波引发的连锁反应中,最值得分析的案例之一,是智谱——一家在Token迈向零利润时代的潮流中,选择逆势前行的企业。
踏入6月,全球多家大模型厂商紧随DeepSeek的脚步,掀起降价浪潮。据公开资料,国内的小米MiMo-V2.5系列、字节跳动Seedance 2.0系列、腾讯云接入的MiniMax-M3均宣告降价;国外的OpenAI也于6月11日启动首轮大规模API价格下调。
对DeepSeek而言,低价是竞争利器。但对绝大多数中国大模型初创公司来说,同样的低价,究竟是“破晓前的沉寂”,还是“永远填不满的深渊”?
以已上市的智谱(2513.HK)为研究案例,“Token步入零利润时代”这句话正从预测变成实况。
2025年,智谱全年收入达7.24亿元,同比增长131.9%;年度净亏损47.18亿元,同比扩大59.5%。据此计算,智谱2025年每获得1元营收,就要亏损6.5元。
其中,智谱2025年研发支出高达31.8亿元,约是其当年收入的4.4倍。这意味着智谱每赚1元,需在研发上投入4.4元。
而这仅是智谱“消耗资金”的一部分。据智谱2025年报,智谱仅经营活动就“吞噬”约22.46亿元现金,加上投资用去的现金3.76亿元,全年现金流出共计26.22亿元。
2026年1月,智谱顺利在港股上市,募资45.16亿元,其中26.14亿元作为融资净流入计入账目。
将流入与流出对比可见,智谱2025年经营活动本身未产生现金盈余。
这亦是智谱在2026年6月公告,计划冲刺科创板A股上市,拟募资150亿元的原因。
近两年,智谱执行了两项看似冲突的举措——先降价,后涨价。
2025年4月,智谱BigModel开放平台进行了一次大幅价格调整:GLM-4-Plus降价90%,从50元/百万Tokens降至5元/百万Tokens;GLM-4-FlashX定价10元/亿Tokens;GLM-Z1-Air定价50元/亿Tokens。
彼时,字节豆包报价压至0.0008元/千Tokens,各方均比拼低价,智谱亦不例外。
2026年成为转折点。智谱在国产头部厂商中率先实质涨价,且进行了多轮上调。
2026年2月,伴随GLM-5发布,智谱对GLM Coding Plan实施结构性调价,涨幅30%起,并取消首购优惠。
2026年3月,智谱推出GLM-5-Turbo,API价格再涨20%,相较上代GLM-4.7累计涨幅约83%。
2026年4月,智谱发布GLM-5.1,API价格再提10%;4月中旬,智谱GLM Coding Plan海外版全线涨价80%至150%,Lite、Pro、Max版本的套餐价格从原先的每月10美元、30美元、80美元,分别上调至18美元、72美元、160美元,此价位几乎与ChatGPT、Gemini、Claude等国外模型的订阅费用持平。
针对涨价策略,智谱CEO张鹏在业绩会上以一组数据消除市场疑虑:2026年一季度智谱API涨价83%后,调用量不减反增,市场依旧供不应求,调用量增长400%。
张鹏指出,这印证了高品质Token是当前的稀缺资产。他还称,当模型能力足够强大,API即是最佳商业模式,定价权由技术实力及长期趋势带来的领先地位所决定。
与智谱涨价不同,同样港股上市的MiniMax(0100.HK)选择了降价,在旗舰模型MiniMax-M3上线一周后,宣布永久降价50%。
针对两家的不同策略,摩根大通6月12日发布研报,并对中国两家上市AI模型公司给出截然相反的评级判断——维持智谱“增持”,将MiniMax下调至“中性”。
摩根大通在报告中强调,在AI使用需求仍超越推理供给的阶段,没有开发者会在需求过剩时主动降价。若一家模型公司在新模型上线后迅速从溢价回调,实际上是以定价行为承认——市场不认可此溢价。
值得注意的是,MiniMax降价后已与DeepSeek系列处于同一价格带,表明其在定价上选择与“由DeepSeek设定价格的那一层”竞争。
智谱通过GLM-5和5.1持续刷新国内SOTA(最优模型),并在涨价后使用量继续攀升。摩根大通认为,这表示下游工作流对GLM系列的依赖度足以支撑涨价。
参照云厂商的发展路径,通用推理Token正重蹈IaaS化覆辙:可标准化的部分必然商品化,利润率趋向零,而真正的价值在上层的PaaS和SaaS层。这便是所谓的“K型分化”。
在大模型行业中,通用推理Token加速商品化,沿IaaS的老路滑向零利润;生路只能向上走,要么做垂直场景Agent获取中等利润,要么攻克企业私有化部署的合规与替换成本,以壁垒支撑溢价。
而DeepSeek此次行动,正是这条K型曲线上的分界点。它用极致低价将所有试图停留在“通用Token批发商”角色的玩家,一举推入零利润。
回到DeepSeek那一击的夜晚。它不仅斩出历史最低价,更将整个行业劈成清晰分明的两条路径:一条是“Token批发商”的宽广大道,规模越大,越靠近零利润;另一条是企业级AI服务商的窄门,门槛越高,存活越久。
智谱选择了后者。它以2025年全年7.24亿元营收、47.18亿元亏损、22.46亿元经营现金流净流出的代价,换得一组比财务报表更关键的数字:API涨价83%后调用量反增400%,GLM-5系列在多项基准上刷新中国SOTA,摩根大通给予“增持”评级。
这些数字向市场传递一个信息:当你的模型足够强大,客户愿为你支付溢价,即便外界遍地是“地板价”。
但这条路径并不平坦。智谱2025年每赚1元即亏损6.5元的结构性缺口,不会因几轮涨价就自动填补。它需完成三重跨越:收入从7亿级迈向数十亿级,使固定成本被大幅分摊;自研推理效率逼近DeepSeek水平,降低第三方算力依赖;本地化部署从项目制转向订阅制,让现金流从脉冲式变为持续式。
这三项任务,任何一项均非易事。但相较在零利润的Token红海中厮杀,这至少是一条有出路的途径。
Token步入零利润时代,智谱出路在何方?
答案或许就在张鹏那句表态里:“当模型足够强大,API即是最佳商业模式。”但这句话有一前提,即不仅要真的足够强大,还需市场也如此认同。
