大模型竞争新阶段：Token利润趋零，行业出路何在

发布时间：2026-06-19 11:10阅读：15

5月22日晚，DeepSeek未举办发布会，未公布新闻稿，仅在官方平台悄然发出一则通知。

通知内容十分简练，重点仅一句话：全线API（应用程序编程接口）输入成本下调。尤其是高端模型DeepSeek-V4系列，限时叠加四分之一优惠，实质上永久降价75%。

若将DeepSeek-V4 Pro的新价格与OpenAI和Claude同级模型相比较，其间产生的Token（词元）输出费用差距超过100倍。可以说，DeepSeek这一举措，创下全球顶级大模型报价的历史新低。

“如果你的模型性价比无法超越DeepSeek，你的市场角色是什么？”一位国内领先云厂商AI产品负责人深夜在社交平台发出深刻提问。

而这股冲击波引发的连锁反应中，最值得分析的案例之一，是智谱——一家在Token迈向零利润时代的潮流中，选择逆势前行的企业。

踏入6月，全球多家大模型厂商紧随DeepSeek的脚步，掀起降价浪潮。据公开资料，国内的小米MiMo-V2.5系列、字节跳动Seedance 2.0系列、腾讯云接入的MiniMax-M3均宣告降价；国外的OpenAI也于6月11日启动首轮大规模API价格下调。

对DeepSeek而言，低价是竞争利器。但对绝大多数中国大模型初创公司来说，同样的低价，究竟是“破晓前的沉寂”，还是“永远填不满的深渊”？

以已上市的智谱（2513.HK）为研究案例，“Token步入零利润时代”这句话正从预测变成实况。

2025年，智谱全年收入达7.24亿元，同比增长131.9%；年度净亏损47.18亿元，同比扩大59.5%。据此计算，智谱2025年每获得1元营收，就要亏损6.5元。

其中，智谱2025年研发支出高达31.8亿元，约是其当年收入的4.4倍。这意味着智谱每赚1元，需在研发上投入4.4元。

而这仅是智谱“消耗资金”的一部分。据智谱2025年报，智谱仅经营活动就“吞噬”约22.46亿元现金，加上投资用去的现金3.76亿元，全年现金流出共计26.22亿元。

2026年1月，智谱顺利在港股上市，募资45.16亿元，其中26.14亿元作为融资净流入计入账目。

将流入与流出对比可见，智谱2025年经营活动本身未产生现金盈余。

这亦是智谱在2026年6月公告，计划冲刺科创板A股上市，拟募资150亿元的原因。

近两年，智谱执行了两项看似冲突的举措——先降价，后涨价。

2025年4月，智谱BigModel开放平台进行了一次大幅价格调整：GLM-4-Plus降价90%，从50元/百万Tokens降至5元/百万Tokens；GLM-4-FlashX定价10元/亿Tokens；GLM-Z1-Air定价50元/亿Tokens。

彼时，字节豆包报价压至0.0008元/千Tokens，各方均比拼低价，智谱亦不例外。

2026年成为转折点。智谱在国产头部厂商中率先实质涨价，且进行了多轮上调。

2026年2月，伴随GLM-5发布，智谱对GLM Coding Plan实施结构性调价，涨幅30%起，并取消首购优惠。

2026年3月，智谱推出GLM-5-Turbo，API价格再涨20%，相较上代GLM-4.7累计涨幅约83%。

2026年4月，智谱发布GLM-5.1，API价格再提10%；4月中旬，智谱GLM Coding Plan海外版全线涨价80%至150%，Lite、Pro、Max版本的套餐价格从原先的每月10美元、30美元、80美元，分别上调至18美元、72美元、160美元，此价位几乎与ChatGPT、Gemini、Claude等国外模型的订阅费用持平。

针对涨价策略，智谱CEO张鹏在业绩会上以一组数据消除市场疑虑：2026年一季度智谱API涨价83%后，调用量不减反增，市场依旧供不应求，调用量增长400%。

张鹏指出，这印证了高品质Token是当前的稀缺资产。他还称，当模型能力足够强大，API即是最佳商业模式，定价权由技术实力及长期趋势带来的领先地位所决定。

与智谱涨价不同，同样港股上市的MiniMax（0100.HK）选择了降价，在旗舰模型MiniMax-M3上线一周后，宣布永久降价50%。

针对两家的不同策略，摩根大通6月12日发布研报，并对中国两家上市AI模型公司给出截然相反的评级判断——维持智谱“增持”，将MiniMax下调至“中性”。

摩根大通在报告中强调，在AI使用需求仍超越推理供给的阶段，没有开发者会在需求过剩时主动降价。若一家模型公司在新模型上线后迅速从溢价回调，实际上是以定价行为承认——市场不认可此溢价。

值得注意的是，MiniMax降价后已与DeepSeek系列处于同一价格带，表明其在定价上选择与“由DeepSeek设定价格的那一层”竞争。

智谱通过GLM-5和5.1持续刷新国内SOTA（最优模型），并在涨价后使用量继续攀升。摩根大通认为，这表示下游工作流对GLM系列的依赖度足以支撑涨价。

参照云厂商的发展路径，通用推理Token正重蹈IaaS化覆辙：可标准化的部分必然商品化，利润率趋向零，而真正的价值在上层的PaaS和SaaS层。这便是所谓的“K型分化”。

在大模型行业中，通用推理Token加速商品化，沿IaaS的老路滑向零利润；生路只能向上走，要么做垂直场景Agent获取中等利润，要么攻克企业私有化部署的合规与替换成本，以壁垒支撑溢价。

而DeepSeek此次行动，正是这条K型曲线上的分界点。它用极致低价将所有试图停留在“通用Token批发商”角色的玩家，一举推入零利润。

回到DeepSeek那一击的夜晚。它不仅斩出历史最低价，更将整个行业劈成清晰分明的两条路径：一条是“Token批发商”的宽广大道，规模越大，越靠近零利润；另一条是企业级AI服务商的窄门，门槛越高，存活越久。

智谱选择了后者。它以2025年全年7.24亿元营收、47.18亿元亏损、22.46亿元经营现金流净流出的代价，换得一组比财务报表更关键的数字：API涨价83%后调用量反增400%，GLM-5系列在多项基准上刷新中国SOTA，摩根大通给予“增持”评级。

这些数字向市场传递一个信息：当你的模型足够强大，客户愿为你支付溢价，即便外界遍地是“地板价”。

但这条路径并不平坦。智谱2025年每赚1元即亏损6.5元的结构性缺口，不会因几轮涨价就自动填补。它需完成三重跨越：收入从7亿级迈向数十亿级，使固定成本被大幅分摊；自研推理效率逼近DeepSeek水平，降低第三方算力依赖；本地化部署从项目制转向订阅制，让现金流从脉冲式变为持续式。

这三项任务，任何一项均非易事。但相较在零利润的Token红海中厮杀，这至少是一条有出路的途径。

Token步入零利润时代，智谱出路在何方？

答案或许就在张鹏那句表态里：“当模型足够强大，API即是最佳商业模式。”但这句话有一前提，即不仅要真的足够强大，还需市场也如此认同。

← 上一篇：云南写作学会AI写作研讨会暨2026学术年会成功举办下一篇：端午安康|澎湃算力护航 AI 新征途 →