豆包付费背后的AI算力生意
豆包这类产品最棘手的点在于:越多人离不开它,平台就越容易被成本“反噬”。
普通用户偶尔聊几句,消耗通常还在可控区间。
可一旦用户开始高频干这些事情:
写长文、做PPT、进行数据分析、开展深度研究、图片生成、视频生成、语音实时对话、以及让Agent多步完成任务。
那成本就不是同一量级了。
豆包Mac版除了聊天,还主打“搜索、P图、写作、翻译、PPT、数据分析”,并把图片与视频生成、深度研究、会议纪要、文档表格处理等做成一站式工作流。
这些能力在本质上比纯聊天更“吃资源”:更依赖token、更依赖推理能力,也更依赖多模态算力。
因此豆包收费,通常就不是因为“普通聊天已经亏到撑不下去”,而是因为:
高价值能力的使用者与重度用户,不能再被无限量地免费供给。
免费版当然还能存在:它用来做入口、带来日活、建立品牌心智;但真正消耗巨大的能力,需要用会员、额度、优先级、专业版等方式分层。
订阅制里有个天然矛盾:
用户每个月交的钱是固定的,但他消耗的token却不固定。
这和奈飞、腾讯视频、爱奇艺并不完全一样。视频平台一部剧拍完之后,用户多看几次的边际成本相对有限;而AI不同——用户每一次深度对话、每一次生成视频、每一次做长上下文分析,都需要重新占用推理资源。
传统软件模式以及奈飞模式,更像是:
研发一次→复制无穷次→卖出多份,边际成本接近于0
但大模型服务更接近:
模型研发一次→每次调用都要算力→用户越多、用得越深,推理成本就越高。
OpenAI、Azure OpenAI等API按token收费,也从侧面说明了这一点:输入token、输出token、长上下文、缓存输入都会有不同的计价方式;一般来说,输出token往往更贵。
在OpenAI的官方定价页里,GPT-5.5短上下文的输入是每百万token 2.5美元、输出是每百万token 15美元,而缓存输入的价格则低得多。
这和卖Office、卖Photoshop、卖操作系统并不是同一经济模型。
字节自家的火山引擎同样能看到类似逻辑:豆包面向开发者的定价也按百万tokens来算,比如Doubao-Seed-2.0-pro显示为3.2元起/百万输入tokens、16元起/百万输出tokens。
这指向一个更本质的问题:
AI产品看起来像会员订阅,但后台结算更像按量消耗。
不过它也并不完全等同于餐厅。
更贴近的说法应该是:
AI其实是“软件公司 + 云计算公司 + 电力密集型实业公司”的混合体。
如果某个用户每月付68元,但疯狂生成PPT、视频和长报告,成本很可能吞掉大部分收入。
反过来,如果有人每月付500元,主要做高价值工作且消耗可控,那就可能是不错的生意。
所以AI订阅本质上是在做一件事:
把不可预测的算力成本,尽量转化成可预期的收入结构。
此前国内AI应用的竞争,很大程度上是“免费抢用户”。
豆包之所以能做得更大,除了产品能力确实有优势之外,也离不开字节的流量池、较强的产品技术实力,以及相对很低的免费门槛。
据QuestMobile数据显示,豆包是中国使用量最大的AI聊天应用,其周活跃用户约1.55亿;同时DeepSeek约8160万;此外阿里也通过大额补贴带动Qwen用户增长。
但免费模式也有明显短板:
用户越多,成本压力就越真实。
尤其在当前中国AI产品还存在价格战的背景下。DeepSeek把模型成本预期压得很低,阿里、字节、腾讯、百度又都不愿放掉入口。
于是消费端AI很容易陷入一种尴尬状态:
用户希望AI永远免费;平台也知道AI不可能无限免费;投资人想看增长;公司内部又要商业闭环。
当豆包推出付费版,它等于在验证一个问题:
中国用户到底愿不愿意为AI工作流付钱?
这笔钱并不是为了“聊天本身”,而是为了让系统帮用户省时间,比如做PPT、写报告、做研究、处理数据、生成视频。
这种差别非常关键。
用户很难为了“陪聊”每月掏500元。
但如果它真的能让内容从业者、销售、老师、学生、运营、咨询顾问每天省下1到2小时,那么68元、200元、500元的可接受区间就会完全不一样。
未来国内AI原生应用,收费方式大概率不会一刀切,而会逐渐形成四层结构:
第一层:免费版
用来获客、养成使用习惯、巩固市场份额。普通聊天、基础问答、轻量搜索仍会保持免费。
第二层:低价会员
面向普通高频用户,比如提供更高额度、更快速度、更少排队,以及更好的模型等权益。
第三层:专业版
面向内容创作者、职场人群、学生、程序员、研究人员,核心卖点是PPT、数据分析、深度研究、文档处理、代码以及长上下文能力。
第四层:企业/API/Agent服务
以按量计费为主,或者“套餐+超额计费”。这里往往才是真正跑得通商业模型的部分。
豆包目前流传的68、200、500三档,本质上就是在试探这种分层能否成立。
免费版解决的是“用户规模”;标准版对应“轻度付费”;加强版与专业版承担“重度用户成本回收”。
ChatGPT、Claude、Gemini、Kimi、通义、智谱、豆包等,要么已经在走类似结构,要么正在接近。差异主要集中在:谁的免费版最强、谁的付费权益最有感、谁的成本控制最好。
AI多一个用户、增加一次对话、进行一次长文总结、触发一次Agent执行任务,就意味着GPU推理、电力、显存、带宽、存储以及工程运维都会相应增加消耗。
所以AI应用公司的最关键问题并不是:
有没有用户?
而是:
用户越多,是越赚钱,还是越烧钱?
这一点和传统SaaS差别很大。传统SaaS一旦系统搭好,新增客户通常带来更高的毛利;但AI产品如果用户特别爱用,反而可能推高推理成本。
如今市场担心Big Tech的AI投入回报,本质也就是这个逻辑。Alphabet、Microsoft、Meta、Amazon等大厂今年都在加码AI相关投入,投资者也开始更关注这些支出何时能换来足够回报。
但需要强调的是:AI订阅不能简单拿“餐厅”去类比。餐厅很难做到让“一碗面”的成本每年下降80%。
而AI可以。
原因在于模型推理成本会被多种因素持续压下去:
第一,芯片性能更强。第二,模型变小、蒸馏、量化、MoE路由更精细。第三,缓存、批处理、上下文复用会减少重复计算。第四,不少任务并不需要最强模型,用小模型就能完成。第五,企业会从“盲目堆token”转向“以更少token达成业务结果”。
因此AI的边际成本不会永远是0,也不会像食材成本那样固定不变。
它更像早期云计算:一开始很贵,但随着规模、硬件与软件优化不断推进,成本会持续被压低。
这也解释了为什么OpenAI在定价里“缓存输入”会明显更便宜。因为缓存机制本身就意味着AI服务商在努力把重复计算变成更低成本、更接近软件化的环节。
所以AI公司需要同时回答三个问题:
第一,用户愿意付多少钱?这是收入端。
第二,用户每月会消耗多少token?这是成本端。
第三,模型成本下降的速度能不能快过使用量增长?这是利润率端。
如果答案是:
用户愿意付200元,但每月消耗150元的成本,那这个生意就很一般。
如果答案是:用户愿意付200元;而成本只有20元,并且随着模型优化还能继续降到10元。
那AI应用又会更接近一个好软件生意。
因此,AI商业模式真正的核心指标并不是DAU,也不是下载量,而是:
每个付费用户的收入/每个付费用户的推理成本。
也就是AI版的单位经济模型。
联系到股市,这件事其实很重要。
市场现在交易AI,大致分三个阶段看:
第一阶段先看的是:算力需求会不会爆发。
所以英伟达、台积电、博通、存储、电力设备、数据中心等都会受到关注并上涨。
第二阶段市场会问:AI应用有没有用户。
因此ChatGPT、豆包、Kimi、Qwen、Copilot、Gemini的用户规模会成为焦点。
第三阶段,也是接下来最关键的一步,市场会问:这些用户能不能付费?付完费以后能不能赚钱?
豆包传出收费信号,本质上就是第三阶段的开始。
如果未来看到这些积极信号,AI行情会更健康:
付费转化率不错;用户不会因收费而大规模流失;高价专业版有人愿意买;企业客户开始规模化采购;推理成本持续下降;AI功能还能带来真实提价能力。
但如果看到相反信号:
用户只愿意免费用;付费口碑不理想;平台频繁降价促销;高频用户把成本“打爆”;应用收入增长很快但毛利率不佳。
那么市场就会开始怀疑:AI应用层是不是一个好生意?
这种怀疑也会进一步向上游传导。因为如果应用层赚不到钱,云厂商和模型厂商就会被追问:你们为什么还要持续加大capex?
另外也要注意:不能把所有AI公司放在同一张牌里看。
有些公司是在“卖铲子”。用户用AI越多,它们越赚钱。
它们不需要直接承担终端用户token成本,反而主要吃到AI推理与训练扩张带来的资本开支红利。
还有一类企业处在中间地带。
一方面,AI带来云收入增长;另一方面,它们自己也要承担巨额capex、折旧、电力以及数据中心成本。
Reuters Breakingviews曾提到:大厂AI开支在显著扩张,但市场也越来越关心这些投入能否形成清晰回报。
所以云厂商要面对的核心问题是:
AI云收入增长,能不能覆盖数据中心、GPU、折旧和电力成本?
用户用得越多,成本自然越高。如果采取固定订阅制,比如每月收一个固定价格,但用户疯狂使用,那毛利率就容易被消耗掉。
因此AI应用理想的状态并不是“用户无限聊天”,而是:
用户愿意付更高价格,但实际token消耗始终可控。
比如企业愿意为AI销售助手、AI代码助手、AI法务助手每月付30、50、100美元,而其背后的推理成本只有几美元,那基本就是好生意。
再比如微软、Adobe、Salesforce这类公司,如果能把AI能力加进原有软件产品里,提高ARPU,同时又不让成本失控,它们就能把AI变成提价工具。
对它们来说,AI不是从零开始创业,而是基于原有软件分发渠道再叠加一个AI加价包。
完全不用纠结AI有没有用、有没有未来——AI当然是未来。
更深层的问题是:AI到底更像高毛利的软件生意,还是重资本的实业?
乐观派认为:
AI成本会快速下降,应用会迅速爆发,ARPU也会随之提升,最后依然会走向软件式的高毛利。
悲观派则认为:
AI会演变成军备竞赛,大家都要买GPU、建数据中心、付电费,但用户未必愿意为每个token支付足够高的价格,最终利润会被基础设施成本吞噬。
我认为结论大概率在中间:
基础模型和云基础设施会越来越像重资产行业;只有那些具备分发能力、明确场景和定价权的AI应用,才有机会重新变成软件生意。
文中观点仅为作者观点,不代表本平台立场