标签

Token经济下,AI企业如何构建反脆弱性?

发布时间:2026-05-23 17:30来源:微信阅读:10

3月中旬,在英伟达GTC 2026大会上,黄仁勋针对Token的爆发式增长发表了振奋人心的讲话:数据中心已不再是文件仓库,而是生产Token的工厂。

“在Token工厂中,你的吞吐量与生成速度,将直接转化为明年的确切收入。”他说道。

这番言论并非空想,而是对AI行业商业模式跃迁的精准概括——Token正成为新时代的电力与石油,具备极高的战略价值且需求刚性;AI企业卖API、卖会员或广告,远不如售卖Token前景广阔。

这一逻辑随后被贴上“Token经济”的标签,迅速风靡全球,并在AI领域引发深远反响。

Token经济最直接的效应之一,是赋予AI企业售卖Token的基础商业模式以丰富想象力,从而点燃全球资本的热情。

今年以来,众多国内外头部AI企业完成上市或获得空前规模的新融资,背后均有新概念加持的推手。

然而在企业与资本的狂欢背后,隐忧渐显:Token经济正被简单解读为“Token必须涨价”。

随着智能体取代Chatbot,AI服务的算力成本呈指数级攀升。绝大多数AI企业倾向于提高Token售价,以构建逻辑自洽、可持续的商业模式。

相应地,各路资本追捧AI企业,同样基于此类假设:Token经济时代,普通企业的Token消耗量将持续飙升,从而为AI企业带来源源不断的收入,稳步推升其长期价值。

Token涨价,似乎已成定局。

就在行业大规模融资之际,国内部分AI平台宣布涨价或取消低价基础套餐,涵盖字节、阿里、腾讯等老牌云厂商,以及智谱等新兴力量。国外OpenAI多次提价,Anthropic也变相大幅上调Claude Code收费标准,引发广泛吐槽。

然而在旺盛需求面前,AI企业通过涨价虽能获即时回报,却可能引发供需矛盾:AI企业与普通企业同为Token经济参与者,一方雄心勃勃欲涨价,另一方却日益不堪重负,期盼价格平稳甚至回落。

日益昂贵的Token,正成为不少企业无法弃用却难以负担的“AI重担”。AI企业凭借强势地位强行涨价、迫使客户多掏钱,显然是一种极其脆弱的商业模式。唯有在风平浪静的理想竞争环境中,此模式或许可持续。

但日新月异的变化,恰是AI这条时代大河的最大特征。管理学大师纳西姆·塔勒布在《反脆弱》一书中指出:世界充满不可预测的“黑天鹅”事件。ChatGPT问世三年多来,AI行业的“黑天鹅”屡屡振翅,每次都在全行业掀起变革浪潮。

AI企业不能寄望环境静止不变,依赖脆弱模式获利,而必须培育“反脆弱”能力,以适应变化、对冲波动,保持稳健增长。正如《反脆弱》所言,脆弱者在波动中毁灭,强韧者仅能复原,而反脆弱者能从混乱、压力与不确定性中获益、变得更强。

AI企业需解答一道难题:当Token经济时代全面来临,该如何“反脆弱”,建立更具韧性的商业模式?

现阶段,Token究竟是贵还是便宜?

部分AI企业的回答是“便宜”,且仍有上涨空间。

以智谱为例,今年2月其宣布GLM Coding Plan涨价30%,理由为用户规模与调用量快速提升,市场需求持续强劲增长。其他企业在调价时多采用类似说辞。

但对于任何行业而言,“因不愁销售而涨价”的商业逻辑,难以长久维系。

充分竞争的行业终将走向供需平衡,Token与AI亦不例外。跑得快的企业可吃尽先发红利,甚至暂时掌握“涨价权”;但当市场步入成熟期,AI企业涨价难度将越来越大,直至搁浅。

越卖越贵的Token,还掩盖了不少AI企业业务单一的短板。

这些企业将Token的产销视为唯一要务。企业除购买API和MaaS外,还需自建Agent矩阵、编排Skills,进行业务适配与流程嵌入。

仅知售卖Token的AI企业,难以培养客户忠诚度,也无法构建用户生态。一旦别家Token更便宜、模型性能更强,客户极易流失。

也有部分AI企业认为,Token依然太贵。

DeepSeek便持此观点。

其在4月底发布V4预览版,各项技术指标优异,尤其支持100万Token上下文,在长文本问答、减少幻觉等方面优势显著,完全有理由像同行一样涨价。

但出乎许多人意料,DeepSeek V4甚至比V3版本更便宜。发布48小时后,DeepSeek又将V4 Pro和Flash的输入价格(缓存命中)下调90%。

DeepSeek V4性价比惊人。根据OpenRouter数据,处理相同长度文本任务,DeepSeek V4输出价格比GPT、Claude、Gemini等便宜99%。

与此同时,DeepSeek引入新技术,如全新混合注意力架构等,大幅降低Token消耗量。据测算,在百万Token上下文设置下,V4-Pro每处理一个Token的算力消耗仅为V3.2的27%,KV缓存占用仅10%。

以原生多模态大模型技术见长的商汤科技,也采取类似策略。

不久前,商汤推出日日新SenseNova 6.7 Flash-Lite,一款全新轻量化多模态智能体模型。与DeepSeek V4类似,商汤新模型通过其多模态大模型技术实现Token消耗大幅降低;在信息搜索等场景中,降幅可达60%。

同时,商汤开启免费试用活动。开发者选用SenseNova Token Plan,首月可免费获取无门槛调用配额,每5小时享有1500次调用额度。

商汤意图明确:既要降低Token单价,让企业用得起;又要降低Token消耗,让企业不必担忧“超标”。这两家AI企业采取的是“技术降本”策略,即通过迭代AI技术,实现Token大幅消耗降低,进而压低企业使用成本,而非提价Token。

道理很简单:只有企业愿意用、用得起,AI企业才能玩转Token经济,才能“反脆弱”。仅靠卖得贵赚快钱,显然非长久之计。

将Token成本打下来,不仅是定价问题,更是技术问题。

部分企业选择追求SOTA,如OpenAI、Anthropic,不仅要做到地表最强,还要比拼谁能率先实现通用人工智能,站在全人类最前沿。

但也有许多企业策略不同。

对刷榜不感兴趣的DeepSeek,将更多精力聚焦于“AI+生产力”。

据DeepSeek称,V4在智能体任务、知识处理与推理能力方面表现突出,并针对Claude Code等主流AI编程工具进行专项优化。

优化效果如何?大模型评估平台Vals AI测评显示,在代码生成方面,V4大幅领先所有其他开源模型。

可以说,DeepSeek在生产力场景下做到了SOTA。

商汤也采取类似策略,选择办公技能集(Skills)作为突破口。

除不断迭代新模型外,商汤还配套开发全系列办公Skills,并原生支持主流智能体框架。此举好处在于,企业在应对不同场景与需求时,均可快速搭建专属Agent,组成适合自身的AI工具箱,实现低成本快速部署与使用。

以SenseNova 6.7 Flash-Lite为例,这款轻量化多模态智能体模型原生支持OpenClaw、Hermes Agent等智能体框架,配合SenseNova-Skills,可覆盖大多数办公场景,助力企业快速构建端到端复杂工作流,一键开启全自动办公。

例如,一家大型蔬菜企业希望让AI分析销售数据。SenseNova 6.7 Flash-Lite先对连续3年近90万行销售记录进行“数据审计”,确认数据正确后,再进行收入、成本、利润等财务指标分析,最终提供“建立动态定价机制”和“调整品类结构”等五项精准建议,直接辅助管理层决策。

与DeepSeek相比,商汤对生产力场景理解更深,打法更有节奏:先抓住“稳”的高频场景,再探索“热”的场景。

“稳”的场景,即打工人日常使用的数据分析、深度研究、PPT创作、搜索等。此类场景业务流程清晰、容错率高、即时性较低,非常适合作为AI的首选“登陆场”。能迅速打穿此类场景,源于商汤在办公场景沉淀的知识与流程经验,以及在To B服务中积累的客户信任;当客户顺应AI势能衍生新技术赋能需求时,商汤迅速抓住。

“稳”的场景更高层次则是“热”的场景,如视频生成、智能营销、具身智能等,与日常办公相比,难度和要求提升一个数量级。再往上,则是金融、教育等高要求场景。

抓住这些从易到难的场景,便抓住了“AI+生产力”的本质。

同时,这也是AI企业接下来必须走的路。

AI大模型发展至今,“生产力”日益重要。各类智能体取代Chatbot,成为核心落地场景。无论个人还是企业用户,都希望用AI干活、解决问题,而非仅能聊天。

这也意味着,要构建足够强韧的商业模式,AI企业必须以生产力为出发点,构建一整套低门槛、高上限的技术体系。

与单纯比拼大模型能力相比,手握这样一套“干活儿”的产品矩阵,AI企业才能尽可能抵消行业波动影响,长期立于不败之地。

Token经济时代,AI企业需改变经营范式与发展重心,而资本市场也正在调整对AI企业的估值逻辑。

过去四年间,资本更青睐哪家公司的大模型“刷榜”、谁的算力储备更多、哪家AI App用户多等。

但如今,与生产力结合紧密的AI企业,越来越受追捧。尤其在B端市场建立竞争优势的企业,堪称“当红炸子鸡”。

两大头部玩家仍在高歌猛进:OpenAI以8520亿美元估值完成惊人的1220亿美元融资。最大对手Anthropic不甘示弱,最近被曝融资300亿美元,市值达9000亿美元,首度反超OpenAI。在不少人看来,以AI编程见长的Anthropic,后劲比OpenAI更强。

“AI+生产力”,已成为Token经济时代的企业价值催化剂。在此领域,DeepSeek和商汤已站稳脚跟,并逐渐获认可。

5月初,DeepSeek被曝寻求融资超500亿元人民币,有望刷新国内AI公司单轮融资纪录;投后估值更是突破3500亿元。

在许多投资者心中,DeepSeek显然比许多明星公司走得更远、飞得更高。

与一再震撼全球AI圈的DeepSeek相比,商汤低调不少,但也具备独特优势。商汤的“三位一体”战略包括:算力基础设施(大装置)-大模型研发(日日新大模型)-AI应用,是AI行业少见的全栈公司。

自2020年起发力大模型,商汤一边推动模型与应用研发,一边长期投入智算中心AIDC建设,打造覆盖算力、模型与垂直应用的体系,实现AI场景全栈覆盖,软硬协同,使商汤AI综合实力位列行业一流。

而这一AI全栈能力,为商汤降低Token成本与价格奠定了根基。

与DeepSeek类似,商汤并非强行压价,而是“技术降本”,从源头革新技术范式,为低成本Token创造空间。

以最新发布的SenseNova 6.7 Flash-Lite为例,它未采用传统“语言+视觉”拼接设计,而是通过原生多模态架构,取消视觉转文本中间层。这样能以更小参数量完成任务,还可大幅降低推理过程中的Token消耗。在第三方权威机构Claw-Eval最新测试中,SenseNova 6.7 Flash-Lite进入全球TOP10,成为排名最高的轻量级模型。

此外,商汤具备独特优势:长期深耕B端。这使其拥有应对不同层级客户、不同复杂场景的丰富经验。多年来,尽管具体业务形态巨变,但商汤此前积累的行业认知与经营范式依然有效,为AI落地生产力场景奠定良好基础。

一个合理判断是:商汤存在一定低估,尚需具备长远眼光的投资者真正“看到”。

再回到最初问题:AI企业该如何“反脆弱”?

DeepSeek和商汤展现了“反脆弱”禀赋。他们靠技术压低Token价格、帮助企业控制AI成本,同时将“AI+生产力”作为出发点和目的地,跑出一条独具特色的发展路径。由此产生的“反脆弱”能力,正逐渐释放价值。

如今,DeepSeek估值潜力刚被释放,便迸发惊人光芒。与之类似,商汤虽目前处于价值洼地,但随着“AI+生产力”场景愈发宽广,商汤也将释放行稳致远的增长潜力。AI行业的“反脆弱”,刚刚拉开序幕。

欢迎在评论区留言~ 如需开白请加小编微信:dongfangmark