DAA取代Token,AI云迎来新标准
AI基础设施,到了必须升级的时候。
5月13日,在Create 2026百度AI开发者大会上,百度创始人李彦宏提出了一个新观点——衡量AI时代平台与生态繁荣程度的核心指标,应该是"日活智能体数"(DAA),而非Token消耗量。
李彦宏的逻辑是,Token衡量的是投入而非产出,DAA才更接近移动互联网时代DAU的意义,也就是有多少智能体在给人类干活并交付结果。他同时预测,未来全球DAA可能超过100亿。
同日,百度集团执行副总裁、百度智能云事业群总裁沈抖宣布,百度智能云将全面升级为面向大规模智能体应用的"新全栈"AI云,在Agent Infra与AI Infra两条主线上分别做出系统性升级。
DAA指标的提出,以及新全栈AI云的发布,背后都有同一个逻辑:AI的竞争重心,正在从模型层转移到应用层,同时在应用进入智能体时代的当下,Token成本问题,不止一种解法。
过去两年,行业的核心命题,是谁能造出能力最强的模型。但随着大模型能力趋于成熟,单纯的模型性能已经很难拉开差距。在Agent(智能体)时代,智能体否在真实业务场景里稳定落地,同时还能最大效率的交付结果,成为了新的竞争焦点。而基础设施,将决定将决定这场应用落地的成败与速度。
需求彻底变了
理解百度智能云为何提出"新全栈",先得从需求和供给理解。
过去十年,云厂商口中的"全栈",其实本质上是一种分层供给的能力清单——芯片层、IaaS层、PaaS层、模型层、应用层,各层各司其职,边界清晰。但这也并非主动选择,而是市场决定,过去无论是AI还是其他行业,更多客户使用云服务往往是按需取用。需要什么,就买什么。那时的全栈意味着"全能力",决定了云厂商可服务的范围。
但在这种惯性需求带来的供给中,也存在一些问题,全栈的各层之间相对自成体系,彼此协同靠人工配置,优化靠分别调参,整体的反应速度和协同效率,天然存在上限。
直到Agent大规模出现,这个上限开始变得明显。
一个在企业生产环境里实际运行的智能体,不应该只是被动的响应执行,而是要持续感知上下文、调用工具、分解任务、协调多个子智能体、在出错时自我纠偏,并在每一次交互后积累记忆、持续进化。整个过程可能跨越数百步,持续时间从几分钟到数小时不等。
这种应用形态对基础设施的要求,跟过去的SaaS软件完全不是同一个量级。
更关键的是,智能体的运行质量,高度依赖各层基础设施之间的实时协同。例如,长上下文的处理出了问题,任务链就会断;工具调用的稳定性跟不上,智能体就会在关键节点卡住;如果底层算力的调度跟不上应用层的并发需求,再好的模型也只能排队等待。
这也意味着,把云服务拆开采购、分层使用的逻辑,在这种场景下行不通。企业需要的是一套从算力到模型到运行时环境能够端到端拉通的基础设施,而不是几块分别运转的积木。
行业数据也在佐证这一变化。赛迪顾问发布的《2025H1中国AI云全栈服务市场份额报告》显示,2025年上半年中国AI云全栈服务市场规模达280.9亿元,同比增长195.7%。这个数据,背后是大量企业从采购单点AI能力转向寻找整体解决方案的集中切换。
这也是为什么,沈抖在大会上表示,智能云的客户目标,已经从业务弹性、可靠、降本增效,变成了高活跃、高价值、规模化的智能体应用。当需求变了,支撑需求的基础设施就必须跟着重构。
"新全栈",新在哪里?
新全栈之于云服务行业,不亚于汽车工业之于早期工业文明。
汽车普及之前,机械加工大多是粗放的。但汽车这种精密复杂产品的出现,对高速旋转稳定性、金属疲劳强度、标准化模组提出了更极端的要求——为了提升动力必须改良钢材工艺,为了精细控制必须进化电气系统,牵一发而动全身,倒逼供应链整体进化升级。
今天,智能体应用对AI云提出的,正是同样的整合需求。
在百度的解读中,"新全栈"的核心逻辑是打破层级孤岛,让芯片、云、模型、智能体四层之间形成双向反馈、实时调整的有机协同机制。沈抖在发布会上将这套体系概括为"芯云模体":芯片可以根据大模型的推理特征进行优化,当智能体在应用层遭遇高并发或复杂逻辑时,压力能迅速传导至模型调度层进行优化,并同步触发算力层的弹性扩容。
具体到产品层面,新全栈AI云在Agent Infra和AI Infra两条主线上分别做了系统性重构。
Agent Infra的核心升级,是把原有的模型服升级为以智能体为中心的「Token Factory词元工厂」,并推出覆盖长上下文管理、持久记忆、工具调用、子智能体调度、评估反馈、运行时保障六大模块的「Harness Engineering驾驭工程体系」。
这套体系的设计目标是让每一次token消耗都尽量转化为业务价值,即减少重复计算、提升任务成功率、让智能体真正跑进生产环境。实测数据显示,在同等任务下,相比OpenClaw的token消耗减少23%,推理速度比行业均值快25%,办公场景任务成功率达到95%。
AI Infra的升级逻辑,则是是让算力的每一分效能都尽量用在刀刃上。从推理侧的分层缓存架构、训练侧的全模态统一框架,到自研昆仑芯P800的规模化交付,再到采用"网络向心布局"的吉瓦级数据中心建设,每一层的优化都在为智能体应用的规模化运行降低物理成本。
两条主线各有侧重,但目标相同:Agent Infra让智能体更聪明、任务完成率更高;AI Infra让算力更便宜、训练和推理的单位成本更低。二者叠加,最终目的是让企业大规模部署智能体的门槛变得足够低,也让DAA足够高。
真实场景的检验
检验一套基础设施是否真正有价值,要看它能解锁什么样的应用场景。百度智能云过去十年在行业里积累的100多个智能体落地案例,提供了一种观察视角。
义乌的"前店后厂"就是一个值得拆解的案例。
"前店后厂"指的是前端面向全球采购商的实体或线上商铺,后端是本地快速响应的中小型制造工厂。在这种生态中,商家需要时刻面对前后端的联动。过去这需要依赖高密度的人力投入,但随着经营规模扩大,管理复杂度也快速上升。
百度智能云的一见视觉智能体,让工厂管理者通过自然语言配置摄像头上的识别规则和处置流程,完成安全生产、质量管理等场景的自动化监控,而Hogee智能营销解决方案则帮助商家实现从销售导购、库存调货到订单管理的营销全链路自动化。两款产品的结合,让小规模商家的经营能力得到实质性扩展。
长安汽车则是自动驾驶领域的典型代表。自动驾驶的研发需要海量数据的训练迭代,对算力规模和训练效率的要求极高,容错空间极小。而长安与百度智能云共建智算中心已有三年,前者过去一直依托百舸平台完成自动驾驶模型的训练并持续迭代。工信部迄今仅批准两家车企的L3级自动驾驶产品上路,长安便是其中之一。
长安汽车只是其中一个缩影,这条赛道的竞争早已在基础设施层展开。目前,百度智能云已覆盖100%的中国主流车企,累计支持超过2000万辆搭载L2级辅助驾驶的新车交付。
大型央企的场景,对稳定性和准确性的要求更为严苛。变电站巡检就是一个对误报率和任务中断零容忍的场景,传统AI识别方案的准确率只有五六成,大量无效告警反而增加了人工筛查的负担。
百度智能云用"大小模型融合"架构重新设计了这套流程:边缘侧小模型负责现场初判,云端大模型负责复判。改造后,缺陷识别准确率超过80%,变电站巡视时间从人工至少2.5小时压缩至约45分钟。这套方案,目前已覆盖全国800余座变电站。
不难看出,智能体承接的都是过去必须靠大量人力维持的复杂流程。而它们之所以能真正跑起来,依赖的是一套从芯片、云、模型再到运行环境全链路打通的基础设施。它真正介入国计民生的核心环节,并且能在高压力、长周期的真实工况下稳定输出。
这正是百度智能云所说的新全栈的终极意义:让整套AI能力像一个"智能器官"一样,自动长入客户的业务场景中,而不是让客户去适应技术层级的限制。
百度在技术路线与商业落地之间的选择是否正确,外部市场的评估或许可以作为注脚。赛迪顾问数据显示,百度智能云以40.2%的市场份额位居中国AI云全栈服务市场第一;沙利文报告显示,其在中国自研GPU云市场同样以40.4%的份额排名第一。今年一季度,百度智能云中标项目数量和金额双双位列行业首位。
李彦宏在大会上表示,"这个时代没有旁观者,我们都是创造者"。这句话放在云服务的语境里也成立——当DAA成为衡量AI生态的新刻度,基础设施的竞争不再只是算力和模型的比拼,而是谁能为那100亿个可能诞生的智能体,提供一个足够好的生长土壤。