智能体AI新时代:从生成转向执行,Token成核心资源
中国AI大模型周调用量连续四周超过美国,小米、阶跃、MiniMax和DeepSeek占据全球前四位置
最近七天,人工智能领域的焦点从“生成”转向了“执行”。从中关村论坛到各企业动态,一个明确的信号已显现:智能体AI正式接替生成式AI,开启产业发展的新阶段。
同时,Token需求呈指数级增长,算力基础设施面临全新挑战。以下为近期值得关注的AI前沿趋势汇总。
一、范式转变:从“生成式”到“智能体”
在3月27日举行的2026中关村论坛“AI开源前沿论坛”上,多位专家达成共识:人工智能正迎来继ChatGPT之后的全新范式变革,智能体AI成为技术发展和产业应用的核心方向。
中国工程院外籍院士张亚勤指出,过去五年是生成式AI阶段;而当前,AI发展已进入智能体AI阶段。智能体的核心能力包括:目标设定、任务分解、规划执行、学习迭代、记忆留存等。
张亚勤特别强调:“最近热门的OpenClaw,仅是智能体在消费端的应用体现。未来智能体技术的核心价值在于工业、医疗、机器人等实体经济领域。”
智谱CEO张鹏将OpenClaw形容为人工智能应用的“脚手架”——让普通人能以较低门槛使用顶尖模型完成复杂任务。小米MiMo大模型负责人罗福莉则认为,OpenClaw“激发了全行业对Agent层创新的想象”。
如果说ChatGPT让AI学会了“说话”,那么智能体正在让AI学会“干活”。
二、数据实力:中国大模型调用量连续四周领先美国
来自OpenRouter的最新数据证实了中国AI的强劲表现:截至3月23日,全球AI大模型周调用量前十名中,中国AI大模型周调用量为7.359万亿Token,较前一周增长56.9%,连续三周超越美国。
最新一周(3月23日-29日)数据显示,中国大模型周调用量已达9.857万亿Token,环比增长33.94%,连续四周增长并领先美国。相比之下,美国仅3.007万亿Token,环比微增1.79%。
更引人注目的是,全球调用量前四名均为中国模型:
· 小米MiMo-V2-Pro:3.96万亿Token
· 阶跃星辰Step 3.5 Flash(free)
· MiniMax M2.7
· DeepSeek V3.2
中国AI大模型从“追赶者”转变为“被追赶对象”。
三、Token经济:需求激增,算力吃紧
随着智能体应用从“简单对话”转向“实际执行”,Token消耗呈指数级爆发。
国家数据局最新数据显示,我国日均Token调用量从2024年初的1000亿跃升至2025年底的100万亿,2026年3月更是突破140万亿,两年间增长超千倍。
张鹏透露,智能体完成复杂任务的Token消耗是简单问答的10倍甚至100倍。这直接传导至算力基础设施领域——张鹏直言,当前人工智能发展再次面临“算力受限”的问题,大量市场需求未被满足。
小米罗福莉预测,今年Token增长“或达100倍”。周鸿祎则直言:“Token永远不会像手机流量那样包月无限量使用。”
云厂商涨价潮随之而来。阿里云AI算力、存储等产品最高涨价34%;百度智能云最高上涨30%。京东云则选择“拒绝跟风涨价”,以差异化策略争夺市场。
无问芯穹CEO夏立雪提出“可持续Token”概念,建议依托我国能源优势,建立中国特色Token经济学,让中国成为世界的“Token工厂”。
Token正在成为智能时代的核心生产要素,算力就是新“电力”。
四、技术突破:小米MiMo、Meta脑预测、通通3.0
过去一周,多家厂商发布了重要技术成果:
小米MiMo-V2系列:3月19日,小米推出三款自研大模型。其中旗舰模型MiMo-V2-Pro专为高强度Agent场景设计,在多项评测中进入全球第一梯队。定价策略激进(输入1美元/百万Token),意图快速吸引开发者生态。
Meta TRIBE v2:Meta发布“下一代”AI模型,可模拟人脑对图像、声音和语言的响应。该模型基于700多名志愿者的fMRI数据训练,被称为“人脑神经活动的数字孪生”,预测速度和精度大幅提升,分辨率较同类模型提高70倍。
通通3.0:北京通用人工智能研究院在中关村论坛发布全球首个通用智能人“通通3.0”与原创“CUV架构”,打破AGI“数据驱动”的单一路径,让AI从“被动响应工具”迈向“主动认知主体”。
技术底座的竞争,正在从模型参数转向架构与生态。
五、政策与生态:开源联盟成立,首个行业标准落地
政策层面释放明确信号。工信部科技司司长魏巍在中关村论坛表示,将从应用牵引、技术创新、生态完善三方面加快构建我国开源生态体系。
3月27日,中关村人工智能开源联盟正式成立,由北京智源研究院、北京大学等发起,汇聚超40家芯片、大模型、科研院所等单位。
值得关注的是,具身智能领域首个行业标准正式发布,为具身智能的规范化发展奠定基础。
北京市宣布将出台“模型券”等惠企政策,大力支持OPC等创业模式。上海方面,上海市人工智能行业协会表示,AI发展“不能因噎废食”,安全和风控要协同推进。
政策正在从“顶层设计”走向“落地支撑”。
六、落地应用:具身智能加速推进
在2026中关村论坛现场,AI已经从“秀场”走进现实:
· 千寻智能“墨子”机器人灵巧串起糖葫芦
· 乐聚“夸父”平稳穿梭送餐
· 亮亮视野AR+AI翻译眼镜实时投射54种语言字幕,延迟低至0.3秒
智源研究院发布RoboBrain 2.0与RoboOS 2.0协作平台,实现跨厂商机器人统一调度,克服多类型机器人本体协作难题。
智元机器人宣布第10000台产品下线,标志着具身智能从“小批量”走向“规模化”。
王兴兴在GTC2026上给出具身智能“GPT时刻”的定义:带机器人到陌生场景,语音指令完成80%以上任务。
具身智能正在从“实验室玩具”变成“工厂同事”。
七、短期展望:苹果AI“破例”预告,特斯拉超级算力
未来几周值得关注的事件:
苹果打破常规:在WWDC26新闻稿中,苹果罕见地提前预告将推出“AI新进展”。全面升级的Siri将成为重头戏,预计将正式揭晓与谷歌Gemini大模型合作的具体成果。
特斯拉TERAFAB:特斯拉发布TERAFAB项目,预计将实现每年超1太瓦算力产出,瞄准超大规模AI训练。
OpenAI新模型:OpenAI已完成新AI模型的初步开发,Sam Altman将重心转向数据中心建设与募资。如果说2025年是“大模型普及元年”,2026年正在成为“智能体落地元年”。从技术范式到产业应用,从Token经济学到算力基建,人工智能的竞争维度已下探到芯片、能源、甚至底层架构层面。
对于从业者而言,值得思考的问题不再是“AI能做什么”,而是“如何让AI把活干好”。而对于普通用户,一个更智能、更能干、更“有温度”的数字助手,或许就在不远的将来。
编发:一诺 审核:王涛