标签

谷歌AI智能体Gemini Spark:重塑搜索与开启Agent新纪元

发布时间:2026-06-02 22:21来源:微信阅读:6

当搜索引擎的缔造者决心让"搜索"这一概念过时,这场变革的深远意义远超推出一款新品。

2026年5月19日,谷歌I/O开发者大会于美国加州山景城Shoreline圆形剧场盛大启幕。不同于往年的"模型军备竞赛"叙事,今年大会释放的唯一核心信号便是:谷歌正将AI智能体(Agent)深度融入其所有核心产品入口。

CEO桑达尔·皮查伊在开幕演讲中公布了一组关键数据——谷歌每月处理的Token总量已从去年的480万亿激增至3.2千万亿,同比增长高达7倍;Gemini应用月活跃用户数从4亿翻倍至9亿;AI Overviews月活用户突破25亿大关;AI Mode上线一年即收获10亿用户。

这些数字背后,是谷歌从"搜索巨头"向"智能体巨头"转型战略决心的有力量化。而承载这一宏大转型的旗舰之作,正是Gemini Spark——一个能全天候运行、跨应用执行复杂任务的AI智能体。

核心定位:24/7不间断运行的AI Agent

Gemini Spark绝非传统意义上的对话助手。它是一个运行在Google Cloud专用虚拟机上的持久化智能体运行时——即便用户合上笔记本电脑,Spark仍会在后台持续运转。

谷歌将其定义为"长周期执行"(long horizon execution)能力:Spark能够跨越数小时甚至数天来维护目标状态和上下文。它可以定时监控收件箱、跨邮件与日历交叉比对信息、甚至在用户打开Gmail之前就草拟好回复。

技术架构:三层体系

Spark的技术栈由三个关键层级构成:

第一层:Gemini 3.5 Flash模型。该模型是Spark的推理引擎,其Token输出速度约为同级别前沿模型的4倍,在编码、智能体及多模态基准测试中均超越了上一代Gemini 3.1 Pro。在Antigravity运行时内,优化后的Gemini 3.5 Flash推理速度可达标准前沿模型的12倍。

第二层:Antigravity 2.0平台。这是谷歌内部构建智能体系统的核心基础设施,今年首次对外开放。Antigravity提供目标持久化、任务分解、工具编排、安全约束及状态恢复等能力,并通过声明式manifest文件定义智能体的行为边界。开发者可像编写配置文件一样定义Agent的目标、工具及权限。

第三层:MCP(Model Context Protocol)网关。Spark支持通过MCP协议连接第三方服务。首发集成了Gmail、Google Docs、Slides和Sheets,同时接入了Canva、OpenTable、Instacart等第三方服务。今年夏天将通过MCP扩展至GitHub、Notion、Slack等平台。

实际能力:从策划派对到企业工作流

在大会演示中,Spark展示了一个完整的社区活动策划场景:汇总参与者回复、追踪每位参与者携带的物品、自动向未回复的邻居发送跟进邮件、在Google Sheets中创建实时追踪表、并利用Google Drive中的信息生成Google Slides宣传文档。整个流程无需用户持续参与,Spark自主完成了跨应用的协调工作。

谷歌在智能体领域,拥有其他竞争者难以复制的结构性优势。

数据深度与生态广度。谷歌坐拥13个用户超10亿的产品,其中5个用户数超过30亿。Gmail、Docs、Calendar、Drive、YouTube、Maps、Chrome、Android——这些产品构成了全球最完整的数字生活基础设施。Spark能够深入这些产品的API层面进行操作,这种集成深度是任何第三方Agent无法企及的。

基础设施的规模效应。皮查伊披露,谷歌2026年资本开支预计达到1800亿至1900亿美元,约为2022年310亿美元的六倍。自研TPU已迭代至第八代,首次采用训练(TPU 8t)与推理(TPU 8i)双芯片架构,训练算力提升近3倍,推理延迟大幅优化。支撑Spark持续运行的算力成本,在谷歌的规模经济下可被有效摊薄。

搜索入口的不可替代性。AI Mode已拥有10亿月活用户,新搜索框融合了AI生成建议、多模态搜索能力,并接入了信息智能体——可在后台持续监控特定行业的市场动态。谷歌正在用Agent重新定义"搜索":从用户主动查询,转向智能体主动推送。

这种自我革命的逻辑清晰:与其等待竞争对手颠覆搜索,不如自己用Agent颠覆搜索。搜索广告依然是谷歌的核心收入引擎,而Spark和AI Mode所代表的"从搜到问"的范式转移,本质上是将广告变现从"展示点击"升级为"意图匹配+智能体执行"的更高级形态。

Spark代表的不仅是搜索体验的升级,而是用户信息获取范式的根本性重构。

传统搜索的核心交互是"用户输入关键词→搜索引擎返回链接列表→用户筛选信息"。AI Overviews和AI Mode将其演进为"用户提问→AI生成整合答案"。而Spark进一步将其推向"用户描述目标→智能体持续执行→用户审阅结果"。

这一范式转移带来的行业影响是深远的:

• SEO生态将被重构。当智能体代替用户完成信息筛选,传统的搜索排名优化将让位于"智能体可理解性优化"。网站需要被Agent读懂,而非仅被算法排序。

• 流量分发逻辑改变。智能体可能直接完成操作(下单、预约、预订),中间页面流量将大幅减少。这对依赖搜索引擎导流的内容平台和电商平台构成直接挑战。

• 商业模式演进。谷歌在本次大会上同步推出了Universal Cart——一个由AI智能体驱动的通用购物车,支持跨Google服务追踪优惠、监控价格、识别兼容性。这表明谷歌正在将搜索流量直接转化为交易闭环。

Spark的发布,标志着AI智能体竞争从"概念验证"阶段正式进入"基础设施争夺"阶段。

开发者生态的争夺

Antigravity 2.0的开放是本次大会向开发者群体释放的最重要信号。它直接对标Anthropic的Claude Code和OpenAI的Codex,提供了一个"毫不掩饰地以智能体为先"的开发平台。其声明式manifest设计降低了构建生产级Agent的门槛——开发者定义目标、工具和安全边界,平台负责编排、约束和恢复。

谷歌宣称,通过Antigravity 2.0从零构建一个操作系统的Token成本不到1000美元。若这一数据可靠,意味着AI驱动的软件开发正快速走向经济可行的区间。

安全与信任的先发优势

Antigravity的设计将安全约束视为一等公民。manifest中可配置每次目标的最大工具调用次数、需用户确认的操作类型、允许的数据源白名单等。这种"默认安全"的设计理念,对于企业级Agent的采用至关重要。

多端覆盖的入口优势

Spark不局限于桌面端。今年夏天将进入Chrome浏览器;Android Halo作为移动端Agent的可视化入口已经发布;在Android XR智能眼镜的现场演示中,Gemini通过眼镜完成了从导航到下单的全流程操作。谷歌正在构建一个覆盖桌面、移动、XR的全场景智能体网络。

中国智能体竞争格局

Gemini Spark的发布对中国AI产业的启示在于:智能体竞争的核心壁垒不仅是模型能力,更是生态整合深度。国内互联网巨头同样拥有丰富的产品矩阵——腾讯的微信生态、阿里的电商与支付体系、字节的短视频与内容平台——但目前的Agent产品多停留在对话层面,缺乏Spark级别的跨应用深度集成。

百度的文心智能体、阿里的通义千问智能体、字节豆包的Agent探索,各有侧重。但它们面临的共同挑战是:如何在一个产品生态内部实现足够深度的数据打通和操作授权,同时又不触碰用户隐私和数据安全的红线。

四川AI产业的机遇

从四川的产业视角看,Gemini Spark所代表的"智能体即服务"趋势,为本地AI企业提供了两个方向的机会:

一是垂直场景的Agent应用开发。通用Agent平台(如Antigravity)降低了基础设施门槛,但行业know-how仍然不可替代。四川在智能制造、文旅、农业等领域拥有丰富的应用场景,基于通用Agent平台构建行业垂直解决方案,是一个务实的技术路线。

二是Agent生态中的工具和服务提供。MCP协议的开放意味着任何服务都可以成为Agent的工具节点。四川的SaaS企业、数据服务商若能将自己的服务封装为MCP Server,就能接入全球Agent生态,获得新的分发渠道。

成都高新区作为西部AI产业高地,已集聚了一批大模型应用企业。Spark的发布进一步验证了从"模型竞争"到"应用竞争"再到"智能体竞争"的产业演进路径。在这一路径上,场景理解和工程落地能力的重要性,正在超越纯粹的模型参数规模。

Gemini Spark的标志性意义,不在于其技术多么惊艳——事实上,其核心能力的各个组件在此前已有不同程度的探索。它的真正意义在于:全球最大的搜索引擎公司,将智能体作为其核心战略方向,并投入了与其搜索业务同等量级的资源。

这传递了两个明确的信号:第一,AI智能体不再是实验室产品或极客玩具,而是面向大众市场的真实产品;第二,从"搜索"到"智能体"的范式转移不是会不会发生的问题,而是以多快速度发生的问题。

Spark下周将面向美国Google AI Ultra订阅用户开放,Ultra套餐起始价100美元/月。价格门槛意味着智能体的大规模普及仍有距离,但方向已经确定——正如2007年iPhone发布时,智能手机的普及也需要时间,而方向从未动摇。

对于研究院而言,我们关注的不仅是Spark本身的功能,更是其背后揭示的产业趋势:AI正在从"回答问题"的工具,进化为"解决问题"的伙伴。这要求我们在技术跟踪、人才培养和产业对接中,将"智能体能力"置于与"模型能力"同等重要的位置。未来的竞争,不仅是谁的模型更强,更是谁的智能体更可靠、更安全、更能融入真实的工作和生活场景。Spark的发布,为这场竞争画下了一条清晰的起跑线。

本文由四川省人工智能研究院撰写,部分信息