标签

AI 绕过界面直连,巨头商业逻辑遭重构

发布时间:2026-07-01 00:14阅读:2

姐的第二曲线 · AI 科普系列

当 AI 不再依赖界面直接执行任务,"点击按钮"这一行为模式正面临终结。

谷歌员工贾斯汀·波内尔特,任职近七载,职责是协助开发者优化谷歌办公套件的使用。今年三月,他开发了一款名为 gws 的开源工具,实现了一项突破:让 AI 能够跳过谷歌办公软件的网页前端,直接调用底层接口执行操作。

这意味什么?过去使用 Gmail 发送邮件,需登录网页,点击"撰写",输入收件人及正文,再点发送。如今借助 gws,AI 仅需一条指令——"替我给张三发邮件,告知明日午后三点会议"——便能自动完成,完全无需经过网页界面。

该工具迅速走红,登顶全球开发者社区 Hacker News 榜首,GitHub 星标数逼近三万。谷歌内部高层纷纷向其请教实现逻辑,Cloud AI 总监甚至公开予以推荐。

随后,他被解雇了。

官方理由是个人项目未经审批便使用了谷歌品牌标识。关于深层原因,外界众说纷纭。波内尔特本人推测,管理层担忧该工具会冲击现有业务——毕竟 AI 绕过了谷歌精心构建的界面,而这些界面正是谷歌商业价值的藏身之处。也有观点认为,这确属品牌合规问题,无需过度引申。

但无论原因为何,时间线便耐人寻味:在他被辞退前两天,谷歌于 Cloud Next 大会上宣布:将推出官方版 Workspace CLI。其功能方向与 gws 高度相似——统一接口、适配 Agent、覆盖 Workspace API。

同一条路,你修了被赶走,公司自己却在修。当然,官方产品是否与 gws 完全一致,尚待最终验证。但从战略方向看,两者重合度极高。

于是问题浮现:谷歌究竟在恐惧什么?

要厘清此事,需先想通一个核心问题——你每日使用的软件界面,究竟为谁而设计?

你以为是为你设计。实则不然。界面是为了"引导你走向何处"而存在。

回想你曾用过的软件:

取消订阅的按钮,常如寻宝般隐蔽,需点击三四层方可寻得;

搜索引擎首页,广告常占据最醒目位置,你真正渴望的内容却隐藏在第二页;

APP 首页推送给你的,往往非你最想见,而是最能助平台变现的内容。

这些并非漏洞,而是特性。产品经理耗费数载打磨的,正是这一路上的界面、入口、转化与留存。你在何处见何按钮、先跳转至哪页、何时弹出付费提示——每一步皆精心设计的"路径"。

界面即入口,入口即金钱。谁能左右你看见什么、先点击何处,谁便掌控了商业价值。

故而,当有人绕过界面直接执行任务时,绝非仅省去几步操作那么简单——他绕过的是一整条商业价值链。

那 AI Agent 登场后呢?它根本不走你铺设好的路。

AI Agent 无需打开网页,无需看见那个巨大的"免费试用"按钮,无需被引导至付费页面。它直接调用 API——即软件背后的接口——一句话即可办成事。产品经理经年累月设计的界面路径、转化漏斗、付费引导,对 AI 而言皆是空气。

这好比,商场斥巨资打造了一条精心规划的购物动线——进门先过化妆品区,再绕至服装区,结账前必经零食架。结果有人从消防通道直奔目标,取货即走,你那条动线对他毫无意义。

这并非谷歌一家的焦虑。就在今年四月,广州互联网法院作出裁定:一家公司开发的 AI 智能体,在未获平台授权情况下,通过模拟用户点击自动操作第三方对话平台,被责令立即下架。法院裁定折射出一种趋势:第三方智能体接入平台,须同时获得平台方许可与用户授权,两道关卡皆需通过。

可见,平台方的反应出奇一致:你可使用我的服务,但必须走我设计好的门。若你试图绕行,要么通过内部手段处置,要么诉诸法律维权。

但问题是,门未必能挡得住。

AI Agent 绕过界面直接执行任务,非某家公司的选择,而是技术演进的方向。当 AI 具备工具调用能力,拥有 MCP 协议打通的通道,以及 Agent 架构的自主决策力——它自然会选择最短路径,直接与系统对话,不经过任何人的界面。

因此,这场"入口之争"的本质,非谷歌对某员工,亦非平台对某智能体,而是两种软件使用方式的更替:一种是你亲自点击按钮,界面即入口;另一种是你告知 AI 所需,AI 直接执行,接口即入口。

对普通用户而言,信号极为明确:未来使用软件的方式,将从"亲自操作"转变为"告知 AI 需求"。那些精心设计的界面不会消失,但其角色将转变——从"操作入口"变为"展示层与权限层"。越来越多的实际操作,将由 AI 代劳,而 AI 不走界面。

谁掌控了 AI 调用的通道,谁便掌控了下一代的商业入口。

这正是 AI 一旦动手执行,大公司便需重新核算账目的原因。#得到大脑

本文案例