AI动态 | Google I/O开幕在即与机器人零故障运行24小时

发布时间：2026-05-19 07:45阅读：14

今夜（5月20日凌晨1点）即将到来，Google I/O 2026 即将在山景城的Shoreline Amphitheatre拉开帷幕。以下是值得关注的几大看点：

Gemini 4.0。这几乎是确定会发布的新版本。多方消息显示，新一代模型在多模态推理方面有显著提升，但其能力大致处于 GPT-5.5 的水平，仍略逊于 Anthropic 的 Claude Mythos。不过，Google 当前的重点并不在于争夺性能榜首，而是想证明一件事：将 Gemini 集成进30亿台 Android 设备的价值，远超跑分榜上的名次。

Agentic Coding。这是开发者今夜最应关注的内容。传闻 Google 将推出代号为“Gemini Spark”的持久化 AI 智能体——它不再只是代码补全工具，而是能够自主完成多步骤任务。这一目标非常明确：直接挑战 Claude Code 和 OpenAI Codex。Google 在 AI 编程领域沉寂已久，这次终于亮出了底牌。

Gemini Omni。这是一个统一模型，可同时生成文本、图像和视频。Google 内部界面已曝光相关 UI 字符串。如果该模型真的发布，Google 将拥有一整套完整的创作工具链。

Android XR 智能眼镜。两款产品：无屏版（配备摄像头、麦克风和扬声器，通过语音与 Gemini 交互）和带屏版（具备 AR 显示和实时翻译功能）。三星、XREAL、Warby Parker、Gentle Monster 四家厂商将共同登台。Meta 去年售出700万副 Ray-Ban 智能眼镜，Google 虽然来晚了，但它押注的是 Android 生态系统这张牌。

Aluminum OS。这是 Android 与 ChromeOS 的融合体。首款 Googlebook 笔记本将在今年秋季交付使用，Acer、Asus、Dell、HP、Lenovo 等品牌均有参与。简而言之，这就是一款 AI 版的 Chromebook。

今晚的焦点无疑是 Gemini Spark。随着 Google 的入局，AI 编程工具市场已从双雄争霸演变为三足鼎立。

过去两周，AI 编程工具的企业级竞争愈演愈烈。

首先，OpenAI 宣布 Codex 已上线至 ChatGPT 手机应用——iOS 和 Android 用户均可免费使用。Sam Altman 透露，Codex 的周活跃用户已突破400万。原因很简单：AI 编程工具执行一个任务往往需要几十分钟甚至几小时，开发者不可能一直守在电脑前。在手机上审批、调整方向、让 Agent 继续运行，是真实的需求。

随后，OpenAI 放出重磅消息：未来30天内，企业用户从 Claude Code 转向 Codex，可免费使用两个月。此外还提供了迁移工具，设置、插件、技能和基础设施可一键迁移。

不到一小时，Anthropic 立即回击：Claude Code 的每周使用上限提高50%，优惠期持续到7月中旬。这一底气来源于刚刚签署的 SpaceX Colossus 1 算力大单——22万张 NVIDIA GPU，总功率达300MW。算力到位后，供应量自然充足。

这已经不是简单的福利发放，而是一场对工作流的争夺战。谁能率先让程序员适应自己的工作流程，谁就掌握了未来软件开发的入口。

Figure AI 的那场直播，越看越精彩。

原计划8小时自主分拣包裹。完成零故障测试后，CEO Brett Adcock 当场决定：继续推进。三台 Figure 03（观众昵称为 Bob、Frank 和 Gary）连续运行24小时，处理了超过28000个包裹。全程无人工干预，且无任何故障。

机器人执行的任务包括：扫描条码、抓取不同材质的包裹（如塑料袋、纸箱）、翻转标签朝下、放置传送带。搭载的是 Helix-02 AI 系统，该系统通过一个统一神经网络整合了视觉、触觉、本体感知和全身控制，所有操作均在本地进行，无需联网。

我认为最有趣的部分是“自愈编队”：当某台机器人出现问题时，它会自动前往维护区，另一台则自动补位接手，无需人工协调。

分拣速度约为每3秒一个包裹，与人类工人效率相当。Figure AI 之前曾在宝马南卡罗来纳工厂进行过测试，那次是8小时作业。这次从8小时延长至24小时，意义截然不同：不再是“能跑一个班”，而是“能全天候运行”。

Figure AI 的产能也在飞速增长：从每天一台提升到每小时一台，仅用了不到4个月时间。

5月上旬，中国多家 AI 实验室密集发布了最新成果：智谱 GLM-5.1、MiniMax M2.7、Moonshot Kimi K2.6、DeepSeek V4，12天内四家开源编码模型相继上线。

核心信息只有一条：在 agentic engineering 基准测试中，这四家公司的模型全部达到西方前沿水平，但推理成本仅为 Claude Opus 4.7 的三分之一甚至更低。

DeepSeek V4 的输入价格为 $0.27/M tokens，Gemini 3.1 Flash-Lite 为 $0.25/M tokens。推理成本的下降速度已经超过了能力提升的速度。对于从事 AI 编程产品的人来说，成本结构发生了变化，商业模式也必须随之调整。

此外，UK AISI 的评测确认了一点：GPT-5.5 在网络基准测试中的表现已与受限版的 Anthropic Mythos 持平。能力天花板的追赶速度比预期更快。

Anthropic 正在以超过9000亿美元的估值寻求至少300亿美元的新一轮融资。Sequoia、Dragoneer、Greenoaks、Altimeter 联合领投，最快月底完成。但支撑这个数字的并非空谈：年经常性收入（ARR）从去年底的约90亿美元增长到今年5月的440亿美元，12个月内激增350亿。

更重要的是算力布局：Colossus 1（与 SpaceX 合作，22万张 GPU，300MW）、5GW 与 Amazon、5GW 与 Google/Broadcom、300亿美元 Azure 容量、500亿美元与 Fluidstack。这些合同叠加起来，Claude Code 背后的算力几乎可以说是无限供给。

Claude Code 和 Cowork 已被 Daniela Amodei 定位为企业级的“AI 操作系统”。年付费超百万美元的企业客户数量在两个月内从500家翻倍至1000多家，PwC、Blackstone、Goldman Sachs 均已全面采用。

与 OpenAI 相比，两家走了不同的路径：OpenAI 走的是消费端入口+移动端延伸路线，Anthropic 则专注于企业级基础设施。谁的路线更正确，今年下半年将见分晓。