标签

AI动态 | Google I/O开幕在即与机器人零故障运行24小时

发布时间:2026-05-19 07:45来源:微信阅读:7

今夜(5月20日凌晨1点)即将到来,Google I/O 2026 即将在山景城的Shoreline Amphitheatre拉开帷幕。以下是值得关注的几大看点:

Gemini 4.0。这几乎是确定会发布的新版本。多方消息显示,新一代模型在多模态推理方面有显著提升,但其能力大致处于 GPT-5.5 的水平,仍略逊于 Anthropic 的 Claude Mythos。不过,Google 当前的重点并不在于争夺性能榜首,而是想证明一件事:将 Gemini 集成进30亿台 Android 设备的价值,远超跑分榜上的名次。

Agentic Coding。这是开发者今夜最应关注的内容。传闻 Google 将推出代号为“Gemini Spark”的持久化 AI 智能体——它不再只是代码补全工具,而是能够自主完成多步骤任务。这一目标非常明确:直接挑战 Claude Code 和 OpenAI Codex。Google 在 AI 编程领域沉寂已久,这次终于亮出了底牌。

Gemini Omni。这是一个统一模型,可同时生成文本、图像和视频。Google 内部界面已曝光相关 UI 字符串。如果该模型真的发布,Google 将拥有一整套完整的创作工具链。

Android XR 智能眼镜。两款产品:无屏版(配备摄像头、麦克风和扬声器,通过语音与 Gemini 交互)和带屏版(具备 AR 显示和实时翻译功能)。三星、XREAL、Warby Parker、Gentle Monster 四家厂商将共同登台。Meta 去年售出700万副 Ray-Ban 智能眼镜,Google 虽然来晚了,但它押注的是 Android 生态系统这张牌。

Aluminum OS。这是 Android 与 ChromeOS 的融合体。首款 Googlebook 笔记本将在今年秋季交付使用,Acer、Asus、Dell、HP、Lenovo 等品牌均有参与。简而言之,这就是一款 AI 版的 Chromebook。

今晚的焦点无疑是 Gemini Spark。随着 Google 的入局,AI 编程工具市场已从双雄争霸演变为三足鼎立。

过去两周,AI 编程工具的企业级竞争愈演愈烈。

首先,OpenAI 宣布 Codex 已上线至 ChatGPT 手机应用——iOS 和 Android 用户均可免费使用。Sam Altman 透露,Codex 的周活跃用户已突破400万。原因很简单:AI 编程工具执行一个任务往往需要几十分钟甚至几小时,开发者不可能一直守在电脑前。在手机上审批、调整方向、让 Agent 继续运行,是真实的需求。

随后,OpenAI 放出重磅消息:未来30天内,企业用户从 Claude Code 转向 Codex,可免费使用两个月。此外还提供了迁移工具,设置、插件、技能和基础设施可一键迁移。

不到一小时,Anthropic 立即回击:Claude Code 的每周使用上限提高50%,优惠期持续到7月中旬。这一底气来源于刚刚签署的 SpaceX Colossus 1 算力大单——22万张 NVIDIA GPU,总功率达300MW。算力到位后,供应量自然充足。

这已经不是简单的福利发放,而是一场对工作流的争夺战。谁能率先让程序员适应自己的工作流程,谁就掌握了未来软件开发的入口。

Figure AI 的那场直播,越看越精彩。

原计划8小时自主分拣包裹。完成零故障测试后,CEO Brett Adcock 当场决定:继续推进。三台 Figure 03(观众昵称为 Bob、Frank 和 Gary)连续运行24小时,处理了超过28000个包裹。全程无人工干预,且无任何故障。

机器人执行的任务包括:扫描条码、抓取不同材质的包裹(如塑料袋、纸箱)、翻转标签朝下、放置传送带。搭载的是 Helix-02 AI 系统,该系统通过一个统一神经网络整合了视觉、触觉、本体感知和全身控制,所有操作均在本地进行,无需联网。

我认为最有趣的部分是“自愈编队”:当某台机器人出现问题时,它会自动前往维护区,另一台则自动补位接手,无需人工协调。

分拣速度约为每3秒一个包裹,与人类工人效率相当。Figure AI 之前曾在宝马南卡罗来纳工厂进行过测试,那次是8小时作业。这次从8小时延长至24小时,意义截然不同:不再是“能跑一个班”,而是“能全天候运行”。

Figure AI 的产能也在飞速增长:从每天一台提升到每小时一台,仅用了不到4个月时间。

5月上旬,中国多家 AI 实验室密集发布了最新成果:智谱 GLM-5.1、MiniMax M2.7、Moonshot Kimi K2.6、DeepSeek V4,12天内四家开源编码模型相继上线。

核心信息只有一条:在 agentic engineering 基准测试中,这四家公司的模型全部达到西方前沿水平,但推理成本仅为 Claude Opus 4.7 的三分之一甚至更低。

DeepSeek V4 的输入价格为 $0.27/M tokens,Gemini 3.1 Flash-Lite 为 $0.25/M tokens。推理成本的下降速度已经超过了能力提升的速度。对于从事 AI 编程产品的人来说,成本结构发生了变化,商业模式也必须随之调整。

此外,UK AISI 的评测确认了一点:GPT-5.5 在网络基准测试中的表现已与受限版的 Anthropic Mythos 持平。能力天花板的追赶速度比预期更快。

Anthropic 正在以超过9000亿美元的估值寻求至少300亿美元的新一轮融资。Sequoia、Dragoneer、Greenoaks、Altimeter 联合领投,最快月底完成。但支撑这个数字的并非空谈:年经常性收入(ARR)从去年底的约90亿美元增长到今年5月的440亿美元,12个月内激增350亿。

更重要的是算力布局:Colossus 1(与 SpaceX 合作,22万张 GPU,300MW)、5GW 与 Amazon、5GW 与 Google/Broadcom、300亿美元 Azure 容量、500亿美元与 Fluidstack。这些合同叠加起来,Claude Code 背后的算力几乎可以说是无限供给。

Claude Code 和 Cowork 已被 Daniela Amodei 定位为企业级的“AI 操作系统”。年付费超百万美元的企业客户数量在两个月内从500家翻倍至1000多家,PwC、Blackstone、Goldman Sachs 均已全面采用。

与 OpenAI 相比,两家走了不同的路径:OpenAI 走的是消费端入口+移动端延伸路线,Anthropic 则专注于企业级基础设施。谁的路线更正确,今年下半年将见分晓。