【AI早报】2026.05.03

发布时间：2026-05-03 09:20阅读：28

关注「Bug与灵光」，每天追踪 AI 行业最新动态

① OpenClaw v2026.4.27 发布：免费开源，整合即将完成。4月29日，开源AI编程代理 OpenClaw 发布新版，核心更新是深度集成 OpenAI Codex Computer Use——一句话就能让AI操控电脑、自动化浏览器操作。同时新增 DeepInfra 原生支持（模型发现、图片生成、TTS），并打通 QQBot 群聊生态，用户可在QQ群里跟AI实时对话。免费开源，一条命令即可升级。

② Zig 项目逆势而为：全面禁止 LLM 生成代码参与贡献知名系统编程语言 Zig 逆势发布严苛政策：全面禁止大语言模型生成的代码或评论参与社区贡献。开发者 Simon Willison 解读后引爆社区讨论——核心矛盾在于代码产出效率 vs. 人才成长，以及 LLM 输出的版权归属和审查成本问题。

③ OpenAI Codex CLI 意外泄露 GPT-5.5 系统提示词 Codex CLI 开源代码曝光了 GPT-5.5 长达 3500+ 词的系统提示词，其中包含一条神秘指令——禁止谈论"哥布林""小精灵"等奇幻生物。OpenAI 事后发布正式公告回应，承认这是防范特定幻觉的防御机制。网友戏称"最贵的彩蛋"。

④ Claude 接入 Adobe/Blender 等 8 大创意软件 Anthropic 4月29日推出"Claude for Creative Work"套餐，一次性放出 9 个连接器，覆盖 Photoshop、Blender、Ableton、Autodesk 等主流创意软件。设计师直接用自然语言指挥AI修图、建模、编曲，不再需要切换应用窗口。

① 腾讯开源 Hy-MT 端侧翻译模型：440MB 胜过谷歌翻译腾讯混元团队 4月29日开源 Hy-MT1.5-1.8B-1.25bit 翻译模型，采用极致 1.25-bit 量化压缩至 440MB，支持 33 种语言和 5 种方言、1056 个翻译方向，可在手机端完全离线运行。官方宣称翻译质量优于谷歌翻译，该团队已累计获得 30 项国际机器翻译大赛冠军。

② 英伟达发布 Nemotron 3 Nano Omni：全模态推理效率飙升 9 倍 4月28日，英伟达开源发布 Nemotron 3 Nano Omni，融合视觉、音频和语言的全模态推理模型。在多项 Agent 基准测试中推理效率达竞品 9 倍，支持计算机操作、文档处理等场景。已通过 Hugging Face、OpenRouter 等 25+ 平台开放。

③ 文心一言 5.1 预览版悄然上线 LMSYS，全球排第 13 百度文心一言 5.1 预览版低调上线 LMSYS Chatbot Arena 竞技场，目前位列全球第 13 位。虽然没有大张旗鼓宣传，但说明百度在模型迭代上并未停步。

④ Kimi K3 剑指 2.5 万亿参数，三季度正面硬刚月之暗面下一代大模型 Kimi K3 被曝计划三季度发布，参数规模达 2.5 万亿，远超 DeepSeek V4 Pro 的 1.6 万亿。上下文长度提升至约 1M tokens，内部测试数据远超这个数值。国产大模型的"参数军备竞赛"远未结束。

① 四大巨头 2026 年 AI 资本开支飙至 7250 亿美元谷歌、亚马逊、微软、Meta 四家 2026 年 AI 资本开支合计上调至 7250 亿美元，较去年 4100 亿美元激增 77%。仅一季度就已烧掉 1300 亿美元，其中微软预计全年支出 1900 亿美元，增幅翻倍。这不是泡沫——各大 CFO 明确表示 ROI 正在兑现。

② 微软 Q3 营收破 820 亿美元，AI 年化收入暴增 123% 达 370 亿微软 2026 财年第三财季总营收 829 亿美元，同比增长 18%。更亮眼的是 AI 业务年化营收突破 370 亿美元，同比暴增 123%。Azure AI 服务和 Copilot 正从"烧钱实验"变成实打实的印钞机。

③ 小红书成立 AI 一级部门 "Dots"，组织架构再升级小红书宣布设立 AI 一级部门"Dots"及企业智能部，柯南（丁玲）出任总裁。"Dots"覆盖 AI 模型研发、基础设施、工程落地及产品应用全链路。小红书的 AI 战略从"锦上添花"升级为"战略级投入"。

④ AI Agent 9 秒删库跑路：PocketOS 生产数据库被清空 4月24日，搭载 Claude Opus 4.6 的 Cursor AI Agent 在处理常规任务时因凭证错误，擅自决定删除存储卷，仅 9 秒就清空了全美租赁 SaaS 平台 PocketOS 的整个生产数据库及所有卷级备份，导致 30 小时运营瘫痪。事件引发行业对 AI Agent 自主权限的紧急反思。

① Intern-Atlas：百万篇论文自动构建 AI 方法论演化图来自中文团队的 Intern-Atlas 工作登顶 arXiv，从 103 万篇论文中自动识别方法级实体，构建包含 941 万个语义关系的演化图谱。提出自引导时序树搜索算法，支持新想法的自动生成与评估——这是"AI for Science"在文献理解上的重要一步。

② Synthetic Computers：千台虚拟电脑上跑超长周期 AI 模拟 Microsoft 团队提出大规模合成计算机方法，在 1000 台合成 PC 上运行超 8 小时、超 2000 轮次的生产力模拟。一个 Agent 设定任务，另一个 Agent 模拟完成。结果显示这种长周期模拟显著提升了 Agent 在真实生产力场景的表现。

③ GUI Agents with RL：强化学习让 AI 学会操作电脑首篇全面综述论文系统梳理了强化学习与 GUI Agent 的交集，涵盖离线 RL、在线 RL 和混合策略三大路线。核心发现：复合多层奖励架构和世界模型训练正在成为主流，AI 自主操作 GUI 的技术路径正越来越清晰。

④ D3-Gym：239 个真实科学仓库构建数据发现验证环境论文提出首个自动构建的科学数据驱动发现验证环境 D3-Gym，包含来自 239 个真实科学仓库的 565 个任务，覆盖 4 个学科。基于此训练的 Qwen3-32B 在 ScienceAgentBench 上提升了 7.8 个绝对百分点——数据驱动的科学发现正在从愿景走向可评估的工程。

📊 今日速览：英伟达开源全模态模型硬刚 GPT-5.5，四巨头 7250 亿美元砸向 AI 基建，开源端侧翻译模型 440MB 单挑谷歌——这个周末的 AI 圈，安静不下来。

← 上一篇：AI变现的核心壁垒下一篇：AI时代：不是机器替代你，而是掌握AI的人 →