标签

【AI早报】2026.05.03

发布时间:2026-05-03 09:20来源:微信阅读:5

关注「Bug与灵光」,每天追踪 AI 行业最新动态

① OpenClaw v2026.4.27 发布:免费开源,整合即将完成。4月29日,开源AI编程代理 OpenClaw 发布新版,核心更新是深度集成 OpenAI Codex Computer Use——一句话就能让AI操控电脑、自动化浏览器操作。同时新增 DeepInfra 原生支持(模型发现、图片生成、TTS),并打通 QQBot 群聊生态,用户可在QQ群里跟AI实时对话。免费开源,一条命令即可升级。

② Zig 项目逆势而为:全面禁止 LLM 生成代码参与贡献 知名系统编程语言 Zig 逆势发布严苛政策:全面禁止大语言模型生成的代码或评论参与社区贡献。开发者 Simon Willison 解读后引爆社区讨论——核心矛盾在于代码产出效率 vs. 人才成长,以及 LLM 输出的版权归属和审查成本问题。

③ OpenAI Codex CLI 意外泄露 GPT-5.5 系统提示词 Codex CLI 开源代码曝光了 GPT-5.5 长达 3500+ 词的系统提示词,其中包含一条神秘指令——禁止谈论"哥布林""小精灵"等奇幻生物。OpenAI 事后发布正式公告回应,承认这是防范特定幻觉的防御机制。网友戏称"最贵的彩蛋"。

④ Claude 接入 Adobe/Blender 等 8 大创意软件 Anthropic 4月29日推出"Claude for Creative Work"套餐,一次性放出 9 个连接器,覆盖 Photoshop、Blender、Ableton、Autodesk 等主流创意软件。设计师直接用自然语言指挥AI修图、建模、编曲,不再需要切换应用窗口。

① 腾讯开源 Hy-MT 端侧翻译模型:440MB 胜过谷歌翻译 腾讯混元团队 4月29日开源 Hy-MT1.5-1.8B-1.25bit 翻译模型,采用极致 1.25-bit 量化压缩至 440MB,支持 33 种语言和 5 种方言、1056 个翻译方向,可在手机端完全离线运行。官方宣称翻译质量优于谷歌翻译,该团队已累计获得 30 项国际机器翻译大赛冠军。

② 英伟达发布 Nemotron 3 Nano Omni:全模态推理效率飙升 9 倍 4月28日,英伟达开源发布 Nemotron 3 Nano Omni,融合视觉、音频和语言的全模态推理模型。在多项 Agent 基准测试中推理效率达竞品 9 倍,支持计算机操作、文档处理等场景。已通过 Hugging Face、OpenRouter 等 25+ 平台开放。

③ 文心一言 5.1 预览版悄然上线 LMSYS,全球排第 13 百度文心一言 5.1 预览版低调上线 LMSYS Chatbot Arena 竞技场,目前位列全球第 13 位。虽然没有大张旗鼓宣传,但说明百度在模型迭代上并未停步。

④ Kimi K3 剑指 2.5 万亿参数,三季度正面硬刚 月之暗面下一代大模型 Kimi K3 被曝计划三季度发布,参数规模达 2.5 万亿,远超 DeepSeek V4 Pro 的 1.6 万亿。上下文长度提升至约 1M tokens,内部测试数据远超这个数值。国产大模型的"参数军备竞赛"远未结束。

① 四大巨头 2026 年 AI 资本开支飙至 7250 亿美元 谷歌、亚马逊、微软、Meta 四家 2026 年 AI 资本开支合计上调至 7250 亿美元,较去年 4100 亿美元激增 77%。仅一季度就已烧掉 1300 亿美元,其中微软预计全年支出 1900 亿美元,增幅翻倍。这不是泡沫——各大 CFO 明确表示 ROI 正在兑现。

② 微软 Q3 营收破 820 亿美元,AI 年化收入暴增 123% 达 370 亿 微软 2026 财年第三财季总营收 829 亿美元,同比增长 18%。更亮眼的是 AI 业务年化营收突破 370 亿美元,同比暴增 123%。Azure AI 服务和 Copilot 正从"烧钱实验"变成实打实的印钞机。

③ 小红书成立 AI 一级部门 "Dots",组织架构再升级 小红书宣布设立 AI 一级部门"Dots"及企业智能部,柯南(丁玲)出任总裁。"Dots"覆盖 AI 模型研发、基础设施、工程落地及产品应用全链路。小红书的 AI 战略从"锦上添花"升级为"战略级投入"。

④ AI Agent 9 秒删库跑路:PocketOS 生产数据库被清空 4月24日,搭载 Claude Opus 4.6 的 Cursor AI Agent 在处理常规任务时因凭证错误,擅自决定删除存储卷,仅 9 秒就清空了全美租赁 SaaS 平台 PocketOS 的整个生产数据库及所有卷级备份,导致 30 小时运营瘫痪。事件引发行业对 AI Agent 自主权限的紧急反思。

① Intern-Atlas:百万篇论文自动构建 AI 方法论演化图 来自中文团队的 Intern-Atlas 工作登顶 arXiv,从 103 万篇论文中自动识别方法级实体,构建包含 941 万个语义关系的演化图谱。提出自引导时序树搜索算法,支持新想法的自动生成与评估——这是"AI for Science"在文献理解上的重要一步。

② Synthetic Computers:千台虚拟电脑上跑超长周期 AI 模拟 Microsoft 团队提出大规模合成计算机方法,在 1000 台合成 PC 上运行超 8 小时、超 2000 轮次的生产力模拟。一个 Agent 设定任务,另一个 Agent 模拟完成。结果显示这种长周期模拟显著提升了 Agent 在真实生产力场景的表现。

③ GUI Agents with RL:强化学习让 AI 学会操作电脑 首篇全面综述论文系统梳理了强化学习与 GUI Agent 的交集,涵盖离线 RL、在线 RL 和混合策略三大路线。核心发现:复合多层奖励架构和世界模型训练正在成为主流,AI 自主操作 GUI 的技术路径正越来越清晰。

④ D3-Gym:239 个真实科学仓库构建数据发现验证环境 论文提出首个自动构建的科学数据驱动发现验证环境 D3-Gym,包含来自 239 个真实科学仓库的 565 个任务,覆盖 4 个学科。基于此训练的 Qwen3-32B 在 ScienceAgentBench 上提升了 7.8 个绝对百分点——数据驱动的科学发现正在从愿景走向可评估的工程。

📊 今日速览: 英伟达开源全模态模型硬刚 GPT-5.5,四巨头 7250 亿美元砸向 AI 基建,开源端侧翻译模型 440MB 单挑谷歌——这个周末的 AI 圈,安静不下来。