AI 今日要闻 | 2026年4月17日:OpenAI Codex 掌控桌面,Claude Opus 4.7 编码性能涨13%

发布时间：2026-04-17 09:00阅读：13

每日精选 AI 圈大事，帮你省时间、抓重点、跟趋势。

朋友们，早啊！昨天到今天 AI 圈又热闹起来了——OpenAI 深夜放大招、Anthropic 祭出 Claude Opus 4.7、阿里通义千问在开源模型上再下一城，连机器人圈都传来好消息。话不多说，我们一起来看看这 24 小时发生了什么。

要说昨天最劲爆的新闻，OpenAI 和 Anthropic 几乎同时出手，火药味十足。

OpenAI 深夜发布 Codex 重大更新，直接把手伸向了你的整个桌面。简单来说，Codex 不再只是一个帮你写代码的工具了——它现在能控制你的电脑，看到屏幕上的内容、点击按钮、输入文字，而且还能同时运行多个 AI 代理帮你干活，彼此之间不打架。

更夸张的是，它还支持记忆功能，能记住你的个人偏好和工作习惯，下次再帮你时效率更高。这次还一口气上线了 90+ 插件，打通了 Jira、GitHub、Slack、Gmail 等一整套工具链。

有开发者感慨：以前要花一天干的事，现在可能喝杯咖啡就搞定了 😄

同一天，Anthropic 推出 Claude Opus 4.7，定位也是"最强编程模型"。根据官方数据，Opus 4.7 在复杂编码任务上的表现比上一代提升了 13%，甚至能独立解决一些 Opus 4.6 完全无解的难题。

更重要的是，它在长程自主工作上有了质的飞跃，已经有多家平台（Devin、Replit、Cursor 等）把它作为默认主力模型。这次 Opus 4.7 还专门配备了网络安全护栏，算是 Anthropic 在模型安全上的一次主动尝试。

阿里通义千问也没闲着，Qwen3.6-35B-A3B 一经发布就在 Hacker News 冲上 798 分。有开发者实测，在自己的笔记本电脑上跑这个模型，画出的漫画比 Claude Opus 4.7 还要好——考虑到这是一个 35B 参数的开源模型，这个成绩相当抢眼。

开源社区正在用脚投票：谁说本地模型一定比闭源旗舰弱？

大模型打得热闹，落地应用也没闲着。

Google 推出 AI Mode 增强版，现在你可以边浏览网页边和 AI 对话，两者并排显示，AI 能直接读取页面内容并与你实时讨论。这对需要边看文档边做研究的人来说非常实用。

Canva 的 AI 助手升级了，现在具备调用多种工具的能力——不只是生成图片，而是能自主调用设计工具、搜索素材、调整版式，真正像个设计助手一样完成多步骤任务。

有设计师调侃：以后可能不是"用 Canva 做设计"，而是"让 Canva 的 AI 帮你做设计"。

翻译工具 DeepL 正式进军语音领域，正在开发语音同声翻译功能，支持面对面实时对话翻译。如果成真，它将直接挑战 Zoom、Google Meet 内置翻译功能的市场。

Runway CEO 则抛出一个大胆观点：AI 将帮助好莱坞用同样预算拍 50 部电影而不是一部 1 亿美元的巨制。虽然这个数字有些理想化，但 AI 生成视频、辅助剪辑已经在悄悄改变内容产业的成本结构，这个趋势值得关注。

如果上面那些是"前台表演"，那基础设施层面的更新就是"后台革命"。

Cloudflare 昨天发布了两条重要消息：

这两招一出，Cloudflare 在 AI 基础设施赛道的位置越来越清晰了。

另一家值得关注的公司是 Upscale AI，据报道正在以20亿美元估值洽谈新一轮融资。这也是近期融资环境收紧背景下，少有的大额 AI 早期融资案。

InsightFinder 则拿到了 1500 万美元融资，专注解决企业用 AI Agent 时的"黑盒问题"——AI 做了啥、错在哪，企业往往一无所知。这个方向的工具类需求正在快速增长。

最后来聊一个有点科幻味道的进展。

Physical Intelligence（一家专注于机器人"大脑"的创业公司）昨天发布新技术，声称他们的机器人能自主学会从未被专门训练过的任务——你只需要给它一个目标，它就能自己摸索出完成方法。

这听起来像是给机器人装了一个"通用学习能力"，而非传统的"一个技能一个模型"模式。

如果这项技术成熟，影响将是深远的：

当然，距离真正落地还有距离，但这个方向让人看到了机器人 AI 的另一种可能性。

好啦，以上就是今天的 AI 日报。总结一下：

如果你觉得这些内容对你有帮助，别忘了点个赞、点个在看，让我知道你还想看到类似内容。有什么想深入聊的话题，欢迎留言告诉我～

明天见！☕