AI 今日要闻 | 2026年4月17日:OpenAI Codex 掌控桌面,Claude Opus 4.7 编码性能涨13%
每日精选 AI 圈大事,帮你省时间、抓重点、跟趋势。
朋友们,早啊!昨天到今天 AI 圈又热闹起来了——OpenAI 深夜放大招、Anthropic 祭出 Claude Opus 4.7、阿里通义千问在开源模型上再下一城,连机器人圈都传来好消息。话不多说,我们一起来看看这 24 小时发生了什么。
要说昨天最劲爆的新闻,OpenAI 和 Anthropic 几乎同时出手,火药味十足。
OpenAI 深夜发布 Codex 重大更新,直接把手伸向了你的整个桌面。简单来说,Codex 不再只是一个帮你写代码的工具了——它现在能控制你的电脑,看到屏幕上的内容、点击按钮、输入文字,而且还能同时运行多个 AI 代理帮你干活,彼此之间不打架。
更夸张的是,它还支持记忆功能,能记住你的个人偏好和工作习惯,下次再帮你时效率更高。这次还一口气上线了 90+ 插件,打通了 Jira、GitHub、Slack、Gmail 等一整套工具链。
有开发者感慨:以前要花一天干的事,现在可能喝杯咖啡就搞定了 😄
同一天,Anthropic 推出 Claude Opus 4.7,定位也是"最强编程模型"。根据官方数据,Opus 4.7 在复杂编码任务上的表现比上一代提升了 13%,甚至能独立解决一些 Opus 4.6 完全无解的难题。
更重要的是,它在长程自主工作上有了质的飞跃,已经有多家平台(Devin、Replit、Cursor 等)把它作为默认主力模型。这次 Opus 4.7 还专门配备了网络安全护栏,算是 Anthropic 在模型安全上的一次主动尝试。
阿里通义千问也没闲着,Qwen3.6-35B-A3B 一经发布就在 Hacker News 冲上 798 分。有开发者实测,在自己的笔记本电脑上跑这个模型,画出的漫画比 Claude Opus 4.7 还要好——考虑到这是一个 35B 参数的开源模型,这个成绩相当抢眼。
开源社区正在用脚投票:谁说本地模型一定比闭源旗舰弱?
大模型打得热闹,落地应用也没闲着。
Google 推出 AI Mode 增强版,现在你可以边浏览网页边和 AI 对话,两者并排显示,AI 能直接读取页面内容并与你实时讨论。这对需要边看文档边做研究的人来说非常实用。
Canva 的 AI 助手升级了,现在具备调用多种工具的能力——不只是生成图片,而是能自主调用设计工具、搜索素材、调整版式,真正像个设计助手一样完成多步骤任务。
有设计师调侃:以后可能不是"用 Canva 做设计",而是"让 Canva 的 AI 帮你做设计"。
翻译工具 DeepL 正式进军语音领域,正在开发语音同声翻译功能,支持面对面实时对话翻译。如果成真,它将直接挑战 Zoom、Google Meet 内置翻译功能的市场。
Runway CEO 则抛出一个大胆观点:AI 将帮助好莱坞用同样预算拍 50 部电影而不是一部 1 亿美元的巨制。虽然这个数字有些理想化,但 AI 生成视频、辅助剪辑已经在悄悄改变内容产业的成本结构,这个趋势值得关注。
如果上面那些是"前台表演",那基础设施层面的更新就是"后台革命"。
Cloudflare 昨天发布了两条重要消息:
这两招一出,Cloudflare 在 AI 基础设施赛道的位置越来越清晰了。
另一家值得关注的公司是 Upscale AI,据报道正在以20亿美元估值洽谈新一轮融资。这也是近期融资环境收紧背景下,少有的大额 AI 早期融资案。
InsightFinder 则拿到了 1500 万美元融资,专注解决企业用 AI Agent 时的"黑盒问题"——AI 做了啥、错在哪,企业往往一无所知。这个方向的工具类需求正在快速增长。
最后来聊一个有点科幻味道的进展。
Physical Intelligence(一家专注于机器人"大脑"的创业公司)昨天发布新技术,声称他们的机器人能自主学会从未被专门训练过的任务——你只需要给它一个目标,它就能自己摸索出完成方法。
这听起来像是给机器人装了一个"通用学习能力",而非传统的"一个技能一个模型"模式。
如果这项技术成熟,影响将是深远的:
当然,距离真正落地还有距离,但这个方向让人看到了机器人 AI 的另一种可能性。
好啦,以上就是今天的 AI 日报。总结一下:
如果你觉得这些内容对你有帮助,别忘了点个赞、点个在看,让我知道你还想看到类似内容。有什么想深入聊的话题,欢迎留言告诉我~
明天见!☕