AI双雄同日对决:OpenAI与Anthropic走向分岔路
人工智能领域迎来了一场巅峰对决:
OpenAI 推出 Codex 重大升级,Anthropic 发布 Claude Opus 4.7
两大重磅产品同日亮相,如此戏剧性的场面,堪称罕见。
先来看看 OpenAI 的这次动作。
他们将 Codex 打造成了真正的 AI 协作伙伴——不仅辅助编写代码,更能操控整台计算机。
Codex 新增了后台计算机操控(Background Computer Use)能力。
简单来说:它能像人类一样,查看屏幕、移动光标、点击按键、输入文字。
这代表着什么?
多个 AI 智能体可在你的 Mac 上同步运行,彼此独立。你专注编码,它负责测试,双管齐下,效能倍增。
Codex 现已整合 GPT-Image-1.5,支持对话中直接生成图像。
结合截图与代码,制作产品概念图、UI 设计稿、游戏原型——单窗口即可完成。
无需再跳转至 Midjourney 或 DALL-E 生成图片后复制粘贴,一站式搞定。
本次最亮眼的功能前瞻:记忆能力(Memory)。
Codex 如今能够记住:
再次启动任务时,无需重复交代背景。宛如与资深同事配合,而非每次都从零起步。
更厉害的是:它能自动安排日程。
下班前你交代任务:"明早运行测试,检查错误",它会在设定时间自动执行,次日早晨向你汇报结果。
这才是名副其实的 24 小时 AI 助手。
开发者欢呼时刻来临 👇
Codex 新增 90 余款插件,涵盖:
个人体会:Superpowers 插件可直接在 Codex 中调用,意味着原有工作流能平滑迁移——令人震撼。
新版 Codex 的编程体验显著优化:
如果说 Codex 致力于"拓展广度",那么 Claude Opus 4.7 则专注于"挖掘深度"。
Anthropic 将 Opus 4.7 塑造为专业领域的顶尖帮手——代码编写、视觉处理、金融分析,无所不能。
先睹为快官方性能对比👇
核心亮点:Opus 4.7 面对越复杂的任务表现越出色——这才是硬实力的证明。
用户的真实评价:
⚠️温馨提示:由于其高度服从性,过往为旧模型撰写的提示词可能需要调整——它会严格按字面执行指令。
适用场景:
在金融分析领域,Opus 4.7 不仅基准测试领先,实战表现同样稳健👇
官方多领域测试数据显示,Opus 4.7 全方位占优。
实战效果:
同时在GDPval-AA(第三方经济知识评测)中斩获顶级成绩,横跨金融、法律等诸多领域。
Opus 4.7 现已支持记忆文件系统中的关键笔记,实现跨会话协作。
这与 Codex 的记忆功能不谋而合——可见"记忆能力"已成为今年 AI 的必备特性。
此次另有重磅升级:Opus 4.7 集成网络安全防御机制。
可自动识别并阻断高危网络攻击请求。
安全研究人员可申请加入 Cyber Verification Program。
安全团队对 Opus 4.7 的评估为:"对齐度良好,值得信赖"。
如图所示,Opus 4.7 的违规评分较 Opus 4.6 和 Sonnet 4.6 均有改进。
利好消息:Opus 4.7 售价与 Opus 4.6 完全一致
现已登陆全部 Claude 产品及主流云平台:Anthropic API、Amazon Bedrock、Google Cloud Vertex AI、Microsoft Foundry。
官方同时发布了效率对比图表👇
该图呈现了不同投入级别下,Opus 4.7 相较 Opus 4.6 的效率与产出优化——性能更强,性价比更高。
昨日的更新中,两家公司选择了迥异的路径:
个人观点:
AI 竞赛仍在持续升温。
你更青睐哪一方?欢迎留言讨论 👇
参考资料