标签

AI早报:Codex并入GPT-5.5,Anthropic试水Agent交易

发布时间:2026-04-27 09:09来源:微信阅读:5

OpenAI 已将独立的 Codex 编码模型下架,并把相关能力直接并入主模型 GPT-5.5;官方称,GPT-5.5 在 agent 编码上更强,同时 token 消耗更低。Codex CLI 仍在持续更新(今晨发布 rust-v0.126.0-alpha.3),但作为单独模型的 Codex 已不再单线迭代。

主线:独立 Codex 模型并入 GPT-5.5,OpenAI 强调“agent 编码更强、token 用量更少”

工具链:Codex CLI 依旧活跃,rust-v0.126.0-alpha.1 到 alpha.3 在 04-24 至 04-26 之间连续三天发布

官方提醒:沿用旧 prompt 方案反而会拖慢 GPT-5.5,开发者应“从零重写” system prompt

https://the-decoder.com/openai-kills-its-dedicated-coding-model-codex-again-folding-it-into-gpt-5-5/

Anthropic 借助真实商品与真金白银搭起一个分类广告市场,让 AI agent 同时扮演买家和卖家完成撮合,这是首个公开的 agent 经济实验。这次实验覆盖了完整的代付与结算链路,监管方和支付机构都在高度关注。

实验设计:agent 在分类广告市场中同时充当买方/卖方,并使用真实资金完成撮合

行业首次:首个公开运行的 agent-on-agent 商业实验

https://techcrunch.com/2026/04/25/anthropic-created-a-test-marketplace-for-agent-on-agent-commerce/

一项针对初级投行任务的 benchmark 让 500 名银行家盲测各主流模型输出,结论是“没有任何一份可以直接交给客户”,核心问题集中在不够准确和数值出错;不过,超过一半受访者会把 AI 结果当作起点来用。

数据规模:500 名分析师,覆盖各家旗舰模型

关键结论:0% 可直接给客户;50%+ 会作为起点参考

主要失分点:数值错误加上不够精确,而不是排版或文风问题

https://the-decoder.com/500-investment-bankers-review-ai-outputs-and-find-none-ready-for-client-delivery/

Anthropic 在 04-24 宣布与 NEC 联手,目标是在日本打造国家级规模最大的 AI 工程师队伍;同一天,Anthropic 还更新了选举安全相关内容。前一周的 04-20,公司又宣布把与 Amazon 的合作扩展到 5 GW 算力。

合作结构:由 NEC 负责本地工程团队,Anthropic 提供模型与工具链

同日双发:NEC 合作 + 选举安全更新

04-20 背景:Amazon 扩展至 5 GW 算力,海外算力布局继续提速

https://www.anthropic.com/news/anthropic-nec

多方消息称,Anthropic 年化收入已达 300 亿美元,超过 OpenAI 的 250 亿美元;估值也升至 3800 亿美元。Google 在 04-24 还宣布向 Anthropic 投资 400 亿美元,其中 60% 通过 TPU 算力投入,锁定 3 年训练产能。

ARR 反超:Anthropic 300B 对 OpenAI 250B;而在 2025 年底,Anthropic 还只有 90B

Google 投资:400 亿美元,60% 以 TPU 算力形式投入,锁定 3 年训练产能

双寡头格局:逐渐形成“微软+OpenAI”与“谷歌+Anthropic”两条主线

https://www.tmtpost.com/agent/ai-article/15132

AI in the AM 系列整理,本期包含四段访谈:Anna Patterson 讨论 Ceramic.ai 转向低成本企业搜索 LLM;Lukas Peterson 解读 GPT-5.5 的 clean 行为模式;模型福利研究的最新进展;以及高效模拟计算的硬件路线。

频道:Cognitive Revolution|⏱ 2:40:40

核心主题:一周 AI 行业要闻汇总 + 4 段独立访谈

嘉宾视角:Anna Patterson(企业搜索)、Lukas Peterson(GPT-5.5 行为)、Cameron Berg(model welfare)、模拟计算研究者

关键观点:GPT-5.5 在内部测试中呈现的“clean”行为模式,可能意味着新一代对齐技术;模型福利研究也已在头部实验室进入工程落地

适合听众:想用一集补齐一周 AI 大事,并听到一线公司视角的从业者

https://www.youtube.com/watch?v=UrG_nF_RuqM

Snap 创始人 Evan Spiegel 讲述了在 Meta 和 TikTok 双面夹击下,如何把 Snapchat 维持到接近 10 亿 MAU;他的核心观点是,分发已经超越产品本身,成为最关键的护城河。访谈还谈到消费社交产品的长期主义、AR 眼镜战略,以及为什么多数 AI 原生应用最终都会撞上分发瓶颈。

频道:Lenny's Podcast|⏱ 1:10:25

核心主题:分发护城河对产品护城河的压倒性优势,以及 AI 原生应用的分发困局

嘉宾视角:Evan Spiegel——在两大巨头夹击下守住消费社交阵地的 CEO

关键观点:AI 原生应用最终都会遇到分发墙,AR 眼镜则是 Snap 下一代分发入口

适合听众:做消费产品,或关注 AI app 商业化路径的人

https://www.youtube.com/watch?v=-7Yol5vX5xw

欢迎关注苍痕LucaB站账号,持续获取每日 AI 视频资讯。