标签

AI内参:OpenAI融资1220亿,白宫拟审查,Mythos引安全震荡

发布时间:2026-05-06 06:40来源:微信阅读:5

OpenAI 于2026年3月31日正式敲定并完成一轮高达$1220亿的融资,投后估值随之升至$8520亿。就规模而言,这堪称科技史罕见的超大体量私募融资,几乎也接近资本市场历史上的最大交易纪录。

此次融资由三家科技巨头进行锚定支持:Amazon 承诺投入 $500亿,NVIDIA 与 SoftBank 则分别出资 $300亿。除上述主体外,Altimeter、Appaloosa LP、ARK Invest、BlackRock 附属基金、Blackstone、Coatue、D1 Capital Partners、Dragoneer、Fidelity、Insight Partners、Sequoia Capital、Temasek、Thrive Capital 等同样加入其中。另值得关注的是,OpenAI 首次通过银行体系向个人投资者开放参与,借此募集资金超过$30亿。

从经营表现看,OpenAI 当前月收入已达到$20亿,较2024年底时“每季度$10亿”的水平实现了明显跃升(按月口径对应增幅显著)。其中企业收入占比为40%(2025年约30%),公司预计到2026年底将把消费者与企业两端的收入结构拉回到相对均衡。用户规模方面,ChatGPT 周活跃用户超过9亿,付费用户超过5000万。Sam Altman 也将这轮融资类比为历史上电力、高速公路与互联网基础设施建设的意义。

4月21日,OpenAI 正式发布 ChatGPT Images 2.0(模型代号 gpt-image-2)。该版本是 OpenAI 首个具备原生推理能力的图像生成模型,意味着AI图像生成正在进入新的发展阶段。

本次关键升级集中在多项能力:一是“思考能力”——模型在出图前会先进行推理,从而改善构图与视觉审美的准确性;二是“Web搜索”——支持联网获取最新信息;三是“多图生成”——同一提示最多可生成8张图像;四是“自我校验”——生成完成后可自动检查输出质量;五是“多语言文本渲染”——对日文、韩文、中文、印地语等非拉丁文字的渲染精度提升明显;此外还实现了4倍速度提升。

TechCrunch 的测试指出,Images 2.0 在生成墨西哥餐厅菜单时,菜品名称几乎难以让人察觉是AI生成。此前AI图像生成在文本部分经常出现编造现象,例如"enchuita"、"churiros"、"burrto"等并不存在的食物名称,但 Images 2.0 基本彻底解决了这类问题。

4月27日,Microsoft 与 OpenAI 宣布签署一项修订后的合作协议,外界普遍认为这意味着双方关系从"下一章"(2025年10月)进一步迈入"下一阶段"。

协议层面的核心变化包括:非独占许可——微软对 OpenAI IP 的许可从此前“事实上独占”调整为非独占,使得 OpenAI 能向更多云服务商提供相关服务;营收上限机制——OpenAI 获得对其向微软支付分成收入设置上限的权利;云服务灵活性——OpenAI 未来可在任意云服务商上为客户提供支持,不再被 Azure 独家绑定。

市场将这次调整视为 OpenAI 提升商业独立性的关键一步,尤其发生在其IPO临近的时间窗口。回看双方于2025年10月上次重组时,OpenAI 曾承诺在 Azure 上投入 $2500亿。

Hugging Face 发布的《State of Open Source on Hugging Face: Spring 2026》报告,给出了开源AI生态的宏观全景数据:平台规模已覆盖1300万用户,托管模型数量超过200万,数据集总量超过50万。尽管模型总数突破200万,但下载分布高度集中——头部0.01%的模型贡献了全部下载量的一半。

从贡献结构看,NVIDIA 是最大的组织型贡献者;中国开源模型正在快速增长,并逐步为国产芯片生态提供支持。与此同时,机器人领域的数据集被认为是增长最快的类别之一。2025年的标志性开源模型包括 Flux 1.0、DeepSeek-R1、GPT-OSS 和 Kimi K2。

5月4日,《纽约时报》报道称,特朗普政府正考虑在新型AI模型面向公众发布之前,设置政府审查环节。这被认为是特朗普此前“让AI放开发展”的立场出现了明显转向。

白宫方面正在讨论一项行政令,计划组建由科技公司高管与政府官员共同参与的AI工作组,以评估潜在审查路径。方案设想包括对新AI模型建立正式的政府审核流程。此次转变的直接导火索与 Anthropic 的 Mythos 模型有关:多名网络安全专家警告称,该模型的能力可能被恶意滥用。

不过,也有部分科技公司高管担心监管过度会削弱美国相对中国的创新优势。

进入2026年4月,Anthropic 发布了Claude Mythos Preview,但拒绝向公众开放。其理由非常直接:模型过于强大,存在被用于网络攻击的重大风险。

Mythos 能够自主发现并利用操作系统与浏览器中的零日漏洞。Anthropic 展示的 Mythos Preview 结果表明,在无需人类协助的情况下,模型成功定位并利用了 FreeBSD 内核中一项存在了17年的远程代码执行漏洞,进而自动获得 root 权限;类似地,它也成功突破了 OpenBSD 的内核安全防线。

在共享策略上,Anthropic 并未让 Mythos 面向更广泛的公众,而是仅提供给 Project Glasswing 联盟的约40家科技与金融机构,包括 Apple、Amazon、Microsoft、Google、JP Morgan 和 Goldman Sachs 等,目的在于帮助其发现并修补关键软件中的安全漏洞。Mythos 的出现也引发白宫内部出现“与 Anthropic 缓和关系”的讨论声音。

随着$1220亿 融资的顺利完成,以及与微软合作关系的重新梳理,OpenAI 的上市路径逐步变得更为清晰。关键经营数据包括:ChatGPT 9亿周活跃用户、5000万付费用户、月收入$20亿(年化约 $240亿),同时企业收入占比达到40%。

尽管有消息指出 CFO Sarah Friar 曾在内部警告2026年底的IPO时间表“过于激进”,但 Morningstar 的研判认为IPO窗口已将原本的2026 Q4推迟到2027年中后期。公司正为其可能在2027年启动、且估值或达到$1万亿的IPO进行预案铺垫。

论文链接:arXiv:2506.14755 · Hugging Face Papers

研究背景:大型推理模型(LRMs)如 o1、DeepSeek-R1 等虽然整体表现出色,但仍存在一个突出缺陷——过度思考。很多情况下,模型在已经形成正确答案之后仍反复核查推理过程,导致输出变得冗长、推理链条不必要,从而既抬高计算成本,也降低用户体验。

核心方案:LC-R1 基于 GRPO 进行后训练。在奖励设计上更具创新性:它引入两类奖励机制——长度奖励(用于引导输出更简洁)与压缩奖励(专门惩罚推理过程中“无效思考”的部分)。整体思路由 Brevity(简洁性)和 Sufficiency(充分性)两项原则共同牵引。

关键指标显示,在多个推理基准上,模型的序列长度可实现约50%的缩减;与此同时准确率仅下降约2%。这使得方法在效率与效果之间的帕累托前沿上取得了相对理想的平衡。

意义在于:该研究揭示了当下大推理模型中能力浪费的真实来源——多数“思考”其实并非必须。若将类似技术落实到真实部署场景,推理成本有望接近降低近一半。

论文链接:arXiv:2506.21539 · Hugging Face Papers

研究背景:目前许多视觉-语言-动作(VLA)模型与世界模型(World Model)往往采取分离式研发路线。VLA 侧重理解当前视觉输入并生成动作,但缺乏对物理世界的预测能力;世界模型则擅长预测未来帧,却无法直接产生活动指令。二者割裂限制了机器人、自动驾驶等具身智能任务的端到端表现。

核心方案:WorldVLA 提出一种自回归动作世界模型框架,首次把 VLA 与世界模型统一到同一套模型架构中。在世界模型部分,系统通过当前动作来预测未来图像,从而学习物理世界的底层规律;在动作模型部分,模型根据图像观测生成后续动作。与此同时,注意力掩码策略带来模块间的相互增强,让视觉理解与物理预测形成更紧密的协同。

关键发现:实验表明,WorldVLA 在动作预测与未来帧生成这两项任务上,都能超过单独训练的动作模型与世界模型,进一步证明视觉理解与物理预测之间存在相互促进的效应。

论文链接:Hugging Face Papers 热门

在海洋科学领域,基础模型训练长期受制于数据稀缺。OceanPile 是一个面向海洋的大规模多模态语料库,它将卫星影像、海洋传感器数据、科学文献、海洋生物观测等多类数据源进行整合,为海洋方向的基础模型训练提供了更系统的数据基础设施。这也被视为 AI for Science 在海洋场景的一项标志性进展。

论文链接:Hugging Face Papers

研究背景:大语言模型具备令人惊叹的上下文学习能力,但更深一层的问题在于:模型到底是从上下文中真正学会了技能,还是仅完成了模仿与模式匹配?

核心发现:实验结果显示,当前语言模型在“从上下文学到技能并实现迁移”这一能力上仍存在明显短板。它们更擅长从上下文提取表层模式,却难以把更深层的推理策略抽象出来并迁移到全新场景;这与人类“举一反三”的学习能力形成鲜明对照。

意义:这篇论文触及了当前LLM能力的关键争议——模型究竟是否具备真正理解,还是只是极强的模式匹配引擎。对于希望在 Agent 场景中落地LLM的开发者而言,弄清这种局限性尤为重要。

标签:#AI日报#OpenAI#ChatGPTImages2#Microsoft#Anthropic#Mythos#白宫AI监管#HuggingFace#开源生态#LC-R1#WorldVLA#OceanPile