AI快报4月9日：GPT-6将至，Sora退场，中国模型Token用量持续领先

发布时间：2026-04-10 02:04阅读：13

整理内容：涵盖模型发布与架构演进、开发工具和框架更新、产品落地应用、技术研究动态、行业战略与资本变化、社区生态观察等重点方向。

今天最重磅的消息是：OpenAI已正式宣布GPT-6即将到来，同时停止运营每年烧掉50亿美元的Sora。与此同时，中国AI模型在全球Token消耗量上已连续五周大幅领先美国——而其中47%的使用者竟然来自美国开发者。另一边，Anthropic从微软挖来了Azure AI负责人Eric Boyd，基础设施竞赛正迅速升温。

OpenAI正式确认，内部代号Spud的GPT-6即将推出，预训练工作已在得州Stargate数据中心完成。其核心升级是采用全新的"Symphony"架构，首次实现文本、图像、音频、视频的原生统一处理；上下文窗口扩大到200万token，编码与推理能力相比GPT-5.4提升超过40%。而在同一天，Sora也被正式关停——其年运行成本超过50亿美元，但总收入只有210万美元，30天留存率仅1%。这并非技术层面的失败，而是商业方向的再调整：面向C端的炫技产品让位于面向B端的生产力工具。OpenAI计划在2026年Q4上市，目前估值达到8520亿美元。

参考链接：

🔗 钛媒体

OpenRouter最新数据显示：3月30日至4月5日，中国AI大模型一周调用量达到12.96万亿Token，连续第五周超过美国（美国仅3.03万亿，不到中国的四分之一）。调用量排名前六全部为中国模型——千问、MiMo、阶跃星辰、DeepSeek、MiniMax。更具反差的是，47%的使用者来自美国，而中国仅占6%。背后的原因很简单：价格低。MiniMax M2.5输入价格为每百万Token 0.3美元，而Claude Opus高达5美元，同样任务的成本差距接近10倍。硅谷开发者实测后发现，月账单可从2500美元降到200美元。再叠加中国西部绿电0.2元/度以及MoE架构"按需激活"的优势，这种结构性成本红利短期内几乎无解。

参考链接：

🔗 钛媒体

Meta超级智能实验室（MSL）推出首个模型Muse Spark，这是Scale AI创始人汪韬以143亿美元加盟Meta后，从零重建团队交出的首份成果。其关键创新在于"思维压缩"：在强化学习阶段惩罚过度推理，促使模型以更少token完成问题求解，在同等性能下所需计算量降低10倍以上。发布当天，Meta股价盘中涨幅超过10%。不过Francois Chollet直言，这款产品"看起来已经令人失望"——因为它在公开benchmark上优化过度，牺牲了其他能力。Epoch AI评测显示：其在FrontierMath Tier 1-3中得分39%，但Tier 4仅有15%。

参考链接：

🔗 钛媒体 / X(@hwchung27, @fchollet)

Agent框架Hermes Agent上线还不到两个月，GitHub Star已突破3.5万，OpenRouter单日Token使用量也在不断刷新纪录。它与OpenClaw最大的区别在于架构理念：OpenClaw以Gateway为核心进行连接与编排，而Hermes则强调"闭环学习循环"——Agent在完成任务后会自动生成结构化技能文件，下次可直接加载复用。根据用户实测，连续使用一个月后，同类任务的工具调用次数可从20多次压缩到8至10次。部分开发者已经开始重新审视框架选型。

参考链接：

🔗 钛媒体

《生化危机》女主角Milla Jovovich与工程师合作，借助Claude开发出开源AI记忆系统MemPalace。在LongMemEval长期记忆基准测试中，它以500题全对拿下满分，成为全球首个做到这一点的系统。该方案借鉴古希腊"记忆宫殿"方法，把对话数据组织为翼楼→房间→走廊→隧道→抽屉的分层结构，使结构化检索召回率从60.9%跃升至94.8%。所有数据都保存在本地ChromaDB中，一年成本仅0.7美元。目前GitHub已获得17.9k星。

参考链接：

🔗 36氪

Cursor宣布支持在任意设备上运行，并可从任何地点进行远程控制，甚至能用手机启动Agent，让其在开发机上执行任务。这意味着你在通勤地铁上，也能通过手机指挥Cursor在公司devbox中写代码、跑测试。本地IDE与云端开发之间的界限因此进一步被打破，也使其与GitHub Codespaces、Gitpod形成更直接竞争。但Cursor的差异化同样明确：AI-native并非后期补上的能力，而是其原生基因。

参考链接：

🔗 X(@HamelHusain)

前微软企业副总裁Eric Boyd已正式加入Anthropic，出任基础设施负责人。Boyd此前在微软管理着1500人的团队，负责整个Copilot Stack底层AI平台。其背景是：Claude Code用户暴增，已多次引发稳定性危机，而Anthropic计划投入500亿美元建设美国AI数据中心。一个颇有意味的细节是，Boyd在微软期间恰好负责过托管Claude的Azure基础设施，从甲方到乙方，磨合成本几乎可以忽略。这释放出非常清晰的信号：AI竞争的焦点，正从模型创新逐渐转向基础设施规模化的工程战。

参考链接：

🔗 钛媒体

在2024年下半年还被视作处于"ICU"状态的智谱、月之暗面（Kimi）和MiniMax，仅一年后就集体完成翻盘。智谱2025年营收达到7.24亿元，同比增长132%，MaaS平台ARR升至17亿元，12个月暴涨60倍；Kimi K2.5发布仅一个月，ARR便突破1亿美元，估值也在三个月内从43亿飙升至180亿美元；MiniMax M2.5在SWE-Bench取得80.2%的成绩，而价格仅为Claude Opus的十分之一。背后的核心推动力是OpenClaw爆发——全球AI Token消耗已从每周5.6万亿暴增到14.8万亿，这三家则成了最大的"燃料供应商"。

参考链接：

🔗 钛媒体

Anthropic发布Claude Managed Agents——这不是一款新模型，而是一套fully managed agent harness。此前企业往往需要6到12个月自建的基础设施，现在已可以按小时付费直接使用。最先被冲击的三类公司包括：API中转商（价值几乎归零）、通用Agent编排平台（StackAI、E2B、Dify.ai等核心卖点被官方覆盖）、缺少差异化的编排框架（LangChain、CrewAI从必需品变成可选项）。真正还有生存空间的，只剩做垂直闭环的公司：既有场景、又有数据、还能交付结果。LangChain创始人Harrison Chase评论称，这"本质上就是Letta一年前API闭源版的翻版"，Agent记忆归属权之争也因此再次升温。

参考链接：

🔗 钛媒体 / X(@hwchase17)

阿里通过内部信对AI业务进行了大规模调整。周靖人卸任阿里云CTO，由李飞飞（数据库方向，并非斯坦福AI教母）接任；通义实验室则升级为通义大模型事业部，继续由周靖人全权负责。集团层面同时成立技术委员会：吴泳铭任组长，周靖人担任首席AI架构师，李飞飞负责AI云基础设施，吴泽明负责AI推理平台。这是继ATH事业群成立、林俊旸离职风波之后，阿里再次进行的重要权力重组，通义团队的组织方式也正进一步向字节Seed模式靠拢。

参考链接：

🔗 36氪

地瓜机器人（原地平线AIoT部门）在40天内连续完成B1和B2两轮融资，总额达到2.7亿美元。投资方阵容十分豪华，包括沙特阿美旗下Prosperity7、远景科技、滴滴、美团龙珠、高瓴、五源和淡马锡。公司的定位非常明确：不做机器人整机，而是提供覆盖5~500 TOPS全算力区间的芯片、操作系统与开发平台。2025年其出货量同比增长180%，全球开发者数量突破10万。核心逻辑也很直接——无论未来是谁打造出爆款机器人，都离不开底层计算平台。它想成为机器人行业的英伟达。

参考链接：

🔗 钛媒体

新论文"The Defense Trilemma"提出了一个颇为扎心的框架：在prompt注入防御中，安全性、功能性和效率之间存在根本性的权衡，三者无法同时兼得。想要更安全，就必须牺牲部分功能或速度；想保留完整功能，就得放宽安全边界。这也解释了为什么市面上的各种防护方案总会顾此失彼。对于所有在生产环境中部署LLM应用的开发者而言，这篇论文给出的结论非常实际：不要幻想存在一套一劳永逸的防御体系，必须根据具体场景做取舍。

参考链接：

🔗 arxiv.org/abs/2604.06436

微软研究员Sebastien Bubeck转发了一篇重磅论文：数学家Vishesh Jain与Clayton Mizgerd借助GPT-5.4 Pro，在Markov链理论中证明了一个"striking result"。这成为LLM参与严肃数学证明的又一个重要里程碑——继此前Terence Tao团队的相关工作之后，AI辅助数学研究正从"辅助计算"逐步走向"辅助证明"。

参考链接：

🔗 X(@SebastienBubeck)

"同事.skill"在社交平台上迅速走红——只要提供离职同事的飞书消息、钉钉文档和邮件，就能把TA"炼成"AI Skill。奇安信报告显示，全球四大主流平台上的Skills总量已逼近75万个，且每天新增2.1万个。腾讯、字节、阿里、百度都在争夺Skill分发入口。变现路径主要有三种：嵌入产品订阅（已有月入六位数案例）、免费引流后转化、企业垂直定制。真正的护城河并不是代码，而是行业知识——Top 100热门Skills拿走了超过50%的总安装量，幂律分布依旧残酷。

参考链接：

🔗 钛媒体

一种新型攻击方式Slopsquatting正在浮出水面：LLM幻觉生成并不存在的包名→攻击者抢先注册这些"幻觉包名"→Agent自动安装时中招。首个野外恶意MCP Server已经出现在npm上，并伪装成Postmark邮件服务。同一天，HuggingFace CEO Clement Delangue也发出警告：未来几个月最容易被忽视的安全风险，将来自那些被广泛依赖、却严重缺少维护者的开源项目。进入Agent时代后，供应链安全问题比传统开发更严峻——因为做决策的已经不再是人，而是模型，也就少了人工目视检查这一道关口。

参考链接：

🔗 nesbitt.io / X(@ClementDelangue)

← 上一篇：AI促动师：打通AI能力与人的智慧下一篇：面对AI，不跟上真的可以吗？ →