AI快报4月9日:GPT-6将至,Sora退场,中国模型Token用量持续领先
整理内容:涵盖模型发布与架构演进、开发工具和框架更新、产品落地应用、技术研究动态、行业战略与资本变化、社区生态观察等重点方向。
今天最重磅的消息是:OpenAI已正式宣布GPT-6即将到来,同时停止运营每年烧掉50亿美元的Sora。与此同时,中国AI模型在全球Token消耗量上已连续五周大幅领先美国——而其中47%的使用者竟然来自美国开发者。另一边,Anthropic从微软挖来了Azure AI负责人Eric Boyd,基础设施竞赛正迅速升温。
OpenAI正式确认,内部代号Spud的GPT-6即将推出,预训练工作已在得州Stargate数据中心完成。其核心升级是采用全新的"Symphony"架构,首次实现文本、图像、音频、视频的原生统一处理;上下文窗口扩大到200万token,编码与推理能力相比GPT-5.4提升超过40%。而在同一天,Sora也被正式关停——其年运行成本超过50亿美元,但总收入只有210万美元,30天留存率仅1%。这并非技术层面的失败,而是商业方向的再调整:面向C端的炫技产品让位于面向B端的生产力工具。OpenAI计划在2026年Q4上市,目前估值达到8520亿美元。
参考链接:
🔗 钛媒体
OpenRouter最新数据显示:3月30日至4月5日,中国AI大模型一周调用量达到12.96万亿Token,连续第五周超过美国(美国仅3.03万亿,不到中国的四分之一)。调用量排名前六全部为中国模型——千问、MiMo、阶跃星辰、DeepSeek、MiniMax。更具反差的是,47%的使用者来自美国,而中国仅占6%。背后的原因很简单:价格低。MiniMax M2.5输入价格为每百万Token 0.3美元,而Claude Opus高达5美元,同样任务的成本差距接近10倍。硅谷开发者实测后发现,月账单可从2500美元降到200美元。再叠加中国西部绿电0.2元/度以及MoE架构"按需激活"的优势,这种结构性成本红利短期内几乎无解。
参考链接:
🔗 钛媒体
Meta超级智能实验室(MSL)推出首个模型Muse Spark,这是Scale AI创始人汪韬以143亿美元加盟Meta后,从零重建团队交出的首份成果。其关键创新在于"思维压缩":在强化学习阶段惩罚过度推理,促使模型以更少token完成问题求解,在同等性能下所需计算量降低10倍以上。发布当天,Meta股价盘中涨幅超过10%。不过Francois Chollet直言,这款产品"看起来已经令人失望"——因为它在公开benchmark上优化过度,牺牲了其他能力。Epoch AI评测显示:其在FrontierMath Tier 1-3中得分39%,但Tier 4仅有15%。
参考链接:
🔗 钛媒体 / X(@hwchung27, @fchollet)
Agent框架Hermes Agent上线还不到两个月,GitHub Star已突破3.5万,OpenRouter单日Token使用量也在不断刷新纪录。它与OpenClaw最大的区别在于架构理念:OpenClaw以Gateway为核心进行连接与编排,而Hermes则强调"闭环学习循环"——Agent在完成任务后会自动生成结构化技能文件,下次可直接加载复用。根据用户实测,连续使用一个月后,同类任务的工具调用次数可从20多次压缩到8至10次。部分开发者已经开始重新审视框架选型。
参考链接:
🔗 钛媒体
《生化危机》女主角Milla Jovovich与工程师合作,借助Claude开发出开源AI记忆系统MemPalace。在LongMemEval长期记忆基准测试中,它以500题全对拿下满分,成为全球首个做到这一点的系统。该方案借鉴古希腊"记忆宫殿"方法,把对话数据组织为翼楼→房间→走廊→隧道→抽屉的分层结构,使结构化检索召回率从60.9%跃升至94.8%。所有数据都保存在本地ChromaDB中,一年成本仅0.7美元。目前GitHub已获得17.9k星。
参考链接:
🔗 36氪
Cursor宣布支持在任意设备上运行,并可从任何地点进行远程控制,甚至能用手机启动Agent,让其在开发机上执行任务。这意味着你在通勤地铁上,也能通过手机指挥Cursor在公司devbox中写代码、跑测试。本地IDE与云端开发之间的界限因此进一步被打破,也使其与GitHub Codespaces、Gitpod形成更直接竞争。但Cursor的差异化同样明确:AI-native并非后期补上的能力,而是其原生基因。
参考链接:
🔗 X(@HamelHusain)
前微软企业副总裁Eric Boyd已正式加入Anthropic,出任基础设施负责人。Boyd此前在微软管理着1500人的团队,负责整个Copilot Stack底层AI平台。其背景是:Claude Code用户暴增,已多次引发稳定性危机,而Anthropic计划投入500亿美元建设美国AI数据中心。一个颇有意味的细节是,Boyd在微软期间恰好负责过托管Claude的Azure基础设施,从甲方到乙方,磨合成本几乎可以忽略。这释放出非常清晰的信号:AI竞争的焦点,正从模型创新逐渐转向基础设施规模化的工程战。
参考链接:
🔗 钛媒体
在2024年下半年还被视作处于"ICU"状态的智谱、月之暗面(Kimi)和MiniMax,仅一年后就集体完成翻盘。智谱2025年营收达到7.24亿元,同比增长132%,MaaS平台ARR升至17亿元,12个月暴涨60倍;Kimi K2.5发布仅一个月,ARR便突破1亿美元,估值也在三个月内从43亿飙升至180亿美元;MiniMax M2.5在SWE-Bench取得80.2%的成绩,而价格仅为Claude Opus的十分之一。背后的核心推动力是OpenClaw爆发——全球AI Token消耗已从每周5.6万亿暴增到14.8万亿,这三家则成了最大的"燃料供应商"。
参考链接:
🔗 钛媒体
Anthropic发布Claude Managed Agents——这不是一款新模型,而是一套fully managed agent harness。此前企业往往需要6到12个月自建的基础设施,现在已可以按小时付费直接使用。最先被冲击的三类公司包括:API中转商(价值几乎归零)、通用Agent编排平台(StackAI、E2B、Dify.ai等核心卖点被官方覆盖)、缺少差异化的编排框架(LangChain、CrewAI从必需品变成可选项)。真正还有生存空间的,只剩做垂直闭环的公司:既有场景、又有数据、还能交付结果。LangChain创始人Harrison Chase评论称,这"本质上就是Letta一年前API闭源版的翻版",Agent记忆归属权之争也因此再次升温。
参考链接:
🔗 钛媒体 / X(@hwchase17)
阿里通过内部信对AI业务进行了大规模调整。周靖人卸任阿里云CTO,由李飞飞(数据库方向,并非斯坦福AI教母)接任;通义实验室则升级为通义大模型事业部,继续由周靖人全权负责。集团层面同时成立技术委员会:吴泳铭任组长,周靖人担任首席AI架构师,李飞飞负责AI云基础设施,吴泽明负责AI推理平台。这是继ATH事业群成立、林俊旸离职风波之后,阿里再次进行的重要权力重组,通义团队的组织方式也正进一步向字节Seed模式靠拢。
参考链接:
🔗 36氪
地瓜机器人(原地平线AIoT部门)在40天内连续完成B1和B2两轮融资,总额达到2.7亿美元。投资方阵容十分豪华,包括沙特阿美旗下Prosperity7、远景科技、滴滴、美团龙珠、高瓴、五源和淡马锡。公司的定位非常明确:不做机器人整机,而是提供覆盖5~500 TOPS全算力区间的芯片、操作系统与开发平台。2025年其出货量同比增长180%,全球开发者数量突破10万。核心逻辑也很直接——无论未来是谁打造出爆款机器人,都离不开底层计算平台。它想成为机器人行业的英伟达。
参考链接:
🔗 钛媒体
新论文"The Defense Trilemma"提出了一个颇为扎心的框架:在prompt注入防御中,安全性、功能性和效率之间存在根本性的权衡,三者无法同时兼得。想要更安全,就必须牺牲部分功能或速度;想保留完整功能,就得放宽安全边界。这也解释了为什么市面上的各种防护方案总会顾此失彼。对于所有在生产环境中部署LLM应用的开发者而言,这篇论文给出的结论非常实际:不要幻想存在一套一劳永逸的防御体系,必须根据具体场景做取舍。
参考链接:
🔗 arxiv.org/abs/2604.06436
微软研究员Sebastien Bubeck转发了一篇重磅论文:数学家Vishesh Jain与Clayton Mizgerd借助GPT-5.4 Pro,在Markov链理论中证明了一个"striking result"。这成为LLM参与严肃数学证明的又一个重要里程碑——继此前Terence Tao团队的相关工作之后,AI辅助数学研究正从"辅助计算"逐步走向"辅助证明"。
参考链接:
🔗 X(@SebastienBubeck)
"同事.skill"在社交平台上迅速走红——只要提供离职同事的飞书消息、钉钉文档和邮件,就能把TA"炼成"AI Skill。奇安信报告显示,全球四大主流平台上的Skills总量已逼近75万个,且每天新增2.1万个。腾讯、字节、阿里、百度都在争夺Skill分发入口。变现路径主要有三种:嵌入产品订阅(已有月入六位数案例)、免费引流后转化、企业垂直定制。真正的护城河并不是代码,而是行业知识——Top 100热门Skills拿走了超过50%的总安装量,幂律分布依旧残酷。
参考链接:
🔗 钛媒体
一种新型攻击方式Slopsquatting正在浮出水面:LLM幻觉生成并不存在的包名→攻击者抢先注册这些"幻觉包名"→Agent自动安装时中招。首个野外恶意MCP Server已经出现在npm上,并伪装成Postmark邮件服务。同一天,HuggingFace CEO Clement Delangue也发出警告:未来几个月最容易被忽视的安全风险,将来自那些被广泛依赖、却严重缺少维护者的开源项目。进入Agent时代后,供应链安全问题比传统开发更严峻——因为做决策的已经不再是人,而是模型,也就少了人工目视检查这一道关口。
参考链接:
🔗 nesbitt.io / X(@ClementDelangue)