极AI前沿周报速览

发布时间：2026-04-30 22:52阅读：10

本期周报对 2026 年 04 月 22 日至 04 月 29 日期间 AI 领域的关键变化进行梳理，重点覆盖基础技术的突破、产品与商业层面的动向、跨行业融合的趋势，同时追踪人才与观点，提炼出值得关注的核心信号及其潜在战略含义。

以下内容由北京中关村学院信息智能系统自动汇总生成，仅供参考。

01.

极基础

底层范式与方法论演变

本周总结

本周多项发布释放出一致信号：AI 智能体正在从展示能力走向真正的业务执行落地，模型能力、推理的成本效率以及底层算力都在围绕“可用与可做”同步升级。能力层面——Kimi K2.6 与 GPT‑5.5 都将长程任务执行与工具协作作为重点；OpenAI 也将近期多项改动归纳为“人提出目标、智能体保留并延续上下文、电脑完成端到端执行”的新型协作范式。成本层面——DeepSeek‑V4 将百万 token 量级场景下的推理开销显著压低，使长上下文能力更具规模化部署的经济可行性。算力层面——Google 的第八代 TPU 针对 Agentic AI 的长上下文与复杂顺序推理进行了更明确的架构设计，训练与推理在单位成本上的表现较上一代出现明显提升。

DeepSeek 发布 DeepSeek‑V4 系列预览版：V4‑Pro、V4‑Flash

DeepSeek 推出 DeepSeek‑V4 系列预览版本：V4‑Pro（1.6T 参数、49B 激活）与 V4‑Flash（284B 参数、13B 激活），两者均可支持 100 万 token 上下文。关键增强包含混合注意力架构（CSA+HCA）以提高长上下文效率；引入 mHC 连接机制以强化传统残差连接；并采用 Muon 优化器来推动更快收敛与更高训练稳定性。与 DeepSeek‑V3.2 对比，在 100 万 token 量级下，V4‑Pro 的单 token 推理 FLOPs 约为其 27%，KV cache 约为其 10%。

2026年04月24日

月之暗面发布并开源 Kimi K2.6

月之暗面发布并开源 Kimi K2.6。该模型强调编码能力、长时程执行能力，并提供智能体集群（Agent Swarm）相关能力。在编码表现上，海外主流前端开发与部署平台 Vercel 的 AI 产品负责人指出，K2.6 在其 Next.js（Web 全栈开发框架）评测中相较 K2.5 提升超过 50%；在长程任务能力上，K2.6 完成了一次约 12 小时的本地部署与优化任务，期间实现 4000+ 次工具调用，使推理吞吐从约 15 提升至约 193 tokens/s；在 Agent Swarm 方面，K2.6 将规模从 K2.5 的 100 子代理/1500 步扩展到 300 子代理/4000 步。

OpenAI 发布 GPT-5.5

OpenAI 发布 GPT‑5.5，并将其定位为面向真实工作流的升级模型。其在编码执行、复杂推理以及工具协同方面表现更强：Terminal‑Bench 2.0 达 82.7%、GDPval 达 84.9%、OSWorld‑Verified 达 78.7%。同时，在维持与 GPT‑5.4 相近的每 token 延迟条件下，完成同类任务所需 token 数进一步减少。

2026年04月24日

事件追踪

04月23日 Greg Brockman（OpenAI 联合创始人）表示，OpenAI 近期连续推出多项更新：单看各自有明确用途，但合在一起，更像是在逐步搭建一种新的“人机协作界面”——由人负责提出目标与创意，智能体持续维系所需上下文，电脑则承担具体任务的落地执行。

04月29日 Epoch AI（AI 研究机构）指出，GPT‑5.5 Pro 在 FrontierMath 刷新纪录：Tier 1–3 达 52%、Tier 4 达 40%，并首次解出此前没有模型攻克的 Tier 4 题目中的两道。

Google 发布第八代 TPU：TPU 8t 训练芯片、TPU 8i 推理芯片

Agentic AI 的基础设施需要能够应对长上下文窗口与复杂的顺序逻辑；与此同时，世界模型正成为对“下一序列数据”范式（即通过预测下一个 token 来生成内容）的重要演进方向。Google 表示，第八代 TPU（8t 与 8i）就是为此类挑战而设计，覆盖从训练首个 token 到多轮推理末端的完整链路，用于高效训练与部署，并用于 DeepMind Genie 3 这类世界模型应用。相较第七代 Ironwood TPU，性能提升较为显著：TPU 8t 在大规模训练中实现最高 2.7 倍每美元性能提升；TPU 8i 在低延迟且大规模 MoE 推理中实现约 80% 每美元性能提升；两款芯片的每瓦性能最高均可提升约 2 倍。

2026年04月22日

· · ·

02.

极应用

商业模式与产业方向研判

本周总结

AI 正在完成从“技术变量”向“经济变量”的转换：它开始同时重塑三类关键问题——资本将投向什么、企业如何组织与协作、以及人力投入的结构与规模。过去两年主流叙事集中在技术能力的竞赛，但本周观察到的是，至少三个市场在围绕 AI 进行定价逻辑的重新校准：在资本市场上，模型公司的议价权逐步反超平台方，独家绑定模式的瓦解意味着前沿模型的稀缺性被市场重新定价；在企业侧，AI 编程工具逐渐进入对可靠性要求更高的工程组织，显示工具成熟度已跨过新一轮采纳门槛；在劳动力市场层面，则出现以“AI 辅助后的人效”为基准重排编制的明确信号。

Google 追加投资 Anthropic：总额最高 400 亿美元

据报道，Google 母公司 Alphabet 将向 Anthropic 追加最高 400 亿美元投资。Anthropic 对外披露，本轮安排为：先以 3500 亿美元估值投入 100 亿美元现金；若后续达到约定业绩目标，再追加 300 亿美元。在该投资消息对外发布前几日，Amazon 也宣布将向 Anthropic 投资最高 250 亿美元。

2026年04月25日

OpenAI 与微软修订合作协议：结束长期独家授权

微软仍是 OpenAI 的主要云合作伙伴，OpenAI 产品默认优先在 Azure 上线；不过当微软无法提供或选择不支持所需能力时，OpenAI 允许向其他云平台客户提供相关产品。协议同时明确，微软对 OpenAI 模型与产品的 IP 授权将延续至 2032 年，并由独占调整为非独占；微软不再向 OpenAI 支付收入分成；同时 OpenAI 向微软的收入分成支付将延续至 2030 年，分成比例保持不变，但设定总额上限。微软也将继续以主要股东身份参与 OpenAI 的增长。

2026年04月27日

SpaceX 与 Cursor 达成合作，或将在本年度以 600 亿美元收购 Cursor

SpaceX 宣布与 Cursor 达成合作，双方希望共同打造“世界上最强的 AI 编程与知识工作系统”。SpaceX 表示其获得了在年内以 600 亿美元收购 Cursor 的权利，或在双方合作框架下就合作支付 100 亿美元。

事件追踪

04月23日据报道，Cursor 之前正在洽谈新一轮融资，目标 20 亿美元，估值预计超过 500 亿美元。

Meta 或将启动新一轮裁员：缩减约 10% 员工，取消 6000 个招聘岗位

据报道，Meta 计划裁员约 10%，预计涉及约 8000 名员工。根据周四发给员工的内部备忘录，这轮裁员将于 5 月 20 日启动，同时公司将取消原定对 6000 个空缺岗位的招聘计划。公司表示，在持续加大 AI 投入的同时，将提升运营效率。这轮调整也属于 Meta 近期连续的组织优化：今年 1 月与 3 月 Meta 已进行了多轮裁员（覆盖 Reality Labs、Facebook 以及销售与运营等部门），并表示将降低对第三方外包审核的依赖，转而更多使用 AI 技术。

2026年04月24日

· · ·

03.

极交叉

学科交叉与应用前沿

本周总结

科学智能的版图正在出现分化：通用大模型开始横向进入科研相关场景，专用工具则在纵向深入流程细节。OpenAI 用通用模型切入临床决策，路径偏向“平台能力+制度合规”——并不重新构建专用医疗模型，而是把通用智能适配到专业场景所需的制度要求之中。10x Science 则沿制药流程纵深推进，只聚焦在生成之后的结构表征这一环节，采用更垂直的工具路线。

OpenAI 推出 ChatGPT 临床专业版，向美国医护人员免费开放

OpenAI 正式发布 ChatGPT 临床专业人士版，面向经过验证的美国医师、NP、PA 以及药剂师提供免费开放。该产品基于包括 GPT‑5.4 在内的模型体系，提供可信的临床搜索；支持对符合条件的临床问题检索并可自动计入 CME 学分；同时提供可选的 HIPAA 合规支持。上线前通过医师顾问完成了 6,924 场对话测试，99.6% 的结果被认定为安全且准确；在 HealthBench Professional 基准上，其表现超过了人类医师基线。

2026年04月22日

事件追踪

04月23日 Ethan Mollick（AI 与教育研究者）表示，在真实且困难的临床任务基准中，ChatGPT‑5.4 击败了拥有无限时间与网络访问权限的专科匹配医师；同时他也提示，这一基准由 OpenAI 自行设计。

10x Science 完成 480 万美元种子轮，攻克 AI 制药候选分子验证瓶颈

10x Science 是一家由斯坦福 Bertozzi 实验室三位研究员创立的公司，开发面向生物药候选分子结构表征的 AI 平台。其切入点在于：虽然 AI 能批量生成候选药物，但后续的分子结构表征与质谱分析仍然复杂、耗时，并且高度依赖专业解释。目前公司已完成 480 万美元种子轮融资，由 Initialized Capital 领投、Y Combinator 参与。

2026年04月22日

· · ·

04.

人才动态

人才的动向与观点

本周总结

本周人才板块呈现两条并行的变化趋势：其一，头部大厂的顶级研究员创业正在加速，并持续获得超大规模早期融资，资本对“顶尖人才+前沿路线”的前置押注仍在加强；其二，多位一线人才的观点指向同一种组织层面变化——智能体转型正在倒逼进行更深层次的组织重构：例如在资源配置上，算力投入向后训练侧移动；在执行节奏上，产品迭代被压缩到周级。

AlphaGo 核心创造者 David Silver 创办 Ineffable Intelligence

前 DeepMind 强化学习团队负责人、AlphaGo 与 AlphaZero 核心研究者 David Silver 创办 Ineffable Intelligence。该公司已完成 11 亿美元种子轮融资，估值达到 51 亿美元。公司目标是打造一个“超级学习者”（Superlearner）：让系统能够通过强化学习自行发现知识与技能，而不依赖人类数据；其学习方式是通过试错而非学习人类生成的示例。

2026年04月27日

事件追踪

除去 Ineffable Intelligence 之外，类似“明星研究员创业+超大早期融资”的项目也在持续出现：AMI Labs（由 Yann LeCun 联合创办）上月完成 10.3 亿美元融资，投前估值 35 亿美元；Recursive Superintelligence（由前 DeepMind 科学家 Tim Rocktäschel 联合创办）据称已获得 5 亿至 10 亿美元融资。

OpenAI Sam Altman、Greg Brockman：AGI 时代的产品路线、经济图景与产业布局

OpenAI 联合创始人 Sam Altman 与 Greg Brockman 在 Core Memory Podcast 接受访谈。两人将当前阶段定义为“聊天模型→智能体平台”的转折点：AI 不再停留在问答层面，而要理解个人上下文、接管电脑任务，并在工作与生活中代表用户处理事务。对应地，OpenAI 也在收缩非主干方向（如 Sora），将更多资源投入到智能体基础设施、代码与通用任务执行上；其判断是，未来的竞争不只来自模型本身，还取决于模型之上的记忆、工具、连接器以及工作流系统能力。治理方面，OpenAI 倾向于通过可控、分阶段发布的方式，让社会在持续使用中建立适应能力，而不是长期封闭地提供高能力模型。Sam Altman 进一步提出 AI 时代的经济设想：①高繁荣+高不平等（下限抬升但财富更集中）；②较缓增长+较低不平等；③Brockman 补充认为，若算力与硬件访问权能够更广泛普及，尤其是让下一代普遍拥有使用智能体的能力，社会阶层流动性可能会更大。两人都强调，缓冲分化风险的关键在于低成本普及算力与基础设施。产业层面，他们也认为美国在硬件制造链条存在短板，尤其在机器人与大规模建设能力上落后；破局方向是“AI+机器人”协同演进，以自动化制造来支撑下一代生产力扩张。

2026年04月22日

Anthropic Claude Code 产品负责人 Cat Wu：AI 时代产品经理方法论

Anthropic Claude Code 与 Cowork 产品负责人 Cat Wu 在 Lenny's Podcast 接受访谈。她认为，AI 时代的产品管理已从按季度规划路线图，转向“寻找最快的发布路径”：核心在于持续清障，把“构思→交付”压缩到周级，甚至天级，并通过研究预览等机制先上线、快速收集反馈，再进行迭代。她还补充指出，随着写代码成本持续下降，PM 的核心价值正在转向“产品品味”，也就是决定“做什么”、取舍“先做什么”，并设计通往结果的最佳路径。由此带来的变化是工程、产品与设计边界不断融合，团队需要兼具技术理解与产品判断的复合型人才；组织侧则更依赖高频指标复盘、清晰的团队原则与跨部门快速协同，才能维持速度。她认为，AI 产品也正从“聊天式”迈向“行动式”：模型不仅给建议，还要直接完成任务。要让这一模式真正落地，关键不在于“能不能做”，而在于“能不能稳定做到”——若可靠性只有 95%，仍不够，必须逼近接近 100%。

2026年04月23日

小米大模型负责人罗福莉：Agent 第二幕里的技术赛点与组织重构

MiMo-V2 系列负责人罗福莉在张小珺访谈中，系统讨论了由 Claude Opus 4.6 与 OpenClaw 引发的范式迁移。她的核心判断是：大模型竞争已从 Pre-train 主导的 Chat 时代，转向 Post-train 主导的 Agent 时代；“上一时代的成功不代表下一时代的领先”，目前各家在新范式下大体回到了同一起跑线。在技术路线方面，她提出三点：第一，1T 基座是冲击接近 Opus 4.6 水平的入场券，但不会在 1T 规模停留太久，下一阶段仍需更大规模的 scaling 决策；第二，Agent 的赛点不在单一 Benchmark，而在复杂框架下能否端到端完成高复杂任务，重点在 Agent 上的 RL scaling；第三，OpenClaw 类开源框架的价值不止体现在产品形态上，更在于其通过记忆、调度、技能以及多模型协同，显著抬升中层模型的上限，并把“人机共创数据”转化为后训练增益。

← 上一篇：AI智能体规避授权操作引争议广州法院发出禁令下一篇：智教融合助课堂提升——人工智能示范与教师培训纪实 →