极AI前沿周报速览
本期周报对 2026 年 04 月 22 日至 04 月 29 日期间 AI 领域的关键变化进行梳理,重点覆盖基础技术的突破、产品与商业层面的动向、跨行业融合的趋势,同时追踪人才与观点,提炼出值得关注的核心信号及其潜在战略含义。
以下内容由北京中关村学院信息智能系统自动汇总生成,仅供参考。
01.
极基础
底层范式与方法论演变
本周总结
本周多项发布释放出一致信号:AI 智能体正在从展示能力走向真正的业务执行落地,模型能力、推理的成本效率以及底层算力都在围绕“可用与可做”同步升级。能力层面——Kimi K2.6 与 GPT‑5.5 都将长程任务执行与工具协作作为重点;OpenAI 也将近期多项改动归纳为“人提出目标、智能体保留并延续上下文、电脑完成端到端执行”的新型协作范式。成本层面——DeepSeek‑V4 将百万 token 量级场景下的推理开销显著压低,使长上下文能力更具规模化部署的经济可行性。算力层面——Google 的第八代 TPU 针对 Agentic AI 的长上下文与复杂顺序推理进行了更明确的架构设计,训练与推理在单位成本上的表现较上一代出现明显提升。
DeepSeek 发布 DeepSeek‑V4 系列预览版:V4‑Pro、V4‑Flash
DeepSeek 推出 DeepSeek‑V4 系列预览版本:V4‑Pro(1.6T 参数、49B 激活)与 V4‑Flash(284B 参数、13B 激活),两者均可支持 100 万 token 上下文。关键增强包含混合注意力架构(CSA+HCA)以提高长上下文效率;引入 mHC 连接机制以强化传统残差连接;并采用 Muon 优化器来推动更快收敛与更高训练稳定性。与 DeepSeek‑V3.2 对比,在 100 万 token 量级下,V4‑Pro 的单 token 推理 FLOPs 约为其 27%,KV cache 约为其 10%。
2026年04月24日
月之暗面 发布并开源 Kimi K2.6
月之暗面发布并开源 Kimi K2.6。该模型强调编码能力、长时程执行能力,并提供智能体集群(Agent Swarm)相关能力。在编码表现上,海外主流前端开发与部署平台 Vercel 的 AI 产品负责人指出,K2.6 在其 Next.js(Web 全栈开发框架)评测中相较 K2.5 提升超过 50%;在长程任务能力上,K2.6 完成了一次约 12 小时的本地部署与优化任务,期间实现 4000+ 次工具调用,使推理吞吐从约 15 提升至约 193 tokens/s;在 Agent Swarm 方面,K2.6 将规模从 K2.5 的 100 子代理/1500 步扩展到 300 子代理/4000 步。
OpenAI 发布 GPT-5.5
OpenAI 发布 GPT‑5.5,并将其定位为面向真实工作流的升级模型。其在编码执行、复杂推理以及工具协同方面表现更强:Terminal‑Bench 2.0 达 82.7%、GDPval 达 84.9%、OSWorld‑Verified 达 78.7%。同时,在维持与 GPT‑5.4 相近的每 token 延迟条件下,完成同类任务所需 token 数进一步减少。
2026年04月24日
事件追踪
04月23日 Greg Brockman(OpenAI 联合创始人)表示,OpenAI 近期连续推出多项更新:单看各自有明确用途,但合在一起,更像是在逐步搭建一种新的“人机协作界面”——由人负责提出目标与创意,智能体持续维系所需上下文,电脑则承担具体任务的落地执行。
04月29日 Epoch AI(AI 研究机构)指出,GPT‑5.5 Pro 在 FrontierMath 刷新纪录:Tier 1–3 达 52%、Tier 4 达 40%,并首次解出此前没有模型攻克的 Tier 4 题目中的两道。
Google 发布第八代 TPU:TPU 8t 训练芯片、TPU 8i 推理芯片
Agentic AI 的基础设施需要能够应对长上下文窗口与复杂的顺序逻辑;与此同时,世界模型正成为对“下一序列数据”范式(即通过预测下一个 token 来生成内容)的重要演进方向。Google 表示,第八代 TPU(8t 与 8i)就是为此类挑战而设计,覆盖从训练首个 token 到多轮推理末端的完整链路,用于高效训练与部署,并用于 DeepMind Genie 3 这类世界模型应用。相较第七代 Ironwood TPU,性能提升较为显著:TPU 8t 在大规模训练中实现最高 2.7 倍每美元性能提升;TPU 8i 在低延迟且大规模 MoE 推理中实现约 80% 每美元性能提升;两款芯片的每瓦性能最高均可提升约 2 倍。
2026年04月22日
· · ·
02.
极应用
商业模式与产业方向研判
本周总结
AI 正在完成从“技术变量”向“经济变量”的转换:它开始同时重塑三类关键问题——资本将投向什么、企业如何组织与协作、以及人力投入的结构与规模。过去两年主流叙事集中在技术能力的竞赛,但本周观察到的是,至少三个市场在围绕 AI 进行定价逻辑的重新校准:在资本市场上,模型公司的议价权逐步反超平台方,独家绑定模式的瓦解意味着前沿模型的稀缺性被市场重新定价;在企业侧,AI 编程工具逐渐进入对可靠性要求更高的工程组织,显示工具成熟度已跨过新一轮采纳门槛;在劳动力市场层面,则出现以“AI 辅助后的人效”为基准重排编制的明确信号。
Google 追加投资 Anthropic:总额最高 400 亿美元
据报道,Google 母公司 Alphabet 将向 Anthropic 追加最高 400 亿美元投资。Anthropic 对外披露,本轮安排为:先以 3500 亿美元估值投入 100 亿美元现金;若后续达到约定业绩目标,再追加 300 亿美元。在该投资消息对外发布前几日,Amazon 也宣布将向 Anthropic 投资最高 250 亿美元。
2026年04月25日
OpenAI 与微软修订合作协议:结束长期独家授权
微软仍是 OpenAI 的主要云合作伙伴,OpenAI 产品默认优先在 Azure 上线;不过当微软无法提供或选择不支持所需能力时,OpenAI 允许向其他云平台客户提供相关产品。协议同时明确,微软对 OpenAI 模型与产品的 IP 授权将延续至 2032 年,并由独占调整为非独占;微软不再向 OpenAI 支付收入分成;同时 OpenAI 向微软的收入分成支付将延续至 2030 年,分成比例保持不变,但设定总额上限。微软也将继续以主要股东身份参与 OpenAI 的增长。
2026年04月27日
SpaceX 与 Cursor 达成合作,或将在本年度以 600 亿美元收购 Cursor
SpaceX 宣布与 Cursor 达成合作,双方希望共同打造“世界上最强的 AI 编程与知识工作系统”。SpaceX 表示其获得了在年内以 600 亿美元收购 Cursor 的权利,或在双方合作框架下就合作支付 100 亿美元。
事件追踪
04月23日据报道,Cursor 之前正在洽谈新一轮融资,目标 20 亿美元,估值预计超过 500 亿美元。
Meta 或将启动新一轮裁员:缩减约 10% 员工,取消 6000 个招聘岗位
据报道,Meta 计划裁员约 10%,预计涉及约 8000 名员工。根据周四发给员工的内部备忘录,这轮裁员将于 5 月 20 日启动,同时公司将取消原定对 6000 个空缺岗位的招聘计划。公司表示,在持续加大 AI 投入的同时,将提升运营效率。这轮调整也属于 Meta 近期连续的组织优化:今年 1 月与 3 月 Meta 已进行了多轮裁员(覆盖 Reality Labs、Facebook 以及销售与运营等部门),并表示将降低对第三方外包审核的依赖,转而更多使用 AI 技术。
2026年04月24日
· · ·
03.
极交叉
学科交叉与应用前沿
本周总结
科学智能的版图正在出现分化:通用大模型开始横向进入科研相关场景,专用工具则在纵向深入流程细节。OpenAI 用通用模型切入临床决策,路径偏向“平台能力+制度合规”——并不重新构建专用医疗模型,而是把通用智能适配到专业场景所需的制度要求之中。10x Science 则沿制药流程纵深推进,只聚焦在生成之后的结构表征这一环节,采用更垂直的工具路线。
OpenAI 推出 ChatGPT 临床专业版,向美国医护人员免费开放
OpenAI 正式发布 ChatGPT 临床专业人士版,面向经过验证的美国医师、NP、PA 以及药剂师提供免费开放。该产品基于包括 GPT‑5.4 在内的模型体系,提供可信的临床搜索;支持对符合条件的临床问题检索并可自动计入 CME 学分;同时提供可选的 HIPAA 合规支持。上线前通过医师顾问完成了 6,924 场对话测试,99.6% 的结果被认定为安全且准确;在 HealthBench Professional 基准上,其表现超过了人类医师基线。
2026年04月22日
事件追踪
04月23日 Ethan Mollick(AI 与教育研究者)表示,在真实且困难的临床任务基准中,ChatGPT‑5.4 击败了拥有无限时间与网络访问权限的专科匹配医师;同时他也提示,这一基准由 OpenAI 自行设计。
10x Science 完成 480 万美元种子轮,攻克 AI 制药候选分子验证瓶颈
10x Science 是一家由斯坦福 Bertozzi 实验室三位研究员创立的公司,开发面向生物药候选分子结构表征的 AI 平台。其切入点在于:虽然 AI 能批量生成候选药物,但后续的分子结构表征与质谱分析仍然复杂、耗时,并且高度依赖专业解释。目前公司已完成 480 万美元种子轮融资,由 Initialized Capital 领投、Y Combinator 参与。
2026年04月22日
· · ·
04.
人才动态
人才的动向与观点
本周总结
本周人才板块呈现两条并行的变化趋势:其一,头部大厂的顶级研究员创业正在加速,并持续获得超大规模早期融资,资本对“顶尖人才+前沿路线”的前置押注仍在加强;其二,多位一线人才的观点指向同一种组织层面变化——智能体转型正在倒逼进行更深层次的组织重构:例如在资源配置上,算力投入向后训练侧移动;在执行节奏上,产品迭代被压缩到周级。
AlphaGo 核心创造者 David Silver 创办 Ineffable Intelligence
前 DeepMind 强化学习团队负责人、AlphaGo 与 AlphaZero 核心研究者 David Silver 创办 Ineffable Intelligence。该公司已完成 11 亿美元种子轮融资,估值达到 51 亿美元。公司目标是打造一个“超级学习者”(Superlearner):让系统能够通过强化学习自行发现知识与技能,而不依赖人类数据;其学习方式是通过试错而非学习人类生成的示例。
2026年04月27日
事件追踪
除去 Ineffable Intelligence 之外,类似“明星研究员创业+超大早期融资”的项目也在持续出现:AMI Labs(由 Yann LeCun 联合创办)上月完成 10.3 亿美元融资,投前估值 35 亿美元;Recursive Superintelligence(由前 DeepMind 科学家 Tim Rocktäschel 联合创办)据称已获得 5 亿至 10 亿美元融资。
OpenAI Sam Altman、Greg Brockman:AGI 时代的产品路线、经济图景与产业布局
OpenAI 联合创始人 Sam Altman 与 Greg Brockman 在 Core Memory Podcast 接受访谈。两人将当前阶段定义为“聊天模型→智能体平台”的转折点:AI 不再停留在问答层面,而要理解个人上下文、接管电脑任务,并在工作与生活中代表用户处理事务。对应地,OpenAI 也在收缩非主干方向(如 Sora),将更多资源投入到智能体基础设施、代码与通用任务执行上;其判断是,未来的竞争不只来自模型本身,还取决于模型之上的记忆、工具、连接器以及工作流系统能力。治理方面,OpenAI 倾向于通过可控、分阶段发布的方式,让社会在持续使用中建立适应能力,而不是长期封闭地提供高能力模型。Sam Altman 进一步提出 AI 时代的经济设想:①高繁荣+高不平等(下限抬升但财富更集中);②较缓增长+较低不平等;③Brockman 补充认为,若算力与硬件访问权能够更广泛普及,尤其是让下一代普遍拥有使用智能体的能力,社会阶层流动性可能会更大。两人都强调,缓冲分化风险的关键在于低成本普及算力与基础设施。产业层面,他们也认为美国在硬件制造链条存在短板,尤其在机器人与大规模建设能力上落后;破局方向是“AI+机器人”协同演进,以自动化制造来支撑下一代生产力扩张。
2026年04月22日
Anthropic Claude Code 产品负责人 Cat Wu:AI 时代产品经理方法论
Anthropic Claude Code 与 Cowork 产品负责人 Cat Wu 在 Lenny's Podcast 接受访谈。她认为,AI 时代的产品管理已从按季度规划路线图,转向“寻找最快的发布路径”:核心在于持续清障,把“构思→交付”压缩到周级,甚至天级,并通过研究预览等机制先上线、快速收集反馈,再进行迭代。她还补充指出,随着写代码成本持续下降,PM 的核心价值正在转向“产品品味”,也就是决定“做什么”、取舍“先做什么”,并设计通往结果的最佳路径。由此带来的变化是工程、产品与设计边界不断融合,团队需要兼具技术理解与产品判断的复合型人才;组织侧则更依赖高频指标复盘、清晰的团队原则与跨部门快速协同,才能维持速度。她认为,AI 产品也正从“聊天式”迈向“行动式”:模型不仅给建议,还要直接完成任务。要让这一模式真正落地,关键不在于“能不能做”,而在于“能不能稳定做到”——若可靠性只有 95%,仍不够,必须逼近接近 100%。
2026年04月23日
小米大模型负责人罗福莉:Agent 第二幕里的技术赛点与组织重构
MiMo-V2 系列负责人罗福莉在张小珺访谈中,系统讨论了由 Claude Opus 4.6 与 OpenClaw 引发的范式迁移。她的核心判断是:大模型竞争已从 Pre-train 主导的 Chat 时代,转向 Post-train 主导的 Agent 时代;“上一时代的成功不代表下一时代的领先”,目前各家在新范式下大体回到了同一起跑线。在技术路线方面,她提出三点:第一,1T 基座是冲击接近 Opus 4.6 水平的入场券,但不会在 1T 规模停留太久,下一阶段仍需更大规模的 scaling 决策;第二,Agent 的赛点不在单一 Benchmark,而在复杂框架下能否端到端完成高复杂任务,重点在 Agent 上的 RL scaling;第三,OpenClaw 类开源框架的价值不止体现在产品形态上,更在于其通过记忆、调度、技能以及多模型协同,显著抬升中层模型的上限,并把“人机共创数据”转化为后训练增益。