标签

AI周报:DeepSeek V4震撼登场,OpenAI GPT-5.5强势来袭,中美差距缩至2.7%

发布时间:2026-04-25 13:20来源:微信阅读:8

这一周的AI领域,用一个词来形容就是:火爆。

4月24日这天,很可能是2026年以来AI行业最繁忙的一天——清晨,OpenAI的GPT-5.5突然发布;国内DeepSeek V4预览版亮相,融资消息随之传播。再加上斯坦福年度AI报告出炉,以及具身智能加快进入工厂生产线,每一条动态都足以成为行业焦点,如今却集中在了同一周内。

DeepSeek V4发布,同步开启首轮外部融资

4月24日,DeepSeek在长达15个月的沉寂后,正式上线V4预览版,并宣布开源。

V4系列包含两个版本:V4-Pro和V4-Flash。V4-Pro(1.6万亿总参数、490亿激活参数)定位能力上限,专注于顶级推理能力和世界知识,承担复杂推理与长上下文等高难度任务;V4-Flash(2840亿总参数、130亿激活参数)则主打低延迟和高性价比,面向大规模调用场景。百万token的超长上下文窗口成为标准配置,足以一次性处理《三体》三部曲,在法律合同分析、长篇创作、复杂代码库维护等企业级场景中意义重大。

V4系列采用MoE(混合专家)架构,每层配置384个专家,推理时激活6个,在保持巨大总容量的同时兼顾运行效率。DeepSeek在Hugging Face上的官方页面显示,这两个版本均已开放调用,支持Thinking Mode复杂推理和Tool Calls外部工具调用。

而最让行业震撼的,是同步传出的融资消息。

但据多家媒体报道,DeepSeek已于4月中旬打开对外融资窗口,正在寻求至少3亿美元的首轮外部融资,目标估值至少100亿美元。随着腾讯和阿里巴巴被曝正在洽谈投资,市场给出的估值预期已被推高至200亿美元以上。

业内人士分析,DeepSeek并非“缺钱”才融资——其背后的幻方量化具备资金和算力积累——启动融资的核心目的更多是稳定研究团队和为资本开支补充弹药。有投资人评价:“这不是一个你出得起价就能进的标的,梁文锋的筛选标准里,钱是最不重要的那一项。”

OpenAI GPT-5.5:更快、更贵、更自主

DeepSeek V4发布当日凌晨,OpenAI突然出手,正式发布了GPT-5.5。

这并非一次常规迭代。OpenAI总裁Greg Brockman没有用“升级”来描述它,而是称之为“新型智能类别”——这是自GPT-4.5以来首个完全重训练的基础模型。

GPT-5.5的核心能力聚焦于“长任务自主执行”:编写和调试代码、在线研究、分析数据、创建文档和电子表格,以及在多个工具之间协同操作。在智能体编码基准测试Terminal-Bench 2.0上,GPT-5.5取得了82.7%的得分;在衡量真实世界编程能力的SWE-Bench Pro上,准确率达到58.6%。Sam Altman本人评价:“根据我的经验,它‘知道该做什么’。”

AI工程师Peter Gostev的深度体验显示,GPT-5.5可稳定自主运行约7个小时完成任务。AI测评者Matthew Berman则评价:“它的回答更简洁、更像真人、不那么正式,确实有了自己的个性。”

但在能力提升的同时,GPT-5.5也变得更贵——输入每百万Token定价5美元,输出30美元,整体比前代贵了一倍。OpenAI的逻辑是,更强的模型可以用更少的Token完成任务,总体成本未必上升。即便如此,这道门槛仍可能将部分价格敏感的开发者推向竞品。

斯坦福AI指数报告出炉:中美差距只剩2.7%

本周,斯坦福大学以人为本人工智能研究所发布了2026年度《人工智能指数报告》。这份厚达423页的报告给出了一个震动行业的结论:中美AI模型的性能差距,已缩小至仅2.7%。

截至2026年3月,美国最强模型Claude Opus 4.6的Elo评分为1503,中国最强模型紧追其后,差距仅有2.7%。而在2025年2月,DeepSeek-R1还曾短暂追平美国最强模型。

与此同时,中国在论文发表量、论文引用、专利授权量以及工业机器人装机量方面均居全球领先地位,工业机器人占全球装机量的54%。但报告也指出,美国在基础模型创新、资本投入和算力基础设施上仍保持领先——美国拥有5427个数据中心,是其他任何国家的10倍以上。

AI能力的分布也呈现出一种“锯齿状”:AI能赢得国际数学奥林匹克金牌,却在读取时钟指针时仅有50.1%的正确率,而人类为90.1%。这意味着,AI距离全面成熟仍有相当长的路要走。

具身智能加速落地:进厂“打工”的机器人

最后一个重磅领域,是真正“长出手脚”的AI——具身智能。

4月17日,智元机器人在上海举办2026年合作伙伴大会,一口气发布了4款机器人本体新品、6大创新AI大模型及7项行业解决方案,覆盖运动智能、交互智能、作业智能三大领域。智元创始人邓泰华首次提出具身智能产业发展的三阶段跃迁路径,并公布“358”宏图计划:三年实现生产力入门,五年实现生产力落地,八年迎接智能涌现。

更令人瞩目的是,人形机器人已在头部工厂批量上岗。优必选的Walker S系列已进入比亚迪、富士康等工厂承担搬运、上下料、物料分拣等核心环节,单台作业成功率高达99%。海外方面,Figure AI公司的Figure 02人形机器人在宝马工厂连续运行约11个月,参与了超过3万辆宝马X3的生产,累计搬运9万个零部件,运行时间超1250小时。