标签

AI快讯:GPT-5.5与DeepSeek V4同日对决,国产开源首次超越Claude

发布时间:2026-04-25 21:47来源:微信阅读:6

GPT-5.5和DeepSeek V4同一天发布,国产开源首次超越Claude Opus 4.6,AI竞争迈入新阶段。

🔥 GPT-5.5登场:百万Token上下文,价格翻倍 📌 OpenAI 4月23日,OpenAI正式推出GPT-5.5,这是自GPT-4.5以来首次从头训练的基座模型。最大特点是API支持百万Token上下文,Terminal-Bench 2.0获得82.7%分数,Coding能力较上代显著增强。更难得的是,GPT-5.5在智能大幅提升的同时,保持了与GPT-5.4几乎相同的响应速度,完成相同任务消耗的Token更少。当然价格也上涨了:$5/百万输入,$30/百万输出。 同一天,DeepSeek V4也开源发布,直接与GPT-5.5正面交锋。1.6万亿参数的Pro版和2840亿参数的Flash版,同样支持百万Token上下文,MIT协议完全开源。技术上有新亮点——混合注意力架构,百万Token场景下推理成本仅为V3.2版本的27%。中文能力在开源模型中最强,华为昇腾950集群已全面支持。中芯国际和华虹半导体港股当日大涨8-15%。 OpenAI和DeepSeek选择在同一天发布旗舰模型,竞争意味浓厚。这也标志着行业重心转变:仅有benchmark分数不够,能否稳定完成8小时真实工作才是新标准。

🔥 GPT-5.5登场:百万Token上下文,价格翻倍

📌 OpenAI

4月23日,OpenAI正式推出GPT-5.5,这是自GPT-4.5以来首次从头训练的基座模型。最大特点是API支持百万Token上下文,Terminal-Bench 2.0获得82.7%分数,Coding能力较上代显著增强。更难得的是,GPT-5.5在智能大幅提升的同时,保持了与GPT-5.4几乎相同的响应速度,完成相同任务消耗的Token更少。当然价格也上涨了:$5/百万输入,$30/百万输出。 同一天,DeepSeek V4也开源发布,直接与GPT-5.5正面交锋。1.6万亿参数的Pro版和2840亿参数的Flash版,同样支持百万Token上下文,MIT协议完全开源。技术上有新亮点——混合注意力架构,百万Token场景下推理成本仅为V3.2版本的27%。中文能力在开源模型中最强,华为昇腾950集群已全面支持。中芯国际和华虹半导体港股当日大涨8-15%。 OpenAI和DeepSeek选择在同一天发布旗舰模型,竞争意味浓厚。这也标志着行业重心转变:仅有benchmark分数不够,能否稳定完成8小时真实工作才是新标准。

🔥 国产开源首次超越Claude Opus 4.6:智谱GLM-5.1亮相 📌 智谱AI 4月8日,智谱发布GLM-5.1,成为全球首个在编程核心榜单SWE-Bench Pro上超越Claude Opus 4.6的开源模型。7440亿参数(MoE架构,40亿活跃参数),200K上下文,MIT协议全开源。 智谱官方将其定位为“唯一能持续工作8小时的开源模型”——单次任务中从规划、执行到迭代优化跑完整循环,交付工程级成果。在Coding和长程任务上实际表现已与Opus 4.6相当,14小时后CUDA专家社区热议。免费、开源、性能追平顶尖闭源方案,GLM-5.1将开源模型天花板推至新高度。

🔥 国产开源首次超越Claude Opus 4.6:智谱GLM-5.1亮相

📌 智谱AI

4月8日,智谱发布GLM-5.1,成为全球首个在编程核心榜单SWE-Bench Pro上超越Claude Opus 4.6的开源模型。7440亿参数(MoE架构,40亿活跃参数),200K上下文,MIT协议全开源。 智谱官方将其定位为“唯一能持续工作8小时的开源模型”——单次任务中从规划、执行到迭代优化跑完整循环,交付工程级成果。在Coding和长程任务上实际表现已与Opus 4.6相当,14小时后CUDA专家社区热议。免费、开源、性能追平顶尖闭源方案,GLM-5.1将开源模型天花板推至新高度。

🤯 Claude Mythos 5:10万亿参数,但有钱也买不到 📌 Anthropic Anthropic在4月7日确认了Claude Mythos的存在——这是全球首个10万亿参数模型,也是Anthropic有史以来最强的模型。 然而,Anthropic选择不公开发售。Mythos触发了ASL-4安全协议(模型接近“危险能力阈值”时的分类),仅通过一个名为Project Glasswing的计划,向50家关键基础设施合作伙伴提供受限访问,包括AWS、苹果、微软、谷歌、NVIDIA、CrowdStrike、摩根大通等。用途明确:让他们用Mythos扫描自家系统和开源代码库,寻找可被利用的漏洞——赶在攻击者之前。预览价格为$25/$125每百万Token,没有公开API,也无上市时间表。 这代表了一种新的AI分发理念:最强模型不等于最开放模型,安全性开始实质性限制技术流通。

🤯 Claude Mythos 5:10万亿参数,但有钱也买不到

📌 Anthropic

Anthropic在4月7日确认了Claude Mythos的存在——这是全球首个10万亿参数模型,也是Anthropic有史以来最强的模型。 然而,Anthropic选择不公开发售。Mythos触发了ASL-4安全协议(模型接近“危险能力阈值”时的分类),仅通过一个名为Project Glasswing的计划,向50家关键基础设施合作伙伴提供受限访问,包括AWS、苹果、微软、谷歌、NVIDIA、CrowdStrike、摩根大通等。用途明确:让他们用Mythos扫描自家系统和开源代码库,寻找可被利用的漏洞——赶在攻击者之前。预览价格为$25/$125每百万Token,没有公开API,也无上市时间表。 这代表了一种新的AI分发理念:最强模型不等于最开放模型,安全性开始实质性限制技术流通。

💡 Google Gemma 4:Apache 2.0,最强开放权重家族 📌 Google DeepMind 4月3日Google发布Gemma 4全系列,包括27B、26B-A4B、E2B、E4B等多个尺寸,全部采用Apache 2.0协议——这是主流厂商首次在最强模型上使用无附加条件的开源许可。 Gemma 4支持超过140种语言,具备多步规划、复杂逻辑推理和智能体构建能力。累计下载量已超4亿次,衍生模型变体超过10万个。Apache 2.0意味着企业可以完全自由地商用、修改、分发,没有任何使用限制或强制条款。这对RAG系统、本地Agent工作流等企业场景吸引力很大——无需API费用,无需数据出境。

💡 Google Gemma 4:Apache 2.0,最强开放权重家族

📌 Google DeepMind

4月3日Google发布Gemma 4全系列,包括27B、26B-A4B、E2B、E4B等多个尺寸,全部采用Apache 2.0协议——这是主流厂商首次在最强模型上使用无附加条件的开源许可。 Gemma 4支持超过140种语言,具备多步规划、复杂逻辑推理和智能体构建能力。累计下载量已超4亿次,衍生模型变体超过10万个。Apache 2.0意味着企业可以完全自由地商用、修改、分发,没有任何使用限制或强制条款。这对RAG系统、本地Agent工作流等企业场景吸引力很大——无需API费用,无需数据出境。

⚡ Qwen3.6-Plus:阿里发布,国产编程能力最强 📌 阿里巴巴 4月2日阿里发布Qwen3.6-Plus,在智能体编程SWE-bench系列评测中,编程表现超越2倍乃至3倍参数量的GLM-5和Kimi-K2.5,成为国产编程能力最强的模型。4月15日进一步开源了Qwen3.6-35B-A3B,延续开源策略。不到一个半月就从Qwen3.5迭代到3.6,节奏明显加快。 同天字节跳动发布豆包语音大模型Seeduplex,基于“边听边说”的全双工框架,自然感大幅提升,已在豆包App全量上线。

⚡ Qwen3.6-Plus:阿里发布,国产编程能力最强

📌 阿里巴巴

4月2日阿里发布Qwen3.6-Plus,在智能体编程SWE-bench系列评测中,编程表现超越2倍乃至3倍参数量的GLM-5和Kimi-K2.5,成为国产编程能力最强的模型。4月15日进一步开源了Qwen3.6-35B-A3B,延续开源策略。不到一个半月就从Qwen3.5迭代到3.6,节奏明显加快。 同天字节跳动发布豆包语音大模型Seeduplex,基于“边听边说”的全双工框架,自然感大幅提升,已在豆包App全量上线。

🔧 特斯拉AI5芯片流片完成:2027年量产,性能提升40倍 📌 Tesla / 马斯克 马斯克4月15日宣布特斯拉AI5芯片完成流片,设计已移交代工厂,2027年由三星和台积电在美国本土工厂分别代工。AI5单芯性能对标英伟达Hopper架构,双芯接近Blackwell级别,整体性能较AI4提升40倍。 用途明确:自动驾驶和人形机器人的核心算力平台。马斯克宣称AI5将成为有史以来产量最高的AI芯片之一。同期博通与Meta达成数十亿美元协议,共同开发定制AI芯片,Meta 2026年资本支出预算1150-1350亿美元用于AI能力建设。

🔧 特斯拉AI5芯片流片完成:2027年量产,性能提升40倍

📌 Tesla / 马斯克

马斯克4月15日宣布特斯拉AI5芯片完成流片,设计已移交代工厂,2027年由三星和台积电在美国本土工厂分别代工。AI5单芯性能对标英伟达Hopper架构,双芯接近Blackwell级别,整体性能较AI4提升40倍。 用途明确:自动驾驶和人形机器人的核心算力平台。马斯克宣称AI5将成为有史以来产量最高的AI芯片之一。同期博通与Meta达成数十亿美元协议,共同开发定制AI芯片,Meta 2026年资本支出预算1150-1350亿美元用于AI能力建设。

💸 具身智能单轮4.55亿美元:它石智航刷新纪录 📌 它石智航 4月16日,它石智航宣布完成超4.55亿美元Pre-A轮融资,由高瓴创投与红杉中国联合领投,美团战投作为基石战略股东加注。这是中国具身智能领域有史以来最高单轮融资——也是该公司第二次刷新行业纪录:2025年Q2他们已完成中国具身智能最大天使轮2.42亿美元。 具身智能赛道整体热度空前。2026年Q1国内具身智能披露融资超50起,累计融资额约200亿元,同比增长近60%。京东同日宣布全球首推覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施。赛道从技术验证期快速进入规模化融资期。

💸 具身智能单轮4.55亿美元:它石智航刷新纪录

📌 它石智航

4月16日,它石智航宣布完成超4.55亿美元Pre-A轮融资,由高瓴创投与红杉中国联合领投,美团战投作为基石战略股东加注。这是中国具身智能领域有史以来最高单轮融资——也是该公司第二次刷新行业纪录:2025年Q2他们已完成中国具身智能最大天使轮2.42亿美元。 具身智能赛道整体热度空前。2026年Q1国内具身智能披露融资超50起,累计融资额约200亿元,同比增长近60%。京东同日宣布全球首推覆盖“采、存、标、训、评、仿、测”全链路的具身智能数据基础设施。赛道从技术验证期快速进入规模化融资期。

📊 Token消耗量井喷,算力政策加码 📌 国家发改委 / 工信部 2026年3月,中国日均Token调用量突破140万亿,较2025年末增长超40%。OpenRouter周度Token消耗量较一年前增加7-8倍,其中国产大模型占了约40%。 算力涨价链条已全面传导:HBM高端芯片严重缺货,Q1存储价格翻倍。需求从训练转向推理,硬件采购和运维成本居高不下。政策面迅速响应:4月17日国家发改委表示今年重点在“人工智能+”基础设施等领域扩大投资;工信部印发通知,组织普惠算力赋能中小企业专项行动,“算力银行”“算力超市”要来了。国家队入场,为中小企业降低算力成本。

📊 Token消耗量井喷,算力政策加码

📌 国家发改委 / 工信部

2026年3月,中国日均Token调用量突破140万亿,较2025年末增长超40%。OpenRouter周度Token消耗量较一年前增加7-8倍,其中国产大模型占了约40%。 算力涨价链条已全面传导:HBM高端芯片严重缺货,Q1存储价格翻倍。需求从训练转向推理,硬件采购和运维成本居高不下。政策面迅速响应:4月17日国家发改委表示今年重点在“人工智能+”基础设施等领域扩大投资;工信部印发通知,组织普惠算力赋能中小企业专项行动,“算力银行”“算力超市”要来了。国家队入场,为中小企业降低算力成本。

💡 小编点评 这周太热闹了,OpenAI和DeepSeek选在同一天发布旗舰模型,火药味十足。国产开源模型终于在编程能力上追上顶级闭源方案,这个节点值得关注。

💡 小编点评

这周太热闹了,OpenAI和DeepSeek选在同一天发布旗舰模型,火药味十足。国产开源模型终于在编程能力上追上顶级闭源方案,这个节点值得关注。

📊 本文由 AI 自动采集 & 生成 | 关注我们,每日获取最新财经资讯