DeepSeek V4登场,AI热潮却现降温
4月24日,中国AI圈迎来一个标志性节点——深度求索正式推出DeepSeek-V4预览版并同步开源。它以27B的轻量参数,在多项关键指标上全面压过参数规模达到其15倍的上一代旗舰模型,直指GPT-4o和Claude Sonnet 4.5,瞬间点燃整个行业。
DeepSeek-V4系列此次共带来两个版本:DeepSeek-V4-Pro(旗舰版)与DeepSeek-V4-Flash(轻量版)。本次更新的看点主要集中在三方面:
① 百万字级超长上下文——这次最具分量的杀手锏。V4最高支持100万Token(约100万汉字)的上下文窗口,意味着它能够一次性读完并理解整部长篇小说、整套代码仓库,甚至数百页企业年报,并据此完成精准推理和问答。在开源阵营里,这一能力尚属首次;在闭源模型中,也只有GPT-4o 128K与Claude 200K可与之抗衡。
② Agent智能体编程能力大幅提升——在Agentic Coding评测中,V4-Pro达到开源模型的最高水平,官方测试结果甚至优于Claude Sonnet 4.5,交付质量接近GPT-4o的非思考模式。这意味着AI已不只是编程辅助工具,而是能够从需求拆解、架构规划到代码落地,独立完成完整开发流程。
③ 原生多模态+双通道推理——V4原生兼容图像、视频与文本输入,并支持“多模态思考”和“非思考”两种模式。简单问题可走快速通道即时返回,复杂推理则进入专家模式深入分析。27B参数在自然语言推理任务上的表现,已经接近数倍体量模型。
背景来看:2025年初,DeepSeek R1凭借极低训练成本横空出世;随后又连续推出V2/V3/R2等多代模型。V4的问世,被普遍看作开源力量在通用智能领域正式向闭源巨头看齐的重要信号。从商业层面看,在算力受限的环境下,V4开源策略将为国内大模型企业提供更高效的底层模型,加速国产AI应用生态迭代。
行业层面:据OpenRouter统计,2026年4月其平台周度Token消耗量较去年同期增长约7-8倍,国产大模型贡献了主要增量。DeepSeek V4上线后,预计还会把这一趋势进一步推高。一位国内AI工程师甚至感叹:“以后简历里写‘熟练使用DeepSeek-V4’,可能比写‘用过GPT-4o’更有分量。”
就在全行业还沉浸在AI高增长的乐观预期中时,一盆冷水却突然泼下——《每日经济新闻》依据OpenRouter最新数据测算,上周(4月6日至12日)全球AI大模型总调用量为21万亿Token,环比下滑22.2%,结束了此前连续十周上涨的势头。这也是AI产业进入2026年以来首次出现明显“踩刹车”的信号。
国产模型的调用量也同步回落——上周,中国AI大模型周调用量降至5.826万亿Token。也就是说,不仅全球总量在下降,中国市场的增长动能也暂时放缓了。
供给端瓶颈开始显现——这一轮下行的关键原因,还是算力产能受限。2026年上半年全球AI芯片供应持续偏紧,英伟达H100/H200的交付周期依旧长达6-9个月,算力价格不降反升。OpenRouter平台数据显示,全球算力成本已经出现上扬,部分API调用费用较年初提高了15%-20%。
商业化落地进展慢于预期——更深一层的原因在于,大模型的赚钱能力仍未跟上资本市场的高期待。许多企业的AIPilot项目还停留在POC(概念验证)阶段,真正能带来规模化收入的应用场景依然有限。德勤最新报告显示,大约67%的企业AI项目在投入生产后的第一年里并未达到预期ROI。
这究竟是回调,还是拐点?上海证券认为,随着算力成本持续优化、模型效率不断提升,全球AI产业正从技术研发阶段走向商业化落地的关键窗口期,短期波动并不会改变长期趋势,当前的“降温”更像是在挤出泡沫、去伪存真。
谷歌这次似乎真急了——联合创始人谢尔盖·布林(Sergey Brin)罕见重启“创始人模式”,亲自坐镇AI研发,并组建精锐“突击队”,全力推动Gemini在AI编程和自主智能体等关键能力上追赶Anthropic、OpenAI等对手。
布林重新站到一线,绝不只是姿态上的变化。据内部人士称,他不仅参与技术方向敲定,还开始用军事化词汇来描述研发节奏——“突击队”“前线”“火力支援”等说法频繁出现在内部会议里,整个团队几乎进入战时状态。
Deep Research智能体迎来重磅升级——4月21日,谷歌正式推出Deep Research与Deep Research Max的升级版,两款产品均基于Gemini 3.1 Pro构建。核心更新包括:原生接入MCP(Model Context Protocol)协议;首次支持原生图表生成;把原本偏摘要的引擎升级为真正具备自主研究能力的AI助手。
Gemini 3.1 Ultra的性能表现同样亮眼——这款拥有200万Token上下文的模型,已经在多项权威基准中刷新纪录,MMLU准确率达到92.7%(GPT-4o为86.4%),HumanEval编程测试得分达到91.2%。
从行业格局看,布林亲自下场,说明谷歌已经把AI提升到“公司存亡”的最高战略位置。在Anthropic估值突破600亿美元、OpenAI年化营收突破50亿美元的大背景下,谷歌的焦虑并不难理解——但Google Search的海量数据、Android生态和TPU自研芯片,依然是它最硬的底牌。
2026年春天,人形机器人不再只是“PPT里的未来”——特斯拉Optimus Gen 2最新演示视频刷屏全网,宇树科技、银河通用等国产机器人公司登上央视春晚舞台,Figure AI估值突破百亿美元……一个万亿级新赛道正在加速成形。
特斯拉最近发布的Optimus Gen 2演示视频展示了多项关键进展:手部关节精度明显提升,可以轻拿鸡蛋而不破;触觉反馈和力控制技术取得实质性突破;整机平衡与运动协调能力大幅优化,行走速度和稳定性较Gen 1提升约40%;自主学习能力也得到验证,机器人能够通过观看人类操作视频快速掌握新任务。
特斯拉CEO马斯克给出了清晰的商业化节奏:2026年预计生产1,000台,2027年将把产能提升到万台级别。
在2026年央视马年春晚(2月16日播出)上,宇树科技、银河通用、松延动力、魔法原子四家国产机器人企业联合登台,宇树H1人形机器人在舞台上完成了高难度的群体协同动作。
Figure AI最新估值已超过100亿美元,Figure F.02机器人也在宝马工厂参与真实作业测试,展现出从“炫技”到“实干”的跨越。
行业层面,中国银河证券指出,单台人形机器人的BOM成本大约在3-5万美元,预计到2030年有望降至1.5万美元以下,行业将逼近爆发临界点。减速器、传感器、灵巧手等零部件厂商将率先受益。
当大家还在讨论“谁的芯片制程更先进”时,更底层的一场技术变革已悄然展开——存算一体(Compute Near Memory / CIM)架构正在成为下一代AI芯片竞争的核心战场。
高通下一代AI250将采用全新的存算一体架构,可带来10倍有效内存带宽提升,并搭配新一代LPDDR6内存。和传统冯·诺依曼架构相比,存算一体把计算单元靠近存储单元,从根本上缓解了“数据搬运”的能耗瓶颈——这正是当前AI芯片最头疼的问题之一。高通技术团队论文显示,在Transformer推理场景中,内存访问约占整体能耗的60%以上,存算一体可将其压低到20%以内,推理速度提升3-5倍。
HBM内存自主化——国内存储厂商在2026年已实现HBM2e量产,并开始小批量试产HBM3,缓解了“有算力、缺存力”的卡脖子风险。
先进封装突破——通富微电、长电科技等企业在2.5D/3D封装技术上取得进展,良率持续改善,为国产大算力芯片量产提供了保障。
Cerebras WSE-3——整片硅晶圆做成一颗芯片,集成85万AI核心和46GB片上SRAM,训练速度较英伟达H100提升约2.5倍。
行业影响:存算一体架构的成熟,将深刻改变AI芯片竞争格局。对于想要通过“换道超车”突围的国产AI芯片企业来说,这是一个必须把握的战略窗口。
就在今天(4月27日),2026广东省人工智能应用对接大会在深圳福田会展中心隆重举行,这场被称作“AI产业风向标”的大会,吸引了来自全国的AI厂商、企业用户和投资人。
广东全省拥有10个万卡级算力集群,各类AI大模型备案数量位居全国前三,AI相关企业数量超过3,000家。大会以“加速AI全域全时全行业高水平应用”为主题,设置50余场专题论坛,覆盖工业AI、医疗AI、金融AI、AI智能体等多个垂直方向。大会现场释放的信号,很可能成为下一轮AI行情的重要催化剂:多模态+Agent如何真正赋能制造业(广东作为全球最大制造业基地,工业AI场景最受关注);端侧AI何时爆发;AI Agent在各行业的落地实践。