标签

2026AI算力产业链研究要点

发布时间:2026-05-06 02:15来源:微信阅读:4

文 任泽平团队

AI的发展离不开算力,而算力的支撑又来自电力。

进入AI时代,算力等同于生产力,Agent AI驱动下的算力需求迎来集中释放。全球科技巨头掀起新一轮算力投入的“军备竞赛”,单位算力成本显著走低,推理算力的比重有望提升至70%以上。由此,算力正从过去的稀缺资源,转变为新型数字基础设施。

算力产业正在形成三方面趋势:第一,算力投入的规模将直接决定AI的能力天花板,Scaling Law持续推动模型迭代;第二,推理阶段所需算力成为增长关键,相关占比快速上升,并重塑算力需求结构;第三,算力通胀趋势加速,能源与数据逐步成为产业演进的最终约束。

算力产业链的结构较为清晰:

上游:先进制程、HBM3e以及2.5D/3D封装、Chiplet技术持续突破。IDC数据显示,国产AI加速卡市占率突破41%,自主可控形成闭环;

中游:光互联方案加速落地,用以缓解带宽瓶颈。CPO共封光学与硅光、EML光源持续迭代,进而重构算力网络的物理层;

下游:AIDC智算中心向高密度、液冷化和网格化升级,成为AI规模化落地的关键物理底座。

1、AI时代:算力就是生产力,Agent AI带来算力加速释放

随着AI迈入新阶段,超级应用加速涌现,我们也站在第四次工业革命的起点。算力就是生产力,Agent则是更灵活的工具载体。自2026年以来,以豆包、千问为代表的国民级应用快速扩张,再加上“养小龙虾”等Agent AI需求的爆发,AI进入大规模商业应用阶段。算力逐渐成为一种具备高流动性、高价值的“数字脑力石油”,每一次算力供给的增加,都将对应到更高的决策质量与更可观的商业产出。

目前,全球科技巨头已进入算力投资的“永动机”节奏。根据英伟达测算,到2030年,人工智能基础设施支出或达3万亿至4万亿美元。与此同时,2026年还呈现出一个表面矛盾的现象:单位Token价格持续下行,但算力总投资却仍在经历超预期的通胀式增长。

造成这一现象的根本原因可从两个维度理解:

一是技术持续普惠,单位算力单价加速下探。

算法与硬件的同步迭代共同推动成本下降。一方面算法层面不断优化:随着MoE(混合专家架构)与MLA(多头潜在注意力)等方案普及,单枚Token的推理成本已较过去下降近1000倍。另一方面在硬件演进方面,成本降低具备坚实的物理基础。以英伟达GPU为例,2024年的Blackwell相较2014年的Kepler,在单位Token能耗上实现了约10.5万倍的下降。

二是成本下降反过来催生总需求的成倍跃升。

当资源使用效率提升、边际成本降低,消耗量并不会随之减少,反而会因应用场景的爆发而持续扩大。到2026年,人类与AI的交互方式将发生实质变化:不再仅仅围绕“对话”完成任务,而是通过成千上万个Agent智能体开展自动化协作。一个复杂任务的拆分与执行所对应的Token消耗量,相比传统对话模式通常要高出百倍以上。根据IDC数据,活跃Agent数量预计将从2025年的约2860万增长至2030年的22.16亿。随着任务复杂度提升,推理深度与调用链路不断拉长,底层Token消耗将出现数量级的跃迁。

未来,AI算力很可能由“军备竞赛”转向覆盖全社会的基础设施建设模式。

当总规模持续膨胀且单位成本明显下降,这一趋势意味着AI行业走向成熟。若推理成本进一步降至“百万Token一分钱”,算力就完成了从昂贵专用资源到更通用资源的迁移。巨量算力投入将支撑起庞大的数字劳动力市场,让AI成为支撑社会运转的新型基础设施。

2、算力产业三大发展趋势

趋势一:算力投入规模直接决定AI智能的上限。

Scaling Law是当前大模型进化的关键底层规律,它表明智能能力可以被工程化地规模生产,本质上是可被量化的物理结果。

AI大模型时代的Scaling Law说明:只要持续按比例加大算力投入、模型参数以及高质量数据量,模型的理解与推理能力就会随之增强。用更直观的说法:学英语时,记100个单词可能只是词汇积累;学1000个单词更容易形成句子;若背到1万个单词,则更可能掌握语法与隐喻——这就是“学得多=能力更强”的朴素Scaling Law。

因此,当前全球科技竞争的本质已从单点技术竞赛演变为算力规模的投入消耗战。持续提升算力、参数与数据投入,就能推动模型逻辑水平出现确定性的跃迁。算力规模也因此成为决定国家与企业智能竞争力的首要基石。

趋势二:推理相关算力正在成为增长的核心。

算力需求正从静态知识预训练,转向更强调动态逻辑推理。

传统语言模型以基于概率的“下一个字符预测”为主要机制;而推理模型借助强化学习与路径搜索,更接近人类式的深度思考过程。

随着o1/o3等支持思维链(CoT)能力的模型出现,解决复杂问题时需要更多的推理计算。在这种机制下,模型性能取决于它在复杂任务中愿意投入多少“思考时间”。这种“以时间换智能”的方式,使推理环节的算力需求出现指数级膨胀,打破了传统算力分配比例。预计未来推理算力在整体结构中的占比将从20%提升至70%以上。

趋势三:算力通胀引发连锁效应,数据、能源与电力基础设施成为终极需求。

进入算力通胀阶段后,产业竞争的重点逐步从算力本身延伸到能源约束的博弈。当需求从“万卡集群”迈向“百万卡集群”,电力供给能力、液冷散热能力以及定制化芯片能力共同决定了产业发展的边界。

IDC数据显示,全球年度Token消耗量将从2025年的0.0005PetaTokens快速跃升至2030年的15万PetaTokens以上,复合增长率超过3000%。这就是算力通胀的直接体现。算力不再只是一般IT成本,而逐渐成为一种稀缺的战略性基础资源。

与此同时,大规模训练也带来高质量数据的阶段性紧缺。由大模型推理生成的合成数据,未来将成为新一代模型的重要数据原材料。这种模式构成了自我强化的闭环:算力用于生产更高质量的数据,数据反哺模型进化,进化后的模型又进一步拉动更高强度的算力需求。

3、算力产业链上游:先进制造芯片,自主可控的长期趋势

一是先进制程代工能力持续迭代:这为国产算力芯片的规模化生产提供了底层保障。中芯国际、华虹半导体等本土龙头通过工艺改进与产能扩张,加速支撑国产通用GPU与特定场景ASIC芯片的落地。

根据IDC于2026年4月发布的《2025年中国云端AI加速器市场跟踪报告》,2025年中国AI加速卡总出货约400万张,其中国产厂商如昇腾、平头哥、昆仑芯、寒武纪、海光等出货165万张,市占率达到41%。随着国产芯片在主流推理场景份额突破40%的关键平衡点,产业链逐步形成从“设计端下单”到“制造端反馈”的协同闭环。

二是技术路径的持续突围:国产算力芯片已进入第三代高带宽内存HBM3e以及2.5D/3D先进封装阶段。芯片垂直堆叠与平面互连的高密度集成技术正在逐渐成为主流。与此同时,依靠Chiplet芯粒的异质集成,可以在一定程度上绕开制程限制,实现不同工艺芯片的高效组合,这也是国产算力实现突破的核心路径。先进封装会直接影响算力表现与集成密度。与此同时,兆易创新、澜起科技等企业在HBM存储接口与高速连接领域的布局,有效缓解大模型“计算快、读写慢”的I/O传输延迟瓶颈,保障海量推理负载下算力芯片保持满负荷运转。

三是封测环节:国产企业通过前瞻布局,承接全球算力硬件的结构性红利。例如,盛合晶微、长电科技等部分厂商在2.5D封装与高密度互联方向的突破,有助于减轻制程约束对单卡性能的影响。封装设备的国产化进程同样在加快,如华峰测控、光力科技等企业在测试与划片环节的深度参与,增强了产业链在复杂环境下的供给韧性。

4、算力产业链中游:光互联革命,缓解带宽瓶颈

过去二十年里,全球计算能力提升约60000倍,但互联带宽仅增长30倍。这种“算力高速奔跑、带宽原地不动”的显著失衡,已成为制约算力中心效率持续提升的第一类物理障碍。当前“高速算力芯片却要面对低带宽电互联”的瓶颈越发突出。

在这样的背景下,光互联作为算力产业链中游的关键枢纽,正在从配套角色升级为算力系统架构的重要组成,成为解决“计算快、传输慢”矛盾的核心抓手。

CPO共封光学,本质上是对算力网络物理层进行重构,实现降本增效。CPO可以理解为算力中游光互联的下一代核心技术,其关键在于将光引擎与交换机ASIC在封装内部近距离集成:传统插拔式光模块依赖PCB长距离电互联,散热、功耗与带宽瓶颈更为突出;而CPO通过硅光芯片实现封装内垂直短距互连,把光电转换从板级迁移到芯片级。其优势在于互联功耗显著下降70%,端口密度进一步翻倍,能够更好匹配超高密度AI算力集群的需求,因此被认为是下一代数据中心算力网络的标配方案。

从行业演进看,光源技术路线迭代是大势所趋。这也是光模块与CPO的性能底座。光源相当于光互联的“发光灯泡”,它直接决定800G、1.6T等高速光模块能否实现更高速度、更低功耗与更低成本。

目前行业内主要有两类技术路径:

第一类是EML(电吸收调制激光器),可视为“高性能专业灯泡”。它发光质量更好、传输距离更远、抗干扰能力更强,更适合骨干网络中的长距离传输,覆盖跨城市与跨国家的场景;

第二类是CW+硅光方案,可视为“低成本量产灯泡”。它与芯片制造工艺兼容性更强,更容易实现大规模生产,因此成本更低、集成度更高,适配数据中心内部短距离高速互联。

两条路线的目标一致:在更小空间内实现更快的数据传输与更低的功耗。随着硅光技术的普及,国内产业链在光芯片、光源与封装环节的协同会更加顺畅,为算力网络的整体升级提供更坚实的支撑。

5、算力产业链下游:AIDC基建热潮

AIDC正在从通用机房升级为高密度“算力工厂”,单机柜功率密度显著提升。人工智能数据中心逐步告别传统通用IDC形态,呈现单机柜功率密度持续上行的趋势。传统IDC通常以5-10kW为设计标准,已难以满足AI大模型训练与推理所需的GPU集群算力。到2026年,新建AIDC普遍要求单机柜功率达到50kW以上,部分超算应用甚至可能超过100kW。该量级的跨越倒逼数据中心对供电配给、配电架构及建筑结构进行全链路重构,能源管控能力因此成为AIDC的核心竞争优势。

液冷技术从“可选项”演化为“必选项”,可用于破解AI算力的散热与能耗压力。液冷已经成为高性能智算中心的标配方向。面对高性能GPU带来的巨量热负荷,传统风冷技术正逐步触及散热极限;液冷不仅能提供相对风冷数倍的散热效率,还能显著降低PUE(能源使用效率比),以满足更严格的碳中和要求。这项技术变革将推动液冷板、冷却液以及循环冷却系统等全产业链需求集中释放,为AI大模型走向全社会实战提供关键的物理保障。

主权AI将带动国家级基建投资,AIDC布局也将向网格化与边缘侧下沉演进。伴随“主权AI”的兴起,各国政府对本土算力基建开展更为密集的投入。为保障数据安全与智力资产自主,各国纷纷启动本土化AIDC建设。国家级资本开支为算力基建提供了更长期、确定的增长动力。

与此同时,AIDC的地理分布正在从“中心化”逐步走向“边缘化”,形成网格化布局。由于Agent实时交互等场景需求持续增长,算力需要更靠近用户:从支撑国计民生的超大型智算中心,到嵌入城市节点的边缘侧模块化中心,进而打通AI赋能千行百业的“最后一公里”。

6、算力面临能源瓶颈,太空算力未来值得期待

AI的背后是算力,而算力的背后是电力。

全球AI算力正在受到物理层面的硬约束,即能源供给的缺口。目前,AI发展最大的瓶颈并不主要来自芯片,而在于电力。据Rand测算,2030年单个AI训练地点的电力需求可能高达8GW(相当于8座大型核反应堆量级)。与之对应的是,全球主要经济体在电网建设方面(除中国外)进展缓慢,电力产出存在停滞,而算力需求却仍以指数速度增长,导致供需错配。

从第一性原理出发,把算力中心推向太空或许是一条可行路径。太空环境没有昼夜循环,也不受大气衰减影响,太阳能板效率约为地面的5倍;同时还能形成天然深空热沉,仅依靠辐射散热就可以支撑兆瓦级负载。由此,太空有望从根本上缓解地面AIDC的能耗与散热痛点,并成为生成式AI算力成本最低的枢纽之一。

到2026年,星链等相关技术的成熟将为太空算力的工程落地提供条件。SpaceX正为年发射1万次并在更长周期目标达到2-3万次进行准备,计划在五年内向轨道输送100吉瓦太阳能与算力载荷,从而让太空AI算力规模有望超过地球。低轨算力网也将进入更可落地的工程化阶段。

太空算力正在成为大国主权竞争的新赛道,核心博弈聚焦于轨道位置、频谱资源以及算力配额。对于中国而言,依托能源供给侧的体系优势,提前布局“天算”相关体系,是增强全球算力竞争力并奠定未来数字文明战略基础的重要举措。