AI-RAN深度解读:技术逻辑与产业博弈
最近两年,AI-RAN在网上引发了大量讨论。
有人觉得,AI-RAN是大势所趋,预示着通信架构的未来走向。
也有人觉得,AI-RAN只是个营销概念,是部分厂商的自嗨,注定失败。
那么,AI-RAN到底是什么?它的技术逻辑何在?它能否颠覆整个通信产业?
█AI-RAN的本质
AI-RAN,全称人工智能无线接入网。也可理解为"AI赋能的无线接入网"。
无线接入网,实质上就是基站。移动网络由核心网、承载网和无线接入网构成,而RAN是用户设备接入运营商网络的首个环节。
RAN涵盖宏基站、微基站等形态。4G时期,RAN由天线、射频单元、基带单元及连接线路构成。
5G时代,架构演进。天线与射频单元融合为AAU(有源天线单元),基带单元功能拆分为CU(集中单元)和DU(分布单元),分别处理非实时与实时任务。
无论如何,基站类似于家用Wi-Fi路由器。天线射频负责信号收发,基带单元负责信号处理,如调制解调、编解码、信道估计、资源调度等。
有计算需求,就需要芯片支持。
过去,RAN设备由通信厂商提供专用设备,采用专用ASIC芯片和封闭固件。(RAN任务固定,专用芯片非常契合。)
21世纪以来,在运营商推动下,网络走向开放化和白盒化——软硬件解耦,通用服务器和芯片也能用于通信设备。
核心网以路由交换为主,易于云化,催生了NFV(网络功能虚拟化)。
RAN跟进难度大——基带处理对时延、算力和实时性要求苛刻,不像核心网那样容易改造。
4G时期,运营商已在RAN领域有所尝试。
中国移动主导推出C-RAN(集中化RAN),将多个BBU集中到机房形成基带池,统一处理后再分发至各射频单元。
此后,业界又推出O-RAN、vRAN、xRAN及知名的Open RAN(开放无线接入网)。
Open RAN核心特征是模块化架构和标准化接口,实现跨厂商设备互通。基带软件脱离专用芯片,可在通用x86/ARM平台运行。
Open RAN的"开放"名义上是生态开放,但通用芯片核心技术被美国企业掌控,背后主导者显而易见。
前几年火爆的小基站热潮,就是众多中小企业基于美国公司的开放方案,自主研发小基站进入通信市场。
但传统ASIC专用芯片是为RAN量身定制的高效能引擎,具有高密度、低功耗、稳定时延的优势。而x86/ARM通用芯片能耗高、效率低、时延波动大。因此,包括日本乐天移动在内的Open RAN运营商在商用中遇到瓶颈,处境艰难。
Open RAN是北美IT势力对通信产业主导权的战略挑战,但目前看来威胁有限。(更早的WiMAX也类似,最终失败。)
如今,新的挑战者出现——英伟达及其AI-RAN,又是美国企业。
逻辑计算主要有四类芯片:CPU、GPU、FPGA和ASIC。CPU对应Open RAN阵营,ASIC代表传统通信设备商,FPGA灵活性高但多用于验证,剩下的就是GPU。
英伟达力推AI-RAN,意在将GPU植入基站,成为主处理芯片。
█AI-RAN的价值与影响
将GPU引入基站,体现了英伟达的宏大野心。
首先,最基础层面,用GPU进行基带处理能开拓电信行业的巨大市场。全球电信设备采购额超千亿美元,英伟达对此觊觎已久。
其次,除基带处理外,英伟达还希望在基站上运行AI模型。借助GPU和AI算法,基站可完成信道智能预测、干扰动态识别、波束自动优化等复杂任务,大幅提升性能并扩展功能。
第三,也是最关键的一点。英伟达希望借"基站+AI"撬动庞大的边缘AI算力市场。
换句话说,AI-RAN不仅是"把GPU塞进基站",而是要将基站升级为"具备5G/6G能力的AI边缘服务器"——既处理无线信号,又执行面向用户和行业的实时AI推理。
当前社会对算力需求旺盛,随着AI应用普及,需求持续增长。
算力通常分为"云-边-端"三层。
云即智算中心,算力最强但距离远、时延高。
端即终端设备,算力最弱但能效比高、响应快、隐私性好。
边即边缘节点,如基站、路由器、网关等。基站正是边缘层最接近用户的算力枢纽——既不像云端那么远,也不像终端那么弱,恰好处于云与端的"黄金时延区"。
AI-RAN联盟将技术研究划分为三大方向:AI for RAN、AI and RAN、AI on RAN。
AI for RAN(AI赋能网络):利用AI提升RAN性能、运营效率与资源利用率。
AI and RAN(AI与RAN协同):在同一设备上同时运行通信和AI功能,整合算力资源,发挥协同效应。
AI on RAN(RAN反哺AI):通过RAN优化连接、数据开放与可编程能力,提升AI应用性能与部署灵活性。这是最富想象力的方向,将基站升级为"通感算智"边缘节点,推动AI落地。
三大方向既独立又互补,共同构成AI-RAN完整技术体系。
█AI-RAN的产业动态
2024年2月,在巴塞罗那MWC上,英伟达联合软银、爱立信、诺基亚、微软等11家创始成员成立AI-RAN联盟。
联盟成立后成员迅速扩充,很快汇聚超百家运营商与设备商。
2024年11月,英伟达与软银宣布试运行全球首个可同时处理AI和5G业务的AI-RAN网络。
2025年,英伟达斥资10亿美元入股诺基亚,成为其大股东之一,强化6G RAN及AI-RAN合作。
作为核心推动者,英伟达持续构建全栈AI-RAN方案。2025年推出Aerial RAN Computer Pro(ARC-Pro)及AI Aerial软件平台,集成GB200、BlueField-3、Spectrum-X网络及CUDA-X库,具备电信级能力。
此后,英伟达又联合伙伴推出"全美AI-RAN技术栈",可在GPU内部或GPU间动态分配计算资源,为运营商提供vRAN部署、AI应用、6G研发等场景支持。
2026年3月,英伟达在GTC大会上提出"AI Grid"愿景,核心是利用运营商、云商的广泛网络覆盖,将AI计算能力(特别是推理能力)部署在更靠近用户的位置,支撑AI原生应用普及。
按英伟达规划,AI-RAN是AI Grid的核心组件,充当边缘网络与计算层,AI Grid则提供分布式云与编排层。
面对英伟达的强势进攻,通信业形成两大阵营。
第一类,全面拥抱。
以软银、AT&T为代表的运营商选择全面采用AI-RAN架构,看重网络智能化带来的运维降本(预计降低OPEX 30%以上)、新业务孵化能力(如实时视频分析、工业定位)及6G时代"通感算智"融合的先发优势。
设备商方面,以诺基亚为代表,毕竟英伟达已是其大股东,深度绑定。
诺基亚推出anyRAN软件,可与英伟达GPU AI RAN平台集成。2026年3月,诺基亚宣布与T-Mobile US、印尼电信、软银等运营商完成基于英伟达GPU加速平台的AI-RAN功能测试。
第二类,自主探索。
从AI发展趋势看,无人怀疑其对通信架构的颠覆潜力。但认同AI-RAN不等于认同英伟达GPU。多数设备商和运营商不愿被英伟达深度绑定,希望探索自主可控的AI-RAN路径。
例如爱立信,一方面将RAN软件移植到英伟达AI平台测试(与T-Mobile合作),另一方面在自研Ericsson Silicon芯片中集成可编程神经网络加速器(NNA),将AI推理能力下沉到射频端。
华为和中兴作为中国厂商,更不可能将AI-RAN主导权交给英伟达。今年MWC上,华为提出"AI-Centric Network",中兴提出"AIR MAX",均在探索各自的"AI+通信"技术路线。
运营商对AI-RAN可谓又爱又怕。
爱,因AI-RAN确实诱人——通过软硬解耦与算力复用,可显著缩短部署周期、降低运维成本;借助开放接口、实时数据流与低时延边缘算力,基站可从"哑管道"升级为可编程、可运营的智能服务节点,摆脱管道化困境。
怕,则源于技术主权焦虑——一旦基带处理与AI推理深度耦合于GPU,RAN架构控制权可能向英伟达生态倾斜,无异于"才脱虎口,又入狼窝"。
运营商纷纷宣称要从"流量运营"转向"Token运营",从通信商转型为算力提供商。AI-RAN与此目标高度契合,但"厂商深度绑定"是其最大顾虑。
AI-RAN成本投入巨大,包括建设成本(CAPEX,算卡、设备、机房改造昂贵)和运营成本(OPEX,电费高昂)。
运营商选择必须谨慎。在AI-RAN路线未充分验证、成本收益未算清前,相信多数运营商(尤其大运营商)不会明确投入。
业界渐成共识——AI-RAN很可能是通信网络演进方向,但算力选型极可能是"ASIC+GPU+CPU"的多元异构架构。说白了,就是运营商按需混搭,实现性能、效率、成本、生态的最佳平衡。
除算力选型外,AI-RAN还面临商业模式、标准化、生态建设等多重挑战。
商业模式,核心是如何计量、计费、运营边缘AI算力,如何将其转化为可售服务。英伟达或其他设备商在商业模式中扮演何种角色,是沿用智算中心模式还是创新模式。
标准化,指AI-RAN缺乏统一的数据语义、模型接口与服务编排规范。通信标准历来由3GPP主导,而AI-RAN由AI-RAN联盟引领,两者如何协调、谁主沉浮,背后牵扯巨大利益。
生态建设,目前因算力选型和技术路线未定而进展缓慢——芯片商、终端商、设备商、运营商、模型商各自为政、心存疑虑,不知该支持谁、是否该投入。
█总结
总体而言,AI-RAN确实是通信业最看好的技术方向,很可能是新一轮网络革命的核心。
但它目前仍充满不确定性,探索尚处初期。现在预判成败为时尚早。
不妨给AI-RAN更多时间,让企业拿出真正商业方案,在真实场景中验证技术可行性、打磨商业模式、构建生态体系。
6G标准研究已全面启动,AI-RAN在6G中将扮演何种角色,能否开启真正的AI原生网络时代?时间将给出答案。