燧原科技IPO审核通过 国产AI芯片加速登陆资本市场
人工智能芯片领域传来重大动态。6月15日,上海证券交易所官网披露,上海燧原科技股份有限公司科创板IPO申请顺利通过上市委会议审核,公司计划募集60亿元资金,将投向第五代及第六代AI芯片系列产品的研发与产业化项目,以及先进人工智能软硬件协同创新平台建设。这意味着继摩尔线程、沐曦股份、壁仞科技之后,被誉为“国产GPU四小龙”的最后一家企业也成功迈过资本市场准入门槛,“四小龙”即将在资本市场首次完成集结。
燧原科技的上市进程并非一蹴而就。这家2018年3月成立的初创企业,用近八年时间完成了从无到有的蜕变。恰逢中国AI算力需求呈现爆发式增长的历史机遇期,燧原选择了一条与主流GPU厂商截然有别的技术路径——当国内多数AI芯片企业追随英伟达开创的GPGPU生态时,燧原毅然走上了DSA架构的自主研发道路。
公司创新性设计了GCU-CARE加速计算单元与GCU-LARE片间高速互联技术,前者以硬件方式固化了计算、互联与存储的优化特性,后者为构建万卡级算力集群提供了关键支撑。截至目前,GCU-CARE加速计算单元微结构已迭代四代,最新第四代架构可原生支持FP8等多种精度数据的混合计算,在国内同类产品中凤毛麟角地实现了FP8数据精度的原生支持。在软件层面,燧原科技自主研发了“驭算TopsRider”全栈AI计算及编程软件平台,涵盖驱动、编译器、算子库等核心组件,通过软硬件架构深度协同,充分释放了DSA架构在AI计算场景中的硬件潜力。
这种不盲从、不依赖的技术路线,在GPU赛道竞争日趋白热化的当下显得尤为珍贵。截至2025年底,公司已获境内发明专利313项,承担了12项国家及地方科技攻关项目,参与了58项AI芯片与智算系统的关键国家及行业标准制定。八年间,燧原自研迭代了四代架构、五款云端AI芯片,产品线覆盖从AI芯片到AI加速卡及模组、从智算系统及集群到AI计算及编程软件平台的完整体系,构建了芯片及硬件、软件及编程平台和算力集群方案三大类别、全方位、立体化的核心技术布局,多代产品已在互联网AI场景中实现规模化商用部署。
从财务指标审视,燧原科技呈现出典型的硬科技创业企业特征:营收保持高速增长,亏损则在持续收窄。2023年至2025年,公司营业收入从3.01亿元增长至7.22亿元,再到9.90亿元,主营业务收入复合增长率高达83.76%,显著领先同期国内云端AI芯片行业的平均增速。然而,持续的高强度研发投入也带来了可观的财务压力。同期,公司扣非净利润分别为-15.67亿元、-15.03亿元和-11.97亿元,三年累计亏损超过40亿元。研发投入占营业收入的比例分别高达408.01%、181.66%和114.63%,这种令业界瞩目的投入强度,在国内芯片企业中实属罕见。截至2025年末,公司合并口径未弥补亏损达到44.41亿元。但从趋势研判,亏损幅度正在逐年收窄,盈利能力逐步改善的信号已经显现。今年第一季度,公司实现营业收入2.87亿元,同比大增14.7倍,但归母净利润为-4.44亿元,亏损幅度同比进一步扩大38%,主要归因于公司业务快速扩张带来的战略性备货和预付款项增加。关于盈利时点,燧原科技给出了相对乐观的预测,预计在2026年或2027年可实现合并报表盈利。
值得关注的还有燧原科技独特的产品定位策略。与同行业公司普遍将训练卡作为主力产品不同,燧原科技当前八成以上的AI加速卡收入来源于推理场景,而国内同行业可比公司推理产品占比约在50%左右。这种产品结构差异的背后并非技术能力欠缺,而是一种务实的商业策略。训练卡作为AI大模型研发的基础设施,追求极致性能与高稳定性,目前仍由国际厂商主导;推理卡作为AI大模型服务的交付载体,更注重部署成本与场景适配效率,商业化落地更快。公司选择从推理场景切入,以此快速实现自我造血,再反哺训练产品的研发投入。燧原科技第四代产品L600是公司首款训推一体产品,截至招股书签署日已回片,预计于2026年下半年实现量产,届时将开启公司从推理到训推并重的战略转型。随着第四代训推一体产品L600规模化量产及超节点系统的交付,公司将持续拓展训练领域的应用,但受行业需求结构、供应链与技术迭代节奏的影响,推理场景仍将是公司未来训推一体产品的核心应用场景。
在客户结构方面,燧原科技与互联网巨头腾讯形成了深度绑定的战略合作关系。持有公司20.26%股份的第一大股东腾讯,同时也贡献了公司营收的半壁江山。2023年至2025年,燧原科技对腾讯直接销售及通过AVAP模式向整机厂商的间接销售合计收入从1亿元迅速攀升至8.3亿元,占公司营收比例从33.34%一路提升至83.79%。这种深度绑定关系在市场上引发了一定关注,但从战略层面审视有其内在的必然逻辑。云端AI芯片的研发投入巨大、技术门槛极高,对于2018年才成立的初创企业而言,同时服务多个头部客户几乎不可能。为此,公司采取了“优先单点突破、后续以点带线、逐步以线代面”的策略。
腾讯作为国民级应用厂商,拥有微信、腾讯会议、元宝等海量业务场景,对AI算力的性能、稳定性、性价比要求极为严苛。选择集中资源与腾讯联合打磨,本质上是用最具挑战性的场景锻造最具竞争力的产品。经过从单一场景小规模验证到多场景大规模验证再到深度战略合作的长期磨合,燧原产品在腾讯深度适配了大量AI模型,已形成了较深的软件生态与业务侧壁垒,而这种壁垒恰恰构成了公司的核心竞争力,不是其他供应商短期内可以复制的。与此同时,公司正在积极开拓其他客户群体。包括大型互联网平台、头部运营商以及行业客户在内的新增客户已在产品测试、小批量下单甚至商务条款磋商等不同阶段取得进展,腾讯的收入占比有望在长期稳步下降。
纵览整个国产AI芯片赛道,燧原科技只是国产替代浪潮中的一个缩影,行业正在经历一场深刻的格局重塑。据IDC发布的《2025年度中国云端AI加速器市场报告》,2025年中国市场AI加速卡总交付量达到400万片,国产厂商合计交付165万片,市场份额一举跃升至41%,而英伟达则交付220万片,占比55%。更令人震撼的是,据多家权威机构预测,英伟达在中国AI芯片市场的份额已从三年前的绝对垄断地位(95%)暴跌至约8%,国产AI加速卡市场份额强势突破60%,国产化率首次站上六成大关。Bernstein Research等机构的分析指出,多家国产芯片厂商凭借自研架构,在性能和性价比上已实现了对进口芯片的实质性赶超。这意味着国产GPU已经正式撕掉了“追随者”的标签,开始重新定义市场格局。
在这场国产替代的大潮中,华为昇腾无疑是当之无愧的领跑者。2025年,华为昇腾以81.2万张的出货量遥遥领先,占国产总出货量的49.2%,近乎半壁江山。在路线规划上,华为轮值董事长徐直军早在2025年全联接大会上就明确提出了“一年一代、算力翻倍”的路线图。进入2026年,昇腾加速迭代:面向推理场景的950PR加速卡率先上市,单卡推理性能已达到英伟达H20的3倍,彻底打破了“国产芯片性能不如进口”的刻板印象。到第四季度,专攻训练场景的950DT将接棒上场,基于950DT打造的950超节点理论最大可将8192张芯片互联起来,在FP8精度下的总算力高达每秒一百亿亿次运算。上一代384卡超节点已经出货超过500套,被华为自己称为“国内唯一真正大规模商用的超节点”——在国产芯片圈子里,这样的数字确实还没有第二家能做到。华为还在积极构建昇腾的软件生态,CANN编译器已针对910系列芯片完成开源,Mind系列工具链全面开放,围绕昇腾生态聚集的合作伙伴已超过3000家。机构预测,至2026年,华为昇腾有望在中国AI芯片市场独占50%至62%的份额,展现出统治级的虹吸效应。
紧随其后的寒武纪同样动作频频。2026年一季度,寒武纪实现营收28.85亿元,同比暴增159.56%,归母净利润达10.13亿元,同比增长185.04%。尤为关键的是,公司经营现金流转正至8.34亿元,为上市以来首次季度现金流为正。2026年初,新一代旗舰云端AI芯片思元690实现量产,采用双die封装设计,FP16算力超过700 TFLOPS,配备196GB HBM3高带宽内存,实测互连带宽超890Gbps,相比上一代思元590实现了算力翻倍和显存翻倍的跨越式升级。思元590系列也已实现全场景规模出货,预计2026年出货量将达30万颗。基于自研MLU架构的思元370在同等算力下价格仅为英伟达A10的三分之一,性价比优势显著。在客户拓展上,字节跳动已累计部署超过十万张思元590/690芯片,阿里巴巴云正在测试思元690与其自研处理器的协同计算,腾讯则将思元590批量部署于微信视频号、腾讯云等场景,用于内容审核与智能推荐。据摩根士丹利分析师预测,2026年寒武纪有望在市场中占据约14%的份额。
海光信息则走出了一条差异化的路径,凭借“CPU+DCU”双轮驱动战略稳步扩张。2026年一季度,海光信息实现营收40.34亿元,同比增长68.06%;归母净利润6.87亿元,同比增长35.82%。公司总经理沙超群在业绩会上表示,未来三到五年,智算中心竞争将从比拼建设规模转向能效比、集群利用率与全生命周期综合成本等方面的比较。海光的DCU产品深算三号已与DeepSeek、Qwen3等365款主流大模型完成适配,覆盖全球99%非闭源大模型。在技术路线上,深算二号采用类CUDA通用并行计算架构,极大降低了开发者的迁移门槛,其AI训练效率已可达英伟达A100的80%,实现了在兼容性与性能之间的精妙平衡。
在GPU赛道,“国产GPU四小龙”的命运引人注目。摩尔线程于2025年12月在科创板上市,成为国产GPU第一股,2026年一季度实现营收7.38亿元,同比增长155.35%,归母净利润2936万元,成为首家实现季度盈利的国产GPU上市公司。基于第四代MUSA“平湖”架构的MTT S5000,单卡AI稠密算力高达1000 TFLOPS,已成功完成中国移动九天35B大模型的适配。
沐曦股份于2025年12月登陆科创板,IPO募资41.97亿元,上市首日股价一度冲至895元/股,市值超3300亿元。旗下曦云C系列GPU高度兼容CUDA,全国产工艺曦云C600预计于2026上半年实现量产销售,下一代曦云C700性能接近英伟达H100,已完成大部分核心设计和功能验证工作。公司同步推进全球化战略,已宣布启动H股上市进程。壁仞科技则于2026年1月登陆港交所,成为“港股GPU第一股”,市值超1300亿港元。公司的BR106、BR110、BR166三款芯片均已量产,下一代旗舰产品BR20X预计2026年商业化上市。壁仞科技在“四小龙”中主打千卡级集群、Chiplet及光互连技术,率先实现相关技术商用,2024年已成功为电信客户交付1024-GPU智能计算集群。
此外,天数智芯也在港股上市,2026年初公布了四代架构路线图,推出边端算力产品“彤央”系列,完成了“云+边+端”的全场景算力布局。龙芯中科和景嘉微也在各自的细分赛道上加速突围——龙芯中科首款自研GPU 9A1000已完成流片,AI算力达40TOPS;景嘉微正推进“高性能GPU+边端侧AI SoC芯片”双轮驱动战略,JM11系列GPU已实现商业化落地。
在这份长长的厂商名单中,我们必须厘清“AI芯片”的广义概念。当前国产AI芯片赛道的竞争,早已不再是单一厂商的角逐,而是演变为华为、寒武纪、百度、阿里、海光信息以及“四小龙”之间一场关于技术路线、生态建设与商业落地能力的多重竞赛。
各家厂商殊途同归——有的走DSA路线,有的走GPGPU兼容路线,有的坚持CPU+DCU双轮驱动——但目标一致:在国产替代的历史浪潮中抢占更大的市场份额。据摩根士丹利分析师Charlie Chan发布的行业研报,预计2026年国内AI加速芯片市场将出现更为清晰的层级分化:华为凭借昇腾系列拿下约62%的市场占比,寒武纪紧随其后占据14%,百度与阿里依托自研芯片各自瓜分约5%的市场份额,头部ASIC厂商稳稳把持国内绝大部分算力市场。
随着国产AI芯片厂商在资本市场上的全面集结——从寒武纪、海光信息、景嘉微等A股先行者,到摩尔线程、沐曦股份登陆科创板,再到壁仞科技登陆港股、燧原科技过会,以及昆仑芯启动科创板上市辅导——中国AI芯片产业正在从单点突破走向体系化竞争的新阶段。国产替代的趋势已从政策驱动转向市场驱动,一个以自主架构为根基、以规模商业化落地为目标的AI芯片新时代,正在加速到来。