标签

国产算力崛起,科大讯飞引领AI硬件新浪潮

发布时间:2026-05-07 16:10来源:微信阅读:7

科大讯飞坚持自主研发的道路正赢得愈来愈多企业的效仿,国内算力能力正迅速从能够运行发展到高效易用。

文/每日资本论

在2024年5月6日,中国股市迎来了一场备受全球瞩目的AI硬件领域盛事。科创50指数一度上涨超过9%,最高触及1715.08点,距离其历史最高点仅一步之遥。权重股表现强劲,海光信息股票涨停,涨幅达到20%,寒武纪股价也突破了1900元/股。在此之前一天公布的数据宝AI应用50强榜单中,世纪华通和科大讯飞以千亿级市值位居前列。

推动本轮市场行情的一个因素来自海外。不久前,纳斯达克指数创下历史新高,标普500指数也刷新了收盘纪录。美光科技的首席执行官Sanjay Mehrotra在接受CNBC采访时表示,人工智能产业仍处于“早期阶段”。他认为,随着推理规模的扩大,对Token的需求将持续增长,而当前产业面临的核心问题并非需求或定价,而是供应的极度紧张且难以快速增加产能。

有趣的是,被誉为美股“AI之王”的英伟达近期股价却连续下跌。一些网友评论称,“科大讯飞的业绩说明会上提到,在国产算力华为950上训练出了更大参数的模型,英伟达的股价因此应声下跌。”

虽然这番话可能带有调侃意味,但包括中国投资者在内的全球资本已经用实际行动表明:算力就是未来的新石油,内存才是决定性因素。更重要的是,网友们的观察是敏锐的——在全国数千家上市公司中,科大讯飞看似普通的市值和排名背后,隐藏着一个非同寻常的事实:它是当前中国主流大模型中唯一一家坚持使用全国产算力完成全栈模型训练的厂商。

请注意!在资本市场,部分投资者对全国产算力的认知存在误区:许多人认为只要能在国产芯片上实现推理就意味着自主可控,将“适配”与“训练”混淆。但科大讯飞团队给出的答案非常清晰——训练和推理是两个难度截然不同的挑战。能够轻松应对后者,并不代表就能解决前者。只有两者都能独立完成,才算得上是真正的全栈自主可控。

在这个投资者将AI芯片视为战略资产的时代,当大多数同行还在竞相囤积英伟达显卡,并将国产算力视为“备选方案”时,科大讯飞选择了这条不留后路的道路。这不仅规避了海外算力依赖的风险,还在技术突破和商业应用中展现出独特的竞争优势。正如股吧里的网友所评论的那样:“我来了,仰望吧!”

构建算力“延安”

故事要从两年前说起。2023年10月24日,科大讯飞在星火大模型发布会上首次提出了“全国产算力训练”的技术路线。当时,行业内多数企业仍将海外算力视为大模型训练的唯一可行选择。这一决策并非一时冲动,而是基于对AI产业发展规律和国家战略需求的深刻理解。

“只有能用国产芯片训练出大模型,才有未来。”科大讯飞董事长刘庆峰在多个场合强调这一观点。但“训练”比“推理”要困难得多。推理就像一位翻译家在台上流利地背诵演讲稿,而训练则像是从零开始学习一门新语言——需要大量的试错和反复调整,稍有不慎就可能前功尽弃。这或许是国产算力生态系统中鲜为人知的“硬骨头”。

而科大讯飞正是啃下了这块硬骨头。在华为昇腾910B集群上,科大讯飞经历了漫长的磨合与攻关。具体来看,910B与英伟达H200芯片在硬件上存在显著差距——前者显存容量为64GB,后者为141GB;带宽方面,1.6TB/s与4.8TB/s的差距意味着数据传输效率几乎相差一半。但这还不是全部。在远程带宽、多卡互联稳定性以及对FP8等低精度格式的支持能力上,国产芯片与英伟达最新一代B系列芯片相比,差距更是达到了数代。

如果说在英伟达的CUDA生态上训练大模型,就像驾驶一辆自动挡汽车在高速公路上行驶,那么在全国产算力上做同样的事情,则像是要自己从头组装一辆赛车,然后开上一条尚未完全打通的山路——随时可能遇到意想不到的障碍和中断。

正是这种现实情况,导致绝大多数中国AI公司仍然选择在英伟达平台上完成模型训练,仅在推理阶段进行本地化适配。这并非一个简单的商业选择,而是一个务实的技朮路径。

但科大讯飞坚持选择了另一条道路。“过去几年,我们与华为合作进行了大量的国产化适配和创新工作。”刘庆峰在业绩说明会上回顾道,“从开箱状态下的训练效率不足同规模A800集群的30%,到去年在910B集群上攻克长思维链强化学习和首个昇腾原生MoE(混合专家模型)的全链条训练效率难题,我们将训练效率分别提升至84%和93%。”

4月29日,科大讯飞还发布了一款备受关注的模型——星火X2-Flash。这款采用MoE架构、总参数为300亿的模型,不仅完全基于华为昇腾910B集群训练完成,更在关键性能指标上实现了一项看似不可能的突破:它在深度研究报告、Skill管理与调用、系统控制与执行等多种智能体常用任务上的表现,竟然接近了业界万亿级参数模型的水平。

这好比一个轻量级拳击手打出了重量级拳王的力量。

其背后的技术秘密体现在三个层面。首先是数据。针对智能体数据轨迹长、逻辑复杂等挑战,科大讯飞在国产算力上构建了可自验证的星火大规模智能体数据自动合成平台。该平台的独特之处在于,它依赖Agent自主搭建环境并检测结果的准确性,从而形成高效的数据闭环——不是由人类为机器标注答案,而是让机器自己建立验证标准。

其次是模型结构。科大讯飞在国产算力上首次实现了DSA(稀疏注意力)与MTP(多token预测)的结合,进行了高效的长文本训练,将上下文窗口扩展至256K。效果惊人——通过对国产芯片算子和分布式训练策略的深度优化,训练效率与同规模A800集群相比大幅提升。这意味着过去需要等待五天的训练任务,现在一天多一点就能完成。

最后是在智能体强化学习训练场景中,通过算法创新与工程创新的叠加,采样推理效率在非DSA结构的基础上提升了2倍以上。这一突破有效缓解了910B在长交互场景下采样效率过低制约强化学习训练的问题,为后续的大规模对齐训练扫清了关键障碍。

如今看来,这项工作对科大讯飞而言在技术上已无障碍,但达成这一成就的背后,是讯飞团队跨越的一个个技术鸿沟和“从0到1”的突破。

自主之路的商业可行性

当然,要实现技术突破,持续高强度的研发投入是必不可少的。2025年,公司研发投入金额达到53.64亿元,同比增长17.12%,占营收比重高达19.79%。这一比例远超行业平均水平。即便在人工智能自主可控领域保持高强度投入的情况下,科大讯飞依然实现了全年营业收入、毛利、归母净利润、扣非净利润、经营性现金流净额等核心经营指标的正向增长,展现出技术投入与商业回报的良性循环。

科大讯飞2025年年度财报显示,公司实现营收271.05亿元,同比增长16.12%;归母净利润8.39亿元,同比大幅增长49.85%;扣非净利润2.64亿元,同比增长40.47%。更为亮眼的是,销售回款总额超过274亿元,较去年同期增长超过45亿元。报告期末,经营活动产生的现金流量净额为32.08亿元,这两项数据均创历史新高,彰显了业务的强劲活力和良好的现金流管理能力。

进入2026年一季度,科大讯飞的收入、毛利、归母净利润均持续改善。一季度实现营收52.74亿元,同比增长13.23%;当期回款金额达57亿元,再次超过当期收入。此外,公司合同金额同比增长28.16%,境外收入同比增长167%,业务继续保持良好的发展势头。

值得注意的是,科大讯飞的海外业务在2025年实现了规模化增长。围绕数字营销、AI硬件、多语种技术授权以及B端产品解决方案等核心业务,公司聚焦东南亚、中东、美国、日韩等关键市场,实现营收同比暴增275%,增长势头强劲。这一成就打破了“国产算力大模型难以走向国际市场”的固有观念,证明了自主可控的技术路线同样具备全球竞争力。

从模型训练到应用落地的全链路贯通

令人惊喜的是,科大讯飞的自主研发之路并非闭门造车,而是构建了一个开放共赢的生态体系。

依托星辰MaaS底座及星火大模型,讯飞开放平台的三方开发者大模型日均Tokens调用量同比增长4241%,三方开发者调用量实现跨越式增长。截至2026年3月底,这一数据仍在持续攀升。公开数据显示,国内目前日均Token调用量已超过140万亿,远高于2024年初的1000亿,两年内增长超过千倍。因此,甚至有人认为台积电的芯片产能已成为全球AI发展的瓶颈。

面对推理算力需求的爆炸式增长,科大讯飞通过“软硬一体”战略提升效率。星火X2依托讯飞“飞星二号”全国产智算训练平台,从数据采集到推理部署的全链路均采用国产算力。通过量化优化,单台昇腾服务器即可运行,大幅降低了企业的部署门槛和成本。在行业场景深度适配方面,基于X2底座的医疗大模型在智能健康分析、报告解读等任务上达到了甚至超越了国际主流模型的水平,展现出国产大模型在垂直领域的独特优势。

在AI应用落地方面,科大讯飞形成了“技术突破-行业适配-商业落地”的闭环。2025年,“星火行业分析师”成为国内首个通过工信部考试认证的行业分析AI应用,在《大数据分析师技术水平考试》中获得92分,超越了85%的人类考生,标志着AI技术在专业领域的应用达到了新的高度。同时,公司以AI场景化落地为重要的技术研发方向,以AI Agent技术为核心抓手,打破了“技术与业务脱节”的行业痛点,在教育、医疗、汽车等领域创造了实际价值。

这种生态构建的价值在AI应用市场中日益凸显。数据宝在AI应用概念板块中统计的AI应用50强股票中,科大讯飞和世纪华通均以超过千亿市值位居榜首,市值最低的华凯易佰也超过50亿元,这反映出市场对AI应用商业化前景的高度认可。多家券商表示,从中长期来看,产业趋势向上的科技成长等高景气领域仍然是重要方向,政策支持与产业突破的共振,使得AI科技依然是A股的主线,未来AI应用落地有望加速。

量子计算+AI的颠覆性突破

站在算力革命的十字路口,刘庆峰对未来有着清晰的判断:“如果未来AI算法能够与量子计算相结合,那么有望一次性解决算力瓶颈和电力消耗问题,一台设备就能完成目前所有的训练和推理需求。”他预测,未来大约5年左右,量子计算与AI的结合有望出现重大的颠覆性突破,这将彻底改变当前AI产业的算力格局。

在此之前,科大讯飞将进一步巩固其“自主可控、行业落地、软硬一体、多语种”的独特战略生态位。2026年,科大讯飞将继续加大对国产算力的投入,优化“飞星二号”智算平台,提升训练效率和模型性能,同时推动星火大模型在更多行业场景的深度应用,尤其是在教育、医疗、汽车等优势领域,打造更多标杆案例。

随着国产算力技术的不断成熟,科大讯飞的自主发展之路正吸引越来越多的追随者。在国内市场方面,国产大模型DeepSeek V4宣布全面适配华为昇腾NPU,成为首个在官方文档中获得国产芯片认证的万亿参数模型,成功验证了昇腾承载顶级大模型的技术实力。这一趋势表明,国产算力正从“可用”向“好用”转变,为中国AI产业的自主发展提供了坚实的基础。

“唯一”这个词从来都意义非凡。在中国企业普遍将自主可控视为生存底线的当下,经历了海外算力被反复“卡脖子”的困境后,这条独立、漫长却日益宽广的道路,正从当年被认为是“备胎路线”,逐渐成长为AI本土化的战略航道。如果说几年前,人们还在追问“为什么要选择全国产算力”,那么如今的问题已经变成了“为什么还不选择全国产算力?”

【本文仅供交流参考,不构成任何投资建议,请注意投资风险。创作不易,若您手机尚有电量,请不吝点赞、转发。祝各位读者在2026年怀揣喜乐之心,迎接新年,积攒福气,奔赴四季顺遂!】