美国科技分析师深入探访中国AI企业:算力困境下的创新突围
今年5月初,一个由美国科技分析师组成的考察团队踏上中国土地,在短短时间内密集走访了14家人工智能及机器人领域的企业。
考察名单涵盖:DeepSeek、月之暗面、MiniMax、智谱AI、字节跳动、阿里巴巴、蚂蚁集团、小米、零一万物、宇树科技、魔搭社区等中国人工智能代表性企业。
考察结束后,团队成员Kevin Xu、Afra Wang、Florian Brand、Nathan Lambert、Azeem Azhar、Lily Ottinger、Kai Williams、Jasmine Sun、Lingua Sinica、Caithrin等人相继发布了自己的观察笔记。
这些文章中蕴含着许多值得深思的洞见,阮一峰在最新一期网络周刊中对其进行了系统整理与摘录。
综合这些资料,可以归纳出以下11个值得关注的现象。
在几乎每一家中国人工智能企业,考察团都听到了同样的诉求:
算力不足。
算力短缺意味着实验次数受限、模型规模难以扩展、研发进度被迫放缓。
造成这一困境的根本原因,在于美国持续推进的芯片出口限制政策。
尽管中国企业仍能获取英伟达H100、B200乃至B300等GPU,但数量至少比美国同行少一个数量级。
而美国已经开始大规模部署最新的GB300 NVL72系统——由72颗最新GPU构成,其实时推理速度相比三年前的H100集群提升30倍,单卡内存提升3.6倍,单位推理能耗降低25倍。
中国企业目前无法获取这一级别的硬件。
国产芯片虽然进步显著,特别是华为在人工智能芯片领域实现重大突破,但今年发布的Ascend 950PR整体性能大致仍相当于2022年的H100,而且产能远低于英伟达。
据估算,到2025年10月,英伟达累计出货Hopper和Blackwell GPU约700万颗,并保持快速增长;而华为计划全年出货Ascend 950PR约75万颗,仅相当于英伟达去年出货量的十分之一左右。
考察团估算:
2025年底,美国人工智能行业整体算力约为中国的8倍,中国目前拥有的总算力,大约相当于美国2023年的水平。
他们曾向中国研究人员透露OpenAI内部的人均GPU资源,对方听后几乎难以置信。
但即便如此,OpenAI的研究员依然觉得算力远远不够。
美国大量算力主要用于训练下一代模型。
而中国情况不同。
中国企业必须同时承担两项任务:
如果一半算力用于线上推理服务,那么真正能投入模型训练的资源自然大幅减少。
此外,美国最顶级算力主要集中在OpenAI、Anthropic、Google、Meta和xAI五家公司。
而中国几乎所有互联网大厂都在训练自己的大模型,有限的算力资源进一步被分散。
按常理推断:
如果中国算力比美国落后两年,那么模型能力也应该至少落后两年。
事实却完全不是这样。
目前业内普遍认为,中国顶尖模型仅落后美国几个月,部分能力甚至已经并驾齐驱。
考察团认为,一个重要原因就是:
芯片限制反而逼出了更高的计算效率。
他们观察到,中国企业单位算力能够发挥出的人工智能能力,是简单堆算力方案的4~7倍。
也就是说,中国公司正在用算法优化和工程能力弥补硬件不足。
算力差距巨大,但模型差距却没有同步扩大。
目前全球最优秀的开源大模型,大多来自中国。
但对于是否继续坚持开源,中国企业内部出现了明显分歧。
随着模型参数突破万亿规模,一条新的分界线开始形成。
一部分公司认为:
万亿参数模型几乎无法本地部署,而开源最大的价值就在于本地运行,因此继续开源意义不大。
更合理的方式,是部署在自己的云平台,只开放API接口供用户调用。
而另一部分公司则认为:
开源不仅是一种商业策略,更是一种信仰。
对于他们而言,打造万亿参数模型,本身就是进入全球开源第一梯队的门票。
考察团发现,中国人工智能企业正在形成两种截然不同的发展风格。
第一种,典型硅谷风格。
办公室开放自由,文化年轻,品牌设计国际化,甚至赠送的周边产品都充满科技感。
第二种,则越来越“中国化”。
企业投入大量资源建设豪华展厅,重点接待国企负责人、地方政府领导以及各类参访团,参观结束后往往还有正式宴请。
考察者认为,这既是企业主动选择,也是现实环境所决定。
创始人背景不同,业务方向不同,自然形成不同的发展路径。
几乎所有受访企业,都高度评价字节跳动的Seed团队。
这是目前中国唯一真正意义上的闭源前沿人工智能团队。
考察者形容:
它像房间里的大象,却又在优雅起舞。
依托豆包庞大的用户基础,字节拥有其他公司无法复制的流量优势,新模型可以第一时间推向海量用户。
而DeepSeek,则成为业内最受尊敬的基础能力提供者。
越来越多公司依赖它在模型架构、推理优化、计算效率以及华为生态适配等底层能力上的贡献。
令人惊讶的是,许多中国人工智能公司的核心研发成员,竟然是实习生。
他们平均年龄只有二十五六岁,大多数仍在攻读博士学位,却已经承担正式员工职责。
不仅享受完整权限,还可以自由提出方案、设计实验、参与模型研发。
相比之下,OpenAI、Anthropic、Cursor几乎没有实习制度。
即使Google提供Gemini实习,也很少参与真正核心项目。
中国企业更愿意相信年轻人。
因为他们拥有更新鲜的想法、更旺盛的创造力,也更愿意承担那些不起眼但决定模型质量的基础工作。
另一方面,中国高校自身算力有限,把优秀学生送到拥有大量GPU资源的企业,一边参与研发,一边联合发表论文,也实现了校企双赢。
考察者曾问年轻研究员:
如果AGI真的出现,你怎么看?
几乎所有人的回答惊人一致:
“AGI,就是人工智能可以取代我。”
更有趣的是,他们没有表现出恐惧。
相反,他们充满好奇。
如果机器真的能够超越创造者,他们愿意去尝试新的工作、新的人生。
相比之下,西方人工智能研究者更加关注AI安全、伦理以及社会风险。
中国研究者同样认为人工智能不能作恶,但普遍相信:
如何约束人工智能,最终应该由政府制定规则并负责治理。
外界一直有一种观点:
中国软件付费意愿低,因此人工智能市场规模有限。
考察团认为,这种判断可能存在误区。
中国SaaS市场确实不大,但中国拥有全球最大的云计算市场之一。
关键问题在于:
企业究竟把人工智能看成软件,还是看成云服务?
如果答案偏向云计算,那么中国人工智能市场的商业空间将远超传统SaaS模式。
目前的发展趋势,也越来越偏向后者。
美国头部人工智能公司每年在训练数据和强化学习环境上的采购投入高达数千万美元,累计投入甚至达到数亿美元。
考察团原本认为中国也会如此。
结果发现,中国几乎没有成熟的数据产业。
很多企业认为外部数据质量不高,因此更倾向于自己构建训练数据和强化学习环境。
像字节跳动、阿里巴巴等大型企业,都建立了自己的内部数据标注团队。
相比直接购买数据,他们更相信自主生产数据。
如果美国人工智能背后站着红杉资本、a16z等顶级风投,
那么中国人工智能背后的最大推动力量是谁?
考察团得到一个颇有意思的答案:
上海、北京、杭州等地方政府。
地方政府官员在强烈的竞争意识和"害怕错过人工智能时代"的压力驱动下,正以前所未有的力度推动本地人工智能产业发展。
某种意义上,他们已经成为中国人工智能生态最积极、最坚定的幕后投资者。
这次美国考察团最大的感受,可以归纳成一句话:
中国人工智能最大的短板,是算力;最大的优势,是效率。
在硬件资源明显落后的情况下,中国企业依靠算法优化、工程能力、年轻人才和快速迭代,正在不断缩小与全球顶尖水平的差距。
未来人工智能竞争,或许不再只是GPU数量的竞争,更是组织效率、人才密度、工程能力和产业生态的综合较量。