标签

前大模型从业者:中美AI差距或仍在拉大

发布时间:2026-04-27 23:25来源:微信阅读:10

内容摘要:

前字节跳动工程师、北京大学教授张池指出,中美在人工智能上的差距不仅没有收窄,反而可能进一步扩大。国内大模型过度投入“刷榜”和高分竞赛,真实落地效果却不理想;同时,训练数据质量不足、迭代周期比美国慢2到4倍、用户付费意愿偏弱,共同形成了不利循环。至于一些美国名人所谓“中国正迅速追上”的说法,或许更像是美国企业界释放出的“烟幕”。

尽管外界普遍认为我们在人工智能领域正逐步逼近美国,部分方向甚至已经占优,但一位前字节跳动工程师却认为,真实情况是双方差距还在继续拉开。

周末,北京大学助理教授、研究科学家张池在《进入亚洲》播客中表示:“我甚至不认同中国模型正在追赶这一前提——在我看来,我们依旧明显落后。很遗憾,我认为这个差距还在变大。”

张池表示,他曾在字节跳动的人工智能部门工作约一年,主要研究AI模型,之后又回到学术领域。他强调,并不否认中国AI初创公司发展很快,但如果美国进步得更快,就必须承认:即便我们在前进,双方差异也未必缩小,甚至可能持续扩大。这应当成为理解国内人工智能行业现状的重要前提。

一、中国大模型更在意基准测试成绩,但真实应用表现并不理想。

张池认为,虽然字节跳动、阿里巴巴等大公司开源或推出的大模型在基准测试里分数不错,但这并不等于它们在现实场景中同样优秀。理论上,我们的大型科技企业几乎都有拿得出手的模型,可真正落地时仍显不足。原因在于,不少大模型团队热衷于“benchmaxxing”,也就是更重视考试分数,而非实际效果。这有些像某些名校高中,把精力都放在提升高考成绩上,培养出擅长应试的学生,却较少关注创造力的塑造。

字节跳动和阿里巴巴都推出过知名AI模型——从类似Seedance的视频生成工具,到像Qwen这样的开源体系——但这些产品也因为深度伪造、版权争议,以及在真实环境中是否足够可靠,而受到用户层面的广泛质疑。

二、中美大模型在基础设施和训练数据上存在不易弥合的差距。

美国与中国大模型在基础设施上的明显差距,是最容易被外界看到的一层。这不仅体现在先进芯片难以获取、数据中心能力偏弱等硬件问题上,这些差距都摆在明面上。更深层、却不易被看见的差异,则在于训练数据的质量偏低。我们的模型往往拿不到足够高质量的数据,甚至有些训练数据还会被人为污染,这已成为国内大模型普遍面临的结构性短板。

而训练数据质量不足这一弱点,又很难被迅速扭转。因为其背后的两大原因更多是制度层面的,而不单是技术问题。比如,互联网中大量敏感词审查造成的语言污染;再比如,大模型应用像软件产品一样难以获得稳定付费用户,结果使AI的盈利方式走向偏门——类似互联网时代搜索引擎依靠关键词变现,进而导致训练语料甚至被刻意污染。

从逻辑上说,如果面对的是被污染过的大模型数据,那么模型拿到再高的理论分数,又能说明多少问题?

很多人不理解,为何国内大多数大模型公司热衷于、甚至依赖从领先的美国模型中提取数据,而不是自己搭建完整的数据管道。公开讨论多把这看作一条省钱省力的捷径,但往往忽视了背后的两个问题:第一,依赖美国大模型蒸馏,某种程度上可能是无奈之举,因为不少AI公司很清楚我们用于训练的数据质量并不理想;第二,美国三大模型巨头以及白宫都在加强对模型蒸馏的限制,这势必会压缩国内大模型的长期发展空间。

三、国内大模型的更新迭代周期通常是美国的2到4倍。

张池表示,差距持续扩大的一个关键因素在于速度。也就是说,美国顶级公司能够以更快节奏迭代大模型。

可以比较明确地说,谷歌能在三个月内完成一次完整的LLM训练周期,包括训练前准备和训练后优化。但字节跳动以及其他大多数公司的一轮模型迭代,往往需要半年,甚至更久到一年。

国内大模型迭代偏慢,既和投入规模有关,也与用户生态有关。

此外,更充分的用户反馈,对大模型优化有很大帮助。美国AI企业同样受益于更强的用户反馈闭环。像ChatGPT、Claude、Gemini这类产品,正是在与用户持续互动的过程中不断调整、持续提升,从而让模型随着时间推移越来越成熟。

相比之下,中国大模型更容易陷入一种负向循环。很多时候,国产模型初期表现一般,真正拿它们处理关键任务的人又不多,于是后续优化与更新便难以依赖真实用户反馈,导致原本基础不差的模型也很难继续提升。而用户反馈不足的重要原因之一,在于中国企业用户和个人用户的收入水平,往往难以长期承担大模型服务费用。比如社交媒体上的专业创作者,从平台获得的收入越来越少,使用付费大模型只会显著增加成本,却未必能同步带来收入增长。

四、不要沉浸在“我们正迅速缩小与美国AI差距”的想象里。

张池的判断,和媒体上一些最响亮的声音形成了鲜明反差。很多人认为,我们正快速逼近美国,甚至在某些方面可能已经走到前面。

国内媒体也经常引用英伟达CEO黄仁勋、特斯拉与space创始人马斯克等人的观点,来证明中国在人工智能方面有望与美国并肩,甚至实现反超。

黄仁勋曾提醒,美国人工智能存在被追赶甚至落后的风险;埃隆·马斯克也认为,中国在能源和算力上的优势,可能帮助其超过竞争者。人工智能先驱杰弗里·辛顿同样表示,美国的领先幅度可能没有外界想象得那么大,并警告这种优势可能随时间缩小。但人们往往忽略一点:这些美国企业家和技术领军人物的表态,并不一定是在为中国AI实力背书。树立一个假想竞争者、制造危机感、争取更多资本和政府支持,才更可能是他们发声的重要目的,这也一直是美国企业家和官员吸引社会资源关注某一领域的常见方式。

张池的说法,其实反映了国内人工智能生态内部一种更偏悲观的判断——即与美国的差距可能还在拉大。持这种看法的人或许并不少,只是表达得更含蓄。比如阿里巴巴董事长蔡崇信就认为,AI竞争最终更取决于部署速度,而不是模型在评分榜单上的表现。

三郎从2024年初起,也一直借助大模型快速获取全球及部分国家的经济数据、生成文章摘要、自动校对错字错词。从最初同时使用国内外六个模型,到如今主要依赖ChatGPT和Google Gemini,原因也在于国内大模型在真实使用中的体验确实难言理想。

三郎同样认同张池的判断:“客观来说,我认为短期内没有哪家中国人工智能公司能够迅速追上美国同类企业。”

推荐观看火星数据研究所视频:

【作者:徐三郎】