AI大模型争霸:为何仅中美能入局?
你是否思考过这个现象——
当下全球热议AI、大模型、ChatGPT,但细数核心玩家,翻来覆去仅有两个国家:中国与美国。
德国工业4.0口号响亮,至今却拿不出像样的GPT产品。日本工匠精神闻名,但其知名AI公司叫……抱歉,我思索半天仍无印象。法国奢侈品风靡全球、浪漫引领潮流,可法国的大模型……Mistral AI?听说过的不妨举手,我绝不取笑。
这绝非夸大其词。查阅最新AI企业榜单、融资排行、论文发表量,前十强中中美占据八席,剩余两席一个是欧洲独苗,另一个是阿联酋这类“财大气粗”的玩家。
那么问题来了:德国、法国、日本等传统工业强国,究竟被什么束缚了手脚?
接下来我们来剖析,这背后究竟是资金问题、人才问题,还是单纯的时代已变。
首先要明确一点:训练大模型这件事,本质上就是在烧钱,而且是疯狂燃烧。
你知道训练一次GPT-4的开销吗?
一亿美金。
注意,这仅是单次训练费用。不包含部署,非一次训练永久使用,单纯“跑一遍”就要一亿美金。
这相当于什么?
好莱坞大片制作成本约1-2亿美元。因此训练一次GPT-4等同于拍摄一部电影——而拍电影好歹能上画盈利,训练模型跑完一次,可能连水花都没溅起。
为何中美敢于如此投入?
美国依托资本狂热。OpenAI融资数百亿美元,孙正义的软银愿景基金、Dell、微软,一家比一家能烧。他们将此视为“人类未来”下注,赌赢了就是下一个苹果谷歌,赌输了……反正不是自己的钱。
中国则不同。
国家力量主导。新基建、数字经济、人工智能国家战略,政府牵头、资本跟进、国企民企齐发力。地方政府招商时,“AI大模型产业基地”已成标配,一个比一个能造势。
反观欧洲日本呢?
德国工业实力强劲,但西门子、奔驰、宝马这些巨头,再有钱也是上市公司,每笔开支都得向股东交代。砸一亿美元训练模型,万一失败,CEO会被董事会当场罢免。
日本处境更糟。
索尼、松下、丰田皆为巨无霸,但日本资本市场的逻辑是“不求有功但求无过”。搞创新?万一失败怎么办?还是踏实做精密制造吧,那个稳。
因此首要原因显而易见:并非不能烧,而是不敢烧、没动力烧。
资金是一方面,但光有钱不够,还得有人。
巧妇难为无米之炊,再多美元也堆不出AI博士。
当前全球AI人才分布如何?
全球顶尖AI人才,57.7%集中在中美两国。
57.7%意味着什么?剩余200多个国家和地区加起来不足一半。
聚焦学术圈更惊人——
在AI领域顶级会议NeurIPS上,论文作者中中国占37%,美国占32%。
中美合计69%,其余国家和地区共分31%。
你细品。
其他国家的人才去哪了?
德国人聪明吧?但德国最顶尖的头脑,要么奔赴硅谷,要么在慕尼黑工厂拧螺丝。日本人勤奋吧?但日本最优秀的程序员,30年前去索尼,20年前去任天堂,如今……仍是那些传统大厂。
欧洲日本的问题并非没有人才,而是留不住人才。
硅谷开出三倍薪资,北京深圳给出两倍半待遇,你走不走?
还有更残酷的事实:AI行业人才马太效应极其显著。
什么意思?
顶尖人才在哪,其他顶尖人才就涌向哪里。因为有同行可交流、有合作机会、有竞争对象。
一个AI实验室,聚齐10个顶尖人才,会逐渐发展为20个、30个,形成生态。
而那些未能形成生态的地方呢?
一位顶尖AI博士归国,发现周围全是传统IT工程师,无人讨论最新论文,无人协同调试,待着有何意义?
因此人才流失一旦开始,便停不下来。
有钱有人,还需工具。
训练大模型的核心工具是GPU,且必须是高端GPU。
最常用的是英伟达H100、A100等。一张H100售价多少?
约3万美元。
注意,是“一张”。
而训练一次大模型需要多少张?
数千张起步,数万张也不嫌多。
这好比什么?
就好比你开餐厅,一道菜成本100元,但需同时开启1万个炉灶。一道菜100万,你卖不卖?
更糟的是,有钱也未必买得到。
美国于2022年10月对华实施高端GPU出口限制,H100、A100等,想买?没门。
中国高端GPU缺口有多大?
40万张H100。
40万张乘以3万美元,即120亿美元的算力缺口。
中国如何应对?
国产替代。华为昇腾、寒武纪、燧原科技等国产GPU厂商近年飞速发展。虽性能与英伟达仍有差距,但至少能用。
而且中国还有一招:云计算。
你买不到GPU,但可租云服务。阿里云、华为云、百度智能云,租用服务器跑模型,不受出口限制。
欧洲日本呢?
出口限制?针对的是中国,而非日韩欧盟。
但问题是,他们想买也买不起、买了也不会用。
买得起GPU,但得有人会用。用了GPU,还需数据、算法、场景。
环环相扣,缺一环皆白费。
聊完算力,再谈数据。
AI大模型训练需要海量数据,而数据与人口规模、上网习惯密切相关。
中国网民有多少?
10.92亿。
这10亿人每日做什么?
刷抖音、发微信、点外卖、网购、打车、支付……每个行为都在生成数据。
你在抖音点赞,我在外卖APP下单,他在微信聊天——这些数据汇聚起来,就是一座金矿。
而且中国还有独特优势:完整的移动互联网生态。
何谓完整生态?
即从社交到支付,从电商到出行,从内容到服务,全能通过手机完成。
美国有Facebook、Google Pay、Amazon,但各自为政,数据分散。
中国呢?微信一个APP,社交、支付、生活服务全搞定。数据高度集中,训练AI的原材料自然充足。
欧洲日本呢?
欧洲的问题是“碎片化”。
德国人用WhatsApp,法国人用Messenger,意大利人用什么我都不清楚。数据分散在各平台,根本形不成规模。
日本更惨。
日本移动互联网发展早,但模式陈旧。日本人还在用现金、传真、实体印章。让这群人贡献高质量数字数据?
难。
因此数据这件事,再次印证了规模效应的威力。
14亿人口、统一的互联网生态、海量的用户行为数据——这些不是AI企业的资产,而是中国发展AI的先天禀赋。
说完经济基础,再谈政策。
中美两国在AI领域,那是真金白银地砸。
美国2024年AI融资多少?
1091亿美元。
占全球AI融资的多少?
78%。
全球AI投资,78%流入美国。
这是什么概念?
就是全球其他国家加起来,都不及美国的一半。
中国呢?
虽无确切数字,但从新基建到数字经济,从人工智能战略到算力中心建设,地方政府配套资金合计,怎么着也得几千亿人民币。
欧洲日本呢?
欧盟提出“AI法案”,说要规范AI发展。
日本提出“AI战略”,说要推进AI应用。
听起来都不错,对吧?
但战略归战略,钱呢?
欧盟“数字主权”喊了数年,结果欧洲有何拿得出手的大模型公司?
Mistral AI算一个,但融资仅数亿美元,与OpenAI的百亿相比,连零头都不到。
日本更别提了。
日本政府2024年AI预算约几亿美元。
几亿美元在北京深圳,能做什么?
可能就够租半年服务器,然后没了。
你看,政策若无资金支撑,就是空谈。
最后一个问题,也是许多人忽视的问题:产业生态。
中美AI发展,不只靠几家公司,而是靠整个生态系统。
美国有硅谷,有斯坦福、伯克利,有OpenAI、Google、Meta,有红杉、高瓴,有完善的创业生态。创业公司失败了大不了重来,再战江湖。
中国有北京中关村、深圳南山,有清华北大,有BAT、字节跳动,有红杉中国、高瓴资本,有“大众创业万众创新”的氛围。失败了?换条赛道继续卷。
欧洲呢?
欧洲有牛津剑桥,有西门子、空中客车,有扎实的工业基础。
但欧洲的问题是:太稳了。
创业失败,别人会认为你无能。投资人亏损,会被追责。因此大家不愿冒险,都想做“确定性高”的项目。
日本更稳。
日本企业文化讲究“终身雇佣”“年功序列”。年轻人想创业?父母首先反对,亲戚都觉得你不靠谱。
这种氛围下,谁去搞AI?
搞AI需要什么?需要冒险、需要试错、需要“死了再来”的心态。
欧洲日本的社会文化,恰恰与这种精神相悖。
说了这么多,你可能会问:其他国家是否彻底没机会了?
倒也不是。
印度AI人才输出迅猛,说不定哪天就诞生印度的OpenAI。
Mistral AI虽小,但好歹是欧洲独苗,说不定能长成参天大树。
阿联酋等中东国家,财大气粗,也在疯狂挖人建团队。
但说实话,AI大模型的格局,在2024年这个时间点,基本已尘埃落定。
中美双雄,其余都是陪跑。
这不是什么“美国打压”或“中国威胁”,而是综合因素的结果:市场规模、人才储备、资本投入、政策力度、产业链完整度,缺一不可。
其他国家想在AI大模型领域追上中美?
相当于在足球领域追平巴西、德国。
你可以说“一切皆有可能”,但概率嘛……你懂的。
因此认清这个格局很重要。
普通人怎么办?
别焦虑AI会取代你,先学会用AI工具赋能自己。
企业怎么办?
别想着搞大模型了,专注应用层吧。大模型是基础设施,应用才是核心。
最后送大家一句话:
时代给了中美一个机遇,他们把握住了。 其他国家看到了机遇,但只是观望。 差距,就是这样拉开的。
你认为AI时代还会出现新的挑战者吗?
欢迎留言探讨。
若有收获,点赞+在看,我们下期见。