标签

创新枯竭时代,人工智能能否重启思想繁荣?

发布时间:2026-06-25 06:16阅读:2

经济学中有一个几乎无人质疑的基本观点:一个国家实现持久富裕的根本动力,归根结底只有一项,即新思想,经济学家所称的ideas。资本会老化,人力有极限,石油终将枯竭,唯有优质的创意能被无数人同时使用而不损耗。增长理论围绕这一点探讨了一个世纪,结论始终如一:思想是复利增长的唯一引擎。

然而这台引擎背后,隐藏着一个日益紧迫的警示:新思想的发掘正变得越来越困难,而且这种困难有数据可循。这一判断最著名的提出者,是斯坦福大学的查尔斯·I·琼斯,人称查德·琼斯。他毕生致力于同一件事:为“思想从何而来”这个问题,打造一把能够精确度量的标尺。

就在这套略显悲观的论断即将被证实时,人类创造出了一台号称能批量生产思想的机器:人工智能。琼斯的整套理论,被推到了一个它从未预见过的十字路口。更耐人寻味的是,同一套理论,在他自己手中,对这台机器给出了两个截然相反的判断。而在这两个判断之上,还压着一个更大的、连他自己也未曾挑明的问题:人类能否找到足够多的思想,去构建一台能持续发现更多思想的机器。

增长理论里有一个不太直观、却被反复验证的结论:长期来看,推动一个国家持续繁荣的,几乎只有一样东西,新思想。资本会折旧,劳动力会触顶,自然资源会耗尽,唯独思想不同。保罗·罗默在1990年清晰阐述了这一点,并因此荣获2018年诺贝尔经济学奖:思想是非竞争性的,non-rival。一块面包你吃了我就无法享用,一个定理你运用了我照样能用,全世界同时使用,它丝毫不减。正因可以无限复制、无限叠加,思想是唯一能支撑复利式增长的动力。

罗默的模型虽然精巧,却有一处与现实不符。按它的逻辑,投入研究的人力越多,增长率就该越高。可二十世纪的事实是,研究人员数量激增数十倍,美国人均收入的增长率却稳稳维持在每年2%那条线上,纹丝不动。琼斯在1995年弥补了这一缺陷。他的修正后来被称为半内生增长,semi-endogenous growth:长期增长率并不由你投入多少研究力量决定,而是由人口增长率托底。多投入研究,能把经济抬到更高的水平线上,却换不来更陡的斜率。说到底,这是一个关于人的理论。增长能跑多快,取决于你拥有多少颗能产生思想的头脑。

如果说思想是引擎,那么琼斯职业生涯中最著名的一篇论文,讲的是这台引擎正变得越来越耗油。2020年,他与尼古拉斯·布卢姆、约翰·范·雷南、迈克尔·韦布合著的《思想是否越来越难找?》,给出了一个让整个领域铭记许久的判断:思想,确实越来越难发掘了。

他们的算法很朴素。长期增长可以拆解为两项的乘积:有效研究人员的数量,乘以他们的研究生产率。然后他们一个领域一个领域去度量后面那一项。摩尔定律是最清晰的例子。芯片上晶体管的密度每两年翻一番,这条规律支撑了半个世纪,可维持它所需要的研究人员,2014年是1971年的约18倍。同样一次翻番,今天要动用的人力是当年的十几倍。半导体研究的“性价比”,每年下滑约**6.8%**。农业、医药,放眼望去几乎都是同一幅图景:产出的思想以大致恒定的速度涌现,而为了让它恒定地涌现,投入的人力和财力在指数式地膨胀。

这给增长描绘出一幅近乎悲观的底色。所谓稳定的2%增长,不是因为思想源源不断,而是因为我们把一支指数式膨胀的研究队伍,扔进了一条正在收窄的矿脉,两股力量相互抵消。文艺复兴式的通才早已消亡,今天的突破来得更晚、更靠人海、更靠分工。(这个判断并非没有争论。也有经济学家认为,问题不在创造力枯竭,而在市场没把创造力兑换成回报。但底色的方向,多数人是认同的。)

把前两节叠在一起,会看到第三件事。琼斯的理论说,增长被两样东西束缚:你拥有多少颗头脑,以及这些头脑在每个领域里多快撞上“思想越来越难找”的那堵墙。两道约束,落点都在人身上,因为思想得由人来构思。

而人工智能,如果真能做到其鼓吹者所说的,恰好是历史上第一项同时撬动这两道约束的技术。它不增加人,它制造头脑。人工智能实验室反复描绘的那幅图景,一座装满虚拟天才、昼夜不停产出思想的数据中心,翻译成琼斯的语言,就是把“有效研究人员的数量”这一项,从受制于人口,变成可以靠堆叠芯片任意放大。一旦产生思想的不必再是人,那条给增长托底的人口约束,就被直接抽掉了。

把它落到那18倍上看。过去维持2%的增长,靠的是一支指数膨胀的研究大军,每一次翻番都要多征召成倍的人,而人,要生育、要抚养、要二十年才长成。人工智能头一回让这支军队的扩编绕开了产房:一个研究者可以像文件一样被复制,开出上千个分身,每个按百倍速度、昼夜不歇地运转。罗默当年说,思想是非竞争的,一个定理你用我也能用;人工智能把非竞争性又往上抬了一层,连“想出定理的那颗头脑”本身,都变得可以无限拷贝。先前每一项技术,从蒸汽机到互联网,都只是把现有的研究者变得更能干,是一把更趁手的工具;人工智能要做的,是直接增产研究者本身。这才是它或许不只是又一项通用技术的原因。

这不是外人的揣测,而是琼斯自己算过的事。早在2019年,他和菲利普·阿吉翁、本杰明·琼斯合写的一篇论文就证明:在标准增长模型里,一旦人工智能能把生产思想这件事本身自动化,增长不光会加速,某些设定下还会在有限时间里冲向无穷,经济学家口中的“奇点”。那个一向以谨慎、以“这次未必不同”著称的怀疑派,亲手写下了乐观派最激进的那条定理。把他的框架当真,它许诺的不是温和的提速,而是爆炸。即使头脑可以复制,世界也未必可以被同样复制。

故事若在这里停下,琼斯就只是又一个增长爆炸的预言家了。但他的工具箱里还有另一只手,而这只手,把那股冲劲按了回去。

这只手叫弱环节,weak links。它的直觉,琼斯喜欢用1986年挑战者号航天飞机的失事来讲述。事后调查发现,致命的缺陷出在一圈叫O-ring的橡胶密封圈上:发射那天气温创下新低,橡胶变脆、密封失效,整架航天飞机随之解体。一条链子,无论别的环节多结实,要断,只断在最弱的那一环。经济学家迈克尔·克雷默受此启发,在1993年把这个直觉写成了著名的O-ring模型。

弱环节的要害在于:当各项任务彼此互补、缺一不可时,产出被卡在最差的那一项上,而不是被最好的那一项拉起来。琼斯和克里斯·托内蒂在最新的论文里,用这一点算出一个几乎像玩笑的结论。设想产出由两项任务合成,一项容易自动化的,一项很难自动化的。当两者以某种方式互补时,总产出近似于它们的调和平均:

这个式子有个冷酷的性质:哪怕你把容易那项做到无穷大,产出也只会逼近,被那个难的、没被自动化的环节牢牢摁住。

顺着这条逻辑,琼斯和托内蒂推出一个更一般的公式:把一项占GDP份额为的任务无限自动化,产出最多涨到原来的倍。然后他把公式对准了那个最被看好的场景,人工智能自动化软件。软件大约占美国GDP的2%。代进去:哪怕你造出无穷多的软件,把今天软件所做的一切任务全部免费、瞬时、无限地完成,GDP也只涨大约2%。

你不必相信公式,看看手边这台电脑就够了。它的算力是1970年代最好机器的约一亿倍,可你我并没有比当年的人聪明一亿倍。矩阵求逆快了无数倍,但该把什么数据填进矩阵、该检验哪个假设,还得人来定。被自动化的那部分变得又便宜又渺小,没被自动化的那部分,反而越来越贵、越来越占分量,最后由它来决定整个经济跑多快。这是威廉·鲍莫尔半个世纪前就讲过的“成本病”:一支弦乐四重奏今天演奏贝多芬,和两百年前一样,要四个人、花同样长的时间,生产率一点没涨,于是它的相对成本只会越抬越高。在琼斯的框架里,被弱环节卡住的整个经济,就是那支永远需要四个人的四重奏。

那人工智能驱动的机器人、乃至全能的AGI呢?把物理任务也交给它,把实验搬进模拟,瓶颈不就拆光了吗。这里要把两件常被混为一谈的事分开:能力,和结构。弱环节摁住产出,靠的不是某项任务能力不足,而是任务之间的互补,也只逼近,能力无穷,结构照旧。而这个结构,被三个毫不相干的领域各自撞见过一次,这通常意味着撞见的是规律本身,不是某一行的偏方。农学叫它李比希最小因子律:一块田的收成由最稀缺的那种养分定夺,氮加到天上去,只要磷是短板就一点不长;补足了磷,钾又成了新短板,瓶颈在养分间迁移,从不消失。计算机体系结构叫它阿姆达尔定律:一段程序若有5%不能并行,哪怕给你无穷多处理器,加速也封顶在20倍,因为那5%会膨胀到吃掉几乎全部运行时间。而阿姆达尔的加速上限(为可并行的比例),和琼斯那个产出涨,是同一个式子,他等于把阿姆达尔定律从一颗芯片搬上了整个经济。

于是问题缩到一句:为什么总剩下清不掉的一环?浅一层的答案在会计里,所有份额加起来永远是1,你把一项做到极便宜,它就缩向零、退出瓶颈的位置,把权重交给下一项还没攻下的,成功是自我抹除的。深一层的答案更要命:要自动化任务X,你得先有一个X的够保真的模型,而造出这个模型本身,通常是更难、更不可自动化的那一种活,因为它就是研究,就是产出一个新思想。机器人用仿真和强化学习清掉了走路,核试验被搬进了计算机,这些是真胜利,但它们成立的前提,是那门物理已被学透到模型不必再被现实纠偏,核爆的模拟,站在先前上千次真实爆炸标定出的方程之上。换成还没学透的系统,活体的药理、强关联的材料、混沌的湍流,造出那个可信模型,就是下一个最难找的思想。弱环节和“思想越来越难找”,到这里露出同一张脸:残差永远是“找出清除当前残差的那个思想”,而思想这个输入,本身正越来越稀缺。瓶颈于是不会被消灭,只会迁移,像壁纸下的气泡,这头压平,那头鼓起,只在你能同时处处压平的那一刻才真正消失。连瓶颈的终结者,自己都长着瓶颈。

还有一个方向的迁移,藏在“思想”这个词内部。把一个思想的一生拆开,它要先被生成,再被筛选、被验证、被解释,最后由某个人担责。人工智能头一个攻陷的是最左端的生成,候选从此可以无限便宜地量产;可弱环节顺着这条流水线往右迁,而越往右,验证回路越长,越离不开人。生成越免费,从一万个候选里挑出值得一验的那几个就越要命,品味成了瓶颈;验证要把候选摁回现实挨打,而现实有自己的钟;解释要把一个验证为真的结果接进人类既有的理解,那把尺子握在人手里;最右端的担责根本不是认知问题,是法律与信任,它要的是一个能签字、能被起诉、能在出错时担后果的人,而这是人工智能给不出的。机器把“想出来”变成了免费,“挑得准、验得实、讲得通、扛得住”于是成了全部稀缺所在,生成贬值,判断升值。

可故事还有更平的一面,它也是对怀疑派的考验。怀疑派从不否认人工智能能想出好思想,它甚至未必只会堆候选,它可能反过来侵入验证器本身:设计更好的实验,把实验室自动化,从一团乱的文献里挖出反复失败的暗坑和没人留意的规律,改进模拟、把更多现实系统拉进可算的范围,甚至帮着造出新的科学语言,让验证本身变便宜。所以真正值得盯的,不是人工智能会不会写论文、提猜想、生成代码,而是它能不能缩短“从猜想到可靠知识”那个闭环。能,它就不只是生成器,而开始啃下验证器;不能,它只会造出越来越大的候选堆,把瓶颈整个推给人的判断。怀疑派真正要说的,从不是人工智能想不出好东西,而是:除非它改造那条验证回路,否则思想的爆发,并不等于知识的爆发。

弱环节这枚硬币,还有另一面。“由最弱一环说了算”这条性质,在收益侧表现为迟滞,你得几乎修好每一环,好处才攒得出来;翻过来,在风险侧它表现为脆弱,毁掉任一环就够。慢与险,本是同一枚硬币的两面。

同一个人,先证明了增长可能爆炸,又算清了它为什么多半只会爬。这不是自相矛盾,这是把两股真实的力量,同时摆上了台面。

把这幅图景概括得最响亮的,是Anthropic的CEO达里奥·阿莫迪。他有一句广为流传的话:不久之后,我们会拥有“a country of geniuses in a data center”,一座数据中心里的天才之国。整家公司,某种意义上,押注在这句话会成真。而6月30日起,琼斯从斯坦福商学院休假,加入了Anthropic旗下的研究机构Anthropic Institute,继续他关于人工智能与长期增长的研究。在那里与他共事的,有安东·科里内克这样研究人工智能经济学的人。换句话说,那个造出尺子的人,走进了那座据说装满天才的数据中心。

他没有完整说明过为什么是现在、为什么是这里,以下只是推断,不是他的原话。但把他的研究和人工智能的走势叠在一起,理由并不难看出来。他大半生想测准的那个量,思想究竟从哪里来、能不能被一台机器重新批量造出,答案此刻并不躺在公开的统计里,而藏在实验室内部的能力曲线和算力账本里,要许多年后才会渗进GDP。一个一辈子隔着公开数字测量思想的人,如今有机会坐到那台也许正在制造思想的机器旁边。这个动机,和他全部的研究是严丝合缝的。

而他带进去的,其实不止一个问题。前面那枚硬币翻过来,就是它:弱环节让好处来得慢,也让坏处来得脆,毁掉任一环就够。一个在软件上超人、却被坏人拿去用的人工智能,攻进金融系统或一间病毒实验室,不必先解决所有难任务,只需踢断一环。好处是合取,风险是析取。所以他研究的,从来不只是“人工智能能让GDP多快增长”这一个问题,还有它的孪生:为什么收益被系统结构拖慢,风险却能从局部泄漏。而这个问题,一家造前沿人工智能、又把安全当命的公司,最需要它被回答。

于是把一位增长理论家请进人工智能实验室,就不只是装点门面。它至少有两种读法,而诚实要求两种都摆着。一种是:一家押注于“这次不一样”的公司,主动把一个最有分量的怀疑者请进内部,让他用自己的弱环节去捶打公司的故事。另一种没那么好看:把斯坦福的信誉借来,为一套既定的叙事背书。消息一出,就有人在琼斯的帖子下追问,要他公开和Anthropic之间关于研究独立性、保密协议的具体约定。这个问题问得对,而眼下,谁也答不上来。

琼斯自己的位置,才是要紧的。他不站在任何一端。他论文里反复出现的那句话是:真实的未来,大概落在两个极端之间,问题只是落在哪。他既不肯陪硅谷狂欢,也不肯陪末日论合唱。这种“身在局外、知之甚深”的悬置,本是一个学者最难守、也最值钱的姿态。它能不能在一家有立场的公司内部守住,是这次加盟真正待解的问题。

退一步看,这次加盟有一种近乎对称的况味。琼斯一辈子在问同一个问题:思想到底从哪里来,又为什么越来越难找。他造出半内生增长,是为了回答前半句;他写《思想越来越难找》,是为了量后半句。这套理论的全部用处,是判断一项技术能不能真正改变增长的速率,而不只是把它抬高一截。

而人工智能,是人类造出的第一台公开宣称要去制造思想的机器。它要正面回答琼斯问了三十年的那个问题,甚至要把那条“越来越难找”的曲线掰直。

所以他去Anthropic,不是选了一边,他是把尺子带到了被量的东西跟前。但这把尺子,不是一架中立的天平。他亲手把最强的武器递给了乐观派,那道奇点,又转身花了更大的力气,去证明这把枪暂时打不响。他把弱环节的强度设得很高,赌的是残差极黏,爆炸被推迟几十年,而非取消。到今天为止,那条“思想越来越难找”的曲线,还没有可见地拐头。一个人花半生打磨一件仪器,为的是量出增长究竟能不能被改变;如今它终于要对准那项唯一为改变增长而生的技术。它量得出爆炸,也量得出又一支永远要四个人的四重奏;琼斯的直觉显然更怕后者被低估,但他真正留下的不是答案,而是一把判断爆炸是否正在发生的尺子。

但琼斯的赌注,还不是这件事的底。人工智能唯一真正的新意,是让那颗会冒猜想的头脑,生成器,可以被复制。可复制不了的,是验证器,是判断哪个问题值得做、哪个结果可信的那套眼光,更是那道把猜想摁回现实去挨打的接地线。科学之所以可靠,从不在单个科学家多聪明,而在它是一台系统性地少犯错的机器,可靠性是过程的性质,不是头脑的性质。生成便宜,验证昂贵,接地最贵,因为现实不能被复制。把一千个天才装进数据中心,得到的不是一个国家,是一个非常聪明、却未经校验的稿件堆。而增长经济学过去几十年最硬的一条发现,与这个意象正面相撞:让国家富起来的,不是要素禀赋,不是人均智商,而是制度,阿西莫格鲁那一脉凭它拿了2024年的诺奖。照这把尺子,数据中心里的天才之国,若只是一堆高智商的模型,确实是个范畴错误,财富从不住在最聪明的那些脑袋里,而住在把脑袋绞成知识的那套制度里。但它未必停在那里:一旦这堆模型长出自己的分工、记忆、纠错、验证、激励,以及那道连向现实的接口,它就不再是一堆天才,而开始逼近一个“国家”,一座科学共同体。

退到比他更远的地方看,这样一台不断找出新思想的机器,人类其实造过至少三台:演化、科学、市场。顺着同一条逻辑,它们立刻显出真身,从来不是三堆聪明零件,而是三套制度,一套做选择,一套做检验与复现,一套做定价与协调,每一台都把自己的产出喂回自己的输入,每一台都自我改进。可四十亿年里,没有一台真正烧起来:“思想生出更多思想”这把火,从没有一次自己烧成燎原。不是因为零件不够聪明,而是因为把猜想筛成真知识,被协调、判断、接地这三道慢工摁着,火每烧到这三关就弱下去。这把尺子,四十亿年反复读出同一个数:始终没烧成片。复制天才,复制的是零件;要让它自己烧起来,得复制整座制度,而制度最要命的那道接地线,偏偏复制不了,因为现实复制不了。

但“复制”本就是错的动词。前面那条验证回路,只是其中一套制度,而制度从来不在人工智能之外,它本身就是一种技术,一种组织行为、分配信任、压低协调成本、存下错误教训的技术。于是人工智能最深的经济意义,也许不是当“研究者的替代品”,而是当“制度的改造器”:不只改造验证,还改造市场、组织、监管。改到那一层,它改写的就不再是某一个思想,而是生产思想的那条底层函数。

人工智能实验室造的,因此不只是更聪明的模型,是一套刚出生的知识制度,模型、人、实验、市场、安全约束绞在一起。真正待问的,从不是它多聪明,而是这套制度能不能稳定地产出真知识。而琼斯这位思想的经济学家,嵌进的就是这样一套制度,而不是一台更聪明的机器。一套制度能不能把聪明绞成知识,本就落在增长经济学的核心。于是那个连他也没挑明的问题,终于收成一句:在演化、科学、市场之后,它是这条序列里第一台烧起来的制度,还是第四台始终没烧起来的。