标签

物理学家视角下的AI科学应用变革

发布时间:2026-04-28 09:51来源:微信阅读:5

图源:Unsplash / Andres Siimon

摘要:

本文提出,人工智能的飞跃,特别是大型语言模型的崛起,其核心意义并非仅仅在于自动化,而在于复杂信息和人类专业知识(know-how)的承载、复制与共享方式发生了根本性转变。从这一视角审视,AI for Science 之所以意义重大,是因为它有可能重塑的不仅是科研效率,还有科学协作、科学发现、科研出版和科研评价的整体生态。文章勾勒了 AI 从科研辅助工具向科研合作伙伴演进的路径,并探讨了 AI 如何可能彻底革新科研出版模式。同时,文章强调,若要 AI 在原创性科学发现中发挥实质性作用,持续学习和思想多样性是不可或缺的两大前提。

● ● ●

01

近年来,基于深度神经网络的人工智能发展迅猛,而其中大型语言模型(LLM)的出现,其影响尤为深远。在现代物理学中,信息的基础性地位日益凸显,甚至被认为是构成时空和物质规律背后更深层概念的关键。我认为,当前这一轮 AI 革命,同样可以从信息的角度来解读。

在分析一个复杂系统时,关键在于理解其中核心信息是如何被管控、承载和处理的。换言之,我们应该探究:最复杂的信息处理过程是如何实现的,它依赖何种载体,以及这些载体如何影响整个系统的整体动力学。据此来看,当下的 AI 革命并非单纯的技术迭代,而是地球信息动力学发展史上的一个新纪元。

信息动力学的三个关键转折

纵观地球历史,复杂信息的载体与处理方式经历了数次重大变革。每一次变革不仅加速了信息传播速度,也重塑了适应、学习和群体演化的模式。

首次重大转变是生命的诞生。以 DNA 和 RNA 作为信息载体,生命系统得以跨代存储、复制和演变其特征与行为。生物演化的可能性正是源于有用信息的持久性,它们不再随个体消亡而消失,而是能在漫长时间尺度上得以保存、积累并持续优化。此阶段,复杂信息的复制与处理已内嵌于生命本身。

第二次重大转变是人类语言的出现。语言使得经验、记忆与知识能够直接在个体间、代际间传递,无需依赖生物遗传。相较于遗传演化,语言与文化的演化速度显著加快。人类社会得以通过交流、教育和书写不断积累思想、制度与技术。因此,人类文明中最核心的信息动力学过程,从基于 DNA 的演化,转向了基于语言的文化演化。

第三次重大转变即为当前的 AI 革命。以人类语言为起点,AI 模型正日益能够在统一的框架内表征和处理包括文本、图像、音频、视频及结构化数据在内的多种信息。这意味着,人类历史上首次,最复杂的信息处理不再局限于人脑的范畴。以往的信息技术革命极大地改善了信息的存储、传输与检索,但深层次的解释、综合与判断仍依赖于人类认知。机器可执行明确定义的程序,却难以广泛参与复杂、开放式信息的灵活处理。

大型语言模型标志着一种质的飞跃。尽管它们尚未达到人类水平的通用智能,但其能力覆盖的广度已使其在众多信息处理任务上能与人类媲美。因此,本轮革命的意义不仅在于机器运算速度的提升或搜索效率的提高,更在于机器信息处理的复杂度已跨越了一个关键门槛。这正是 AI 革命应被视为人类历史上前所未有事件的根本原因。若说人类语言相对于生物演化加速了文明进程,那么在人与 AI 共生的时代,文明的演化速度可能将进一步加快,且发生在更短的时间尺度上。

大型语言模型革命带来的根本性改变

大型语言模型革命带来的最根本性改变,在于人类的 know-how(专业知识与技能)正变得能够被大规模复制与共享。在我看来,这一点的重要性超越了任何单一应用。在 AI 出现之前,人类已能通过书籍、论文、公式、软件和形式化指令来共享显性知识。然而,人类能力的重要组成部分并非完全显性存在,它更多地体现为 know-how:源于经验的判断、工作的直觉、解决问题的习惯、对语境的理解,以及在面对真实情境细微变化时的应对能力。

传统上,这类 know-how 只能通过紧密的个体互动来传递。它需要学徒式的训练、反复的练习、观察、纠正,以及往往持续多年的合作。教材可以阐述原理,却无法完整传达专家实际的工作方式;论文可以呈现研究结果,却通常不会详述那些失败的尝试、中间的判断、实践中的技巧,以及获得结果所依赖的语境理解。正因如此,知识可以被广泛传播,而经验却难以复制。这种局限性一直制约着人类能力扩散的速度。

大型语言模型正在从根本上改变这一现状。通过学习海量的人类语言数据,并在实际任务中与用户直接交互,AI 系统能够吸收并重现那些以往仅存于人类实践中的推理、解释、决策与任务分解模式。它们不仅存储显性的知识表述,还能具备可操作的专业能力:如何切入问题、下一步应询问什么、工作流程如何组织,以及如何将一般性原则应用于具体情境。

这也是 AI 能够带来新生产力的原因。它最深层的贡献并非狭义上的自动化,而是对人类 know-how 的大规模复制与分发。那些过去依赖面对面传授的能力,现在至少有一部分可以被编码进 AI 系统并广泛共享。从这个角度看,AI 拓展了专业经验的社会传播半径。它使得那些过去局部化、脆弱化、难以迁移的实践经验,变得更容易获取、复用与整合。

我认为,这正是 AI 革命的核心所在。关键问题不在于机器能否完成任务,而在于机器能否承载并传递那些过去只有通过高成本的人际教学才能传授的人类能力。一旦 know-how 变得可以规模化复制,教育、科研、生产和协作的组织模式都将随之改变。这是 AI 形成新生产力最根本的机制,也是其影响远超一般技术进步的原因。

02

基于上述观察,AI 革命将为各行各业带来根本性变革。在其众多应用中,对创新活动本身的改变或许最为重要,因为这种改变最有可能创造长期且深远的价值。因此,我们尤其需要深入探讨 AI 如何影响科学与技术领域,因为这些领域的核心任务是拓展知识边界并产生真正新颖的思想。在更早期的技术阶段,新工具可以提升科研效率,但并不能直接改变创新过程本身。相比之下,大型语言模型带来了这样一种可能性:AI 在科学发现中的角色,将不再仅仅是工具,更可能成为合作者。在本节中,我将首先回顾当前科学研究的主要挑战,然后讨论 AI for Science 所提供的机遇,最后探讨 AI 仍面临的难题及未来的发展方向。

科学研究的痛点

为了理解 AI 能为科研带来什么,我们首先需要回顾当前科学研究普遍面临的一些问题。尽管不同学科的挑战不尽相同,但有几类是高度共有的:

1. 时间成本:深入理解领域进展、学习他人研究成果需要耗费大量时间。

2. 隐性知识的流失:研究过程中积累的大量“中间”经验与数据往往无法完全体现在论文中,导致后来者不得不重新摸索。

3. 协作规模受限:科研合作的规模受到人际沟通成本的制约,因此大规模协作和跨学科合作都面临困难。

4. 行政性负担:撰写论文、审稿、撰写基金申请,以及研究结束后向他人解释工作内容等非创造性任务,会占用大量宝贵时间。

正如背景部分所述,这些问题的深层根源在于:显性知识可以广泛共享,而人类经验与 know-how 却难以转移。在科学研究中,这种差异尤为关键。论文可以记录最终成果、形式化方法和经过筛选的证据,但通常无法完整呈现一项工作究竟是如何完成的。科研中的许多关键要素都未被明确记录:如何选择一个值得研究的方向、如何规避无效尝试、如何调试实验或代码、如何判断一个意外结果是错误还是重大发现,以及当实际条件偏离论文中的理想假设时应如何调整方法。其结果是,每一位新入门的学生或新合作者,都必须花费大量时间去重建那些实际上已存在于学术共同体中、但未被完整传递的实践理解。这也是科研训练周期长、跨学科合作难、许多结果在实践中难以复现的重要原因之一。如果这一层面的科研 know-how 能够被更有效地捕捉和共享,那么科研协作的速度和结构都将发生根本性改变。这正是 AI 革命所开启的最重要可能性之一。

科学研究的智能体化

大型语言模型在科学研究中的应用已初见端倪,AI 智能体正在生物、数学、化学、理论物理和机器学习等领域辅助科研工作。尽管当前的应用仍处于探索阶段,但许多领域的研究者已识别出越来越多有价值的使用场景[1][2][3][4][5][6][7]。我相信,AI 最终将为各学科的科学研究带来根本性的巨大变革。同时,这种变革并非以一种预先设计好的系统形式突然降临。它更可能是在一个开放的学术共同体中被逐步探索出来的:在这个共同体里,人类研究者和 AI 系统共同学习如何协作,并一步步重塑科研流程。

我将这一过程称为科学研究的智能体化。这里的关键不在于 AI 成为更好的工具,而在于它在真实的科研工作流中逐渐获得更强的自主性、连续性和在场性。在本小节中,我将讨论这种变化的几个维度。大体而言,我将从近期、具体的变化入手,逐步过渡到更长期、更结构性的变化。

AI 使用科研工具

AI 参与科学研究的第一步,是让 AI 能够运用研究者实际依赖的工具[2][8][9][10][11][12][13]。在理论研究中,这包括计算软件、模拟包、编程环境、数据库和算力资源;在实验研究中,这则涉及仪器控制软件、数据采集系统、参数调节界面以及过程监控系统。缺乏这样的接入能力,AI 将始终被局限于对话框内,只能提供建议或解释,而无法直接参与真实的科研过程。

一旦 AI 能够使用科研工具,其角色将发生质的转变。它可以从“告知人类应该做什么”,转变为“直接完成工作的一部分”。随着模型能力的提升,这一能力起初可能体现在完成简单、重复性的任务,但它将逐步扩展到更长、更复杂的流程,甚至包括对意外情况的响应。从这个意义上说,工具的使用赋予了 AI 在科研世界中的“实体”。它使得 AI 能够贯穿整个过程持续存在,而非仅在零散的咨询时刻出现。

这一步之所以重要,不仅在于它能提升效率,更在于它对 AI 自身后续的发展至关重要。当 AI 被整合进真实的工作流程后,它就能接触到传统训练语料中缺失的重要科研数据和实践反馈。这些内容包括失败的尝试、中间状态、仪器运行情况、流程中的决策,以及高度依赖语境的调整。对于构建真正能够参与前沿研究、而非仅仅擅长课本式推理的系统而言,这类数据具有决定性意义。

重复性工作的自动化

在 AI 获得必要的工具接入能力后,接下来的优先事项并非立即探究其能否提出重大新思想。一个更实际且高产的起点,是先让它承担科研中那些常规、重复性的工作。这非常类似于初级研究生的成长路径。人类研究者也是先通过受限、可重复的任务来熟悉科研工作流程,然后才逐步做出更独立的贡献。AI 也应遵循类似的路径发展。

这一阶段涵盖文献检索、前人工作的梳理、标准流程的执行、理论或实验分析中可复现的部分、仪器调试、目标明确的测量、参数扫描、数据清洗,以及常规报告或总结的准备等。这些任务通常非常耗时,但并非原创性贡献的主要来源。