斯坦福2026报告:AI医学加速跃迁,治理滞后与体系重构
本文篇幅约5300字,预计阅读时长13分钟
本译文源自斯坦福HAI研究院发布的《The 2026 AI Index Report》(2026年AI指数报告)中的“第六章-医学”章节,旨在探讨全球AI在生物医药领域的进步、竞争态势、治理评估、教育适配及临床应用等前沿动态。报告通过剖析模型性能、普及率、基建、资本流向、科研突破及临床转化等核心维度,揭示出AI正以前所未有的速度渗透进社会核心系统,然而配套的评估工具、监管机制、教育体系及责任框架却明显跟不上步伐。
AI的发展势头愈发迅猛,但围绕其建立的治理、评测和数据基建却显得捉襟见肘。过去一年,AI的能力持续突破,以前所未有的速率渗透进企业、校园、医院、科研机构及公共治理体系。数据显示,生成式AI在人口层面的普及率已达53%,这一扩散速度远超个人电脑和互联网;组织层面的采纳率更是高达88%,四分之三的大学生已将生成式AI用于学习任务。与此同时,2025年产业界产出超过90%的前沿模型,部分模型在博士级科学难题、多模态推理及数学竞赛中已超越人类基准。AI并未陷入平台期,反而在能力、普及度及经济影响力上同步加速。
不过,技术扩张并未同步带来等量的可测性与可治理性。随着顶尖模型间差距收窄,评估工具的有效性反而降低。开放权重模型竞争力增强,美中模型性能差距几近消失,自2025年初以来两国模型多次交替领跑。美国在顶级模型数量及高影响力专利上占优,中国则在论文发表、引用量、专利总量及工业机器人安装量上领先。模型趋同导致传统基准测试趋于饱和,前沿实验室披露信息减少,独立复现也常遇困难。报告强调,AI能力增长与管理准备不足之间的鸿沟,已成为本轮扩张最突出的结构性矛盾。
放眼基础设施与产业格局,全球AI竞争愈发激烈。美国拥有5,427个数据中心,数量遥遥领先,能耗也居全球之首。投资方面,2025年美国私人AI投资达2859亿美元,远超中国的124亿美元;若计入政府引导基金,中国总支出不容小觑。美国创业活跃度同样拔尖,2025年获融资AI公司达1,953家,超第二名国家10倍以上。但美国吸引全球AI人才的能力在衰退,自2017年以来迁美的研究者与开发者数量下降89%,仅去年就降80%。这意味着资本、算力和企业生态虽仍高度集中于美国,但其人才流动的长期优势正逐渐削弱。
此外,AI的经济价值正以更直观的方式释放。2026年初,生成式AI工具为美国消费者创造的年价值约1720亿美元,用户人均价值中位数一年内激增三倍。研究指出,在客户支持和软件开发领域,AI带来的生产率提升约14%至26%;但在需高度判断力和复杂情境理解的领域,效果不佳甚至为负。值得注意的是,生产率提升显著的领域,恰好也是入门级岗位开始萎缩的领域。美国22至25岁软件开发者就业人数自2024年起下降近20%,而资深开发者人数却在增长。AI正在重塑劳动市场结构,尤其对初级岗位和标准化认知劳动的影响已初显端倪。
在科学领域,AI的角色正从加速单一研究步骤,迈向尝试替代整个研究流程。面向科学的模型虽在部分任务超越人类,但并非模型越大越好。前沿模型在ChemBench上表现优于人类化学家,但在天体物理学实验复现中得分低于20%,地球观测仅33%。而仅1.11亿参数的MSAPairformer蛋白模型,却击败了此前领先方案;2亿参数的GPN-Star基因组模型,也优于规模大200倍的模型。这表明在科学AI中,数据质量、任务专一性和训练方法往往比单纯堆砌参数更重要。与通用AI主要由产业主导不同,多数科学基础模型源于跨部门合作,反映了科研对数据、实验及验证链条的特殊要求。
医学是AI影响最为迅速的领域之一。2025年,AI在医疗领域的进展显著。分子生物学层面,AI模型已贯通从基因序列到蛋白结构再到治疗设计的全链条。2024至2025年间,AI驱动的蛋白研究增长约71%,相关论文从2,259篇跃升至3,855篇。其中,蛋白-药物相互作用占据最大份额,蛋白结构预测占比则持续下滑,反映出结构预测技术日趋成熟,研究重心正转向治疗应用。
随着模型在生物学中应用的深化,训练数据日益成为核心瓶颈。2025年,生物AI模型越来越多地在多数据集上联合训练,融合结构数据、小分子结合力、基因序列及单细胞观测等实验信息。多种共折叠方法开始同步利用蛋白数据库的结构数据与实验测量数据,合成数据也被广泛采用。同时,大规模数据资源快速扩充,训练集规模从数十万条提升至数千万条,生物模型开发越来越受制于数据而非架构。
蛋白语言模型的发展趋势也发生显著转变。2024年该方向曾走向超大规模,诞生了980亿参数的ESM3;至2025年,重点转向精选数据上的小型架构及检索增强。多项结果表明,小模型结合高质量数据、物理约束及检索增强,能以更低成本达到甚至超越以往大模型的效果。这说明蛋白模型的发展重心,正从单纯扩大参数规模转向更高效的数据与任务设计。
结构预测与共折叠模型在2025年同样飞速发展。多个受AlphaFold3启发的开源模型相继发布,用于预测蛋白、核酸、药物及其他生物分子组合的三维结构。尽管AlphaFold3在部分任务仍占优,但多数共折叠模型在蛋白结构和复合体建模上已表现相当。随着模型逐步覆盖主要结构类型,性能提升愈发依赖新数据的补充