AI 医疗新纪元：能力飞跃、治理短板与范式重塑

发布时间：2026-05-17 02:46阅读：32

本文译自斯坦福 HAI 研究院《2026 年 AI 指数报告》中关于“医学”的第六章，深度剖析全球人工智能在生物医药领域的效能升级、产业博弈、治理评估、教育适配及临床应用等前沿动态。报告通过解构模型性能、普及程度、基建支撑、资本动向、科研突破及临床转化等核心维度，揭示出 AI 正以超越以往任何技术的速度嵌入社会核心系统，然而相应的评估手段、治理机制、教育体系及责任框架却显得捉襟见肘。

AI 演进势头迅猛，但配套的治理、评估及数据基建却明显脱节。过去一年，AI 能力持续跨越，并以前所未有之势渗透进企业、校园、医院、科研院所及公共治理等核心环节。数据显示，生成式 AI 在三年内的人口渗透率已逼近 53%，扩散速度快于 PC 与互联网；组织层面的采用率攀升至 88%，五成以上大学生已在学习任务中借助生成式 AI。与此同时，产业界于 2025 年贡献了超 90% 的关键前沿模型，部分模型在博士级科学问答、多模态推理及数学竞赛中已持平或超越人类基准。AI 并未步入平台期，反而在能力、普及度及经济影响力上全面加速。

然而，技术的狂飙突进并未带来同等的可测性与可治性。随着头部模型差距收窄，评估工具的有效性反而下降。开源权重模型竞争力大增，中美在模型性能上的鸿沟几近抹平。自 2025 年初起，两国模型轮流坐庄：2 月 DeepSeek-R1 曾短暂追平美方顶尖水平；至 2026 年 3 月，Anthropic 的旗舰模型优势也仅余 2.7%。美国虽在顶级模型数量及高价值专利上占优，中国在论文产出、引用量、专利总数及工业机器人装机量上则遥遥领先。此外，模型趋同导致传统基准测试饱和，前沿实验室信息披露减少，独立测试亦难复现官方结果。报告强调，AI 能力增长与管理准备不足之间的错位，已成为本轮技术扩张中最突出的结构性矛盾。

纵观基建与产业格局，全球 AI 竞争日趋白热化。美国坐拥 5427 个数据中心，数量超他国十倍，能耗亦居全球之首。投资层面，2025 年美国私人 AI 投资高达 2859 亿美元，是中国 124 亿美元的 23 倍；但若计入中国政府引导基金，仅看私人投资会低估其实际投入。美国创业活力同样领跑，2025 年获投 AI 初创企达 1953 家，超第二名十倍有余。不过，美国吸纳全球 AI 人才的能力正在衰退，迁入的 AI 研究人员与开发者数量较 2017 年骤降 89%，仅去年便跌幅达 80%。这意味着，尽管资本、算力与生态仍高度集聚美国，但其人才流动的长期优势正被削弱。

同时，AI 的经济价值正以更直观的形态显现。截至 2026 年初，生成式 AI 工具为美国消费者创造的预估价值已达每年 1720 亿美元，人均价值中位数一年内翻了三倍。研究指出，在客服与软件开发等领域，AI 驱动的生产率提升约 14% 至 26%；但在需高度判断力与复杂情境理解的任务中，效果微弱甚至呈负相关。值得注意的是，生产率提升最显著的领域，恰恰是初级岗位开始缩减的领域。美国 22 至 25 岁软件开发者就业人数自 2024 年以来下滑近两成，而大龄开发者人数仍在增长。AI 正重构劳动力市场结构，尤其是对初级岗位及标准化认知劳动的冲击已初现端倪。

在科学界，AI 的角色正从加速单一研究步骤转向试图替代完整工作流。面向科学的模型在部分任务上已超越人类科学家，但并非模型越大越好。前沿模型在 ChemBench 上的平均表现优于人类化学家，但在天体物理复现实验中得分不足 20%，地球观测问题得分仅 33%。相反，参数量仅 1.11 亿的蛋白质语言模型 MSAPairformer 在 ProteinGym 上击败了此前的领跑者；2 亿参数的基因组学模型 GPN-Star 也优于规模大其 200 倍的模型。这些发现表明，在科学 AI 领域，数据质量、任务专精度及训练方法往往比单纯堆砌参数更关键。与通用 AI 主要由产业界主导不同，大多数科学基础模型源于跨部门协作，这种结构也折射出科学研究对数据、实验及验证链条的特殊诉求。

医学是 AI 影响扩张最迅猛的领域之一。2025 年，医学 AI 进展斐然。在分子生物学层面，AI 模型已覆盖从基因序列、蛋白质结构到治疗设计的全链路。2024 至 2025 年间，AI 驱动的蛋白质研究激增约 71%，相关论文总数从 2259 篇跃升至 3855 篇。其中，蛋白质—药物相互作用始终占据最大比重，而蛋白质结构预测的占比持续下滑，反映出结构预测技术日趋成熟，研究重心正加速向治疗应用倾斜。

随着模型在生物学中应用深化，训练数据正成为更关键的瓶颈。至 2025 年，生物 AI 模型更多采用多数据集联合训练，整合结构数据、小分子结合亲和力、基因序列及单细胞观测等实验信息。多种共折叠方法开始同步利用蛋白质数据库中的结构与实验测量数据，合成生成数据也被广泛采纳。与此同时，大规模数据资源迅速扩容，训练集规模已从数十万条跃升至数千万条，生物模型开发愈发受制于数据而非架构。

蛋白质语言模型的发展趋势也发生显著转变。2024 年该方向曾一度追求超大规模，诞生了 980 亿参数的 ESM3；至 2025 年，重心转向在精选数据上训练的小型架构，并借由检索增强提升性能。多项结果表明，小模型结合高质量数据、物理约束及检索增强，已能以更低成本达到甚至超越以往大模型的效果。这说明蛋白质模型的发展重心，正从单纯扩张参数规模转向更高效的数据与任务设计。

结构预测与共折叠模型在 2025 年同样突飞猛进。多个受 AlphaFold3 启发的开源模型相继问世，用于预测蛋白质、核酸、药物及其他生物分子组合的三维结构。尽管 AlphaFold3 在部分任务上仍具优势，但多数共折叠模型在蛋白质结构及复合体建模上已展现出相近性能。随着模型逐步覆盖主要结构类型，性能的进一步提升将愈发依赖新数据的获取。

← 上一篇：AI Agent不缺智能，缺的是沟通渠道下一篇：达摩院携手国家具身智能中试基地，共筑机器人产业化快车道 →