AI 重塑农药研发全链路
FRONTIER · 学术前沿
人工智能 助推农药研发
从分子构建到环境归宿——一场由算力驱动的范式革新
关键词 | 生成式设计 · 机制模拟 · 逆合成 · 精准喷洒 · 归趋预测
在过去的五十年间,农药发现呈现出与计算机行业截然相反的走势。当摩尔定律推动芯片性能飞速提升且成本骤降时,农药与制药领域的"新分子创制"却变得愈发迟缓、昂贵——学界将这一反常现象戏称为"厄鲁姆定律"(Eroom's Law)。
>12年 · >$3亿美元
目前,将一个全新农药活性分子从实验室推向商业化,平均需耗费如此漫长的时间与巨额投入。与此同时,杂草与害虫的抗性问题在全球范围内迅速扩散,环保标准与监管门槛也持续攀升。
创新的紧迫性前所未有,但实现难度亦空前巨大。正是在这一困境中,人工智能强势介入。其愿景不仅在于"加速分子筛选",更在于将农药从发现、合成、施用到环境归宿的全生命周期,从依赖"随机与运气"的试错模式,转变为以"预测、特异与设计"为核心的工程化流程。本文将沿着这一全生命周期,剖析 AI 正在重构农药科学的五大关键节点——发现、作用机制、合成、施用及环境归宿。
01
分子的"反向构建"
AI DISCOVERY · 农药发现
传统农药研发遵循"设计—合成—测试—分析"(DMTA)的循环:化学家凭经验构思结构,进行合成,再在活体上逐一筛选,往往需在数万个化合物中大海捞针。AI 的首要变革,是将该循环的绝大部分迁移至"虚拟实验室"。
其技术路径主要涵盖三个层面:
① 定量构效关系(QSAR/QSPR)。利用分子结构特征预测活性、毒性及理化性质,这是化学信息学的经典工具,如今正被各类机器学习算法不断刷新精度。
② 深度生成模型与逆向设计。不再"先有分子后算性质",而是"先定性质再生成分子"——设定期望的药效、低毒性与可降解性,让模型反向生成候选结构。
③ 靶标识别与结构预测。依托蛋白结构预测与组学数据,精准锁定害虫或病原体特有而人类与益虫缺乏的作用靶点,从源头提升选择性。
代表性进展 · CASES
PestiGen。由华中师范大学绿色农药全国重点实验室提出的强化学习生成式模型,专为新农药分子设计打造,并以公开网络服务器形式开放,被视为"绿色农药"智能设计的概念验证。
Bindwell。这家初创企业以靶向害虫特异性蛋白为思路开发农药,宣称可分析数十亿分子,速度约为 DeepMind AlphaFold 3 的四倍,目前正测试 AI 生成分子并与全球农化巨头洽谈合作。
Corteva × Enveda。科迪华联手深耕 AI 药物研发的 Enveda,将其在复杂天然混合物中预测化学结构的能力,迁移至新型农化品的发现与开发中。
Bayer。据报,拜耳的 AI 辅助发现平台识别出一类新型杀菌剂,其水生毒性较现有市售产品降低约 90%——这正是"先定低毒约束、再生成分子"思路的典型成果。
值得注意的是,发现环节的瓶颈正从"算力"转向"数据"。农化数据长期被私营部门以知识产权为由封闭、拒绝共享,导致公共可用的高质量训练数据匮乏——这也是当前 AI 农药发现"巧妇难为无米之炊"的根本原因。
02
在计算机里先"预演"一遍
MODE OF ACTION · 作用机制模拟
在医学领域,药物进入临床前,研究者会利用计算模拟其在体内与靶点的结合、起效方式及剂量分布。农药科学的第二重变革,正是将这套"计算医学式"的分子模拟引入——只不过这里的"病人"是害虫、杂草或真菌,难点在于:既要分子精准命中靶标,又要确保对人、益虫及环境尽量无害。
生成模型提供的仅是"候选";其实际疗效与安全性,需在原子尺度上通过模拟进行检验:
① 分子对接(docking)。将候选分子置入靶标蛋白的口袋中"试穿"——例如杀虫剂的经典靶点乙酰胆碱酯酶(AChE)——快速估算结合位姿与亲和力,是早期机制研究最常用的快筛手段。
② 分子动力学(MD)与结合自由能。对接假设受体是"刚性"的,易产生假阳性;分子动力学让蛋白 - 配体体系真正"动起来",再配合 MM/GBSA、MM/PBSA 计算结合自由能(ΔG),更可靠地为候选排序。已有研究显示,ΔGbinding与农药的急性毒性(LD₅₀)相关,可被反向用于设计更低毒的分子。
③ 选择性与脱靶评估。将同一分子分别对靶标物种与非靶标(人、传粉昆虫)的同源蛋白建模,预测"对害虫狠、对人轻"的选择性窗口,从机制上规避脱靶毒性。
④ 抗性预测与量子化学机制。在酶 - 抑制剂体系中耦合分子动力学与机器学习,可从模拟特征中学习靶标突变如何削弱结合、催生抗性,进而提前设计"抗抗性"的分子;而 QM/DFT 量子化学计算则从反应路径与速率层面揭示作用与抑制机理,为低毒结构改造提供依据。
对接负责提出假设,动力学负责揭示真相;机器学习则学会为二者重新评分。三者叠加,等同于在昂贵的活体试验之前,先在计算机里跑完一遍"作用机制的预演"。
这一步的价值,在于将"为何有效、为何安全"从事后解释,转变为事前可计算的设计变量——既筛除无效分子,也提前为人和生态把住风险关。
03
从"画得出"到"做得出"
RETROSYNTHESIS · 逆合成预测
AI 能"画"出一个精美的分子,并不意味着它能被经济地合成。可合成性(synthesizability),是连接虚拟设计与真实工厂之间最常被低估的鸿沟。AI 的第三重变革,便发生在此处。
逆合成分析(retrosynthesis),是指给定目标分子,反向推导可行合成路线与起始原料的过程。深度学习将这件高度依赖化学家直觉的工作,转化为可大规模搜索、可比较、可优化的计算任务。
代表性进展 · CASES
ChemAIRS(Chemical.AI)。该逆合成平台为科迪华新型杀虫剂 fentiazoluron 生成了多条可行合成路线,在起始原料与合成策略上提供灵活选择,让化学家得以快速比较不同路径、加速复杂农化分子的合成决策。
IBM RXN for Chemistry。基于深度学习的合成路线预测与逆合成平台,在制药与农化两个领域均有应用,是该方向被广泛引用的代表性工具之一。
"合成生物学 + AI"。除化学合成路线外,AI 也被用于设计工程菌株的代谢路径,以生物合成方式低成本、规模化生产活性物质。国内如利民股份等农化企业正以此为战略方向布局绿色制造。
当逆合成模型与发现模型被串联进同一个闭环——生成分子的同时即评估其合成可行性——DMTA 循环才真正被压缩。这是"可制造的创新",而非纸面上的创新。
04
把药精准送达
SPRAY SIMULATION · 施药模拟与精准喷施
一个分子再优秀,若大部分在喷施途中随风飘散、落入非靶标区域,其效率与环境代价都将归零。AI 的第四重变革,是将"如何喷"从经验活转变为可计算、可实时调控的精密工程。
雾滴的沉积与飘移,受风速、风向、雾滴粒径、飞行高度等多重因素耦合影响,传统上极难精确控制。研究者将计算流体力学(CFD)模拟与机器学习结合,并将决策权交给无人机的实时控制系统:
· 航迹自适应。以地面无线传感网采集的风速、风向为输入,利用深度强化学习与粒子群优化实时调整无人机飞行航线,将雾滴尽量"摁"在目标区域内。
· 雾滴粒径动态调节。通过脉宽调制按航段动态调整雾滴大小,在保证穿透力的同时抑制飘移。
· 视觉靶向变量喷施。如自主果园喷施机器人 OrcBOT,以 YOLO 系列模型实时识别冠层结构、配合静电喷头独立控制,实现"哪有靶标喷哪里"。
−89.18%
在一项无人机施药研究中,三段式雾滴粒径调节策略相对于无控制基线,将飘移率降低约 89.18%,并将 90% 飘移距离缩短至约 3.36 米——意味着更少的农药损失与更小的生态外溢风险。
精准施药的本质,是将"少用药、用对地方"从口号变为可量化的控制目标。它让前序环节辛苦设计出的低毒分子,真正以低剂量、高命中的方式抵达靶标。
05
给环境算一笔账
ECO-RISK · 生态毒性 · 降解与归趋模拟
新化合物的数量呈爆炸式增长,而将每一种化合物在每一种生物、每一种环境介质中都实测一遍,既不现实、也面临动物实验的伦理约束。AI 的第五重变革,是为环境与生态风险评估提供快速、低成本的"计算替身"。
· 跨物种毒性外推。引入物种生理性状信息的 Bio-QSAR 模型,能在不同水生类群间外推,对淡水生物的农药急性毒性展现出可观的预测力,缓解"测不过来"的困境。
· 非靶标毒性预测。针对蚯蚓(Eisenia fetida)等土壤指示生物,基于梯度提升树与分子描述符的 ML-QSAR 模型,在判别农药毒性上达到 AUROC 约 0.88 的水平,可作为实测的高效前置筛查。
· 环境归趋建模。预测降解半衰期、在土壤与大气中的持久性、迁移与生物累积,并与 USEtox 等表征框架结合,量化分子从喷洒源头到远场环境的全过程命运。
专题 · IN FOCUS
降解与转化产物模拟:算出它的"下落"
农药进入环境后并非凭空消失,而是经光解、水解、微生物降解逐级转化,生成一连串转化产物(TPs)——其中某些代谢物可能比母体分子更持久、甚至更毒。"会降解成什么、降解有多快",因此是风险评估中最难啃、却最关键的一块硬骨头。AI 正从四个方向逼近它:
通路与代谢产物预测。enviPath 等平台(含 EAWAG-BBD、Eawag-Soil、Eawag-Sludge 数据集)以"转化规则 + 机器学习"预测多步生物降解通路与中间产物,并将转化规则与催化酶类关联,回答"哪种微生物酶促成了哪一步转化"。
降解动力学与半衰期。用 QSAR 与深度学习预测光解动力学与土壤半衰期(DT₅₀);针对有机磷类,还能刻画碱性条件下磷酸酯键水解断裂等具体机制。
量子化学机理。借助 QM/DFT 计算,从反应路径与能垒层面揭示某条降解为何快、为何慢,将经验观测升级为可解释的机理。
未知物鉴定。以机器学习预测色谱保留时间,辅助液相色谱 - 高分辨质谱(LC-HRMS)对农药及其转化产物做大规模"可疑物筛查",将藏在水土食品中的未知代谢物揪出来。
282条降解通路· 4716条半衰期
仅 enviPath 的 Eawag-Soil 数据包,便从欧盟农药登记资料中整理出约 282 条土壤降解通路、1535 个反应、1619 种化合物与 4716 条生物降解半衰期数据——为"降解可预测"提供了公开的训练地基。
借助 SHAP 等可解释性方法,模型不再是黑箱——它能指出究竟是分子结构、土壤参数还是剂型,主导了某个毒性或降解结果。
更深远的意义在于闭环:当"低毒、易降解、对非靶标友好"这些环境约束,被前移至第一章的分子生成阶段成为设计目标,"绿色农药"就不再是事后补救,而是从第一笔结构画起就被写进的基因。
REFLECTION · 余论
乐观之外,仍有清醒
AI 将农药生命周期的五个环节——发现、作用机制、合成、施药、环境与降解评估——逐一从"经验试错"推向"预测设计",这是一次真实的范式转移。但它远未完成,至少还有三重制约横亘在前:
数据与壁垒。高质量农化数据稀缺且被知识产权封锁,限制了模型的训练与泛化;有学者呼吁让高校等公共部门参与,使基础数据集得以公开。
泛化与适用域。模型在训练分布之外的可靠性仍是软肋,"适用域"之外的预测需谨慎对待。
监管的滞后。面对"AI 设计"的全新分子,各国审批路径仍存在不确定性,人机协同(human-in-the-loop)因此短期内不可或缺。
AI 不会取代化学家与农学家。它要替换的,是农药发现中那份延续了半个世纪的"随机与偶然"——代之以可预测、可设计、可对环境负责的全新工作方式。从分子的第一笔结构,到田间最后一颗雾滴,再到它在土壤里的归宿,计算正在让这条漫长链条上的每一步,都变得可被设计。
资料