标签

AI设计的蛋白热稳定性突破100°C!EMBL推出全新分析工具CheMelt

发布时间:2026-04-16 08:16来源:微信阅读:6

在人工智能主导的蛋白质设计领域中,一个显著且普遍存在的现象是:全新设计的蛋白质通常表现出卓越的热稳定性,其熔解温度常常远高于水的沸点。

这一特性对众多生物技术应用极具价值,例如高温工业催化反应,或是利用热变性实现快速蛋白质纯化。

然而,这种“异常”的稳定性也给科学分析带来了挑战:当蛋白质在常规实验温度下(例如95°C)完全不会展开时,我们应如何精确测定并解读其稳定性指标?

以往,关于蛋白质热稳定性的研究多聚焦于自然界中的嗜热微生物,通过对比中温与嗜热同源蛋白,归纳出三种主要的稳定性增强模式。这些模式可以通过蛋白质去折叠自由能随温度变化的曲线来直观呈现。

图1:三种可能的蛋白质热稳定性提升机制示意图

一种可能性是蛋白质在所有温度下都更加稳定(曲线整体向上平移);另一种可能是稳定性的峰值向高温区域移动;第三种,也是常被忽略的一种,是蛋白质对温度变化的敏感性降低,这表现为去折叠过程中的热容变化较小。

为了在蛋白质工程中高效、准确地获取这些热力学参数,纳米级差示扫描荧光法因其样品消耗量低、可并行处理多个样本而成为优选方案。

针对高热稳定蛋白,常见的策略是添加变性剂(如盐酸胍),通过记录不同变性剂浓度下的热熔解曲线,来推算无变性剂条件下的稳定性参数。但这种方法的数据分析过程较为复杂,迫切需要更便捷、标准化的工具。

为突破这一技术瓶颈,来自丹麦奥胡斯大学和欧洲分子生物学实验室汉堡分部的研究团队开发了一款名为CheMelt的在线分析工具。

该工具专门用于联合分析化学与热诱导去折叠数据,旨在通过直观的图形界面,降低这一强大分析方法的应用难度。

图 2:CheMelt在线工具的五大核心操作步骤

CheMelt的分析流程简明扼要,主要包含五个步骤:

该工具基于成熟的Python软件包pychemelt构建,并集成于eSPC生物物理数据分析平台,方便研究人员随时调用。

研究团队通过三个具体案例,系统性地验证了CheMelt工具的性能。

案例一,他们重新分析了经典的乙酰辅酶A结合蛋白数据集。CheMelt不仅成功完成了数据拟合,其提取的热力学参数(如Tm、ΔCp、m值)与先前文献记录高度吻合,证明了算法的可靠性。

案例二,面对核心难题——超高热稳定蛋白,团队首先采用模拟数据进行测试。结果表明,即使在无变性剂条件下完全观测不到去折叠转变,CheMelt依然能够借助高浓度变性剂下的曲线,准确推算并估计出蛋白质在生理条件下的Tm及其他参数。

真正的验证来自案例三。研究团队挑选了35个利用RFdiffusion和ProteinMPNN设计的新型蛋白结合剂,使用nanoDSF进行扫描分析。

图 3:对35个从头设计蛋白进行变性条件筛选的流程与结果示例

出乎意料的是,其中20个蛋白即使在高温和高浓度变性剂下,也未显示出明显的荧光信号变化。后续的圆二色谱实验证实,这些蛋白实际上发生了去折叠,只是其芳香族残基在去折叠前后所处环境变化极小,导致荧光信号“沉寂”。

这一现象本身就是一个重要发现,暗示了这些设计蛋白的疏水核心可能具备独特性质。

在15个显示出可观测熔解转变的蛋白中,CheMelt成功完成了所有数据的高质量全局拟合。

结果显示,这些从头设计蛋白的熔解温度分布在96°C至152°C之间,平均值高达122°C,证实了其超强的热稳定性。

图 4:CheMelt对三个代表性设计蛋白去折叠数据的全局拟合结果

然而,更深入的分析揭示了其稳定性的独特机理。当研究人员将设计蛋白的热容变化和变性剂依赖性与天然蛋白数据库进行比较时,发现了一个显著区别。

图 5:从头设计蛋白与天然蛋白在ΔCp和m值上的对比

尽管设计蛋白的ΔCp和m值之间存在着与天然蛋白相似的关联性,但这两个参数随蛋白链长度增长的速率明显低于天然蛋白。这意味着,对于大小相同的蛋白,设计蛋白在去折叠时暴露的疏水表面积更少。

ΔCp的大小直接决定了蛋白质稳定性曲线的弯曲程度。较低的ΔCp意味着曲线更为平缓,蛋白质的稳定性对温度变化不敏感。

图 6:低ΔCp导致蛋白质稳定性曲线更平坦,从而提升熔解温度

研究表明,这些从头设计的蛋白主要是通过降低ΔCp(即降低对温度的敏感性),而非普遍认为的“在所有温度下都具有极高的平衡稳定性”,来实现其惊人的高熔解温度。

这项研究对AI驱动的药物发现和蛋白质设计领域具有重要意义。

首先,它强调了全面热力学表征的重要性。高熔解温度并不等同于高平衡稳定性。一个通过低ΔCp实现高热稳定性的蛋白,在室温下可能含有相当比例的非折叠状态,这意味着它可能并不具备抵抗聚集或蛋白酶降解的强健性。

因此,在评估设计蛋白的稳定性时,仅依赖Tm值作为单一指标是片面的。CheMelt这类工具的出现,使得快速、准确地获取完整热力学参数成为可能,为蛋白质工程的理性优化提供了关键数据支持。

其次,研究揭示了当前AI蛋白质设计算法可能存在的某种“设计倾向”。它们倾向于生成具有更紧密、疏水残基暴露更少的疏水核心的蛋白,这或许是算法在追求能量最小化或结构理想化时产生的结果。

理解这一机制,有助于我们在未来设计中更好地平衡热稳定性与其他功能需求。

【文章原文】

https://arxiv.org/html/2604.09369v1

往期精选

1AI设计大环肽结合剂登Nature子刊:成功率高达100%

2保姆级最前沿 AI蛋白质设计教程!有浏览器就能学 AlphaFold, RFDiffusion和ProteinMPNN 一网打尽

3AI两周设计出超长效降糖肽,效果超越司美格鲁肽

4AI 重塑GPCR信号通路,实现精准药物靶向治疗

5AI蛋白设计新时代:David Baker 谈新型蛋白质的革命性应用