标签

AlphaFold如何突破蛋白质结构预测极限

发布时间:2026-05-31 14:11来源:微信阅读:14

AlphaFold 究竟是什么原理?它为何能够揭示蛋白质的结构奥秘?

这是个很好的问题!人们经常误认为 AlphaFold"创造了全新的科学发现",但它的本质更加精妙,让我们用"统计与推理"的概念来说明👇

🧬 AlphaFold 的核心功能

AlphaFold(特别是 AlphaFold2)专注于从氨基酸序列推断蛋白质的三维构象,接收一段氨基酸链(比如数百个单位),计算出原子级别的空间折叠形态。

它并非从头构建物理法则,而是:

1. 学习阶段:基于约17万个已知的人类蛋白质结构(来自PDB数据库)进行模式识别——建立氨基酸排列与空间构型的映射关系,同时分析进化变异数据(协同变异位点→空间邻近性)

2. 推理阶段:针对未知序列实施多重序列对比(MSA)寻找同源蛋白→获取协同进化限制条件→运用Evoformer(Transformer的改进版)反复推演出残基间距/角度→得出3D坐标,并通过几何限制(化学键角、空间阻碍等物理先验条件)进行最终优化

✅ "预测新结构"的真实含义

所谓预测"新构象"指的是:

- 训练样本中不存在该特定蛋白质的构象(某些折叠类别在训练集中极为稀少)

- 但通过同源家族的MSA分析,模型展现出良好的泛化能力——这在CASP14竞赛中证实对部分新颖折叠也能实现较精确预测

⚠️ 但这并非"发现新折叠类别"——它预测的是自然界中已存在的蛋白质天然构象,仅仅是人类尚未通过实验测定。

🆚 与"从零创造新知识"的根本差异

AlphaFold 人类理论创新(正如你之前探讨的)

知识