微元合成获3亿融资!携手斯坦福、字节共建AI生物开放平台
(合成生物学网)近日,微元合成正式宣布完成3亿元A+轮融资,由河南投资集团汇融基金与谭瑞清先生共同参与。
此前,河南投资集团已在AI基础设施领域完成系统性布局:从芯片投资到控股超大规模算力中心,再到全面整合HALO资产(Heavy Assets, Low Obsolescence),构建起覆盖电力+算力的坚实底座,有力支撑AI在多场景的规模化落地。
谭瑞清先生系复旦大学校董、校友会副会长,兼任复旦大学化学系校友会会长;同时为化工行业A股龙头企业龙佰集团联合创始人及前副董事长,亦担任河南银泰投资有限公司、河南银科国际化工董事长。深耕化工产业三十余载,是业内公认的资深专家、企业家与战略投资人。
本轮融资将加速推进微元合成在AI生物计算方向的技术纵深与应用拓展,持续加大核心算法研发与产业化落地投入,进一步巩固其在AI驱动生物制造领域的技术制高点与行业引领力。
事实上,公司在AI赋能生命科学方面早已动作频频!
一、引言:告别经验依赖,筑牢生物制造的“数字地基”
当生命科学迈入“按需定制”的合成生物学新纪元,如何精准预判小分子(配体)与靶标蛋白(受体)之间的结合构象,无异于在纳米尺度上寻找开启生命工厂的“万能钥匙”。这一关键任务即为“分子对接”(Protein-Ligand Docking)。
传统路径高度依赖科研人员的经验直觉,或采用耗时耗力的物理模拟计算。但生命体系远比想象复杂:蛋白并非静态锁孔,而是持续柔性波动的“动态果冻”。如何在蛋白结构不断演化的过程中,仍实现高精度结合预测?这正是新药发现与工业酶设计中长期悬而未决的“硬骨头”。
PoseX平台的推出,旨在突破传统对接工具在动态蛋白场景下的能力边界,以AI原生的高精度建模能力直击行业核心瓶颈,推动“理性设计分子-蛋白互作”从理想走向现实,为合成生物学、创新药开发与酶工程注入底层驱动力。(平台地址:http://dock-lab.tech/)。
二、行业困局:为何“实战级对接”举步维艰?
分子对接实际面临两大典型任务:
1.self-docking:将共晶结构中的配体取出后,重新对接回其原始完美匹配的结合口袋。类比拼图归位,只要形状吻合即可;
2.cross-docking:仅掌握蛋白与配体A共结晶时的构象,却需将全新配体B准确嵌入——期间侧链旋转、骨架呼吸、口袋形变甚至重构均可能发生,这才是药物设计与酶改造的真实战场;
长期以来,业界缺乏统一、高质量、面向cross-docking的评测基准。大量实验室表现优异的算法,一旦进入真实研发环境便迅速失准。PoseX应运而生,不仅构建了专为cross-docking定制的高难度数据集,更对24种主流方法(涵盖经典Glide、Autodock Vina,以及前沿AlphaFold3、Boltz、Chai等)展开高强度“极限压力测试”。
为何cross-docking如此棘手?原文Figure S12给出直观示例:配体YI8从共晶结构8V6Y迁移至蛋白8V71时,原结合位点被侧链完全占据,导致严重空间冲突。所有物理模型在此案例中全部失效(RMSD ≥ 2Å),唯SurfDock与AlphaFold3成功输出正确构象。
作为微元合成“AI×合成生物”战略的关键落子,PoseX展现出扎实的专业厚度与广阔的技术视野:
1.填补空白:全球首个大规模cross-docking评测基准
PoseX分别构建含718个样本的self-docking数据集与1,312个样本的cross-docking数据集。这是目前全球最贴近工业研发实际、数据质量最优的开源对接评测体系,有效破解了既有基准数据单一、泛化弱、脱离产线需求等痛点。
2.算法全景图:物理派、AI对接派、AI共折叠派“同台竞技”
PoseX集成24种代表性方法,覆盖三大技术流派:
•物理模型:如行业标杆Schrödinger Glide、MOE、Discovery Studio等;
•AI对接模型:如基于深度学习的DiffDock、SurfDock等;
•AI共折叠模型:如引发广泛关注的AlphaFold3、RoseTTAFold-All-Atom、Boltz、Chai等;
3.核心结论:AI首次在跨构象对接中实现全面超越
经PoseX严苛验证,顶尖AI对接模型(如SurfDock)与AI共折叠模型(如AlphaFold3)在最具挑战性的cross-docking任务中,其预测精度与鲁棒性已整体超越沿用数十年的传统物理模型。该发现为工业界向“AI原生研发范式”转型提供了坚实依据。
3.1综合排名:谁问鼎cross-docking王者之位?
self-docking评测结果 cross-docking评测结果
三大关键发现:
•AI全面领跑:Top 9榜单中,5席属AI对接模型,4席属AI共折叠模型;
•SurfDock断层领先:较第二名Uni-Mol高出近8个百分点,且推理速度极快(10.8秒/样本);
•物理模型明显掉队:表现最佳的GNINA仅约54%,与顶尖AI模型差距达20个百分点;
3.2深度探析:AI是真懂机制,还是“死记硬背”?
为评估模型泛化能力,研究进一步分析了测试样本与训练数据在结合口袋相似度维度上的关联性。物理方法表现稳定(其固有优势),而多数AI模型(如DiffDock、AlphaFold3)在陌生口袋上性能骤降。值得关注的是,SurfDock在AI阵营中展现出最强泛化能力,即便面对全新口袋,其预测效果仍优于主流物理方法。
PoseX-SD上按pocket相似度排序的评测结果
PoseX-CD上按pocket相似度排序的评测结果
3.3口袋信息的价值
研究证实:显式引入口袋结构信息可显著提升对接性能。当前主流AI共折叠模型(如AlphaFold3、Chai-1)属盲对接,无需指定口袋;而在提供口袋先验条件下,SurfDock以77.0%成功率登顶,UMD V2紧随其后——二者借助口袋引导应对构象变化,性能反超物理方法;盲对接赛道中,AlphaFold3以68.8%成功率位居榜首。
指定口袋/不指定口袋信息在PoseX-CD的对接评测结果
指定口袋/不指定口袋信息在PoseX-CD的对接评测结果
3.4Relaxation带来的质变提升
尽管AI方法在速度与RMSD指标上优势明显,但其输出构象偶存原子碰撞(clashes)等物理不合理现象。为此,PoseX创新引入高质量Relaxation(能量最小化)后处理模块,基于OpenMM实现全自动能量优化与短时分子动力学模拟,智能修复蛋白-小分子细节结构。叠加Relaxation后,SurfDock在PoseX自对接(PoseX-SD)数据集成功率升至78.0%,在更具挑战的交叉对接(PoseX-CD)数据集达77.0%,双双刷新SOTA纪录。Relaxation使AI预测结果由“视觉合理”跃升为“物理可信”,真正打通从计算到实验的闭环。
PoseX平台的发布,不仅为全球蛋白-配体对接研究树立了新一代标准化评测标杆,更正快速转化为微元合成推动合成生物学工业化的关键技术引擎。
•高效酶进化与“超级催化剂”创制
在酶工程中,精准刻画酶与底物在多元构象下的动态互作是核心瓶颈。PoseX筛选出的高精度AI算法,可高效模拟Cross-Docking场景下的蛋白构象演化,助力快速设计耐高温、高转化率、高选择性的“超级酶”。原本依赖多轮湿实验的定向进化流程,如今可在数字空间高效完成筛选与优化,大幅压缩从实验室到工业化发酵罐的转化周期。
•代谢通路重构与高值生物基产品开发
面向各类高附加值产品生产,PoseX可精准识别代谢网络中的关键酶-底物或酶-中间体节点,结合口袋信息引导与Relaxation姿态精修,实现代谢通路重编程与瓶颈突破。无论上游路径设计抑或下游产物纯化,PoseX均实现“分子级精细调控”与“工业级规模放大”的无缝协同,推动产量、纯度与成本指标跨越式升级,加速产品从概念走向量产。
•显著压降研发成本与失败风险
传统湿实验筛选动辄耗时数月、投入巨大;而PoseX驱动的AI模拟+物理后处理方案,可将周期压缩至数天至几周。此举不仅大幅提升生物制造的研发投入回报率(ROI),更显著降低试错成本,助力更多创新构想高效跨越“死亡之谷”,迈向规模化应用。
本次PoseX成果由微元合成生物计算团队联合全球顶尖学术力量协同攻关完成,相关论文已被ICLR 2026录用。这不仅是对其AI模型与算法实力的高度认可,更是对其“以AI重塑生物制造”使命的权威背书。