AI4Protein 最新论文精选 | 2026-05-19
今日热点 / Relevant Today AI4Protein 前沿动态 1.跨越桥梁的熵:用于流与薛定谔采样器的条件 - 边缘离散化 日期:2026-05-15 作者:Bruno Trentini, Dejan Stancevic, Michael M. Bronstein 等人 AI 深度解析 本研究提出了一种名为 AlphaFlow 的新方法,致力于优化高维扩散模型采样中的时间步长分配难题。研究指出,经典的布朗桥理论(例如 U 形收缩模式)仅适用于高斯分布,而通用模型需采用自适应的边际项来匹配学习到的种群轨迹。为此,作者设计了三层架构:数学层将条件散度与边际散度的差值定义为核心速率指标;计算层借助 Hutchinson 估计法规避雅可比矩阵求导,直接估算该速率;经验层则依据估算结果构建采样网格,并利用边界浓度比(BCR)等指标验证网格质量。 在方法实现层面,研究严格区分了条件 SDE 漂移与概率流场,强调不可简单等同,否则会导致分布的人为平坦化。通过引入正则化映射(如 log(1+r))处理原始速率,既保留了高速率区域的排序特性,又避免了端点处的过度聚集。实验数据表明,基于熵率(条件 - 边际速率)构建的网格在低函数评估次数(NFE)场景下,显著优于线性、余弦、Sigmoid 等传统调度器,尤其在处理连续 - 离散(C-D)和离散 - 连续(D-C)等复杂传输几何时,能更精准地捕捉边界效应并提升采样效率。此外,研究还提出了加权步长规则(命题 3),为确定性与随机性求解器在不同压缩或弯曲向量场区域提供了理论上的最优时间密度分配策略。 中文摘要 摘要:对于固定流基生成模型,在有限的推理预算下,样本质量很大程度上取决于采样器如何分配其少量的函数评估。流匹配(Flow Matching)和薛定谔桥(Schrödinger bridges)定义了概率路径,但其推理网格通常基于启发式方法或沿袭自单端点扩散模型。我们推导了一种针对桥感知离散化的条件边缘熵率目标函数,将端点条件桥几何结构与边际流演化分离,并基于此从第一性原理构建了一种无需训练的熵推理时间调度器。对于高斯布朗桥,该速率具有闭式解且呈 U 型,从而激励采用边界权重较大的非均匀网格。在训练好的二维桥/流模型上,估计的分布轮廓恢复了预测的形状,相较于线性调度,10 步 ODE-Heun 的 MMD 提升了 18.1%,在相同的低 NFE(函数评估次数)遍历中,SDE-Heun 也取得了 22.7% 的成对提升。在 EDM/CIFAR-10 数据集上,熵时间离散化取得了目前测试中最佳的五步 FID 分数(186.3 ± 4.0,而线性调度为 200.5 ± 2.9,余弦调度为 238.0 ± 5.3)。在 AlphaFlow 蛋白质生成任务中,熵条件 - 边缘(cond-marg)调度在 CAMEO22 和 ATLAS 基准的低 NFE 区域下均表现出优势。这些结果支持将熵率调度作为一种实用的低预算分配信号,适用于高维桥和流采样器。 Paper Key Illustration 原文 Entropy Across the Bridge: Conditional-Marginal Discretization for Flow and Schrödinger Samplers Abstract: For a fixed flow-based generative model under a small inference budget, sample quality can depend strongly on where the sampler spends its few function evaluations. Flow matching and Schrödinger bridges define probability paths, yet their inference grids are usually heuristic or inherited from one-endpoint diffusion. We derive a conditional-marginal entropy-rate objective for bridge-aware discretization, separating endpoint-conditioned bridge geometry from marginal flow evolution, and use it to build a training-free entropic inference-time scheduler from first principles. For Gaussian Brownian bridges this rate is closed-form and U-shaped, motivating boundary-heavy nonuniform grids. On trained two-dimensional bridge/flow models, the estimated profile recovers the predicted shape and improves 10-step ODE-Heun MMD over linear by 18.1%, with a paired 22.7% SDE-Heun improvement in the same low-NFE sweep. On EDM/CIFAR-10, the entropic time-discretization gives the best tested five-step FID (186.3 \pm 4.0 versus 200.5 \pm 2.9 for linear and 238.0 \pm 5.3 for cosine). On AlphaFlow protein generation, entropic conditional-marginal (cond-marg) scheduling shows advantage in low-NFE regimes on both CAMEO22 and ATLAS benchmarks. These results support entropy-rate scheduling as a practical low-budget allocation signal for high-dimensional bridge and flow samplers. 链接:https://arxiv.org/pdf/2605.16126 2.确定性事件图基底作为反事实推理的世界模型 日期:2026-05-15 作者:Fabio Rovai AI 深度解析 本文提出了一种基于事件日志的因果推理框架,旨在解决物理场景中的描述性、解释性、预测性及反事实推理问题。研究核心在于利用事件图结构,通过反向广度优先搜索(BFS)高效计算事件的祖先对象集合(AncObj),从而将反事实查询转化为确定性的成员资格测试。针对移除对象后可能引发的‘涌现性交互’(如原本被阻挡的碰撞发生),论文引入了一种启发式机制:若两个对象均与待移除对象发生过碰撞,则判定它们在反事实世界中可能发生碰撞。实验在 CLEVRER 基准数据集上验证了该方法,结果显示该框架在描述性和解释性任务上显著优于现有最强基线(NS-DR 和 ALOE),并在反事实推理任务上大幅超越了符号基线 NS-DR,证明了其在无需特定物理求解器代码的情况下,仅凭结构化的事件日志即可实现高效且准确的因果推理。 中文摘要 摘要:我们研究了事件图(event-graph)基底:一类世界模型,该模型将智能体状态表示为带类型 RDF 三元组的追加式日志,并通过在结构化干预词汇下分叉日志来回答反事实查询。基底支持在三元组层面进行检查,支持精确的反事实推理,且无需学习组件即可跨领域迁移。我们形式化了该类模型,证明了解释性查询与反事实查询之间的对偶性,将两者均归结为相同的因果祖先遍历,并在完整的 CLEVRER 验证规模(n=75,618)下,评估了构建于领域无关基底运行时之上的 1,400 行 CLEVRER-DSL 解释器。该基底在四个问题类别上的表现均优于 NS-DR 符号预言机(分别高出 9.89、20.26、17.65 和 0.80 个百分点),在描述性和解释性任务上优于参数化 ALOE 基线,但在预测性和反事实任务上略逊一筹。此外,我们引入了 twin-EventLog,这是一个包含 500 个规格说明的 Park 规范 Smallville 反事实基准,在该基准上,基底在完整上下文设置下的联合准确率比 Llama-3.1-8B 高出 18.80 个百分点。 Paper Key Illustration 原文 Deterministic Event-Graph Substrates as World Models for Counterfactual Reasoning Abstract: We study event-graph substrates: a class of world models that represent agent state as an append-only log of typed RDF triples and answer counterfactual queries by forking the log under a structured intervention vocabulary. Substrates are inspectable at the triple level, support exact counterfactuals, and transfer across domains without learned components. We formalize the class, prove a duality between explanatory and counterfactual queries that reduces both to the same causal-ancestor traversal, and evaluate a 1,400-line CLEVRER-DSL interpreter atop a domain-agnostic substrate runtime at full CLEVRER validation scale (n=75,618). The substrate exceeds the NS-DR symbolic oracle on all four per-question categories (by 9.89, 20.26, 17.65, and 0.80 percentage points), and exceeds the parametric ALOE baseline on descriptive and explanatory while lagging on predictive and counterfactual. We also introduce twin-EventLog, a 500-specification Park-canonical Smallville counterfactual benchmark on which the substrate exceeds Llama-3.1-8B with full context by 18.80 points joint accuracy. 链接:https://arxiv.org/pdf/2605.15967 3.多模态生物医学机器学习任务中大型语言模型智能体的基准测试 日期:2026-05-15 作者:Loka Li, Duzhen Zhang, Xingbo Du 等人 AI 深度解析 该研究提出了一种名为 MLEvolvege 的多模态大模型评估框架,旨在全面衡量模型在生物医学领域的综合能力。研究针对现有评估体系仅关注单一任务或成功率的局限,构建了涵盖序列、单细胞、结构、网络、化学、扰动、表型、成像及文本等九大维度的基准测试集。方法上,研究不仅计算了各模型在成功任务上的平均得分,还引入了惩罚机制,对所有任务(含失败案例)进行加权平均,以更真实地反映模型鲁棒性。关键结果显示,MLEvolvege 在多数生物医学子任务上表现优异,特别是在结构预测和化学领域得分显著领先;同时,惩罚后的平均得分揭示了部分模型在特定任务(如成像和文本)上存在严重短板。该研究的意义在于为生物医学大模型提供了更严格、多维度的评估标准,推动了模型从‘能完成任务’向‘稳定解决复杂问题’的演进,为后续模型优化指明了方向。 中文摘要 摘要:大型语言模型(LLM)代理在自动化机器学习开发组件方面日益展现出强大能力,然而现有的生物医学基准测试主要侧重于问答、推理和工具使用,或仅评估生物医学机器学习编码的狭窄方面。我们提出了 BioXArena,这是一个旨在评估代理是否为异构和多模态生物医学数据集生成特定任务模型训练流程的生物医学机器学习基准测试。BioXArena 涵盖 9 个领域的 76 个端到端任务,包括序列建模、单细胞分析、结构生物学、网络生物学、化学生物学、扰动动力学、表型 - 疾病建模、生物医学成像以及文本集成学习。每个任务均从主要生物医学