[Paper] 逆合成中顺序至关重要:结构感知生成 via Reaction-Center-Guided Discrete Flow Matching
发布: (2026年2月14日 GMT+8 01:39)
7 分钟阅读
原文: arXiv
Source: arXiv - 2602.13136v1
请提供您希望翻译的具体文本内容,我将按照要求进行简体中文翻译并保留原始的格式和链接。
概览
一篇新论文从全新的角度解决 retrosynthesis——即弄清如何合成目标分子的问题——:原子呈现给神经网络的顺序很重要。通过有意将构成反应中心的原子放在输入序列的前部,作者将隐含的化学知识转化为一种简单的位置信号,供现代 graph transformers 利用。其结果是一个 template‑free 系统,能够达到 state‑of‑the‑art 的准确率,同时所需的推理步骤远少于以往的 diffusion‑based 模型。
关键贡献
- Positional inductive bias: 引入一种 “reaction‑center‑first” 原子排序,使模型能够轻松识别最具化学相关性的子结构。
- RetroDiT backbone: 一种配备旋转位置嵌入的图形Transformer,能够直接处理有序的原子序列。
- Discrete flow matching: 将训练与采样解耦,使模型能够在 20‑50 步 内生成逆合成路线(相较于早期扩散方法约 500 步)。
- Strong empirical results: 在 USPTO‑50K(61.2 %)和 USPTO‑Full(51.3 %)上创下新的 top‑1 准确率记录(使用预测的反应中心);在提供真实中心时提升至 71.1 % / 63.4 %。
- Efficiency over scale: 表明使用排序技巧的 280 K 参数模型能够匹配未使用该技巧的 65 M 参数模型的性能,凸显结构先验相较于粗放式扩展的优势。
方法论
- 两阶段反应视图 – 首先,识别 反应中心(键发生变化的原子);其次,重建完整的前体分子。
- 原子顺序作为偏置 – 作者重新排列图的节点列表,使得反应中心原子出现在输入到 Transformer 的序列开头。这将“化学发生的部位”转化为一个简单的位置模式。
- RetroDiT 架构 – 一个处理有序节点列表的图 Transformer,使用 旋转位置嵌入 在不牺牲图其余部分的置换不变性的前提下保留相对顺序信息。
- 离散流匹配 – 模型不学习连续扩散过程,而是学习一种离散变换,直接将潜在的“噪声”图映射到有效的前体图。训练只进行一次;在推理时,模型可以通过短且固定数量的离散转变(20‑50 步)生成候选合成路线。
- 反应中心预测 – 一个轻量级分类器从目标分子预测反应中心;其输出用于指导主生成器的排序。
结果与发现
| 数据集 | 设置 | Top‑1 Accuracy |
|---|---|---|
| USPTO‑50K | 预测中心 | 61.2 % |
| USPTO‑Full | 预测中心 | 51.3 % |
| USPTO‑50K | Oracle(真实)中心 | 71.1 % |
| USPTO‑Full | Oracle 中心 | 63.4 % |
- 速度: 生成仅需 20‑50 个离散流动步骤,比之前需要约 500 步的扩散式逆合成模型提升 10×‑25× 的速度。
- 参数效率: 0.28 M 参数的 RetroDiT 能匹配一个 65 M 参数、缺乏排序偏置的基线,证明结构先验比单纯增大模型规模更有价值。
- 数据效率: 该方法在仅使用标准 USPTO 数据集(≈100 万条反应)的情况下,仍优于在 10 B 条反应上训练的大型基础模型。
实际意义
- 更快的 AI 辅助合成规划: 化学家可以在秒级而非分钟内获得候选路线,从而实现与交互式设计工具和自动化实验室工作流的更紧密集成。
- 降低计算成本: 离散流匹配方案和小模型规模降低了 GPU 内存占用和推理时间,使得在本地服务器甚至高端工作站上部署成为可能。
- 在数据有限的情况下实现更好泛化: 通过将领域知识编码为简单的顺序,拥有专有反应数据库(通常远小于公共语料库)的公司可以在无需大量数据收集的情况下训练出具竞争力的逆合成模型。
- 即插即用的反应中心预测器: 模块化设计允许开发者替换为更复杂的中心预测模型(例如在特定化学领域上微调的基于图的分类器),进一步提升准确性。
- 下游自动化的潜力: 简短且确定性的生成流水线非常适合与需要快速、可靠路线建议的机器人合成平台耦合。
局限性与未来工作
- 依赖准确的反应中心预测: 如果中心分类器出错,排序提示可能误导生成器,导致性能下降。
- 无模板但仍是启发式: 虽然模型不使用显式模板,但离散流步骤是手工设计的;探索完全学习的流动动力学可能带来进一步提升。
- 对异类化学的可扩展性: 基准测试侧重于专利反应;将其扩展到有机金属或生物催化转化可能需要额外的领域特定先验。
- 与多步规划的集成: 论文评估了单步逆合成;未来工作可以将该方法嵌入递归规划器,以构建多步合成路线。
作者
- Chenguang Wang
- Zihan Zhou
- Lei Bai
- Tianshu Yu
论文信息
- arXiv ID: 2602.13136v1
- 分类: cs.LG
- 发表时间: 2026年2月13日
- PDF: 下载 PDF