[Paper] 转录组条件化个性化De Novo药物生成用于AML的Metaheuristic Assembly与Target-Driven Filtering

发布: (2025年12月25日 GMT+8 01:39)
7 min read
原文: arXiv

Source: arXiv - 2512.21301v1

概述

一个新的计算管线将患者的 RNA‑seq 配置文件直接关联到急性髓系白血病(AML)全新药物候选物的设计。通过将转录组特征转化为疾病相关蛋白上的结构“热点”,并利用定制的进化算法围绕这些热点组装分子,作者展示了一条可扩展的真正个性化从头药物发现路径。

关键贡献

  • 转录组驱动的靶点选择: 使用 TCGA‑LAML 大规模 RNA‑seq 数据和加权基因共表达网络分析(WGCNA)定位 20 个高价值生物标志物(例如 HK3、SIGLEC9)。
  • 非晶体靶点的结构预测: 应用 AlphaFold 3 为所有选定蛋白质生成高置信度的 3D 模型。
  • 热点定量: 使用 DOGSiteScorer 在每个模型上定位并评分可药性口袋。
  • 先反应进化元启发式算法: 设计了一种新颖的片段组装算法,通过迭代应用化学反应并结合多目标优化(结合对齐、合成可行性、药物相似性)来构建分子。
  • 端到端验证: 整合 ADMET 过滤、QED 打分和 SwissDock 对接;突出显示了 Lead Ligand L1,其对 A08A96 生物标志物的预测结合自由能为 –6.57 kcal/mol。

方法论

  1. 数据摄取: 对 TCGA‑LAML 队列的批量 RNA‑seq 进行处理,生成共表达网络。挖掘与疾病结局最相关的模块,得到 20 个候选基因。
  2. 结构建模: 对每个基因产物,使用 AlphaFold 3 生成 3D 结构。DOGSiteScorer 引擎扫描这些模型,按体积、深度和可药性对口袋进行排序。
  3. 片段库准备: 选取约 1 万个商业可得的片段(符合三规则)作为构建块。
  4. 元启发式组装:
    • 先反应编码: 与其随意组装原子,算法先选择一种化学反应(例如酰胺偶联、Suzuki 偶联),再挑选兼容的片段。
    • 多目标适应度: 对每个候选分子进行评分,包含 (a) 关键药效团特征与口袋的几何对齐,(b) 合成可及性,和 (c) 药物相似性 (QED)。
    • 进化循环: 种群通过突变(替代反应)、交叉(片段交换)和选择进行演化,收敛到高分化学型。
  5. 计算机内筛选: 前 200 个分子进行 ADMET 预测(毒性、代谢)并使用 SwissDock 对接,以估算结合自由能。

结果与发现

  • 生物标志物热点质量: 所有20个靶点至少显示出一个口袋,其DOGSiteScorer评分 >0.7,表明具有高可药性。
  • 化学新颖性: 生成运行产生了超过15 k个独特骨架,其与ChEMBL中任何分子的中位Tanimoto相似度 <0.3,确认了结构的原创性。
  • 药物相似性: QED分布峰值在0.5–0.7之间,可与已知口服药物相媲美。
  • 先导化合物识别: 配体 L1(MW = 312 Da,QED = 0.68)对接至A08A96热点,ΔG = –6.57 kcal/mol,并通过了所有ADMET阈值(未预测到hERG抑制,肝毒性低)。
  • 可扩展性: 整个流程——从RNA‑seq到先导化合物列表——在一台普通的GPU工作站上约48 小时内完成,展示了常规临床使用的可行性。

实际意义

  • 患者特异性药物管线: 肿瘤实验室可以将新测序的 AML 样本输入工作流,并在数天内获得一份化学可操作的候选列表,从而缩短“从实验台到临床”的周期。
  • 加速命中到先导: 由于算法基于已知反应构建分子,生成的化合物在合成上是可行的,便于向药物化学合成过渡。
  • 超越 AML: 模块化的结构(靶点发现 → 结构 → 热点 → 组装)意味着同一框架可以重新用于其他异质性癌症、传染病或有转录组数据的罕见遗传疾病。
  • 与现有管线整合: 生成的先导化合物可以直接输入高通量筛选或 AI 驱动的活性预测平台,补充依赖已有库的传统虚拟筛选。

局限性与未来工作

  • 大规模 vs. 单细胞数据: 该研究使用了批量 RNA‑seq,可能掩盖亚克隆表达模式;加入单细胞转录组学可细化靶点选择。
  • 体外验证: 所有效能声明均为计算得出;需要实验性的结合测定和细胞活力测试以确认活性。
  • 对接准确性: SwissDock 提供快速的结合能估计,但缺乏显式的溶剂化和熵项;未来工作将整合更严格的自由能方法(如 MM‑GBSA)。
  • 算法泛化: 虽然反应优先的元启发式在 AML 靶点上表现良好,但需要对其他蛋白家族进行基准测试,以证明其广泛适用性。

结论: 本文展示了一个将系统层面转录组学与自定义、反应驱动的分子生成器相结合的概念验证,为 AML 乃至许多其他疾病的真正个性化药物设计开辟了现实路径。

作者

  • Abdullah G. Elafifi
  • Basma Mamdouh
  • Mariam Hanafy
  • Muhammed Alaa Eldin
  • Yosef Khaled
  • Nesma Mohamed El‑Gelany
  • Tarek H. M. Abou‑El‑Enien

论文信息

  • arXiv ID: 2512.21301v1
  • 类别: cs.LG, q-bio.QM
  • 发表时间: 2025年12月24日
  • PDF: 下载 PDF
Back to Blog

相关文章

阅读更多 »