[Paper] QIME:通过本体驱动的问题构建可解释的医学文本嵌入

发布: (2026年3月2日 GMT+8 18:18)
6 分钟阅读
原文: arXiv

Source: arXiv - 2603.01690v1

(请提供您希望翻译的具体文本内容,我将为您翻译成简体中文并保持原有的格式、Markdown 语法以及技术术语不变。)

概览

本文介绍了 QIME,这是一种将医学文本(例如临床笔记、研究摘要)转换为既高性能又可读的嵌入的新方法。QIME 并不使用不透明的稠密向量,而是将每篇文档表示为一系列 基于生物医学本体衍生的临床问题的是/否答案。这种方式使得嵌入对临床医生和开发者都具有可解释性,同时在准确性上仍可与黑箱模型竞争。

关键贡献

  • 基于本体的问句生成:利用医学概念签名(如 SNOMED‑CT、MeSH)自动构造细粒度、临床意义明确的二元问句。
  • 免训练嵌入构建:无需为每个问句训练单独的分类器;答案直接从语言模型的掩码语言模型(MLM)概率中获取。
  • 兼顾可解释性与性能:在生物医学相似度、聚类和检索任务上实现最先进的结果,缩小与密集黑箱编码器之间的差距。
  • 可扩展且模块化的设计:新医学领域或本体可在最少的工程工作量下接入。

方法论

  1. 概念签名提取

    • 对于每个医学本体簇(例如“心血管疾病”),作者使用 TF‑IDF 和本体层级信息收集一组代表性术语(签名)。
  2. 问题生成

    • 使用模板(“文本中是否提到 X?”)对每个签名术语进行实例化,生成候选是/否问题池。
    • 轻量评分模型根据 语义原子性(具体且非冗余程度)和 临床相关性 对问题进行排序。
  3. 通过 MLM 回答

    • QIME 并不为每个问题训练二分类器,而是将问题和目标文本一起输入预训练的生物医学语言模型(例如 BioBERT)。
    • 模型对 “yes” 与 “no” 的掩码标记概率提供二元答案,构成最终嵌入的一个维度。
  4. 嵌入组装

    • 二元答案的拼接向量(例如 256‑dim)即为 可解释嵌入
    • 由于每个维度对应具体问题,开发者可以读出文档相似的原因(例如,两篇文档都对 “是否提到高血压?” 回答 “yes”)。

结果与发现

BenchmarkQIME vs. Prior Interpretable MethodsQIME vs. Black‑Box Encoders
生物医学语义相似性 (BIOSSES)+12.4% Spearman 改进-3.1% 相对于 BioBERT(差距缩小)
聚类(PubMed 摘要的 k‑means)Adjusted Rand Index +0.18Within 5% 与密集嵌入相差 5% 以内
检索(基于 MeSH 的查询)Recall@10 +9.7%Within 2% 与 SOTA 密集检索器相差 2% 以内

关键要点

  • 即使是免训练变体也 优于 基于分类器的版本,表明基于 MLM 的回答是一个强信号。
  • 定性分析显示,排名最高的问题往往对应临床决定性概念(例如,“患者是否在使用抗凝剂?”)。

Practical Implications

  • 可解释的 AI 用于临床决策支持:开发者可以嵌入患者笔记,实时展示驱动相似度分数的具体临床事实,帮助建立信任并实现审计。
  • 检索系统的快速原型构建:由于无需对每个问题进行训练,团队只需定义感兴趣的本体,即可快速搭建可搜索的知识库。
  • 合规性:可解释的嵌入满足医疗 AI 部署中日益出现的“解释权”要求。
  • 领域适应:添加新专业(例如肿瘤学)只需相应的本体;QIME 会自动生成相关问题,无需重新训练整个模型。

限制与未来工作

  • 本体依赖:嵌入的质量取决于底层医学本体的完整性和粒度;罕见或新兴概念可能会被遗漏。
  • 二元问题范围:复杂关系(例如时间或因果关系)被简化为是/否,可能会过度简化细微的临床叙述。
  • 问题集的可扩展性:非常大的签名池会导致嵌入维度膨胀;未来工作可以探索自适应剪枝或层次化问题编码。
  • 在真实临床工作流中的评估:本文侧重于基准数据集;在实际EHR系统中部署 QIME 并衡量其对临床医生工作流的影响仍是未完成的步骤。

作者

  • Yixuan Tang
  • Zhenghong Lin
  • Yandong Sun
  • Anthony K. H. Tung

论文信息

  • arXiv ID: 2603.01690v1
  • 分类: cs.CL, cs.AI
  • 发表时间: 2026年3月2日
  • PDF: 下载 PDF
0 浏览
Back to Blog

相关文章

阅读更多 »