[Paper] AnchorOPT:致力于优化动态锚点的自适应提示学习

发布: (2025年11月26日 GMT+8 17:11)
2 min read
原文: arXiv

Source: arXiv

AnchorOPT: 朝着优化动态锚点用于自适应提示学习的方向

摘要

现有基于 CLIP 模型的提示学习方法利用文本标记作为锚点来引导可学习的软标记,从而提升 CLIP 的泛化能力。然而,这些锚点在数值和位置上都是静态的,缺乏跨任务和阶段的自适应灵活性。为了解决这一局限,我们提出 AnchorOPT,一种基于动态锚点的提示学习框架。AnchorOPT 在两个关键维度上引入了动态性:

  1. 锚点数值 摒弃手工设计的显式文本标记(例如 “shape”、 “color”),而是从任务特定数据中动态学习。
  2. 锚点与软标记之间的位置信息 不再固定,而是通过一个可学习的位置信息矩阵,根据训练阶段和任务上下文自适应优化。

训练流程

AnchorOPT 采用两阶段训练:

  • 阶段 1: 学习锚点标记。
  • 阶段 2: 冻结锚点,并利用它们来优化软标记和位置信息矩阵。

实验

大量实验表明,仅使用一个简单的可学习锚点和位置信息矩阵,就能实现与甚至超过那些加入额外可学习模块或正则化技术的方法相当的性能。作为即插即用的模块,AnchorOPT 能够无缝集成到现有框架中,在各类数据集上均带来一致的性能提升。

资源

Submitted to arXiv on 26 Nov 2025 (v1).

Back to Blog

相关文章

阅读更多 »