[Paper] ReSAM:细化、重新查询与强化:自提示点监督遥感图像分割
交互式分割模型,例如 Segment Anything Model(SAM),在自然图像上展示了显著的泛化能力,但表现不佳……
交互式分割模型,例如 Segment Anything Model(SAM),在自然图像上展示了显著的泛化能力,但表现不佳……
视频扩散模型在帧级保真度方面表现出色,但仍在运动连贯性、动态性和真实感方面存在困难,常常会产生抖动、重影或 …
对抗性攻击对基于学习的 3D 点云模型构成了重大威胁,严重削弱了它们在安全敏感应用中的可靠性。
Illumination inconsistency 是多视角 3D 重建中的一个根本性挑战。阳光方向、云层覆盖以及阴影的变化会破坏一致性……
Reward feedback learning(ReFL)已被证明在将图像生成与人类偏好对齐方面有效。然而,将其扩展到视频生成面临…
Bangla Sign Language Translation (BdSLT) 迄今为止受到严重限制,因为该语言本身资源极其匮乏。标准的句子级数据集创建……
阿尔茨海默病是一种导致认知功能下降的衰弱性疾病。及时识别该疾病对于疾病的早期干预和治疗方案的开发至关重要。
近期在 foundation models 方面的进展在 natural language processing 和 computer vision 等领域显示出巨大前景,类似的努力现在正在…
抗核抗体(ANA)检测是诊断自身免疫性疾病(包括系统性红斑狼疮、干燥综合征和硬皮病)的关键方法。尽管它的…
深度伪造检测方法的有效性往往不太取决于其核心设计,而更取决于实现细节,例如数据预处理、增强……
我们提出了 Cross-Attention-based Non-local Knowledge Distillation (CanKD),一种利用 cross-attention 的新型基于特征的知识蒸馏框架。
我们提出了一种新颖的训练方法 Merge-and-Bound (M&B),用于类别增量学习 (CIL),该方法直接在参数空间中操作模型权重,以实现高效且稳健的增量学习...