· ai · - · -
提升 AI 模型解释其预测的能力
高风险可解释性在医学诊断中的应用 在高风险环境如医学诊断中,用户通常想了解是什么导致计算机视觉模型…
高风险可解释性在医学诊断中的应用 在高风险环境如医学诊断中,用户通常想了解是什么导致计算机视觉模型…
多模态大型语言模型(MLLM)的分类性能在很大程度上取决于评估协议和真实标签的质量。比较MLLM的研究……
虽然近期的多模态大语言模型(MLLMs)取得了令人印象深刻的进展,但它们主要采用传统的自回归架构作为其……
增量少样本(IFS)分割旨在通过仅少量标注随时间学习新类别。虽然在 2D 中已被广泛研究,但仍未得到充分利用……
外科医生不仅仅是看——他们在解读。当专家观察手术现场时,他们不仅了解正在使用的器械是什么,还明白为什么选择它……
Vision Language Model (VLM) 的开发在很大程度上依赖于扩大模型规模,这阻碍了在计算受限的移动和边缘设备上的部署……
下一代自动驾驶车辆(AVs)依赖大量的多源和多模态(M^2)数据来支持实时决策。实际上,数据...
我们介绍了SurgFormer,一种用于体积网格上数据驱动软组织仿真的多分辨率门控Transformer。高保真生物力学求解器…
否定是一个基本的语言运算符,但在 diffusion-based generative systems 中仍未得到充分建模。在本工作中,我们提出了一个形式化的……
高质量的多摄像头3D流媒体对于许多 AR/VR 应用中的沉浸式体验至关重要。视角数量受限——通常是由于真实…
虽然用于视频理解的数据集已经扩展到小时级时长,但它们通常由密集拼接的片段组成,这些片段与自然的、未剪辑的...
高光谱图像(HSI)有许多应用,范围从环境监测到国家安全,可用于材料检测和识别……