[Paper] 当视觉压倒语言:评估与缓解 VLAs 中的反事实失效
Vision-Language-Action models (VLAs) 旨在将语言指令与机器人控制相结合,但在实践中往往未能忠实地遵循语言。当 pr...
Vision-Language-Action models (VLAs) 旨在将语言指令与机器人控制相结合,但在实践中往往未能忠实地遵循语言。当 pr...
奖励建模是现代对齐流水线的核心组成部分,包括 RLHF 和 RLAIF,支撑包括 PPO 和 TRPO 在内的策略优化方法。如何...
Language Identification (LID) 是许多多语言自然语言处理流水线中的重要组成部分,它有助于语料库策划、训练…
我们提出了一种两阶段的 “Mine and Refine” 对比训练框架,用于语义文本嵌入,以提升多类别电子商务搜索检索。Larg...
人类可以从二维 visual inputs 中推断出物体的 three-dimensional 结构。对这种能力的建模一直是科学界的长期目标。
随着人类在高风险决策中日益依赖多轮对话 AI,亟需原则性框架来确保此类交互能够可靠地实现……
Black-box 对抗攻击在大型视觉语言模型(LVLMs)上具有挑战性,因为缺少梯度且多模态边界复杂。虽然先前的研究…
市场区域模型,例如 Huff 模型及其扩展,广泛用于估计零售和服务地点的区域市场份额和客户流动。
从复杂场景中检索用户指定的对象仍然是一项具有挑战性的任务,尤其是当查询含糊不清或涉及多个相似对象时。Exi...
学习 time series foundation models 已被证明是跨多种 time series 领域进行 zero-shot time series 预测的有前景的方法。Insof...
使用 LLM 进行推理正越来越多地在更广泛的验证循环中展开。系统在内部使用廉价检查,例如 self-consistency 或 proxy rewards,wh...
现代离线强化学习(RL)方法能够找到性能良好的actor-critics,然而,使用value-based RL algorithms对这些actor-critics进行在线微调……