1周前 · ai [Paper] 从观察到行动:基于潜在动作的原语分割用于工业环境中的 VLA 预训练 我们提出了一种新颖的无监督框架,用于从连续的工业视频流中解锁海量未标记的人类示范数据,以用于 Vision-Language-Action ...