latent action tokenization | EUNO.NEWS

1个月前 · ai

[Paper] 从观察到行动：基于潜在动作的原语分割用于工业环境中的 VLA 预训练

我们提出了一种新颖的无监督框架，用于从连续的工业视频流中解锁海量未标记的人类示范数据，以用于 Vision-Language-Action ...

#unsupervised video segmentation #action primitives #vision-language-action #industrial AI #latent action tokenization