Aktualności23 czerwca 2026 VLA-JEPA: latentny model świata dla robotów zamiast pikseli
Chiński zespół z USTC, Zhongguancun Academy, SJTU i Eastern Institute of Technology Ningbo opracował VLA-JEPA — framework JEPA do pretreningu modeli VLA, który uczy się dynamiki świata w przestrzeni utajonej zamiast przewidywać piksele. Na LIBERO osiągnął 97,2% skuteczności, na OOD benchmarku LIBERO-Plus 78,1% — i pokazał, że 13 trajektorii wystarczy do prostych zadań montażowych.