
9 mar 2026
MoDE-VLA
Robotyczny model VLA od Sharpa do kontaktowo-bogatych, bimanualnych zadań manipulacyjnych z użyciem wzroku, języka, siły i dotyku.
Specyfikacja techniczna
Okno kontekstunieujawnione publicznie
Parametrynieujawnione publicznie; backbone obejmuje SigLIP So400m/14, PaliGemma (Gemma-3B) oraz action expert Gemma-300M
LicencjaCC BY 4.0 for paper; model/license for weights not publicly disclosed
Tool useNie
Fine-tuningNie
Ostatnia aktualizacja: 12 mar 2026
Modalności
Wejście
Tekst
robot vision
Sensory
Stan robota
Wyjście
Akcje robota
Komendy robota
Sterow. manip.
Trajektorie

