News29 kwietnia 2026
World Action Models — czym są i jak działają modele uczące robotów z wideo
Modele VLA (Vision-Language-Action) stały się w ostatnich latach podstawowym podejściem do budowania robotycznych systemów sterowania opartych na sztucznej inteligencji. Ich następca — World Action Model (WAM) — to nowa kategoria architektury, która zamiast opierać naukę wyłącznie na parach obraz–instrukcja–akcja, wykorzystuje generowanie wideo jako pośredni mechanizm planowania ruchu. DreamZero, opracowany przez zespół NVIDIA i opublikowany w lutym 2026 roku jako praca naukowa na arXiv, jest pierwszym publicznie opisanym systemem tej klasy działającym w czasie rzeczywistym na prawdziwym robocie. Warto go zrozumieć, bo wyznacza kierunek, w którym może zmierzać projektowanie robotycznych modeli fundamentalnych.