O rodzinie
Genie to rodzina foundation world models rozwijana przez Google DeepMind, której celem jest generowanie nieograniczonej różnorodności sterowanych akcjami środowisk do trenowania i ewaluacji uogólniających agentów AI. Rodzina zaczęła się od modelu Genie (2024) opisanego w pracy "Genie: Generative Interactive Environments" — generatywnego modelu uczonego z internetowych materiałów wideo, który tworzy interaktywne światy 2D na podstawie pojedynczego obrazu. Genie 2 (grudzień 2024) jest dużym, autoregresyjnym modelem latentnej dyfuzji, który generuje spójne światy 3D sterowane klawiaturą i myszą przez około 10–60 sekund, demonstrując m.in. pamięć długodystansową, animację postaci, fizykę, oświetlenie i efekty cząsteczkowe. Genie 3 (sierpień 2025) kontynuuje ten kierunek, rozszerzając horyzont generacji i jakość symulowanych światów. Rodzina pełni rolę zaplecza dla badań nad embodied agents (np. SIMA) oraz nad generalną AI zdolną działać w bogatych, interaktywnych środowiskach.