RL
Foundation model RLWRLD do dexterous manipulation; oparty o architekturę Multi-Stream Action Transformer (MSAT) z dedykowanymi strumieniami dla wizji, dotyku, momentów i pamięci.
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsBazowy model robotycznyModel wzrok-język-akcjaModel multimodalny
Parametry
8.1B (mid-trained)
parametrów
Data premiery
7 maja 2026
Dostęp:DownloadWdrożenie:💻 Lokalnie📱 Na urządzeniu
Przegląd
Klasyfikacja
Bazowy model robotycznyModel wzrok-język-akcjaModel multimodalny
Dostęp i wdrożenie
Pobieranie
LokalnieNa urządzeniu
Wagi: Open weights
Kluczowe parametry
🧩 Parametry: 8.1B (mid-trained)
✓ Fine-tuning
📥 Wejście: obraz, wideo, tekst, sensory robota…
Robotyka
Dexterous manipulationBimanual manipulationRobot manipulation
Specyfikacja techniczna
Parametry
8.1B (mid-trained)
parametrów
Licencja
Open weights (Hugging Face — RLWRLD)
Wymagania sprzętowe
Inference zoptymalizowane dla GPU klasy NVIDIA RTX 5090 + Intel Core Ultra 7 265K (latencja p50 ~43 ms dla wariantu all-modality dzięki static graph + CUDA Graph + fuzji jąder).
Funkcje:✓ Fine-tuning
Modalności
⬇ Wejście (Input)
imagevideotextrobot_sensorsrobot_state_data
⬆ Wyjście (Output)
robot_actionsmotion_trajectoriesmanipulator_controlrobot_commands
Możliwości i zastosowania
Natywne możliwości modelu
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Robotyka
Dexterous manipulationBimanual manipulationRobot manipulation
Wyniki benchmarków
10 benchmarków
LIBERO
average success rate · RLDX-1-PT, simulation
97.8%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
RoboCasa Kitchen
average success rate · RLDX-1-PT vs GR00T N1.6 66.2 / π₀.₅ 62.1
70.6%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
RoboCasa GR-1 Tabletop
average success rate · RLDX-1-PT, humanoid suite (+10.7%p vs GR00T N1.5 48.0)
58.7%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
RoboCasa 365
average success rate · RLDX-1-PT, long-horizon multi-stage (+5.2%p vs GR00T N1.6 26.9)
32.1%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
SIMPLER Google-VM
average success rate · RLDX-1-PT, simulation
81.5%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
LIBERO-Plus
total robustness · RLDX-1-PT vs GR00T N1.6 72.6 / π₀-FAST 64.2
86.7%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
ALLEX Conveyor Pick-and-Place
success rate · RLDX-1-MT-ALLEX, real-world
87.5%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
ALLEX Object-in-Box Selection
success rate · RLDX-1-MT-ALLEX, real-world
91.7%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
ALLEX Pot-to-Cup Pouring
success rate · RLDX-1-MT-ALLEX, real-world
70.8%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
DROID Shell Game (memory)
success rate · RLDX-1-MT-DROID, Franka Research 3 + AnySkin
91.7%
📅 7 maj 2026📄 RLWRLD Tech Report (arXiv:2605.03269)
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)