Sterowanie · Sterowanie i planowanie

π0 (pi-zero)

Name: π0 (pi-zero)
Brand: Physical Intelligence

π0-FAST·Physical Intelligence

Aktywny Open source Dostępne API

KATEGORIASterowanie · Sterowanie i planowanie

GOTOWOŚĆTRL 7

SKALA ADOPCJIBadania / prototyp

LICENCJEApache-2.0

PIERWSZE WYDANIE2024

**π0 (pi-zero)** to flagowy model VLA (Vision-Language-Action) firmy Physical Intelligence, ogłoszony w październiku 2024 r. i opisany w pracy 'π0: A Vision-Language-Action Flow Model for General Robot Control' (arXiv:2410.24164, autorzy: Black, Brown, Driess et al.). Pi-zero jest pierwszym publicznie znanym 'generalist robot policy' wykonującym zręczne, dłuższe sekwencje czynności (multi-minute manipulation) na wielu różnych robotach — w tym jednoramienne i dwuramienne ramiona Franka, ALOHA, UR5, oraz humanoid Mobile ALOHA.

Architektura składa się z trzech warstw: (1) **VLM backbone** — PaliGemma 3B (Google) jako fundament wzroku-języka, wzbogacony o dodatkowe tokeny akcji. (2) **Action expert** — sieć typu transformer ~300 M parametrów generująca strumień ciągłych akcji (joint velocities) za pomocą **flow matching** (zamiast dyskretyzacji akcji jak w RT-2 / OpenVLA — flow matching pozwala na inferencję w pełnej precyzji ciągłej i mniejsze szumy). (3) **Action chunking** — model przewiduje 50 kolejnych akcji jednocześnie (chunk 1 sekundy przy 50 Hz), co znacząco redukuje latencję efektywną i pozwala na płynne, koordynowane ruchy.

Dane treningowe: ~10 000 godzin demonstracji z **8 platform robotycznych** zebranych przez Physical Intelligence + zbiór Open X-Embodiment (1 mln trajektorii). Demonstracje pochodzą z teleoperacji (VR rig + ALOHA). Zadania w eval suite: składanie t-shirtów, pakowanie pudełek wysyłkowych Amazon-style, sprzątanie stołu, ładowanie zmywarki, składanie kartonu. **π0-base** (luty 2025) został udostępniony jako open weights na Apache 2.0 (pierwsze 'generalist' weights w historii).

Inferencja: ~1 GPU H100 dla pełnego π0 (3 B parametrów), latencja ~50-200 ms per chunk akcji (50 akcji = 1 s ruchu). Fine-tuning dostępny przez `openpi` codebase na GitHub (Apache 2.0). Wersja **π0.5** (kwiecień 2025) wprowadza co-training z dodatkowymi zbiorami multimodalnymi i lepszą generalizację out-of-distribution (np. nieznane pomieszczenia).

Dokumentacja

Obsługiwane modele robotów

Unitree G1

Humanoidalny robot dwunożny firmy Unitree Robotics, zaprojektowany jako kompaktowa platforma badawczo-rozwojowa oraz deweloperska.

Applications

Badania
Asystencja domowa

Unitree H1

Pełnowymiarowy uniwersalny humanoid Unitree Robotics, ok. 180 cm i 47 kg, 5 DOF na nogę, prędkość 3,3 m/s, percepcja 3D LiDAR + kamera głębi, kluczowe stawy z silnikami PMSM Unitree M107.

Applications

Badania

Figure 03

Figure 03 to trzeciej generacji humanoidalny robot Figure AI, zaprojektowany dla Helix, środowiska domowego i skalowalnej produkcji masowej.

Applications

Automatyzacja fabryki
Logistyka przemysłowa
Obsługa linii produkcyjnej
Automatyzacja magazynowa
Manipulacja obiektami
Asystencja domowa

MagicBot Z1

Kompaktowy, dynamiczny humanoid bipedalny MagicLab. 140 cm, 40 kg, 24–50 DOF, prędkość chodu do 2,5 m/s. Zaprezentowany 8 lipca 2025 wyczynami z zakresu sztuk walki i akrobacji.

Applications

Badania
Hotelarstwo
Handel detaliczny
Asystencja domowa
Manipulacja obiektami

Sonny

Semi-humanoidalny, dwuręczny robot Tutor Intelligence przeznaczony do złożonych zadań manualnych w fabrykach i magazynach; flota 100 sztuk pracuje w Data Factory 1 generując dane do treningu modeli foundation.

Applications

Automatyzacja fabryki
Manipulacja obiektami
Logistyka przemysłowa
Badania
Obsługa linii produkcyjnej
Obsługa maszyn

Docelowe platformy robotyczne

Ramię robotyczne

Robot mobilny

Humanoid

Robot usługowy

Robot badawczy

Obsługiwany sprzęt

NVIDIA Jetson AGX Orin 64GB

NVIDIA Jetson AGX Thor

compute · compute_modules · industrial

Intel RealSense D435i

sensing · cameras · research · Stereoskopowa kamera RGB-D

Stereolabs ZED 2i

sensing · cameras · industrial

Intel NUC 13 Pro

compute · compute_modules · professional

Licencje

Apache-2.0Apache License 2.0v2.0

Rodzina licencji: Licencja permisywna

ModyfikacjaDystrybucjaUżytek komercyjnySublicencjonowanieUżytek prywatnyKompatybilna z ROSOSI zatwierdzonaFSF Free/LibreWymaga oznaczenia autorstwaPatent grant

Permissive licencja open source opracowana przez Apache Software Foundation. Zawiera jawne udzielenie praw patentowych przez kontrybutorów (patent grant) oraz klauzulę retaliation (utrata licencji przy pozwie patentowym). Wymaga zachowania tekstu licencji, NOTICE file i informacji o zmianach w modyfikowanych plikach.

Uwaga dla robotyki

Oficjalna licencja Open Robotics dla rdzenia ROS 2 i większości pakietów tier-1. Standard de facto dla oprogramowania robotycznego open source. Klauzula patentowa chroni użytkowników przed pozwami ze strony kontrybutorów – preferowana nad MIT w projektach korporacyjnych. Kompatybilna z GPL v3 (ale nie GPL v2).

Oficjalny tekst ↗SPDX ↗OSI ↗

Historia wersji

π0-FASTsie 2025

Wersja zoptymalizowana pod inferencję na Jetson AGX Orin — 4-bit quantization, ~30 ms per chunk akcji.

π0.5kwi 2025

Druga generacja z co-trainingiem na zbiorach multimodalnych — lepsza generalizacja out-of-distribution (np. nowe pomieszczenia, nieznane obiekty).

π0-base open weightslut 2025

Udostępnienie wag π0-base na Apache 2.0 wraz z codebase `openpi` do fine-tuningu.

π0 paper preprintpaź 2024

Publikacja preprintu arXiv:2410.24164 — pierwsze publiczne ujawnienie π0 z demonstracjami i benchmarkami.

Sterowanie · Sterowanie i planowanie

π0 (pi-zero)

π0-FAST·Physical Intelligence

Aktywny Open source Dostępne API

KATEGORIASterowanie · Sterowanie i planowanie

GOTOWOŚĆTRL 7

SKALA ADOPCJIBadania / prototyp

LICENCJEApache-2.0

PIERWSZE WYDANIE2024

Dokumentacja

Obsługiwane modele robotów

Unitree G1

Humanoidalny robot dwunożny firmy Unitree Robotics, zaprojektowany jako kompaktowa platforma badawczo-rozwojowa oraz deweloperska.

Applications

Badania
Asystencja domowa

Unitree H1

Pełnowymiarowy uniwersalny humanoid Unitree Robotics, ok. 180 cm i 47 kg, 5 DOF na nogę, prędkość 3,3 m/s, percepcja 3D LiDAR + kamera głębi, kluczowe stawy z silnikami PMSM Unitree M107.

Applications

Badania

Figure 03

Figure 03 to trzeciej generacji humanoidalny robot Figure AI, zaprojektowany dla Helix, środowiska domowego i skalowalnej produkcji masowej.

Applications

Automatyzacja fabryki
Logistyka przemysłowa
Obsługa linii produkcyjnej
Automatyzacja magazynowa
Manipulacja obiektami
Asystencja domowa

MagicBot Z1

Kompaktowy, dynamiczny humanoid bipedalny MagicLab. 140 cm, 40 kg, 24–50 DOF, prędkość chodu do 2,5 m/s. Zaprezentowany 8 lipca 2025 wyczynami z zakresu sztuk walki i akrobacji.

Applications

Badania
Hotelarstwo
Handel detaliczny
Asystencja domowa
Manipulacja obiektami

Sonny

Applications

Automatyzacja fabryki
Manipulacja obiektami
Logistyka przemysłowa
Badania
Obsługa linii produkcyjnej
Obsługa maszyn

Docelowe platformy robotyczne

Ramię robotyczne

Robot mobilny

Humanoid

Robot usługowy

Robot badawczy

Obsługiwany sprzęt

NVIDIA Jetson AGX Orin 64GB

NVIDIA Jetson AGX Thor

compute · compute_modules · industrial

Intel RealSense D435i

sensing · cameras · research · Stereoskopowa kamera RGB-D

Stereolabs ZED 2i

sensing · cameras · industrial

Intel NUC 13 Pro

compute · compute_modules · professional

Licencje

Apache-2.0Apache License 2.0v2.0

Rodzina licencji: Licencja permisywna

ModyfikacjaDystrybucjaUżytek komercyjnySublicencjonowanieUżytek prywatnyKompatybilna z ROSOSI zatwierdzonaFSF Free/LibreWymaga oznaczenia autorstwaPatent grant

Uwaga dla robotyki

Oficjalny tekst ↗SPDX ↗OSI ↗

Historia wersji

π0-FASTsie 2025

Wersja zoptymalizowana pod inferencję na Jetson AGX Orin — 4-bit quantization, ~30 ms per chunk akcji.

π0.5kwi 2025

Druga generacja z co-trainingiem na zbiorach multimodalnych — lepsza generalizacja out-of-distribution (np. nowe pomieszczenia, nieznane obiekty).

π0-base open weightslut 2025

Udostępnienie wag π0-base na Apache 2.0 wraz z codebase `openpi` do fine-tuningu.

π0 paper preprintpaź 2024

Publikacja preprintu arXiv:2410.24164 — pierwsze publiczne ujawnienie π0 z demonstracjami i benchmarkami.