26 lutego 2026 · 6 min lektury

Chiński Spirit AI nowym jednorożcem. Roboty uczą się na "brudnych danych"

Okładka: Chiński Spirit AI nowym jednorożcem. Roboty uczą się na "brudnych danych"

Zaledwie dwa lata po rynkowym debiucie start-up Spirit AI zamknęła dwie gigantyczne rundy finansowania o łącznej wartości blisko 2 miliardów juanów (ok. 280 milionów dolarów), co katapultowało jej wycenę znacznie powyżej progu 1,4 miliarda dolarów. Spółka zdominowała nagłówki portali technologicznych nie tylko ze względu na skalę inwestycji, ale przede wszystkim dzięki radykalnemu podejściu do inżynierii uczenia maszynowego – wprowadzając na zrobotyzowane linie produkcyjne systemy trenowane na błędach i "brudnych danych".

Najważniejsze w skrócie

  • Status jednorożca i ogromny kapitał: Spirit AI pozyskało 2 mld RMB (ok. 280 mln USD), zyskując zaufanie kluczowych graczy przemysłowych i państwowych funduszy, co czyni z firmy jednego z liderów azjatyckiego wyścigu o ucieleśnioną inteligencję.
  • Architektura VLA open-source: Wypuszczony na początku 2026 roku darmowy model językowo-wizyjno-ruchowy Spirit v1.5 oficjalnie wyprzedził w globalnych benchmarkach konkurencyjny model Pi0.5, wykazując doskonałą zdolność do natychmiastowej adaptacji (zero-shot).
  • "Brudne dane" jako klucz do skalowania: Zamiast sterylnie przygotowanych symulacji, inżynierowie użyli do treningu setek tysięcy godzin nieustrukturyzowanych interakcji z rzeczywistością, co znacząco poprawiło elastyczność maszyn.
  • Sprawdzian bojowy w fabrykach i handlu: Humanoidalne roboty pracują już z precyzją rzędu milisekund w zakładach produkcyjnych baterii CATL oraz obsługują klientów na halach sprzedażowych giganta e-commerce JD.com.

Od laboratorium do hal fabrycznych w rekordowym tempie

Założona w lutym 2024 roku przez Han Fengtao (byłego dyrektora technicznego Rokae Robotics) oraz Gao Yanga z Uniwersytetu Tsinghua, firma Spirit AI szybko udowodniła, że potrafi przekuć akademickie koncepcje w twardy, przemysłowy hardware. Najnowsza runda finansowania to w dużej mierze pokaz siły chińskiego ekosystemu innowacji. Wśród inwestorów znalazły się nie tylko topowe fundusze venture capital, takie jak Sequoia China (HongShan) czy Yunfeng Capital, ale także państwowe wehikuły inwestycyjne z miast Chongqing i Hangzhou.

Największą przewagą Spirit AI jest jednak pozyskanie tzw. Kapitału przemysłowego. Wejście w strukturę udziałową gigantów takich jak CATL, Xiaomi, Huawei i TCL to nie tylko zastrzyk gotówki, ale przede wszystkim gwarancja dostępu do najcenniejszego zasobu w robotyce: rzeczywistych środowisk testowych i niewyczerpanych strumieni surowych danych. To właśnie to "pełne zjednoczenie ekosystemu" sprawia, że firma w ciągu dwóch lat przeszła drogę, którą innym zajmuje dekadę.

Rewolucja "brudnych danych" i piramidy szkoleniowej

Z technologicznego punktu widzenia Spirit AI łamie dotychczasowe konwencje. Większość firm zajmujących się sztuczną inteligencją w robotyce obsesyjnie dąży do czystości zestawów treningowych. Tradycyjne modele wizyjne i przestrzenne (world models) pochłaniają gigantyczną moc obliczeniową, próbując precyzyjnie przewidzieć każdy kolejny kadr i ruch w wyidealizowanym środowisku. Podejście Spirit AI, określane mianem "piramidy danych", całkowicie odwraca tę logikę.

Podstawą algorytmów firmy są potężne, autorskie modele VLA (Vision-Language-Action), które we wstępnej fazie uczone są na masowej liczbie ogólnodostępnych nagrań wideo z internetu pokazujących ludzi podczas codziennych czynności. Następnie modele te są dotrenowywane za pomocą danych, które sami twórcy nazywają "brudnymi". Są to nieustrukturyzowane, pełne szumu zapisy z rzeczywistych interakcji w świecie fizycznym – zawierające błędy, potknięcia, zmiany oświetlenia czy nieoczekiwane zachowania materiałów.

Teleoperacja a sprzęt ubieralny: Nowe zasady gry

Większość branży od lat polega na kosztownej teleoperacji, gdzie inżynier steruje robotem-marionetką, aby zarejestrować dla modelu idealną ścieżkę wykonania zadania. Koszty takiego podejścia są jednak astronomiczne, a czas pozyskiwania terabajtów informacji skutecznie hamuje rozwój branży. Spirit AI podeszło do problemu inaczej.

Firma stworzyła własne, tanie systemy czujników ubieralnych (obecnie w piątej generacji), które ludzie noszą podczas wykonywania swoich normalnych obowiązków. System rejestruje wszystkie niedoskonałości i naturalne korekty ruchu ludzkiego ciała, redukując koszty pozyskania bazy treningowej aż dziesięciokrotnie w stosunku do standardów rynkowych. Dzięki temu potężny LLM zasilający ich maszyny nie "panikuje", gdy napotka nieprzewidzianą sytuację, lecz w locie adaptuje się do warunków. To mechanizm zbliżony w swoich założeniach do osiągnięć potęg takich jak brytyjski DeepMind, z tą różnicą, że Chińczykom udało się z sukcesem wdrożyć go na liniach produkcyjnych i zaoferować jako open-source (Spirit v1.5).

Humanoidy na etacie: Xiaomo i Moz1

Wdrażanie zaawansowanego oprogramowania bez odpowiedniego sprzętu (hardware) bywa ślepą uliczką, dlatego Spirit AI rozwija kompleksową infrastrukturę sprzętową. Ich humanoidalne maszyny mogą pochwalić się 26 stopniami swobody (DOF) i imponującym, niespotykanym dotąd w klasie ogólnego przeznaczenia stosunkiem udźwigu do własnej masy na poziomie 1:1.

Najbardziej jaskrawym przykładem sukcesu operacyjnego jest model "Xiaomo", który przeszedł z fazy laboratoryjnej do morderczej pracy trójzmianowej. Roboty tego typu zostały zainstalowane na linii produkcyjnej bazy Zhongzhou należącej do CATL. Służą tam jako kluczowy element montażowy elastycznych wiązek przewodów. Błyskawicznie reagując na zmienność linii produkcyjnej (czas reakcji na poziomie milisekund), wyprodukowały już blisko 1000 zestawów akumulatorowych przy zerowej tolerancji błędu. Co zaskakujące, w wielu sekwencjach ich tempo pracy przewyższa możliwości fizyczne wykwalifikowanych operatorów ludzkich.

Z kolei na rynku komercyjnym i usługowym firma wdrożyła linię robotów "Moz1". We współpracy detalicznej maszyny te pełnią funkcje doradcze i interaktywne. Rozmawiają z klientami, demonstrują produkty i poruszają się swobodnie między sklepowymi półkami, pełniący rolę fizycznych awatarów platform e-commerce.

Dlaczego to ważne?

Wkroczenie Spirit AI do klubu "jednorożców" to nie jest zwykła ciekawostka finansowa z azjatyckiego parkietu inwestycyjnego, lecz wyraźny symptom transformacji całej branży technologicznej. Zamykamy właśnie erę zachwytów nad chatbotami potrafiącymi napisać wiersz lub zsyntetyzować obraz, a wchodzimy w epokę Physical AI (fizycznej sztucznej inteligencji). Dane rynkowe nie kłamią – tylko w 2025 roku chiński sektor robotyki opartej na fundamentach AI zebrał blisko 73,5 miliarda juanów we wsparciu finansowym z ponad 740 odrębnych transakcji.

Sukces Spirit AI wyznacza wektor tego rozwoju. Model "czystego oprogramowania", który królował w Dolinie Krzemowej przez ostatnie kilkanaście lat, napotyka barierę braku rąk do pracy w fizycznym świecie. Przejście od dostarczania jedynie algorytmu do sprzedaży "kompetencji i percepcji w pudełku" to budowa najpotężniejszej w historii fosy rynkowej (moat). Fakt, że firma wykorzystuje brudne, zaszumione dane jako główny silnik do skalowania swoich architektur wielomodalnych, dowodzi dojrzałości technologicznej. Aby maszyny potrafiły nawigować w chaotycznym świecie fabryk, logistyki i handlu, same musiały przestać być sterylne. Uczenie robotów potknięć i błędów to jedyna droga do pełnej autonomii, a mariaż kapitału technologicznego z przemysłowym udowadnia, że era w pełni użytecznych, "rozumiejących fizykę" asystentów nadeszła szybciej, niż prognozowali analitycy.

Co dalej?

  • Skalowanie "brudnych danych": Spółka zapowiedziała potężne przyspieszenie w akwizycji danych. Celem jest zgromadzenie ponad 1 miliona godzin materiału z rzeczywistych interakcji ucieleśnionych do końca 2026 roku. Pomoże w tym najnowsza generacja autorskich ubieralnych sensorów, której koszty operacyjne ograniczono do ułamka kwoty z ubiegłego roku.
  • Wielka ekspansja z gigantami chmury: Współpraca z siecią detaliczną JD to dopiero początek. Połączenie mocy chmurowych (JD Cloud), modelu Joyinside i robotów Moz wytycza drogę do dwukierunkowej optymalizacji – maszyny będą nie tylko obsługiwać klientów, ale na żywo karmić wielkie modele językowe danymi behawioralnymi z hal sprzedaży.
  • Standaryzacja przemysłowa na rynkach "New Energy": Oczekuje się, że sukces pilotażowy na liniach CATL otworzy firmie drzwi do wdrożeń na masową skalę w globalnym łańcuchu dostaw. Spirit AI będzie priorytetyzować szybką personalizację dla różnych typów linii produkcyjnych, uderzając w sektory zielonej energii, od produkcji ogniw fotowoltaicznych po masowy montaż pojazdów EV.

Źródło: Na podstawie doniesień informacyjnych oraz raportów rynkowych portali Pandaily, Ventureburn, Gasgoo, EqualOcean oraz DealStreetAsia.

Udostępnij ten artykuł

Powiązane artykuły