Sakana Fugu (サカナ・フグ) to flagowy międzynarodowy produkt komercyjny japońskiego laboratorium Sakana AI, dostarczający pełny multi-agentowy system orkiestracji w postaci jednego foundation modelu z OpenAI-kompatybilnym endpointem API. Premiera bety odbyła się 24 kwietnia 2026, ogólna dostępność (GA) wraz z modelem Fugu Ultra — 22 czerwca 2026.
Mechanizm działania
Fugu jest sam w sobie modelem językowym wytrenowanym, aby decydować, kiedy i komu delegować zadanie z puli zewnętrznych agentów (m.in. Gemini 3.1 Pro, GPT 5.5, Opus 4.8). Decyzje obejmują: wybór modelu, sposób komunikacji między agentami, weryfikację i syntezę odpowiedzi. Z zewnątrz użytkownik wywołuje jeden endpoint API — wewnątrz pracuje skoordynowany zespół ekspertów. Architektura bazuje na dwóch artykułach ICLR 2026: Trinity (Xu et al.) — ewolucyjny koordynator LLM, oraz Conductor (Nielsen et al.) — uczenie się orkiestracji agentów w języku naturalnym.
Dwa warianty
Fugu — równowaga między wydajnością a niską latencją, domyślny wybór do codziennej pracy. Integruje się naturalnie z narzędziami typu Codex, chatbotami i interaktywnymi serwisami. Pozwala wyłączyć konkretne modele z puli (dla zespołów z wymaganiami prywatności i compliance).
Fugu Ultra — dostrojony na maksymalną jakość odpowiedzi w trudnych, wieloetapowych problemach. Wykorzystuje głębszą pulę ekspertów. Pierwsi użytkownicy stosują go do autonomicznych badań AI, reprodukcji artykułów naukowych, analiz cyberbezpieczeństwa oraz przeszukiwania literatury i patentów.
Wyniki benchmarków
Fugu Ultra dorównuje liderom rynku (Anthropic Fable 5, Mythos Preview) na rygorystycznych benchmarkach inżynieryjnych, naukowych i rozumowania: GPQAD 95,1 (przekracza Gemini 3.1 high 94,4 i Opus 4.6 max 92,7), LCBv6 93,2, SWEPro 54,2 (vs Opus 4.6 max 53,4). W zastosowaniach AutoResearch, projektowanie mechaniczne, predykcja szeregów finansowych, kostka Rubika, analiza japońskiego pisma odręcznego i one-shot chess — Fugu konsekwentnie przewyższa modele frontier.
Rekurencyjna samo-orkiestracja
Wyróżniającą cechą jest możliwość rekurencyjnego wywoływania samego siebie jako agenta w puli. Model czyta własne wcześniejsze odpowiedzi jako kontekst i decyduje, czy zrewidować strategię koordynacji. Daje to nową oś test-time scaling — głębokość rekurencji można regulować w czasie inferencji bez retreningu. Mały model, czytając siebie, dochodzi do odpowiedzi nieosiągalnych w pojedynczym przebiegu.
Kontekst geopolityczny: suwerenność AI
Sakana AI pozycjonuje Fugu jako praktyczny hedge przeciwko ryzyku zależności od jednego dostawcy. Po nałożeniu kontroli eksportowych na modele Anthropic Fable 5 i Mythos, dostęp może być cofnięty z dnia na dzień. Pula agentów Fugu jest w pełni wymienialna — jeśli jeden dostawca ograniczy dostęp, Fugu dynamicznie omija przerwę. To czyni go infrastrukturą krytyczną dla finansów, infrastruktury i administracji rządowej w epoce AI sovereignty.