Robocikowo>ROBOCIKOWO
Inne

LSI

2026AktywnyOpublikowano: 17 maja 2026Aktualizacja: 17 maja 2026Opublikowany
Teza Nathana Lamberta (2026) o tym, że AI realnie wspiera własny rozwój, ale akumulujące się tarcia (wąskość zadań, prawo Amdahla, polityka zasobów) sprowadzają trajektorię z wykładniczego RSI do bardziej liniowego LSI.
Kluczowa innowacja
Konceptualna rama opisująca, dlaczego rekursywne samodoskonalenie AI (RSI) w praktyce nie generuje wykładniczego „intelligence explosion", lecz wzrost zbliżony do liniowego — z powodu tarcia, malejących zwrotów i wąskich gardeł złożoności.
Kategoria
Inne
Poziom abstrakcji
Paradigm
Poziom operacji
SystemTreningPo-trening
Zastosowania
Polityka AI safety — kalibracja oczekiwań co do timeline'ów RSI i singularityStrategia laboratoriów AI — planowanie inwestycji w narzędzia ML4ML (autoresearch) z realistycznymi prognozami zwrotuRamowanie debaty o „fast takeoff" vs „slow takeoff" w społeczności AI safetyAnaliza efektywności konkretnych systemów samodoskonalenia (AI Scientist, DGM, AlphaEvolve) na tle tarcia LSIArgumentacja przeciwko deterministycznym narracjom intelligence explosion (Yudkowsky 2007/2008)

Jak działa

LSI identyfikuje trzy klasy tarcia w pętli samodoskonalenia AI: (1) wąskość automatyzowalnych badań — agenci dobrze optymalizują pojedyncze metryki (test loss), ale słabo radzą sobie z balansowaniem wielu celów jednocześnie, co jest właściwą pracą najlepszych badaczy; (2) malejące zwroty z równoległych agentów — analogicznie do prawa Amdahla, zwiększanie liczby agentów na zadanie szybko nasyca się, bo wszyscy próbkują z podobnej dystrybucji rozwiązań; (3) ograniczenia zasobów i polityka — alokacja miliardów dolarów na compute pozostaje pod ludzką kontrolą organizacyjną. Każde tarcie przekłada się na „utratę" zysku w cyklu, sprowadzając hipotetyczne wykładnicze RSI do bardziej linearnej trajektorii.

Rozwiązany problem

Narracja o nadciągającym intelligence explosion przez RSI ignoruje empiryczne tarcia w procesie tworzenia modeli AI. LSI dostarcza języka do precyzyjnego mówienia o tych tarciach i prognozowania trajektorii rozwoju bardziej linearnej niż wykładniczej.

Kluczowe mechanizmy

Identyfikacja trzech klas tarcia (narrow research, Amdahl-like saturation, resource politics)
Analogia do prawa Amdahla z architektury komputerów (strict saturation parallel agents)
Powiązanie z „complexity brake" Paula Allena (2011)
Argumentacja przez konkretne przykłady (PostTrainBench, AutoML niewielki impact na pracę badawczą)
Ramowanie wzrostu jako sigmoidy a nie wykładniczej (early stages of a sigmoid feel like an exponential)

Mocne strony i ograniczenia

Mocne strony
Empirycznie ugruntowane — bazuje na realnych ograniczeniach laboratoriów AI w 2025-2026
Wpływowe — natychmiast podchwycone przez mainstream (IEEE Spectrum, 6 tygodni od publikacji)
Praktyczne implikacje dla polityki i strategii AI labs
Konstruktywny przeciwwagę dla deterministycznych narracji singularity
Łączy się z bogatą tradycją myślową (Allen 2011, kontestowanie Yudkowsky 2007)
Ograniczenia
Konceptualny szkic, nie sformalizowany model matematyczny — brak ilościowych prognoz
Krytyka nazewnictwa — termin „lossy" historycznie należy do teorii informacji (Sarah Marzen w komentarzach do oryginału)
Może okazać się zbyt zachowawczy, jeśli pojawi się przełom paradygmatyczny (continual learning, world models)
Dotyczy ścieżki samodoskonalenia LLM-centric — nie wyklucza scenariuszy „Cambrian explosion of artificial life forms" (Krueger)
Jako esej blogowy nie jest peer-reviewed; siła autorytetu autora (Ai2) zastępuje formalną walidację

Komponenty

Tarcie wąskości zadań (narrow research)

Agenci AI dobrze radzą sobie z optymalizacją lokalnych metryk (test loss, single reward), ale nie z balansowaniem wielu konkurencyjnych celów charakterystycznych dla prawdziwych badań.

Tarcie skali (Amdahl's law w AI)

Dorzucanie kolejnych agentów do problemu daje szybko nasycające się przyspieszenie — wszyscy próbkują z podobnej dystrybucji rozwiązań i są ograniczani przez ludzką supervisję.

Tarcie zasobów i polityki

Alokacja miliardowych budżetów compute jest decyzją organizacyjną, nie algorytmiczną — AI nie może autonomicznie sięgać po te zasoby.

Complexity brake (Paul Allen)

Im więcej wiemy o inteligencji, tym trudniej jest robić dalszy postęp — prawo malejących zwrotów dla całego systemu badawczego.

Implementacja

Pułapki implementacyjne
Mylenie linearnego z wykładniczym wzrostemWysoka

Wczesne fazy sigmoidy wyglądają jak wykładnicze. LSI ostrzega, że spektakularne ulepszenia 2023-2026 nie muszą się utrzymać.

Ignorowanie politycznych ograniczeń zasobówWysoka

Modele scenariuszy RSI zakładające autonomiczny dostęp do miliardowych budżetów compute są nierealistyczne — alokacja pozostaje pod ludzką kontrolą organizacyjną.

Pomijanie ludzkiego wąskiego gardła supervisjiŚrednia

Pojedynczy badacz nie jest w stanie sensownie nadzorować setek agentów dziennie — to fundamentalna granica wzrostu produktywności.

Nadmierne uogólnianie z wąskich sukcesówŚrednia

Sukcesy AI w optymalizacji lokalnych metryk (Karpathy autoresearch, kernel writing) nie przekładają się automatycznie na zdolność do projektowania całych modeli.

Ewolucja

Oryginalny paper · 2026 · Interconnects (blog) · Nathan Lambert
Lossy self-improvement
Nathan Lambert
2007
Eliezer Yudkowsky — „Levels of Organization in General Intelligence" formalizuje koncepcję Seed AI i RSI (tezę, którą LSI będzie później kontestować).
2011
Paul Allen — esej „The Singularity Isn't Near" wprowadza koncepcję „complexity brake" — konceptualny przodek LSI.
Punkt przełomowy
2026
Nathan Lambert (Ai2) — esej „Lossy self-improvement" (22 marca 2026) na blogu Interconnects wprowadza termin LSI i trzy klasy tarcia.
Punkt przełomowy
2026
IEEE Spectrum — artykuł „AI Is Starting to Build Better AI" (Matthew Hutson, 7 maja 2026) popularyzuje LSI w mainstreamowej prasie technicznej.
2026
Jason Weston i Jakob Foerster (Meta) — propozycja, aby zamiast pełnego self-improvement maksymalizować co-improvement; uzupełniająca propozycja w tym samym dyskursie.

Paradygmat wykonania

Tryb główny
mixture
Wzorzec aktywacji
stage_dependent

Równoległość

Poziom równoległości
partially_parallel
Zakres
trainingacross_devices
Ograniczenia
!Amdahl's law — narzucone strukturalne ograniczenie maksymalnego przyspieszenia od liczby równoległych agentów.
!Ludzka supervisja jako wąskie gardło: pojedynczy badacz koordynuje co najwyżej kilka-kilkanaście agentów dziennie.

Wymagania sprzętowe

Iteracyjny trening z wewnętrznie generowanymi danymi wymaga GPU zarówno do inferencji (generowania danych) jak i treningu — często na tym samym klastrze.