Anthropic "dreaming": agenci AI uczą się z własnej historii sesji

Anthropic 7 maja 2026 r. zaprezentowało trzy nowe funkcje dla platformy Claude Managed Agents podczas drugiego corocznego Code with Claude Developer Conference w San Francisco. Najistotniejsza z nich — "dreaming" — to asynchroniczny mechanizm pozwalający agentom AI analizować zapisy minionych sesji i reorganizować pamięć w celu wydobycia powtarzających się wzorców. Jednocześnie Dario Amodei poinformował, że annualizowany wzrost przychodów i użytkowania Claude w Q1 2026 wyniósł 80-krotność planu bazowego, choć firma przygotowywała się wyłącznie na wzrost 10-krotny.

Najważniejsze w skrócie

Funkcja "dreaming" jest dostępna w research preview i wymaga odrębnego nagłówka beta dreaming-2026-04-21
Outcomes i multi-agent orchestration przeszły z research preview do public beta dla wszystkich deweloperów Claude
Harvey (legal AI) odnotował 6-krotny wzrost wskaźnika ukończenia zadań po wdrożeniu dreaming
Wisedocs skrócił czas przeglądu dokumentów medycznych o 50% dzięki outcomes
Anthropic podwoiło 5-godzinne limity użytkowania dla planów Pro, Max, Team i Enterprise

Czym jest dreaming — i czym nie jest

"Dreaming" nie jest mechanizmem uczenia się przez modyfikację wag modelu. Zgodnie z oficjalną dokumentacją Claude Managed Agents, dream to asynchroniczne zadanie, które jako dane wejściowe przyjmuje istniejący memory store oraz opcjonalnie do 100 transkryptów poprzednich sesji. Na wyjściu powstaje nowy, zreorganizowany memory store — duplikaty scalone, sprzeczne wpisy zastąpione aktualniejszymi wartościami, a nowe wzorce wydobyte ze wszystkich wejściowych sesji jednocześnie.

Kluczowe jest to, że memory store wejściowy nigdy nie jest modyfikowany. Deweloper może przejrzeć wynik i odrzucić go bez konsekwencji. Memory store wyjściowy jest zwykłym zasobem przestrzeni roboczej — można go dołączyć do kolejnych sesji zamiast lub obok store'a wejściowego. Dreaming jest zadaniem płatnym w standardowych stawkach tokenowych API dla wybranego modelu; w fazie beta obsługiwane są claude-opus-4-7 i claude-sonnet-4-6.

Alex Albert, szef działu product management badań w Anthropic, opisał analogię do organizacyjnego uczenia się: agent przeprowadza workflow, a po jego zakończeniu rejestruje skrót ścieżki od punktu A do B. Dreaming robi to samo automatycznie — zamiast ręcznego tworzenia umiejętności z doświadczenia, model sam wydobywa wiedzę dla przyszłych sesji.

Outcomes i multi-agent orchestration w public beta

Obie funkcje, które dotychczas były w research preview, są teraz dostępne dla wszystkich deweloperów. Outcomes pozwala zdefiniować rubric sukcesu — strukturę, standard prezentacji, ton marki lub inny zestaw kryteriów — i zlecić agentowi iterowanie w kierunku tego standardu bez udziału człowieka. Kluczowym elementem architektury jest separacja odpowiedzialności: oddzielny agent-grader ocenia wyniki w osobnym context window, wolnym od akumulowanych założeń sesji roboczej.

Multi-agent orchestration umożliwia agentowi nadrzędnemu rozkładanie złożonych zadań na podzadania i delegowanie każdego z nich do agenta wyspecjalizowanego — ze swoim modelem, system promptem i niezależnym context window. Netflix używa już tego mechanizmu do równoległego przetwarzania logów z setek buildów.

Wzrost i ograniczenia obliczeniowe

Dane podane przez Amodeia podczas konferencji są konkretne: wolumen API na platformie Claude wzrósł prawie 70-krotnie rok do roku. Przeciętny deweloper korzystający z Claude Code spędza 20 godzin tygodniowo z narzędziem. Mercado Libre — największa platforma e-commerce w Ameryce Łacińskiej — ma 23 000 inżynierów uruchomionych na Claude Code i przejrzało ponad 500 000 pull requestów z nadzorem człowieka.

Ten wzrost wymagał pilnych działań po stronie infrastruktury. Anthropic ogłosił partnerstwo z SpaceX, w ramach którego uzyska dostęp do pełnej pojemności centrum obliczeniowego Colossus, by rozszerzyć dostępność compute. Firma jednocześnie podniosła limity API Rate dla wszystkich planów.

Dlaczego to ważne?

Dreaming wyznacza nową kategorię w architekturze agentów AI. Dotychczasowe platformy oferowały pamięć sesji, historię rozmów i tool use — żadna nie wprowadzała mechanizmu systematycznego przeglądu własnej historii operacyjnej w celu wydobycia ponadindywidualnych wzorców. Porównanie z outcomes i multi-agent orchestration pokazuje spójną strategię Anthropic: zamiast ścigać się wyłącznie na surowych możliwościach modelu, firma buduje warstwę niezawodności produkcyjnej — weryfikacja, uczenie i skalowalność bez ingerencji człowieka.

Dla klientów enterprise oznacza to nowy rodzaj argumentu zakupowego: nie "który model jest najinteligentniejszy?", lecz "która platforma automatycznie poprawia się podczas pracy?". Benchmarkowe dane — 6-krotny wzrost ukończenia zadań u Harvey, 50-procentowe przyspieszenie przeglądu dokumentów u Wisedocs — to pierwsze sygnały z realnych wdrożeń, choć obie firmy są klientami Anthropic i nie stanowią niezależnej weryfikacji.

80-krotny wzrost annualizowany przy planie 10-krotnym to jednak sygnał, że firma traci kontrolę nad stroną podażową. Ograniczenia compute, które Amodei opisał wprost, oznaczają, że kolejne miesiące to przede wszystkim wyścig infrastrukturalny, nie tylko algorytmiczny.

Co dalej?

Dreaming pozostaje w research preview i wymaga wniosku o dostęp przez formularz Anthropic — powszechna dostępność nie ma ogłoszonego terminu
Partnerstwo z SpaceX (Colossus) ma rozszerzyć dostępność compute w odpowiedzi na ograniczenia opisane przez Amodeia na konferencji 7 maja 2026
Amodei przewiduje, że 2026 r. przyniesie pierwszą firmę miliardera prowadzoną przez jedną osobę dzięki AI agentom — jako konkretny mierzalny punkt weryfikacji strategii Anthropic