Agentic AI
Jak działa
System agentowy otrzymuje cel, a następnie sam planuje kroki, wybiera narzędzia, zbiera dane, wykonuje działania i ocenia wyniki pośrednie. W prostszych wariantach robi to jeden agent korzystający z tool use; w bardziej zaawansowanych – wiele agentów współpracuje nad podzadaniami w ramach jednego workflow.
Rozwiązany problem
Tradycyjny model generatywny dobrze odpowiada na pojedyncze prompty, ale słabiej radzi sobie z długimi zadaniami wymagającymi planu, pamięci roboczej, narzędzi i adaptacji do zmieniającego się kontekstu. Agentic AI adresuje ten problem przez połączenie rozumowania, planowania i działania.
Komponenty
Przyjmuje obserwacje ze środowiska (wiadomości użytkownika, wyniki narzędzi, zawartość plików, odpowiedzi API) i formatuje je jako kontekst dla modelu bazowego. Może obejmować wyszukiwanie RAG w celu pobrania istotnych dokumentów.
Oficjalna
Rozkłada cel wysokopoziomowy na sekwencję podczelów lub działań. Może generować jawny plan lub wnioskować krok po kroku za pomocą łańcucha myśli (chain-of-thought).
Oficjalna
Przechowuje i pobiera informacje między krokami w ramach sesji (pamięć krótkoterminowa) oraz opcjonalnie między sesjami (pamięć długoterminowa).
Oficjalna
Udostępnia agentowi wywoływalne funkcje zewnętrzne: wyszukiwanie w sieci, wykonywanie kodu, zapytania do baz danych, operacje na plikach, wywołania API, sterowanie przeglądarką. Interfejsy narzędzi definiowane są przez schematy (np. JSON Schema, OpenAPI, MCP).
Oficjalna
Ocenia, czy bieżący wynik spełnia kryterium sukcesu. Wyzwala ponowną próbę, przeplanowanie lub zakończenie pętli. Odpowiada wzorcowi ewaluator-optymalizator opisanemu przez Anthropic.
Oficjalna
W systemach wieloagentowych kieruje subagentami, przydziela zadania i agreguje wyniki. Może być modelem LLM lub deterministycznym kontrolerem zakodowanym statycznie.
Oficjalna
Implementacja
Model może wywoływać narzędzia z wymyślonymi parametrami lub twierdzić, że wykonał działania, których faktycznie nie zrealizował — co prowadzi do cichych błędów w wieloetapowych pipeline'ach.
Bez twardego limitu kroków lub skutecznego kryterium zakończenia agent może zapętlać się w nieskończoność, zużywając zasoby obliczeniowe i trafiając na limity szybkości API.
Złośliwe instrukcje osadzone w wynikach narzędzi (strony internetowe, dokumenty, e-maile) mogą przejąć kontrolę nad zachowaniem agenta, podszywając się pod instrukcje systemowe.
Skumulowane wyniki narzędzi i historia konwersacji mogą przekroczyć okno kontekstu modelu, powodując ciche obcinanie wcześniejszych kroków.
Agenci z dostępem do narzędzi z prawem zapisu (usuwanie plików, wysyłanie e-maili, zapis do bazy danych) mogą spowodować rzeczywiste szkody działając na podstawie błędnego rozumowania.
Wprowadzenie agentowej autonomii dla deterministycznych, dobrze zdefiniowanych zadań dodaje opóźnienie, nieprzewidywalność i tryby awarii, których uniknąłby prosty przepływ pracy.
Ewolucja
Russell i Norvig formalizują racjonalnych agentów jako jednostki postrzegające środowisko i podejmujące działania zorientowane na cel. Ustanowione zostają architektury agentów BDI (Belief-Desire-Intention).
Yao i in. (2022) proponują ReAct — przeplatanie śladów rozumowania łańcuchem myśli z wykonywaniem działań w LLM, demonstrując że modele językowe mogą służyć jako silnik rozumowania w pętlach agentowych wzbogaconych o narzędzia.
OpenAI wprowadza function calling w GPT-4 (czerwiec 2023). Upowszechniają się AutoGPT, BabyAGI i abstrakcje agentów LangChain. Termin Agentic AI wchodzi do powszechnego użytku w branży.
Seria wpisów blogowych Andrew Ng identyfikuje cztery fundamentalne wzorce projektowe: Refleksja, Użycie narzędzi, Planowanie i Współpraca wieloagentowa — szeroko cytowana jako praktyczna taksonomia systemów agentowych.
Anthropic publikuje praktyczne wytyczne odróżniające przepływy pracy (predefiniowane ścieżki) od agentów (wykonanie sterowane modelem) i formalizuje pięć wzorców kompozycyjnych: łańcuch promptów, routing, równoległość, orkiestrator-pracownicy, ewaluator-optymalizator.
Anthropic publikuje MCP jako otwarty standard łączenia LLM z zewnętrznymi serwerami narzędzi, umożliwiając interoperacyjne ekosystemy agentowe między dostawcami.
Paradygmaty agentowe rozszerzają się na systemy fizyczne: planiści oparci na LLM sterują działaniami robotów przez pętle percepcja-planowanie-działanie, łącząc Agentic AI z rzeczywistym wykonaniem motorycznym.
Hiperparametry (konfigurowalne osie)
Zbiór zewnętrznych narzędzi dostępnych dla agenta (wyszukiwanie w sieci, wykonywanie kodu, operacje na plikach, API, przeglądarka). Określa przestrzeń możliwych działań.
Twardy limit liczby iteracji rozumowanie-działanie przed wymuszonym zakończeniem. Zabezpieczenie przed nieskończonymi pętlami.
Czy agent używa wyłącznie pamięci w kontekście, czy również zewnętrznego trwałego magazynu (baza wektorowa, klucz-wartość).
Czy system używa jednego agenta, czy sieci wyspecjalizowanych agentów koordynowanych przez orkiestratora.
Czy i w których krokach agent zatrzymuje się oczekując potwierdzenia człowieka przed podjęciem nieodwracalnych działań.
Maksymalna liczba tokenów przetwarzana przez bazowy LLM w jednym wywołaniu. Ogranicza ilość skumulowanej historii, wyników narzędzi i instrukcji mieszczących się w jednym kroku inferencji.
Złożoność obliczeniowa
Złożoność czasowa: O(N · C_step). Złożoność przestrzenna: O(L_ctx + S_mem).
Wąskie gardło obliczeniowe
Każdy krok pętli agentowej wymaga co najmniej jednego wywołania inferencji LLM. Wieloetapowe zadania z długimi oknami kontekstu i wieloma wywołaniami narzędzi zwielokrotniają liniowo opóźnienie i koszt obliczeniowy.
Paradygmat wykonania
Ścieżka wykonania nie jest z góry określona — jest ustalana w trakcie działania przez wnioskowanie modelu nad zgromadzonym kontekstem. Przepływy pracy z predefiniowanymi ścieżkami stanowią przypadek zdegenerowany.
Bazowy LLM decyduje w każdym kroku, które narzędzie wywołać, czy kontynuować pętlę, delegować zadanie do subagenta, czy zakończyć — na podstawie bieżącego kontekstu i zaobserwowanych wyników.
Równoległość
Równoległość jest osiągalna gdy podzadania są niezależne (np. równoległe wyszukiwania w sieci, jednoczesne wykonywanie subagentów). Sekwencyjne pętle są wymagane gdy każdy krok zależy od wyników poprzednich wywołań narzędzi.
Wymagania sprzętowe
Agentic AI jest paradygmatem architektonicznym, nie konkretnym jądrem obliczeniowym. Wymagania sprzętowe są całkowicie determinowane przez bazowy LLM i narzędzia, a nie przez samą pętlę agentową.