Robocikowo>ROBOCIKOWO
Agenci

Agentic AI

2024AktywnyOpublikowano: 20 marca 2026Aktualizacja: 5 maja 2026Opublikowany
Paradygmat AI oparty na systemach, które potrafią planować, podejmować działania i realizować cele przy ograniczonym nadzorze człowieka.
Kluczowa innowacja
Przesuwa systemy AI od bezstanowego generowania odpowiedzi na prompt do sterowanych celem pętli autonomicznych, w których agent postrzega środowisko, planuje wieloetapowe działania, wywołuje zewnętrzne narzędzia, reflektuje nad wynikami i iteruje aż do osiągnięcia celu.
Kategoria
Agenci
Poziom abstrakcji
Pattern
Poziom operacji
SystemŚrodowisko agentoweOrkiestracjaToolingModelInferencja
Zastosowania
Agenci researchowiAutomatyzacja pracy biurowej i knowledge workAsystenci wykonujący zadania end-to-endAgent workflows i orchestracja zadańObsługa procesów wymagających planu i działania

Jak działa

System agentowy otrzymuje cel, a następnie sam planuje kroki, wybiera narzędzia, zbiera dane, wykonuje działania i ocenia wyniki pośrednie. W prostszych wariantach robi to jeden agent korzystający z tool use; w bardziej zaawansowanych – wiele agentów współpracuje nad podzadaniami w ramach jednego workflow.

Rozwiązany problem

Tradycyjny model generatywny dobrze odpowiada na pojedyncze prompty, ale słabiej radzi sobie z długimi zadaniami wymagającymi planu, pamięci roboczej, narzędzi i adaptacji do zmieniającego się kontekstu. Agentic AI adresuje ten problem przez połączenie rozumowania, planowania i działania.

Komponenty

Warstwa percepcji / wejściaOdbiór i kodowanie wejść środowiskowych do okna kontekstu modelu

Przyjmuje obserwacje ze środowiska (wiadomości użytkownika, wyniki narzędzi, zawartość plików, odpowiedzi API) i formatuje je jako kontekst dla modelu bazowego. Może obejmować wyszukiwanie RAG w celu pobrania istotnych dokumentów.

Wejście wzbogacone RAGPobiera odpowiednie dokumenty przed przekazaniem kontekstu do modelu.
Surowe wejście z wiadomościPrzekazuje wyniki narzędzi i wiadomości użytkownika bezpośrednio do modelu bez dodatkowego wyszukiwania.

Oficjalna

Moduł planowaniaDekompozycja celu na działania i generowanie planu wykonania

Rozkłada cel wysokopoziomowy na sekwencję podczelów lub działań. Może generować jawny plan lub wnioskować krok po kroku za pomocą łańcucha myśli (chain-of-thought).

Planowanie inline (łańcuch myśli)Planowanie osadzone w wyjściu modelu przed wyborem działania.
Oddzielny model planującyDedykowane wywołanie LLM do planowania przed fazą wykonania.

Oficjalna

PamięćZarządzanie stanem i historią między krokami pętli agentowej

Przechowuje i pobiera informacje między krokami w ramach sesji (pamięć krótkoterminowa) oraz opcjonalnie między sesjami (pamięć długoterminowa).

W kontekście (krótkoterminowa)Historia konwersacji i wyniki narzędzi akumulowane w oknie kontekstu.
Zewnętrzny magazyn (długoterminowa)Baza wektorowa lub magazyn klucz-wartość umożliwiający pobieranie danych między sesjami.

Oficjalna

Warstwa narzędzi / działańRozszerzenie przestrzeni działań modelu o wywołania zewnętrznych systemów

Udostępnia agentowi wywoływalne funkcje zewnętrzne: wyszukiwanie w sieci, wykonywanie kodu, zapytania do baz danych, operacje na plikach, wywołania API, sterowanie przeglądarką. Interfejsy narzędzi definiowane są przez schematy (np. JSON Schema, OpenAPI, MCP).

Function calling / Tool use APIModel generuje ustrukturyzowane wywołanie narzędzia w formacie JSON; host wykonuje je i zwraca wynik.
Model Context Protocol (MCP)Ustandaryzowany protokół łączenia modelu z zewnętrznymi serwerami narzędzi.

Oficjalna

Refleksja / EwaluacjaKontrola jakości wyniku i decyzja o kontynuacji lub zakończeniu pętli

Ocenia, czy bieżący wynik spełnia kryterium sukcesu. Wyzwala ponowną próbę, przeplanowanie lub zakończenie pętli. Odpowiada wzorcowi ewaluator-optymalizator opisanemu przez Anthropic.

Oficjalna

OrkiestratorKoordynacja pracy wielu agentów i zarządzanie przepływem zadań

W systemach wieloagentowych kieruje subagentami, przydziela zadania i agreguje wyniki. Może być modelem LLM lub deterministycznym kontrolerem zakodowanym statycznie.

LLM jako orkiestratorOrkiestrator sam jest modelem LLM dynamicznie decydującym o przydziale zadań.
Zakodowany orkiestratorDeterministyczny program kierujący zadaniami do subagentów według stałej logiki.

Oficjalna

Implementacja

Pułapki implementacyjne
Halucynacje w działaniuKrytyczna

Model może wywoływać narzędzia z wymyślonymi parametrami lub twierdzić, że wykonał działania, których faktycznie nie zrealizował — co prowadzi do cichych błędów w wieloetapowych pipeline'ach.

Rozwiązanie:Waliduj wszystkie wywołania narzędzi względem schematów przed wykonaniem; używaj deterministycznych parserów; wprowadź jawne kroki potwierdzenia dla działań nieodwracalnych.
Nieskończone pętleWysoka

Bez twardego limitu kroków lub skutecznego kryterium zakończenia agent może zapętlać się w nieskończoność, zużywając zasoby obliczeniowe i trafiając na limity szybkości API.

Rozwiązanie:Ustaw jawne limity max_steps; zaimplementuj wykrywanie pętli na podstawie powtarzających się sygnatur działań; użyj ewaluatora do egzekwowania warunków zatrzymania.
Wstrzykiwanie promptów przez obserwowaną treśćKrytyczna

Złośliwe instrukcje osadzone w wynikach narzędzi (strony internetowe, dokumenty, e-maile) mogą przejąć kontrolę nad zachowaniem agenta, podszywając się pod instrukcje systemowe.

Rozwiązanie:Izoluj niezaufaną treść od instrukcji systemowych; wymagaj jawnego potwierdzenia użytkownika przed działaniem na podstawie instrukcji znalezionych w obserwowanej treści; stosuj filtrowanie treści.
Przepełnienie okna kontekstuWysoka

Skumulowane wyniki narzędzi i historia konwersacji mogą przekroczyć okno kontekstu modelu, powodując ciche obcinanie wcześniejszych kroków.

Rozwiązanie:Zaimplementuj kompaktowanie/podsumowywanie kontekstu; używaj zewnętrznych magazynów pamięci; monitoruj budżet tokenów na każdy krok.
Nadużycie narzędzi i nieodwracalne skutki uboczneKrytyczna

Agenci z dostępem do narzędzi z prawem zapisu (usuwanie plików, wysyłanie e-maili, zapis do bazy danych) mogą spowodować rzeczywiste szkody działając na podstawie błędnego rozumowania.

Rozwiązanie:Stosuj zestawy narzędzi z minimalnym zakresem uprawnień; wymagaj potwierdzenia człowieka dla działań nieodwracalnych; preferuj operacje odwracalne tam gdzie to możliwe.
Narastająca złożoność — budowanie agentów tam gdzie wystarczy przepływ pracyŚrednia

Wprowadzenie agentowej autonomii dla deterministycznych, dobrze zdefiniowanych zadań dodaje opóźnienie, nieprzewidywalność i tryby awarii, których uniknąłby prosty przepływ pracy.

Rozwiązanie:Domyślnie stosuj predefiniowane przepływy pracy; wprowadzaj agentową autonomię tylko gdy zadanie rzeczywiście wymaga dynamicznego podejmowania decyzji w wielu nieprzewidywalnych krokach.

Ewolucja

1995
Fundamentalna teoria inteligentnych agentów

Russell i Norvig formalizują racjonalnych agentów jako jednostki postrzegające środowisko i podejmujące działania zorientowane na cel. Ustanowione zostają architektury agentów BDI (Belief-Desire-Intention).

2022
ReAct: Rozumowanie + Działanie z LLM
Punkt przełomowy

Yao i in. (2022) proponują ReAct — przeplatanie śladów rozumowania łańcuchem myśli z wykonywaniem działań w LLM, demonstrując że modele językowe mogą służyć jako silnik rozumowania w pętlach agentowych wzbogaconych o narzędzia.

2023
API do wywoływania narzędzi i pierwsze komercyjne systemy agentowe
Punkt przełomowy

OpenAI wprowadza function calling w GPT-4 (czerwiec 2023). Upowszechniają się AutoGPT, BabyAGI i abstrakcje agentów LangChain. Termin Agentic AI wchodzi do powszechnego użytku w branży.

2024
Cztery wzorce projektowe agentów według Andrew Ng

Seria wpisów blogowych Andrew Ng identyfikuje cztery fundamentalne wzorce projektowe: Refleksja, Użycie narzędzi, Planowanie i Współpraca wieloagentowa — szeroko cytowana jako praktyczna taksonomia systemów agentowych.

2024
Anthropic 'Building effective agents' — wzorce kompozycyjne dla produkcji
Punkt przełomowy

Anthropic publikuje praktyczne wytyczne odróżniające przepływy pracy (predefiniowane ścieżki) od agentów (wykonanie sterowane modelem) i formalizuje pięć wzorców kompozycyjnych: łańcuch promptów, routing, równoległość, orkiestrator-pracownicy, ewaluator-optymalizator.

2025
Model Context Protocol (MCP) standaryzuje łączność narzędzi

Anthropic publikuje MCP jako otwarty standard łączenia LLM z zewnętrznymi serwerami narzędzi, umożliwiając interoperacyjne ekosystemy agentowe między dostawcami.

2025
Agentic AI w robotyce — ucieleśnione pętle agentowe

Paradygmaty agentowe rozszerzają się na systemy fizyczne: planiści oparci na LLM sterują działaniami robotów przez pętle percepcja-planowanie-działanie, łącząc Agentic AI z rzeczywistym wykonaniem motorycznym.

Hiperparametry (konfigurowalne osie)

Zestaw narzędziKrytyczna

Zbiór zewnętrznych narzędzi dostępnych dla agenta (wyszukiwanie w sieci, wykonywanie kodu, operacje na plikach, API, przeglądarka). Określa przestrzeń możliwych działań.

web_search + code_executionTypowe dla agentów badawczych.
file_read + file_write + bashTypowe dla agentów kodujących.
Maksymalna liczba krokówWysoka

Twardy limit liczby iteracji rozumowanie-działanie przed wymuszonym zakończeniem. Zabezpieczenie przed nieskończonymi pętlami.

10Konserwatywny limit dla krótkich zadań.
50–200Stosowane w agentach kodowania i badań długoterminowych.
Typ pamięciWysoka

Czy agent używa wyłącznie pamięci w kontekście, czy również zewnętrznego trwałego magazynu (baza wektorowa, klucz-wartość).

in_context_only
in_context + vector_store
Liczba agentów (jeden vs. wieloagentowy)Wysoka

Czy system używa jednego agenta, czy sieci wyspecjalizowanych agentów koordynowanych przez orkiestratora.

1Pętla jednoagentowa.
2–10+System wieloagentowy orkiestrator-pracownicy.
Punkty kontrolne z udziałem człowiekaWysoka

Czy i w których krokach agent zatrzymuje się oczekując potwierdzenia człowieka przed podjęciem nieodwracalnych działań.

noneW pełni autonomiczny.
before_irreversible_actionsZalecane dla wdrożeń krytycznych bezpieczeństwa.
Rozmiar okna kontekstuWysoka

Maksymalna liczba tokenów przetwarzana przez bazowy LLM w jednym wywołaniu. Ogranicza ilość skumulowanej historii, wyników narzędzi i instrukcji mieszczących się w jednym kroku inferencji.

128k tokenów
1M tokenówWymagane dla zadań bardzo długoterminowych.

Złożoność obliczeniowa

Złożoność czasowa: O(N · C_step). Złożoność przestrzenna: O(L_ctx + S_mem).

Wąskie gardło obliczeniowe

Inferencja LLM na każdy krok działania

Każdy krok pętli agentowej wymaga co najmniej jednego wywołania inferencji LLM. Wieloetapowe zadania z długimi oknami kontekstu i wieloma wywołaniami narzędzi zwielokrotniają liniowo opóźnienie i koszt obliczeniowy.

Zależy od
Rozmiar okna kontekstuLiczba kroków agentowychOpóźnienie wykonania narzędzi

Paradygmat wykonania

Tryb główny
conditional

Ścieżka wykonania nie jest z góry określona — jest ustalana w trakcie działania przez wnioskowanie modelu nad zgromadzonym kontekstem. Przepływy pracy z predefiniowanymi ścieżkami stanowią przypadek zdegenerowany.

Wzorzec aktywacji
input_dependent
Mechanizm routingu

Bazowy LLM decyduje w każdym kroku, które narzędzie wywołać, czy kontynuować pętlę, delegować zadanie do subagenta, czy zakończyć — na podstawie bieżącego kontekstu i zaobserwowanych wyników.

Równoległość

Poziom równoległości
conditionally_parallel

Równoległość jest osiągalna gdy podzadania są niezależne (np. równoległe wyszukiwania w sieci, jednoczesne wykonywanie subagentów). Sekwencyjne pętle są wymagane gdy każdy krok zależy od wyników poprzednich wywołań narzędzi.

Zakres
inferenceacross_devices
Ograniczenia
!Pętla sterowania jednego agenta jest z natury sekwencyjna: każde działanie zależy od wyniku poprzedniego.
!Wzorce orkiestrator-pracownicy i równoległość umożliwiają jednoczesne wykonywanie niezależnych podzadań przez wiele agentów lub wątków.

Wymagania sprzętowe

Podstawowe

Agentic AI jest paradygmatem architektonicznym, nie konkretnym jądrem obliczeniowym. Wymagania sprzętowe są całkowicie determinowane przez bazowy LLM i narzędzia, a nie przez samą pętlę agentową.