
Agentic AIŚredniozaawansowany
Architektura agentów AI — ReAct, pamięć, planowanie i systemy wieloagentowe
Kurs obejmuje teorię i architekturę agentów AI na poziomie średniozaawansowanym, stanowiąc bezpośredni prerequisite do kursu "Buduj agenty AI z LangChain". Materiał zorganizowany jest rosnąco pod względem trudności: pierwsze rozdziały budują fundamenty konceptualne (czym jest agent, pętla percepcja-działanie, rola LLM jako silnika decyzyjnego), a kolejne przechodzą do konkretnych wzorców architektonicznych. Kurs szczegółowo omawia paradygmat ReAct (Reasoning + Acting) w oparciu o insighty portalu Robocikowo, wzorce pamięci krótkoterminowej i długoterminowej, strategie planowania (CoT, Tree-of-Thought, zadania sekwencyjne vs. równoległe) oraz architekturę systemów wieloagentowych z orkiestratorem. Osobny moduł poświęcony jest Tool-augmented LLM: sposobom wyposażania agentów w narzędzia, function calling i podejmowaniu decyzji o wywołaniu narzędzi. Kurs nie pokrywa implementacji w konkretnych frameworkach (LangChain, AutoGen, CrewAI) — to zakres kursu następnego. Nie jest też kursem promptowania ani fine-tuningu modeli. Prerequisites: podstawowa znajomość LLM i promptowania (poziom użytkownika), umiejętność czytania pseudokodu Python. Absolwent rozumie architekturę agentu od wejścia do wyjścia, potrafi ocenić trade-offy między wzorcami planowania i dobiera odpowiednią architekturę pamięci do wymagań systemu.
Rozdziały
MODUŁ 01Agent AI — architektura, nie chatbot
Rozdział fundamentalny: czym różni się agent AI od chatbota, jakie są filary architektury agentowej (Planning, Memory, Tool Use) i gdzie przebiega granica między prawdziwym agentem a produktem opatrzonym modnym label-em.
Agent AI — architektura, nie chatbot
- 1.1Od chatbota do agenta — różnica architektoniczna
- 1.2Trzy filary agenta: Planning, Memory, Tool Use
- 1.3Pętla agentowa: Observe → Think → Act → Observe
- 1.4Agentyczność jako spektrum — nie binarny przełącznik
- 1.5Ograniczenia natywne LLM: brak pamięci, finite context, brak dostępu do świata
- 1.6"Agent washing" — jak rozpoznać fałszywego agenta
MODUŁ 02Reasoning — jak LLM myśli przed działaniem
Rozdział omawia techniki wzmacniania rozumowania LLM-ów: Chain-of-Thought, zero-shot vs few-shot CoT, Tree of Thoughts oraz strategie przeszukiwania BFS/DFS, a także granice i pułapki samokorekcji.
Reasoning — jak LLM myśli przed działaniem
MODUŁ 03ReAct — pętla rozumowania i działania
Wzorzec ReAct (Reasoning + Acting) — architektura pętli Thought→Action→Observation, benchmarki HotpotQA i FEVER, środowiska decyzyjne ALFWorld i WebShop, mechanizm Reflexion oraz produkcyjna implementacja z bounded loops i error handling.
ReAct — pętla rozumowania i działania
- 3.1Problem: reasoning bez działania vs działanie bez rozumowania
- 3.2Wzorzec Thought → Action → Observation — anatomia jednej iteracji
- 3.3ReAct na zadaniach knowledge-intensive — HotpotQA i FEVER jako case study
- 3.4ReAct na zadaniach decision-making — ALFWorld i WebShop
- 3.5Reflexion — agent uczący się z własnych błędów przez self-reflection
- 3.6Bounded ReAct w produkcji — max_steps, infinite loop detection, error trace jako observation
MODUŁ 04Pamięć agenta — od kontekstu do vector store
Rozdział omawia wszystkie warstwy pamięci agenta AI: od bezstanowości LLM i roli context window, przez cztery typy pamięci, long-term memory z embeddingami i vector store, memory stream z retrieval scoring, aż po reflection jako syntezę wspomnień wyższego rzędu.
Pamięć agenta — od kontekstu do vector store
- 4.1LLM jest bezstanowy — pamięć to architektoniczny trick
- 4.2Cztery typy pamięci agenta: sensory, working, episodic, semantic
- 4.3Short-term memory — context window jako RAM agenta i jego limity
- 4.4Long-term memory — embeddingi, vector store i semantic retrieval
- 4.5Memory stream i retrieval scoring: recency × importance × relevance
- 4.6Reflection — synteza wspomnień wyższego rzędu
MODUŁ 05Tool-Augmented LLM — narzędzia, funkcje i środowisko
Rozdział omawia architekturę LLM rozszerzonych o narzędzia: od podstaw i taksonomii narzędzi, przez kontrakty JSON schema, uczenie wywoływania (Toolformer, MRKL), bezpieczny dispatcher, aż po obsługę błędów i halucynacje nazw funkcji.
Tool-Augmented LLM — narzędzia, funkcje i środowisko
- 5.1Dlaczego LLM potrzebuje narzędzi — luka wiedzy i możliwości
- 5.2Taksonomia narzędzi: read-only vs effectful, deterministic vs stochastic
- 5.3JSON schema narzędzia — kontrakt między LLM a środowiskiem
- 5.4Toolformer i MRKL — jak LLM uczy się kiedy i jak wywoływać narzędzia
- 5.5Dispatcher — parsowanie outputu LLM i bezpieczny rejestr narzędzi
- 5.6Obsługa błędów narzędzi i halucynacje nazw funkcji