Robocikowo>ROBOCIKOWO

Kursy

architektura-agentow-ai-react-pamiec-planowanie-systemy-cover

Agentic AIŚredniozaawansowany

Architektura agentów AI — ReAct, pamięć, planowanie i systemy wieloagentowe

5 Rozdziałów29 Lekcji

Kurs obejmuje teorię i architekturę agentów AI na poziomie średniozaawansowanym, stanowiąc bezpośredni prerequisite do kursu "Buduj agenty AI z LangChain". Materiał zorganizowany jest rosnąco pod względem trudności: pierwsze rozdziały budują fundamenty konceptualne (czym jest agent, pętla percepcja-działanie, rola LLM jako silnika decyzyjnego), a kolejne przechodzą do konkretnych wzorców architektonicznych. Kurs szczegółowo omawia paradygmat ReAct (Reasoning + Acting) w oparciu o insighty portalu Robocikowo, wzorce pamięci krótkoterminowej i długoterminowej, strategie planowania (CoT, Tree-of-Thought, zadania sekwencyjne vs. równoległe) oraz architekturę systemów wieloagentowych z orkiestratorem. Osobny moduł poświęcony jest Tool-augmented LLM: sposobom wyposażania agentów w narzędzia, function calling i podejmowaniu decyzji o wywołaniu narzędzi. Kurs nie pokrywa implementacji w konkretnych frameworkach (LangChain, AutoGen, CrewAI) — to zakres kursu następnego. Nie jest też kursem promptowania ani fine-tuningu modeli. Prerequisites: podstawowa znajomość LLM i promptowania (poziom użytkownika), umiejętność czytania pseudokodu Python. Absolwent rozumie architekturę agentu od wejścia do wyjścia, potrafi ocenić trade-offy między wzorcami planowania i dobiera odpowiednią architekturę pamięci do wymagań systemu.

Rozdziały

MODUŁ 01

Agent AI — architektura, nie chatbot

0 / 6 · 0%

Rozdział fundamentalny: czym różni się agent AI od chatbota, jakie są filary architektury agentowej (Planning, Memory, Tool Use) i gdzie przebiega granica między prawdziwym agentem a produktem opatrzonym modnym label-em.

  1. 1.1Od chatbota do agenta — różnica architektoniczna
  2. 1.2Trzy filary agenta: Planning, Memory, Tool Use
  3. 1.3Pętla agentowa: Observe → Think → Act → Observe
  4. 1.4Agentyczność jako spektrum — nie binarny przełącznik
  5. 1.5Ograniczenia natywne LLM: brak pamięci, finite context, brak dostępu do świata
  6. 1.6"Agent washing" — jak rozpoznać fałszywego agenta
MODUŁ 02

Reasoning — jak LLM myśli przed działaniem

0 / 5 · 0%

Rozdział omawia techniki wzmacniania rozumowania LLM-ów: Chain-of-Thought, zero-shot vs few-shot CoT, Tree of Thoughts oraz strategie przeszukiwania BFS/DFS, a także granice i pułapki samokorekcji.

  1. 2.1Chain-of-Thought — po co pisać myśli przed odpowiedzią
  2. 2.2Zero-shot CoT vs few-shot CoT — kiedy które działa
  3. 2.3Tree of Thoughts — eksploracja wielu ścieżek myślenia
  4. 2.4BFS vs DFS w ToT — strategie przeszukiwania przestrzeni myśli
  5. 2.5Kiedy reasoning zawodzi — pułapki CoT i granice self-correction
MODUŁ 03

ReAct — pętla rozumowania i działania

0 / 6 · 0%

Wzorzec ReAct (Reasoning + Acting) — architektura pętli Thought→Action→Observation, benchmarki HotpotQA i FEVER, środowiska decyzyjne ALFWorld i WebShop, mechanizm Reflexion oraz produkcyjna implementacja z bounded loops i error handling.

  1. 3.1Problem: reasoning bez działania vs działanie bez rozumowania
  2. 3.2Wzorzec Thought → Action → Observation — anatomia jednej iteracji
  3. 3.3ReAct na zadaniach knowledge-intensive — HotpotQA i FEVER jako case study
  4. 3.4ReAct na zadaniach decision-making — ALFWorld i WebShop
  5. 3.5Reflexion — agent uczący się z własnych błędów przez self-reflection
  6. 3.6Bounded ReAct w produkcji — max_steps, infinite loop detection, error trace jako observation
MODUŁ 04

Pamięć agenta — od kontekstu do vector store

0 / 6 · 0%

Rozdział omawia wszystkie warstwy pamięci agenta AI: od bezstanowości LLM i roli context window, przez cztery typy pamięci, long-term memory z embeddingami i vector store, memory stream z retrieval scoring, aż po reflection jako syntezę wspomnień wyższego rzędu.

  1. 4.1LLM jest bezstanowy — pamięć to architektoniczny trick
  2. 4.2Cztery typy pamięci agenta: sensory, working, episodic, semantic
  3. 4.3Short-term memory — context window jako RAM agenta i jego limity
  4. 4.4Long-term memory — embeddingi, vector store i semantic retrieval
  5. 4.5Memory stream i retrieval scoring: recency × importance × relevance
  6. 4.6Reflection — synteza wspomnień wyższego rzędu
MODUŁ 05

Tool-Augmented LLM — narzędzia, funkcje i środowisko

0 / 6 · 0%

Rozdział omawia architekturę LLM rozszerzonych o narzędzia: od podstaw i taksonomii narzędzi, przez kontrakty JSON schema, uczenie wywoływania (Toolformer, MRKL), bezpieczny dispatcher, aż po obsługę błędów i halucynacje nazw funkcji.

  1. 5.1Dlaczego LLM potrzebuje narzędzi — luka wiedzy i możliwości
  2. 5.2Taksonomia narzędzi: read-only vs effectful, deterministic vs stochastic
  3. 5.3JSON schema narzędzia — kontrakt między LLM a środowiskiem
  4. 5.4Toolformer i MRKL — jak LLM uczy się kiedy i jak wywoływać narzędzia
  5. 5.5Dispatcher — parsowanie outputu LLM i bezpieczny rejestr narzędzi
  6. 5.6Obsługa błędów narzędzi i halucynacje nazw funkcji