Robocikowo>ROBOCIKOWO
Architektura

MAS

1995productionpeer_reviewed
Systemy AI składające się z wielu współpracujących agentów.
Kluczowa innowacja
Dekompozycja złożonych zadań na zestaw autonomicznych agentów o wyspecjalizowanych rolach, komunikujących się i koordynujących działania, co pozwala przekraczać ograniczenia jednotorowego wnioskowania modeli i realizować zadania długiego horyzontu, których nie da się wykonać w jednym wywołaniu LLM.
Kategoria
Architektura
Poziom abstrakcji
Paradigm
Poziom operacji
SystemŚrodowisko agentowe
Zastosowania
Software engineering autonomiczne — wieloagentowe zespoły programistyczne (architekt, programista, tester, code reviewer) realizujące pełne projekty na podstawie specyfikacji (MetaGPT, ChatDev)Deep research i synteza wiedzy — agenci specjalizujący się w wyszukiwaniu, weryfikacji źródeł, ekstrakcji faktów i pisaniu raportów (OpenAI Deep Research, GPT Researcher)Symulacje społeczne i ekonomiczne — agenty z osobowościami symulujące zachowania w wirtualnych społecznościach (Generative Agents, Smallville, AI Town)Negocjacje i debata wieloagentowa — konkurujące agenty osiągające konsensus lub dochodzące do prawdy przez argumentację (Society of Mind, Multi-Agent Debate)Robotyka multi-robot — koordynacja wielu fizycznych robotów w zadaniach magazynowych, logistycznych i eksploracji (swarm robotics, fleet management)Customer support i workflow biznesowe — orkiestracja agentów-specjalistów (billing, tech support, sales) z dynamicznym routingiem zapytańSymulacje gier i AI dla NPC — wieloagentowe systemy w grach strategicznych i symulacjach taktycznychNaukowe odkrycia i eksperymenty wspomagane AI — agenty-eksperymentatorzy generujący hipotezy, planujący eksperymenty in silico i interpretujący wyniki

Jak działa

System MAS definiuje zbiór agentów, środowisko komunikacji i protokół koordynacji. Każdy agent to jednostka autonomiczna z: (1) rdzeniem kognitywnym (zwykle LLM z system promptem definiującym rolę), (2) pamięcią krótkoterminową (kontekst) i opcjonalnie długoterminową (vector store), (3) interfejsem narzędzi (API, code execution, web search, retrieval), (4) celem lub instrukcją zadaniową. Wykonanie zadania składa się z etapów: (a) dekompozycja — orkiestrator lub agent-planista rozkłada zapytanie na podzadania, (b) routing — przypisanie podzadań do agentów na podstawie ról i zdolności, (c) komunikacja — agenci wymieniają wiadomości (naturalny język, structured function calls, shared memory), (d) iteracja — agenci wykonują akcje, obserwują wyniki, korygują plan (często z wbudowanym agentem-krytykiem), (e) agregacja — synteza wyników w finalną odpowiedź. Topologie koordynacji: sequential pipeline (łańcuch), hierarchical (orchestrator-worker), parallel fan-out/fan-in, blackboard (wspólna tablica), debate (agenci konkurują/dyskutują), publish-subscribe i decentralized peer-to-peer.

Rozwiązany problem

Pojedynczy model LLM napotyka twarde ograniczenia przy zadaniach długiego horyzontu, wymagających różnorodnej wiedzy domenowej, wieloetapowego planowania lub równoległej obsługi wielu źródeł informacji. Monolityczny prompt szybko traci spójność, kontekst ulega degradacji (context rot), a brak wyspecjalizowanych ról uniemożliwia separację odpowiedzialności (np. planista vs wykonawca vs krytyk). MAS rozwiązuje to przez dekompozycję problemu na podzadania przypisane do autonomicznych agentów z dedykowanymi rolami, narzędziami i pamięcią, koordynowanych przez topologię komunikacyjną. Pozwala to skalować złożoność systemu bez powiększania pojedynczego modelu, równolegle eksplorować rozwiązania i wprowadzać mechanizmy peer-review / krytyki między agentami.

Kluczowe mechanizmy

Dekompozycja zadania — orkiestrator lub agent-planista rozkłada zapytanie na zestaw podzadań możliwych do delegowania
Wyspecjalizowane role — każdy agent otrzymuje system prompt definiujący tożsamość, zakres odpowiedzialności i dostępne narzędzia
Komunikacja między agentami — wymiana wiadomości w języku naturalnym, structured function calls lub przez wspólną pamięć (blackboard)
Topologia koordynacji — wybór wzorca: sequential, hierarchical (orchestrator-worker), parallel fan-out/fan-in, debate, publish-subscribe, peer-to-peer
Tool use — agenci wywołują zewnętrzne API, wykonują kod, przeszukują web, korzystają z retrieval i baz wektorowych
Pamięć agenta — short-term context window + long-term memory (vector store) z możliwością współdzielenia między agentami
Mechanizm krytyki / peer-review — wbudowany agent-krytyk weryfikuje wyniki innych agentów (reflexion, self-critique, multi-agent debate)
Routing dynamiczny — orkiestrator wybiera kolejnego agenta na podstawie aktualnego stanu, typu zadania lub wyników wcześniejszych kroków
Iteracja i korekta planu — agenci mogą obserwować wyniki działań i modyfikować plan w locie (closed-loop control)

Mocne strony i ograniczenia

Mocne strony
Skalowanie złożoności bez powiększania modelu — wzrost capability przez dodanie agentów zamiast trenowania większego LLM
Separacja odpowiedzialności — wyspecjalizowane role (planista, wykonawca, krytyk) lepiej radzą sobie niż jeden monolityczny prompt
Równoległość — niezależne podzadania mogą być wykonywane jednocześnie, redukując latencję
Modularność i wymienność — agentów można aktualizować, zastępować lub dodawać bez przeprojektowania całego systemu
Peer-review i samokorekta — wiele agentów wykrywa błędy, które pojedynczy model przeoczyłby (multi-agent debate, reflexion)
Wydłużenie efektywnego horyzontu — zadania długiego horyzontu (godziny pracy) wykonalne dzięki rozłożeniu na sub-tasks
Naturalna ekspresja problemów wieloaktorowych — symulacje społeczne, negocjacje, multi-robot fleet są bezpośrednio modelowalne
Bogaty ekosystem frameworków — AutoGen, CAMEL, MetaGPT, CrewAI, LangGraph dostarczają production-ready abstrakcje
Ograniczenia
Wysoki koszt tokenów — komunikacja między agentami multiplikuje liczbę wywołań LLM (często 5–50× pojedynczego zapytania)
Latencja sekwencyjna — łańcuchy agentów wprowadzają cumulative delay, nawet 10× większy niż pojedyncze zapytanie
Propagacja błędów — błąd jednego agenta przekazany kolejnym może snowball, prowadząc do całkowicie błędnej finalnej odpowiedzi
Brak globalnej spójności — agenci mogą lokalnie optymalizować w sposób sprzeczny z celem systemu (misalignment między agentami)
Trudność debugowania — non-deterministyczne trajektorie i wielowątkowa komunikacja czynią diagnozę błędów bardzo kosztowną
Koordynacja overhead — w prostych zadaniach pojedynczy LLM call jest tańszy i szybszy; MAS opłaca się dopiero przy złożoności
Halucynacje wzmocnione — agenci mogą wzajemnie utwierdzać się w błędnych przekonaniach (echo chamber effect)
Brak standardów protokołów — różne frameworki używają niekompatybilnych formatów wiadomości i schematów ról
Rate limits API — równoległe wywołania LLM z jednego konta mogą napotykać throttling i kolejkowanie

Komponenty

AgentPodstawowa jednostka obliczeniowa i decyzyjna systemu.

Autonomiczna jednostka obliczeniowa z własnym stanem wewnętrznym, zdolnościami percepcji środowiska, wnioskowania i podejmowania działań. W kontekście LLM-MAS: model językowy z systemowym promptem definiującym rolę, cel i ograniczenia agenta.

Agent orkiestratora (Orchestrator Agent)Agent odpowiedzialny za dekompozycję zadań, przydzielanie podzadań innym agentom i agregację wyników.
Agent wyspecjalizowany (Worker Agent)Agent z wąską specjalizacją (np. wyszukiwanie, kodowanie, analiza), wykonujący konkretne podzadania przydzielone przez orkiestratora.
Agent ludzki (Human-in-the-Loop)Człowiek uczestniczący jako agent w systemie, weryfikujący lub korygujący działania agentów AI w kluczowych punktach decyzyjnych.

Oficjalna

Kanał komunikacyjnyUmożliwia koordynację i transfer stanu między agentami.

Mechanizm wymiany informacji między agentami. Może przyjmować formę bezpośredniego przekazywania wiadomości (direct message passing), wspólnej pamięci (shared memory), systemu publikuj-subskrybuj (publish-subscribe) lub kolejki zdarzeń (event queue).

Przekazywanie wiadomości (Message Passing)Agenty wymieniają ustrukturyzowane wiadomości bezpośrednio lub przez brokera.
Wspólna pamięć (Shared Memory / Blackboard)Agenty czytają i zapisują do wspólnej bazy wiedzy lub stanu (np. bazy wektorowej, obiektu stanu grafowego).

Oficjalna

Orkiestrator / KoordynatorZarządzanie globalnym postępem w realizacji zadania i koordynacja między agentami.

Komponent odpowiedzialny za zarządzanie przepływem pracy: dekompozycję zadania, routing do agentów, zarządzanie zależnościami, obsługę błędów i agregację wyników końcowych. Może być agentem LLM lub programowalnym kontrolerem.

Oficjalna

Podsystem pamięciPersistencja stanu między wywołaniami agentów i sesjami systemu.

Mechanizmy przechowywania stanu: pamięć krótkoterminowa (kontekst konwersacji / okno kontekstowe LLM), pamięć długoterminowa (baza wektorowa, zewnętrzna baza danych), pamięć epizodyczna (historia interakcji) i pamięć proceduralną (nauczone procedury).

Oficjalna

Interfejs narzędziowy (Tool Interface)Rozszerzenie możliwości agentów poza przetwarzanie językowe o działania na świecie zewnętrznym.

Warstwa integrująca agenty z zewnętrznymi systemami: API, silniki wyszukiwania, interpretery kodu, bazy danych, usługi plików. Umożliwia agentom działanie poza ich kontekstem tekstowym.

Oficjalna

Implementacja

Pułapki implementacyjne
Propagacja błędów między agentami (Error Cascading)Wysoka

Błędne wyjście jednego agenta jest przekazywane jako wejście do kolejnego, co prowadzi do kumulacji błędów w całym pipeline. W systemach bez weryfikatora może skutkować kompletnie błędnymi wynikami końcowymi.

Rozwiązanie:Wdrożyć agentów weryfikujących (critic/validator agents) po kluczowych krokach; stosować wiele niezależnych ścieżek wykonania z głosowaniem lub agregacją wyników.
Nadmiarowe koszty tokenów (Token Cost Explosion)Wysoka

Każda komunikacja między agentami zużywa tokeny (przesyłanie historii konwersacji, kontekstu, narzędzi). Przy dużej liczbie agentów i długich łańcuchach komunikacji koszty mogą rosnąć nieproporcjonalnie szybko.

Rozwiązanie:Stosować kompresję kontekstu; ograniczać historię przekazywaną między agentami do niezbędnego minimum; używać lżejszych modeli dla prostszych podzadań.
Zapętlenia i zbieżność (Infinite Loops / Non-Convergence)Krytyczna

Agenty mogą wpadać w pętle — np. jeden agent prosi drugi o rewizję, który prosi z powrotem o wyjaśnienie — bez mechanizmu terminacji. Brak kryterium stopu powoduje nieskończone pętle.

Rozwiązanie:Definiować wyraźne kryteria terminacji (maksymalna liczba iteracji, warunek 'TERMINATE', timeout); stosować nadzorującego agenta-monitora.
Niespójność stanu między agentami (State Inconsistency)Wysoka

Przy równoległym wykonaniu agenty mogą operować na niespójnych wersjach współdzielonego stanu, prowadząc do konfliktów i race conditions, szczególnie gdy wspólna pamięć nie jest transakcyjna.

Rozwiązanie:Stosować transakcyjne aktualizacje współdzielonego stanu; projektować agenty tak, by były idempotentne; minimalizować zapis-zapis konkurencji przez przypisywanie odrębnych partycji stanu do różnych agentów.
Rozmycie odpowiedzialności między agentami (Role Confusion / Overlapping Responsibilities)Średnia

Agenty z niejasno zdefiniowanymi rolami mogą duplikować pracę, wchodzić w konflikt w podejmowaniu decyzji lub pomijać zadania, bo każdy zakłada, że zajmie się tym inny agent.

Rozwiązanie:Precyzyjnie definiować zakres odpowiedzialności każdego agenta w systemowym prompcie; stosować formalne protokoły handoff i potwierdzenia odbioru zadania.

Ewolucja

Oryginalny paper · 1995 · The Knowledge Engineering Review, vol. 10, no. 2
Intelligent Agents: Theory and Practice
,
1995
Wooldridge i Jennings formalizują pojęcie inteligentnych agentów i MAS
Punkt przełomowy

Wooldridge i Jennings publikują 'Intelligent Agents: Theory and Practice' (Knowledge Engineering Review), definiując właściwości agentów (autonomia, reaktywność, proaktywność, zdolności społeczne) i podstawy teorii MAS.

1999
Gerhard Weiss redaguje 'Multiagent Systems: A Modern Approach to Distributed Artificial Intelligence' (MIT Press)

Podręcznik standaryzujący terminologię i architekturę MAS, stając się podstawową referencją akademicką dla kolejnej dekady.

2023
Eksplozja frameworków LLM-MAS: CAMEL, AutoGen, MetaGPT
Punkt przełomowy

Rok 2023 przynosi pierwszą falę frameworków opartych na LLM do budowy systemów wieloagentowych: CAMEL (Li et al., marzec 2023), AutoGen (Wu et al., Microsoft, sierpień 2023), MetaGPT (Hong et al., sierpień 2023). Stanowią one przełom, przekształcając MAS z systemu bazującego na regułach w systemy oparte na modeli językowych.

2024
Standaryzacja protokołów komunikacji (MCP, A2A) i frameworków orkiestracji (LangGraph, CrewAI)

Anthropic ogłasza Model Context Protocol (MCP), Google — Agent-to-Agent Protocol (A2A). Pojawiają się bardziej dojrzałe frameworki: LangGraph (LangChain), CrewAI, wspierające złożone topologie agentowe z persistencją stanu i kontrolowanym przepływem.

Hiperparametry (konfigurowalne osie)

Liczba agentówWysoka

Liczba agentów w systemie. Wyższa liczba agentów może zwiększyć równoległość i specjalizację, ale też komplikuje koordynację i zwiększa koszt.

2Minimalny system: jeden orkiestrator + jeden pracownik.
5–10Typowy zakres dla złożonych zadań z kilkoma specjalizacjami.
> 20Duże systemy; wymaga zaawansowanej orchestracji i kontroli przepływu.
Topologia koordynacjiKrytyczna

Wzorzec komunikacji i zależności między agentami: sekwencyjny łańcuch, hierarchia (orchestrator-worker), siatka peer-to-peer, publish-subscribe, równoległy fan-out/fan-in lub hybrydowy graf DAG.

sequentialAgent A → Agent B → Agent C; proste, deterministyczne.
hierarchicalOrkiestrator kieruje grupą agentów-pracowników.
parallelWiele agentów działa jednocześnie na niezależnych podzadaniach.
Architektura pamięciWysoka

Rodzaj i zakres pamięci przydzielonej każdemu agentowi i systemowi jako całości: tylko kontekstowa (w oknie kontekstowym LLM), zewnętrzna pamięć długoterminowa (baza wektorowa), współdzielona między agentami lub prywatna dla każdego agenta.

Udział człowiekaWysoka

Sposób i punkty wejścia człowieka w system: brak (pełna autonomia), zatwierdzanie na każdym kroku, zatwierdzanie kluczowych decyzji lub interwencja tylko przy błędach.

fully autonomousBrak interwencji człowieka.
human-in-the-loop on decisionsCzłowiek zatwierdza decyzje o wysokim ryzyku.
human-in-the-loop on errorsCzłowiek interweniuje tylko przy wykrytych błędach.
Stopień specjalizacji agentówŚrednia

Zakres, w jakim poszczególne agenty mają wyspecjalizowane role (np. agent wyszukujący, agent kodujący, agent weryfikujący) versus agenty ogólnego przeznaczenia.

Złożoność obliczeniowa

Charakterystyki obliczeniowe
Liczba wywołań LLM rośnie liniowo z liczbą agentów × liczba rund komunikacji (typowo 5–50× vs single call)
Koszt tokenów: każda wiadomość między agentami nosi ze sobą rosnący kontekst — historia rozmowy może przekroczyć rzeczywisty payload
Latencja sekwencyjna: w pipeline'ach z N krokami całkowity czas ≈ N × średni czas pojedynczego wywołania LLM
Równoległość: parallel fan-out redukuje latencję do max(per-agent latency), ale nie obniża kosztu tokenów
Skalowalność: hierarchiczne topologie skalują lepiej niż peer-to-peer (komunikacja O(N) vs O(N²))
Pamięć: shared memory / vector store dodaje koszt embeddingu i query latency, ale redukuje token bloat w wiadomościach
Caching: prefix caching i tool-call caching mogą obniżyć koszt o 30–70% w workflow z powtarzalnymi rolami
Uwagi do benchmarku

MAS nie ma jednego kanonicznego benchmarku — ocenia się go w kontekście konkretnego zastosowania. Najczęściej cytowane wyniki: (1) MetaGPT na HumanEval i MBPP osiąga 85,9% pass@1 (vs ~70% single-agent GPT-4 baseline z 2023 r.). (2) AutoGen demonstruje 15–30% poprawę nad single-agent na zadaniach matematycznych (MATH) i kodowych dzięki agentowi-krytykowi. (3) Multi-Agent Debate (Du et al., 2023) poprawia accuracy na MMLU i GSM8K o 5–20 p.p. nad single-model przy koszcie ~3× tokenów. (4) Generative Agents (Park et al., 2023) — ewaluowane jakościowo przez human raters w środowisku Smallville; brak metryk numerycznych. (5) ChatDev — pełne projekty programistyczne dostarczane w czasie liczonym w minutach przy koszcie kilku dolarów. Ważne caveats: MAS rzadko bije najsilniejszy single-model baseline (np. GPT-5) na pojedynczych prostych zapytaniach; przewaga ujawnia się przy zadaniach długiego horyzontu i wymagających specjalizacji.

Paradygmat wykonania

Tryb główny
conditional

Nie wszystkie agenty są aktywne dla każdego zadania — zestaw aktywnych agentów zależy od charakteru zadania i dynamicznego routingu orkiestratora.

Wzorzec aktywacji
input_dependent
Mechanizm routingu

Orkiestrator lub mechanizm routingu decyduje, który agent powinien obsłużyć dane podzadanie, na podstawie roli agenta, jego zdolności, aktualnego stanu systemu lub wyników poprzednich agentów.

Równoległość

Poziom równoległości
conditionally_parallel

Systemy MAS mogą być w pełni równoległe (agenty działają asynchronicznie na niezależnych podzadaniach), częściowo sekwencyjne (z barierami synchronizacji) lub hybrydowe, w zależności od topologii zadania i jego grafu zależności.

Zakres
inferenceacross_devices
Ograniczenia
!Równoległe wykonanie jest możliwe tylko dla agentów, których podzadania są niezależne (brak zależności danych). Zadania z liniowym łańcuchem zależności muszą być wykonywane sekwencyjnie.
!Równoległa praca wielu agentów wykorzystujących ten sam LLM API może napotykać ograniczenia przepustowości (rate limits).

Wymagania sprzętowe

Podstawowe

Systemy MAS to wzorzec architektoniczny działający ponad warstwą sprzętową. Poszczególne agenty mogą działać na GPU (LLM inference), CPU (logika orkiestracyjna) lub w chmurze, w zależności od implementacji.