Robocikowo>ROBOCIKOWO

Architektura agentów AI — ReAct, pamięć, planowanie i systemy wieloagentowe · ReAct — pętla rozumowania i działania

Reflexion — agent uczący się z własnych błędów przez self-reflection

ReAct — pętla rozumowania i działania

Wprowadzenie

Reflexion (Shinn et al. 2023) to rozszerzenie ReAct które dodaje trzeci poziom temporalny: oprócz in-context Thought i zewnętrznych Observations, agent generuje po nieudanym epizodzie "Reflection" — werbalne podsumowanie co poszło nie tak i jak naprawić strategię. Te refleksje są przechowywane w episodic memory i wstrzykiwane do kontekstu następnego episodu. Mechanizm pozwala agentowi poprawić się w kolejnych próbach bez modyfikowania wag modelu — jest to efektywne "few-shot learning over episodes" zamiast gradient descent.