Architektura agentów AI — ReAct, pamięć, planowanie i systemy wieloagentowe · ReAct — pętla rozumowania i działania

ReAct na zadaniach knowledge-intensive — HotpotQA i FEVER jako case study

ReAct — pętla rozumowania i działania

Wprowadzenie

Dwa kluczowe benchmarki z oryginalnego ReAct paper: HotpotQA — wieloetapowe pytania wymagające przeszukiwania Wikipedii przez 2+ dokumenty, i FEVER — weryfikacja twierdzeń (SUPPORTS/REFUTES/NOT ENOUGH INFO) na podstawie faktów z Wikipedii. Ta lekcja analizuje architekturę eksperymentów Yao et al. 2023, metryki (dokładność EM, F1, evidence accuracy), wyniki porównawcze ReAct vs CoT vs CoT-SC vs Act-Only oraz mechanizmy błędów specyficzne dla każdego zadania.