Bezpieczeństwo agentów AI — ataki, jailbreak i obrona · Guardrails i AI Firewall — obrona wielowarstwowa

Sandboxing agentów: deterministyczna izolacja vs AI-based allow-list

Guardrails i AI Firewall — obrona wielowarstwowa

Wprowadzenie

Gdy agent AI wykonuje kod, wywołuje API lub operuje na plikach, sandbox staje się ostatnią linią obrony przed eskalacją uprawnień i nieodwracalnymi akcjami. Ta lekcja porównuje dwa podejścia: deterministyczną izolację (seccomp, namespaces, gVisor, Firecracker) z jej twardymi gwarancjami bezpieczeństwa oraz AI-based allow-list, gdzie drugi model decyduje o dostępach — elastyczną, ale probabilistyczną.