O rodzinie
Mamba to rodzina modeli sekwencyjnych wykorzystująca strukturę selektywnych modeli stanu (Selective SSM) zamiast mechanizmu uwagi z architektury Transformer. Pierwsza wersja (Mamba) została opisana w grudniu 2023 (arXiv:2312.00752), Mamba-2 w maju 2024 (arXiv:2405.21060), a Mamba-3 w 2026. Modele są wydawane na licencji Apache-2.0.