Drugi flagowy model xAI z możliwościami multimodalnymi i generowaniem obrazów przez FLUX (Black Forest Labs). Wagi udostępnione na HuggingFace (ok. 500 GB, 42 pliki). Wymaga 8× GPU z >40 GB pamięci.
Okno kontekstowe
131K
tokenów
Parametry
nieujawnione
parametrów
Data premiery
20 sierpnia 2024
Dostęp:APIDownloadHostedWdrożenie:☁ Cloud💻 Lokalnie
Przegląd
Dostęp i wdrożenie
APIPobieranieHostowane
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 131K
🧩 Parametry: nieujawnione
📥 Wejście: tekst, obraz
Specyfikacja techniczna
Okno kontekstowe
131K
tokenów
Parametry
nieujawnione
parametrów
Licencja
xAI Community License Agreement
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textimage
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Rozumowanie wieloetapowe
Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.
Kategoria: reasoning
Wyniki benchmarków
8 benchmarków
GPQA
0-shot CoT (xAI eval, Aug 2024)
56.0%
📄 xAI Grok-2 Beta Release blog
MMLU
0-shot CoT (xAI eval, Aug 2024)
87.5%
📄 xAI Grok-2 Beta Release blog
MMLU-Pro
0-shot CoT (xAI eval, Aug 2024)
75.5%
📄 xAI Grok-2 Beta Release blog
MATH
maj@1 (xAI eval, Aug 2024)
76.1%
📄 xAI Grok-2 Beta Release blog
HumanEval
pass@1 (xAI eval, Aug 2024)
88.4%
📄 xAI Grok-2 Beta Release blog
MMMU
0-shot CoT (xAI eval, Aug 2024)
66.1%
📄 xAI Grok-2 Beta Release blog
MathVista
xAI eval, Aug 2024
69.0%
📄 xAI Grok-2 Beta Release blog
DocVQA
xAI eval, Aug 2024
93.6%
📄 xAI Grok-2 Beta Release blog
Architektura techniczna
Rdzeń architektury (Core Architecture)
