Robocikowo>ROBOCIKOWO
Grok-2

Grok-2

2 · Rodzina: Grok
Drugi flagowy model xAI z możliwościami multimodalnymi i generowaniem obrazów przez FLUX (Black Forest Labs). Wagi udostępnione na HuggingFace (ok. 500 GB, 42 pliki). Wymaga 8× GPU z >40 GB pamięci.
⚠ Deprecated✓ Publiczny dostęp⚖ Open weightsLLMModel multimodalny📁 Grok
Okno kontekstowe
131K
tokenów
Parametry
nieujawnione
parametrów
Data premiery
20 sierpnia 2024
Dostęp:APIDownloadHostedWdrożenie:☁ Cloud💻 Lokalnie

Przegląd

Grok-2 to multimodalny frontierowy model językowy xAI ogłoszony 13 sierpnia 2024 r. i dostępny dla subskrybentów X Premium oraz Premium+. W oficjalnych benchmarkach xAI (sierpień 2024) osiągnął m.in. GPQA 56,0%, MMLU 87,5%, MMLU-Pro 75,5%, MATH 76,1%, HumanEval 88,4%, MMMU 66,1%, MathVista 69,0% i DocVQA 93,6%. Wczesna wersja testowana w LMSYS Chatbot Arena pod kryptonimem "sus-column-r" przewyższała wówczas Claude 3.5 Sonnet i GPT-4-Turbo w ogólnym Elo. Model integruje generację obrazów dzięki współpracy z Black Forest Labs (FLUX.1). W sierpniu 2025 r. wagi Grok-2 zostały udostępnione na Hugging Face na licencji xAI Community License Agreement (źródło-available, ograniczenia komercyjne) — checkpoint waży ~500 GB w 42 plikach i wymaga 8 GPU >40 GB każda do uruchomienia (TP=8, kwantyzacja FP8). Liczba parametrów nie została oficjalnie ujawniona przez xAI.

Klasyfikacja
LLMModel multimodalny
Rodzina: Grok
Dostęp i wdrożenie
APIPobieranieHostowane
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 131K
🧩 Parametry: nieujawnione
📥 Wejście: tekst, obraz

Specyfikacja techniczna

Okno kontekstowe
131K
tokenów
Parametry
nieujawnione
parametrów
Licencja
xAI Community License Agreement
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textimage

Możliwości i zastosowania

Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Rozumowanie wieloetapowe
Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.
Kategoria: reasoning

Wyniki benchmarków

8 benchmarków
GPQA
0-shot CoT (xAI eval, Aug 2024)
56.0%
📄 xAI Grok-2 Beta Release blog
MMLU
0-shot CoT (xAI eval, Aug 2024)
87.5%
📄 xAI Grok-2 Beta Release blog
MMLU-Pro
0-shot CoT (xAI eval, Aug 2024)
75.5%
📄 xAI Grok-2 Beta Release blog
MATH
maj@1 (xAI eval, Aug 2024)
76.1%
📄 xAI Grok-2 Beta Release blog
HumanEval
pass@1 (xAI eval, Aug 2024)
88.4%
📄 xAI Grok-2 Beta Release blog
MMMU
0-shot CoT (xAI eval, Aug 2024)
66.1%
📄 xAI Grok-2 Beta Release blog
MathVista
xAI eval, Aug 2024
69.0%
📄 xAI Grok-2 Beta Release blog
DocVQA
xAI eval, Aug 2024
93.6%
📄 xAI Grok-2 Beta Release blog

Architektura techniczna

Rdzeń architektury (Core Architecture)