Robocikowo>ROBOCIKOWO
GLM-5.1

GLM-5.1

5.1 · Rodzina: GLM
Flagowy open-source model Z.ai (Zhipu AI) do agentic engineering, oparty na architekturze Mixture-of-Experts (744B parametrów, 40B aktywnych).
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsLLMModel rozumowania📁 GLM
Okno kontekstowe
200K
tokenów
Parametry
744B total (40B active per token)
parametrów
Max output
128
tokenów
Data premiery
7 kwietnia 2026
Dostęp:APIDownloadWdrożenie:💻 Lokalnie☁ Cloud

Przegląd

GLM-5.1 to flagowy open-source model Z.ai (Zhipu AI) kolejnej generacji, zaprojektowany przede wszystkim pod kątem zadań agentic engineering i programowania wspomaganego AI. Model oparty jest na architekturze Mixture-of-Experts (MoE) z mechanizmem DeepSeek Sparse Attention (DSA) – łącznie 744B parametrów, z których 40B jest aktywnych dla każdego tokenu (256 ekspertów routowanych + 1 współdzielony, 8 aktywnych na token).

W stosunku do poprzednika (GLM-5) model istotnie poprawia wyniki na benchmarkach agentycznych: SWE-Bench Pro (58.4%), BrowseComp (68.0%) i CyberGym (68.7%). Kluczową cechą GLM-5.1 jest zdolność do efektywnego działania przez długie horyzonty – model samodzielnie planuje, przeprowadza eksperymenty, analizuje wyniki i iteruje strategię przez setki rund i tysiące wywołań narzędzi. Obsługuje tryb thinking (chain-of-thought reasoning) domyślnie włączony, narzędzia (function calling) oraz generowanie kodu.

Model udostępniony jest na licencji MIT, wagi dostępne do pobrania na Hugging Face (zai-org/GLM-5.1) oraz ModelScope (ZhipuAI/GLM-5.1). Lokalny deployment wymaga klastra GPU (co najmniej 8× GPU klasy H800/A100; obsługiwane przez vLLM, SGLang, KTransformers i xLLM). Dostępny też jako usługa API przez platformę Z.ai. Wagi trenowano na sprzęcie Huawei Ascend 910B.

Klasyfikacja
LLMModel rozumowania
Rodzina: GLM
Dostęp i wdrożenie
APIPobieranie
LokalnieChmura
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 200K
🧩 Parametry: 744B total (40B active per token)
Narzędzia
📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe
200K
tokenów
Parametry
744B total (40B active per token)
parametrów
Max output tokens
128
tokenów na odpowiedź
Licencja
MIT
Wymagania sprzętowe
Trenowany na Huawei Ascend 910B (bez Nvidia). Lokalne wdrożenie wymaga klastra GPU enterprise. Pełny model BF16 ~1.49TB.
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
textcodestructured_data

Możliwości i zastosowania

Natywne możliwości modelu
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning

Wyniki benchmarków

7 benchmarków
SWE-bench
58.4%
📅 7 kwi 2026📄 Z.ai (self-reported)
Wynik self-reported przez Z.ai. Pierwsze miejsce wśród wszystkich modeli na SWE-Bench Pro w dacie publikacji. Wynik nieweryfikowany niezależnie.
GPQA
86.2%
📅 7 kwi 2026📄 Z.ai (self-reported)
Wynik self-reported przez Z.ai z oficjalnej karty modelu na HuggingFace.
HLE (Humanity's Last Exam)
accuracy · without tools
31.0%
📅 7 kwi 2026📄 Z.ai / zai-org (self-reported, official HuggingFace model card)
Wynik z tabeli benchmarków w oficjalnym model card na HuggingFace (zai-org/GLM-5.1). Self-reported przez Z.ai.
HLE (Humanity's Last Exam) with Tools
accuracy · with tools
52.3%
📅 7 kwi 2026📄 Z.ai / zai-org (self-reported, official HuggingFace model card)
Wynik z tabeli benchmarków w oficjalnym model card na HuggingFace (zai-org/GLM-5.1). Self-reported przez Z.ai.
AIME 2026
accuracy · competition math
95.3%
📅 7 kwi 2026📄 Z.ai / zai-org (self-reported, official HuggingFace model card)
Wynik z tabeli benchmarków w oficjalnym model card na HuggingFace (zai-org/GLM-5.1). Self-reported przez Z.ai.
BrowseComp
accuracy · without context management
68.0%
📅 7 kwi 2026📄 Z.ai / zai-org (self-reported, official HuggingFace model card)
Wynik z tabeli benchmarków w oficjalnym model card na HuggingFace (zai-org/GLM-5.1). Self-reported przez Z.ai.
CyberGym
accuracy
68.7%
📅 7 kwi 2026📄 Z.ai / zai-org (self-reported, official HuggingFace model card)
Wynik state-of-the-art wśród modeli w tabeli. Self-reported przez Z.ai.

Cennik

Architektura techniczna

Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)

Wdrożenie i bezpieczeństwo

☁ Dostępny na platformach