GLM-5.1

5.1 · Rodzina: GLM

Flagowy open-source model Z.ai (Zhipu AI) do agentic engineering, oparty na architekturze Mixture-of-Experts (744B parametrów, 40B aktywnych).

✓ Aktywny✓ Publiczny dostęp⚖ Open weightsLLMModel rozumowania📁 GLM

Okno kontekstowe

200K

tokenów

Parametry

744B total (40B active per token)

parametrów

Max output

128

tokenów

Data premiery

7 kwietnia 2026

🏢Z.aiProducent

Dostęp:APIDownloadWdrożenie:💻 Lokalnie☁ Cloud

Przegląd

GLM-5.1 to flagowy open-source model Z.ai (Zhipu AI) kolejnej generacji, zaprojektowany przede wszystkim pod kątem zadań agentic engineering i programowania wspomaganego AI. Model oparty jest na architekturze Mixture-of-Experts (MoE) z mechanizmem DeepSeek Sparse Attention (DSA) – łącznie 744B parametrów, z których 40B jest aktywnych dla każdego tokenu (256 ekspertów routowanych + 1 współdzielony, 8 aktywnych na token).

W stosunku do poprzednika (GLM-5) model istotnie poprawia wyniki na benchmarkach agentycznych: SWE-Bench Pro (58.4%), BrowseComp (68.0%) i CyberGym (68.7%). Kluczową cechą GLM-5.1 jest zdolność do efektywnego działania przez długie horyzonty – model samodzielnie planuje, przeprowadza eksperymenty, analizuje wyniki i iteruje strategię przez setki rund i tysiące wywołań narzędzi. Obsługuje tryb thinking (chain-of-thought reasoning) domyślnie włączony, narzędzia (function calling) oraz generowanie kodu.

Model udostępniony jest na licencji MIT, wagi dostępne do pobrania na Hugging Face (zai-org/GLM-5.1) oraz ModelScope (ZhipuAI/GLM-5.1). Lokalny deployment wymaga klastra GPU (co najmniej 8× GPU klasy H800/A100; obsługiwane przez vLLM, SGLang, KTransformers i xLLM). Dostępny też jako usługa API przez platformę Z.ai. Wagi trenowano na sprzęcie Huawei Ascend 910B.

Klasyfikacja

LLMModel rozumowania

Rodzina: GLM

Zastosowania

Kodowanie Asystent badawczy Q&A / Odpowiadanie na pytania

Dostęp i wdrożenie

APIPobieranie

LokalnieChmura

Wagi: Open weights

Kluczowe parametry

📏 Kontekst: 200K

🧩 Parametry: 744B total (40B active per token)

✓ Narzędzia

📥 Wejście: tekst

Platformy

Hugging Face Hub

Specyfikacja techniczna

Okno kontekstowe

200K

tokenów

Parametry

744B total (40B active per token)

parametrów

Max output tokens

128

tokenów na odpowiedź

Licencja

MIT

Wymagania sprzętowe

Trenowany na Huawei Ascend 910B (bez Nvidia). Lokalne wdrożenie wymaga klastra GPU enterprise. Pełny model BF16 ~1.49TB.

Funkcje:✓ Używanie narzędzi

Modalności

⬇ Wejście (Input)

text

⬆ Wyjście (Output)

textcodestructured_data

Możliwości i zastosowania

Natywne możliwości modelu

Programowanie

Generowanie, analiza i modyfikacja kodu źródłowego.

Kategoria: coding

Rozumowanie

Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.

Kategoria: reasoning

Rozumowanie wieloetapowe

Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.

Kategoria: reasoning

Wielojęzyczność

Rozumienie i generowanie tekstu w wielu językach.

Kategoria: language

Planowanie

Tworzenie i realizacja planów działania dla złożonych zadań.

Kategoria: planning

Wyjście strukturyzowane

Generowanie danych w ustrukturyzowanych formatach, np. JSON.

Kategoria: structured_generation

Wywoływanie funkcji

Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.

Kategoria: planning

Długi kontekst

Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.

Kategoria: language

Wyjście strumieniowe

Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.

Kategoria: reasoning

Dziedziny zastosowań

Kodowanie Asystent badawczy Q&A / Odpowiadanie na pytania

Wyniki benchmarków

7 benchmarków

SWE-bench

58.4%

📅 7 kwi 2026📄 Z.ai (self-reported)

Wynik self-reported przez Z.ai. Pierwsze miejsce wśród wszystkich modeli na SWE-Bench Pro w dacie publikacji. Wynik nieweryfikowany niezależnie.

GPQA

86.2%

📅 7 kwi 2026📄 Z.ai (self-reported)

Wynik self-reported przez Z.ai z oficjalnej karty modelu na HuggingFace.

HLE (Humanity's Last Exam)

accuracy · without tools

31.0%