Robocikowo>ROBOCIKOWO
MiniMax M2.7

MiniMax M2.7

M2.7
MiniMax M2.7 to model językowy MoE o 230B parametrach (10B aktywnych przy inferencji), wydany 18 marca 2026 roku.
✓ Aktywny✓ Publiczny dostęp⚖ Open weightsLLMModel rozumowaniaModel używający narzędzi
Okno kontekstowe
200K
tokenów
Parametry
230B (10B active)
parametrów
Max output
131 072
tokenów
Data premiery
18 marca 2026
Dostęp:APIDownloadWdrożenie:☁ Cloud💻 Lokalnie

Przegląd

MiniMax M2.7 to model językowy dużej skali (LLM) opracowany przez chińską firmę MiniMax Group Inc. (稀宇科技), wydany 18 marca 2026 roku. Jest to model typu Mixture of Experts (MoE) o 230 miliardach parametrów całkowitych, z czego jedynie 10 miliardów jest aktywowanych podczas pojedynczej inferencji. M2.7 jest bezpośrednim następcą MiniMax M2.5 (luty 2026) i stanowi pierwszą iterację w serii M2, w której model aktywnie uczestniczył we własnym procesie ewolucji i doskonalenia.

Architektura i parametry

Model oparty jest na architekturze sparse Mixture of Experts z 256 ekspertami i mechanizmem routingu top-k. Zastosowano wielogłowicową przyczynową self-attention wzbogaconą o Rotary Position Embeddings (RoPE) oraz Query-Key Root Mean Square Normalization (QK RMSNorm). Okno kontekstowe wynosi 200 000 tokenów, a maksymalna długość wyjścia sięga 131 072 tokenów. Dzięki aktywacji jedynie ~10B parametrów przy każdym przejściu do przodu, model oferuje niskie opóźnienia i niższe koszty inferencji przy zachowaniu możliwości porównywalnych z modelami o pełnej gęstości parametrów.

Samodzielna ewolucja modelu

Kluczowym wyróżnikiem M2.7 jest to, że wewnętrzna wersja modelu aktywnie uczestniczyła w procesie swojego własnego treningu. W ramach eksperymentu model autonomicznie optymalizował scaffold do programowania przez ponad 100 rund — analizował trajektorie niepowodzeń, modyfikował kod, uruchamiał ewaluacje i decydował o zatwierdzeniu lub cofnięciu zmian — osiągając poprawę wydajności o 30% bez interwencji człowieka. Model buduje złożone harnessy agentowe, aktualizuje własną pamięć, tworzy dziesiątki złożonych umiejętności i poprawia własny proces uczenia na podstawie wyników eksperymentów.

Inżynieria oprogramowania i agentic workflows

M2.7 jest przeznaczony przede wszystkim do zaawansowanych zadań programistycznych i długich łańcuchów agentowych. Obsługuje analizę logów, wykrywanie błędów, refactoring, bezpieczeństwo kodu, zadania z zakresu machine learningu oraz kompleksowe dostarczanie projektów end-to-end. Model wspiera natywnie mechanizm Agent Teams (wieloagentowa współpraca) oraz dynamiczne wyszukiwanie narzędzi. Na benchmarku SWE-Pro uzyskał wynik 56,22%, dorównując GPT-5.3-Codex. Na Terminal Bench 2 osiągnął 57,0%, na VIBE-Pro — 55,6%, na SWE Multilingual — 76,5, a na MLE Bench Lite medal rate 66,6% (drugi wynik wśród open-weight models).

Profesjonalna praca biurowa

Model wykazuje silne możliwości w zakresie edycji dokumentów biurowych — Excel, Word i PowerPoint — z obsługą wielorundowych, wysokiej wierności modyfikacji. Na benchmarku GDPval-AA osiągnął wynik ELO 1495, najwyższy spośród modeli open-weights. Na Toolathon uzyskał dokładność 46,3%, a na MM Claw — 62,7%, zbliżając się do wyników Sonnet 4.6. Model utrzymuje 97-procentowy wskaźnik przestrzegania umiejętności na zbiorze 40 złożonych skills przekraczających 2000 tokenów każda.

Dostępność i licencja

Wagi modelu są publicznie dostępne na Hugging Face (MiniMaxAI/MiniMax-M2.7) oraz w repozytorium GitHub (MiniMax-AI/MiniMax-M2.7). Model można uruchamiać lokalnie przy użyciu SGLang, vLLM lub Transformers, a także przez NVIDIA NIM Endpoint i Ollama. Licencja oznaczona przez MiniMax jako „Modified-MIT" jest w praktyce licencją niekomercyjną — użycie niekomercyjne jest dozwolone, natomiast każde użycie komercyjne wymaga uprzedniej pisemnej zgody MiniMax. M2.7 jest pierwszym modelem z serii M2, który odszedł od w pełni permisywnej licencji MIT stosowanej we wcześniejszych wersjach (M2, M2.1, M2.5).

Cennik API

W modelu Pay-as-You-Go koszt inferencji przez API MiniMax wynosi $0,30 za milion tokenów wejściowych oraz $1,20 za milion tokenów wyjściowych. Dostępny jest również wariant MiniMax-M2.7-highspeed ($0,60/$2,40 za milion tokenów) oferujący wyższą przepustowość przy tej samej jakości. Prompt caching read kosztuje $0,06/M tokenów, a prompt caching write — $0,375/M tokenów.

Klasyfikacja
LLMModel rozumowaniaModel używający narzędzi
Dostęp i wdrożenie
APIPobieranie
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 200K
🧩 Parametry: 230B (10B active)
Narzędzia
📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe
200K
tokenów
Parametry
230B (10B active)
parametrów
Max output tokens
131 072
tokenów na odpowiedź
Licencja
MiniMax Non-Commercial License (Modified-MIT, non-commercial; commercial use requires prior written authorization)
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
textcode

Możliwości i zastosowania

Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning

Wyniki benchmarków

11 benchmarków
SWE-Pro
pass@1
56.22%%
📄 MiniMax official blog / Hugging Face model card
Real-world software engineering tasks. MiniMax reports this matches GPT-5.3-Codex level.
VIBE-Pro
pass@1
55.6%%
📄 MiniMax official blog / Hugging Face model card
End-to-end full project delivery benchmark. Reported close to Opus 4.6.
Terminal Bench 2
accuracy
57.0%%
📄 MiniMax official blog / Hugging Face model card
SWE Multilingual
score
76.5
📄 Hugging Face model card
Multi SWE Bench
score
52.7
📄 Hugging Face model card
NL2Repo
score
39.8
📄 Hugging Face model card
GDPval-AA (ELO)
ELO
1495
📄 MiniMax official blog / Hugging Face model card
Highest among open-source models per MiniMax; benchmark covers 45 models in professional office tasks.
Toolathon
accuracy
46.3%%
📄 Hugging Face model card
MM Claw
accuracy
62.7%%
📄 Hugging Face model card
End-to-end benchmark. MiniMax reports close to Sonnet 4.6.
MLE Bench Lite (Medal Rate, 22 competitions)
medal rate
66.6%%
📄 Hugging Face model card
Average over three 24-hour autonomous runs. Second only to Opus 4.6 (75.7%) and GPT-5.4 (71.2%).
Artificial Analysis Intelligence Index
index score
50
📄 Artificial Analysis (https://artificialanalysis.ai/models/minimax-m2-7)
Score of 50 vs field average of 27 (non-reasoning open-weight models of similar size). As of March/April 2026.

Cennik