MiniMax M2.7

M2.7

MiniMax M2.7 to model językowy MoE o 230B parametrach (10B aktywnych przy inferencji), wydany 18 marca 2026 roku.

✓ Aktywny✓ Publiczny dostęp⚖ Open weightsLLMModel rozumowaniaModel używający narzędzi

Okno kontekstowe

200K

tokenów

Parametry

230B (10B active)

parametrów

Max output

131 072

tokenów

Data premiery

18 marca 2026

🏢MiniMaxProducent

Dostęp:APIDownloadWdrożenie:☁ Cloud💻 Lokalnie

Przegląd

MiniMax M2.7 to model językowy dużej skali (LLM) opracowany przez chińską firmę MiniMax Group Inc. (稀宇科技), wydany 18 marca 2026 roku. Jest to model typu Mixture of Experts (MoE) o 230 miliardach parametrów całkowitych, z czego jedynie 10 miliardów jest aktywowanych podczas pojedynczej inferencji. M2.7 jest bezpośrednim następcą MiniMax M2.5 (luty 2026) i stanowi pierwszą iterację w serii M2, w której model aktywnie uczestniczył we własnym procesie ewolucji i doskonalenia.

Architektura i parametry

Model oparty jest na architekturze sparse Mixture of Experts z 256 ekspertami i mechanizmem routingu top-k. Zastosowano wielogłowicową przyczynową self-attention wzbogaconą o Rotary Position Embeddings (RoPE) oraz Query-Key Root Mean Square Normalization (QK RMSNorm). Okno kontekstowe wynosi 200 000 tokenów, a maksymalna długość wyjścia sięga 131 072 tokenów. Dzięki aktywacji jedynie ~10B parametrów przy każdym przejściu do przodu, model oferuje niskie opóźnienia i niższe koszty inferencji przy zachowaniu możliwości porównywalnych z modelami o pełnej gęstości parametrów.

Samodzielna ewolucja modelu

Kluczowym wyróżnikiem M2.7 jest to, że wewnętrzna wersja modelu aktywnie uczestniczyła w procesie swojego własnego treningu. W ramach eksperymentu model autonomicznie optymalizował scaffold do programowania przez ponad 100 rund — analizował trajektorie niepowodzeń, modyfikował kod, uruchamiał ewaluacje i decydował o zatwierdzeniu lub cofnięciu zmian — osiągając poprawę wydajności o 30% bez interwencji człowieka. Model buduje złożone harnessy agentowe, aktualizuje własną pamięć, tworzy dziesiątki złożonych umiejętności i poprawia własny proces uczenia na podstawie wyników eksperymentów.

Inżynieria oprogramowania i agentic workflows

M2.7 jest przeznaczony przede wszystkim do zaawansowanych zadań programistycznych i długich łańcuchów agentowych. Obsługuje analizę logów, wykrywanie błędów, refactoring, bezpieczeństwo kodu, zadania z zakresu machine learningu oraz kompleksowe dostarczanie projektów end-to-end. Model wspiera natywnie mechanizm Agent Teams (wieloagentowa współpraca) oraz dynamiczne wyszukiwanie narzędzi. Na benchmarku SWE-Pro uzyskał wynik 56,22%, dorównując GPT-5.3-Codex. Na Terminal Bench 2 osiągnął 57,0%, na VIBE-Pro — 55,6%, na SWE Multilingual — 76,5, a na MLE Bench Lite medal rate 66,6% (drugi wynik wśród open-weight models).

Profesjonalna praca biurowa

Model wykazuje silne możliwości w zakresie edycji dokumentów biurowych — Excel, Word i PowerPoint — z obsługą wielorundowych, wysokiej wierności modyfikacji. Na benchmarku GDPval-AA osiągnął wynik ELO 1495, najwyższy spośród modeli open-weights. Na Toolathon uzyskał dokładność 46,3%, a na MM Claw — 62,7%, zbliżając się do wyników Sonnet 4.6. Model utrzymuje 97-procentowy wskaźnik przestrzegania umiejętności na zbiorze 40 złożonych skills przekraczających 2000 tokenów każda.

Dostępność i licencja

Wagi modelu są publicznie dostępne na Hugging Face (MiniMaxAI/MiniMax-M2.7) oraz w repozytorium GitHub (MiniMax-AI/MiniMax-M2.7). Model można uruchamiać lokalnie przy użyciu SGLang, vLLM lub Transformers, a także przez NVIDIA NIM Endpoint i Ollama. Licencja oznaczona przez MiniMax jako „Modified-MIT" jest w praktyce licencją niekomercyjną — użycie niekomercyjne jest dozwolone, natomiast każde użycie komercyjne wymaga uprzedniej pisemnej zgody MiniMax. M2.7 jest pierwszym modelem z serii M2, który odszedł od w pełni permisywnej licencji MIT stosowanej we wcześniejszych wersjach (M2, M2.1, M2.5).

Cennik API

W modelu Pay-as-You-Go koszt inferencji przez API MiniMax wynosi $0,30 za milion tokenów wejściowych oraz $1,20 za milion tokenów wyjściowych. Dostępny jest również wariant MiniMax-M2.7-highspeed ($0,60/$2,40 za milion tokenów) oferujący wyższą przepustowość przy tej samej jakości. Prompt caching read kosztuje $0,06/M tokenów, a prompt caching write — $0,375/M tokenów.

Klasyfikacja

LLMModel rozumowaniaModel używający narzędzi

Dostęp i wdrożenie

APIPobieranie

ChmuraLokalnie

Wagi: Open weights

Kluczowe parametry

📏 Kontekst: 200K

🧩 Parametry: 230B (10B active)

✓ Narzędzia

📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe

200K

tokenów

Parametry

230B (10B active)

parametrów

Max output tokens

131 072

tokenów na odpowiedź

Licencja

MiniMax Non-Commercial License (Modified-MIT, non-commercial; commercial use requires prior written authorization)

Funkcje:✓ Używanie narzędzi

Modalności

⬇ Wejście (Input)

text

⬆ Wyjście (Output)

textcode

Możliwości i zastosowania

Natywne możliwości modelu

Rozumowanie

Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.

Kategoria: reasoning

Rozumowanie wieloetapowe

Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.

Kategoria: reasoning

Długi kontekst

Obsługa dużych okien kontekstowych — dziesiątek do setek tysięcy (lub milionów) tokenów wejścia. Umożliwia analizę całych baz kodu, długich dokumentów, wielu równolegle rozmów bez utraty wcześniejszych informacji. GPT-5.1 wspiera 400 000 tokenów.

Kategoria: language

Programowanie

Generowanie, analizowanie i modyfikowanie kodu w wielu językach programowania. Obejmuje pisanie funkcji, debugowanie, refaktoryzację, code review, tworzenie testów. Mierzone benchmarkami takimi jak HumanEval, SWE-bench.

Kategoria: coding

Wywoływanie funkcji

Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.

Kategoria: planning

Wyjście strukturyzowane

Generowanie danych w ustrukturyzowanych formatach, np. JSON.

Kategoria: structured_generation

Wielojęzyczność

Kompetencje w wielu językach naturalnych (od kilku do stu+): rozumienie, generowanie, tłumaczenie, code-switching w obrębie jednej rozmowy. Modele frontier obsługują szeroki wachlarz języków ze zbliżoną jakością.

Kategoria: language

Planowanie

Tworzenie i realizacja planów działania dla złożonych zadań.

Kategoria: planning

Wyjście strumieniowe

Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.

Kategoria: reasoning

Wyniki benchmarków

11 benchmarków

SWE-Pro

pass@1

56.22%%

📄 MiniMax official blog / Hugging Face model card

Real-world software engineering tasks. MiniMax reports this matches GPT-5.3-Codex level.

VIBE-Pro

pass@1

55.6%%

📄 MiniMax official blog / Hugging Face model card

End-to-end full project delivery benchmark. Reported close to Opus 4.6.

Terminal Bench 2

accuracy

57.0%%

📄 MiniMax official blog / Hugging Face model card

SWE Multilingual

score

76.5

📄 Hugging Face model card

Multi SWE Bench

score

52.7

📄 Hugging Face model card

NL2Repo

score

39.8

📄 Hugging Face model card

GDPval-AA (ELO)

ELO

1495

📄 MiniMax official blog / Hugging Face model card

Highest among open-source models per MiniMax; benchmark covers 45 models in professional office tasks.

Toolathon

accuracy

46.3%%

📄 Hugging Face model card

MM Claw

accuracy

62.7%%

📄 Hugging Face model card

End-to-end benchmark. MiniMax reports close to Sonnet 4.6.

MLE Bench Lite (Medal Rate, 22 competitions)

medal rate

66.6%%

📄 Hugging Face model card

Average over three 24-hour autonomous runs. Second only to Opus 4.6 (75.7%) and GPT-5.4 (71.2%).

Artificial Analysis Intelligence Index

index score

📄 Artificial Analysis (https://artificialanalysis.ai/models/minimax-m2-7)

Score of 50 vs field average of 27 (non-reasoning open-weight models of similar size). As of March/April 2026.

Cennik

Źródła i powiązane strony

12 źródeł

WebMiniMax M2.7 — Oficjalna strona produktuminimax.io BlogMiniMax M2.7: Early Echoes of Self-Evolution — oficjalny blog MiniMaxminimax.io RepoMiniMaxAI/MiniMax-M2.7 — Hugging Face model cardhuggingface.co RepoMiniMax-AI/MiniMax-M2.7 — GitHubgithub.com DocsMiniMax API Models — oficjalna dokumentacjaplatform.minimax.io DocsMiniMax Pay as You Go Pricingplatform.minimax.io DocsMiniMax Release Notes — Modelsplatform.minimax.io BlogNVIDIA Technical Blog: MiniMax M2.7 Advances Scalable Agentic Workflows on NVIDIA Platformsdeveloper.nvidia.com WebArtificial Analysis — MiniMax M2.7 Intelligence Index & Specsartificialanalysis.ai WebOllama — minimax-m2.7 library pageollama.com WebDecrypt: MiniMax Drops State-of-the-Art AI Agent Model—Then Quietly Changes the Licensedecrypt.co RepoMiniMax-M2.7 LICENSE — GitHubgithub.com

Przeglądaj powiązane tematy

Wszystkie modele llm Wszystkie modele reasoning model