Robocikowo>ROBOCIKOWO
Mistral Large 3

Mistral Large 3

v25.12 · Rodzina: Mistral
Otwarty model multimodalny Mistral AI z grudnia 2025 oparty na architekturze Mixture-of-Experts; 41B aktywnych i 675B całkowitych parametrów, kontekst 256k, licencja Apache 2.0.
✓ Aktywny✓ Publiczny dostęp⚖ Open sourceLLMModel multimodalny📁 Mistral
Okno kontekstowe
256k
tokenów
Parametry
675B total / 41B active
parametrów
Data premiery
2 grudnia 2025
Dostęp:APIDownloadHostedWdrożenie:☁ Cloud💻 Lokalnie

Przegląd

Mistral Large 3 to multimodalny model językowy ogłoszony przez Mistral AI 2 grudnia 2025 r. jako część rodziny Mistral 3. Model wykorzystuje rzadką architekturę Mixture-of-Experts (MoE) z 41 mld aktywnych i 675 mld całkowitych parametrów oraz oknem kontekstowym 256k tokenów.

Model został wytrenowany od zera na 3000 GPU NVIDIA H200 i jest pierwszym modelem MoE Mistral AI od czasu rodziny Mixtral. Udostępniono wersję bazową oraz fine-tunowaną instrukcyjnie, obie na licencji Apache 2.0. Model obsługuje rozumienie obrazów (multimodalne wejście) oraz konwersacje wielojęzyczne.

Mistral Large 3 jest dostępny przez Mistral AI Studio, Amazon Bedrock, Azure AI Foundry, Hugging Face, IBM WatsonX, OpenRouter, Fireworks i Together AI. Wersje wagowe można uruchomić na pojedynczym węźle 8×A100 lub 8×H100 z vLLM, a w formacie NVFP4 — na systemach Blackwell NVL72.

Klasyfikacja
LLMModel multimodalny
Rodzina: Mistral
Dostęp i wdrożenie
APIPobieranieHostowane
ChmuraLokalnie
Wagi: Open source
Kluczowe parametry
📏 Kontekst: 256k
🧩 Parametry: 675B total / 41B active
📥 Wejście: tekst, obraz

Specyfikacja techniczna

Okno kontekstowe
256k
tokenów
Parametry
675B total / 41B active
parametrów
Licencja
Apache 2.0
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textcode

Możliwości i zastosowania

Natywne możliwości modelu
Rozumienie obrazu
Analiza i interpretacja treści obrazów.
Kategoria: vision
Wielojęzyczność
Rozumienie i generowanie tekstu w wielu językach.
Kategoria: language
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście strukturyzowane
Generowanie danych w ustrukturyzowanych formatach, np. JSON.
Kategoria: structured_generation
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language
OCR
Rozpoznawanie tekstu na obrazach i w dokumentach.
Kategoria: vision

Architektura techniczna

Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)