Otwarty model rozumowania od DeepSeek (styczeń 2025). MoE 671B z 37B aktywnymi parametrami, trenowany czystym RL z weryfikowalną nagrodą (GRPO) na bazie DeepSeek-V3.
Okno kontekstowe
128K
tokenów
Parametry
671B (37B active)
parametrów
Max output
32 768
tokenów
Data premiery
20 stycznia 2025
Dostęp:APIDownloadHostedWdrożenie:☁ Cloud💻 Lokalnie
Przegląd
Zastosowania
Dostęp i wdrożenie
APIPobieranieHostowane
ChmuraLokalnie
Wagi: Open weights
Kluczowe parametry
📏 Kontekst: 128K
🧩 Parametry: 671B (37B active)
✓ Narzędzia · ✓ Fine-tuning
📥 Wejście: tekst
Specyfikacja techniczna
Okno kontekstowe
128K
tokenów
Parametry
671B (37B active)
parametrów
Max output tokens
32 768
tokenów na odpowiedź
Knowledge cutoff
1 lip 2024
Data graniczna wiedzy
Licencja
MIT
Wymagania sprzętowe
Pełny model wymaga klastra wielu GPU (typowo 8×H100 80 GB lub większy). Dostępne dystylowane warianty (1.5B–70B) działają na pojedynczym consumer/data-center GPU.
Funkcje:✓ Używanie narzędzi✓ Fine-tuning
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Planowanie
Zdolność modelu do wyznaczania sekwencji działań prowadzących do celu — przewidywania skutków akcji i wyboru optymalnej ścieżki w danym środowisku.
Kategoria: planning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Modelowanie języka
Zdolność przewidywania kolejnych tokenów i generowania spójnego tekstu w języku naturalnym na podstawie poprzedzającego kontekstu.
Kategoria: language
Zdolności agentowe
Zdolność modelu do autonomicznego planowania i wykonywania wieloetapowych zadań poprzez sekwencyjne użycie narzędzi, utrzymywanie kontekstu i adaptację do wyników pośrednich.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumowanie po diagramach
Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.
Kategoria: reasoning
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyniki benchmarków
8 benchmarków
AIME 2024
pass@1 · cons@64 (majority voting)
79.8%
📄 DeepSeek-R1 paper (arXiv:2501.12948)
MATH
pass@1 · MATH-500 subset
97.3%
📄 DeepSeek-R1 paper (MATH-500)
Codeforces
percentile · 2 029 ELO equivalent
96.3percentile
📄 DeepSeek-R1 paper
MMLU
accuracy · pass@1
90.8%
📄 DeepSeek-R1 paper
GPQA
pass@1 · GPQA Diamond
71.5%
📄 DeepSeek-R1 paper
LiveCodeBench
pass@1 · COT@8
65.9%
📄 DeepSeek-R1 paper
SWE-bench
resolved · SWE-bench Verified
49.2%
📄 DeepSeek-R1 paper
MMLU-Pro
EM · Exact Match
84.0%
📄 DeepSeek-R1 paper
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)
Wdrożenie i bezpieczeństwo
☁ Dostępny na platformach
