
Reasoning model OpenAI wydany 16 kwietnia 2025 r. z pełnym dostępem do narzędzi w ChatGPT, zdolnością myślenia obrazami i oknem kontekstu 200K. Zastąpiony przez GPT-5.
Okno kontekstowe
200K
tokenów
Max output
100 000
tokenów
Data premiery
16 kwietnia 2025
Dostęp:APIHostedWdrożenie:☁ Cloud
Przegląd
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 200K
✓ Narzędzia
📥 Wejście: tekst, obraz
Platformy
Specyfikacja techniczna
Okno kontekstowe
200K
tokenów
Max output tokens
100 000
tokenów na odpowiedź
Knowledge cutoff
1 cze 2024
Data graniczna wiedzy
Funkcje:✓ Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textcode
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Równoległe wywołania narzędzi
Zdolność do jednoczesnego wywoływania wielu narzędzi zewnętrznych w trakcie generowania odpowiedzi.
Kategoria: reasoning
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Zdolności agentowe
Zdolność modelu do autonomicznego planowania i wykonywania wieloetapowych zadań poprzez sekwencyjne użycie narzędzi, utrzymywanie kontekstu i adaptację do wyników pośrednich.
Kategoria: planning
Obsługa komputera
Zdolność modelu do obsługi interfejsu komputera poprzez interpretację zrzutów ekranu oraz generowanie akcji takich jak kliknięcia, wpisywanie tekstu i nawigacja po aplikacjach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Wyniki benchmarków
6 benchmarków
Codeforces
ELO rating · High reasoning effort, with tools
2727points
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
SWE-bench
accuracy · SWE-bench Verified, fixed subset n=477, no custom scaffold
69.1%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
MMMU
accuracy · Multimodal understanding, high reasoning effort
82.9%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
AIME 2025
pass@1 · AIME 2025 z dostępem do narzędzi (Python). Bez narzędzi wynik jest niższy i nieporównywalny z modelami bez tool access.
98.4%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
GPQA
accuracy · GPQA Diamond, high reasoning effort
83.3%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
Humanity's Last Exam (HLE)
accuracy · Humanity's Last Exam, no tools
20.32%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
Cennik
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)
Wdrożenie i bezpieczeństwo
☁ Dostępny na platformach