Robocikowo>ROBOCIKOWO
OpenAI o3

OpenAI o3

o3 · Rodzina: OpenAI o-series
Reasoning model OpenAI wydany 16 kwietnia 2025 r. z pełnym dostępem do narzędzi w ChatGPT, zdolnością myślenia obrazami i oknem kontekstu 200K. Zastąpiony przez GPT-5.
✓ Aktywny✓ Publiczny dostępModel rozumowaniaModel multimodalnyLLM📁 OpenAI o-series
Okno kontekstowe
200K
tokenów
Max output
100 000
tokenów
Data premiery
16 kwietnia 2025
Dostęp:APIHostedWdrożenie:☁ Cloud

Przegląd

OpenAI o3 to model rozumujący z serii o, opublikowany 16 kwietnia 2025 r. razem z o4-mini. Jako pierwszy w rodzinie o-series otrzymał pełny agentowy dostęp do wszystkich narzędzi w ChatGPT — wyszukiwania w sieci, interpretera Pythona, generowania obrazów oraz analizy plików — i został wytrenowany przez reinforcement learning do decydowania, kiedy i jak ich używać. Model wprowadził też "thinking with images": obrazy stają się częścią łańcucha rozumowania i mogą być przekształcane (obrót, zoom) w trakcie analizy. W API o3 ma okno kontekstu 200 000 tokenów, maksymalną odpowiedź 100 000 tokenów oraz knowledge cutoff 1 czerwca 2024. Identyfikator API to o3 (snapshot o3-2025-04-16). Cennik: 2 USD za 1M tokenów wejściowych (0,50 USD cached) i 8 USD za 1M tokenów wyjściowych. Model został zastąpiony przez GPT-5, ale pozostaje dostępny w API. W czerwcu 2025 r. wydano także wariant OpenAI o3-pro.

Klasyfikacja
Model rozumowaniaModel multimodalnyLLM
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 200K
Narzędzia
📥 Wejście: tekst, obraz

Specyfikacja techniczna

Okno kontekstowe
200K
tokenów
Max output tokens
100 000
tokenów na odpowiedź
Knowledge cutoff
1 cze 2024
Data graniczna wiedzy
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textcode

Możliwości i zastosowania

Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Równoległe wywołania narzędzi
Zdolność do jednoczesnego wywoływania wielu narzędzi zewnętrznych w trakcie generowania odpowiedzi.
Kategoria: reasoning
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Zdolności agentowe
Zdolność modelu do autonomicznego planowania i wykonywania wieloetapowych zadań poprzez sekwencyjne użycie narzędzi, utrzymywanie kontekstu i adaptację do wyników pośrednich.
Kategoria: planning
Obsługa komputera
Zdolność modelu do obsługi interfejsu komputera poprzez interpretację zrzutów ekranu oraz generowanie akcji takich jak kliknięcia, wpisywanie tekstu i nawigacja po aplikacjach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation

Wyniki benchmarków

6 benchmarków
Codeforces
ELO rating · High reasoning effort, with tools
2727points
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
SWE-bench
accuracy · SWE-bench Verified, fixed subset n=477, no custom scaffold
69.1%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
MMMU
accuracy · Multimodal understanding, high reasoning effort
82.9%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
AIME 2025
pass@1 · AIME 2025 z dostępem do narzędzi (Python). Bez narzędzi wynik jest niższy i nieporównywalny z modelami bez tool access.
98.4%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
GPQA
accuracy · GPQA Diamond, high reasoning effort
83.3%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)
Humanity's Last Exam (HLE)
accuracy · Humanity's Last Exam, no tools
20.32%
📅 16 kwi 2025📄 OpenAI announcement (Introducing OpenAI o3 and o4-mini)

Cennik

Architektura techniczna

Rdzeń architektury (Core Architecture)
Techniki trenowania (Training Techniques)

Wdrożenie i bezpieczeństwo