GPT-5.5 to najnowszy model OpenAI, skoncentrowany na autonomicznym wykonywaniu wieloetapowych zadań z zakresu kodowania, pracy z komputerem i badań naukowych.
Okno kontekstowe
1M
tokenów
Max output
128 000
tokenów
Data premiery
23 kwietnia 2026
Dostęp:APIHostedWdrożenie:☁ Cloud
Przegląd
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 1M
✓ Narzędzia
📥 Wejście: tekst, obraz
Specyfikacja techniczna
Okno kontekstowe
1M
tokenów
Max output tokens
128 000
tokenów na odpowiedź
Knowledge cutoff
1 gru 2025
Data graniczna wiedzy
Funkcje:✓ Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
textcodestructured_data
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumienie audio
Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.
Kategoria: audio
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie wykresów
Zdolność modelu do rozumienia wykresów, trendów, osi, legend i danych wizualnych.
Kategoria: vision
Rozumowanie po diagramach
Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.
Kategoria: reasoning
OCR
Zdolność modelu do odczytywania i interpretowania tekstu znajdującego się na obrazach lub skanach.
Kategoria: vision
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do wyznaczania sekwencji działań prowadzących do celu — przewidywania skutków akcji i wyboru optymalnej ścieżki w danym środowisku.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Przeplatane wejście multimodalne
Zdolność do dowolnego łączenia tekstu i obrazu w dowolnej kolejności w ramach jednego polecenia.
Kategoria: reasoning
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Wyniki benchmarków
20 benchmarków
SWE-Bench Pro (Public)
accuracy · Ewaluacja przeprowadzona z reasoning effort xhigh w środowisku badawczym.
58.6%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Wynik może być nieznacznie inny niż w produkcyjnym ChatGPT.
Terminal-Bench 2.0
accuracy · Testy złożonych przepływów pracy z wiersza poleceń wymagających planowania, iteracji i koordynacji narzędzi.
82.7%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
Expert-SWE (Internal)
accuracy · Wewnętrzna ewaluacja długoterminowego kodowania (szacowany czas przez człowieka: 20 godzin).
73.1%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Benchmark wewnętrzny OpenAI; brak publicznej metodologii.
OSWorld
accuracy · Mierzy zdolność modelu do samodzielnej obsługi rzeczywistych systemów operacyjnych.
78.7%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
GDPval
wins or ties vs industry professional · Testuje zdolności modelu do produkcji wyspecjalizowanej wiedzy branżowej w 44 zawodach.
84.9%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
BrowseComp
accuracy · Ewaluacja zdolności do korzystania z narzędzi przeglądarkowych.
84.4%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
GPQA
accuracy · Ewaluacja z reasoning effort xhigh w środowisku badawczym.
93.6%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
Humanity's Last Exam (HLE)
accuracy · Ewaluacja z reasoning effort xhigh w środowisku badawczym, bez narzędzi.
41.4%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Wariant bez narzędzi.
Humanity's Last Exam (HLE)
accuracy · Ewaluacja z reasoning effort xhigh w środowisku badawczym, z narzędziami.
52.2%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Wariant z narzędziami.
EpochAI Frontier Math
accuracy · Ewaluacja z reasoning effort xhigh w środowisku badawczym.
51.7%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
EpochAI Frontier Math
accuracy · Najtrudniejszy poziom FrontierMath; ewaluacja z reasoning effort xhigh.
35.4%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
Toolathlon
accuracy · Ewaluacja użycia narzędzi; reasoning effort xhigh.
55.6%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
CyberGym
accuracy · Benchmark cyberbezpieczeństwa; reasoning effort xhigh.
81.8%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
TAU-bench
accuracy · Testuje złożone przepływy obsługi klienta w telekomunikacji; wyniki bez prompt tuningu i bez prompt adjustments.
98.0%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Tau2-bench Telecom uruchomiony bez prompt tuningu (GPT-4.1 jako user model).
MMMU
accuracy · Multimodalna ewaluacja bez narzędzi; reasoning effort xhigh.
81.2%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
MMMU
accuracy · Multimodalna ewaluacja z narzędziami; reasoning effort xhigh.
83.2%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
BixBench
accuracy · Benchmark bioinformatyczny i analiza danych; reasoning effort xhigh.
80.5%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
GeneBench
accuracy · Wieloetapowa analiza danych naukowych z genetyki i biologii ilościowej; reasoning effort xhigh.
25.0%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
ARC-AGI-1 (Verified)
accuracy · Abstrakcyjne rozumowanie; reasoning effort xhigh.
95.0%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
ARC-AGI-2 (Verified)
accuracy · Abstrakcyjne rozumowanie (trudniejszy poziom); reasoning effort xhigh.
85.0%
📅 23 kwi 2026📄 OpenAI (openai.com/index/introducing-gpt-5-5/)
Ewaluacja z reasoning effort xhigh w środowisku badawczym.
Cennik
Wdrożenie i bezpieczeństwo
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise
OpenAI ocenia zdolności cybernetyczne i biologiczne GPT-5.5 jako High w ramach Preparedness Framework. Model przeszedł pełny proces bezpieczeństwa i zarządzania, w tym targetowane ewaluacje dla zaawansowanych zdolności cybernetycznych i biologicznych oraz testy z zewnętrznymi ekspertami.
Aktualizacja: 25 kwi 2026↗ Dokumentacja security
