Wersja GPT-5.4 o najwyższej jakości odpowiedzi, używająca większej ilości obliczeń do rozwiązywania bardzo trudnych problemów; dostępna w ChatGPT i API.
✓ Aktywny★ WyróżnionyLLMModel multimodalnyModel rozumowaniaModel wzrokowyModel używający narzędzi📁 GPT
Okno kontekstowe
1.05M tokens
tokenów
Parametry
Nieujawnione
parametrów
Data premiery
5 marca 2026
Przegląd
Klasyfikacja
LLMModel multimodalnyModel rozumowaniaModel wzrokowyModel używający narzędzi
Rodzina: GPT
Zastosowania
Kluczowe parametry
📏 Kontekst: 1.05M tokens
🧩 Parametry: Nieujawnione
✓ Narzędzia
📥 Wejście: tekst, obraz
Specyfikacja techniczna
Okno kontekstowe
1.05M tokens
tokenów
Parametry
Nieujawnione
parametrów
Licencja
Proprietary (OpenAI)
Wymagania sprzętowe
Brak lokalnych wymagań sprzętowych dla użytkownika końcowego. Model jest udostępniany jako usługa przez API OpenAI oraz w ChatGPT. W praktyce wymagane są jedynie środowisko klienckie i dostęp do usług OpenAI. Lokalny self-hosting nie jest wspierany.
Funkcje:✓ Używanie narzędzi
Modalności
⬇ Wejście (Input)
textimage
⬆ Wyjście (Output)
text
Możliwości i zastosowania
Natywne możliwości modelu
Rozumowanie
Zdolność modelu do logicznego wnioskowania, analizowania zależności i wyprowadzania odpowiedzi na podstawie przesłanek.
Kategoria: reasoning
Rozumowanie wieloetapowe
Zdolność modelu do rozwiązywania problemów wymagających kilku kolejnych kroków rozumowania.
Kategoria: reasoning
Długi kontekst
Zdolność modelu do pracy na długim kontekście i utrzymywania spójności przy dużej ilości danych wejściowych.
Kategoria: reasoning
Kodowanie
Zdolność modelu do generowania, analizowania, poprawiania i wyjaśniania kodu.
Kategoria: coding
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Wyjście ustrukturyzowane
Zdolność modelu do generowania odpowiedzi w uporządkowanej formie, np. JSON, list, tabel lub schematów.
Kategoria: structured_generation
Rozumienie audio
Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.
Kategoria: audio
Rozumienie obrazów
Zdolność modelu do analizowania i interpretowania zawartości obrazów.
Kategoria: vision
Rozumienie wideo
Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.
Kategoria: video
Rozumienie wykresów
Zdolność modelu do rozumienia wykresów, trendów, osi, legend i danych wizualnych.
Kategoria: vision
Rozumowanie po diagramach
Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.
Kategoria: reasoning
OCR
Zdolność modelu do odczytywania i interpretowania tekstu znajdującego się na obrazach lub skanach.
Kategoria: vision
Wielojęzyczność
Zdolność modelu do rozumienia i generowania treści w wielu językach.
Kategoria: language
Planowanie
Zdolność modelu do układania planów, sekwencji działań i uporządkowanych kroków rozwiązania.
Kategoria: planning
Wyjście strumieniowe
Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.
Kategoria: reasoning
Przeplatane wejście multimodalne
Zdolność do dowolnego łączenia tekstu i obrazu w dowolnej kolejności w ramach jednego polecenia.
Kategoria: reasoning
Rozumienie multimodalne
Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.
Kategoria: multimodal
Wyniki benchmarków
1 benchmark
BrowseComp
accuracy · agentic web browsing
89.3%
📅 5 mar 2026📄 OpenAI – Introducing GPT-5.4
GPT-5.4 Pro ustanawia nowy SOTA na BrowseComp według OpenAI.
Cennik
Architektura techniczna
Forma modelu (Model Form)
Wdrożenie i bezpieczeństwo
🔒 Security / Enterprise
✓ Zweryfikowane informacje enterprise
Publiczne informacje security dla GPT-5.4 Pro wynikają z polityk i architektury bezpieczeństwa OpenAI dla platformy API oraz produktów ChatGPT Enterprise/Business/Edu. Dostawca opisuje security głównie na poziomie usługi, a nie jako osobny dokument model-specific dla wariantu Pro.
Dla GPT-5.4 Pro security należy modelować jako platform security inherited from OpenAI environment. To najbezpieczniejsze i najbardziej merytoryczne ujęcie.
Aktualizacja: 15 mar 2026↗ Dokumentacja security
