GPT-5.4 Pro

5.4 Pro · Rodzina: GPT

Wersja GPT-5.4 o najwyższej jakości odpowiedzi, używająca większej ilości obliczeń do rozwiązywania bardzo trudnych problemów; dostępna w ChatGPT i API.

✓ Aktywny★ WyróżnionyLLMModel multimodalnyModel rozumowaniaModel wzrokowyModel używający narzędzi📁 GPT

Okno kontekstowe

1.05M tokens

tokenów

Parametry

Nieujawnione

parametrów

Data premiery

5 marca 2026

🏢OpenAIProducent

Przegląd

GPT-5.4 Pro to wariant GPT-5.4 zaprojektowany do najtrudniejszych zadań, który używa większej ilości obliczeń, aby dostarczać bardziej precyzyjne i konsekwentnie lepsze odpowiedzi. Model obsługuje wejście tekstowe i obrazowe oraz generuje wyjście tekstowe. W API jest dostępny przede wszystkim przez Responses API i wspiera reasoning.effort: medium, high oraz xhigh. W ChatGPT wariant Pro jest dostępny dla planów Pro, Business, Enterprise i Edu.

Klasyfikacja

LLMModel multimodalnyModel rozumowaniaModel wzrokowyModel używający narzędzi

Rodzina: GPT

Zastosowania

Kodowanie Analiza dokumentów Q&A / Odpowiadanie na pytania Asystent badawczy Asystent wyszukiwania Analiza arkuszy kalkulacyjnych Generowanie prezentacji Streszczanie

Kluczowe parametry

📏 Kontekst: 1.05M tokens

🧩 Parametry: Nieujawnione

✓ Narzędzia

📥 Wejście: tekst, obraz

Specyfikacja techniczna

Okno kontekstowe

1.05M tokens

tokenów

Parametry

Nieujawnione

parametrów

Licencja

Proprietary (OpenAI)

Wymagania sprzętowe

Brak lokalnych wymagań sprzętowych dla użytkownika końcowego. Model jest udostępniany jako usługa przez API OpenAI oraz w ChatGPT. W praktyce wymagane są jedynie środowisko klienckie i dostęp do usług OpenAI. Lokalny self-hosting nie jest wspierany.

Funkcje:✓ Używanie narzędzi

Modalności

⬇ Wejście (Input)

textimage

⬆ Wyjście (Output)

text

Możliwości i zastosowania

Natywne możliwości modelu

Rozumowanie

Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.

Kategoria: reasoning

Rozumowanie wieloetapowe

Prowadzenie wieloetapowego toku rozumowania w długich, złożonych zadaniach.

Kategoria: reasoning

Długi kontekst

Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.

Kategoria: language

Programowanie

Generowanie, analiza i modyfikacja kodu źródłowego.

Kategoria: coding

Wywoływanie funkcji

Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.

Kategoria: planning

Wyjście strukturyzowane

Generowanie danych w ustrukturyzowanych formatach, np. JSON.

Kategoria: structured_generation

Rozumienie audio

Zdolność modelu do interpretowania dźwięku, mowy, tonów i sygnałów audio.

Kategoria: audio

Rozumienie obrazu

Analiza i interpretacja treści obrazów.

Kategoria: vision

Rozumienie wideo

Zdolność analizy wideo poprzez przetwarzanie sekwencji klatek.

Kategoria: video

Rozumienie wykresów

Odczyt i interpretacja wykresów, tabel i diagramów.

Kategoria: vision

Rozumowanie po diagramach

Zdolność modelu do analizowania diagramów, schematów i relacji przedstawionych wizualnie.

Kategoria: reasoning

OCR

Rozpoznawanie tekstu na obrazach i w dokumentach.

Kategoria: vision

Wielojęzyczność

Rozumienie i generowanie tekstu w wielu językach.

Kategoria: language

Planowanie

Tworzenie i realizacja planów działania dla złożonych zadań.

Kategoria: planning

Wyjście strumieniowe

Wiadomości strumieniowe umożliwiają pobieranie treści w czasie rzeczywistym, gdy model generuje odpowiedzi, bez czekania na wygenerowanie całej odpowiedzi. Takie podejście może znacząco poprawić doświadczenie użytkownika, zwłaszcza podczas tworzenia długich treści tekstowych, ponieważ użytkownicy mogą od razu zobaczyć, że odpowiedź zaczyna się pojawiać.

Kategoria: reasoning

Przeplatane wejście multimodalne

Zdolność do dowolnego łączenia tekstu i obrazu w dowolnej kolejności w ramach jednego polecenia.

Kategoria: reasoning

Rozumienie multimodalne

Zdolność modelu do łączenia i interpretowania informacji z więcej niż jednej modalności, np. tekstu i obrazu.

Kategoria: multimodal

Dziedziny zastosowań

Kodowanie Analiza dokumentów Q&A / Odpowiadanie na pytania Asystent badawczy Asystent wyszukiwania Analiza arkuszy kalkulacyjnych Generowanie prezentacji Streszczanie Asystent pisania

Wyniki benchmarków

1 benchmark

BrowseComp

accuracy · agentic web browsing

89.3%

📅 5 mar 2026📄 OpenAI – Introducing GPT-5.4

GPT-5.4 Pro ustanawia nowy SOTA na BrowseComp według OpenAI.

Cennik

Architektura techniczna

Forma modelu (Model Form)

MLMultimodal LLM RMReasoning model

Wdrożenie i bezpieczeństwo

🔒 Security / Enterprise

✓ Zweryfikowane informacje enterprise

Publiczne informacje security dla GPT-5.4 Pro wynikają z polityk i architektury bezpieczeństwa OpenAI dla platformy API oraz produktów ChatGPT Enterprise/Business/Edu. Dostawca opisuje security głównie na poziomie usługi, a nie jako osobny dokument model-specific dla wariantu Pro.

Dla GPT-5.4 Pro security należy modelować jako platform security inherited from OpenAI environment. To najbezpieczniejsze i najbardziej merytoryczne ujęcie.

Aktualizacja: 15 mar 2026↗ Dokumentacja security

Źródła i powiązane strony

5 źródeł

DocsGPT-5.4 pro Model | OpenAI APIdevelopers.openai.com DocsPricing | OpenAI APIdevelopers.openai.com BlogIntroducing GPT-5.4openai.com DocsUsing GPT-5.4 | OpenAI APIdevelopers.openai.com DocsGPT-5.3 and GPT-5.4 in ChatGPThelp.openai.com

Przeglądaj powiązane tematy

📁 GPT 🌐 Kodowanie 🌐 Analiza dokumentów 🌐 Q&A / Odpowiadanie na pytania 🌐 Asystent badawczy 🧠 Multimodal LLM 🧠 Reasoning model Wszystkie modele llm Wszystkie modele multimodal model