ChatGPT Images 2.0
Model generowania i edycji obrazów OpenAI z wbudowaną warstwą wnioskowania O-series, obsługą rozdzielczości do 2K, renderacją tekstu niełacińskiego i generowaniem do 8 obrazów z jednego polecenia.
Specyfikacja techniczna
Modalności
Zastosowania
Rozliczenie tokenowe. Tokeny obrazów wejściowych: $8/1M, cached: $2/1M, wyjściowych: $30/1M. Tokeny tekstowe: wejście $5/1M, wyjście $10/1M. Batch API (asynchroniczny, do 24h): 50% rabatu na input i output. Szacunkowe koszty na obraz (1024×1024): low ~$0,006, medium ~$0,053, high ~$0,211. Przy rozmiarze 1024×1536 (portrait) taniej: low ~$0,005, medium ~$0,041, high ~$0,165.
WEJŚCIE
$5.0000 / 1M tokens
WYJŚCIE
$10.0000 / 1M tokens
CACHE
$1.2500 / 1M tokens
RAZEM
dla 10K tokenów
Tokeny obrazów (image input/output). Edycja z obrazem referencyjnym jest rozliczana po stawce image input tokens przy maksymalnej wierności (high-fidelity), niezależnie od ustawienia parametru quality. Źródło: openai.com/api/pricing/
Tokeny tekstowe promptów. Cached text input: $1.25/1M. Źródło: openai.com/api/pricing/
Batch API — 50% rabatu na image tokens (input i output). Przetwarzanie asynchroniczne do 24h. Identyczna jakość modelu. Źródło: OpenAI API changelog i dokumentacja Batch API.
Bezpieczeństwo i Enterprise
Model dostępny wyłącznie przez infrastrukturę chmurową OpenAI (closed weights). Thinking mode i zaawansowane funkcje ograniczone do planów płatnych (Plus, Pro, Business, Enterprise). Dostęp przez API wymaga weryfikacji konta deweloperskiego OpenAI; organizacyjna weryfikacja może być wymagana do pełnego dostępu do modeli GPT Image w API.
Informacja techniczna
Model generuje obrazy z wbudowanym content policy enforcement — zapytania naruszające zasady zwracają błąd 400 (BadRequestError) z informacją content_policy. Treści generowane przez model są oznaczane metadanymi AI (metadata tagging for AI-generated content). Transparent background (PNG z kanałem alfa) nie jest obsługiwany w trybie Responses API tool option — do tego celu należy używać gpt-image-1.5. Dostęp Free tier: tylko standard/instant mode, ograniczona liczba generacji (ok. 2 obrazy/dzień według doniesień testerów). Funkcje streaming, function calling i structured outputs nie są obsługiwane przez gpt-image-2 API (potwierdzone na stronie modelu).
