Robocikowo>ROBOCIKOWO
GPT-5.3-Codex-Spark

GPT-5.3-Codex-Spark

5.3-Codex-Spark · Rodzina: GPT
Mniejszy, ultra-szybki wariant GPT-5.3-Codex zaprojektowany do interaktywnej pracy z kodem w czasie rzeczywistym. Działa na Cerebras WSE-3, generując ponad 1000 tokenów/s.
⏳ Preview⏳ Ograniczony dostępLLMModel używający narzędzi📁 GPT
Okno kontekstowe
128K
tokenów
Data premiery
12 lutego 2026
Dostęp:APIHostedWdrożenie:☁ Cloud

Przegląd

GPT-5.3-Codex-Spark to badawczy preview ultraszybkiego modelu kodującego OpenAI, ogłoszony 12 lutego 2026 r. Jest to mniejsza wersja flagowego GPT-5.3-Codex i pierwszy model OpenAI zaprojektowany konkretnie pod kątem pracy w czasie rzeczywistym z agentem kodującym Codex. Model jest serwowany na akceleratorze Cerebras Wafer-Scale Engine 3, co pozwala mu generować ponad 1000 tokenów na sekundę — fundamentalna zmiana w odczuwaniu interakcji z modelem AI.

Charakterystyka techniczna

Codex-Spark ma okno kontekstowe 128k tokenów i obsługuje wyłącznie tekst (text-only). Jest zoptymalizowany pod kątem dokonywania precyzyjnych, minimalnych edycji w kodzie — nie uruchamia automatycznie testów, chyba że poprosisz. Model jest sterowalny w czasie rzeczywistym — można mu przerywać, przekierowywać, zadawać pytania i widzieć rezultaty niemal natychmiast.

Benchmarki

Według OpenAI Codex-Spark uzyskuje wyniki silniejsze niż GPT-5.1-Codex-mini na benchmarkach SWE-Bench Pro i Terminal-Bench 2.0, kończąc te same zadania w ułamku czasu potrzebnego GPT-5.3-Codex. Codex-Spark to pierwszy element rodziny ultraszybkich modeli OpenAI.

Dostępność

Codex-Spark jest dostępny jako research preview dla użytkowników ChatGPT Pro w aplikacji Codex, CLI oraz rozszerzeniu VS Code. Dostęp do API jest rozprowadzany do wąskiej grupy design partnerów. Model jest serwowany na osobnej ścieżce ultra-niskolatencyjnej (Cerebras), z osobnym rate-limitem, który nie wlicza się do standardowych limitów Codex.

Współpraca z Cerebras

Codex-Spark jest pierwszym wynikiem współpracy OpenAI z Cerebras Systems, ogłoszonej w styczniu 2026 r. Sean Lie, CTO i współzałożyciel Cerebras, opisał współpracę jako próbę zrozumienia, jakie nowe wzorce interakcji, przypadki użycia i fundamentalnie inne doświadczenia są możliwe dzięki ultraszybkiej inferencji. GPU pozostaje fundamentem treningu i większości inferencji OpenAI — Cerebras uzupełnia tę architekturę o tor niskolatencyjny dla workflow wymagających natychmiastowej responsywności.

Optymalizacje latency

Razem z wydaniem Codex-Spark OpenAI wdrożyło end-to-end usprawnienia opóźnień w całym stosie obsługującym Codex — trwałe połączenie WebSocket, optymalizacje wewnątrz Responses API i przepisany sposób strumieniowania odpowiedzi. Łączny efekt: −80% narzutu na roundtrip klient/serwer, −30% narzutu per-token, −50% time-to-first-token. Te poprawki będą stopniowo udostępniane wszystkim modelom Codex.

Klasyfikacja
LLMModel używający narzędzi
Rodzina: GPT
Dostęp i wdrożenie
APIHostowane
Chmura
Wagi: Zamknięte
Kluczowe parametry
📏 Kontekst: 128K
Narzędzia
📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe
128K
tokenów
Licencja
Proprietary (OpenAI Terms of Use)
Wymagania sprzętowe
Wymaga sprzętu inferencyjnego o ultra-niskim opóźnieniu: model jest serwowany przez OpenAI na Cerebras Wafer-Scale Engine 3 (CS-3), nie jest dostępny do wdrożenia lokalnego.
Funkcje:Używanie narzędzi
Modalności
⬇ Wejście (Input)
text
⬆ Wyjście (Output)
textcode

Możliwości i zastosowania

Natywne możliwości modelu
Programowanie
Generowanie, analiza i modyfikacja kodu źródłowego.
Kategoria: coding
Wnioskowanie w czasie rzeczywistym
Zdolność modelu do generowania odpowiedzi z bardzo niskim opóźnieniem (>1000 tokenów/s) na specjalistycznym sprzęcie inferencyjnym (np. Cerebras WSE), umożliwiająca interaktywną, wymianową współpracę z człowiekiem.
Kategoria: coding
Rozumowanie
Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.
Kategoria: reasoning
Zdolności agentowe
Zdolność modelu do autonomicznego planowania i wykonywania wieloetapowych zadań poprzez sekwencyjne użycie narzędzi, utrzymywanie kontekstu i adaptację do wyników pośrednich.
Kategoria: planning
Wywoływanie funkcji
Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.
Kategoria: planning
Obsługa komputera
Zdolność modelu do obsługi interfejsu komputera poprzez interpretację zrzutów ekranu oraz generowanie akcji takich jak kliknięcia, wpisywanie tekstu i nawigacja po aplikacjach.
Kategoria: planning
Długi kontekst
Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.
Kategoria: language
Planowanie
Tworzenie i realizacja planów działania dla złożonych zadań.
Kategoria: planning

Wyniki benchmarków

2 benchmarki
SWE-Bench Pro
pass@1 · Agentowa inżynieria oprogramowania, wielojęzyczna (Python/Java/JS/Go), środowisko Codex.
stronger than GPT-5.1-Codex-mini%
📅 12 lut 2026📄 OpenAI announcement (Feb 12, 2026) — Introducing GPT-5.3-Codex-Spark
OpenAI nie ujawniło dokładnej liczby pass@1 dla Codex-Spark — komunikat porównuje wynik wyłącznie z GPT-5.1-Codex-mini i podkreśla, że Codex-Spark wykonuje zadania w ułamku czasu GPT-5.3-Codex.
Terminal-Bench 2.0
task completion rate · Agentowa praca w terminalu (komendy shell, debug, testy).
stronger than GPT-5.1-Codex-mini%
📅 12 lut 2026📄 OpenAI announcement (Feb 12, 2026) — Introducing GPT-5.3-Codex-Spark
Codex-Spark uzyskuje wyższy wynik niż GPT-5.1-Codex-mini przy znacznie mniejszym budżecie czasowym niż GPT-5.3-Codex.

Architektura techniczna

Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
Techniki trenowania (Training Techniques)