GPT-5.3-Codex-Spark

5.3-Codex-Spark · Rodzina: GPT

Mniejszy, ultra-szybki wariant GPT-5.3-Codex zaprojektowany do interaktywnej pracy z kodem w czasie rzeczywistym. Działa na Cerebras WSE-3, generując ponad 1000 tokenów/s.

⏳ Preview⏳ Ograniczony dostępLLMModel używający narzędzi📁 GPT

Okno kontekstowe

128K

tokenów

Data premiery

12 lutego 2026

🏢OpenAIProducent 🤝CerebrasPartner technologiczny

Dostęp:APIHostedWdrożenie:☁ Cloud

Przegląd

GPT-5.3-Codex-Spark to badawczy preview ultraszybkiego modelu kodującego OpenAI, ogłoszony 12 lutego 2026 r. Jest to mniejsza wersja flagowego GPT-5.3-Codex i pierwszy model OpenAI zaprojektowany konkretnie pod kątem pracy w czasie rzeczywistym z agentem kodującym Codex. Model jest serwowany na akceleratorze Cerebras Wafer-Scale Engine 3, co pozwala mu generować ponad 1000 tokenów na sekundę — fundamentalna zmiana w odczuwaniu interakcji z modelem AI.

Charakterystyka techniczna

Codex-Spark ma okno kontekstowe 128k tokenów i obsługuje wyłącznie tekst (text-only). Jest zoptymalizowany pod kątem dokonywania precyzyjnych, minimalnych edycji w kodzie — nie uruchamia automatycznie testów, chyba że poprosisz. Model jest sterowalny w czasie rzeczywistym — można mu przerywać, przekierowywać, zadawać pytania i widzieć rezultaty niemal natychmiast.

Benchmarki

Według OpenAI Codex-Spark uzyskuje wyniki silniejsze niż GPT-5.1-Codex-mini na benchmarkach SWE-Bench Pro i Terminal-Bench 2.0, kończąc te same zadania w ułamku czasu potrzebnego GPT-5.3-Codex. Codex-Spark to pierwszy element rodziny ultraszybkich modeli OpenAI.

Dostępność

Codex-Spark jest dostępny jako research preview dla użytkowników ChatGPT Pro w aplikacji Codex, CLI oraz rozszerzeniu VS Code. Dostęp do API jest rozprowadzany do wąskiej grupy design partnerów. Model jest serwowany na osobnej ścieżce ultra-niskolatencyjnej (Cerebras), z osobnym rate-limitem, który nie wlicza się do standardowych limitów Codex.

Współpraca z Cerebras

Codex-Spark jest pierwszym wynikiem współpracy OpenAI z Cerebras Systems, ogłoszonej w styczniu 2026 r. Sean Lie, CTO i współzałożyciel Cerebras, opisał współpracę jako próbę zrozumienia, jakie nowe wzorce interakcji, przypadki użycia i fundamentalnie inne doświadczenia są możliwe dzięki ultraszybkiej inferencji. GPU pozostaje fundamentem treningu i większości inferencji OpenAI — Cerebras uzupełnia tę architekturę o tor niskolatencyjny dla workflow wymagających natychmiastowej responsywności.

Optymalizacje latency

Razem z wydaniem Codex-Spark OpenAI wdrożyło end-to-end usprawnienia opóźnień w całym stosie obsługującym Codex — trwałe połączenie WebSocket, optymalizacje wewnątrz Responses API i przepisany sposób strumieniowania odpowiedzi. Łączny efekt: −80% narzutu na roundtrip klient/serwer, −30% narzutu per-token, −50% time-to-first-token. Te poprawki będą stopniowo udostępniane wszystkim modelom Codex.

Klasyfikacja

LLMModel używający narzędzi

Rodzina: GPT

Zastosowania

Kodowanie Automatyzacja procesów

Dostęp i wdrożenie

APIHostowane

Chmura

Wagi: Zamknięte

Kluczowe parametry

📏 Kontekst: 128K

✓ Narzędzia

📥 Wejście: tekst

Specyfikacja techniczna

Okno kontekstowe

128K

tokenów

Licencja

Proprietary (OpenAI Terms of Use)

Wymagania sprzętowe

Wymaga sprzętu inferencyjnego o ultra-niskim opóźnieniu: model jest serwowany przez OpenAI na Cerebras Wafer-Scale Engine 3 (CS-3), nie jest dostępny do wdrożenia lokalnego.

Funkcje:✓ Używanie narzędzi

Modalności

⬇ Wejście (Input)

text

⬆ Wyjście (Output)

textcode

Możliwości i zastosowania

Natywne możliwości modelu

Programowanie

Generowanie, analiza i modyfikacja kodu źródłowego.

Kategoria: coding

Wnioskowanie w czasie rzeczywistym

Zdolność modelu do generowania odpowiedzi z bardzo niskim opóźnieniem (>1000 tokenów/s) na specjalistycznym sprzęcie inferencyjnym (np. Cerebras WSE), umożliwiająca interaktywną, wymianową współpracę z człowiekiem.

Kategoria: coding

Rozumowanie

Zdolność modelu do logicznego wnioskowania i rozwiązywania złożonych problemów.

Kategoria: reasoning

Zdolności agentowe

Zdolność modelu do autonomicznego planowania i wykonywania wieloetapowych zadań poprzez sekwencyjne użycie narzędzi, utrzymywanie kontekstu i adaptację do wyników pośrednich.

Kategoria: planning

Wywoływanie funkcji

Natywne wsparcie dla ustrukturyzowanego wykorzystania narzędzi, umożliwiające przepływy pracy oparte na agentach.

Kategoria: planning

Obsługa komputera

Zdolność modelu do obsługi interfejsu komputera poprzez interpretację zrzutów ekranu oraz generowanie akcji takich jak kliknięcia, wpisywanie tekstu i nawigacja po aplikacjach.

Kategoria: planning

Długi kontekst

Utrzymanie spójności i uwagi w bardzo długim kontekście wejściowym.

Kategoria: language

Planowanie

Tworzenie i realizacja planów działania dla złożonych zadań.

Kategoria: planning

Dziedziny zastosowań

Kodowanie Automatyzacja procesów

Wyniki benchmarków

2 benchmarki

SWE-Bench Pro

pass@1 · Agentowa inżynieria oprogramowania, wielojęzyczna (Python/Java/JS/Go), środowisko Codex.

stronger than GPT-5.1-Codex-mini%

📅 12 lut 2026📄 OpenAI announcement (Feb 12, 2026) — Introducing GPT-5.3-Codex-Spark

OpenAI nie ujawniło dokładnej liczby pass@1 dla Codex-Spark — komunikat porównuje wynik wyłącznie z GPT-5.1-Codex-mini i podkreśla, że Codex-Spark wykonuje zadania w ułamku czasu GPT-5.3-Codex.

Terminal-Bench 2.0

task completion rate · Agentowa praca w terminalu (komendy shell, debug, testy).

stronger than GPT-5.1-Codex-mini%

📅 12 lut 2026📄 OpenAI announcement (Feb 12, 2026) — Introducing GPT-5.3-Codex-Spark

Codex-Spark uzyskuje wyższy wynik niż GPT-5.1-Codex-mini przy znacznie mniejszym budżecie czasowym niż GPT-5.3-Codex.

Architektura techniczna

Rdzeń architektury (Core Architecture)

TRTransformer

Forma modelu (Model Form)

LLLLM TLTool-augmented LLM

Techniki trenowania (Training Techniques)

ITInstruction Tuning RRReasoning RL

Źródła i powiązane strony

4 źródła

BlogIntroducing GPT-5.3-Codex-Spark — OpenAIopenai.com BlogIntroducing OpenAI GPT-5.3-Codex-Spark Powered by Cerebrascerebras.ai BlogIntroducing GPT-5.3-Codex — OpenAIopenai.com DocsCerebras Wafer-Scale Engine 3cerebras.ai

Przeglądaj powiązane tematy

📁 GPT 🌐 Kodowanie 🌐 Automatyzacja procesów 🧠 Transformer 🧠 LLM 🧠 Tool-augmented LLM Wszystkie modele llm Wszystkie modele tool using model