OpenAI i Broadcom prezentują Jalapeño — pierwszy własny chip do inferencji LLM

OpenAI i Broadcom 24 czerwca 2026 roku ogłosiły wspólnie pierwszy niestandardowy procesor przeznaczony wyłącznie do obsługi wnioskowania (inference) modeli językowych. Chip nosi nazwę Jalapeño, zaprojektowany jako ASIC (Application-Specific Integrated Circuit) i skrojony pod architekturę nowoczesnych LLM. Jego opracowanie trwało zaledwie dziewięć miesięcy — tyle, ile zwykle zajmuje przejście przez jeden etap przeglądu projektu w tradycyjnym cyklu półprzewodnikowym.

Najważniejsze w skrócie

Jalapeño to ASIC zaprojektowany wyłącznie do inferencji LLM, nie ogólny GPU
Czas projektowania: dziewięć miesięcy od konceptu do gotowości produkcyjnej
Redukcja kosztów inferencji szacowana na około 50% względem dotychczasowych rozwiązań
OpenAI użyło własnych modeli do przyspieszenia procesu projektowania chipa
Testy na modelu GPT-5.3-Codex-Spark już trwają w środowisku produkcyjnym

Dziewięć miesięcy od rysunków do fabryki

Typowy cykl projektowania chipa komercyjnego trwa od dwóch do pięciu lat. OpenAI i Broadcom skompresowali ten czas do dziewięciu miesięcy — partnerstwo ogłoszono publicznie dopiero w październiku 2025, a już w czerwcu 2026 chip trafił do testów produkcyjnych. Tę prędkość obie firmy przypisują głębokiej współpracy pomiędzy warstwą oprogramowania a sprzętem: architektura chipa była kształtowana przez bezpośrednią znajomość obciążeń, jakie OpenAI obsługuje na co dzień w ChatGPT, Codex i API.

Kluczową rolę odegrały też własne modele OpenAI. Poprzednie generacje modeli firmy uczestniczyły w automatyzacji części procesu projektowego, skracając iteracje między konceptem a gotowym projektem krzemowym. Rzecznik OpenAI nie ujawnił, które konkretnie modele były użyte.

Chip Jalapeño jest ASIC-iem — czyli układem scalonym projektowanym pod jedno wąskie zastosowanie. W przeciwieństwie do GPU Nvidii, który obsługuje dziesiątki rodzajów obciążeń, Jalapeño jest zoptymalizowany wyłącznie pod serwowanie już wytrenowanych modeli językowych. To oznacza, że nie będzie użyteczny do trenowania modeli — tam OpenAI pozostanie przy sprzęcie Nvidii, AWS Trainium i innych partnerów.

Ukierunkowanie na inferencję i ekonomikę

Dla OpenAI inferencja to krwioobieg biznesu. Każda odpowiedź ChatGPT, każde żądanie do API, każde wywołanie Codexa generuje koszt obliczeniowy po stronie inferencji. W 2025 roku OpenAI wygenerowało 13,07 mld USD przychodu, ale koszty operacyjne sięgnęły 34 mld USD, z czego samo R&D — napędzane infrastrukturą — pochłonęło 19,18 mld USD. Firma płaciła Microsoftowi ponad 10,59 mld USD rocznie tylko za infrastrukturę obliczeniową.

Jeśli Jalapeño rzeczywiście obniży koszty inferencji o około 50% (według danych Bloomberg), wpływ na wynik finansowy będzie bezpośredni. Greg Brockman, współzałożyciel i prezydent OpenAI, mówił o wynikach chipa wprost: „To realna poprawa wydajności — zarówno pod kątem performance per watt, jak i performance per dollar". Na antenie CNBC Brockman i dyrektor generalny Broadcomu Hock Tan potwierdzili, że testy już trwają na modelu GPT-5.3-Codex-Spark w środowisku zbliżonym do produkcyjnego.

Broadcom odpowiada za krzemową implementację i technologię sieciową (w tym sieciowy chip Tomahawk), natomiast Celestica — za integrację na poziomie płyt, szaf i systemów. Masa inwestycji z zewnętrznych partnerów — 30 mld USD od Nvidii, 50 mld USD od Amazon — pozostaje nienaruszona. Jalapeño nie zastępuje tych relacji, lecz uzupełnia je o własną warstwę sprzętową po stronie inferencji.

Kontekst rynkowy: Google, Amazon i globalny wyścig chipów

OpenAI nie jest pionierem w projektowaniu chipów pod AI. Google od lat używa Tensor Processing Units (TPU) do obsługi własnych modeli, a Amazon rozwijał Trainium. Microsoft wyłożył Maia 100 pod koniec 2023 roku i Maia 200 w styczniu 2026 — ta ostatnia już aktywnie obsługuje modele GPT-5.2 w Azure. Meta projektuje własną serię MTIA.

Jalapeño sytuuje OpenAI bliżej modelu operacyjnego tych firm — z własnym stosem od architektury chipa przez jądra obliczeniowe (kernele), zarządzanie pamięcią, po wdrożenie. Firma w swojej publikacji opisała to jako pełną kontrolę nad „stosem poniżej modelu": architektura chipa, kernele, sieci, scheduling, deployment.

W tym wyścigu uczestniczą też firmy chińskie: Alibaba przedstawiło chip Zhenwu M890 do obsługi agentów AI z dużym oknem kontekstu, Huawei zapowiada Ascend 950DT, a ByteDance prowadzi negocjacje z Qualcommem w sprawie własnego ASIC. Geopolityczne ograniczenia eksportu chipów do Chin pośrednio napędzają to tempo.

Dlaczego to ważne?

Przez pierwsze lata istnienia OpenAI było firmą zależną — od GPT trenowanego na obliczeniach Microsoftu, od Nvidii jako dostawcy GPU, od AWS jako infrastruktury. Jalapeño to pierwszy sygnał, że firma buduje własną podkładkę pod swoją ekonomikę: kontrolę nad kosztami inferencji, która jest bezpośrednio powiązana z ceną produktu końcowego.

Dla całego rynku znaczenie jest szersze. Dotychczas tylko wielkie platformy chmurowe mogły sobie pozwolić na wieloletnie programy chipów. Fakt, że OpenAI — mimo strat — zdecydowało się wejść w ten obszar z dziewięciomiesięcznym sprintem, sugeruje, że kompresja czasów projektowania przy wsparciu modeli AI zaczyna zmieniać ekonomikę semi-custom silicon. To może otworzyć drzwi innym firmom AI do podobnych kroków szybciej, niż branża oczekiwała.

Co dalej?

OpenAI planuje wdrożyć Jalapeño w aktywnych centrach danych do końca 2026 roku zgodnie z oficjalnym ogłoszeniem z 24 czerwca
Roadmap zakłada gigawatowe centra danych z Microsoftem i innymi partnerami, gdzie Jalapeño ma być centralnym elementem warstwy inferencji
Chip jest projektowany z myślą o przyszłych modelach LLM ogólnie — Broadcom wprost zapowiada udostępnienie go zewnętrznym firmom AI jako produkt komercyjny