OpenAI i Broadcom 24 czerwca 2026 roku ogłosiły wspólnie pierwszy niestandardowy procesor przeznaczony wyłącznie do obsługi wnioskowania (inference) modeli językowych. Chip nosi nazwę Jalapeño, zaprojektowany jako ASIC (Application-Specific Integrated Circuit) i skrojony pod architekturę nowoczesnych LLM. Jego opracowanie trwało zaledwie dziewięć miesięcy — tyle, ile zwykle zajmuje przejście przez jeden etap przeglądu projektu w tradycyjnym cyklu półprzewodnikowym.
Najważniejsze w skrócie
- Jalapeño to ASIC zaprojektowany wyłącznie do inferencji LLM, nie ogólny GPU
- Czas projektowania: dziewięć miesięcy od konceptu do gotowości produkcyjnej
- Redukcja kosztów inferencji szacowana na około 50% względem dotychczasowych rozwiązań
- OpenAI użyło własnych modeli do przyspieszenia procesu projektowania chipa
- Testy na modelu GPT-5.3-Codex-Spark już trwają w środowisku produkcyjnym
Dziewięć miesięcy od rysunków do fabryki
Typowy cykl projektowania chipa komercyjnego trwa od dwóch do pięciu lat. OpenAI i Broadcom skompresowali ten czas do dziewięciu miesięcy — partnerstwo ogłoszono publicznie dopiero w październiku 2025, a już w czerwcu 2026 chip trafił do testów produkcyjnych. Tę prędkość obie firmy przypisują głębokiej współpracy pomiędzy warstwą oprogramowania a sprzętem: architektura chipa była kształtowana przez bezpośrednią znajomość obciążeń, jakie OpenAI obsługuje na co dzień w ChatGPT, Codex i API.
Kluczową rolę odegrały też własne modele OpenAI. Poprzednie generacje modeli firmy uczestniczyły w automatyzacji części procesu projektowego, skracając iteracje między konceptem a gotowym projektem krzemowym. Rzecznik OpenAI nie ujawnił, które konkretnie modele były użyte.
Chip Jalapeño jest ASIC-iem — czyli układem scalonym projektowanym pod jedno wąskie zastosowanie. W przeciwieństwie do GPU Nvidii, który obsługuje dziesiątki rodzajów obciążeń, Jalapeño jest zoptymalizowany wyłącznie pod serwowanie już wytrenowanych modeli językowych. To oznacza, że nie będzie użyteczny do trenowania modeli — tam OpenAI pozostanie przy sprzęcie Nvidii, AWS Trainium i innych partnerów.
Ukierunkowanie na inferencję i ekonomikę
Dla OpenAI inferencja to krwioobieg biznesu. Każda odpowiedź ChatGPT, każde żądanie do API, każde wywołanie Codexa generuje koszt obliczeniowy po stronie inferencji. W 2025 roku OpenAI wygenerowało 13,07 mld USD przychodu, ale koszty operacyjne sięgnęły 34 mld USD, z czego samo R&D — napędzane infrastrukturą — pochłonęło 19,18 mld USD. Firma płaciła Microsoftowi ponad 10,59 mld USD rocznie tylko za infrastrukturę obliczeniową.
Jeśli Jalapeño rzeczywiście obniży koszty inferencji o około 50% (według danych Bloomberg), wpływ na wynik finansowy będzie bezpośredni. Greg Brockman, współzałożyciel i prezydent OpenAI, mówił o wynikach chipa wprost: „To realna poprawa wydajności — zarówno pod kątem performance per watt, jak i performance per dollar". Na antenie CNBC Brockman i dyrektor generalny Broadcomu Hock Tan potwierdzili, że testy już trwają na modelu GPT-5.3-Codex-Spark w środowisku zbliżonym do produkcyjnego.
Broadcom odpowiada za krzemową implementację i technologię sieciową (w tym sieciowy chip Tomahawk), natomiast Celestica — za integrację na poziomie płyt, szaf i systemów. Masa inwestycji z zewnętrznych partnerów — 30 mld USD od Nvidii, 50 mld USD od Amazon — pozostaje nienaruszona. Jalapeño nie zastępuje tych relacji, lecz uzupełnia je o własną warstwę sprzętową po stronie inferencji.
Kontekst rynkowy: Google, Amazon i globalny wyścig chipów
OpenAI nie jest pionierem w projektowaniu chipów pod AI. Google od lat używa Tensor Processing Units (TPU) do obsługi własnych modeli, a Amazon rozwijał Trainium. Microsoft wyłożył Maia 100 pod koniec 2023 roku i Maia 200 w styczniu 2026 — ta ostatnia już aktywnie obsługuje modele GPT-5.2 w Azure. Meta projektuje własną serię MTIA.
Jalapeño sytuuje OpenAI bliżej modelu operacyjnego tych firm — z własnym stosem od architektury chipa przez jądra obliczeniowe (kernele), zarządzanie pamięcią, po wdrożenie. Firma w swojej publikacji opisała to jako pełną kontrolę nad „stosem poniżej modelu": architektura chipa, kernele, sieci, scheduling, deployment.
W tym wyścigu uczestniczą też firmy chińskie: Alibaba przedstawiło chip Zhenwu M890 do obsługi agentów AI z dużym oknem kontekstu, Huawei zapowiada Ascend 950DT, a ByteDance prowadzi negocjacje z Qualcommem w sprawie własnego ASIC. Geopolityczne ograniczenia eksportu chipów do Chin pośrednio napędzają to tempo.
Dlaczego to ważne?
Przez pierwsze lata istnienia OpenAI było firmą zależną — od GPT trenowanego na obliczeniach Microsoftu, od Nvidii jako dostawcy GPU, od AWS jako infrastruktury. Jalapeño to pierwszy sygnał, że firma buduje własną podkładkę pod swoją ekonomikę: kontrolę nad kosztami inferencji, która jest bezpośrednio powiązana z ceną produktu końcowego.
Dla całego rynku znaczenie jest szersze. Dotychczas tylko wielkie platformy chmurowe mogły sobie pozwolić na wieloletnie programy chipów. Fakt, że OpenAI — mimo strat — zdecydowało się wejść w ten obszar z dziewięciomiesięcznym sprintem, sugeruje, że kompresja czasów projektowania przy wsparciu modeli AI zaczyna zmieniać ekonomikę semi-custom silicon. To może otworzyć drzwi innym firmom AI do podobnych kroków szybciej, niż branża oczekiwała.
Co dalej?
- OpenAI planuje wdrożyć Jalapeño w aktywnych centrach danych do końca 2026 roku zgodnie z oficjalnym ogłoszeniem z 24 czerwca
- Roadmap zakłada gigawatowe centra danych z Microsoftem i innymi partnerami, gdzie Jalapeño ma być centralnym elementem warstwy inferencji
- Chip jest projektowany z myślą o przyszłych modelach LLM ogólnie — Broadcom wprost zapowiada udostępnienie go zewnętrznym firmom AI jako produkt komercyjny
Źródła
OpenAI — OpenAI and Broadcom unveil Jalapeño inference chip
Broadcom Investor Relations — OpenAI and Broadcom unveil LLM-optimized intelligence processor
TechCrunch — OpenAI unveils its first custom chip, built by Broadcom
VentureBeat — OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom





