Flagowy model wideo-audio OpenAI: lepsza fizyka i kontrolowalność niż Sora 1, synchroniczna generacja dialogów i efektów dźwiękowych, funkcja "characters".
Data premiery
30 września 2025
Dostęp:HostedAPIWdrożenie:☁ Cloud
Przegląd
Dostęp i wdrożenie
HostowaneAPI
Chmura
Wagi: Zamknięte
Kluczowe parametry
📥 Wejście: tekst, obraz, wideo
Specyfikacja techniczna
Modalności
⬇ Wejście (Input)
textimagevideo
⬆ Wyjście (Output)
videoaudio
Możliwości i zastosowania
Natywne możliwości modelu
Generowanie wideo
Zdolność modelu do generowania klipów wideo z opisu tekstowego, obrazu lub innego wideo, z kontrolą długości, rozdzielczości i charakterystyk wizualnych.
Kategoria: video
Animacja obrazu (image-to-video)
Zdolność modelu do animowania statycznego obrazu wejściowego — przedłużania go w czasie do spójnego klipu wideo zgodnie z opisem ruchu lub akcji.
Kategoria: video
Rozumienie wideo
Zdolność modelu do analizy i interpretacji treści wideo — rozpoznawania akcji, ruchu, zdarzeń oraz relacji między obiektami w czasie.
Kategoria: video
Architektura techniczna
Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)
