Robocikowo>ROBOCIKOWO
Sora 2

Sora 2

2 · Rodzina: Sora
Flagowy model wideo-audio OpenAI: lepsza fizyka i kontrolowalność niż Sora 1, synchroniczna generacja dialogów i efektów dźwiękowych, funkcja "characters".
✕ Wycofany⏳ Ograniczony dostępModel generowania wideo📁 Sora
Data premiery
30 września 2025
Dostęp:HostedAPIWdrożenie:☁ Cloud

Przegląd

Sora 2 to flagowy model generatywny wideo i audio opracowany przez OpenAI, ogłoszony 30 września 2025 roku. Według OpenAI Sora 1 (luty 2024) była "GPT-1 momentem" dla wideo — Sora 2 jest opisywana jako "GPT-3.5 moment", z znacząco lepszą fizyką, realistycznym modelowaniem niepowodzeń (np. piłka odbijająca się od tablicy zamiast teleportować do kosza) oraz lepszą sterowalnością wieloujęciowych instrukcji.

Architektura i dźwięk

Sora 2 jest następcą Sora 1 — diffusion transformer (DiT) trenowany w przestrzeni latentnej. W odróżnieniu od poprzednika model jest ogólnym systemem generacji wideo i audio: tworzy wyrafinowane tła dźwiękowe, dialogi i efekty dźwiękowe zsynchronizowane z obrazem.

Funkcja Characters

Sora 2 wprowadza funkcję "characters" — po krótkim, jednorazowym nagraniu wideo i audio weryfikującym tożsamość, model potrafi wstawić daną osobę (lub zwierzę / obiekt) do dowolnej generowanej sceny z wysoką wiernością wyglądu i głosu. Użytkownik zachowuje pełną kontrolę nad swoim wizerunkiem: decyduje kto może go używać, może w każdej chwili cofnąć dostęp i widzi wszystkie filmy zawierające jego "character", włącznie z draftami innych użytkowników.

Aplikacja Sora

Razem z modelem OpenAI udostępniło społecznościową aplikację iOS o nazwie "Sora", napędzaną przez Sora 2. W aplikacji można tworzyć i remiksować generacje, odkrywać filmy w spersonalizowanym feedzie i wstawiać siebie lub znajomych przez funkcję characters. Inicjalny rollout: USA i Kanada, model zaproszeniowy. Po zaproszeniu dostęp był też możliwy przez sora.com. Subskrybenci ChatGPT Pro otrzymali dostęp do eksperymentalnego wariantu Sora 2 Pro o wyższej jakości.

Status

Zgodnie z informacją OpenAI, produkt Sora (aplikacja społecznościowa) został zamknięty 26 kwietnia 2026 roku. OpenAI zapowiadało wcześniej także udostępnienie Sora 2 w API. Sora 1 Turbo pozostawała dostępna obok Sora 2.

Klasyfikacja
Model generowania wideo
Rodzina: Sora
Dostęp i wdrożenie
HostowaneAPI
Chmura
Wagi: Zamknięte
Kluczowe parametry
📥 Wejście: tekst, obraz, wideo

Specyfikacja techniczna

Modalności
⬇ Wejście (Input)
textimagevideo
⬆ Wyjście (Output)
videoaudio

Możliwości i zastosowania

Natywne możliwości modelu
Generowanie wideo
Zdolność modelu do generowania klipów wideo z opisu tekstowego, obrazu lub innego wideo, z kontrolą długości, rozdzielczości i charakterystyk wizualnych.
Kategoria: video
Animacja obrazu (image-to-video)
Zdolność modelu do animowania statycznego obrazu wejściowego — przedłużania go w czasie do spójnego klipu wideo zgodnie z opisem ruchu lub akcji.
Kategoria: video
Rozumienie wideo
Zdolność modelu do analizy i interpretacji treści wideo — rozpoznawania akcji, ruchu, zdarzeń oraz relacji między obiektami w czasie.
Kategoria: video

Architektura techniczna

Rdzeń architektury (Core Architecture)
Forma modelu (Model Form)