Sora 2

2 · Rodzina: Sora

Flagowy model wideo-audio OpenAI: lepsza fizyka i kontrolowalność niż Sora 1, synchroniczna generacja dialogów i efektów dźwiękowych, funkcja "characters".

✕ Wycofany⏳ Ograniczony dostępModel generowania wideo📁 Sora

Data premiery

30 września 2025

🏢OpenAIProducent

Dostęp:HostedAPIWdrożenie:☁ Cloud

Przegląd

Sora 2 to flagowy model generatywny wideo i audio opracowany przez OpenAI, ogłoszony 30 września 2025 roku. Według OpenAI Sora 1 (luty 2024) była "GPT-1 momentem" dla wideo — Sora 2 jest opisywana jako "GPT-3.5 moment", z znacząco lepszą fizyką, realistycznym modelowaniem niepowodzeń (np. piłka odbijająca się od tablicy zamiast teleportować do kosza) oraz lepszą sterowalnością wieloujęciowych instrukcji.

Architektura i dźwięk

Sora 2 jest następcą Sora 1 — diffusion transformer (DiT) trenowany w przestrzeni latentnej. W odróżnieniu od poprzednika model jest ogólnym systemem generacji wideo i audio: tworzy wyrafinowane tła dźwiękowe, dialogi i efekty dźwiękowe zsynchronizowane z obrazem.

Funkcja Characters

Sora 2 wprowadza funkcję "characters" — po krótkim, jednorazowym nagraniu wideo i audio weryfikującym tożsamość, model potrafi wstawić daną osobę (lub zwierzę / obiekt) do dowolnej generowanej sceny z wysoką wiernością wyglądu i głosu. Użytkownik zachowuje pełną kontrolę nad swoim wizerunkiem: decyduje kto może go używać, może w każdej chwili cofnąć dostęp i widzi wszystkie filmy zawierające jego "character", włącznie z draftami innych użytkowników.

Aplikacja Sora

Razem z modelem OpenAI udostępniło społecznościową aplikację iOS o nazwie "Sora", napędzaną przez Sora 2. W aplikacji można tworzyć i remiksować generacje, odkrywać filmy w spersonalizowanym feedzie i wstawiać siebie lub znajomych przez funkcję characters. Inicjalny rollout: USA i Kanada, model zaproszeniowy. Po zaproszeniu dostęp był też możliwy przez sora.com. Subskrybenci ChatGPT Pro otrzymali dostęp do eksperymentalnego wariantu Sora 2 Pro o wyższej jakości.

Status

Zgodnie z informacją OpenAI, produkt Sora (aplikacja społecznościowa) został zamknięty 26 kwietnia 2026 roku. OpenAI zapowiadało wcześniej także udostępnienie Sora 2 w API. Sora 1 Turbo pozostawała dostępna obok Sora 2.

Klasyfikacja

Model generowania wideo

Rodzina: Sora

Dostęp i wdrożenie

HostowaneAPI

Chmura

Wagi: Zamknięte

Kluczowe parametry

📥 Wejście: tekst, obraz, wideo

Specyfikacja techniczna

Modalności

⬇ Wejście (Input)

textimagevideo

⬆ Wyjście (Output)

videoaudio

Możliwości i zastosowania

Natywne możliwości modelu

Generowanie wideo

Zdolność modelu do generowania klipów wideo z opisu tekstowego, obrazu lub innego wideo, z kontrolą długości, rozdzielczości i charakterystyk wizualnych.

Kategoria: video

Animacja obrazu (image-to-video)

Zdolność modelu do animowania statycznego obrazu wejściowego — przedłużania go w czasie do spójnego klipu wideo zgodnie z opisem ruchu lub akcji.

Kategoria: video

Rozumienie wideo

Zdolność modelu do analizy i interpretacji treści wideo — rozpoznawania akcji, ruchu, zdarzeń oraz relacji między obiektami w czasie.

Kategoria: video

Architektura techniczna

Rdzeń architektury (Core Architecture)

DMDiffusion Model LDLDM TRTransformer

Forma modelu (Model Form)

WMWorld Models

Źródła i powiązane strony

4 źródła

BlogSora 2 is here (OpenAI, Sep 30, 2025)openai.com DocsSora 2 System Card (OpenAI)openai.com BlogLaunching Sora responsibly (OpenAI, Sep 30, 2025)openai.com WebSora — OpenAIopenai.com

Przeglądaj powiązane tematy

📁 Sora 🧠 Diffusion Model 🧠 LDM 🧠 Transformer Wszystkie modele video generation model