Architektura

Seq2Seq RNN

2014HistorycznyOpublikowano: 28 maja 2026Aktualizacja: 28 maja 2026Opublikowany

Architektura seq2seq oparta na RNN: enkoder zamienia sekwencję wejściową na wektor kontekstu, a dekoder generuje sekwencję wyjściową.

Kluczowa innowacja

Ujęcie translacji sekwencji jako dwóch wspólnie trenowanych sieci RNN: enkodera kompresującego wejście do wektora o stałej długości i dekodera generującego sekwencję wyjściową.

Kategoria

Architektura

Poziom abstrakcji

Wzorzec

Poziom operacji

ModelTreningInferencja

Zastosowania

Tłumaczenie maszynoweTransdukcja sekwencjiStreszczanie tekstuRozpoznawanie mowy

Jak działa

Enkoder RNN czyta tokeny wejściowe jeden po drugim i aktualizuje stan ukryty. Końcowy stan enkodera jest traktowany jako wektor kontekstu reprezentujący całą sekwencję. Dekoder RNN startuje z tego wektora i autoregresyjnie generuje kolejne tokeny wyjściowe, maksymalizując prawdopodobieństwo sekwencji docelowej warunkowanej wejściem.

Rozwiązany problem

Pozwala modelować zadania, w których wejście i wyjście są sekwencjami o zmiennej długości, bez ręcznego projektowania wyrównań między elementami sekwencji.