Enkoder RNN czyta tokeny wejściowe jeden po drugim i aktualizuje stan ukryty. Końcowy stan enkodera jest traktowany jako wektor kontekstu reprezentujący całą sekwencję. Dekoder RNN startuje z tego wektora i autoregresyjnie generuje kolejne tokeny wyjściowe, maksymalizując prawdopodobieństwo sekwencji docelowej warunkowanej wejściem.
Pozwala modelować zadania, w których wejście i wyjście są sekwencjami o zmiennej długości, bez ręcznego projektowania wyrównań między elementami sekwencji.
Rekurencyjna sieć czytająca sekwencję wejściową i produkująca reprezentację kontekstową.
Oficjalna
Końcowy stan enkodera używany jako reprezentacja całej sekwencji wejściowej.
Rekurencyjna sieć generująca sekwencję wyjściową autoregresyjnie.
Oficjalna
Złożoność czasowa: O(T_x · d² + T_y · d²).
RNN przetwarza tokeny sekwencyjnie po osi czasu.