Robocikowo>ROBOCIKOWO
D

Rodziny modeli

Dreamer Rodzina

1 model · 1 rok ewolucji

O rodzinie

Dreamer to rodzina algorytmów uczenia ze wzmocnieniem (RL) opartych na modelu świata, rozwijana przez Danijara Hafnera i współpracowników z Google Brain, Google DeepMind oraz University of Toronto. Model uczy się reprezentacji środowiska z obserwacji (m.in. obrazu) za pomocą rekurencyjnego modelu stanu (RSSM) i trenuje politykę typu actor-critic na trajektoriach generowanych w wyobraźni — bez wykonywania akcji w rzeczywistym środowisku. Kolejne wersje to PlaNet (2019, model-based planning), Dreamer (2019), DreamerV2 (2020, dyskretne reprezentacje, sukces na Atari 2600) oraz DreamerV3 (2023/2025, jeden zestaw hiperparametrów dla ponad 150 zadań, pierwsze zebranie diamentów w Minecrafcie bez danych człowieka). Cała rodzina jest udostępniana jako open source na licencji MIT i stanowi jeden z kluczowych kierunków badań nad modelami świata i ogólnymi algorytmami RL.