Robocikowo>ROBOCIKOWO

Transformer od zera · PyTorch dla architektur sekwencyjnych

Broadcasting, reshape, transpose i view

PyTorch dla architektur sekwencyjnych

Wprowadzenie

W tej lekcji nauczysz się przekształcać tensory bez gubienia znaczenia osi. To podstawa implementacji multi-head attention, masek i projekcji Q/K/V.