Transformer od zera · PyTorch dla architektur sekwencyjnych
Broadcasting, reshape, transpose i view
PyTorch dla architektur sekwencyjnych
Wprowadzenie
W tej lekcji nauczysz się przekształcać tensory bez gubienia znaczenia osi. To podstawa implementacji multi-head attention, masek i projekcji Q/K/V.