Sieci neuronowe od podstaw do nowoczesnej AI · Od neuronu do MLP: architektura i forward pass
Sieć wielowarstwowa (MLP) i forward pass krok po kroku
Od neuronu do MLP: architektura i forward pass
Wprowadzenie
Multi-Layer Perceptron (MLP) to fundament wszystkich nowoczesnych sieci feedforward. Ta lekcja prowadzi przez forward pass MLP krok po kroku: pre-aktywację z = Wx + b, aktywację a = σ(z), kompozycję warstw, batch processing (X ∈ R^{B×n} zamiast x ∈ R^n), wymiary tensorów na każdym etapie, oraz konwencje (row-major vs column-major, transpozycje, broadcasting biasu). Zrozumiesz jak liczyć rozmiary parametrów, jak inferować shape outputu, i czemu kolejność w transformerze (input → linear → activation → linear) jest taka a nie inna.