Sieci neuronowe od podstaw do nowoczesnej AI · Matematyka i narzędzia: tensor, gradient, Python, NumPy
Pochodna i chain rule — intuicja kierunku największego wzrostu
Matematyka i narzędzia: tensor, gradient, Python, NumPy
Wprowadzenie
Pochodna funkcji w punkcie odpowiada na jedno pytanie: "jeśli teraz lekko ruszę x, jak bardzo i w którą stronę zmieni się y?". To miara "stromości" wykresu w tym konkretnym punkcie — duża dodatnia pochodna oznacza ostry wzrost, duża ujemna ostry spadek, zero oznacza chwilę "płaską" (szczyt, dolinę albo punkt przegięcia). Chain rule (reguła łańcuchowa) to przepis na pochodną funkcji złożonej z innych funkcji — i to dokładnie ona pozwala policzyć gradient w sieci neuronowej, gdzie wyjście to skomplikowane złożenie warstw. W tej lekcji nie będzie epsilon-delta — tylko intuicja "ile szybko coś rośnie" i przykład jak łańcuch funkcji daje łańcuch pochodnych przez mnożenie.