Robocikowo>ROBOCIKOWO

Kursy

Sieci neuronowe od podstaw do nowoczesnej AI Cover

Deep LearningŚredniozaawansowany

Sieci neuronowe od podstaw do nowoczesnej AI

13 Rozdziałów65 Lekcji

Kurs obejmuje pełny zakres tematyczny sieci neuronowych — od matematycznych fundamentów (algebra liniowa, rachunek różniczkowy, statystyka), przez mechanizm wstecznej propagacji błędów, po nowoczesne architektury głębokiego uczenia stosowane w przemyśle i badaniach. Uczestnik poznaje sieci w pełni połączone (MLP), konwolucyjne (CNN), rekurencyjne (RNN, LSTM, GRU) oraz mechanizmy uwagi i podstawy transformerów. Materiał osadzony jest w ekosystemie PyTorch — wszystkie implementacje kodowane od podstaw, a następnie refaktorowane do idiomatycznego kodu frameworka. Kurs zakłada znajomość Pythona na poziomie skryptowania oraz podstaw NumPy; nie zakłada wcześniejszej znajomości bibliotek ML ani zaawansowanej matematyki (potrzebne pojęcia wprowadzane są na bieżąco). Kurs nie pokrywa: modeli językowych (LLM), diffusion models, uczenia przez wzmacnianie, wdrożenia produkcyjnego (MLOps) ani zaawansowanych metod regularyzacji poza poziomem praktycznym. Absolwent kursu jest gotowy do samodzielnego projektowania eksperymentów z głębokimi sieciami, interpretowania wyników trenowania oraz dołączenia do projektów bazujących na PyTorch bez wsparcia seniora.

Rozdziały

MODUŁ 01

Czym jest sieć neuronowa — mentalny model AI

0 / 4 · 0%

Rozdział wprowadzający dla początkujących: czym jest AI, ML i deep learning, jak działa sztuczna sieć neuronowa, trzy paradygmaty uczenia oraz cykl życia projektu ML. Bez kodu, bez formuł — tylko intuicja i analogie z życia codziennego.

  1. 1.1Czym jest sztuczna inteligencja, uczenie maszynowe i deep learning
  2. 1.2Czym jest sztuczna sieć neuronowa — analogia biologiczna i jej granice
  3. 1.3Trzy paradygmaty uczenia: supervised, unsupervised, reinforcement
  4. 1.4Cykl życia projektu ML: dane → trening → ewaluacja → wdrożenie
MODUŁ 02

Matematyka i narzędzia: tensor, gradient, Python, NumPy

0 / 6 · 0%

Fundament matematyczny przed PyTorchem: skalar, wektor, macierz i tensor z intuicją geometryczną, operacje na tensorach, pochodna i chain rule, gradient funkcji wielu zmiennych, gradient descent na prostej funkcji 1D oraz Python + NumPy jako most do PyTorcha. Bez epsilon-delta — tylko intuicja, kierunki i strzałki na mapie loss.

  1. 2.1Skalar, wektor, macierz, tensor — geometryczna intuicja
  2. 2.2Operacje na tensorach: dodawanie, mnożenie, mnożenie macierzy
  3. 2.3Pochodna i chain rule — intuicja kierunku największego wzrostu
  4. 2.4Gradient funkcji wielu zmiennych — strzałka na mapie loss
  5. 2.5Gradient descent na prostej funkcji — schodzenie z górki krok po kroku
  6. 2.6Python, NumPy i pierwszy tensor — most do PyTorcha
MODUŁ 03

Pierwszy trening end-to-end — od danych do prognozy

0 / 5 · 0%

Pierwszy dzialajacy klasyfikator: jak dane staja sie prognoza. Poznajesz dataset, loss, petle treningowa (forward → loss → gradient → update), ewaluacje i kodujesz klasyfikator XOR w czystym NumPy.

  1. 3.1Dane: features, labels, dataset, batch, epoka
  2. 3.2Funkcja straty — jak mierzymy, że sieć się myli
  3. 3.3Pętla treningowa: forward → loss → gradient → update
  4. 3.4Ewaluacja: train/val/test split, accuracy, kiedy zatrzymać trening
  5. 3.5Klasyfikator XOR w czystym NumPy — sieć 2-2-1 od zera
MODUŁ 04

Środowisko PyTorch i fundament tensorów

0 / 4 · 0%

Podstawy pracy w PyTorch: tensory i ich operacje, autograd i computational graph, warstwy przez nn.Module oraz pełny cykl treningu z metrykami i pracą na GPU.

  1. 4.1Tensor: kształt, dtype, operacje i broadcasting
  2. 4.2Autograd: computational graph, backward() i grad_fn
  3. 4.3nn.Module, nn.Parameter, warstwy i ich rejestracja
  4. 4.4Cykl train/val/test, metryki i praca z GPU (AMP, mixed precision)
MODUŁ 05

Od neuronu do MLP: architektura i forward pass

0 / 6 · 0%

Od pojedynczego perceptronu po wielowarstwową sieć MLP: funkcje aktywacji (sigmoid, ReLU, GELU, tanh), Universal Approximation Theorem, mechanika forward pass, funkcje straty MSE i Cross-Entropy oraz implementacja 2-warstwowej sieci od zera w czystym NumPy.

  1. 5.1Perceptron: wejście, waga, bias, aktywacja
  2. 5.2Funkcje aktywacji: sigmoid, ReLU, GELU, tanh — kiedy i dlaczego
  3. 5.3Universal Approximation Theorem — dlaczego nieliniowość jest konieczna
  4. 5.4Sieć wielowarstwowa (MLP) i forward pass krok po kroku
  5. 5.5Funkcje straty: MSE i Cross-Entropy — intuicja i wybór
  6. 5.6Implementacja 2-warstwowego MLP od zera (bez autograd, czysty NumPy)
MODUŁ 06

Backpropagation — jak sieć się uczy

0 / 5 · 0%

Algorytm propagacji wstecznej od matematycznego fundamentu po praktyczną implementację: reguła łańcucha jako rdzeń backpropu, symetria forward i backward pass, budowa autograd-a w stylu micrograd Karpathy, ręczne wyprowadzenie gradientów przez cross-entropy, warstwę liniową i tanh oraz wpływ inicjalizacji Xavier i He na zdrowy przepływ gradientu.

  1. 6.1Chain rule i reguła łańcuchowa — fundament backpropagacji
  2. 6.2Forward pass vs backward pass — symetria i przepływ gradientu
  3. 6.3Budujemy micrograd: Value, backward(), wizualizacja grafu (Karpathy)
  4. 6.4Backprop Ninja: ręczny backward przez cross-entropy, linear, tanh i batch-norm
  5. 6.5Inicjalizacja wag: Xavier i He — jak start decyduje o gradient flow
MODUŁ 07

Trening w praktyce: optymalizatory i diagnostyka

0 / 6 · 0%

Praktyczna strona treningu sieci neuronowych: geometria krajobrazu strat i mini-batch SGD, momentum i Adam jako rodzina adaptacyjnych optymalizatorów, harmonogramy learning rate (step decay, cosine annealing, warmup), systematyczna diagnostyka treningu (overfit single batch, sanity-check loss na inicjalizacji), histogramy gradientów, problem dead neurons i gradient clipping oraz klasyczny bias-variance tradeoff jako framework diagnozy underfittingu i overfittingu.

  1. 7.1Gradient descent geometrycznie: loss surface, learning rate i mini-batch SGD
  2. 7.2Momentum i Adam: adaptacyjne learning rates i kiedy ich używać
  3. 7.3LR schedules: step decay, cosine annealing, warmup
  4. 7.4Systematyczna diagnostyka: overfit single batch, init loss, learning curves
  5. 7.5Histogramy gradientów, dead neurons i gradient clipping
  6. 7.6Bias-variance tradeoff i diagnoza underfitting vs overfitting
MODUŁ 08

Regularyzacja — jak uniknąć przeuczenia

0 / 5 · 0%

Regularyzacja jako zestaw technik utrzymujących generalizację modelu: dropout jako stochastyczne wygaszanie neuronów z różnym zachowaniem w trybie train vs eval, weight decay i L2 jako kara za duże wagi, batch normalization rozwiązująca problem internal covariate shift, layer normalization jako alternatywa dla małych batchy i sekwencji o zmiennej długości oraz early stopping wraz z systematycznym monitorowaniem treningu (krzywe loss, podział train/val, kryteria stopu).

  1. 8.1Dropout: mechanizm, tryb train vs eval, implementacja
  2. 8.2Weight decay i L2 regularization — karanie dużych wag
  3. 8.3Batch Normalization: problem internal covariate shift i rozwiązanie
  4. 8.4Layer Normalization: kiedy BatchNorm zawodzi i jak go zastąpić
  5. 8.5Early stopping i strategie monitorowania treningu
MODUŁ 09

Sieci konwolucyjne (CNN)

0 / 5 · 0%

Sieci konwolucyjne jako fundament współczesnego computer vision: splot 2D z filtrem jako detektorem cech, znaczenie paddingu, stride i equiwariancji translacyjnej; pooling i przepływ wymiarów przestrzennych przez kolejne warstwy; ewolucja architektur od AlexNet przez VGG do ResNet i odpowiedź na pytanie co i dlaczego się zmieniło; skip connections oraz bloki rezydualne rozwiązujące problem degradacji w bardzo głębokich sieciach (He et al. 2015); transfer learning jako ekstrakcja cech i fine-tuning pretrenowanych modeli.

  1. 9.1Splot 2D: filtr jako detektor cech, padding, stride, equiwariancja
  2. 9.2Pooling, mapy cech i przepływ wymiarów przez sieć
  3. 9.3Ewolucja architektur: AlexNet → VGG → ResNet — co się zmieniło i dlaczego
  4. 9.4Skip connections i bloki rezydualne — rozwiązanie problemu degradacji (He 2015)
  5. 9.5Transfer learning — ekstrakcja cech vs fine-tuning (jak korzystać z ImageNet)
MODUŁ 10

Interpretacja i wizualizacja sieci neuronowych

0 / 4 · 0%

Jak otworzyć czarną skrzynkę głębokiej sieci: wizualizacja wyuczonych filtrów i map aktywacji w CNN (Zeiler & Fergus 2014); GradCAM jako gradientowo-ważona mapa istotności klasy (Selvaraju et al. 2017); adversarial examples i FGSM jako dowód kruchości decyzji modelu (Goodfellow et al. 2015); profilowanie modelu — liczba parametrów, FLOPs, latencja inferencji jako konkretne metryki kosztu obliczeniowego.

  1. 10.1Wizualizacja filtrów i map aktywacji w CNN
  2. 10.2GradCAM: gradient-weighted class activation maps
  3. 10.3Adversarial examples — kiedy sieć się myli i dlaczego
  4. 10.4Profilowanie modelu: parametry, FLOPs, czas inferencji
MODUŁ 11

Sekwencje: RNN, LSTM i GRU

0 / 5 · 0%

Dlaczego sieci feedforward nie wystarczają dla danych sekwencyjnych i jak rekurencja rozwiązuje ten problem. Klasyczna RNN i jej trening przez BPTT (backpropagation through time, Werbos 1990). Patologia gradientów w głębokich rozwinięciach czasu — vanishing i exploding (Bengio et al. 1994). LSTM jako odpowiedź na vanishing gradient z bramkami zapominania, wejścia i wyjścia (Hochreiter & Schmidhuber 1997). GRU jako uproszczona alternatywa LSTM z mniejszą liczbą bramek (Cho et al. 2014).

  1. 11.1Problem sekwencji — dlaczego feedforward nie wystarczy
  2. 11.2RNN: pętla ukrytego stanu, BPTT i first-step implementacja
  3. 11.3Vanishing i exploding gradients w głębokich RNN
  4. 11.4LSTM: bramki, cell state i constant error carousel
  5. 11.5GRU: uproszczony wariant LSTM
MODUŁ 12

Mechanizm uwagi i Transformer

0 / 6 · 0%

Mechanizm uwagi to wynalazek, który zastąpił rekurencję jako podstawę modelowania sekwencji i dał początek architekturze Transformera (Vaswani et al. 2017). Rozdział omawia motywację — ograniczenia RNN przy długoterminowych zależnościach (vanishing gradients, brak paralelizmu) — następnie scaled dot-product attention z trójką Query/Key/Value, multi-head attention i positional encoding, pełny blok encodera (FFN, residual, Layer Norm), tokenizację BPE oraz implementację mini-Transformera od zera w PyTorch.

  1. 12.1Motywacja — ograniczenia RNN i długoterminowe zależności
  2. 12.2Self-attention — Query, Key, Value i scaled dot-product attention
  3. 12.3Multi-head attention i positional encoding
  4. 12.4Architektura Transformera — blok encodera, FFN, LayerNorm, residual
  5. 12.5Tokenizacja i BPE — dlaczego tekst nie jest znakami ani słowami
  6. 12.6Implementacja mini-Transformera od zera w PyTorch
MODUŁ 13

Modele generatywne: Autoenkodery, VAE i GAN

0 / 4 · 0%

Rozdział wprowadza modele generatywne uczenia głębokiego: autoenkodery i ich przestrzeń latentną, wariacyjne autoenkodery (VAE) z reparametrization trickiem i ELBO oraz sieci GAN — od adversarial trainingu po typowe patologie (mode collapse, niestabilność) i techniki ich łagodzenia.

  1. 13.1Autoenkodery: enkoder, dekoder i przestrzeń latentna
  2. 13.2VAE: reparametrization trick i ELBO
  3. 13.3GAN: adversarial training, generator vs dyskryminator
  4. 13.4Problemy treningu GAN: mode collapse, niestabilność i techniki stabilizacji