Robocikowo>ROBOCIKOWO

Machine Learning · Dane i przygotowanie

Inżynieria cech (feature engineering)

Dane i przygotowanie

Wprowadzenie

Inżynieria cech to świadome tworzenie nowych zmiennych, które ujawniają strukturę danych modelowi. Lekcja pokrywa techniki klasyczne (cechy wielomianowe, interakcje, stosunki, bucketing), domenowe (data, geografia, tekst, time-series — lag i rolling), agregacje per-grupa, frequency/target encoding z dyscypliną K-Fold, PCA jako reduktor wymiarowości, automatyczną generację (Featuretools/DFS), problem przekleństwa wymiarowości oraz reprodukowalność przez sklearn Pipeline. Przewodnia zasada: feature engineering MUSI być częścią pipeline, fitowana wyłącznie na train, by uniknąć leakage.