Python — od podstaw do zaawansowanego · scikit-learn — klasyczne ML
Pipeline — preprocessing i model w jednym obiekcie
scikit-learn — klasyczne ML
Wprowadzenie
Pipeline w sklearn to nie tylko wygoda — to architektoniczna gwarancja braku przecieku danych. Łączy transformery (scaler, encoder, PCA, selektor cech) z końcowym predyktorem w JEDEN obiekt, który zachowuje się jak zwykły estymator: fit/predict/score/get_params. Dzięki temu w cross_val_score i GridSearchCV cały preprocessing jest dopasowywany TYLKO na fold-train. Ta lekcja systematyzuje: Pipeline vs make_pipeline, ColumnTransformer dla mieszanych typów cech, dostęp do kroków przez named_steps, składnia step__param w grid search, serializacja przez joblib. Po lekcji nigdy więcej nie napiszesz ręcznej pętli „scaler → model → ewaluacja”.