Inne

AutoML

2013AktywnyOpublikowano: 17 maja 2026Aktualizacja: 17 maja 2026Opublikowany

Paradygmat automatyzacji procesu stosowania uczenia maszynowego: preprocesing danych, wybór modelu, optymalizacja hiperparametrów i projektowanie architektur.

Kluczowa innowacja

Automatyzacja całego potoku uczenia maszynowego — od przygotowania danych, przez wybór modelu, optymalizację hiperparametrów, po wyszukiwanie architektur sieci neuronowych — umożliwiająca stosowanie ML bez głębokiej eksperckiej wiedzy.

Kategoria

Inne

Poziom abstrakcji

Paradygmat

Poziom operacji

TreningModelElement architektury

Zastosowania

Klasyfikacja i regresja na danych tabelarycznych (tabular AutoML — AutoGluon, H2O, Auto-sklearn)Projektowanie architektur sieci neuronowych dla wizji i NLP (NAS — DARTS, EfficientNet, Auto-PyTorch)AutoML w domenach biomedycznych i naukowych (np. analiza danych genomowych przez TPOT)Demokratyzacja ML dla zespołów bez ekspertów (chmurowe usługi: Google Cloud AutoML, Azure AutoML, Amazon SageMaker Autopilot)Optymalizacja pipeline'ów ML w przemyśle (predykcyjne utrzymanie ruchu, prognozy popytu)

Jak działa

AutoML definiuje przestrzeń poszukiwań (modele, pipeline'y, hiperparametry, architektury) i optymalizuje ją procedurą wyszukiwania — Bayesowską (SMAC, BOHB), ewolucyjną (TPOT), bandycką (Hyperband, ASHA), wzmocnieniową (NAS-RL) lub gradientową (DARTS). Meta-learning wykorzystuje wcześniejsze eksperymenty (np. portfolio konfiguracji) jako warm-start dla nowych zadań. Walidacja krzyżowa, stacking i ensembling poprawiają finalne wyniki.

Rozwiązany problem

Stosowanie ML wymaga eksperckiej wiedzy w preprocesowaniu, doborze modelu i strojeniu hiperparametrów, co tworzy barierę wejścia dla domenowych użytkowników i spowalnia iteracje badawcze.

Kluczowe mechanizmy

Hyperparameter optimization (HPO): Bayesian (SMAC, BOHB), bandyty (Hyperband, ASHA), ewolucyjne

Neural Architecture Search (NAS): RL (Zoph & Le), ewolucyjne (AmoebaNet), gradient (DARTS)

Meta-learning i warm-start na podstawie portfolio konfiguracji z wcześniejszych zadań

Multi-fidelity evaluation: ocena kandydatów na zmniejszonych zasobach (Hyperband, Successive Halving)

Pipeline search: optymalizacja całego pipeline'u ML (preprocesing + model + ensembling) — TPOT, Auto-sklearn

Ensembling i stacking: łączenie wielu modeli w finalny predyktor (AutoGluon multi-layer stacking)

Mocne strony i ograniczenia

Mocne strony

✓Demokratyzacja uczenia maszynowego — użytkownicy bez głębokiej wiedzy ML mogą budować dobre modele

✓Powtarzalność i mniejszy wpływ subiektywnych decyzji ekspertów

✓Często lepsze lub porównywalne wyniki vs. ręcznie strojony pipeline (szczególnie na danych tabelarycznych)

✓Bogaty open-source ecosystem: Auto-sklearn, AutoGluon, TPOT, H2O AutoML, Auto-PyTorch

✓Stanowi konceptualny fundament dla nowoczesnego self-improving AI (RSI, DGM, AlphaEvolve)

Ograniczenia

✗Wysokie zużycie zasobów obliczeniowych (zwłaszcza NAS na sieciach neuronowych)

✗Ograniczenie do przyjętej przestrzeni poszukiwań — brak otwartej kreatywności

✗Słaba interpretowalność wybranych modeli — bariera w domenach regulowanych

✗Ryzyko data leakage i overfittingu do zbioru walidacyjnego

✗Zwykle słabsze rezultaty niż dedykowane ręcznie projektowane SOTA w wąskich problemach

Komponenty

Przestrzeń poszukiwań (search space)

Formalna definicja zbioru dopuszczalnych modeli, pipeline'ów, hiperparametrów i topologii sieci.

Strategia wyszukiwania (search strategy)

Algorytm eksplorujący przestrzeń poszukiwań: Bayesian optimization, ewolucja, bandyty, RL, gradient.

Estymacja jakości (performance estimation)

Procedura tania w obliczeniach do oceny kandydatów: walidacja krzyżowa, multi-fidelity (Hyperband), learning curve extrapolation, predyktory wydajności.

Meta-learning / warm-start

Wykorzystanie wiedzy z wcześniejszych zadań (portfolio konfiguracji, embeddings zadań) do przyspieszenia startu na nowym datasecie.

Ensembling i stacking

Łączenie wielu wytrenowanych modeli (bagging, boosting, multi-layer stacking) w finalny predyktor.

Implementacja

Implementacje referencyjne

Auto-sklearn

Python · AutoML.org (Freiburg-Hannover-Tübingen)

Python · Epistasis Lab (UPenn)

H2O AutoML

Java/Python/R · H2O.ai

AutoKeras

Python · Keras Team / Texas A&M DATA Lab

Pułapki implementacyjne

Wysokie koszty obliczenioweWysoka

Pełne wyszukiwanie hiperparametrów lub architektur potrafi pochłonąć tysiące godzin GPU, co czyni naiwny AutoML niedostępnym dla małych zespołów.

Overfitting do zbioru walidacyjnegoWysoka

Wielokrotna ewaluacja konfiguracji na tym samym zbiorze walidacyjnym prowadzi do efektu „winner's curse" — wybrany model jest optymistycznie oszacowany.

Wyciek danych (data leakage)Wysoka

Automatyczne pipeline'y łatwo przecieka informacje z zestawu testowego, jeśli preprocesing nie jest poprawnie zamknięty w foldach walidacji.

Słaba interpretowalność wynikówŚrednia

Złożone ensemble'e wybrane przez AutoML są często trudne do wyjaśnienia, co utrudnia walidację w domenach regulowanych (medycyna, finanse).

Wąskie przestrzenie poszukiwańŚrednia

Wyniki AutoML są ograniczone przez przyjętą przestrzeń poszukiwań — z definicji nie odkryje on rozwiązań poza nią.

Ewolucja

Oryginalny paper · 2013 · KDD 2013 · Chris Thornton

Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms

Chris Thornton, Frank Hutter, Holger H. Hoos, Kevin Leyton-Brown

2013

Auto-WEKA — pierwszy system łączący wybór algorytmu i optymalizację hiperparametrów (Thornton, Hutter, Hoos, Leyton-Brown, KDD 2013).

Punkt przełomowy

2014

AutoML Workshop @ ICML 2014 (Hutter, Caruana, Bardenet i in.) — instytucjonalne ustanowienie pola badawczego.

2015

Auto-sklearn (Feurer i in., NeurIPS 2015) — meta-learning + ensembling nad scikit-learn; wygrywa konkursy ChaLearn AutoML.

Punkt przełomowy

2016

TPOT (Olson i in.) — pipeline ML optymalizowany programowaniem genetycznym.

2017

Neural Architecture Search z RL (Zoph & Le, ICLR 2017) — NAS staje się głośnym poddziedziną AutoML.

Punkt przełomowy

2018

Google Cloud AutoML — komercjalizacja AutoML jako usługi chmurowej.

2019

DARTS (Liu i in., ICLR 2019) — różniczkowalny NAS redukujący koszt obliczeniowy o rzędy wielkości; książka „Automated Machine Learning: Methods, Systems, Challenges" (Hutter, Kotthoff, Vanschoren).

Punkt przełomowy

2020

AutoGluon-Tabular (Erickson i in., AWS) — multi-layer stacking dla danych tabelarycznych.

2022

TabPFN (Hollmann i in.) — transformer wytrenowany na syntetycznych danych rozwiązujący małe problemy tabelaryczne w sekundę.

2024

Pierwsza dedykowana konferencja AutoML Conference (po ICML/NeurIPS workshops) — pole dojrzewa instytucjonalnie.