Robocikowo>ROBOCIKOWO
Inne

AutoML

2013AktywnyOpublikowano: 17 maja 2026Aktualizacja: 17 maja 2026Opublikowany
Paradygmat automatyzacji procesu stosowania uczenia maszynowego: preprocesing danych, wybór modelu, optymalizacja hiperparametrów i projektowanie architektur.
Kluczowa innowacja
Automatyzacja całego potoku uczenia maszynowego — od przygotowania danych, przez wybór modelu, optymalizację hiperparametrów, po wyszukiwanie architektur sieci neuronowych — umożliwiająca stosowanie ML bez głębokiej eksperckiej wiedzy.
Kategoria
Inne
Poziom abstrakcji
Paradigm
Poziom operacji
TreningModelElement architektury
Zastosowania
Klasyfikacja i regresja na danych tabelarycznych (tabular AutoML — AutoGluon, H2O, Auto-sklearn)Projektowanie architektur sieci neuronowych dla wizji i NLP (NAS — DARTS, EfficientNet, Auto-PyTorch)AutoML w domenach biomedycznych i naukowych (np. analiza danych genomowych przez TPOT)Demokratyzacja ML dla zespołów bez ekspertów (chmurowe usługi: Google Cloud AutoML, Azure AutoML, Amazon SageMaker Autopilot)Optymalizacja pipeline'ów ML w przemyśle (predykcyjne utrzymanie ruchu, prognozy popytu)

Jak działa

AutoML definiuje przestrzeń poszukiwań (modele, pipeline'y, hiperparametry, architektury) i optymalizuje ją procedurą wyszukiwania — Bayesowską (SMAC, BOHB), ewolucyjną (TPOT), bandycką (Hyperband, ASHA), wzmocnieniową (NAS-RL) lub gradientową (DARTS). Meta-learning wykorzystuje wcześniejsze eksperymenty (np. portfolio konfiguracji) jako warm-start dla nowych zadań. Walidacja krzyżowa, stacking i ensembling poprawiają finalne wyniki.

Rozwiązany problem

Stosowanie ML wymaga eksperckiej wiedzy w preprocesowaniu, doborze modelu i strojeniu hiperparametrów, co tworzy barierę wejścia dla domenowych użytkowników i spowalnia iteracje badawcze.

Kluczowe mechanizmy

Hyperparameter optimization (HPO): Bayesian (SMAC, BOHB), bandyty (Hyperband, ASHA), ewolucyjne
Neural Architecture Search (NAS): RL (Zoph & Le), ewolucyjne (AmoebaNet), gradient (DARTS)
Meta-learning i warm-start na podstawie portfolio konfiguracji z wcześniejszych zadań
Multi-fidelity evaluation: ocena kandydatów na zmniejszonych zasobach (Hyperband, Successive Halving)
Pipeline search: optymalizacja całego pipeline'u ML (preprocesing + model + ensembling) — TPOT, Auto-sklearn
Ensembling i stacking: łączenie wielu modeli w finalny predyktor (AutoGluon multi-layer stacking)

Mocne strony i ograniczenia

Mocne strony
Demokratyzacja uczenia maszynowego — użytkownicy bez głębokiej wiedzy ML mogą budować dobre modele
Powtarzalność i mniejszy wpływ subiektywnych decyzji ekspertów
Często lepsze lub porównywalne wyniki vs. ręcznie strojony pipeline (szczególnie na danych tabelarycznych)
Bogaty open-source ecosystem: Auto-sklearn, AutoGluon, TPOT, H2O AutoML, Auto-PyTorch
Stanowi konceptualny fundament dla nowoczesnego self-improving AI (RSI, DGM, AlphaEvolve)
Ograniczenia
Wysokie zużycie zasobów obliczeniowych (zwłaszcza NAS na sieciach neuronowych)
Ograniczenie do przyjętej przestrzeni poszukiwań — brak otwartej kreatywności
Słaba interpretowalność wybranych modeli — bariera w domenach regulowanych
Ryzyko data leakage i overfittingu do zbioru walidacyjnego
Zwykle słabsze rezultaty niż dedykowane ręcznie projektowane SOTA w wąskich problemach

Komponenty

Przestrzeń poszukiwań (search space)

Formalna definicja zbioru dopuszczalnych modeli, pipeline'ów, hiperparametrów i topologii sieci.

Strategia wyszukiwania (search strategy)

Algorytm eksplorujący przestrzeń poszukiwań: Bayesian optimization, ewolucja, bandyty, RL, gradient.

Estymacja jakości (performance estimation)

Procedura tania w obliczeniach do oceny kandydatów: walidacja krzyżowa, multi-fidelity (Hyperband), learning curve extrapolation, predyktory wydajności.

Meta-learning / warm-start

Wykorzystanie wiedzy z wcześniejszych zadań (portfolio konfiguracji, embeddings zadań) do przyspieszenia startu na nowym datasecie.

Ensembling i stacking

Łączenie wielu wytrenowanych modeli (bagging, boosting, multi-layer stacking) w finalny predyktor.

Implementacja

Pułapki implementacyjne
Wysokie koszty obliczenioweWysoka

Pełne wyszukiwanie hiperparametrów lub architektur potrafi pochłonąć tysiące godzin GPU, co czyni naiwny AutoML niedostępnym dla małych zespołów.

Overfitting do zbioru walidacyjnegoWysoka

Wielokrotna ewaluacja konfiguracji na tym samym zbiorze walidacyjnym prowadzi do efektu „winner's curse" — wybrany model jest optymistycznie oszacowany.

Wyciek danych (data leakage)Wysoka

Automatyczne pipeline'y łatwo przecieka informacje z zestawu testowego, jeśli preprocesing nie jest poprawnie zamknięty w foldach walidacji.

Słaba interpretowalność wynikówŚrednia

Złożone ensemble'e wybrane przez AutoML są często trudne do wyjaśnienia, co utrudnia walidację w domenach regulowanych (medycyna, finanse).

Wąskie przestrzenie poszukiwańŚrednia

Wyniki AutoML są ograniczone przez przyjętą przestrzeń poszukiwań — z definicji nie odkryje on rozwiązań poza nią.

Ewolucja

Oryginalny paper · 2013 · KDD 2013 · Chris Thornton
Auto-WEKA: Combined Selection and Hyperparameter Optimization of Classification Algorithms
Chris Thornton, Frank Hutter, Holger H. Hoos, Kevin Leyton-Brown
2013
Auto-WEKA — pierwszy system łączący wybór algorytmu i optymalizację hiperparametrów (Thornton, Hutter, Hoos, Leyton-Brown, KDD 2013).
Punkt przełomowy
2014
AutoML Workshop @ ICML 2014 (Hutter, Caruana, Bardenet i in.) — instytucjonalne ustanowienie pola badawczego.
2015
Auto-sklearn (Feurer i in., NeurIPS 2015) — meta-learning + ensembling nad scikit-learn; wygrywa konkursy ChaLearn AutoML.
Punkt przełomowy
2016
TPOT (Olson i in.) — pipeline ML optymalizowany programowaniem genetycznym.
2017
Neural Architecture Search z RL (Zoph & Le, ICLR 2017) — NAS staje się głośnym poddziedziną AutoML.
Punkt przełomowy
2018
Google Cloud AutoML — komercjalizacja AutoML jako usługi chmurowej.
2019
DARTS (Liu i in., ICLR 2019) — różniczkowalny NAS redukujący koszt obliczeniowy o rzędy wielkości; książka „Automated Machine Learning: Methods, Systems, Challenges" (Hutter, Kotthoff, Vanschoren).
Punkt przełomowy
2020
AutoGluon-Tabular (Erickson i in., AWS) — multi-layer stacking dla danych tabelarycznych.
2022
TabPFN (Hollmann i in.) — transformer wytrenowany na syntetycznych danych rozwiązujący małe problemy tabelaryczne w sekundę.
2024
Pierwsza dedykowana konferencja AutoML Conference (po ICML/NeurIPS workshops) — pole dojrzewa instytucjonalnie.

Paradygmat wykonania

Tryb główny
conditional
Wzorzec aktywacji
input_dependent

Równoległość

Poziom równoległości
fully_parallel
Zakres
trainingacross_devices

Wymagania sprzętowe

Podstawowe
Dobry fit
Dobry fit