Model Cards
Jak działa
Model Card to ustrukturyzowany dokument towarzyszący modelowi, zawierający: opis przeznaczenia, dane treningowe, metryki wydajności z podziałem na grupy demograficzne, znane ograniczenia i zagrożenia, zalecenia użytkowania.
Rozwiązany problem
Modele ML były wdrażane bez transparentnej dokumentacji ich możliwości, ograniczeń i potencjalnych zagrożeń. Model Cards standaryzują raportowanie modeli dla odpowiedzialnego AI.
Komponenty
Podstawowe informacje o modelu: kto go opracował, wersja, typ modelu, algorytm treningowy, parametry, link do zasobów.
Zamierzone przypadki użycia modelu, docelowi użytkownicy oraz zastosowania wykraczające poza zakres projektu (out-of-scope).
Czynniki istotne dla zachowania modelu: grupy demograficzne, warunki środowiskowe, atrybuty instrumentalne. Rozróżniane są czynniki istotne (relevant factors) od czynników ewaluacyjnych (evaluation factors).
Lista metryk wydajności i progów decyzyjnych, wraz z uzasadnieniem ich wyboru w kontekście struktury modelu i jego zastosowania.
Opis zbiorów ewaluacyjnych: źródło, kompozycja, reprezentatywność dla zamierzonych przypadków użycia.
Opis danych treningowych na poziomie ogólnym, obejmujący proweniencję i skład statystyczny, z uwzględnieniem ograniczeń prywatności.
Zdezagregowane wyniki ewaluacji modelu według wybranych czynników, obejmujące zarówno wyniki jednostkowe (unitary), jak i intersekcionalne (intersectional).
Identyfikacja wrażliwych danych użytych w modelu, implikacji dla życia ludzi, zagrożeń i szkód oraz zastosowanych środków zaradczych.
Dodatkowe obawy i zalecenia nieomówione w poprzednich sekcjach: ograniczenia, znane luki, wskazówki dla użytkowników.
Opcjonalna sekcja metadanych YAML na początku pliku README.md (implementacja Hugging Face Hub): license, language, pipeline_tag, base_model, datasets, eval_results.
Oficjalna
Implementacja
Twórcy kart modeli często raportują wyniki wyłącznie per pojedynczy czynnik (np. tylko płeć lub tylko wiek), pomijając analizę intersekcionalną (np. starsze kobiety vs. młodzi mężczyźni), która ujawnia stronniczości niewidoczne w analizie jednostkowej.
Sekcja etyczna bywa wypełniana hasłowo lub pomijana, zamiast zawierać konkretną identyfikację zagrożeń, wrażliwych danych i podjętych środków zaradczych.
Karty modeli często raportują jedynie zagregowane metryki (np. ogólna dokładność), bez rozbicia na podgrupy demograficzne, co maskuje zróżnicowaną jakość działania modelu dla różnych populacji.
Karta modelu jest tworzona raz przy pierwszym wdrożeniu, a następnie nie jest aktualizowana przy kolejnych wersjach lub fine-tuningach, co prowadzi do rozbieżności między dokumentacją a rzeczywistym modelem.
Ewolucja
5 października 2018 Mitchell i współautorzy opublikowali na arXiv propozycję Model Cards jako ustandaryzowanego dokumentu towarzyszącego wytrenowanym modelom ML, wprowadzającego dezagregację wyników po grupach demograficznych.
Papier ukazał się w materiałach konferencji FAT* 2019 (Conference on Fairness, Accountability, and Transparency), formalnie wprowadzając Model Cards do dyskursu naukowego i praktyki branżowej.
Google udostępnił Model Card Toolkit — bibliotekę Python automatyzującą generowanie kart modeli z danych ewaluacyjnych TensorFlow Model Analysis (TFMA), integrującą się z TFX pipeline.
Hugging Face opublikował Model Card Guidebook — zaktualizowany szablon kart modeli zintegrowany z biblioteką huggingface_hub, narzędziem Model Card Creator Tool i analizą krajobrazu dokumentacji ML.
Hiperparametry (konfigurowalne osie)
Liczba i szczegółowość czynników demograficznych, środowiskowych i instrumentalnych uwzględnionych w ewaluacji. Wpływa bezpośrednio na wykrywalność stronniczości.
Czy raportowane wyniki obejmują wyłącznie analizę jednostkową (per czynnik) czy też analizę intersekcionalną (kombinacje czynników). Autorzy paperu zalecają obie formy.
Zakres ujawnianej informacji o zbiorach ewaluacyjnych: pełna specyfikacja vs. ogólny opis z powołaniem na publicznie dostępne datasety.
Zakres ujawnianej informacji o danych treningowych — często ograniczony przez restrykcje prywatności lub własność intelektualną.
Wymagania sprzętowe
Model Cards to wzorzec dokumentacyjny — pliki tekstowe (Markdown/YAML) niezależne od sprzętu. Mogą opisywać modele działające na dowolnym hardwarze.