Robocikowo>ROBOCIKOWO

Machine Learning · Uczenie nienadzorowane

k-means clustering

Uczenie nienadzorowane

Wprowadzenie

k-means to najprostszy i najczęściej używany algorytm grupowania w uczeniu nienadzorowanym. Dzieli zbiór punktów na k rozłącznych skupień, minimalizując sumę kwadratów odległości każdego punktu od najbliższego centroidu (WCSS / inertia). W tej lekcji zobaczysz dokładnie jak działa algorytm Lloyda, dlaczego inicjalizacja przez k-means++ jest standardem od 2007 roku, kiedy elbow i silhouette zawodzą, oraz jakie założenia (sferyczne skupienia, podobna wariancja, skala cech) musisz spełnić, żeby wyniki były sensowne.