Perbandingan Kinerja K-Means Dan  S-K-Means Clustering Untuk Data Berdimensi Tinggi

Oktarinda, Rafa

Penelitian yang dilakukan Chakraborty & Das pada tahun 2017 menjelaskan mengenai berbagai synthetic dan real-life data set yang mengindikasikan bahwa hasil simulasi S-k-means memiliki performa lebih baik dibandingkan dengan K- means konvensional (K-means dengan metrik Euclidean distance) dan W-k-means (K-means dengan penambahan boot/weight) pada situasi tertentu. Sehingga pada penelitian ini dilakukan perbandingan kinerja K-means konvensional dan S-k- means pada beberapa data. Data yang diuji coba merupakan data dengan jumlah atribut yang lebih banyak. Perbandingan kinerja dilakukan dengan evaluasi Adjusted Rand Index (ARI). Hasilnya, data set yang memiliki jumlah atribut yang sama dengan penelitian sebelumnya, S-k-means memiliki kinerja lebih baik dibandingkan dengan K-means berdasarkan nilai maksimum ARI yang didapat. Sedangkan, pada data set dengan jumlah atribut yang lebih besar, kinerja K-means dengan S-k-means tidak jauh berbeda berdasarkan nilai maksimum ARI yang didapat. Kata Kunci: S-distance, S-k-means clustering, Adjusted Rand Index (ARI)

Abstrak

Perbandingan Kinerja K-Means Dan S-K-Means Clustering Untuk Data Berdimensi Tinggi