Abstrak


Perbandingan kinerja k-means dan s-k-means clustering untuk data berdimensi tinggi


Oleh :
Rafa Oktarinda - M0514042 - Fak. MIPA

 Penelitian yang dilakukan Chakraborty & Das pada tahun 2017 menjelaskan mengenai berbagai synthetic  dan  real-life  data set yang mengindikasikan bahwa hasil simulasi S-k-means  memiliki performa lebih baik dibandingkan dengan K- means konvensional (K-means dengan metrik Euclidean distance) dan W-k-means (K-means  dengan  penambahan boot/weight)  pada situasi tertentu. Sehingga pada penelitian ini dilakukan perbandingan kinerja K-means  konvensional  dan  S-k- means  pada beberapa data.  Data yang diuji coba merupakan data dengan jumlah atribut  yang  lebih banyak.  Perbandingan kinerja dilakukan dengan evaluasi Adjusted Rand Index (ARI). Hasilnya, data set yang memiliki jumlah atribut yang sama dengan penelitian sebelumnya, S-k-means  memiliki kinerja lebih baik dibandingkan dengan K-means  berdasarkan nilai maksimum  ARI  yang didapat. Sedangkan, pada data set dengan jumlah atribut yang lebih besar, kinerja K-means dengan  S-k-means  tidak jauh berbeda  berdasarkan nilai maksimum  ARI yang didapat. Kata Kunci: S-distance, S-k-means clustering, Adjusted Rand Index (ARI)