Penulis Utama : Dewi Prasetyan Drajati
Penulis Tambahan : -
NIM / NIP : M0510018
Tahun : 2016
Judul : Perbandingan Teknik Undersampling dan Oversampling pada Klasifikasi Data Pasien Diabetes Mellitus (Dm) Dengan Menggunakan Algoritma Naive Bayes Classifier (NBC)
Edisi :
Imprint : Surakarta - Fak. MIPA - 2016
Kolasi :
Sumber : UNS - Fak. MIPA Jur. Informatika- M0510018-2016
Subyek : UNDERSAMPLING; OVERSAMPLING; SPREADSUBSAMPLE; SMOTE; BACKWARD GREEDY STEPWISE; NBC
Jenis Dokumen : Skripsi
ISSN :
ISBN :
Abstrak :

ABSTRAK

 

Ketidakseimbangan data merupakan masalah serius dalam suatu proses klasifikasi. Sebagian besar algoritma klasifikasi cenderung hanya melakukan klasifikasi pada data anggota kelas mayor sehingga mengabaikan proses klasifikasi pada data anggota kelas minor. Hal ini dapat berpengaruh terhadap perolehan nilai presisi dan recall pada data anggota kelas minoritas sehingga menjadi sangat kecil. Untuk menyelesaikan permasalahan ketidakseimbangan data yang terjadi, maka pada penelitian ini akan dilakukan baik proses undersampling maupun proses oversampling untuk menyeimbangkan data. Proses undersampling dilakukan menggunakan teknik Spreadsubsample, sedangkan proses oversampling dilakukan menggunakan Synthetic Minority Oversampling Technique (SMOTE). Data yang digunakan pada penelitian ini adalah data pasien Diabetes Mellitus (DM). Teknik lain yang juga digunakan dalam penelitian yang diusulkan ini adalah Backward Greedy Stepwise untuk melakukan pencarian terhadap atribut yang berpengaruh positif terhadap hasil klasifikasi dan algoritma Naive Bayes Classifier (NBC) untuk melakukan klasifikasi data. Hasil dari penelitian yang telah dilakukan adalah nilai rata- rata akurasi tertinggi yang diberikan oleh data latih dari data pasien DM yang diproses dengan metode undersampling lebih tinggi dibandingkan dengan akurasi data latih yang diproses dengan metode oversampling, meskipun nilai rata- rata tertinggi pada nilai presisi dan nilai recall yang diberikan oleh data latih yang diproses dengan metode undersampling lebih rendah. Nilai rata- rata tertinggi akurasi, presisi, dan recall dari data uji yang dikenai proses oversampling lebih tinggi dibandingkan dengan nilai rata- rata tertinggi data uji yang dikenai proses undersampling.

Keywords : undersampling; oversampling; Spreadsubsample; SMOTE; Backward
Greedy Stepwise; NBC

File Dokumen : abstrak.pdf
Harus menjadi member dan login terlebih dahulu untuk bisa download.
COVER.pdf
BAB I.pdf
BAB II.pdf
BAB III.pdf
BAB IV.pdf
BAB V.pdf
DAFTAR PUSTAKA.pdf
SURAT PERNYATAAN.pdf
File Dokumen : -
Status : Public
Pembimbing : 1. Ristu Saptono, S.Si.,M.T
2. Winarno, S.Si., M.Eng
Catatan Umum :
Fakultas : Fak. MIPA