Penulis Utama | : | Dewi Prasetyan Drajati |
Penulis Tambahan | : | - |
NIM / NIP | : | M0510018 |
Tahun | : | 2016 |
Judul | : | Perbandingan Teknik Undersampling dan Oversampling pada Klasifikasi Data Pasien Diabetes Mellitus (Dm) Dengan Menggunakan Algoritma Naive Bayes Classifier (NBC) |
Edisi | : | |
Imprint | : | Surakarta - Fak. MIPA - 2016 |
Kolasi | : | |
Sumber | : | UNS - Fak. MIPA Jur. Informatika- M0510018-2016 |
Subyek | : | UNDERSAMPLING; OVERSAMPLING; SPREADSUBSAMPLE; SMOTE; BACKWARD GREEDY STEPWISE; NBC |
Jenis Dokumen | : | Skripsi |
ISSN | : | |
ISBN | : | |
Abstrak | : | ABSTRAK
Ketidakseimbangan data merupakan masalah serius dalam suatu proses klasifikasi. Sebagian besar algoritma klasifikasi cenderung hanya melakukan klasifikasi pada data anggota kelas mayor sehingga mengabaikan proses klasifikasi pada data anggota kelas minor. Hal ini dapat berpengaruh terhadap perolehan nilai presisi dan recall pada data anggota kelas minoritas sehingga menjadi sangat kecil. Untuk menyelesaikan permasalahan ketidakseimbangan data yang terjadi, maka pada penelitian ini akan dilakukan baik proses undersampling maupun proses oversampling untuk menyeimbangkan data. Proses undersampling dilakukan menggunakan teknik Spreadsubsample, sedangkan proses oversampling dilakukan menggunakan Synthetic Minority Oversampling Technique (SMOTE). Data yang digunakan pada penelitian ini adalah data pasien Diabetes Mellitus (DM). Teknik lain yang juga digunakan dalam penelitian yang diusulkan ini adalah Backward Greedy Stepwise untuk melakukan pencarian terhadap atribut yang berpengaruh positif terhadap hasil klasifikasi dan algoritma Naive Bayes Classifier (NBC) untuk melakukan klasifikasi data. Hasil dari penelitian yang telah dilakukan adalah nilai rata- rata akurasi tertinggi yang diberikan oleh data latih dari data pasien DM yang diproses dengan metode undersampling lebih tinggi dibandingkan dengan akurasi data latih yang diproses dengan metode oversampling, meskipun nilai rata- rata tertinggi pada nilai presisi dan nilai recall yang diberikan oleh data latih yang diproses dengan metode undersampling lebih rendah. Nilai rata- rata tertinggi akurasi, presisi, dan recall dari data uji yang dikenai proses oversampling lebih tinggi dibandingkan dengan nilai rata- rata tertinggi data uji yang dikenai proses undersampling. Keywords : undersampling; oversampling; Spreadsubsample; SMOTE; Backward |
File Dokumen Tugas Akhir | : |
abstrak.pdf Harus menjadi member dan login terlebih dahulu untuk bisa download. COVER.pdf BAB I.pdf BAB II.pdf BAB III.pdf BAB IV.pdf BAB V.pdf DAFTAR PUSTAKA.pdf SURAT PERNYATAAN.pdf |
File Dokumen Karya Dosen | : | - |
Status | : | Public |
Pembimbing | : |
1. Ristu Saptono, S.Si.,M.T 2. Winarno, S.Si., M.Eng |
Catatan Umum | : | |
Fakultas | : | Fak. MIPA |