Abstrak


Pengaruh dummy variable pada metode naïve bayes dalam kasus klasifikasi penyakit kandungan


Oleh :
Rahmawati Danu Kusuma - M0509058 - Fak. MIPA

Salah satu penyakit yang sering terjadi pada kaum wanita adalah penyakit kandungan. Penyakit kandungan yang dimaksud dalam penelitian ini adalah radang panggul, mioma uteri, kanker serviks, dan kanker ovarium. Penelitian ini mempelajari pengaruh penggunaan dummy variable pada metode naïve bayes pada kasus klasifikasi penyakit kandungan. Penggunaan dummy variable untuk pemecahan gejala agar nilainya menjadi binary dan gejala menjadi lebih spesifik. Laplacian smoothing diterapkan ketika klasifikasi data menggunakan metode Naïve Bayes guna menghindari kegagalan klasifikasi akibat kemungkinan hadirnya nilai nol pada model probabilitas.
Langkah penelitian yang dilakukan adalah pengumpulan data, klasifikasi data, implementasi menggunakan PHP, pengujian dan analisa hasil. Dua skenario diterapkan di penelitian ini. Skenario satu merupakan klasifikasi data menggunakan 18 gejala. Sedangkan skenario dua merupakan klasifikasi data menggunakan 24 gejala yang diperoleh dari penjabaran 18 gejala awal yang telah mengalami proses dummy.
Pengujian terhadap skenario tersebut menggunakan metode pengujian Confusion Matrix yang dilakukan sebanyak lima kali dengan mengganti-ganti partisi yang berfungsi sebagai data training dan data uji. Pada percobaan menggunakan data awal, akurasi Naïve Bayes yang didapat adalah 88% (dengan 18 parameter) dan mendapat akurasi 88.88% (dengan 24 parameter) jika menggunakan data yang telah didummy. Sehingga berdasarkan hasil dari penelitian, akurasi klasifikasi data menggunakan dummy variable lebih tinggi daripada akurasi klasifikasi data tanpa penggunaan dummy variable.
Kata kunci : Confusion Matrix, Dummy variable, PHP, Penyakit kandungan, Naïve Bayes, Laplacian Smoothing.