Abstrak


Pengaruh Dummy Variable dan Backward Feature Selection dengan Korelasi Pearson pada Naive Bayes Classifier untuk Diagnosa Ginekologi


Oleh :
Febrianti - M0509028 - Fak. MIPA

ABSTRAK

Penggunaan Pearson correlation dan backward selection sebagai feature selection dapat dikombinasikan untuk meningkatkan hasil akurasi pada Naive Bayes Classifier. Feature selection ini dilakukan sebagai preprocessing data dan pada proses algoritma Naive Bayes Classfier. Pearson Correlation sebagai preprocessing data akan bekerja untuk mengurutkan parameter yang berpengaruh dalam proses klasifikasi penyakit kandungan dan Backward Selection akan menyeleksi parameter tersebut sesuai urutan pada preprocessing data dalam proses Naive Bayes Classfier. Sebelumnya, parameter tersebut akan diubah menjadi dummy variables karena parameter memiliki kemungkinan nilai yang muncul lebih dari dua (non-binary). Penelitian ini membahas tentang pengaruh Naive Bayes Classfier menggunakan dummy variables dan feature backward selection dengan pearson correlation dalam diagnosa penyakit kandungan. Hasil yang didapat pada penelitian ini membuktikan bahwa penggunaan dummy variables meningkatkan nilai akurasi dari 88% menjadi 88,8?n penggunaan pearson correlation sebagai preprocessing data meningkatkan nilai akurasi pada Naive Bayes Classifier dari 88,8?ngan 24 parameter menjadi 89,6?ngan 20 parameter. Penggunaan pearson correlation tidak hanya meningkatkan hasil akurasi tetapi juga meningkatkan efektivitas fitur. yang digunakan dalam proses Naive Bayes Classifier. Hal ini dapat dilihat dari peningkatan hasil akurasi dengan penggunaan jumlah parameter yang menurun.  
Kata kunci : Naive Bayes Classifier, Dummy Variable, Pearson Correlation