Abstrak


Pengaruh Double Learning Logistic Regression pada Klasifikasi Data Liver


Oleh :
Lindarwati Kusumawardani - M0517026 - Fak. MIPA

Data biomedis sangat rentan terhadap noisy, missing value, data tidak seimbang, dan atribut yang tidak relavan. Hal ini dapat mengurangi tingkat akurasi dalam proses klasifikasi. Indian Liver Patient Dataset (ILPD) merupakan data medis yang memiliki masalah pada tingkat akurasi, data yang tidak seimbang, adanya missing value, serta adanya atribut yang tidak relavan. Untuk mengatasi masalah tersebut peneliti mencoba menerapkan teknik Double Learning (DL) dengan Logistic Regression. Dimana dalam penelitian sebelumnya proses klasifikasi biasa dilakukan dengan data yang bebas noise, dan menyebabkan data minoritas hilang dalam proses uji. Ide utama dari penelitian ini adalah membangun model menggubanakn instances yang dianggap noise. Pendekatan ini mampu mengurangi jumlah instances dan meningkatkan akurasi. Teknik double learning yang diusulkan akan dibandingkan dengan dengan beberapa teknik pre-processing seperti SMOTE untuk mengatasi data yang tidak seimbang dan Correlation Feature Selection (CFS) untuk melakukan seleksi atribut berdasarkan korelasi terhadap kelas. Hasil percobaan menunjukan bahwa model yang diusulkan memiliki pengaruh untuk hasil akurasi.