Abstrak


Pencocokan Nama Sekolah Menengah Atas Pada Data Sekolah Menggunakan Algoritma Hamming Distance Dan Jaro-Winkler Distance


Oleh :
Khoirul Syaifuddin - M0509040 - Fak. MIPA

ABSTRAK

Nilai siswa dan track record dari sekolah asal peserta seleksi menjadi pertimbangan 
dalam proses seleksi mahasiswa baru di SNMPTN. Track record bisa diketahui dari 
nilai  akreditasi  sekolah.  Masalahnya  universitas  tidak  memiliki  informasi  nilai 
akreditasi  sekolah  di  Indonesia.  Universitas  memerlukan  update  data  sekolah 
dengan  rincian  seperti  nilai  akreditasi  dari  website  Badan  Akreditasi  Nasional 
Sekolah  / Madrasah  (BAN-SM). Masalahnya belum  tersedia hubungan  langsung 
dengan  database  BAN-SM  atau  fasilitas  web  service  dari  BAN-SM.  Masalah 
lainnya,  data  dari  BAN-SM  tidak  memiliki  kata  kunci  yang  unik  yang  dapat 
digunakan untuk menghubungkan tabel sekolah di universitas dengan tabel sekolah 
di BAN-SM dari website bansm.or.id. 
Solusi  dari masalah  itu  adalah  pengumpulan  data  dengan web  crawler  dan web 
mining,  kemudian  melakukan  pencocokan  untuk  menghubungkan  dua  tabel 
menggunakan algoritma Jaro-Winkler Distance dan Hamming Distance. 
Tujuan dari penelitian ini adalah untuk mendapatkan informasi nilai akreditasi yang 
valid berdasarkan hubungan crawling website bansm.or.id dengan tabel sekolah di 
universitas.  Dari  hasil  pengujian,  didapatkan  bahwa  keakuratan  aplikasi  adalah 
92,8%  dengan  nilai  ambang  batas minimum  kesamaan  paling  ideal  adalah  0,78 
sehingga seluruh hasil pencocokan yang mempunyai nilai diatas atau sama dengan 
0,78 memiliki nilai kebenaran sebesar 92,8%. 
 
Kata - Kunci : Jaro-Winkler Distance, Hamming Distance, Pencocokan, Akreditasi