Abstrak


Analisis Perbandingan Google Cloud Vision dan Tesseract sebagai Optical Character Recognition pada Dokumen Hasil Scanner


Oleh :
Muhammad Hardiansyah - K3520049 - Fak. KIP

Muhammad Hardiansyah, K3520049. Pembimbing I: Febri Liantoni, S.ST., M.Kom. Pembimbing II: Dwi Maryono, S.Si., M.Kom. ANALISIS PERBANDINGAN GOOGLE CLOUD VISION DAN TESSERACT SEBAGAI OPTICAL CHARACTER RECOGNITION PADA DOKUMEN HASIL SCANNER. Skripsi, Surakarta: Fakultas Keguruan dan Ilmu Pendidikan Universitas sebelas Maret, September 2024.

Penelitian ini membandingkan Google Cloud Vision dan Tesseract sebagai alat Optical Character Recognition (OCR) pada dokumen hasil scanner. Dalam era digital, pengarsipan dokumen ke bentuk digital menjadi keharusan, namun banyak dokumen masih dalam bentuk gambar yang sulit dibaca oleh komputer untuk indexing atau searching. Google Cloud Vision API, layanan dari Google Cloud Platform, dan Tesseract, OCR yang dikembangkan oleh Hewlett-Packard dan bersifat open-source, diuji untuk mengetahui perbedaan dalam hal akurasi, waktu proses, dan resource memory yang dibutuhkan. 

Penelitian ini menggunakan metode Research and Development (R&D) dengan pendekatan waterfall dalam pengembangan aplikasi web yang mampu melakukan OCR menggunakan kedua library tersebut. Pengujian dilakukan dengan dataset berupa 82 gambar dokumen skripsi mahasiswa Universitas Sebelas Maret yang di-scan. Hasil penelitian ini diharapkan dapat menjadi pertimbangan bagi peneliti lain dalam memilih library OCR dan mendorong pemanfaatan teknologi OCR dalam proses digitalisasi dokumen, khususnya di lingkungan pendidikan. 

Berdasarkan hasil pengujian, dapat disimpulkan bahwa library Google Cloud Vision unggul dalam tingkat akurasi dan waktu proses rekognisi, sedangkan Tesseract unggul pada kebutuhan resource memory.

Kata kunci: Optical Character Recognition, Tesseract, Google Cloud Vision, Waterfall