Abstrak


Rekomendasi Lagu Berbasis Analisis Topik, Tema, dan Emosi Pada Lirik Lagu Bahasa Indonesia Menggunakan BERTopic, BERTScore, dan Kombinasi Klasifikasi


Oleh :
Irzan Rafi Imtinan - M0521033 - Fak. Teknologi Informasi dan Sains Data

Rekomendasi lagu berbasis konten umumnya masih terbatas pada fitur audio dan metadata, tanpa memperhatikan kedalaman makna dari lirik lagu. Penelitian ini bertujuan untuk mengembangkan model rekomendasi lagu berbahasa Indonesia berdasarkan analisis topik, tema, dan emosi dalam lirik lagu. Metode yang digunakan melibatkan pemodelan topik menggunakan BERTopic, kombinasi klasifikasi pada tema dan emosi menggunakan algoritma model machine learning, serta rekomendasi berbasis content-based filtering dan kesamaan semantik menggunakan BERTScore. Dataset terdiri dari 4077 lirik lagu Indonesia melalui hasil scraping. Hasil pemodelan menunjukkan bahwa BERTopic optimal pada jumlah 6 topik dengan coherence score sebesar 0.5757 dan topic diversity sebesar 0.9. Model SVM menghasilkan akurasi tertinggi dalam klasifikasi tema dengan nilai 0.8308, dan model XGBoost unggul dalam klasifikasi emosi dengan nilai akurasi 0.7949. Rekomendasi yang dibangun mampu menghasilkan rekomendasi lagu dengan nilai rata-rata BERTScore F1 di atas 0,84 pada skenario input lirik baru maupun lirik dataset. Temuan ini menunjukkan bahwa pendekatan yang diusulkan dapat menjadi alternatif dalam merekomendasikan lagu yang relevan secara tematik dan emosional, serta mampu menangkap makna mendalam dalam lirik berbahasa Indonesia.