Optimasi Pengembangan Question Answering System Bahasa Indonesia Menggunakan Bi-Directional Attention Flow dengan Self-Attention
Penulis Utama
:
Vicko Danendra Setyo Yuwono
NIM / NIP
:
M0520079
×<p><em>Question Answering System </em>(QAS) dapat menjawab suatu pertanyaan pada suatu konteks yang diberikan dan membutuhkan pemodelan interaksi yang kompleks antara konteks dan pertanyaan menggunakan <em>Deep Neural Network </em>(DNN). Pengembangan QAS Bahasa Indonesia dengan pendekatan DNN masih menjadi tantangan yang signifikan di bidang <em>Natural Language Processing </em>(NLP). Hal ini disebabkan karena Bahasa Indonesia merupakan <em>low resource language</em>, dan sebagian besar pendekatan NLP menggunakan Bahasa Inggris yang merupakan <em>high resource language</em>. Oleh karena itu, diperlukan optimasi pada pengembangan QAS Bahasa Indonesia yang dapat memahami dan menangani Bahasa Indonesia sebagai <em>low resource language</em>. Penelitian ini mengusulkan model arsitektur <em>Bi-Directional Attention Flow </em>(BiDAF) dengan menambahkan <em>self-attention </em>dan perbandingan model <em>Bidirectional Long Short-Term Memory </em>(BiLSTM) dan <em>Bidirectional Gated Recurrent Unit </em>(BiGRU) pada <em>modeling layer</em>-nya. Model arsitektur BiDAF dengan <em>self-attention </em>mampu menangkap hubungan yang kompleks antara kata dan frasa dalam suatu konteks secara global, sehingga dapat memberikan manfaat signifikan terutama untuk <em>low resource language</em>. Pengujian dilakukan dengan empat <em>dataset</em>, yaitu SQuAD, TyDiQA, QASiNa, dan <em>variated dataset</em>. Pada <em>dataset </em>SQuAD mendapatkan skor matriks F1-<em>score </em>61.7 dan EM 45.1 dengan BiLSTM. Pada <em>dataset </em>TyDiQA mendapatkan skor matriks F1-<em>score </em>65.1 dan EM 52.5 dengan BiGRU. Pada <em>dataset </em>QASiNa mendapatkan skor matriks F1-<em>score </em>58.5 dan EM 41.6 dengan BiLSTM. Pada <em>variated dataset </em>mendapatkan skor matriks yang lebih unggul daripada saat menggunakan data asli dengan F1-<em>score </em>75.1 dan EM 64.8 dengan BiGRU. Dari hasil pengujian tersebut, model yang diusulkan menunjukkan kinerja yang lebih optimal dibandingkan dengan <em>pre-trained </em>model sebelumnya dalam pengembangan QAS Bahasa Indonesia.</p>
×
Penulis Utama
:
Vicko Danendra Setyo Yuwono
Penulis Tambahan
:
-
NIM / NIP
:
M0520079
Tahun
:
2024
Judul
:
Optimasi Pengembangan Question Answering System Bahasa Indonesia Menggunakan Bi-Directional Attention Flow dengan Self-Attention
Edisi
:
Imprint
:
Surakarta - Fak. Teknologi Informasi dan Sains Data - 2024