PENERAPAN WESTCLASS UNTUK ANALISIS SENTIMEN KEBIJAKAN PPN 12% BERBASIS DATA MEDIA SOSIAL X
DOI:
https://doi.org/10.36499/psnst.v15i1.14863Abstrak
Kenaikan Pajak Pertambahan Nilai (PPN) menjadi 12% memunculkan respons publik yang luas di platform X, sehingga diperlukan analisis sentimen untuk memahami persepsi masyarakat. Namun, dominasi data tidak berlabel menjadikan pendekatan supervised learning kurang optimal. Penelitian ini menerapkan WeSTClass sebagai metode weakly supervised learning dengan memanfaatkan seed word dan pseudo-document berbasis distribusi von Mises–Fisher (vMF) untuk membangun representasi awal tanpa memerlukan banyak data berlabel. Data penelitian terdiri dari 13.962 tweet terkait isu PPN 12%, dengan 2.980 data diberi label manual oleh seorang pakar. Proses pembangkitan pseudo-document menghasilkan 150 dokumen semu yang memperkaya distribusi semantik tiap kelas sentimen. Model CNN digunakan sebagai classifier utama, dilatih melalui tahapan pre-training dan self-training berbasis pseudo-label berkeyakinan tinggi. Hasil evaluasi menunjukkan bahwa CNN memberikan performa terbaik dengan akurasi 0.83 dan F1-Macro 0.72, mengungguli BiLSTM dan SVM. Temuan ini menunjukkan bahwa pendekatan weak supervision melalui WeSTClass efektif dalam mengatasi keterbatasan data berlabel dan meningkatkan stabilitas model pada analisis sentimen berbasis media sosial.