Implementasi Multinomial Naive Bayes Untuk Klasifikasi Ujaran Kebencian Pada Dataset Kicauan (Twitter) Bahasa Indonesia

Umar Syahid Aulia Rahman, Yudi Wibisono, Eddy Prasetyo Nugroho

Abstract


Pada paper ini kami membahas klasifikasi ujaran kebencian pada data kicauan (Twitter) dalam bahasa Indonesia dimana pada penelitian ini kami membangun dataset ujaran kebencian pada kicauan bahasa Indonesia dan melakukan pengklasifikasian dengan mengimplementasikan algoritma Multinomial Naive Bayes dengan menggunakan ekstraksi fitur term frequency – inverse document frequency (TF-IDF). Pada penelitian kami melakukan beberapa konfigurasi dalam modifikasi data training untuk mengatasi imbalanced dataset yaitu dengan menggunakan metode random oversampling dan random undersampling. Dari eksperimen tersebut kami melakukan evaluasi menggunakan confusion matrix dan didapatkan hasil implementasi metode Multinomial Naive Bayes dengan modifikasi data training menggunakan random oversampling dengan rasio data testing 10% memiliki hasil yang paling bagus dengan fmeasure sebesar 0.5307.

 


Keywords


Dataset Construction; Hate Speech Classification; Imbalanced Dataset; Multinomial Naive Bayes Classifier; Term Frequency Inverse Document Frequency

Full Text:

PDF

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Jurnal Aplikasi dan Teori Ilmu Komputer



Terindex oleh:

 

  
Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.