Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Sentimen Genosida Palestina Menggunakan Multinomial Naive Bayes

  • Fajar Sidik Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
  • Ilham Faishal Mahdy Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
Keywords: Genosida, Multinomial Naive Bayes, Palestina

Abstract

Abstract. Social media, including the X platform (formerly known as Twitter), has become an important source of information in understanding public sentiment towards various issues, including the Palestinian genocide. Text data obtained from social media is often unbalanced, with more negative sentiment than positive and neutral sentiment because people do not agree with the genocide. This imbalance can interfere with the accuracy of the sentiment classification model. Therefore, this research aims to overcome the problem of data imbalance by applying the SMOTE (Synthetic Minority Over-sampling Technique) method in the sentiment classification of the Palestinian genocide using the Multinomial Naive Bayes algorithm. The data used in this study was collected from X social media platform, consisting of 1000 posts related to the Palestinian genocide taken backward on February 29, 2024. The classification method used is Multinomial Naive Bayes, which was chosen for its ability to handle text data by considering the frequency of occurrence of words. The results showed that the sentiment analysis mostly showed negative sentiments towards the Palestinian genocide issue. The application of SMOTE successfully balanced the data distribution, increasing the representation of positive and neutral sentiments. Model performance evaluation shows that the resulting model is able to achieve an accuracy rate of 80%, with a precision of 43%, recall of 54%, and F1-score of 46%. In conclusion, the application of SMOTE can optimize text classification performance in unbalanced data conditions, providing more insight into public sentiment towards the Palestinian genocide on X social media.

Abstrak. Media sosial, termasuk platform X (sebelumnya dikenal sebagai Twitter), telah menjadi sumber informasi yang penting dalam memahami sentimen masyarakat terhadap berbagai isu, termasuk genosida Palestina. Data teks yang diperoleh dari media sosial seringkali tidak seimbang, adanya kecenderungan lebih banyak sentimen negatif dibandingkan sentimen positif dan netral karena masyarakat tidak setuju dengan adanya genosida. Ketidakseimbangan ini dapat mengganggu keakuratan model klasifikasi sentimen. Oleh karena itu, penelitian ini bertujuan untuk mengatasi masalah ketidakseimbangan data dengan menerapkan metode SMOTE (Synthetic Minority Over-sampling Technique) dalam klasifikasi sentimen genosida Palestina menggunakan algoritma Multinomial Naive Bayes. Data yang digunakan dalam penelitian ini dikumpulkan dari platform media sosial X, terdiri dari 1000 post terkait genosida Palestina yang diambil mundur pada tanggal 29 Februari 2024. Metode klasifikasi yang digunakan adalah Multinomial Naive Bayes, yang dipilih karena kemampuannya dalam menangani data teks dengan mempertimbangkan frekuensi kemunculan kata-kata. Hasil penelitian menunjukkan bahwa analisis sentimen mayoritas menunjukkan sentimen negatif terhadap isu genosida Palestina. Penerapan SMOTE berhasil menyeimbangkan distribusi data, meningkatkan representasi sentimen positif dan netral. Evaluasi kinerja model menunjukkan bahwa model yang dihasilkan mampu mencapai tingkat akurasi sebesar 80%, dengan precision sebesar 43%, recall sebesar 54%, dan F1-score sebesar 46%. Kesimpulannya, penerapan SMOTE dapat mengoptimalkan performa klasifikasi teks dalam kondisi data yang tidak seimbang, memberikan wawasan lebih mengenai sentimen masyarakat terhadap genosida Palestina di media sosial X.

References

Abbas, M., Ali, K., Jamali, A., Ali Memon, K., & Aleem Jamali, A. (2019). Multinomial Naive Bayes Classification Model for Sentiment Analysis. IJCSNS International Journal of Computer Science and Network Security, 19(3), 62. https://doi.org/10.13140/RG.2.2.30021.40169Djaslim S. Intisari Pemasaran dan Unsur-unsur Pemasaran. Bandung: Linda Karya; 2003.

Rifki Eliandy, R., Heriadi, M., Riskinta Tumanggor, E., & Aini Hasibuan, E. (2023). Konflik Palestina Dengan Israel. Jurnal Pendidikan Ilmu Pengetahuan Sosial (JPIPS), 1, 106–112. http://e-journal.upr.ac.id/index.php/JP-IPSA. Shimp T. Periklanan Promosi: Aspek Tambahan Komunikasi Pemasaran Terpadu. 5th ed. Jakarta: Erlangga; 2000.

Jaramaya, R., & Maharani, E. (2022, September 1). republika. Retrieved December 18, 2023, from https://internasional.republika.co.id/berita/rhi92t335/pbb-sekolah-anakanak-palestina-terancam-digusurisrael

Persada Pulungan, M., Purnomo, A., Kurniasih, A., Tinggi Ilmu Manajemen dan Ilmu Komputer ESQ, S., & Korespondensi, P. (2023). PENERAPAN SMOTE UNTUK MENGATASI IMBALANCE CLASS DALAM KLASIFIKASI KEPRIBADIAN MBTI MENGGUNAKAN NAIVE BAYES CLASSIFIER APPLICATION OF SMOTE TO OVERCOME CLASS IMBALANCE IN THE MBTI PERSONALITY CLASSIFICATION USING THE NAÏVE BAYES CLASSIFIER. 10(7), 1493–1502. https://doi.org/10.25126/jtiik.2023107989

Nabilla. (2023). ANALISIS SENTIMEN REVIEW APLIKASI MYPERTAMINA TUGAS AKHIR.

Dwi Indriyanti, A., & Fadhilah, P. N. (2023). Analisis Sentimen terhadap Opini Publik Mengenai Childfree dalam Pernikahan pada Twitter Menggunakan K-Nearest Neighbor (K-NN). Journal of Informatics and Computer Science, 05.

Hasibuan, E., & Heriyanto, E. A. (2022). ANALISIS SENTIMEN PADA ULASAN APLIKASI AMAZON SHOPPING DI GOOGLE PLAY STORE MENGGUNAKAN NAIVE BAYES CLASSIFIER. JTS, 1(3).

WIJAYANTI, N. P. Y. T., N. KENCANA, E., & SUMARJAYA, I. W. (2021). SMOTE: POTENSI DAN KEKURANGANNYA PADA SURVEI. E-Jurnal Matematika, 10(4), 235. https://doi.org/10.24843/mtk.2021.v10.i04.p348

Manning. (2009). An Introduction to Information Retrieval. Cambridge: Cambridge University Press.

Herlinawati, N., Yuliani, Y., Faizah, S., Gata, W., Komputer STMIK Nusa Mandiri Jl Damai No, I., Jati Barat, W., & Selatan, J. (2020). ANALISIS SENTIMEN ZOOM CLOUD MEETINGS DI PLAY STORE MENGGUNAKAN NAÏVE BAYES DAN SUPPORT VECTOR MACHINE (Vol. 5, Issue 2).

Cholid, F. (2023). Perbandingan Geographically Weighted Regression dengan Mixed Geographically Weighted Regression. Statistika, 23(2), 96–109. https://doi.org/10.29313/statistika.v23i2.1700

Ikhsanudin, Istiyono, E., & Syamsuddin, S. (2023). Efek Besaran Simpangan Baku Sampel terhadap Nilai Residu dalam Analisis Regresi Berganda Tiga Variabel Bebas. Statistika, 23(2), 88–95. https://doi.org/10.29313/statistika.v23i2.1661

Zulfan, Radhiah, Usman, T., Zuhra, R., Nazaruddin, & Marzuki. (2023). Pengaruh Pandemi Covid-19 terhadap Prestasi Mahasiswa Fakultas MIPA Universitas Syiah Kuala. Statistika, 23(2), 110–115. https://doi.org/10.29313/statistika.v23i2.1714

Published
2024-08-09