Implementasi Text Mining untuk Analisis Opini Publik terhadap Calon Presiden Indonesia 2024

  • Gina Nur Fatimah Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
  • Ilham Faishal Mahdy Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
Keywords: calon presiden, analisis sentiment, media sosial

Abstract

Abstract. The holding of the Indonesian presidential general election in 2024, which began with the announcement of three pairs of presidential and vice-presidential candidates, was widely discussed on social media. Therefore, sentiment analysis was conducted on the three presidential candidates to determine their initial electability. Data was collected from the Twitter/X application on each candidate pair name with a total of 4.415 tweets. After going through a series of stages in data preprocessing, the number was reduced to 3.384 tweets. By conducting sentiment analysis using the VADER algorithm, it was found that the highest positive sentiment value with a result of 92.2% was on the presidential candidate pair Ganjar and Mahfud. Meanwhile, the presidential candidate pair that received the highest negative sentiment value with a result of 12.7% was Prabowo and Gibran.

Abstrak. Diselenggarakannya pemilihan umum presiden Indonesia pada tahun 2024 yang diawali dengan ditetapkannya tiga pasangan calon presiden dan calon wakil presiden, ramai diperbincangkan di media sosial. Oleh karena itu, dilakukan analisis sentiment terhadap ketiga calon presiden untuk mengetahui elektabilitas awal mereka. Data dikumpulkan dari aplikasi twitter/X pada masing-masing nama pasangan calon dengan jumlah data yang didapat sebanyak 4.415 cuitan. Setelah melalui serangkaian tahapan dalam preprocessing data, jumlahnya berkurang menjadi sebanyak 3.384 cuitan. Dengan dilakukan analisis sentimen menggunakan algoritma VADER, didapatkan bahwa hasil nilai sentimen positif tertinggi dengan hasil 92,2% yaitu pada calon pasangan presiden Ganjar dan Mahfud. Sementara itu, calon pasangan presiden yang mendapat nilai sentimen negatif tertinggi dengan hasil 12,7% yaitu pada pasangan Prabowo dan Gibran.

References

C. M. Annur, “Jumlah Pengguna Internet di Indonesia (Januari 2013-Januari 2023),” Katadata.co.id. [Daring]. Tersedia pada: https://databoks.katadata.co.id/datapublish/2023/09/20/pengguna-internet-di-indonesia-tembus-213-juta-orang-hingga-awal-2023

M. R. Fais Sya’ bani, U. Enri, dan T. N. Padilah, “Analisis Sentimen Terhadap Bakal Calon Presiden 2024 Dengan Algoritme Naïve Bayes,” JURIKOM (Jurnal Riset Komputer), vol. 9, no. 2, hlm. 265, 2022, doi: 10.30865/jurikom.v9i2.3989.

S. N. J. Fitriyyah, N. Safriadi, dan E. E. Pratama, “Analisis Sentimen Calon Presiden Indonesia 2019 dari Media Sosial Twitter Menggunakan Metode Naive Bayes,” Jurnal Edukasi dan Penelitian Informatika (JEPIN), vol. 5, no. 3, hlm. 279, 2019, doi: 10.26418/jp.v5i3.34368.

S. Elbagir dan J. Yang, “Language Toolkit and VADER Sentiment,” Proceedings of the International MultiConference of Engineers and Computer Scientists (IMECS), vol. 0958, hlm. 12–16, 2019.

H. Saif, Y. He, M. Fernandez, dan H. Alani, “Contextual semantics for sentiment analysis of Twitter,” Inf Process Manag, vol. 52, no. 1, hlm. 5–19, 2016, doi: 10.1016/j.ipm.2015.01.005.

M. Ghiassi dan S. Lee, “A domain transferable lexicon set for Twitter sentiment analysis using a supervised machine learning approach,” Expert Syst Appl, vol. 106, hlm. 197–216, 2018, doi: 10.1016/j.eswa.2018.04.006.

P. Amira Sumitro dkk., “Analisis Sentimen Terhadapat Vaksin Covid-19 di Indonesia pada Twitter Menggunakan Metode Lexicon Based”, [Daring]. Tersedia pada: https://developer.twitter.com

N. Anggraini dan H. Suroyo, “Comparison of Sentiment Analysis against Digital Payment ‘T-cash and Go-pay’ in Social Media Using Orange Data Mining,” Journal of Information Systems and Informatics, vol. 1, no. 2, hlm. 152–163, 2019, doi: 10.33557/journalisi.v1i2.21.

A. D. Sofia dan A. Kudus, “Pengelompokan Kabupaten/Kota berdasarkan Indikator Indeks Pembangunan Manusia 2022 Menggunakan K-Harmonic Means Clustering,” Jurnal Riset Statistika, vol. 3, no. 2, hlm. 163–172, Des 2023, doi: 10.29313/jrs.v3i2.3130.

J. W. Arisa dan N. Hajarisman, “Determinasi Derajat Kelangsungan Hidup Anak Menggunakan Multigroup Structural Equation Modeling,” Jurnal Riset Statistika, vol. 3, no. 2, hlm. 147–154, Des 2023, doi: 10.29313/jrs.v3i2.3047.

T. Azzahra, “Pemodelan Regresi Hurdle Negative Binomial pada Jumlah Kasus Difteri Jawa Barat 2020,” Jurnal Riset Statistika, vol. 3, no. 2, hlm. 125–130, Des 2023, doi: 10.29313/jrs.v3i2.3014.

Published
2024-08-14