Pengelompokan Data Jenis Kejahatan di Indonesia Menggunakan Metode Agglomerative Hierarchical Clustering (AHC) pada Tahun 2021

  • Faustina Alifah Mardhiyah Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam
  • Marizsa Herlina Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam
Keywords: Agglomerative Hierarchical Clustering, Data Missing, Jenis Kejahatan

Abstract

Abstract. The development of technology makes it easier for the public to receive information, one of which is news abour crimes tha are occurring. This causes public unrest because many lives have been lost so people feel unsafe. This research aims to make it easier for law enforcement and the public to anticipate criminal acts. To find out the results of these objectives, the Agglomerative Hierarchical Clustering (AHC) method is used, where grouping is caried out to determine crime-prone areas. The data source used is the result of publications issued by the Central Statistics Agency. The data used is data on the number of crimes in 2021 consisting of 34 regional police forces in Indonesia where the data used is carried out by simple imputation first using the average due to missing data. Based on the results of cluster analysis of single linkage, complete linkage, average linkage, ward’s method and centroid method, 2 clusters were obtained each. The results of the cluster analysis were compared eith the k-means method which esulted in the AHC method being the best mehod eith better index values compared to k-means.

Abstrak. Berkembangnya teknologi memudahkan masyarakat dalam menerima informasi, salah satunya adalah pemberitaan mengenai tindakan kejahatan yang sedang terjadi. Hal tersebut membuat keresahan masyarakat dikarenakan banyaknya nyawa yang hilang sehingga masyarakat merasa tidak aman. Tujuan dari penelitian ini adalah untuk memudahkan penegak hukum dan masyarakat dalam melakukan antisipasi tindakan kejahatan. Untuk mengetahui hasil dari tujuan tersebut digunakanlah metode Agglomerative Hierarchical Clustering (AHC) dimana dilakukan pengelompokan dalam menentukan daerah rawan kejahatan. Sumber data yang digunakan merupakan hasil publikasi yang dikeluarkan oleh Badan Pusat Statistik. Data yang digunakan adalah data jumlah kejahatan tahun 2021 ynag terdiri dari 34 kepolisian daerah di Indonesia dimana data yang digunakan dilakukan imputasi sederhana terlebih dahulu menggunakan rata-rata dikarenakan adanya data missing. Berdasarkan hasil analisis cluster single linkage, complete linkage, average linkage, ward’s method dan centroid method masing-masing diperoleh 2 cluster. Hasil analisis cluster tersebut dibandingkan dengan metode k-means yang menghasilkan bahwa metode AHC merupakan metode terbaik dengan nilai indeks yang lebih baik dibandingkan dengan k-means.

References

Kementrian PPN/Bappenas. Sustainable Development Goals. https://sdgs.bappenas.go.id/.

Dewi, S. M., Windarto, A. P., Damanik, I. S., & Satria, H. (2019). Analisa Metode K-Means pada Pengelompokan Kriminalitas Menurut Wilayah. Seminar Nasional Sains &Teknologi Informasi (SENSASI), 620-625.

BPS. (2022). Statistik Kriminal 2022. Jakarta: Badan Pusat Statistik.

Johnson, R. A., & Wichern, D. W. (2002). Applied Multivariate Statistical Analysis. Fifth Edition. New Jersey: Prentice Hall Inc.

Hair, J. F. Jr., R. E. Anderson, R. L. Thatham, & W. C. Black. (2010). Multivariate Data Analysis Fifth Edition. New Jersey: Prentice Hall International, Inc.

Prasetyo, E. (2012). Data Mining: Konsep dan Aplikasi Menggunakan MATLAB. Yogyakarta: Penerbit Andi.

Bunkers, W. J., Miller, J. R., & DeGaetano, A. T. (1996). Definition of Climate Regions in the Northern Plains Using an Objective Cluster Modification Technique.

Acuna, E. & Rodrigues, C. (2004). The Treatment of Missing Values and its Effect is the Classifier Accuracy. Proceedings of the Meeting of the International Federation of Classification Sociaties (IFCS).

Agnesya Risnandar, & Anneke Iswani Achmad. (2023). Pemodelan Generalized Space Time Autoregressive untuk Meramalkan Indeks Harga Konsumen. Jurnal Riset Statistika, 43–50. https://doi.org/10.29313/jrs.v3i1.1792

Nur, F., 1, A., & Achmad, A. I. (2023). Perbandingan Fuzzy C-Means Clustering dan Fuzzy Possibilistic C-Means Clustering dalam Pengelompokan Kabupaten/Kota di Jawa Barat Berdasarkan Akses terhadap Sumber Air dan Sanitasi Layak Pada Tahun 2020. 1(1), 27–34. https://doi.org/10.29313/datamath.v1i1.16

Salsabila Pratiwi, & Marizsa Herlina. (2023). Pengaruh Harga Pangan terhadap Inflasi dengan Metode Vector Autoregressive Integrated Moving Average. Jurnal Riset Statistika, 87–96. https://doi.org/10.29313/jrs.v3i2.2690

Published
2024-01-21