Penerapan Metode Simple K-Medoid (SKM) dalam Mengklasterkan SMA di Kabupaten Karanganyar Tahun 2023

  • Dwi Ayu Puspita Sari 10060119034 Statistika
  • Nur Azizah Komara Rifai Fakultas MIPA, Universitas Islam Bandung
Keywords: Analisis Klaster, Medoid Shadow Value, Simple K-Medoid

Abstract

Abstract. Cluster analysis is an analysis that classifies objects that have similar characteristics into the same group. One of the most common cluster analysis methods is the non-hierarchical method where the number of clusters is determined by the researcher. Some of the methods included in non-hierarchical methods are k-means and k-medoid. The k-means method is a clustering method used for numeric variable data, while the k-medoid method can be used for mixed variable data (numeric and categorical data). The k-medoid method used for mixed variable data is the Simple K-Medoid (SKM) method. The cluster results obtained in the SKM method must be validated using the Medoid Shadow Value (MSV) to see the best number of clusters. The data used in this study comes from the Sekolah Kita website and the Basic Education Data which is mixed data consisting of 14 numerical variables and 3 binary and categorical variables. Based on the results of the SKM method clustering and cluster validation using MSV, it was found that there were 2 clusters of high schools in Karanganyar District. Cluster 1 consists of 15 high schools from 18 high schools with more complete facilities and infrastructure than cluster 2 which consists of 3 high schools from 18 high schools.

Abstrak. Analisis klaster adalah analisis yang mengklasifikasikan objek yang memiliki kesamaan karakteristik ke dalam kelompok yang sama. Salah satu metode analisis klaster yang paling umum adalah metode non hierarki di mana jumlah klaster ditentukan oleh peneliti. Beberapa metode yang termasuk ke dalam metode non hierarki adalah k-means dan k-medoid. Metode k-means adalah metode klaster yang digunakan untuk data bervariabel numerik, sedangkan metode k-medoid dapat digunakan untuk data bervariabel campuran (data numerik dan kategorik). Metode k-medoid yang digunakan untuk data bervariabel campuran adalah metode Simple K-Medoid (SKM). Hasil klaster yang didapat pada metode SKM harus divalidasi menggunakan Medoid Shadow Value (MSV) untuk melihat jumlah klaster yang terbaik. Data yang digunakan pada penelitian ini berasal dari website Sekolah Kita dan Data Pokok Pendidikan yang merupakan data campuran yakni terdiri dari 14 variabel numerik dan 3 variabel biner dan kategorik. Berdasarkan hasil dari pengelompokkan metode SKM dan validasi klaster menggunakan MSV didapatkan pengelompokkan SMA di Kabupaten Karanganyar sebanyak 2 klaster. Klaster 1 beranggotakan 15 SMA dari 18 SMA dengan memiliki sarana dan prasarana yang lebih lengkap dibandingkan klaster 2 yang beranggotakan 3 SMA dari 18 SMA.

References

S. M. Aziz and N. A. K. Rifai, “Pengelompokkan Ekspor Kopi Menurut Negara Tujuan Menggunakan Metode K-Means Clustering dengan Silhouette Coefficient,” Bandung Conference Series: Statistics, vol. 2, no. 2, p. 417, Aug. 2022, doi: 10.29313/bcss.v2i2.4536.

I. Gunawan, Pengantar Statistika Inferensial. 2016.

W. Budiaji and F. Leisch, “Simple K-Medoids Partitioning Algorithm for Mixed Variable Data,” Algorithms, vol. 12, no. 177, Sep. 2019, doi: 10.3390/a12090177.

Y. Alpian, S. W. Anggraeni, U. Wiharti, and N. M. Soleha, “Pentingnya Pendidikan bagi Manusia,” Jurna Buana Pengabdian, vol. 1, no. 1, 2019.

M. Al Kahfi and D. Widiyastuti, “Kajian Ketersediaan dan Pola Distribusi Fasilitas Pendidikan Sekolah Menengah Atas/ Sederajat di Kabupaten Karanganyar,” 2020.

Nurahman, A. Purwanto, and S. Mulyanto, “Klasterisasi Sekolah Menggunakan Algoritma K-Means Berdasarkan Fasilitas, Pendidik, dan Tenaga Pendidik,” MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer, vol. 21, no. 2, pp. 337–350, Mar. 2022, doi: 10.30812/matrik.v21i2.1411.

D. Desita, “Implementasi Metode Ensemble Robust Clustering Using Links (Rock) Untuk Klasterisasisekolah Menengah Atas (Sma)Di Bandar Lampung,” 2023.

T. Susilowati, D. Sugiarto, and I. Mardianto, “Uji Validasi AlgoritmeSelf-Organizing Map (SOM) dan K-Means untukPengelompokan Pegawai,” JURNAL RESTI, vol. 1, no. 3, p. 1172, 2017.

W. Budiaji, “Medoid-based shadow value validation and visualization,” International Journal of Advances in Intelligent Informatics, vol. 5, no. 2, pp. 76–88, Jul. 2019, doi: 10.26555/ijain.v5i2.326.

Anggi Priliani Yulianto and S. Darwis, “Penerapan Metode K-Nearest Neighbors (kNN) pada Bearing,” Jurnal Riset Statistika, vol. 1, no. 1, pp. 10–18, Jul. 2021, doi: 10.29313/jrs.v1i1.16.

Salsabila Pratiwi and Marizsa Herlina, “Pengaruh Harga Pangan terhadap Inflasi dengan Metode Vector Autoregressive Integrated Moving Average,” Jurnal Riset Statistika, pp. 87–96, Dec. 2023, doi: 10.29313/jrs.v3i2.2690.

F. Dewi, H. 1, and A. Kudus, “Penanganan Data Missing dengan Algoritma Multivariate Imputation By Chained Equations (MICE),” vol. 1, no. 1, pp. 35–42, 2023, doi: 10.29313/datamath.v1i1.25.

Published
2024-02-07