Pengelompokan Rumah Tangga Berdasarkan Indikator Pembentuk Rumah Layak Huni Menggunakan Metode K-Prototypes di Provinsi Jawa Barat Tahun 2023

  • Rena Siti Nur Aliyah Hamzah 10060120042 Statistika
  • Abdul Kudus Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Islam Bandung
Keywords: K-Prototypes, Rumah Layak Huni, Pengelompokan

Abstract

Abstract. The K-Prototypes method is an effective clustering technique for handling data with mixed types. The Susenas data involving several livable housing variables has 25,890 observations, consisting of 2 numerical variables and 9 categorical variables. Therefore, the K-Prototypes method can be used to cluster this data. The purpose of this study is to cluster households based on indicators of livable houses in West Java Province in 2023. K-Prototypes combines K-Means and K-Modes, using Euclidean distance for numeric variables and Simple Matching for categorical variables. This method works similar to K-Means, which is known to be efficient and easy to implement. Cluster evaluation is conducted using the Silhouette coefficient, with the optimal number of clusters determined by a Silhouette coefficient value close to 1. The optimal results of clustering households in West Java Province in 2023 using K-Prototypes show the existence of 2 clusters, with a Silhouette coefficient value of 0.219759, while other coefficient values are lower. Cluster 1 consists of 17,330 members, most of whom are from urban areas and have good livable houses, while cluster 2 consists of 8,560 members, most of whom are from rural areas and have less livable houses.

Abstrak. Metode K-Prototypes adalah teknik pengelompokan yang efektif untuk menangani data dengan tipe campuran. Data Susenas yang melibatkan variabel rumah layak huni memiliki 25.890 pengamatan, terdiri dari 2 variabel numerik dan 9 variabel kategorik. Oleh karena itu, metode K-Prototypes dapat digunakan untuk mengelompokkan data ini. Tujuan dari penelitian ini adalah untuk mengelompokkan rumah tangga berdasarkan indikator-indikator rumah layak huni di Provinsi Jawa Barat pada tahun 2023. K-Prototypes menggabungkan K-Means dan K-Modes, menggunakan jarak Euclidean untuk variabel numerik dan Simple Matching untuk variabel kategorik. Metode ini bekerja mirip dengan K-Means, yang dikenal efisien dan mudah diterapkan. Evaluasi klaster dilakukan menggunakan koefisien Silhouette, dengan optimalnya jumlah klaster ditentukan oleh nilai koefisien Silhouette yang mendekati 1. Hasil optimal pengelompokan rumah tangga di Provinsi Jawa Barat pada tahun 2023 menggunakan K-Prototypes menunjukkan adanya 2 klaster, dengan nilai koefisien Silhouette sebesar 0,219759, sementara nilai koefisien lainnya lebih rendah. Klaster 1 terdiri dari 17.330 anggota, yang mayoritas berasal dari perkotaan dan memiliki rumah layak huni yang baik, sedangkan klaster 2 terdiri dari 8.560 anggota, sebagian besar berasal dari pedesaan dan memiliki capaian rumah layak huni yang kurang.

References

Annas S, Irwan, S RH, et al. K-Prototypes Algorithm for Clustering The Tectonic Earthquake in Sulawesi Island. Jurnal Varian 2022; 5: 191–198.

Yin S, Gan G, Valdez EA, et al. Applications of Clustering with Mixed Type Data in Life Insurance. Risks 2021; 9: 1–19.

Ganmanah M. Penerapan Algoritme K-Prototypes untuk Pengelompokkan Desa-Desa di Provinsi Jawa Barat Berdasarkan Indikator Indeks Desa Membangun Tahun 2020. Skirpsi Tidak Dipublikasikan, Universitas Islam Bandung, 2021.

Septianingsih A. Analisis K-Means Clustering Pada Pemetaan Provinsi Indonesia Berdasarkan Indikator Rumah Layak Huni. Lebesgue: Jurnal Ilmiah Pendidikan Matematika, Matematika dan Statistika 2022; 3: 224–241.

Direktorat Statistik Kesejahteraan Rakyat. Indikator Perumahan dan Kesehatan Lingkungan 2023. Jakarta, December 2023.

Harmain A, Paiman, Kurniawan H, et al. Normalisasi Data Untuk Efisiensi K-Means Pada Pengelompokan Wilayah Berpotensi Kakaran Hutan dan Lahan Berdasarkan Sebaran Titik Panas. TEKNIMEDIA 2021; 2: 83–89.

Harmouch M. 17 Types of Similarity and Dissimilarity Measures Used in Data Science. Medium.com.

Huang Z. Extensions to the k-Means Algorithm for Clustering Large Data Sets with Categorical Values. Data Mining and Knowledge Discovery 2 1998; 283–304.

Huang Z. Clustering Large Data Sets with Mixed Numeric And Categorical Values. 1997.

Nooraeni R. Metode Cluster Menggunakan Kombinasi Algoritma Cluster K-Prototype dan Algoritma Genetika Untuk Data Bertipe Campuran. Jurnal Aplikasi Statistika & Komputasi Statistik 2015; 7: 81–98.

Novidianto R, Fithriasari K. Algoritma ClusterMix K-Prototypes Untuk Menangkap Karakteristik Pasien Berdasarkan Variabel Penciri Mortalitas Pasien Dengan Gagal Jantung. Inferensi 2021; 4: 37–46.

Orisa M. Optimasi Cluster pada Algoritma K-Means. Metaverse: Peluang dan Tantangan Pendidikan Tinggi di Era Industri 50 2022; 430–437.

Published
2024-08-14