Penerapan Metode Chi-Squared Automatic Interaction Detection pada Segmentasi Karakteristik yang Mempengaruhi Pengangguran di Provinsi Banten Tahun 2022
Abstract
Abstract. This study will discuss the application of the Chi-Squared Auto Interaction Detection (CHAID) method for segmenting characteristics that affect the unemployed workforce in Banten Province in 2022. The CHAID method was introduced by Dr. G. V Kass in 1980. In the CHAID method, segmentation will be formed which divides a sample into two or more different groups/categories based on the chi-square test statistics, then the segmentation results will be displayed in a tree diagram. In this study, the variables of gender, age, education level, marital status, status in the household and regional classification will be used as independent variables with labor force status as the dependent variable, where all data are categorical types which are suitable for use in CHAID analysis. This study uses secondary data sourced from Badan Pusat Statistik (BPS), using data from the result of Survei Hasil Angkatan Kerja Nasional (SAKERNAS). The results of the CHAID segmentation in this study resulted in 8 different segments with 3 of them producing a classification of the workforce with unemployed status. Then, based on the CHAID tree diagram, it was found that there were 5 (five) independent variables, namely gender, age, education level, household status and regional classification which had a significant association with labor force status which resulted in a classification accuracy of 70.6%.
Abstrak. Dalam penelitian ini akan membahas tentang penerapan metode Chi-Squared Auto Interaction Detection (CHAID) pada segmentasi karakteristik yang mempengaruhi angkatan kerja berstatus pengangguran di Provinsi Banten tahun 2022. Metode CHAID diperkenalkan pertama kali oleh Dr. G. V Kass pada tahun 1980. Pada metode CHAID akan membentuk segmentasi yang membagi sebuah sampel menjadi dua atau lebih kelompok/kategori yang berbeda berdasarkan dengan statistik uji chi-square kemudian hasil segmentasi akan ditampilkan dalam diagram pohon. Pada penelitian ini akan menggunakan variabel jenis kelamin, usia, tingkat pendidikan, status pernikahan, status dalam rumah tangga dan klasifikasi wilayah sebagai variabel independen dengan status angkatan kerja sebagai variabel dependen, dimana semua datanya merupakan tipe kategorik yang cocok digunakan pada analisis CHAID. Penelitian ini menggunakan data sekunder yang bersumber dari Badan Pusat Statistik (BPS), yaitu data hasil Survei Angkatan Kerja Nasional (SAKERNAS). Hasil segmentasi CHAID pada penelitian ini menghasilkan 8 segmentasi yang berbeda dengan 3 segmentasi diantaranya menghasilkan klasifikasi angkatan kerja yang berstatus pengangguran. Kemudian berdasarkan diagram pohon CHAID didapatkan bahwa terdapat 5 (lima) variabel independen yaitu jenis kelamin, usia, tingkat pendidikan, status dalam rumah tangga dan klasifikasi wilayah yang mempunyai asosiasi yang signifikan dengan status angkatan kerja yang menghasilkan ketepatan klasifikasi yaitu sebesar 70,6%.
References
Aniswita, Fitri, H., Efendi, R., Sastri, L., & Rahmadani, P. (2023). Determinant of the Study Period for Mathematics Education Students at IAIN Bukittinggi Based on CHAID Method. Jurnal Iqra’: Kajian Ilmu Pendidikan, 8(1), 9-23.
Daniel, Wayne, W. (1978). Statistik Nonparametrik Terapan. Terjemahan oleh Alex Tri Kantjono W. (1989). Jakarta: Gramedia.
Fitrianto, A., Wan Muhamad, W.Z.A., & Susetyo, B. (2022). Development Of Direct Marketing Strategy for Banking Industry: The Use of a Chi-Squared Automatic Interaction Detector (CHAID) In Deposit Subscription Classification. Journal of Socioeconomics and Development, 5(1), 64-75.
Gallagher, C.A., H. M. Monroe, & J.L. Fish. (2000). An Iterative Approach to Classification Analysis (online), (https://www.casact.org/pubs/dpp/dpp90/90dpp237.pdf, diakses pada 11 Mei 2023).
Hadi, Setia Tunggal (2009). Pengantar Hukum Ketenagakerjaan Indonesia. Jakarta: Harvarindo.
Hasibuan, E.A., & Harahap, A.N. (2019). Aplikasi Metode CHAID dalam Menganalisis Kecendrungan Penelitian Skripsi Mahasiswa pada Program Studi Pendidikan Matematika. Edumatika: Jurnal Riset Pendidikan Matematika. 2(2), 89-97.
Johnson, R. A. & Wichern, D. W. (2007). Applied Multivariate Statistical Analysis - 6th edition. New Jersey: Prentice Hall.
Kass, G. V. (1980). An Exploratory Technique for Investigating Large Quantities of Categorical Data. Applied Statistics, 29 (2), 119-127.
Kunto, Y. S. & S. N. Hasana (2006). Analisis CHAID sebagai Alat Bantu Statistika untuk Segmentasi Pasar (Studi Kasus Pada Koperasi Syari’ah Alhidayah). Jurnal Manajemen Pemasaran. 1(2), 88–98.
Nisbet, R., Elder, J. & Miner, G. (2009). Handbook of Statistical Analysis and Data Mining Applications. Canada: Elsevier Inc.
Perez, F.M.D., & M. B. Cejas. (2016) CHAID Algorithm as An Appropriate Analytical Method for Tourism Market Segmentation. Journal of Destination Marketing & Management. 5, 275-282.
Siswantining, T., Maghfiroh, Kamelia, T., & Sarwinda, D. (2018). Implementation of Chi Square Automatic Interaction Detection (CHAID) Method to Identify Type 2 Diabetes Mellitus in Tuberculosis Patient. A Case Study in Cipto Mangunkusumo Hospital. Journal of Physics: Conference Series.
Struhl, Steven. (1992). Classification Tree Methods: AID, CHAID and CART (online), (https://www.quirks.com/articles/classification-tree-methods-aid-chaid-and-cart, diakses pada 28 Mei 2023).
Ye, N. (2014). Data Mining Theories, Algorithms, and Examples. Boca Raton: Taylor & Francis Group, LLC.
Fadilah, T. S., & Kudus, A. (2023). Penerapan Metode Regresi Kernel Smoothing untuk Imputasi Data Lama Waktu Terinfeksi Covid-19. Jurnal Riset Statistika, 51–60. https://doi.org/10.29313/jrs.v3i1.1802