Penerapan Metode Regresi Komponen Utama Kernel untuk Prediksi Harga Rumah
Abstract
Abstract. Linear regression analysis is a statistical method used to model the relationship between the dependent variable and one or more independent variables expressed in the form of a regression equation. The Ordinary Least Square (OLS) can be used to estimate regression parameters. The regression parameter estimator obtained will be good if the assumptions that apply to MKT are met. One of the assumptions that must be met is that there is a linear relationship between the dependent variable and each independent variable. If linearity is violated, kernels can be used. In addition, another assumption that must be met is the absence of multicollinearity between independent variables. An alternative method that can be used to overcome multicollinearity is using Principal Component Analysis. If the linearity and multicollinearity assumptions are violated, the Kernel Principal Component Regression method can be applied. This study will apply the Kernel Principal Component Regression (KPCR) method, where the principal component is a nonlinear combination of independent variables through a kernel function. This KPCR method is implemented to predict house prices in South Jakarta based on building area, land area, number of bedrooms, number of bathrooms, and number of car capacity in the garage. Based on the results of the study, 3 main components of the kernel were formed with a prediction model Y ̂ = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2 – 291,7757 KUK3 and a coefficient of determination (R2) of 70.4640%.
Abstrak. Analisis regresi linear merupakan suatu metode statistika yang digunakan untuk memodelkan hubungan antara variabel dependen dengan satu atau lebih variabel independen yang dinyatakan dalam bentuk persamaan regresi. Dalam menaksir parameter regresi dapat menggunakan Metode Kuadrat Terkecil (MKT). Penaksir parameter regresi yang diperoleh akan baik jika asumsi-asumsi yang berlaku untuk MKT dipenuhi. Salah satu asumsi yang harus dipenuhi adalah terdapat hubungan linear antara variabel dependen dan masing-masing variabel independen. Apabila linearitas terlanggar, dapat menggunakan kernel. Selain itu, asumsi lainnya yang harus terpenuhi adalah tidak adanya multikolinearitas antar variabel independen. Metode alternatif yang dapat digunakaan untuk mengatasi multikolinearitas adalah menggunakan Analisis Komponen Utama. Apabila asumsi linearitas dan multikolinearitas terlanggar, dapat diterapkan metode Regresi Komponen Utama Kernel. Dalam penelitian ini, akan diterapkan metode Regresi Komponen Utama Kernel (RKUK), dimana komponen utama merupakan kombinasi nonlinier dari variabel independen melalui fungsi kernel. Metode RKUK ini diimplementasikan untuk memprediksi harga rumah di Jakarta Selatan berdasarkan luas bangunan, luas tanah, jumlah kamar tidur, jumlah kamar mandi, dan jumlah kapasitas mobil dalam garasi. Berdasarkan hasil penelitian, terbentuk 3 buah komponen utama kernel dengan model prediksi Y ̂ = 76,3612 + 409,5373 KUK1 + 328,4967 KUK2 – 291,7757 KUK3 serta nilai koefisien determinasi (R2) sebesar 70,4640%.
References
Hair, J. F., Black, W. C., Babin, B. J., Anderson, R. E., & Tatham, R. L. (2006). Multivariate data analysis (Vol. 6).
Härdle, W. (1994). Applied Nonparametric Regression Berlin. Cambridge University Press.
Kutner, M. H., Nachtsheim, C. J., Neter, J., & Wasserman, W. (2004). Applied linear regression models (Vol. 4). McGraw-Hill/Irwin New York.
Mika, M., Hirano, & Tsumura. (1999). Kernel Principal Component Regression in Welding Process Modeling.
Montgomery, D. C., & Peck, E. A. (1991). Introduction Linear Regression Analysis (Second Edition). John Wiley & Sons.
Rahayuningtyas, E. F., Rahayu, F. N., & Azhar, Y. (2021). Prediksi Harga Rumah Menggunakan General Regression Neural Network. Jurnal Informatika, 8(1), 59–66. https://doi.org/10.31294/ji.v8i1.9036.
Schölkopf, B., Burges, C. J. C., & Smola, A. J. (1999). Advances in kernel methods: support vector learning. MIT press.
Sun, C., & Ma, H. (2020). A Study of Complex Industrial Systems Based on Revised Kernel Principal Component Regression Method. IFAC-PapersOnLine, 53(2), 126–131. https://doi.org/10.1016/j.ifacol.2020.12.108.
Fadilah, T. S., & Kudus, A. (2023). Penerapan Metode Regresi Kernel Smoothing untuk Imputasi Data Lama Waktu Terinfeksi Covid-19. Jurnal Riset Statistika, 51–60. https://doi.org/10.29313/jrs.v3i1.1802