Penggunaan Metode Support Vector Machine Klasifikasi Multiclass pada Data Pasien Penyakit Tiroid
Abstract
Abstract. At first classification was used for the problem of grouping two classes, but later developed for the problem of grouping more than two classes or multiclass classification. In the multiclass classification it is assumed that each observation is grouped into only one label. Support Vector Machine (SVM) is one method used to recognize a pattern. SVM can be used for classification problems for both binary and multiclass classification. There are two types of approaches to multiclass classification, namely One Against All and One Against One. The One Against One approach builds and combines several binary classifiers, while the One Against All approach is to consider all data in one optimization formulation directly. Thyroid disease is a condition in which the shape or function of the thyroid gland is abnormal. Hyperthyroidism is a condition in which too much thyroid hormone is produced. Hypothyroidism is a condition where there is a lack of thyroid hormone production. The data used is the data of patients with thyroid disease which is sourced from the UCI Repository Of Machine Learning. The results of this study were obtained from the SVM multiclass One Against One approach with a linear kernel to predict whether the patient's thyroid class was normal (euthyroidism), hypothyroidism or hyperthyroidism. The results obtained an accuracy rate of 93.85% after the variables were first normalized. It can be concluded that in the classification process using the SVM classification method through the SVM One Against One approach, the accuracy value is better.
Abstrak. Klasifikasi adalah teknik yang berusaha untuk menentukan item dalam kelas atau kategori yang telah ditentukan. Pada awalnya klasifikasi digunakan untuk masalah pengelompokan dua kelas, tetapi kemudian berkembang untuk masalah pengelompokan lebih dari dua kelas atau klasifikasi multiclass. Dalam klasifikasi multiclass diasumsikan bahwa masing-masing pengamatan dikelompokkan hanya ke dalam satu label. Support Vector Machine (SVM) merupakan salah satu metode yang digunakan untuk mengenali suatu pola. SVM dapat digunakan untuk permasalahan klasifikasi baik untuk klasifikasi biner ataupun multiclass. Ada dua jenis pendekatan untuk klasifikasi multiclass yaitu One Against All dan One Against One. Pendekatan One Against One membangun dan menggabungkan beberapa pengklasifikasi biner, sedangkan pendekatan One Against All adalah dengan mempertimbangkan semua data dalam satu formulasi optimasi secara langsung. Penyakit tiroid adalah suatu kondisi di mana bentuk atau fungsi kelenjar tiroid tidak normal. Hipertiroidisme merupakan suatu kondisi di mana terlalu banyak hormon tiroid yang dihasilkan. Hipotiroidisme, merupakan kondisi kurangnya produksi hormon tiroid. Data yang digunakan merupakan data pasien penderita penyakit tiroid yang bersumber dari UCI Repository Of Machine Learning. Hasil dari penelitian ini didapatkan dari metode SVM multiclass pendekatan One Against One dengan kernel linier untuk menduga kelas tiroid pasien apakah normal (euthyroidism), hypothyroidism atau hyperthyroidism. Hasilnya diperoleh tingkat akurasi sebesar 93,85% setelah variabelnya terlebih dulu dinormalisasi. Dapat disimpulkan bahwa dalam proses klasifikasi dengan menggunakan metode klasifikasi SVM melalui pendekatan SVM One Against One nilai akurasi lebih baik.