Penerapan Sparse Principal Component Analysis dalam Menghasilkan Matriks Loading yang Sparse
DOI:
https://doi.org/10.20956/jmsk.v15i2.5713Keywords:
Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparseAbstract
Abstract
Sparse Principal Component Analysis (Sparse PCA) is one of the development of PCA. Sparse PCA modifies new variables as a linier combination of p old variables (original variable) which is yielded by PCA method. Modifying new variables is conducted by producing a loading yang sparse matrix, such that old variable which is not effective (value of loading is zero) able be exit from PCA. In this study, Sparse PCA method was applied on data of Indonesia Poverty population in 2015, that contains 13 variables and 34 observation with variable reduction such that yields 4 (four) new variables, which can explain 80.1% of total variance data. This study show, the loading matrix that has been yielded by using Sparse PCA method to become sparse with there exist 11 elements (loading value) zero entry of matrix, such that the model that has been produced to be simpler and easy to be interpreted.
Keywords: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse
Abstrak
Sparse Principal Component Analysis (Sparse PCA) merupakan salah satu pengembangan dari metode PCA. Sparse PCA memodifikasi variabel-variabel baru yang merupakan kombinasi linear dari variabel lama (variabel asli) yang dihasilkan oleh metode PCA. Pemodifikasian variabel baru ini dilakukan dengan dengan menghasilkan matriks loading yang sparse sehingga variabel lama yang tidak efektif (memiliki nilai loading sama dengan nol) dapat dikeluarkan dari model PCA. Pada penelitian ini, metode Sparse PCA diterapkan pada data Indikator Kemiskinan Penduduk Indonesia Tahun 2015 yang memuat 13 variabel dan 34 observasi dengan reduksi variabel menghasilkan 4 (empat) variabel baru yang telah mampu menjelaskan 80,1% dari total variansi data. Hasil penelitian menunjukkan, matriks loading yang dihasilkan menggunakan metode Sparse PCA menjadi sparse dengan terdapat 11 elemen (nilai loading) matriks bernilai nol sehingga model yang dihasilkan menjadi lebih sederhana dan mudah untuk diinterpretasikan.
Kata Kunci: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse
References
. Hsu, Y. L., P. Y. Huang, dan D. T. Chen., 2014. Sparse Principal Component Analysis In Cancer Research. Transl Cancer Res. 3(3): 182–190.
. Soemartini., 2012. Aplikasi Principal Component Analysis (PCA) dalam Mengatasi Multikoliniearitas Untuk Menentukan Investasi Di Indonesia Periode. 2001.1 – 2010.4. Bandung: Universitas Padjajaran.
. Rachmatin, D., 2015. Aplikasi Metode Weighted Principal Component Analysis (WPCA) dengan Software S-PLUS2000. Jurnal Penelitian Sains UNSRI. 17(2): 51-58.
. Sharma, S., 1996. Applied Multivariate Techniques. New York: John Wiley and Sons, Inc.
. Varmuza, K. dan P. Filzmoser., 2009. Introduction to Multivariate Statistical Analysis in Chemometrics. Florida: CRC Press.
. Tantular, B., 2011. Praktikum Analisis Data Multivariat II Menggunakan Software R: Modul 1 Analisis Komponen Utama. https://berthoveens.files.wordpress.com /2011/07/modul-multi.pdf dan bertho@unpad.ac.id. 20 Desember 2018(09:17).
. Hair, J.F. Jr. , Anderson, R.E., Tatham, R.L., dan Black, W.C. 1998. Multivariate Data Analysis, (5 th. Edition). Upper Saddle River, NJ: Prentice Hall.
. Zou, H., T. Hastie, dan R. Tibshirani. 2004 Sparse Principal Component Analysis. California: Department of Statistics, Stanford University.
. Ramadhini, Fitri. 2014. Penyusutan Koefisien dan Seleksi Variabel Regresi dengan Elastic Net [skripsi]. Yogyakarta: UGM.
. Cadima, J. F. dan I. T. Jolliffe, I. T. 1995. Loadings and Correlations in the interpretation of Principal Components. Journal of Applied Statistics. 22(2): 203-214.
. Zou, H., T. Hastie, dan R. Tibshirani. 2006. Sparse Principal Component Analysis. Journal of Computational and Graphical Statistics. 15(2): 265–286.
. Zou, H. dan T. Hastie. 2003. Regression Shrinkage And Selection Via The Elastic Net. California: Department of Statistics, Stanford University.
. Badan Pusat Statistik. 2015. Data Indikiator Kemiskinan Penduduk Indonesia Tahun 2015 [ditemukan pada situs http://www.bps.go.id pada 13 Februari September 2018].
Downloads
Published
Issue
Section
License
This work is licensed under a Creative Commons Attribution 4.0 International License.
Jurnal Matematika, Statistika dan Komputasi is an Open Access journal, all articles are distributed under the terms of the Creative Commons Attribution License, allowing third parties to copy and redistribute the material in any medium or format, transform, and build upon the material, provided the original work is properly cited and states its license. This license allows authors and readers to use all articles, data sets, graphics and appendices in data mining applications, search engines, web sites, blogs and other platforms by providing appropriate reference.