Penerapan Sparse Principal Component Analysis dalam Menghasilkan Matriks Loading yang Sparse

Authors

  • Georgina M. Tinungki
  • Nurtiti Sunusi

DOI:

https://doi.org/10.20956/jmsk.v15i2.5713

Keywords:

Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse

Abstract

Abstract Sparse Principal Component Analysis (Sparse PCA) is one of the development of  PCA. Sparse PCA modifies new variables as a linier combination of  p old variables (original variable) which  is yielded by PCA method. Modifying new variables is conducted by producing a loading yang sparse matrix, such that old variable which is not effective (value of loading is zero) able be exit from PCA.  In this study, Sparse PCA method was applied on data of Indonesia Poverty population in 2015, that contains 13 variables and 34 observation with variable reduction such that yields 4 (four) new variables, which can explain 80.1% of total variance data. This study show, the loading matrix that has been yielded by using Sparse PCA method to become sparse with there exist 11 elements (loading value) zero entry of matrix, such that the model that has been produced to be simpler and easy to be interpreted. Keywords:  Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse Abstrak Sparse Principal Component Analysis (Sparse PCA) merupakan salah satu pengembangan dari metode PCA. Sparse PCA memodifikasi variabel-variabel baru yang merupakan kombinasi linear dari  variabel lama (variabel asli) yang dihasilkan oleh metode PCA. Pemodifikasian variabel baru ini dilakukan dengan dengan menghasilkan matriks loading yang sparse sehingga variabel lama yang tidak efektif (memiliki nilai loading sama dengan nol) dapat dikeluarkan dari model PCA. Pada penelitian ini, metode Sparse PCA diterapkan pada data Indikator Kemiskinan Penduduk Indonesia Tahun 2015 yang memuat 13 variabel dan 34 observasi dengan reduksi variabel menghasilkan 4 (empat) variabel baru yang telah mampu menjelaskan 80,1% dari total variansi data. Hasil penelitian menunjukkan, matriks loading yang dihasilkan menggunakan metode Sparse PCA menjadi sparse dengan terdapat 11 elemen (nilai loading) matriks bernilai nol sehingga model yang dihasilkan menjadi lebih sederhana dan mudah untuk diinterpretasikan. Kata Kunci: Principal Component Analysis, Sparse Principal Component Analysis, reduksi dimensi, matriks loading yang sparse

Downloads

Download data is not yet available.

References

. Hsu, Y. L., P. Y. Huang, dan D. T. Chen., 2014. Sparse Principal Component Analysis In Cancer Research. Transl Cancer Res. 3(3): 182–190.

. Soemartini., 2012. Aplikasi Principal Component Analysis (PCA) dalam Mengatasi Multikoliniearitas Untuk Menentukan Investasi Di Indonesia Periode. 2001.1 – 2010.4. Bandung: Universitas Padjajaran.

. Rachmatin, D., 2015. Aplikasi Metode Weighted Principal Component Analysis (WPCA) dengan Software S-PLUS2000. Jurnal Penelitian Sains UNSRI. 17(2): 51-58.

. Sharma, S., 1996. Applied Multivariate Techniques. New York: John Wiley and Sons, Inc.

. Varmuza, K. dan P. Filzmoser., 2009. Introduction to Multivariate Statistical Analysis in Chemometrics. Florida: CRC Press.

. Tantular, B., 2011. Praktikum Analisis Data Multivariat II Menggunakan Software R: Modul 1 Analisis Komponen Utama. https://berthoveens.files.wordpress.com /2011/07/modul-multi.pdf dan bertho@unpad.ac.id. 20 Desember 2018(09:17).

. Hair, J.F. Jr. , Anderson, R.E., Tatham, R.L., dan Black, W.C. 1998. Multivariate Data Analysis, (5 th. Edition). Upper Saddle River, NJ: Prentice Hall.

. Zou, H., T. Hastie, dan R. Tibshirani. 2004 Sparse Principal Component Analysis. California: Department of Statistics, Stanford University.

. Ramadhini, Fitri. 2014. Penyusutan Koefisien dan Seleksi Variabel Regresi dengan Elastic Net [skripsi]. Yogyakarta: UGM.

. Cadima, J. F. dan I. T. Jolliffe, I. T. 1995. Loadings and Correlations in the interpretation of Principal Components. Journal of Applied Statistics. 22(2): 203-214.

. Zou, H., T. Hastie, dan R. Tibshirani. 2006. Sparse Principal Component Analysis. Journal of Computational and Graphical Statistics. 15(2): 265–286.

. Zou, H. dan T. Hastie. 2003. Regression Shrinkage And Selection Via The Elastic Net. California: Department of Statistics, Stanford University.

. Badan Pusat Statistik. 2015. Data Indikiator Kemiskinan Penduduk Indonesia Tahun 2015 [ditemukan pada situs http://www.bps.go.id pada 13 Februari September 2018].

Downloads

Published

2018-12-20