Yulia Fariani UAS Komstat
Yulia Fariani UAS Komstat
Yulia Fariani1)
1)
Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sriwijaya,
Abstract
Principal Component Analysis (PCA) is a statistical technique to change from most of the original
variables used and correlated with each other, into a new set of variables that are smaller and
independent of each other (no longer correlated). To determine the relationship between the
occurrence of Baseline Histological Staging and the factors that influence it, Principal Component
Analysis or PCA is used. The variables used in this study were 29 variables, namely Age,
Gender, BMI, Fever, Vomting, Headache, Diarrhea,
Fatigue & generalized bone ache, Jaundice, Epigastric, WBC, RBC,
HGB, Plat, AST, ALT 1, ALT 4, ALT 12, ALT 24,
ALT 36, ALT 48, ALT after 24 w, RNA base, RNA 4,
RNA 12, RNA EOT, RNA EF, Baseline histological Grading, and
Baseline Histological Staging. Based on the results of the study of two 28 variables, there are 2
variables that affect basic histological staging, namely variables and
Abstrak
Principal Component Analysis (PCA) merupakan suatu teknik statistik untuk mengubah dari
sebagian besar variabel asli yang digunakan dan saling berkorelasi satu dengan yang lainnya,
menjadi satu set variabel baru yang lebih kecil dan saling bebas (tidak berkorelasi lagi). Untuk
menentukan mengetahui hubungan kejadian Baseline Histological Staging dengan faktor yang
mempengaruhinya, digunakan Principal Component Analysis atau PCA. Variabel yang
digunakan dalam penelitian ini ada 29 variabel yaitu umur, Jenis Kelamin, BMI,
Demam, muntah, Sakit kepala, Diare, Kelelahan dan nyeri tulang,
Penyakit kuning, Epigastrium, WBC, RBC, HGB, Plat,
AST, ALT 1, ALT 4, ALT 12, ALT 24, ALT 36,
ALT 48, ALT after 24 w, RNA basis, RNA 4, RNA 12, RNA
EOT, RNA EF, Staging histologi dasar, and Staging histologi dasar.
Berdasarkan hasil penelitian dari dua 28 variabel ada 2 variabel yang mempengaruhi Staging
histologi dasar yaitu variable dan
Kelenjar pencernaan yang berhubungan dengan saluran pencernaan dengan perantara ductus
dikelompokkan menjadi empat yaitu, Glandulue, Pancreas, Hepar, dan vesica fellea. system
pencernaan terdiri atas saluran pencernaan atau traktus gastrointestinalis dimulai dari cavum oris
sampai anus dan organ asesoris berupa gigi, lidah, kelenjar ludah, pancreas, hati, dan kantung
ampedu.
Dalam statistika, analisis komponen utama (AKU) dalam bahasa Inggris: principal
component analysis/PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data,
dengan cara mentransformasi data secara linier sehingga terbentuk sistem koordinat baru
dengan varians maksimum. Analisis komponen utama dapat digunakan untuk mereduksi dimensi
suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. Analisis komponen
utama juga sering digunakan untuk menghindari masalah multikolinearitas antar peubah bebas
dalam model regresi berganda.
Salah satu metode yang akan digunakan untuk mengatasi masalah tersebut adalah metode
Analisis Komponen Utama (AKU). Penggunaan metode analisis komponen utama sangat
berguna digunakan jika data yang ada memiliki jumlah variabel yang besar dan memiliki
korelasi antar variabelnya. Melalui penggunaan analisis komponen utama ini akan dihasilkan
variabel–variabel baru yang merupakan kombinasi linier dari variabelvariabel bebas asal dan
antarvariabel baru ini bersifat saling bebas. Variabel-variabel yang baru ini disebut komponen
utama, dan selanjutnya diregresikan dengan variabel tidak bebas. Penggunaan metoda PCA
sangat berguna digunakan jika data yang ada memiliki jumlah variabel yang besar dan memiliki
korelasi antar variabelnya. Selain untuk mereduksi faktor-faktor, Analisis Komponen Utama juga
dapat digunakan untuk mengatasi masalah multikolinieritas dalam Analisis Regresi Linier
Berganda.
2. TINJAUAN PUSTAKA
Metode Principal Component Analysis (PCA) ditemukan oleh Karl Pearson pada tahun 1901
yang digunakan pada bidang biologi. Pada tahun 1947 teori ini ditemukan kembali oleh
Karhunen, dan kemudian dikembangkan oleh Loeve pada tahun l963, sehingga teori ini juga
dinamakan Karhunen-Loeve transform pada bidang ilmu telekomunikasi. Principal component
analysis (PCA) merupakan suatu teknik statistik untuk mengubah dari sebagian besar variabel
asli yang digunakan yang saling berkorelasi satu dengan yang lainnya menjadi satu set variabel
baru yang lebih kecil dan saling bebas. Jadi principal component analysis (PCA) berguna untuk
mereduksi data, sehingga lebih mudah untuk menginterpretasikan data-data tersebut.
Tahun 2011, pada penelitian yang berjudul “Perbandingan Reduksi Data Menggunakan
Transformasi Cosinus Diskrit dan Analisa Komponen Utama (AKU)” Program Studi Teknik
Informatika Sekolah Tinggi Informatika dan Komputer Indonesia Malang. Dalam penelitian ini
membahas bahwa ada metode Diskrit Cosinus Transforms (DCT) untuk reduksi dimensi data
menggantikan metode Principal Component Analysis (PCA).
Tahun 2016, pada penelitian yang berjudul “Perbandingan Regresi Ridge dan Principal
Component Analysis dalam Mengatasi Multikolinearitas” Dosen pada Jurusan Matematika
Fakultas Sains dan Teknologi Universitas Istana Negeri Makassar. Membahas tentang metode
ridge lebih baik dari Principal Component Analysis (PCA) karena nilai MSE yang diteliti untuk
regresi ridge minimum dan nilai 𝑅2 besar.
3. METODE PENELITIAN
Secara umum komponen utama dapat digunakan untuk mereduksi dan menginterpretasi
variabel-variabel. Misalkan saja terdapat 𝑝 buah variabel yang terdiri atas 𝑛 buah objek.
Misalkan pula bahwa dari 𝑝 buah variabel tersebut dibuat sebanyak 𝑘 buah komponen utama
(dengan 𝑘 ≤ 𝑝) yang merupakan kombinasi linier atas 𝑝 buah variabel tersebut. 𝐾 komponen
utama tersebut, dapat menggantikan 𝑝 buah variabel yang membentuknya tanpa kehilangan
banyak informasi mengenai keseluruhan variabel. Umumnya analisis komponen utama
merupakan (analisis intermediate/analisis antara) yang berarti hasil komponen utama dapat
digunakan untuk analisis selanjutnya.
Dalam data ini menggunakan data sekunder yaitu sebanyak 100 data. Kemudian, dilakukan
pembangkitan data dengan menggunakan spss sehingga dihasilkan data sebanyak 300 yang
berdistribusi normal. Dalam proses pembangkitan data,dibutuhkan nilai rata – rata dan standar
deviasi untuk setiap variabel.
a. Uji Bartlett
Pengujian dengan uji Bartlet digunakan untuk melihat apakah matriks korelasinya merupakan
matriks identitas. Uji ini digunakan apabila sebagian besar koefisien korelasinya kurang dari 0,5.
Hipotesis :
: matriks korelasi merupakan matriks identitas
: matriks korelasi bukan matriks identitas
Statistik uji :
[ ]
Dimana :
N = Jumlah Observasi
Jumlah Variabel
Keputusan :
diterima jika
diterima jika
Tahap selanjutnya adalah melakukan uji Bartlett test of spericity yang dipakai untuk menguji
korelasi antar variabel-variabel dalam sampel. Pengujian untuk melihat apakah data yang
diperoleh layak digunakan untuk diolah yaitu dengan melihat nilai Keiser Meyer Olkin (KMO)
dan Measure Of Sampling Adequancy (MSA). Analisis faktor dianggap layak digunakan apabila
besaran KMO > 0,5 dan MSA yang digunakan untuk mengukur derajat korelasi antar variabel
dengan kriteria MSA > 0,6.
Descriptive Statistics
N Mean Std. Deviation
X1 300 44.1610 8.82118
X2 300 1.4723 .49139
X3 300 28.4074 4.02292
X4 300 1.4813 .47232
X5 300 1.5157 .50227
X6 300 1.5072 .45847
X7 300 1.5160 .49172
X8 300 1.3645 .51634
X9 300 1.4609 .50202
X10 300 1.5922 .53471
X11 300 7429.5426 2631.32567
X12 300 4468933.5123 341870.13418
X13 300 12.8991 1.73944
X14 300 162907.9302 37942.68584
X15 300 82.1034 25.89796
X16 300 81.4124 23.47248
X17 300 89.0044 26.89429
X18 300 86.6374 25.54227
X19 300 81.6680 24.56570
X20 300 88.3876 28.94659
X21 300 85.0674 26.23195
X22 300 33.6603 6.79466
X23 300 586000.0738 386331.74967
X24 300 628813.1841 320596.05012
X25 300 245650.3639 284985.15619
X26 300 222949.4589 260363.42407
X27 300 239663.5505 270199.41628
X28 300 9.9747 4.19969
Y 300 2.4286 1.16295
Valid N (listwise) 300
Anti-image Matrices
X7 X17
Anti-image Covariance X7 .999 -.029
X17 -.029 .999
a
Anti-image Correlation X7 .500 -.029
a
X17 -.029 .500
a. Measures of Sampling Adequacy(MSA)
Tabel 5. Hasil MSA 2 Variabel
4.1 Komunalitas
Nilai komunalitas berguna untuk menunjukkan variansi yang dapat ditunjukkan. Untuk
melihat nilai komunalitas pada setiap variable dapat dilihat pada Tabel 6 dibawah ini. Pada Tabel
6 dihasilkan nilai dari komunalitas untuk setiap variable sebesar 0,514 untuk variabel X10 dan
0,514 untuk variable X17.
Communalities
Initial Extraction
X7 1.000 .514
X17 1.000 .514
Extraction Method: Principal Component
Analysis.
Tabel 6. Komunalitas
Maka, dapat disimpulkan bahwa untuk variable X7 dapat menjelaskan variansi yang dapat
terbentuk sebesar 51,4%. Dan dapat menjelaskan keragaman variansi sebesar 51,4%.untuk
variabel X17.
Component Matrixa
Component
1
X7 .717
X17 .717
Extraction Method:
Principal Component
Analysis.
a. 1 components extracted.
Tabel 8. Komponen Matrik
Pada tabel 9 dihasilkan persamaan untuk faktor baru yang terbentuk sebagai berikut:
Skor – skor yang terdapat pada persamaan diatas dapat digunakan untuk menggantikan skor –
skor variabel bebas yang sebenarnya.
Component Score
Coefficient Matrix
Component
1
X7 .697
X17 .697
Extraction Method:
Principal Component
Analysis.
Rotation Method: Varimax
with Kaiser Normalization.
Component Scores.
Tabel 9. Komponen Skor Koefisien
5. KESIMPULAN
Dapat disimpulan dari hasil dengan proses pembangkitan diketahui bahwa nilai KMO sama
dengan 0,5. Kemudian nilai dari Barlett yang dihasilkan sebesar 0,248 dengan nilai signifikan
sebesar 0,619 lebih besar dari 0,05 atau 5%, maka pengujian dapat dilakukan. Dan dilihat dengan
nilai MSA yang dihasilkan maka dapat dilihat beberapa variable dapat mempengaruhi nilai Y
(Baselin histological Staging) dengan persamaan yaitu: .
DAFTAR PUSTAKA
Johnson & Wichern, “Applied Multivariate Statistical Analysis,” no. Edisi keenam, 2007.
Irwan & Hasriani, “Perbandingan Regresi Ridge dan Principal Component Analysis dalam
Miranda. Y. A. Le Borgne and G. Bontempi. Nem Routes from Minimal Approximation Error to
Principal Components, Volume 27, Number 3/June, 2008, Neural Processing Letters,
Springer.
Johnson, Richard A & Wichern, Dean W. Applied Multivariate Statistika Analysis (New Jersey:
Juanda, Bambang. Ekonometrika: Pemodelan dan Pendugaan (Bogor: IPB Press, 2009). ISBN
978-979- 493-177-6.
Iriawan, Nur, Astuti, Septin Puji. Mengelolah Data Statistik dengan mudah menggunakan
Soesilawati, P. (2022). Histologi Kedokteran Dasar. Jawa Timur: Airlangga University Press.
Husairi, A., Sanyoto, D. D., Yuliana, I., Panghiyangi, R., Anawati, & Triawanti. (2020). Sistem
Pencernaan - Tinjauan Anatomi, Histologi, Biologi dan Biokimia. Purwokerto: CV IRDH.
Ulqodry, T. Z., Bengen, D., & Kaswadji, R. (2010). Karakteristik Perairan Mangrove Tanjung Api-api
Sumatra Selatan berdasarkan sebaran parameter lingkungan perairan dengan menggunakan
analisis komponen utama. Maspari Journal, 16-21.
Ilmaniati, A., & Putro, B. E. (2018). Analisis komponen Utama Faktor-faktor Pendahulu (Antencendents)
Berbagi Pengetahuan Pada Usaha Mikro, Kecil, Dan Menengah (UMKM) Di Indonesia. Jurnal
Teknologi.
R. Susetyoko & E. Purwantini, "Teknik Reduksi Dimensi Menggunakan Komponen Utama Data
Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil".
Nurlinda. 2019. Analisis Komponen Utama. Makalah. Dikutip dari (PDF) ANALISIS KOMPONEN
Ulqodry, T. Z., Bengen, D., & Kaswadji, R. (2010). Karakteristik Perairan Mangrove Tanjung Api-api
Sumatra Selatan berdasarkan sebaran parameter lingkungan perairan dengan menggunakan
analisis komponen utama. Maspari Journal, 16-21.
Delsen, M. V., A.Z Wattimena, & S.D Saputri. (2017). Penggunaan Analisis Komponen Utama Untuk
Mereduksi Faktor-Faktor Inflansi di Kota Ambon. Barekeng, 109-118.