Anda di halaman 1dari 6

Tugas Analisis Multivariat

Modul 2

Disusun oleh:
1. Fadilah Turahma (H11111012)
2. Dwi Haryanto (H11111013)

JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS TANJUNGPURA
PONTIANAK
2014
13.7 Validitas Model Analisis Faktor
Bagi banyak ahli statistik, analisis faktor adalah kontroversial dan tidak termasuk
dalam teknik multivariat yang sah. Alasan ketidakpercayaan ini diberikan: kesulitan dalam
memilih m, banyak metode ekstraksi faktor, banyak teknik rotasi, dan subjektivitas dalam
penafsiran. Beberapa ahli statistik juga mengkritik analisis faktor karena ketidakpastian dari
faktor loading matriks Λ atau ^
Λ, catatan pertama di bagian 13.2.2.
Pertanyaan mendasar adalah apakah faktor benar-benar ada. Model (13.11) untuk
matriks kovarians adalah ∑ ¿ Λ Λ ' +Ψ atau ∑ −Ψ =¿ Λ Λ' ¿, dimana Λ Λ' adalah Rank m.
Banyak populasi memiliki matriks kovarians yang tidak mendekati pola ini kecuali m besar.
Dengan demikian model tidak akan cocok dari data populasi seperti ketika mencoba untuk
memaksakan nilai m yang kecil. Di sisi lain, untuk populasi yang mana Σ cukup dekat
dengan Λ Λ' +Ψ untuk m yang kecil, prosedur pengambilan sampel yang mengarah ke Sdapat
mengaburkan pola ini. Peneliti percaya ada faktor-faktor yang mendasari tetapi memiliki
kesulitan mengumpulkan data yang akan mengungkapkan mereka. Dalam banyak kasus,
masalah dasarnya adalah bahwa S (atau R ¿ berisi struktur dan kesalahan, dan metode
analisis faktor tidak dapat memisahkan keduanya.
Seorang konsultan statistik dalam lingkungan universitas atau di tempat lain terlalu
sering mengikuti skenario. Seorang peneliti desain kuesioner yang panjang, dengan jawaban
yang akan diberikan, katakanlah, lima poin skala diferensial semantik atau skala likert. Para
responden, yang bervariasi dalam sikap dari tertarik untuk marah, buru-buru menandai
jawaban bahwa dalam banyak kasus tidak respon subjektif bahakan baik untuk pertanyaan-
pertanyaan. Kemudian peneliti menyampaikan hasilnya ke program analisis faktor. Menjadi
kecewa dalam haasil, hal ini menarik bagi seorang ahli statistik untuk membantu. Mereka
berusaha untuk meningkatkan hasil dengan mencoba berbagai metode ekstraksi, rotasi yang
berbeda, nilai yang berbeda dari m, dan sebagainya. Tapi itu semua sia-sia. Scree plot yang
lebih mirip kaki dari tebing curam dengan landai puing-puing di bagian bawah. Tidak ada
nilai m yang jelas. Mereka harus mengambil 10 atau 12 faktor untuk memperhitungkan,
misalnya 60% dari varians, dan interpretasi sejumlah ini merupakan faktor sia-sia. Jika
beberapa dimensi yang mendasari ada, mereka benar-benar tertutup oleh kedua kesalahan
sistematis dan acak dalam menandai kuesioner. Sebuah model analisis faktor hanya tidak
cocok untuk satu set data tersebut, kecuali nilai m yang besar digunakan, yang memberikan
hasil yang berguna.
Hal ini belum tentu “discreteness” dari data yang menyebabkan masalah, tetapi
“noisiness” dari data. Variabel yang ditentukan tidak diukur secara akurat. Dalam beberapa
kasus, variabel diskrit menghasilkan hasil yang memuaskan, seperti dalam contoh 13.3.1,
13.3.2, 13.5.2a, dan 13.5.2b (a), dimana seorang gadis 12 tahun, menanggapi hati-hati untuk
skala diferensial semantik, menghasilkan data yang mengarah ke analisis faktor ambigu. Di
sisi lain, variabel kontinu tidak menjamin hasil yang baik [lihat contoh 13.7 (a)].
Dalam kasus-kasus dimana beberapa faktor yang menemukan bahwa memberikan
kecocokan yang memuaskan untuk data, kita harus tetap tentatif dalam penafsiran sampai kita
secara independen dapat menetapkan adanya faktor. Jika faktor-faktor yang sama muncul
dalam pengambilan sampel berulang dari populasi yang sama atau yang serupa, maka kita
dapat memiliki keyakinan bahwa penerapan model telah menemukan beberapa faktor yang
nyata. Jadi itu adalah praktik yang baik untuk mengulangi percobaan untuk memeriksa
stabilitas faktor. Jika himpunan data yang cukup besar, itu bisa terbagi dua dan analisis faktor
dilakukan pada tiap babak. Dua solusi dapat dibandingkan satu sama lain dengan solusi untuk
set lengkap.
Jika ada repliksi dalam kumpulan data, mungkin akan membantu untuk rata-rata
selama ulangan. Hal ini dilakukan untuk keuntungan besar pada contoh 13.6, dimana
beberapa hakim dinilai suara-suara yang sama. Rata-rata lebih menghasilkan variabel yang
ternyata memiliki noise yang sangat rendah. Eksperimen serupa dengan hakim yang berbeda
selalu menghasilkan faktor yang sam. Sayangnya, replikasi jenis ini tidak tersedia dalam
kebanyakan situasi.
Seperti dengan teknik lain dalam buku ini, analisis faktor mengasumsikan bahwa
variabel setidaknya hampir linear berhubungan satu sama lain. Kita bisa membuat scater plot
bivariat untuk memriksa asumsi ini.
Sebuah prasyarat dasar untuk aplikasi analisis faktor adalah bahwa variabel tidak
bebas. Untuk memeriksa persyaratan ini, kita bisa menguji H 0 :P p=I , dengan menggunakan
tes dalam bagian 7.4.3.
Beberapa penulis telah menyarankan bahwa R−1 harus menjadi near-diagonal matrix
agar berhasil sesuai model analisis faktor.Untuk menilai seberap dekat R−1 adalah matriks
diagonal, Kaiser (1970) mengusulkan ukuran kecukupan sampling,

∑ r ij2
i≠ j
MSA= , (13.60)
∑ r +∑ qij 2
ij
2

i≠ j i≠ j

dimana r ij 2 adalah merupakan kuadrat dari sebuah elemen dari R dan q ij2 adalah merupakan
1 −1
[ ]
kuadrat dari sebuah elemen dari Q¿ D R−1 D , dengan D= ( diag R−1) 2 . R−1 merupakan
Pendekatan matriks diagonal, MSA mendekati 1. Kaisar dan Rice (1974) menunjukkan
bahwa MSA boleh melebihi 0,8 untuk hasil yang diharapkan. Kami menunjukkan beberapa
hasil untuk MSA dalam contoh 13.7(b).
Singkatnya, ada banyak data set yang analisis faktor tidak harus diterapkan. Salah satu
indikasi bahwa R tidak pantas adalah kegagalan metode dalam bagian 13.4 dengan jelas dan
agak obyektif memilih nilai m . Jika scree plot tidak memiliki tikungan atau nilai eigen tidak
menunjukkan kesenjangan yang besar sekitar 1, maka R kemungkinan tidak sesuai untuk
anjak piutang. Selain itu, komunalitas memperkirakan setelah anjak harus cukup besar.
Untuk menyeimbangkan “baik” contoh dalam bab ini, kita sekarang memberikan
contoh yang melibatkan kumpulan data yang tidak dapat berhasil dimodelkan dengan analisis
faktor. Demikian juga, masalah pada akhir bab ini mencakup “baik” dan “buruk” set data.
Contoh 13.7(a). Sebagai gambaran aplikasi analisis faktor yang kurang berhasil
daripada contoh sebelumnya dalam bab ini, kita mempertimbangkan data diabetes dari Tabel
3.6. Korelasi matriks untuk lima variabel adalah sebagai berikut.
1 0,05 −0,13 0,07 0,21

(0,05 1
R= −0,13 −0,01
0,07
−0,1 0 ,01 −0,10
1 0,29 0,05
0,01 0,29 1 0,21
0,21 −0,01 0,05 0,21 1
)
Korelasi semua kecil dan variabel tampaknya tidak memiliki banyak kesamaan. Nilai
MSA 0,49. Nilai eigen adalah 1,40, 1,21, 1,04, 0,71, dan 0,65. Tiga faktor akan diperlukan
untuk memperhitungkan 73% dari varians dan empat faktor untuk mencapai 87%. Ini bukan
pengurangan berguna dalam dimensi. Nilai eigen di plot dalam grafik sree plot pada gambar
13.7. Kurangnya nilai m yang jelas.

Hal ini terbukti dari korelasi kecil di R bahwa communalities variabel tidak akan
besar. Metode komponen utama yang pada dasarnya memperkirakan communalities awal
sebagai 1, memberikan perkiraan komunalitas akhir yang sangat berbeda daripada metode
iterasi faktor utama.
Komunalitis
metode komponen utama 0.71 0.9 0.71 0.6 0.64
1 7
Metode iterasi faktor komponen 0.31 0.1 0.35 0.3 0.33
6 7

Komunalitis diperoleh dengan pendekatan iterasi mencerminkan lebih akurat korelasi


kecil antar variabel-variabel.
The varimax diputar faktor loadings selama tiga faktor diekstraksi dengan metode
faktor utama iterasi diberikan dalam Tabel 13.11. Faktor pertama adalah terkait dengan
variabel 3 dan 4, faktor kedua dengan variables1and 5, dan yang ketiga dengan variabel
variabel Rotated loading communalities
f1 f2 f3
1 -0.08 0.54 0.12 0.31
2 0.01 0.01 0.40 0.16
3 0.57 -0.15 -0.03 0.35
4 0.57 0.22 0.2 0.37
5 0.19 0.47 -0.27 0.33
Variance 0.69 0.59 0.24 1.52
accounted for

Ini pengelompokan variabel dapat dilihat pada R, di mana variabel 1 dan 5 memiliki
korelasi 0,21, variabel 3 dan 4 memiliki korelasi 0,29, dan variabel 2 memiliki korelasi yang
sangat rendah dengan semua variabel lainnya. Namun, korelasi ini (0,21 dan 0,29) kecil, dan
dalam hal ini runtuh dari lima variabel untuk tiga faktor tidak pengurangan berguna dalam
dimensi, terutama sejak tiga nilai eigen account untuk only73% oftr (R). The 73% tidak
meyakinkan lebih besar dari 60%, yang akan kita harapkan dari tiga variabel asli dipilih
secara acak. Kesimpulan ini ditanggung oleh uji H 0: Pρ = I. Menggunakan (7.37) dan (7.38),
kita memperoleh:
u=|R|=0.90276 v=20−1=19 p=5

1 15
u' =−[v− (2 p+5)] ln u=− 19−
6 (
6 )
(−0.2197 )=3.625

Dengan derajat kebebasan, nilai kritis 0,05 untuk uji χ2 perkiraan ini adalah 18,31,
dan kita tidak memiliki dasar untuk mempertanyakan independensi dari lima variabel.
Dengan demikian tiga faktor yang kami peroleh sangat mungkin sebuah artefak dari sampel
ini dan tidak akan muncul dalam sampel lain dari populasi yang sama.
Contoh 13.7(b). Untuk set data yang digunakan dalam contoh sebelumnya dalam bab
ini, nilai-nilai MSA dari (13.60) dihitung sebagai berikut:
Data seishu : MSA = 0.53
Data Sons : MSA = 0.82
Data Voice : MSA = 0.73
Data diabetes : MSA =0.49
Nilai MSA tidak dapat dihitung untuk data persepsi, karena R adalah tunggal. Hasil
ini tidak menyarankan keyakinan besar dalam indeks MSA sebagai satu-satunya panduan
untuk kesesuaian R untuk anjak piutang. Kita melihat berbagai perbedaan dalam nilai-nilai
MSA untuk pertama tiga set data. Namun ketiga faktor sukses menghasilkan analisis. Ketiga
nilai MSA tampaknya berbanding terbalik dengan sejumlah faktor: Dalam data anak, ada
indikasi bahwa salah satu faktor akan cukup; data suara dengan jelas memiliki dua faktor; dan
untuk data Seishu, ada empat faktor. The MSA untuk data diabetes dekat dengan yang dari
data Seishu. Namun data diabetes benar-benar tidak cocok untuk analisis faktor, di mana
sebagai analisis faktor ofthe Data Seishu sangat meyakinkan.
13.8 Hubungan Faktor Analisis Terhadap Analisis Komponen Utama
Analisis faktor dan analisis komponen utama memiliki tujuan mengurangi dimensi.
Karena tujuan yang sama, banyak penulis membahas pokok analisis komponen utama sebagai
jenis lain dari analisis faktor. Hal ini dapat membingungkan, dan kami ingin
menggarisbawahi karakteristik yang membedakan dari dua teknik.
Dua perbedaan antara analisis faktor dan analisis komponen utama yang disebutkan
dalam Bagian 13.1: (1) Dalam analisis faktor, variabel dinyatakan sebagai kombinasi linear
dari faktor-faktor, sedangkan analisis komponen utama adalah adalah fungsi linear dari
variabel-variabel, dan (2) dalam analisis komponen utama, penekanannya adalah menjelaskan
total variansi ∑ s ii, sebagai kontras dengan upaya untuk menjelaskan kovarians dalam
i
analisis faktor.
Perbedaan lain adalah bahwa (3) analisis komponen utama pada dasarnya tidak ada
asumsi, sedangkan analisis faktor membuat beberapa asumsi utama; (4) komponen utama
yang unik (dengan asumsi nilai eigen yang berbeda dari S), sedangkan faktor yang dikenakan
rotasi sewenang-wenang; dan (5) jika kita mengubah sejumlah faktor, (diperkirakan) faktor
berubah. Hal ini tidak terjadi dalam komponen utama.
Kemampuan untuk merotasi, untuk meningkatkan interpretability adalah salah satu
keuntungan dari analisis faktor daripada analisis komponen utama. Jika menemukan dan
menjelaskan beberapa faktor yang mendasari tujuan, analisis faktor mungkin terbukti lebih
berguna daripada analisis komponen utama. Kita akan lebih suka analisis faktor jika model
faktor sesuai dengan data yang sebenarnya dan kita akan suka untuk menginterpretasikan
faktor rotasi. Di sisi lain, jika kita ingin mendefinisikan sebuah variabel kecil untuk diinput
ke dalam analisis yang lain, kami akan biasa memilih analisis komponen utama, meskipun
terkadang hal ini bisa dicapai dengan nilai faktor.

Anda mungkin juga menyukai