NIM : 20081032
3. Pedoman apa yang dapat Anda gunakan untuk menentukan jumlah faktor yang akan
diambil? Jelaskan masing-masing secara singkat.
Jawab:
Bagaimana kita memutuskan jumlah faktor yang akan diekstraksi? Kedua metode analisis
faktor tertarik pada kombinasi variabel linier terbaik, yakni paling baik dalam arti bahwa
kombinasi tertentu dari variabel asli menyumbang lebih banyak varians dalam data secara
keseluruhan daripada kombinasi variabel linier lainnya. Oleh karena itu, faktor pertama
dapat dilihat sebagai ringkasan tunggal terbaik dari hubungan linier yang diperlihatkan
dalam data. Faktor kedua didefinisikan sebagai kombinasi linier terbaik kedua dari
variabel, tunduk pada batasan bahwa itu ortogonal dengan faktor pertama.
Menjadi ortogonal untuk faktor pertama, faktor kedua harus diturunkan hanya dari varian
yang tersisa setelah faktor pertama diekstraksi. Dengan demikian, faktor kedua dapat
didefinisikan sebagai kombinasi linier dari variabel yang menyumbang sebagian besar
varian yang masih belum dapat dijelaskan setelah pengaruh faktor pertama telah dihapus
dari data. Proses terus mengekstraksi faktor-faktor yang menghitung jumlah varian yang
semakin kecil hingga semua varian dijelaskan. Misalnya, metode komponen sebenarnya
mengekstrak n faktor, di mana n adalah jumlah variabel dalam analisis. Jadi, jika 30
variabel di analisis, 30 faktor diekstraksi.
Jadi, apa yang diperoleh dari analisis faktor eksplorasi. Dalam contoh kami dari 30
variabel gambar toko di mana 30 faktor diekstraksi, faktor pertama diharapkan akan
menjelaskan porsi yang cukup besar dari varians sehingga peneliti dapat mempertahankan
hanya sejumlah kecil faktor untuk secara memadai mewakili varians dari seluruh
himpunan variabel. Pertanyaan kuncinya adalah: Berapa banyak faktor yang harus
diekstraksi atau dipertahankan
Dalam memutuskan kapan harus berhenti memfaktorkan (yaitu, berapa banyak faktor
yang akan diekstraksi), peneliti harus menggabungkan landasan konseptual (Berapa
banyak faktor yang harus ada dalam struktur?) Dengan beberapa bukti empiris (Berapa
banyak faktor yang dapat didukung secara wajar?). Peneliti umumnya mulai dengan
beberapa kriteria yang telah ditentukan, seperti jumlah umum faktor ditambah beberapa
ambang umum relevansi praktis (misalnya, persentase varian yang diperlukan dijelaskan).
Kriteria ini digabungkan dengan ukuran empiris dari struktur faktor. Dasar kuantitatif
yang pasti untuk menentukan jumlah faktor yang akan diekstraksi belum dikembangkan.
Keputusan tentang jumlah faktor yang akan dipertahankan harus didasarkan pada
beberapa pertimbangan:
Penggunaan beberapa kriteria penghentian untuk menentukan jumlah awal faktor yang
harus dipertahankan:
- Faktor dengan nilai eigen lebih besar dari 1.0.
- Sejumlah faktor yang telah ditentukan berdasarkan tujuan penelitian dan / atau
penelitian sebelumnya.
- Faktor-faktor yang cukup untuk memenuhi persentase varian tertentu yang
dijelaskan, biasanya 60 persen atau lebih tinggi.
- Faktor yang ditunjukkan oleh uji scree memiliki sejumlah besar varian umum
(yaitu, faktor sebelum titik belok).
- Faktor-faktor di atas ambang batas ditetapkan dengan analisis paralel.
Lebih banyak faktor ketika heterogenitas hadir di antara subkelompok sampel.
Pertimbangan beberapa solusi alternatif (satu faktor lebih banyak dan satu faktor
kurang dari solusi awal) untuk memastikan struktur terbaik teridentifikasi.
4. Bagaimana Anda menggunakan matriks pemuatan faktor untuk menafsirkan arti faktor?
Jawab:
Tidak ada satu cara terbaik untuk mendefinisikan struktur sederhana, tetapi Thurstone
menguraikan beberapa pedoman umum yang jika tercapai memberikan solusi faktor yang
mudah diinterpretasikan:
a. Setiap variabel: harus memiliki setidaknya satu pemuatan yang sangat rendah / low
loading (di bawah ± 0,10).
b. Setiap faktor: harus memiliki beban yang sangat rendah sebanyak beberapa faktor.
c. Setiap pasangan faktor:
Sebuah variabel yang memiliki signifikan loading (lebih besar dari 0,3 atau 0,4)
pada satu faktor dan sangat rendah pada faktor lainnya.
Persentase besar dari beban yang sangat rendah pada setiap faktor bila ada
empat atau lebih faktor.
Relatif sedikit beban silang (yaitu, variabel dengan beban signifikan pada setiap
faktor).
Singkatnya, ide dasar dari struktur sederhana adalah:
● setiap variabel memiliki loading yang tinggi / signifikan pada satu faktor saja, dan
● setiap faktor memiliki loading yang tinggi / signifikan hanya untuk sebagian item.
Mencapai struktur sederhana dalam banyak kasus tidak sepenuhnya dicapai, tetapi selalu
merupakan tujuan yang diinginkan untuk meningkatkan interpretabilitas. Dalam semua
kasus, ini membutuhkan kombinasi penerapan kriteria obyektif dengan pertimbangan
manajerial. When would the researcher use an oblique rotation instead of an orthogonal
rotation? What are the basic differences between them? . Kapan peneliti menggunakan
rotasi miring daripada rotasi ortogonal? Apa perbedaan mendasar di antara keduanya?
5. Apa kriteria yang digunakan dalam menentukan variabel yang akan mewakili suatu faktor
(misalnya, digunakan untuk menamai faktor itu)?
Jawab:
Jika tujuan peneliti hanya untuk mengidentifikasi variabel yang sesuai untuk aplikasi
selanjutnya dengan teknik statistik lainnya, peneliti memiliki pilihan untuk memeriksa
matriks faktor dan memilih variabel dengan loading faktor tertinggi pada setiap faktor
untuk bertindak sebagai variabel pengganti yang mewakili faktor itu. Pendekatan ini
sederhana dan langsung hanya jika satu variabel memiliki loading faktor yang secara
substansial lebih tinggi daripada semua loading faktor lainnya. Namun, dalam banyak
kasus, proses pemilihan lebih sulit karena dua atau lebih variabel memiliki loading yang
signifikan dan cukup dekat satu sama lain, namun hanya satu yang dipilih sebagai
perwakilan dari dimensi tertentu. Keputusan ini harus didasarkan pada pengetahuan teori
apriori peneliti yang mungkin menyarankan bahwa satu variabel lebih dari yang lain
secara logis akan mewakili dimensi. Selain itu, peneliti mungkin memiliki pengetahuan
yang menunjukkan bahwa variabel dengan loading sedikit lebih rendah sebenarnya lebih
dapat diandalkan daripada variabel pembebanan tertinggi.
Faktor mewakili gabungan dari banyak variabel. Ketika solusi faktor yang dapat diterima
telah diperoleh dimana semua variabel memiliki loading yang signifikan pada suatu
faktor, peneliti mencoba untuk memberikan beberapa makna pada pola faktor loading.
Variabel dengan loading lebih tinggi dianggap lebih penting dan memiliki pengaruh lebih
besar pada nama atau label yang dipilih untuk mewakili suatu faktor. Variabel signifikan
untuk faktor tertentu diperiksa dan, lebih menekankan pada variabel-variabel dengan
loading lebih tinggi, nama atau label diberikan ke faktor yang secara akurat
mencerminkan variabel yang memuat faktor itu. Adanya cross-loadings (yaitu, variabel
dengan loading yang signifikan pada lebih dari satu faktor) dapat menunjukkan
penghapusan variabel tersebut dari analisis karena tidak mewakili struktur sederhana dan
mempersulit proses penamaan.
6. Bagaimana dan kapan skor faktor harus digunakan dalam hubungannya dengan teknik
statistik multivariat lainnya?
Jawab:
Analisis faktor memfokuskan pada proses peringkasan data, yang melibatkan pemilihan
model faktor yang akan digunakan, jumlah faktor yang dipertahankan, dan kemungkinan
proses interpretasi. Mungkin ada contoh di mana peringkasan data akan mencukupi
dengan memberikan dasar empiris untuk menilai struktur variabel dan dampak struktur
ini saat menafsirkan hasil dari teknik multivariat lainnya. Salah satu penggunaan tersebut
adalah sebagai pemeriksaan awal data sebelum analisis faktor konfirmatori. Tetapi dalam
kebanyakan situasi lain, peneliti akan terlibat dalam peringkasan data dan kemudian
melanjutkan ke reduksi data. Di sini tujuannya adalah untuk secara umum memperluas
hasil faktor dengan membuat variabel "pengganti" yang sesuai yang mewakili setiap
faktor untuk aplikasi selanjutnya ke teknik statistik lainnya.
Memilih variabel dengan loading faktor tertinggi sebagai perwakilan pengganti
untuk dimensi faktor tertentu.
Mengganti kumpulan variabel asli dengan kumpulan variabel yang sama sekali baru
dan lebih kecil yang dibuat dari dijumlahkan timbangan atau skor faktor.
Salah satu opsi akan memberikan variabel baru untuk digunakan, misalnya, sebagai
variabel independen dalam analisis regresi atau diskriminan, sebagai variabel dependen
dalam analisis varians multivariat, atau bahkan sebagai variabel pengelompokan dalam
analisis kluster.
7. Apa perbedaan antara skor faktor dan skala penjumlahan? Kapan masing-masing paling
cocok?
Jawab:
Karakteristik utama yang membedakan skor faktor dari summated scale adalah bahwa
skor faktor dihitung berdasarkan pemuatan faktor semua variabel pada faktor, sedangkan
skala penjumlahan dihitung dengan menggabungkan hanya variabel yang dipilih. Oleh
karena itu, meskipun peneliti mampu mengkarakterisasi suatu faktor dengan variabel
dengan loading tertinggi, pertimbangan juga harus diberikan pada pembebanan variabel
lain, meskipun lebih rendah, dan pengaruhnya terhadap skor faktor.
Skor faktor Skala Penjumlahan
(Factor Scores) (Summated Scales)
5. Apa pendekatan alternatif untuk hierarki dan nonhierarkis pendekatan? Kapan adalah
mereka terbaik dipekerjakan
Jawab :
Prosedur pendekatan hierarki menentukan bagaimana kesamaan ditentukan antara cluster
multi-anggota dalam proses clustering. Saat menggabungkan dua cluster beranggota tunggal,
kesamaannya hanyalah kesamaan antara satu objek di setiap cluster. Peneliti menggunakan
salah satu pendekatan ini, atau bahkan menemukan cara lain untuk mengukur kesamaan
antara cluster dengan banyak anggota. Di antara banyak pendekatan, lima algoritma
aglomeratif paling populer adalah
(1) tautan tunggal,
(2) tautan lengkap,
(3) tautan rata-rata,
(4) metode sentroid,
(5) metode Ward.
Prosedur Pengelompokan Nonhierarki Berbeda dengan metode hierarki, prosedur nonhierarki
tidak melibatkan proses konstruksi seperti pohon. Sebaliknya, mereka menetapkan objek ke
dalam cluster setelah jumlah cluster ditentukan. Misalnya, solusi enam cluster bukan hanya
kombinasi dua cluster dari solusi tujuh cluster, tetapi hanya didasarkan pada menemukan
solusi enam cluster terbaik. Program perangkat lunak cluster nonhierarchical biasanya
berjalan melalui dua langkah:
1 Tentukan benih cluster. Tugas pertama adalah mengidentifikasi titik awal, yang dikenal
sebagai benih cluster, untuk setiap cluster. SEBUAH benih cluster dapat ditentukan
sebelumnya oleh peneliti atau pengamatan dapat dipilih, biasanya dalam proses acak.
2 Tugas. Dengan menentukan cluster seed, langkah selanjutnya adalah menugaskan setiap
observasi ke salah satu cluster benih berdasarkan kesamaan. Banyak pendekatan tersedia
untuk membuat tugas ini (lihat pembahasan selanjutnya di bagian ini), tetapi tujuan dasarnya
adalah untuk menetapkan setiap observasi ke benih cluster yang paling mirip. Dalam
beberapa pendekatan, saat observasi ditambahkan ke cluster yang sudah ada dan komposisi
cluster berubah, objek dapat dipindahkan / dialihkan ke cluster lain yang lebih mirip daripada
tugas cluster aslinya.
6. Bagaimana seorang peneliti menentukan jumlah cluster yang harus dimiliki dalam solusi
cluster hirarkis?
Jawab :
Peneliti harus memilih solusi cluster yang paling mewakili data dengan menerapkan aturan
berhenti. Prinsip dasar yang mendasari semua aturan penghentian untuk metode hierarki
adalah mengidentifikasi solusi cluster dengan lebih banyak homogenitas / lebih sedikit
heterogenitas daripada solusi cluster lain yang memungkinkan. Karena heterogenitas akan
selalu meningkat seiring dengan berkurangnya jumlah cluster, aturan penghentian berupaya
mengidentifikasi "lompatan" atau
peningkatan besar dalam heterogenitas, yang menunjukkan bahwa penggabungan cluster
pada tahap proses tersebut dilakukan dengan menggabungkan dua cluster yang sangat
berbeda. Ini kemudian menunjukkan bahwa solusi sebelumnya di mana cluster terpisah lebih
disukai. Dalam analisis klaster hierarkis, jadwal aglomerasi menjadi penting dalam
menentukan aturan penghentian ini. Peneliti juga harus menganalisis solusi cluster untuk
kekhasan dan kemungkinan outlier, yang akan diidentifikasi
dengan ukuran cluster yang sangat kecil atau dengan pengamatan yang bergabung dengan
cluster di akhir jadwal aglomerasi. Hasil cluster hierarki, termasuk jumlah cluster dan
mungkin titik benih cluster, kemudian dapat menjadi masukan untuk pendekatan nonhierarki,
di mana pertanyaan kritisnya adalah berapa banyak cluster yang akan dibentuk. Karena
jumlah cluster sudah ditetapkan, fokusnya adalah pada interpretasi dan pembuatan profil
cluster pada variabel clustering dan variabel lain,
8. Apa perbedaan antara tahap interpretasi dan tahap profiling dan validasi?
Jawab :
Tahap interpretasi melibatkan pemeriksaan setiap cluster dalam istilah cluster variate untuk
menamai atau menetapkan label yang secara akurat menggambarkan sifat cluster. Saat
memulai proses interpretasi, salah satu ukuran yang sering digunakan adalah sentroid cluster.
Jika prosedur pengelompokan dilakukan pada data mentah, itu akan menjadi deskripsi logis.
Jika data distandarisasi atau jika analisis cluster dilakukan dengan menggunakan hasil
analisis faktor eksplorasi (faktor komponen), peneliti harus kembali ke skor mentah untuk
variabel asli. Karena jumlah variabel pengelompokan atau jumlah kluster meningkat, melihat
nilai tabel untuk sentroid menjadi semakin sulit
Tahap pembuatan profil melibatkan mendeskripsikan karakteristik masing-masing cluster
pada variabel yang tidak berada di antara variabel clustering atau variabel validasi. Variabel
yang digunakan pada tahap ini biasanya terdiri dari dua jenis: (1) variabel deskriptif seperti
variabel demografis, profil psikografis, pola konsumsi atau ukuran perilaku lain yang
membantu mengidentifikasi cluster dalam populasi umum atau (2) variabel prediktif yang
dihipotesiskan sebagai alasan yang mengarah ke pengelompokan objek dalam cluster.
Sementara variabel dalam kategori deskriptif dapat dipilih hanya berdasarkan relevansi
praktis, upaya untuk memahami dampak variabel pada pembentukan cluster membutuhkan
dukungan teoritis juga. Dalam kedua contoh, analisis diskriminan atau teknik lain digunakan
untuk mengidentifikasi variabel mana yang berbeda di seluruh cluster.
Peneliti harus memilih solusi cluster yang paling mewakili data dengan menerapkan aturan
berhenti. Prinsip dasar yang mendasari semua aturan penghentian untuk metode hierarki
adalah mengidentifikasi solusi cluster dengan lebih banyak homogenitas / lebih sedikit
heterogenitas daripada solusi cluster lain yang memungkinkan. Karena heterogenitas akan
selalu meningkat seiring dengan berkurangnya jumlah cluster, aturan penghentian berupaya
mengidentifikasi "lompatan" atau peningkatan besar dalam heterogenitas, yang menunjukkan
bahwa penggabungan cluster pada tahap proses tersebut dilakukan dengan menggabungkan
dua cluster yang sangat berbeda. Ini kemudian menunjukkan bahwa solusi sebelumnya di
mana cluster terpisah lebih disukai. Dalam analisis klaster hierarkis, jadwal aglomerasi
menjadi penting dalam menentukan aturan penghentian ini.
Peneliti juga harus menganalisis solusi cluster untuk kekhasan dan kemungkinan outlier, yang
akan diidentifikasi dengan ukuran cluster yang sangat kecil atau dengan pengamatan yang
bergabung dengan cluster di akhir jadwal aglomerasi. Hasil cluster hierarki, termasuk jumlah
cluster dan mungkin titik benih cluster, kemudian dapat menjadi masukan untuk pendekatan
nonhierarki, di mana pertanyaan kritisnya adalah berapa banyak cluster yang akan dibentuk.
Karena jumlah cluster sudah ditetapkan, fokusnya adalah pada interpretasi dan pembuatan
profil cluster pada variabel clustering dan variabel lain, termasuk validasi (lihat bagian
selanjutnya untuk pembahasan lebih lanjut).
Validasi mencakup upaya peneliti untuk memastikan bahwa solusi cluster mewakili populasi
umum, dan dengan demikian dapat digeneralisasikan ke objek lain dan stabil dari waktu ke
waktu. Validasi silang Pendekatan paling langsung dalam hal ini adalah dengan menganalisis
cluster sampel terpisah, membandingkan solusi cluster dan menilai korespondensi hasil [11,
12]. Pendekatan ini, bagaimanapun, seringkali tidak praktis karena kendala waktu atau biaya
atau tidak tersedianya objek(terutama konsumen) untuk beberapa analisis cluster. Dalam hal
ini, pendekatan umum adalah membagi sampel menjadi dua kelompok. Setiap cluster
dianalisis secara terpisah, dan hasilnya kemudian dibandingkan. Tabulasi silang juga dapat
digunakan untuk sampel tunggal, karena anggota cluster tertentu dalam satu solusi harus
tetap bersama dalam cluster di solusi lain. Oleh karena itu, tabulasi silang harus menampilkan
pola jelas dari keanggotaan cluster yang cocok.