Anda di halaman 1dari 15

Nama : Poetri Marissa Yulhar

NIM : 20081032

Chapter 3 Exploratory Factor Analysis hal 187

1. Apa perbedaan antara tujuan peringkasan data dan reduksi data?


Jawab:
Analisis faktor eksplorasi memberi peneliti dua hasil yang berbeda, tetapi saling
melengkapi,: peringkasan data (data summarization) dan reduksi data (data reduction).
 Dalam meringkas data, analisis faktor eksplorasi memperoleh dimensi yang
mendasari yang menggambarkan data dalam jumlah konsep yang jauh lebih kecil
daripada variabel individu asli. Peneliti dapat memperluas proses ini dengan
memodifikasi dimensi (faktor) asli untuk mendapatkan faktor yang lebih dapat
ditafsirkan dan dipahami dengan lebih baik. Konsep dasar yang terlibat dalam
peringkasan data adalah definisi struktur. Melalui struktur, peneliti dapat melihat
sekumpulan variabel pada berbagai tingkatan generalisasi, mulai dari tingkat yang
paling detail (variabel individu itu sendiri) ke tingkat yang lebih umum, dimana
variabel individu dikelompokkan dan kemudian dilihat bukan untuk apa yang mereka
wakili secara individu, tetapi untuk apa yang mereka wakili secara kolektif
mengekspresikan sebuah konsep.
 Reduksi data memperluas proses ini dengan mendapatkan nilai empiris (faktor atau
skor skala yang dijumlahkan) untuk setiap dimensi (faktor) dan kemudian mengganti
nilai ini dengan nilai aslinya. Setelah analisis faktor eksplorasi dievaluasi dalam
proses peringkasan data, peneliti umumnya juga menggunakan teknik reduksi data
untuk (1) mengidentifikasi variabel perwakilan dari kumpulan variabel yang jauh
lebih besar yang diwakili oleh setiap faktor untuk digunakan dalam analisis
multivariat berikutnya, atau (2) membuat kumpulan variabel yang sama sekali baru,
mewakili gabungan variabel yang diwakili oleh setiap faktor, untuk menggantikan
kumpulan variabel asli. Dalam kedua contoh, tujuannya adalah untuk
mempertahankan sifat dan karakter variabel asli, tetapi mengurangi jumlah nilai
aktual yang disertakan dalam analisis (yaitu, satu per faktor) untuk menyederhanakan
analisis multivariat berikutnya. Meskipun teknik multivariat dikembangkan untuk
mengakomodasi banyak variabel, peneliti selalu mencari variabel yang paling pelit
untuk disertakan dalam analisis. Seperti dibahas dalam Bab 1, masalah konseptual dan
empiris mendukung pembuatan ukuran gabungan sambil "Mengelola Variasi" (lihat
Gambar 3.1). Analisis faktor eksplorasi memberikan dasar empiris untuk menilai
struktur variabel dan potensi untuk membuat ukuran komposit ini atau memilih subset
variabel perwakilan untuk analisis lebih lanjut.

2. Bagaimana analisis faktor eksplorasi membantu peneliti meningkatkan hasil teknik


multivariat lainnya?
Jawab:
Analisis faktor eksplorasi, dengan memberikan wawasan tentang keterkaitan antar
variabel dan struktur yang mendasari data, merupakan titik awal yang sangat baik untuk
banyak teknik multivariat lainnya. Dari perspektif peringkasan data, analisis faktor
eksplorasi memberi peneliti pemahaman yang jelas tentang variabel mana yang dapat
bertindak bersama dan berapa banyak variabel yang sebenarnya diharapkan
berdampak dalam analisis.
 Variabel yang ditentukan berkorelasi tinggi dan termasuk dalam faktor yang sama
diharapkan memiliki profil perbedaan yang serupa di seluruh kelompok dalam
analisis varians multivariat atau dalam analisis diskriminan.
 Variabel berkorelasi tinggi, seperti variabel dalam satu faktor, memengaruhi prosedur
bertahap dari analisis regresi dan diskriminan berganda yang secara berurutan
memasukkan variabel berdasarkan prediksi tambahannya. Kekuatan atas variabel
sudah dalam model. Saat salah satu variabel dari suatu faktor dimasukkan,
kemungkinan variabel tambahan dari faktor yang sama juga akan dimasukkan
menjadi lebih kecil karena korelasinya yang tinggi dengan variabel yang sudah ada
dalam model, yang berarti bahwa variabel tersebut memiliki sedikit daya prediksi
tambahan. Ini tidak berarti bahwa variabel lain dari faktor tersebut kurang penting
atau memiliki pengaruh yang lebih kecil, tetapi pengaruhnya sudah diwakili oleh
variabel yang disertakan dari faktor tersebut. Dengan demikian, pengetahuan tentang
struktur variabel dengan sendirinya akan memberikan pemahaman yang lebih baik
bagi peneliti tentang alasan di balik masuknya variabel dalam teknik ini. Korelasi
tinggi antara variabel independen dalam regresi berganda atau analisis diskriminan
dengan demikian merupakan alasan yang sangat baik untuk melakukan reduksi data
dengan analisis faktor eksplorasi.
Pemahaman yang diberikan oleh peringkasan data dapat langsung dimasukkan ke dalam
teknik multivariat lainnya melalui salah satu teknik reduksi data. Analisis faktor
memberikan dasar untuk membuat kumpulan variabel baru yang menggabungkan
karakter dan sifat variabel asli dalam jumlah yang jauh lebih kecil dari variabel baru, baik
menggunakan variabel perwakilan, skor faktor, atau skala penjumlahan. Dengan cara ini,
masalah yang terkait dengan sejumlah besar variabel atau hubungan antar variabel yang
tinggi dapat dikurangi secara substansial dengan substitusi variabel baru. Peneliti bisa
mendapatkan keuntungan dari estimasi empiris hubungan dan wawasan tentang landasan
konseptual dan interpretasi hasil.

3. Pedoman apa yang dapat Anda gunakan untuk menentukan jumlah faktor yang akan
diambil? Jelaskan masing-masing secara singkat.
Jawab:
Bagaimana kita memutuskan jumlah faktor yang akan diekstraksi? Kedua metode analisis
faktor tertarik pada kombinasi variabel linier terbaik, yakni paling baik dalam arti bahwa
kombinasi tertentu dari variabel asli menyumbang lebih banyak varians dalam data secara
keseluruhan daripada kombinasi variabel linier lainnya. Oleh karena itu, faktor pertama
dapat dilihat sebagai ringkasan tunggal terbaik dari hubungan linier yang diperlihatkan
dalam data. Faktor kedua didefinisikan sebagai kombinasi linier terbaik kedua dari
variabel, tunduk pada batasan bahwa itu ortogonal dengan faktor pertama.
Menjadi ortogonal untuk faktor pertama, faktor kedua harus diturunkan hanya dari varian
yang tersisa setelah faktor pertama diekstraksi. Dengan demikian, faktor kedua dapat
didefinisikan sebagai kombinasi linier dari variabel yang menyumbang sebagian besar
varian yang masih belum dapat dijelaskan setelah pengaruh faktor pertama telah dihapus
dari data. Proses terus mengekstraksi faktor-faktor yang menghitung jumlah varian yang
semakin kecil hingga semua varian dijelaskan. Misalnya, metode komponen sebenarnya
mengekstrak n faktor, di mana n adalah jumlah variabel dalam analisis. Jadi, jika 30
variabel di analisis, 30 faktor diekstraksi.
Jadi, apa yang diperoleh dari analisis faktor eksplorasi. Dalam contoh kami dari 30
variabel gambar toko di mana 30 faktor diekstraksi, faktor pertama diharapkan akan
menjelaskan porsi yang cukup besar dari varians sehingga peneliti dapat mempertahankan
hanya sejumlah kecil faktor untuk secara memadai mewakili varians dari seluruh
himpunan variabel. Pertanyaan kuncinya adalah: Berapa banyak faktor yang harus
diekstraksi atau dipertahankan
Dalam memutuskan kapan harus berhenti memfaktorkan (yaitu, berapa banyak faktor
yang akan diekstraksi), peneliti harus menggabungkan landasan konseptual (Berapa
banyak faktor yang harus ada dalam struktur?) Dengan beberapa bukti empiris (Berapa
banyak faktor yang dapat didukung secara wajar?). Peneliti umumnya mulai dengan
beberapa kriteria yang telah ditentukan, seperti jumlah umum faktor ditambah beberapa
ambang umum relevansi praktis (misalnya, persentase varian yang diperlukan dijelaskan).
Kriteria ini digabungkan dengan ukuran empiris dari struktur faktor. Dasar kuantitatif
yang pasti untuk menentukan jumlah faktor yang akan diekstraksi belum dikembangkan.
Keputusan tentang jumlah faktor yang akan dipertahankan harus didasarkan pada
beberapa pertimbangan:
 Penggunaan beberapa kriteria penghentian untuk menentukan jumlah awal faktor yang
harus dipertahankan:
- Faktor dengan nilai eigen lebih besar dari 1.0.
- Sejumlah faktor yang telah ditentukan berdasarkan tujuan penelitian dan / atau
penelitian sebelumnya.
- Faktor-faktor yang cukup untuk memenuhi persentase varian tertentu yang
dijelaskan, biasanya 60 persen atau lebih tinggi.
- Faktor yang ditunjukkan oleh uji scree memiliki sejumlah besar varian umum
(yaitu, faktor sebelum titik belok).
- Faktor-faktor di atas ambang batas ditetapkan dengan analisis paralel.
 Lebih banyak faktor ketika heterogenitas hadir di antara subkelompok sampel.
 Pertimbangan beberapa solusi alternatif (satu faktor lebih banyak dan satu faktor
kurang dari solusi awal) untuk memastikan struktur terbaik teridentifikasi.

4. Bagaimana Anda menggunakan matriks pemuatan faktor untuk menafsirkan arti faktor?
Jawab:
Tidak ada satu cara terbaik untuk mendefinisikan struktur sederhana, tetapi Thurstone
menguraikan beberapa pedoman umum yang jika tercapai memberikan solusi faktor yang
mudah diinterpretasikan:
a. Setiap variabel: harus memiliki setidaknya satu pemuatan yang sangat rendah / low
loading (di bawah ± 0,10).
b. Setiap faktor: harus memiliki beban yang sangat rendah sebanyak beberapa faktor.
c. Setiap pasangan faktor:
 Sebuah variabel yang memiliki signifikan loading (lebih besar dari 0,3 atau 0,4)
pada satu faktor dan sangat rendah pada faktor lainnya.
 Persentase besar dari beban yang sangat rendah pada setiap faktor bila ada
empat atau lebih faktor.
 Relatif sedikit beban silang (yaitu, variabel dengan beban signifikan pada setiap
faktor).
Singkatnya, ide dasar dari struktur sederhana adalah:
● setiap variabel memiliki loading yang tinggi / signifikan pada satu faktor saja, dan
● setiap faktor memiliki loading yang tinggi / signifikan hanya untuk sebagian item.
Mencapai struktur sederhana dalam banyak kasus tidak sepenuhnya dicapai, tetapi selalu
merupakan tujuan yang diinginkan untuk meningkatkan interpretabilitas. Dalam semua
kasus, ini membutuhkan kombinasi penerapan kriteria obyektif dengan pertimbangan
manajerial. When would the researcher use an oblique rotation instead of an orthogonal
rotation? What are the basic differences between them? . Kapan peneliti menggunakan
rotasi miring daripada rotasi ortogonal? Apa perbedaan mendasar di antara keduanya?

5. Apa kriteria yang digunakan dalam menentukan variabel yang akan mewakili suatu faktor
(misalnya, digunakan untuk menamai faktor itu)?
Jawab:
Jika tujuan peneliti hanya untuk mengidentifikasi variabel yang sesuai untuk aplikasi
selanjutnya dengan teknik statistik lainnya, peneliti memiliki pilihan untuk memeriksa
matriks faktor dan memilih variabel dengan loading faktor tertinggi pada setiap faktor
untuk bertindak sebagai variabel pengganti yang mewakili faktor itu. Pendekatan ini
sederhana dan langsung hanya jika satu variabel memiliki loading faktor yang secara
substansial lebih tinggi daripada semua loading faktor lainnya. Namun, dalam banyak
kasus, proses pemilihan lebih sulit karena dua atau lebih variabel memiliki loading yang
signifikan dan cukup dekat satu sama lain, namun hanya satu yang dipilih sebagai
perwakilan dari dimensi tertentu. Keputusan ini harus didasarkan pada pengetahuan teori
apriori peneliti yang mungkin menyarankan bahwa satu variabel lebih dari yang lain
secara logis akan mewakili dimensi. Selain itu, peneliti mungkin memiliki pengetahuan
yang menunjukkan bahwa variabel dengan loading sedikit lebih rendah sebenarnya lebih
dapat diandalkan daripada variabel pembebanan tertinggi.
Faktor mewakili gabungan dari banyak variabel. Ketika solusi faktor yang dapat diterima
telah diperoleh dimana semua variabel memiliki loading yang signifikan pada suatu
faktor, peneliti mencoba untuk memberikan beberapa makna pada pola faktor loading.
Variabel dengan loading lebih tinggi dianggap lebih penting dan memiliki pengaruh lebih
besar pada nama atau label yang dipilih untuk mewakili suatu faktor. Variabel signifikan
untuk faktor tertentu diperiksa dan, lebih menekankan pada variabel-variabel dengan
loading lebih tinggi, nama atau label diberikan ke faktor yang secara akurat
mencerminkan variabel yang memuat faktor itu. Adanya cross-loadings (yaitu, variabel
dengan loading yang signifikan pada lebih dari satu faktor) dapat menunjukkan
penghapusan variabel tersebut dari analisis karena tidak mewakili struktur sederhana dan
mempersulit proses penamaan.

6. Bagaimana dan kapan skor faktor harus digunakan dalam hubungannya dengan teknik
statistik multivariat lainnya?
Jawab:
Analisis faktor memfokuskan pada proses peringkasan data, yang melibatkan pemilihan
model faktor yang akan digunakan, jumlah faktor yang dipertahankan, dan kemungkinan
proses interpretasi. Mungkin ada contoh di mana peringkasan data akan mencukupi
dengan memberikan dasar empiris untuk menilai struktur variabel dan dampak struktur
ini saat menafsirkan hasil dari teknik multivariat lainnya. Salah satu penggunaan tersebut
adalah sebagai pemeriksaan awal data sebelum analisis faktor konfirmatori. Tetapi dalam
kebanyakan situasi lain, peneliti akan terlibat dalam peringkasan data dan kemudian
melanjutkan ke reduksi data. Di sini tujuannya adalah untuk secara umum memperluas
hasil faktor dengan membuat variabel "pengganti" yang sesuai yang mewakili setiap
faktor untuk aplikasi selanjutnya ke teknik statistik lainnya.
 Memilih variabel dengan loading faktor tertinggi sebagai perwakilan pengganti
untuk dimensi faktor tertentu.
 Mengganti kumpulan variabel asli dengan kumpulan variabel yang sama sekali baru
dan lebih kecil yang dibuat dari dijumlahkan timbangan atau skor faktor.
Salah satu opsi akan memberikan variabel baru untuk digunakan, misalnya, sebagai
variabel independen dalam analisis regresi atau diskriminan, sebagai variabel dependen
dalam analisis varians multivariat, atau bahkan sebagai variabel pengelompokan dalam
analisis kluster.
7. Apa perbedaan antara skor faktor dan skala penjumlahan? Kapan masing-masing paling
cocok?
Jawab:
Karakteristik utama yang membedakan skor faktor dari summated scale adalah bahwa
skor faktor dihitung berdasarkan pemuatan faktor semua variabel pada faktor, sedangkan
skala penjumlahan dihitung dengan menggabungkan hanya variabel yang dipilih. Oleh
karena itu, meskipun peneliti mampu mengkarakterisasi suatu faktor dengan variabel
dengan loading tertinggi, pertimbangan juga harus diberikan pada pembebanan variabel
lain, meskipun lebih rendah, dan pengaruhnya terhadap skor faktor.
Skor faktor Skala Penjumlahan
(Factor Scores) (Summated Scales)

Kelebihan  mewakili semua variabel yang  kompromi antara variabel


memuat faktor; pengganti dan pilihan skor
 metode terbaik untuk reduksi faktor;
data lengkap;  mengurangi kesalahan
 secara default ortogonal dan pengukuran;
dapat menghindari komplikasi  mewakili berbagai aspek
yang disebabkan oleh dari sebuah konsep;
multikolinearitas.  mudah direplikasi di seluruh
studi.

Kekurangan  interpretasi lebih sulit karena  hanya menyertakan


semua variabel berkontribusi variabel yang memuat
melalui loading; sangat banyak faktor dan
 membutuhkan prosedur mengecualikan variabel
tambahan untuk direplikasi di yang memiliki dampak
seluruh studi. kecil atau marjinal;
 belum tentu ortogonal;
 membutuhkan analisis
ekstensif atas masalah
reliabilitas dan validitas.
8. Apa perbedaan antara analisis faktor eksplorasi dan analisis faktor konfirmatori? Kapan
masing-masing paling dapat diterapkan?
Jawab:
Analisis faktor sebagai pada dasarnya adalah teknik eksplorasi karena peneliti memiliki
sedikit kendali atas spesifikasi struktur (misalnya, jumlah faktor, loading setiap variabel,
dll.). Meskipun metode yang dibahas dalam bab ini memberikan wawasan tentang data,
upaya konfirmasi apa
pun kemungkinan besar akan memerlukan penggunaan metode khusus yang dibahas
dalam bab tentang pemodelan persamaan struktural.
Peneliti juga harus ingat bahwa analisis faktor eksplorasi akan selalu menghasilkan
faktor. Dengan demikian, analisis faktor eksplorasi selalu menjadi kandidat potensial
untuk fenomena “sampah masuk, sampah keluar”. Jika peneliti tanpa pandang bulu
memasukkan sejumlah besar variabel dan berharap analisis faktor akan “mengetahuinya,”
maka kemungkinan hasil yang buruk tinggi. Kualitas dan makna dari faktor-faktor yang
diturunkan mencerminkan dasar-dasar konseptual dari variabel-variabel yang termasuk
dalam analisis. Dengan demikian, peneliti harus menggunakan penilaian pada kumpulan
variabel mana yang akan dianalisis bersama dan memahami bahwa peneliti menentukan
struktur yang diperiksa. Sebagai contoh, satu set variabel yang merepresentasikan sikap
dan opini dalam banyak kasus tidak akan dianalisis dengan set variabel lain yang
merepresentasikan perilaku aktual karena ini adalah set variabel yang sangat berbeda. Ini
terutama benar ketika satu set mungkin variabel independen dan set lain akan menjadi
variabel dependen. Analisis faktor eksplorasi tidak dapat membedakan antara set ini
seperti yang dapat dilakukan dalam analisis faktor konfirmatori, sehingga peneliti paling
cocok untuk menganalisis setiap set secara terpisah untuk struktur uniknya daripada
dalam analisis gabungan.

9. Apa perbedaan antara analisis faktor tipe-Q dan analisis cluster?


Jawab:
Sama dengan analisis factor, analisis cluster (cluster analysis) termasuk pada
Interdependes Techniques. Namun ada perbedaan mendasar di antara kedua alat analisis
multivariate ini. Jika analisis factor (R factor analysis) bertujuan mereduksi variabel,
analisis cluster (Q factor analysis) lebih bertujuan mengelompokkan isi variabel,
walaupun bisa juga disertai dengan pengelompokan variabel.
Jika peneliti memutuskan untuk menggunakan analisis faktor tipe-Q, perbedaan yang
berbeda dari teknik analisis cluster tradisional harus dicatat. Dengan ketersediaan teknik
pengelompokan lain dan meluasnya penggunaan analisis faktor untuk reduksi dan
peringkasan data, pembahasan selanjutnya dalam bab ini berfokus pada analisis faktor
tipe-R, pengelompokan variabel, bukan responden.

Chapter 4 Cluster Analysis hal 254- 255

1. Apa tujuan mendasar yang bisa dicapai melalui analisis cluster?


Jawab :
Untuk mengelompokkan individu atau objek ke dalam cluster sehingga objek dalam cluster
yang sama lebih mirip satu sama lain daripada objek di cluster lain. Upaya untuk
memaksimalkan homogenitas objek dalam cluster sekaligus memaksimalkan heterogenitas
antar cluster.

2. Apa saja tahapan dasar dalam penerapan cluster analisis?


Jawab :
Analisis cluster mengklasifikasikan benda ( misalnya, responden, produk, atau entitas lain),
pada sekumpulan karakteristik yang dipilih pengguna ( variabel pengelompokan). Cluster
yang dihasilkan harus menunjukkan homogenitas internal (dalam-cluster) yang tinggi dan
heterogenitas eksternal (antar-cluster) yang tinggi. Jadi, jika klasifikasi berhasil, objek dalam
cluster akan berdekatan ketika diplot secara geometris, dan cluster yang berbeda akan
berjauhan. Konsep variate sekali lagi penting dalam memahami bagaimana analisis cluster
secara matematis menghasilkan hasil. Itu cluster variate mewakili representasi matematis dari
kumpulan variabel pengelompokan yang dipilih yang membandingkan kesamaan objek.
Variasi dalam analisis cluster ditentukan secara berbeda dari teknik multivariat lainnya.
Analisis cluster adalah satu-satunya teknik multivariat yang tidak mengestimasi variate
secara empiris melainkan menggunakan variate seperti yang ditentukan oleh peneliti. Fokus
analisis cluster adalah pada perbandingan objek berdasarkan variate, bukan pada estimasi
variate itu sendiri. Perbedaan ini membuat definisi peneliti tentang variate sebagai langkah
penting dalam analisis cluster.
3. Apa yang harus dipertimbangkan peneliti saat memilih a ukuran kesamaan untuk
digunakan dalam analisis cluster?
Jawab :
Ketika seorang peneliti ingin mengembangkan hipotesis tentang sifat data atau untuk
memeriksa hipotesis yang dinyatakan sebelumnya. Misalnya, seorang peneliti mungkin
percaya bahwa sikap terhadap konsumsi makanan versus minuman ringan biasa dapat
digunakan untuk memisahkan konsumen minuman ringan menjadi segmen atau kelompok
logis. Analisis cluster dapat mengklasifikasikan konsumen minuman ringan berdasarkan
sikap mereka tentang diet versus minuman ringan biasa, dan cluster yang dihasilkan, jika ada,
dapat diprofilkan untuk persamaan dan perbedaan demografis. peneliti harus memiliki dasar
konseptual yang kuat untuk menangani masalah seperti mengapa kelompok ada di tempat
pertama dan variabel apa yang secara logis menjelaskan mengapa objek berakhir di
kelompok yang mereka lakukan. Bahkan jika analisis cluster digunakan dalam
pengembangan konseptual seperti yang baru saja disebutkan, beberapa alasan konseptual
tetap penting. Dengan demikian dalam setiap penggunaan analisis cluster, peneliti harus
berhati-hati dalam memastikan bahwa dukungan konseptual yang kuat mendahului penerapan
teknik. Hanya dengan dukungan ini, peneliti kemudian membahas setiap keputusan spesifik
yang terlibat dalam melakukan analisis cluster

4. Bagaimana peneliti mengetahui apakah akan menggunakan hierarki atau nonhierarkis


gugus teknik? Dibawah yang kondisi akan setiap pendekatan menjadi bekas?
Jawab :
Peneliti melakukan pengelompokan tujuh objek di mana semua objek awalnya berada dalam
kluster terpisah dan kemudian secara berurutan bergabung dengan dua kluster pada satu
waktu hingga hanya satu kluster yang tersisa. SEBUAH nonhierarkis Prosedurnya sangat
berbeda dalam hal jumlah cluster ditentukan oleh analis dan kemudian himpunan objek
dibentuk ke dalam himpunan pengelompokan tersebut. Jadi, meskipun peneliti melihat
jumlah cluster tertentu, peneliti harus melakukan analisis terpisah untuk setiap solusi cluster
potensial.
pertama-tama peneliti akan memeriksa prosedur hierarkis dan nonhierarkis dan kemudian
membandingkannya dengan kekuatan dan kelemahannya. kemudian peneliti memeriksa
secara singkat dua prosedur alternatif yang muncul: prosedur berbasis kepadatan yang
memiliki cara yang berbeda secara fundamental untuk merepresentasikan kesamaan dan
prosedur berbasis model yang menggunakan metode pemodelan nonhierarki berbasis statistik
untuk mengidentifikasi pengelompokan objek untuk membentuk cluster.

5. Apa pendekatan alternatif untuk hierarki dan nonhierarkis pendekatan? Kapan adalah
mereka terbaik dipekerjakan
Jawab :
Prosedur pendekatan hierarki menentukan bagaimana kesamaan ditentukan antara cluster
multi-anggota dalam proses clustering. Saat menggabungkan dua cluster beranggota tunggal,
kesamaannya hanyalah kesamaan antara satu objek di setiap cluster. Peneliti menggunakan
salah satu pendekatan ini, atau bahkan menemukan cara lain untuk mengukur kesamaan
antara cluster dengan banyak anggota. Di antara banyak pendekatan, lima algoritma
aglomeratif paling populer adalah
(1) tautan tunggal,
(2) tautan lengkap,
(3) tautan rata-rata,
(4) metode sentroid,
(5) metode Ward.
Prosedur Pengelompokan Nonhierarki Berbeda dengan metode hierarki, prosedur nonhierarki
tidak melibatkan proses konstruksi seperti pohon. Sebaliknya, mereka menetapkan objek ke
dalam cluster setelah jumlah cluster ditentukan. Misalnya, solusi enam cluster bukan hanya
kombinasi dua cluster dari solusi tujuh cluster, tetapi hanya didasarkan pada menemukan
solusi enam cluster terbaik. Program perangkat lunak cluster nonhierarchical biasanya
berjalan melalui dua langkah:
1 Tentukan benih cluster. Tugas pertama adalah mengidentifikasi titik awal, yang dikenal
sebagai benih cluster, untuk setiap cluster. SEBUAH benih cluster dapat ditentukan
sebelumnya oleh peneliti atau pengamatan dapat dipilih, biasanya dalam proses acak.
2 Tugas. Dengan menentukan cluster seed, langkah selanjutnya adalah menugaskan setiap
observasi ke salah satu cluster benih berdasarkan kesamaan. Banyak pendekatan tersedia
untuk membuat tugas ini (lihat pembahasan selanjutnya di bagian ini), tetapi tujuan dasarnya
adalah untuk menetapkan setiap observasi ke benih cluster yang paling mirip. Dalam
beberapa pendekatan, saat observasi ditambahkan ke cluster yang sudah ada dan komposisi
cluster berubah, objek dapat dipindahkan / dialihkan ke cluster lain yang lebih mirip daripada
tugas cluster aslinya.
6. Bagaimana seorang peneliti menentukan jumlah cluster yang harus dimiliki dalam solusi
cluster hirarkis?
Jawab :
Peneliti harus memilih solusi cluster yang paling mewakili data dengan menerapkan aturan
berhenti. Prinsip dasar yang mendasari semua aturan penghentian untuk metode hierarki
adalah mengidentifikasi solusi cluster dengan lebih banyak homogenitas / lebih sedikit
heterogenitas daripada solusi cluster lain yang memungkinkan. Karena heterogenitas akan
selalu meningkat seiring dengan berkurangnya jumlah cluster, aturan penghentian berupaya
mengidentifikasi "lompatan" atau
peningkatan besar dalam heterogenitas, yang menunjukkan bahwa penggabungan cluster
pada tahap proses tersebut dilakukan dengan menggabungkan dua cluster yang sangat
berbeda. Ini kemudian menunjukkan bahwa solusi sebelumnya di mana cluster terpisah lebih
disukai. Dalam analisis klaster hierarkis, jadwal aglomerasi menjadi penting dalam
menentukan aturan penghentian ini. Peneliti juga harus menganalisis solusi cluster untuk
kekhasan dan kemungkinan outlier, yang akan diidentifikasi
dengan ukuran cluster yang sangat kecil atau dengan pengamatan yang bergabung dengan
cluster di akhir jadwal aglomerasi. Hasil cluster hierarki, termasuk jumlah cluster dan
mungkin titik benih cluster, kemudian dapat menjadi masukan untuk pendekatan nonhierarki,
di mana pertanyaan kritisnya adalah berapa banyak cluster yang akan dibentuk. Karena
jumlah cluster sudah ditetapkan, fokusnya adalah pada interpretasi dan pembuatan profil
cluster pada variabel clustering dan variabel lain,

7. Bagaimana peneliti dapat menggunakan penggambaran grafis dari prosedur cluster?


Jawab :
Meskipun kami mengharapkan semua variabel pengelompokan bervariasi di seluruh kluster
karena itu adalah tujuan analisis kluster, dengan variabel ini peneliti mencari variabel
pembeda utama dari variabel deskriptif atau prediktif. Dengan menggunakan analisis
diskriminan, peneliti membandingkan profil skor rata-rata untuk cluster. Variabel dependen
kategoris adalah cluster yang teridentifikasi sebelumnya, dan variabel independen adalah
demografi, psikografis, dan sebagainya. Dengan menggunakan analisis diskriminan, peneliti
membandingkan profil skor rata-rata untuk cluster. Variabel dependen kategoris adalah
cluster yang teridentifikasi sebelumnya, dan variabel independen adalah demografi,
psikografis, dan sebagainya. Dengan menggunakan analisis diskriminan, peneliti
membandingkan profil skor rata-rata untuk cluster. Variabel dependen kategoris adalah
cluster yang teridentifikasi sebelumnya, dan variabel independen adalah demografi,
psikografis, dan sebagainya.
Untuk perbandingan grafis atau sederhana antar cluster, peneliti dapat memilih untuk itu
pusat setiap variabel dengan mengurangi mean keseluruhan untuk variabel itu dari setiap
observasi. Hasilnya adalah sekumpulan variabel dengan mean nol tetapi mempertahankan
variabilitas uniknya. Langkah ini hanya memfasilitasi interpretasi ketika variabel tidak
memiliki arti yang sama, tetapi tidak digunakan dalam proses pengelompokan yang
sebenarnya. Analis harus berhati-hati, bagaimanapun, untuk mengingat bahwa ketika
menggunakan variabel terpusat, titik rujukannya adalah individu (yaitu, seberapa jauh
variabel tunggal berbeda dari respons rata-rata objek) versus perbedaan antara kelompok.
Singkatnya, analisis profil berfokus pada penggambaran bukan pada apa yang secara
langsung menentukan cluster, melainkan pada karakteristik cluster setelah mereka
diidentifikasi. Apalagi yang ditekankan ada pada ciri-ciri yang berbeda-beda secara
signifikan di seluruh cluster dan yang dapat memprediksi keanggotaan dalam cluster tertentu.
Pembuatan profil sering kali merupakan
langkah praktis yang penting dalam prosedur pengelompokan, karena mengidentifikasi
karakteristik seperti demografi memungkinkan segmen diidentifikasi atau ditempatkan
dengan informasi yang diperoleh dengan mudah.

8. Apa perbedaan antara tahap interpretasi dan tahap profiling dan validasi?
Jawab :
Tahap interpretasi melibatkan pemeriksaan setiap cluster dalam istilah cluster variate untuk
menamai atau menetapkan label yang secara akurat menggambarkan sifat cluster. Saat
memulai proses interpretasi, salah satu ukuran yang sering digunakan adalah sentroid cluster.
Jika prosedur pengelompokan dilakukan pada data mentah, itu akan menjadi deskripsi logis.
Jika data distandarisasi atau jika analisis cluster dilakukan dengan menggunakan hasil
analisis faktor eksplorasi (faktor komponen), peneliti harus kembali ke skor mentah untuk
variabel asli. Karena jumlah variabel pengelompokan atau jumlah kluster meningkat, melihat
nilai tabel untuk sentroid menjadi semakin sulit
Tahap pembuatan profil melibatkan mendeskripsikan karakteristik masing-masing cluster
pada variabel yang tidak berada di antara variabel clustering atau variabel validasi. Variabel
yang digunakan pada tahap ini biasanya terdiri dari dua jenis: (1) variabel deskriptif seperti
variabel demografis, profil psikografis, pola konsumsi atau ukuran perilaku lain yang
membantu mengidentifikasi cluster dalam populasi umum atau (2) variabel prediktif yang
dihipotesiskan sebagai alasan yang mengarah ke pengelompokan objek dalam cluster.
Sementara variabel dalam kategori deskriptif dapat dipilih hanya berdasarkan relevansi
praktis, upaya untuk memahami dampak variabel pada pembentukan cluster membutuhkan
dukungan teoritis juga. Dalam kedua contoh, analisis diskriminan atau teknik lain digunakan
untuk mengidentifikasi variabel mana yang berbeda di seluruh cluster.
Peneliti harus memilih solusi cluster yang paling mewakili data dengan menerapkan aturan
berhenti. Prinsip dasar yang mendasari semua aturan penghentian untuk metode hierarki
adalah mengidentifikasi solusi cluster dengan lebih banyak homogenitas / lebih sedikit
heterogenitas daripada solusi cluster lain yang memungkinkan. Karena heterogenitas akan
selalu meningkat seiring dengan berkurangnya jumlah cluster, aturan penghentian berupaya
mengidentifikasi "lompatan" atau peningkatan besar dalam heterogenitas, yang menunjukkan
bahwa penggabungan cluster pada tahap proses tersebut dilakukan dengan menggabungkan
dua cluster yang sangat berbeda. Ini kemudian menunjukkan bahwa solusi sebelumnya di
mana cluster terpisah lebih disukai. Dalam analisis klaster hierarkis, jadwal aglomerasi
menjadi penting dalam menentukan aturan penghentian ini.
Peneliti juga harus menganalisis solusi cluster untuk kekhasan dan kemungkinan outlier, yang
akan diidentifikasi dengan ukuran cluster yang sangat kecil atau dengan pengamatan yang
bergabung dengan cluster di akhir jadwal aglomerasi. Hasil cluster hierarki, termasuk jumlah
cluster dan mungkin titik benih cluster, kemudian dapat menjadi masukan untuk pendekatan
nonhierarki, di mana pertanyaan kritisnya adalah berapa banyak cluster yang akan dibentuk.
Karena jumlah cluster sudah ditetapkan, fokusnya adalah pada interpretasi dan pembuatan
profil cluster pada variabel clustering dan variabel lain, termasuk validasi (lihat bagian
selanjutnya untuk pembahasan lebih lanjut).
Validasi mencakup upaya peneliti untuk memastikan bahwa solusi cluster mewakili populasi
umum, dan dengan demikian dapat digeneralisasikan ke objek lain dan stabil dari waktu ke
waktu. Validasi silang Pendekatan paling langsung dalam hal ini adalah dengan menganalisis
cluster sampel terpisah, membandingkan solusi cluster dan menilai korespondensi hasil [11,
12]. Pendekatan ini, bagaimanapun, seringkali tidak praktis karena kendala waktu atau biaya
atau tidak tersedianya objek(terutama konsumen) untuk beberapa analisis cluster. Dalam hal
ini, pendekatan umum adalah membagi sampel menjadi dua kelompok. Setiap cluster
dianalisis secara terpisah, dan hasilnya kemudian dibandingkan. Tabulasi silang juga dapat
digunakan untuk sampel tunggal, karena anggota cluster tertentu dalam satu solusi harus
tetap bersama dalam cluster di solusi lain. Oleh karena itu, tabulasi silang harus menampilkan
pola jelas dari keanggotaan cluster yang cocok.

Anda mungkin juga menyukai