Analisis MTV1
Analisis MTV1
Pertemuan 8
TUJUAN
Mentransformasi
NOTES
Menggunakan PCA merupakan langkah
menengah bukan langkah terakhir dalam
analisis data. Misalnya, analisis cluster dapat
dilakukan pada beberapa ( misalnya , 6 atau 7 )
komponen utama ( variabel baru yang diperoleh
dari PCA) daripada variabel asli ( misalnya,80).
Selain itu juga untuk analisis regresi berganda
ataupun analisis faktor.
Analisis Komponen Utama dilakukan untuk
menyederhanakan sekumpulan variabel yang
saling berhubungan
kombinasi
dengan
RESULT 8.1
RESULT 8.2
RESULT 8.3
Jika
utama dari matriks kovarians
adalah komponen
maka
RESULT 8.4
dengan
dan vektor ciri
dimana
LATIHAN
ANALISIS FAKTOR
(FACTOR ANALYSIS)
Pertemuan 9
SEJARAH
Galton (1888), Pertama kali menemukan tentang
konsep faktor laten.
Spearman (1904) meneliti pola tertentu yang
sistematik pada matriks korelasi dari skor nilai
pada suatu sekolah.
general intellective ability
individual tests.
2.
3.
FA
I1
I2
PCA
I3
I1
I2
I3
Exploratory
FA
Confirmatory FA
EXPLORATORY FA
digunakan untuk penelitian awal di mana
faktor-faktor yang mempengaruhi suatu
faktor / variabel laten belum
diidentifikasikan secara baik terutama
digunakan dalam explanatory research.
CONFIRMATORY FA
Digunakan untuk mengestimasi parameter dan
menguji hipotesis tentang sejumlah faktor yang
mendasari hubungannya dengan suatu set
indikator.
MODEL FAKTOR
X p x1 p x1 L p x m F m x1 p x1
Dengan:
lij
STRUKTUR COVARIANS X
X X ' LF LF '
LF LF ' '
LF LF ' ' LF ' LF ' '
E LF LF ' E LF F ' L '
( LL ' ) E ( FF ' )
LL'.I
LL'
E '
Cluster Analysis
CLUSTER ANALYSIS
Cluster Analysis adalah suatu teknik analisis multivariate metode
interdependen, dengan tujuan meringkas data dengan
penggerombolan obyek (responden) sehingga terbentuk beberapa
kelompok, disebut cluster. Obyek di dalam suatu cluster lebih mirip
dibandingkan antar cluster. Kemiripan ini sudah didasarkan pada
sekumpulan variabel secara simultan.
KEGUNAAN
2 identifikasi banyaknya cluster dari sekumpulan obyek
2 identifikasi karakteristik setiap cluster
2 prediksi jumlah anggota masing-masing subpopulasi berdasarkan
perhitungan anggota setiap cluster yang diperoleh dari data
sampel
BASIS KLASTERING DAN INPUT
2 Pengelompokkan dibuat berbasis pada kesamaan (similiarities)
atau jaraknya (disimiliarities/distance)
2 Input yang diperlukan berupa ukuran kesamaan atau data
CLUSTER ANALYSIS
Analisis Cluster dalam beberapa bidang keilmuan
Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk
(a) mengetahui segmentasi dan menentukan target pasar yang dituju;
(b) mengetahui positioning produk dan menentukan pengembangan
produk baru; (c) Memilih pasar yang akan dipilih untuk produk baru
perusahaan.
Dalam analisis penelitian pendidikan, data untuk clustering dapat
berupa data siswa, orang tua, jenis kelamin atau nilai ujian.
Clustering merupakan metode penting untuk memahami dan utilitas
dari cluster dalam penelitian pendidikan, msialnya untuk
pengelompokkan siswa ataupun sekolah.
CLUSTER ANALYSIS
Tahapan dalam Cluster Ananlysis
Tahap 1. Partitioning (membentuk cluster)
1. Variabel apa yang digunakan untuk menghitung
similarity (atau distance) antar objek
2. Bagaimana menentukan ukuran similarity (atau distance)
3. Algoritma apa yang sebaiknya digunakan dalam
menempatkan suatu objek ke dalam cluster
4. Berapa jumlah cluster yang terbentuk
Tahap 2. Interpretasi
Tahap 3. Validasi dan Profil
CLUSTER ANALYSIS
Ukuran ketakmiripan
Ukuran jarak yang sering digunakan adalah jarak euclidean (d)
dengan mengukur proximity pada ruang dua dimensi sehingga
jarak antara dua observasi menunjukkan kesamaan. Secara
umum jarak euclid antara 2 amatan dengan p variabel dinyatakan
sebagai
dij
2
(
X
X
)
ki kj
k 1
Ukuran Mikowski
dij
k 1
dan Mahalanobis
1/ m
X ik X jk
dij
X X S X X
t
CLUSTER ANALYSIS
Ukuran kemiripan
Sifat-sfat ukuran ketakmiripan:
d(uv) 0
d(uu)= 0
d(uv)= d(vu)
d(uv) akan meningkat nilainya dengan semakin tak miripnya
gerombol u dan v
Nilai jarak tersebut akan disajikan dalam matriks jarak yang
disebut dengan matriks proksimitas/proximity
CLUSTER ANALYSIS
Asumsi Analisis Gerombol
CLUSTER ANALYSIS
Metode analisis :
1) Hirarki (berjenjang) :
- Terstruktur
- Dapat ditelusuri penggerombolan suatu objek dengan objek lainnya
- Stabil
- Banyak kelompok belum diketahui
- Output berupa dendogram
- pemotongan : jarak lompatan terjauh
2) Tidak Berhirarki :
- Tidak terstruktur
- Banyak kelompok ditentukan terlebih dahulu (diketahui)
- Menggunakan Iterasi
- Kurang Stabil
- Output : anggota kelompok dan centroid
CLUSTER ANALYSIS
Metode yang sering digunakan untuk pengelompokan obyek pada
Hierarchical clustering adalah
1. Metode penggumpalan (agglomeratif)
Setiap obyek dianggap sebagai suatu gerombol/cluster,
kemudian dikelompokkan dengan obyek yang memiliki jarak
terdekat
2. Metode pembagian (divisive)
Bekerja dengan membagi 2 berdasarkan jumlah objek,
dipisahkan dengan dicari obyek yang mempunyai jarak terjauh
CLUSTER ANALYSIS
Hirarki (berjenjang)
Metode yang sering digunakan untuk pengelompokan obyek pada
Hierarchical clustering adalah metode penggumpalan
(agglomeratif)
Terdapat 7 metode pengelompokkan
Agglomerative yang sering
dipergunakan untuk perhitungan jarak
antar cluster dengan obyek atau
dengan cluster lain di dalam
penggerombolan berjenjang, yaitu
single lingkage (pautan tunggal),
complete linkage (pautan lengkap,
average linkage (pautan rata-rata),
centroid, median, minimum variance,
ward
CLUSTER ANALYSIS
Hirarki (berjenjang)
Untuk teknik pengelompokkan dengan metode Divisive ada 2
metode yang sering digunakan yaitu :
A splinter- Average Distance Method
Automatic Interaction Detection
CLUSTER ANALYSIS
Hirarki (berjenjang)
Output : berupa dendogram
CLUSTER ANALYSIS
Hirarki (berjenjang)
Latihan:
Diketahui data variabel pendidikan dan pendapatan untuk 6
amatan adalah sebagai berikut:
Nilai Pendapatan: 5,6,15,16,25,30
Nilai Pendidikan: 5,6,14,15,20,19
Dengan menggunakan metode Pautan tunggal
CLUSTER ANALYSIS
Hasil
Pendapatan
5
6
15
16
25
30
Pendidikan
5
6
14
15
20
19
Kelompok
1
1
2
2
2
2
CLUSTER ANALYSIS
APLIKASI
Suatu penelitian dilakukan dengan cara survey, bertujuan ingin
mengetahui peta karakteristik anak jalanan. Bilamana mapping ini
dapat dilakukan, diharapkan dapat dikembangkan model pembinaan
yang efektif.
Variabel yang diamati adalah pendidikan, alasan dan keinginan.
Analisis dilakukan dengan program SPSS
CLUSTER ANALYSIS
HASIL ANALISIS
CLUSTER ANALYSIS
HASIL ANALISIS
Penempatan setiap obyek (case) ke dalam cluster dapat dilihat
pada tabel di bawah ini.
CLUSTER ANALYSIS
HASIL ANALISIS
Anak jalanan yang berjumlah 100 orang membentuk dua cluster
dan untuk melakukan identifikasi karakteristik setiap cluster
dilakukan analisis diskriptif.
Karakteristik cluster 1 adalah pendidikan orang tua cukup tinggi akan tetapi
pendidikan anak tidak terurus, mereka menjadi anak jalanan bukan karena
keadaan (ekonomi) dan sebenarnya mereka tidak ingin menjadi anak jalanan.
Tampaknya anak jalanan di dalam kelompok ini lebih disebabkan karena
sangat kurangnya perhatian orang tua.
CLUSTER ANALYSIS
HASIL ANALISIS
Karakteristik cluster 2 adalah pendidikan orang tua rendah, untuk
bisa bertahan hidup mereka harus menjadi anak jalanan sehingga
ada keinginan yang tinggi untuk menjadi anak jalanan. Pada
cluster ini, tampaknya mereka menjadi anak jalanan
dilatarbelakangi kondisi ekonomi keluarga.
Pembinaan anak jalanan pada cluster 1 seharusnya berbeda
dengan pada cluster 2. Dengan kata lain, dari hasil pemetaan
(mapping) ini selanjutnya dapat dirancang model dan
program pembinaan anak jalanan yang efektif.
CLUSTER ANALYSIS
Tidak Hirarki (tidak berjenjang)
Pada analisis gerombol tidak berjenjang jumlah cluster harus
ditetapkan terlebih dahulu sebelum kita melakukan analisis data.
Dengan kata lain, non hierarchical clustering digunakan bilamana
jumlah gerombol dapat ditentukan sebelum analisis dilakukan.
Penentuan jumlah cluster dapat didasarkan pada rujukan teoritis,
kondisional, common sense, dan atau tujuan penelitian.
Metode yang banyak digunakan adalah Metode K-rataan (K mean Method).
CLUSTER ANALYSIS
APLIKASI
Suatu penelitian dilakukan dengan tujuan untuk mengetahui karakteristik
karyawan. Bilamana terdapat beberapa kelompok karaktersitik, maka pada
setiap kelompok ingin diketahui faktor apa yang dominan berpengaruh
terhadap kinerjanya (perform). Variabel yang diamati adalah loyalitas,
motivasi, kepuasan, dan kinerja.
Pengembangan model dan program pembinaan karyawan guna
meningkatkan kinerjanya ditetapkan hanya 2 macam. Oleh karena itu,
karyawan akan dikelompokkan menjadi 2, selanjutnya akan diidentifikasi
karakteristik dari dari setiap kelompok. Informasi ini akan digunakan
sebagai bahan pengembangan model dan program pembinaan
karyawan.
Mengingat jumlah cluster (kelompok) sudah ditetapkan terlebih
dahulu, maka analisis untuk penggerombolan yang paling tepat
adalah analisis gerombol tidak berjenjang. Hasil analisis data,
menggunakan SPSS, disajikan sebagai berikut.
CLUSTER ANALYSIS
HASIL ANALISIS
CLUSTER ANALYSIS
HASIL ANALISIS
Kelompok 2 beranggotakan 46 orang karyawan, dengan center
semuanya negatif. Sehingga pada kelompok ini diperlukan upaya
pembinaan yang tujuannya adalah perbaikan berbagai aspek perilaku
karyawan.
Kemudian pada kelompok 2 ini akan diidentifikasi faktor apa yang dominan
berpengaruh terhadap kinerja (perform)
CLUSTER ANALYSIS
UKURAN EVALUASI KLUSTER
1. Root Mean Square Standart Deviation (RMSSTD)
pooledSS semuavariabel
pooleddf semuavariabel
Tidak ada kriteria khusus, untuk pengelompokkan yang baik nilai tsb harus kecil
RMSSTD
2. R-Square (RS)
RS bernilai antara 0 dan 1, semakin besar nilai RS semakin baik pengelompokkan yang
dilakukan
RS
SSbetween
SStotal
*Dengan nilai SS diperoleh dari tabel One-way ANOVA nilai amatan yang sudah dikelompokkan*
CLUSTER ANALYSIS
RS
341,3 176,3
0,7377
498,8 202,83
ANALISIS DISKRIMINAN
X : N p ( , )
1 2
1 2
Data sudah dikelompokkan
H 0 : 1 2
H 1 : 1 2
y a' x
a' ( 1 2 )' 1
Aturan Klasifikasi
Aturan pengelompokkan pada analisis Diskriminan:
1. Cut off Value (CV), merupakan batas/kriteria skor untuk
menentukan suatu individu/obyek termasuk dalam
kelompok yang mana
2. Prior Probability, untuk meminumkan salah klasifikasi
3. Memininumkan biaya salah klasifikasi
4. Jarak Mahalanobis
1
1
X 1 jika X 1 X 2 ' S Xmendekati X 1 X 2 S X 1
1
1
X 2 jika X 1 X 2 ' S Xmendekati X 1 X 2 S X 2
atau
X 1 jika
1
1
1
1
X1 X 2 S X1 X 2 S X1 X1 X 2 S X1 X 2 S X 2
atau jika
1
y X1 X 2 S X1 X 2
2
CV
X1 X 2
X1 X 2
1
X 1 jika y X 1 X 2 ' S 1
2
1
X 2 jika y X 1 X 2 ' S 1
2
Jika n1 n2
1
X1 X 2 S X 2
1
X1 X 2 S X 2
n1 X 1 X 2 ' S X 1 n 2
X 1 jika y
n1 n 2
n X X 2 ' S X 1 n2
X 1 jika y 1 1
n1 n 2
Prior Probability
Metode untuk meminumkan salah klasifikasi, dengan alokasi
pengelompokkan
p2
1
1
X 1 jika y X 1 X 2 ' S X 1 X 2 ln
2
p
1
p2
1
1
X 2 jika y X 1 X 2 ' S X 1 X 2 ln
2
p
1
dimana:
pi : prob. prior sebuah individu termasuk ke kelompok ke i
p 2 C 1 2
1
1
X 1 jika y X 1 X 2 ' S X 1 X 2 ln
2
p1C 2 1
p 2 C 1 2
1
1
X 2 jika y X 1 X 2 ' S X 1 X 2 ln
2
p
C
2
1
1
Jarak Mahalanobis
Jarak Mahalanobis:
1
X i jika X X i ' S
X Xi
minimum
Interpretasi Hasil
Jika secara statistik signifikansi fungsi diskriminasi dan klassifikasi akurasinya dapat
diterima, maka peneliti harus fokus pada pembuatan substansi interpretasi terhadap
hasil temuan tersebut.
Proses ini melibatkan pemeriksaan diskriminan yang berfungsi untuk menentukan
relatif pentingnya setiap variabel independen dalam membedakan antara kelompok
melalui:
i. Koefisien diskriminan (discriminant weight)
Semakin besar pembobot diskriminan menunjukkan semakin besar pula kekuatan
peubah yang bersesuaian dalam fungsi diskriminan.
ii. Discriminant structure correlation
Besaran ini mengukur korelasi linear sederhana antara masing-masing peubah bebas
dengan fungsi diskriminan.
iii. Nilai f parsial
Besarnya nilai f parsial dari suatu peubah bebas menunjukkan kekuatan peubah
tersebut di dalam fungsi diskriminan untuk membedakan amatan/obyek ke dalam
kelompok yang ada. Nilai f parsial ini sering digunakan apabila pembentukan fungsi
diskriminan menggunakan metode stepwise.