H1:
harus tolak H0 agar memenuhi asumsi rata-rata grup berbeda
kesimpulan: semua signifikan berbeda kecuali variabel Jam kerja => lihat dari nilai sig. nya
ket:
)
Centroid Grup ini menunjukan nilai tengah dari masing2 grup / dari masing2 Z score nya
Classification Results(a)
Classification Results
Minum
Predicted Group
Membership Total
sedikit banyak sedikit
Original Count sedikit
24 14 38
banyak
12 25 37
% sedikit
63.2 36.8 100.0
banyak
32.4 67.6 100.0
a 65.3% of original grouped cases correctly classified.
ket: angka yg berwarna merah: yang benar
interpretasi nilai 65,3 % => tingkat keakuratan fungsi diskriminan dapat membedakan
perbedaan grup adalah sebesar : (24 + 25) / 75 * 100% = 65,3 %
-selesai-
Tambahan Teori:
Ciri-ciri Diskriminan
ada 1 variabel dependen yang kategorik
ada var independen nya berupa matrik
ingin menentukan amatan masuk ke grup mana
bedanya dengan cluster => cluster menggunakan informasi variabel untuk
membentuk gerombol, sedangkan diskriminan membedakan dulu baru ada variabel-
variabelnya
UJI CLUSTER
variabel belum dibedakan antara X dan Y
Cluster Non Hierarki: sudah ada kepentingan dari peneliti (biaya, ada teori, dll)
Cluster Hierarki: membebaskan SPSS untuk membuat pengklusteran
Asumsi:
Normal
Multikolinieritas
Independen antar observasi
sampelnya acak
syarat utama: data harus berupa matrik
catatan jika normal maka sudah pasti independen, dan acak
tahapan:
1. uji kenormalan
2. Uji analisisnya: analyze Descriptives statististik descriptive masukan semua
variabel centang save standardized values as variables ok
3. analyze classify- hierarchical cluster- masukan semua variabel Z score ke kolom
variable(s) pada Statistic centang agglomeration dan proximity, pada cluster
membership=> none itu membebaskan spss, single dibatasi oleh user, range
solution=> memerintahkan mau minimum bro max brp pada plot pilih: dendogram,
pada method pilih Wards method-continue pada Label Cases masukan var provinsi
(yg akan dibuat cluster) OK
4. output
Agglomeration schedule : proses pembentukan cluster => ada . step
untuk yang non hierarki cluster:
analyze classify K means cluster masukan var Z score- select case by :
provinsi- number of cluster misalnya ingin buat jadi 3 cluster save: centang cluster
membership dan distance from cluster- di options : centang ANOVA- iterasi: tidak
ada yg diubah OK
output:
iteration history: melakukan iterasi brp kali untuk mendapatkan cluster terbaik
final cluster centers: jika nilai Z scorepositif berartinilai tsb berada di atas rata2 total,
jika negatif berarti rata2nya berada di bawah rata2 total
dengan kata lain jika + => di atas rata2 nasional, - di bawah rata2 nasional
Final Cluster Centers
Cluster
1 2 3
Zscore(PE)
.02972 -.04791 -.19605
Zscore(PDRB_per_kapita)
-.23288 -.22111 1.68545
Zscore(Share)
-.36608 3.02753 1.80569
Zscore(PAD)
-.27798 4.84684 .73412
Zscore(PMDN)
-.29842 .82484 1.88275
Zscore(PMA)
-.26154 5.06503 .56451
Zscore(J.Penduduk)
-.31256 .23384 2.12945
Zscore(IPM)
-.12337 1.93049 .38094
Zscore(TPAK)
.15775 -1.83674 -.64503
Zscore(PersenMiskin)
.02559 -1.02641 .07750
jadi rata2 yg tertinggi ada di cluster pertama .02972, kedua di cluster ke-2 -.04791, terendah
di cluster ke 3 -.19605
ANOVA
Cluster Error F Sig.
Mean Square Df Mean Square Df Mean Square df
Zscore(PE)
.090 2 1.061 30 .085 .919
Zscore(PDRB_per_kapita)
6.465 2 .636 30 10.171 .000
Zscore(Share)
12.980 2 .201 30 64.476 .000
Zscore(PAD)
13.906 2 .140 30 99.592 .000
Zscore(PMDN)
8.677 2 .488 30 17.771 .000
Zscore(PMA)
14.422 2 .105 30 137.111 .000
Zscore(J.Penduduk)
10.464 2 .369 30 28.354 .000
Zscore(IPM)
2.367 2 .909 30 2.604 .091
Zscore(TPAK)
2.867 2 .876 30 3.275 .052
Zscore(PersenMiskin)
.548 2 1.030 30 .532 .593
The F tests should be used only for descriptive purposes because the clusters have been chosen to maximize
the differences among cases in different clusters. The observed significance levels are not corrected for this and
thus cannot be interpreted as tests of the hypothesis that the cluster means are equal.
dilihat yang signifikan berbeda: share, PAD, PMDN, PMA, J Penduduk.=> variabel ini
bisa digunakan untuk mengelompokan cluster.
QCL1: melihat observasi masuk ke cluster mana
QCL 2: jarak antara observasi ke pusat cluster . contoh jarak rata2 aceh dengan
rata2 cluster tempat kemana aceh masuk.