Anda di halaman 1dari 55

ANALISIS MULTIVARIATE II

Diajukan untuk memenuhi Syarat

Ujian Akhir Semester Analisis Multivariate II

Disusun oleh:

Ardelia Luthfiyah Amardana (140610150009)

Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Padjadjaran
2018
ANALISIS KORELASI KANONIK
Kasus yang digunakan :

Provinsi 7-12 13-15 16-18 19-24


ACEH 99.19 94.99 73.53 24.11
SUMATERA UTARA 98.9 92.26 66.94 15.65
SUMATERA BARAT 98.24 89.51 65.65 21.26
RIAU 98.75 92.09 64.54 14.02
JAMBI 98.27 85.56 56.11 12.81
SUMATERA SELATAN 98 85.41 54.79 12.07
BENGKULU 98.67 88.25 59.63 16.95
LAMPUNG 98.71 86.62 51.34 9.82
KEP. BANGKA BELITUNG 97.1 80.59 47.51 8.9
KEP. RIAU 99.35 92.16 66.56 8.64
DKI JAKARTA 99.16 91.45 61.99 17.91
JAWA BARAT 98.29 82.73 47.82 10.38
JAWA TENGAH 98.95 85.33 53.72 11.34
DI YOGYAKARTA 99.69 94.02 73.06 44.03
JAWA TIMUR 98.74 88.82 59.39 12.43
BANTEN 98.01 81.7 50.9 11.7
BALI 98.69 89.26 65.22 15.31
NUSA TENGGARA BARAT 98.26 86.52 57.71 15.39
NUSA TENGGARA TIMUR 96.49 81.24 49.22 14.44
KALIMANTAN BARAT 97.04 84.48 50.35 11.43
KALIMANTAN TENGAH 98.7 86.83 54.5 11.06
KALIMANTAN SELATAN 97.9 80.59 50.23 12.18
KALIMANTAN TIMUR 98.68 92.49 64.76 14.88
SULAWESI UTARA 98.3 89.06 56.75 13.3
SULAWESI TENGAH 97.52 84.17 50.06 14.69
SULAWESI SELATAN 97 82.63 53 18.64
SULAWESI TENGGARA 97.81 88.17 59.93 18.28
GORONTALO 96.86 81.78 49.61 12.87
SULAWESI BARAT 95.93 77.92 44.54 10.47
MALUKU 98.27 92.85 72.4 21.88
MALUKU UTARA 97.23 90.76 64.12 17.04
PAPUA BARAT 94.43 90.25 60.12 14.66
PAPUA 76.22 74.35 48.28 13.18
Sumber : BPS Angka Partisipasi Sekolah menurut Provinsi
Dengan menggunakan softwar R diperoleh :

> setwd("D:/")
> data=read.csv("Data Ardel (2).csv")
> data

Provinsi X7.12 X13.15 X16.18 X19.24


1 ACEH 99.19 94.99 73.53 24.11
2 SUMATERA UTARA 98.90 92.26 66.94 15.65
3 SUMATERA BARAT 98.24 89.51 65.65 21.26
4 RIAU 98.75 92.09 64.54 14.02
5 JAMBI 98.27 85.56 56.11 12.81
6 SUMATERA SELATAN 98.00 85.41 54.79 12.07
7 BENGKULU 98.67 88.25 59.63 16.95
8 LAMPUNG 98.71 86.62 51.34 9.82
9 KEP. BANGKA BELITUNG 97.10 80.59 47.51 8.90
10 KEP. RIAU 99.35 92.16 66.56 8.64
11 DKI JAKARTA 99.16 91.45 61.99 17.91
12 JAWA BARAT 98.29 82.73 47.82 10.38
13 JAWA TENGAH 98.95 85.33 53.72 11.34
14 DI YOGYAKARTA 99.69 94.02 73.06 44.03
15 JAWA TIMUR 98.74 88.82 59.39 12.43
16 BANTEN 98.01 81.70 50.90 11.70
17 BALI 98.69 89.26 65.22 15.31
18 NUSA TENGGARA BARAT 98.26 86.52 57.71 15.39
19 NUSA TENGGARA TIMUR 96.49 81.24 49.22 14.44
20 KALIMANTAN BARAT 97.04 84.48 50.35 11.43
21 KALIMANTAN TENGAH 98.70 86.83 54.50 11.06
22 KALIMANTAN SELATAN 97.90 80.59 50.23 12.18
23 KALIMANTAN TIMUR 98.68 92.49 64.76 14.88
24 SULAWESI UTARA 98.30 89.06 56.75 13.30
25 SULAWESI TENGAH 97.52 84.17 50.06 14.69
26 SULAWESI SELATAN 97.00 82.63 53.00 18.64
27 SULAWESI TENGGARA 97.81 88.17 59.93 18.28
28 GORONTALO 96.86 81.78 49.61 12.87
29 SULAWESI BARAT 95.93 77.92 44.54 10.47
30 MALUKU 98.27 92.85 72.40 21.88
31 MALUKU UTARA 97.23 90.76 64.12 17.04
32 PAPUA BARAT 94.43 90.25 60.12 14.66
33 PAPUA 76.22 74.35 48.28 13.18

> attach(data)
> apsmuda=data.frame(X7.12,X13.15)
> apsdewasa=data.frame(X16.18,X19.24)
> install.packages("CCA")
> library(CCA)
> cc(apsmuda,apsdewasa)

$cor
[1] 0.94993259 0.07590146

$names
$names$Xnames
[1] "X7.12" "X13.15"
$names$Ynames
[1] "X16.18" "X19.24"

$names$ind.names
[1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10" "11" "12" "13" "14" "1
5" "16" "17" "18" "19"
[20] "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30" "31" "32" "33"

$xcoef
[,1] [,2]
X7.12 0.06624286 -0.29877430
X13.15 -0.22523353 0.08933992

$ycoef
[,1] [,2]
X16.18 -0.13567495 -0.08867704
X19.24 0.02443922 0.20405167

$scores
$scores$xscores
[,1] [,2]
[1,] -1.72137851 0.188001030
[2,] -1.12570141 0.030747602
[3,] -0.55002949 -0.017746134
[4,] -1.09734814 0.060375961
[5,] 0.34163023 -0.379602035
[6,] 0.35752969 -0.312333963
[7,] -0.23775082 -0.258787377
[8,] 0.13202955 -0.416362413
[9,] 1.38353672 -0.474055497
[10,] -1.07336877 -0.112634823
[11,] -0.92603911 -0.119299047
[12,] 0.98036597 -0.638409486
[13,] 0.43847908 -0.603316738
[14,] -1.46978056 -0.048045838
[15,] -0.36149693 -0.228777825
[16,] 1.19380850 -0.646772798
[17,] -0.46391182 -0.174529547
[18,] 0.12474361 -0.290847972
[19,] 1.19672678 -0.233732230
[20,] 0.50340372 -0.108596761
[21,] 0.08406808 -0.394613288
[22,] 1.43653100 -0.713074933
[23,] -1.19207855 0.117026128
[24,] -0.44469983 -0.075875554
[25,] 0.60502269 -0.279703798
[26,] 0.91743604 -0.261924636
[27,] -0.27670099 -0.008988676
[28,] 1.09961054 -0.296035164
[29,] 1.90740610 -0.363027149
[30,] -1.30032219 0.271685960
[31,] -0.89847669 0.395690801
[32,] -0.96908758 1.186695473
[33,] 1.40584310 5.206870725

$scores$yscores
[,1] [,2]
[1,] -1.929329825 0.41408453
[2,] -1.241987703 -0.72781092
[3,] -0.929863002 0.53131234
[4,] -0.956203753 -0.84759025
[5,] 0.157964611 -0.34694531
[6,] 0.318970522 -0.38088986
[7,] -0.218432843 0.18568542
[8,] 0.732060853 -0.53407033
[9,] 1.229211825 -0.38216480
[10,] -1.361750146 -2.12451587
[11,] -0.515164072 0.17229721
[12,] 1.223322635 -0.10765821
[13,] 0.446302087 -0.43496314
[14,] -1.378733362 4.52047205
[15,] -0.296336124 -0.71534564
[16,] 0.837703561 -0.11143529
[17,] -1.016936126 -0.64466398
[18,] 0.003937877 0.03762473
[19,] 1.132600935 0.59664372
[20,] 0.905726194 -0.11775687
[21,] 0.333632646 -0.56126571
[22,] 0.940336602 0.04592313
[23,] -0.965034513 -0.69161476
[24,] 0.083107861 -0.30371330
[25,] 1.024743783 0.57316793
[26,] 0.722394347 1.11846153
[27,] -0.226631167 0.43047104
[28,] 1.041318131 0.24169855
[29,] 1.670535997 0.20156714
[30,] -1.830516591 0.05925435
[31,] -0.825413833 -0.19410984
[32,] -0.340879379 -0.32504466
[33,] 1.229341971 0.42289504

$scores$corr.X.xscores
[,1] [,2]
X7.12 -0.3687084 -0.9295451
X13.15 -0.9762917 -0.2164589

$scores$corr.Y.xscores
[,1] [,2]
X16.18 -0.9431917 0.00902619
X19.24 -0.5197124 0.06353440

$scores$corr.X.yscores
[,1] [,2]
X7.12 -0.3502481 -0.07055383
X13.15 -0.9274113 -0.01642955

$scores$corr.Y.yscores
[,1] [,2]
X16.18 -0.9929039 0.1189199
X19.24 -0.5471046 0.8370643
Interpretasi :

Berdasarkan hasil output yang disajikan oleh R studio, didapat korelasi untuk Aps Muda
dari variabel umur 7-12 dan umur 13-15 adalah 0.94993259 dan korelasi untuk Aps Dewasa
dari variabel umur 16-18 dan umur 19-24 adalah 0.07590146.

> plot(res.cc1$cor,type="b")

> plot(res.cc1$cor,type="b")
Kesimpulan :

Maka, dari hasil analisis diatas dapat disimpulkan bahwa APS Muda (Umur 7 -12 dan
Umur 13 - 15) memiliki rata-rata Angka Partisipasi Sekolah yang signifikan dibandingkan APS
Dewasa (Umur 16-18 dan Umur 19-24).
ANALISIS DISKRIMINAN 2 KELOMPOK

Kasus yang digunakan :

Diketahui dua kelompok perusahaan masing-masing terdiri dari 12 perusahaan dimana


dikelompokkan menjadi perusahaan yang sangat dikagumi (Most-Admired) dan kurang
dikagumi (Least-Admired). Dua factor rasio finansial yang berkaitan dengan perusahaan diambil
yaitu Earning Before Interest and Taxes to total ASSets (EBITASS) dan Return On Total Capital
(ROTC). Berikut ini data dari kedua kelompok perusahaan:

Kelompok 1 : Kurang Dikagumi Kelompok 2 : Paling Dikagumi


Jenis Perusahaan Jenis Perusahaan
EBITAS ROTC EBITASS ROTC
1 -0.012 -0.031 13 0.158 0.182
2 0.036 0.053 14 0.210 0.206
3 0.038 0.036 15 0.207 0.188
4 -0.063 -0.074 16 0.280 0.236
5 -0.054 -0.119 17 0.197 0.193
6 0 -0.005 18 0.227 0.173
7 0.005 0.039 19 0.148 0.196
8 0.091 0.122 20 0.254 0.212
9 -0.036 -0.072 21 0.079 0.147
10 0.045 0.064 22 0.149 0.128
11 -0.026 -0.024 23 0.200 0.150
12 0.016 0.026 24 0.187 0.191
Jawab:

Menggunakan Software SPSS

Lalu, Dengan menggunakan Analyze  Classify  Discriminant

Dari hal tersebut, diperoleh sebuah output sebagai berikut :


 Deskriptif

Group Statistics

Valid N (listwise)

Kelompok Mean Std. Deviation Unweighted Weighted

1 EBITASS .00333 .044919 12 12.000

ROTC .00125 .068521 12 12.000


2 EBITASS .19133 .053241 12 12.000
ROTC .18350 .030219 12 12.000
Total EBITASS .09733 .107428 24 24.000

ROTC .09238 .106522 24 24.000

Dari tabel diatas diketahui bahwa rata – rata EBITASS pada kelompok 1 atau kelompok yang
kurang dikagumi lebih rendah dibandingkan dengan kelompok 2 atau kelompok yang paling
dikagumi, sama - halnya dengan rata-rata ROTC pada kelompok 1 lebih rendah pula
dibandingkan kelompok 2.

 Inferensial

Uji Perbedaan Antar Kelompok

Variabel EBITASS :

H0 : µ1=μ2 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata EBITASS
kelompok 1 dengan kelompok 2

H1 : µ1≠μ2 yang artinya Terdapat perbedaan yang signifikans antara rata – rata EBITASS
kelompok 1 dengan kelompok 2

Statistik Uji :

Wilks' Lambda F df1 df2 Sig.


EBITASS .201 87.408 1 22 .000
ROTC .236 71.070 1 22 .000
Kriteria Uji :

Tolak H0 jika p-value < alpha dan terima dalam hal lainnya.

Kesimpulan :

Karena p-value = 0.000 < alpha = 0.05, maka H0 ditolak yang artinya Terdapat perbedaan
signifikan antara rata – rata EBITASS Kelompok 1 denga Kelompok 2

Variabel ROTC

H0 : µ1=μ2 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata ROTC
kelompok 1 dengan kelompok 2

H1 : µ1≠μ2 yang artinya Terdapat perbedaan yang signifikans antara rata – rata ROTC kelompok
1 dengan kelompok 2

Statistik Uji :

Tests of Equality of Group Means


Wilks' Lambda F df1 df2 Sig.
EBITASS .201 87.408 1 22 .000
ROTC .236 71.070 1 22 .000

Kriteria Uji :

Tolak H0 jika p-value < alpha dan terima dalam hal lainnya.

Kesimpulan :

Karena p-value = 0.000 < alpha = 0.05, maka H0 ditolak yang artinya Terdapat perbedaan
signifikan antara rata – rata ROTC Kelompok 1 denga Kelompok 2
Uji Matriks Kovarians antar Kelompok

H0 : Kelompok Matriks Kovarians adalah relatif sama

H1 : Kelompok Matriks Kovarians adalah berbeda secara nyata

Statistik Uji :

Dengan mengunakan Uji Box-M dan Log Determinants

Log Determinants
Kelompok Rank Log Determinant
1 1 -6.206
2 1 -5.866
Pooled within-groups 1 -6.021
The ranks and natural logarithms of determinants printed are those of the group covariance
matrices.

Test Results
Box's M .316
F Approx. .302
df1 1
df2 1452.000
Sig. .582
Tests null hypothesis of equal population covariance matrices.

Kriteria Uji :

Tolak H0 Jika p-value < alpha dan terima dalam hal lainnya

Kesimpulan

Berdasarkan uji Box-M diperoleh bahwa p-value = 0.582 > alpha = 0.05, maka H0 diterima
yang berarti Kelompok Matriks Kovarians adalah relative sama.

Sedangkan, Berdasarkan Berdasarkan output Log Determinants terlihat bahwa angka Log
Determinants untuk kategori kurang dikagumi (1) dan paling dikagumi (2) sedikit berbeda,
sehingga kelompok matriks kovarians adalah relative sama.
Proses Diskriminan Pada Kasus

Output 1

Variables Entered/Removeda,b,c,d
Min. D Squared
Between Exact F
Step Entered Statistic Groups Statistic df1 df2 Sig.
1 EBITASS 14.568 1 and 2 87.408 1 22.000 4.048E-9
At each step, the variable that maximizes the Mahalanobis distance between the two closest
groups is entered.
a. Maximum number of steps is 4.
b. Minimum partial F to enter is 3.84.
c. Maximum partial F to remove is 2.71.
d. F level, tolerance, or VIN insufficient for further computation.

Dari hasil tabel diatas, dari 2 variabel bebas yang diketahui ternyata yang dengan menggunakan
Stepwise Method yang memenuhi kriteria hanya satu variabel yaitu EBITASS karena p-value <
alpha.

Output 2

Variables in the Analysis


Step Tolerance F to Remove
1 EBITASS 1.000 87.408

Tabel di atas hanyalah sebagai perincian dari proses stepwise pada tabel sebelumnya. Dari tabel
output di atas dapat dilihat hanya pada step 1, variabel EBITASS adalah variabel pertama yang
masuk dalam model diskriminan. Hal ini disebabkan variabel tersebut mempunyai angka Sig.
of F to Remove yang paling sedikit dibandingkan dengan variabel ROTC.

Output 3

Wilks' Lambda
Number of Exact F
Step Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.
1 1 .201 1 1 22 87.408 1 22.000 .000
Wilk’s Lambda pada prinsipnya adalah varians total dalam discriminant scores yang tidak bisa
dijelaskan oleh perbedaan di antara grup-grup yang ada. Perhatikan tabel di atas yang terdiri atas
hanya 1 tahap (step), yang terkait dengan 1 variabel yang secara berurutan dimasukkan pada
tahapan analisis sebelu mnya.

Pada step 1, jumlah variabel yang dimasukkan ada satu yaitu variabel EBITASS dengan angka
Wilk’s Lambda adalah 0,201. Hal ini berarti 20.1% varians tidak dapat dijelaskan oleh perbedaan
antara grup-grup.

Dari Statistics F dan signifikansinya dapat diketahui bahwa variabel tersebut signifikans. Hal itu
dapat meyakinkan bahwa variabel EBITASS memang berbeda untuk 2 kelompok.

Output 4

Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
a
1 3.973 100.0 100.0 .894
a. First 1 canonical discriminant functions were used in the analysis.

Canonical Correlation mengukur keeratan hubungan antara Discriminant Score dengan


kelompok, karena pada kasus ini ada 2 kategori maka terdapat 2 kelompok. Dari tabel diatas
dapat diketahui bahwa nilai Canonical Correlation adalah 0.894 dan itu cukup tinggi untuk
menunjukan skala keeratan hubungan.

Output 5

Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 .201 34.487 1 .000

Dari Tabel diatas, Angka Chi-Square sebesar 34.487 dengan tingkat signifikansi yang tinggi
menunjukan perbedaan yang jelas antara 2 kelompok kategori.
Output 6

Structure Matrix
Function
1
EBITASS 1.000
ROTCa .780
Pooled within-groups correlations between discriminating variables and standardized canonical
discriminant functions
Variables ordered by absolute size of correlation within function.
a. This variable not used in the analysis.

Tabel Structure Matrix menjelaskan korelasi antara variabel indepenen dengan fungsi
diskriminanyang terbentuk. Terlihat Variabel EBITASS paling erat hubungannya dengan fungsi
diskriminan lalu diikuti oleh Variabel ROTC namun Variabel ini tidak dimasukkan ke dalam
model diskriminan.

Output 7

Canonical Discriminant Function Coefficients


Function
1
EBITASS 20.302
(Constant) -1.976
Unstandardized coefficients

Tabel di atas mempunyai fungsi yang hampir mirip dengan persamaan regresi berganda,yang
dalam analisis diskriminan disebut sebagai Fungsi Diskriminan :
Z Score = -1.976 + 20.302 EBITASS
Kegunaan fungsi tersebut untuk mengetahui sebuah perusahaan masuk pada kelompok yang satu
atau lainnya.
Kesimpulan

Jadi, Berdasarkan Uji Wilks Lamdba terdapat perbedaan yang signifikans antara kedua
kelompok dan dari kedua variabel bebas tersebut, ternyata hanya satu variabel yang memenuhi
kriteria yaitu Variabel EBITASS. Sehingga Fungsi (Model) Diskriminan yang didapat adalah :

Z Score = -1.976 + 20.302 EBITASS

Dimana dari model tersebut dapat diketahui prediksi jenis perusahaan tersebut apakah termasuk
kedalam kelompok perusahaan yang kurang dikagumi atau paling dikagumi.
ANALISIS DISKRIMINAN 3 KELOMPOK

Kasus yang digunakan :

Seorang peneliti meneliti mengenai 3 Species of Iris Flowers dari 15 Tanaman setiap speciesnya
yang diukur dengan 4 Variabel Bebas yaitu X1 = Sepal Length, X2 = Sepal Width, X3 = Petal
Length, dan X4 = Petal Width. Berikut data peneliti tersebut :

Species Of Iris Sepal Length Sepal Width Petal Length Petal Width
Iris Setosa 5.1 3.5 1.4 0.2
Iris Setosa 4.9 3.0 1.4 0.2
Iris Setosa 4.7 3.2 1.3 0.2
Iris Setosa 4.6 3.1 1.5 0.2
Iris Setosa 5.0 3.6 1.4 0.2
Iris Setosa 5.4 3.9 1.7 0.4
Iris Setosa 4.6 3.4 1.4 0.3
Iris Setosa 5.0 3.4 1.5 0.2
Iris Setosa 4.4 3.9 1.4 0.2
Iris Setosa 4.9 3.1 1.5 0.1
Iris Setosa 5.4 3.7 1.5 0.2
Iris Setosa 4.8 3.4 1.6 0.2
Iris Setosa 4.8 3.0 1.4 0.1
Iris Setosa 4.3 3.0 1.1 0.1
Iris Setosa 5.0 4.0 1.2 0.2
Iris Versicolor 7.0 3.2 4.7 1.4
Iris Versicolor 6.4 3.2 4.5 1.5
Iris Versicolor 6.9 3.2 4.9 1.5
Iris Versicolor 5.5 2.3 4 1.3
Iris Versicolor 6.5 2.8 4.6 1.5
Iris Versicolor 5.7 2.8 4.5 1.3
Iris Versicolor 6.3 3.3 4.7 1.6
Iris Versicolor 4.9 2.4 3.3 1
Iris Versicolor 6.6 2.9 4.6 1.3
Iris Versicolor 5.2 2.7 3.9 1.4
Iris Versicolor 5.0 2.0 3.5 1
Iris Versicolor 5.9 3.0 4.2 1.5
Iris Versicolor 6.0 2.2 4 1
Iris Versicolor 6.1 2.9 4.7 1.4
Iris Versicolor 5.6 2.9 3.6 1.3
Iris Virginica 6.3 3.3 6 2.5
Iris Virginica 5.8 2.7 5.1 1.9
Iris Virginica 7.1 3.0 5.9 2.1
Iris Virginica 6.3 2.9 5.6 1.8
Iris Virginica 6.5 3.0 5.8 2.2
Iris Virginica 7.6 3.0 6.6 2.1
Iris Virginica 4.9 2.5 4.5 1.7
Iris Virginica 7.3 2.9 6.3 1.8
Iris Virginica 6.7 2.5 5.8 1.8
Iris Virginica 7.2 3.6 6.1 2.5
Iris Virginica 6.5 3.2 5.1 2
Iris Virginica 6.4 2.7 5.3 1.9
Iris Virginica 6.8 3.0 5.5 2.1
Iris Virginica 5.7 2.5 5 2
Iris Virginica 5.8 2.8 5.1 2.4

Jawab :

Menggunakan Software SPSS :


 Deskriptif

Group Statistics
Valid N (listwise)
Species_of_Iris Mean Std. Deviation Unweighted Weighted
Iris Setosa Sepal_Length 4.8600 .31578 15 15.000
Sepal_Width 3.4133 .34819 15 15.000
Petal_Length 1.4200 .14736 15 15.000
Petal_Width .2000 .07559 15 15.000
Iris Versicolor Sepal_Length 5.9733 .65625 15 15.000
Sepal_Width 2.7800 .39133 15 15.000
Petal_Length 4.2467 .50266 15 15.000
Petal_Width 1.3333 .19518 15 15.000
Iris Virginica Sepal_Length 6.4600 .71093 15 15.000
Sepal_Width 2.9067 .31045 15 15.000
Petal_Length 5.5800 .56594 15 15.000
Petal_Width 2.0533 .25598 15 15.000
Total Sepal_Length 5.7644 .88784 45 45.000
Sepal_Width 3.0333 .44107 45 45.000
Petal_Length 3.7489 1.80714 45 45.000
Petal_Width 1.1956 .79371 45 45.000

Dari tabel diatas diketahui bahwa Species of Iris Setosa memiliki rata – rata yang lebih besar
pada Sepal Width dibandingan dengan jenis species lainnya, lalu Speciesi of Iris Versicolor
memiliki rata – rata yang lebih besar pada Petal Width dibandingan dengan jenis species lainnya,
dan Species of Iris Virginica memiliki rata – rata yang lebih besar pada Sepal Length dan Petal
Length.
 Inferensial

Uji Perbedaan Antar Kelompok

Hipotesis

X1= Sepal Length

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Sepal
Length dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Sepal Length
dalam kelompok

X2= Sepal Width

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Sepal
Width dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Sepal Width dalam
kelompok

X3= Petal Length

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Petal
Length dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Petal Length
dalam kelompok

X4= Petal Width

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Petal
Width dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Petal Width dalam
kelompok
Statistik Uji :

Tests of Equality of Group Means


Wilks' Lambda F df1 df2 Sig.
Sepal_Length .418 29.226 2 42 .000
Sepal_Width .606 13.631 2 42 .000
Petal_Length .058 341.453 2 42 .000
Petal_Width .055 359.293 2 42 .000

Kriteria Uji :

Tolak H0 jika p-value < alpha dan terima dalam hal lainnya.

Kesimpulan :

Karena masing – masing variabel memiliki p-value < alpha, maka H0 ditolak yang artinya tiap
variabel memiliki perbedaan rata – rata dalam kelompok.

Uji Matriks Kovarians antar Kelompok

H0 : Kelompok Matriks Kovarians adalah relatif sama

H1 : Kelompok Matriks Kovarians adalah berbeda secara nyata

Statistik Uji :

Dengan mengunakan Uji Box-M dan Log Determinants

Log Determinants
Species_of_Iris Rank Log Determinant
Iris Setosa 3 -11.824
Iris Versicolor 3 -8.728
Iris Virginica 3 -7.261
Pooled within-groups 3 -8.016
The ranks and natural logarithms of determinants printed are those of the group covariance
matrices.
Test Results
Box's M 52.705
F Approx. 3.933
df1 12
df2 8548.615
Sig. .000
Tests null hypothesis of equal population covariance matrices.

Kriteria Uji :

Tolak H0 Jika p-value < alpha dan terima dalam hal lainnya

Kesimpulan

Berdasarkan uji Box-M diperoleh bahwa p-value = 0.000 < alpha = 0.05, maka H0 ditolak
yang berarti Kelompok Matriks Kovarians berbeda secara nyata. Dalam hal ini menyalahi asumsi
diskriminan. Namun demikian analisis fungsi diskriminan tetap robush walaupun asumsi
homogenitas varians tidak terpenuhi dengan syarat data tidak memiliki outlier.(Ghazali, 2008)

Proses Diskriminan Pada Kasus

Output 1

Variables Entered/Removeda,b,c,d
Min. D Squared
Between Exact F
Step Entered Statistic Groups Statistic df1 df2 Sig.
1 Iris Versicolor
Petal_Width 14.224 and Iris 106.683 1 42.000 4.234E-13
Virginica
2 Iris Versicolor
Sepal_Width 23.655 and Iris 86.594 2 41.000 1.909E-15
Virginica
3 Iris Versicolor
Petal_Length 29.236 and Iris 69.608 3 40.000 6.283E-16
Virginica
At each step, the variable that maximizes the Mahalanobis distance between the two closest
groups is entered.
a. Maximum number of steps is 8.
b. Minimum partial F to enter is 3.84.
c. Maximum partial F to remove is 2.71.
d. F level, tolerance, or VIN insufficient for further computation.

Dari hasil tabel diatas, dari 4 variabel bebas yang diketahui ternyata yang dengan menggunakan
Stepwise Method yang memenuhi kriteria hanya tiga variabel yaitu Petal Width, Sepal Width,
dan Petal Length karena p-value < alpha.

Output 2

Canonical Discriminant Function Coefficients


Function
1 2
Sepal_Width -3.154 1.878
Petal_Length 1.436 -1.198
Petal_Width 5.240 3.329
(Constant) -2.073 -5.190
Unstandardized coefficients

Dari hasil tabel diatas, persamaan estimasi fungsi diskriminan unstandardized dapat membuat
persamaan fungsi diskriminan sebagai berikut:

Z1 = -2.073 – 3.154 Sepal Width + 1.436 Petal Length + 5.240 Petal Width

Z2 = -5.190 + 1.878 Sepal Width – 1.198 Petal Length + 3.329 Petal Width

Dari persamaan diskriminan 1 (Z1) dan persamaan diskriminan 2 (Z2) terlihat bahwa nilai rata
rata rasio yang paling dominan untuk memprediksi perbedaan Species of Iris adalah Petal Width
karena memiliki koefisien yang tinggi dengan masing – masing persamaan 5.240 dan 3.229.

Output 3

Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 through 2 .015 173.432 6 .000
2 .825 7.680 2 .021

Dari tabel di atas, fungsi diskriminan pertama dan kedua (secara bersama) adalah signifikan.
Namun jika hanya fungsi diskriminan kedua yang diperhitungkan (dengan menghilangkan fungsi
diskriminan pertama) maka fungsi kedua tidak signifikan, maka dapat disimpulkan bahwa fungsi
diskriminan signifikan secara statistic yang berarti nilai rata-rata score diskriminan untuk Iris
Setosa, Iris Versicolor, dan Iris Virginice berbeda secara signifikan.

Output 4

Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
a
1 55.988 99.6 99.6 .991
2 .206a .4 100.0 .413
a. First 2 canonical discriminant functions were used in the analysis.
Dari tabel diatas, dapat dilihat bahwa Fungsi Diskriminan 1 memiliki Canonical Correlation
sebesar 0.991 yang lebih besar dibandingkan dengan Fungsi Diskriminan 2 yang berarti terdapat
perbedaan secara signifikan antara ketiga jenis kelompok tersebut sebesar 0.991.

Kesimpulan

Jadi, Berdasarkan Uji Wilks Lamdba terdapat perbedaan yang signifikans antara ketiga
kelompok dengan masing – masing keempat variabel bebas tersebut. Dengan menggunakan
Stepwise Method dari 4 Variabel Bebas hanya ada 3 variabel yang memenuhi kriteria yaitu
Variabel Sepal Width, Petal Length, dan Petal Width.
Sehingga Fungsi (Model) Diskriminan yang didapat adalah :

Z1 = -2.073 – 3.154 Sepal Width + 1.436 Petal Length + 5.240 Petal Width

Z2 = -5.190 + 1.878 Sepal Width – 1.198 Petal Length + 3.329 Petal Width
Soal No 11.29 Hal 567

The GPA and GMAT data alluded to in Example 11.11 are listed in Table 11.6

𝜋1 = Admit 𝜋2 = No Admit 𝜋3 = Borderline


Applicant GPA GMAT Applicant GPA GMAT Applicant GPA GMAT
1 2.96 596 32 2.54 446 60 2.86 494
2 3.14 473 33 2.43 425 61 2.85 496
3 3.22 482 34 2.2 474 62 3.14 419
4 3.29 527 35 2.36 531 63 3.28 371
5 3.69 505 36 2.57 542 64 2.89 447
6 3.46 693 37 2.35 406 65 3.15 313
7 3.03 626 38 2.51 412 66 3.5 402
8 3.19 663 39 2.51 458 67 2.89 485
9 3.63 447 40 2.36 399 68 2.8 444
10 3.59 588 41 2.36 482 69 3.13 416
11 3.3 563 42 2.66 420 70 3.01 471
12 3.4 553 43 2.68 414 71 2.79 490
13 3.5 572 44 2.48 533 72 2.89 431
14 3.78 591 45 2.46 509 73 2.91 446
15 3.44 692 46 2.63 504 74 2.75 546
16 3.48 528 47 2.44 336 75 2.73 467
17 3.47 552 48 2.13 408 76 3.12 463
18 3.35 520 49 2.41 469 77 3.08 440
19 3.39 543 50 2.55 538 78 3.03 419
20 3.28 523 51 2.31 505 79 3 509
21 3.21 530 52 2.41 489 80 3.03 438
22 3.58 564 53 2.19 411 81 3.05 399
23 3.33 565 54 2.35 321 82 2.85 483
24 3.4 431 55 2.6 394 83 3.01 453
25 3.38 605 56 2.55 528 84 3.03 414
26 3.26 664 57 2.72 399 85 3.04 446
27 3.6 609 58 2.85 381
28 3.37 559 59 2.9 384
29 3.8 521
30 3.76 646
31 3.24 467
(a) Using these data, calculate ̅ 1, ̅ 2, ̅ 3, ̅ and Spooled thus Verify the results for these
quantities

given in Example 11.11

Jawab :

Dengan Menggunakan Software SPPS

Group Statistics
Valid N (listwise)
Group Mean Std. Deviation Unweighted Weighted
1.00 GPA 3.4039 .20871 31 31.000
GMAT 561.2258 67.95769 31 31.000
2.00 GPA 2.4825 .18344 28 28.000
GMAT 447.0714 62.37992 28 28.000
3.00 GPA 2.9927 .17232 26 26.000
GMAT 446.2308 47.40153 26 26.000
Total GPA 2.9746 .42900 85 85.000
GMAT 488.4471 81.52235 85 85.000

Pooled Within-Groups Matricesa


GPA GMAT
Covariance GPA .036 -2.019
GMAT -2.019 3655.901
Correlation GPA 1.000 -.176
GMAT -.176 1.000
a. The covariance matrix has 82 degrees of freedom.

Dari Output diatas, diperoleh

̅ 1 = [3.4039 561.2258]

̅ 2 = [2.4825 447.0714]

̅ 3 = [2.9927 446.2308]

̅ = [2.9746 488.4471]
Spooled = 0.0436 -2.019
-2.019 3655.9

(b) Calculate W-1 and ̂ 0 and the eigenvalues and eigenvectors of W-1 ̂ 0. Use the linear
discriminants derived fron these eigenvectors to classify the new observation X=[3.21 497]
into one of the populations 𝜋1:admit, 𝜋2:not admit, and 𝜋3:borderline. Does the
classification agree with that in Example 11.11 ? Should it? Explain

Jawab :

Dengan Menggunakan Software R :


> X1=matrix(c(3.4039,561.2258),2,1)
> X2=matrix(c(2.4825,447.0714),2,1)
> X3=matrix(c(2.9927,446.2308),2,1)
> X=matrix(c(2.9746,488.4471),2,1)
> A=X1-X
> B=X2-X
> C=X3-X
> A1=A%*%t(A)
> B1=B%*%t(B)
> C1=C%*%t(C)
> B0=A1+B1+C1
> B0
[,1] [,2]
[1,] 0.4267885 50.84076
[2,] 50.8407629 8790.90371
> n=31+28+26-3
> Sp=matrix(c(0.036,-2.019,-2.019,3655.901),2,2)
> W=n*Sp
> W1=solve(W)
> W1
[,1] [,2]
[1,] 0.3495807640 1.930587e-04
[2,] 0.0001930587 3.442355e-06
> WB=solve(W)%*%B0
> WB
[,1] [,2]
[1,] 0.1590123059 19.47011333
[2,] 0.0002574072 0.04007666
> eigen(WB)
$values
[1] 0.192000791 0.007088175

$vectors
[,1] [,2]
[1,] 0.999998565 -0.999969558
[2,] 0.001694312 0.007802703
Dari hasil diatas, diperoleh :

 W-1
[,1] [,2]
[1,] 0.3495807640 1.930587e-04
[2,] 0.0001930587 3.442355e-06

 ̂0
[,1] [,2]
[1,] 0.4267885 50.84076
[2,] 50.8407629 8790.90371

 Eigen Value dari W-1 ̂ 0


𝜆1 = 0.192000791
𝜆2 = 0.007088175

 Eigen Vektor dari W-1 ̂ 0


Dari nilai eigen diatas, didapatkan :

 𝜆
Dan nilai vector eigen :

[ ]

Sehingga dari nilai vector eigen diatas, dapat dicari persamaan yaitu :

̂
 𝜆
Dan nilai vector eigen

[ ]

Sehingga dari nilai vector eigen diatas, dapat dicari persamaan yaitu :
̂

 Mencari S-1pooled
> solve(Sp)
[,1] [,2]
[1,] 28.66562265 0.0158308149
[2,] 0.01583081 0.000282273
S-1pooled = [ ]

Selanjutnya, dengan x’0 = [3.21 497], maka jarak sampel adalah sebagai berikut :

o ( ) ( ̅̅̅) ( ̅̅̅̅)
= [ ]

[ ]

> d1.x0=t(x0-rata1)%*%(solve(Spooled))%*%(x0-rata1)
> d1.x0
[,1]
[1,] 2.633025

Maka ( )

o ( ) ( ̅̅̅) ( ̅̅̅̅)
> d2.x0=t(x0-rata2)%*%(solve(Spooled))%*%(x0-rata2)
> d2.x0
[,1]
[1,] 16.99314
Maka ( )

o ( ) ( ̅̅̅) ( ̅̅̅̅)
> d3.x0=t(x0-rata3)%*%(solve(Spooled))%*%(x0-rata3)
> d3.x0
[,1]
[1,] 2.427123
Maka ( )

Dari hasil diatas, didaptkan bahwa rata-rata jarak grup yang terkecil adalah ̅̅̅ yaitu
sebesar 2.427123.
Mengklasifikasikan kedalam observasi yang baru :
̂

Dengan x’0 = [3.21 497]

 ̂
= ( ) ( ) = 4.0522893
 ̂
( ) ( )
ANALISIS KLUSTER HIERARKI

Kasus yang digunakan :

No PROVINSI IPM HLS AHS


1 ACEH 70.6 14.13 69.52
2 SUMATERA UTARA 70.57 13.1 68.37
3 SUMATERA BARAT 71.24 13.94 68.78
4 RIAU 71.79 13.03 70.99
5 JAMBI 69.99 12.87 70.76
6 SUMATERA SELATAN 68.86 12.35 69.18
7 BENGKULU 69.95 13.57 68.59
8 LAMPUNG 68.25 12.46 69.95
9 KEP. BANGKA BELITUNG 69.99 11.83 69.95
10 KEP. RIAU 74.45 12.81 69.48
11 DKI JAKARTA 80.06 12.86 72.55
12 JAWA BARAT 70.69 12.42 72.47
13 JAWA TENGAH 70.52 12.57 74.08
14 DI YOGYAKARTA 78.89 15.42 74.74
15 JAWA TIMUR 70.27 13.09 70.8
16 BANTEN 71.42 12.78 69.49
17 BALI 74.3 13.21 71.46
18 NUSA TENGGARA BARAT 66.58 13.46 65.55
19 NUSA TENGGARA TIMUR 63.73 13.07 66.07
20 KALIMANTAN BARAT 66.26 12.5 69.92
21 KALIMANTAN TENGAH 69.79 12.45 69.59
22 KALIMANTAN SELATAN 69.65 12.46 68.02
23 KALIMANTAN TIMUR 75.12 13.49 73.7
24 KALIMANTAN UTARA 69.84 12.79 72.47
25 SULAWESI UTARA 71.66 12.66 71.04
26 SULAWESI TENGAH 68.11 13.04 67.32
27 SULAWESI SELATAN 70.34 13.28 69.84
28 SULAWESI TENGGARA 69.86 13.36 70.47
29 GORONTALO 67.01 13.01 67.14
30 SULAWESI BARAT 64.3 12.48 64.34
31 MALUKU 68.19 13.91 65.4
32 MALUKU UTARA 67.2 13.56 67.54
33 PAPUA BARAT 62.99 12.47 65.32
34 PAPUA 59.09 10.54 65.14
Dengan menggunakan software R :

> setwd("C:/Users/user123/Documents/multi")
> kluster=read.csv("kluster.csv")
> attach(kluster)
> kluster=data.frame(IPM,HLS,AHS)
> kluster1=scale(kluster)
> d=dist(kluster1,method="euclidean")

1. Menggunakan Single Lingkage


> #Single Linkage
> fit.s <-hclust(d,method="single")
> plot(fit.s)

2. Menggunakan Complete Lingkage


> #Complete Linkage
> fit.c <-hclust(d,method="complete")
> plot(fit.c)
3. Menggunakan Average Lingkage
> #Average Linkage
> fit.a <-hclust(d,method="average")
> plot(fit.a)
4. Menggunakan Ward Lingkage

> #Ward Linkage


> fit.w <-hclust(d,method="ward.D")
> plot(fit.w)

Dari keempat metode yang digunakan terlihat menghasilkan Dendogram yang


berbedabeda, sehingga kita harus memilih metode yang dapat mengelompokkan data dengan
jelas. Katakan saja dalam kasus ini kita akan menggunaka metode Ward untuk mengelompokkan
data kita. Selanjutnya kita akan mengelompokkan data dengan cara memotong dendogram
menjadi 7 klaster menggunakan perintah berikut ini :

> install.packages("sparcl")
Installing package into ‘C:/Users/user123/Documents/R/win-library/3.3’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/sparcl_1.0.3.zi
p'
Content type 'application/zip' length 62462 bytes (60 KB)
downloaded 60 KB

package ‘sparcl’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\user123\AppData\Local\Temp\RtmpGK8TFW\downloaded_packages
> library(sparcl)
> y=cutree(fit.w,6)
> ColorDendrogram(fit.w,y=y,labels=names(y),main='ClusterDendrogram',branchl
eng=1300)
Interpretasi :

Dilihat dari dendrogam, Dari hasil penelitian tentang pengelompokkan provinsi terhadap IPM,
AHS, dan HLS dengan Cluster Hierarki yang diperoleh bahwa terdapat 6 kelompok Provinsi
tersebut memiliki kemiripan berdasarkan ketiga variabel yang digunakan.

- Kelompok 1 : Jambi, Riau, Jawa Barat, Jawa Tengah, Banten, Bali, Jawa Timur,
Kalimatan Utara, Sulawesi Utara.
- Kelompok 2 : Kep. Bangka Belitung, Kalimantan Barat, Kalimantan Selatan, Sumatera
Selatan, Lampung, Kalimantan Tengah
- Kelompok 3 : Aceh, Sumatera Barat, Sumatera Utara, Bengkulu, Sulawesi Selatan,
Sulawesi Tenggara
- Kelompok 4 : DKI Jakarta, DI Yogyakarta, Kalimantan Timur
- Kelompok 5 : Nusa Tenggara Barat, Nusa Tenggara Timur, Sulawesi Tengah, Gorontalo,
Sulawesi Barat, Maluku, Maluku Utara, Papua Barat
- Kelompok 6 : Papua
ANALISIS KLUSTER NON HIERARKI

Masih dengan menggunakan data yang sama dengan Analisis Kluster Hierarki :

No PROVINSI IPM HLS AHS


1 ACEH 70.6 14.13 69.52
2 SUMATERA UTARA 70.57 13.1 68.37
3 SUMATERA BARAT 71.24 13.94 68.78
4 RIAU 71.79 13.03 70.99
5 JAMBI 69.99 12.87 70.76
6 SUMATERA SELATAN 68.86 12.35 69.18
7 BENGKULU 69.95 13.57 68.59
8 LAMPUNG 68.25 12.46 69.95
9 KEP. BANGKA BELITUNG 69.99 11.83 69.95
10 KEP. RIAU 74.45 12.81 69.48
11 DKI JAKARTA 80.06 12.86 72.55
12 JAWA BARAT 70.69 12.42 72.47
13 JAWA TENGAH 70.52 12.57 74.08
14 DI YOGYAKARTA 78.89 15.42 74.74
15 JAWA TIMUR 70.27 13.09 70.8
16 BANTEN 71.42 12.78 69.49
17 BALI 74.3 13.21 71.46
18 NUSA TENGGARA BARAT 66.58 13.46 65.55
19 NUSA TENGGARA TIMUR 63.73 13.07 66.07
20 KALIMANTAN BARAT 66.26 12.5 69.92
21 KALIMANTAN TENGAH 69.79 12.45 69.59
22 KALIMANTAN SELATAN 69.65 12.46 68.02
23 KALIMANTAN TIMUR 75.12 13.49 73.7
24 KALIMANTAN UTARA 69.84 12.79 72.47
25 SULAWESI UTARA 71.66 12.66 71.04
26 SULAWESI TENGAH 68.11 13.04 67.32
27 SULAWESI SELATAN 70.34 13.28 69.84
28 SULAWESI TENGGARA 69.86 13.36 70.47
29 GORONTALO 67.01 13.01 67.14
30 SULAWESI BARAT 64.3 12.48 64.34
31 MALUKU 68.19 13.91 65.4
32 MALUKU UTARA 67.2 13.56 67.54
33 PAPUA BARAT 62.99 12.47 65.32
34 PAPUA 59.09 10.54 65.14
Dengan menggunakan software R :

Dengan menggunakan
> #Analisis software R :
non kluster
> #Menentukan Banyak Klaster
> wss <- (nrow(kluster)-1)*sum(apply(kluster,2,var))
> for (i in 1:33) {
+ wss[i] <- sum(kmeans(kluster,
+ centers=i)$withinss)
+ }
> plot(1:33, wss, type="b", xlab="Number of Clusters",
+ ylab="Within groups sum of squares")

Dari gambar diatas banyak klaster yang dapat diambil adalah 7 yaitu titik pada saat kurva mulai
melandai. Sehingga analisis klaster K-means adalah sebagai berikut:

> fit <- kmeans(kluster, 7)


> fit
K-means clustering with 7 clusters of sizes 5, 14, 2, 3, 4, 3, 3

Cluster means:
IPM HLS AHS
1 67.41800 13.39600 66.59000
2 70.50857 13.03929 69.72929
3 79.47500 14.14000 73.64500
4 70.35000 12.59333 73.00667
5 62.52750 12.14000 65.21750
6 67.79000 12.43667 69.68333
7 74.62333 13.17000 71.54667

Clustering vector:
[1] 2 2 2 2 2 6 2 6 2 7 3 4 4 3 2 2 7 1 5 6 2 2 7 4 2 1 2 2 1 5 1 1 5 5
Within cluster sum of squares by cluster:
[1] 6.797600 25.004357 6.359300 2.201933 21.780750 4.089933 9.530333
(between_SS / total_SS = 90.5 %)

Available components:

[1] "cluster" "centers" "totss" "withinss" "tot.withins


s" "betweenss"
[7] "size" "iter" "ifault"

> aggregate(kluster,by=list(fit$cluster),FUN=mean)
Group.1 IPM HLS AHS
1 1 67.41800 13.39600 66.59000
2 2 70.50857 13.03929 69.72929
3 3 79.47500 14.14000 73.64500
4 4 70.35000 12.59333 73.00667
5 5 62.52750 12.14000 65.21750
6 6 67.79000 12.43667 69.68333
7 7 74.62333 13.17000 71.54667
> agt_klaster<- data.frame(kluster, fit$cluster)
> agt_klaster
IPM HLS AHS fit.cluster
1 70.60 14.13 69.52 2
2 70.57 13.10 68.37 2
3 71.24 13.94 68.78 2
4 71.79 13.03 70.99 2
5 69.99 12.87 70.76 2
6 68.86 12.35 69.18 6
7 69.95 13.57 68.59 2
8 68.25 12.46 69.95 6
9 69.99 11.83 69.95 2
10 74.45 12.81 69.48 7
11 80.06 12.86 72.55 3
12 70.69 12.42 72.47 4
13 70.52 12.57 74.08 4
14 78.89 15.42 74.74 3
15 70.27 13.09 70.80 2
16 71.42 12.78 69.49 2
17 74.30 13.21 71.46 7
18 66.58 13.46 65.55 1
19 63.73 13.07 66.07 5
20 66.26 12.50 69.92 6
21 69.79 12.45 69.59 2
22 69.65 12.46 68.02 2
23 75.12 13.49 73.70 7
24 69.84 12.79 72.47 4
25 71.66 12.66 71.04 2
26 68.11 13.04 67.32 1
27 70.34 13.28 69.84 2
28 69.86 13.36 70.47 2
29 67.01 13.01 67.14 1
30 64.30 12.48 64.34 5
31 68.19 13.91 65.40 1
32 67.20 13.56 67.54 1
33 62.99 12.47 65.32 5
34 59.09 10.54 65.14 5
> install.packages("cluster")
Installing package into ‘C:/Users/user123/Documents/R/win-library/3.3’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/cluster_2.0.7-1
.zip'
Content type 'application/zip' length 549629 bytes (536 KB)
downloaded 536 KB

package ‘cluster’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\user123\AppData\Local\Temp\RtmpGK8TFW\downloaded_packages
> library(cluster)
> clusplot(kluster, fit$cluster, color=TRUE, shade=TRUE, labels=2, lines=0)

Interpretasi :

Dilihat dari KMeans, Dari hasil penelitian tentang pengelompokkan provinsi terhadap IPM,
AHS, dan HLS dengan Cluster Non Hierarki yang diperoleh bahwa terdapat 7 kelompok
Provinsi tersebut memiliki kemiripan berdasarkan ketiga variabel yang digunakan.

- Kelompok 1 : Nusa Tenggara Barat, Sulawesi Tengah, Gorontalo, Maluku, Maluku Utara
- Kelompok 2 : Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Bengkulu, Kep.
Bangka Belitung, Jawa Timur, Banten, Kalimantan Tengah, Kalimantan Selatan,
Sulawesi Utara, Sulawesi Selatan, Sulawesi Tenggara.
- Kelompok 3 : DKI Jakarta, DI Yogyakarta
- Kelompok 4 : Jawa Barat, Jawa Tengah, Kalimantan Utara
- Kelompok 5 : Sulawesi Barat, Papua Barat, Papua
- Kelompok 6 : Sumatera Selatan, Kep. Bangka Belitung, Kalimantan Barat
- Kelompok 7 : Kep. Riau, Bali, Kalimantan Timur
ANALISIS MULTIDIMENSIONAL SCALLING

Kasus yang digunakan :

Pemetaan Karakteristik Kemiskinan di Provinsi Sulawesi Selatan. Adapun variabel atau atribut
yang digunakan dalam penelitian ini adalah sebagai berikut:

1. Tidak bekerja (TB atau X1)

2. Bekerja di sektor informal (BD informal atau X2)

3. Bekerja di sektor formal (BD formal atau X3)

4. Bekerja di sektor pertanian (BD pertanian atau X4)

5. Pengeluaran perkapita untuk makanan (PPM atau X5)

6. Rumah tangga penerima BSM (BSM atau X6)

Berikut data yang disajikan :

kabupaten/ X1 X2 X3 X4 X5 X6
kota
Kepulauan Selayar 39.55 40.9 19.55 39.14 60.68 25.81
Bulukumba 49.98 43.81 6.21 30.72 59.7 16.08
Bantaeng 34.74 54.09 11.18 50.16 55.64 11.78
Jeneponto 33.45 62.25 4.3 47.13 62.58 18.75
Takalar 49.68 31.37 18.95 20.19 59.61 12.83
Gowa 39.53 50.36 10.11 39.51 55.86 18.32
Sinjai 40.99 52.11 6.91 53.68 60.82 4.68
Maros 42.54 38.81 18.65 34.49 53.88 18.32
Pangkajene Dan Kepulauan 45.87 34.54 19.59 29.54 55.97 23.48
Barm 57.56 35.69 6.75 25.68 56.75 33.09
Bone 38.36 53.96 7.67 43.47 59.07 19.52
Soppeng 41.01 41.98 17.01 37.23 59.31 10.04
Wajo 42.84 43.41 13.75 26.33 57.83 8.92
Sidenreng Rappang 53.46 30.72 15.82 20.92 58.86 0
Pinrang 48.31 42.16 9.53 37.09 54.7 11.62
Enrekang 30.72 65.93 3.35 59.12 57.86 29.4
Luwu 43.35 51.2 5.45 36.96 61.1 26.51
Tana Toraja 14.94 78.58 6.48 72.65 58.4 27.6
Luwu Utara 26.69 62.1 11.21 48.96 60.26 14.33
Luwu Timur 43.43 48.31 8.26 49.29 56.21 14.35
Toraja Utara 22.77 70.29 6.95 61.57 63.49 26.99
Kota Makassar 50.26 21.1 28.64 1.01 50.15 10.65
Kota Parepare 59.83 22.07 18.1 1.45 49.13 27.01
Kota Palopo 51.41 28.98 19.61 15.74 53.18 14.02
Sumber: Badan Pusat Statistik Provinsi Sulawesi Selatan
Dengan menggunakan software SPSS diperoleh :

Alscal Procedure Options

Data Options-

Number of Rows (Observations/Matrix). 24


Number of Columns (Variables) . . . 24
Number of Matrices . . . . . . 1
Measurement Level . . . . . . . Ratio
Data Matrix Shape . . . . . . . Symmetric
Type . . . . . . . . . . . Dissimilarity
Approach to Ties . . . . . . . Leave Tied
Conditionality . . . . . . . . Matrix
Data Cutoff at . . . . . . . . .000000

Model Options-

Model . . . . . . . . . . . Euclid
Maximum Dimensionality . . . . . 2
Minimum Dimensionality . . . . . 2
Negative Weights . . . . . . . Not Permitted

Output Options-

Job Option Header . . . . . . . Printed


Data Matrices . . . . . . . . Printed
Configurations and Transformations . Plotted
Output Dataset . . . . . . . . Not Created
Initial Stimulus Coordinates . . . Computed

Algorithmic Options-

Maximum Iterations . . . . . . 30
Convergence Criterion . . . . . .00100
Minimum S-stress . . . . . . . .00500
Missing Data Estimated by . . . . Ulbounds

Raw (unscaled) Data for Subject 1

1 2 3 4 5
6 7 8 9 10

1 .000
2 21.488 .000
3 24.715 27.848 .000
4 29.033 30.027 14.883 .000
5 26.880 20.943 41.411 46.917 .000
6 16.065 16.259 13.937 17.762 30.972
.000
7 30.748 28.435 12.282 20.260 42.896
20.661 .000
8 11.751 16.977 25.329 32.766 19.336
15.637 30.325 .000
9 14.148 18.759 33.749 39.133 15.462
22.503 38.118 9.258 .000
10 27.658 21.145 43.972 44.637 26.046
31.013 46.389 26.095 20.266 .000
11 19.340 20.371 11.911 11.424 36.779
6.907 18.397 21.831 28.195 34.775
12 16.247 16.717 20.091 28.533 22.130
14.342 22.500 10.983 18.345 33.015
13 22.545 13.492 27.697 32.928 16.581
18.397 30.014 14.690 18.647 30.184
14 36.228 25.122 43.843 50.790 13.792
36.091 42.325 27.153 26.840 35.296
15 20.495 10.100 22.381 29.420 22.764
14.027 22.810 13.417 19.092 27.028
16 37.242 43.079 24.765 17.360 59.920
29.615 30.961 43.064 48.910 52.721
17 18.021 15.774 23.159 19.679 32.957
11.749 27.653 21.301 23.967 25.172
18 57.685 65.798 42.161 36.893 81.011
51.040 47.650 63.673 70.352 76.780
19 30.212 35.186 12.580 11.033 48.612
20.700 20.940 33.392 40.950 50.760
20 21.255 20.673 11.186 19.344 36.069
11.592 12.500 20.958 28.238 35.639
21 42.620 50.272 29.099 21.517 65.657
36.168 35.066 49.189 55.374 61.468
22 48.826 44.970 63.884 70.111 25.726
53.743 66.659 40.825 35.976 43.601
23 48.201 42.414 65.952 69.545 29.195
53.344 68.890 42.062 34.654 31.648
24 32.024 25.936 46.640 52.535 8.468
35.766 48.887 23.383 18.690 26.897

11 12 13 14 15
16 17 18 19 20

11 .000
12 19.148 .000
13 24.000 11.759 .000
14 41.522 25.500 19.698 .000
15 19.077 11.534 13.497 24.714 .000
16 23.755 41.499 47.506 65.092 41.522
.000
17 11.524 22.331 23.726 39.928 19.638
29.847 .000
18 45.533 60.777 67.550 85.438 63.110
24.605 53.293 .000
19 16.537 28.292 34.116 52.117 32.357
20.707 26.881 34.246 .000
20 11.259 17.208 24.774 38.535 14.894
28.670 18.441 49.570 22.262 .000
21 30.219 46.180 52.650 70.630 48.611
11.776 37.441 16.712 20.744 35.710
22 60.185 45.310 38.439 29.203 46.216
82.577 56.173 102.617 70.394 59.864
23 59.222 49.230 42.248 36.385 46.345
79.978 51.814 102.466 72.732 59.610
24 42.080 28.269 21.813 16.651 27.365
64.792 37.792 86.099 54.151 41.244

21 22 23 24

21 .000
22 88.081 .000
23 87.427 21.737 .000
24 71.147 19.557 22.589 .000

Iteration history for the 2 dimensional solution (in squared distances)

Young's S-stress formula 1 is used.

Iteration S-stress Improvement

1 .05584
2 .04793 .00791
3 .04756 .00037

Iterations stopped because


S-stress improvement is less than .001000

Stress and squared correlation (RSQ) in distances


RSQ values are the proportion of variance of the scaled data (disparities)
in the partition (row, matrix, or entire data) which
is accounted for by their corresponding distances.

Stress values are Kruskal's stress formula 1.

For matrix
Stress = .06608 RSQ = .98814

Configuration derived in 2 dimensions

Stimulus Coordinates

Dimension

Stimulus Stimulus 1 2
Number Name

1 Kep_Sela -.0419 .5474


2 Bulukumb -.4196 .0615
3 Bantaeng .8516 -.4328
4 Janepont 1.1795 -.0014
5 Takalar -1.2976 -.1709
6 Gowa .2981 .0252
7 Sinjai .8270 -.8663
8 Maros -.4128 .0214
9 Pangkaje -.7627 .3973
10 Barm -.9187 1.0989
11 Bone .6214 .0752
12 Soppeng -.1693 -.4768
13 Wajo -.5428 -.4484
14 Sidenren -1.3989 -.8205
15 Pinrang -.2640 -.3702
16 Enrekang 1.7896 .4816
17 Luwu .2681 .5864
18 Tana_Tor 2.9672 .2364
19 Luwu_Uta 1.2713 -.3626
20 Luwu_Tim .5276 -.3477
21 Toraja_U 2.1604 .2875
22 Kota_Mak -2.5206 -.2468
23 Kota_Par -2.4247 .7810
24 Kota_Pal -1.5881 -.0552

Optimally scaled data (disparities) for subject 1

1 2 3 4 5
6 7 8 9 10

1 .000
2 1.131 .000
3 1.301 1.466 .000
4 1.528 1.581 .783 .000
5 1.415 1.102 2.180 2.470 .000
6 .846 .856 .734 .935 1.630
.000
7 1.619 1.497 .647 1.066 2.258
1.088 .000
8 .619 .894 1.333 1.725 1.018
.823 1.596 .000
9 .745 .988 1.777 2.060 .814
1.185 2.007 .487 .000
10 1.456 1.113 2.315 2.350 1.371
1.633 2.442 1.374 1.067 .000
11 1.018 1.072 .627 .601 1.936
.364 .968 1.149 1.484 1.831
12 .855 .880 1.058 1.502 1.165
.755 1.184 .578 .966 1.738
13 1.187 .710 1.458 1.733 .873
.968 1.580 .773 .982 1.589
14 1.907 1.322 2.308 2.674 .726
1.900 2.228 1.429 1.413 1.858
15 1.079 .532 1.178 1.549 1.198
.738 1.201 .706 1.005 1.423
16 1.960 2.268 1.304 .914 3.154
1.559 1.630 2.267 2.575 2.775
17 .949 .830 1.219 1.036 1.735
.618 1.456 1.121 1.262 1.325
18 3.037 3.464 2.219 1.942 4.264
2.687 2.508 3.352 3.703 4.042
19 1.590 1.852 .662 .581 2.559
1.090 1.102 1.758 2.156 2.672
20 1.119 1.088 .589 1.018 1.899
.610 .658 1.103 1.486 1.876
21 2.244 2.646 1.532 1.133 3.456
1.904 1.846 2.589 2.915 3.236
22 2.570 2.367 3.363 3.691 1.354
2.829 3.509 2.149 1.894 2.295
23 2.537 2.233 3.472 3.661 1.537
2.808 3.626 2.214 1.824 1.666
24 1.686 1.365 2.455 2.765 .446
1.883 2.573 1.231 .984 1.416

11 12 13 14 15
16 17 18 19 20

11 .000
12 1.008 .000
13 1.263 .619 .000
14 2.186 1.342 1.037 .000
15 1.004 .607 .710 1.301 .000
16 1.250 2.185 2.501 3.426 2.186
.000
17 .607 1.175 1.249 2.102 1.034
1.571 .000
18 2.397 3.199 3.556 4.497 3.322
1.295 2.805 .000
19 .871 1.489 1.796 2.743 1.703
1.090 1.415 1.803 .000
20 .593 .906 1.304 2.029 .784
1.509 .971 2.609 1.172 .000
21 1.591 2.431 2.772 3.718 2.559
.620 1.971 .880 1.092 1.880
22 3.168 2.385 2.023 1.537 2.433
4.347 2.957 5.402 3.706 3.151
23 3.117 2.591 2.224 1.915 2.440
4.210 2.727 5.394 3.829 3.138
24 2.215 1.488 1.148 .877 1.440
3.411 1.989 4.532 2.851 2.171

21 22 23 24

21 .000
22 4.637 .000
23 4.602 1.144 .000
24 3.745 1.029 1.189 .000
Abbreviated Extended
Name Name

Bulukumb Bulukumba
Janepont Janeponto
Kep_Sela Kep_Selayar
Kota_Mak Kota_Makassar
Kota_Pal Kota_Palopo
Kota_Par Kota_Parepare
Luwu_Tim Luwu_Timur
Luwu_Uta Luwu_Utara
Pangkaje Pangkajene
Sidenren Sidenreng_Rappang
Tana_Tor Tana_Toraja
Toraja_U Toraja_Utara

Dari Output SPSS diatas, diperoleh :

Nilai Stress pada data diatas adalah :

Stress = .06608 RSQ = .98814


Berdasarkan pedoman nilai stress menurut Romanian Journal of Economic Forecasting – 3/2010
yang sebagai berikut :

Stress Value Responses

Stress Value Compatibility


>0.20 Incompatible presentation
0.10-<0.20 Low compatibility
0.05-<0.10 Good compatibility
0.025-<0.05 Perfect compatibility
0.00-<0.025 Full compatibility

Nilai stress yang dimiliki ada diantara 0.05 sampai 0.10 yang berarti termasuk dalam kategori
Good Compatibility dan nilai index of fit sebesar 0.98814 atau 98.814% dikatan telah memenuhi
kelayakan (index of fit dikategorikan layak jika >60%) (Malholtra, 1966). Selanjutnya, Stimulus
coordinates menunjukkan koordinat peta posisi dari masing-masing Kabupaten/Kota yang ada di
Provinsi Sulawesi Selatan yang dinyatakan dalam 2 dimensi.
Stimulus Coordinates
13 Wajo -.5428 -.4484
Dimension 14 Sidenren -1.3989 -.8205
15 Pinrang -.2640 -.3702
Stimulus Stimulus 1 2 16 Enrekang 1.7896 .4816
Number Name 17 Luwu .2681 .5864
18 Tana_Tor 2.9672 .2364
1 Kep_Sela -.0419 .5474 19 Luwu_Uta 1.2713 -.3626
2 Bulukumb -.4196 .0615 20 Luwu_Tim .5276 -.3477
3 Bantaeng .8516 -.4328 21 Toraja_U 2.1604 .2875
4 Janepont 1.1795 -.0014 22 Kota_Mak -2.5206 -.2468
5 Takalar -1.2976 -.1709 23 Kota_Par -2.4247 .7810
6 Gowa .2981 .0252 24 Kota_Pal -1.5881 -.0552
7 Sinjai .8270 -.8663
8 Maros -.4128 .0214
9 Pangkaje -.7627 .3973
10 Barm -.9187 1.0989
11 Bone .6214 .0752
12 Soppeng -.1693 -.4768

Nilai tersebut menunjukkan kemiripan dan jarak nilai kedekatan antar Kabupaten/Kota. Dari
stimulus coordinates ini, kemudian dinyatakan dalam konfigurasi peta posisi Kabupaten/Kota
yang dapat dilihat pada gamba dibawah ini :
Interpretasi :

- Berdasarkan Analisis Kuadran

Pada peta konfigurasi kabupaten/kota diatas dapat dilihat pola kedekatan antar kota
sebagai berikut :
1. Kuadran 1 : Luwu, Bone, Gowa, Janeponto, Enrekang, Toraja Utara, Tana Toraja
2. Kuadran 2 : Barm, Kota Parepare, Kep. Selayan, Pangkajene, Maros, Bulukumba
3. Kuadran 3 : Kota Palopo, Kota Makassar, Takalar, Pinrang, Wajo, Soppeng,
Sidenreng Rappang
4. Kuadran 4 : Luwu Timur, Luwu Utara, Bantaeng, Sinjai
Pengelompokan kota Pengelompokan kota-kota pada peta konfigurasi diatas
kabupaten/kota pada peta konfigurasi diatas didasarkan pada keenam variabel yang
digunakan.

- Berdasarkan Analisis Jarak (Relatif)


Jika tanpa melihat kuadran, misal Kep. Selayar dan Luwu mempunyai jarak yang cukup
dekat pada peta konfigurasi, ini menujukkan adanya kemiripan/kedekatan antar
keduanya.
ANALISIS KORESPONDENSI

Kasus yang digunakan :


Penelitian di bidang sosial politik berikut ini ingin melihat hubungan antara wilayah tempat
tinggal penduduk di Kota Semarang dengan pandangan mereka tentang calon walikota, serta
ingin diketahui deskripsi pandangan calon walikota di Semarang dalam kaitannya dengan
wilayah. Misalkan calon walikota dikategorikan dalam 4 calon, yaitu A,B,C,D. Sedangkan
wilayah tempat tinggal dikategorikan menjadi 5 bagian, yaitu Semarang Utara,Tengah, Selatan,
Timur dan Barat. Disini, banyaknya kategori dari calon walikota adalah 4 dan banyaknya
kategori Wilayah Tempat Tinggal adalah 5, sehingga pangkat dari matriks M = min(5,4)-1 = 3.
Berarti tiga dimensi yang terbentuk nantinya mampu mempresentasikan data tanpa kehilangan
informasi.
Berikut data yang disajikan :

Sumber : ANALISIS KORESPONDENSI UNTUK PEMETAAN PERSEPSI DI WILAYAH KOTA SEMARANG


Dengan menggunakan software SPSS diperoleh :

Analyze  Dimension Reduction  Correspondence Analysis


Diperoleh hasil output sebagai berikut :

Ringkasan Hasil

Summary

Proportion of Inertia Confidence Singular Value

Singular Chi Accounted Standard Correlation

Dimension Value Inertia Square Sig. for Cumulative Deviation 2

1 .490 .240 .914 .914 .033 .077


2 .142 .020 .076 .990 .049
3 .051 .003 .010 1.000
a
Total .263 129.198 .000 1.000 1.000

a. 12 degrees of freedom

Intepretasi dari singular value yang merupakan akar kuadrat dari eigenvalue antar kategori dari
variabel dalam analisis untuk setiap dimensi adalah 0,490 untuk dimensi pertama (terbesar),
0,148 untuk dimensi kedua (juga merupakan yang kedua terbesar) dan 0,051 dimensi ketiga. Dari
yang diperoleh dalam analisis (proportion of inertia), dapat dinyatakan bahwa keragaman yang
dapat diterangkan adalah sebesar 100% dengan rincian sebagai berikut:
1. Faktor pertama dengan eigen value sebesar 0,036 mampu menerangkan keragaman data
sebesar 90.8%
2. Faktor kedua dengan eigen value sebesar 0,015 mampu menerangkan keragaman data
sebesar 8.2% (total dengan figure pertama adalah 99%)
3. Faktor ketiga dengan eigen value sebesar 0,006 mampu menerangkan keragaman data
sebesar 1% (total dengan sebelumnya menjadi 100%)
Bila dilihat standar deviasinya terlihat bahwa untuk dimensi pertama ditemukan nilai sebesar
0.033. nilai ini juga menunjukkan presisi yang lebih baik dari dimensi kedua yang memiliki nilai
standar deviasi sebesar 0.049.
Total inersia diperoleh dari λ1^2 + λ2^2 + λ3^2 = 0,24^2 + 0,022^2 + 0,003^2 = 0,265

Peta Kemiripan antar wilayah dan Calon Walikota

Dari Peta kemiripan diatas, dapat dilihat bahwa terdapat 2 pasang wilayah yang memiliki
kemiripan berdasarkan respon terhadap calon walikota yang pertama Wilayah Barat dan Selatan
serta yang kedua wilayah Tengah dan Timur karena terlihat jarak titik yang cukup dekat.
Sedangkan pada Calon Walikota tidak begitu terlihat kemiripan antar pasangan calon
berdasarkan respon di suatu wilayah.

Apabila kedua peta tersebut digabungkan maka akan didapat figure akhir yang
memperlihatkan pemetaan karakteristik pandangan politik penduduk pada kelima wilayah yang
ada. Seperti pada gambar dibawah ini :

Pada Gambar diatas, dapat dilihat bahwa karakteristik pandangan calon walikota, penduduk
Semarang yang bermukim di wilayah Utara pada umumnya adalah calon B, sementara yang
bermukim di wilayah Selatan dan barat pada umumnya adalah dan cenderung ke calon A. Untuk
wilayah Timur dan Tengah karakteristik umum adalah cenderung ke calon C sedangkan tidak
ada penduduk yang berpandangan cenderung ke calon D namun bisa juga di interpretasikan
sebagian dari wilayah Selatan dan Tengah cenderung ke calon D.
DAFTAR PUSTAKA

The Statistical Analysis of Finding... (PDF Download Available). Available from:


https://www.researchgate.net/publication/315831554_The_Statistical_Analysis_of_Finding_Optimum_
Ratio_Between_Real_Aircraft_and_Simulator_Flights_An_Application_to_Army_Aviation [accessed Jun
16 2018].
Lebart L., Moreneau A., and Warwick M., Multivariate Descriptive Statistic Analysis Correspondence
Analysis and Related Tecniques for Large Matrices, John Wiley and Sons Inc, 1984.
Michael, J.G., Theory and Aplications of Correspondence Analysis, Academic Press, Inc , 1984
Pauls, G., Multidimensional Scalling : Concepts and Aplications, 1989.

Anda mungkin juga menyukai