Anda di halaman 1dari 29

ANALISIS DISKRIMINAN

Diajukan untuk memenuhi Tugas

Mata Kuliah Multivariate II

Disusun oleh:

Ardelia Luthfiyah Amardana (140610150009)

Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
Universitas Padjadjaran
2018
ANALISIS DISKRIMINAN 2 KELOMPOK

Kasus yang digunakan :

Diketahui dua kelompok perusahaan masing-masing terdiri dari 12 perusahaan dimana


dikelompokkan menjadi perusahaan yang sangat dikagumi (Most-Admired) dan kurang
dikagumi (Least-Admired). Dua factor rasio finansial yang berkaitan dengan perusahaan diambil
yaitu Earning Before Interest and Taxes to total ASSets (EBITASS) dan Return On Total Capital
(ROTC). Berikut ini data dari kedua kelompok perusahaan:

Kelompok 1 : Kurang Dikagumi Kelompok 2 : Paling Dikagumi


Jenis Perusahaan Jenis Perusahaan
EBITAS ROTC EBITASS ROTC
1 -0.012 -0.031 13 0.158 0.182
2 0.036 0.053 14 0.210 0.206
3 0.038 0.036 15 0.207 0.188
4 -0.063 -0.074 16 0.280 0.236
5 -0.054 -0.119 17 0.197 0.193
6 0 -0.005 18 0.227 0.173
7 0.005 0.039 19 0.148 0.196
8 0.091 0.122 20 0.254 0.212
9 -0.036 -0.072 21 0.079 0.147
10 0.045 0.064 22 0.149 0.128
11 -0.026 -0.024 23 0.200 0.150
12 0.016 0.026 24 0.187 0.191
Jawab:

Menggunakan Software SPSS

Lalu, Dengan menggunakan Analyze  Classify  Discriminant

Dari hal tersebut, diperoleh sebuah output sebagai berikut :


 Deskriptif

Group Statistics

Valid N (listwise)

Kelompok Mean Std. Deviation Unweighted Weighted

1 EBITASS .00333 .044919 12 12.000

ROTC .00125 .068521 12 12.000


2 EBITASS .19133 .053241 12 12.000
ROTC .18350 .030219 12 12.000
Total EBITASS .09733 .107428 24 24.000

ROTC .09238 .106522 24 24.000

Dari tabel diatas diketahui bahwa rata – rata EBITASS pada kelompok 1 atau kelompok yang
kurang dikagumi lebih rendah dibandingkan dengan kelompok 2 atau kelompok yang paling
dikagumi, sama - halnya dengan rata-rata ROTC pada kelompok 1 lebih rendah pula
dibandingkan kelompok 2.

 Inferensial

Uji Perbedaan Antar Kelompok

Variabel EBITASS :

H0 : µ1=μ2 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata EBITASS
kelompok 1 dengan kelompok 2

H1 : µ1≠μ2 yang artinya Terdapat perbedaan yang signifikans antara rata – rata EBITASS
kelompok 1 dengan kelompok 2

Statistik Uji :

Wilks' Lambda F df1 df2 Sig.


EBITASS .201 87.408 1 22 .000
ROTC .236 71.070 1 22 .000
Kriteria Uji :

Tolak H0 jika p-value < alpha dan terima dalam hal lainnya.

Kesimpulan :

Karena p-value = 0.000 < alpha = 0.05, maka H0 ditolak yang artinya Terdapat perbedaan
signifikan antara rata – rata EBITASS Kelompok 1 denga Kelompok 2

Variabel ROTC

H0 : µ1=μ2 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata ROTC
kelompok 1 dengan kelompok 2

H1 : µ1≠μ2 yang artinya Terdapat perbedaan yang signifikans antara rata – rata ROTC kelompok
1 dengan kelompok 2

Statistik Uji :

Tests of Equality of Group Means


Wilks' Lambda F df1 df2 Sig.
EBITASS .201 87.408 1 22 .000
ROTC .236 71.070 1 22 .000

Kriteria Uji :

Tolak H0 jika p-value < alpha dan terima dalam hal lainnya.

Kesimpulan :

Karena p-value = 0.000 < alpha = 0.05, maka H0 ditolak yang artinya Terdapat perbedaan
signifikan antara rata – rata ROTC Kelompok 1 denga Kelompok 2
Uji Matriks Kovarians antar Kelompok

H0 : Kelompok Matriks Kovarians adalah relatif sama

H1 : Kelompok Matriks Kovarians adalah berbeda secara nyata

Statistik Uji :

Dengan mengunakan Uji Box-M dan Log Determinants

Log Determinants
Kelompok Rank Log Determinant
1 1 -6.206
2 1 -5.866
Pooled within-groups 1 -6.021
The ranks and natural logarithms of determinants printed are those of the group covariance
matrices.

Test Results
Box's M .316
F Approx. .302
df1 1
df2 1452.000
Sig. .582
Tests null hypothesis of equal population covariance matrices.

Kriteria Uji :

Tolak H0 Jika p-value < alpha dan terima dalam hal lainnya

Kesimpulan

Berdasarkan uji Box-M diperoleh bahwa p-value = 0.582 > alpha = 0.05, maka H0 diterima
yang berarti Kelompok Matriks Kovarians adalah relative sama.

Sedangkan, Berdasarkan Berdasarkan output Log Determinants terlihat bahwa angka Log
Determinants untuk kategori kurang dikagumi (1) dan paling dikagumi (2) sedikit berbeda,
sehingga kelompok matriks kovarians adalah relative sama.
Proses Diskriminan Pada Kasus

Output 1

Variables Entered/Removeda,b,c,d
Min. D Squared
Between Exact F
Step Entered Statistic Groups Statistic df1 df2 Sig.
1 EBITASS 14.568 1 and 2 87.408 1 22.000 4.048E-9
At each step, the variable that maximizes the Mahalanobis distance between the two closest
groups is entered.
a. Maximum number of steps is 4.
b. Minimum partial F to enter is 3.84.
c. Maximum partial F to remove is 2.71.
d. F level, tolerance, or VIN insufficient for further computation.

Dari hasil tabel diatas, dari 2 variabel bebas yang diketahui ternyata yang dengan menggunakan
Stepwise Method yang memenuhi kriteria hanya satu variabel yaitu EBITASS karena p-value <
alpha.

Output 2

Variables in the Analysis


Step Tolerance F to Remove
1 EBITASS 1.000 87.408

Tabel di atas hanyalah sebagai perincian dari proses stepwise pada tabel sebelumnya. Dari tabel
output di atas dapat dilihat hanya pada step 1, variabel EBITASS adalah variabel pertama yang
masuk dalam model diskriminan. Hal ini disebabkan variabel tersebut mempunyai angka Sig.
of F to Remove yang paling sedikit dibandingkan dengan variabel ROTC.

Output 3

Wilks' Lambda
Number of Exact F
Step Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.
1 1 .201 1 1 22 87.408 1 22.000 .000
Wilk’s Lambda pada prinsipnya adalah varians total dalam discriminant scores yang tidak bisa
dijelaskan oleh perbedaan di antara grup-grup yang ada. Perhatikan tabel di atas yang terdiri atas
hanya 1 tahap (step), yang terkait dengan 1 variabel yang secara berurutan dimasukkan pada
tahapan analisis sebelu mnya.

Pada step 1, jumlah variabel yang dimasukkan ada satu yaitu variabel EBITASS dengan angka
Wilk’s Lambda adalah 0,201. Hal ini berarti 20.1% varians tidak dapat dijelaskan oleh perbedaan
antara grup-grup.

Dari Statistics F dan signifikansinya dapat diketahui bahwa variabel tersebut signifikans. Hal itu
dapat meyakinkan bahwa variabel EBITASS memang berbeda untuk 2 kelompok.

Output 4

Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
1 3.973a 100.0 100.0 .894
a. First 1 canonical discriminant functions were used in the analysis.

Canonical Correlation mengukur keeratan hubungan antara Discriminant Score dengan


kelompok, karena pada kasus ini ada 2 kategori maka terdapat 2 kelompok. Dari tabel diatas
dapat diketahui bahwa nilai Canonical Correlation adalah 0.894 dan itu cukup tinggi untuk
menunjukan skala keeratan hubungan.

Output 5

Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 .201 34.487 1 .000

Dari Tabel diatas, Angka Chi-Square sebesar 34.487 dengan tingkat signifikansi yang tinggi
menunjukan perbedaan yang jelas antara 2 kelompok kategori.
Output 6

Structure Matrix
Function
1
EBITASS 1.000
ROTCa .780
Pooled within-groups correlations between discriminating variables and standardized canonical
discriminant functions
Variables ordered by absolute size of correlation within function.
a. This variable not used in the analysis.

Tabel Structure Matrix menjelaskan korelasi antara variabel indepenen dengan fungsi
diskriminanyang terbentuk. Terlihat Variabel EBITASS paling erat hubungannya dengan fungsi
diskriminan lalu diikuti oleh Variabel ROTC namun Variabel ini tidak dimasukkan ke dalam
model diskriminan.

Output 7

Canonical Discriminant Function Coefficients


Function
1
EBITASS 20.302
(Constant) -1.976
Unstandardized coefficients

Tabel di atas mempunyai fungsi yang hampir mirip dengan persamaan regresi berganda,yang
dalam analisis diskriminan disebut sebagai Fungsi Diskriminan :
Z Score = -1.976 + 20.302 EBITASS
Kegunaan fungsi tersebut untuk mengetahui sebuah perusahaan masuk pada kelompok yang satu
atau lainnya.
Kesimpulan

Jadi, Berdasarkan Uji Wilks Lamdba terdapat perbedaan yang signifikans antara kedua
kelompok dan dari kedua variabel bebas tersebut, ternyata hanya satu variabel yang memenuhi
kriteria yaitu Variabel EBITASS. Sehingga Fungsi (Model) Diskriminan yang didapat adalah :

Z Score = -1.976 + 20.302 EBITASS

Dimana dari model tersebut dapat diketahui prediksi jenis perusahaan tersebut apakah termasuk
kedalam kelompok perusahaan yang kurang dikagumi atau paling dikagumi.
ANALISIS DISKRIMINAN 3 KELOMPOK

Kasus yang digunakan :

Seorang peneliti meneliti mengenai 3 Species of Iris Flowers dari 15 Tanaman setiap speciesnya
yang diukur dengan 4 Variabel Bebas yaitu X1 = Sepal Length, X2 = Sepal Width, X3 = Petal
Length, dan X4 = Petal Width. Berikut data peneliti tersebut :

Species Of Iris Sepal Length Sepal Width Petal Length Petal Width
Iris Setosa 5.1 3.5 1.4 0.2
Iris Setosa 4.9 3.0 1.4 0.2
Iris Setosa 4.7 3.2 1.3 0.2
Iris Setosa 4.6 3.1 1.5 0.2
Iris Setosa 5.0 3.6 1.4 0.2
Iris Setosa 5.4 3.9 1.7 0.4
Iris Setosa 4.6 3.4 1.4 0.3
Iris Setosa 5.0 3.4 1.5 0.2
Iris Setosa 4.4 3.9 1.4 0.2
Iris Setosa 4.9 3.1 1.5 0.1
Iris Setosa 5.4 3.7 1.5 0.2
Iris Setosa 4.8 3.4 1.6 0.2
Iris Setosa 4.8 3.0 1.4 0.1
Iris Setosa 4.3 3.0 1.1 0.1
Iris Setosa 5.0 4.0 1.2 0.2
Iris Versicolor 7.0 3.2 4.7 1.4
Iris Versicolor 6.4 3.2 4.5 1.5
Iris Versicolor 6.9 3.2 4.9 1.5
Iris Versicolor 5.5 2.3 4 1.3
Iris Versicolor 6.5 2.8 4.6 1.5
Iris Versicolor 5.7 2.8 4.5 1.3
Iris Versicolor 6.3 3.3 4.7 1.6
Iris Versicolor 4.9 2.4 3.3 1
Iris Versicolor 6.6 2.9 4.6 1.3
Iris Versicolor 5.2 2.7 3.9 1.4
Iris Versicolor 5.0 2.0 3.5 1
Iris Versicolor 5.9 3.0 4.2 1.5
Iris Versicolor 6.0 2.2 4 1
Iris Versicolor 6.1 2.9 4.7 1.4
Iris Versicolor 5.6 2.9 3.6 1.3
Iris Virginica 6.3 3.3 6 2.5
Iris Virginica 5.8 2.7 5.1 1.9
Iris Virginica 7.1 3.0 5.9 2.1
Iris Virginica 6.3 2.9 5.6 1.8
Iris Virginica 6.5 3.0 5.8 2.2
Iris Virginica 7.6 3.0 6.6 2.1
Iris Virginica 4.9 2.5 4.5 1.7
Iris Virginica 7.3 2.9 6.3 1.8
Iris Virginica 6.7 2.5 5.8 1.8
Iris Virginica 7.2 3.6 6.1 2.5
Iris Virginica 6.5 3.2 5.1 2
Iris Virginica 6.4 2.7 5.3 1.9
Iris Virginica 6.8 3.0 5.5 2.1
Iris Virginica 5.7 2.5 5 2
Iris Virginica 5.8 2.8 5.1 2.4

Jawab :

Menggunakan Software SPSS :


 Deskriptif

Group Statistics
Valid N (listwise)
Species_of_Iris Mean Std. Deviation Unweighted Weighted
Iris Setosa Sepal_Length 4.8600 .31578 15 15.000
Sepal_Width 3.4133 .34819 15 15.000
Petal_Length 1.4200 .14736 15 15.000
Petal_Width .2000 .07559 15 15.000
Iris Versicolor Sepal_Length 5.9733 .65625 15 15.000
Sepal_Width 2.7800 .39133 15 15.000
Petal_Length 4.2467 .50266 15 15.000
Petal_Width 1.3333 .19518 15 15.000
Iris Virginica Sepal_Length 6.4600 .71093 15 15.000
Sepal_Width 2.9067 .31045 15 15.000
Petal_Length 5.5800 .56594 15 15.000
Petal_Width 2.0533 .25598 15 15.000
Total Sepal_Length 5.7644 .88784 45 45.000
Sepal_Width 3.0333 .44107 45 45.000
Petal_Length 3.7489 1.80714 45 45.000
Petal_Width 1.1956 .79371 45 45.000

Dari tabel diatas diketahui bahwa Species of Iris Setosa memiliki rata – rata yang lebih besar
pada Sepal Width dibandingan dengan jenis species lainnya, lalu Speciesi of Iris Versicolor
memiliki rata – rata yang lebih besar pada Petal Width dibandingan dengan jenis species lainnya,
dan Species of Iris Virginica memiliki rata – rata yang lebih besar pada Sepal Length dan Petal
Length.
 Inferensial

Uji Perbedaan Antar Kelompok

Hipotesis

X1= Sepal Length

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Sepal
Length dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Sepal Length
dalam kelompok

X2= Sepal Width

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Sepal
Width dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Sepal Width dalam
kelompok

X3= Petal Length

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Petal
Length dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Petal Length
dalam kelompok

X4= Petal Width

H0 : µ1=μ2=μ3 yang artinya Tidak terdapat perbedaan yang signifikans antara rata – rata Petal
Width dalam kelompok

H1 : µ1≠μi yang artinya Terdapat perbedaan yang signifikans antara rata – rata Petal Width dalam
kelompok
Statistik Uji :

Tests of Equality of Group Means


Wilks' Lambda F df1 df2 Sig.
Sepal_Length .418 29.226 2 42 .000
Sepal_Width .606 13.631 2 42 .000
Petal_Length .058 341.453 2 42 .000
Petal_Width .055 359.293 2 42 .000

Kriteria Uji :

Tolak H0 jika p-value < alpha dan terima dalam hal lainnya.

Kesimpulan :

Karena masing – masing variabel memiliki p-value < alpha, maka H0 ditolak yang artinya tiap
variabel memiliki perbedaan rata – rata dalam kelompok.

Uji Matriks Kovarians antar Kelompok

H0 : Kelompok Matriks Kovarians adalah relatif sama

H1 : Kelompok Matriks Kovarians adalah berbeda secara nyata

Statistik Uji :

Dengan mengunakan Uji Box-M dan Log Determinants

Log Determinants
Species_of_Iris Rank Log Determinant
Iris Setosa 3 -11.824
Iris Versicolor 3 -8.728
Iris Virginica 3 -7.261
Pooled within-groups 3 -8.016
The ranks and natural logarithms of determinants printed are those of the group covariance
matrices.
Test Results
Box's M 52.705
F Approx. 3.933
df1 12
df2 8548.615
Sig. .000
Tests null hypothesis of equal population covariance matrices.

Kriteria Uji :

Tolak H0 Jika p-value < alpha dan terima dalam hal lainnya

Kesimpulan

Berdasarkan uji Box-M diperoleh bahwa p-value = 0.000 < alpha = 0.05, maka H0 ditolak
yang berarti Kelompok Matriks Kovarians berbeda secara nyata. Dalam hal ini menyalahi asumsi
diskriminan. Namun demikian analisis fungsi diskriminan tetap robush walaupun asumsi
homogenitas varians tidak terpenuhi dengan syarat data tidak memiliki outlier.(Ghazali, 2008)

Proses Diskriminan Pada Kasus

Output 1

Variables Entered/Removeda,b,c,d
Min. D Squared
Between Exact F
Step Entered Statistic Groups Statistic df1 df2 Sig.
1 Iris Versicolor
Petal_Width 14.224 and Iris 106.683 1 42.000 4.234E-13
Virginica
2 Iris Versicolor
Sepal_Width 23.655 and Iris 86.594 2 41.000 1.909E-15
Virginica
3 Iris Versicolor
Petal_Length 29.236 and Iris 69.608 3 40.000 6.283E-16
Virginica
At each step, the variable that maximizes the Mahalanobis distance between the two closest
groups is entered.
a. Maximum number of steps is 8.
b. Minimum partial F to enter is 3.84.
c. Maximum partial F to remove is 2.71.
d. F level, tolerance, or VIN insufficient for further computation.

Dari hasil tabel diatas, dari 4 variabel bebas yang diketahui ternyata yang dengan menggunakan
Stepwise Method yang memenuhi kriteria hanya tiga variabel yaitu Petal Width, Sepal Width,
dan Petal Length karena p-value < alpha.

Output 2

Canonical Discriminant Function Coefficients


Function
1 2
Sepal_Width -3.154 1.878
Petal_Length 1.436 -1.198
Petal_Width 5.240 3.329
(Constant) -2.073 -5.190
Unstandardized coefficients

Dari hasil tabel diatas, persamaan estimasi fungsi diskriminan unstandardized dapat membuat
persamaan fungsi diskriminan sebagai berikut:

Z1 = -2.073 – 3.154 Sepal Width + 1.436 Petal Length + 5.240 Petal Width

Z2 = -5.190 + 1.878 Sepal Width – 1.198 Petal Length + 3.329 Petal Width

Dari persamaan diskriminan 1 (Z1) dan persamaan diskriminan 2 (Z2) terlihat bahwa nilai rata
rata rasio yang paling dominan untuk memprediksi perbedaan Species of Iris adalah Petal Width
karena memiliki koefisien yang tinggi dengan masing – masing persamaan 5.240 dan 3.229.

Output 3

Wilks' Lambda
Test of Function(s) Wilks' Lambda Chi-square df Sig.
1 through 2 .015 173.432 6 .000
2 .825 7.680 2 .021

Dari tabel di atas, fungsi diskriminan pertama dan kedua (secara bersama) adalah signifikan.
Namun jika hanya fungsi diskriminan kedua yang diperhitungkan (dengan menghilangkan fungsi
diskriminan pertama) maka fungsi kedua tidak signifikan, maka dapat disimpulkan bahwa fungsi
diskriminan signifikan secara statistic yang berarti nilai rata-rata score diskriminan untuk Iris
Setosa, Iris Versicolor, dan Iris Virginice berbeda secara signifikan.

Output 4

Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
a
1 55.988 99.6 99.6 .991
2 .206a .4 100.0 .413
a. First 2 canonical discriminant functions were used in the analysis.
Dari tabel diatas, dapat dilihat bahwa Fungsi Diskriminan 1 memiliki Canonical Correlation
sebesar 0.991 yang lebih besar dibandingkan dengan Fungsi Diskriminan 2 yang berarti terdapat
perbedaan secara signifikan antara ketiga jenis kelompok tersebut sebesar 0.991.

Kesimpulan

Jadi, Berdasarkan Uji Wilks Lamdba terdapat perbedaan yang signifikans antara ketiga
kelompok dengan masing – masing keempat variabel bebas tersebut. Dengan menggunakan
Stepwise Method dari 4 Variabel Bebas hanya ada 3 variabel yang memenuhi kriteria yaitu
Variabel Sepal Width, Petal Length, dan Petal Width.
Sehingga Fungsi (Model) Diskriminan yang didapat adalah :

Z1 = -2.073 – 3.154 Sepal Width + 1.436 Petal Length + 5.240 Petal Width

Z2 = -5.190 + 1.878 Sepal Width – 1.198 Petal Length + 3.329 Petal Width
Soal No 11.29 Hal 567

The GPA and GMAT data alluded to in Example 11.11 are listed in Table 11.6

𝜋1 = Admit 𝜋2 = No Admit 𝜋3 = Borderline


Applicant GPA GMAT Applicant GPA GMAT Applicant GPA GMAT
1 2.96 596 32 2.54 446 60 2.86 494
2 3.14 473 33 2.43 425 61 2.85 496
3 3.22 482 34 2.2 474 62 3.14 419
4 3.29 527 35 2.36 531 63 3.28 371
5 3.69 505 36 2.57 542 64 2.89 447
6 3.46 693 37 2.35 406 65 3.15 313
7 3.03 626 38 2.51 412 66 3.5 402
8 3.19 663 39 2.51 458 67 2.89 485
9 3.63 447 40 2.36 399 68 2.8 444
10 3.59 588 41 2.36 482 69 3.13 416
11 3.3 563 42 2.66 420 70 3.01 471
12 3.4 553 43 2.68 414 71 2.79 490
13 3.5 572 44 2.48 533 72 2.89 431
14 3.78 591 45 2.46 509 73 2.91 446
15 3.44 692 46 2.63 504 74 2.75 546
16 3.48 528 47 2.44 336 75 2.73 467
17 3.47 552 48 2.13 408 76 3.12 463
18 3.35 520 49 2.41 469 77 3.08 440
19 3.39 543 50 2.55 538 78 3.03 419
20 3.28 523 51 2.31 505 79 3 509
21 3.21 530 52 2.41 489 80 3.03 438
22 3.58 564 53 2.19 411 81 3.05 399
23 3.33 565 54 2.35 321 82 2.85 483
24 3.4 431 55 2.6 394 83 3.01 453
25 3.38 605 56 2.55 528 84 3.03 414
26 3.26 664 57 2.72 399 85 3.04 446
27 3.6 609 58 2.85 381
28 3.37 559 59 2.9 384
29 3.8 521
30 3.76 646
31 3.24 467
̅ 1, 𝑿
(a) Using these data, calculate 𝑿 ̅ 2, 𝑿
̅ 3, 𝑿
̅ and Spooled thus Verify the results for these
quantities

given in Example 11.11

Jawab :

Dengan Menggunakan Software SPPS

Group Statistics
Valid N (listwise)
Group Mean Std. Deviation Unweighted Weighted
1.00 GPA 3.4039 .20871 31 31.000
GMAT 561.2258 67.95769 31 31.000
2.00 GPA 2.4825 .18344 28 28.000
GMAT 447.0714 62.37992 28 28.000
3.00 GPA 2.9927 .17232 26 26.000
GMAT 446.2308 47.40153 26 26.000
Total GPA 2.9746 .42900 85 85.000
GMAT 488.4471 81.52235 85 85.000

Pooled Within-Groups Matricesa


GPA GMAT
Covariance GPA .036 -2.019
GMAT -2.019 3655.901
Correlation GPA 1.000 -.176
GMAT -.176 1.000
a. The covariance matrix has 82 degrees of freedom.

Dari Output diatas, diperoleh

̅ 1 = [3.4039 561.2258]
𝑿

̅ 2 = [2.4825 447.0714]
𝑿

̅ 3 = [2.9927 446.2308]
𝑿

̅ = [2.9746 488.4471]
𝑿
Spooled = 0.0436 -2.019
-2.019 3655.9

(b) Calculate W-1 and 𝑩 ̂ 0 and the eigenvalues and eigenvectors of W-1 𝑩
̂ 0. Use the linear
discriminants derived fron these eigenvectors to classify the new observation X=[3.21 497]
into one of the populations 𝜋1:admit, 𝜋2:not admit, and 𝜋3:borderline. Does the
classification agree with that in Example 11.11 ? Should it? Explain

Jawab :

Dengan Menggunakan Software R :


> X1=matrix(c(3.4039,561.2258),2,1)
> X2=matrix(c(2.4825,447.0714),2,1)
> X3=matrix(c(2.9927,446.2308),2,1)
> X=matrix(c(2.9746,488.4471),2,1)
> A=X1-X
> B=X2-X
> C=X3-X
> A1=A%*%t(A)
> B1=B%*%t(B)
> C1=C%*%t(C)
> B0=A1+B1+C1
> B0
[,1] [,2]
[1,] 0.4267885 50.84076
[2,] 50.8407629 8790.90371
> n=31+28+26-3
> Sp=matrix(c(0.036,-2.019,-2.019,3655.901),2,2)
> W=n*Sp
> W1=solve(W)
> W1
[,1] [,2]
[1,] 0.3495807640 1.930587e-04
[2,] 0.0001930587 3.442355e-06
> WB=solve(W)%*%B0
> WB
[,1] [,2]
[1,] 0.1590123059 19.47011333
[2,] 0.0002574072 0.04007666
> eigen(WB)
$values
[1] 0.192000791 0.007088175

$vectors
[,1] [,2]
[1,] 0.999998565 -0.999969558
[2,] 0.001694312 0.007802703
Dari hasil diatas, diperoleh :

 W-1
[,1] [,2]
[1,] 0.3495807640 1.930587e-04
[2,] 0.0001930587 3.442355e-06

 ̂0
𝑩
[,1] [,2]
[1,] 0.4267885 50.84076
[2,] 50.8407629 8790.90371

 ̂0
Eigen Value dari W-1𝑩
𝜆1 = 0.192000791
𝜆2 = 0.007088175

 ̂0
Eigen Vektor dari W-1𝑩
Dari nilai eigen diatas, didapatkan :

 𝜆1 = 0.191251866
Dan nilai vector eigen :

0.999998564
𝑒1 = [ ]
0.001694796
Sehingga dari nilai vector eigen diatas, dapat dicari persamaan yaitu :

̂𝟏 = 𝟎. 𝟗𝟗𝟗𝟗𝟗𝟖 𝑿𝟏 + 𝟎. 𝟎𝟎𝟏𝟔𝟗𝟒𝟕𝟔 𝑿𝟐
𝒚
 𝜆2 = 0.00706467
Dan nilai vector eigen

−0.99996946
𝑒2 = [ ]
0.007815072
Sehingga dari nilai vector eigen diatas, dapat dicari persamaan yaitu :
̂𝟐 = −𝟎. 𝟗𝟗𝟗𝟗𝟔𝟗 𝑿𝟏 + 𝟎. 𝟎𝟎𝟕𝟖𝟏𝟓 𝑿𝟐
𝒚

 Mencari S-1pooled
> solve(Sp)
[,1] [,2]
[1,] 28.66562265 0.0158308149
[2,] 0.01583081 0.000282273
𝟐𝟖. 𝟔𝟎𝟗𝟔𝟕𝟔𝟒𝟖 𝟎. 𝟎𝟏𝟓𝟕𝟗𝟖𝟎𝟑𝟐𝟗
S-1pooled = [ ]
𝟎. 𝟎𝟏𝟓𝟕𝟗𝟖𝟎𝟑 𝟎. 𝟎𝟎𝟎𝟐𝟖𝟐𝟐𝟓𝟑𝟗

Selanjutnya, dengan x’0 = [3.21 497], maka jarak sampel adalah sebagai berikut :

𝑥1 −1 𝑝𝑜𝑜𝑙𝑒𝑑(𝑥0 − ̅̅̅̅
o 𝐷12 (𝑋0 ) = (𝑥0 − ̅̅̅)′𝑆 𝑥1 )
28.60967648 0.0157980329
= [3.21 − 3.4038 , 497 − 561,2258] [ ]
0.01579803 0.0002822539
−0.1938
[ ]
−64.2258

> d1.x0=t(x0-rata1)%*%(solve(Spooled))%*%(x0-rata1)
> d1.x0
[,1]
[1,] 2.633025

Maka 𝐷12 (𝑋0 ) = 2.633025

𝑥2 −1 𝑝𝑜𝑜𝑙𝑒𝑑(𝑥0 − ̅̅̅̅
o 𝐷22 (𝑋0 ) = (𝑥0 − ̅̅̅)′𝑆 𝑥2 )
> d2.x0=t(x0-rata2)%*%(solve(Spooled))%*%(x0-rata2)
> d2.x0
[,1]
[1,] 16.99314
Maka 𝐷22 (𝑋0 ) = 16.99314

𝑥3 −1 𝑝𝑜𝑜𝑙𝑒𝑑(𝑥0 − ̅̅̅̅
o 𝐷32 (𝑋0 ) = (𝑥0 − ̅̅̅)′𝑆 𝑥3 )
> d3.x0=t(x0-rata3)%*%(solve(Spooled))%*%(x0-rata3)
> d3.x0
[,1]
[1,] 2.427123
Maka 𝐷32 (𝑋0 ) = 2.427123

̅̅̅3 yaitu
Dari hasil diatas, didaptkan bahwa rata-rata jarak grup yang terkecil adalah 𝑋
sebesar 2.427123.
Mengklasifikasikan kedalam observasi yang baru :
̂𝟏 = 𝟎. 𝟗𝟗𝟗𝟗𝟗𝟖 𝑿𝟏 + 𝟎. 𝟎𝟎𝟏𝟔𝟗𝟒𝟕𝟔 𝑿𝟐
𝒚

̂𝟐 = −𝟎. 𝟗𝟗𝟗𝟗𝟔𝟗 𝑿𝟏 + 𝟎. 𝟎𝟎𝟕𝟖𝟏𝟓 𝑿𝟐


𝒚

Dengan x’0 = [3.21 497]

 ̂𝟏 = 𝟎. 𝟗𝟗𝟗𝟗𝟗𝟖 𝒙𝟎𝟏 + 𝟎. 𝟎𝟎𝟏𝟔𝟗𝟒𝟕𝟔 𝒙𝟎𝟐


𝒚
= 𝟎. 𝟗𝟗𝟗𝟗𝟗𝟖 (𝟑. 𝟐𝟏) + 𝟎. 𝟎𝟎𝟏𝟔𝟗𝟒𝟕𝟔 (𝟒𝟗𝟕) = 4.0522893
 ̂𝟐 = −𝟎. 𝟗𝟗𝟗𝟗𝟔𝟗 𝒙𝟎𝟏 + 𝟎. 𝟎𝟎𝟕𝟖𝟏𝟓 𝒙𝟎𝟐
𝒚
= −𝟎. 𝟗𝟗𝟗𝟗𝟔𝟗 (𝟑. 𝟐𝟏) + 𝟎. 𝟎𝟎𝟕𝟖𝟏𝟓(𝟒𝟗𝟕) = 𝟎. 𝟔𝟕𝟒𝟏𝟓𝟒
ANALISIS KLUSTER HIERARKI

Kasus yang digunakan :

No PROVINSI IPM HLS AHS


1 ACEH 70.6 14.13 69.52
2 SUMATERA UTARA 70.57 13.1 68.37
3 SUMATERA BARAT 71.24 13.94 68.78
4 RIAU 71.79 13.03 70.99
5 JAMBI 69.99 12.87 70.76
6 SUMATERA SELATAN 68.86 12.35 69.18
7 BENGKULU 69.95 13.57 68.59
8 LAMPUNG 68.25 12.46 69.95
9 KEP. BANGKA BELITUNG 69.99 11.83 69.95
10 KEP. RIAU 74.45 12.81 69.48
11 DKI JAKARTA 80.06 12.86 72.55
12 JAWA BARAT 70.69 12.42 72.47
13 JAWA TENGAH 70.52 12.57 74.08
14 DI YOGYAKARTA 78.89 15.42 74.74
15 JAWA TIMUR 70.27 13.09 70.8
16 BANTEN 71.42 12.78 69.49
17 BALI 74.3 13.21 71.46
18 NUSA TENGGARA BARAT 66.58 13.46 65.55
19 NUSA TENGGARA TIMUR 63.73 13.07 66.07
20 KALIMANTAN BARAT 66.26 12.5 69.92
21 KALIMANTAN TENGAH 69.79 12.45 69.59
22 KALIMANTAN SELATAN 69.65 12.46 68.02
23 KALIMANTAN TIMUR 75.12 13.49 73.7
24 KALIMANTAN UTARA 69.84 12.79 72.47
25 SULAWESI UTARA 71.66 12.66 71.04
26 SULAWESI TENGAH 68.11 13.04 67.32
27 SULAWESI SELATAN 70.34 13.28 69.84
28 SULAWESI TENGGARA 69.86 13.36 70.47
29 GORONTALO 67.01 13.01 67.14
30 SULAWESI BARAT 64.3 12.48 64.34
31 MALUKU 68.19 13.91 65.4
32 MALUKU UTARA 67.2 13.56 67.54
33 PAPUA BARAT 62.99 12.47 65.32
34 PAPUA 59.09 10.54 65.14
Dengan menggunakan software R :

> setwd("C:/Users/user123/Documents/multi")
> kluster=read.csv("kluster.csv")
> attach(kluster)
> kluster=data.frame(IPM,HLS,AHS)
> kluster1=scale(kluster)
> d=dist(kluster1,method="euclidean")

1. Menggunakan Single Lingkage


> #Single Linkage
> fit.s <-hclust(d,method="single")
> plot(fit.s)

2. Menggunakan Complete Lingkage


> #Complete Linkage
> fit.c <-hclust(d,method="complete")
> plot(fit.c)
3. Menggunakan Average Lingkage
> #Average Linkage
> fit.a <-hclust(d,method="average")
> plot(fit.a)
4. Menggunakan Ward Lingkage

> #Ward Linkage


> fit.w <-hclust(d,method="ward.D")
> plot(fit.w)

Dari keempat metode yang digunakan terlihat menghasilkan Dendogram yang


berbedabeda, sehingga kita harus memilih metode yang dapat mengelompokkan data dengan
jelas. Katakan saja dalam kasus ini kita akan menggunaka metode Ward untuk mengelompokkan
data kita. Selanjutnya kita akan mengelompokkan data dengan cara memotong dendogram
menjadi 7 klaster menggunakan perintah berikut ini :

> install.packages("sparcl")
Installing package into ‘C:/Users/user123/Documents/R/win-library/3.3’
(as ‘lib’ is unspecified)
trying URL 'https://cran.rstudio.com/bin/windows/contrib/3.3/sparcl_1.0.3.zi
p'
Content type 'application/zip' length 62462 bytes (60 KB)
downloaded 60 KB

package ‘sparcl’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in


C:\Users\user123\AppData\Local\Temp\RtmpGK8TFW\downloaded_packages
> library(sparcl)
> y=cutree(fit.w,6)
> ColorDendrogram(fit.w,y=y,labels=names(y),main='ClusterDendrogram',branchl
eng=1300)
Interpretasi :

Dilihat dari dendrogam, Dari hasil penelitian tentang pengelompokkan provinsi terhadap IPM,
AHS, dan HLS dengan Cluster Hierarki yang diperoleh bahwa terdapat 6 kelompok Provinsi
tersebut memiliki kemiripan berdasarkan ketiga variabel yang digunakan.

- Kelompok 1 : Jambi, Riau, Jawa Barat, Jawa Tengah, Banten, Bali, Jawa Timur,
Kalimatan Utara, Sulawesi Utara.
- Kelompok 2 : Kep. Bangka Belitung, Kalimantan Barat, Kalimantan Selatan, Sumatera
Selatan, Lampung, Kalimantan Tengah
- Kelompok 3 : Aceh, Sumatera Barat, Sumatera Utara, Bengkulu, Sulawesi Selatan,
Sulawesi Tenggara
- Kelompok 4 : DKI Jakarta, DI Yogyakarta, Kalimantan Timur
- Kelompok 5 : Nusa Tenggara Barat, Nusa Tenggara Timur, Sulawesi Tengah, Gorontalo,
Sulawesi Barat, Maluku, Maluku Utara, Papua Barat
- Kelompok 6 : Papua

Anda mungkin juga menyukai