Analisis Diskriminan
Analisis Diskriminan
Definisi
Analisis diskriminan adalah teknik statistik
multivariat yang digunakan untuk
menggolongkan subyek pada satu
kelompok (dari k kelompok yang ada)
Analisis diskriminan akan membuat fungsi
diskriminan berdasarkan kombinasi linier dari
variabel prediktor untuk menghasilkan
diskriminasi terbaik antar kelompok
Fungsi diskriminan dihasilkan dari sampel di
mana telah diketahui subyek termasuk dalam
kelompok yang mana
Contoh Sederhana
Function
1
Income .021
Years of education .195
Age -.036
Employed .226
Suburban .290
Gender .030
Children less than
-.089
17 years old
(Constant) -2.231
Unstandardized coefficients
Fungsi diskriminan
D = -2,231 + 0,021*Income + 0,195*Yrs Educ – 0,036*Age +
0,226*Employed + 0,290*Suburban + 0,030*Gender –
0,089*Chd < 17 yrs
Fungsi Diskriminan
Jika ada seorang penghasilan 50, lama
pendidikan 15 th, umur 30 th, bekerja,
tinggal di kota, laki-laki & tidak punya anak
Income = 50
Yrs educ = 15
Age = 30
Employed = 1
Suburban = 0
Gender = 1
Chd < 17 yrs = 0
Fungsi Diskriminan
Fungsi diskriminan
D = -2,231 + 0,021*Income + 0,195*Yrs
Educ – 0,036*Age + 0,226*Employed +
0,290*Suburban + 0,030*Gender –
0,089*Chd < 17 yrs
Maka skor diskriminannya:
D = -2,231 + 0,021*50 + 0,195*15 –
0,036*30 + 0,226*1 + 0,290*0 + 0,030*1
– 0,089*0
D = 0,694
Group Membership
OK, orang tersebut memiliki skor
diskriminan 0,694, tapi pertanyaan
belum terjawab: Ia pengguna
internet atau bukan?
Untuk menjawabnya kita harus tahu
cut off skor diksriminan
Group Membership
Functions at Group Centroids
Function
Internet use 1
No -.742
Yes .576
Unstandardized canonical discriminant
functions evaluated at group means
Function
1
Income .571
Years of education .477
Age -.562
Employed .105
Suburban .140
Gender .015
Children less than
-.044
17 years old
Korelasi
Cara lain untuk menilai kontribusi prediktor
adalah dg menggunakan korelasi prediktor dg
skor diskriminan
Structure Matrix
Function
1
Income .687
Years of education .588
Age -.449
Employed .405
Suburban .262
Gender .134
Children less than
.133
17 years old
Pooled within-groups correlations between discriminating
variables and standardized canonical discriminant functions
Variables ordered by absolute size of correlation within function.
Hubungan Skor Diskriminan &
Pengelompokkan
Eigen Value
Rasio antara between group sum of
square dg within group sum of square
Fungsi diskriminan yg baik memiliki
perbedaan antar kelompok yg besar dan
perbedaan dalam kelompok yg kecil
Fungsi diskriminan yg baik Eigen
Value besar
Eigen Value
Eigenvalues
Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
1 .428a 100.0 100.0 .547
a. First 1 canonical discriminant functions were used in the
analysis.
Hubungan Skor Diskriminan &
Pengelompokkan
Wilks’ lambda
Rasio within group sum of square
dengan total sum of square
1-Wilks’ Lamba menggambarkan variasi
skor diskriminan yang dapat dijelaskan
oleh perbedaan kelompok
Atau menggambarkan kemampuan fungsi
diskriminan untuk membedakan subyek
menurut kelompoknya
Sama dengan R2 pada regresi linier
Wilks’ Lambda
Wilks' Lambda
Wilks'
Test of Function(s) Lambda Chi-square df Sig.
1 .700 823.049 7 .000
Predicted Group
Membership
Internet use No Yes Total
Original Count No 750 262 1012
Yes 322 982 1304
Ungrouped cases 1 0 1
% No 74.1 25.9 100.0
Yes 24.7 75.3 100.0
Ungrouped cases 100.0 .0 100.0
Cross-validated a Count No 747 265 1012
Yes 324 980 1304
% No 73.8 26.2 100.0
Yes 24.8 75.2 100.0
a. Cross validation is done only for those cases in the analysis. In cross
validation, each case is classified by the functions derived from all cases other
than that case.
b. 74.8% of original grouped cases correctly classified.
c. 74.6% of cross-validated grouped cases correctly classified.
Uji Asumsi
Dilakukan jika hasil analisis diskriminan
akan digunakan pada populasi (inferensi)
Asumsi:
Multivariat normality
Equal Variance Covariance Matrix
Uji Asumsi
Box’ M Test terlalu sensitif pada sampel besar
Log Determinant
Box’ M Test
Test Results
Box's M 327.409
F Approx. 11.655
df1 28
df2 2E+007
Sig. .000
Tests null hypothesis of equal population covariance matrices.
Log Determinants
Log
Internet use Rank Determinant
No 7 7.331
Yes 7 7.534
Pooled within-groups 7 7.587
The ranks and natural logarithms of determinants
printed are those of the group covariance matrices.