Anda di halaman 1dari 27

Analisis Diskriminan

Definisi
 Analisis diskriminan adalah teknik statistik
multivariat yang digunakan untuk
menggolongkan subyek pada satu
kelompok (dari k kelompok yang ada)
 Analisis diskriminan akan membuat fungsi
diskriminan berdasarkan kombinasi linier dari
variabel prediktor untuk menghasilkan
diskriminasi terbaik antar kelompok
 Fungsi diskriminan dihasilkan dari sampel di
mana telah diketahui subyek termasuk dalam
kelompok yang mana
Contoh Sederhana

Berdasarkan tabel di atas, dapatkah Anda menduga mobil


yang digunakan berdasarkan gaji per bulan?
Contoh Sederhana
 Si L berpenghasilan Rp 12 juta/bln,
apakah mobil yang digunakan?
 Berdasarkan data yang ada, Anda
cenderung menebak mobilnya Corolla
Altis
 Prinsip yang sama digunakan pada
analisis diskriminan, tetapi
menggunakan lebih banyak variabel
sebagai prediktor
Analisis Diskriminan
 Analisis diskriminan dilakukan untuk
menentukan prediktor pengguna
internet
 Sampel 2316
 1012 bukan pengguna internet
 1304 pengguna internet
 Variabel prediktor: income, yrs of educ,
age, employed, suburban, gender,
children age < 17 yrs
Fungsi Diskriminan
Canonical Discriminant Function Coefficients

Function
1
Income .021
Years of education .195
Age -.036
Employed .226
Suburban .290
Gender .030
Children less than
-.089
17 years old
(Constant) -2.231
Unstandardized coefficients

Fungsi diskriminan
D = -2,231 + 0,021*Income + 0,195*Yrs Educ – 0,036*Age +
0,226*Employed + 0,290*Suburban + 0,030*Gender –
0,089*Chd < 17 yrs
Fungsi Diskriminan
 Jika ada seorang penghasilan 50, lama
pendidikan 15 th, umur 30 th, bekerja,
tinggal di kota, laki-laki & tidak punya anak
 Income = 50
 Yrs educ = 15
 Age = 30
 Employed = 1
 Suburban = 0
 Gender = 1
 Chd < 17 yrs = 0
Fungsi Diskriminan
 Fungsi diskriminan
D = -2,231 + 0,021*Income + 0,195*Yrs
Educ – 0,036*Age + 0,226*Employed +
0,290*Suburban + 0,030*Gender –
0,089*Chd < 17 yrs
 Maka skor diskriminannya:
D = -2,231 + 0,021*50 + 0,195*15 –
0,036*30 + 0,226*1 + 0,290*0 + 0,030*1
– 0,089*0
D = 0,694
Group Membership
 OK, orang tersebut memiliki skor
diskriminan 0,694, tapi pertanyaan
belum terjawab: Ia pengguna
internet atau bukan?
 Untuk menjawabnya kita harus tahu
cut off skor diksriminan
Group Membership
Functions at Group Centroids

Function
Internet use 1
No -.742
Yes .576
Unstandardized canonical discriminant
functions evaluated at group means

Pengguna internet memiliki skor rata-rata: 0,576 dan


bukan pengguna memiliki skor rata-rata -0,742.
Cut off skor = (0,576-0,742)/2 = -0,083

Jika skor diskriminan < -0,083  Bukan pengguna


internet
Jika skor diskriminan > -0,083  Pengguna internet
Peran Variabel Prediktor
 Unstandardized coeff tidak dapat
digunakan untuk menentukan
prediktor mana yg paling berperan,
karena coeff dipengaruhi oleh satuan
ukuran
 Untuk menentukan prediktor mana
yang paling berperan digunakan
standardized coefficient
Standardized Coefficient

Standardized Canonical Discriminant Function Coefficients

Function
1
Income .571
Years of education .477
Age -.562
Employed .105
Suburban .140
Gender .015
Children less than
-.044
17 years old
Korelasi
 Cara lain untuk menilai kontribusi prediktor
adalah dg menggunakan korelasi prediktor dg
skor diskriminan
Structure Matrix

Function
1
Income .687
Years of education .588
Age -.449
Employed .405
Suburban .262
Gender .134
Children less than
.133
17 years old
Pooled within-groups correlations between discriminating
variables and standardized canonical discriminant functions
Variables ordered by absolute size of correlation within function.
Hubungan Skor Diskriminan &
Pengelompokkan
 Eigen Value
 Rasio antara between group sum of
square dg within group sum of square
 Fungsi diskriminan yg baik memiliki
perbedaan antar kelompok yg besar dan
perbedaan dalam kelompok yg kecil
 Fungsi diskriminan yg baik  Eigen
Value besar
Eigen Value

Eigenvalues

Canonical
Function Eigenvalue % of Variance Cumulative % Correlation
1 .428a 100.0 100.0 .547
a. First 1 canonical discriminant functions were used in the
analysis.
Hubungan Skor Diskriminan &
Pengelompokkan
 Wilks’ lambda
 Rasio within group sum of square
dengan total sum of square
 1-Wilks’ Lamba menggambarkan variasi
skor diskriminan yang dapat dijelaskan
oleh perbedaan kelompok
 Atau menggambarkan kemampuan fungsi
diskriminan untuk membedakan subyek
menurut kelompoknya
 Sama dengan R2 pada regresi linier
Wilks’ Lambda

Wilks' Lambda

Wilks'
Test of Function(s) Lambda Chi-square df Sig.
1 .700 823.049 7 .000

30% (100-70%) variasi skor diskriminan dapat dijelaskan


karena perbedaan kelompok pengguna & bukan pengguna
internet
Sensitifitas & Spesifisitas Fungsi
Diskriminan
 Fungsi diskriminan digunakan
kembali pada sampel untuk
menentukan subyek masuk ke
kelompok yang mana
 Hasil penggelompokkan menurut
fungsi diskriminan dibandingkan
dengan kelompok yang
sesungguhnya
Sensitifitas & Spesifisitas Fungsi
Diskriminan
Classification Resultsb,c

Predicted Group
Membership
Internet use No Yes Total
Original Count No 750 262 1012
Yes 322 982 1304
Ungrouped cases 1 0 1
% No 74.1 25.9 100.0
Yes 24.7 75.3 100.0
Ungrouped cases 100.0 .0 100.0
Cross-validated a Count No 747 265 1012
Yes 324 980 1304
% No 73.8 26.2 100.0
Yes 24.8 75.2 100.0
a. Cross validation is done only for those cases in the analysis. In cross
validation, each case is classified by the functions derived from all cases other
than that case.
b. 74.8% of original grouped cases correctly classified.
c. 74.6% of cross-validated grouped cases correctly classified.
Uji Asumsi
 Dilakukan jika hasil analisis diskriminan
akan digunakan pada populasi (inferensi)
 Asumsi:
 Multivariat normality
 Equal Variance Covariance Matrix
 Uji Asumsi
 Box’ M Test  terlalu sensitif pada sampel besar
 Log Determinant
Box’ M Test
Test Results
Box's M 327.409
F Approx. 11.655
df1 28
df2 2E+007
Sig. .000
Tests null hypothesis of equal population covariance matrices.

H0:Variance/Covariance Matrix equal


Hasil di atas  Asumsi tidak terpenuhi
Log Determinant

Log Determinants

Log
Internet use Rank Determinant
No 7 7.331
Yes 7 7.534
Pooled within-groups 7 7.587
The ranks and natural logarithms of determinants
printed are those of the group covariance matrices.

Log determinant tidak berbeda jauh sehingga dapat


dikatakan asumsi equak variance/covariance terpenuhi.
Box’ M test menyimpulkan assumsi tidak terpenuhi
karena sampel besar  uji terlalu sensitif
Contoh Aplikasi pada Penelitian
Kedokteran
 Desertasi Jacub Pandelaki:
 Penggunaan Rasio Metabolit Kimia Otak
dengan Magnetic Resonance Spectoscopy
untuk Mendapatkan Fungsi Model
Prediksi dalam Menentukan Derajata
Astrositoma
 Penggunaan analisis diskriminan untuk
menentukan diagnosis pasien: normal,
astrositoma derajat rendah (ADR),
astrositoma derajat tinggi (ADT)
Hasil Analisis
 Diperoleh 2 fungsi diskriminan
 F1 = -2,931 – (0,889*Cho/Cr) + (1,613*Lip/Cr) –
(1,361*Lac/Cr) – (3,890*Mi/Cr) + (2,198*Glx/Cr) +
(3,065*LL/Cr) + (3,411*Cho/NAA)
 F2 = -0,434 + (1,771*Cho/Cr) + (4,046*Lip/Cr) +
(1,048*Lac/Cr) + (3,152*Mi/Cr) + (4,705*Glx/Cr) –
(4,709*LL/Cr) – (1,777*Cho/NAA)
 Berdasarkan kedua fungsi tsb, sensitifitas u/
diagnosis normal 94,7%, ADR 81,8% dan ADT
75,0%
 Fungsi dpt digunakan u/prediksi diagnosis pasien
astrositoma (tanpa perlu PA)
Contoh Penggunaan Kedua
Fungsi Diskriminan
 Seorang pasien dilakukan MRS
dengan hasil sbb:
Contoh Penggunaan Kedua
Fungsi Diskriminan

 F1 = -2,931 – (0,889*2,00) + (1,613*2,57) –


(1,361*7,70) – (3,890*1,70) + (2,198*1,17) +
(3,065*4,35) + (3,411*1,00) = 3,517
 F2 = -0,434 + (1,771*2,00) + (4,046*2,57) +
(1,048*7,70) + (3,152*1,70) + (4,705*1,17) –
(4,709*4,35) – (1,777*1,00) = 0,774
Contoh Penggunaan Kedua
Fungsi Diskriminan

Jadi berdasarkan rasio


metabolit otaknya, diagnosis
pasien tersebut adalah
astrositoma derajat tinggi

Anda mungkin juga menyukai