Anda di halaman 1dari 9

MODUL 3

ANALISIS DISKRIMINAN
Analisis diskriminan bertujuan untuk membentuk sejumlah fungsi melalui kombinasi
linear variabel-variabel

asal, yang

dapat

digunakan

sebagai

cara terbaik

untuk

membedakan kelompok-kelompok individu. Fungsi yang terbentuk melalui analisis ini


kemudian disebut sebagi fungsi diskriminan. Manfaat lain dari fungsi diskriminan ini
disamping dapat digunakan untuk menjelaskan perbedaan antar kelompok juga dapat
digunakan dalam masalah pengelompokkan suatu individu atau observasi baru.
Pengelompokkan pada analisis diskriminan bersifat mutually exclusive, yaitu jika
suatu objek telah masuk pada salah satu kelompok maka tidak dapat menjadi anggota
dari kelompok yang lain. Analisis diskriminan tidak hanya memecahkan masalah yang
menyangkut dua kelompok saja tetapi juga memecahkan masalah yang menyangkut
lebih dari dua kelompok. Pada makalah ini akan dijelaskan mengenai prosedur analisis
diskriminan untuk dua kelompok.
Ada dua asumsi utama yang harus dipenuhi pada analisis diskriminan ini, yaitu:
1. Sejumlah p variabel penjelas harus berdistribusi normal multivariat.
2. Matriks varians-covarians variabel penjelas berdimensi pxp pada kedua kelompok
harus sama (homogen).

KASUS 1:
Tabel berikut menunjukkan data yang berupa hasil penelitian untuk mengetahui
pengaruh perubahan lingkungan terhadap tekanan darah. Obyek penelitian adalah 35
pria berusia di atas 21 tahun di Peru yang telah migrasi dari pegunungan Andes ke kota
besar. Ada 10 variabel yang diukur, yaitu (lihat file data diskriminan.sav) :

Usia (tahun)

Lama migrasi (tahun)

Berat badan (Kg)

Tinggi badan (mm)

Lekukan kulit pada dagu

Lekukan kulit pada lengan bawah

Lekukan kulit pada betis

Detak nadi per menit

Tekanan darah sistolik

Tekanan darah diastolik

Pelatihan Analisis Multivariat | Analisis Diskriminan

23

Uji Normal Multivariat


Sebelum melakukan analisis diskriminan, terlebih dahulu melakukan uji asumsi

normal multivariat menggunakan software MINITAB. Macro MINITAB untuk menguji


kemultinormalan data melalui multivariate skewness dan multivariate kurtosis dapat
dilihat pada Lampiran 1.

Langkah Pengujian :
1. Buka file data diskriminan.MTW
2. Aktifkan windows Session dengan cara klik windows Session terlebih dahulu,
kemudian pilih menu Editor lalu pilih Enable Commands

3. Perhatikan bahwa secara otomatis akan muncul MTB >

pada windows Session

4. Selanjutnya ketikkan perintah untuk menjalankan Macro MINITAB untuk uji normal
multivariat, seperti berikut :

MTB > %diskriminan.txt c1-c10


Pelatihan Analisis Multivariat | Analisis Diskriminan

24

Output :
Multivariate skewness

Data Display
b1
z1
pvalue

38.6030
248.247
0.0926808

Multivariate kurtosis

Data Display
b2
z2
pvalue

116.429
-0.681760
0.495391

Berdasarkan output MINITAB di atas, p-value untuk statistik uji multivariate

skewness (0,0926808) dan multivariate kurtosis (0,495391) lebih besar dari

=5%, sehingga data berdistribusi normal. Dengan demikian asumsi normal multivariat
pada analisis diskriminan telah terpenuhi.

Uji Homoskedastisitas
Selanjutnya dilakukan uji asumsi yang kedua, yaitu uji kesamaan matriks varianscovarians (homoskedastisitas) menggunakan uji Boxs M dengan hipotesis :
Ho:

1 2

H 1:

1 2

diharapkan dari uji ini hipotesis nol tidak ditolak, sehingga asumsi homoskedastisitas
terpenuhi dan bisa dilanjutkan ke analisis diskriminan.

Langkah Pengujian :
1. Buka file data diskriminan.sav
2. Pilih menu Analyze, pilih submenu Classify, lalu pilih Discriminant

Pelatihan Analisis Multivariat | Analisis Diskriminan

25

- Pada kotak Grouping Variable masukkan variabel respon, yaitu kelompok.


Kemudian klik Define Range untuk mendefinisikan kode kategori kelompok yang
dianalisis. Bagian Minimum diisi dengan kode terkecil dan Maximum diisi dengan
kode terbesar dari variabel respon.

- Pada kotak Independents masukkan variabel penjelas yaitu usia, umur


migrasi, berat badan, tinggi badan, dagu, lengan bawah, betis, nadi,
sistolik dan diastolik.
- Metode yang sering dipakai adalah metode stepwise. Sehingga pilih Use
stepwise method.
3. Klik tombol Statistics sehingga muncul kotak dialog berikut :

Pada bagian Descriptives pilih Boxs M untuk menguji asumsi homoskedastisitas.


Kemudian Klik Continue untuk kembali ke menu utama.
4. Abaikan bagian yang lain, kemudian klik OK.

Output :
Test Results
Box's M
F

Approx.
df1
df2
Sig.

20,983
1,165
15
4091,153
,292

Tests null hypothesis of equal population covariance matrices.

Berdasarkan Tabel di atas terlihat bahwa

p-value (0,292) lebih besar dari 0,05

sehingga tidak menolak H0. Hal ini berarti matriks varians-covarians kedua kelompok
adalah sama. Dengan demikian asumsi homoskedastisitas pada analisis diskriminan telah
terpenuhi.

Pelatihan Analisis Multivariat | Analisis Diskriminan

26

ANALISIS DISKRIMINAN
Setelah dilakukan uji asumsi yang harus terpenuhi pada analisis diskriminan, maka

selanjutnya dapat dilakukan analisis diskriminan.

Langkah Pengujian :
1. Buka file data diskriminan.sav
2. Pilih menu Analyze, pilih submenu Classify, lalu pilih Discriminant

- Pada kotak Grouping Variable masukkan variabel kelompok. Kemudian klik


Define Range. Bagian Minimum diisi dengan 1 dan Maximum diisi dengan 2.
- Pada kotak Independents masukkan variabel penjelas yaitu usia, umur
migrasi, berat badan, tinggi badan, dagu, lengan bawah, betis, nadi,
sistolik dan diastolik.
- Metode yang sering dipakai adalah metode stepwise. Sehingga pilih Use
stepwise method. Secara otomatis tombol Method akan diaktifkan.
3. Klik tombol Method tersebut, maka akan keluar kotak dialog seperti berikut :

- Pada bagian Method pilih Wilks lambda. Sedangkan pada bagian Criteria pilih
Use probability of F. Kemudian Klik Continue.

Pelatihan Analisis Multivariat | Analisis Diskriminan

27

4. Klik tombol Statistics sehingga muncul kotak dialog berikut :

- Pada

bagian

Descriptives

pilih

Boxs

untuk

menguji

asumsi

homoskedastisitas. Sedangkan pada bagian Function Coefficients pilih Fishers


dan Unstandardized. Kemudian Klik Continue.
5. Klik tombol Classify sehingga muncul kotak dialog berikut :

- Pada bagian Display pilih Casewise results untuk membandingkan hasil kasus
awal dengan model diskriminan. Pilih Summary table untuk menampilkan nilai
hit ratio. Pilih Leave-one-out classification untuk menampilkan data yang
cocok dengan hasil proses diskriminan dan data yang tidak cocok.
-

Abaikan bagian yang lain, kemudian Klik Continue.

6. Klik tombol Save untuk menampilkan nilai-nilai posterior probability, nilai-nilai


discriminant score, dan pengklasifikasian observasi oleh model. Kemudian klik
Continue.

Pelatihan Analisis Multivariat | Analisis Diskriminan

28

Output :

Pembentukan fungsi linear


Pada output SPSS, koefisien untuk setiap variabel yang masuk dalam model
dapat dilihat pada tabel Canonical Discriminant Function Coefficient. Tabel ini
akan dihasilkan pada output apabila pilihan Function Coefficient pada bagian
Unstandardized diaktifkan.
Canonical Discriminant Function Coefficients

usia
umur_migrasi
tinggi_badan
sistolik
diastolik
(Constant)

Function
1
-,136
,195
,021
,037
,071
-41,318

Unstandardized coefficients

Dari tabel di atas, dapat dibentuk fungsi diskrikiman linearnya sebagai berikut:
Z score = - 41,318 - 0,136 usia + 0,195 umur migrasi + 0,021 tinggi
badan + 0,037 sistolik + 0,071 diastolik
o

Perhitungan discriminant score


Setelah dibentuk fungsi linearnya, maka dapat dihitung skor diskriminan untuk
setiap observasi dengan memasukkan nilai-nilai variabel penjelasnya. Misalnya
untuk observasi pertama, dengan memasukkan nilai usia = 21, umur migrasi = 1 ,
tinggi badan = 1629, sistolik = 170 dan diastolik = 76, maka diperoleh
discriminant score nya sebesar 1,916.

Perhitungan cutting score


Cutting score (m) dapat dihitung dengan rumus sebagai berikut :

n12Y n2 1Y
n1 n2

Kemudian nilai-nilai discriminant score tiap observasi akan dibandingkan dengan

Pelatihan Analisis Multivariat | Analisis Diskriminan

29

cutting score, sehingga dapat diklasifikasikan suatu observasi akan termasuk ke


dalam kelompok yang mana. Suatu observasi akan diklasifikasikan sebagai anggota
kelompok 1 jika discriminant score > cutting score, selain itu dimasukkan ke

dalam kelompok 2.
Functions at Group Centroids

kelompok
1
2

Function
1
1,537
-1,294

Unstandardized canonical discriminant


functions evaluated at group means

Berdasarkan Tabel di atas, dapat dihitung cutting score nya, yaitu

n12Y n2 1Y
16( 1, 294) 19(1,537)
0, 242829
=
n1 n2
35

Untuk observasi pertama, karena discriminant score nya (1,916) lebih besar dari
cutting

score

(0,242829),

maka

dimasukkan

ke

dalam

kelompok

(pengklasifkasian sudah benar karena sebenarnya observasi pertama sebelumnya


memang termasuk ke dalam anggota kelompok 1).
o

Perhitungan Hit Ratio


Setelah semua observasi diprediksi keanggotaannya, dapat dihitung hit ratio,
yaitu rasio antara observasi yang tepat pengklasifikasiannya dengan total seluruh
observasi.
Classification Resultsb,c

Original

Count
%

Cross-validated a

Count
%

kelompok
1
2
1
2
1
2
1
2

Predicted Group
Membership
1
2
15
1
2
17
93,8
6,3
10,5
89,5
13
3
2
17
81,3
18,8
10,5
89,5

Total
16
19
100,0
100,0
16
19
100,0
100,0

a. Cross validation is done only for those cases in the analysis. In cross
validation, each case is classified by the functions derived from all
cases other than that case.
b. 91,4% of original grouped cases correctly classified.
c. 85,7% of cross-validated grouped cases correctly classified.

Berdasarkan Tabel di atas, angka hit ratio adalah

15 17
0,9143
35

Pelatihan Analisis Multivariat | Analisis Diskriminan

30

Dengan demikian ketepatan prediksi dari model adalah sebesar 91,4%. Sehingga
ketepatan model dapat dikatakan tinggi dan model tersebut bisa digunakan untuk
mengklasifikasikan observasi baru.
o

Pengklasifikasian observasi baru


Jika ada observasi atau responden baru, maka dapat diprediksi akan termasuk dalam
kelompok mana berdasarkan karakteristik yang dimilikinya dengan fungsi linear yang
sudah terbentuk. Inilah yang menjadi tujuan pembentukan fungsi diskriminan.

Pelatihan Analisis Multivariat | Analisis Diskriminan

31