Anda di halaman 1dari 19

Statistika Multivariat Terapan

Tentang

Analisis Diskriminan

Disusun Oleh:

1. Ilham Agusman Hanafi 18037030


2. Lia Apriyani 18037036
3. Melia Wahyuni 18037044
4. Mutiara Putri 18037050

STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS NEGERI PADANG

2020
Bab I

Pendahuluan

1.1. Latar Belakang

Dalam kehidupan sehari-hari, sering ditemui masalahmasalah yang berkaitann dengan


pengelompokan barang-barang berdasarkan jenis yang telah ditentukan. Sehingga secara tidak
langsung, perlu adanya pertimbangan yang tepat untuk mengklasifikasikanya dimana
pertimbangan tersebut berkaitan dengan ilmu statistic.

Statistic merupakan salah satu cabang disiplin ilmu matematika. Banyak metode yang
dapat dipelajri dalam ilmu statistic ini salah satunya metodenya yang dapat digunakan adalah
analisis diskriminan. Menurut Suryanto (1988:169) analisis diskriminan adalah metode statistic
untuk mengelompokkan sejumlah objek ke dalam beberapa kelompok, berdasarkan beberapa
variable sedemikian sehingga setiap bjek menjadi anggota dari salah satu kelompok.

Analisis diskriminasi merupakan teknik menganalisis data, dimana variable dependen


merupakan data kategorik (nominal, ordinal) sedangkan variable independen berupa data interval
dan rasio.

1.2. Rumusan Masalah

Berdasarkan latar belakang tersebut, diperoleh beberapa rumusan masalah sebagai


berikut:

1. Apa saja karakteristik dari analisis diskriminan?


2. Apa saja asumsi yang harus dipenuhi pada analisis diskriminan?
3. Bagaimana langkah-langkah pada analisis diskriminan?
4. Bagaimana penerapan analisis diskriminan pada kasus-kasus yang dihadapi daklam
kehidupan nyata
Bab II

Pembahasan

2.1. Analisis Diskriminan

Analisis diskriminan (discriminant analysis) merupakan salah satu metode yang


digunakan dalam analisis multivariate. Analisis diskriminan adalah teknik multivariate untuk
memisahkan objek-objek dalam kelompok yang berbeda dan mengelompokkan objek baru ke
dalam kelompok-kelompok tersebut (Jhonson, 1956). Dalam analisis diskriminan terdapat dua
jenis variable terlibat yaitu variable independen dan variable dependen. Ciri khusus analisis
diskriminan adalah data variable dependen harus berupa data kategori (data nominal dan
ordinal), sedangkan data untuk variable independen berupa data metric (data rasio dan interval).
Analisis diskriminan dapat digunakan jika variable dependennya terdiri dari dua kelompok atau
lebih. Apabila veriabel dependennya lebih dari dua kelompok, maka metode yang digunakan
adalah analisis diskriminan multipeL (multiple discriminant analysis).

Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu kombinasi
linier dari berbagai variable independen. Hal ini dapat dimodelkan sebagai berikut:

D=b0 +b1 X 1 +b 2 X 2 +…+ bn X n

Dimana:

D : skor diskriminan

b : koefisien diskriminan atau bobot

X : predictor atau variable independen

2.2. Tujuan Analisi Diskriminan

Karena bentuk multivariate dari analiss diskriminan adalah dependen, maka variable
dependen adalah variable yang menjadi dasar analisis diskriminan. Adapun tujuan dari analisis
diskriminan antara lain:
1. Mengetahui perbedaan yang jelas antar grup pada variable dependen
2. Jika ada perbedaan, variable independen manakah pada fungsi diskriminan yang
membuat perbedaan tersebut.
3. Membuat fungsi atau model diskriminan (yang mirip dengan persamaan regresi).
4. Melakukan klasifikasi terhadap objek ke dalam kelompok (grup).

2.3. Asumsi Analisis Diskriminan

Asumsi penting yang harus dipenuhi agar model diskriminan dapat digunakan antara lain:

1. Multivariate normality, atau variable independen seharusnya berdistribusi normal. Jika


data tidak berdistribusi norma, maka hal ini akan menyebabkan masalh pada ketetapan
fungsi(model) diskriminan. Regresi logistic (logisticregression) bias dijadikan alternative
motode ini jika memang data tidak berdistribusi normal.
2. Matriks kovarians semua variable independen harus sama (equal)
3. Tidak terjadi multikolinieritas (tidak berkorelasi) antara variable independen. Jika dua
variable independen mempunyai korelasi yang kuat, maka dikatakan terjadi
multikolinieritas.
4. Tidak terdapat data yang ekstrim (outliet) pada variable independen. Jika ada data outlier
yang tetap diproses, hal ini bias berakibat berkurangnya ketepatan klasifikasi dari fungsi
diskriminan.

2.4. Proses Analisi Diskriminan

Langkah-langkah dalam melakukan proses analisis diskriminan antara lain:

1. Uji Multikolinieritas
Dengan menggunakan macro minitab diperoleh bahwa plot antara nilai X2tabel
engan jarak mahanabolis dari data mengikuti garis normal dan nilai P-value > 0.5 maka
dapat disimpulkan variable-variabel yang digunakan mengikuti sebaran multinormal.
2. Pengecekan multikolinieritas
Secara teori, idealnya dalam analisis diskriminan tidak ada multikolinieritas antar
variable. Pengecekan multikolinieritas dapat dilihat dengan bantuan matrik korelasi.
Apabila ada dua variable memiliki nilai korelasi r>0.5 maka variable tersebut berkorelasi
sehingga terdapat multikolinieritas antar variable.
Untuk lebih menyakinkan adanya multikolinieritas, bias dicek dengan
menggunakan uji KMO dan Baetlett Test pada SPSS. Jika nilai KMO > 0.5 maka
terdapat multikolinieritas antar variable. Sedangkan pada Bartett Test, multikolinieritas
terjadi jika p-value <0.5.
3. Menguji kesamaan rata-rata kelompok
Untuk melakukan pengujian kesamaan rata-rata kelompok menggunakan angka
Wilks Lambda dan menggunakan angka signifikamsi. Wilks Lambda adalah rasio antar
jumlah kuadrat dalam kelompok dan jumlah kuadrat total. Nilai Wilks Lambda berkisar
anara 0 sampai 1. Nilai lambda yang mendeteksi 1 menujjukkan bahwa rata-rata
kelompok cenderung tidak berbeda. Sebaliknya nilai lambda yang mendekati 0
menunjukkan nilai rata-rata kelompok berbeda. Melakukan pengujian terhadap masing-
masing variable, menggunakan uji F. uji F dilakukan untuk menguji hipotesis berikut
H0:rata-rata dari masing-masing kelompok adaLah relative sama.
H1: rata-rata dari masing-masing kelompok memiliki pebedaan secara nyata.
Jika Fhitung < Ftabel, maka tidak terdapat perbedaan antara grup
Jika Fhitung > Ftabel, maka terdapat perbedaan antara grup .
Uji kesamaan rta-rata jiga digunakan untuk mengetahui variable mana saja yang
secara signifikan menjadi factor pembeda pada kelompok 1 dan kelompok 2.
4. Mengguji kesamaan varians kovarians (Homokedastisitas)
Melakukan pengujian varians dari masing-masing variable, digunakan angka
Box’M dengan asumsi bahwa variable independen utuk setiap kelompok seharusnya
sama dan varians diantara variable-variabel independen seharusnya juga sama.
5. Menentukan variable yang memenuhi persyaratan untuk membentuk fungsi diskriminan

6. Membentuk funsi diskriminan


Fungsi diskriminan dapat dibentuk dengan kriteria Fisher yaitu
mengelompokkkan suatu observasi berdasarkan nilai skor yang dihitung dari suatu fungsi
linier. Pembentukan fungsi linier juga dapat dilakukan dengan bantuan SPSS.
7. Menentukan validitas secara diskriminan.
Hasil klasifikasi dapat didasarkan pada analisis sampel ataupun validitas sampel
dapat dilakukan dengan cara sebagai berikut:
a. Menghitung diskriminan skor
Setelah dibenuk fungsi linier, maka dapat dihitung skor diskriminan untuk tiap
pobservasi dengan memasukkan nilai-nilai variable penjelasnya.
b. Menghitung cutting score
Cutting skore (m) dapat dihitung dengan rumus sebagai berikut:
N A ZB+ N B Z A
Z ce=
NANB
Keterangan:
Z ce: Cutting skor
N A : Jumlah anggota grup A

N B : Jumlah anggota grup B

Z A : centroid grup A

Z B:centroid grup B

Kemudian nilai-nilai diskriminan skore tiap observasi akan dibandingkan dengan cutting
skore, sehingga dapat diklasifikasikan suatu observasi akan termaksud kedalam kelompok yang
sama. Suatu observasi dengan karakteristik x akan diklasifikasikan sebagai anggota kelompok
kode 1 jika:

−1
D=| μ1−μ2|∑ X ≥ Z ce

Selain itu dimasukkan kedalam kelompok 2. Perhitungan Zce dapat dilakukan


menggunakan SPSS yaitu dengan bantuan table Function at group centroids dari
output Spss.
c. Akurasi statistic
Klasifikasi yang dilakukan dengan fungsi diskriminan dapat diuji keakuratannya
dengan menggunakan Press Q Statistic. Ukuran sederhana ini membandingkan
jumlah kasus yang diklasifikasikan secara tepat dengan ukuran sampel dan jumlah
grup. Nilai yang diperoleh dari perhitungan kemudian dibandingkan dengan nilai
kritis. Press Q Statistic dapat dituliskan dengan rumus:
2
' |N− ( nK )|
Pres s sQ=
N ( K−1 )
Keterangan:
N: ukuran sampel
n: jumlah kasus yang diklasifikasi secar tepat
K: jumlah grup

2.5. Contoh Kasus Analisis Diskriminan

Seorang peneliti menggunakan analisis diskriminan untuk mendapatkan fungsi guna


menduga frekuensi liburan keluarga (Y), dimana variable Y terdiri dari 3 kategori, yakni Y=1
untuk
frekuensi liburan rendah, Y=2 untuk frekuensi liburan sedang, Y=3 untuk frekuensi liburan
tinggi. Variabel yang digunakan sebagai penduga Y adalah :
X1= pendapatan keluarga per bulan (juta rupiah)
X2= sikap terhadap perjalanan (skala 1-7, dari sangat negatif sampai sangat positif)

X3= tingkat kepentingan liburan keluarga (skala 1-7, dari sangat tidak penting sampai sangat

penting)

X4= jumlah anggota keluarga

X5=umur kepala keluarga

Adapun data sebagai berikut :

Y X1 X2 X3 X4 X5
1 1.5 1 1 6 25
1 2 1 1 7 30
1 1.17 1 1 8 55
1 3.5 2 1 9 60
1 1.25 2 1 5 30
2 5.3 3 3 3 32
2 6.5 3 4 4 31
2 4.7 4 4 4 45
2 4.65 4 3 5 42
2 3.75 5 4 5 41
3 10 7 7 2 43
3 15 6 7 1 45
3 13 7 6 3 29
3 14 6 6 2 28
3 8 7 6 2 26
1 1.5 1 1 10 23
1 2.3 2 1 7 24
1 3.1 1 2 8 32
1 1.4 1 2 9 34
1 0.75 2 2 6 47
2 3.2 3 4 4 49
2 4.5 4 4 5 50
2 6.1 6 4 4 36
2 4.3 4 5 5 31
2 3.8 4 5 5 39
3 11 7 7 2 35
3 12 5 7 3 42
3 12.5 7 6 2 43
3 13.7 6 6 3 44
3 19 6 7 1 45

Berikut Langkah-langkah dalam analisis diskriminan:

1. Masukkan data yang akan diolah. seperti pada gambar di bawah.


2. Pada menu Analyze, pilih submenu Classsify, lalu pilih Discriminant. Pada kotak dialog
Discriminant Analysis, pindahkan Nakal_Rev2 ke dalam Grouping Variable, lalu klik Define
Range.
3. Lalu pada kotak kecil, bagian minimum diisi dengan kode terkecil dan maximum diisi dengan
kode terbesar dari variabel respon, pada contoh kasus disini,masukkan angka “1” untuk
minimum dan “2” untuk maximum. Kemudian klik Continue.

4. Kembali ke kotak dialog Discriminant Analysis, lalu pada Independents diisi dengan variabel
penjelas. Metode yang sering dipaparkan pada literatur-literatur adalah metode bertatar
(stepwise), maka kali ini hanya akan diberi contoh penggunaan metode ini. Pada contoh kasus di
sini, variabel independents adalah variabel yang tersisa tadi. Kemudian pindahkan variable yang
tersisa ke dalam Independents.lalu, pilih dan klik Statistics.

5. Pada kotak kecil, centangkan kotak means, univariate ANOVA’s, Box’s M, serta
Unstandardized. Lalu, Continue.
6. Kembali ke kotak dialog Discriminant Analysis, lalu pada Classification, lalu diberi tanda cek
di All group equal, Casewise result, Summary table, dan Within-groups. Lalu, klik Continue.

Interpretasi Hasil Analisis Diskriminan

Uji Kesamaan matriks ragam-peragam antar kelompok Pada kasus ini, kita menguji asumsi
kesamaan matrik ragam-peragam antara kelompok Y ke atas dan Y digunakan statistic uji Box’s
M.
Hasil Uji Signifikasi Model Deskriminan
Tersaji di bagian wilks’ lambda, tampak bahwa fungsi diskriminan 1 hingga 2 diperoleh
nilai sig 0.000 karena sig<5% maka disimpulkan fungsi diskriminan 1 hingga 2 signifikan pada
taraf nyata 5%. Sedangkan untuk uji signifikasi diskriminan 2 diperoleh nilai sig sebesar 0,019.
Karena sig<5% maka dapat disimpulkan fungsi diskriminan 2 juga signifikan untuk memisahkan
ke tiga grup pada taraf nyata 5%. Proses di uraikan sebagai berikut :

HIPOTESIS :
Ho : Fungsi diskriminan tidak signifikan
H1 : Fungsi diskriminan signifikan

STATISTIK UJI
fungsi diskriminan 1 hingga 2 :
Wilks’ Lambda = = 0,016
Chi-Square = -[(n-1)-( )][ln ]=103,151
Statistik Chi-Square menyebar dengan derajat bebas fungsi diskriminan 1 hingga 2 (pr+1)
(G-r)=10 dari tabel diperoleh nilai (df=10)5%=18,307. Nilai Sig dihitung dari
Sig=peluang( df=10>103,151)=0,000. Karena Sig<5% atau Chi-Square> (df=10)5% maka
disimpulkan tolak Ho pada taraf nyata 5%.

STATISTIK UJI
fungsi diskriminan 2 :
Wilks’ Lambda = = 0,623
Chi-Square = -[(n-1)-( )][ln ]= 11,846
Statistik Chi-Square menyebar dengan derajat bebas fungsi diskriminan 2 (p-r+1)(G-r)=4
dari tabel diperoleh nilai (df=4)5%=9,488. Nilai Sig dihitung darii Sig=peluang(
df=4>103,151)=0,000. Karena Sig<5% atau Chi-Square> (df=4)5% maka disimpulkan tolak
Ho pada taraf nyata 5%.

Hasil Uji Signifikasi Variabel Independen


Tersaji di bagian Test Of Equality of Group Means, tampak bahwa nilai Sig untuk
variabel X1,X2, X3 dan X4 kurang dari 5%, sehingga dapat disimpulkan variabel X1, X2, X3,
dan X4
signifikan dalam mendeskriminasi frekuensi liburan keluarga pada taraf nyata 5%. Sementara
variabel X5 tidak signifikan.

 Uji X1
Hipotesis
Ho : Variabel 1 tidak berpengaruh signifikan terhadap frekuensi liburan keluarga
H1 : Variabel 1 berpengaruh signifikan terhadap frekuensi liburan keluarga
Statistic uji:
Wilks’ Lambda = = 0,130
F = = 90,203
Statistik F menyebar mengikuti sebaran F dengan derajat bebas V1=2 V2=27. Pada tabel F
diperoleh nilai F (V1=2 V2=27)5% = 3,35. Pada output diperoleh nilai Sig, dimana sig=peluang
(F(v2,v2=27) > 90,203)=0,000. Karena Sig,5% atau F> Ftabel maka disimpulkan tolak Ho pada
taraf nyata 5%.
·
 Uji X2
Hipotesis :
Ho : Variabel 1 tidak berpengaruh signifikan terhadap frekuensi liburan keluarga
H1 : Variabel 1 berpengaruh signifikan terhadap frekuensi liburan keluarga

Statistic Uji:
Wilks’ Lambda = = 0,106
F = = 114,081
Statistik F menyebar mengikuti sebaran F dengan derajat bebas V1=2 V2=27. Pada tabel F
diperoleh nilai F (V1=2 V2=27)5% = 3,35. Pada output diperoleh nilai Sig, dimana sig=peluang
(F(v1=2,v2=27) >114,081
)=0,000. Karena Sig,5% atau F> Ttabel maka disimpulkan tolak Ho pada taraf nyata 5%.

 Uji X3
Hipotesis :
Ho : Variabel 1 tidak berpengaruh signifikan terhadap frekuensi liburan keluarga
H1 : Variabel 1 berpengaruh signifikan terhadap frekuensi liburan keluarga
Statistik Uji :
Wilks’ Lambda = =0,060
F = = 212,337
Statistik F menyebar mengikuti sebaran F dengan derajat bebas V1=2 V2=27. Pada tabel F
diperoleh nilai F (V1=2 V2=27)5% = 3,35. Pada output diperoleh nilai Sig, dimana sig=peluang
(F(v1=2,v2=27) >212,337)=0,000. Karena Sig 5% atau F> Ttabel maka disimpulkan tolak Ho
pada taraf nyata 5%.

 Uji X4
Hipotesis :
Ho : Variabel 1 tidak berpengaruh signifikan terhadap frekuensi liburan keluarga
H1 : Variabel 1 berpengaruh signifikan terhadap frekuensi liburan keluarga
Statistik uji :
Wilks’ Lambda = = 0,178
F = = 62,349 Statistik F menyebar mengikuti sebaran F dengan derajat bebas V1=2 V2=27.
Pada tabel F diperoleh nilai F (V1=2 V2=27)5% = 3,35. Pada output diperoleh nilai Sig, dimana
sig=peluang (F(v1=2,v2=27) >62,349)=0,000. Karena Sig 5% atau F> Ttabel maka disimpulkan
tolak Ho pada taraf nyata 5%.

Anda mungkin juga menyukai