ANALISIS DISKRIMINAN
OLEH:
ZAENAL (1611140006)
JURUSAN MATEMATIKA
2018
1
KATA PENGANTAR
Assalamu’alaikum wr.wb
Segala puji dan syukur atas kehadirat Allah SWT atas segala nikmat dan
karunia-Nya sehingga kami dapat menyelesaikan makalah ini dan disusun sebagai
salah satu syarat untuk memperoleh nilai pada mata kuliah Statistika Multivariat.
Wassalamu’alaikum wr.wb
Penyusun
2
DAFTAR ISI
HALAMAN JUDUL i
KATA PENGANTAR ii
BAB I PENDAHULUAN 1
A. Latar Belakang 1
B. Rumusan Masalah 2
C. Tujuan Penulisan 2
BAB II PEMBAHASAN 3
DAFTAR PUSTAKA 36
3
BAB I
PENDAHULUAN
A. Latar Belakang
1
dan metode diskriminan dengan lebih dari dua kategori (Multiple
Discriminant Analysis).
B. Rumusan Masalah
Berdasarkan latar belakang, diperoleh rumusan masalah yaitu:
1. Apa yang dimaksud dengan analisis diskriminan?
2. Apa tujuan analisis diskriminan?
3. Apa asumsi yang harus dipenuhi di dalam analisis diskriminan?
4. Bagaimana langkah-langkah dalam melakukan analisis diskriminan?
C. Tujuan Penulisan
Berdasarkan rumusan masalah yang diperoleh, tujuan penulisan yaitu:
1. Untuk mengetahui definisi analisis diskriminan.
2. Untuk mengetahui tujuan analisis diskriminan.
3. Untuk mengetahui asumsi yang harus dipenuhi di dalam analisis
diskriminan.
4. Untuk mengetahui langkah-langkah analisis diskriminan.
BAB II
PEMBAHASAN
2
1. Definisi Analisis Diskriminan
Ide dasar dari analisis diskriminan sama dengan analisis regresi logistik.
Pada awalnya analisis diskriminan dikembangkan untuk menganalisis variabel
dependen yang bersifat non metrik atau non numerik dengan dua atau lebih
kategori.
Sebagai moteode untuk membedakan objek menjadi dua atau lebih grup,
maka analisis diskriminan dapat dihitung dengan memberi timbangan kepada
setiap variabel independen agar bisa memaksimalkan perbedaan antara grup
yang ada. Formula persamaan analisis diskriminan ini seperti halnya regresi
dapat ditulis dalam bentuk fungsi diskriminan sebagai berikut:
Dimana :
D = Nilai diskriminan
a = intersep
3
adalah sama atau tidak. Rata-rata grup yang diperoleh dari menghitung rata-
rata skor diskriminan disebut centroid atau rata-rata skor diskriminan.
Centroid menunjukkan pusat lokasi dari setiap anggota grup. Sedangkan
perbandingan group centroid menunjukkan seberapa jauh grup di dalam fungsi
diskriminan.
4
c) Tidak ada data yang sangat ekstrim (outlier) pada variabel independen,
jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat
berkurangnya ketepatan klasifikasi dari fungsi diskriminan.
d) Tidak ada korelasi yang kuat antar-variabel independen, jika dua variabel
independen mempunyai korelasi yang kuat, dikatakan terjadi
multikolinieritas. Untuk mengetahui adanya multikolinieritas dapat
dilakukan dengan melihat korelasi antar variabel independen (r) yaitu jika
nilai r > 0.6 menunjukkan adanya multikolinieritas.
dimana :
di2 adalah dengan mencari nilai jarak kuadrat untuk setiap pengamatan ke-i
Kemudian di2 diurutkan dari yang paling kecil ke yang paling besar,
selanjutnya dibuat plot di2 dimana i = urutan = 1, 2, ..., n . Bila hasil plot
dapat didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah
ganda menyebar normal.
5
H0 : ∑1 = ∑2 =...=∑k = ∑, matriks varians kovarians kelompok adalah
relatif sama.
1
X2hit ≤ X2α; 2 (k-1)p (p+1)
dengan :
[ ]
k k
1 1
X 2
hit = -2(1-C1) ∑
2 i=1
V i ln |Si|− ln |S|∑ V i
2 i=1
i = 1,2, ... , k
dengan
V i = ni – 1
∑ V iS i
i=1
S= k
∑ Vi
i=1
[ ] [ ]
k 2
C1 =
∑ V1 − k
1 2 p + 3 p−1
6( p+ 1)( k−1)
i=1 i
∑ Vi
i=1
6
4. Langkah-langkah Analisis Diskriminan
7
2
Jika V > X p (k−1)(1−α ) maka H0 ditolak
Bila dari hasil pengujian ada perbedaan vektor nilai rataan, maka
fungsi diskriminan layak disusun untuk mengkaji hubungan antar
kelompok serta berguna untuk mengelompokkan suatu objek ke salah
satu kelompok tersebut. Diharapkan dalam uji ini adalah hipotesis nol
ditolak, sehingga kita mempunyai informasi awal bahwa variabel yang
sedang diteliti memang membedakan kedua kelompok.
∏ |S j|( n −1 )/ 2
j
¿ j=1
λ= (n−k)/2
|W /(n−k)|
Dimana:
k = banyaknya kelompok
W/(n-k) = matriks ragam-peragam dalam kelompok gabungan
Sj = matriks ragam-peragam kelompok ke-j
¿
−2 ln λ
Bila H 0 diterima, maka ( ) akan mengikuti sebaran F
b
denganderajat bebas V1 dan V2 pada taraf signifikan α, dimana:
1
v 1= ()
2
( k−1 ) p ( p+ 1 )
v 2= ( v 1 +2 ) ( a 2−a21 )
v1
b=v 1 /(1−a1− )
v2
[∑ ]
k
2 p 3+ 3 p−1 1 1
a1= −
6 (k−1)( p+1) j=1 (n j −1) (n−k )
8
n
1
1
(¿¿ j−1)2 −
(n−k )2
k
∑¿
j=1
( p−1)( p+2)
a 2= ¿
6 (k +1)
p = jumlah peubah pembeda dalam fungsi diskriminan
Hipotesis :
H 0 : matriks kovarians grup adalah sama
H 1 : matriks kovarins grup adalah berbeda secara nyata
¿
−2 ln λ
Jika ( ) ¿ F v 1, v 2, α berarti H 0 diterima
b
¿
−2 ln λ
Jika ( ) ≤ F v 1, v 2, α berarti H 1 diterima
b
Sama tidaknya grup kovarians matriks juga bisa dilihat dari tabel
output Log Determinant pada software SPSS. Jika dalam pengujian ini
H 0 ditolak maka proses lanjutan seharusnya tidak bisa dilakukan.
H0 : μ0=μ1 =μ 2=…=μk
9
Dimana :
λi = 1/(1+ej)
X= [ ]
X1
X2
[ ]
X 11k ⋯ X 1 pk
Xk = ⋮ ⋱ ⋮
Xn1k ⋯ X npk
i = 1,2,...,n
j = 1,2,...,p
k = 1,2
10
Di bawah asumsi Xk ~ N( μk , ∑k )
μ=
[ ] []
E(X 1 )
E(X 2 )
=
μ1
μ2
dan ∑k = E( X k −μk ) ( X k −μ k ) ' ; ∑1 = ∑2
=...= ∑
[]
μ1k
μk = ⋮ ; μk adalah vektor rata-rata tiap variabel X pada
μ pk
kelompok ke-k.
[ ]
σ 11 σ 12 ⋯ σ 1 p
∑= ⋮ σ 22 ⋯ σ 2 p
⋮ ⋮ ⋯ ⋮
… ⋯ ⋯ σ pp
11
( λ ' δ )2
Jika ( μ1−μ2 ) =δ , maka persamaan di atas menjadi .
λ' ∑ λ
Karena ∑ adalah matriks definit positif, maka menurut teori
( λ ' δ )2
pertidaksamaan Cauchy-Schwartz, rasio dapat
λ' ∑ λ
dimaksimumkan jika
−1 −1
λ =c ∑ δ = c ∑ ( μ1 −μ 2 )
'
❑ ❑
n1 μ 1Y +n2 μ2 Y
m=
n1 +n2
12
Kemudian nilai-nilai discriminant score tiap observasi akan
dibandingkan dengan cutting score, sehingga dapat diklasifikasikan
suatu observasi akan termasuk ke dalam kelompok yang mana. Suatu
observasi dengan karakteristik x akan diklasifikasikan sebagai anggota
−1
kelompok kode 1 jika y=( μ 1−μ2 ) ' ∑ X ≥ m , selain itu
❑
13
Usia konsumen (tahun)
Berat badan konsumen (kilogram)
Tinggi badan konsumen (sentimeter)
Pendapatan konsumen (rupiah/bulan)
Jam kerja konsumen dalam sehari (jam)
Kegiatan olahraga konsumen dalam sehari (jam)
14
Kemudian masukkan data-data setiap variable pada data view seperti
gambar di atas.
2. Uji asumsi
a) Uji normalitas multivariat variabel independen
Uji normalitas multivariat dengan SPSS dilakukan dengan
menentukan jarak mahalanobis dari data yang kita miliki
kemudian menghitung nilai Chi squarenya. Setelah itu kita
buat scatter-plot antara keduanya.
Klik menu Analyze lalu pilih Regression lalu klik Linear.
Langkah ini dilakukan untuk menentukan jarak mahalanobis
dari data yang kita miliki.
15
Pada kotak dialog yang muncul isikan variabel X1, X2, X3, X4,
X5, X6 di kolom Independent(s), lalu masukkan juga variabel Y di
kolom Dependent. Selanjutnya silahkan klik Save.
16
Jika langkah anda benar maka akan muncul kotak dialog sebagai
berikut:
17
setelah diperoleh jarak mahalanobis yang tersaji pada variabel
MAH_1 kita perlu mengurutkan data jarak mahalanobis tersebut.
Untuk mengurutkan data jarak mahalanobis, klik
menu Data kemudian pilih Sort Cases seperti ditunjukkan pada
gambar.
18
Data pada variabel MAH_1 sekarang sudah terurut dari kecil ke
besar. Selanjutnya, buatlah variabel baru bernama “J” kemudian
isikan data berupa angka urut dari 1, 2, 3, dan seterusnya hingga
sejumlah data.
19
Jika langkah anda benar maka akan muncul data nilai probabilitas
pada variabel prob_value yang berada di sebelah kanan variabel J.
20
Variable yang merupakan simbol dari nilai chi square. Pada kolom
Numeric Expression isikan fungsi IDF.CHISQ diikuti variabel
Prob_value dan df atau derajat kebebasan, dalam hal ini 6 karena
ada 6 variabel bebas yang kita uji.
21
jendela pilihan type scatter-nya, pilih simple scatter. Selanjutnya
klik Define maka akan muncul jendela Simple Scatterplot.
Masukkan variabel Mahalanobis Distance (MAH_1) ke Y Axis dan
variabel qi ke X Axis. Kemudian klik OK
Hasil :
22
Setelah itu, masukkan variable Y ke dalam Grouping Variable,
lalu klik define range. Bagian minimum diisi kode terkecil,
dalam kasus ini adalah 0 dan maksimum diisi kode terbesar
yaitu 1. Pindahkan juga variable X1, X2, X3, X4, X5. X6 ke
dalam kotak Independents, lalu pilih use stepwise method.
Selanjutnya klik Statistics, pada Desciptive centang Box’s M
23
Hasil :
24
diterima). Dengan demikian, asumsi matriks varians kovarians
grup sama terpenuhi.
Hasil :
25
terjadi bila nilai akar ciri (eigen value) mendekati 0 (nol).
Berdasarkan hasil pengolahan data didapatkan nilai akar ciri
yang menjauhi nol, yaitu sebesar 0,511. Dapat dilihat bahwa
variabel pendapatan (X4) dengan usia (X1) memiliki korelasi
sebesar 0,895. Hal ini menunjukkan bahwa antara variabel
pendapatan dengan usia memiliki korelasi tetapi tidak kuat.
Pada tabel Eigen Value terdapat pula nilai canonical
correlation. Canonical correlation digunakan untuk mengukur
derajat hubungan antara besarnya variabilitas yang mampu
diterangkan oleh variabel independen terhadap variabel
dependen. Dari tabel di atas, diperoleh nilai canonical
correlation sebesar 0,581, bila dikuadratkan menjadi (0,581 x
0,581) =0,3375; artinya 33,75% varians dari variabel dependen
dapat dijelaskan dari model diskriminan yang terbentuk.
26
Kembali ke kotak dialog Discriminant Analysis, lalu
pada Classification, lalu diberi tanda cek di All group equal, Casewise
result, Summary table, dan Within-groups. Lalu klik Continue.
Hasil :
1) Uji Kesamaan matriks varians kovarians antar kelompok
(sudah dijelaskan pada bagian uji asumsi)
2) Pengecekan multikolinieritas (sudah dijelaskan pada bagian uji
asumsi)
3) Uji vektor rata-rata antar kelompok
27
Pada table Test of Equality of Group Means dapat dilihat bahwa
variabel usia, tinggi, jam kerja, dan olahraga memiliki
signifikansi yang besar dari alpha (p-value > 0,05), dan hanya
ada satu variabel yang nilai signifikansi lebih kecil dari alpha
(p-value < 0.05). Meskipun variabel pendapatan nilai
signifikansinya yaitu 0.036 kecil dari alpha, tetapi variabel
pendapatan memiliki korelasi dengan variabel usia sehingga
variabel pendapatan akan dikeluarkan dari daftar variabel yang
akan disertakan pada analisis diskriminan. Hal ini
menunjukkan bahwa hanya ada satu variabel yang membuat
dua kelompok berbeda secara signifikan. Lima variabel yang
tidak signifikan akan dikeluarkan dari daftar variabel yang akan
disertakan pada analisis diskriminan.
4) Stepwise statistics
28
air mineral dengan kelompok yang sering minum air mineral
karena nilai signifikansi yang kecil dari 0,05.
7) Hasil klasifikasi
29
Tabel menggambarkan crosstabulasi antara model awal dengan
pengklasifikasian model diskriminan. Terlihat ada 5 responden
yang salah klasifikasi, yaitu 4 responden yang awalnya ada
pada kelompok sedikit minunm air mineral kemudian
diprediksi masuk dalam kelompok banyak minum air mineral
dan 1 responden yang awalnya ada pada kelompok banyak
minum air mineral kemudian diprediksi masuk dalam
kelompok seikit minum air mineral. Secara keseluruhan model
diskriminan yang terbentuk mempunyai tingkat validasi 75%.
Y Lengkungan Diamete
r
1 2,95 6,63
1 2,53 7,79
1 3,57 5,65
1 3,16 5,47
2 2,58 4,46
2 2,16 6,22
2 3,27 3,52
30
Sebagai konsultan untuk pabrik, Anda mendapat tugas untuk mengatur
kriteria untuk mutu kendali otomatis. Kemudian Anda juga ditugaskan
untuk menguji kriteria yang telah diatur pada jenis cincin yang baru.
Terdapat cincin baru yang memiliki kelengkungan 2,81 dan diameter 5,46.
Masuk di kelompok manakah cincin baru tersebut?
X1 = lengkungan
X2 = diameter
Solusi:
31
X = variabel independen dari semua data
32
µi = rata-rata Xi
µ = vektor rata-rata dari seluruh kumpulan data, dalam kasus ini
μ=[ 2,88 5,676 ]
0
xi = data yang dikoreksi, yaitu fitur data untuk kelompok ke i.
Cara memperolehnya dengan mengurangkan xi dengan µ
T
( x 0i ) x 0i
= matriks kovarian kelompok ke i
c i=
ni
g
1
C ( r , s )= ∑ n c (r , s)
n i =1 i i
4 3
( 0,66 ) + ( 0,259 ) =0,206
7 7
4 3
(−0,192 )+ (−0,286 )=−0,233
7 7
33
4 3
( 1,349 ) + ( 2,142 )=1,689
7 7
Sehingga diperoleh
ni
setiap kelompok dibagi dengan total sampel, yaitu Pi =
N
Fungsi Diskriminan
34
Pada hasil di atas, jika kita memasukkan cincin baru yang memiliki
kelengkungan 2,81 dan diameter 5,46 maka akan masuk ke dalam
kelompok 2 yaitu kelompok yang tidak lulus atau tidak memenuhi
standar yang telah ditetapkan oleh pabrik.
DAFTAR PUSTAKA
35
Teknomo, Kardi. “Linear Discriminant Analysis Numerical Example”. Diakses 7
Oktober2018.https://people.revoledu.com/kardi/tutorial/LDA/Numerical
%20Example.html
36