ANALISIS DISKRIMINAN
sudah bisa dibedakan mana variabel terikat dan mana variabel bebas). Analisis
diskriminan digunakan pada kasus dimana variabel bebas berupa data metrik
(interval atau rasio) dan variabel terikat berupa data nonmetrik (nominal atau
ordinal). Analisis diskriminan adalah salah satu metode yang dapat digunakan
kelompok lain dalam suatu populasi. Analisis diskriminan juga dapat digunakan
menjadi dua, yaitu analisis diskriminan dua kelompok dan analisis diskriminan
berganda. Untuk analisis diskriminan dua kelompok, jika variabel terikat (Y)
lebih dari dua kelompok maka diperlukan fungsi diskriminan sebanyak (k-1)
untuk k kategori.
(berarti) dalam membedakan nilai rata-rata diskriminan dari dua atau lebih
kelompok.
𝑌 = 𝑏0 + 𝑏1 𝑋1 + 𝑏2 𝑋2 + ⋯ + 𝑏𝑘 𝑋𝑘 (3.1)
Keterangan:
Dalam suatu populasi yang terdiri dari dua kelompok dan sejumlah
observasi ni untuk setiap kelompok ke-i, ditentukan kombinasi linear dari variabel
bebas yang memisahkan kedalam dua kelompok. Kombinasi linear yang dapat
𝑎 ′ 𝐻𝑎
Dengan menggunakan persamaan 𝜆 = (3.3)
𝑎 ′ 𝐸𝑎
Di mana
2
′
𝐻= 𝑛𝑖 𝑥𝑖 − 𝑥 𝑥𝑖 − 𝑥 (3.4)
𝑖=1
2 𝑛
′
𝐸= 𝑥𝑖𝑗 − 𝑥𝑖 𝑥𝑖𝑗 − 𝑥𝑖 (3.5)
𝑖=1 𝑗 −𝑖
dan a adalah vektor koefisien, 𝒙𝒊 adalah vektor rata-rata kelompok ke-i, dan 𝒙
adalah vektor rata-rata keseluruhan dan n1, n2 adalah ukuran sampel dari
kelompok 1 dan 2.
𝑎′ 𝐻𝑎 = 𝜆𝑎′ 𝐸𝑎
𝑎′ 𝐻𝑎 − 𝜆𝐸𝑎 = 0 (3.6)
𝒂′ tidak dibolehkan nol karena (3.3) akan menjadi bentuk λ = 0/0 sehingga solusi
𝐸−1 ℎ − 𝜆𝐼 = 0 (3.7)
Metode Fisher ini tidak mengasumsikan data harus berdistribusi normal, tapi
dalam perhitungan salah satu syarat yang harus diperhatikan adalah data yang
37
digunakan harus memiliki matriks kovarians yang sama untuk setiap kelompok
gabungan dari populasi tersebut (overall mean), dan B0 menyatakan cross product
di antara kelompok:
ℎ ℎ
′
1
𝐵0 = 𝜇𝑖 − 𝜇 𝜇𝑖 − 𝜇 di mana 𝜇 = 𝜇𝑖 (3.8)
ℎ
𝑖=1 𝑖=1
𝑌 = 𝑎′ 𝑋 (3.9)
Kombinasi linear ini dari tiap kelompok populasi memiliki nilai harapan sebagai
berikut:
dan variansi
ℎ ℎ ℎ
1 1 1
𝜇𝑌 = 𝜇𝑖𝑌 = 𝑎′ 𝜇 𝑖 = 𝑎′ 𝜇𝑖 = 𝑎 ′ 𝜇 3.12
ℎ ℎ ℎ
𝑖=1 𝑖=1 𝑖=1
38
antara kelompok dari nilai relatif Y terhadap keseragaman dalam kelompok dari
2 ℎ ′
ℎ
𝑖=1 𝑎 ′ 𝜇𝑖 − 𝑎 ′ 𝜇 𝑎′ 𝑖=1 𝜇𝑖 − 𝜇 𝜇𝑖 − 𝜇 𝑎
= =
𝑎′ 𝑎 𝑎′ 𝑎
ℎ ℎ 𝑛𝑖
𝑖=1 𝑛𝑖 𝑥𝑖 𝑖=1 𝑗 =1 𝑥𝑖𝑗
𝑥= ℎ = ℎ (3.15)
𝑖=1 𝑛𝑖 𝑖=1 𝑛𝑖
ℎ
′
𝐵0 = 𝑥𝑖 − 𝑥 𝑥𝑖 − 𝑥 (3.16)
𝑖=1
39
ℎ ℎ 𝑛𝑖
′
𝑊= 𝑛𝑖 − 1 𝑆𝑖 = 𝑥𝑖𝑗 − 𝑥𝑖 𝑥𝑖𝑗 − 𝑥𝑖 (3.17)
𝑖=1 𝑖=1 𝑗 =1
matriks kovarians yang sama adalah Spooled. Selanjutnya dapat dinyatakan bahwa
𝑊
𝑛1 + 𝑛2 + ⋯ + 𝑛ℎ − ℎ
= 𝑆𝑝𝑜𝑜𝑙𝑒� 楲 (3.18)
𝑎′ 𝐵0 𝑎
kelompok, maka ditentukan vektor koefisien 𝑎 yang memaksimumkan
𝑎′ 𝑆𝑝𝑜𝑜𝑙𝑒𝑑 𝑎
𝑎′ 𝐵0 𝑎
dan memaksimumkan . Untuk mencari 𝑎 yang memaksimumkan kasus ini
𝑎′ 𝑊𝑎
dapat dinyatakan dalam bentuk vektor eigen 𝑒𝑖 , 𝑖 = 1,2, … , ℎ yang dapat dicari dari
bentuk 𝑊−1 𝐵0 . Vektor-vektor eigen ini bersesuaian dengan nilai eigen dari
𝑆−1
𝑝𝑜𝑜𝑙𝑒𝑑 𝐵0 𝑒 = 𝜆 𝑛1 + 𝑛2 + ⋯ + 𝑛ℎ − ℎ 𝑒 (3.19)
mana Xj adalah pengamatan yang ke-j dan S-1 adalah kebalikan matriks
ragam-peragam S.
j 1 2
besar, selanjutnya dibuat plot d 2j dengan nilai Chi-Kuadrat 2p
n
dimana j = urutan 1, 2, ..., n dan p = banyak peubah. Bila hasil plot dapat
didekati dengan garis lurus, maka dapat disimpulkan bahwa peubah ganda
menyebar normal.
berikut:
Perumusan hipotesis
H0 : Σ1 = Σ2
H1 : Σ1 ≠ Σ2
Statistik uji
Statitik uji yang digunakan untuk perhitungan adalah
𝑣1 /2 𝑣2 /2 𝑣𝑘 /2
𝑆1 𝑆2 … 𝑆𝑘
𝑀= (3.20)
𝑖 𝑣𝑝 𝑙 /2
𝑆𝑝𝑙
41
dengan
𝑘
𝑖=1 𝑣𝑖 𝑆𝑖
𝑆𝑝𝑙 = 𝑘 𝑣
dan 𝑣𝑖 = 𝑛𝑖 − 1
𝑖=1 𝑖
Jika 𝑐2 > 𝑐21 maka digunakan 𝐹 = −2𝑏1 ln 𝑀 yang didekati oleh 𝐹𝑎1,𝑎2 .
2𝑎 2 𝑏2 ln 𝑀
Jika 𝑐2 < 𝑐21 maka digunakan 𝐹 = yang didekati oleh 𝐹𝑎1,𝑎2 .
𝑎 1 1+2𝑏2 ln 𝑀
Kriteria Pengujian
Tolak H0 jika sign. < 0,05 , atau terima H0 jika sign. > 0,05.
Pengujian Hipotesis
antar kelompok)
Statistik Uji
𝑊
Λ= (3.21)
𝑊+𝐵
dengan:
𝑘 𝑛1
′
𝑊= 𝑋𝑖𝑗 − 𝑥𝑖 𝑋𝑖𝑗 − 𝑥𝑖
𝑖=1 𝑗 =1
𝑘
′
𝐵= 𝑛𝑖 𝑥𝑖 − 𝑥 𝑥𝑖 − 𝑥
𝑖=1
Kriteria Pengujian
Tolak H0 jika sign. < 0,05 , atau sebaliknya. Diharapkan dari uji ini adalah
H0 ditolak.
43
𝑋1
𝑋=
𝑋2
𝐸 𝑋1 𝜇1 ′
𝜇= = 𝜇 dan 𝐸𝑘 = 𝐸 𝑋𝑘 − 𝜇𝑘 𝑋𝑘 − 𝜇𝑘 ; Σ1 = Σ2 = Σ
𝐸 𝑋2 2
𝜇1𝑘
𝜇𝑘 = ⋮ ; 𝜇𝑘 adalah vektor rata-rata tiap variabel X pada kelompok ke-k
𝜇𝑝𝑘
𝜇𝑘𝑦 = 𝐸 𝑌𝑘 = 𝐸 𝜆′ 𝑋 = 𝜆′ 𝜇𝑘 ;
44
𝜇𝑘𝑦 adalah rata-rata Y yang diperoleh dari x yang termasuk dalam kelompok
ke-k, sedangkan 𝜎2𝑌 adalah varians Y dan diasumsikan sama untuk kedua
kelompok.
𝑌 = 𝜆′ 𝑋 = 𝜇1 − 𝜇2 Σ −1 𝑋 (3.24)
variabel bebasnya.
antar kelompok
kelompok
Kriteria pengujian: H0 ditolak jika nilai 𝜒ℎ𝑖𝑡𝑢𝑛𝑔 > 𝜒𝑡𝑎𝑏𝑒𝑙 atau sebaliknya.
Apparent Error Rate (APER). Prosedur ini berdasarkan dari matriks konfusi.
Tabel 3.1 Klasifikasi Actual Group (Kelompok pada Kenyataan) dan Predicted
Group (Kelompok yang Diprediksi)
Predicted Group
(Kelompok yang diprediksi)
π1 π2
46
Error Rate pada Actual Error Rate (AER) merupakan proporsi salah
𝑔 𝐻
𝑖=1 𝑛𝑖𝑀
𝐸 𝐴𝐸𝑅 = 𝑔 , 𝑖 = 1, 2, … , 𝑔 (3.25)
𝑖=1 𝑛𝑖
𝐻
Dimana 𝑛𝑖𝑀 adalah banyak observasi holdout yang salah pengelompokan
Error Rate pada Apparent Error Rate (APER) merupakan proporsi salah
kelompok ke-i.