NIM : 16/403762/PPA/05279
Tugas: Analisis Multivariat
Diskriminasi dan klasifikasi adalah teknik multivariat yang berkaitan dengan pemisahan
kumpulan objek yang berbeda (atau Observasi) dengan mengalokasikan objek baru
(pengamatan) ke kelompok yang didefinisikan secara normal. Analisis diskriminatif agak
eksploratif. Sebagai prosedur pemisahan, sering dipekerjakan satu kali untuk menyelidiki
perbedaan yang diamati saat hubungan kausal tidak dipahami dengan baik. Prosedur
klasifikasi kurang eksploratif dalam arti bahwa mereka mengarah pada aturan yang
didefinisikan dengan baik, yang dapat digunakan untuk menugaskan objek baru. Klasifikasi
biasanya membutuhkan lebih banyak struktur masalah daripada diskriminasi
ANALISIS DISKRIMINAN
Analisis diskriminan adalah suatu teknik statistik yang digunakan untuk
meprediksikan probabilitas obyek-obyek yang menjadi milik dua atau lebih kategori
yang benar-benar
1. Model analisis diskriminan
Model dasar analisis diskriminan mirip regresi berganda. Perbedaannnya adalah
variabel dependen regresi berganda dilambangkan dengan Y, maka dalam analisis
diskriminan dilambangkan dengan D.
Model analisis diskriminan adalah sebuah persamaan yang menunjukkan suatu
kombinasi linier dari berbaai variabel independden yaitu:
Dengan:
Yang diestimasi adalah koefisien bk , sehingga nilai D setiap grup sedapat mungkin
berbeda. Ini terjadi pada saat rasio jumlah kuadrat antargrup (between-group sum of squares)
terhadap jumlah kuadrat dalam grup (within-group sum of square) untuk skor diskriminan
mencapai maksimum. Berdasarkan nilai D itulah keanggotaan sesorang diprediksi.
Analisis Diskriminan untuk Kasus 2 Populasi
Diasumsikan bahwa kedua populasi yang dibandingkan ini mempunyai matriks
kovariansi yang sama ( , dan masing-masing secara berturut-turut
menyatakan vector mean dari populasi ke-1 dan populasi ke-2. Kita mempunyai sampel
dan dari dua populasi. Biasanya tiap vektor terdiri dari
p variable. Fungsi diskriminannya adalah kombinasi linear dari p variabel yang
memaksimumkan jarak antara vektor mean dari kedua grup (populasi), yaitu
dengan Karena dan diketahui, maka diestimasi
dengan menggunakan rata-rata dan variansi sampel gabungan. Jadi fungsi diskriminasi
linear Fisher untuk sampel adalah :
Contoh 1:
Empat tes psikologi dilakukan pada 32 pria dan 32 wanita. Data yang diambil terdiri dari
empat variabel
Penyelesaian :
[ ], [ ]
[ ] , [ ]
[ ]
[ ]
[ ]
Aspek deskriptif dari analisis diskriminan, dimana pemisahan kelompok dicirikan dengan
cara fungsi diskriminan, dibahas pada Bagian A. Alokasi pengamatan terhadap kelompok
merupakan aspek prediktif dari analsis diskriminan. Kami lebih suka menyebutnya sebagai
analisa klasifikasi agar dapat secara jelas membedakannya dari aspek deskriptif. Namun,
klasifikasi sering disebut hanya sebagai analisis diskriminan.
Di bidang teknik dan ilmu komputer, klasifikasi biasanya disebut pola rekognitif. Beberapa
penulis menggunakan istilah analisis klasifikasi untuk menggambarkan analisis cluster, di
mana pengamatan dikelompokkan menurut nilai variabel dibandingkan ke dalam kelompok
yang telah ditentukan.
Dalam klasifikasi, unit sampling (subjek atau objek) yang keanggotaan kelompoknya tidak
diketahui ditempatkan ke dalam kelompok berdasarkan vektor nilai terukur , dan terkait
dengan unit tersebut. Untuk mengklasifikasikan unit, kita harus sebelumnya telah
memperoleh sampel vektor pengamatan dari masing-masing kelompok. Maka salah satu
pendekatan adalah untuk membandingkan y dengan vektor mean dari sampel
dan menentukan unitnya ke kelompok paling dekat dengan .
karena definit positif sehingga selalu lebih besar dari .
Contoh 2 :
, dan
[ ]
[ ] .[ ]
[ ] .[ ]
Titik tengahnya
Dengan demikian, jika ada sampel pengamatan baru (y), maka y akan masuk ke (grup
pria) ketika dan y akan masuk ke (grup wanita) ketika
.
Berdasarkan uraian di atas, dapat dikatakan bahwa analisis diskriminan lebih bersifat
eksploratory karena pada analisis diskriminan kita mencoba untuk membuat suatu fungsi
diskriminan yang dapat digunakan untuk mengidentifikasi hubungan antara variabel indikator
dalam membentuk sebuah grup (populasi). Sedangkan analisis klasifikasi lebih bersifat
konfirmatory, karena pada analisis klasifikasi, kita telah memiliki suatu teori pengukuran,
dalam hal ini teori/alatnya adalah fungsi diskriminan, yang mengatur hubungan antara
variabel-variabel pengamatan. Sehingga analisis klasifikasi dilakukan untuk memberikan
penegasan (konfirmasi) tentang keberadaan (posisi) suatu sampel pengamatan dalam suatu
grup (populasi), baik sampel pengamatan (objek) baru maupun sampel pengamatan
sebelumnya.
Referensi
Rencher, Alvin C., 2002, Methods of Multivariate Analysis Second Edition, Brigham
Tatham et al, 1998, Multivariate Data Analysis (fifth edition), Upper Saddle River,
http://www.jonathansarwono.info/mvariat/multivariat.htm