Anda di halaman 1dari 39

DISCRIMINANT ANALYSIS

KONSEP DASAR
Merupakan

teknik analisis data jika kriteria atau variabel dependen menggunakan data nominal, sedangkan variabel independen menggunakan data interval/rasio. Analisis diskriminan bertujuan untuk mengklasifikasikan suatu individu atau observasi ke dalam kelompok yang saling bebas (mutually exclusive/disjoint) dan menyeluruh (exhaustive ) berdasarkan sejumlah variabel independen.

KARAKTERISTIK

Merupakan teknik Multivariat yang termasuk Dependence Method, yakni adanya variabel dependen dan Independen. Data variabel dependen harus berupa data kategori (non metrik), sedangkan data variabel independen merupakan data interval atau rasio (metrik).

Karena

mirip dengan analisis regresi, analisis diskriminan memiliki 2 kegunaan:


Kemampuan memprediksi adanya variabel dependen dengan input data variabel independen. Kemampuan memilih mana di antara variabel-variabel independen yang berpengaruh terhadap variabel dependen dan yang tidak berpengaruh terhadap variabel dependen.

Teknik

analisis diskriminan ditentukan oleh jumlah kategori dalam variabel dependen. Jika variabel dependen memiliki 2 kategori, disebut two-group discriminant analysis. Sebaliknya jika variabel dependen memiliki 3 atau lebih kategori, dikenal dengan multiple discriminant analysis. Perbedaan utamanya adalah dalam two-group case, hanya dihasilkan satu fungsi diskriminan, sedangkan dalam MDA dapat dihasilkan lebih dari satu fungsi diskriminan.

Tujuan Analisis Diskriminan


Mengetahui

apakah terdapat perbedaan antar grup pada variabel dependen. Jika terdapat perbedaan, variabel independen manakah pada fungsi diskriminan yang membuat perbedaan tersebut. Membuat Fungsi atau Model Diskriminan. yaitu kombinasi linear variabel-variabel independen mampu membedakan paling baik di antara kategori dalam variabel dependen (grup).

Melakukan

klasifikasi terhadap objek, yaitu apakah suatu objek termasuk dalam suatu grup tertentu. Untuk itu, sampel penelitian harus merupakan sampel independen. Menentukan mana di antara variabel-variabel independen yang memiliki kontribusi paling besar dalam perbedaaan di antara grup. Mengevaluasi ketepatan klasifikasi yang dihasilkan fungsi diskriminan.

Proses Dasar Analisis Diskriminan


Memisah

variabel-variabel menjadi Variabel Dependen dan Variabel Independen. Menentukan metode untuk membuat Fungsi Diskriminan:
SIMULTANEUS ESTIMATION STEP-WISE ESTIMATION
Menguji

signifikansi dari Fungsi Diskriminan yang telah terbentuk dengan menggunakan Wilks Lambda, Pilai, dan F test.

Proses Dasar Analisis Diskriminan Lanjutan


Menguji

ketepatan klasifikasi dari Fungsi Diskriminan. Melakukan interpretasi terhadap Fungsi Diskriminan Melakukan uji validasi Fungsi Diskriminan

Jumlah Sampel Penelitian


Sampel ideal pada Analisis Diskriminan adalah 5 20 data untuk setiap variabel independen. Contohnya jika dalam model analisis digunakan 5 variabel independen, jumlah sampel minimum adalah 5 x 5 = 25 data. Sampel penelitian sebaiknya dibagi menjadi dua, yaitu analysis sample dan holdout sample. Pemisahan ini diperlukan untuk proses validasi silang dari Fungsi Diskriminan.

ASUMSI ANALISIS DISKRIMINAN


Data

variabel independen harus berdistribusi normal. Matriks kovarians dari semua variabel independen seharusnya sama. Tidak ada korelasi antara variabel independen (multikoliniearitas). Tidak ada data yang sangat ekstrim (outlier) pada variabel independen.

MODEL ANALISIS DISKRIMINAN


Model analisis diskriminan dapat dinyatakan sbb: D = b0 + b1X1 + b2X2 + . + bkXk Keterangan: D = skor diskriminan b = koefisien diskriminan X = variabel independen

TAHAP-TAHAP PENGUJIAN PADA ANALISIS DISKRIMINAN


1.

2. 3. 4.

Menilai variabel independen yang layak untuk analisis. Melakukan proses Diskriminan. Menganalisis Output Diskriminan. Membuat simpulan berdasarkan Output Diskriminan di atas.

Menilai variabel independen yang layak untuk analisis


Angka Wilks lambda. Angka ini berkisar antara 0 1. Jika angka mendekati 0, data tiap grup cenderung berbeda, sedangkan jika angka mendekati 1, data tiap grup cenderung sama. F test (ANOVA). Simpulan yang diambil berdasarkan angka Sig.

Jika Sig. > 0,05, berarti tidak ada perbedaan antar grup. Jika Sig. < 0,05, berarti ada perbedaan antar grup.

Jika ada suatu variabel independen memiliki angka Wilks Lamda mendekati 1 dan angka Sig. > 0,05, harus dikeluarkan dari model.

Pengujian Varians Setiap Variabel Independen


Pengujian

varians setiap variabel independen dilakukan dengan menggunakan Boxs M. Keputusan diambil berdasarkan angka Sig.
Jika Sig. > 0,05, berarti tidak ada perbedaan antar matriks kovarian grup. Jika Sig. < 0,05, berarti ada perbedaan matriks kovarian antar grup.
Jika

angka Sig. < 0,05, proses lanjutan seharusnya tidak bisa dilaksanakan.

ANALISIS DISKRIMINAN DUA FAKTOR Uji Variabel


Sebuah

perusahaan AMDK sedang melakukan penelitian dengan tujuan berikut ini:


Apakah terdapat perbedaan antara konsumen yang banyak minum AMDK dengan yang sedikit minum AMDK. Jika ada perbedaan, variabel apa saja yang membuat perilaku konsumsi air mineral mereka berbeda. Membuat model diskriminan. Menguji ketepatan model diskriminan.

Untuk

melakukan analisis diskriminan dengan tujuan penelitian di atas, bukalah file diskriminan. Dari menu Analyze, pilih submenu Classify, kemudian pilih Discriminant. Masukkan variabel minum ke bagian GROUPING VARIABLE. Hal ini berarti variabel minum merupakan variabel dependen dengan data kategorikal. Kemudian, buka icon Define Range. Masukkan angka 0 pada Minimum, sedangkan 1 pada Maximum.

Kemudian,

masukkan variabel-variabel independen yang terdiri atas usia, berat, tinggi, income, jamkerja, dan olahraga ke dalam bagian INDEPENDENT. Dalam icon STATISTICS, aktifkan pilihan univariate ANOVAS dan Boxs M. Tekan OK untuk proses uji variabel.

Output SPSS 1
Tests of Equality of Group Means

Wilks' Lambda
usia berat tinggi .945 .934 .946 .894 .999

F 4.247 5.173 4.186

df1 1 1 1 1 1

df2 73 73 73 73 73

Sig. .043 .026 .044 .004 .783

income
jamkerja olahraga

8.656
.076 4.183

.946

73

.044

Analisis
Angka

Wilks Lambda

Angka ini berkisar antara 0 s.d. 1. Jika angka mendekati 0, data setiap grup cenderung berbeda. Sebaliknya jika angka mendekati 1, data tiap grup cenderung sama. Hampir semua variabel memiliki angka Wilks Lambda yang besar. Artinya, data tiap grup cenderung sama.

Uji

Hasil uji F dapat dilihat dari angka Sig. Jika Sig. > 0,05, tidak ada perbedaan antar grup. Jika Sig. < 0,05, ada perbedaan antar grup. Semua variabel, kecuali jam kerja memiliki angka Sig < 0,05. Artinya, kelima variabel tersebut berbeda untuk dua grup diskriminan. Dengan demikian, jumlah konsumsi AMDK responden dipengaruhi oleh usia, BB, TB, tingkat penghasilan, dan kegiatan olahraga responden, sedangkan jam kerja reponden tidak memengaruhi jumlah konsumsi AMDK mereka sehingga variabel ini tidak lolos uji.

Test Results
Box's M F Approx. df1 28.145 1.222 21

df2
Sig. Tests null hypothesis of equal population covariance matrices.

19569.371
.220

Analisis
Analisis ANOVA dan angka Wilks Lambda menguji rerata dari setiap variabel, sedangkan Boxs M menguji varians dari setiap variabel. Analisis Diskriminan memiliki asumsi bahwa: Varians setiap variabel untuk tiap grup seharusnya sama. Varians di antara variabel-variabel bebas seharusnya juga sama.

Berdasarkan

kedua asumsi tersebut, seharusnya grup covariance matrices adalah relatif sama. HIPOTESIS:
H0: grup covariance matrices relatif sama H1: grup covariance matrices berbeda

Keputusan:
Jika Sig. > 0,05, H0 diterima Jika Sig. < 0,05, H0 ditolak

Angka

Sig. (0,22) > 0,05. Artinya grup covariance matrices adalah sama. Artinya, data di atas sudah memenuhi asumsi analisis diskriminan sehingga proses selanjutnya bisa dilanjutkan.

Uji kesamaan grup covariance matrices juga dapat dilakukan dengan melihat output Log Determinant di bawah ini.
Log Determinants
MINUM .00 sedikit 1.00 banyak Pooled within-groups Rank Log Determinant 14.085 14.258 14.556

6
6 6

The ranks and natural logarithms of determinants printed are those of the group covariance matrices.

Angka Log determinants untuk kategori sedikit (14,085) dan banyak (14,258) tidak berbeda sehingga grup covariance matrices akan relatif sama untuk kedua grup tersebut.

Jika

grup covariance matrices untuk kedua grup berbeda namun hanya ada dua kategori, proses selanjutnya tidak dapat dilanjutkan. Setelah dilakukan uji variabel, proses selanjutnya adalah melakukan pembuatan model diskriminan. Variabel-variabel yang dimasukkan dalam analisis adalah usia, BB, TB, tingkat penghasilan, dan kegiatan olahraga responden

Langkah-langkah
PROSES

DISKRIMINAN

Dari menu Analyze, pilih submenu Classify, kemudian Discriminant. Dalam isian Independent, keluarkan jamkerja. Klik icon Statistics dan aktifkan pilihan Means. Pada bagian Function Coefficients, aktifkan pilihan Fishers dan Unstandardized.

Aktifkan

pilihan Use stepwise method, kemudian klik icon Method dan pilih Mahalanobis distance. Pada bagian criteria, pilih Use Probability of F. Klik icon Classify. Pada bagian Display, aktifkan Casewise results dan Leave-one-out classification. Klik OK untuk menjalankan SPSS.

Analisis Output SPSS

Tabel Wilks Lambda Wilks Lambda adalah varians total dalam skor diskriminan yang tidak bisa dijelaskan oleh perbedaan di antara grup-grup yang ada. Pada step 1,angka Wilks Lambda adalah 0,894. Artinya, 89,4% varians tidak dapat dijelaskan oleh perbedaan antar grup-grup. Pada kolom F dan signifikansinya, diperoleh angka Sig. semuanya < 0,05. Artinya, ketiga variabel (income, berat, dan tinggi) berbeda untuk kedua grup.

Summary of Canonical Discriminant Function Tabel Eigenvalues


Canonical Correlation mengukur keeratan hubungan antara skor diskriminan dengan grup. Angka 0,49 menunjukkan keeratan yang cukup tinggi.

Tabel Wilks Lambda


Angka Chi-square sebesar 19,321 dengan nilai Sig. 0,00. Artinya, terdapat perbedaan yang jelas antar dua grup konsumen.

Tabel Structure Matrix


Menjelaskan korelasi antara variabel independen dengan fungsi diskriminan yang terbentuk. Variabel income paling erat hubungannya dengan fungsi diskriminan yang terbentuk.

Canonical Discriminant Function Coefficients


Menjelaskan koefisien-koefisien variabel independen yang dihasilkan.

Fungsi diskriminan yang terbentuk:


zScore = 7,884 + 0,064 Berat 0,93 Tinggi + 0,006 Income

Kegunaan fungsi di atas adalah untuk mengetahui sebuah case masuk pada grup yang mana. Function at Group Centroids
Centroids adalah rerata kelompok (group means). Kelompok minum banyak memiliki nilai Z=-0,557, sedangkan kelompok sedikit minum memiliki nilai Z=0,542. Angka dalam tabel menunjukkan besaran yang memisahkan kedua grup tersebut.

Prior Probabilities for Groups


Tabel tersebut menunjukkan komposisi responden yang dihasilkan oleh fungsi diskriminan. Sebanyak 37 responden termasuk dalam grup banyak minum, sedangkan sisanya ada di grup sedikit minum.

Classification Function Coefficients


Fungsi diskriminan Fisher digunakan untuk membuat persamaan regresi dengan pembagian berdasarkan kode grup. Fungsi diskriminan untuk kelompok sedikit minum zScore = -297,88 + 0,04 Berat + 3,59 Tinggi + 0,04 Income Fungsi diskriminan untuk kelompok banyak minum zScore = -306,56 - 0,04 Berat + 3,69 Tinggi + 0,03 Income

Casewise

Statistics

Tabel di atas digunakan untuk menguji apakah model


diskriminan yang terbentuk akan mengelompokkan dengan tepat seorang responden pada kategori minum banyak atau sedikit.

Contoh:

Responden 1 (0) memiliki data: Berat 65 kg; tinggi 154 cm; dan income Rp680 rb.
zScore = 7,89 + (0,06x65) (0,09x154) + (0,006x680)=1,57

Hasil skor tersebut dibandingkan dengan cut-off score untuk mengetahui apakah konsumen masuk grup sedikit atau banyak. Cut-off score dihitung dengan rumus:

N AZ B N B Z A ZCU N A NB

Keterangan:
Zcu = cut-off score NA dan NB = jumlah sampel setiap grup. ZA dan ZB = angka centroid setiap grup. A = grup sedikit minum B = grup banyak minum

Perhitungan:
Z CU 38 0,56 37 0,54 0,0148 75

Karena skor (-0,0148) sangat kecil, bisa dianggap 0.

Penggunaan angka ZCU

Angka skor kasus > ZCU, masuk ke grup sedikit (0). Angka skor kasus < ZCU, masuk ke grup banyak (1).

Contoh:

Kasus 1 mempunyai skor 1,57. Karena 1,57 > 0, masuk grup 0 (sedikit). Kasus 6 mempunyai skor -0,378. Karena -0,378 < 0, masuk grup 1 (banyak). Tanda ** berarti fungsi diskriminan tidak mampu mengelompokkan suatu kasus dengan tepat.

Classification

Results

Tabel ini menunjukkan seberapa jauh klasifikasi tersebut sudah tepat. Dengan kata lain, berapa % terjadi kesalahan klasifikasi pada proses klasifikasi kasus. Ketepatan prediksi dapat dihitung sbb:

27 24 0,68atau 68% 75

Simpulan

Terdapat perbedaan signifikan antara responden yang banyak minum AMDK dengan responden yang sidikit minum AMDK. Hal ini dibuktikan dengan hasil analisis Wilks Lamda. Variabel-variabel yang membuat beda adalah berat badan, tinggi badan, dan income. Model atau fungsi diskriminan yang dihasilkan adalah:
zScore = 7,884 + 0,064 Berat 0,93 Tinggi + 0,006 Income

Fungsi di atas mempunyai ketepatan mengklasifikasi kasus sebesar 68% sehingga dapat digunakan untuk mengklasifikasikan suatu kasus dengan cukup akurat.

Tugas Analisis Diskriminan

Manajemen HATCO ingin menguji apakah terdapat perbedaan antara konsumen yang menggunakan Use of specification buying dengan konsumen yang memilih Employs total value analysis. Jika berbeda, faktor-faktor apa saja (X1 s.d. X7) yang dapat membuat berbeda Specification buying mereka. Rumuskan permasalahan, tujuan penelitian, hipotesis penelitian, dan berdasarkan pengujian data apakah semua hipotesis diterima.