K8 - Analisis Diskriminan

“ANALISIS DISKRIMINAN”
Disusun untuk Memenuhi Tugas Matakuliah Analisis Data Kuantitatif
Dosen Pengampu:
Dr. H. Karim, M.Si
Rzki Amalia, M.Pd.
Hj. Indah Budiarti, M.Pd.
Disusun Oleh:
Kelompok 8
Fahriza Muhaimin 1710118210011
Laila Mubarakah 1710118220014
Wafa Islamiyah 1710118220031
Zuraida Khatimah 1710118220033
PROGRAM STUDI PENDIDIKAN MATEMATIKA

JURUSAN PENDIDIKAN MATEMATIKA DAN IPA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMBUNG MANGKURAT
BANJARMASIN
2020
ANALISIS DISKRIMINAN
Analisis diskriminan adalah salah satu metode analisis multivariat yang

bertujuan untuk memisahkan beberapa kelompok data yang sudah terkelompokkan
dengan cara membentuk fungsi diskriminan (Johnson & Wichern 1998).
Tujuan analisis diskrimanan secara umum adalah sebagai berikut:
(1)Mengetahui apakah ada perbedaan yang jelas antara kelompok pada variabel
dependen. Bisa juga dikatakan untuk melihat perbedaan antara anggota grup 1
dengan grup 2.
(2)Jika ada perbedaan, untuk mengetahui variabel bebas mana yang membuat perbedaan
tersebut.
(3)Membuat fungsi atau model diskriminan yang pada dasarnya mirip dengan
persamaan regresi.
(4)Melakukan klasifikasi terhadap objek dan untuk mengetahui apakah suatu objek
termasuk pada grup 1 atau grup 2 atau lainnya.
Hal-hal Pokok Tentang Analisis Diskriminan

a. Langkah-langkah analisis pada analisis diskriminan:
 Memisah variabel menjadi Variabel Dependen dan Variabel Independen.
 Menentukan metode untuk membuat Fungsi Diskriminan. Pada prinsipnya ada dua
metode dasar untuk itu, yakni :
1. SIMULTANEOUS ESTIMATION, dimana semua variabel dimasukkan secara
bersama-sama kemudian dilakukan proses Diskriminan.
2. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu persatu ke dalam
model diskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada
model, dan ada kemungkinan satu atau lebih variabel independen yang
‘dibuang’ dari model.
 Menguji signifikansi dari Fungsi Diskriminan yang telah terbentuk, menggunakan
Wilk’s Lambda, Pilai, F test dan lainnya.
 Menguji ketepatan klasifikasi dari fungsi diskriminan, termasuk mengetahui
ketepatan klasifikasi secara individual dengan Casewise Diagnostics.
 Melakukan interpretasi terhadap Fungsi Diskriminan tersebut.
 Melakukan uji validasi Fungsi Diskriminan.
b. Jumlah Sampel pada Analisis Diskriminan
Secara pasti tidak ada jumlah sampel yang ideal pada Analisis Diskriminan.
Pedoman yang bersifat umum menyatakan untuk setiap variabel independen
sebaiknya ada 5 – 20 data (sampel). Dengan demikian, jika ada enam variabel
independen, seharusnya minimal ada 6 x 5 = 30 sampel. Secara terminologi SPSS,
jika ada enam kolom variabel independen, sebaiknya ada 30 baris data.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni
analysis sample yang digunakan untuk membuat Fungsi Diskriminan, serta Holdout
sample (spilt sample) yang digunakan untuk menguji hasil diskriminan.
c. Asumsi pada Analisis Diskriminan
Asumsi penting yang harus dipenuhi agar model diskriminan bisa digunakan adalah :
 Multivariate Normality, atau variabel independen seharusnya berdistribusi
normal. Jika data tidak berdistribusi normal, hal ini akan menyebabkan masalah
pada ketepatan fungsi (model) diskriminan. Regresi Logistik (Logistic
Regression) bisa dijadikan alternatif metode jika memang data tidak berdistribusi
normal.
 Matriks Kovarians dari semua variabel independen seharusnya sama (equal).
 Tidak ada korelasi antar-variabel independen. Jika dua variabel independen
mempunyai korelasi yang kuat, dikatakan terjadi multikolinieritas.
 Tidak adanya data yang sangat ekstrem (outlier) pada variabel independen. Jika
ada data outlier yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan
klasifikasi dari fungsi diskriminan.
d. Model dari Analisis Diskriminan
Analisis diskriminan termasuk dalam Multivariate Dependence Method, dengan
model :
Y1 = X1 + X2 + … + Xn
Non-Metrik Metrik
Keterangan :
 Variabel Independen ( X1 dan seterusnya ) adalah data metrik, yakni data berjenis
interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, kandungan zat
besi dalam tubuh, dan sebagainya.
 Variabel Dependen ( Y1 ) adalah Data Kategorikal atau Nominal, seperti Golongan
Miskin (kode 1), Golongan Menengah (kode 2), Golongan Kaya (kode 3) dan
sebagainya. Jika data kategorikal tersebut hanya terdiri atas dua kode saja (misal
kode 1 untuk Daerah Banjir dan kode 2 Daerah Non-Banjir), maka model bisa
disebut Two-Group Discriminant Analysis. Sedang jika kode lebih dari dua
kategori, disebut dengan Multiple Discriminant Analysis.
 Dari keterangan diatas, perhatikan adanya perbedaan dalam penempatan data yang
sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia disebut secara
langsung sekian tahun (17 tahun, 32 tahun, dan sebagainya), maka data tersebut
adalah rasio dan otomatis diperlakukan sebagai variabel independen. Namun, jika
Usia seseorang dilakukan penggolongan, dan dimasukkan dalam kategori-
kategori tertentu, seperti jika Usia seseorang antara 15-20 tahun, ia digolongkan
Remaja, diatas 20 tahun digolongkan Dewasa, maka data orang yang berusia 17
tahun tidak akan ditulis langsung ‘17’, namun akan ditulis Remaja. Data hasil
kategorisasi ini adalah data nominal dan termasuk variabel Dependen.
Dengan demikian, usia 17 tahun bisa menjadi variabel dependen atau independen
tergantung bagaimana data tersebut akan diperlakukan, langsung diinput apa
adanya atau dilakukan penggolongan.
Contoh Kasus
Kami mengumpulkan data sekelompok mahasiswa(i) yang pernah makan di luar dengan
variabel berikut.
Variabel Dependen (Y):
 Tipe Mahasiswa dari sering/jarangnya mereka makan di luar, dengan kode:
Kode 0 = JARANG (kurang dari 5 kali dalam seminggu makan di luar)
Kode 1 = SERING (minimal 5 kali dalam seminggu makan di luar)
Variabel Independen (X):
 Semester yang sedang anda tempuh/jalani
 Malas memasak sendiri
 Jumlah uang saku yang didapat perbulan/perminggu
 Kesibukan diluar kuliah yang dimiliki
 Karena ajakan teman
Variabel NAMA tidak disertakan dalam proses analisis, karena berupa data STRING
(berisi karakter dan bukannya angka).
Data file DISKRIMINAN yang berisi Faktor-faaktor yang Mempengaruhi Mahasiswa(i)

Makan di Luar, akan dilakukan analisis Diskriminan untuk mengetahui.
 Apakah ada perbedaan yang signifikan antara mahasiswa yang sering makan di luar
dengan mahasiswa yang jarang makan di luar?
 Jika ada perbedaan yang signifikan, variabel apa saja yang membuat perilaku
makan di luar mahasiswa berbeda?
 Membuat model diskriminan dua faktor (karena hanya ada yang sering dengan
yang jarang) untuk kasus tersebut.
 Menguji ketepatan model (fungsi) diskriminan.
Analisis Menggunakan SPSS

Untuk menganalisis, maka dibagikan form kepada beberapa mahasiswa yang
berisi beberapa pernyataan tentang faktor-faktor apa saja yang mempengaruhi
mahasiswa untuk makan di luar dan didapat 100 responden yang mengisi form Kami.
Berikut ini langkah-langkah untuk menganalisis dengan menggunakan SPSS.
Langkah-langkah untuk menganalisis data dengan menggunakan analisis
diskriminan adalah sebagai berikut :
Tahapan pengujian (menilai variabel yang layak dianalisis)
1. Aktifkan program SPSS
2. Pada Variabel View di SPSS isi dengan seperti gambar di bawah ini:
3. Input data ke Data View
4. Selanjutnya, klik menu AnalyzeClassifyDiscriminant...

5. Masukkan variabel Tipe ke bagian GROUPING VARIABLE. Hal ini berarti variabel
Tipe berfungsi sebagai dependent variabel (variabel tergantung), yang berciri data
kategori. Karena itu, SPSS meminta masukan kode kategori yang dipakai. Untuk itu,
buka ikon DEFINE RANGE ...,
Sesuai kode untuk variabel Tipe, maka:

o Masukkan angka 0 pada Minimum
o Masukkan angka 1 pada Maximum
Tekan tombol CONTINUE untuk kembali ke kotak dialog utama.
6. Masukan variabel semester, malas, uang, kesibukan, dan ajakan ke dalam kotak
INDEPENDENT. Hal ini berarti kelima variabel tersebut berfungsi sebagai variabel
bebas (independen).
7. Klik ikon STATISTICS. Pada bagian DESCRIPTIVES, aktifkan pilihan Univariate

ANOVAs dan Box’s M. Lalu CONTINUE untuk kembali ke kotak dialog utama.
Kemudian OK.
8. Maka akan muncul output seperti berikut.
Analisis
Tabel di atas adalah hasil pengujian untuk setiap variabel bebas yang ada. Keputusan
bisa diambil lewat dua cara.
 Dengan angka Wilk’s Lambda
Angka Wilk’s Lamba berkisar 0 sampai 1. Jika angka mendekati 0 maka data tiap
tipe cenderung berbeda, sedang jika angka mendekati 1, data tiap tipe cenderung
sama.
Dari tabel terlihat angka Wilk’s Lambda berkisar antara 0,886 sampai 0,995
(mendekati 1). Kriteria ‘mendekati angka 1’ adalah sulit ditentukan secara pasti,
karena hampir semua variabel diatas mempunyai angka Wilk’s Lambda yang besar,
namun hanya satu variabel yang lolos.
 Dengan F test
Lihat angka Sig.
Jika Sig. > 0,05 berarti tidak ada perbedaan antar tipe.
Jika Sig. < 0,05 berarti ada perbedaan antar tipe.
i) Variabel Malas Masak, angka Sig. adalah dibawah 0,05 (0,001). Hal ini berarti
ada perbedaan antar tipe, atau responden yang sering atau jarang makan di luar
terkait dengan kemalasan responden untuk memasak sendiri.
ii) Variabel lainnya (Semester yang ditempuh, Uang saku, Kesibukan di luar kuliah,
dan Ajakan teman) memiliki nilai Sig. lebih dari 0,05. Hal ini berarti tidak ada
perbedaan secara signifikan antar tipe atau variabel tersebut tidak memengaruhi
sering atau jarangnya mahasiswa makan diluar.
Kesimpulan ini, sama dengan jika berpatokan pada angka Wilk’s Lambda yang hampir
mendekati 1. Dari lima variable, ada satu variable yang berbeda sacara signifikan untuk
dua tipe diskriminan, yaitu Malas Masak. Dengan demikian, sering atau jarangnya
mahasiswa makan di luar dipengaruhi oleh rasa malas untuk memasak.
Catatan
Pada beberapa analisis diskriminan, suatu variabel yang tidak lolos uji tidak otomatis
dikeluarkan. Seperti pada kasus di atas, variabel lainnya walaupun tidak lolos uji,
namun seharusnya tetap disertakan pada analisis diskriminan selanjutnya. Pandangan ini
berdasar pada prinsip bahwa pada analisis multivariate, variabel-variabel dianggap suatu
kesatuan, dan bukannya terpisah-pisah.
Analisis
Jika analisis ANOVA dan angka Wilk’s Lambda menguji means (rata-rata) dari setiap
variabel, maka Box’s M menguji varians dari setiap variabel. Analisis Diskriminan
mempunyai asumsi bahwa :
 Varians variabel bebas untuk tiap tipe seharusnya sama. Jika demikian, seharusnya
varians dari Responden yang jarang makan di luar sama dengan varians dari
Responden yang sering makan di luar.
 Varians di antara variabel-variabel bebas seharusnya juga sama. Jika demikian,
seharusnya varians dari Semester sama dengan varians dari Malas, sama dengan
variabel Uang dan sebagainya.
Kedua pengertian di atas bisa disimpulkan, seharusnya group covariance matrices
adalah relatif sama, yang diuji dengan alat Box’s dengan ketentuan:
 HIPOTESIS
Ho : group covariance matrices adalah relatif sama
Hi : group covariance matrices adalah berbeda secara nyata
 Keputusan dengan dasar signifikansi (lihat angka Sig.)
Jika Sig.>0,05 berarti Ho diterima.
Jika Sig.<0,05 berarti Ho ditolak.
Dari tabel terlihat bahwa angka Sig. di atas 0,05 (0,062) yang berarti group covariance
matrices adalah sama. Hal ini berarti data diatas sudah memenuhi asumsi analisis
diskriminan, sehingga proses bisa dilanjutkan.
Catatan
 Sama tidaknya group covariance matrices juga bisa dilihat dari table output LOG
DETERMINANT berikut (ada di atas table Box’s M)
Terlihat angka log determinant untuk jarang sebesar 8,466 dan sering sebesar 7,635
tidak berbeda banyak, sehingga group covariances matrices akan relatif sama untuk
kedua tipe.
Karena data sudah layak untuk dilanjutkan, maka akan dilanjutkan dengan analisis
diskriminan yaitu dengan melanjutkan melakukan proses pembuatan model
diskriminan. Pada kasus ini akan dibahas model diskriminan yang paling sederhana,
yaitu hanya melibatkan dua kategori pada variabel dependen (Two-Group).
KASUS (lanjutan)
Langkah-langkah :
Tahapan lanjutan pada Analisis Diskriminan.
1. Klik menu AnalyzeClassifyDiscriminant...
2. Masukkan variabel Tipe ke bagian GROUPING VARIABLE. Hal ini berarti variabel
Tipe berfungsi sebagai dependent variabel (variabel tergantung), yang berciri data
kategori. Karena itu, SPSS meminta masukan kode kategori yang dipakai. Untuk itu,
buka ikon DEFINE RANGE ...,
Sesuai kode untuk variabel Tipe, maka:

o Masukkan angka 0 pada Minimum
o Masukkan angka 1 pada Maximum
Tekan tombol CONTINUE untuk kembali ke kotak dialog utama.
3. Masukan variabel semester, malas, uang, kesibukan, dan ajakan ke dalam kotak
INDEPENDENT. Hal ini berarti kelima variabel tersebut berfungsi sebagai variabel
bebas (independen).
4. Klik ikon STATISTICS. Pada bagian DESCRIPTIVES, aktifkan pilihan Means.
Pada bagian FUNCTION COEFFICIENTS, aktifkan pilihan Fisher’s dan
Unstandardized. Abaikan bagian lain, dan tekan CONTINUE untuk kembali ke
kota dialog utama.
5. Klik mouse pada pilihan Use stepwise method (yang terletak di tengah bawah),
maka secara otomatis ikon METHOD yang ada di bagian tengah kanan ota dialog
utama akan terbuka (aktif).
6. Klik Ikon METHOD tersebut. Pada bagian METHOD, pilih Mahalanobis distance.
Pada bagian CRITERIA, pilih Use Probability of F, namun jangan mengubah isi
yang sudah ada (default). Lalu klik Continue.
7. Klik ikon CLASSIFY. Pada bagian DISPLAY, aktifkan pilihan Casewise results
dan Leave-one-out-classification. Abaikan bagian lain, dan tekan CONTINUE lalu
OK.
8. Maka akan muncul output berikut.
Tabel GROUP STATISTICS pada dasarnya berisi data statistik (deskriptif) yang
utama, yakni Rata – rata dan standar deviasi, dari kedua tipe Mahasiswa.
Sebagai contoh, Mahasiswa yang termasuk tipe jarang makan di luar mempunyai
semester rata-rata 4,91. Sedangkan mahasiswa yang termasuk tipe sering makan di luar
memiliki rata-rata semester lebih tinggi, yakni 5,50. Kedua angka ini tentu berbeda,
namun apakah perbedaan tersebut nyata (signifikan)?
Demikian pula untuk variabel lainnya, semua mempunyai angka rata –rata dan
standar deviasi yang berbeda untuk kedua tipe mahasiswa. Dan semuanya akan diuji
untuk mengetahui variabel mana yang mempunyai perbedaan yang signifikan.
Dari tabel di atas juga terlihat ada 66 responden yang tergolong jarang makan di luar,
sedangkan ada 34 responden yang tergolong sering makan di luar. Jika melihat semua
variabel terisi angka 66 atau 34 semuanya, maka pada kasus ini tidak ada data yang
hilang (missing), sehingga total data untuk semua variabel adalah 100 buah.
Tabel ini menyajikan variabel mana saja yang bisa dimasukkan (entered) dalam
persamaan diskriminan. Kerena proses adalah stepwise (bertahap), maka akan dimulai
dengan variabel yang mempunyai angka F hitung (statistic) terbesar.
Dengan Demikian, dari lima variabel yang dimasukkan, hanya ada satu variabel yang
signifikan. Atau bisa dikatakan Malas Memasak mempengaruhi perilaku mahasiswa
jarang/sering makan di luar.
Tabel di atas dan tabel selanjutnya sebenarnya hanyalah perincian (detail) dari proses
stepwise pada tabel sebelumnya. Namun, karena hanya ada satu variabel, maka hanya
terdapat satu step.
Tabel di atas adalah kebalikan dari tabel sebelumnya, di mana pada tabel ini justru yang
ditayangkan adalah proses pengeluaran variabel secara bertahap.
 Pada step 0 (keadaan awal), kelima variabel secara lengkap ditayangkan dengan
angka SIG. OF F TO REMOVE sebagai faktor penguji. Terlihat angka SIG. OF F
REMOVE yang terkecil adalah pada variabel Malas Masak (angka 0,001). Maka
variabel Malas Masak dikeluarkan dari step 0 tersebut, yang berarti variabel
tersebut bukan termasuk variabel yang tidak dianalisis.
 Pada step 1, sekarang terlihat ada empat variabel, dan terlihat keempat variabel
tersebut mempunyai angka SIG. OF F TO REMOVE diatas 0,05 (yakni 0,556
untuk Semester, 0,625 untuk Uang Saku, 0,299 untuk Kesibukan dan 0,326 untuk
Ajakan Teman). Karena sudah tidak ada variabel yang memenuhi syarat maka
proses pengeluaran variabel berhenti, dan keempat variabel sisa tersebut tidak
dikeluarkan, yang berarti keempatnya termasuk pada VARIABEL NOT IN THE
ANALYSIS, atau variabel yang tidak dianalisis lebih lanjut.
Wilk’s Lambda pada prinsipnya adalah varians total dalam discriminant scores
yang tidak bisa dijelaskan oleh perbedaan di antara tipe-tipe yang ada. Perhatikan tabel
di atas yang hanya terdiri atas satu tahap (step), yang terkait dengan satu variabel yang
secara berurutan dimasukkan pada tahapan analisis sebelumnya.
Pada step 1, jumlah variabel yang dimasukkan ada satu (Malas Masak), dengan angka
Wilk’s Lambda adalah 0,886. Hal ini berarti 88,6% varians tidak dapat dijelaskan oleh
perbedaan antara tipe-tipe.
Dari kolom F dan signifikansinya, terlihat signifikan secara statistik. Hal ini berarti
variabel tersebut memang berbeda untuk kedua tipe mahasiswa.
Summary of Canonical Discriminant Funtions
Cononical Correlation mengukur keeratan hubungan antara discriminant score

dengan tipe (dalam hal ini, karena ada dua tipe konsumen, maka ada dua tipe). Angka
0,338 menunjukkan keeratan yang cukup tinggi, dengan ukuran skala asosiasi antara 0
sampai 1.
Angka Chi-Square sebesar 11,852 dengan tingkat signifikansi yang tinggi menunjukkan
perbedaan yang jelas antara dua tipe mahasiswa (mahasiswa yang Jarang makan di luar
dengan mahasiswa yang Sering makan di luar).
Tabel STRUCTURE MATRIX menjelaskan korelasi antara variabel independen dengan
fungsi diskriminan yang terbentuk. Terlihat variabel Malas Masak paling erat
hubungannya dengan fungsi diskriminan, diikuti oleh variabel Uang Saku, Kesibukan di
luar kuliah, dan seterusnya. Hanya saja, selain variabel Malas Masak tidak dimasukkan
dalam model diskriminan (perhatikan tanda huruf a di dekat variabel tersebut).
Tabel di atas mempunyai fungsi yang hampir mirip dengan persamaan regresi berganda,
yang dalam analisis diskriminan disebut sebagai FUNGSI DISKRIMINAN :
Z Score = -2,114-0,373 Malas Masak
Kegunaan fungsi ini untuk mengetahui sebuah case (dalam kasus ini adalah seorang
mahasiswa) masuk pada tipe yang satu, ataukah tergolong pada tipe yang lainnya.
KESIMPULAN
Dari penelitian yang dilakukan menggunakan analisis diskriminan dengan lima

variabel yang mempengaruhi sering atau jarangnya mahasiswa(i) makan di luar,
Semester yang ditempuh, Malas Masak, Uang saku, Kesibukan di luar kuliah, dan
Ajakan teman, terdapat perbedaan yang jelas antara dua tipe mahasiswa (mahasiswa
yang Jarang makan di luar dengan mahasiswa yang Sering makan di luar).
Dari beberapa faktor yang ada, hanya faktor Malas Memasak yang paling
mempengaruhi perilaku mahasiswa jarang/sering makan di luar. Dengan kata lain, rajin
atau malasnya mahasiswa untuk memasak memengaruhi perilaku mahasiswa untuk
makan di luar.
Bentuk persamaan diskriminan dari kasus ini adalah:
Y =−2,114−0,373 X 2
Dengan:
Y : Sering/Jarangnya Mahasiswa(i) Makan di Luar
X2 : Malas Masak

K8 - Analisis Diskriminan

Diunggah oleh

Informasi Dokumen

Deskripsi Asli:

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

K8 - Analisis Diskriminan

Diunggah oleh

Hak Cipta:

Format Tersedia

“ANALISIS DISKRIMINAN”

Disusun untuk Memenuhi Tugas Matakuliah Analisis Data Kuantitatif

PROGRAM STUDI PENDIDIKAN MATEMATIKA

Analisis diskriminan adalah salah satu metode analisis multivariat yang

Hal-hal Pokok Tentang Analisis Diskriminan

Data file DISKRIMINAN yang berisi Faktor-faaktor yang Mempengaruhi Mahasiswa(i)

Analisis Menggunakan SPSS

3. Input data ke Data View

4. Selanjutnya, klik menu AnalyzeClassifyDiscriminant...

Sesuai kode untuk variabel Tipe, maka:

7. Klik ikon STATISTICS. Pada bagian DESCRIPTIVES, aktifkan pilihan Univariate

Sesuai kode untuk variabel Tipe, maka:

8. Maka akan muncul output berikut.

Summary of Canonical Discriminant Funtions

Cononical Correlation mengukur keeratan hubungan antara discriminant score

Dari penelitian yang dilakukan menggunakan analisis diskriminan dengan lima

Anda mungkin juga menyukai