Dosen Pengampu:
Dr. H. Karim, M.Si
Rzki Amalia, M.Pd.
Hj. Indah Budiarti, M.Pd.
Disusun Oleh:
Kelompok 8
Fahriza Muhaimin 1710118210011
Laila Mubarakah 1710118220014
Wafa Islamiyah 1710118220031
Zuraida Khatimah 1710118220033
Y1 = X1 + X2 + … + Xn
Non-Metrik Metrik
Keterangan :
Variabel Independen ( X1 dan seterusnya ) adalah data metrik, yakni data berjenis
interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, kandungan zat
besi dalam tubuh, dan sebagainya.
Variabel Dependen ( Y1 ) adalah Data Kategorikal atau Nominal, seperti Golongan
Miskin (kode 1), Golongan Menengah (kode 2), Golongan Kaya (kode 3) dan
sebagainya. Jika data kategorikal tersebut hanya terdiri atas dua kode saja (misal
kode 1 untuk Daerah Banjir dan kode 2 Daerah Non-Banjir), maka model bisa
disebut Two-Group Discriminant Analysis. Sedang jika kode lebih dari dua
kategori, disebut dengan Multiple Discriminant Analysis.
Dari keterangan diatas, perhatikan adanya perbedaan dalam penempatan data yang
sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia disebut secara
langsung sekian tahun (17 tahun, 32 tahun, dan sebagainya), maka data tersebut
adalah rasio dan otomatis diperlakukan sebagai variabel independen. Namun, jika
Usia seseorang dilakukan penggolongan, dan dimasukkan dalam kategori-
kategori tertentu, seperti jika Usia seseorang antara 15-20 tahun, ia digolongkan
Remaja, diatas 20 tahun digolongkan Dewasa, maka data orang yang berusia 17
tahun tidak akan ditulis langsung ‘17’, namun akan ditulis Remaja. Data hasil
kategorisasi ini adalah data nominal dan termasuk variabel Dependen.
Dengan demikian, usia 17 tahun bisa menjadi variabel dependen atau independen
tergantung bagaimana data tersebut akan diperlakukan, langsung diinput apa
adanya atau dilakukan penggolongan.
Contoh Kasus
Kami mengumpulkan data sekelompok mahasiswa(i) yang pernah makan di luar dengan
variabel berikut.
Variabel Dependen (Y):
Tipe Mahasiswa dari sering/jarangnya mereka makan di luar, dengan kode:
Kode 0 = JARANG (kurang dari 5 kali dalam seminggu makan di luar)
Kode 1 = SERING (minimal 5 kali dalam seminggu makan di luar)
Variabel Independen (X):
Semester yang sedang anda tempuh/jalani
Malas memasak sendiri
Jumlah uang saku yang didapat perbulan/perminggu
Kesibukan diluar kuliah yang dimiliki
Karena ajakan teman
Variabel NAMA tidak disertakan dalam proses analisis, karena berupa data STRING
(berisi karakter dan bukannya angka).
Analisis
Tabel di atas adalah hasil pengujian untuk setiap variabel bebas yang ada. Keputusan
bisa diambil lewat dua cara.
Dengan angka Wilk’s Lambda
Angka Wilk’s Lamba berkisar 0 sampai 1. Jika angka mendekati 0 maka data tiap
tipe cenderung berbeda, sedang jika angka mendekati 1, data tiap tipe cenderung
sama.
Dari tabel terlihat angka Wilk’s Lambda berkisar antara 0,886 sampai 0,995
(mendekati 1). Kriteria ‘mendekati angka 1’ adalah sulit ditentukan secara pasti,
karena hampir semua variabel diatas mempunyai angka Wilk’s Lambda yang besar,
namun hanya satu variabel yang lolos.
Dengan F test
Lihat angka Sig.
Jika Sig. > 0,05 berarti tidak ada perbedaan antar tipe.
Jika Sig. < 0,05 berarti ada perbedaan antar tipe.
i) Variabel Malas Masak, angka Sig. adalah dibawah 0,05 (0,001). Hal ini berarti
ada perbedaan antar tipe, atau responden yang sering atau jarang makan di luar
terkait dengan kemalasan responden untuk memasak sendiri.
ii) Variabel lainnya (Semester yang ditempuh, Uang saku, Kesibukan di luar kuliah,
dan Ajakan teman) memiliki nilai Sig. lebih dari 0,05. Hal ini berarti tidak ada
perbedaan secara signifikan antar tipe atau variabel tersebut tidak memengaruhi
sering atau jarangnya mahasiswa makan diluar.
Kesimpulan ini, sama dengan jika berpatokan pada angka Wilk’s Lambda yang hampir
mendekati 1. Dari lima variable, ada satu variable yang berbeda sacara signifikan untuk
dua tipe diskriminan, yaitu Malas Masak. Dengan demikian, sering atau jarangnya
mahasiswa makan di luar dipengaruhi oleh rasa malas untuk memasak.
Catatan
Pada beberapa analisis diskriminan, suatu variabel yang tidak lolos uji tidak otomatis
dikeluarkan. Seperti pada kasus di atas, variabel lainnya walaupun tidak lolos uji,
namun seharusnya tetap disertakan pada analisis diskriminan selanjutnya. Pandangan ini
berdasar pada prinsip bahwa pada analisis multivariate, variabel-variabel dianggap suatu
kesatuan, dan bukannya terpisah-pisah.
Analisis
Jika analisis ANOVA dan angka Wilk’s Lambda menguji means (rata-rata) dari setiap
variabel, maka Box’s M menguji varians dari setiap variabel. Analisis Diskriminan
mempunyai asumsi bahwa :
Varians variabel bebas untuk tiap tipe seharusnya sama. Jika demikian, seharusnya
varians dari Responden yang jarang makan di luar sama dengan varians dari
Responden yang sering makan di luar.
Varians di antara variabel-variabel bebas seharusnya juga sama. Jika demikian,
seharusnya varians dari Semester sama dengan varians dari Malas, sama dengan
variabel Uang dan sebagainya.
Kedua pengertian di atas bisa disimpulkan, seharusnya group covariance matrices
adalah relatif sama, yang diuji dengan alat Box’s dengan ketentuan:
HIPOTESIS
Ho : group covariance matrices adalah relatif sama
Hi : group covariance matrices adalah berbeda secara nyata
Keputusan dengan dasar signifikansi (lihat angka Sig.)
Jika Sig.>0,05 berarti Ho diterima.
Jika Sig.<0,05 berarti Ho ditolak.
Dari tabel terlihat bahwa angka Sig. di atas 0,05 (0,062) yang berarti group covariance
matrices adalah sama. Hal ini berarti data diatas sudah memenuhi asumsi analisis
diskriminan, sehingga proses bisa dilanjutkan.
Catatan
Sama tidaknya group covariance matrices juga bisa dilihat dari table output LOG
DETERMINANT berikut (ada di atas table Box’s M)
Terlihat angka log determinant untuk jarang sebesar 8,466 dan sering sebesar 7,635
tidak berbeda banyak, sehingga group covariances matrices akan relatif sama untuk
kedua tipe.
Karena data sudah layak untuk dilanjutkan, maka akan dilanjutkan dengan analisis
diskriminan yaitu dengan melanjutkan melakukan proses pembuatan model
diskriminan. Pada kasus ini akan dibahas model diskriminan yang paling sederhana,
yaitu hanya melibatkan dua kategori pada variabel dependen (Two-Group).
KASUS (lanjutan)
Langkah-langkah :
Tahapan lanjutan pada Analisis Diskriminan.
1. Klik menu AnalyzeClassifyDiscriminant...
2. Masukkan variabel Tipe ke bagian GROUPING VARIABLE. Hal ini berarti variabel
Tipe berfungsi sebagai dependent variabel (variabel tergantung), yang berciri data
kategori. Karena itu, SPSS meminta masukan kode kategori yang dipakai. Untuk itu,
buka ikon DEFINE RANGE ...,
5. Klik mouse pada pilihan Use stepwise method (yang terletak di tengah bawah),
maka secara otomatis ikon METHOD yang ada di bagian tengah kanan ota dialog
utama akan terbuka (aktif).
6. Klik Ikon METHOD tersebut. Pada bagian METHOD, pilih Mahalanobis distance.
Pada bagian CRITERIA, pilih Use Probability of F, namun jangan mengubah isi
yang sudah ada (default). Lalu klik Continue.
7. Klik ikon CLASSIFY. Pada bagian DISPLAY, aktifkan pilihan Casewise results
dan Leave-one-out-classification. Abaikan bagian lain, dan tekan CONTINUE lalu
OK.
Tabel GROUP STATISTICS pada dasarnya berisi data statistik (deskriptif) yang
utama, yakni Rata – rata dan standar deviasi, dari kedua tipe Mahasiswa.
Sebagai contoh, Mahasiswa yang termasuk tipe jarang makan di luar mempunyai
semester rata-rata 4,91. Sedangkan mahasiswa yang termasuk tipe sering makan di luar
memiliki rata-rata semester lebih tinggi, yakni 5,50. Kedua angka ini tentu berbeda,
namun apakah perbedaan tersebut nyata (signifikan)?
Demikian pula untuk variabel lainnya, semua mempunyai angka rata –rata dan
standar deviasi yang berbeda untuk kedua tipe mahasiswa. Dan semuanya akan diuji
untuk mengetahui variabel mana yang mempunyai perbedaan yang signifikan.
Dari tabel di atas juga terlihat ada 66 responden yang tergolong jarang makan di luar,
sedangkan ada 34 responden yang tergolong sering makan di luar. Jika melihat semua
variabel terisi angka 66 atau 34 semuanya, maka pada kasus ini tidak ada data yang
hilang (missing), sehingga total data untuk semua variabel adalah 100 buah.
Tabel ini menyajikan variabel mana saja yang bisa dimasukkan (entered) dalam
persamaan diskriminan. Kerena proses adalah stepwise (bertahap), maka akan dimulai
dengan variabel yang mempunyai angka F hitung (statistic) terbesar.
Dengan Demikian, dari lima variabel yang dimasukkan, hanya ada satu variabel yang
signifikan. Atau bisa dikatakan Malas Memasak mempengaruhi perilaku mahasiswa
jarang/sering makan di luar.
Tabel di atas dan tabel selanjutnya sebenarnya hanyalah perincian (detail) dari proses
stepwise pada tabel sebelumnya. Namun, karena hanya ada satu variabel, maka hanya
terdapat satu step.
Tabel di atas adalah kebalikan dari tabel sebelumnya, di mana pada tabel ini justru yang
ditayangkan adalah proses pengeluaran variabel secara bertahap.
Pada step 0 (keadaan awal), kelima variabel secara lengkap ditayangkan dengan
angka SIG. OF F TO REMOVE sebagai faktor penguji. Terlihat angka SIG. OF F
REMOVE yang terkecil adalah pada variabel Malas Masak (angka 0,001). Maka
variabel Malas Masak dikeluarkan dari step 0 tersebut, yang berarti variabel
tersebut bukan termasuk variabel yang tidak dianalisis.
Pada step 1, sekarang terlihat ada empat variabel, dan terlihat keempat variabel
tersebut mempunyai angka SIG. OF F TO REMOVE diatas 0,05 (yakni 0,556
untuk Semester, 0,625 untuk Uang Saku, 0,299 untuk Kesibukan dan 0,326 untuk
Ajakan Teman). Karena sudah tidak ada variabel yang memenuhi syarat maka
proses pengeluaran variabel berhenti, dan keempat variabel sisa tersebut tidak
dikeluarkan, yang berarti keempatnya termasuk pada VARIABEL NOT IN THE
ANALYSIS, atau variabel yang tidak dianalisis lebih lanjut.
Wilk’s Lambda pada prinsipnya adalah varians total dalam discriminant scores
yang tidak bisa dijelaskan oleh perbedaan di antara tipe-tipe yang ada. Perhatikan tabel
di atas yang hanya terdiri atas satu tahap (step), yang terkait dengan satu variabel yang
secara berurutan dimasukkan pada tahapan analisis sebelumnya.
Pada step 1, jumlah variabel yang dimasukkan ada satu (Malas Masak), dengan angka
Wilk’s Lambda adalah 0,886. Hal ini berarti 88,6% varians tidak dapat dijelaskan oleh
perbedaan antara tipe-tipe.
Dari kolom F dan signifikansinya, terlihat signifikan secara statistik. Hal ini berarti
variabel tersebut memang berbeda untuk kedua tipe mahasiswa.
Angka Chi-Square sebesar 11,852 dengan tingkat signifikansi yang tinggi menunjukkan
perbedaan yang jelas antara dua tipe mahasiswa (mahasiswa yang Jarang makan di luar
dengan mahasiswa yang Sering makan di luar).
Tabel STRUCTURE MATRIX menjelaskan korelasi antara variabel independen dengan
fungsi diskriminan yang terbentuk. Terlihat variabel Malas Masak paling erat
hubungannya dengan fungsi diskriminan, diikuti oleh variabel Uang Saku, Kesibukan di
luar kuliah, dan seterusnya. Hanya saja, selain variabel Malas Masak tidak dimasukkan
dalam model diskriminan (perhatikan tanda huruf a di dekat variabel tersebut).
Tabel di atas mempunyai fungsi yang hampir mirip dengan persamaan regresi berganda,
yang dalam analisis diskriminan disebut sebagai FUNGSI DISKRIMINAN :
Z Score = -2,114-0,373 Malas Masak
Kegunaan fungsi ini untuk mengetahui sebuah case (dalam kasus ini adalah seorang
mahasiswa) masuk pada tipe yang satu, ataukah tergolong pada tipe yang lainnya.
KESIMPULAN