(409312417678)
Andrie Kurniawan
(409312417687)
(409312419799)
Firqin Setara
(409312419800)
BAB I
PENDAHULUAN
1.1.Latar Belakang
Analisis diskriminan merupakan teknik menganalisis data, dimana variabel dependen
merupakan data kategorik ( nominal dan ordinal ) sedangkan variabel independen berupa
data interval atau rasio . Misalnya berdasarkan data dari nasabah peminjam kredit suatu
bank, seperti penghasilan, umur, pekerjaan, tingkat pendidikan, ingin meramalkan apakah
seseorang nasabah yang baru termasuk jujur atau tidak jujur. Analisis diskriminan ini
termasuk dalam analisis multivariat dengan metode dependensi. Ada dua metode dalam
analisis multivariat yaitu metode dependensi dan metode interdenpendensi . Metode
dependensi yaitu variabel-variabelnya tidak saling bergantung satu dengan yang lain,
sedangkan metode interdenpendensi adalah antarvariabelnya ada saling ketergantungan.
Variabel dependen adalah data kategorikal. Jika data kategorikal terdiri dari dua kelompok
atau kategori disebut Two-Group Discriminant Analysis , sedangkan jika lebih dari dua
kategori disebut dengan Multiple Discriminant Analysis. Adapun yang menjadi latar
belakang penelitian ini adalah terkait dengan peranan dan aplikasi analisis diskriminan
yang merupakan salah satu dari teknik statistik multivariat yang banyak digunakan dalam
berbagai bidang ilmu yang terjadi dalam sebuah fenomena sosial, keuangan dan ekonomi.
Analisis diskriminan digunakan asalkan pertanyaan penelitian mengarah pada variabel tak
bebas (dependent variable) yang berupa data kategori seperti : macet-lancar,untung-rugi,
puas-tidak puas dan lainnya.
Analisis diskriminan adalah metode untuk mencari dasar pengelompokan individu
berdasarkan lebih dari satu variabel bebas. Analisis Diskriminan dipakai untuk menjawab
pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan
beberapa variabel. Persamaan Fungsi Diskriminan yang dihasilkan untuk memberikan
peramalan yang paling tepat untuk mengklasifikasi individu kedalam kelompok
berdasarkan skor variabel bebas . Pada penelitian bidang kesehatan , analisis diskriminan
dilakukan untuk mengetahui apakah dari keempat variabel prediktor, yaitu perasaan
cemas (feeling anxious), gelisah (restless), depresi (depressed), putusasa (hopeless) dapat
menentukan apakah seorang pasien akan didiagnosis pada kelompok tidak stress (normal)
atau stress . Pada Bank, analisis diskriminan juga dilakukan untuk mengklasifikasi
Formulir Aplikasi untuk pinjaman, kartu kredit, dan asuransi dalam kategori berisiko
rendah atau berisiko tinggi.
1.2.Rumusan Masalah
1. Bagaimana definisi analisis diskriminan?
2. Apa saja hal hal pokok yang mempengaruhi diskriminan analisis?
3. Bagaimana proses pengambilan keputusan untuk analisis diskriminan?
4. Bagaiman aplikasi dalam menganalisis model diskriminan?
1.3.Tujuan
1. Mengetahui pengertian tentang analisis diskriminan
2. Untuk mengetahui tujuan dan syarat dari analisis diskriminan, menentukan banyaknya
sampel, dan mengetahui proses-proses dalam mencari model diskriminan.
3. Mengetahui proses pengambilan keputusan untuk analisis diskriminan.
4. Menganalisis model diskriminan dengan bantuan SPSS.
BAB 2
PEMBAHASAN
2.1 DEFINISI DISKRIMINAN ANALISIS
Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen
adalah kategori (nominal atau nonmetrik) variabel dan variabel independen adalah variabel
metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi
(contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dalam kasus lain,
lebih dari dua kelompok yang terlibat, seperti rendah, sedang, dan klasifikasi tinggi. Analisis
diskriminan mampu menangani baik dua kelompok atau beberapa kelompok (tiga atau lebih).
Ketika dua klasifikasi yang terlibat, teknik ini disebut sebagai dua kelompok analisis
diskriminan. Ketika tiga atau lebih klasifikasi diidentifikasi, teknik ini disebut sebagai
analisis diskriminan ganda (MDA).
Analisis diskriminan melibatkan menurunkan suatu variat. Diskriminan variat adalah
kombinasi linear dari variabel independen dua (atau lebih) yang akan membedakan terbaik
antara obyek (orang, perusahaan, dll) dalam kelompok didefinisikan suatu priori.
Diskriminasi dicapai dengan menghitung bobot untuk masing-masing variate variabel
independen untuk memaksimalkan perbedaan antara kelompok (yaitu varians antara
kelompok relatif terhadap varians dalam kelompok). Para variate untuk analisis diskriminan,
juga dikenal sebagai fungsi diskriminan, berasal dari persamaan seperti yang terlihat pada
regresi berganda. Dibutuhkan bentuk sebagai berikut:
dimana
= diskriminan Z skor diskriminan j fungsi untuk objek k
= intercept
= bobot diskriminan untuk variabel independen
= variabel independen untuk objek
Analisis diskriminan adalah teknik statistik yang sesuai untuk menguji hipotesis
bahwa kelompok berarti satu set variabel independen untuk dua atau lebih kelompok yang
sama. Dengan rata-rata skor diskriminan untuk semua individu dalam suatu kelompok
tertentu, kita sampai pada kelompok rata-rata. Kelompok rata-rata ini disebut sebagai suatu
titik berat. Ketika analisis melibatkan dua kelompok ada dua centroid, dengan tiga kelompok
ada tiga centroid, dan sebagainya. Para centroid menunjukkan letak paling khas dari setiap
anggota dari kelompok tertentu, dan perbandingan dari centroid kelompok menunjukkan
seberapa jauh kelompok-kelompok yang dalam bentuk adalah fungsi diskriminan.
Uji untuk signifikansi statistik dari fungsi diskriminan adalah ukuran umum dari jarak
antara centroid kelompok, dihitung dengan membandingkan distribusi dari skor diskriminan
untuk kelompok. Jika tumpang tindih cukup besar, fungsi adalah diskriminator yang buruk
antara kelompok-kelompok. Dua distribusi skor diskriminan ditunjukkan pada gambar 1
lebih menggambarkan konsep ini. Diagram atas mewakili distribusi skor diskriminan untuk
fungsi yang memisahkan kelompok-kelompok dengan baik, menunjukkan tumpang tindih
minim (daerah yang diarsir) antara kelompok. Diagram bawah menunjukkan distribusi skor
diskriminan pada fungsi diskriminan yang merupakan diskriminator relatif miskin antara
kelompok A dan B. daerah yang diarsir tumpang tindih merupakan contoh di mana
misclassifying objek dari grup A ke kelompok B dan sebaliknya dapat terjadi.
Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel
dependen, atau bisa dikatakan apakah ada perbedaan antara anggota grup 1
dengan anggota grup 2.
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan
persamaan regresi.
Variabel tergantung hanya satu dan bersifat non-metrik, artinya data harus
kategorikal dan berskala nominal.
Variabel bebas terdiri lebih dari dua variabel dan berskala interval.
Tidak ada korelasi antar variabel independen. Jika dua variabel independen
mempunyai korelasi yang kuat, dikatakan terjadi multikolinieritas.
Tidak adanya data yang sangat ekstrem (outlier) pada variabel independen. Jika
ada data outlier yang tetap diproses, Hal ini bisa berakibat berkurangnya
ketetapan klasifikasi dari fungsi diskriminan.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua
metode dasar untuk itu, yaitu:
1. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan secara
bersama-sama kemudian dilakukan proses diskriminan.
2. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke dalam
modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada pada model,
dan ada kemungkinan satu atau lebih variabel independen yang dibuang dari
model.
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap
variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam
variabel independen, seharusnya minimal ada 6x5=30 sampel.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua jenis sampel, yakni
analysis sampel yang digunakan untuk Fungsi Diskriminan, serta holdout sample (split
sample) yang digunakan untuk menguji hasil diskriminan. Sebagai contoh, jika ada 70
sampel, maka sampel tersebut bisa dibagi dua, 35 unntuk analysis sampel dan 35 untuk
holdout sample. Kemudian hasil fungsi diskriminan yang terjadi pada analisis sample
dibandingkan dengan hasil fungsi diskriminan dari holdout sample, apakah terjadi perbedaan
yang besar atau tidak. Jika ketetapan klasifikasi kedua sampel hampir sama besar, dikatakn
fungsi diskriminan dari analisis sampel sudah valid. Inillah yang disebut proses validasi
silang (Cross Validation) dari fungsi diskriminan.
Model dari Analisis Diskriminan
Analisis diskriminan termasuk dalam multivariate dependence method, dengan model :
Y1
Non metriks
X1+X2+..+Xn
Metrik
Keterangan :
Variabel Independen (X1 dan Seterusnya) adalah data metrik, yakni data berjenis
interval atau rasio, seperti Usia seseorang, tinggi sebuah pohon, kandungan zat besi
dalam tubuh, dan seterusnya.
Variabel Dependen (Y1) adalah data kategorikal atau nominal, seperti golongan
miskin (kode 1), golongan menengah (kode 2), golongan kaya (kode 3) dan
sebagainya. Jika data kategorikal tersebut hanya terdiri atas dua kode saja (missal
kode 1 untuk daerah banjir dan kode 2 untuk daerah non banjir), maka model bisa
disebut Two-Group Discriminant Analysis. Sedang jika kode lebih dari dua kategori
disebut dengan Multiple Discriminant Analysis.
Dari keterangan di atas, perhatikan adanya perbedaan dalam penempatan data yang
sekilas mirip. Seperti Usia seseorang (dalam tahun). Jika usia disebut secara langsung
sekian tahun (17 tahun, 32 tahun dan sebagainya), maka data tersebut adalah rasio dan
BAB 3
PENUTUP
Analisis diskriminan adalah teknik statistik yang sesuai ketika variabel dependen
adalah kategori (nominal atau nonmetrik) variabel dan variabel independen adalah variabel
metrik. Dalam banyak hal, variabel dependen terdiri dari dua kelompok atau klasifikasi
(contoh. laki-laki dibandingkan perempuan atau tinggi versus rendah). Dengan fungsi
diskriminan sebagai berikut:
Tujuan dari analisis diskriminan secara umum adalah mengetahui apakah ada
perbedaan yang jelas antar grup pada variabel dependen, menentukan model diskriminan
dari suatu permasalahan. Jika model tersebut sudah diperoleh selanjutnya akan dilakukan
pengujian ketepatan klasifikasi model.
Model dari analisis diskriminan dapat digunakan untuk mencari hubungan antara
variabel dependen dengan variabel dependen dari permasalahan yang didapat.
BAB II
PEMBAHASAN
2.1.Analisis Diskiminan (Analisis Fungsi Pembeda )
Menurut Johnson dan Wichern (2007) Analisis Diskriminan digunakan untuk
mengklasifikasikan individu ke dalam salah satu dari dua kelompok atau lebih. Suatu
fungsi diskriminan layak untuk dibentuk, bila terdapat perbedaan nilai rataan di antara
kelompok-kelompok yang ada.
Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan
untuk mengelompokkan atau mengklasifikasi suatu objek dalam dua kelompok atau lebih
berdasarkan variabel independentnya.
Sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian terhadap perbedaan
nilai rataan dari kelompok-kelompok tersebut. Dalam pengujian tersebut, asumsi analisis
diskriminan yang harus dipenuhi adalah :
1. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate
Normality), jika data tidak berdistribusi normal,akan menyebabkan masalah pada
ketepatan fungsi (model) diskriminan.
2. Matriks varians kovarians grup dari semua variabel independen seharusnya sama.
3. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen, jika ada data
ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi
dari fungsi diskriminan.
4. Tidak ada korelasi yang kuat antar-variabel independen , jika dua variabel independen
mempunyai korelasi yang kuat,dikatakan terjadi multikolinieritas. Untuk mengetahui
adanya multikolinieritas dapat dilakukan dengan melihat korelasi antar variabel
independen (r) yaitu jika nilai r > 0.6 menunjukkan adanya multikolinieritas.
2.2.Fungsi Diskriminan
Y b0 b1 X i1 b2 X i 2 ... b j X ij
dimana :
perbedaan yang besar ataukah tidak. Jika ketetapan klasifikasi kedua sampel hampir sama
besar, dikatakn fungsi diskriminan dari analysis sampel sudah valid. Inillah yang disebut
proses validasi silang (Cross Validation) dari fungsi diskriminan.
2.4.Tujuan Analisis Diskriminan
Karena bentuk multivariat dari analisis diskriminan adalah dependen, maka
variabel dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel
dependen bisa berupa kode grup 1 atau kode grup 2 atau lainnya, dengan tujuan
diskriminan secara umum adalah :
Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel
dependen? Atau bisa dikatakan apakah ada perbedaan antara anggota grup 1
dengan anggota grup 2?
Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang
membuat perbedaan tersebut?
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan
persamaan regresi.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua
metode dasar untuk itu, yaitu:
3. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan
secara bersama-sama kemudian dilakukan proses diskriminan.
4. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke
dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada
pada model, dan ada kemungkinan satu atau lebih variabel independen
yang dibuang dari model.
H 0 : 1 2
H1 : 1 2
Diharapkan dari uji ini adalah hipotesis nol ditolak, sehingga kita mempunyai
informasi awal bahwa variabel yang sedang diteliti memang membedakan kedua
kelompok. Pada SPSS, uji ini dilakukan secara univariate (jadi yang diuji bukan
berupa vektor), dengan bantuan tabel Tests of Equality of Group Means.
3. Dilanjutkan pemeriksaan asumsi homoskedastisitas, dengan uji Boxs M. Diharapkan
dari uji ini hipotesisi nol tidak ditolak ( H 0 : 1 2 ).
4. Pembentukan model diskriminan
a. Kriteria Fungsi Linier Fisher
Pembentukan Fungsi Linier (teoritis)
Fisher mengelompokkan suatu observasi berdasarkan nilai skor yang
dihitung dari suatu fungsi linier Y ' X dimana ' menyatakan vektor
yang berisi koefisien-koefisien variabel penjelas yang membentuk
persamaan linier terhadap variabel respon, ' 1 , 2 ,..., p
X1
X
X2
X 21k X 22 k . . . X 2 pk i 1, 2, ...., n
.
.
.
j 1, 2, ...., p
Xk
.
.
.
.
k 1, 2
.
.
X n1k X n 2 k . . . X npk
X ijk menyatakan observasi ke-i variabel ke-j pada kelompok ke-k
Di bawah asumsi X k
N (k .k ) maka
E ( X 1 ) 1
dan k E ( X k k ) (X k k ) ' ; 1 2
E( X 2 ) 2
1k
.
k . ; k adalah vektor rata-rata tiap variable X pada kelompok ke-k
.
pk
11
.
.
.
.
12 . . . 1 p
22 . . . 22
.
. . . .
. . . .
. . . pp
j j {
1 2
( 1Y 2Y )2
2
Y
'( 1 2 )( 1 2 ) '
'
( ) 2
. Karena adalah
'
( ) 2
dapat dimaksimumkan jika
'
' c1 c1 (1 2 )
dengan memilih c=1, menghasilkan kombinasi linier yang disebut
kombinasi linier Fisher sebagai berikut:
Y ' X (1 2 )1 X
n11Y n2 2Y
n1 n2
dengan
cutting
score,
sehingga
dapat
sebagai
anggota
kelompok
kode
jika
ratio,
yaitu
rasio
antara
observasi
yang
tepat
P(k x)
pk f k ( x)
pk f k ( x)
k
Dimana
1
(2 )
p
2
1
exp ( x k ) 1 ( x k ); k 0,1
2
perusahaan
bergerak
dalam
penjualan
Air
Mineral
Dalam
Tipe konsumen dari banyak tipe Air Mineral yang minum dengan kode:
Kemasan
Apakah ada perbedaan yang signifikan antara konsumen yang banyak minum air
mineral dengan konsumen yang sedikit minum air mineral?
Jika ada perbedaan yang signifikan, variabel apa saja yang membuat perilaku
konsumsi air mineral mereka berbeda?
Membuat model diskriminan dua faktor (tipe sedikit dan tipe banyak) untuk kasus
tersebut
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
Wilks'
Lambda
.945
.934
.946
.894
1.000
.946
F
4.247
5.173
4.186
8.656
.000
4.183
df 1
df 2
1
1
1
1
1
1
73
73
73
73
73
73
Sig.
.043
.026
.044
.004
.994
.044
Analisis
Tabel diatas adalah hasilpengujian untuk setiap variabel bebas yang ada.
Keputusan bisa diambil lewat dua cara.
Dengan F test
Perhatikan angka signifikan.
Jika sig. > 0.05 berarti tidak ada perbedaan antar grup
Jika sig < 0.05 berarti ada perbedaan antar grup
Analisis dari data diatas adalah
Variabel Usia, angka sig. < 0.05 (yaitu; 0.043). Hal ini berarti ada perbedaan
antar grup, atau usia responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Berat, angka sig. < 0.05 (yaitu; 0.026). Hal ini berarti ada perbedaan
antar grup, atau berat badan responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Tinggi, angka sig. < 0.05 (yaitu; 0.044). Hal ini berarti ada perbedaan
antar grup, atau tinggi responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Income, angka sig. < 0.05 (yaitu; 0.004). Hal ini berarti ada
perbedaan antar grup, atau income responden memengaruhi banyak sedikitnya
mengkonsumsi air mineral.
Variabel Jam Kerja, angka sig. > 0.05 (yaitu; 0.994). Hal ini berarti tidak ada
perbedaan antar grup, atau jam kerja responden tidak memengaruhi banyak
sedikitnya mengkonsumsi air mineral.
Variabel Olah Raga, angka sig. < 0.05 (yaitu; 0.44). Hal ini berarti ada
perbedaan antar grup, atau olah raga responden memengaruhi banyak
sedikitnya mengkonsumsi air mineral.
Dari 6 varible tersebut ada lima variabel berbeda secara signifikan untuk dua group
diskriminan, yaitu USIA, BERAT, TINGGI, INCOME, OLAH RAGA. Dengan demikian
sedikit atau banyaknya konsumsi air mineral dipengaruhi oleh variabel-variabel tersebut.
UJI VARIANS DARI SETIAP VARIABEL,
Uji selanjutnya adalah menguji varians dari setiap variabel. Dapat dilakukan dengan dua
cara yaitu dengan Boxs M atau dilihat dari output LOG DETERMINANT.
Analisis diskriminan mempunyai asumsi bahwa:
Varians variabel bebas untuk tiap grup seharusnya sama. Jika demikian,
seharusnya varians dari responden yang sedikit mengkonsumsi air mineral sama
dengan varians dari responden yang banyak mengonsumsi air mineral.
Varians diantara variabel-variabel bebas seharusnya juga sama. Jika demikian,
seharusnya varians dari income sama dengan varians dari olah raga.
Kedua pengertian diatas bisa disimpulkan, seharusnya group covariance matrices
adalah relatif sama, yang di uji dengan alat Boxs M dengan ketentuan:
HIPOTESIS
: group covariance matrices adalah relatif sama
: group covariance matrices adalah berbeda secara nyata
diterima
ditolak
Test Results
Box's M
F
Approx.
df 1
df 2
Sig.
29.866
1.297
21
19569.371
.163
Tests null hy pothesis of equal populat ion cov ariance mat rices.
Analisis
Dari tabel terlihat bahwa angka sig. > 0,05, yaitu 0.163 yang menerima
berarti group
covariance matrices adalah relatif sama. Hal ini berarti data di atas sudah memenuhi
asumsi analisis diskriminan.
Log Determi nants
MINUM
.00
1.00
Pooled within-groups
Rank
6
6
6
Log
Determinant
14.081
14.520
14.706
Analisis
Terlihat angka log determinant untuk kategori SEDIKIT (14,081) dan BANYAK (14,520)
tidak berbeda banyak, sehingga group covariance matrices akan relatif sama untuk kedua
grup.
B. MELAKUKAN ANALISIS DISKRIMINAN
Dari SPSS diperoleh output sebagai berikut
Group Statistics
MINUM
.00
1.00
Total
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
Mean
31.8684
57.2105
158.4474
659.4737
5.2684
3.1974
28.9459
51.8108
161.5676
578.9189
5.2686
2.9054
30.4267
54.5467
159.9867
619.7333
5.2685
3.0533
Analisis
Tabel GROUP STATISTICS pada dasarnya berisi data statistic yang utama, yaitu rata-rata
dan standar deviasi dari kedua grup konsumen.
Misalnya, Konsumen yang termasuk tipe SEDIKIT meminum air mineral mempunyai
berat badan rata-rata 57,21 kilogram. Sedangkan konsumen yang termasuk tipe
BANYAK meminum air mineral mempunyai berat badan rata-rata 51,81 kilogram.
Terlihat bahwa ada 38 responden yang tergolong sedikit mengonsumsi air mineral,
sedangkan 37 responden lainnya tergolong banyak mengonsumsi air mineral. Semua
variabel terisi angka 38 atau 37, maka pada kasus ini tidak ada data yang hilang, sehingga
total data untuk semua variabel adalah 75 buah. Tentu ini adalah keadaan yang ideal.
Variables Entered/Removeda,b,c,d
Min. D Squared
Step
1
2
3
Entered
Stat istic
INCOME
.462
BERAT
.776
TINGGI
1.208
Between
Groups
.00 and
1.00
.00 and
1.00
.00 and
1.00
Exact F
Stat istic
df 1
df 2
Sig.
8.656
73.000
4.367E-03
7.170
72.000
1.446E-03
7.343
71.000
2.351E-04
At each st ep, the v ariable that maximizes t he Mahalanobis distance between t he two closest
groups is entered.
a. Maximum number of steps is 12.
b. Maximum signif icance of F to ent er is .05.
c. Minimum signif icance of F to remov e is .10.
d. F lev el, tolerance, or VIN insuf f icient f or f urther computation.
Analisis
Tabel ini menyajikan variabel mana dari variabel input yang bisa dimasukkan ke dalam
persamaan diskriminan.
Karena proses adalah stepwise (bertahap), maka akan dimulai dengan variabel yang
mempunyai angka F hitung (statistic) terbesar.
Tahap pemasukan variabel bebas:
Pada tahap pertama, angka F hitung variabel Income adalah terbesar, mencapai 8.656
maka pada tahap ini variabel Income terpilih.
Pada tahap kedua, dengan variabel yang berkurang satu, angka F hitung terbesar
kedua adalah Berat,mencapai 7.170 maka pada tahap kedua ini variabel Berat terpilih.
Pada tahap ketiga, dengan variabel sudah berkurang dua, angka F hitung terbesar
ketiga adalah Tinggi, mencapai 7.343, maka pada tahap ketiga ini variabel Tinggi
terpilih.
Ketiga variabel tersebut mempunyai angka sig. < 0.05 yaitu angka sig. Income adalah
4.367E-03 < 0.05, angka sig. Berat adalah 1.446E-03 < 0.05, angka sig. Tinggi adalah
2.351E-04 < 0.05.
Dengan demikian, dari lima variabel yang dimasukkan hanya ada tiga variabel yang
signifikan. Dengan kata lain Income, Berat, Tinggi konsumen memengaruhi perilaku
konsumen tersebut sedikit atau banyak minum air mineral.
St ep
1
2
INCOME
INCOME
BERAT
INCOME
BERAT
TINGGI
Tolerance
1.000
Sig. of F to
Remov e
.004
Min. D
Squared
.997
.004
.276
.997
.026
.462
.993
.004
.647
.944
.008
.721
.943
.012
.776
Between
Groups
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
Analisis
Pada Step 1, variabel Income adalah variabel pertama yang masuk ke dalam model
diskriminan. Karena variabel tersebut mempunyai angka sig. of F to remove yang
paling sedikit, yaitu 0.004. < 0.05
Pada Step 2, dimasukkan variabel kedua, yaitu Berat. Karena mempunyai angka sig.
0f F to remove sebesar 0.26 < 0.05.
Pada Step 3, dimasukkan variabel ketiga, yaitu Tinggi. Karena mempunyai angka sig.
of F to remove sebesar 0.012 < 0.05.
Step
0
Tolerance
USIA
BERAT
TINGGI
INCOME
JAMKERJA
OLAHRAGA
USIA
BERAT
TINGGI
JAMKERJA
OLAHRAGA
USIA
TINGGI
JAMKERJA
OLAHRAGA
USIA
JAMKERJA
OLAHRAGA
Min.
Tolerance
Sig. of F
to Enter
Min. D
Squared
1.000
1.000
.043
.227
1.000
1.000
.026
.276
1.000
1.000
.044
.223
1.000
1.000
.004
.462
1.000
1.000
.994
.000
1.000
1.000
.044
.223
.318
.318
.542
.484
.997
.997
.026
.776
.997
.997
.042
.721
1.000
1.000
.952
.462
.538
.538
.953
.462
.317
.316
.458
.812
.943
.943
.012
1.208
.995
.993
.837
.778
.537
.537
.876
.777
.316
.316
.524
1.238
.958
.908
.779
1.214
.523
.523
.798
1.213
Between
Groups
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
.00 and
1.00
Analisis
Pada Step 0, keenam variabel secara lengkap ditayangkan dengan angka sig. of F to
remove sebagai fakor uji. Angka sig. of F to remove variabel Income terkecil yaitu
0.004 < 0.05. Maka variabel Income dikeluarkan dari step 0, yang berarti variabel
Income bukan termasuk variabel yang tidak dianalisis.
Pada Step 1, tersisa lima variabel. Angka sig. of F to remove variabel Berat terkecil
yaitu 0.026 < 0.05. Maka variabel Berat dikeluarkan dari step 1, yang berarti variabel
Berat bukan termasuk variabel yang tidak dianalisis.
Pada Step 2, tersisa empat variabel. Angka sig. of F to remove variabel Tinggi terkecil
yaitu 0.012< 0.05. Maka variabel Tinggi dikeluarkan dari step 2, yang berarti variabel
Tinggi bukan termasuk variabel yang tidak dianalisis.
Pada Step 3, tersisa tiga variabel. Angka sig. of F to remove ketiga variabel tersebut
lebih dari 0.05. Maka variabel tersebut tidak dikeluarkan dari step 3, yang berarti
variabel Tinggi termasuk variabel yang tidak dianalisis.
Wi lks' Lambda
Step
1
2
3
Number of
Variables
1
2
3
Exact F
Lambda
.894
.834
.763
df 1
df 2
1
2
3
df 3
1
1
1
Stat istic
8.656
7.170
7.343
73
73
73
df 1
1
2
3
df 2
73.000
72.000
71.000
Sig.
4.367E-03
1.446E-03
2.351E-04
Wilks Lambda pada prinsipnya adalah varians total dalam discriminant scores yang tidak
bisa dijelaskan oleh perbedaan di antara grup-grup yang ada.
Analisis
Pada Step 1, jumlah variabel yang dimasukkan ada satu Income dengan angka Wilks
Lambda adalah 0.894. hal ini berarti 89,4 % varians tidak dapat dijelaskan perbedaan
antara grup-grup.
Pada Step 2, dengan tambahan variabel Berat, angka Wilks Lambda turun menjadi
0.834.
Pada Step 3, angka Wilks Lambda turun menjadi 0.763. penurunan angka Wilks
Lambda baik untuk model diskriminan, karena varians yang tidak bisa dijelaskan juga
semakin kecil.
Function
1
Cumulat iv e %
100.0
Canonical
Correlation
.487
Analisis
Canonical Correlation mengukur keeratan hubungan antara discriminant score dengan
grup (pada kasus ini, karena ada dua tipe konsumen, maka ada dua grup). Angka 0.487
menunjukkan keeratan yang cukup tinggi, dengan skala asosiasi antara 0 sampai 1.
Wi lks' Lambda
Test of Function(s)
1
Wilks'
Lambda
.763
Chi-square
19.321
df
3
Sig.
.000
Analisis
Tabel diatas menyatakan angka akhir dari Wilks Lambda. Angka Chi-Square sebesar
19.321 dengan tingkat signifikansi yang tinggi menunjukkan perbedaan yang jelas antara
dua grup konsumen.
Structure Matrix
INCOME
USIAa
BERAT
OLAHRAGAa
TINGGI
JAMKERJAa
Function
1
.618
.521
.478
.475
-.430
-.069
Analisis
Tabel diatas menjelaskan korelasi antara variabel independen dengan fungsi diskriminan
yang terbentuk. Varibel Income paling erat hubungannya dengan fungsi diskriminan,
diikuti oleh variabel Berat dan Tinggi.
BERAT
TINGGI
INCOME
(Constant)
Function
1
.064
-.093
.006
7.884
Analisis
Tabel diatas menunjukkan FUNGSI DISKRIMINAN:
Kegunaan fungsi ini untuk mengetahui seorang konsumen air mineral masuk pada Grup
yang kesatu atau tergolong pada Grup yang kedua.
Functions at Group Centroids
MINUM
.00
1.00
Function
1
.542
-.557
Analisis
Karena ada dua tipe konsumen, maka disebut Two-Group Discriminant, dimana grup yang
satu mempunyai Centroid (Grup Means) negative, dan grup yang satu mempunyai
Centroid (Grup Means) positif. Angka pada tabel menunjukkan besaran Z yang
memisahkan kedua grup tersebut.
Gambar :
BANYA
SEDIK
K
Z= - 0,557
IT
Z= 0,542
N=3
N=3
Terlihat distribusi anggota grup dengan kode 0 (sedikit) dan kode 1 (banyak) , dimana dari
75 responden, 37 orang pada Grup Banyak, dan 38 orang ada pada Grup Sedikit.
Prior Probabilities for Groups
MINUM
.00
1.00
Total
Prior
.500
.500
1.000
Analisis
Tabel diatas memperihatkan komposisi ke 75 responden, yang dengan model diskriminan
menghasilkan 37 responden ada di Grup Banyak dan 38 responden ada di Grup Sedikit.
Classificati on Function Coefficients
BERAT
TINGGI
INCOME
(Constant)
MINUM
.00
1.00
3.506E-02 -3.48E-02
3.587
3.690
3.641E-02 3.007E-02
-297.882
-306.557
Analisis
Memberikan persamaan dengan pembagian berdasrkan Grup.
Konsumen yang minum air mineral dalam kategori Sedikit:
SCORE = -297,882 + 3,506E-2 BERAT + 3,587 TINGGI + 3,641E-02 INCOME
Konsumen yang minum air mineral dalam kategori Banyak:
SCORE = -306,557 3,48E-02 BERAT + 3,690 TINGGI + 3,007E-02 INCOME
Analisis
Pada tabel Discriminant Score menunjukkan penghitungan score dari perilaku konsumen
dalam mengonsumsi air mineral.
Hasil score tersebut selanjutnya akan dibandingkan dengan cut off score, untuk
mengetahui apakah konsumen masuk dalam Grup Sedikit atau Grup banyak.
MINUM
.00
1.00
Total
Prior
.500
.500
1.000
Dari tabel diatas didapat jumlah responden Sedikit adalah 38 orang, sedangkan responden
Banyak adalah 37 orang. Dengan demikian dengan mengaitkannya dengan angka grup
centroid, didapat:
(
0
Perhitungan
(angka kriris):
Dimana:
: Angka kritis, yang berfungsi sebagai cut off score
: jumlah sampel dari grup A dan B, yang dalam kasus ini adalah grup Sedikit
dan Banyak
: angka centroid pada Grup A dan B
Perhitungan :
Penggunaan angka
(Discriminating Z score):
Sebagai contoh:
Case number 1 (Rusdi) mempunyai score 1,571. Karena 1,571 > 0, maka Rusdi
masuk pada grup 0 (Sedikit).
Case number 2 (Nina) mempunyai score 1,724. Karena 1,724 > 0, maka Nina masuk
pada grup 0 (Sedikit).
Case number 15 (Esti) mempunyai score -0,223. Karena -0,223 < 0, maka Esti masuk
pada grup 1 (Banyak).
Kesimpulan:
Konsumen yang masuk pada tipe SEDIKIT adalah Rusdi, Nina, Lanny, Citra, Dina,
Lenny, Rudi, Roby, Bambang, Yunus, Lestari, Erni, Hesty, Lilis, Lita, Rani, Hengky,
Hana, Eli, Renata, Dewe, Jodan, Rina, Herman, Sobari, Rully, Leoni, Agnes, Deddy,
Dodik, Conny, Mary, Susy, James, Joni, Melani, Susana, Titik, Nanik, Nuning.
Konsumen yang masuk pada tipe BANYAK adalah Siska, Lusi, Esti, Hany, Susan, Lina,
Baby, Andre, Gunawan, Lina, Vina, Sugeng, Handoko, Binsar, Fanny, Fenny, Yulita,
Yulia, Richard, Rosy, Dimas, Kiky, Usman, Salim, Joni, Kristanto, Karim, Rusmin,
Sulastri, Liliana, Prihardi, Suhardi, Tatik, Ninik, Gala.
Classification Resultsb,c
Original
Count
%
Cross-v alidateda
Count
%
MINUM
.00
1.00
.00
1.00
.00
1.00
.00
1.00
Predicted Group
Membership
.00
1.00
27
11
13
24
71.1
28.9
35.1
64.9
27
11
13
24
71.1
28.9
35.1
64.9
Total
38
37
100.0
100.0
38
37
100.0
100.0
Analisis
Pada tabel diatas, perhatikan bagian Original, terlihat bahwa mereka yang pada data awal
adalah tergolong Sedikit, dan dari klasifikasi Fungsi Diskriminan tetap pada kelompok
Sedikit adalah 27 orang. Sedangkan dengan model diskriminan, mereka yang awalnya
masuk grup Sedikit, ternyata menjadi anggota grup Banyak adalah 11 orang.
Demikian juga dengan grup Banyak yang tetap pada grup Banyak sejumlah 24 orang dan
yang tidak di grup Banyak adalah 13 orang.
Dengan demikian, ketepatan prediksi dari model adalah:
Karena angka ketepatan tinggi maka model diskriminan di atas sebenarnya bisa digunakan
untuk analisis diskriminan.
Setelah terbukti bahwa Fungsi Diskriminan mempunyai ketepatan prediksi yang tinggi,
maka fungsi diskriminan tersebut bisa digunakan untuk memprediksi sebuah kasus,
apakah akan diklasifikasikan ke tipe sedikit atau tipe banyak.
Kesimpulan
Dari proses diskriminan, dimulai uji variabel sampai analisis output, sehingga didapat
kesimpulan yang terkait dengan tujuan awal.
Ada perbedaan yang signifikan antara konsumen yang banyak minum dengan
konsumen yang sedikit minum air mineral. Hal ini dibuktikan pada analisis Wilks
Lambda.
Variabel yang membuat perilaku konsumsi air mineral mereka berbeda adalah Berat
Badan, Tinggi Bada, dan Income.
Model atau fungsi diskriminan untuk kasus tersebut adalah:
BAB III
PENUTUP
Kesimpulan
Analisis diskriminan merupakan suatu teknis analisis multivariat yang digunakan
untuk mengelompokkan atau mengklasifikasi suatu objek dalam dua kelompok atau lebih
berdasarkan variabel independentnya.
Asumsi analisis diskriminan yang harus dipenuhi adalah :
5. Variabel independen seharusnya berdistribusi normal multivariat (Multivariate
Normality)..
6. Matriks varians kovarians grup dari semua variabel independen seharusnya sama.
7. Tidak ada data yang sangat ekstrim (outlier) pada variabel independen..
8. Tidak ada korelasi yang kuat antar-variabel independen.
Fungsi diskriminannya Y b0 b1 X i1 b2 X i 2 ... b j X ij
Secara pasti tidak ada jumlah sampel yang ideal pada analisis diskriminan. Setiap
variabel independen sebaiknya ada 5-20 data (sampel). Dengan demikian, jika ada enam
variabel independen, seharusnya minimal ada 6x5=30 sampel.
Tujuan diskriminan secara umum adalah :
Ingin mengetahui apakah ada perbedaan yang jelas antar grup pada variabel
dependen atau bisa dikatakan apakah ada perbedaan antara anggota grup 1 dengan
anggota grup 2.
Jika ada perbedaan, variabel independen manakah pada fungsi diskriminan yang
membuat perbedaan.
Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan
persamaan regresi.
Menentukan metode untuk membuat fungsi diskriminan. Pada prinsipnya ada dua
metode dasar untuk itu, yaitu:
5. SIMULTANEOUS ESTIMATION, di mana semua variabel dimasukkan
secara bersama-sama kemudian dilakukan proses diskriminan.
6. STEP-WISE ESTIMATION, dimana variabel dimasukkan satu per satu ke
dalam modeldiskriminan. Pada proses ini, tentu ada variabel yang tetap ada
pada model, dan ada kemungkinan satu atau lebih variabel independen
yang dibuang dari model.