Anda di halaman 1dari 37

ANALISIS DISKRIMINAN

Dr. Ir. Imam Buchori Ir. Artiningsih, MSi


1

PENDAHULUAN

Pertama kali diperkenalkan oleh Fisher (1936). Digunakan untuk mengetahui variabel-variabel penciri yang membedakan kelompok populasi yang ada dan juga dapat dipergunakan sebagai kriteria pengelompokkan. Banyak dipakai dalam berbagai bidang ilmu pengetahuan, misalnya : Psikologi (Lie, 1964), Pendidikan (John, 1968), Geografi (Mather, 1969), Geologi (Davis, 1973) dan berbagai bidang ilmu lainnya.

PENDAHULUAN (Lanjutan)

Pada prinsipnya hampir sama dengan Regression Analysis. Mempunyai Dependen Variabel (Y) dan Independen Variabel (X) yang mempengaruhi Dependen Variabel. Regression Analysis : 1. Linier Regression (2 Variabel) 2. Multiple Regression ( >2 Variabel) Discriminant Analysis : 1. Diskriminan 2 Group (2 Variabel Penciri) 2. Diskriminan 3 Group (>2 Variable Penciri)

DEFINISI dan CARA KERJA


Definisinya adalah : Teknik analisis statistik untuk menggolongkan populasi / individu / objek menjadi kelompok-kelompok sendiri dalam sekumpulan variabel independent. Cara kerjanya adalah : Maksimasi variansi antar kelompok dan minimasi variansi dalam kelompok. Menentukan nilai setiap individu dalam sampel, dimana nilai setiap individu adalah rata-rata bobot dari individu dalam sejumlah variabel independent.
4

TUJUAN
Untuk

mencari model yang sesuai untuk dapat menentukan objek-objek pengamatan menjadi kelompokkelompok yang lengkap. Untuk menentukan kontribusi masing-masing variabel yang terlibat dalam pengklasifikasian. Sebagai dasar penentuan apakah suatu variabel tertentu perlu dilibatkan dalam analisa pengklasifikasian selanjutnya atau tidak.

PRINSIP DASAR / ASUMSI-ASUMSI YANG BERLAKU

Variabel independent (1p) mempunyai distribusi normal. Matriks p x p atau matriks variant covariant untuk setiap kelompok (1k) harus sama. Pengamatan dari masing-masing group dipilih secara acak / random.

CONTOH PENGGUNAAN :
Untuk menentukan suatu daerah yang termasuk dalam tingkat kriminalitasnya tinggi / rendah diperlukan data : Jumlah tindakan kriminalitas (var. dependent) Jumlah polisi, jumlah kantor polisi, jumlah penduduk berpendapatan rendah, jumlah keluarga yang mendiami permukiman kumuh, jumlah penduduk berpendidikan rendah (var. independent). Catatan : Kemampuan untuk mengelompokkan objek pengamatan sangat menentukan keberhasilan analisis diskriminan.
7

FORMULA UMUM ANALISIS DISKRIMINAN

Y = b X
Dimana : Y = Vektor nilai diskriminan untuk individu (1 x n) b = Vektor bobot diskriminan (1 x p) X = Matriks yang mengandung nilai-nilai untuk setiap n individu pada p independen variabel.

ANALOGI DENGAN ANALISA REGRESI

Dependen Variabel (Y) pada multiple regresi adalah suatu nilai kuantitatif, sedangkan pada discriminant analysis, dependen variabel adalah suatu nilai kualitatif. Pada analisis regresi, variabel dependen (Y) menjadi satu fokus yang berubah (prediktif) dan variabel independen (x) relatif tetap, sedangkan pada analisis diskriminan, variabel dependen relatif tetap (kelompok) dan variabel independen berubah-ubah serta terdistribusi normal. Analisis Regresi menurunkan perkiraan-perkiraan parameter yang telah mempunyai kelengkapan statistik, sedang analisis diskriminan merupakan strategi yang teliti dalam menemukan mean dari pengelompokkan.

PERMASALAHAN 2 GROUP
Misal kita memiliki dua kelompok populasi yang bebas. Populasi 1 diambil sampel sebesar n1 serta dipelajari p karakter dari sampel tersebut. Populasi 2 diambil sampel sebesar n2 serta dipelajari p karakter dari sampel tersebut.
Sehingga keseluruhan sampel dari populasi 1 dan populasi 2 adalah n = n1 + n2

10

PERMASALAHAN 2 GROUP (Lanjutan.)

P karakter yang dipelajari bila dinyatakan dalam variabel (multidimensional) melalui vektor x = (x1 , x2 ,., xp)

(1) ( pxn1)

( X11, X12 ,.....,X1n1 )

( 2) ( pxn2)

( X 21, X 22 ,.....,X 2n2 )

11

PERMASALAH 2 GROUP (Lanjutan.)

Sehingga vektor nilai rata-rata dan matriks variance kovariance dirumuskan sebagai berikut :

X1

1 n1
n1

X
j 1

n1

1 ' S1 ( X X )( X X ) 1 1 1j 1j n1 1 j 1
12

PERMASALAHAN 2 GROUP (Lanjutan..)

Asumsi populasi mempunyai peragam yang sama yaitu maka matrik peragam S1 & S2 dapat digabung sebagai penduga bagi Melalui rata-rata terbobot sebagai berikut :
SG ( n1 1).S1 ( n2 1). S 2 ( n1 n2 2)

Diskriminan dibangun untuk menerangkan perbedaan diantara populasi perlu diuji apakah ada perbedaan yang nyata secara statistik (uji statistik T2-Hotteling)

13

UJI HIPOTESIS PADA ANALISIS DISKRIMINAN

H0 : U1 = U2 ; vektor nilai rata-rata dari populasi 1 sama dengan dari populasi 2 H1 : U1 U2 ; kedua vektor nilai rata-rata itu berbeda
2

n1.n2 1 ' T ( X 1 X 2 ) SG ( X 1 X 2 ) n1 n2 Selanjutnya.

n1 n2 p 1 2 F T (n1 n2 2) p
14

UJI HIPOTESIS PADA DISK. ANALISIS (Lanjutan..)


F adalah derajat kebebasan yang berdistribusi, dimana v1= p dab v2 = n1+ n2 p -1
1. Kaidah keputusan. Terima Ho : U1 = U2 , jika T2 - tabel T2 - hitung 2. Selain itu ada alternatif lain :

Terima H0 : U1 = U2, jika F- tabel F-hitung


Tolak H0 : U1 = U2, jika F- tabel > F-hitung.
15

FUNGSI DISKRIMINAN LINIER FISHER

Y b X ( X 1 X 2 ) .SG .X
' '

Dimana : b : vektor koefisien pembobot fungsi diskriminan X : vektor variabel acak (yang diident) dalam diskriminan X1 : vektor nilai rata-rata dari variabel acak kelompok 1 X 2 : vektor nilai rata-rata dari variabel acak kelompok 2 1 SG : invers matriks gabungan
16

ATURAN PENGGOLONGAN

Menurut Fisher untuk menetapkan individu dengan nilai x di p pada kelompok 1 :

b' ( X X 1 ) b' ( X X 2 )
pada kelompok 2 jika ;

b ( X X 1) b ( X X 2 )
' '

Cara lain adalah Metoda mid point

m ( X 1 X 2 ) SG .( X 1 X 2 )
1 2 '
17

ATURAN PENGGOLONGAN (Lanjutan)

m ( X 1 X 2 ) SG .( X 1 X 2 )
1 2 '

Bila ukuran sampel tidak sama (n1 n2), maka :

n2 .Y 1 n1Y 2 m n1 n2

18

ATURAN PENGGOLONGAN MID POINT


Kelompok 1 jika yo > m 2 jika yo m Yo = skor diskriminan dari individu Metode lain adalah Wald Anderson Statistic W
W X 1SG ( X 1 X 2 )
1

1 1 ( X 1 X 2 )1 SG ( X 1 X 2 ) 2

Alokasikan pada kelompok 1. Jika W > 0 2. Jika W 0.

19

BAHAN BACAAN

Anderson, Black, Hair and Tatham, Multivariate Data Analysis, Fifth Edition, Prentice Hall, USA, 1998 Gasperz, Teknik Analisis dalam Penelitian Percobaan, Edisi ke-2, Tarsito, Bandung, 1992. William R Dillon and Mathew Goldstein, Multivariate Analysis Methods and Applications, USA, 1984.

20

Contoh Aplikasi
Analisis Diskriminan

21

Contoh Aplikasi

Sebuah toko yang bernama LAKU KERAS selama ini menduga ada dua kelompok pembeli, yaitu mereka yang sering berbelanja di toko LAKU KERAS dan mereka yang jarang berbelanja di toko tersebut. Jika ini benar, pihak manajemen ingin mengetahui faktor apa saja yang mendorong seorang konsumen untuk sering atau jarang berbelanja di toko tersebut. Kepada setiap responden diberikan daftar kuesioner yang memuat pertanyaan tentang pendapat responden terhadap atribut-atribut toko LAKU KERAS serta frekuensi belanja di toko tersebut.
22

Contoh Pertanyaan
Bagaimana dengan fasilitas pendingin udara yang ada pada toko LAKU KERAS? ________________________________________________________________ 1. Sangat Tidak Sejuk

5. Sangat Sejuk

Responden memberi tanda x pada di sembarang tempat di antara garis 1 sampai 5, yang akan diukur oleh periset sebagai jawaban responden dalam bentuk angka. Semua pengukuran atribut mempunyai arah yang sama, yaitu angka 1 untuk penilaian negatif dan angka 5 untuk penilaian positif. Hasil pengukuran adalah bersifat numerik seperti 3,4 atau 2,5 dan sebagainya.
23

Variabel (untuk 40 responden)


1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Layout, yaitu tata letak barang di toko LAKU KERAS. Lengkap, yaitu kelengkapan barang di toko. Harga, yaitu harga yang murah dan kompetitif. Musik, yaitu fasilitas musik untuk para pengunjung toko. AC, yaitu fasilitas pendingin udara untuk pengunjung toko. Lampu, yaitu fasilitas penerangan untuk pengunjung toko. Pelkar, yaitu pelayanan karyawan toko. Pelkasir, yaitu pelayanan kasir toko. Promosi, yaitu kegiatan promosi toko LAKU KERAS. Image, yaitu citra toko di mata konsumen

24

Variabel (lanjutan)

Selain itu kepada setiap konsumen ditanyakan apakah mereka:


Sering membeli di toko LAKU KERAS dengan kode 0. Jarang membeli di toko LAKU KERAS dengan kode 1.

Dengan demikian, sekarang terdapat dua kelompok variabel, yaitu:

SEBUAH variabel dependen, yaitu variabel berjenis kategori, dengan kode 0 (sering beli) dan 1 (jarang beli).

SEPULUH variabel independen, yaitu atribut yang diduga membuat perbedaan perilaku konsumen yang menjadi sering membeli atau jarang membeli.
25

Variabel
VARIABEL DEPENDEN (Kategori) Y: Kode 0 = Sering Kode 1 = Jarang VARIABEL INDEPENDEN X1 . Layout X2 . Lengkap X3 . Harga Xn . dst

26

Tujuan Analisis (dalam kasus ini)


1. Apakah perilaku beli konsumen benar-benar berbeda, dalam arti mereka yang sering membeli perilakunya benar-benar berbeda dengan yang jarang membeli? Jika berbeda, variabel bebas mana saja yang membedakan perilaku beli konsumen? Semua variabel bebas atau hanya sebagian? Jika ada sejumlah variabel yang membedakan (diskriminan) maka ada sebuah model diskriminan. Jika ada sejumlah variabel bebas yang membedakan perilaku, variabel mana yang paling penting dan seterusnya? Dilakukan pengujian apakah model diskrimanan tersebut mampu melakukan klasifikasi responden dengan tepat?

2.

3.

4.

27

Langkah Pengerjaan-01

Buka program SPSS dan masukkan data yang ada dengan terlebih dahulu mendefinisikan variabel yang akan dimasukkan datanya Dari menu utama SPSS, pilih menu Analyze, lalu submenu Classify, kemudian pilih Discriminant.

28

Langkah Pengerjaan-02

Masukkan variabel beli ke grouping variabel yang berfungsi sebagai dependen variabel dan masukkan kode kategori yang dipakai.
Pengisian:

Masukkan angka 0 pada minimum. Masukkan angka 1 pada maksimum.

Tekan Continue untuk kembali pada kotak dialog discriminant. Masukkan variabel-variabel lainnya pada kotak independents yang berarti kesepuluh variabel ini berfungsi sebagai variabel bebas.

29

Langkah Pengerjaan-03

Klik tombol Statistics dan aktifkan pilihan sesuai tampilan layar berikut ...... Klik Continue untuk kembali ke kotak dialog utama.

30

Langkah Pengerjaan-04

Klik mouse pada pilihan Stepwise Method dan klik tombol Method sehingga akan tampak di layar ......

Pilihan Stepwisie berarti pemasukan variabel akan dilakukan secara bertahap.

Pada bagian Method, pilih Mahalanobis Distance dan bagian Criteria pilih Use Probability of F tetapi jangan mengubah isi yang telah ada. Abaikan pilihan yang lain dan tekan Continue untuk kembali ke menu utama.

31

Langkah Pengerjaan-05

Pada menu utama klik tombol Classify, sehingga akan tampak di layar........

Pada bagian Display, aktifkan pilihan Casewise Results dan juga aktifkan pilihan Leave-oneout classification.

Abaikan pilihan yang lain dan klik Continue untuk kembali ke menu utama. Pada menu utama klik OK untuk proses data.

32

Group Statistics

Interpretasi-01

Beli .00

Tidak ada data yang hilang:


1.00

22

orang sering belanja 18 orang jarang belanja Total = 40 orang

Total

Layout Lengkap Harga Musik AC Lampu Pelkar Pelkasir Promosi Image Layout Lengkap Harga Musik AC Lampu Pelkar Pelkasir Promosi Image Layout Lengkap Harga Musik AC Lampu Pelkar Pelkasir Promosi Image

Mean 2.8091 2.6136 3.2227 2.7955 2.4682 2.4455 2.2818 2.9000 3.0864 2.9364 2.8833 2.7944 2.9611 2.7833 2.9111 2.6056 3.1222 2.6111 2.6778 2.6111 2.8425 2.6950 3.1050 2.7900 2.6675 2.5175 2.6600 2.7700 2.9025 2.7900

Std. Deviation 1.27126 1.01807 1.01603 1.16393 1.10556 1.04139 .89583 1.31258 1.14363 1.18745 .85147 1.10479 1.02334 1.00250 .97973 1.04795 1.09306 1.01974 1.20614 1.04875 1.08979 1.04806 1.01475 1.08055 1.06130 1.03401 1.06405 1.18413 1.17506 1.12496

Valid N (listwise) Unweighted Weighted 22 22.000 22 22.000 22 22.000 22 22.000 22 22.000 22 22.000 22 22.000 22 22.000 22 22.000 22 22.000 18 18.000 18 18.000 18 18.000 18 18.000 18 18.000 18 18.000 18 18.000 18 18.000 18 18.000 18 18.000 40 40.000 40 40.000 40 40.000 40 40.000 40 40.000 40 40.000 40 40.000 40 40.000 40 40.000 40 40.000

33

Interpretasi-02

Walupun terdapat satu atribut perbedaan perilaku konsumen tapi secara umum tidak ada perbedaan yang nyata antara mereka yang sering berbelanja di toko LAKU KERAS dengan mereka yang jarang berbelanja di toko tersebut (Tabel Test of Equality of Group Means).
Semakin mendekati nol semakin berbeda Semakin mendekati satu semakin sama

Tests of Equality of Group Means Wilks' Lambda .999 .992 .983 1.000 .956 .994 .842 .985 .969 .979 F .045 .289 .652 .001 1.758 .233 7.149 .583 1.203 .824 df1 1 1 1 1 1 1 1 1 1 1 df2 38 38 38 38 38 38 38 38 38 38 Sig. .833 .594 .424 .972 .193 .632 .011 .450 .280 .370

Wilks Lamda:

Sig:
Sig>0.05 tidak ada perbedaan Sig<0.05 ada perbedaan

Layout Lengkap Harga Musik AC Lampu Pelkar Pelkasir Promosi Image

Semakin tinggi angka F semakin ada perbedaan

34

Interpretasi-03

Atribut yang paling membedakan perilaku kedua kelompok tersebut adalah atribut PELKAR Perhatikan nilai Sig.-nya
a,b,c,d Variables Entered/Remov ed

Min. D Squared Between Groups .00 and 1. 00 Exact F Statistic 7.149 df1 1 df2 38.000 Sig. .011

Step 1

Entered Pelkar

Statistic .722

At each step, the variable that maximizes the Mahalanobis distance between the two closest groups is entered. a. Maximum number of steps is 20. b. Maximum significance of F to enter is .05. c. Minimum significance of F to remove is .10. d. F level, tolerance, or VIN insufficient for further computation.

35

Interpretasi-04

Sehubungan dengan hasil dari no. 2, maka kesembilan atribut yang ada bukanlah variabel yang membedakan perilaku kedua kelompok. Atau dapat dikatakan sikap mereka terhadap kesembilan atribut tersebut relatif sama (sama-sama positif atau sama-sama negatif).
36

Interpretasi-05

Model diskriminan yang ada tidak dapat digunakan karena walaupun hasil menunjukkan tingkat validitasnya di atas 50 % (60% valid), hanya satu variabel yang mempengaruhi pembedaan, itupun tidak cukup signifikan. Model ini belum dapat digunakan sebagai bahan untuk pengambilan keputusan secara menyeluruh (Tabel Classification Results).

b,c Classification Results

Original

Count %

Cross-validated a

Count %

Beli .00 1.00 .00 1.00 .00 1.00 .00 1.00

Predicted Group Membership .00 1.00 15 7 8 10 68.2 31.8 44.4 55.6 14 8 8 10 63.6 36.4 44.4 55.6

Total 22 18 100.0 100.0 22 18 100.0 100.0

a. Cross validation is done only for those cases in the analysis. In cross validation, each case is classified by the functions derived from all cases other than that case. b. 62.5% of original grouped cases correctly classified. c. 60.0% of cross-validated grouped cases correctly classified.

37