Anda di halaman 1dari 13

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

ANALISIS DISKRIMINAN

Discriminant analysis is useful in situation where the total sample can be divided into group

based on a dependent variable characterizing several known case. The primary objectives of

multiple discriminant analysis are to understand group differences and to predict

the

likelihood that entity (individual of object) will belong to a particular class or group based

on several metric independent variable,” (Hair, Anderson, Tatham, Black, 1995).

[Analisis diskriminan berguna pada situasi di mana sampel total dapat dibagi menjadi group-

group berdasarkan karateristik variabel yang diketahui dari beberapa kasus. Tujuan utama

dari analisis multipel diskriminan adalah untuk mengetahui perbedaan antargroup,”(Hair,

Anderson, Tatham, Black, 1995).]

Analisis diskriminan digunakan untuk memodelkan suatu hubungan antara variabel

dependen yang berdata kategori dengan beberapa variabel independen (prediktor). Analisis

diskriminan berusaha untuk mengelompokan setiap objek ke dalam dua atau lebih kelompok

berdasarkan pada sejumlah kriteria variabel independen. Asumsi dalam analisis diskriminan

yaitu :

1. Tidak adanya multikolinieritas antara variabel independen.

2. Variabel independen mengikuti distribusi normal.

3. Adanya homogenitas varians antara kelompok data.

Contoh kasus

Sebuah tempat pariwisata, yang banyak dikunjungi wisatawan akan melakukan survei

terhadap

para

pengunjung.

Variabel

penelitian,

antara

lain

informasi

tempat

wisata,

sikap/persepsi, jumlah keluarga, umur kepala keluarga, dan pendapatan responden. Informasi

tempat wisata di bagi 2 kelompok yaitu kelompok yang mendapatkan informasi dari promosi

dan

kelompok

yang

tidak

mendapatkan

informasi

promosi.

Pihak

manajemen

ingin

 

1

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

mengetahui faktor apa yang mempengaruhi pada masing masing kelompok? Dan apakah ada

perbedaan yang signifikan antara kelompok pertama dan kedua? Data sebagai berikut :

Informasi

Sikap

Jumlah keluarga

Umur KK

Pendapatan

1

5

3

43

502000

1

4

4

61

703000

1

5

6

52

629000

1

5

5

36

485000

1

4

4

55

527000

1

5

5

68

750000

1

4

3

62

462000

1

2

6

51

570000

1

5

4

57

641000

1

5

5

45

681000

1

4

5

44

734000

1

3

4

64

719000

1

1

6

54

562000

1

4

3

56

493000

1

4

2

58

620000

0

4

3

58

321000

0

4

2

55

362000

0

2

2

57

432000

0

5

4

37

504000

0

5

3

42

441000

0

5

2

45

383000

0

2

2

57

550000

0

5

3

51

461000

0

5

5

64

350000

0

1

4

54

373000

0

2

3

56

418000

0

5

2

36

570000

0

5

2

50

334000

0

2

3

48

375000

0

2

2

42

413000

Langkah-langkah SPSS :

1)

Pilh Analyze > Classify > Discriminant

 

2)

Pindahkan

variabel

Informasi

ke

kolom

Grouping

Variable,

klik

Define

Range.

Masukan angka 0 ke kotak Minimium dan 1 ke kotak Maximum.

 

3)

Pindahkan

variabel

sikap,

jumlah

keluarga,

umur

KK,

dan

pendapatan

ke

kolom

Independent.

 

4)

Pilih Statistic dan Pilih Univariate's Anova dan Box's M kemudian Continue

 

5)

Klik OK

2

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Hasil Output SPSS

Group Statistics

www.statistikolahdata.com

Informasi

Valid N (listwise)

 

Unweighted

Weighted

Tidak ada promosi

Sikap

15

15.000

Jumlah keluarga

15

15.000

Umur KK

15

15.000

Pendapatan

15

15.000

Promosi

Sikap

15

15.000

Jumlah keluarga

15

15.000

Umur KK

15

15.000

Pendapatan

15

15.000

Total

Sikap

30

30.000

Jumlah keluarga

30

30.000

Umur KK

30

30.000

Pendapatan

30

30.000

Tabel Group Statistics menerangkan bahwa kasus yang dianalisis ada 30 responsden. 15

responden mendapatkan informasi promosi dan 15 responden tidak mendapatkan informasi

responden.

 

Tests of Equality of Group Means

 
 

Wilks' Lambda

F

df1

df2

Sig.

Sikap

.978

.627

 

1 28

.435

Jumlah keluarga

.657

14.636

1 28

.001

Umur KK

.954

1.338

1 28

.257

Pendapatan

.453

33.796

1 28

.000

Tabel Tests of Equality of Group Means di atas adalah hasil analisis untuk menguji kesamaan

rata-rata variabel. Uji ini menggunakan Wilks' lambda dan nilai signifikansi. Jika angka

Wilks' Lambda mendekati angka 0 maka cenderung ada perbedaan dalam kelompok.

Ketentuan dengan nilai signifikansi :

Jika signifikansi > 0,05 maka tidak ada perbedaan dalam kelompok

Jika signifikansi < 0,05 maka ada perbedaan dalam kelompok

3

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

Untuk variabel sikap nilai signifikasi 0,435 (> 0,05) maka tidak ada perbedaan

Untuk variabel jumlah keluarga nilai signifikansi 0,001(< 0,05) maka ada perbedaan

Untuk variabel umur KK, nilai signifikansi 0,257 (> 0.05) maka tidak ada perbedaan

Untuk variabel pendapatan, nilai signifikansi 0,000 (< 0,05) maka ada perbedaan

Dengan demikian jumlah keluarga dan pendapatan merupakan faktor pembeda dalam mencari

informasi promosi wisata. Artinya jumlah keluarga sedikit dan banyak akan mempengaruhi

kelompok

untuk

penghasilan.

Analysis 1

mencari

informasi

promosi

wisata.

Demikian

juga

halnya

dengan

Box's Test of Equality of Covariance Matrices

Log Determinants

 

Informasi

Rank

Log Determinant

Tidak ada promosi Promosi Pooled within-groups

4

26.946

4

27.483

4

27.791

The ranks and natural logarithms of determinants printed are those of the group covariance matrices.

 

Test Results

Box's M

16.133

F

Approx.

1.361

df1

10

df2

3748.207

Sig.

.192

Tests null hypothesis of equal population covariance matrices.

Untuk menguji kesamaan varian digunakan angka Box' M dengan ketentuan sebagai

berikut :

Jika signifikansi > 0,05 maka HO diterima

Jika signifikansi < 0,05 maka H0 ditolak

4

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Hipotesis :

www.statistikolahdata.com

H0 = Varians kedua kelompok data identik/homogen

H1 = Varians kedua kelompok data tidak sama/heterogen.

Dari nilai p-value statistik uji Box' M diketahui nilai p-value 0,192 (> 0,05) maka terima H0.

Dengan demikian varians kelompok data adalah identik/homogen.

NB : jika tidak terpenuhinya asumsi ini dapat dilakukan eksplorasi data untuk melihat

kemungkinan ada tidaknya outlier data.

Summary of Canonical Discriminant Functions

Eigenvalues

Function

     

Canonical

Eigenvalue

% of Variance

Cumulative %

Correlation

1

1.720

a

100.0

100.0

.795

a. First 1 canonical discriminant functions were used in the analysis.

Pada tabel Eigenvalues terdapat nilai canonical correlation. Nilai canonical correlation

digunakan

untuk

mengukur

derajat

hubungan

antara

hasil

diskriminan

atau

besarnya

variabilitas yang mampu diterangkan oleh variabel independen terhadap variabel dependen.

Dari tabel di atas, diperoleh nilai canonical correlation sebesar 0,795 bila di kuadratka (0,795

x 0,795) =

0.632025, artinya 63,20 % varians dari variabel independen (kelompok ) dapat

dijelaskan dari model diskriminan yang terbentuk.

Wilks' Lambda

Test of Function(s)

Wilks' Lambda

Chi-square

df

Sig.

1

.368

26.013

4

.000

Pada tabel Wilk's Lambda diketahui nilai signifikansi statistics C hi-square sebesar 0,000 (<

0,05) yang berarti ada perbedaan yang signifikan antara kedua kelompok responden yang

didasarkan pada keempat variabel bebas.

5

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Structure Matrix

Function

1

Pendapatan

Jumlah keluarga

Umur KK

Sikap

.838

.551

.167

.114

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.

www.statistikolahdata.com

Tabel Structure Matrix menunjukan urutan karakteristik yang paling membedakan perilaku

dua

kelompok

wisatawan.

Karakteristik

kemudian jumlah keluarga.

Functions at Group Centroids

Informasi

Function

 

1

Tidak ada promosi Promosi

-1.267

1.267

Unstandardized canonical discriminant functions evaluated at group means

pendapatan

adalah

yang

paling

membedakan,

Berdasarkan angka tabel di atas , terdapat dua kelompok yang berbeda yaitu kelompok yang

tidak ada promosi

dengan centroid (rata-rata kelompok) negatif dan kelompok yang

mendapatkan promosi dengan centroid (rata-rata kelompok ) positif.

Analisis akan dilanjutkan dengan menguji signifikansi perbedaan antara dua kelompok dan

mencari faktor pembeda yang mempengaruhi terbentuknya klasifikasi dua kelompok tersebut.

Caranya sebagai berikut :

1)

Pilih Analyze > Classify > Discriminant

6

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

2)

Pindahkan variabel informasi ke kolom Grouping Variable

3)

Define Range : isikan 0 pada minimum dan 1 pada Maximum

4)

Pindahkan variabel sikap, jumlah keluarga, umur KK dan pendapatan ke kolom

Independent.

5)

Aktifkan pilihan “Use stepwise Methode

6)

Pilih Statistics : Pada Descriptives, pilih Means dan function Coeficient pada pilihan

Fisher's dan Unstandardized, kemudian Continue.

7)

Pilih Methode : Aktifkan pilihan Malahanobis Distance dan aktifkan pilihan Use

probabability of F tanpa mengubah angka 0,05. Tekan Continue

8)

Pada Classify : Aktifkan Casewise Results dan Leave One Out Classification.

Tekan Continue.

9)

Tekan OK.

Hasil Output SPSS

Output tidak ditampilkan semuanya, karena beberapa bagian sudah di bahas sebelumnya.

Group Statistics

Informasi

Mean

Std. Deviation

Valid N (listwise)

     

Unweighted

Weighted

Tidak ada promosi

Sikap

3.60

1.549

15

15.000

Jumlah keluarga

2.80

.941

15

15.000

Umur KK

50.13

8.271

15

15.000

Pendapatan

419133.33

75511.462

15

15.000

Promosi

Sikap

4.00

1.195

15

15.000

Jumlah keluarga

4.33

1.234

15

15.000

Umur KK

53.73

8.771

15

15.000

Pendapatan

605200.00

98306.518

15

15.000

Total

Sikap

3.80

1.375

30

30.000

Jumlah keluarga

3.57

1.331

30

30.000

Umur KK

51.93

8.574

30

30.000

Pendapatan

512166.67

127952.330

30

30.000

Tabel di atas berisi data statistik descriptif, seperti rata-rata untuk variabel bebas yang

7

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

digunakan untuk kelompok pertama dan kelompok kedua. Sebagai contoh pada kelompok

yang memperoleh promosi , pada variabel sikap nilai rata-ratanya 4,00, sedangkan yang tidak

memperoleh promosi sebesar 3,60. Artinya rata-rata sikap terhadap tempat wisata pada

kelompok pertama lebih tinggi dibandingkan dengan kelompok kedua.

Variables Entered/Removed a,b,c,d

Step

Entered

 

Min. D Squared

 
   

Statistic

Between Groups

 

Exact F

 
       

Statistic

df1

df2

Sig.

1

Pendapatan

4.506

Tidak ada

33.796

 

1 3.027E-6

28.000

 

promosi and

Promosi

2

Jumlah

5.978

Tidak ada

21.616

2 2.484E-6

27.000

keluarga

promosi and

Promosi

At each step, the variable that maximizes the Mahalanobis distance between the two closest groups is

entered.

a. Maximum number of steps is 8.

b. Maximum significance of F to enter is .05.

c. Minimum significance of F to remove is .10.

d. F level, tolerance, or VIN insufficient for further computation.

Pada tabel di atas dapat dilihat bahwa hanya terdapat variabel pendapatan dan jumlah

keluarga, karena hanya dua variabel ini yang memenuhi persyaratan. Metode yang dilakukan

menggunakan metode “Stepwise”, yaitu memasukkan variabel satu persatu tidak secara

sekaligus seperti pada analisis sebelumnya. Variabel pendapatan nilai F sebesar 33,796

dengan nilai p-value statistik 3.027E-6 (atau 0,00000303). Sedangkan variabel jumlah

keluarga nilai F sebesar 21,616 dengan nilai p-value statistik 2.484E-6 (atau 0,000002484).

Pada tabel Variable s in the analysis di bawah, menunjukan kondisi urutan variabel-variabel

yang dianalisis. Tahapan pemasukan variabel ditentukan oleh besar kecilnya angka sig of F to

Remove

dimanaangka

terkecil

akan

di

dahulukan.

Variabel

pendapatan

mempunyai

signifikansi sebesar 0,00, oleh karena itu variabel ini di masukan terlebih dahulu. Selanjutnya

variabel jumlah keluarga dengan nilai signifikansi (0,037).

8

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

 

Variables in the Analysis

 

Step

Tolerance

 

Sig. of F to Remove

Min. D Squared

Between Groups

1

Pendapatan

 

1.000

 

.000

   

2

Pendapatan

 

.992

 

.000

1.952

Tidak ada

     

promosi and

Promosi

 

Jumlah keluarga

 

.992

 

.037

4.506

Tidak ada

     

promosi and

Promosi

 

Wilks' Lambda

 
   

Exact F

   

Step

Statistic

df1

df2

Sig.

 

1 33.796

 

1

28.000

.000

2 21.616

2

27.000

.000

Angka signifikansi untuk dua variabel sebesar 0,000 dengan nilai F 33.796 pada tahap satu

dan pada tahap 2 signifikansi sebesar 0,000 dengan nilai F 21.616. karena nilai signifikansi

0,000

(<

0,05)

signifikan.

maka

variabel

masing-masing

kelompok

mempunyai

Eigenvalues

Function

     

Canonical

Eigenvalue

% of Variance

Cumulative %

Correlation

1

1.601

a

100.0

100.0

.785

perbedaan

yang

a. First 1 canonical discriminant functions were used in the analysis.

Nilai korelasi kanonikal menunjukan hubungan antara nilai diskriminan dengan kelompok.

Nilai sebesar 0,785 berarti hubungannya sangat tinggi karena mendekati angka 1 (besarnya

korelasi antara 0-1).

9

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

Structure Matrix

Function

1

Pendapatan Jumlah keluarga Umur KK a Sikap a

.868

.571

-.033

.001

Pooled within-groups correlations between discriminating variables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function. a. This variable not used in the analysis.

Tabel

di atas menunjukan adanya korelasi antara variabel-variabel bebas dengan fungsi

diskriminan yang terbentuk. Variabel pendapatan mempunyai korelasi yang paling tinggi

dengan nilai korelasi sebesar 0,868. variabel jumlah keluarga nilai korelasinya sebesar 0,571.

sedangkan umur KK (-0,033) dan sikap (0,001) tidak dimasukan dalam proses analisis

diskriminan, hal ini ditandai dengan tanda “a” pada kedua variabel tersebut.

Canonical Discriminant Function Coefficients

Function

1

Jumlah keluarga

Pendapatan

(Constant)

.454

.000

-6.433

Unstandardized coefficients

Tabel di atas menunjukan fungsi diskriminan dengan persamaan sebagai berikut :

Z score = -6,433 (konstan) + 0,454 jumlah keluarga + 0,00 pendapatan

fungsi ini berguna untuk menganalisis kasus atau responden yang diteliti akan termasuk ke

dalam kelompok mana, yaitu kelompok pertama atau kedua.

Pada tabel Function at group Centroisds di bawah ini, menerangkan terdapat dua kelompok

diskriminan, yaitu kelompok yang tidak memperoleh promosi dengan rata-rata kelompok

(centroid) negatif dan kelompok yang memperoleh promosi dengan rata-rata kelompok

(centroid ) positif.

10

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Functions at Group Centroids

Informasi

Function

 

1

Tidak ada promosi Promosi

-1.222

1.222

Unstandardized canonical discriminant functions evaluated at group means

Classification Processing Summary

Processed

Excluded

30

0

0

30

Missing or out-of-range group codes At least one missing discriminating variable

Used in Output

www.statistikolahdata.com

Tabel di atas menunjukan jumlah kasus (responden) sebanyak 30 yang di proses dan tidak ada

data yang hilang (missing).

Prior Probabilities for Groups

Informasi

Prior

Cases Used in Analysis

   

Unweighted

Weighted

Tidak ada promosi Promosi Total

.500

15

15.000

.500

15

15.000

1.000

30

30.000

Kelompok yang tidak ada promosi sebanyak 15 responden sedangkan kelompok yang

mendapat promosi sebanyak 15 responden.

Classification Function Coefficients

Informasi

Tidak ada

promosi

Promosi

Jumlah keluarga

Pendapatan

(Constant)

1.952

5.238E-5

-14.404

3.062

7.536E-5

-30.132

Fisher's linear discriminant functions

Bagian ini sama dengan bagian Canonical Discriminant Function Coefficients di atas yang

sudah dibahas. Persamaannya sebagai berikut :

11

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

www.statistikolahdata.com

Untuk kelompok yang tidak ada promosi, persamaannya :

Nilai = -14,404 (konstan) + 1,952 (jumlah keluarga) + 0,00005238 (pendapatan)

Untuk kelompok tang ada promosi, persamaannya :

Nilai = -30,132 (konstan) + 3,062 (jumlah keluarga) + 0,00007536 (pendapatan)

Selisis antara kedua kelompok :

Nilai Z = 15,728 (konstan) + 5,014 (jumlah keluarga) + 0.00012916 (pendapatan)

Classification Results b,c

 

Predicted Group Membership

 

Tidak ada

 
 

Informasi

promosi

Promosi

Total

Original

Count

Tidak ada promosi

14

1

15

Promosi

3

12

15

%

Tidak ada promosi

93.3

6.7

100.0

Promosi

20.0

80.0

100.0

Cross-validated a

Count

Tidak ada promosi

13

2

15

Promosi

4

11

15

%

Tidak ada promosi

86.7

13.3

100.0

Promosi

26.7

73.3

100.0

a. Cross validation is done only for those cases in the analysis. In cross validation, each case is

classified by the functions derived from all cases other than that case.

b. 86.7% of original grouped cases correctly classified.

c. 80.0% of cross-validated grouped cases correctly classified.

Tabel di atas pada kolom Original baris “Tidak ada promosi sebanyak 14 responden atau

93,3 %, sedangkan 1 responden (6,7%) berpindah ke kelompok yang ada “Promosi”.

Sementara itu, 12 responden (80%) yang berada dikelompok “promosi”, sedangkan 3

responden (20%) berpindah ke kelompok yang “Tidak ada promosi.

Ketepatan fungsi diskriminan dapat dihitung dengan cara :

14 + 12 /30 = 0,866 atau 86,6 %

Kesimpulan :

(1) Terdapat perbedaan yang signifikan antara kelompok responden yang memperoleh

promosi dengan kelompok yang tidak ada promosi.

12

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com

(2) Faktor-faktor

pendapatan.

yang

membuat

berbeda

www.statistikolahdata.com

adalah

variabel

jumlah

keluarga

dan

(3) Ketepatan fungsi diskriminan adalah sebesar 86,6%. Ketepatan ini tinggi karena

mendekati angka 100%.

(4) Persamaan fungsi dskriminan adalah :

Nilai Z = 15,728 (konstan) + 5,014 (jumlah keluarga) + 0.00012916 (pendapatan)

13

Jasa Olah Data, Hub : 08816637417 / 087737940271, email : suseno16@gmail.com