Anda di halaman 1dari 40

Analisis Variabel Dummy (Variabel terikat)

Untuk Memenuhi Tugas Mata Kuliah:


EKONOMETRIKA
(ABKC1508)
DOSEN PENGAMPU:
Drs. H. Karim, M.Si
Rizki Amalia, M.Pd

Disusun Oleh:
1. Iskandar

(A1C113014)

2. H. M. Fazri Arif Billah

(A1C113063)

PROGRAM STUDI PENDIDIKAN MATEMATIKA


JURUSAN PENDIDIKAN MATEMATIKA DAN IPA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMBUNG MANGKURAT
BANJARMASIN
2016

KATA PENGANTAR
Puji syukur kami panjatkan kepada Allah SWT yang telah melimpahkan karunia kepada
hambaNya, sehingga makalah yang berjudul Analisis Variabel Dummy (Variabel
terikat) ini dapat diselesaikan.
Dengan terselesaikannya makalah ini diharapkan makalah ini dapat memberi manfaat
kepada pembaca. Selain itu, tak lupa pula kami mengucapkan terima kasih kepada semua pihak
yang telah membantu dalam penyelesaian makalah ini.
Terima kasih sebesar-besarnya penulis ucapkan kepada Bapak Drs. H. Karim, M.Si. dan
Ibu Rizky Amalia, M.Pd. selaku dosen pengajar yang telah memberikan bimbingan dan arahan
dalam pengerjaan dan penyusunan bahan hingga dapat disajikan dalam karya tulis ini. Tidak lupa
ucapan terima kasih kepada pihak-pihak yang tidak bisa disebutkan satu per satu yang juga turut
membantu dalam proses penyusunan makalah ini.
Kami menyadari bahwa dalam pembuatan makalah ini masih banyak memiliki
kekurangan baik dari segi penulisan, isi dan lain sebagainya. Kami mengharapkan saran dan
kritik yang membangun demi kesempurnaan makalah ini. Atas perhatian semua pihak, kami
mengucapkan terima kasih.

Banjarmasin, 28 Desember 2015

Penulis

Daftar Isi

KATA PENGANTAR.......................................................................................................................i
Daftar Isi..........................................................................................................................................ii
BAB I...............................................................................................................................................1
PENDAHULUAN...........................................................................................................................1
A.

Latar Belakang.........................................................................................................................1

B.

Rumusan Masalah....................................................................................................................1

C.

Tujuan......................................................................................................................................1

BAB II.............................................................................................................................................2
PEMBAHASAN..............................................................................................................................2
A.

Kajian Teori.............................................................................................................................2
1.

Pemodelan Matematis...........................................................................................................3

2.

Model Logit..........................................................................................................................5

3.

Pengolahan Logit..................................................................................................................6

B.

Contoh Kasus...........................................................................................................................8
1.

Langkah Langkah Analisis regresi Variabel dummy ( variable terikat)...............................9


a. Input data ke dalam SPSS.................................................................................................9
b.

Pada variable view masukan variable Y, X1,X2, dan X3..............................................9

c. Klik Analyze pilih regression kemudian klik binary logistic..........................................11


d.
Masukkan Y sebagai variabel dependen dengan cara klik Y di kotak kiri, kemudian
klik tanda panah di samping kotak Dependent. Masukkan X1, X2 dan X3 ke dalam kotak
Covariates, dengan cara klik masing-masing variabel, kemudian klik tanda panah di
samping kotak Covariates. Dan klik Ok................................................................................11
e. Kemudian klik Classification plots, Hosmer-Lemeshow goodness-of-fit, Correlation of
estimates, dan Iteration of History. Selanjutnya klik Continue.............................................12
f.
2.

Selanjutnya klik OK........................................................................................................12


Interpretasi output SPSS.....................................................................................................12

a. Identifikasi Data yang hilang..........................................................................................12


b.

Pemberian kode variable respon oleh SPSS................................................................12

c. Uji signifikansi omnibus terhadap model.......................................................................13


d.

Menilai keseluruhan model (overall model fit) dan menilai kelayakan model regresi
13
2

e. Menguji Koefisien Regresi.............................................................................................14


f.
1.

Penafsiran dan prediksi...................................................................................................16


Analisis Data.......................................................................................................................22

a. Langkah-LangkahAnalisis Data Menggunakan Spss....................................................22


b.

Analis Data Hasil Output SPSS...................................................................................26

BAB III..........................................................................................................................................34
KESIMPULAN..............................................................................................................................34
Daftar Pustaka................................................................................................................................36

BAB I
PENDAHULUAN
A. Latar Belakang
Variabel dependent pada dasarnya tidak hanya dapat dipengaruhi
oleh variabel independent kuantitatif, tetapi juga dimungkinkan oleh
variabel kualitatif. (Catatan: sebenarnya variabel dependent juga dapat
berbentuk variabel kualitatif, tetapi hal tersebut akan kita bahas pada
tulisan yang lain). Lalu bagaimana cara kita memasukkan variabel
independent kualitatif tersebut (yang tidak berbentuk angka) ke dalam
model regresi kita?
Variabel

kualitatif

tersebut

harus

dikuantitatifkan

atributnya

(cirinya). Untuk mengkuantitatifkan atribut variabel kualitatif, dibentuk


variabel dummy dgn nilai 1 dan 0. Jadi, inilah yang dimaksud dengan
variabel dummy tersebut. Nilai 1 menunjukkan adanya, sedangkan nilai 0
menunjukkan tidak adanya ciri kualitas tsb. Misalnya variabel jenis
kelamin. Jika nilai 1 digunakan untuk laki-laki maka nilai 0 menunjukkan
bukan laki-laki (perempuan), atau sebaliknya.
Dalam makalah ini kita akan memprediksikan pengaruh Uang saku, jenis kelamin,
dan penghasilan orang tua terhadap kemungkinan seorang anak menabung dengan model
regresi binary logistic variabel terikat dummy.

B. Rumusan Masalah
1. Apa itu model regresi variabel dummy terikat?
2. Bagaimana menganalisis kasus model regresi variabel dummy terikat dengan SPSS?

C. Tujuan
1. Mengetahui apa itu model regresi variabel dummy terikat.
2. Dapat menganalisis kasus model regresi variabel dummy terikat dengan SPSS.

BAB II
PEMBAHASAN
A. Kajian Teori
Persamaan regresi baik sederhana maupun berganda yang telah dipelajari pada babbab lalu, hanya menunjukan hubungan antara variabel numerik baik variabel terikat maupun
variabel bebasnya. Padahal untuk mengungkapkan suseatu fenomena, tidak jarang
dibutuhkan variabel bukan numerik, yang salah satunya adalah variabel kategorik.
Dalam model regresi, variabel kategorik yang berharga nol atau satu bias disebut
dengan variabel dummy. Dalam aplikasinya, variabel dummy ini sangat bermanfaat untuk
mengkuantifikasi data kualitatif, seperti : jenis kelamin, status perkawinan, kualitas produk,
kepuasan pelayanan, dan sebagainya. Disamping itu, variabel dummy juga bermanfaat untuk
malihat model regresi yang berubah arah maupun terjasinya loncatan trend pada kurun
waktu yang berbeda, serta dapat juga dipergunakan untuk membuat model regresi yang
linier sebagian-sebagian.
Variabel dummy disebut juga variabel indicator, biner, kategorik, kualitatif, boneka,
atau variabel dikotomi. Suatu persamaan regresi dahat hanya menggunakan variabel
kategorik sebagai variabel bebas tetapi daoat pula disertai oleh variabel bebas lain yang
numeric. Regresi dengan variabel bebasnya hanya vriabel dummy atau yang sifatnya
kualitatif disebut model Analysis of Variance (ANOVA).
Misalkan : sebuah perusahaan parfum ingin melakukan marketing research, untuk
mengetahui segmen pasar pada berbagai macam jenis produknya. Segmen pasar yang
dimaksud diukur berdasarkan daerah tempat tinggal responden, yaitu kota atau desa,dan
harga berbagai macam produk. Atau dengan kata lain, akan dilihat hubungan antara daerah
tempat tinggal responden dengan harga yang dipilih. Untuk kepentingan tersebu, perusahaan
mengadakan observasi di beberapa daerah untuk mengumpulkan data. Setelah data
terkumpul, maka digunakan model regresi untuk menghasilkan hasil penilitian.
Sebagai ilustrasi analisis regresi variabel dummy terikat, model ini muncul pada
kasus-kasus seperti berikut : Misalkan ingin mempelajari partisipasi wanita dewasa apda
2

angkatan kerja sebagai fungsi rata-rata upah, pendapatan suami, umur, banyaknya anak usia
sekolah, dan lain-lain. Variabel terikatnya partisipasi angkatan kerja wanita.
Model ini juga dipakai untuk menganalisis apakah buruh/pekerja menjadi anggota
dari serikat pekerja atau tidak. Variabel terikatnya berupa keikutsertaan seseorang dalam
suatu serikat.
Selain itu juga dapat mengamati hubungan antara pernah tidaknya melakukan
perjalanan luar negeri dan faktor ynag mempengaruhinya seperti pendapatan, jenis
pekerjaan, dll. Variabel terikatnya pernah tidaknya melakukan perjalanan keluar negeri.
Biasanya suatu variabel terikat diasumsikan dengan 1 dan 0 untuk tidak. Dari
contoh-contoh diatas ada satu hal yang menarik yaitu variabel terikatnya merupakan suatu
jawaban YA atau TIDAK atau berupa Variabel Dikotomi.

1. Pemodelan Matematis
Perhatikan kembali model regresi sederhana yang telah kita analsis:
Y i= 1 + 2 X i +ui
X

pendapatan

1 ; bila seseorang pernah melakukan perjalanan ke luar negeri


0 ; bila seseorang tidak pernah melakukan perjalanan ke luar negeri.
Ekspekstasi kondisional dari Yi jika diberikan Xi yang lazim dinotasikan dengan E

( Yi | Xi ) dapat dicari sebagai berikut :


E ( Yi | Xi ) = E ( Yi = 1 ). P( Yi = 1 | Xi ) + E ( Yi = 0 ). P( Yi = 0 | Xi ) = P ( Yi = 1| Xi )
Ekspektasi kondisional tersebut dapat juga diinterprestasikan sebagai probabilitas
kondisional bahwa suatu peristiwa akan terjadi bila X (pendapatan) diketahui. Secara notasi
dituliskan Pr ( Yi = 1| Xi ) yang menyatakan probabilitas bahwa seseorang pernah melakukan
perjalanan keluar negeri bila pendapatannya diketahui. Dengan kata lain E ( Yi | Xi ) dapat
diartikan sebagai Pr (Yi = 1| Xi) yaitu probabilitas bahwa seseorang pernah melakukan
3

perjalanan keluar negeri. Dengan dasar inilah model tersebut disebut Model Probabilitas
Linier.
Linear Probability Model (LPM) merupakan metode regresi yang umum digunakan
sebelum logit dan probit model dikembangkan. LPM bekerja dengan dasar bahwa variabel
respon Y, yang merupakan probabilita terjadinya sesuatu, mengikuti Bernoulli probability
distribution dimana:

Sumber: wcr.sonoma.edu
Gambar diatas menunjukkan bahwa garis dari Linear Probability Model (LPM) sangat
minim menjelaskan atau mempresentasikan dari variabel dependent yang diskrit. Oleh
karena itu, karena LPM bekerja berdasarkan metode OLS biasa maka timbul permasalahan
yang telah diungkapkan sebelumnya: non-normality of the disturbance, heteroscedastis,
tidak terpenuhinya ekspektasi nilai Y antara satu sampai dengan nol, dan tidak dapat
digunakannya R sebagai pengukur Goodness of Fit. Kebutuhan akan model probabilita
yang menghasilkan Y yang terletak antara interval satu sampai dengan nol dengan
hubungan antara Pt dengan Xt yang tidak linear menyebabkan logit model dikembangkan.

2. Model Logit
Model Linear Probability Model memiliki masalah, tidak dapatnya memberikan hasil
nilai Y yang terletak pada interval 1 dan 0, padahal niai probabilitas mengharuskan kisaran

nilainya diantara 1 dan 0. dikarenakan mereka menggunakan OLS atau regresi linear dalam
melakukan estimasinya, atau dengan persamaan sebagai berikut:

Dikarenakan persamaan regresi linear tidak dapat memenuhi persyaratan nilai


probabilitas tersebut, di buatlah model logit yang menggunakan persamaan eksponensial
untuk mendapatkan nilai probabilitas pada interval 1 dan 0, Dimana persamaan model
Logit menjadi seperti berikut:

Dimana Zi = 1 + 2Xi.
Persamaan diatas lebih dikenal sebagai logistic distribution function. Persyaratan yang
diminta sebelumnya, yaitu model probabilita yang menghasilkan Y antara interval satu
sampai dengan nol dengan hubungan antara Pt dengan Xt yang tidak linear, dapat
terpenuhi. Hal ini disebabkan, saat Z berkisar antara - sampai dengan , Pi berkisar
antara 0 dan 1 sehingga Pi tidak berhubungan linear dengan Z. Meskipun begitu masih
terdapat masalah estimasi karena P tidak hanya tidak linier pada X tetapi juga ke .
Namun, seperti dapat ditunjukkan pada persamaan berikut, masalah estimasi tersebut dapat
diatasi. Setelah itu kita perlu menentukan persamaan kejadian gagal, dengan merujuk
kepada Bernoulli probability distribution. Maka kita akan mendapatkan persamaan seperti
dibawah ini:
Setelah kita memiliki persamaan kejadian sukses dan persamaan kejadian gagal, maka
kita dapat pula membuat Odds Ratio yang merupakan peluang sukses dibagi dengan
peluang gagal, dengan rumus matematika seperti dibawah.

Untuk mendapatkan nilai z yang sudah linier maka kita perlu melakukan treatment
tambahan setelah melakukan odd ratio dimana dengan mengalikan persamaan diatas
dengan Logaritma Natural dengan tujuan membuat persamaan menjadi linear, sehingga
bentuk persamaan akan menjadi seperti dibawah ini:

Logaritma Natural atau ln dari odds ratio tidak hanya bersifat linear pada X tetapi juga
bersifat linear terhadap parameter. Persamaan tersebut yang kemudian dikenal sebagai
model logit. Kelebihan dari model logit tersebut adalah:

Saat P berpindah dari 0 ke 1, logit L akan berpindah dari - ke .Oleh karena itu,
meskipun probabilita terletak antara 0 hingga 1, logit sendiri tidak terbatasi. Dan
meski L linear terhadap X, probabilitanya sendiri tidak.

L (logit) yang bernilai positif menandakan bahwa meningkatnya nilai regresor akan
menyebabkan meningkatnya odds dari regresan yang setara dengan 1. Sebaliknya, L
(logit) yang bernilai negative menandakan bahwa menurunnya odds dari regresan yang
setara dengan 1akan menyebabkan meningkatnya nilai dari X.

Model logit yang diberikan pada persamaan lima dapat diinterpretasikan sebagai
berikut: slope 2 merupakan pengukur perubahan nilai L karena perubahan nilai X,
sementara Intercept 1 merupakan nilai dari log-odds apabila nilai suatu slope nol.
Logit model juga mengasumsikan bahwa log sebuah odds ratio berhubungan linier
terhadap Xi atau nilai sebuah slope.

3. Pengolahan Logit

Untuk menguji signifikansi suatu koefisien secara statistik, kita menggunakan Z


statistik (distribusi normal).

Dalam binary regressand model, kita menggunakan pseudo R2, yang mirip dengan
R2, untuk mengukur goodness of fit. Program Stata secara otomatis menyediakan
pengukuran tersebut, yaitu McFadden R2, yang ditulis dengan Pseudo R2.

Mirip dengan F test pada model regresi linear adalah likelihood ratio (LR) statistik.
LR statistik mengikuti ditribusi 2 dengan derajat kebebasan (degree of freedom)
sama dengan jumlah variabel bebas

Mencari Odds Ratio dari setiap variabel independent

Margina Effek dari setiap variabel independent

Mencari probabilitas setiap variabel independent terhadap variabel dependentnya .


Tujuan

menggunakan

regresi

berganda

dummy

adalah

memprediksi besarnya nilai variabel tergantung/dependent atas dasar


satu atau lebih variabel bebas/independent, di mana satu atau lebih
variabel bebas yang digunakan bersifat dummy. Variabel dummy
adalah variabel yang digunakan untuk membuat kategori data yang
bersifat kualitatif (data kualitatif tidak memiliki satuan ukur), agar data
kualitatif dapat digunakan dalam analisa regresi maka harus lebih
dahulu di transformasikan ke dalam bentuk Kuantitatif. contoh data
kualitatif misal jenis kelamin adalah laki-laki dan perempuan, harus di
transform ke dalam bentuk Laki-laki = 1 ; Perempuan = 0. atau tingkat
pendidikan misal SMA dan Sarjana, maka diubah menjadi SMA = 0 ;
Sarjana = 1, skala yang terdiri dari dua yakni 0 dan 1 disebut kode
Binary, sedangkan persamaan model yang terdiri dari Variabel
Dependentnya

Kuantitatif

dan

variabel

Independentnya

skala

campuran : kualitatif dan kuantitatif, maka persamaan tersebut disebut


persamaan regresi berganda Dummy. Dalam kegiatan penelitian,
kadang variabel yang akan diukur bersifatKualitatif, sehingga muncul
kendala dalam pengukuran, dengan adanya variabel dummy tersebut,
maka besaran atau nilai variabel yang bersifat Kualitatif tersebut dapat
di ukur dan diubah menjadi kuantitatif.

B. Contoh Kasus
Berikut akan diberikan contoh kasus beserta penjelasannya:
7

Misalkan kita ingin memprediksikan pengaruh Uang saku, jenis kelamin, dan
penghasilan orang tua terhadap kemungkinan seorang anak menabung
No
1

Y
0

X1
15000

X2
1

X3
1

16000

10000

14000

5000

5000

20000

10000

6000

10

7000

11

10000

12

10000

13

6000

14

10000

15

6000

16

7000

17

19000

18

5000

19

5000

20

8000

Keterangan :
y={ 0 tidak suka menabung
1 suka menabung
X 1=uang saku anak

X 2={0 perempuan
1lakilaki
X 3={0 penghasilan orang tuakurang dari3000000
1 penghasilan orang tua lebih dari3000000

1. Langkah Langkah Analisis regresi Variabel dummy ( variable terikat)


a. Input data ke dalam SPSS

b. Pada variable view masukan variable Y, X1,X2, dan X3


1. Pada Baris Y kolom Values. Berikan 0 pada velue untuk label tidak suka
menabung. Dan berikan 1 pada value untuk label suka menabung

2. Pada Baris X2 kolom Values. Berikan 0 pada velue untuk label


perempuan. Dan berikan 1 pada value untuk label laki-laki

3. Pada Baris X3 kolom Values. Berikan 0 pada velue untuk label


penghasilan orang tua kurang dari 3.000.000. Dan berikan 1 pada value
untuk label Penghasilan orang tua lebih dari atau sama dengan 3.000.000

10

c. Klik Analyze pilih regression kemudian klik binary logistic

d. Masukkan Y sebagai variabel dependen dengan cara klik


Y di kotak kiri, kemudian klik tanda panah di samping
kotak Dependent. Masukkan X1, X2 dan X3 ke dalam kotak
Covariates, dengan cara klik masing-masing variabel,
kemudian klik tanda panah di samping kotak Covariates.
Dan klik Ok.

11

e. Kemudian klik Classification plots, Hosmer-Lemeshow


goodness-of-fit, Correlation of estimates, dan Iteration of
History. Selanjutnya klik Continue.

f. Selanjutnya klik OK.


Sehingga menghasilkan output sebagai berikut :

2. Interpretasi output SPSS


a. Identifikasi Data yang hilang
Case Processing Summary
Unweighted Casesa
Selected Cases

N
Included in Analysis
Missing Cases
Total

Unselected Cases
Total

Percent
20

100.0

.0

20

100.0

.0

20

100.0

a. If weight is in effect, see classification table for the total number of


cases.

Tabel diatas menunjukkan jumlah responden yang menjadi sampel dalam


pembuatan model, dimana berjumlah 20. Dari jumlah tersebut, pengaruh prilaku
menabung siswa terhadap jumlah uang saku, jenis kelamin, dan pendapatan
orang tua, semuanya digunakan dalam analisis atau pembuatan model.
Selanjutnya, dapat dilihat tidak ada data yang hilang (missing cases) yang
diindikasikan N (jumlah) adalah 0.
b. Pemberian kode variable respon oleh SPSS
Dependent Variable Encoding
Original Value

Internal Value

tidak suka menabung

suka menabung

12

Tabel diatas menunjukkan kode variabel terikat, yang dalam hal ini
adalah 0 untuk siswa tidak suka menabung dan 1 untuk siswa suka menabung.
c. Uji signifikansi omnibus terhadap model
Omnibus Tests of Model Coefficients
Chi-square
Step 1

df

Sig.

Step

14.106

.003

Block

14.106

.003

Model

14.106

.003

Tabel diatas merupakan nilai Chi Square(2) dari model regresi.


Sebagaimana halnya model regresi linear dengan metode Ordinary Least Square
(OLS), kita juga dapat melakukan pengujian arti penting model secara
keseluruhan. Jika metode OLS menggunakan uji F, maka pada model logit
menggunakan uji G. Statistik G ini menyebar menurut sebaran Chi Square (2).
Karenanya dalam pengujiannya, nilai G dapat dibandingkan dengan nilai 2 tabel
pada tertentu dan derajat bebas (df) = k-1 (kriteria pengujian dan cara
pengujian persis sama dengan uji F pada metode regresi OLS). Tetapi, kita juga
bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan oleh
sofware-software statistik, termasuk SPSS. Dari Tabel 3, didapatkan nilai 2
sebesar 14,106 dengan p-value sebesar 0,003. Karena nilai tersebut signifikan
atau jauh di bawah = 10%, maka dapat disimpulkan bahwa model regresi
logistik secara keseluruhan dapat menjelaskan kemungkinan siswa memiliki
prilaku suka menabung.

d. Menilai keseluruhan model (overall model fit) dan menilai


kelayakan model regresi
Model Summary

Step
1

-2 Log likelihood
13.620

Cox & Snell R

Nagelkerke R

Square

Square
.506

.675

a. Estimation terminated at iteration number 6 because


parameter estimates changed by less than .001.

Cox & Snell R Square merupakan ukuran yang mencoba meniru ukuran
R2 pada multiple regression yang didasarkan pada teknik estimasi likelihood
dengan nilai maksimum kurang dari 1 sehingga sulit diinterpretasikan. Dilihat
dari Tabel tersebut, nilai Cox & Snell R Square adalah 0,506.
13

Nagelkerke R Square merupakan modifikasi dari koefisien Cox & Snell R


Square untuk memastikan bahwa nilainya bervariasi dari 0 sampai 1. Kisaran
nilai Nagelkerke R Square adalah 0 hingga 1. Semakin nilai Nagelkerke R Square
mendekati angka 1, maka semakin kuat variabel bebas memprediksi variabel
terikat. Hal ini dilakukan dengan cara membagi nilai Cox & Snell R Square
dengan nilai maksimumnya. Oleh karena itu, nilai Nagelkerke R Square dapat
diinterpretasikan seperti nilai R2 pada multiple regression. Dilihat dari output
SPSS, nilai Nagelkerke R Square adalah 0,675. Ini berarti variabilitas variabel
dependen yang dapat dijelaskan oleh variabilitas variabel independen sebesar
67,5 %.
Hipotesis untuk menilai model fit adalah:
H0 = Model yang dihipotesakan fit dengan data.
HA = Model yang dihipotesakan tidak fit dengan data.
Dari hipotesis ini jelas bahwa kita tidak akan menolak H 0 agar supaya
model fit dengan data.
Dalam data ini digunakan hipotesisnya sebagai berikut:
H0 = tidak ada perbedaan yang nyata antara klasifikasi yang diprediksi
(predicted) dengan klasifikasi yang diamati (observed).
H1= ada perbedaan yang nyata antara klasifikasi yang diprediksi
(predicted) dengan klasifikasi yang diamati (observed )
Hosmer and Lemeshow Test
Step
1

Chi-square
9.878

df

Sig.
8

.274

Hosmer and Lemeshow Test menguji hipotesis nol bahwa data empiris
cocok atau sesuai dengan model (tidak ada perbedaan antara model dengan data
sehingga model dapat dikatakan fit).
Dasar pengambilan keputusannya adalah dengan memperhatikan nilai
signifikansi dari Chi Square terhadap kriteria pengujian = 0.1 pada Hosmer and
Lemeshow Test yaitu:

Jika probabilitas > 0,1 maka H0 diterima

Jika probabilitas < 0,1 maka H1 diterima


Tabel 6 menunjukkan bahwa besarnya nilai Hosmer and Lemeshow Test
sebesar 9,878 dengan probabilitas signifikansi 0,274 > = 0,1 maka H0 diterima.
Hal ini berarti model regresi binary logistic layak digunakan untuk analisis
selanjutnya, karena tidak ada perbedaan yang nyata antara klasifikasi yang
diprediksi dengan klasifikasi yang diamati.
14

e. Menguji Koefisien Regresi


Variables in the Equation
B
Step 1a

S.E.

Wald

df

Sig.

Exp(B)

X1

.001

.000

4.186

.041

1.001

X2

-4.548

2.283

3.969

.046

.011

X3

-4.747

2.399

3.914

.048

.009

-.815

1.775

.211

.646

.443

Constant

a. Variable(s) entered on step 1: X1, X2, X3.

Tabel tersebut memberikan estimasi koefisien model dan pengujian


hipotesis parsial dari koefisien model. Regresi logistik menghasilkan rasio
peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari
suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi
dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang
(odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya.
Rasio peluang bagi prediktor diartikan sebagai jumlah relatif dimana peluang
hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai
variabel prediktor meningkat sebesar 1 unit. Odds ratio pada SPSS dilambangkan
dengan Exp(B).
Dari tabel tersebut diperoleh nilai Exp (B) sebagai faktor pengali (p).
Adapun nilai Exp(B) dari variabel independen uang saku sebesar 1,001, variabel
independen jenis kelamin sebesar 0,011, variabel independen pendapatan oorang
tua sebesar 0,009, Penafsirannya adalah:
Angka negatif dianggap probabilitas = 0.
Angka > 1 dianggap probabilitas = 1.
Angka di antara 0 sampai 1, probabilitasnya sesuai angka yang tertera.
Nilai Exp(B) dari variabel independen uang saku sebesar 1,001, maka
peluang uang saku sebesar 1 (karena Exp(B) > 1 maka dibulatkan menjadi 1)
dapat diartikan bahwa siswa yang punya uang saku lebih banyak, peluang dia
suka menabung adalah 1,001 kali . jika pendapatan orang tua dan jenis kelamin
mereka sama. Artinya siswa yang lebih banyak uang sakunya memiliki peluang
lebih tinggi memiliki prilaku suka menabung. Dalam konteks uang saku ini
(yang merupakan variabel dengan skala rasio), hati-hati menginterpretasikan nilai
perbedaan peluangnya.
Nilai Exp(B) variabel independen jenis kelamin (jenis kelamin dimana 0
= perempuan dan 1 = laki-laki) sebesar 0,132, maka peluang jenis kelamin
sebesar 0,011. Dapat diartikan bahwa peluang laki-laki memiliki prilaku suka
menabung adalah 0,011 kali dibandingkan perempuan, jika uang saku dan
15

pendapatan orang tua mereka sama. Artinya laki-laki memiliki peluang lebih
tinggi memiliki prilaku suka menabung daripada perempuan.
Nilai Exp(B) variabel independen pendapatan orang tua sebesar 0,009,
maka peluang siswa yang memiliki pendapatan orang tua lebih dari atau sama
dengan 3 juta memiliki prilaku suka menabung sebesar 0,009. Dapat diartikan
bahwa peluang siswa yang memiliki pendapatan orang tua lebih dari atau sama
dengan 3 juta memiliki prilaku suka menabung adalah 0,009 kali jika
dibandingkan siswa yang pendapatan orang tuanya kurang dari 3 juta, jika uang
saku dan jenis kelamin sama.
Untuk menguji faktor mana yang berpengaruh nyata siswa yang memiliki
prilaku suka menabung tersebut, dapat menggunakan uji signifikansi dari
parameter koefisien secara parsial dengan statistik uji Wald, yang serupa dengan
statistik uji t atau uji Z dalam regresi linear biasa, yaitu dengan membagi
koefisien terhadap standar error masing-masing koefisien. Dengan uji t (Uji
Wald) dan pvalue-nya (dengan menggunakan kriteria pengujian = 10%) terlihat
bahwa X3 berpengarh nyata (karena memiliki p-value dibawah 10%) siswa yang
memiliki prilaku suka menabung. Variabel independen uang saku dan jenis
kelamin juga signifikan pada = 10%, sehingga model regresi ini layak
digunakan untuk memprediksi variabel siswa yang memiliki prilaku suka
menabung.
f. Penafsiran dan prediksi
Persamaan model regresi binary logistic tersebut adalah:
p
ln
=0,815+0,001 X 14,548 X 24,747 X 3
1 p

Y= siswa memiliki prilaku suka menabung


X1 = Uang saku
X2 = Jenis kelamin
X3 = Pendapatan orang tua
P = peluang siswa memiliki prilaku suka menabung
1-p = peluang siswa memiliki prilaku tidak suka menabung
1. Nilai konstan sebesar 0,093 bearti pada saat jenis kelamin berkode 0
( perempuan), dan pendapatan berkode 0 ( pendapatan orang tua kurang dari 3
juta), misalkan siswa memunyai uang saku 10.000 maka peluang siswa suka
menabung sebesar :
p
ln
=0,815+0,001 ( 10.000 )4,548 ( 0 )4,747 (0)
1 p

ln

( 1p p )=9,185
16

( 1p p )=e

9,185

p=

e9,185
9,185
e +1

p=

9749,78
=0,99989744=99,98
9750,78

Karena menghasilkan probabilitas

99,98 maka dapat disimpulkan bahwa

siswa yang ber jenis kelamin perempuan, pendapatan orang tua kurang dari 3 juta
dan uang saku siswa 10.000 maka siswa meliliki peluang sebesar 99,98
untuk memiliki prilaku suka menabung.

2. Apabila jenis kelamin berkode 0 ( perempuan), dan pendapatan orang tua


berkode 1 ( pendapatan orang tua lebih dari atau sama dengan 3 juta),missal uang
saku siswa 10.000, maka peluang siswa suka menabung sebesar :
p
ln
=0,815+0,001(10.000)4,548 ( 0 )4,747(1)
1 p

( )
p
ln (
=0,815+104,747=4.438
1 p )
( 1p p )=e
4.438

p=

e4.438
e 4.438 + 1

p=

84,6055612
85,6055612

p=0,98831852=98,83
Karena menghasilkan probabilitas

98,83 , maka dapat disimpulkan, siswa

yang berjenis kelamin perempuan, dan pendapatan orang tua lebih dari atau sama
dengan 3 juta dan uang saku siswa 10.000 maka siswa memiliki peluang sebesar
98,83 untuk memiliki prilaku suka menabung.

3. Apabila jenis kelamin berkode 1 ( laki-laki), dan pendapatan orang tua berkode 0
( pendapatan orang tua kurang 3 juta),missal uang saku siswa 5.000, maka
peluang siswa suka menabung sebesar :

17

ln

( 1p p )=0,815+0,001(5.000)4,548 (1) 4,747 (0)

( 1p p )=0,815+54,548=0,363
( 1p p )=e
ln

0,363

0,363

p=
p=

0,363

+1

0,69558643
1,69558643

p=0,41023354=41,02
Karena menghasilkan probabilitas 41,02 , maka dapat disimpulkan bahwa
siswa yang berjenis kelamin laki-laki, dan pendapatan orang tua lebih dari atau
sama dengan 3 juta dan uang saku siswa 5.000 maka siswa memiliki peluang
sebesar 41,02 untuk memiliki prilaku suka menabung.

4. Apabila jenis kelamin berkode 1 ( laki-laki), dan pendapatan orang tua berkode 1
( pendapatan orang tua lenih dari atau sama dengan 3 juta),missal uang saku
siswa 15.000, maka peluang siswa suka menabung sebesar :

( 1p p )=0,815+0,001(15.000)4,548 (1) 4,747 (1)


p
ln (
=0,815+154,5484,747=4,89
1 p )
( 1p p )=e
ln

4,89

p=

e4,89
e 4,89 +1

p=

132,953574
133,953574

p=0,99253472=99,25
Karena menghasilkan probabilitas 99,25 , maka dapat disimpulkan bahwa
siswa yang berjenis kelamin laki-laki, dan pendapatan orang tua lebih dari atau

18

sama dengan 3 juta dan uang saku siswa 15.000 maka siswa memiliki peluang
sebesar 99,25 untuk memiliki prilaku suka menabung

Latihan Soal
Dalam sebuah survei, ingin diprediksi pengaruh umur, jenis
kelamindan kegemukan terhadap kemungkinan seseorang mengidap penyakit
diabetes. Berdasarkan hasil survei terhadap 50 responden, didapatkan datanya
dalam tabel sebagai berikut:

No

Diabetes

Umur

Jenis Kelamin

Kegemukan

.
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.

(Y)
0
0
1
1
1
0
1
0
1
1
1
0
0
1
1
0
1
1
1
1
1
1
1
1
1
1
1

(X1)
38
39
48
52
46
40
50
37
42
44
42
36
41
44
47
43
53
82
61
66
55
63
60
58
56
49
47

(X2)
0
1
1
1
1
0
1
1
0
1
1
0
1
0
1
0
1
1
0
1
0
1
1
1
1
0
1

(X3)
0
0
1
1
1
0
1
0
1
1
1
0
0
0
1
0
1
1
1
1
1
1
1
1
1
1
1

19

28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.

1
0
0
1
1
1
1
1
1
1
0
1
1
1
1
1
1
1
1
1
1
1
1

47
43
42
57
56
52
69
70
46
50
44
48
50
49
47
51
55
50
49
52
63
60
49

0
1
0
1
1
0
1
1
0
1
0
1
1
1
1
0
1
0
1
1
1
0
1

Berdasarkan data pada tabel 1 diatas, didapatkan:


Varibel

Terikat/Bebas

Terikat

X1
X2
X3

Bebas

Dummy
0
1
0
1
0
1

Definisi Operasional
tidak terkena diabetes
Terkena diabetes
Umur dalam tahun
Laki-Laki
Perempuan
Tidak mengalami kegemukan
Mengalami Kegemukan

20

1
0
0
1
1
1
1
1
0
1
0
1
1
1
0
1
1
1
0
1
1
1
1

Tabel 2

1. Analisis Data
a. Langkah-LangkahAnalisis Data Menggunakan Spss
1. Input data diatas ke SPSS

2. Ubah value masing-masing variabel berdasarkan keterangan yang didapat pada


tabel 2, kecuali untuk variabel X1 (Umur).

21

3. Klik Analyze Regression Binary Logistic

4. Masukkan Y sebagai variabel dependen dengan cara klik Y di kotak kiri,


kemudian klik tanda panah di samping kotak Dependent. Masukkan X1, X2 dan
X3 ke dalam kotak Covariates, dengan cara klik masing-masing variabel,
kemudian klik tanda panah di samping kotak Covariates.

22

5. Klik Options, kemudian beri tanda () pada Classification plots, HosmerLemeshow goodness-of-fit, Correlation of estimates, dan Iteration of History.
Selanjutnya klik Continue.

6. Klik Ok, akan keluar hasil output SPSS untuk Model Regresi Binary Logistic.

23

b. Analis Data Hasil Output SPSS


1. Identifikasi Data yang Hilang

Hasil output diatas menunjukkan jumlah responden yang menjadi


sampel dalam pembuatan model, dimana berjumlah 50. Dari jumlah tersebut,
data penderita diabetes, umur, jenis kelamin dan kegendutan semuanya
digunakan dalam analisis atau pembuatan model. Selanjutnya, dapat dilihat
tidak ada data yang hilang (missing cases) yang diindikasikan N (jumlah)
adalah 0.
2. Pemberian kode variabel respon oleh SPSS

24

Tabel selanjutnya menunjukkan kode variabel terikat, yang dalam hal


ini adalah 0 untuk bukan penderita diabetes dan 1 untuk penderita diabetes.
3. Uji Signifikansi Omnibus terhadap Model

Tabel ini menunjukkan nilai Chi Square (2) dari model regresi.
Sebagaimana halnya model regresi linear dengan metode Ordinary Least
Square (OLS), kita juga dapat melakukan pengujian arti penting model secara
keseluruhan. Jika metode OLS menggunakan uji F, maka pada model logit
menggunakan uji G. Statistik G ini menyebar menurut sebaran Chi Square
(2). Karenanya dalam pengujiannya, nilai G dapat dibandingkan dengan nilai
2 tabel pada tertentu dan derajat bebas (df) = k-1 (kriteria pengujian dan
cara pengujian persis sama dengan uji F pada metode regresi OLS). Tetapi,
kita juga bisa melihat nilai p-value dari nilai G ini yang biasanya ditampilkan
oleh sofware-software statistik, termasuk SPSS. Dari tabel diatas, didapatkan
nilai 2 sebesar 47,268 dengan p-value sebesar 0,000. Karena nilai tersebut
signifikan atau jauh di bawah = 10%, maka dapat disimpulkan bahwa model
regresi logistik secara keseluruhan dapat menjelaskan kemungkinan seseorang
dapat menderita diabetes.
4. Menilai Keseluruhan Model (Overall Model Fit) dan Menilai Kelayakan Model
Regresi

25

Pada tabel Model Summary, Cox & Snell R Square merupakan ukuran
yang mencoba meniru ukuran R2 pada multiple regression yang didasarkan
pada teknik estimasi likelihood dengan nilai maksimum kurang dari 1 sehingga
sulit diinterpretasikan. Dilihat dari Tabel 5, nilai Cox & Snell R Square adalah
0,611.
Nagelkerke R Square merupakan modifikasi dari koefisien Cox & Snell
R Square untuk memastikan bahwa nilainya bervariasi dari 0 sampai 1.
Kisaran nilai Nagelkerke R Square adalah 0 hingga 1. Semakin nilai
Nagelkerke R Square mendekati angka 1, maka semakin kuat variabel bebas
memprediksi variabel terikat. Hal ini dilakukan dengan cara membagi nilai
Cox & Snell R Square dengan nilai maksimumnya. Oleh karena itu, nilai
Nagelkerke R Square dapat diinterpretasikan seperti nilai R2 pada multiple
regression. Dilihat dari output SPSS, nilai Nagelkerke R Square adalah 0,967.
Ini berarti variabilitas variabel dependen yang dapat dijelaskan oleh
variabilitas variabel independen sebesar 0,967 %.
Hipotesis untuk menilai model fit adalah:
H0 = Model yang dihipotesakan fit dengan data.
HA = Model yang dihipotesakan tidak fit dengan data.
Dari hipotesis ini jelas bahwa kita tidak akan menolak H 0 agar supaya
model fit dengan data.
Dalam data ini digunakan hipotesisnya sebagai berikut:
H0=

tidak ada perbedaan yang nyata antara klasifikasi yang diprediksi


(predicted) dengan klasifikasi yang diamati (observed).

H1=

ada perbedaan yang nyata antara klasifikasi yang diprediksi (predicted)


dengan klasifikasi yang diamati (observed).
26

Tabel Hosmer and Lemeshow Test menguji hipotesis nol bahwa data
empiris cocok atau sesuai dengan model (tidak ada perbedaan antara model
dengan data sehingga model dapat dikatakan fit.
Dasar pengambilan keputusannya adalah dengan memperhatikan nilai
signifikansi dari Chi Square terhadap kriteria pengujian = 0.1 padaHosmer
and Lemeshow Test yaitu:

Jika probabilitas > 0,1 maka H0 diterima

Jika probabilitas < 0,1 maka H1 diterima

Tabel ini menunjukkan bahwa besarnya nilai Hosmer and Lemeshow


Test sebesar 7,211 dengan probabilitas signifikansi 1,000 > = 0,1 maka H 0
diterima. Hal ini berarti model regresi binary logistic layak digunakan untuk
analisis selanjutnya, karena tidak ada perbedaan yang nyata antara klasifikasi
yang diprediksi dengan klasifikasi yang diamati.
5. Menguji Koefisien Regresi

Tabel Varaibles in the Equation memberikan estimasi koefisien model


dan pengujian hipotesis parsial dari koefisien model. Regresi logistik
menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor.
Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang
muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara
umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang
dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai
jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun
(rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.
Odds ratio pada SPSS dilambangkan dengan Exp(B).
Dari tabel diatas diperoleh nilai Exp (B) sebagai faktor pengali (p).
Adapun nilai Exp(B) dari variabel independen umur sebesar 823672,293,

27

variabel independen jenis kelamin sebesar 0,018, variabel independen


mengalami kegendutan sebesar 5,166E+20, Penafsirannya adalah:

Angka negatif dianggap probabilitas = 0.

Angka > 1 dianggap probabilitas = 1.

Angka di antara 0 sampai 1, probabilitasnya sesuai angka yang tertera.


Nilai Exp(B) dari variabel independen umur sebesar 823672,293, maka

peluang umur sebesar 1 (karena Exp(B) > 1 maka dibulatkan menjadi 1) dapat
diartikan bahwa seseorang yang berumur lebih tua satu tahun, peluang
menderita diabetes adalah 1,031 kali dibandingkan seseorang yang berumur
lebih muda (satu tahun), jika dalam keluarga merupakan keturunan diabetes
dan jenis kelamin mereka sama. Artinya orang yang lebih tua memiliki
peluang yang lebih tinggi menjadi penderita diabetes. Dalam konteks umur ini
(yang merupakan variabel dengan skala rasio), hati-hati menginterpretasikan
nilai perbedaan peluangnya. Jika perbedaan umur lebih dari 1 tahun, misalnya
10 tahun, maka oddsratio-nya akan menjadi 0,31, yang diperoleh dari
perhitungan exp (10 x 0,031). Artinya peluang seseorang menjadi penderita
diabetes berumur lebih tua 10 tahun adalah 0,31 kali dibandingkan yang lebih
muda (10 tahun) darinya.
Nilai Exp(B) variabel independen jenis kelamin (jenis kelamin dimana
1 = wanita dan 0 = pria) sebesar 2,702, maka peluang jenis kelamin sebesar
2,702. Dapat diartikan bahwa peluang wanita menderita diabetes adalah 2,702
kali dibandingkan pria, jika umur dan gen keturunan mereka sama. Artinya
wanita

memiliki

peluang

lebih

tinggi

menjadi

penderita

diabetes

dibandingkan pria.
Nilai Exp(B) variabel independen kegemukan sebesar 11,115, maka
peluang orang yang kegemukan sebesar sebesar 11,115. dapat diartikan bahwa
peluang seseorang yang kegemukanadalah sebesar 11,115 kali dibandingkan
seseorang yang tidak kegemukan, jika umur dan jenis kelaminnya sama.

28

Untuk menguji faktor mana yang berpengaruh nyata seseorang yang


menderita diabetes tersebut, dapat menggunakan uji signifikansi dari
parameter koefisien secara parsial dengan statistik uji Wald, yang serupa
dengan statistik uji t atau uji Z dalam regresi linear biasa, yaitu dengan
membagi koefisien terhadap standar error masing-masing koefisien. Dengan
uji t (Uji Wald) dan pvalue-nya (dengan menggunakan kriteria pengujian =
10%) terlihat bahwa X3 berpengaruh nyata (karena memiliki p-value dibawah
10%) seseorang yang menderita diabetes. Variabel independen umur dan jenis
kelamin tidak signifikan pada = 10%, namun model regresi ini layak
digunakan untuk memprediksi variabel seseorang menderita diabetes, karena
secara faktual variabel independen berupa umur dan jenis kelamin bisa saja
mempengaruhi seseorang menjadi penderita diabetes. Ketidaksignifikan data
ini mungkin disebabkan karena pengumpulan data yang kurang akurat atau
terbatasnya sampel yang diambil.
6. Penafsiran dan Prediksi
Persamaan model regresi binary logistic tersebut adalah:
ln

( 1p p )=2,264+0,031 X +0,994 X + 2,408 X


1

Dimana:
Y = Penderita Diabetes
X 1 = Umur
X 2 = Jenis Kelamin
X 1 = Kegemukan
p = Peluang menderita diabetes
1-p= Peluang tidak menderita diabetes
a. Nilai konstanta sebesar -2,264 berarti pada saat umur berkode 0, jenis
kelamin berkode 0, kegemukan berkode 0, maka peluang seseorang
menderita diabetes sebesar:
29

ln

( 1p p )=2,264

p
=e2,264
1p
p=

e2,264
=0,0941487=9,4141
1+e2,264

Karena menghasilkan probabilitas 9,4141% , maka dapat disimpulkan


bahwa tanpa adanya variabel independen umur, jenis kelamin, dan
kegemukan maka seseorang masih meliliki peluang sebesar 9,414% untuk
menderita diabetes.
b. Apabila jenis kelamin berkode 0 (pria), kegemukan berkode 0 maka
probabilitas seseorang menderita diabetes adalah sebagai berikut:
p
ln
=2,264+0,031 X 1
1 p

Misalkan kita ambil seorang laki-laki berumur 35 tahun


p
ln
=2,264+0,031 ( 35 )
1 p

( )
p
ln (
=1,179
1 p )
p
=e1,179
1p
p=

e1,179
=0,2352320465=23,52
1+e1,179

Karena menghasilkan probabilitas 23,52% maka pada umur 35


tahun bisa diprediksi bahwa peluang seseorang menderita diabetes
adalah 23,52%.

ln

Misalkan kita ambil laki-laki berumur 51 tahun

( 1p p )=2,264+0,031 ( 51)
30

ln

( 1p p )=0,683

p
=e0,683
1p
p=

e0,683
=0,3355=33,55
1+e0,683
Karena menghasilkan probabilitas 33,55% maka pada umur 51

tahun bisa diprediksi bahwa peluang seseorang menderita diabetes


sebesar 33,55%.
c. Apabila jenis kelamin berkode 1 (wanita), kegemukan berkode 0 maka
probabilitas seseorang menderita diabetes adalah sebagai berikut:
p
ln
=2,264+0,031 X 1 +0,994
1 p

Misalkan kita ambil wanita berumur 30 tahun


ln

ln

( 1p p )=2,264+0,031 ( 30) +0,994

( 1p p )=0,34
p
0,34
=e
1p
034

p=

e
p
=0,4158=41,58
0,34
1+e
Karena menghasilkan probabilitas 41,58% maka pada umur 30

tahun bisa diprediksi bahwa peluang seseorang wanita menderita diabetes


adalah sebesar 41,58%
d. Apabila jenis kelamin berkode 1 (wanita), kegemukan berkode (1) maka
probabilitas seseorang menderita diabetes adalah sebagai berikut:

31

ln

( 1p p )=2,264+0,031 X +0,994 X + 2,408 X


1

Misalkan kita ambil konsumen berumur 30 tahun


ln

( 1p p )=2,264+0,031 ( 30) +0,994 ( 1) +2,408 ( 1)=2,068


p
2,068
=e
1p
2,068

p=

e
p
=0,8877=88,77
2,068
1+e
Karena menghasilkan probabilitas 88,77% maka seorang wanita

pada umur 30 tahun dan seorang dengan keturunan penderita diabetes bisa
diprediksi peluang seseorang tersebut menderita diabetes sebesar 88,77%.
e. Apabila jenis kelamin berkode 0 (Laki-Laki), kegemukan berkode (1)
maka probabilitas seseorang menderita diabetes adalah sebagai berikut:
ln

( 1p p )=2,264+0,031 X +2,408 X
1

Misalkan kita ambil konsumen berumur 30 tahun


ln

( 1p p )=2,264+0,031 ( 30) +2,408 ( 1)=1,074


p
=e 1,074
1p
p=

e1,074
=0,7454=74,54
1+e 1,074
Karena menghasilkan probabilitas 74,54% maka seorang pria pada

umur 30 tahun dan seorang dengan keturunan penderita diabetes bisa


diprediksi peluang seseorang tersebut menderita diabetes sebesar 74,54%.
32

Dengan demikian, dapat diambil kesimpulan bahwa dapat diprediksi


peluang seorang wanita dan dengan keturunan penderita diabetes adalah lebih
tinggi untuk menderita diabetes.

BAB III
KESIMPULAN
Variabel dummy disebut juga variabel indicator, biner, kategorik, kualitatif, boneka,
atau variabel dikotomi. Suatu persamaan regresi dahat hanya menggunakan variabel
kategorik sebagai variabel bebas tetapi daoat pula disertai oleh variabel bebas lain yang
numeric. Regresi dengan variabel bebasnya hanya vriabel dummy atau yang sifatnya
kualitatif disebut model Analysis of Variance (ANOVA).
Pengkodean data kategorikal memerlukan pengkategorian eksklusif. Artinya satu
subjek/sampel adalah masuk dalam satu kategori, tidak boleh dua kategori. Sampel A
misalnya, tidak boleh masuk ke dalam kategori laki-laki dan perempua. Si B tidak boleh
masuk ke dalam kategori PNS dan wiraswasta meskipun kedua profesi tersebut dijalaninya.
Aturan ini berlaku variabel dummy. Sebuah variabel dengan kategori sebanyak k akan
membutuhkan seperangkat k 1 variabel dummy untuk menjangkau semua informasi yang
terkandung didalamnya. Jadi misalnya saya memiliki variabel tingkat pendidikan dari SD
hingga PT (4 kategori) maka jumlah variabel kategori yang sama buat ada 3 kategori.
Menggunakan pola koding biner (0,1), variabel dummy selalu vaiables berbentuk dikotomi.
Semua responden yang menjadi anggota kategori yang diberi kode 1 sedangkan
responden tidak dalam kategori tersebut dikode dari 0. Dengan cara seperti ini maka setiap
responden akan memiliki kode 1 pada kategori yang sesuai dengannya dan kode 0 pada
kategori yang tidak sesuai dengannya. Kode biner dapat dianggap sebagai mirip ke saklar
listrik: kode A 1 sinyal bahwa kategori yang diberikan adalah on untuk responden
(misalnya, dia adalah anggota dari kelompok tertentu, atau karakteristik tertentu hadir ),
karena bukan anggota, variabel dummy yang menunjukkan kategori yang diaktifkan off
(yaitu, karakteristik ini tidak ada).
33

Dalam contoh kasus, ingin diprediksi pengaruh durasi belajar, bimbingan belajar, dan
jenis kelamin siswa terhadap peningkatan prestasi belajar siswa terhadap 20 responden.
Didapatkan hasil sebagai berikut:
Persamaan model regresi binary logistic dari kasus tersebut adalah:
ln

( 1p p )=2,264+0,031 X +0,994 X + 2,408 X


1

Dimana:
Y = Penderita Diabetes
X 1 = Umur
X 2 = Jenis Kelamin
X 1 = Kegemukan
p = Peluang menderita diabetes
1-p= Peluang tidak menderita diabetes
Dari kasus tersebut dapat diambil kesimpulan bahwa dapat diprediksi peluang
seorang wanita gemuk adalah lebih tinggi untuk menderita diabetes.

34

35

Daftar Pustaka
Gujarati, Damudar N. & Dawn C. P. 2012. Dasar-Dasar Ekonometrika. Jakarta: Salemba Empat.

36