Anda di halaman 1dari 22

Agung Priyo Utomo - agungpu@gmail.

com 1
MODEL PROBIT
BAHAN KULIAH EKONOMETRIKA
PROGRAM STUDI KAJIAN TIMUR TENGAH DAN ISLAM
UNIVERSITAS INDONESIA
Agung Priyo Utomo - agungpu@gmail.com 2
Model Probit
Contoh 1:
Penelitian untuk mengetahui faktor-faktor yang
mempengaruhi apakah seorang kandidat akan
memenangkan pemilu atau tidak. Dalam kasus ini maka
hasilnya adalah menang atau kalah. Beberapa faktor yg
diduga berpengaruh adalah besarnyauang yang
dikeluarkan dalam kampanye, lamanya waktu
berkampanye negatif dan apakah kandidat memiliki
jabatan atau tidak.

Contoh 2:
Penelitian untuk mengetahui apakah latihan OR, usia, dan
jenis kelamin berpengaruh terhadap seseorang akan
terkena serangan jantung atau tidak.
Agung Priyo Utomo - agungpu@gmail.com 3
Model Probit
Contoh 3:
Beberapa siswa SMU berkeinginan untuk melanjutkan
kuliah. Dalam berkas lamarannya, mereka memasukkan
skor GRE dan nilai GPA. Beberapa siswa berasal dari
sekolah unggulan dan ada juga yang dari sekolah non
unggulan. Beberapa bulan setelah siswa mengirimkan
aplikasi, siswa tersebut menerima 2 macam amplop (tebal
atau tipis) yang menandakan mereka diterima atau ditolak
di PT yang bersangkutan.
Agung Priyo Utomo - agungpu@gmail.com 4
Model Probit
Pertama kali ditemukan oleh Chester Bliss (1930)
Probit = Probability Unit
Model logit menggunakan fungsi logistik kumulatif
(cumulative logistic function)
Model probit menggunakan fungsi normal kumulatif
(normal CDF) disebut juga dengan model normit
Secara prinsip utk memperoleh model probit dpt dilakukan
dg mengganti fungsi logistik kumulatif pd persamaan


dengan fungsi normal kumulatif
i
Z
i
e 1
1
P

+
=
Agung Priyo Utomo - agungpu@gmail.com 5
Model Probit
Agung Priyo Utomo - agungpu@gmail.com 6
Model Probit
Contoh:
Keputusan untuk membeli/memiliki rumah dilihat dari
pendapatan keluarga.
Ada suatu nilai, semacam indeks kegunaan yg tdk dpt
diamati (unobservable utility index), misal I
i
, sedemikian
sehingga makin besar nilai I
i
, maka makin besar pula
peluang sebuah keluarga untuk membeli rumah.
Indeks I
i
dapat dinyatakan sbb:

I
i
=
1
+
2
X
i

X
i
= pendapatan keluarga ke-i
Agung Priyo Utomo - agungpu@gmail.com 7
Model Probit
Bgmn hubungan I
i
dg keputusan utk membeli rumah?
Pada model logistik, Y = 1 jika keluarga memiliki rumah dan Y = 0
jika keluarga tidak memiliki rumah
Pada model probit, dapat diasumsikan untuk setiap keluarga ada
batasan indeks, misal I
i
* sedemikian shg jika I
i
> I
i
*, maka keluarga
tersebut akan membeli rumah
Jika diasumsikan I
i
* berdistribusi normal dengan rata-rata
dan varian sama, maka I
i
* maupun I
i
dapat diestimasi
Dibawah asumsi kenormalan, maka



dimana t ~ N(0,1)
} }
| + |

t
=
t
= = s = = =
i 2 1
2
2
t
i
2
2
t
X T
i i
*
i i
dt e
2
1
dt e
2
1
) I ( F ) I I ( P ) 1 Y ( P P
Agung Priyo Utomo - agungpu@gmail.com 8
Model Probit
Jika P
i
= peluang sebuah event akan terjadi, maka
peluang untuk memiliki rumah dapat dihitung dari luas di
bawah kurva normal baku dari - s.d. I
i



P
i
= F(I
i
)
I
i
=
1
+
2
X
i
Agung Priyo Utomo - agungpu@gmail.com 9
Model Probit
Untuk menghitung indeks I
i
, dapat diperoleh dari

I
i
= F
-1
(I
i
) = F
-1
(P
i
) =
1
+
2
X
i
F
-1
merupakan invers dari CDF normal
P
i Pr(I
i
*I
i
)
0 -
P
i
= F(I
i
)
1
I
i
= F
-1
(P
i
)
Agung Priyo Utomo - agungpu@gmail.com 10
Model Probit
Bagaimana memperoleh indeks I
i
, jika yg diketahui hanya
X
i
(pendapatan) dan Y = 1 atau Y = 0 (tergantung apakah
keluarga tersebut memiliki rumah atau tidak)?
Misal datanya sbb: (X = dalam ribuan $)

X Ni ni
6 40 8
8 50 12
10 60 18
13 80 28
15 100 45
20 70 36
25 65 39
30 50 33
35 40 30
40 25 20
Agung Priyo Utomo - agungpu@gmail.com 11
Model Probit
Untuk mengestimasi indeks I
i
dpt dilakukan melalui nilai
Peluang (frekuensi relatif), selanjutnya bandingkan
dengan CDF normal
X Ni ni Est. Pi Ii
6 40 8 0,20 -0.84
8 50 12 0,24 -0.70
10 60 18 0,30 -0.52
13 80 28 0,35 -0.38
15 100 45 0,45 -0.12
20 70 36 0,51 0.03
25 65 39 0,60 0.25
30 50 33 0,66 0.40
35 40 30 0,75 0.67
40 25 20 0,80 0.84
Agung Priyo Utomo - agungpu@gmail.com 12
Model Probit
Dari data tersebut, model probit dapat diperoleh sbb:
Berdasarkan est. P
i
(frekuensi relatif), maka dapat diperoleh I
i
dari
CDF normal (ada di tabel sebelumnya)
Setelah I
i
diperoleh, maka dapat dicari
1
dan
2
dg mudah
Pada analisis probit, I
i
disebut normal equivalent deviate
(n.e.d) atau disebut juga normit
Karena I
i
atau n.e.d akan bernilai negatif (-) pada saat P
i
<
0.5, maka dalam prakteknya ditabahkan dengan nilai 5
dan hasilnya disebut probit
probit = n.e.d + 5 = I
i
+ 5

1
dan
2
dapat diestimasi berdasarkan model:
I
i
=
1
+
2
X
i
+ u
i
; dimana u
i
= unsur gangguan
Agung Priyo Utomo - agungpu@gmail.com 13
Model Probit
Tahapan dalam model probit:
1. Dari data yang sudah dikelompokkan, estimasi P
i

(frekuensi relatif)
2. Berdasarkan estimasi dari P
i
, cari n.e.d (I
i
) dari CDF
normal
3. Gunakan estimasi I
i
(I
i
*), sebagai variabel terikat dalam
regresi
I
i
* =
1
+
2
X
i
+ u
i

4. Jika diperlukan, tambahkan 5 pada nilai n.e.d (Ii) untuk
mengubah menjadi probit dan gunakan sebagai
variabel terikat pada
I
i
* =
1
+
2
X
i
+ u
i

Agung Priyo Utomo - agungpu@gmail.com 14
Perkiraan Peluang Logit &
Probit
Agung Priyo Utomo - agungpu@gmail.com 15
Logit atau Probit?
Logistic didasarkan pada kondisi dimana variabel tak
bebasnya bersifat kualitatif (menggunakan fungsi logit)
Probit didasarkan pada kondisi dimana variabel tak
bebasnya bersifat kuantitatif (menggunakan distribusi
kumulatif normal)
Dalam prakteknya kedua model seringkali memberikan
hasil yang sama/mirip.
Probit lebih mudah diinterpretasikan.
Agung Priyo Utomo - agungpu@gmail.com 16
Contoh:
(Aplikasi menggunakan SPSS)
Beberapa siswa SMU berkeinginan untuk melanjutkan
kuliah. Dalam berkas lamarannya, mereka memasukkan
skor GRE dan nilai GPA. Beberapa siswa berasal dari
sekolah unggulan dan ada juga yang dari sekolah non
unggulan. Beberapa bulan setelah siswa mengirimkan
aplikasi, siswa tersebut menerima 2 macam amplop (tebal
atau tipis) yang menandakan mereka diterima atau ditolak
di PT yang bersangkutan.
Data ada di file probit.sav
Agung Priyo Utomo - agungpu@gmail.com 17
Contoh:
(Aplikasi menggunakan SPSS)
Variabel tak bebas/terikat = admit
1 = diterima (admitted)
0 = tidak diterima (not admitted)
Variabel bebas =
gre (graduate record exam score),
gpa (grade point average),
topnotch (asal sekolah) :
- 1 jika berasal dari sekolah ungulan
- 0 jika berasal dari sekolah non unggulan
Agung Priyo Utomo - agungpu@gmail.com 18
Contoh:
(Aplikasi menggunakan SPSS)
Descriptive Statistics
400 220,00 800,00 587,7000 115,51654
400 2,26 4,00 3,3899 ,38057
400
Graduate Record Exam
Grade Point Average
Vali d N (li stwi se)
N Mini mum Maximum Mean Std. Devi ation
Asal Sekolah
335 83,8 83,8 83,8
65 16,3 16,3 100,0
400 100,0 100,0
Non Unggul an
Unggul an
Total
Vali d
Frequency Percent Vali d Percent
Cumul ati ve
Percent
Agung Priyo Utomo - agungpu@gmail.com 19
Beberapa Strategi
Regresi OLS
Analisis ini akan bermasalah, karena asumsi OLS akan
terlanggar jika digunakan pada kasus variabel terikatnya
berupa kategorik.
Uji t
Uji ini bisa digunakan jika kasusnya hanya terdiri dari
satu variabel bebas dan bersifat kuantitatif, misal hanya
melihat pengaruh dari GPA terhadap diterima atau
tidaknya seorang siswa di PT.
Regresi Logit
Model ini sangat mirip dengan model probit
Agung Priyo Utomo - agungpu@gmail.com 20
Penggunaan Model Probit
Sebelum menjalankan model probit, maka periksa dulu
apakah ada sel yang kosong/terlalu kecil frekuensinya
(pada tabulasi silang antara variabel bebas kategorik dan
variabel tak bebasnya). Jika terdapat sel yang kosong,
maka akan sulit menjalankan model probit.
Admission Status * Asal Sekolah Crosstabulation
Count
238 35 273
97 30 127
335 65 400
not admi tted
admi tted
Admi ssi on
Status
Total
Non
Unggul an Unggul an
Asal Sekol ah
Total
Tidak ada
sel yang kosong
Agung Priyo Utomo - agungpu@gmail.com 21
Model Probit
Sebelum menjalankan model probit, maka periksa dulu
apakah ada sel yang kosong/terlalu kecil frekuensinya
(pada tabulasi silang antara variabel bebas kategorik dan
variabel tak bebasnya). Jika terdapat sel yang kosong,
maka akan sulit menjalankan model probit.
Karena GPA dan GRE
kuantitatif/kontinu
Agung Priyo Utomo - agungpu@gmail.com 22
Model Probit
Semua data
valid digunakan
Digunakan untuk
mengetahui
apakah model dg
beberapa variabel
bebas lebih baik
drpd model tanpa
variabel bebas
(hanya intersep).
Nilai sig. sebesar
0.000 < o (misal
5%) menunjukkan
bahwa model dg
variabel bebas
lebih baik dari
model tanpa
variabel bebas.