Anda di halaman 1dari 24

MODEL PROBIT

BAHAN KULIAH ANALISIS DATA KATEGORIK


SEKOLAH TINGGI ILMU STATISTIK
Oleh:
Agung Priyo Utomo
Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Contoh 1:
Penelitian untuk mengetahui faktor-faktor yang
mempengaruhi apakah seorang kandidat akan
memenangkan pemilu atau tidak. Dalam kasus ini maka
hasilnya adalah menang atau kalah. Beberapa faktor yg
diduga berpengaruh adalah besarnya uang yang
dikeluarkan dalam kampanye, lamanya waktu
berkampanye negatif dan apakah kandidat memiliki
jabatan atau tidak.

Contoh 2:
Penelitian untuk mengetahui apakah latihan OR, usia, dan
jenis kelamin berpengaruh terhadap seseorang akan
terkena serangan jantung atau tidak.
Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Contoh 3:
Beberapa siswa SMU berkeinginan untuk melanjutkan
kuliah. Dalam berkas lamarannya, mereka memasukkan
skor GRE dan nilai GPA. Beberapa siswa berasal dari
sekolah unggulan dan ada juga yang dari sekolah non
unggulan. Beberapa bulan setelah siswa mengirimkan
aplikasi, siswa tersebut menerima 2 macam amplop (tebal
atau tipis) yang menandakan mereka diterima atau ditolak
di PT yang bersangkutan.

Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Pertama kali ditemukan oleh Chester Bliss (1930)


Probit = Probability Unit
Model logit menggunakan fungsi logistik kumulatif
(cumulative logistic function)
Model probit menggunakan fungsi normal kumulatif
(normal CDF) disebut juga dengan model normit
Secara prinsip utk memperoleh model probit dpt dilakukan
dg mengganti fungsi logistik kumulatif pd persamaan
1
Pi
1 e Zi
dengan fungsi normal kumulatif
Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Contoh:
Keputusan untuk membeli/memiliki rumah dilihat dari
pendapatan keluarga.
Ada suatu nilai, semacam indeks kegunaan yg tdk dpt
diamati (unobservable utility index), misal Ii, sedemikian
sehingga makin besar nilai Ii, maka makin besar pula
peluang sebuah keluarga untuk membeli rumah.
Indeks Ii dapat dinyatakan sbb:
Ii = 1 + 2Xi
Xi = pendapatan keluarga ke-i
Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Bgmn hubungan Ii dg keputusan utk membeli rumah?

Pada model logistik, Y = 1 jika keluarga memiliki rumah dan Y = 0


jika keluarga tidak memiliki rumah
Pada model probit, dapat diasumsikan untuk setiap keluarga ada
batasan indeks, misal Ii* sedemikian shg jika Ii > Ii*, maka keluarga
tersebut akan membeli rumah

Jika diasumsikan Ii* berdistribusi normal dengan rata-rata


dan varian sama, maka Ii* maupun Ii dapat diestimasi
Dibawah asumsi kenormalan, maka
T

1 i t2 2
1
*
Pi P( Y 1) P(Ii Ii ) F(Ii )
e
dt

2
2

1 2 Xi

2
2

dt

dimana t ~ N(0,1)
Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Jika Pi = peluang sebuah event akan terjadi, maka


peluang untuk memiliki rumah dapat dihitung dari luas di
bawah kurva normal baku dari - s.d. Ii
Pi = F(Ii)

Ii = 1 + 2Xi
Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Untuk menghitung indeks Ii, dapat diperoleh dari


Ii = F-1(Ii) = F-1(Pi) = 1 + 2Xi
F-1 merupakan invers dari CDF normal
Pi = F(Ii)

1
Pi

Pr(Ii*Ii)

Ii = F-1(Pi)

Agung Priyo Utomo - agungpu@gmail.com

Model Probit

Bagaimana memperoleh indeks Ii, jika yg diketahui hanya


Xi (pendapatan) dan Y = 1 atau Y = 0 (tergantung apakah
keluarga tersebut memiliki rumah atau tidak)?
Misal datanya sbb: (X = dalam ribuan $)
X

Ni

ni

40

50

12

10

60

18

13

80

28

15

100

45

20

70

36

25

65

39

30

50

33

35

40

30

40

25

20
Agung Priyo Utomo - agungpu@gmail.com

10

Model Probit

Untuk mengestimasi indeks Ii dpt dilakukan melalui nilai


Peluang (frekuensi relatif), selanjutnya bandingkan
dengan CDF normal
X

Ni

ni

Est. Pi

Ii

40

0,20

-0.84

50

12

0,24

-0.70

10

60

18

0,30

-0.52

13

80

28

0,35

-0.38

15

100

45

0,45

-0.12

20

70

36

0,51

0.03

25

65

39

0,60

0.25

30

50

33

0,66

0.40

35

40

30

0,75

0.67

40

25

20

0,80

0.84

Agung Priyo Utomo - agungpu@gmail.com

11

Model Probit

Dari data tersebut, model probit dapat diperoleh sbb:

Berdasarkan est. Pi (frekuensi relatif), maka dapat diperoleh Ii dari


CDF normal (ada di tabel sebelumnya)
Setelah Ii diperoleh, maka dapat dicari 1 dan 2 dg mudah

Pada analisis probit, Ii disebut normal equivalent deviate


(n.e.d) atau disebut juga normit
Karena Ii atau n.e.d akan bernilai negatif (-) pada saat Pi <
0.5, maka dalam prakteknya ditambahkan dengan nilai 5
dan hasilnya disebut probit
probit = n.e.d + 5 = Ii + 5
1 dan 2 dapat diestimasi berdasarkan model:
Ii = 1 + 2Xi + ui
; dimana ui = unsur gangguan
Agung Priyo Utomo - agungpu@gmail.com

12

Model Probit

Tahapan dalam model probit:


1. Dari data yang sudah dikelompokkan, estimasi Pi
(frekuensi relatif)
2. Berdasarkan estimasi dari Pi, cari n.e.d (Ii) dari CDF
normal
3. Gunakan estimasi Ii (Ii*), sebagai variabel terikat dalam
regresi
Ii* = 1 + 2Xi + ui
4. Jika diperlukan, tambahkan 5 pada nilai n.e.d (Ii) untuk
mengubah menjadi probit dan gunakan sebagai
variabel terikat pada
Ii* = 1 + 2Xi + ui
Agung Priyo Utomo - agungpu@gmail.com

13

Logit vs Probit?

Kedua model termasuk dalam model non linier


Untuk membuat menjadi model linier, Logistik
menggunakan transformasi fungsi logit (logaritma natural
dari nilai odds), sedangkan probit menggunakan fungsi
invers dari distribusi kumulatif normal (Z-score)
Dalam prakteknya kedua model seringkali memberikan
hasil yang sama/mirip.
Kedua metode menggunakan metode MLE
Model probit tidak menghasilkan nilai odds ratio seperti
pada model logit.

Agung Priyo Utomo - agungpu@gmail.com

14

Perkiraan Peluang Logit &


Probit

Agung Priyo Utomo - agungpu@gmail.com

15

Contoh:
(Aplikasi menggunakan SPSS)

Beberapa siswa SMU berkeinginan untuk melanjutkan


kuliah. Dalam berkas lamarannya, mereka memasukkan
skor GRE dan nilai GPA. Beberapa siswa berasal dari
sekolah unggulan dan ada juga yang dari sekolah non
unggulan. Beberapa bulan setelah siswa mengirimkan
aplikasi, siswa tersebut menerima 2 macam amplop (tebal
atau tipis) yang menandakan mereka diterima atau ditolak
di PT yang bersangkutan.
Data ada di file probit.sav

Agung Priyo Utomo - agungpu@gmail.com

16

Contoh:
(Aplikasi menggunakan SPSS)

Variabel tak bebas/terikat = admit


1 = diterima (admitted)
0 = tidak diterima (not admitted)
Variabel bebas =
gre (graduate record exam score),
gpa (grade point average),
topnotch (asal sekolah) :
- 1 jika berasal dari sekolah ungulan
- 0 jika berasal dari sekolah non unggulan
Agung Priyo Utomo - agungpu@gmail.com

17

Contoh:
(Aplikasi menggunakan SPSS)
Descriptive Statistics
N
Graduat e Record Exam
Grade Point Av erage
Valid N (listwise)

400
400
400

Minimum
220,00
2, 26

Max imum
800,00
4, 00

Mean
587,7000
3, 3899

Std. Dev iation


115,51654
,38057

Asal Sekol ah

Valid

Non Unggulan
Unggulan
Tot al

Frequency
335
65
400

Percent
83, 8
16, 3
100,0

Valid Percent
83, 8
16, 3
100,0

Agung Priyo Utomo - agungpu@gmail.com

Cumulat iv e
Percent
83, 8
100,0

18

Beberapa Strategi

Regresi OLS
Analisis ini akan bermasalah, karena asumsi OLS akan
terlanggar jika digunakan pada kasus variabel terikatnya
berupa kategorik.
Uji t
Uji ini bisa digunakan jika kasusnya hanya terdiri dari
satu variabel bebas dan bersifat kuantitatif, misal hanya
melihat pengaruh dari GPA terhadap diterima atau
tidaknya seorang siswa di PT.
Regresi Logit
Model ini sangat mirip dengan model probit
Agung Priyo Utomo - agungpu@gmail.com

19

Penggunaan Model Probit

Sebelum menjalankan model probit, maka periksa dulu


apakah ada sel yang kosong/terlalu kecil frekuensinya
(pada tabulasi silang antara variabel bebas kategorik dan
variabel tak bebasnya). Jika terdapat sel yang kosong,
maka akan sulit menjalankan model probit.
Admi ssi on Status * Asal Sekolah Crosstabul ati on
Count

Admis sion
Stat us
Tot al

not admitt ed
admitt ed

Asal Sekolah
Non
Unggulan
Unggulan
238
35
97
30
335
65

Agung Priyo Utomo - agungpu@gmail.com

Tidak ada
sel yang kosong

Tot al
273
127
400

20

Model Probit

Sebelum menjalankan model probit, maka periksa dulu


apakah ada sel yang kosong/terlalu kecil frekuensinya
(pada tabulasi silang antara variabel bebas kategorik dan
variabel tak bebasnya). Jika terdapat sel yang kosong,
maka akan sulit menjalankan model probit.

Karena GPA dan GRE


kuantitatif/kontinu

Agung Priyo Utomo - agungpu@gmail.com

21

Model Probit
Semua data
valid digunakan

Agung Priyo Utomo - agungpu@gmail.com

Digunakan untuk
mengetahui
apakah model dg
beberapa variabel
bebas lebih baik
drpd model tanpa
variabel bebas
(hanya intersep).
Nilai sig. sebesar
0.000 < (misal
5%) menunjukkan
bahwa model dg
variabel bebas
lebih baik dari
model tanpa
variabel bebas.

22

Model Probit

Merupakan perkiraan/pendekatan untuk


R2 seperti pada regresi OLS pada model
non linier. (pada model non linier tidak
bisa dihitung R2 scr langsung spt pada
model regresi OLS).
Terdapat banyak jenis pseudo R2, dan
masing-masing akan memberikan nilai
perkiraan yg berbeda

Nilai koef. tdk bisa diinterpretasikan spt pd regresi OLS


Interpretasi dpt dilakukan melalui probit index atau Zscore
Contoh: untuk setiap kenaikan skor GRE, akan
menaikkan Z-score sebesar 0,002

Agung Priyo Utomo - agungpu@gmail.com

GRE & GPA


signifikan
mempengaruhi
status pendaftaran
siswa di PT

23

Cautions !

Ukuran sampel: Baik model logit maupun probit


memerlukan jumlah sampel yg lebih banyak
dibandingkan regresi OLS, karena keduanya
menggunakan metode MLE
Sel kosong/sedikit: jika terdapat sel kosong atau hanya
sedikit frekuensinya, maka kedua model tdk bisa
digunakan/dijalankan
Pseudo R2: nilai ini tdk sama dg R2 pada OLS, ada
banyak jenis pseudo R2
Diagnosa: pada model probit pemeriksaan asumsi
dilakukan seperti pada model logit.
Agung Priyo Utomo - agungpu@gmail.com

24

Anda mungkin juga menyukai