Anda di halaman 1dari 5

1 | P a g e

Berkenalan dengan Regresi Probit



Wahyu Widhiarso
Fakultas Psikologi Universitas Gadjah Mada
Yogyakarta | 2012

1 Pengantar
Ketika variabel dependen (Y) berbentuk dikotomi atau biner dan diasumsikan
mengikuti distribusi binomial kita dapat menggunakan analisis regresi logit atau
probit. Salah satu keuntungan untuk menggunakan regresi probit adalah bahwa
nilainilai yang diperoleh dari pencocokan model (fitting) langsung dapat diubah
menjadi probabilitas dengan menggunakan nilai dari tabel normal standar. Dalam
hal ini kita hanya perlu mencari nilai probabilitas terkait dengan skor z yang
diperoleh dari model.

2 Persamaan
Regresi linier dengan satu prediktor (X) didefinisikan dengan persamaan di
bawah ini. B0 adalah intersep dan B1 adalah slope. Slope menunjukkan seberapa
besar peranan prediktor (X) dalam menjelaskan variabel keluaran (Y).
0 1
Y X =
Regresi logistik dengan satu prediktor (X) didefinisikan dengan persamaan di
bawah ini. Karena diterapkan pada data keluaran yang bersifat dikotomi (pilah),
maka persamaan regresi ditransformasi menjadi probabilitas (P) yang merupakan
kepanjangan dari P=1 (probabilitas untuk mendapatkan skor 1).
0 1
0 1
exp( )
1 exp( )
X
P
X

=

atau
0 1
1
P
Ln X
P

1

=



( )

Regresi Probit merupakan modifikasi regresi logistik dengan menetapkan
persamaan regresi logit mengikuti distribusi normal. Dengan menggunakan regresi
probit maka B
0
+B
1
X dilihat sebagai skor standar Z yang mengikuti distribusi
normal, maka didapatkan :
exp( )
1 exp( )
Z
P
Z
=

atau
1
P
Ln Z
P
1

=



( )

Persamaan ini didasari pada distribusi normal () di bawah ini sehingga regresi
probit ditunjukkan dengan (Z) (Skrondal & Hesketh, 2004). Simbol

menunjukkan berlakunya fungsi deviasi standar distribusi normal (inverse
standard normal distribution).
2
2
1
( 1) ( )
2
t
Z
P Y e dt z

= = = 1
]

2 | P a g e

Z adalah suatu variabel kontinu yang tidak teramati (laten) karena merupakan
suatu "kecenderungan" munculnya sebuah kejadian. Jadi misalnya data teramati
kita adalah lulus (kode 1) dan tidak lulus (kode 0), nilai Z menunjukkan
kecenderungan atau probabilitas untuk lulus. Contoh lainnya adalah data
pelanggan. Melakukan pembelian ulang (kode 1) dan tidak melakukan pembelian
ulang (kode 0). Dalam kasus ini Z merupakan suatu kecenderungan pelanggan
untuk melakukan pembelian ulang. Semakin besar nilai Z semakin besar
kecenderungan pelanggan untuk melakukan pembelian ulang.

3 Hubungan antara Hasil Estimasi dan Probabilitas
Gambar di bawah ini menunjukkan hubungan antara hasil regresi probit dengan
kurva normal yang diwujudkan dalam kontinum probabilitas. Ketika hasil
persamaan regresi probit menghasilkan nilai nol, itu artinya nilai probabilitas
yang dihasilkan sama dengan 50%. Ketika persamaan regresi probit menghasilkan
nilai 1.645, itu artinya probabilitas yang didapatkan adalah 5%.

Luas Area 50%
atau =0.050
1
( ) (0.500) 0 probit

= 1 =


Luas Area 5%
atau =0.050
1
( ) (0.050) 1.645 probit

= 1 =

Luas Area 97.5%
atau =0.975
1
( ) (0.975) 1.96 probit

= 1 =


Proses analisis dengan menggunakan program komputer akan menghasilkan nilai
probit (Z) yang menunjukkan posisi individu dalam wilayah kurva normal. Oleh
karena itu untuk menghasilkan informasi mengenai probabilitas yang dihasilkan
kita perlu mentransformasinya dengan menggunakan tabel Z.
Misalnya dengan memasukkan nilai individu yang memiliki X=1 ke dalam
persamaan regresi kita dapatkan nilai untuk individu tersebut adalah Y=0. Nilai
0 ini kemudian ditransformasi melalui tabel Z menjadi 0.5 (50%).
Penghubung logit dan probit sering memberikan hasil yang sama meskipun
penghubung probit mendiskriminasikan dengan lebih baik dan mendekati nilai
median (0.5 respon probabilitas).

4 Praktek !
4.1.1 Data
Kali ini kita meneliti seberapa besar probabilitas jejaka untuk memutuskan
menikah didasarkan dari kesiapan (X1) dan tingkat kemandiriannya (X2).
3 | P a g e

Variabel keputusan menikah bersifat kategorikal, memutuskan menikah (kode 1)
dan belum memutuskan menikah (kode 0). Data prediktor bersifat kontinyu
karena didapatkan dari skor skala psikologi. Tabel di bawah ini contoh
penampakan data ini.



4.1.2 Menganalisis
Di program SPSS analisis regresi probit dengan tampilan data di atas lebih tepat
dianalisis dengan menggunakan syntax.


plum menikah with siap mandiri
/link = probit
/print = parameter summary.


Gambar di atas menunjukkan syntax yang dapat kita terapkan. Anda tinggal
mengganti nama variabel di atas dengan nama variabel anda. Untuk kasus di
atas, nama variabel yang dipakai disesuaikan dengan nama variabel di dalam
data.
4.1.3 Hasil Analisis
Berikut ini hasil output yang keluar dari SPSS.


Model Fitting Information. Bagian ini menunjukkan kebaikan model yang
kita kembangkan. Nilai 2 loglikelihood pada baris intercept only didapatkan dari
model tanpa prediktor. Pada model tanpa prediktor ini nilai koefisien slope
regresi diasumsikan sebesar nol (b1=0). Akibatnya hanya koefisien intersep saja
yang dipakai. Berikut ini adalah model yang hanya melibatkan intersep () saja.
( )
o
probit =
Model Final menggambarkan model yang mencakup variabel prediktor yang kita
analisis. Nilai ini didapatkan dari proses iterasi untuk menemukan log likelihood
4 | P a g e

yang maksimal (baca tulisan estimasi maksimum likelihood di bab sebelumnya).
Persamaan untuk model ini adalah sebagai berikut.
0 1
( ) probit X =

Hasil analisis menunjukkan adanya perbedaan yang signifikan (
2
=113.463;
p<0.05). Dapat disimpulkan bahwa melibatkan prediktor dalam model lebih baik
daripada tidak melibatkannya sama sekali. Nilai df didapatkan dari jumlah
prediktor yang dilibatkan di dalam model.

Pseudo R-Square. Rkuadrat dalam Regresi probit tidak sama dengan R
kuadrat yang ditemukan dalam regresi linier (OLS). Namun demikian sejumlah
ahli telah mencoba untuk mengembangkannya. Karena nilai ini tidak
menunjukkan Rkuadrat yang sebenarnya maka dinamakan dengan R-Square
pseudo (Rkuadrat semu).

Parameter Estimates. Bagian ini menunjukkan koefisien regresi. Probabilitas
pengambilan keputusan menikah terprediksi dilaporkan dengan menggunakan
koefisien ini. Nilai ambang (threshold) menunjukkan nilai konstan seperti halnya
dalam regresi linier. Berdasarkan hasil di atas dapat dihasilkan persamaan regresi
probit yang dihasilkan adalah:
1
( ) ( )
1
( ) -14.49 2.563( ) 0.229( )
F Z Z
F Z siap mandiri

= 1

l
= 1
l

Hasil analisis melalui program STATA dapat dilihat pada Tabel di bawah ini.
. probit menikah siap mandiri

Probit regression Number of obs = 100
LR chi2(2) = 113.46
Prob > chi2 = 0.0000
Log likelihood = -12.403309 Pseudo R2 = 0.8206

------------------------------------------------------------------------------
menikah | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
siap | 2.56276 .7542198 3.40 0.001 1.084516 4.041004
mandiri | -.2288208 .1566053 -1.46 0.144 -.5357616 .07812
_cons | -14.49084 4.175093 -3.47 0.001 -22.67387 -6.307806
------------------------------------------------------------------------------
Note: 22 failures and 25 successes completely determined.

5 | P a g e

F adalah fungsi distribusi normal kumulatif. Interpretasi koefisien dalam regresi
probit tidak sama dengan regresi linier atau regresi logistik. Peningkatan
probabilitas dalam analisis ini dikaitkan dengan peningkatan satu unit prediktor
lain dan nilai awal prediktor.
Dari hasil analisis ini dapat ketahui koefisien (beta) untuk kesiapan menikah
adalah 2.563 (p<0.05). Nilai signifikansi di bawah 0.05 menunjukkan bahwa nilai
koefisien ini berbeda secara signifikan dengan beta=0. Dengan kata lain
merupakan prediktor pemilihan keputusan menikah yang signifikan. Sebaliknya,
nilai koefisien kesiapan tidak signifikan (2.563; p<0.05) sehingga bukan
merupakan prediktor pemilihan keputusan menikah.
4.1.4 Menerapkan Hasil
Kita mendapatkan persamaan regresi F(Z)=[14.49+2.563(X1)+0.299(X2)].
Karena peranan kemandirian tidak signifikan, maka kita keluarkan dari
persamaan. Dengan demikian persamaan kita menjadi F(Z)=14.49+2.563X1.
Jika X1=0 maka F(Z)= [14.49+2.563(0)]=14.49. Jika X1=1 maka Z=19.61.
Sekarang tinggal kita mentransformasikan nilai Z ini menjadi nilai probabilitas.
Kita tinggal melihat tabel. Misalnya nilai Z=19.61 terletak pada wilayah 0.999
(mendekati 1). Kasus kita kali ini kurang pas untuk contoh penerapan karena
nilai koefisien B0 dan B1 yang dihasilkan sangat besar sehingga mendekati 1.
Berikut ini contoh lainnya.
Misalnya peneliti hendak memprediksi kesuksesan berwirausaha berdasarkan
kemauan mengambil resiko (X). Kesuksesan berwirausaha terdiri dari sukses=1
dan belum sukses=0. Persamaan regresi menghasilkan F(Z)=[
2.061+0.188(X1)]. Ketika nilai X=0 maka nilai Z yang dihasilkan adalah
2.061+0.188 (0)=2.061. Kita lihat di tabel Z, nilai Z=2.061 sama dengan luas
kurva sebesar 0.02 atau probabilitas sebesar 2%. Jika X=5 maka nilai Z=1.12
yang setara dengan probabilitas sebesar 13.1%. Artinya ketika kemauan individu
mengambil resiko sebesar 5, maka probabilitas untuk suksesnya adalah 13.1%.

5 Referensi
Skrondal, A. and RabeHesketh, S. (2004). Generalized Latent Variable Modeling:
Multilevel, Longitudinal and Structural Equation Models. Boca Raton, FL :
Chapman & Hall/CRC