Anda di halaman 1dari 10

Berkenalan dengan Regresi Probit

Wahyu
Widhiarso
Fakultas Psikologi Universitas Gadjah Mada
Yogyakarta |
2012

1 Pengantar
Ketika variabel dependen (Y) berbentuk dikotomi atau biner dan
diasumsikan mengikuti distribusi binomial kita dapat menggunakan
analisis regresi logit atau probit. Salah satu keuntungan untuk
menggunakan regresi probit adalah bahwa nilainilai yang diperoleh dari
pencocokan model (fitting) langsung dapat diubah menjadi probabilitas
dengan menggunakan nilai dari tabel normal standar. Dalam hal ini kita
hanya perlu mencari nilai probabilitas terkait dengan skor z yang diperoleh
dari model.

2 Persamaan
Regresi linier dengan satu prediktor (X) didefinisikan dengan persamaan
di bawah ini. B0 adalah intersep dan B1 adalah slope. Slope
menunjukkan seberapa besar peranan prediktor (X) dalam menjelaskan
variabel keluaran (Y).

Y 0
1 X

Regresi logistik dengan satu prediktor (X) didefinisikan dengan persamaan


di
bawah ini. Karena diterapkan pada data keluaran yang bersifat dikotomi
(pilah), maka persamaan regresi ditransformasi menjadi probabilitas (P)
yang merupakan kepanjangan dari P=1 (probabilitas untuk
mendapatkan skor 1).

exp(0 1 X ) P
X
P ata Ln
1 exp(0 1X ) u 0 1
1P

Regresi Probit merupakan modifikasi regresi logistik dengan


menetapkan
persamaan regresi logit mengikuti distribusi normal. Dengan
menggunakan regresi probit maka B0+B1X dilihat sebagai skor standar
Z yang mengikuti distribusi normal, maka didapatkan :

exp(Z ) P
P ata Ln Z
u

1 ) 1 P
exp(Z

Persamaan ini didasari pada distribusi normal () di bawah ini sehingga regresi
probit ditunjukkan dengan (Z) (Skrondal & Hesketh, 2004). Simbol
menunjukkan berlakunya fungsi deviasi standar distribusi normal
(inverse standard normal distribution).
t Z
2

1
P(Y 1) e 2 dt (z )
2

1|Page
Z adalah suatu variabel kontinu yang tidak teramati (laten) karena
merupakan suatu "kecenderungan" munculnya sebuah kejadian. Jadi
misalnya data teramati kita adalah lulus (kode 1) dan tidak lulus (kode
0), nilai Z menunjukkan kecenderungan atau probabilitas untuk lulus.
Contoh lainnya adalah data pelanggan. Melakukan pembelian ulang
(kode 1) dan tidak melakukan pembelian ulang (kode 0). Dalam kasus
ini Z merupakan suatu kecenderungan pelanggan untuk melakukan
pembelian ulang. Semakin besar nilai Z semakin besar
kecenderungan pelanggan untuk melakukan pembelian ulang.

3 Hubungan antara Hasil Estimasi dan Probabilitas


Gambar di bawah ini menunjukkan hubungan antara hasil regresi
probit dengan kurva normal yang diwujudkan dalam kontinum
probabilitas. Ketika hasil persamaan regresi probit menghasilkan nilai nol,
itu artinya nilai probabilitas yang dihasilkan sama dengan 50%. Ketika
persamaan regresi probit menghasilkan nilai 1.645, itu artinya probabilitas
yang didapatkan adalah 5%.

Luas Area 1
50% probit() (0.500) 0
atau
=0.050

1
probit() (0.050) 1.645
Luas Area
5%
atau
=0.050 1
probit() (0.975) 1.96

Luas Area
97.5%
atau
=0.975

Proses analisis dengan menggunakan program komputer akan


menghasilkan nilai
probit (Z) yang menunjukkan posisi individu dalam wilayah kurva
normal. Oleh karena itu untuk menghasilkan informasi mengenai
probabilitas yang dihasilkan kita perlu mentransformasinya dengan
menggunakan tabel Z.
Misalnya dengan memasukkan nilai individu yang memiliki X=1 ke
dalam persamaan regresi kita dapatkan nilai untuk individu tersebut adalah
Y=0. Nilai
0 ini kemudian ditransformasi melalui tabel Z menjadi 0.5 (50%).

Penghubung logit dan probit sering memberikan hasil yang sama


meskipun penghubung probit mendiskriminasikan dengan lebih baik
dan mendekati nilai median (0.5 respon probabilitas).

4 Praktek !
4.1.1 Data
Kali ini kita meneliti seberapa besar probabilitas jejaka untuk
memutuskan menikah didasarkan dari kesiapan (X1) dan tingkat
kemandiriannya (X2).

2|Page
Variabel keputusan menikah bersifat kategorikal, memutuskan menikah
(kode 1) dan belum memutuskan menikah (kode 0). Data prediktor
bersifat kontinyu karena didapatkan dari skor skala psikologi. Tabel di
bawah ini contoh penampakan data ini.

4.1.2 Menganalisis
Di program SPSS analisis regresi probit dengan tampilan data di atas lebih
tepat dianalisis dengan menggunakan syntax.

plum menikah with siap mandiri


/link = probit
/print = parameter summary.

Gambar di atas menunjukkan syntax yang dapat kita terapkan. Anda


tinggal
mengganti nama variabel di atas dengan nama variabel anda. Untuk
kasus di atas, nama variabel yang dipakai disesuaikan dengan nama
variabel di dalam data.

4.1.3 Hasil Analisis


Berikut ini hasil output yang keluar dari SPSS.

Model Fitting Information. Bagian ini menunjukkan kebaikan model


yang kita kembangkan. Nilai 2 loglikelihood pada baris intercept only
didapatkan dari model tanpa prediktor. Pada model tanpa prediktor ini
nilai koefisien slope regresi diasumsikan sebesar nol (b1=0). Akibatnya
hanya koefisien intersep saja yang dipakai. Berikut ini adalah model yang
hanya melibatkan intersep () saja.
probit()
o

Model Final menggambarkan model yang mencakup variabel prediktor


yang kita analisis. Nilai ini didapatkan dari proses iterasi untuk menemukan
log likelihood
3|Page
yang maksimal (baca tulisan estimasi maksimum likelihood di bab
sebelumnya). Persamaan untuk model ini adalah sebagai berikut.

probit() 0
1 X

Hasil analisis menunjukkan adanya perbedaan yang signifikan


(2=113.463;
p<0.05). Dapat disimpulkan bahwa melibatkan prediktor dalam model
lebih baik daripada tidak melibatkannya sama sekali. Nilai df didapatkan
dari jumlah prediktor yang dilibatkan di dalam model.

Pseudo R-Square. Rkuadrat dalam Regresi probit tidak sama


dengan R kuadrat yang ditemukan dalam regresi linier (OLS). Namun
demikian sejumlah ahli telah mencoba untuk
mengembangkannya. Karena nilai ini tidak
menunjukkan Rkuadrat yang sebenarnya maka dinamakan
dengan R-Square pseudo (Rkuadrat semu).

Parameter Estimates. Bagian ini menunjukkan koefisien regresi.


Probabilitas pengambilan keputusan menikah terprediksi dilaporkan
dengan menggunakan koefisien ini. Nilai ambang (threshold)
menunjukkan nilai konstan seperti halnya dalam regresi linier. Berdasarkan
hasil di atas dapat dihasilkan persamaan regresi probit yang dihasilkan
adalah:

1

F (Z ) (Z )
1 -14.49
2.563(siap) 0.229(mandiri)
F (Z )

Hasil analisis melalui program STATA dapat dilihat pada Tabel di bawah
ini.
. probit menikah siap mandiri

Probit regression Number of obs = 10


LR chi2(2) = 0
113.4
Prob > chi2 = 6
0.000
Log likelihood = -12.403309 Pseudo R2 = 0
0.820
6
------------------------------------------------------------------------------
menikah | Coef. Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
siap | 2.56276 .7542198 3.40 0.001 1.084516 4.04100
mandiri | -.2288208 .1566053 -1.46 0.144 -.5357616 4 .
_cons | -14.49084 4.175093 -3.47 0.001 -22.67387 - 07812
6.30780
------------------------------------------------------------------------------ Note: 22 failures and
25 successes completely determined.

4|Page
F adalah fungsi distribusi normal kumulatif. Interpretasi koefisien dalam
regresi probit tidak sama dengan regresi linier atau regresi logistik.
Peningkatan probabilitas dalam analisis ini dikaitkan dengan peningkatan
satu unit prediktor lain dan nilai awal prediktor.
Dari hasil analisis ini dapat ketahui koefisien (beta) untuk kesiapan menikah
adalah 2.563 (p<0.05). Nilai signifikansi di bawah 0.05 menunjukkan
bahwa nilai koefisien ini berbeda secara signifikan dengan beta=0.
Dengan kata lain merupakan prediktor pemilihan keputusan menikah
yang signifikan. Sebaliknya, nilai koefisien kesiapan tidak
signifikan (2.563; p<0.05) sehingga bukan
merupakan prediktor pemilihan keputusan menikah.

4.1.4 Menerapkan Hasil


Kita mendapatkan persamaan regresi
F(Z)=[14.49+2.563(X1)+0.299(X2)]. Karena peranan kemandirian
tidak signifikan, maka kita keluarkan
dari persamaan. Dengan demikian persamaan kita menjadi
F(Z)=14.49+2.563X1.
Jika X1=0 maka F(Z)= [14.49+2.563(0)]=14.49. Jika X1=1
maka Z=19.61. Sekarang tinggal kita mentransformasikan nilai Z ini
menjadi nilai probabilitas. Kita tinggal melihat tabel. Misalnya nilai
Z=19.61 terletak pada wilayah 0.999
(mendekati 1). Kasus kita kali ini kurang pas untuk contoh penerapan
karena nilai koefisien B0 dan B1 yang dihasilkan sangat besar sehingga
mendekati 1. Berikut ini contoh lainnya.
Misalnya peneliti hendak memprediksi kesuksesan berwirausaha
berdasarkan kemauan mengambil resiko (X). Kesuksesan berwirausaha
terdiri dari sukses=1 dan belum sukses=0.
Persamaan regresi menghasilkan
F(Z)=[
2.061+0.188(X1)]. Ketika nilai X=0 maka nilai Z yang dihasilkan adalah

2.061+0.188 (0)=2.061. Kita lihat di tabel Z, nilai Z=2.061 sama


dengan luas kurva sebesar 0.02 atau probabilitas sebesar 2%. Jika X=5
maka nilai Z=1.12 yang setara dengan probabilitas sebesar 13.1%.
Artinya ketika kemauan individu mengambil resiko sebesar 5, maka
probabilitas untuk suksesnya adalah 13.1%.

5 Referensi
Skrondal, A. and RabeHesketh, S. (2004). Generalized Latent Variable
Modeling: Multilevel, Longitudinal and Structural Equation Models.
Boca Raton, FL : Chapman & Hall/CRC
5|Page

Anda mungkin juga menyukai