Toaz - Info Perbandingan Antara Regresi Logit Probit Dan Tobit PR

Tigas Analisis Data Kualitatif Nahiruddin
(1302 201 010)

Perbandingan antara Regresi Logit, Probit dan Tobit
PERBANDINGAN ANTARA REGRESI LOGIT,

PROBIT DAN TOBIT
1. Model Regresi Logit
Regresi logistik sering digunakan dalam menyelesaikan masalah klasifikasi pada
metode parametrik. Metode ini digunakan untuk menggambarkan hubungan variabel
dependen (variabel respon) dengan variabel independen (variabel predictor) bersifat
kategori, kontinu atau kombinasi keduanya.
Untuk menggambar kondisional mean dari Y (respon) terhadap X (prediktor)
digunakan hitungan π( x ) =E (Y x) . Bentuk dari model logistik adalah sebagai berikut:
exp( β 0 + β ' x )
π ( x) = (1.1)
1 + exp( β 0 + β ' x)
dimana : β ’ = (β 1, β 2, …, β p) dan X = (x1, x2, …, xp)
p = jumlah parameter
dengan menggunakan transformasi logit dari π (x), maka model logistik dapat disebut
Model Logit yang ditunjukkan oleh:
 π ( x)  p
g ( x ) = ln   = β 0 + β1 x1 + β 2 x 2 + ... + β p x p = ∑ β j x j
1 − π ( x)  j =1
(1.2)
Pada regresi linier berganda diasumsikan bahwa Y = π (x) + ε dimana ε adalah
galat error dan menunjukkan selisih obyek pengamatan terhadap nilai harapannya. Galat
-1-
(1302 201 010)
diasumsikan berdistribusi normal dengan rataan nol variansi tetap terhadap variabel
pengamatannya. Sehingga dengan respon yang biner dinyatakan, jika
Y = 0, maka ε = -π (x) dengan probabilitas 1 - π (x)
Y = 1, maka ε = 1 - π (x) dengan probabilitas π (x).
Dan dapat dinyatakan bahwa ε memiliki E(ε ) = 0 dan var(ε ) = π (x). [1 - π (x)] yang
mengikuti distribusi binomial (Hosmer,1989).
Metode pendugaan yang digunakan untuk mengestimasi parameter yang belum
diketahui adalah pendugaan likelihood Maksimum (Maximum Likelihood Estimation atau
MLE) dengan menetapkan asumsi distribusi Bernoulli dan obyek pengamatan saling
bebas, E(ε i, ε j) = 0, i ≠ j.
Pada pasangan pengamatan (xi,yi) fungsi likelihood yang dimaksimumkan adalah :
ς ( xi ) = π ( xi ) y [1 − π ( xi )] 1− y
i i
(1.3)
Karena pengamatan diasumsikan bersifat independen, maka likelihood
pengamatan mrupakan perkalian dari fungsi likelihood masing-masing, misal dinyatakan
dengan :
I
I ( β ) = ∏ς ( xi )
i =1
yi
I
 π ( xi ) 
= ∏  {1 − π ( xi )} n
i
(1.4)
i =1  (1 − π ( x i )) 
dimana yi adalah variabel random binomial yang saling bebas, i = 1, 2,…, I dengan
E(yi) = ni . π (xi) dan ∑ ni = N.
-2-
(1302 201 010)
yi
 π ( xi ) 
Karena z = exp (ln z), maka untuk z =   persamaan (1.4) dapat
 (1 − π ( xi )) 
ditulis menjadi :
 I ni    π ( xi ) 
∏ {1 + π ( xi ) }  exp ∑ y i ln  {1 − π ( x )}  (1.5)
 i =1    i 
kemudian dilakukan transformasi logit terhadap model regresi logistik pada persamaan
(1.5). sehingga didapatkan model :
 I  
−ni
   
∑ 
 ∑β j xij
1 + exp  exp ∑( y i xij ) β j  (1.6)
 i =1   
   j 
   j 

Prinsip dari MLE untuk mendapatkan nilai taksiran β adalah dengan
memaksimumkan fungsi likelihood. Nilai maksimim dari fungsi persamaan (1.6)
diperoleh melalui transformasi log sebagai berikut :
L(β ) = ln (I(β ))
    
  
= ∑∑y i x ij β j −∑ni ln 1 +exp ∑β j xij  (1.7)
  
 j  i   i   j 

Nilai β diperoleh melalui turunan parsial pertama L(β ) terhadap β yang
disamadengankan nol, sehingga persamaan (1.7) akan menjadi :
∂L( β )
= ∑ y i xia − ∑ni xia π i = 0 (1.8)
∂Lβ a i i
dimana a = 0,1, 2, …., p dengan
-3-
(1302 201 010)
   
 exp ∑βi xij  


πi =   j  
menyatakan taksiran likelihood maksimum dari
 
1 + exp ∑β j xij 
  
  j 
π (xi). Sedang terhadap varians diperoleh dari turunan parsial kedua dari persamaan (1.8)
yang hasilnya sebagai berikut :
   
 exp ∑βi xij  
∂2 L( β)  
= −∑ni xia xib 

 j  
∂βa ∂βb  
i
1 + exp ∑β j xij 
  
  j 
= −∑ni xia xib π i (1 −π i ) (1.9)

i
dimana a, b = 0, 1, 2, …, p
2. Model Regresi Probit
Regresi Probit adalah suatu analisis regresi yang digunakan untuk menggambarkan
hubungan antara variabel dependen dan variabel independen. Variabel dependen (variable
respon) biasa disimbolkan Y dengan skala pengukuran dikotomus (biner) dan variabel
independent (variable prediktor) biasa disimbolkan X yang skala pengukuran bersifat
dikotomus, polikotomus atau kontinu.
1  1 
Jika φ ( x) = exp  − x 2 
2π  2 
Dan jika diketahui
Y=1 P(y = 1x)
Y=0 P(y = 0x)
-4-
(1302 201 010)
β0 +β1 x
1  1 
Maka P(y = 1/x) = ∫ 2π
exp  − t 2 dt
 2 
= Φ [β 0 + β 1x] (2.1)
Dengan Φ [.] adalah fungsi komulatif distribusi normal standar.
Φ−1 [ P ( y =1 x )] = Φ−1 [Φ[ β0 + β1 x ]]
Φ−1 [ P ( y = 1 x )] = β0 + β1 x
−1
atau Z = β 0 + β 1x1 dengan Z = Φ P ( y =1 x)
Dengan cara yang sama jika variabel bebas lebih dari satu, maka:
Z = Xβ + e (2.2)
Dengan Z merupakan variabel yang tidak diobservasi dan observasi kita adalah :
Y=1 Jika Z > 0
Y=0 jika Z ≤ 0 dengan ε adalah residual yang diasumsikan
berdistribusi normal dengan mean nol (0) dan varians satu (1).
Probabilitas Yi = 1 dari persamaan (2.1) adalah :
P ( y i =1  x) = Φ (Xiβ )
(2.3)
P ( y i = 0  x) = 1 - Φ (Xiβ ) (2.4)
3. Model Regresi Tobit
Regresi Tobit (regrsi tersensor) merupakan analisis regresi yang digunakan untuk
menggambarkan hubungan antara variabel dependen dan variabel independen. Variabel
-5-
(1302 201 010)
dependen (variable respon) biasa disimbolkan Y yang berskala campuran dengan variabel
indepeden (variable prediktor) biasa disimbolkan X. Output dari analisis regresi ini untuk
mengestimasi nilai rata-rata dari variabel dependen bila nilai variabel independen
diketahui.
Formula model tobit secara umum adalah sebagai berikut :
Y* = Xβ + ε (3.1)
dimana :
Y* : vektor dari variabel takbebas
X : matriks dari variabel regressor atau bebas
β : vektor estimasi parameter yang nilainya belum diketahui
ε : residual model yang mengikuti distribusi normal terpotong (0,σ 2).
Model Tobit juga dapat terbentuk dalam dua bagian formula yang digunakan untuk
memprediksikan variabel tak bebas yaitu memprediksikan nilai dimana variabel tak bebas
adalah nol (limited) sedangkan yang lain tidak nol (unlimited). Model tobit dapat ditulis
sebagai:
*
Yi * Yi > 0
Jika
Yi =  (3.2)
Untuk
 0 yang lain
Nilai ekspektasi dari regresi Tobit adalah :
E (Y X ) =P (Yi >0) E (Yi Yi >0) +P (Yi =0) E (Yi Yi =0)
1
= Φ( X i β +σ ) + P (Yi = 0). 0
Φ (3.3).
= XβΦ +σ
-6-
(1302 201 010)
Tujuan utama dari pembentukan model adalah untuk memilih variabel yang sesuai
dan memberikan hasil yang terbaik dalam menjelaskan masalah yang dihadapi. Semakin
banyak variabel yang masuk kedalam model, maka semakin kompleks model yang
dihasilkan. Begitu juga semakin banyak variabel prediktor yang diperlukan untuk
menduga respon. Hal ini diatasi dengan menyeleksi variabel yang masuk ke model secara
bertahap agar didapatkan model yang layak digunakan.
Langka-langkah yang dilakukan untuk memilih variabel yang layak adalah pertama,
memeriksa korelasi antara variabel prediktor. Tujuannya adalah untuk mendapatkan
variabel prediktor yang independen. Jika didapatkan variabel prediktor yang saling
berkorelasi, maka hanya variabel prediktor yang mempunyai korelasi terbesar dengan
variabel respon yang akan diikutkan dalam pembentukan model, karena variabel prediktor
yang nilai korelasinya dengan variabel respon kecil sudah terwakili oleh variabel tersebut.
Selanjutnya membuat model univariat, yaitu dengan meregresikan masing-masing
variabel prediktor terhadap variabel respon. Untuk mengetahui apakah hubungan antara
variabel respon dengan prediktor signifikan atau tidak. Variabel prediktor yang tidak
mempunyai hubungan yang signifikan dengan variabel respon akan dikeluarkan dari
pembentukan model. Kemudian memodelkan secara serentak (multivariate) variabel
respon dan semua variabel prediktor yang signifikan pada pemodelan univariate.
-7-

Toaz - Info Perbandingan Antara Regresi Logit Probit Dan Tobit PR

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Toaz - Info Perbandingan Antara Regresi Logit Probit Dan Tobit PR

Diunggah oleh

Hak Cipta:

Format Tersedia

Tigas Analisis Data Kualitatif Nahiruddin

(1302 201 010)

PERBANDINGAN ANTARA REGRESI LOGIT,

1. Model Regresi Logit

Regresi logistik sering digunakan dalam menyelesaikan masalah klasifikasi pada

metode parametrik. Metode ini digunakan untuk menggambarkan hubungan variabel

dependen (variabel respon) dengan variabel independen (variabel predictor) bersifat

kategori, kontinu atau kombinasi keduanya.

Untuk menggambar kondisional mean dari Y (respon) terhadap X (prediktor)

digunakan hitungan π( x ) =E (Y x) . Bentuk dari model logistik adalah sebagai berikut:

dimana : β ’ = (β 1, β 2, …, β p) dan X = (x1, x2, …, xp)

Model Logit yang ditunjukkan oleh:

Pada regresi linier berganda diasumsikan bahwa Y = π (x) + ε dimana ε adalah

pengamatannya. Sehingga dengan respon yang biner dinyatakan, jika

Y = 0, maka ε = -π (x) dengan probabilitas 1 - π (x)

Y = 1, maka ε = 1 - π (x) dengan probabilitas π (x).

mengikuti distribusi binomial (Hosmer,1989).

Metode pendugaan yang digunakan untuk mengestimasi parameter yang belum

diketahui adalah pendugaan likelihood Maksimum (Maximum Likelihood Estimation atau

Pada pasangan pengamatan (xi,yi) fungsi likelihood yang dimaksimumkan adalah :

Karena pengamatan diasumsikan bersifat independen, maka likelihood

pengamatan mrupakan perkalian dari fungsi likelihood masing-masing, misal dinyatakan

E(yi) = ni . π (xi) dan ∑ ni = N.

(1.5). sehingga didapatkan model :

Prinsip dari MLE untuk mendapatkan nilai taksiran β adalah dengan

memaksimumkan fungsi likelihood. Nilai maksimim dari fungsi persamaan (1.6)

diperoleh melalui transformasi log sebagai berikut :

Nilai β diperoleh melalui turunan parsial pertama L(β ) terhadap β yang

disamadengankan nol, sehingga persamaan (1.7) akan menjadi :

dimana a = 0,1, 2, …., p dengan

yang hasilnya sebagai berikut :

= −∑ni xia xib π i (1 −π i ) (1.9)

2. Model Regresi Probit

independent (variable prediktor) biasa disimbolkan X yang skala pengukuran bersifat

dikotomus, polikotomus atau kontinu.

Dan jika diketahui

Y=1 P(y = 1x)

Y=0 P(y = 0x)

Dengan Φ [.] adalah fungsi komulatif distribusi normal standar.

Φ−1 [ P ( y =1 x )] = Φ−1 [Φ[ β0 + β1 x ]]

Y=1 Jika Z > 0

Y=0 jika Z ≤ 0 dengan ε adalah residual yang diasumsikan

Probabilitas Yi = 1 dari persamaan (2.1) adalah :

3. Model Regresi Tobit

menggambarkan hubungan antara variabel dependen dan variabel independen. Variabel

Formula model tobit secara umum adalah sebagai berikut :

Y* : vektor dari variabel takbebas

X : matriks dari variabel regressor atau bebas

β : vektor estimasi parameter yang nilainya belum diketahui

ε : residual model yang mengikuti distribusi normal terpotong (0,σ 2).

Nilai ekspektasi dari regresi Tobit adalah :

E (Y X ) =P (Yi >0) E (Yi Yi >0) +P (Yi =0) E (Yi Yi =0)

bertahap agar didapatkan model yang layak digunakan.

memeriksa korelasi antara variabel prediktor. Tujuannya adalah untuk mendapatkan

Selanjutnya membuat model univariat, yaitu dengan meregresikan masing-masing

pembentukan model. Kemudian memodelkan secara serentak (multivariate) variabel

Anda mungkin juga menyukai