P. 1
REGRESI LOGISTIK

REGRESI LOGISTIK

1.0

|Views: 3,566|Likes:
Dipublikasikan oleh Ida Ayu Dyantari Putri

More info:

Published by: Ida Ayu Dyantari Putri on Oct 13, 2010
Hak Cipta:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOC, PDF, TXT or read online from Scribd
See more
See less

04/11/2014

pdf

text

original

REGRESI LOGISTIK Regresi logistik merupakan pengembangan lebih lanjut sebagai multivariat chi square yaitu variabel dependentnya

dalam skala data nominal (dikotomis ). Regresi logistik termasuk dalam rumpun dari regresi sehingga kedudukannya sama dengan regresi linier, sebagai uji prediksi atau estimasi, namun secara sederhana perbedaan antara regresi biasa dengan pemodelan logit ialah hanya pada variabel dependen atau responnya. Dimana pada regresi biasa dengan pemodelan logit ialah hanya pada variabel dependen dan responnya. Dimana pada regresi biasa, data variabel berupa data kontinyu, namun pada regresi logistik, data variabel dependennya berupa kategorik, baik Biner ( seperti Ya atau Tidak ) yang sering disebut dikotomus, atau juga polycotomus ( seperti sangat setuju, setuju, biasa, tidak setuju, dan sangat tidak setuju ), namun yang sering digunakan adalah untuk variabel dependen dikotomus. Model logit berdasarkan dari ide linier probability model (LPM ), yaitu Y = b₀ + b₁X + u misalnya variabel X adalah usia sedangkan variabel Y kejadian ca pulmo ( kanker pulmo)dimana 0 = tidak terjadi ca pulmo, 1 = tidak terjadi ca pulmo. Regresi linier tidak mampu menyelesaikan analisis ini, namun LPM dapat menyelesaikan analisis ini dengan cara ekspektasi kondisional Y dari X, dapat diinterpretasikan sebagai probabilitas kondisional saat suatu event Y akan muncul karena X, atau dituliskan dengan E(Yix), yang didefinisikan : p=P(Y) P=(Y=1IX=x), maka E(YIx)=p.1 + ( 1-p )*0=p untuk memenuhi konsep LPM , sangat sulit karena terkadang nilai dari P berada diluar range 0-1, sedangkan nilai R² umumnya kecil, sehingga perlu dibuat pemodelan logit untuk menyelesaikan kelemahan-kelemahan yang ada dalam LPM. Untuk membuat harga p selalu berada diantara 0 dan 1, maka perlu suatu fungsi monoton positif, yang memtakan linier prediktor h= a+bX ke unit interval. Transformasi tipe ini akan mempertahankan struktur linier dari model dan menghindari nilai peluang berada diluar interval [0,1]. Fungsi distribusi kumulatif (CDF= cummulative distributions function) akan memnuhi kriteria di atas. p=P(Y) P=(Y=1IX=x), P(h)= P(a+bX) dengan menggunakan fungsi logistik, diperoleh linier regresion atau linier logit model, dengan rumus sebagai berikut :

p=

=

=

1

riwayat keluarga ca pulmo dan daerah asal tinggal.718 Contoh : sebuah penelitian bertujuan ingin mencari faktor-faktor yang mempengaruhi kejadian kanker pulmo ( ca pulmo ). maka dapat dicari dari harga b yang telah diketahui . usia. dianalisis variabel independen adalan kebiasaan merokok. maka rumus mencari OR adalah OR= Dimana e adalah bilangan natural yang besarnya adalah 2.maka untuk rumus regresi logistik adalah p= E (Y=1IX )= untuk mencari odd ratio / OR ( sebagai faktor resiko ). Adapun data yang dikumpulkan adalah sebagai berikut: CA PULMO tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo tidak capulmo capulmo capulmo capulmo capulmo capulmo capulmo PEROKOK tak merokok tak merokok tak merokok tak merokok tak merokok tak merokok tak merokok merokok tak merokok tak merokok tak merokok tak merokok merokok merokok merokok merokok merokok merokok merokok merokok USIA 45 43 34 34 26 27 27 28 29 29 30 31 32 33 45 45 46 47 8 57 2 RIWAYAT KELUARGA tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca ada riwayat ca tdk ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca ada riwayat ca DAERAH desa desa desa desa kota kota kota kota kota kota desa desa desa desa desa desa desa desa desa kota .

ada riwayat ca=1. pada variabel perokok. perokok.capulmo capulmo capulmo capulmo capulmo capulmo capulmo capulmo capulmo capulmo merokok merokok tak merokok tak merokok tak merokok tak merokok merokok merokok merokok merokok 57 54 55 48 49 59 37 57 58 59 ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca tdk ada riwayat ca ada riwayat ca kota kota kota kota kota kota kota kota desa desa Keterangan data dari variabel dimana dari variabel ca pulmo . Untuk menyelesaikan masalah diatas hanya dapat dikerjakan dengan regresi logistik karena variabelnya berupa variabel dikotomi untuk variabel ca pulmo. Soal ini dapat diselesaikan dengan menggunakan aplikasi SPSS (Statistical Package For Social Science) RIWAYAT CA PULMO 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 PEROKOK 0 0 0 0 0 0 0 1 0 0 0 0 1 1 1 1 1 1 USIA 45 43 34 34 26 27 27 28 29 29 30 31 32 33 45 45 46 47 3 KELUARGA 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 1 DAERAH 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 . desa=0 .pada variabel daerah. tidak ca pulmo=0. kota=1. Sedangkan variabel usia distribusi data tidak normal. pada variabel umur berskala data interval. ca pulmo=1. daerah dan riwayat keluarga. merokok=1. pada variabel riwayat keluarga tidak ada riwayat ca=0. tak merokok=0 .

0 100. Dependent Variable Encoding Original Value Internal Value tidak capulmo 0 capulmo 1 Block 0: Beginning Block 4 . If weight is in effect.0 .0 . usia.0 100. riwayat keluarga dan daerah pada covariates selanjutnya klik ok Maka akan tampil output seperti dibawah ini Logistic Regression Case Processing Summary Unweighted Cases Selected Cases Included in Analysis Missing Cases Total Unselected Cases Total a N 30 0 30 0 30 Percent 100. see classification table for the total number of cases.8 1 1 57 1 1 57 1 1 54 1 1 55 1 0 48 1 0 49 1 0 59 1 0 37 1 1 57 1 1 58 1 1 59 1 1 • Masukkan data tersebut ke dalam aplikasi SPSS • • • • Analyze. binary logistik Isikan ca pulmo pada dependent 1 1 1 0 0 0 0 0 0 0 0 1 0 1 1 1 1 1 1 1 1 1 0 0 Sedangkan rokok. pilih regression.0 a.

500 Variables in the Equation Step 0 Constant B . Constant is included in the model.3 Step 0 Observed kanker pulmo Overall Percentage tidak capulmo capulmo a.464 .a.0 53.531 . The cut value is .001 Overall Statistics Block 1: Method = Enter Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 27.3 Step 1 Observed kanker pulmo Overall Percentage tidak capulmo capulmo a. .0 100. .000 .571 12.143 Variables not in the Equation Step 0 Variables ROKOK USIA RWYKLG DAERAH Score 8.8 93.960 27.E.000 .000 .496 Cox & Snell R Square .810 a Classification Table Predicted kanker pulmo tidak capulmo capulmo 13 1 1 15 Percentage Correct 92.715 Exp(B) 1.306 df 1 1 1 1 4 Sig.536 19.366 Wald .b Classification Table Predicted kanker pulmo tidak capulmo capulmo 0 14 0 16 Percentage Correct . .133 df 1 Sig. The cut value is . b. .9 93.606 Nagelkerke R Square .960 27.003 .011 .000 Model Summary Step 1 -2 Log likelihood 13.500 5 .134 S.960 df 4 4 4 Sig.820 6.

0 100. DAERAH. USIA. Hasil menunjukkan bahwa variabel usia yang signifikan ( sig. maka kita perlu melakukan analisis dengan metode forward.628 .562 7. If weight is in effect.393 .= 0.086 2.010 ) sedangkan variabel lainnya sebagai variabel moderator atas terjadinya ca pulmo.090 .068 3. 1.246 .109 . .705 Wald 1.169 5.310 -10.722 df 1 1 1 1 1 Sig.005 Exp(B) 6. see classification table for the total number of cases. Untuk mengetahui variabel mana yang berpengaruh atas ca pulmo. Variable(s) entered on step 1: ROKOK.603 1.888 .295 S.184 187.111 2.008 .0 .0 100.824 27. Langkah analisis metode forward adalah : • • • • Langkah awal sama dengan langkah sebelumnya Method diganti Forward Conditional Lalu klik ok Maka akan tampil output seperti dibawah ini Logistic Regression Case Processing Summary Unweighted Cases Selected Cases Included in Analysis Missing Cases Total Unselected Cases Total a N 30 0 30 0 30 Percent 100.E.236 3.0 a.Variables in the Equation Step a 1 ROKOK USIA RWYKLG DAERAH Constant B 1.0 .000 a.344 7.063 3. Dependent Variable Encoding Original Value Internal Value tidak capulmo 0 capulmo 1 Block 0: Beginning Block 6 .877 2. RWYKLG. d ari hasil diketahui bahwa semua variabel dimasukkan dalam hasil analisis. karena metode yang kita pakai adalah metode enter. dimana dengan memasukkan variabel yang signifikan saja dalam analisis.

001 Overall Statistics Block 1: Method = Forward Stepwise (Conditional) Omnibus Tests of Model Coefficients Step 1 Step Block Model Step Block Model Chi-square 15.143 Variables not in the Equation Step 0 Variables ROKOK USIA RWYKLG DAERAH Score 8.000 .000 .571 12. . The cut value is . .3 Step 0 Observed kanker pulmo Overall Percentage tidak capulmo capulmo a.543 .815 19.464 .000 .003 . .695 7 .134 S.133 df 1 Sig. b.000 . Constant is included in the model.0 53.531 .047 df 1 1 1 1 2 2 Sig.536 19.820 6.011 .640 15.a.306 df 1 1 1 1 4 Sig.011 .407 22.000 Step 2 Model Summary Step 1 2 -2 Log likelihood 25.406 .0 100.366 Wald .E.640 6.000 .500 Variables in the Equation Step 0 Constant B .640 15.047 22.715 Exp(B) 1. .520 Nagelkerke R Square .409 Cox & Snell R Square .b Classification Table Predicted kanker pulmo tidak capulmo capulmo 0 14 0 16 Percentage Correct .

b. .365 9.169 .720 Change in -2 Log Likelihood 15.973 8. of the Change .893 6.002 16.177 .000 a.728 S.352 1.000 a.767 -13. .000 .125 df 1 1 1 1 1 Sig. Variable(s) entered on step 1: USIA.5 86.052 2. .7 87. Variable(s) entered on step 2: ROKOK.011 .004 .794 .156 -6.027 .0 Step 1 Observed kanker pulmo tidak capulmo capulmo Step 2 Overall Percentage kanker pulmo tidak capulmo capulmo Overall Percentage a.895 Wald 8.E.403 -16.458 5.a Classification Table Predicted kanker pulmo tidak capulmo capulmo 12 2 2 14 12 1 2 15 Percentage Correct 85.7 93.801 1.011 .020 .408 4.301 5. The cut value is . Based on conditional parameter estimates Variables not in the Equation Step 1 Variables ROKOK RWYKLG DAERAH RWYKLG DAERAH Score 6.713 .263 .500 Variables in the Equation B Step a 1 Step b 2 USIA Constant ROKOK USIA Constant .133 1.186 2.741 1.008 Exp(B) 1.398 14.7 85.8 90.017 .519 7.007 .530 df 1 1 1 3 1 1 2 Sig.254 .064 2.063 Step 2 Overall Statistics Variables Overall Statistics 8 . a Model if Term Removed Variable Step 1 USIA Step 2 ROKOK USIA Model Log Likelihood -20.032 df 1 1 1 Sig.546 .187 .163 -7.003 .719 7.

794*1)+(0.728+( 2. dapat dicari • OR untuk variabel yang signifikan (yaitu rokok dan usia ) • OR untuk rokok adalah OR1= • OR untuk usia adalah OR2= = = = 16. maka kemungkinan terjadinya kanker paru-paru adalah Z= a+b₁X₁+b₂X₂ Z= -7.163X₂ Interpretasi hasil dari model logit tersebut bukanlah nilai kuantitatif dari response melainkan sebagai probabilitas atau peluang terjadinya suatu kejadian atau event dalam hal ini adalah kejadian kanker pulmo (ca pulmo ). sig.163X₂ Z= -7.728.163*30) Z= -7. sig. dan X₂=usia 30 tahun.794 .011 ) dengan konstanta -7. Sehingga persamaan regresinya adalah P = -7.728+ 2.027) dan variabel usia ( koefisiensi regresi= 0.17.794 + 4. Sedangkan usia sebagai faktor resiko terjadinya ca pulmo sebasar 1.794X₁+0. Contoh : Jika terdapat seseorang dengan kriteria X₁= perokok ( nilai= 1 ).044 9 . dengan persamaan distribusi komulatifnya adalah : p= E (Y=1IX )= Perlu diketahui bahwa besarnya (a+b₁X₁+b₂X₂) = Z Sehingga E (Y=1IX ) dibaca harga harapan / peluang terjadinya suatu kejadian atau event. Dari haril koefisien regresi yang diperoleh.34.728+ 2.34 = 1.794X₁+0.163.684 Z= -0.Dari hasil forward diketahui bahwa variabel independen yang berpengaruh terhadap ca pulmo adalah rokok ( koefesiensi regresi= 2. dengan nilai kuantitatif 1 dalam hal ini adalah terjadinya kanker paru ( ca pulmo ) dikarenakan suatu respon dengan input/ prediktor variabel X.17 Dari hasil tersebut diketahui bahwa riwayat perokok sebagai faktor resiko terhadap terjadinya ca pulmo sebesar 16.728 + 2.=0.89 Z= -7.728 + 7.=0.

794X₁+0. dengan kondisi ia perokok dan berumur 30 tahun.163X₂ Z= -7. dan X₂=usia 30 tahun. maka p= E (Y=1I X )= p= E (Y=1IX )= 10 . maka p= E (Y=1I X )= p= E (Y=1IX )= p= E (Y=1IX )= p= E (Y=1IX )= jadi orang memiliki peluang sebesar 48.718.89 Z= -2.838 dengan e adalah bilangan natural dengan nilai 2.9% atau 49% untuk terjadi kanker paru-paru.838 Sehingga besar Z = -2.Sehingga p= E (Y=1IX )= Atau p= E (Y=1I X )= Sehingga besar Z = -0.728 + 4.728 + 0 + 4.794*0)+(0.728+( 2. Jika terdapat seseorang dengan kriteria X₁=tidak perokok ( nilai= 0 ). maka kemungkinan terjadinya kanker paru-paru adalah Z= a+b₁X₁+b₂X₂ Z= -7.728+ 2.163*30) Z= -7.044 dengan e adalah bilangan natural dengan nilai 2.89 Z= -7.718.

5% atau 6 % untuk terjadi kanker paru-paru. dengan kondisi ia tidak perokok dan berumur 30 tahun. 11 .p= E (Y=1IX )= p= E (Y=1IX )= dengan kata lain bahwa orang tersebut memiliki peluang sebesar 5.

You're Reading a Free Preview

Mengunduh
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->