Pertemuan 12 Regresi Logistik

REGRESI LOGISTIK SEDERHANA
1. Pendahuluan
Analisis regresi logistik adalah salah satu pendekatan model matematis
yang digunakan untuk menganalisis hubungan satu atau beberapa variabel
independen dengan sebuah variabel dependen katagorik yang bersifat
dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang mempunyai
dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal, merokok dan
tidak merokok, dan lain-lain
Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis
variabel dependennya. Regresi linear digunakan apabila variabel dependennya
numerik , sedangkan regresi logistik diogunakan pada data yang dependennya
berbentuk katagorik yang dikotom.
Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh
analisis penelitian yang mempelajari hubungan antara variabel umur dengan
kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang sampel,
didapatkan hasil :
No 1 2 3 4 5 6 7 8 9 10 11 … … 100
Umur 20 22 23 24 25 27 28 29 30 32 33 … … 70
PJK 0 0 1 0 0 1 0 1 1 0 0 … … 1
Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian
jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan
diberi kode 0 bila mereka tiodak menderita PJK.
Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier,
misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka
hubungannya tidak jelas terlihat tebaran data pada Scatter Plot membentuk dua
garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian
penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda.
Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel
dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu
menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan
kejadian PJK.
Untuk mempertajam analisis kita, sekarang dicoba untuk mengelompokkan

variabel independen (variabel umur) dan menhitung nilai tengah (dalam hal ini
menghitung proporsi) variabel dependen (variabel PJK) untuk setiap kelompok
variabel umur dan kejadian jantung dapat dilihat pada tabel berikut:
PJK Proporsi
Umur Jumlah
Tidak Ya Kejadian
20 – 29 10 9 1 0,10
30 – 34 15 13 2 0,13
35 – 39 12 9 3 0,25
40 – 44 15 10 5 0,33
45 – 49 13 7 6 0,46
50 – 54 8 3 5 0,63
55 – 59 17 4 13 0,76
60 – 69 10 2 8 0,80
Total 100 57 43 0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada
kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut
dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik terlihat jelas adanya peningkatan yang tidak linear antara
proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang landai,
kemudian meningkat tajam dan kemudian landai kembali, garis tersebut
menyerupai huruf S.
Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara
untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita
ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel
dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut
sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai
dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan
berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka
untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata
(mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai
E(Y/x) akan berkisar antara 0 s.d  (0 ≤ E(Y/x) ≤ ).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada sedikit
perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh karena
pada regresi logistik dependennya adalah dikotom maka variabel dependen
dihitung bukan dengan mean namun menggunakan proporsi. Seperti pada data di
atas variabel Y kejadia PJK dan x variabel umur, maka untuk mengetahui estimasi
kejadian PJK berdasarkan umur, dihitung proporsi kejadian PJK pada tiap
kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu berada antara nol
dan satu (0 ≤ E(Y/x) ≤ 1).
2. Model Logistik
f(z) = 1 .
1 + e-z
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko

tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu.
Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara -
sampai +.
Bila nilai Z mendekati –  maka f(– ) = 1 . =0
1 + e-(– )
Bila nilai Z mendekati +  maka f(+ ) = 1 . =1
1 + e-(+ )
Fungsi Logistik dapat digambarkan sbb:
Terlihat bahwa fungsi f(Z) nilai berkisar
0 dan 1 berapapun nilai Z. kisaran pada regresi logistik ini berari cocok/sesuai
digunakan untuk model hubungan yang variabel dependennya dikotom. Grafik f(Z)
membentuk garis yang berbentuk huruf S, ini berarti sesuai dengan contoh plot
hubungan antara PJK dengan umur pada kasus yang telah kita bahas di atas.
Bentuk S ini mencerminkan tentang pengaruh nilai Z pada risiko individu yang
minimal pada nilai Z rendah kemudian seiring dengan meningkatnya nilai Z risiko
juga semakin meningkat, dan pada ketinggian tertentu garisnya akan mendatar
mendekati nilai 1.
Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu
probabilitas kejadian pada dependen yang dikotom maka model regresi logistik
adalah pilihan yang tepat.
3. Model Logistik
Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan
penjumlahan linear konstanta () ditambah dengan 1X1, ditambah 2X2 dan
seterusnya sampai iXi. Variabel X adalah variabel Independen.
Z =  + 1X1 (Regresi logistik sederhana)

Z =  + 1X1 + 2X2 + … + iXi (Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah
f(z) = 1 .
1 + e-( + 1X1 + 2X2 + … + iXi)
Kasus
Suatu penelitian ingin mengetahui hubungan antara status ASI Ekslusif dengan berat badan
bayi
Langkah –langkah nya
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent
dan kotak Covariates.
4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai
dependen (dalam hal ini berarti masukkan “Eksklu”) dan pada kotak
independen isikan variabel independennya (dalam hal ini berarti masukkan
“bbbayi ”).
Sehingga tampilannya sbb:
5. Klik Menu Options.. Muncul Menu Dialog berikut : Centang Hosmer-Lemeshow… dan CI for
exp(B) klik continue
6. Klik OK
7. Hasil Analisis
Lihat di BLOK 1 : METHODE = ENTER
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step .301 1 .583
Block .301 1 .583
Model .301 1 .583
Nilai ini menunjukan Nilai Chi Square yaotu 0,301 dengan df 1. Nilai chi square ini tidak
signifikan dilihat dari kolom Sig. (0,583) nilai ini < α (0,05) artinya tidak ada hubungan antara
status menyusui dengan berat badan bayi
Model Summary
Cox & Snell R Nagelkerke R
Step -2 Log likelihood Square Square
1 68.934a .006 .008
a. Estimation terminated at iteration number 3 because
parameter estimates changed by less than .001.
Nilai Cox dan Snell R Square 0,006 menunjukan variabel berat badan bayi dalam model regresi
logistik mampu menjelaskan ibu menyusui eksklusif/tidak eksklusif sebesar 0,6%) dan Nilai
Nagelkerke R square 0,008menunjukan variabel berat badan bayi dalam model regresi logistik
mampu menjelaskan ibu menyusui eksklusif/tidak eksklusif sebesar 0,8 % (hasil ini sangat kecil
sesuai dengan hasil Chi Square bahwa tidak ada hubungan antara status menyusui dengan berat
badan bayi
Hosmer and Lemeshow Test

Step Chi-square df Sig.
1 27.023 7 .000
Uji hosmer dan Lemeshow untuk mengukur apakah yang probabilitas yang diprediksi sesuai
dengan probabilitas yang diobservasi . uji ini menggunakan uji distribusi Chi Square. Jika Chi
Square tidak signifikan maka probabilitas yang diprediksi sesuai dengan yang diobservasi dan
sebaliknya Jika Chi Square signifikan maka probabilitas yang diprediksi tidak sesuai dengan yang
diobservasi
Variables in the Equation
95% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step 1a berat badan bayi .000 .000 .299 1 .584 1.000 .999 1.001
Constant .934 1.588 .346 1 .556 2.546
a. Variable(s) entered on step 1: berat badan bayi.
menyimpulkan bahwa regresi logistik sederhana cocok (fit) dengan data yang ada
persamaan garis regresi dapat dilihat pada tabel ‘Variabel in the Equation’ yaitu pada
kolom B Dari hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept atau
nilai ) sebesar 0.934 dan nilai 1 = 0.000, sehingga persamaan regresinya:
Z =  + 1X1 (Regresi logistik sederhana)
Z= 0,0934+ 0,000 berat badan bayi
uji statistik untuk koefisien regresi dapat dilihat pada kolom Sig T, dan menghasilkan nilai
p=0, 584 dengan alpha 5% maka kita gagal menolak Ho maka dapat disimpukan tidak
hubungan antara status ASI dengan Berat badan bayi

Pertemuan 12 Regresi Logistik

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Pertemuan 12 Regresi Logistik

Diunggah oleh

Hak Cipta:

Format Tersedia

REGRESI LOGISTIK SEDERHANA

Untuk mempertajam analisis kita, sekarang dicoba untuk mengelompokkan

f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko

Z =  + 1X1 (Regresi logistik sederhana)

Hosmer and Lemeshow Test

Z =  + 1X1 (Regresi logistik sederhana)

Z= 0,0934+ 0,000 berat badan bayi

Anda mungkin juga menyukai