ANALISIS MULTIVARIAT
11
ANALISIS MULTIVARIAT
Proses analisis multivariat dengan menghubungkan beberapa variabel independen dengan satu variabel dependen pada waktu yang bersamaan. Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden. Dari analisis multivariat kita dapat mengetahui: a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel dependen? b. Apakah variabel independen berhubungan dengan variabel dependen dipengaruhi variabel lain atau tidak? c. Bentuk hubungan beberapa variabel independen dengan variabel dependen, apakah berhubungan langsung atau pengeruh tidak langsung. Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis statistik yang dapat digunakan untuk analisis multivariat: Variabel Independen Numerik (minimal 1 variabel numerik) Katagori Katagori (dapat dengan numerik) Kontinyu Numerik/Katgori Katagori Numerik waktu Uji Diskriminan Uji Regresi Cox Numerik Katagori ANOVA Uji Regresi Logistik Variabel Dependen Numerik Jenis Uji Uji Regresi Linier
Dalam melakukan analisis multivariat kita harus mengetahui terlebih dahulu mengenai konsep konfounding dan Interaksi.
a.Konfounding
Konfounding merupakan kondisi bias dalam mengestimasi efek pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari perbandingan yang tidak seimbang antara kelompok expose dengan kelompok non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose. Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun expose dihilangkan pada kedua kelompok tersebut. Satu variabel disebut konfounding bila variabel tersebut merupakan faktor risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan berhubungan dengan variabel independen tapi tidak merupakan hasil dari variabel independen.
b.Interaksi
Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose Pada tingkat expose yang lain. Jadi efek satu expose pada kejadian penyakit berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam analisis karena pada saat analisis kita harus menentukan apakah akan melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah untuk masing-masing strata. Pada analisis multivariat, jika ditemukan adanya interaksi antar variabel expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing strata harus dihitung 3
12
linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel independen (variabel bebas) dihubungkan dengan satu variabel dependen (terikat).. Sedangkan pada Multiple regression Linear merupakan analisis hubugan antara beberapa variabel independen dengan satu variabel dependen. Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat badan, dan jenis kelamin. Dalam regresi linier ganda variabel dependennya harus numerik sedangkan variabel independen boleh semuanya numerik dan boleh juga campuran numerik dan katagorik. Model persamaan regresi linier ganda merupakan perluasan regresi linier sederhana, yaitu: Y = a + b1X1 + b2X2 + . + bkXk + e 1. Asumsi Regresi Linier Seperti pada umumnya pengujian statistik, dari analisis regresi linier ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi) tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil. Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin pada semua orang (populasi), tidak hanya seperti yang teramati di sejumlah orang pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression 4
e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas. 2. Kegunaan Analisis Regresi Ganda Tujuan analisis regresi linier ganda adalah untuk menemukan model regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna untuk dua hal: a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi yang ada pada sebuah atau beberapa variabel independen. Disini dapat diketahui secara probabilitas nilai variabel dependen bila seseorang/individu mempunyai suatu set variabel dengan independen tertentu. Misalnya kita melakukan analisis variabel independen umur, BB dan jenis kelamin dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi, seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat badan dan jenis kelamin tertentu. b. Estimasi, menguantifikasihubungan sebuah atau beberapa variabel independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa besar hubungan masing-masing independen terhadap variabel independen lainnya. Dari analisis ini dapat diketahui variabel mana yang paling besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.
3. Pemodelan Satu hal yang penting dalam regresi ganda adalah bagaimana memilih variabel independen sehingga terbentuk sebuah model yang paling sesuai menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam (populasi). Dalam pembuatan model seringkali dijumpai pandangan yang kurang tepat yaitu memasukkan semua/sebanyak mungkin variabel independen ke dalam model. Alasannya, dengan memasukkan sebanyak mungkin variabel independen ke dalam model, maka variabel dependen diharapkan diprediksi dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping itu, model dengan banyak variabel seringkali malah menyulitkan dalam interpretasi. Berdasarkanpertimbangan tersebut pemilihan variabel independen hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen. Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk dalam model, salah satu kriteria yang sering digunakan adalah melihat perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena setiap penambahan satu variabel independen akan meningkatkan R2 walaupun variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan adalah model dengan nilai R2 yang besar namun variabel independennya dengan jumlah sedikit. Berikut langkah-langkah dalam pemodelan regresi linier ganda: 1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat model. Masing-masing variabel independen dihubungkan dengan variabel 7
dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka variabel tersebut masuk dalam model multivariat. Untuk variabel yang p value-nya > 0,25 namun secara substansi penting, maka variabel tersebut dapat masuk ke multivariat. 2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk dalam model. Ada beberapa metode untuk melakukan pemilihan variabel independen dalam analisis multivariat regresi linier ganda, yaitu: a). ENTER, memasukkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode melakukan pertimbangan aspek substansi. b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke dalam model, sampai semua variabel yang memenuhi kriteria tersebut masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel yang mempunyai korelasi parsial terbesar dengan variabel dependen dan yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi parsial adalah adalah korelasi antara variabel independen dengan dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005 artinya variabel yang dapat masuk model bila variabel tersebut mempunyai nilai P lebih kecil atau sama dengan 0,05. c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi kemudian satu persatu variabel independen dikeluarkan dari model berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah 0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama dengan 0,10 dikeluarkan dari model. d). STEPWISE, model ini merupakan kombinasi antara metode backward dan Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa 8 ini yang tepat/sering digunakan, karena dalam pemodelan kita dapat
variabel
sama
sekali
di
dalam
model.
Lalu
satu
variabel
hasil dan
pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu variabel hasil pengkorelasian dimasukkan ke dalam model dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama masuk sama dengan metode forward yakni variabel yang mempunyai korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria pengeluaran seperti metode backward. e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu langkah, tanpa melewati kriteria kemaknaan statistik tertentu.
kemudian bandingkan antara model 1 dan model 2, bila hasilnya sama/hampir sama maka model regresi reliabel. Bila model reliabel maka seluruh sampel dapat digunakan untuk pembuatan model.
10
11
12
Correlations
Correlations Weight of mother (pounds) .180* .013 189 1 189 .141 .054 189 -.140 .055 189 .186* .010 189 No History of physician prematur visits in first e labor trimester .215** .072 .003 .328 189 189 .141 -.140 .054 .055 189 189 1 -.044 .544 189 -.044 .544 189 .058 .426 189 189 1 189 -.155* .034 189 Birth weight (gram) .090 .219 189 .186* .010 189 .058 .426 189 -.155* .034 189 1 189
Age of mother
Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N
Age of mother 1 189 .180* .013 189 .215** .003 189 .072 .328 189 .090 .219 189
*. Correlation is significant at the 0.05 level (2-tailed). **. Correlation is significant at the 0.01 level (2-tailed).
13
Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur, berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat. Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena secara substansi frekuensi anc merupakan faktor yang sangat penting mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan dalam analisis multivariat.
1. Merokok
Langkahnya: 1.Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu Compare Means, lalu pilih Independen-Samples T Test 2.Pada layar tampak kotak yang di dalamnya ada kotak Test variable
dan
Grouping Variable. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik. 3.Klik bwt dan msukkan ke kotak Test variable 4.Klik variabel smoke dan masukkan ke kotakGrouping Variable.
14
5.Klik Define Group, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel smoke ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa 0 tidak merokok dan kode 1 untuk Yang merokok. Jadi ketiklah 0 pada
1. Klik Continue 2. Klik OK untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics Smoking status No Yes N 115 74 Mean 3054.96 2773.24 Std. Deviation 752.409 660.075 Std. Error Mean 70.163 76.732
15
t-test for Equality of Means Sig. (2-tail ed) .009 Mean Differen ce 281.713 Std. Error Differenc e 106.969 95% Confidence Interval of the Difference Lower Upper 70.693 492.7
F Birth weight (gram) Equal variances assumed Equal variances not assumed 1.508
Sig. .221
t 2.634
df 187
2.709
170.0
.007
281.713
103.974
76.467
487.0
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value = 0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok dapat lanjut ke multivariat.
2. Riwayat Hipertensi
Langkahnya: 1.Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu Compare Means, lalu pilih Independen-Samples T Test 2.Pada layar tampak kotak yang di dalamnya ada kotak Test variable
dan
Grouping Variable. Ket: kotak test varibles tempat memasukkan variabel numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik. 3.Klik bwt dan msukkan ke kotak Test variable 4.Klik variabel ht dan masukkan ke kotakGrouping Variable. (variabel yang sebelumnya (variabel smoke) dikeluarkan dahulu baru ht dimasukkan
16
5.Klik Define Group, kemudian di layar nampak kotak isian. Anda diminta mengisi kode variabel smoke ke dalam kedua kotak. Pada contoh ini, kita tahu bahwa 0 tidak ada hipertensi dan kode 1 ada hipertensi. Jadi ketiklah 0 pada
6.Klik Continue 7.Klik OK untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
Group Statistics History of hypertension No Yes N 177 12 Mean 2972.31 2536.75 Std. Deviation 709.226 917.341 Std. Error Mean 53.309 264.813
17
t-test for Equality of Means Std. Error Differen ce 215.709 95% Confidence Interval of the Difference Lower Upper 10.024 861.1
F Birth weight (gram) Equal variances assumed Equal variances not assumed 1.419
Sig. .235
t 2.019
df 187
1.612
11.908
.133
435.56
270.126
-153.5
1025
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6 variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis multivariat.
5. Pada kotak Method, pilih Enter 6. Abaikan lainnya 7. Klik OK, dan hasilnya
Regression
Model Summary Model 1 R .340a R Square .116 Adjusted R Square .086 Std. Error of the Estimate 696.829
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds)
19
ANOVAb Model 1 Sum of Squares 11543236 88373817 99917053 df 6 182 188 Mean Square 1923872.611 485570.423 F 3.962 Sig. .001a
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History of hypertension, History of premature labor, Age of mother, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa Unstandardized Coefficients B Std. Error 2315.862 299.442 7.162 10.022 4.793 -232.253 -154.002 -574.230 -2.847 1.777 105.928 106.574 215.481 49.705 Standardized Coefficients Beta .052 .201 -.156 -.104 -.193 -.004
Model 1
(Constant) Age of mother Weight of mother (pounds) Smoking status History of premature labor History of hypertension No physician visits in first trimester
Dari kotak Model Sumarry didapatkan nilai R Square sebesar 0,116, artinya keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar 11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik (lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model. Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3 variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur (history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba keluarkan adalah frekuensi anc(No physician..). 20
Langkahnya: 1. Klik Analysis, sorot Regression, sorot dan klik Linier 2. Di layar nampak pada kotak Dependen masih terisi bwt lewati dan biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel, namun sekarang anda harus keluarkan variabel no physician dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb:
Model Summary Model 1 R R Square .340a .116 Adjusted R Square .091 Std. Error of the Estimate 694.929
a. Predictors: (Constant), History of hypertension, Smoking status, Age of mother, History of premature labor, Weight of mother (pounds)
Coefficientsa Unstandardized Coefficients B Std. Error 2317.608 297.074 7.051 9.807 4.781 -232.224 -153.747 -573.011 1.759 105.638 106.191 213.841 Standardized Coefficients Beta .051 .201 -.156 -.104 -.192
Model 1
(Constant) Age of mother Weight of mother (pounds) Smoking status History of premature labor History of hypertension
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
21
berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel, ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel frekuensi anc kita keluarkan dari model. Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473). Langkah/proses : 1. Klik Analysis, sorot Regression, sorot dan klik Linier 2. Di layar nampak pada kotak Dependen masih terisi bwt lewati dan biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel, namun sekarang anda harus keluarkan variabel umur (age) dan masukkan ke kotak Variable di sebelah kiri. 3. Klik OK, dan hasilnya sbb:
Model Summary Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016
a. Predictors: (Constant), History of hypertension, Smoking status, History of premature labor, Weight of mother (pounds)
22
Coefficientsa Unstandardized Coefficients B Std. Error 2449.121 233.779 5.035 -236.420 -145.412 -582.566 1.721 105.338 105.417 213.148 Standardized Coefficients Beta .211 -.159 -.098 -.195
Model 1
(Constant) Weight of mother (pounds) Smoking status History of premature labor History of hypertension
Setelah variabel umur perhitungannya sbb: Variabel Age bwt smoke ptl hi ftv
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %, dengan demikian variabel umur kita keluarkan dari model. Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur, Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst. Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:
23
Model Summary Model 1 R R Square .322a .104 Adjusted R Square .089 Std. Error of the Estimate 695.707
Coefficientsa Unstandardized Coefficients B Std. Error 2390.105 230.391 5.352 -263.009 -586.722 1.710 103.812 213.646 Standardized Coefficients Beta .224 -.177 -.197
Model 1
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan perubahan Coef. B dapat dilihat sbb: Variabel Age bwt smoke ptl hi ftv Masih lengkap 7,1 4,7 -232,2 -154,0 -574,2 -2,847 Prematur keluar 5,3 -236,4 582,5 perubahan Coef. 12,3 % 1,7 % 1,3 %
Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p valuenya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model telah selesai dan model yang terakhir adalah sbb: 24
Model Summaryb Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016 DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Coefficientsa Stand ardize d Coeffi cients Beta .211 -.159 -.195 -.098 t 10.476 2.925 -2.244 -2.733 -1.379 Sig. .000 .004 .026 .007 .169
Mo de l 1
Unstandardized Coefficients B 2449.121 5.035 -236.420 -582.566 -145.412 Std. Error 233.779 1.721 105.338 213.148 105.417
Collinearity Statistics Tolera nce VIF .925 .964 .943 .947 1.081 1.037 1.060 1.056
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
25
4.Klik tombol Statistics 5. Klik kotak Collinearity diagnostic dan klik kotak Covariance matrix (perintah ini untuk uji asumsi multicoliniarity) 6. Klik kotak Durbin-Watson (perintah ini untuk uji asumsi Independensi)
7. Klik Continue 26
8. Klik tombol Plot 9. Masukkan SRESID ke kotak Y, dan masukan ZPRED ke kotak X (perintah ini untuk uji asumsi Homoscedasity) 10. Klik kotak histogram dan kotak Normal probability plot (perintah ini untuk uji asumsi Normality)
11. Klik Continue Hasilnya : a. Asumsi Eksistensi (Variabel Random) Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen) adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini, sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil analisis:
27
Residuals Statisticsa Predicted Value Std. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std. Residual Stud. Residual Deleted Residual Stud. Deleted Residual Mahal. Distance Cook's Distance Centered Leverage Value Minimum 2249.77 -2.835 67.193 1955.43 -2082.610 -3.001 -3.015 -2102.316 -3.084 .768 .000 .004 Maximum 3602.03 2.682 292.804 3616.97 1921.631 2.769 2.782 1940.423 2.835 32.469 .209 .173 Mean 2944.66 .000 103.399 2943.73 .000 .000 .001 .923 .000 3.979 .007 .021 Std. Deviation 245.079 1.000 45.407 251.196 686.593 .989 1.005 708.619 1.010 5.320 .019 .028 N 189 189 189 189 189 189 189 189 189 189 189 189
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi b. Asumsi Independensi Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin Watson, bila nilai Durbin 2 s.d. +2 berarti asumsi independensi terpenuhi, sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Model Summaryb Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016 DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
28
c. Asumsi Linieritas Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, , Xk terletak pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test) bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil uji asumsi :
b ANOVA
Model 1
df 4 184 188
F 5.861
Sig. .000a
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas terpenuhi
d. Asumsi Homoscedascity Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka diduga variannya terjadi heteroscedasticity. 29
Scatterplot
-1
-2
-3
-4 -3 -2 -1 0 1 2 3
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi homoscedasity terpenuhi e. Asumsi Normalitas Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X. dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar garis diagonal dan mengikuti arah garis diagonal, maka model regresi memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
30
Histogram
40
30
Frequency
20
10
0 -4 -3 -2 -1 0 1 2 3
31
0.8
0.6
0.4
0.2
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk distribusinya normal, berarti asumsi normality terpenuhi. f.Diagostik Multicollinearity Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka mengindikasikan telah terjadi collinearity.
32
Coefficientsa Stand ardize d Coeffi cients Beta .211 -.159 -.195 -.098 t 10.476 2.925 -2.244 -2.733 -1.379 Sig. .000 .004 .026 .007 .169
Mo de l 1
Unstandardized Coefficients B 2449.121 5.035 -236.420 -582.566 -145.412 Std. Error 233.779 1.721 105.338 213.148 105.417
Collinearity Statistics Tolera nce VIF .925 .964 .943 .947 1.081 1.037 1.060 1.056
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian tidak ada Multicollinearity antara sesama variabel indepeden Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi sehingga model dapat digunakan untuk memprediksi berat badan bayi. Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan. Sehingga model yang terakhir adalah sbb:
Model Summaryb Model 1 R R Square .336a .113 Adjusted R Square .094 Std. Error of the Estimate 694.016 DurbinWatson .222
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking status, Weight of mother (pounds) b. Dependent Variable: Birth weight (gram)
33
Coefficientsa Stand ardize d Coeffi cients Beta .211 -.159 -.195 -.098 t 10.476 2.925 -2.244 -2.733 -1.379 Sig. .000 .004 .026 .007 .169
Mo de l 1
Unstandardized Coefficients B 2449.121 5.035 -236.420 -582.566 -145.412 Std. Error 233.779 1.721 105.338 213.148 105.417
Collinearity Statistics Tolera VIF nce .925 .964 .943 .947 1.081 1.037 1.060 1.056
(Constant) Weight of mother (pounds) Smoking status History of hypertension History of premature labor
Interpretasi model: Setelah dilakuikan analisis ,ternyata variabel independen yang masuk model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan riwayat prematur. Pada tabel Model Summary terlihat koefisien determinasi (R square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel berat bayi sebesar 11,3 %.. Kemudian pada kotak ANOVA, kita lihat hasil uji F yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi variabel berat bayi. Pada kotak Coefficient kita dapat memperoleh persamaaan garisnya, pada kolom B (di bagian Variabel In Equation) di atas, kita dapat mengetahui koefisien regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi yang diperoleh adalah Berat Bayi = 2449,1+5,0 Lwt 236,4 smoke - 582Hi 145,4 Ptl
34
Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun arti koef. B untuk masing-masing variabel adalah sbb: Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi dan prematur Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4 gram setelah dikontrol variabel berat badan, hipertensi dan prematur. Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok dan prematur. Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap variabel dependennya. Pada hasil di atas berarti variabel yang paling besar pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
35
13
puas dll).
REGRESI LOGISTIK
Berbeda dengan regresi linier yang variabel dependennya numerik, regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus, artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak A. REGRESI LOGISTIK SEDERHANA 1. Pendahuluan Analisis regresi logistik adalah salah satu pendekatan model matematis yang digunakan untuk menganalisis hubungan satu atau beberapa variabel independen dengan sebuah variabel dependen katagorik yang bersifat dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal, merokok dan tidak merokok, dan lain-lain Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis variabel dependennya. Regresi linear digunakan apabila variabel dependennya numerik , sedangkan regresi logistik diogunakan pada data yang dependennya berbentuk katagorik yang dikotom. Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh analisis penelitian yang mempelajari hubungan antara variabel umur dengan kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang sampel, didapatkan hasil : No PJK 1 0 2 22 0 3 23 1 4 24 0 5 25 0 6 27 1 7 28 0 8 29 1 9 30 1 10 32 0 11 33 0 100 70 1 Umur 20
36
Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan diberi kode 0 bila mereka tiodak menderita PJK. Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier, misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda. Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan kejadian PJK.
Untuk
mempertajam
analisis
kita,
sekarang
dicoba
untuk
mengelompokkan variabel independen (variabel umur) dan menhitung nilai tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK) untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada tabel berikut:
37
Umur 20 29 30 34 35 39 40 44 45 49 50 54 55 59 60 69 Total
Jumlah 10 15 12 15 13 8 17 10 100
PJK Tidak 9 13 9 10 7 3 4 2 57 Ya 1 2 3 5 6 5 13 8 43
Proporsi Kejadian 0,10 0,13 0,25 0,33 0,46 0,63 0,76 0,80 0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 20 - 29 30 34 35 39 40 44 45 49 50 54 55 59 60 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut menyerupai huruf S. Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada 38
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata (mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai E(Y/x) akan berkisar antara 0 s.d (0 E(Y/x) ). Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh karena pada regresi logistik dependennya adalah dikotom maka variabel dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu berada antara nol dan satu (0 E(Y/x) 1).
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu. Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara - sampai +. Bila nilai Z mendekati maka f( ) = 1 . =0 1 + e-( )
39
Bila nilai Z mendekati + maka f(+ ) = Fungsi Logistik dapat digambarkan sbb:
. =1
1 + e-(+ )
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada ketinggian tertentu garisnya akan mendatar mendekati nilai 1. Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu probabilitas kejadian pada dependen yang dikotom maka model regresi logistik adalah pilihan yang tepat. 3. Model Logistik Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan penjumlahan linear konstanta () ditambah dengan 1X1, ditambah 2X2 dan seterusnya sampai iXi. Variabel X adalah variabel Independen. 40
f(z) =
Nilai f(z) dapat diganti dengan P(X), maka rumusnya: P(X) = 1 . 1 + e-z
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb: = -3,911 dan 1 = 0,652, maka: P(X) = 1 . 1 + e-(-3,911 + 0,652KAT)
Dari model tersebut coba kita jawab pertanyaan di atas: a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi. Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai KAT=1 pada model di atas, hasilnya: P(X) = 1 . = 0,037 atau sekitar 4% 1 + e-(-3,911 + 0,652*1) jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up. b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai KAT=0 pada model di atas, hasilnya: P(X) = 1 . = 0,019 atau sekitar 2% 1 + e-(-3,911 + 0,652*0) jadi mereka/individu yang kadar katekolaminnya rendah dalam darah mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up. c. Besar risiko kedua kelompok tersebut P1(X) = 0,037 = 1,947 = 2,0 P0(X) 0,019 Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh secara direk. Arti dari angka di atas adalah mereka yang kaadar 42
katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi dibandingkan mereka yang kadar katekolaminnya rendah. Model regresi logistik dapat digunakan pada data yang dikumpulkan melalui rancangan kohort, case control maupun cross sectional. Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko individual. Sedangkan pada rancangan case control dan cross sectional tidak dapat digunakan untuk menghitung risiko individual karena 0 pada rancangan ini tidak sahih. Nilai 0 dapat dihitung/diestimasi bila sampling fraction populasi yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket: sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit). Namun dengan memperlakukan rancangan case control dan cross sectional sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan perhitungan eksponensial dari persamaan garis regresi logistik. Odds Ratio (OR) = exp() atau dapat ditulis OR = e() Dengan demikian dapat disimpulkan bahwa Individual Risk (ririko
individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan pada rancangan case control, cross sectional tidak dapat melakukan prediskis risiko individual. Pada rancangan case control dan cross sectional dan cohort dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek. Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal) berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat digunakan dengan model: P(X) = 1+e
-( + 1X1 + 2X2 + + iXi
43
B. REGRESI LOGISTIK GANDA Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model. Pada regresi logistik, variabel independennya boleh campuran antara variabel katagorik dan numerik. Namun sebaiknya variabel independennya berupa katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah. Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu: a. Model Prediksi Pemodelan dengan tujuan untuk memperoleh model yang tediri dari beberapa variabel independen yang dianggap terbaik untuk memprediksi kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien regresi logistik sekaligus. Bentuk kerangka konsep model regresi : X1 X2 X3 X4 Prosedur pemodelan: Agar diperoleh model regresi yang hemat dan mampu menjelaskan hubungan variabel independen dan independen dalam populasi, diperlukan prosedur pemilihan variabel sbb: 1). Melakukan analisis bivariat antara masing-masing variabel independen dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p < 0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara substansi penting.
44
2). Memilih variabel yang dianggap penting yang masuk dalam model, dengan cara mempertahankan variabel yang mempunyai p value < 0,05 dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara bertahap dimulai dari variabel yang mempunyai p value terbesar. 3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan apakah variabel numerik dijadikan variabel katagorik atau tetap variabel numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4 kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok menunjukkan bentuk garis lurus, maka variabel numerik dapat dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka dapat dipertimbangkan dirubah dalam bentuk katagorik. 4). Setelah memperoleh model yang memuat variabel-variabel penting, maka langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik. Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting dimasukkan dalam model. b. Model Faktor Risiko Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel utama dengan variabel dependen dengan mengontrol beberapa variabel konfonding. Bentuk kerangka konsep model faktor risiko: X1 Y
X2 X3 X4 45
Tahapan pemodelan: 1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama dengan semua variabel konfonding). 2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara berurutan satu per satu dari nilai p Wald yang terbesar. 3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding dan harus tetap berada dalam model.
46
KASUS I :
Adapun langkahnya:
A. SELEKSI BIVARIAT
Masing-masing variabel independen dilakukan analisis bivariat dengan variabel dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel tersebut langsung masuk tahap multivariat. Untuk variabel independen yang hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting, maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi bivariat menggunakan uji regresi logistik sederhana. 1.Analisis bivariat antara umur denganbblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam hal ini berarti masukkan low) dan pada kotak independen isikan variabel independennya (dalam hal ini berarti masukkan age). Sehingga tampilannya sbb: 47
5. Klik tombol Options , klik CI for Exp(B) 6. Klik Continue 7. Klik OK, dan hasilnya sbb:
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .893 1.011
Step a 1
B -.051 .385
df 1 1
48
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25 sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI: 0,89-1,01) 2.Analisis bivariat antara ras dengan bblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates variabel age dikeluarkan dan gantilah dengan mengisikan variabel race. Tampilannya sbb:
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras 49
putih, hitam dan lainnya). Klik tombol Categorical, pindahkan race dari kotak covariates ke kotak categorical covariates, klik pilihan first pada bagian Reference category, lalu klik Change, dan tampilannya:
Race
Frequency 96 26 67
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 5.010 5.010 5.010 df 2 2 2 Sig. .082 .082 .082
50
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .939 .955 5.772 3.736
df 2 1 1 1
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy, terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih. 3. Analisis bivariat antara hipertensi dengan bblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan ht. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 4.022 4.022 4.022 df 1 1 1 Sig. .045 .045 .045
51
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.021 11.088
Step a 1
ht Constant
B 1.214 -.877
df 1 1
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam multivariat 4. Analisis bivariat antara kelainan uterus dengan bblr 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan ui. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 5.076 5.076 5.076 df 1 1 1 Sig. .024 .024 .024
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.139 5.834
Step a 1
ui Constant
B .947 -.947
df 1 1
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat lanjut ke multivariat
52
5.Analisis bivariat antara periksa hamil dengan bblr 1.Pilih Analyze 2.Pilih Regression 3.Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4.Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan ftv. Klik OK, Tampilannya sbb:
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square .773 .773 .773 df 1 1 1 Sig. .379 .379 .379
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .643 1.188
Step a 1
ftv Constant
B -.135 -.687
df 1 1
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak dapat lanjut ke multivariat, namun karena secara substansi variabel periksa hamil sangat penting, maka variabel ini dapat dianalisis multivariat. 6.Analisis bivariat antara merokok dengan bblr
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 4.867 4.867 4.867 df 1 1 1 Sig. .027 .027 .027
53
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.081 3.783
Step a 1
smoke Constant
B .704 -1.087
df 1 1
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian variabel merokok dapat masuk ke multivariat. 7.Analisis bivariat antara prematur dengan bblr
Omnibus Tests of Model Coefficients Step 1 Step Block Model Chi-square 6.779 6.779 6.779 df 1 1 1 Sig. .009 .009 .009
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.197 4.151
Step a 1
ptl Constant
B .802 -.964
df 1 1
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel riwayat adanya prematur dapat masuk ke multivariat Hasil seleksi bivariat : Variabel Umur Ras Hipertensi Kelainan uterus Periksa hamil Merokok Prematur P value 0,097 0,082 0,045 0,024 0,379 0,027 0,009 54
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis multivariat oleh karena secara substansi periksa hamil merupakan variabel yang sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT
Selanjutnya dilakukan analisis multivariat keenam variabel tersebut dengan kejadian bblr. 1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel dependen. 1. Pilih Analyze 2. Pilih Regression 3. Klik Binary Logistic, muncul menu dialog yang berisi kotak Dependent dan kotak Covariates. 4. Pada kotak Dependent tetap berisi low dan pada kotak Covariates isikan variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy. 5. Klik Option, pilih CI for exp(B) 6. Klik Continue
55
7. Kilik OK
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .894 1.031 1.025 1.185 1.219 .964 1.132 .909 .736 7.345 6.280 5.639 3.654 13.451 5.468 1.384
Step a 1
S.E. .036 .502 .426 .391 .340 .631 .458 .161 .919
Wald 1.249 6.783 4.034 5.560 6.090 3.429 4.648 3.066 .003 1.659
df 1 2 1 1 1 1 1 1 1 1
Sig. .264 .034 .045 .018 .014 .064 .031 .080 .954 .198
Exp(B) .960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv dikeluarkan dari model. Dengan langkah yang sama akhirnya diperoleh hasil sbb. 56
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .896 1.030 1.025 1.184 1.219 .963 1.134 .908 7.347 6.262 5.632 3.651 13.341 5.454
Step a 1
Wald 1.275 6.781 4.035 5.562 6.086 3.423 4.663 3.063 1.661
df 1 2 1 1 1 1 1 1 1
Sig. .259 .034 .045 .018 .014 .064 .031 .080 .197
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race, smoke, ptl, ht, dan ui. Variabel Age Race(1) Race(2) Smoke Ptl Ht ui ftv OR ftv ada 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 OR ftv tak ada 0.960 2.744 2.723 2.620 1.875 3.889 2.226 perubahan OR 0% 0% 0% 0% 0,1 % 0.3 % 0,1 %
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah umur, dengan demikian dikelurkan dar model dan hasilnya Hasilnyanya :
57
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970 7.916 6.538 5.747 3.422 13.537 5.692
B Step a 1 race race(1) race(2) smoke ptl ht ui Constant 1.088 1.059 .991 .576 1.364 .855 -2.146
df 2 1 1 1 1 1 1 1
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel yang masih aktif di model. Variabel Age Race(1) Race(2) Smoke Ptl Ht ui ftv OR age ada 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 OR age tak ada 2.968 2.883 2.694 1.779 3.912 2.350 8,2 % 5,7 % 2,7 % 5,2 % 0.3 % 5,4 % perubahan OR
Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan demikian variabel umur dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl dikeluarkan model, hasilnya
58
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.090 1.315 1.419 1.133 1.158 7.704 6.640 6.286 13.379 6.458
B Step a 1 race race(1) race(2) smoke ht ui Constant 1.064 1.083 1.094 1.359 1.006 -2.092
df 2 1 1 1 1 1 1
Setelah ptl dikeluarkan, kita lihat perubahan OR nya: Variabel OR ptl ada OR ptl tak ada Age Race(1) Race(2) Smoke Ptl Ht ui ftv 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 2.897 2.955 2.986 3.894 2.734 -
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam model. Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan hasilnya sbb:
59
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.086 1.321 1.280 .988 1.062 7.712 6.626 5.726 11.640 3.793
B Step a 1 race race(1) race(2) smoke ht ptl Constant 1.062 1.085 .996 1.221 .696 -2.025
df 2 1 1 1 1 1 1
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan : Variabel OR ui ada OR ui tak ada perubahan OR Age Race(1) Race(2) Smoke Ptl Ht ui ftv 0.960 2.743 2.727 2.622 1.877 3.902 2.229 1.009 2.894 2.958 2.707 2.007 3.390 5,5 % 8,4 % 3,2 % 6,9 % 13.1 % -
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %, dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang dihasilkan adalah sbb:
60
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970 7.916 6.538 5.747 3.422 13.537 5.692
B Step a 1 race race(1) race(2) smoke ptl ht ui Constant 1.088 1.059 .991 .576 1.364 .855 -2.146
df 2 1 1 1 1 1 1 1
C. UJI INTERAKSI
Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi, kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi. Langkahnya: 1. klik analysis, klik regression, klik binary ogistik 2. Kotak dependen isikan low 3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui 4. Klik tombol Next 5. isikan : smoke*ht ke kotak kovariat 6. klik OK lihat hasilnya pada bagian Block 2
df 1 1 7
Step 1
61
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.109 1.268 1.236 .921 .765 .970 .082 7.946 6.555 5.865 3.438 19.852 5.693 12.491
B Step a 1 race race(1) race(2) smoke ptl ht ui ht by smoke Constant 1.088 1.059 .990 .576 1.360 .854 .010 -2.146
Wald 7.900 4.692 6.387 6.211 2.937 2.680 3.584 .000 30.875
df 2 1 1 1 1 1 1 1 1
Sig. .019 .030 .011 .013 .087 .102 .058 .994 .000
Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05, berarti : tidak ada interaksi antara merokok dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa ada interaksi:
MODEL TERAKHIR
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.113 1.271 1.263 .925 1.131 .970 7.916 6.538 5.747 3.422 13.537 5.692
B Step a 1 race race(1) race(2) smoke ptl ht ui Constant 1.088 1.059 .991 .576 1.364 .855 -2.146
df 2 1 1 1 1 1 1 1
62
Interpretasi: Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
63
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .000 . .514 56.109 .760 1.186 .000 . .849 1.583
Stea p1
df 1 1 1 1 1 1
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
64
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di atas variabel interaksi Pekerjaan by umur mempunyai nilai p terbesar (p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model menjadi:
Logistic Regression
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper .022 18.557 .971 86.749 .753 1.178 .878 1.616
Stea p1
df 1 1 1 1 1
Dari
output diatas, variabel interaksi kerja by sikap harus dikeluarkan dari model
Step a 1
df 1 1 1 1
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel interasksi, langkah selanjutnya uji konfounding
65
UJI KONFOUNDING
Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka varaibel tsb dianggap sebagai variabel konfounding. Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model hasiilnya sbb:
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165 99.754
Stea p1
df 1 1 1
Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja sebesar : (4,111 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan konfounding, dan harus dikeluarkan dari model Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya:
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.627 18.357
Step a 1
B 1.698 -.754
df 1 1
Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam model sebagai konfounding hubungan kerja dengan menyusui eksklusive.
66
Model terakhir :
Variables in the Equation 95.0% C.I.for EXP(B) Lower Upper 1.127 14.985 1.165 99.754
Stea p1
df 1 1 1
Interpretasi: Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb: Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah dikontrol variabel umur.
67
Id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
Low 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
age 28 29 34 25 25 27 23 24 24 21 32 19 25 16 25 20 21 24 21 20 25 19 19 26 24 17 20 22 27 20
lwt 120 130 187 105 85 150 97 128 132 165 105 91 115 130 92 150 200 155 103 125 89 102 112 117 138 130 120 130 130 80
race 3 1 2 3 3 3 3 2 3 1 1 1 3 3 1 1 2 1 3 3 3 1 1 1 1 3 2 1 2 3
smoke 1 0 1 0 0 0 0 0 0 1 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 1 1 1 0 1
ptl 1 0 0 1 0 0 0 1 0 0 0 2 0 0 0 0 0 1 0 0 2 0 0 1 0 1 0 1 0 0
ht 0 0 1 1 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
ui 1 1 0 0 1 0 1 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 1 0 0 1 0 1 1 1
ftv 0 2 0 0 0 0 1 1 0 1 0 0 0 1 0 2 2 0 0 0 1 2 0 0 0 0 3 1 0 0
bwt 709 1021 1135 1330 1474 1588 1588 1701 1729 1790 1818 1885 1893 1899 1928 1928 1928 1936 1970 2055 2055 2082 2084 2084 2100 2125 2126 2187 2187 2211
68
69
70
71
72
73