ANALISIS DATA MEDIS INFERENSIAL
( Regresi Linier dan Regresi Logistik)
Tugas Parktikum
Oleh
Ulva Dwi F
(G41140442)
Golongan B
PROGRAM STUDI REKAM MEDIK
JURUSAN KESEHATAN
POLITEKNIK NEGERI JEMBER
KEMENTERIAN RISTEK DAN PENDIDIKAN TINGGI
2016
REGRESI LINIER
1. Hipotesis statistik
a) H0 = tidak ada pengaruh secara signifikan antara
tinggi badan dan umur terhadap berat badan
b) Ha = ada pengaruh secara signifikan antara tinggi
badan dan umur terhadap berat badan
2. Nilai = 0.05
Aplikasi SPSS
Variabel view
Data View
Proses pengerjaan
1. Klik analyze -> Regression -> Linear
2. Muncul jendela seperti di bawah ini dan masukkan variable
sesuai yang tertera dalam gambar (Dependent -> Variabel
terikat ( berat badan ) sedangkan Independent -> Variabel
bebas ( umur dan tinggi badan ) )
3. Pilih Statistic dan akan muncul window seperti di bawah ini
lalu tandai pada estimates, model fit dan collinearity
diagnostic pada kolom regression coefficient
kolom
residuals
tandai
pada
durbin-watson
dan pada
lalu
klik
continue
4. Pilih Plot lalu akan muncul window seperti di bawah ini dan
masukkan *SDRESID pada kolom Y dan *ZPRED pada kolom
X, dan tandai semua pilihan dalam kolom Standarized
Residual Plots dan klik continue
Output dari SPSS
Analisis
MODEL SUMMARY
Dari output model summary diatas terlihat bahwa nilai R
(koefisien
bahwa
korelasi)
korelasi
sebesar
antara
0.740
variable
yang
menandakan
independent
dengan
variable dependent sangat kuat dikarenakan nilaipada R
mendekati angka 1
Berdasarkan gambar diperoleh angka adjusted R Square
sebesar 0.448 atau 44.8%.
tinggi
badan
dan
umur
Hal ini menunjukkan bahwa
mempengaruhi
berat
badan
sebesar 44.8% sedangkan sisa persen sebesar 55.2%
merupakan pengaruh dari factor lain ang tidak diteliti.
Std. error of the estimate (SEE) sebesar 5.437. Makin kecil
nilai SEE akan membuat model regresi semakin tepat
dalam
memprediksi
pengaruh
terhadap
variable
dependent.
Durbin-Watson
Sedangkan pada Durbin-Watson meruapakan hasil SPSS
yang
menerangkang
apakah
terdapat
autokorelasi
di
antara variable independent berdasarkan jumlah sampel
yang di ambil yang di wakili dengan nilai dL dan dU
- Jumlah variabel bebas : k = 2
- Jumlah sampel : n = 12
Tabel Durbin-Watson menunjukkan bahwa nilai dL = 0,8122
dan nilai dU = 1,5794 sehingga dapat ditentukan kriteria
terjadi atau tidaknya autokorelasi yang dapat dilihat pada
Tabel statistic Durbin-Watson : 5 per cent.
Nilai DW hitung sebesar 1,133 lebih kecil dari 1,5794 dan
lebih besar dari 0,8122 yang artinya berada pada daerah
ragu-ragu. Sehingga dapat disimpulkan bahwa dalam
model regresi linier berkemungkinan memiliki autokorelasi
di setiap variable independent.
ANOVA
Untuk menguji apakah model regresi yang di estimasi layak
digunakan atau tidak.
Dan dalam hasil SPSS yaitu 0,028 lebih kecil dari tingkat
kesalahan/eror (alpha) 0,05 sehingga dapat disimpulkan
bahwa model regresi yang diestimasi layak untuk di
gunakan.
Analisis
COEFFICIENT
Pada tabe coefficient merupakan hasil dari uji koefisien
regresi yang dapat membuktikan bahwa parameter yang
meliputi intersep (konstanta) dan slope ( koefisien dalam
persamaan linier ) mampu menjelaskan perilaku variable
bebas dalam mempengaruhi variable terikatnya.
Dan dari hasil SPSS dapat di simpulkan bahwa t hitung ( sig
) dari umur adalah 0.,800 lebih besar dari alpha ( 0,05 )
sehingga variable bebas umur tidak berpengaruh secara
signifikan terhadap berat badan sedangkan sig pada tinggi
badan adalah 0,142 lebih besar dari alpha ( 0,05 ) sehingga
variable bebas tinggi badan tidak berpengaruh secara
signifikan terhadap berat badan
Analisis
Pada Normal P-P Plot merupakan hasil dari uji normalitas
yang dalam asumsi klasik merupakan pendekatan OLS adalah
( data ) residual yang dibentuk model regresi linier bedistribusi
normal, bukan variable bebas maupun variable terikatnya.
Kriteria sebuah (data) residual berdistribusi normal atau tidak
dapat dilihat dari pendekatan pada Normal P-P Plot.
Dari hasil SPSS di atas dapat disimpulkan bahwa (data)
residual terdistribusi normal karena titik-titik pada gambar
Normal P-P Plot di atas relative mendekati garis lurus atau
garis prediksi.
Analisis
Pengujian heteroskedasitas dapat dilakukan dengan melihat
scatterplot ( alur sebaran ) antara residual dan nilai prediksi dari
variable terikat yang telah di standarisasi.
Dari hasil scatterplot di atas dapat disimpulkan bahwa
sebaran titik membentuk tidak membentuk suatu pola/alur
tertentu,
sehingga
dapat
disimpulkan
bahwa
tidak
terjadi
heteroskeraditas atau dengan kata lain terjadi homoskedasitas.
REGRESI LOGISTIK ( GANJIL )
1. Hipotesis statistic
- H0 : tidak ada hubungan secara signifikan antara PMT,
-
Daerah dan ekonomi terhadap gizi
Ha : ada hubungan secara signifikan antara PMT, Daerah
dan ekonomi terhadap gizi
2. Alpha yang digunakan 0,05
Aplikasi SPSS
Variable view
Memberi
nilai
values
pada
variable
gizi
kurang
dan
normal ),PMT ( tidak PMT dan PMT ) dan daerah ( rural dan
urban )
a. Variable gizi
b. Variabel PMT
c. Variabel daerah
Data View
Proses pengerjaan
1. Klik analyze -> Regression -> Binary Logistic
2. Maka akan muncul window seperti ini, masukkan gizi pada
kolom dependent sebagai variable terikat dan sisanya di
masukkan dalamkolom covariates sebagai variable bebas
3. Pilih Option lalu tandai Classification plots, Hosmerlemeshow goodness-of-fit, Casewise listing residuals
dan pilih Outliers outside dan isi dengan angka 2,
Correlation of estimates, Iteration history, CI for
exp(B) dan isi dengan 95, Dan terakhir klik continue
4. Pilih Categorical lalu masukkan semua covariates ke dalam
kolom categorical covariates lalu klik continue
5. Pilih Save lalu tandai Probabilities, Group membership,
Unstandardized
Continue.
dan
Studentized
kemudian
klik
Output dari SPSS
Analisis
CASE PROCESSING SUMMARY
Di atas pada tabel Case Processing Summary adalah ringkasan
jumlah sampel, yaitu sebanyak 30 sampel.
DEPENDENT VARIABLE ENCODING
Di atas adalah kode variabel dependen. Yaitu kategori "kurang"
dengan kode 0 dan "normal" dengan kode 1.
Analisis
ITERATION HISTORY
Pada
block
atau
saat
variabel
independen
tidak
dimasukkan dalam model
N = 30 mendapatkan Nilai -2 Log Likelihood: 38.191.
Degree of Freedom (DF) = N - 1 = 30-1= 29. Chi-Square (X 2)
Tabel Pada DF 29 dan Probabilitas 0.05 = 42.557
Nilai -2 Log Likelihood (38.191) < X2 tabel (42.557) sehingga
menerima
H 0,
maka
menunjukkan
bahwa
model
sebelum
memasukkan variabel independen adalah FIT dengan data.
Analisis
CLASSIFICATION TABLE
Merupakan tabel kontingensi 2 x 2 yang seharusnya terjadi
atau disebut juga frekuensi harapan berdasarkan data empiris
variabel dependen, di mana jumlah sampel yang memiliki
kategori variabel dependen referensi atau akibat buruk (kode 1)
yaitu "Normal" sebanyak 20. Sedangkan yang "Kurang" sebanyak
10 orang. Jumlah sampel sebanyak 30 orang. Sehingga nilai
overall percentage sebelum variabel independen dimasukkan ke
dalam model sebesar: 20/30 = 66,67%.
VARIABLES IN THE EQUATION
Saat sebelum var independen di masukkan ke dalam model,
maka belum ada variabel independen di dalam model. Nilai Slope
atau Koefisien Beta (B) dari Konstanta adalah sebesar 0,693
dengan Odds Ratio atau Exp(B) sebesar 2,000. Nilai Signifikansi
atau p value dari uji Wald sebesar 0,074.
Perlu diingat bahwa nilai B identik dengan koefisien beta
pada Ordinary Least Square (OLS) atau regresi linear. Sedangkan
Uji Wald identik dengan t parsial pada OLS. Sedangkan Exp(B)
adalah nilai eksponen dari B, maka Exp(0,693) = 2,000.
VARIABLES NOT IN THE EQUATION
Di atas pada tabel Variables not in the Equation: Menunjukkan
variabel yang belum dimasukkan ke dalam model regresi, yaitu
variabel PMT, daerah dan ekonomi.
Analisis
Di atas pada tabel Iteration history Block 1 atau saat
variabel independen dimasukkan dalam model: N= 30. Degree of
Freedom (DF) = N - jumlah variabel independen - 1 = 30-3-1=
26. Chi-Square (X2) Tabel Pada DF 26 dan Prob 0.05 = 38,885.
Nilai -2 Log Likelihood (10,549) < X2 tabel (38,885) sehingga
menerima
H0,
maka
menunjukkan
bahwa
model
dengan
memasukkan variabel independen adalah FIT dengan data. Hal
ini berbeda dengan Block Beginning di atas, di mana saat
sebelum variabel independen dimasukkan ke dalam model,
model FIT dengan data.
Analisis
OMNIBUS TEST
Tampak di atas bahwa selisihnya (-2 Log likelihood sebelum
variabel
independen
masuk model: 38,191 dikurangi
-2
Log
likelihood setelah variabel independen masuk model: 10,549 =
27,642) adalah nilai chi-square 27,642.
Nilai X2 27,642 > X2 tabel pada DF 9 yaitu 16,919 atau
dengan signifikansi sebesar 0,001 < (0,05) sehingga menolak H 0,
yang menunjukkan bahwa penambahan variabel independen
DAPAT memberikan pengaruh nyata terhadap model, atau
dengan kata lain model dinyatakan FIT.
Perlu diingat jika pada OLS untuk menguji signifikansi
simultan menggunakan uji F, sedangkan pada regresi logistik
menggunakan
nilai
Chi-Square
dari
selisih
antara
-2
Log
likelihood sebelum variabel independen masuk model dan -2 Log
likelihood setelah variabel independen masuk model. Pengujian
ini disebut juga dengan pengujian Maximum likelihood.
Sehingga jawaban terhadap hipotesis pengaruh simultan
variabel
independen
terhadap
variabel
dependen
adalah
menerima Ha dan menolak H0 atau yang berarti ada pengaruh
signifikan
secara
simultan
merokok
dan
riwayat
keluarga
terhadap kejadian kanker paru oleh karena nilai p value ChiSquare sebesar 0,001 di mana < Alpha 0,05 atau nilai Chi-Square
Hitung 27,642 > Chi-Square tabel 16,919.
PSEUDO R-SQUARE
Di
atas
kemampuan
pada
tabel
variabel
Model
Summary:
independen
Untuk
dalam
melihat
menjelaskan
variabel dependen, digunakan nilai Cox & Snell R Square dan
Nagelkerke R Square.
Nilai Nagelkerke R Square sebesar 0,836 dan Cox & Snell R
Square 0,602
yang
menunjukkan
bahwa
variabel independen dalam
variabel dependen adalah
kemampuan
menjelaskan
sebesar
0,836
atau
83,6% dan terdapat 100% - 83,6% = 16,4% faktor lain di luar
model yang menjelaskan variabel dependen.
HOSMER AND LEMESHOW TEST
Hosmer and Lemeshow Test adalah uji Goodness of fit test
(GoF), yaitu uji untuk menentukan apakah model yang dibentuk
sudah tepat atau tidak. Dikatakan tepat apabila tidak ada
perbedaan signifikan antara model dengan nilai observasinya.
Nilai Chi Square tabel untuk DF 5 pada taraf signifikansi
0,05 adalah sebesar 11,070. Karena nilai Chi Square Hosmer and
Lemeshow hitung 0,000 < Chi Square table 11,070 atau nilai
signifikansi sebesar 1,000 > (0,05) sehingga menerima H 0, yang
menunjukkan bahwa model dapat diterima dan pengujian
hipotesis dapat dilakukan sebab ada perbedaan signifikan antara
model dengan nilai observasinya
Analisis
CLASSIFICATION TABLE
Berdasarkan tabel Classification Table di atas, jumlah sampel
yang gizinya normal 1 + 19 = 20 orang. Yang benar-benar
gizinya normal sebanyak 19 orang dan yang seharusnya gizinya
normal namun ternyata gizinya kurang sebanyak 1 orang. Jumlah
sampel yang gizinya kurang sebanyak 8 + 2 = 10 orang. Yang
benar-benar
gizinya
kurang
sebanyak
orang
dan
yang
seharusnya gizinya kurang namun ternyata gizinya normal
sebanyak 2 orang.
Tabel di atas memberikan nilai overall percentage sebesar
(8+19)/30 = 90,0% yang berarti ketepatan model penelitian ini
adalah sebesar 90,0%.
Analisis
VARIABLES IN THE EQUATION
Lihat tabel Variabel in the equation di atas: semua variabel
independen nilai P value uji wald (Sig) > 0,05, artinya masingmasing
variabel
tidak
mempunyai
pengaruh
parsial
yang
signifikan terhadap gizi balita di dalam model. PMT mempunyai
nilai Sig Wald 0,999 > 0,05 sehingga menerima H 0 atau yang
berarti PMT tidak memberikan pengaruh parsial yang signifikan
terhadap status gizi balita. Daerah mempunyai nilai Sig Wald
0,999 > 0,05 sehingga menerima H0 atau yang berarti daerah
tidak memberikan pengaruh parsial yang signifikan terhadap
status gizi balita.
Besarnya pengaruh ditunjukkan dengan nilai EXP (B) atau
disebut juga ODDS RATIO (OR). Variabel PMT dengan OR 1,651
maka PMT (kode 1 variabel independen), lebih berpengaruh
terhadap
status
gizi
balita
sebanyak
1,651
kali
lipat
di
bandingkan yang tidak PMT (kode 0 variabel independen). Nilai B
= Logaritma Natural dari 1,651 = 18,922. Oleh karena nilai B
bernilai
positif,
maka
PMT
mempunyai
hubungan
positif
denganstatus gizi balita.
Variabel daerah dengan OR 0,000 maka daerah tidak
berpengaruh terhadap status gizi balita. Oleh karena nilai B
bernilai negatif, maka daerah tidak mempunyai hubungan positif
dengan status gizi balita.
Variabel
ekonomi
dengan
OR
2,446
maka
daerah
berpengaruh terhadap status gizi balita sebanyak 2,446 kali.
Oleh karena nilai B bernilai positif, maka ekonomi mempunyai
hubungan positif dengan status gizi balita.
Analisis
OBSERVED GROUPS AND PREDICTED PROBABILITIES
Di atas adalah grafik klasifikasi dari observed group dan
predicted group membership.
CASEWISE LIST
Berisikan daftar sampel yang menjadi outlier beserta nilai
studentized Residual.