Sutanto Priyo Hastono Analisis Data Suta
Sutanto Priyo Hastono Analisis Data Suta
ANALISIS
DATA
1
SUTANTO PRIYO HASTONO: Analisis Data
PENDAHULUAN
1 STATISTIK dan PENELITIAN
Statistik dalam arti sempit berarti angka/data. Sedangkan dalam arti luas statistik
sebagi suatu prosedur atau metode pengumpulan data, pengolahan data,
analisis data dan penyajian data. Sedangkan penelitian adalah cara ilmiah untuk
mendapatkan data dengan tujuan dan kegunaan tertentu.
Data yang diperoleh melalui penelitian harus akurat, artinya data yang dihasilkan
harus memenuhi kriteria: valid, reliabel dan obyektif. Valid artinya
ketepatan/kecermatan pengukuran, artinya ketepatan antara data yang
sesungguhnya terjadi pada obyek dengan data yang dapat dikumpulkan oleh
peneliti. Misalkan data dalam obyek berwarna merah, maka data yang terkumpul
oleh peneliti juga berwarna merah. Contoh lain, kita akan mengukur waktu
lomba lari cepat, kalau mengukurnya dengan jam tangan tentunya hasilnya tidak
valid, untuk lomba lari cepat akan valid bila menggunakan alat Stop watch.
Contoh lain, bila survei melakukan wawancara dengan orang pedesaan Cianjur
tidak valid kalau wawancaranya menggunakan bahasa batak, akan valid bila
menggunakan bahasa sunda.
2
SUTANTO PRIYO HASTONO: Analisis Data
4. Jenis Data
Dalam menggunakan statistik perlu dipahami benar mengenai definisi data
dan jenis-jenis data. Data merupakan kumpulan angka/huruf hasil dari penelitian
terhadap sfat/karakteristik yang kita teliti. Isi data pada umumnya bervariasi
(misalnya data berat badan dalam suatu kelompok orang ada yang beratnya 60
kg, 50 kg, 75 kg dst) sehingga muncul istilah variabel. Jadi variabel merupakan
3
SUTANTO PRIYO HASTONO: Analisis Data
4
SUTANTO PRIYO HASTONO: Analisis Data
antara A dan B adalah 30 kg, berat b dua kali lebih tinggi dari berat A. berat
0 kg, ini berarti tidak ada berat (tidak ada bendanya) sehingga ada nol
mutlak.
Dalam analisis seringkali digunakan pembagian data/variabel menjadi dua
kelompok yaitu; data katagorik dan data numerik.
a. Katagorik (kualitatif), merupakan data hasil
pengklasifikasian/penggolongan suatu data. Cirinya: isisnya berupa kata-kata.
Contoh; sex, jenis pekerjaan, pendidikan
b. Numerik (kuantitatif), merupakan variabel hasil dari penghitungan dan
pengukuran. Cirinya: isi variabel berbentuk angka-angka. Variabel numerik
dibagi menjadi dua macam: Diskrit dan Kontinyu.
Diskrit merupakan variabel hasil dari penghitungan. Misalnya jumlah anak,
jumlah pasien tiap ruang, kontinyu merupakan hasol dari pengukuran,
misalkan tekanan darah, Hb dll.
Variabel katagorik pada umumnya berisi variabel yang berskala nominal dan
ordinal. Sedangkan variabel numerik berisi variabel yang berskala interval dan
rasio.
Dalam analisis statistik, seringkali data numerik diubah ke dalam data
katagorik dengan cara dilakukan pengelompokan/pengklasifikasian. Misalnya
variabel berat badan data riilnya merupakan data numeric, namun bila
dikelompokkan menjadi kurus (<50 kg), sedang (50-60 kg) dan gemuk (>60 kg)
maka jenis variabelnya sudah berubah menjadi katagorik.
5
SUTANTO PRIYO HASTONO: Analisis Data
PENGOLAHAN DATA
2
1. Pengantar Pengolahan Data
Pengolahan data merupakan salah satu bagian rangkaian kegiatan penelitian
setelah pengumpulan data. Setelah dilakukan pengumpulan data, seringkali
orang bingung “mau diapakan data yang telah terkumpul?, Bagaimana
menghubungkan data di kuesioner dengan tujuan penelitian?”. Untuk itu data
yang masih mentah (raw data) perlu diolah sedemikian rupa sehingga menjadi
informasi yang akhirnya dapat digunakan untuk menjawab tujuan penelitian.
Agar analisis penelitian menghasilkan informasi yang benar, paling tidak
ada empat tahapan dalam pengolahan data yang harus dilalui, yaitu:
1. Editing
Merupakan kegiatan untuk melakukan pengecekan isian formulir atau
kuesioner apakah jawaban yang ada di kuesioner sudah:
a. Lengkap: semua pertanyaan sudah terisi jawabannya
b. Jelas: jawaban pertanyaan apakah tulisannya cukup jelas terbaca.
c. Relevan: jawaban yang tertulis apakah relevan dengan pertanyaan
d. Konsisten: apakah antara beberapa pertanyaan yang berkaitan isi
jawabannya konsisiten, misalnya antara pertanyaan usia dengan
pertanyaan jumlah anak. Bila dipertanyaan usia terisi 15 tahun dan di
pertanyaan jumlah anak 9, ini berarti tidak konsisten.
2. Coding
Coding merupakan kegiatan merubah data berbentuk huruf menjadi data
berbentuk angka/bilangan. Misalnya untuk variabel pendidikan dilakukan
koding 1 = SD, 2 = SMP, 3 = SMU dan 4 = PT. Jenis kelamin: 1 = laki-laki
6
SUTANTO PRIYO HASTONO: Analisis Data
7
SUTANTO PRIYO HASTONO: Analisis Data
Dari kedua tabel di atas memperlihatkan bahwa tabel jenis kelamin tidak
ada nilai yang hilang (missing), sedangkan pada tabel pendidikan ada 5
pasien yang missing, karena total jumlahnya hanya 95 (seharusnya 100).
b. Mengetahui variasi data
Dengan mengetahui variasi data akan diketahui apakah data yang di-entry
benar atau salah. Cara mendeteksi dengan mengeluarkan distribusi
frekuensi masing-masing variabel. Dalam entry data biasanya data
dimasukkan dalam bentuk kode/coding, misalnya untuk variabel
pendidikan SD kode 1, SMP kode 2, SMU kode 3, dan PT kode 4. Untuk
mengetahui kesalahan data berikut ilustrasi keluaran dari variabel
pendidikan:
8
SUTANTO PRIYO HASTONO: Analisis Data
Dari tampilan di atas kendati jumlah total sudah benar 100, namun
terlihat ada data yang salah, yaitu munculnya kode pendidikan angka 7
yang berjumlah 4 pasien. Seharusnya variabel pendidikan variasi
angkanya hanya dari angka 1 s.d. 4.
9
SUTANTO PRIYO HASTONO: Analisis Data
Keterangan:
* = ada 2 responden dengan umur 15 tahun dan anaknya ada 10 orang (ada
kesalahan entry data!!!)
10
SUTANTO PRIYO HASTONO: Analisis Data
2. ENTRY DATA
Setelah kita mengetahui langkah-langkah pengolahan data, selanjutnya
akan dibahas entry data menggunakan SPSS. Kepanjangan dari SPSS yaitu
Statistical Program For Social Science. SPSS merupakan paket program ststistik
yang berguna untuk mengolah dan menganalisis data penelitian. Dengan SPSS
semua kebutuhan pengolahan dan analisis data dapat diselesaikan dengan
mudah dan cepat. Kemampuan yang dapat diperoleh dari SPSS meliputi
pemrosesan segala bentuk file data, modifikasi data, membuat tabulasi
berbentuk distribusi frekuensi, analisis statistik deskriptif, analisis lanjut yang
sederhana maupun komplek, pembuatan grafik, dsb. Perkembangan program
SPSS sangat cepat dimulai dari program SPSS/PC+(masih under DOS) kemudian
berkembang menjadi SPSS for Windows dari versi 6 dan berkembang terus
sampai sekarang sudah memasuki versi 11. Dan untuk latihan digunakan SPSS
for Windows versi 10.
a. MEMANGGIL SPSS
Pertama kali anda harus pastikan bahwa komputer sudah ter-install
program SPSS for Windows. Untuk memanggil program SPSS dapat dilakukan
dua cara :
Pertama :
Bila tampilan pertama komputer sudah muncul Icon SPSS, maka klik dengan
mouse icon tersebut dua kali.
Kedua :
Bila di layar belum ada icon SPSS, maka klik “Start”, pilih “File Program” dan
sorot “SPSS” dan klik dua kali.
Di dalam operasionalnya, SPSS mengenal 2 jenis jendela (Window) yang utama
yaitu:
a. SPSS Data Editor
11
SUTANTO PRIYO HASTONO: Analisis Data
Jendela ini berisis tampilan data yang kita olah dan analisis dengan tampilan
sejenis Spreadsheet (seperti tampilan Program Excel).
b. SPSS Output
Hasil olahan (hasil analisis) yang anda lakukan akan ditampilkan pada Output
window. Window ini merupakan teks editor, artinya dapat mengedit hasil
analisis yang ditampilkan.
12
SUTANTO PRIYO HASTONO: Analisis Data
b. tampilan variabel
Sistem kerja SPSS for Windows dikendalikan oleh menu (bar menu)./ Bar menu
terletak di sebelah atas dengan urutan dari kiri ke kanan sbb: File, Edit, View,
Data, Transform, Analyze, Graphs, Utilities, Window, Help.
File: digunakan untuk membuat file data baru, membuka file data yang telah
tersimpan (ekstensi SAV), atau membaca file data dari program lain, seperti
dbase, excell dll.
Edit: digunakan untuk memodifikasi, mengcopy, menghapus, mencari, dan
mengganti data.
View: digunakan untuk mengatur tampilan font, tampilan kode/label
Data: digunakan untuk membuat/mendefinisikan nama variabel, mengambil/
menganalisis sebagian data, menggabungkan data.
Transform: digunakan untuk transformasi/modifikasi data seperti
pengelompokan variabel, pembuatan variabel baru dari
perkalian/penjumlahan variabel yang ada dll.
13
SUTANTO PRIYO HASTONO: Analisis Data
I. MEMASUKKAN DATA
Entry data dapat langsung dilakukan pada data editor. Data editor
memiliki bentuk tampilan sejenis spreadsheet (seperti Excel) yang digunakan
sebagai fasilitas untuk memasukkan/engisikan data. Ada tiga hal yang harus
diperhatikan:
Baris menunjukkan kasus/responden
Kolom menunjukkan variabel
Sel merupakan perpotongan antara kolom dan baris menunjukkan nilai/data
14
SUTANTO PRIYO HASTONO: Analisis Data
Note: yang sering digunakan adalah tipe Numerik, karena data yang akan kita
olah biasanya berbentuk angka.
15
SUTANTO PRIYO HASTONO: Analisis Data
POLA MENYUSUI
Nomor Responden
1. Berapa umur ibu? …. Tahun
2. pendidikan ibu yang telah ditamatkan?
1. SD 2. SMP 3. SMU 4. PT
3. Apakah ibu bekerja?
0. bekerja 1. Tidak bekerja
4. Berapa berat badan ibu ? … kg
5. Apakah ibu menyusui secara Eksklusif (menyusui sampai usia bayi 4 bulan)?
0. tidak 1. ya
6. a.Kadar Hb ibu pengukuran pertama : …. gr%
b.Kadar Hb ibu pengukuran kedua : …. gr%
7. Berat badan bayi ibu? …….gram
PERTANYAAN SIKAP
1. Bayi yang baru lahir sesegera mungkin diberi ASI?
1. STS 2. TS 3.KS 4. S 5.SS
2. Bayi yang baru lahir diberi kolostrum
1. STS 2. TS 3.KS 4. S 5.SS
3. Bayi sejak lahir sampai usia 4 bulan hanya diberi ASI saja?
1. STS 2. TS 3.KS 4. S 5.SS
4. ASI diberikan sampai bayi berusia 2 tahun?
1. STS 2. TS 3.KS 4. S 5.SS
16
SUTANTO PRIYO HASTONO: Analisis Data
17
SUTANTO PRIYO HASTONO: Analisis Data
Pada tampilan “Variable View” diatas terlihat kolom: Name, Type, Width,
Decimals, dst.. Selanjutnya kita dapat membuat nama variabelnya dimulai
dari No, umur, didik, dst..sbb:
a. Membuat Variabel No
Adapun tahapannya sbb:
18
SUTANTO PRIYO HASTONO: Analisis Data
19
SUTANTO PRIYO HASTONO: Analisis Data
c. Variabel Pendidikan
Proses pembuatannya sama dengan ketika membuat variabel No sbb:
1. Sekarang pada kolom name ketik nama variabel Didik, kemudian
2. Pindahkan kursor ke kolom Type.. Untuk variabel Didik karena datanya
yang akan masuk berbentuk angka berarti anda pilih numeric (secara
otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi
kolom Type jangan diubah)
3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda
juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
20
SUTANTO PRIYO HASTONO: Analisis Data
standar lebar kolom sudah diatur SPSS, lebar kolom (Width) 8 karakter,
jadi abaikan/biarkan saja untuk width nya
4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis
memberi ruang untuk 2 desimal, untuk variabl Didik tentunya berbentuk
bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan.
5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel Didik, isikan: Pendidikan formal ibu menyusui
6. Langkah selanjutnya geser kekanan ke kolom Values, untuk variabel
Didik kolom Values ada isinya oleh karena variabel Didik merupakan
variabel yang berbentuk koding, yaitu kode 1 = SD, 2=SMP, 3=SMU,
4=PT. Klik kolom Value akan muncul menu:
Klik disini
Pada kotak Value isikan angka 1, lalu klik kotak Value Label isikan:
SD,hasilnya nampak sbb:
21
SUTANTO PRIYO HASTONO: Analisis Data
Kemudian klik tombol Add sehinga di kotak bagian bawah akan muncul:
Seterusnya klik kotak Value, isikan angka 2, klik kotak Value Label dan
isikan: SMP, kemudian klik tombol Add
Seterusnya klik kotak Value, isikan angka 3, klik kotak Value Label dan
isikan: SMU, kemudian klik tombol Add Seterusnya klik kotak Value, isikan
angka 4, klik kotak Value Label dan isikan: PT, kemudian klik tombol Add
sehingga kotak menu akan tertampil sbb:
22
SUTANTO PRIYO HASTONO: Analisis Data
d. Variabel Kerja
1. Pada kolom Name isikan Kerja
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Status pekerjaan ibu
4. Geser kekanan ke kolom Value, isikan koding 0=bekerja 1=tdk kerja
Proses pembuatan variabel kerja selesai
e. Variabel BBibu
1. Pada kolom Name isikan Bbibu
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Berat badan ibu
4. Kolom Value, abaikan/biarkan aja karena variabel Bbibu berbentuk numerik
Proses pembuatan variabel Bbibu selesai
f. Variabel Eksklu
1. Pada kolom Name isikan Eksklu
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Status menyusui eksklusive
23
SUTANTO PRIYO HASTONO: Analisis Data
g. Variabel Hb1
1. Pada kolom Name isikan Hb1
2. Geser kekanan ke kolom Decimal, untuk variabel HB1 sesuai dengan
datanya, ada satu desimal, maka isikan angka 1
3. Geser ke kolom Label isikan: Hb pengukuran pertama
4. Abaikan kolom Values, karena variabel HB1 berbentuk numerik
h. Variabel Hb2
1. Pada kolom Name isikan Hb2
2. Geser kekanan ke kolom Decimal, untuk variabel HB2 sesuai dengan
datanya, ada satu desimal, maka isikan angka 1
3. Geser ke kolom Label isikan: Hb pengukuran kedua
4. Abaikan kolom Values, karena variabel HB2 berbentuk numerik
i. Variabel BBbayi
1. Pada kolom Name isikan BBbayi
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Berat badan bayi
4. Abaikan kolom Value,
Proses pembuatan variabel bbbayi selesai
Dengan cara sama kemudian dapat dibuat untuk variabel: Segera, Kolos,
Lahir, Sampai
Akhirnya tampilan kseluruhannya sbb:
24
SUTANTO PRIYO HASTONO: Analisis Data
B. Memasukkan/entry Data
Setelah semua variabel sudah dibuat, maka langkah selanjutnya adalah
memasukkan data hasil survei kedalam format yang telah dibuat diatas. Untuk
memasukkan data anda harus berpindah ke layar/jendela Data View, yaitu
dengan Klik tombol Data View, nampak tampilannya sbb:
c. Mengedit Data
1. Menghapus isi sel
a. Klik sel yang akan dihapus isinya
b. Tekan tombol ‘Delete’ (pada Keyboard)/clear pada edit. Bila kita nggak
jadi menghapus, klik Undo
Untuk menghapus isi sejumlah sel sekaligus, pilihlah sejumlah sel tersebut
dengan drag (menyorot/memblok) dengan mouse.
Dari tampilan di atas berarti kita membuat blok untuk variabel Kerja pada
responden no 3 s/d 5
Tekan ‘delete’ untuk menghapusnya.
26
SUTANTO PRIYO HASTONO: Analisis Data
Klik disini
Klik
disini
27
SUTANTO PRIYO HASTONO: Analisis Data
28
SUTANTO PRIYO HASTONO: Analisis Data
7. Menyisipkan Kolom
a. Pindahkan penunujuk sel pada kolom yang disisipi
b. Klik ‘Data’, pilih ‘Insert Variable’, terlihat kolom baru muncul.
8. Menyisipkan Baris
a. Pindahkan penunjuk sel pada baris yang akan disisipi
b. Klik ’Data’, pilih ‘Insert Case’, terlihat kasus/ responden baru muncul
29
SUTANTO PRIYO HASTONO: Analisis Data
30
SUTANTO PRIYO HASTONO: Analisis Data
]
3. Klik “Save “, data akan tersimpan
31
SUTANTO PRIYO HASTONO: Analisis Data
2. Misalkan sekarang akan diaktifkan file data: “Latihan” dari drive c direktori My
Documen, maka caranya klik kotak File name: ketik “latihan”, atau klik
“latihan yang terlihat/tertampil pada kotak di atasnya.
32
SUTANTO PRIYO HASTONO: Analisis Data
33
SUTANTO PRIYO HASTONO: Analisis Data
Setelah semua data di-entry pada dasarnya anda dapat langsung melakukan
analisis untuk mengetahui informasi yang diinginkan. Namun seringkali data
yang ada tidak semuanya dapat langsung dilakukan analisis. Beberapa data bisa
jadi masih perlu dilakukan modifikasi/transformasi, misalnya untuk keperluan
analisis kita harus mengelompokkan umur menjadi tiga katagori misalnya < 20
th, 20 – 35 th dan > 35 th. Kasus lain, misalnya kita akan membuat variabel
baru hasil dari gabungan beberapa variabel (misalnya variabel sikap diukur oleh
10 pertanyaan/variabel), maka kita harus melakukan aktifitas di SPSS untuk
menggabungkan beberapa variabel tersebut.
Dari uraian di atas tentunya sekarang menjadi jelas ternyata seringkali kita
tidak dapat langsung melakukan analisis, kita harus melakukan
modifikasi/transformasi data. Perlu tidaknya modifikasi dilakukan dapat
dilihat/dicek pada “Definisi Operasional Variabel” dari penelitian/tesis/skripsi kita.
Misalkan dalam penelitian anda definisi variabelnya sbb:
No Variabel Definisi Operasional Hasil Ukur/Skala
1 Lama tugas Rentang waktu berkeja sebagai Tahun/Rasio
petugas puskesmas
2 Umur Lama waktu hidup yang diukur dari Muda dan tua/
ulang tahun terakhir Ordinal
3 Sikap Pernyataan setuju/tidak setuju Baik dan Buruk/
terhadap sistem pencatatan dan Ordinal
pelaporan yang diukur melalui 10
pertanyaan
Dari contoh definisis operasional di atas dapat diketahui bahwa variabel ‘Lama
tugas” dapat langsung dianalisis, sedangkan variabel umur dan sikap masih perlu
dilakukan modifikasi/transformasi dengan SPSS. Variabel umur perlu dilakukan
34
SUTANTO PRIYO HASTONO: Analisis Data
pengelompokan menjadi umur muda (misalnya ≤ 30 th) dan tua (< 30 th).
Variabel sikap perlu dibuat dengan cara menjumlahkan skor 10 pertanyaan sikap,
kemudian variabel baru tersebut dilakukan pengelompkkan untuk membuat
katagori baik dan buruk (misal menggunakan cut point: mean). Berikut akan
diuraikan beberapa jenis modifikasi data yang dapat dilakukan di program SPSS
for Window.
1. Mengelompokkan data
#perintah : RECODE
Pengelompokan biasanya digunakan untuk mengubah variabel numerik
menjadi variabel katagorik. Pengelompokan dapat dilakukan pada variabel
yang sama atau ke variabel baru yang berbeda. Dianjurkan kalau melakukan
pengelompokan sebaiknya digunakan variabel baru sehingga masih dimiliki
nilai yang asli pada file data.
Coba aktifkan file data ASI.SAV (file ini berisi data penelitian menyusui
eksklusive, yang telah di entry lengkap 50 rsponden)
35
SUTANTO PRIYO HASTONO: Analisis Data
4). Sorot variabel “umur”, lalu klik tanda panah ke kanan sehingga “umur”
berpindah di kotak Input variable Æ Output Variable:
5). Pada kotak Output variable, pada bagian Name ketiklah umur1 (nama
variabel baru untuk umur yang bentuknya sudah katagorik)
6). Klik change sehingga pada kotak Input Variable Æ Output Variable terlihat
umur Æ umur1
36
SUTANTO PRIYO HASTONO: Analisis Data
7). Klik Option “Old and New Value”, nampak kotak Old and New di monitor.
Pada kotak dialog tersebut ada beberapa ada beberapa isian yang harus
diisi. Secara garis besar ada 2 isian yang harus diisi, yaitu ‘Old Value’ (nilai
lama yang akan direcode) dan New Value (nilai baru sebagai hasil ‘recode’
dari nilai lama). Me-recode dapat dilakukan per satu nilai lama atau
jangkauan nilai (range).
8). Sekarang kita akan merecode nilai umur < 20 th menjadi kode 1. Umur
dibawah 20 th, artinya umur terendah/paling muda sampai dengan umur 19
th.
Pindahkan kursor ke kotak Range: ‘lowest through , ketiklah 19 dan
bawa kursor ke bagian kotak ‘new Value’, ketik 1 kemudian klik Add,
hasilnya sbb
37
SUTANTO PRIYO HASTONO: Analisis Data
Langkah 3
Langkah 1
Langkah 4
Langkah 2
10). Kita akan melakukan pengkodean berat > 30 th menjadi kode 3. Pada
kotak Range: thrugh highest ketiklah 31. Lalu pindahkan kursor ke
kotak ‘New Value’, ketiklah 3, klik ‘Add’. Langkahnya seperti diatas, dan
akhirnya setelah selesai hasilnya sbb:
38
SUTANTO PRIYO HASTONO: Analisis Data
39
SUTANTO PRIYO HASTONO: Analisis Data
# perintah : COMPUTE
Selain fasilitas me-recode yang sudahkita coba untuk mengelompokkan
data, fasilitas SPSS yang lain yaitu membuat variabel baru hasil dari operasi
matematik dari beberapa variabel yang sudah dientry, misal melakukan
penjumlahan, pengurangan, pembagian dan perkalian dll.
Sebagai contoh pada data ASI.SAV ada data berat badan bayi dalam bentuk
satuan gram, sekarang anda diminta untuk membuat variabel baru, berat
badan bayi dalam satuan kilogram.
Adapun caranya:
1). Pastikan anda di posisi tampilan data editor
2). Pilih “Transform”
3). Pilih “Compute”, kemudian muncul kotak dialog ”Compute Variable”.
40
SUTANTO PRIYO HASTONO: Analisis Data
6). Klik “OK”, sesaat kemudian variabel “bayikilo” akan muncul dibagian paling
kanan.
41
SUTANTO PRIYO HASTONO: Analisis Data
# perintah : IF
Dalam pembuatan variabel baru seringkali dihasilkan dari kondisi
beberapa variabel yang ada. Misalnya dalam file “ASI.SAV” terdapat variabel
“umur” dan variabel “berat ibu”. Kemudian kita ingin membuat variabel baru
yang berisi dua kelompok yaitu: risiko tinggi dan ririko rendah. Misalkan variabel
tersebut diberi nama “Risk” dan untuk kelompok risiko rendah (kode 0) dan risiko
tinggi (kode 1). Adapun kriteria risiko tinggi adalah bila responden berumur di
atas 30 tahun dan berat badan dibawah 50 kg. Selain kondisi tersebut
dikelompokkan ke dalam risiko rendah. Dari kasus ini berarti kita diharapkan
membuat variabel baru dengan kondisi variabel umur dan hipertensi. Bagaimana
cara membuat variabel “Risk” tersebut? Ada dua langkah untuk menyelesaikan
kasus ini:
Langkah pertama:
= membuat variabel RISK yang isinya semuanya 0 (risiko rendah)=
1). Pilih “Transform”
2). Pilih “Compute”
3). Pada kotak “Target Variable”, ketiklah “risk”
4). Pada kotak “Numeric Expression”, ketiklah “0”
42
SUTANTO PRIYO HASTONO: Analisis Data
5). Klik “OK”, terlihat dilayar variabel “risk” sudah terbentuk dengan semua
selnya berisi angka 0.
Langkah kedua:
=membuat kondisi risiko tinggi (kode 1) untuk umur >30 dan bb<50
6). Pilih kembali menu “Transform”
7). Pilih kembali ‘Compute”
8). Pada kotak “Target Variable” biarkan tetap berisi “RISK”.
43
SUTANTO PRIYO HASTONO: Analisis Data
9). Pada kotak “Numeric Expression”, hapus angka 0 dan gantilah dengan angka
1.
44
SUTANTO PRIYO HASTONO: Analisis Data
15). Klik “OK”, maka terbentuklah variabel “RISK” pada kolom paling kanan
dengan isi 0 dan 1 (0=risiko rendah dan 1= risiko tinggi), kalau menemui data
yang berisi umur diatas 30 tahun dan berat ibu dibawah 50 th, maka isi variabel
RISK akan berubah dari 0 menjadi 1, coba dicek !!!!
45
SUTANTO PRIYO HASTONO: Analisis Data
# perintah : SELECT
Dalam kondisi tertentu seringkali kita hanya menginginkan mengolah dan
menganalisis hanya data dari kelompok tertentu saja. Misalkan kita punya data
seluruh DKI, tapi kita hanya ingin mengetahui distribusi aktifitas pada ibu hamil
yang tinggal di Jakarta Selatan. Di dalam data tentunya ada variabel yang
menunjukkan wilayah tempat tinggal ibu hamil.
Sebagai contoh kita ingin menganalisis data, hanya untuk ibu yang
menyusui saja,(dalam contoh ini kita masih menggunakan file data ASI.SAV).
caranya:
1). Pilih menu “Data”
2). Pih “Select Cases”
3). Klik pada tombol : If Conditin is satisfied
46
SUTANTO PRIYO HASTONO: Analisis Data
47
SUTANTO PRIYO HASTONO: Analisis Data
# perintah : MERGE
Dalam pengolahan data seringkali kita mempunyai tidak satu file data, melainkan
beberapa file data yang tentunya harus digabung kalau kita akan melakukan
analisis data. Teknik penggabungan data ada dua jenis yaitu penggabungan
responden dan penggabungan variabel.
a. Penggabungan responden/case
Misal:
data file pertama, berisi: nomor responden 1 s/d 3
No Umur Didik
1 20 1
2 23 3
3 19 2
48
SUTANTO PRIYO HASTONO: Analisis Data
Aplikasi di SPSS:
Pastikan anda sudah memasukkan data kedua file, misalnya data pertama
dengan nama Data1.sav dan data kedua dengan nama Data2.sav.
Langkahnya:
1. File ‘data1.sav’ dalam kondisi aktif
2. klik data, sorot Merge Files, sorot Add Cases
49
SUTANTO PRIYO HASTONO: Analisis Data
5. klik Open
6. Klik OK, dan akhirnya tergabunglah kedua file data
7. Untuk menyimpan file gabungan, klik Save As isikan nama file baru,
misalnya data12
b. Penggabungan variabel
Data kedua, berisi variabel : no, sex, kerja dan berat badan
50
SUTANTO PRIYO HASTONO: Analisis Data
no sex kerja bb
1 2 1 60
2 2 3 45
3 1 2 56
4 2 1 76
5 2 3 56
6 1 2 60
7 2 3 55
Langkahnya:
Aplikasi di SPSS:
Pastikan anda sudah memasukkan data kedua file, misalnya data pertama
dengan nama Data3.sav dan data kedua dengan nama Data4.sav.
Langkahnya:
1. File ‘data3.sav’ dalam kondisi aktif
2. klik data, sorot Merge Files, sorot Add Variables
51
SUTANTO PRIYO HASTONO: Analisis Data
52
SUTANTO PRIYO HASTONO: Analisis Data
Frequencies
Statistics
RISK
N Valid 5
Missing 0
RISK
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 2 40.0 40.0 40.0
2 3 60.0 60.0 100.0
Total 5 100.0 100.0
53
SUTANTO PRIYO HASTONO: Analisis Data
UJI INSTRUMEN
3
A. Uji validitas dan Reliabilitas Kuesioner
Salah satu masalah dalam suatu penelitian adalah bagaimana data yang
diperoleh adalah akurat dan objektif. Hal ini sangat penting dalam penelitian
karena kesimpulan penelitian hanya akan dapat dipercaya (akurat). Data yang
kita kumpulkan tidak akan berguna bilamana alat pengukur yang digunakan
untuk mengumpulkan data penelitian tidak mempunyai validitas dan reliabilitas
yang tinggi.
VALIDITAS
Validitas berasal dari kata Validity yang mempunyai arti sejauhmana
ketepatan suatu alat ukur dalam mengukur suatu data. Misalnya bila seseorang
akan mengukur cincin, maka dia harus menggunakan timbangan emas. Dilain
pihak bila seseorang ingin menimbang berat badan, maka dia harus
menggunakan timbangan berat badan. Jadi dapat disimpulkan bahwa timbangan
emas valid untuk mengukur berat cincin, tapi timbangan emas tidak valid untuk
menimbang berat badan.
RELIABILITAS
Realibilitas adalah suatu ukuran yang menunjukkan sejauhmana hasil
pengukuran tetap konsisten bila dilakukan pengukuran dua kali atau lebih
terhadap gejala yang sama dan dengan alat ukur yang sama. Misalkan seseorang
ingin mengukur jarak dari satu tempat ke tempat lain dengan menggunakan dua
jenis alat ukur. Alat ukur pertama denganmeteran yang dibuatdari logam,
sedangkan alat ukur kedua dengan menghitung langkah kaki. Pengukuran
54
SUTANTO PRIYO HASTONO: Analisis Data
r= N (ΣXY)- (ΣXΣY)
V[NΣX2 – (ΣX)2][NΣY2 – (ΣY)2]
Keputusan uji:
Bila r hitung lebih besar dari r tabel Æ Ho ditolak, artinya variabel valid
Bila r hitung lebih kecil dari r tabel Æ Ho gagal ditolak, artinya variabel tidak
valid
55
SUTANTO PRIYO HASTONO: Analisis Data
56
SUTANTO PRIYO HASTONO: Analisis Data
KASUS:
UJI VALIDITAS DAN RELIABILITAS KUESIONER
57
SUTANTO PRIYO HASTONO: Analisis Data
Penyelesaian:
Langkahnya:
1. Masukkan data tersebut ke SPSS
2. Klik ‘Analyze’
3. Pilih ‘Scale’
4. Pilih ‘Reliability Analysis’
58
SUTANTO PRIYO HASTONO: Analisis Data
8. Pada bagian ‘Descriptives for’ klik pilihan ‘ítem’, Scale if Item deleted.
9. Klik ‘Continue’
10. Klik ‘OK’., terlihat hasil outputnya sbb :
Reliability Statistics
Cronbach's
Alpha N of Items
.928 5
Item Statistics
59
SUTANTO PRIYO HASTONO: Analisis Data
Item-Total Statistics
Interpretasi:
Hasil analisis reliability memperlihatkan dua bagian. Bagian utama menunjukkan
hasil statistik deskriptif masing-masing variabel dalam bentuk mean, varian dll.
Pada bagian kedua memperlihatkan hasil dari proses validitas dan reliabilitas.
Kaidah yang berlaku bahwa pengujian dimulai dengan menguji validitas
kuesioner baru dilanjutkan uji reliabilitas.
a. Uji Validitas
Untuk mengetahui validitas kuesioner dilakukan dengan membandingkan nilai r
tabel dengan nilai r hitung.
*) Menentukan nilai r tabel
Nilai r tabel dilihat dengan tabel r (pada lampiran) dengan menggunakan df = n-
2 Î 15-2=13. Pada tingkat kemaknaan 5%, didapat angka r tabel = 0,514
**) Menentukan nilai r hasil perhitungan
Nilai r hasil dapat dilihat pada kolom “Corrected item-Total Correlation”
***) Keputusan
Masing-masing pertanyaan/variabel dibandingkan nilai r hasil dengan nilai r
tabel, ketentuan: bila r hasil > r tabel, maka pertanyaan tersebut valid.
Kesimpulan:
Terlihat dari 5 pertanyaan, ada satu pertanyaan yaitu P2 (r=0,3275) yang
nilainya lebih rendah dari r tabel (r=0,514). Sehingga pertanyaan P2 tidak valid,
sedangkan untuk pertanyaan P1, P3, P4 dan P5 dinyatakan valid.
60
SUTANTO PRIYO HASTONO: Analisis Data
Reliability Statistics
Cronbach's
Alpha N of Items
.993 4
Item Statistics
Item-Total Statistics
Interpretasi:
Sekarang terlihat bahwa dari keempat pertanyaan, semua mempunyai nilai r
hasil (Corrected item-Total Correlation) berada di atas dari niali r tabel
(r=0,514), sehingga dapat disimpulkan keempat pertanyaan tersebut valid.
61
SUTANTO PRIYO HASTONO: Analisis Data
b. Uji Reliabilitas
setelah semua pertanyaan valid semua, amnalisis dilanjutkan dengan uji
reliabilitas. Untuk mengetahui reliabilitas caranya adalah; membandingkan nialia
r hasil dengan r tabel.dalam uji reliabilitas sebagai nilai r hasil adalah nilai
“Alpha” (terletak di akhir output). Ketentuannya: bila r Alpha > r tabel, maka
pertanyaan tersebut reliabel
Dari hasil uji di atas ternyata, nilai r Alpha (0,9935) lebih besar dibandingkan
dengan nilai r tabel, maka keempat pertanyaan di atas dinyatakan reliabel.
Prinsip ujinya: bila hasil uji Kappa signifikan/bermakna maka persepsi antara
peneliti dengan numerator sama, sebaliknya bila hasil uji kappa tidak
signifikan/bermakna, maka persepsi antara peneliti dengan numerator terjadi
perbedaan.
Contoh :
Suatu penelitian praktek keperawatan keluarga terdapat instrumen yang
berbentuk observasi terhadap perilaku perawat merawat pasien. Pertanyaanya:
62
SUTANTO PRIYO HASTONO: Analisis Data
Langkah:
1. data di entry di SPSS
2. Klik analysis, sorot Descriptif, sorot dan klik Crostab
3. Masukkan variabel ‘peneliti’ ke bagian Row dan masukkan variabel
‘numerator’ ke bagian colom.
4. Klik tombol Statistic, klik Kappa
5. Klik Continue
6. Klik OK, dan hasilnya
63
SUTANTO PRIYO HASTONO: Analisis Data
Symmetric Measures
Asymp.
a b
Value Std. Error Approx. T Approx. Sig.
Measure of Agreement Kappa .583 .262 1.845 .065
N of Valid Cases 10
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Hasil uji didapatkan nilai koefisien kapaa sebesar 0,583 dan p valuenya sebesar
0,065. Dengan hasil ini berarti p value > alpha berarti hasil uji kappa tidak
signifikan/bermakna, sehingga kesimpulannya: ada perbedaan persepsi
mengenai aspek yang diamati antara peneliti dengan numerator.
64
SUTANTO PRIYO HASTONO: Analisis Data
PENGANTAR
4 ANALISIS DATA
1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya
adalah menganalisis data. Data mentah (raw data) yang sudah susah payah kita
kumpulkan tidak akan ada artinya jika tidak dianalisis. Analisis data merupakan
kegiatan yang sangat penting dalam suatu penelitian, karena dengan analisislah
data dapat mempunyai arti/makna yang dapat berguna untuk memecahkan
masalah penelitian.
Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu
dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat
langsung memberi jawaban penelitian, untuk itu perlu diketahui bagaimana
menginterpretasi hasil penelitian tersebut. Menginterpretasi berarti kita
menjelaskan hasil analisis guna memperoleh makna/arti.
Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas.
Interpretasi dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya
sebatas pada masalah penelitian yang diteliti berdasarkan data yang
dikumpulkan dan diolah untuk keperluan penelitian tersebut. Sedangkan
interpretasi dalam arti luas (analitik) yaitu interpretasi guna mencari makna data
hasil penelitian dengan jalan tidak hanya menjelaskan/menganalisis data hasil
penelitian tersebut, tetapi juga melakukan inferensi (generalisasi) dari data yang
diperoleh dengan teori-teori yang relevan dengan hasil-hasil penelitian tersebut.
65
SUTANTO PRIYO HASTONO: Analisis Data
a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat
masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan
survei. Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan
kuantitatif. Namun bila kita menginginkan untuk mendapatkan
pendapat/gambaran yang mendalam tentang suatu fenomena, maka data dapat
dikumpulkan dengan fokus grup diskusi atau observasi, maka analisisnya
menggunakan pendekatan analisis kualitatif.
c. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua
sampel independen atau dependen. Misalnya pada penelitian survei yang tidak
menggunakan sampel yang sama, dapat digunakan uji statistik yang
mengasumsikan sampel yang independen. Misalkan survei untuk mengetahui
apakah ada perbedaan berat badan bayi antara bayi-bayi yang dilahirkan dari ibu
perokok dengan bayi-bayi dari ibu yang tidak merokok. Disini berarti kelompok
ibu perokok dan kelompok ibu bukan perokok bersifat independen.
66
SUTANTO PRIYO HASTONO: Analisis Data
Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan
sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang
digunakanadalah uji statistik utnuk data yang dependen. Misalnya, suatu
penelitian ingin mengetahui pengaruh penelitian manajemen terhadap kinerja
petugas kesehatan. Pertanyaan penelitiannya “Apakah ada perbedaan kinerja
petugas kesehatan antara sebelum dan sesudah mendapatkan pelatihan
manajemen?”. Dalam penelitian ini sampel kelompok petugas kesehatan bersifat
dependen, karena pada kelompok (orang) yang sama diukur dua kali yaitu pada
saat sebelum pelatihan (pre test) dan sesudah dilakukan pelatihan (Post Test).
c. Jenis Data/Variabel
Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik.
Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai
contoh, nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk
menjelaskan data berjenis katagorik, sedangkan untuk data jenis numerik
biasanya dapat menggunakan nilai rata-rata untuk menjelaskan karakteristiknya.
Untuk analisis hubungan dua variabel (analsis bivariat), uji kai kuadrat hanya
dapat dipakai untuk mengetahui hubungan data katagori dengan data katagori.
Sebaliknya untuk mengetahui hubungan numerik dengan numerik digunakan uji
korelasi/regresi.
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi
datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan
prosedur uji statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat
dipenuhi maka dapat digunakan uji statistik parametrik.
Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan
kuantitatif):
1. Analisis Deskriptif (Univariat).
67
SUTANTO PRIYO HASTONO: Analisis Data
68
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS UNIVARIAT
5 ( DESKTIPTIF)
69
SUTANTO PRIYO HASTONO: Analisis Data
X = Σ Xi / n
2). Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai
nialai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda
dengan nilai mean, penghitungan median hanya mempertimbangkan urutan
nilai dasil pengukuran, besar beda antar nilai di abaikan. Karena
70
SUTANTO PRIYO HASTONO: Analisis Data
mengabaikan besar beda, maka median tidak dipengaruhi oleh nilai ekstrim.
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke besar
b). Hitung posisi median dengan rumus (n+1)/2
c). Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th
Data diurutkan: 20, 24, 26, 30, 36, 40
Posisi = (6+1)/2 = 3,5
Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28
Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa
berumur di atas 28 tahun
3). Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun
71
SUTANTO PRIYO HASTONO: Analisis Data
b. Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain
atau dengan kata lain hasil pengamatan akan bervariasi. Untuk menegtahui
seberapa jauh data bervariasi digunakan ukuran variasi antara lain range, jarak
linier kuartil dan standard deviasi.
1). Range
Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai
terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai
ekstrim. Keuntungan penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian
ditentukan kuartil bawah dan atas. Kuartil merupakan pembagiandata
menjadi 4 bagian yang dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil
II dan kuartil III.
Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di
atasnya.
Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data
berada di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di
atasnya.
Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih
baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi
sangat menyebar.
3). Standard Deviasi
Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai
pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi
terhadap mean disebut varian, yang rumusnya;
72
SUTANTO PRIYO HASTONO: Analisis Data
Semakin besar nilai varian akan semakin bervariasi, karena satuan varian
(kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka
dikembangkan suatu ukuran variasi yang mempunyai satuan yang sama
dengan satuan pengamatan, yaitu Standard Deviasi.
Standard Deviasi merupakan akar dari varian:
73
SUTANTO PRIYO HASTONO: Analisis Data
74
SUTANTO PRIYO HASTONO: Analisis Data
b. Data katagorik
Tabel 2
Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X
tahun 1999
75
SUTANTO PRIYO HASTONO: Analisis Data
KASUS :
ANALISIS DESKRIPTIF (UNIVARIAT)
Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-
masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk
data numerik digunakan nialai mean (rata-rata), median, standard deviasi dll.
Sedangkan untuk data katagorik tentunya hanya dapat menjelaskan angka/nilai
jumlah dan persentase masing-masing kelompok. Berikut akan dipelajari cara
mengeluarkan analisis deskriptif di SPAA, dimulai untuk variabel katagorik
(sebagai latihan digunakan variabel ‘pendidikan’) dan kemudian dilanjutkan
variabel numerik (variabel umur).
a. Data Katagorik
Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi.
Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel
pendidikan dari file ‘ASI.SAV’.
1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive Statistic’ dan
pilih ‘Frequencies’, sehingga muncul tampilan:
2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “Variable (s)”
76
SUTANTO PRIYO HASTONO: Analisis Data
Frequencies
Statistics
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 10 20.0 20.0 20.0
2 11 22.0 22.0 42.0
3 16 32.0 32.0 74.0
4 13 26.0 26.0 100.0
Total 50 100.0 100.0
Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada
contoh di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang
berpendidikan SD, proporsi dapat dilihat pada kolom ‘Percent’, pada contoh di
atas ada 20% ibu yang berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil
yang sama karena pada data ini tidak ada ’missing cases’. ‘Cumulative Percent’
77
SUTANTO PRIYO HASTONO: Analisis Data
menjelaskan tentang persent kumulatif. Pada contoh di atas ada 42,0% ibu yang
tingkat pendidikannya SD dan SMP. Dalam menginterpretasikan tabel katagorik
dapat dilihat dari variasi dan konsentrasi datanya.
b. Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan
ukuran tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata,
median dan modus. Sedangkan ukuran sebarannya (variasi) yang digunakan
adalah range, standard deviasi, minimal dan maksimal. Pada SPSS ada dua cara
untuk mengeluarkan analisis deskriptif yaitu dapat melalaui perintah
‘Frequencies’ atau perintah ‘Expolre’. Biasanya yang digunakan adalah
78
SUTANTO PRIYO HASTONO: Analisis Data
Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada menu
‘Frequencies’ sangat lengkap (seperti mean, median, varian dll), selain itu pada
perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya.
Berikut akan dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan
menggunakan perintah frequencies.
1. Aktifkan data “susu.sav”
2. Pilih ‘Analyze’
3. Pilih ‘Descriptive Statistic’
4. Pilih ‘Frequencies’, terlihat kotak frequencies:
5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda
panahsehingga umur masuk ke kotak variable (s).
6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya mean,
median, standard seviasi, minimum, maximum, SE.
79
SUTANTO PRIYO HASTONO: Analisis Data
7. Klik ‘Continue’
8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu
klik ‘With Normal Curve’
9. Klik ‘Continue’
10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistik
yang diminta dan dibawahnya tampak grafik histogram beserta curve
normalnya.
Frequencies
Statistics
80
SUTANTO PRIYO HASTONO: Analisis Data
Statistics
Cumulative
Frequency Percent Valid Percent Percent
Valid 19 7 14.0 14.0 14.0
20 3 6.0 6.0 20.0
21 3 6.0 6.0 26.0
22 5 10.0 10.0 36.0
23 5 10.0 10.0 46.0
24 4 8.0 8.0 54.0
25 2 4.0 4.0 58.0
26 5 10.0 10.0 68.0
27 3 6.0 6.0 74.0
30 3 6.0 6.0 80.0
31 3 6.0 6.0 86.0
32 3 6.0 6.0 92.0
34 2 4.0 4.0 96.0
35 2 4.0 4.0 100.0
Total 50 100.0 100.0
81
SUTANTO PRIYO HASTONO: Analisis Data
Histogram
5
Frequency
1
Mean = 25.1
Std. Dev. = 4.85
0 N = 50
15 20 25 30 35
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan
nilai standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas,
rata-rata umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi
4,85 tahun dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi
frekuensi ditampilkan menurut umur termuda sampai dengan umur tertua
dengan informasi tentang jumlah dan persentasenya. Bentuk distribusi data
dapat diketahui dari grafik histogram dan kurve normalnya. Dari tampilan grafik
dapat dilihat bahwa distribusi variabel umur berbentuk normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk
melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi
interval lakukan analisis eksplorasi data dengan perintah ‘Explore’. Adapun
caranya sbb:
1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu
‘descriptive Statistics’, lalu pilih ‘Explore’
82
SUTANTO PRIYO HASTONO: Analisis Data
2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan
‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:
4. Klik ‘Continue’
5. Klik ‘OK’, hasilnya dapat dilihat di layar:
Explore
83
SUTANTO PRIYO HASTONO: Analisis Data
Descriptives
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu menyusui .130 50 .035 .920 50 .002
a. Lilliefors Significance Correction
7.00 1 . 9999999
20.00 2 . 00011122222333334444
10.00 2 . 5566666777
11.00 3 . 00011122244
2.00 3 . 55
Stem width: 10
Each leaf: 1 case(s)
84
SUTANTO PRIYO HASTONO: Analisis Data
1
Expected Normal
-1
-2
15 20 25 30 35
Observed Value
35
30
25
20
15
85
SUTANTO PRIYO HASTONO: Analisis Data
Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun
yang paling penting dari tampilan explore munculnya angka estimasi interval.
Dari hasil tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita
dapat menghitung 95% confidence interval umur yaitu 23,72 s.d. 26,48. jadi kita
95% yakin bahwa rata-rata umur ibu di populasi berada pada selang 23,72
sampai 26,48 tahun.
86
SUTANTO PRIYO HASTONO: Analisis Data
Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat
bentuk yang normal, selain itu hasil dari perbandingan skwness dan standar
error didapatkan: 0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti
distribusi normal. Dari hasil tersebut diatas dengan demikian variabel umur
disimpulkan berdistribusi normal.
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x
Variabel Mean SD Minimal- Maksimal 95% CI
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72
– 26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur
tertua 35 tahun. Dari hasil estimasi interval dapat disimpulkan bahwa 95%
diyakini bahwa rata-rata umur ibu adalah diantara 23,72 sampai dengan 26,48
tahun.
87
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS BIVARIAT
6
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan
analisis lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis
pembayaran berobat dan kepuasan pasien, kita hanya melakukan
pendeskripsian sendiri-sendiri untuk variabel jenis pembayaran dan kepuasan
pasien. Untuk variabel jenis pembayaran akan diketahui berapa persen yang
berobat dengan biaya sendiri dan berapa persen yang dibiayai askes. Begitu juga
untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan
berapa persen yang tidak puas.
Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh
diatas berarti kita ingin mengetahui hubungan jenis pembayaran dengan
kepuasan pasien, maka analisis dilanjutkan pada tingkat bivariat. Pada analisis
bivariat kita dapat mengetahui apakah ada perbedaan kepuasan pasien antara
pasien dengan membayar sendiri dengan pasien dengan biaya askes. Kegunaan
analisis bivariat bisa untuk mengetahui apakah ada hubungan yang siginifikan
antara dua variabel, atau bisa juga digunakan untuk mengetahui apakah ada
perbedaan yang signifikan antara dua atau lebih kelompok(sampel).
88
SUTANTO PRIYO HASTONO: Analisis Data
berubah menjadi bermakna secara statitik. Oleh karena itu arti kegunaan dari
setiap penemuan jangan hanya dilihat dari aspek statistik semata, namun harus
juga dinilai/dilihat kegunaannya dari segi klinis/substansi. Sebagai contoh ada
studi eksperimen yang akan menguji dua obat (katakanlah obat A dan Obat B)
untuk mengathui pengaruhnya terhadap penurunan tekanan darah. Kemudian
obat A dan B diujicobakan pada dua kelompok relawan penderita hipertensi.
Hasil eksperimen didapatkan bahwa rata-rata penurunan tekanan darah setelah
minum obat A adalah 40 mmHg dan pada kelompok yang minum Obat B rata-
rata penurunannya 39 mmHg. Kemudian dilakukan uji statistik dan hasilnya
signifikan/bermakna (p value < alpha), apa yang dapat disimpulkan dari temuan
ini? Secara statistik memang terjadi perbedaan bermakna, namun secara
substansi tidaklah mempunyai perbedaan yang berarti, oleh karena perbedaan
mean penurunan tekanan darah antara obat A dan B hanya 1 mmHg. Dengan
hasil ini dapat disimpulkan bahwa sebenarnya antara obat A dan B tidak ada
perbedaan (sama saja) kasiatnya.
UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan
keputusan tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau
hubungan, cukup menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini
didasarkan pada besarnya peluang untuk memperoleh hubungan tersebut secara
kebetulan (by chance). Semakin kecil peluang tersebut (peluang adanya by
chance), semakin besar keyakinan bahwa hubungan tersebut memang ada.
Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk
memutuskan berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru
lebih baik daripada yang sekarang beraedar di pasaran. Untuk menjawab
pertanyaan ini maka perlu dilakukan pengujian hipotesis. Dengan pengujian
hipotesis akan diperoleh suatu kesimpulan secara probalistik apakah vaksin baru
tersebut lebih baik dari yang sekarang beredar di pasaran atau malah sebaliknya.
89
SUTANTO PRIYO HASTONO: Analisis Data
1. Hipotesis
Hipotesis berasal dari kata hupo dan thesis. Hupo artinya
sementara/lemah kebenarannya dan thesis artinya pernyataan/teopri. Dengan
90
SUTANTO PRIYO HASTONO: Analisis Data
91
SUTANTO PRIYO HASTONO: Analisis Data
a. One tail (satu sisi): bila hipotesis alternatifnya menyatakan adanya perbedaan
dan ada pernyataan yang mengatakan hal satu lebih tinggi/rendah dari hal
lain.
Contoh:
Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan
bayi dari ibu tidak merokok.
b. Two tail (dua sisi) merupakan hipotesis alternatif yang hanya menyatakan
perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi
dari ibu tidak merokok. Atau dengan kata lain: ada perbedaan berat badan
bayi antara mereka yang dilahirkan dari ibu yang merokok dibandingkan dari
ibu yang tidak merokok.
Contoh penulisan hipotesis:
Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan
tekanan darah, maka hipotesisnya sbb:
Ho : μA = μB
Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau
Tidak ada hubungan antara jenis kelamin dengan tekanan darah.
Ho : μA ≠ μB
Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau
Ada hubungan antara jenis kelamin dengan tekanan darah
93
SUTANTO PRIYO HASTONO: Analisis Data
Penentuan jenis uji juga ditentukan oleh jumlah data yang dianalisis, bila jumlah
data kecil (<30) cenderung digunakan uji non parametrik.
94
SUTANTO PRIYO HASTONO: Analisis Data
3). Jenis distribusi data populasinya apakah mengikuti distribusi normal atau
tidak.
Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean
akan berbeda dengan uji statistik untuk mengetahui perbedaan
proporsi/persentase. Uji beda mean menggunakan uji t atau inova, sedangkan
uji untuk mengetahui perbedaan proporsi digunakan uji Kai kuadrat.
Pengertian Nilai P
Nilai p merupakan nilai yang menunjukkan besarnya peluang salah
menolak Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai
besarnya peluang hasil penelitian (misal adanya perbedaan mean atau proporsi)
terjadi karena faktor kebetulan (by chance). Harapan kita nilai p adalah sekecil
mungkin, sebab bila nilai p-nya kecil maka kita yakin bahwa adanya perbedaan
pada hasil penelitian menunjukkan pula adanya perbedaan di populasi. Dengan
kata lain kalau nilai p-nya kecil maka perbedaan yang ada pada penelitian terjadi
bukan karena faktor kebetulan (by chance).
Contoh:
Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan
berat badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa rata-
rata berat badan bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat
badan bayi yang lahir dari ibu yang tidak hipertensi adalah 3000 gram.
Perbedaan berat bayi antara ibu yang hipertensi dengan ibu yang tidak
hipertensi sebesar 100 gram. Pertanyaan yang timbul adalah apakah perbedaan
berat badan bayi tersebut juga berlaku untuk seluruh populasi yang diteliti atau
hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut kemudian
dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p = 0,0110
96
SUTANTO PRIYO HASTONO: Analisis Data
maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat
dari faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena
peluangnya sangat kecil (p=0,0110), maka dapat diartikan bahwa adanya
perbedaan tersebut bukan karena faktor kebetulan namun karena memang
karena adanya riwayat hipetensi.
Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat
- Fisher Exact
- ANOVA
- Regresi
97
SUTANTO PRIYO HASTONO: Analisis Data
Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah
parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan
tekanan darah penduduk dewasa orang kota dengan orang desa. Atau, apakah
ada perbedaan berat badan antar sebelum mengikuti program diet dengan
sesudahnya. Uji statistik yang membandingkan mean dua kelompok data ini
disebut uji beda dua mean. Pendekatan ujinya dapat menggunakan pendekatan
distribusi Z dan distribusi t , sehingga pada uji beda dua mean bisa
menggunakan uji Z atau uji t, namun lebih sering digunakan uji t.
Sebelum kita melakukan uji statistik dua kelompok data, kita perlu
mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok
yang independen atau berasal dari dua kelompok yang
dependen/pasangan. Dikatakan kelompok independen bila data kelompok
yang satu tidak tergantung dari kelopok kedua, misalnya membandingkan mean
tekanan darah sistolik orang desa dengan orang kota. Tekanan darah orang
kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua
kelompok data dikatakan dependen/pasangan bila kelompok data yang
dibandingkan datanya saling mempunyai ketergantungan, misalnya data berat
badan sebelum dan sesudah mengikuti program diet berasal dari orang yang
sama (data sesudah dependen/tergantung dengan data sebelum).
98
SUTANTO PRIYO HASTONO: Analisis Data
Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi
dalam dua kelompok, yaitu: uji beda mean independen (uji T independen) dan
uji beda mean dependen (uji T dependen).
Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua
kelompok data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah
varian kedua kelompok yang diuji sama atau tidak. Bentuk varian kedua
kelompok data akan berpengaruh pada nilai standar error yang akhirnya akan
membedakan rumus pengujiannya.
a. Uji untuk varian sama
Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. uji
Z dapat digunakan bila standar deviasi populasi (σ) diketahui dan jumlah
sampel besar (>30). Apabila kedua syarat tersebut tidak terpenuhi maka
dilakukan uji . pada umumnya nilai σ sulit diketahui, sehingga uji beda dua
mean biasanya menggunakan uji T (T Test). Untuk varian yang sama maka
bentuk ujinya sbb:
X1 – X2
T=
Sp (1/n1) + (1/n2)
99
SUTANTO PRIYO HASTONO: Analisis Data
df = n1 – n2 - 2
Ket :
n1 atau n2 = jumlah sampel kelompok 1 atau 2
S1 atau S2 = standar deviasi sampel kelompok 1 atau 2
b. Uji untuk varian berbeda
X1 – X2
T=
(S12/n1) + (S22/n2)
[(S12/n1) + (S22/n2)]2
df =
[(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]
S12
F=
S22
100
SUTANTO PRIYO HASTONO: Analisis Data
d
T=
S_d / n
101
SUTANTO PRIYO HASTONO: Analisis Data
KASUS:
UJI t INDEPENDEN DAN UJI t DEPENDEN
1. Uji t independen
Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji hubungan
perilaku menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada
perbedaan kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang
menyusuinya tidak eksklusif, caranya:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
3. Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable (s)’I dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’
5. Klik variabel ‘eksklu’ dan masukkan ke kotak‘Grouping Variable’.
6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada contoh ini, kita
102
SUTANTO PRIYO HASTONO: Analisis Data
tahu bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’ untuk Yang
eksklusif. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2”
7. Klik “Continue”
8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
Std. Error
status menyusui asi N Mean Std. Deviation Mean
kadar hb pengukuran tdk EKSKLUSIVE 24 10.421 1.4712 .3003
pertama EKSKLUSIVE 26 10.277 1.3228 .2594
Levene's Test
for Equality of
Variances t-test for Equality of Means
Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan
standar error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb
ibu yang menyusui ekslusif adalah 10,277 gr% dengan standar deviasi 1,322
103
SUTANTO PRIYO HASTONO: Analisis Data
gr%, sedangkan untuk ibu yang menyusui non eksklusif, rata-rata kadar Hb-nya
adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua
uji T, yaitu uji T dengan asumsi varian kedua kelompok sama (equal variances
assumed) dan uji T dengan asumsi varian kedua kelompok tidak sama (equal
variances not assumed). Untuk, memilih uji mana yang kita pakai, dapat dilihat
uji kesamaan varian melalui uji Levene. Lihat nilai p Levene test, nilai p < alpha
(0,05) maka varian berbeda dan bila nilai p > alpha (0,05) maka varian sama
(equal). Pada uji Levene di atas menghasilkan nilai p = 0,790 sehingga dapat
disimpulkan bahwa pada alpha 5%, didapat tidak ada perbedaan varian (varian
kedua kelompok sama). Selanjutnya dicari p value uji t pada bagian varian sama
(equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717 artinya tidak ada
perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui eksklusif
dengan ibu yang menyusui non eksklusif.
Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan
standar deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif
rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
104
SUTANTO PRIYO HASTONO: Analisis Data
Hasil uji statistik didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak
ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui
secara eksklusif dengan non eksklusif.
2. Uji T Dependen
Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji
T dependen sering digunakan pada analisis data penelitian eksperimen. Seperti
sudah dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau
kedua kelompok sampel yang dibandingkan mempunyai subyek yang sama.
Dengan kata lain disebut dependen bila responden diukur dua kali/diteliti dua
kali, sering orang mengatakan penelitian pre dan post. Misalnya kita ingin
membandingkan berat badan antara sebelum dan sesudah mengikuti program
diet.
Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb
pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui
apakah ada perbedaan kadar Hb antara pengukuran pertama dengan
pengukuran kedua. Disini terlihat sampelnya dependen karena orangnya sama
diukur dua kali. Adapun langkahnya:
1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file ini.
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Paired-Samples T Test”
105
SUTANTO PRIYO HASTONO: Analisis Data
3. Klik ‘hb1’
4. Klik ‘hb2’
5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan
6. Klik ‘OK’ hasilnya tampak sbb
T-Test
Std. Error
Mean N Std. Deviation Mean
Pair kadar hb pengukuran
10.346 50 1.3835 .1957
1 pertama
kadar hb pengukuran
10.860 50 1.0558 .1493
kedua
N Correlation Sig.
Pair kadar hb pengukuran
1 pertama & kadar hb 50 .707 .000
pengukuran kedua
Paired Differences
95% Confidence
Std. Std. Interval of the Sig.
Deviati Error Difference (2-taile
Mean on Mean Lower Upper t df d)
Pair kadar hb
1 pengukuran
pertama - kadar -.5140 .9821 .1389 -.7931 -.2349 -3.701 49 .001
hb pengukuran
kedua
106
SUTANTO PRIYO HASTONO: Analisis Data
107
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS HUBUNGAN
UJI ANOVA
Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data
baik yang independen maupun dependen. Namun seringkali kita jumpai jumlah
kelompok yang lebih dari dua, misalnya ingin mengetahui perbedaan mean berat
badan bayi untuk daerah Bekasi, Bogor dan Tangerang. Dalam menganalisis data
seperti ini (> 2 kelompok) sangat tidak dianjurkan menggunakan uji T.
kelemahan menggunakan uji T adalah; pertama kita melakukan uji berulang kali
sesuai kombinasi yang mungkin, kedua, bila melakukan uji T berulang kali akan
meningkatkan (inflasi) nilai α, artinya akan meningkatkan peluang hasil yang
keliru.
Perubahan inflasi α sebesar = 1 – (1-α)n
Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang
tepat) dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji
F.
Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua
sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar kelompok
(between). Bila variasi within dan between sama (nilai perbandingan kedua
varian sama dengan 1) maka mean-mean yang dibandingkan tidak ada
perbedaan, sebaliknya bila hasil perbandingan tersebut menghasilkan lebih dari
1, maka mean yang dibandingkan menunjuk ada perbedaan.
108
SUTANTO PRIYO HASTONO: Analisis Data
Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor
(one way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas
analisis varian satu faktor (one way).
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1. Varian homogen
2. Sampel/kelompok independen
3. Data berdistribusi normal
4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk
katagori yang lebih dari 2 kelompok.
Sb2
F= df = k-1 Æ untuk pembilang
2
Sw
n-k Æ untuk penyebut
109
SUTANTO PRIYO HASTONO: Analisis Data
Xi - Xj
tij =
Sw2[(1/ni) + (1/nj)]
df = n – k
Dengan level of significance (α) sbb:
α
α* =
(k2)
110
SUTANTO PRIYO HASTONO: Analisis Data
Kasus:
UJI ANOVA
Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan
berat badan bayi. Variabel pendidikan merupakan variabel katagorik dengan 4
katagori. Variabel berat bayi berbentuk numerik sehingga uji yang digunakan
ANOVA. Adapun caranya sbb:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul menu
One Way NOVA
3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak
Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik dan kotak
‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada kotak
Dependen diisi variabel “bbbayi” pada kotak Factor diisi variabel “Didik”.
4.
5. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”
111
SUTANTO PRIYO HASTONO: Analisis Data
6. Klik “Continue”
7. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”
8. Klik “Continue”
9. Klik “OK”
Oneway
Descriptives
112
SUTANTO PRIYO HASTONO: Analisis Data
ANOVA
Multiple Comparisons
Dari print out ini diperoleh rata-rata berat bayi dan stndar deviasi masing-masing
kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah
2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang
berpendidikan SMP rata-rata berat bayinya adalah 2727,2 gram dengan standar
deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat
113
SUTANTO PRIYO HASTONO: Analisis Data
bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka
yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan
standar deviasi 386,3 gram.
Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”,
terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005),
berarti pada alpha 5%, dapat disimpulkan ada perbedaan berat bayi diantara
keempat jenjang pendidikan.
Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons Bonferroni”
yang berguna untuk menelusuri lebih lanjut kelompok mana saja yang
berhubungan signifikan. Untuk mengetahui kelompok yang signifikan dapat
terlihat dari kolom Sig. Ternyata kelompok signifikan adalah tingkat pendidikan
SD dengan SMU, SD dengan PT, SMP dengan SMU, SMP dengan PT dan SMU
dengan PT.
114
SUTANTO PRIYO HASTONO: Analisis Data
115
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS HUBUNGAN
Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat
dinyatakan dalam bentuk angka-angka pengukuran (data numerik). Sebaliknya
justru yang kita jumpai adalah data hasil dari menghitung jumlah pengamatan
yang diklasifikasikan atas beberapa katagori. Data seperti ini disebut data
katagorik (kualitatif), misalnya jenis kelamin yang mempunyai katagori: laki-laki
dan perempuan; status merokok yang mempunyai katagori; perokok berat,
perokok ringan dan tidak merokok. Dalam penelitian kesehatan seringkali peneliti
perlu melakukan analisis hubungan variabel katagorik dengan variabel katagorik.
Analisis ii bertujuan untuk menguji perbedaan proporsi dua atau lebih kelompok
sampel. Uji statistik yang digunakan untuk menjawab kasus tersbut adalah UJI
KAI KUADRAT (CHI SQUARE).
Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku
menyusui ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif
antara ibu yang bekerja dengan ibu yang tidak bekerja. Dari contoh terlihat
bahwa variabel jenis pekerjaan (bekerja/tidak bekerja) merupakan variabel
katagorik, dan variabel perilaku menyusui (eksklusif/non eksklusif) juga
merupakan variabel katagorik.
Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita
pahami dengan benar apa itu variabel katagorik. Suatu variabel disebut
katagorik bila isi variabel tersebut terbentuk dari hasil klasifikasi/penggolongan,
misalnya variabel sex, jenis pekerjaan, golongan darah, pendidikan. Di lain
pihakvariabel numerik (misalnya berat badan, umur dll) dapat masuk/dapat
116
SUTANTO PRIYO HASTONO: Analisis Data
E
SUTANTO PRIYO HASTONO: Analisis Data
df = (k-1)(n-1)
ket :
O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan
dalam bentuk tabel silang:
Variabel 2
Variabel 1 Jumlah
Tinggi Rendah
Ya a b a+b
Tidak c d c+d
Jumlah a+c b+d n
N (ad-bc)2
X2 =
(a+c)(b+d)(a+b)(c+d)
118
SUTANTO PRIYO HASTONO: Analisis Data
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang
besar. Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya
digunakan uji kai kuadrat yang sudah dikoreksi (Yate Corrected atau Yate’s
Correction). Formula kai kuadrat Yate’s Correction adalah sbb:
(|O – E| - 0,5)2
2
X =
E
atau
N {|ad-bc|2 – (N/2)]2
X2 =
(a+c)(b+d)(a+b)(c+d)
119
SUTANTO PRIYO HASTONO: Analisis Data
Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak
bisa menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji
Fisher’s Exact.
Pengkodean Variabel :
Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hati-
hati jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada
konsistensi antara variabel independen dengan variabel dependen. Untuk
variabel independen, kelompok yang berisiko/expose diberi kode tinggi (kode
1) dan kode rendah (kode 0)untuk kelompok yang tidak berisiko/non expose.
Pada variabel dependennya, kode tinggi (kode 1) untuk kelompok kasus atau
kelompok yang menjadi fokus pembahasan penelitian dan kode rendah (kode 0)
untuk kelompok non kasus atau yang bukan menjadi fokus penelitian. Sebagai
contoh data di atas pengkodeannya adalah sbb: Ibu tidak bekerja diberi kode 1
120
SUTANTO PRIYO HASTONO: Analisis Data
dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi kode 1 dan
non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus
konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0,
tdk eksklusive =1.
Tabel …
Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan
Total
Pendidikan Rendah Tinggi
N % n % n %
SD 25 50,0 25 50,0 50 34,4
SMP 16 40,0 24 60,0 40 27,6
SMU 10 33,3 20 66,7 30 20,7
PT 5 20,0 20 80,0 25 17,3
Jumlah 56 38,7 89 61,3 145 100,0
121
SUTANTO PRIYO HASTONO: Analisis Data
berpengetahuan tinggi. Dari data ini terlihat ada kecenderungan bahwa semakin
tinggi tingkat pendidikan akan semakin tinggi tingkat pengetahuannya.
Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan
persentasenya berdasarkan variabel dependennya, misalkan terlihat pada tabel
berikut:
Tabel …
Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin
Kanker Paru
Jenis Total
Kasus Kontrol
Kelamin
n % N % n %
Laki-laki 75 75,0 30 30,0 105 52,5
Perempuan 25 25,0 70 70,0 95 47,5
Jumlah 100 50,0 100 50,0 200 100,0
Interpretasinya:
Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden
berjenis kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita
kanker paru, ada sebanyak (30%) responden yang berjenis kelamin laki-laki.
122
SUTANTO PRIYO HASTONO: Analisis Data
KASUS :
UJI KAI KUADRAT
123
SUTANTO PRIYO HASTONO: Analisis Data
5. Klik option “Statistics..”, klik pilihan “Chi Square” dan klik pilihan “Risk”
6. Klik “Continue”
7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”
8. Klik “Continue”
9. Klik “OK” hasilnya tampak sbb:
124
SUTANTO PRIYO HASTONO: Analisis Data
Crosstabs
Chi-Square Tests
Risk Estimate
95% Confidence
Interval
Value Lower Upper
Odds Ratio for status
pekerjaan ibu (TIDAK 5.464 1.627 18.357
KERJA / KERJA)
For cohort status
menyusui asi = YA 2.250 1.209 4.189
EKSKLUSIVE
For cohort status
menyusui asi = .412 .208 .816
TIDAK EKSKLUS
N of Valid Cases 50
125
SUTANTO PRIYO HASTONO: Analisis Data
Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola
menyusui, dengan angka di masing-masing selnya. Angka yang paling atas
adalah jumlah kasus masing-masing sel, angka kedua adalah persentase
menurut baris (data yang kita analisis “ASI.SAV, berasal dari penelitian Cross
Sectional sehingga persen yang ditampilkan adalah persentase baris, namun bila
junis penelitiannya Case Control angka persentase yang digunakan adalah
persentase kolom)
Dari analisis data di atas maka interpretasinya:
Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara
eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui
secara eksklusif.
Hasil uji Chi Square dapat dilihat pada kotak “Chi Square Test”. Dari print
out muncul dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan,
“Angka yang mana yang kita pakai?”, apakah Pearson, Continuity Correction,
Likelihood atau Fisher?”
Aturan yang berlaku pada Chi Square adalah sbb:
a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang
digunakan adalah “Fisher’s Exact Test”
b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya
“Continuity Correction (a)”
c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji
“Pearson Chi Square”
d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya
digunakan untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada
bidang epidemiologi dan juga untuk mengetahui hubungan linier dua variabel
katagorik, sehingga kedua jenis ini jarang digunakan.
Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b
dibawah kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti
pada tabel silang diatas tidak ditemukan ada nilai E < 5
126
SUTANTO PRIYO HASTONO: Analisis Data
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan
koreksi (Continuity Correction) dengan p value dapat dilihat pada kolom
“Asymp. Sig” dan terlihat p valuenya = 0,011. berarti kesimpulannya ada
perbedaan perilaku menyusui eksklusif antara ibu yang bekerja dengan ibu yang
tidak bekerja. Dengan kata lain dapat disimpulkan bahwa ada hubungan status
pekerjaan dengan perilaku menyusui eksklusif.
Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya
hubungan dua variabel, sehingga uji ini tidak dapat untuk mengetahui
derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan
hubungan banyak metodenya tergantung latar belakangdisiplin keilmuannya,
misal untuk ilmu sosial dengan melihat koefisien Phi, koefisien Contingency dan
cramer’s V. sedangkan untuk bidang kesehatan terutama kesehatan masyarakat
digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis penelitian Cross
Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis penelitiannya
Kohort.
Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464
(95% CI: 1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort
yaitu bearnya 2,250 (95% CI: 1,209 – 4,189). Pada data ini berasal dari
penelitian Cross Sectional maka kita dapat menginterpretasikan nialai OR=5,464
sbb: Ibu yang tidak bekerja mempunyai peluang 5,46 kali untuk menyusui
eksklusif dibandingkan ibu yang bekerja.. Pada perintah Crosstab nilai OR akan
keluar bila tabel silang 2 x 2, bila tabel silang lebih dari 2 x 2, misalnya 3 x 2, 4 x
2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi logistik sederhana
dengan cara membuat “Dummy variable”
127
SUTANTO PRIYO HASTONO: Analisis Data
128
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS HUBUNGAN
1. Korelasi
Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan,
korelasi dapat juga untuk mengetahui arah hubungan dua variabel numerik.
Misalnya, apakah huubungan berat badan dan tekanan darah mempunyai derajat
yang kuat atau lemah, dan juga apakah kedua variabel tersebut berpola positif
atau negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat
dari diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang
menunjukkan titik-titik perpotongan nilai data dari dua variabel (X dan Y). Pada
umumnya dalam grafik, variabel independen (X) diletakkan pada garis horizontal
sedangkan variabel dependen (Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan
antara dua variabel X dan Y. selain memberi informasi pola hubungan dari kedua
129
SUTANTO PRIYO HASTONO: Analisis Data
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya
antara –1 s.d. +1.
r = 0 Æ tidak ada hubungan linier
r = -1 Æ hubungan linier negatif sempurna
r = +1 Æ hubungan linier positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan
positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya
semakin bertambah berat badannya (semakin gemuk) semakin tinggi tekanan
darahnya. Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel
diikuti penurunan variabel yang lain, misalnya semakin bertambah umur
(semakin tua) semakin rendah kadar Hb-nya.
130
SUTANTO PRIYO HASTONO: Analisis Data
Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama
untuk menjelaskan derajat hubungan derajat hubungan linier anatara dua
variabel. Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah
hubungan antara dua variabelteradi secara signifikan atau hanya karena faktor
kebetulan dari random sample (by chance). Uji hipotesis dapat dilakukan dengan
dua cara, yaitu pertama: membandingkan nilai r hitung dengan r tabel, kedua:
menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita
gunakan pendekatan distribusi t, dengan formula:
n–2
t=r
1 – r2
df = n – 2
n = jumlah sampel
131
SUTANTO PRIYO HASTONO: Analisis Data
analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu variabel
(variabel dependen) melalui variabel yang lain (variabel independen).
Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat
badan dan tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel
independen dan tekanan darah sebagai variabel dependen, sehingga dengan
regresi kita dapat memperkirakan besarnya nilai tekanan darah bila diketahui
data berat badan.
Untuk melakukan prediksi digunakan persamaan garis yang dapat
diperoleh dengan berbagai cara/metode. Salah satu cara yang sering digunakan
oleh peneliti adalah dengan menggunakan metode kuadrat terkecil (least
square). Metode least square merupakan suatu metode pembuatan garis regresi
dengan cara meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati
dan Y yang diramalkan oleh garis regresi itu. Secara matematis persamaan garis
sbb:
Y = a + bx
Persamaan di atas merupakan model deterministik yang secara sempurna/tepat
dapat digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi,
yang ditemukan oleh Issac Newton adalah contoh model deterministik. Variabel
kecepatan benda jatuh (variabel dependen) pada keadaan yang ideal adalah
fungsi matematik sempurna (bebas dari kesalahan) dari variabel independen
berat beda dan gaya gravitasi.
Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius
dapat dibuat persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat
dihitung/diprediksi secara sempurna/tepat (bebas kesalahan) bila suhu Celcius
(X) diketahui.
Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada
kemungkinan kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa
nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya
hubungan berat badan dengan tekanan darah, tidak setiap orang yang berat
badannya sama memiliki tekanan darah yang sama. Oleh karena hubungan X
132
Y = a + bx + e
SUTANTO PRIYO HASTONO: Analisis Data
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X
berubah satu unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati
dengan nilai Y yang sesungguhnya pada titik X tertentu
ΣXY – (ΣXΣY)/n
b= a = Y - bX
ΣX2 – (ΣX)2/n
134
SUTANTO PRIYO HASTONO: Analisis Data
KASUS :
KORELASI DAN REGRESI
135
SUTANTO PRIYO HASTONO: Analisis Data
Correlations
Correlations
berat berat
badan ibu badan bayi
berat badan ibu Pearson Correlation 1 .684**
Sig. (2-tailed) .000
N 50 50
berat badan bayi Pearson Correlation .684** 1
Sig. (2-tailed) .000
N 50 50
**. Correlation is significant at the 0.01 level (2-tailed).
contoh ini berarti berat badan bayi) dan pada kotak Independent isikan
variabel independennnya (dalam contoh ini berarti berat badan ibu), caranya
4. klik ‘berat badan bayi’, masukkan ke kotak Dependent
5. Klik ‘berat badan ibu’, masukkan ke kotak Independent
Regression
Model Summary
137
SUTANTO PRIYO HASTONO: Analisis Data
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 7820262 1 7820261.965 42.154 .000a
Residual 8904738 48 185515.376
Total 16725000 49
a. Predictors: (Constant), berat badan ibu
b. Dependent Variable: berat badan bayi
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 657.929 391.676 1.680 .099
berat badan ibu 44.383 6.836 .684 6.493 .000
a. Dependent Variable: berat badan bayi
Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu
nilai berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada
kolom Sig T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak
138
SUTANTO PRIYO HASTONO: Analisis Data
hipotesis nol, berarti ada hubngan linier antara berat badan ibu dengan berat
badan bayi. Dari nilai b=44,38 berarti bahwa variabel berat badan bayi akan
bertambah sebesar 44,38 gr bila berat badan ibu bertambah setiap satu
kilogram.
Tabel …
Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi
Variabel R R2 Persamaan garis P value
Umur 0,684 0,468 bbayi =657,93 + 44,38*bbibu 0,0005
Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan
kuat (r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu
semakin besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468
artinya , persamaan garis regresi yang kita peroleh dapat menerangkan 46,8,6%
variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk
menjelaskan variabel berat badan bayi. Hasil uji statistik didapatkan ada
hubungan yang signifikan antara berat badan ibu dengan berat badan bayi
(p=0,005).
139
SUTANTO PRIYO HASTONO: Analisis Data
Ingat prediksi regresi tidak dapat menghasil;kan angka yang tepat seperti di
atas, namun perkiraannya tergantung dari nilai ‘Std, Error of The estimate’(SEE)
yang besarnya adalah 430,715 (lihat di kotak Model Summary). Dengan
demikianvariasi variabel dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan
tingkat kepercyaan 95% dan didapat nilai Z = 1,96, sehingga variasinya 1,96 *
430,715 = ± 844,201
Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg
diprediksikan berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr
140
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS MULTIVARIAT
11
Proses analisis multivariat dengan menghubungkan beberapa variabel
independen dengan satu variabel dependen pada waktu yang bersamaan.
Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya
jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal
diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka
diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden.
Dari analisis multivariat kita dapat mengetahui:
a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel
dependen?
b. Apakah variabel independen berhubungan dengan variabel dependen
dipengaruhi variabel lain atau tidak?
c. Bentuk hubungan beberapa variabel independen dengan variabel dependen,
apakah berhubungan langsung atau pengeruh tidak langsung.
Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori
atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis
statistik yang dapat digunakan untuk analisis multivariat:
141
SUTANTO PRIYO HASTONO: Analisis Data
142
SUTANTO PRIYO HASTONO: Analisis Data
ANALISIS
Analisis Multiple regression Linear atau sering disebut juga analisis regresi
linier ganda merupakan perluasan analiss Simple Linear Regression (regresi linier
sederhana). Dalam analisis Simple Linear Regression hanya ada satu variabel
independen (variabel bebas) dihubungkan dengan satu variabel dependen
(terikat).. Sedangkan pada Multiple regression Linear merupakan analisis
hubugan antara beberapa variabel independen dengan satu variabel dependen.
Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan tekanan
darah, dilakukan analisis dengan melibatkan variabel independen: umur, berat
badan, dan jenis kelamin.
Dalam regresi linier ganda variabel dependennya harus numerik
sedangkan variabel independen boleh semuanya numerik dan boleh juga
campuran numerik dan katagorik. Model persamaan regresi linier ganda
merupakan perluasan regresi linier sederhana, yaitu:
143
SUTANTO PRIYO HASTONO: Analisis Data
144
SUTANTO PRIYO HASTONO: Analisis Data
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
145
SUTANTO PRIYO HASTONO: Analisis Data
3. Pemodelan
Satu hal yang penting dalam regresi ganda adalah bagaimana memilih
variabel independen sehingga terbentuk sebuah model yang paling sesuai
menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam
(populasi).
Dalam pembuatan model seringkali dijumpai pandangan yang kurang
tepat yaitu “memasukkan semua/sebanyak mungkin variabel independen ke
dalam model”. Alasannya, dengan memasukkan sebanyak mungkin variabel
independen ke dalam model, maka variabel dependen diharapkan diprediksi
dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak
selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel
dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang
tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping
itu, model dengan banyak variabel seringkali malah menyulitkan dalam
interpretasi.
Berdasarkanpertimbangan tersebut pemilihan variabel independen
hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang
dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk
dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk
menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen.
Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk
dalam model, salah satu kriteria yang sering digunakan adalah melihat
perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena
setiap penambahan satu variabel independen akan meningkatkan R2 walaupun
variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan
adalah model dengan nilai R2 yang besar namun variabel independennya dengan
jumlah sedikit.
Berikut langkah-langkah dalam pemodelan regresi linier ganda:
1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat
model. Masing-masing variabel independen dihubungkan dengan variabel
146
SUTANTO PRIYO HASTONO: Analisis Data
dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka
variabel tersebut masuk dalam model multivariat. Untuk variabel yang p
value-nya > 0,25 namun secara substansi penting, maka variabel tersebut
dapat masuk ke multivariat.
2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk
dalam model. Ada beberapa metode untuk melakukan pemilihan variabel
independen dalam analisis multivariat regresi linier ganda, yaitu:
a). ENTER, memasukkan semua variabel independen dengan serentak satu
langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode ini
yang tepat/sering digunakan, karena dalam pemodelan kita dapat
melakukan pertimbangan aspek substansi.
b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian
variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke
dalam model, sampai semua variabel yang memenuhi kriteria tersebut
masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel
yang mempunyai korelasi parsial terbesar dengan variabel dependen dan
yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi
parsial adalah adalah korelasi antara variabel independen dengan
dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005
artinya variabel yang dapat masuk model bila variabel tersebut
mempunyai nilai P lebih kecil atau sama dengan 0,05.
c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi
kemudian satu persatu variabel independen dikeluarkan dari model
berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali
dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil
dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah
0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama
dengan 0,10 dikeluarkan dari model.
d). STEPWISE, model ini merupakan kombinasi antara metode backward dan
Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa
147
SUTANTO PRIYO HASTONO: Analisis Data
5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek
reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok.
Untuk masing-masing sampel dibuat model dengan variabel yang sama,
148
SUTANTO PRIYO HASTONO: Analisis Data
149
SUTANTO PRIYO HASTONO: Analisis Data
KASUS:
REGRESI LINIER GANDA
Sebagai latihan kita melakukan analisis penelitian “faktor-faktor yang
berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV.
Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur
ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami
prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya
berat badan bayi (BWT).
Kode variabel pada file data : LBW.SAV
Nama Definisi Operasional Hasil Ukur
Id Nomor Identitas
Low Kondisi bayi dalam klasifikasi BBLR 0 = ≥ 2500 g
1 = < 2500 g
Age Umur ibu tahun
Lwt Berat ibu pada saat menstruasi terakhir pounds
Race Suku bangsa/ras 1= putih
2= hitam
3 = lainnya
Smoke Kebiasaan merokok selama hamil 0 = tidak
1 = ya
Ptl Riwayat mengalami prematur 0 = tidak
1 = ya
Ht Riwayat menderita hipertensi 0 = tidak
1 = ya
Ui Terjadi/mengalami iritability Uterine 0 = tidak
1 = ya
Ftv Frekuensi periksa hamil pada trimester pertama 0 ,1, 2 dst..
Bwt Berat badan bayi gram
150
SUTANTO PRIYO HASTONO: Analisis Data
151
SUTANTO PRIYO HASTONO: Analisis Data
Correlations
No
Weight of physician History of Birth
Age of mother visits in first prematur weight
mother (pounds) trimester e labor (gram)
Age of mother Pearson Correlation 1 .180* .215** .072 .090
Sig. (2-tailed) .013 .003 .328 .219
N 189 189 189 189 189
Weight of mother Pearson Correlation .180* 1 .141 -.140 .186*
(pounds) Sig. (2-tailed) .013 .054 .055 .010
N 189 189 189 189 189
No physician visits Pearson Correlation .215** .141 1 -.044 .058
in first trimester Sig. (2-tailed) .003 .054 .544 .426
N
189 189 189 189 189
152
SUTANTO PRIYO HASTONO: Analisis Data
Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel
umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi
prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur,
berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan
demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat.
Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu
p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena
secara substansi frekuensi anc merupakan faktor yang sangat penting
mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan
dalam analisis multivariat.
153
SUTANTO PRIYO HASTONO: Analisis Data
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak merokok dan kode ‘1’ untuk Yang merokok. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
9. Klik “Continue”
10. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
Std. Error
Smoking status N Mean Std. Deviation Mean
Birth weight (gram) No 115 3054.96 752.409 70.163
Yes 74 2773.24 660.075 76.732
154
SUTANTO PRIYO HASTONO: Analisis Data
Levene's Test
for Equality of
Variances t-test for Equality of Means
95% Confidence
Sig. Mean Std. Error Interval of the
(2-tail Differen Differenc Difference
F Sig. t df ed) ce e Lower Upper
Birth Equal
weight variances 1.508 .221 2.634 187 .009 281.713 106.969 70.693 492.7
(gram) assumed
Equal
variances
2.709 170.0 .007 281.713 103.974 76.467 487.0
not
assumed
2. Riwayat Hipertensi
Langkahnya:
1.Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
2.Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable’ dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’
4.Klik variabel ‘ht’ dan masukkan ke kotak‘Grouping Variable’. (variabel yang
sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan
155
SUTANTO PRIYO HASTONO: Analisis Data
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
6.Klik “Continue”
7.Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
Group Statistics
Std. Error
History of hypertension N Mean Std. Deviation Mean
Birth weight (gram) No 177 2972.31 709.226 53.309
Yes 12 2536.75 917.341 264.813
156
SUTANTO PRIYO HASTONO: Analisis Data
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan
berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga
variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat
157
SUTANTO PRIYO HASTONO: Analisis Data
Regression
Model Summary
158
SUTANTO PRIYO HASTONO: Analisis Data
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 11543236 6 1923872.611 3.962 .001a
Residual 88373817 182 485570.423
Total 99917053 188
a. Predictors: (Constant), No physician visits in first trimester, Smoking status, History
of hypertension, History of premature labor, Age of mother, Weight of mother
(pounds)
b. Dependent Variable: Birth weight (gram)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2315.862 299.442 7.734 .000
Age of mother 7.162 10.022 .052 .715 .476
Weight of mother
4.793 1.777 .201 2.698 .008
(pounds)
Smoking status -232.253 105.928 -.156 -2.193 .030
History of premature labor -154.002 106.574 -.104 -1.445 .150
History of hypertension -574.230 215.481 -.193 -2.665 .008
No physician visits in first
-2.847 49.705 -.004 -.057 .954
trimester
a. Dependent Variable: Birth weight (gram)
Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya
keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar
11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik
(lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi
secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus
yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di
cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model.
Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3
variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur
(history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap
berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel
dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba
keluarkan adalah frekuensi anc(No physician..).
159
SUTANTO PRIYO HASTONO: Analisis Data
Langkahnya:
1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan
biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel,
namun sekarang anda harus keluarkan variabel ‘no physician’ dan
masukkan ke kotak Variable di sebelah kiri.
3. Klik OK, dan hasilnya sbb:
Model Summary
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2317.608 297.074 7.801 .000
Age of mother 7.051 9.807 .051 .719 .473
Weight of mother
4.781 1.759 .201 2.718 .007
(pounds)
Smoking status -232.224 105.638 -.156 -2.198 .029
History of premature labor -153.747 106.191 -.104 -1.448 .149
History of hypertension -573.011 213.841 -.192 -2.680 .008
a. Dependent Variable: Birth weight (gram)
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah
dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square
dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi
dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R
Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk
coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
160
SUTANTO PRIYO HASTONO: Analisis Data
berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum
dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Model Summary
161
SUTANTO PRIYO HASTONO: Analisis Data
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026
History of premature labor -145.412 105.417 -.098 -1.379 .169
History of hypertension -582.566 213.148 -.195 -2.733 .007
a. Dependent Variable: Birth weight (gram)
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %,
dengan demikian variabel umur kita keluarkan dari model.
162
SUTANTO PRIYO HASTONO: Analisis Data
Model Summary
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2390.105 230.391 10.374 .000
Weight of mother
5.352 1.710 .224 3.130 .002
(pounds)
Smoking status -263.009 103.812 -.177 -2.534 .012
History of hypertension -586.722 213.646 -.197 -2.746 .007
a. Dependent Variable: Birth weight (gram)
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan
perubahan Coef. B dapat dilihat sbb:
163
SUTANTO PRIYO HASTONO: Analisis Data
Model Summaryb
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
164
SUTANTO PRIYO HASTONO: Analisis Data
7. Klik Continue
165
SUTANTO PRIYO HASTONO: Analisis Data
166
SUTANTO PRIYO HASTONO: Analisis Data
Residuals Statisticsa
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan
standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi
b. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai
dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk
mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin
Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Model Summaryb
Dari hasil uji didapatkan koefisien Durbin Watson 0,222, berarti asumsi
independensi terpenuhi.
167
SUTANTO PRIYO HASTONO: Analisis Data
c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X1, X2, X3, …, Xk terletak
pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)
bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil
uji asumsi :
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 11291987 4 2822996.778 5.861 .000a
Residual 88625066 184 481657.965
Total 99917053 188
a. Predictors: (Constant), History of premature labor, History of hypertension, Smoking
status, Weight of mother (pounds)
b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas
terpenuhi
d. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity
dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran
tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka
dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi
homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola
tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka
diduga variannya terjadi heteroscedasticity.
168
SUTANTO PRIYO HASTONO: Analisis Data
Scatterplot
3
Regression Studentized Residual
-1
-2
-3
-4
-3 -2 -1 0 1 2 3
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara
titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi
homoscedasity terpenuhi
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
169
SUTANTO PRIYO HASTONO: Analisis Data
Histogram
40
30
Frequency
20
10
Mean = -2.53E-16
Std. Dev. = 0.989
0 N = 189
-4 -3 -2 -1 0 1 2 3
170
SUTANTO PRIYO HASTONO: Analisis Data
0.8
Expected Cum Prob
0.6
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk
distribusinya normal, berarti asumsi normality terpenuhi.
f.Diagostik Multicollinearity
Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi
secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari
nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka
mengindikasikan telah terjadi collinearity.
171
SUTANTO PRIYO HASTONO: Analisis Data
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian
tidak ada Multicollinearity antara sesama variabel indepeden
Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi
sehingga model dapat digunakan untuk memprediksi berat badan bayi.
172
SUTANTO PRIYO HASTONO: Analisis Data
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Interpretasi model:
173
SUTANTO PRIYO HASTONO: Analisis Data
Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi
dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun
arti koef. B untuk masing-masing variabel adalah sbb:
- Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi
akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi
dan prematur
- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4
gram setelah dikontrol variabel berat badan, hipertensi dan prematur.
- Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah
sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok
dan prematur.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar
peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat
badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap
variabel dependennya. Pada hasil di atas berarti variabel yang paling besar
pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
174
SUTANTO PRIYO HASTONO: Analisis Data
REGRESI LOGISTIK
13
Berbeda dengan regresi linier yang variabel dependennya numerik,
regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu
variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus,
artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak
puas dll).
A. REGRESI LOGISTIK SEDERHANA
1. Pendahuluan
Analisis regresi logistik adalah salah satu pendekatan model matematis
yang digunakan untuk menganalisis hubungan satu atau beberapa variabel
independen dengan sebuah variabel dependen katagorik yang bersifat
dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal,
merokok dan tidak merokok, dan lain-lain
Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis
variabel dependennya. Regresi linear digunakan apabila variabel dependennya
numerik , sedangkan regresi logistik diogunakan pada data yang dependennya
berbentuk katagorik yang dikotom.
Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh
analisis penelitian yang mempelajari hubungan antara variabel umur dengan
kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang
sampel, didapatkan hasil :
No 1 2 3 4 5 6 7 8 9 10 11 … … 100
Umur 20 22 23 24 25 27 28 29 30 32 33 … … 70
PJK 0 0 1 0 0 1 0 1 1 0 0 … … 1
175
SUTANTO PRIYO HASTONO: Analisis Data
Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian
jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan
diberi kode 0 bila mereka tiodak menderita PJK.
Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier,
misalnya dibuat penyajian dalam bentuk diagram tebar (Scatter Plot), maka
hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua
garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian
penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda.
Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel
dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu
menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan
kejadian PJK.
176
SUTANTO PRIYO HASTONO: Analisis Data
PJK Proporsi
Umur Jumlah
Tidak Ya Kejadian
20 – 29 10 9 1 0,10
30 – 34 15 13 2 0,13
35 – 39 12 9 3 0,25
40 – 44 15 10 5 0,33
45 – 49 13 7 6 0,46
50 – 54 8 3 5 0,63
55 – 59 17 4 13 0,76
60 – 69 10 2 8 0,80
Total 100 57 43 0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada
kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut
dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara
proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang
landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut
menyerupai huruf S.
Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara
untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada
177
SUTANTO PRIYO HASTONO: Analisis Data
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita
ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel
dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut
sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai
dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan
berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka
untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata
(mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai
E(Y/x) akan berkisar antara 0 s.d ∞ (0 ≤ E(Y/x) ≤ ∞).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada
sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh
karena pada regresi logistik dependennya adalah dikotom maka variabel
dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti
pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk
mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian
PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu
berada antara nol dan satu (0 ≤ E(Y/x) ≤ 1).
2. Model Logistik
f(z) = 1 .
1 + e-z
178
SUTANTO PRIYO HASTONO: Analisis Data
-∞ 0 +∞
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada
regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang
variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk
huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur
pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang
pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian
seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada
ketinggian tertentu garisnya akan mendatar mendekati nilai 1.
Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu
probabilitas kejadian pada dependen yang dikotom maka model regresi logistik
adalah pilihan yang tepat.
3. Model Logistik
Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan
penjumlahan linear konstanta (α) ditambah dengan β1X1, ditambah β2X2 dan
seterusnya sampai βiXi. Variabel X adalah variabel Independen.
179
SUTANTO PRIYO HASTONO: Analisis Data
f(z) = 1 .
1 + e-(α + β1X1 + β2X2 + … + βiXi)
4. Contoh Kasus
Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari
mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama
vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama
variabel KAT).
Pemberian kode nilai variabel adalah sbb:
Untuk variabel PJK Æ 1 = timbul penyakit jantung koroner
0 = tidak ada penyakit jantung koroner
Untuk variabel KAT Æ 1 = kadar katekolamin darah tinggi
0 = kadar katekolamin darah rendah
Pertanyaan:
a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko
untuk terjadi PJK?
b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko
untuk terjadi PJK?
c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya
tinggi dengan yang kadar katekolaminnya rendah?
Jawab:
Dengan model regresi logistik maka pada soal tersebut modelnya adalah:
f(z) = 1 .
1 + e-z
180
SUTANTO PRIYO HASTONO: Analisis Data
P(X) = 1 .
1 + e-z
Bila Z = α + β1KAT, maka modelnya :
P(X) = 1 .
1 + e-α + β1KAT
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb:
α = -3,911 dan β1 = 0,652, maka:
P(X) = 1 .
1 + e-(-3,911 + 0,652KAT)
Dari model tersebut coba kita jawab pertanyaan di atas:
a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi.
Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai
KAT=1 pada model di atas, hasilnya:
P(X) = 1 . = 0,037 atau sekitar 4%
1 + e-(-3,911 + 0,652*1)
jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up.
b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah
Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai
KAT=0 pada model di atas, hasilnya:
P(X) = 1 . = 0,019 atau sekitar 2%
1 + e-(-3,911 + 0,652*0)
jadi mereka/individu yang kadar katekolaminnya rendah dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up.
c. Besar risiko kedua kelompok tersebut
P1(X) = 0,037 = 1,947 = 2,0
P0(X) 0,019
Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh
secara direk. Arti dari angka di atas adalah mereka yang kaadar
181
SUTANTO PRIYO HASTONO: Analisis Data
katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi
dibandingkan mereka yang kadar katekolaminnya rendah.
Model regresi logistik dapat digunakan pada data yang dikumpulkan
melalui rancangan kohort, case control maupun cross sectional.
Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko
individual. Sedangkan pada rancangan case control dan cross sectional tidak
dapat digunakan untuk menghitung risiko individual karena β0 pada rancangan
ini tidak sahih. Nilai β0 dapat dihitung/diestimasi bila sampling fraction populasi
yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket:
sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit).
Namun dengan memperlakukan rancangan case control dan cross sectional
sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan
perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan
perhitungan eksponensial β dari persamaan garis regresi logistik.
P(X) = 1 .
-(α + β1X1 + β2X2 + … + βiXi
1+e
182
SUTANTO PRIYO HASTONO: Analisis Data
X1
X2 Y
X3
X4
Prosedur pemodelan:
Agar diperoleh model regresi yang hemat dan mampu menjelaskan
hubungan variabel independen dan independen dalam populasi, diperlukan
prosedur pemilihan variabel sbb:
1). Melakukan analisis bivariat antara masing-masing variabel independen
dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p <
0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa
saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara
substansi penting.
183
SUTANTO PRIYO HASTONO: Analisis Data
2). Memilih variabel yang dianggap penting yang masuk dalam model,
dengan cara mempertahankan variabel yang mempunyai p value < 0,05
dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel
tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara
bertahap dimulai dari variabel yang mempunyai p value terbesar.
3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan
apakah variabel numerik dijadikan variabel katagorik atau tetap variabel
numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4
kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik
dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok
menunjukkan bentuk garis lurus, maka variabel numerik dapat
dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka
dapat dipertimbangkan dirubah dalam bentuk katagorik.
4). Setelah memperoleh model yang memuat variabel-variabel penting, maka
langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke
dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan
logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik.
Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting
dimasukkan dalam model.
X2
X3
X4
184
SUTANTO PRIYO HASTONO: Analisis Data
Tahapan pemodelan:
1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat
konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama
dengan semua variabel konfonding).
2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi
yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara
berurutan satu per satu dari nilai p Wald yang terbesar.
3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel
kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald
terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel
utama antara sebelum dan sesudahvariabel kovariat (X1) dikeluarkan lebih
besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding
dan harus tetap berada dalam model.
185
SUTANTO PRIYO HASTONO: Analisis Data
KASUS I :
REGRESI LOGISTIK MODEL PREDIKSI
Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS
(race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA
HAMIL (ftv) dengan BBLR (low).
Adapun langkahnya:
A. SELEKSI BIVARIAT
Masing-masing variabel independen dilakukan analisis bivariat dengan variabel
dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel
tersebut langsung masuk tahap multivariat. Untuk variabel independen yang
hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting,
maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi
bivariat menggunakan uji regresi logistik sederhana.
186
SUTANTO PRIYO HASTONO: Analisis Data
Chi-square df Sig.
Step 1 Step 2.760 1 .097
Block 2.760 1 .097
Model 2.760 1 .097
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
age -.051 .032 2.635 1 .105 .950 .893 1.011
1 Const
.385 .732 .276 1 .599 1.469
ant
a. Variable(s) entered on step 1: age.
187
SUTANTO PRIYO HASTONO: Analisis Data
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada
bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25
sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan
SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI:
0,89-1,01)
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis
katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras
188
SUTANTO PRIYO HASTONO: Analisis Data
putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari
kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada
bagian Reference category, lalu klik Change, dan tampilannya:
Parameter coding
Frequency (1) (2)
Race White 96 .000 .000
Black 26 1.000 .000
Other 67 .000 1.000
Chi-square df Sig.
Step 1 Step 5.010 2 .082
Block 5.010 2 .082
Model 5.010 2 .082
189
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea race 4.922 2 .085
p1 race(1) .845 .463 3.323 1 .068 2.328 .939 5.772
race(2) .636 .348 3.345 1 .067 1.889 .955 3.736
Constant -1.155 .239 23.330 1 .000 .315
a. Variable(s) entered on step 1: race.
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras
dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy,
terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam
akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit
putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai
risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih.
Chi-square df Sig.
Step 1 Step 4.022 1 .045
Block 4.022 1 .045
Model 4.022 1 .045
190
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
ht 1.214 .608 3.979 1 .046 3.365 1.021 11.088
1 Constant -.877 .165 28.249 1 .000 .416
a. Variable(s) entered on step 1: ht.
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam
multivariat
4. Analisis bivariat antara “kelainan uterus” dengan “bblr”
7. Pilih “Analyze”
8. Pilih “Regression”
9. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak
Dependent dan kotak Covariates.
10. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates
isikan “ui”. Klik OK, Tampilannya sbb:
Chi-square df Sig.
Step 1 Step 5.076 1 .024
Block 5.076 1 .024
Model 5.076 1 .024
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
ui .947 .417 5.162 1 .023 2.578 1.139 5.834
1 Constant -.947 .176 29.072 1 .000 .388
a. Variable(s) entered on step 1: ui.
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat
lanjut ke multivariat
191
SUTANTO PRIYO HASTONO: Analisis Data
Chi-square df Sig.
Step 1 Step .773 1 .379
Block .773 1 .379
Model .773 1 .379
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak
dapat lanjut ke multivariat, namun karena secara substansi variabel periksa
hamil sangat penting, maka variabel ini dapat dianalisis multivariat.
Chi-square df Sig.
Step 1 Step 4.867 1 .027
Block 4.867 1 .027
Model 4.867 1 .027
192
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
smoke .704 .320 4.852 1 .028 2.022 1.081 3.783
1 Constant -1.087 .215 25.627 1 .000 .337
a. Variable(s) entered on step 1: smoke.
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian
variabel merokok dapat masuk ke multivariat.
Chi-square df Sig.
Step 1 Step 6.779 1 .009
Block 6.779 1 .009
Model 6.779 1 .009
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
ptl .802 .317 6.391 1 .011 2.230 1.197 4.151
1 Constant -.964 .175 30.370 1 .000 .381
a. Variable(s) entered on step 1: ptl.
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel
riwayat adanya prematur dapat masuk ke multivariat
193
SUTANTO PRIYO HASTONO: Analisis Data
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa
hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis
multivariat oleh karena secara substansi periksa hamil merupakan variabel yang
sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT
Selanjutnya dilakukan analisis multivariat keenam variabel tersebut
dengan kejadian bblr.
1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel
dependen.
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy.
5. Klik Option, pilih ‘CI for exp(B)’
6. Klik ‘Continue’
194
SUTANTO PRIYO HASTONO: Analisis Data
7. Kilik ‘OK’
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
age -.041 .036 1.249 1 .264 .960 .894 1.031
1 race 6.783 2 .034
race(1) 1.009 .502 4.034 1 .045 2.743 1.025 7.345
race(2) 1.003 .426 5.560 1 .018 2.727 1.185 6.280
smoke .964 .391 6.090 1 .014 2.622 1.219 5.639
ptl .630 .340 3.429 1 .064 1.877 .964 3.654
ht 1.361 .631 4.648 1 .031 3.902 1.132 13.451
ui .802 .458 3.066 1 .080 2.229 .909 5.468
ftv .009 .161 .003 1 .954 1.009 .736 1.384
Constant -1.183 .919 1.659 1 .198 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui
dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv
dikeluarkan dari model.
195
SUTANTO PRIYO HASTONO: Analisis Data
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
age -.040 .036 1.275 1 .259 .960 .896 1.030
1 race 6.781 2 .034
race(1) 1.009 .503 4.035 1 .045 2.744 1.025 7.347
race(2) 1.002 .425 5.562 1 .018 2.723 1.184 6.262
smoke .963 .390 6.086 1 .014 2.620 1.219 5.632
ptl .629 .340 3.423 1 .064 1.875 .963 3.651
ht 1.358 .629 4.663 1 .031 3.889 1.134 13.341
ui .800 .457 3.063 1 .080 2.226 .908 5.454
Constant -1.184 .919 1.661 1 .197 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race,
smoke, ptl, ht, dan ui.
Variabel OR ftv ada OR ftv tak ada perubahan OR
Age 0.960 0.960 0%
Race(1) 2.743 2.744 0%
Race(2) 2.727 2.723 0%
Smoke 2.622 2.620 0%
Ptl 1.877 1.875 0,1 %
Ht 3.902 3.889 0.3 %
ui 2.229 2.226 0,1 %
ftv 1.009
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian
dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah
umur, dengan demikian dikelurkan dar model dan hasilnya
Hasilnyanya :
196
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel
yang masih aktif di model.
Variabel OR age ada OR age tak ada perubahan OR
Age 0.960 -
Race(1) 2.743 2.968 8,2 %
Race(2) 2.727 2.883 5,7 %
Smoke 2.622 2.694 2,7 %
Ptl 1.877 1.779 5,2 %
Ht 3.902 3.912 0.3 %
ui 2.229 2.350 5,4 %
ftv 1.009
197
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
race 8.245 2 .016
1 race(1) 1.064 .499 4.545 1 .033 2.897 1.090 7.704
race(2) 1.083 .413 6.877 1 .009 2.955 1.315 6.640
smoke 1.094 .380 8.299 1 .004 2.986 1.419 6.286
ht 1.359 .630 4.660 1 .031 3.894 1.133 13.379
ui 1.006 .438 5.262 1 .022 2.734 1.158 6.458
Constant -2.092 .380 30.307 1 .000 .123
a. Variable(s) entered on step 1: race, smoke, ht, ui.
Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan
hasilnya sbb:
198
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
race 8.286 2 .016
1 race(1) 1.062 .500 4.513 1 .034 2.894 1.086 7.712
race(2) 1.085 .411 6.949 1 .008 2.958 1.321 6.626
smoke .996 .382 6.794 1 .009 2.707 1.280 5.726
ht 1.221 .629 3.764 1 .052 3.390 .988 11.640
ptl .696 .325 4.596 1 .032 2.007 1.062 3.793
Constant -2.025 .372 29.586 1 .000 .132
a. Variable(s) entered on step 1: race, smoke, ht, ptl.
199
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
C. UJI INTERAKSI
Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi,
kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus
sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi.
Langkahnya:
1. klik analysis, klik regression, klik binary ogistik
2. Kotak dependen isikan low
3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui
4. Klik tombol Next
5. isikan : smoke*ht ke kotak kovariat
6. klik OK
Chi-
square df Sig.
Step 1 Step .000 1 .994
Block .000 1 .994
Model 26.560 7 .000
200
SUTANTO PRIYO HASTONO: Analisis Data
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
race 7.900 2 .019
1 race(1) 1.088 .502 4.692 1 .030 2.969 1.109 7.946
race(2) 1.059 .419 6.387 1 .011 2.883 1.268 6.555
smoke .990 .397 6.211 1 .013 2.692 1.236 5.865
ptl .576 .336 2.937 1 .087 1.779 .921 3.438
ht 1.360 .831 2.680 1 .102 3.896 .765 19.852
ui .854 .451 3.584 1 .058 2.350 .970 5.693
ht by smoke .010 1.283 .000 1 .994 1.010 .082 12.491
Constant -2.146 .386 30.875 1 .000 .117
a. Variable(s) entered on step 1: ht * smoke .
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa
ada interaksi:
MODEL TERAKHIR
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
201
SUTANTO PRIYO HASTONO: Analisis Data
Interpretasi:
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat
Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
control, interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B)
pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka
nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada model.
Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan
kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel
riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis
didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang
menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi
dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race,
merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk
variabel yang lain.
202
SUTANTO PRIYO HASTONO: Analisis Data
KASUS KEDUA :
REGRESI LOGISTIK MODEL FAKTOR RISIKO
Tujuan analisis :
Untuk mengetahui hubungan pekerjaan dengan menyusui eksklusive
Variabel independen utama : Pkerjaan
Variabel dependen : Eksklusive
Variabel konfounding : umur, berat badan ibu dan sikap
A. Langkah pertama: menyusun model mencakup semua variabel dan variabel
interaksi
Cara
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
Covariat. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai
dependen (dalam contoh ini berarti eksklu) dan pada kotak Covariat isikan
variabel independen utama beserta variabel konfounding dan interaksinya
(dalam hal ini berarti: kerja, umur1, bbibu, sikap, kerja*umur1,kerja*bbibu,
kerja*sikap)
4. Klik ‘OK’, dan hasilnya sbb:
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea kerja -20.275 28420.722 .000 1 .999 .000 .000 .
p1 umur1 1.681 1.197 1.972 1 .160 5.372 .514 56.109
sikap -.052 .114 .208 1 .648 .949 .760 1.186
kerja by umur1 20.279 28420.722 .000 1 .999 6E+008 .000 .
kerja by sikap .148 .159 .869 1 .351 1.160 .849 1.583
Constant -1.505 1.432 1.105 1 .293 .222
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
203
SUTANTO PRIYO HASTONO: Analisis Data
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan
berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara
bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan
secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di
atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar
(p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model
menjadi:
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea kerja -.445 1.718 .067 1 .795 .641 .022 18.557
p1 umur1 2.217 1.146 3.741 1 .053 9.177 .971 86.749
sikap -.060 .114 .274 1 .601 .942 .753 1.178
kerja by
.175 .156 1.264 1 .261 1.191 .878 1.616
sikap
Constant -1.881 1.483 1.610 1 .205 .152
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .
Dari output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step
a
kerja 1.376 .666 4.273 1 .039 3.959 1.074 14.592
1 umur1 2.260 1.157 3.812 1 .051 9.582 .991 92.609
sikap .035 .076 .212 1 .645 1.036 .893 1.202
Consta
-2.876 1.239 5.384 1 .020 .056
nt
a. Variable(s) entered on step 1: kerja, umur1, sikap.
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel
interasksi, langkah selanjutnya uji konfounding
204
SUTANTO PRIYO HASTONO: Analisis Data
UJI KONFOUNDING
Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan
dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka
varaibel tsb dianggap sebagai variabel konfounding.
Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model
hasiilnya sbb:’
Model terakhir :
205
SUTANTO PRIYO HASTONO: Analisis Data
Interpretasi:
Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding
hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb:
Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai
peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah
dikontrol variabel ”umur”.
206
SUTANTO PRIYO HASTONO: Analisis Data
207
SUTANTO PRIYO HASTONO: Analisis Data
31 1 17 110 1 1 0 0 0 0 2225
32 1 25 105 3 0 1 0 0 1 2240
33 1 20 109 3 0 0 0 0 0 2240
34 1 18 148 3 0 0 0 0 0 2282
35 1 18 110 2 1 1 0 0 0 2296
36 1 20 121 1 1 1 0 1 0 2296
37 1 21 100 3 0 1 0 0 4 2301
38 1 26 96 3 0 0 0 0 0 2325
39 1 31 102 1 1 1 0 0 1 2353
40 1 15 110 1 0 0 0 0 0 2353
41 1 23 187 2 1 0 0 0 1 2367
42 1 20 122 2 1 0 0 0 0 2381
43 1 24 105 2 1 0 0 0 0 2381
44 1 15 115 3 0 0 0 1 0 2381
45 1 23 120 3 0 0 0 0 0 2395
46 1 30 142 1 1 1 0 0 0 2410
47 1 22 130 1 1 0 0 0 1 2410
48 1 17 120 1 1 0 0 0 3 2414
49 1 23 110 1 1 1 0 0 0 2424
50 1 17 120 2 0 0 0 0 2 2438
51 1 26 154 3 0 1 1 0 1 2442
52 1 20 105 3 0 0 0 0 3 2450
53 1 26 190 1 1 0 0 0 0 2466
54 1 14 101 3 1 1 0 0 0 2466
55 1 28 95 1 1 0 0 0 2 2466
56 1 14 100 3 0 0 0 0 2 2495
57 1 23 94 3 1 0 0 0 0 2495
58 1 17 142 2 0 0 1 0 0 2495
59 1 21 130 1 1 0 1 0 3 2495
60 0 19 182 2 0 0 0 1 0 2523
61 0 33 155 3 0 0 0 0 3 2551
62 0 20 105 1 1 0 0 0 1 2557
63 0 21 108 1 1 0 0 1 2 2594
64 0 18 107 1 1 0 0 1 0 2600
208
SUTANTO PRIYO HASTONO: Analisis Data
65 0 21 124 3 0 0 0 0 0 2622
66 0 22 118 1 0 0 0 0 1 2637
67 0 17 103 3 0 0 0 0 1 2637
68 0 29 123 1 1 0 0 0 1 2663
69 0 26 113 1 1 0 0 0 0 2665
70 0 19 95 3 0 0 0 0 0 2722
71 0 19 150 3 0 0 0 0 1 2733
72 0 22 95 3 0 0 1 0 0 2750
73 0 30 107 3 0 1 0 1 2 2750
74 0 18 100 1 1 0 0 0 0 2769
75 0 18 100 1 1 0 0 0 0 2769
76 0 15 98 2 0 0 0 0 0 2778
77 0 25 118 1 1 0 0 0 3 2782
78 0 20 120 3 0 0 0 1 0 2807
79 0 28 120 1 1 0 0 0 1 2821
80 0 32 121 3 0 0 0 0 2 2835
81 0 31 100 1 0 0 0 1 3 2835
82 0 36 202 1 0 0 0 0 1 2836
83 0 28 120 3 0 0 0 0 0 2863
84 0 25 120 3 0 0 0 1 2 2877
85 0 28 167 1 0 0 0 0 0 2877
86 0 17 122 1 1 0 0 0 0 2906
87 0 29 150 1 0 0 0 0 2 2920
88 0 26 168 2 1 0 0 0 0 2920
89 0 17 113 2 0 0 0 0 1 2920
90 0 17 113 2 0 0 0 0 1 2920
91 0 24 90 1 1 1 0 0 1 2948
92 0 35 121 2 1 1 0 0 1 2948
93 0 25 155 1 0 0 0 0 1 2977
94 0 25 125 2 0 0 0 0 0 2977
95 0 29 140 1 1 0 0 0 2 2977
96 0 19 138 1 1 0 0 0 2 2977
97 0 27 124 1 1 0 0 0 0 2992
98 0 31 215 1 1 0 0 0 2 3005
209
SUTANTO PRIYO HASTONO: Analisis Data
99 0 33 109 1 1 0 0 0 1 3033
100 0 21 185 2 1 0 0 0 2 3042
101 0 19 189 1 0 0 0 0 2 3062
102 0 23 130 2 0 0 0 0 1 3062
103 0 21 160 1 0 0 0 0 0 3062
104 0 18 90 1 1 0 0 1 0 3076
105 0 18 90 1 1 0 0 1 0 3076
106 0 32 132 1 0 0 0 0 4 3080
107 0 19 132 3 0 0 0 0 0 3090
108 0 24 115 1 0 0 0 0 2 3090
109 0 22 85 3 1 0 0 0 0 3090
110 0 22 120 1 0 0 1 0 1 3100
111 0 23 128 3 0 0 0 0 0 3104
112 0 22 130 1 1 0 0 0 0 3132
113 0 30 95 1 1 0 0 0 2 3147
114 0 19 115 3 0 0 0 0 0 3175
115 0 16 110 3 0 0 0 0 0 3175
116 0 21 110 3 1 0 0 1 0 3203
117 0 30 153 3 0 0 0 0 0 3203
118 0 20 103 3 0 0 0 0 0 3203
119 0 17 119 3 0 0 0 0 0 3225
120 0 17 119 3 0 0 0 0 0 3225
121 0 23 119 3 0 0 0 0 2 3232
122 0 24 110 3 0 0 0 0 0 3232
123 0 28 140 1 0 0 0 0 0 3234
124 0 26 133 3 1 2 0 0 0 3260
125 0 20 169 3 0 1 0 1 1 3274
126 0 24 115 3 0 0 0 0 2 3274
127 0 28 250 3 1 0 0 0 6 3303
128 0 20 141 1 0 2 0 1 1 3317
129 0 22 158 2 0 1 0 0 2 3317
130 0 22 112 1 1 2 0 0 0 3317
131 0 31 150 3 1 0 0 0 2 3321
132 0 23 115 3 1 0 0 0 1 3331
210
SUTANTO PRIYO HASTONO: Analisis Data
211
SUTANTO PRIYO HASTONO: Analisis Data
212