Data
ANALISIS
DATA
1
PENDAHULUAN
1 STATISTIK dan PENELITIAN
Statistik dalam arti sempit berarti angka/data. Sedangkan dalam arti luas statistik
sebagi suatu prosedur atau metode pengumpulan data, pengolahan data,
analisis data dan penyajian data. Sedangkan penelitian adalah cara ilmiah untuk
mendapatkan data dengan tujuan dan kegunaan tertentu.
Data yang diperoleh melalui penelitian harus akurat, artinya data yang dihasilkan
harus memenuhi kriteria: valid, reliabel dan obyektif. Valid artinya
ketepatan/kecermatan pengukuran, artinya ketepatan antara data yang
sesungguhnya terjadi pada obyek dengan data yang dapat dikumpulkan oleh
peneliti. Misalkan data dalam obyek berwarna merah, maka data yang terkumpul
oleh peneliti juga berwarna merah. Contoh lain, kita akan mengukur waktu
lomba lari cepat, kalau mengukurnya dengan jam tangan tentunya hasilnya tidak
valid, untuk lomba lari cepat akan valid bila menggunakan alat Stop watch.
Contoh lain, bila survei melakukan wawancara dengan orang pedesaan Cianjur
tidak valid kalau wawancaranya menggunakan bahasa batak, akan valid bila
menggunakan bahasa sunda.
4. Jenis Data
Dalam menggunakan statistik perlu dipahami benar mengenai definisi data
dan jenis-jenis data. Data merupakan kumpulan angka/huruf hasil dari penelitian
terhadap sfat/karakteristik yang kita teliti. Isi data pada umumnya bervariasi
(misalnya data berat badan dalam suatu kelompok orang ada yang beratnya 60
kg, 50 kg, 75 kg dst) sehingga muncul istilah variabel. Jadi variabel merupakan
karakteristik yang nilai datanya bervariasi dari suatu pengukuran ke pengukuran
berikutnya.
Menurut skala pengukurannya, variabel dibagi empat jenis, yaitu nominal,
ordinal, interval dan rasio.
a. Nominal, variabel yang hanya dapat membedakan nilai datanya dan tidak
tahu nilai data mana yang lebih tinggi atau rendah. Contoh; jenis kelamin,
suku dll. Jenis kelamin laki-laki tidak lebih tinggi dibandingkan perempuan .
Suku Jawa tidak dapat dikatakan lebih baik/lebih buruk dari suku sunda.
Dengan ilustrasi ini dapat dijelaskan bahwa variabel nominal, nilai datanya
sederajat.
b. Ordinal, variabel yang dapat membedakan nilai datanya dan juga sudah
diketahui tingkatan lebih tinggi atau lebih rendah, tapi belum diketahui besar
beda antar nilai datanya. Contoh pendidikan, pangkat, stadium penyakit dll.
Pendidikan SD pengetahuannya lebih rendah dibandingkan SMP. Namun
demikian, kita tidak dapat tahu besar perbedaan pengetahuan orang SD
dengan SMP.
c. Interval, variabel yang dapat dibedakan, diketahui tingkatannya dan
diketahui juga besar beda antar nilainya, namun pada variabel interval belum
diketahui kelipatan suatu nilai terhadap nilai yang lain dan pada skala interval
tidak mempunyai titik nol mutlak. Contohnya variabel suhu, misalnya benda A
suhunya 40 derajat dan benda B 10 derajat. Benda A lebih panas dari benda
B dan beda panas anta benda A dan B 30 derajat, namun kita tidak bisa
mengatakan bahwa benda A panasnya 4 kali dari benda B (ini berarti tidak
ada kelipatannya!). Selanjutnya, kalau suatu benda suhunya 0 derajat, ini
tidak berart bahwa benda tersebut tidak punya panas (tidak mempunyai nilai
nol mutlak),
d. Rasio, variabel yang paling tinggi skalanya, yaitu bisa dibedakan, ada
tingkatan, ada besar beda dan ada kelipatannya serta ada nol mutlak. Contoh
berat badan, tinggi badan dll. Misal A beratnya 30 kg dan B beratnya 60 kg.
Dalam hal ini dapat dikatakan bahwa A lebih ringan dari B, selisih berat
antara A dan B adalah 30 kg, berat b dua kali lebih tinggi dari berat A. berat
0 kg, ini berarti tidak ada berat (tidak ada bendanya) sehingga ada nol
mutlak.
Dalam analisis seringkali digunakan pembagian data/variabel menjadi dua
kelompok yaitu; data katagorik dan data numerik.
a. Katagorik (kualitatif), merupakan data hasil
pengklasifikasian/penggolongan suatu data. Cirinya: isisnya berupa kata-kata.
Contoh; sex, jenis pekerjaan, pendidikan
b. Numerik (kuantitatif), merupakan variabel hasil dari penghitungan dan
pengukuran. Cirinya: isi variabel berbentuk angka-angka. Variabel numerik
dibagi menjadi dua macam: Diskrit dan Kontinyu.
Diskrit merupakan variabel hasil dari penghitungan. Misalnya jumlah anak,
jumlah pasien tiap ruang, kontinyu merupakan hasol dari pengukuran,
misalkan tekanan darah, Hb dll.
Variabel katagorik pada umumnya berisi variabel yang berskala nominal dan
ordinal. Sedangkan variabel numerik berisi variabel yang berskala interval dan
rasio.
Dalam analisis statistik, seringkali data numerik diubah ke dalam data
katagorik dengan cara dilakukan pengelompokan/pengklasifikasian. Misalnya
variabel berat badan data riilnya merupakan data numeric, namun bila
dikelompokkan menjadi kurus (<50 kg), sedang (50-60 kg) dan gemuk (>60 kg)
maka jenis variabelnya sudah berubah menjadi katagorik.
PENGOLAHAN DATA
2
1. Pengantar Pengolahan Data
Pengolahan data merupakan salah satu bagian rangkaian kegiatan penelitian
setelah pengumpulan data. Setelah dilakukan pengumpulan data, seringkali
orang bingung “mau diapakan data yang telah terkumpul?, Bagaimana
menghubungkan data di kuesioner dengan tujuan penelitian?”. Untuk itu data
yang masih mentah (raw data) perlu diolah sedemikian rupa sehingga menjadi
informasi yang akhirnya dapat digunakan untuk menjawab tujuan penelitian.
Agar analisis penelitian menghasilkan informasi yang benar, paling tidak
ada empat tahapan dalam pengolahan data yang harus dilalui, yaitu:
1. Editing
Merupakan kegiatan untuk melakukan pengecekan isian formulir atau
kuesioner apakah jawaban yang ada di kuesioner sudah:
a. Lengkap: semua pertanyaan sudah terisi jawabannya
b. Jelas: jawaban pertanyaan apakah tulisannya cukup jelas terbaca.
c. Relevan: jawaban yang tertulis apakah relevan dengan pertanyaan
d. Konsisten: apakah antara beberapa pertanyaan yang berkaitan isi
jawabannya konsisiten, misalnya antara pertanyaan usia dengan
pertanyaan jumlah anak. Bila dipertanyaan usia terisi 15 tahun dan di
pertanyaan jumlah anak 9, ini berarti tidak konsisten.
2. Coding
Coding merupakan kegiatan merubah data berbentuk huruf menjadi data
berbentuk angka/bilangan. Misalnya untuk variabel pendidikan dilakukan
koding 1 = SD, 2 = SMP, 3 = SMU dan 4 = PT. Jenis kelamin: 1 = laki-laki
dan 2 = perempuan, dsb. Kegunaan dari coding adalah untuk mempermudah
pada saat analisis data dan juga mempercepat pada saat entry data.
3. Processing
Setelah semua kuesioner terisi penuh dan benar, serta sudah melewati
pengkodean, maka langkah selanjutnya adalah memproses data agar data
yang sudah di-entry dapat dianalisis. Pemrosesan data dilakukan dengan cara
meng-entry data dari kuesioner ke paket program komputer. Ada bermacam-
macam paket program yang dapat digunakan untuk pemrosesan data dengan
masing-masing mempunyai kelebihan dan kekurangan. Salah satu paket
program yang sudah umum digunakan untuk entry data adalah paket
program SPSS for Window.
4. Cleaning
Cleaning (pembersihan data) merupakan kegiatan pengecekan kembali data
yang sudah di-entry apakah ada kesalahan atau tidak. Kesalahan tersebut
dimungkinkan terjadi pada saat kita meng- entry ke komputer Misalnya untuk
variabel pendidikan ada data yang bernilai 7, mestinya berdasarkan coding
yang ada pendidikan kodenya hanya antara 1 s.d. 4 (1=SD, 2=SMP, 3=SMU
dan 4=PT). Contoh lain misalnya dalam variabel status perkawinan terisi data
1 (misalnya 1=belum kawin) dan dalam variabel jumlah anak terisi nilai . ini
berarti ada data yang salah (tidak konsisten) karena statusnya belum kawin
tetapi mempunyai anak 5?.
Berikut akan diuraikan cara meng-cleaning data:
a. Mengetahui Missing Data
Cara mendetekdi adanya missing data adalah dengan melakukan list
(distribusi frekuensi) dari variabel yang ada. Misalnya data yang diolah 100
responden, kemudoian dikeluarkan variabel jenis kelamin dan pendidikan.
Tabel 1 Jenis kelamin pasien
Jenis Kelamin Jumlah
Laki-laki 40
Perempuan 60
Total 100
Dari kedua tabel di atas memperlihatkan bahwa tabel jenis kelamin tidak
ada nilai yang hilang (missing), sedangkan pada tabel pendidikan ada 5
pasien yang missing, karena total jumlahnya hanya 95 (seharusnya 100).
b. Mengetahui variasi data
Dengan mengetahui variasi data akan diketahui apakah data yang di-
entry benar atau salah. Cara mendeteksi dengan mengeluarkan distribusi
frekuensi masing-masing variabel. Dalam entry data biasanya data
dimasukkan dalam bentuk kode/coding, misalnya untuk variabel
pendidikan SD kode 1, SMP kode 2, SMU kode 3, dan PT kode 4. Untuk
mengetahui kesalahan data berikut ilustrasi keluaran dari variabel
pendidikan:
Tabel 3 Jenis pendidikan pasien
Pendidikan Jumlah
1 40
2 30
3 20
4 6
7 4
Total 100
Dari tampilan di atas kendati jumlah total sudah benar 100, namun
terlihat ada data yang salah, yaitu munculnya kode pendidikan angka 7
yang berjumlah 4 pasien. Seharusnya variabel pendidikan variasi
angkanya hanya dari angka 1 s.d. 4.
Keterangan:
* = ada 2 responden dengan umur 15 tahun dan anaknya ada 10 orang (ada
kesalahan entry data!!!)
2. ENTRY DATA
Setelah kita mengetahui langkah-langkah pengolahan data, selanjutnya
akan dibahas entry data menggunakan SPSS. Kepanjangan dari SPSS yaitu
Statistical Program For Social Science . SPSS merupakan paket program ststistik
yang berguna untuk mengolah dan menganalisis data penelitian. Dengan SPSS
semua kebutuhan pengolahan dan analisis data dapat diselesaikan dengan
mudah dan cepat. Kemampuan yang dapat diperoleh dari SPSS meliputi
pemrosesan segala bentuk file data, modifikasi data, membuat tabulasi
berbentuk distribusi frekuensi, analisis statistik deskriptif, analisis lanjut yang
sederhana maupun komplek, pembuatan grafik, dsb. Perkembangan program
SPSS sangat cepat dimulai dari program SPSS/PC+(masih under DOS) kemudian
berkembang menjadi SPSS for Windows dari versi 6 dan berkembang terus
sampai sekarang sudah memasuki versi 11. Dan untuk latihan digunakan SPSS
for Windows versi 10.
a. MEMANGGIL SPSS
Pertama kali anda harus pastikan bahwa komputer sudah ter-install
program SPSS for Windows. Untuk memanggil program SPSS dapat dilakukan
dua cara :
Pertama :
Bila tampilan pertama komputer sudah muncul Icon SPSS, maka klik dengan
mouse icon tersebut dua kali.
Kedua :
Bila di layar belum ada icon SPSS, maka klik “Start”, pilih “File Program” dan
sorot “SPSS” dan klik dua kali.
Di dalam operasionalnya, SPSS mengenal 2 jenis jendela (Window) yang utama
yaitu:
a. SPSS Data Editor
Jendela ini berisis tampilan data yang kita olah dan analisis dengan tampilan
sejenis Spreadsheet (seperti tampilan Program Excel).
b. SPSS Output
Hasil olahan (hasil analisis) yang anda lakukan akan ditampilkan pada Output
window. Window ini merupakan teks editor, artinya dapat mengedit hasil
analisis yang ditampilkan.
Sistem kerja SPSS for Windows dikendalikan oleh menu (bar menu)./ Bar menu
terletak di sebelah atas dengan urutan dari kiri ke kanan sbb: File, Edit, View,
Data, Transform, Analyze, Graphs, Utilities, Window, Help.
File: digunakan untuk membuat file data baru, membuka file data yang telah
tersimpan (ekstensi SAV), atau membaca file data dari program lain, seperti
dbase, excell dll.
Edit: digunakan untuk memodifikasi, mengcopy, menghapus, mencari, dan
mengganti data.
View: digunakan untuk mengatur tampilan font, tampilan kode/label
Data: digunakan untuk membuat/mendefinisikan nama variabel, mengambil/
menganalisis sebagian data, menggabungkan data.
Transform: digunakan untuk transformasi/modifikasi data seperti
pengelompokan variabel, pembuatan variabel baru dari
perkalian/penjumlahan variabel yang ada dll.
Analyze: digunakan untuk memilih berbagai prosedur statistik, dari statistik
sederhana (deskriptif) sampai dengan analisis statistik komplek (multivariat).
Graphs: digunakan untuk membuat grafik meliputi grafik Bar, Pie, garis,
Histogram, scatter plot dsb.
Utilities: digunakan untuk menampilkan berbagai informasi tentang isi file.
Window: digunakan untuk berpindah-pindah antar jendela, misalnya dari
jendela data ke jendela output.
Help: memuat informasi bantuan bagaimana menggunakan berbagai fasilitas
pada SPSS.
I. MEMASUKKAN DATA
Entry data dapat langsung dilakukan pada data editor. Data editor
memiliki bentuk tampilan sejenis spreadsheet (seperti Excel) yang digunakan
sebagai fasilitas untuk memasukkan/engisikan data. Ada tiga hal yang harus
diperhatikan:
Baris menunjukkan kasus/responden
Kolom menunjukkan variabel
Sel merupakan perpotongan antara kolom dan baris menunjukkan nilai/data
Note: yang sering digunakan adalah tipe Numerik, karena data yang akan kita
olah biasanya berbentuk angka.
POLA MENYUSUI
Nomor Responden
Berapa umur ibu? …. Tahun
pendidikan ibu yang telah ditamatkan?
SD2. SMP3. SMU 4. PT
Apakah ibu bekerja?
bekerja1. Tidak bekerja
Berapa berat badan ibu ? … kg
Apakah ibu menyusui secara Eksklusif (menyusui sampai usia bayi 4 bulan)?
tidak1. ya
a.Kadar Hb ibu pengukuran pertama : …. gr% b.Kadar Hb ibu pengukuran kedua: …. gr%
Berat badan bayi ibu? …….gram
PERTANYAAN SIKAP
Bayi yang baru lahir sesegera mungkin diberi ASI?
STS2. TS3.KS4. S 5.SS
Bayi yang baru lahir diberi kolostrum
STS2. TS3.KS4. S5.SS
Bayi sejak lahir sampai usia 4 bulan hanya diberi ASI saja?
STS2. TS3.KS4. S5.SS
ASI diberikan sampai bayi berusia 2 tahun?
STS2. TS3.KS4. S5.SS
Survei dilakukan dengan jumlah responden sebanyak 50 orang, datanya sbb:
no umur didik kerja bbibu eksklu Hb1 Hb2 bbbayi Segera Kolos Lahir sampai
1 23 1 0 46 0 10.1 11.1 2,500 2 1 2 1
2 24 4 0 47 1 9.8 10.2 3,000 4 3 3 4
3 34 4 1 60 0 11.1 11.5 4,000 1 2 2 1
4 35 3 0 50 0 10.2 9.8 3,600 2 3 4 2
5 19 3 1 55 1 10.4 10.1 3,500 3 2 4 3
6 24 2 1 45 1 11.2 10.0 2,700 5 4 4 4
7 22 1 1 47 1 12.5 12.2 2,900 3 4 2 2
8 19 1 0 46 0 11.4 11.4 2,600 2 1 1 2
9 26 3 0 52 1 13.2 12.3 3,500 3 2 2 4
10 25 4 1 65 0 9.2 9.1 4,000 4 4 5 4
11 21 3 1 60 0 10.1 11.1 3,300 2 1 2 1
12 22 4 0 65 1 10.1 11.1 4,100 2 4 2 4
13 19 2 1 50 1 10.2 9.8 2,800 2 1 2 1
14 20 3 0 55 0 10.2 9.8 3,600 2 3 4 4
15 23 1 1 48 1 10.2 9.8 2,400 1 1 2 2
16 26 3 0 68 0 10.2 10.0 3,000 5 4 4 4
17 27 4 1 70 1 10.2 10.0 3,900 5 4 4 4
18 30 2 1 46 1 10.2 10.0 2,800 5 4 4 4
19 31 4 0 47 0 13.2 12.3 3,300 1 1 2 2
20 32 2 0 48 0 13.2 12.3 2,100 3 2 4 4
21 23 2 0 47 0 11.1 11.1 2,500 2 1 2 1
22 24 3 0 56 1 9.8 10.2 3,000 4 3 3 4
23 34 4 1 74 0 10.4 11.5 4,000 1 2 2 1
24 35 3 0 72 0 7.2 9.8 3,600 2 1 1 2
25 19 3 1 60 1 7.4 10.1 3,500 3 4 2 2
26 24 1 1 49 1 8.9 10.0 2,700 5 4 4 4
27 22 2 1 46 1 11.2 12.2 2,900 1 2 2 2
28 19 1 0 48 0 11.4 11.4 2,600 2 1 1 2
29 26 3 0 57 1 12.0 12.3 3,500 3 2 1 1
30 25 3 1 75 0 8.8 9.1 4,000 4 4 5 4
31 21 4 1 64 0 10.1 11.1 3,300 2 1 2 1
32 22 4 0 67 1 10.1 11.1 4,100 2 1 2 1
33 19 2 1 50 1 8.1 9.8 2,800 2 3 4 2
34 20 3 0 63 0 7.8 9.8 3,600 2 3 1 1
35 23 1 1 50 1 9.2 9.8 2,400 2 3 4 2
36 26 2 0 51 0 9.4 10.0 3,000 5 4 4 4
37 27 4 1 53 1 9.0 10.0 3,900 5 4 4 4
38 30 2 1 54 1 8.3 10.0 2,800 5 4 4 4
39 31 4 0 67 0 10.2 12.3 3,300 1 1 2 2
40 32 1 0 46 0 10.1 12.3 2,100 3 2 2 2
41 21 3 1 60 0 10.1 11.1 3,300 2 1 2 1
42 22 4 0 68 1 10.2 11.1 4,100 2 1 2 1
43 19 2 1 67 1 10.2 12.1 2,800 1 1 2 2
44 20 3 0 60 0 10.2 11.3 3,600 2 3 4 2
45 23 1 1 63 1 11.2 10.2 2,400 2 3 1 2
46 26 3 0 64 0 11.2 11.4 3,000 5 4 4 4
47 27 4 1 72 1 11.2 10.0 3,900 5 4 4 4
48 30 2 1 49 1 11.2 12.4 2,800 5 4 4 4
49 31 3 0 58 0 13.2 13.3 3,300 3 2 4 2
50 32 1 0 50 1 11.2 12.3 2,100 3 1 1 2
Pada tampilan “Variable View” diatas terlihat kolom: Name, Type, Width,
Decimals, dst.. Selanjutnya kita dapat membuat nama variabelnya dimulai
dari No, umur, didik, dst..sbb:
a. Membuat Variabel No
Adapun tahapannya sbb:
1. Sekarang pada kolom name ketik nama variabel “No”, kemudian
2. Pindahkan kursor ke kolom Type. Jenis variabel yang tersedia ada
beberapa jenis meliputi numeric untuk tipe angka, string untuk tipe
karakter/huruf dll. Untuk varibel No karena datanya yang akan masuk
berbentuk angka berarti anda pilih numeric (secara otomatis SPSS
memberikan default Numeric)
3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda
juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
standar lebar kolom sudah diatur SPSS lebar kolom (Width) 8 karakter,
jadi abaikan saja untuk width nya
4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis
memberi ruang untuk 2 desimal, untuk variabel No tentunya berbentuk
bilangan bulat(tidak ada desimal) jadi kolom Decimal diberi angka 0 atau
dikosongkan.
5. Geser korsor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel No, misalnya diketik “Nomor Responden”
6. Langkah selanjutnya harusnya kursor kita geser kekanan mengisi kolom
Values, namun kolom Values ini diisi kalau variabel yang kita buat
berbentuk variabel koding (atau variabel katagorik) misalnya variabel sex
yang isinya ada koding 1=pria dan 2=wanita. Untuk variabel No bukan
merupakan variabel koding, maka kolom Value tidak diisi/diabaikan saja,
sehingga proses pembuatan variabel No sudah selesai, dan tampilan
lengkapnya menjadi sebagai berikut
b.Membuat Variabel Umur
Proses pembuatannya sama dengan ketika membuat variabel No sbb:
1. Sekarang pada kolom name ketik nama variabel Umur, kemudian
2. Pindahkan kursor ke kolom Type.. Untuk variabel Umur karena datanya
yang akan masuk berbentuk angka berarti anda pilih numeric (secara
otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi
kolom Type jangan diubah)
3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda
juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
standar lebar kolom sudah diatur SPSS, lebar kolom ( Width) 8 karakter,
jadi abaikan/biarkan saja untuk width nya
4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis
memberi ruang untuk 2 desimal, untuk variabl Umur tentunya berbentuk
bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan.
5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel Umur, isikan: Umur ibu menyusui
6. Karena variabel umur berjenis numerik (bukan variabel yg isinya koding)
maka kolom Values diabaikan saja, dan dengan demikian proses
pembuatan variabel umur telah selessai
c. Variabel Pendidikan
Proses pembuatannya sama dengan ketika membuat variabel No sbb:
1. Sekarang pada kolom name ketik nama variabel Didik, kemudian
2. Pindahkan kursor ke kolom Type.. Untuk variabel Didik karena datanya
yang akan masuk berbentuk angka berarti anda pilih numeric (secara
otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi
kolom Type jangan diubah)
3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda
juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
standar lebar kolom sudah diatur SPSS, lebar kolom ( Width) 8 karakter,
jadi abaikan/biarkan saja untuk width nya
4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis
memberi ruang untuk 2 desimal, untuk variabl Didik tentunya berbentuk
bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan.
5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel Didik, isikan: Pendidikan formal ibu menyusui
6. Langkah selanjutnya geser kekanan ke kolom Values, untuk variabel
Didik kolom Values ada isinya oleh karena variabel Didik merupakan
variabel yang berbentuk koding, yaitu kode 1 = SD, 2=SMP, 3=SMU,
4=PT. Klik kolom Value akan muncul menu:
Klik disini
Pada kotak Value isikan angka 1, lalu klik kotak Value Label isikan:
SD,hasilnya nampak sbb:
Kemudian klik tombol Add sehinga di kotak bagian bawah akan muncul:
Seterusnya klik kotak Value, isikan angka 2, klik kotak Value Label dan
isikan: SMP, kemudian klik tombol Add
Seterusnya klik kotak Value, isikan angka 3, klik kotak Value Label dan
isikan: SMU, kemudian klik tombol Add Seterusnya klik kotak Value, isikan
angka 4, klik kotak Value Label dan isikan: PT, kemudian klik tombol Add
sehingga kotak menu akan tertampil sbb:
Kemudian, klik tombol OK sehingga selesailah pembuatan variabel
Didik.
d. Variabel Kerja
1. Pada kolom Name isikan Kerja
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Status pekerjaan ibu
4. Geser kekanan ke kolom Value, isikan koding 0=bekerja 1=tdk kerja
Proses pembuatan variabel kerja selesai
e. Variabel BBibu
1. Pada kolom Name isikan Bbibu
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Berat badan ibu
4. Kolom Value, abaikan/biarkan aja karena variabel Bbibu berbentuk numerik
Proses pembuatan variabel Bbibu selesai
f. Variabel Eksklu
1. Pada kolom Name isikan Eksklu
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Status menyusui eksklusive
4. Geser kekanan ke kolom Value, isikan koding 0=tdk eksklusive
1=eksklusive
Proses pembuatan variabel Eksklu selesai
g. Variabel Hb1
1. Pada kolom Name isikan Hb1
2. Geser kekanan ke kolom Decimal, untuk variabel HB1 sesuai dengan
datanya, ada satu desimal, maka isikan angka 1
3. Geser ke kolom Label isikan: Hb pengukuran pertama
4. Abaikan kolom Values, karena variabel HB1 berbentuk numerik
h. Variabel Hb2
1. Pada kolom Name isikan Hb2
2. Geser kekanan ke kolom Decimal, untuk variabel HB2 sesuai dengan
datanya, ada satu desimal, maka isikan angka 1
3. Geser ke kolom Label isikan: Hb pengukuran kedua
4. Abaikan kolom Values, karena variabel HB2 berbentuk numerik
i. Variabel BBbayi
1. Pada kolom Name isikan BBbayi
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Berat badan bayi
4. Abaikan kolom Value,
Proses pembuatan variabel bbbayi selesai
Dengan cara sama kemudian dapat dibuat untuk variabel: Segera, Kolos,
Lahir, Sampai
Akhirnya tampilan kseluruhannya sbb:
B. Memasukkan/entry Data
Setelah semua variabel sudah dibuat, maka langkah selanjutnya adalah
memasukkan data hasil survei kedalam format yang telah dibuat diatas. Untuk
memasukkan data anda harus berpindah ke layar/jendela Data View, yaitu
dengan Klik tombol Data View, nampak tampilannya sbb:
Dari tampilan di atas berarti kita membuat blok untuk variabel Kerja pada
responden no 3 s/d 5
Tekan ‘delete’ untuk menghapusnya.
2. Menghapus isi sel satu kolom (menghapus variabel)
a. Klik heading kolom (nama variabel) yang akan dihapus isi-isi
selnya, misalkan akan dihapus variabel BBibu: klik heading BBibu
seperi tampilan sbb:
Klik disini
Klik disini
7. Menyisipkan Kolom
a. Pindahkan penunujuk sel pada kolom yang disisipi
b. Klik ‘Data’, pilih ‘Insert Variable’, terlihat kolom baru muncul.
8. Menyisipkan Baris
a. Pindahkan penunjuk sel pada baris yang akan disisipi
b. Klik ’Data’, pilih ‘Insert Case’, terlihat kasus/ responden baru muncul
2. Misalkan sekarang akan diaktifkan file data: “Latihan” dari drive c direktori My
Documen, maka caranya klik kotak File name: ketik “latihan”, atau klik
“latihan yang terlihat/tertampil pada kotak di atasnya.
3. Kemudian klik Open, data akan muncul di layar.
3. TRANSFORMASI / MODIFIKASI DATA
Setelah semua data di-entry pada dasarnya anda dapat langsung melakukan
analisis untuk mengetahui informasi yang diinginkan. Namun seringkali data
yang ada tidak semuanya dapat langsung dilakukan analisis. Beberapa data bisa
jadi masih perlu dilakukan modifikasi/transformasi, misalnya untuk keperluan
analisis kita harus mengelompokkan umur menjadi tiga katagori misalnya < 20
th, 20 – 35 th dan > 35 th. Kasus lain, misalnya kita akan membuat variabel
baru hasil dari gabungan beberapa variabel (misalnya variabel sikap diukur oleh
10 pertanyaan/variabel), maka kita harus melakukan aktifitas di SPSS untuk
menggabungkan beberapa variabel tersebut.
Dari uraian di atas tentunya sekarang menjadi jelas ternyata seringkali kita
tidak dapat langsung melakukan analisis, kita harus melakukan
modifikasi/transformasi data. Perlu tidaknya modifikasi dilakukan dapat
dilihat/dicek pada “Definisi Operasional Variabel” dari penelitian/tesis/skripsi kita.
Misalkan dalam penelitian anda definisi variabelnya sbb:
No Variabel Definisi Operasional Hasil Ukur/Skala
1 Lama tugas Rentang waktu berkeja sebagai Tahun/Rasio
petugas puskesmas
2 Umur Lama waktu hidup yang diukur dari Muda dan tua/
ulang tahun terakhir Ordinal
3 Sikap Pernyataan setuju/tidak setuju Baik dan Buruk/
terhadap sistem pencatatan dan Ordinal
pelaporan yang diukur melalui 10
pertanyaan
Dari contoh definisis operasional di atas dapat diketahui bahwa variabel ‘Lama
tugas” dapat langsung dianalisis, sedangkan variabel umur dan sikap masih perlu
dilakukan modifikasi/transformasi dengan SPSS. Variabel umur perlu dilakukan
pengelompokan menjadi umur muda (misalnya 30 th) dan tua (< 30 th).
Variabel sikap perlu dibuat dengan cara menjumlahkan skor 10 pertanyaan sikap,
kemudian variabel baru tersebut dilakukan pengelompkkan untuk membuat
katagori baik dan buruk (misal menggunakan cut point: mean). Berikut akan
diuraikan beberapa jenis modifikasi data yang dapat dilakukan di program SPSS
for Window.
1. Mengelompokkan data
#perintah : RECODE
Pengelompokan biasanya digunakan untuk mengubah variabel numerik
menjadi variabel katagorik. Pengelompokan dapat dilakukan pada variabel
yang sama atau ke variabel baru yang berbeda. Dianjurkan kalau melakukan
pengelompokan sebaiknya digunakan variabel baru sehingga masih dimiliki
nilai yang asli pada file data.
Coba aktifkan file data ASI.SAV (file ini berisi data penelitian menyusui
eksklusive, yang telah di entry lengkap 50 rsponden)
4). Sorot variabel “umur”, lalu klik tanda panah ke kanan sehingga
“umur” berpindah di kotak Input variable € Output Variable:
5). Pada kotak Output variable, pada bagian Name ketiklah umur1 (nama
variabel baru untuk umur yang bentuknya sudah katagorik)
6). Klik change sehingga pada kotak Input Variable € Output Variable terlihat
umur € umur1
7). Klik Option “Old and New Value”, nampak kotak Old and New di monitor.
Pada kotak dialog tersebut ada beberapa ada beberapa isian yang harus
diisi. Secara garis besar ada 2 isian yang harus diisi, yaitu ‘ Old Value’
(nilai lama yang akan direcode) dan New Value (nilai baru sebagai hasil
‘recode’ dari nilai lama). Me-recode dapat dilakukan per satu nilai lama
atau jangkauan nilai (range).
8). Sekarang kita akan merecode nilai umur < 20 th menjadi kode 1. Umur
dibawah 20 th, artinya umur terendah/paling muda sampai dengan umur 19
th.
Pindahkan kursor ke kotak Range: ‘lowest , ketiklah 19 dan
through bawa kursor ke bagian kotak ‘new 1 kemudian klik Add,
Value’, ketik hasilnya sbb
Langkah 3
Langkah 1
Langkah 4
Langkah 2
10). Kita akan melakukan pengkodean berat > 30 th menjadi kode 3. Pada
kotak Range: thrugh highest ketiklah 31. Lalu pindahkan kursor ke
kotak ‘New Value’, ketiklah 3, klik ‘Add’. Langkahnya seperti diatas, dan
akhirnya setelah selesai hasilnya sbb:
11). Klik “Continoue”
12). Klik “OK”, terlihat variabel baru “umur1” sudah terbentuk berada dikolom
paling kanan
# perintah : COMPUTE
Selain fasilitas me-recode yang sudahkita coba untuk mengelompokkan
data, fasilitas SPSS yang lain yaitu membuat variabel baru hasil dari operasi
matematik dari beberapa variabel yang sudah di entry, misal melakukan
penjumlahan, pengurangan, pembagian dan perkalian dll.
Sebagai contoh pada data ASI.SAV ada data berat badan bayi dalam bentuk
satuan gram, sekarang anda diminta untuk membuat variabel baru, berat
badan bayi dalam satuan kilogram.
Adapun caranya:
1). Pastikan anda di posisi tampilan data editor
2). Pilih “Transform”
3). Pilih “Compute”, kemudian muncul kotak dialog ”Compute Variable”.
6). Klik “OK”, sesaat kemudian variabel “bayikilo” akan muncul dibagian paling
kanan.
3. Membuat variabel baru dengan kondisi
# perintah : IF
Dalam pembuatan variabel baru seringkali dihasilkan dari kondisi
beberapa variabel yang ada. Misalnya dalam file “ASI.SAV” terdapat variabel
“umur” dan variabel “berat ibu”. Kemudian kita ingin membuat variabel baru
yang berisi dua kelompok yaitu: risiko tinggi dan ririko rendah. Misalkan variabel
tersebut diberi nama “Risk” dan untuk kelompok risiko rendah (kode 0) dan risiko
tinggi (kode 1). Adapun kriteria risiko tinggi adalah bila responden berumur di
atas 30 tahun dan berat badan dibawah 50 kg. Selain kondisi tersebut
dikelompokkan ke dalam risiko rendah. Dari kasus ini berarti kita diharapkan
membuat variabel baru dengan kondisi variabel umur dan hipertensi. Bagaimana
cara membuat variabel “Risk” tersebut? Ada dua langkah untuk menyelesaikan
kasus ini:
Langkah pertama:
= membuat variabel RISK yang isinya semuanya 0 (risiko rendah)=
1). Pilih “Transform”
2). Pilih “Compute”
3). Pada kotak “Target Variable”, ketiklah “risk”
4). Pada kotak “Numeric Expression”, ketiklah
“0”
5). Klik “OK”, terlihat dilayar variabel “risk” sudah terbentuk dengan semua
selnya berisi angka 0.
Langkah kedua:
=membuat kondisi risiko tinggi (kode 1) untuk umur >30 dan bb<50
6). Pilih kembali menu “Transform”
7). Pilih kembali ‘Compute”
8). Pada kotak “Target Variable” biarkan tetap berisi “RISK”.
9). Pada kotak “Numeric Expression”, hapus angka 0 dan gantilah dengan angka
1.
15). Klik “OK”, maka terbentuklah variabel “RISK” pada kolom paling kanan
dengan isi 0 dan 1 (0=risiko rendah dan 1= risiko tinggi), kalau menemui data
yang berisi umur diatas 30 tahun dan berat ibu dibawah 50 th, maka isi variabel
RISK akan berubah dari 0 menjadi 1, coba dicek !!!!
# perintah : SELECT
Dalam kondisi tertentu seringkali kita hanya menginginkan mengolah dan
menganalisis hanya data dari kelompok tertentu saja. Misalkan kita punya data
seluruh DKI, tapi kita hanya ingin mengetahui distribusi aktifitas pada ibu hamil
yang tinggal di Jakarta Selatan. Di dalam data tentunya ada variabel yang
menunjukkan wilayah tempat tinggal ibu hamil.
Sebagai contoh kita ingin menganalisis data, hanya untuk ibu yang
menyusui saja,(dalam contoh ini kita masih menggunakan file data ASI.SAV).
caranya:
1). Pilih menu “Data”
2). Pih “Select Cases”
3). Klik pada tombol : If Conditin is satisfied
# perintah : MERGE
Dalam pengolahan data seringkali kita mempunyai tidak satu file data, melainkan
beberapa file data yang tentunya harus digabung kalau kita akan melakukan
analisis data. Teknik penggabungan data ada dua jenis yaitu penggabungan
responden dan penggabungan variabel.
a. Penggabungan responden/case
Misal:
data file pertama, berisi: nomor responden 1 s/d 3
No Umur Didik
1 20 1
2 23 3
3 19 2
b. Penggabungan variabel
Data kedua, berisi variabel : no, sex, kerja dan berat badan
no sex kerja bb
1 2 1 60
2 2 3 45
3 1 2 56
4 2 1 76
5 2 3 56
6 1 2 60
7 2 3 55
Langkahnya:
Aplikasi di SPSS:
Pastikan anda sudah memasukkan data kedua file, misalnya data pertama
dengan nama Data3.sav dan data kedua dengan nama Data4.sav.
Langkahnya:
1. File ‘data3.sav’ dalam kondisi aktif
2. klik data, sorot Merge Files, sorot Add Variables
3. klik Add Variables
4. klik Open, Klik OK
5. Tampilan sudah tergabung variabelnya, anda tinggal melakukan
penyimpanan “ klik Save As” beri nama file misal namanya Data34
Statistics
RISK
N Valid 5
Missing 0
RISK
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 2 40.0 40.0 40.0
2 3 60.0 60.0 100.0
Total 5 100.0 100.0
UJI INSTRUMEN
3
A. Uji validitas dan Reliabilitas Kuesioner
Salah satu masalah dalam suatu penelitian adalah bagaimana data yang
diperoleh adalah akurat dan objektif. Hal ini sangat penting dalam penelitian
karena kesimpulan penelitian hanya akan dapat dipercaya (akurat). Data yang
kita kumpulkan tidak akan berguna bilamana alat pengukur yang digunakan
untuk mengumpulkan data penelitian tidak mempunyai validitas dan reliabilitas
yang tinggi.
VALIDITAS
Validitas berasal dari kata Validity yang mempunyai arti sejauhmana
ketepatan suatu alat ukur dalam mengukur suatu data. Misalnya bila seseorang
akan mengukur cincin, maka dia harus menggunakan timbangan emas. Dilain
pihak bila seseorang ingin menimbang berat badan, maka dia harus
menggunakan timbangan berat badan. Jadi dapat disimpulkan bahwa timbangan
emas valid untuk mengukur berat cincin, tapi timbangan emas tidak valid untuk
menimbang berat badan.
RELIABILITAS
Realibilitas adalah suatu ukuran yang menunjukkan sejauhmana hasil
pengukuran tetap konsisten bila dilakukan pengukuran dua kali atau lebih
terhadap gejala yang sama dan dengan alat ukur yang sama. Misalkan seseorang
ingin mengukur jarak dari satu tempat ke tempat lain dengan menggunakan dua
jenis alat ukur. Alat ukur pertama denganmeteran yang dibuatdari logam,
sedangkan alat ukur kedua dengan menghitung langkah kaki. Pengukuran
dengan meteran logam akan mendapatkan hasil yang sama kalau
pengukurannya diulang dua kali atau lebih. Sebaliknya pengukuran yang
dilakukan dengan kaki, besar kemungkinan akan didapatkan hasil yang berbeda
kalau pengukurannya diulang dua kali atau lebih. Dari ilustrasi ini berarti meteran
logam lebih reliable dibandingkan langkah kaki untuk mengukur jarak.
N (XY)-
r= (XY) V[NX2 – (X)2][NY2 – (Y)2]
Keputusan uji:
Bila r hitung lebih besar dari r tabel € Ho ditolak, artinya variabel valid
Bila r hitung lebih kecil dari r tabel € Ho gagal ditolak, artinya variabel
tidak valid
Penyelesaian:
Langkahnya:
1. Masukkan data tersebut ke SPSS
2. Klik ‘Analyze’
3. Pilih ‘Scale’
4. Pilih ‘Reliability Analysis’
8. Pada bagian ‘Descriptives for’ klik pilihan ‘ítem’, Scale if Item deleted.
9. Klik ‘Continue’
10. Klik ‘OK’., terlihat hasil outputnya sbb :
Reliability Statistics
Cronbach's
Alpha N of Items
.928 5
Item Statistics
Interpretasi:
Hasil analisis reliability memperlihatkan dua bagian. Bagian utama menunjukkan
hasil statistik deskriptif masing-masing variabel dalam bentuk mean, varian dll.
Pada bagian kedua memperlihatkan hasil dari proses validitas dan reliabilitas.
Kaidah yang berlaku bahwa pengujian dimulai dengan menguji validitas
kuesioner baru dilanjutkan uji reliabilitas.
a. Uji Validitas
Untuk mengetahui validitas kuesioner dilakukan dengan membandingkan nilai r
tabel dengan nilai r hitung.
*) Menentukan nilai r tabel
Nilai r tabel dilihat dengan tabel r (pada lampiran) dengan menggunakan df
= n- 2 € 15-2=13. Pada tingkat kemaknaan 5%, didapat angka r tabel =
0,514
**) Menentukan nilai r hasil perhitungan
Nilai r hasil dapat dilihat pada kolom “Corrected item-Total Correlation”
***) Keputusan
Masing-masing pertanyaan/variabel dibandingkan nilai r hasil dengan nilai r
tabel, ketentuan: bila r hasil > r tabel, maka pertanyaan tersebut valid.
Kesimpulan:
Terlihat dari 5 pertanyaan, ada satu pertanyaan yaitu P2 (r=0,3275) yang
nilainya lebih rendah dari r tabel (r=0,514). Sehingga pertanyaan P2 tidak valid,
sedangkan untuk pertanyaan P1, P3, P4 dan P5 dinyatakan valid.
Langkah selanjutnya melakukan analisis lagi dengan mengeluarkan pertanyaan
yang tidak valid. Lakukan prosedur/langkah seperti di atas yaitu:
1. Klik ‘Analyze’
2. Pilih ‘Scale’
3. Pilih ‘Reliability Analysis’
4. Masukkan keempat variabel ke dalam kotak ‘Items’ (variabel P2 tidak ikut
dianalisis)
5. Klik “OK” Kemudian muncul tampilan Output sbb:
Reliability Statistics
Cronbach's
Alpha N of Items
.993 4
Item Statistics
Item-Total Statistics
Interpretasi:
Sekarang terlihat bahwa dari keempat pertanyaan, semua mempunyai nilai r
hasil (Corrected item-Total Correlation) berada di atas dari niali r tabel
(r=0,514), sehingga dapat disimpulkan keempat pertanyaan tersebut valid.
b. Uji Reliabilitas
setelah semua pertanyaan valid semua, amnalisis dilanjutkan dengan uji
reliabilitas. Untuk mengetahui reliabilitas caranya adalah; membandingkan nialia
r hasil dengan r tabel.dalam uji reliabilitas sebagai nilai r hasil adalah nilai
“Alpha” (terletak di akhir output). Ketentuannya: bila r Alpha > r tabel, maka
pertanyaan tersebut reliabel
Dari hasil uji di atas ternyata, nilai r Alpha (0,9935) lebih besar dibandingkan
dengan nilai r tabel, maka keempat pertanyaan di atas dinyatakan reliabel.
Prinsip ujinya: bila hasil uji Kappa signifikan/bermakna maka persepsi antara
peneliti dengan numerator sama, sebaliknya bila hasil uji kappa tidak
signifikan/bermakna, maka persepsi antara peneliti dengan numerator terjadi
perbedaan.
Contoh :
Suatu penelitian praktek keperawatan keluarga terdapat instrumen yang
berbentuk observasi terhadap perilaku perawat merawat pasien. Pertanyaanya:
Apakah dalam melakukan komunikasi dengan pasien bersifat ramah ?
1. ya 2. tidak
Langkah:
1. data di entry di SPSS
2. Klik analysis, sorot Descriptif, sorot dan klik Crostab
3. Masukkan variabel ‘peneliti’ ke bagian Row dan masukkan variabel
‘numerator’ ke bagian colom.
4. Klik tombol Statistic, klik Kappa
5. Klik Continue
6. Klik OK, dan hasilnya
Symmetric Measures
Asymp. b
a
Value Std. Error Approx. T Approx. Sig.
Measure of Agreement Kappa .583 .262 1.845 .065
N of Valid Cases 10
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Hasil uji didapatkan nilai koefisien kapaa sebesar 0,583 dan p valuenya sebesar
0,065. Dengan hasil ini berarti p value > alpha berarti hasil uji kappa tidak
signifikan/bermakna, sehingga kesimpulannya: ada perbedaan persepsi
mengenai aspek yang diamati antara peneliti dengan numerator.
PENGANTAR
4 ANALISIS DATA
1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya
adalah menganalisis data. Data mentah (raw data) yang sudah susah payah kita
kumpulkan tidak akan ada artinya jika tidak dianalisis. Analisis data merupakan
kegiatan yang sangat penting dalam suatu penelitian, karena dengan analisislah
data dapat mempunyai arti/makna yang dapat berguna untuk memecahkan
masalah penelitian.
Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu
dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat
langsung memberi jawaban penelitian, untuk itu perlu diketahui bagaimana
menginterpretasi hasil penelitian tersebut. Menginterpretasi berarti kita
menjelaskan hasil analisis guna memperoleh makna/arti.
Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas.
Interpretasi dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya
sebatas pada masalah penelitian yang diteliti berdasarkan data yang
dikumpulkan dan diolah untuk keperluan penelitian tersebut. Sedangkan
interpretasi dalam arti luas (analitik) yaitu interpretasi guna mencari makna data
hasil penelitian dengan jalan tidak hanya menjelaskan/menganalisis data hasil
penelitian tersebut, tetapi juga melakukan inferensi (generalisasi) dari data yang
diperoleh dengan teori-teori yang relevan dengan hasil-hasil penelitian tersebut.
a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat
masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan
survei. Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan
kuantitatif. Namun bila kita menginginkan untuk mendapatkan
pendapat/gambaran yang mendalam tentang suatu fenomena, maka data dapat
dikumpulkan dengan fokus grup diskusi atau observasi, maka analisisnya
menggunakan pendekatan analisis kualitatif.
c. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua
sampel independen atau dependen. Misalnya pada penelitian survei yang tidak
menggunakan sampel yang sama, dapat digunakan uji statistik yang
mengasumsikan sampel yang independen. Misalkan survei untuk mengetahui
apakah ada perbedaan berat badan bayi antara bayi-bayi yang dilahirkan dari ibu
perokok dengan bayi-bayi dari ibu yang tidak merokok. Disini berarti kelompok
ibu perokok dan kelompok ibu bukan perokok bersifat independen.
Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan
sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang
digunakanadalah uji statistik utnuk data yang dependen. Misalnya, suatu
penelitian ingin mengetahui pengaruh penelitian manajemen terhadap kinerja
petugas kesehatan. Pertanyaan penelitiannya “Apakah ada perbedaan kinerja
petugas kesehatan antara sebelum dan sesudah mendapatkan pelatihan
manajemen?”. Dalam penelitian ini sampel kelompok petugas kesehatan bersifat
dependen, karena pada kelompok (orang) yang sama diukur dua kali yaitu pada
saat sebelum pelatihan (pre test) dan sesudah dilakukan pelatihan (Post Test).
c. Jenis Data/Variabel
Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik.
Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai
contoh, nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk
menjelaskan data berjenis katagorik, sedangkan untuk data jenis numerik
biasanya dapat menggunakan nilai rata-rata untuk menjelaskan karakteristiknya.
Untuk analisis hubungan dua variabel (analsis bivariat), uji kai kuadrat hanya
dapat dipakai untuk mengetahui hubungan data katagori dengan data katagori.
Sebaliknya untuk mengetahui hubungan numerik dengan numerik digunakan uji
korelasi/regresi.
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi
datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan
prosedur uji statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat
dipenuhi maka dapat digunakan uji statistik parametrik.
Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan
kuantitatif):
1. Analisis Deskriptif (Univariat).
Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan
karakteristik masing-masing variabel yang diteliti. Bentuknya tergantung dari
jenis datanya. Untuk data numerik digunakan nilai mean (rata-rata), median,
standard deviasi dan inter kuartil range, minimal maksimal.
2. Analisis Analitik (Bivariat)
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan
analisis lebih lanjut. Apabila diinginkan analisis hubungan antar dua variabel,
maka analisis dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui
hubungan antara berat badan dengan tekanan darah. Untuk mengetahui
hubungan dua variabel tersebut biasanya digunakan pengujian statistik. Jenis
uji statistik yang digunakan sangat tergantung jenis data/variabel yang
dihubungkan.
3. Analisis Multivariat
Merupakan analisis yang menghubungkan antara beberapa variabel
independen dengan satu variabel dependen.
5 ( DESKTIPTIF)
X = Xi / n
2). Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai
nialai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda
dengan nilai mean, penghitungan median hanya mempertimbangkan urutan
nilai dasil pengukuran, besar beda antar nilai di abaikan. Karena
mengabaikan besar beda, maka median tidak dipengaruhi oleh nilai ekstrim.
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke
besar b). Hitung posisi median dengan rumus
(n+1)/2 c). Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th
Data diurutkan: 20, 24, 26, 30, 36, 40
Posisi = (6+1)/2 = 3,5
Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28
Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa
berumur di atas 28 tahun
3). Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun
2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “ Variable (s)”
3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:
Frequencies
Statistics
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 10 20.0 20.0 20.0
2 11 22.0 22.0 42.0
3 16 32.0 32.0 74.0
4 13 26.0 26.0 100.0
Total 50 100.0 100.0
Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada
contoh di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang
berpendidikan SD, proporsi dapat dilihat pada kolom ‘ Percent’, pada contoh di
atas ada 20% ibu yang berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil
yang sama karena pada data ini tidak ada ’missing cases’. ‘Cumulative Percent’
menjelaskan tentang persent kumulatif. Pada contoh di atas ada 42,0% ibu yang
tingkat pendidikannya SD dan SMP. Dalam menginterpretasikan tabel katagorik
dapat dilihat dari variasi dan konsentrasi datanya.
b. Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan
ukuran tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata,
median dan modus. Sedangkan ukuran sebarannya (variasi) yang digunakan
adalah range, standard deviasi, minimal dan maksimal. Pada SPSS ada dua cara
untuk mengeluarkan analisis deskriptif yaitu dapat melalaui perintah
‘Frequencies’ atau perintah ‘Expolre’. Biasanya yang digunakan adalah
Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada menu
‘Frequencies’ sangat lengkap (seperti mean, median, varian dll), selain itu pada
perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya.
Berikut akan dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan
menggunakan perintah frequencies.
1. Aktifkan data “susu.sav”
2. Pilih ‘Analyze’
3. Pilih ‘Descriptive Statistic’
4. Pilih ‘Frequencies’, terlihat kotak frequencies:
5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda
panahsehingga umur masuk ke kotak variable (s).
6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya mean,
median, standard seviasi, minimum, maximum, SE.
7. Klik ‘Continue’
8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu
klik ‘With Normal Curve’
9. Klik ‘Continue’
10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistik
yang diminta dan dibawahnya tampak grafik histogram beserta curve
normalnya.
Frequencies
Statistics
Cumulative
Frequency Percent Valid Percent Percent
Valid 19 7 14.0 14.0 14.0
20 3 6.0 6.0 20.0
21 3 6.0 6.0 26.0
22 5 10.0 10.0 36.0
23 5 10.0 10.0 46.0
24 4 8.0 8.0 54.0
25 2 4.0 4.0 58.0
26 5 10.0 10.0 68.0
27 3 6.0 6.0 74.0
30 3 6.0 6.0 80.0
31 3 6.0 6.0 86.0
32 3 6.0 6.0 92.0
34 2 4.0 4.0 96.0
35 2 4.0 4.0 100.0
Total 50 100.0 100.0
Histogram
5
Frequency
Mean = 25.1
Std. Dev. = 4.85
0
N = 50
15 20
25 30 35
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan
nilai standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas,
rata-rata umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi
4,85 tahun dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi
frekuensi ditampilkan menurut umur termuda sampai dengan umur tertua
dengan informasi tentang jumlah dan persentasenya. Bentuk distribusi data
dapat diketahui dari grafik histogram dan kurve normalnya. Dari tampilan grafik
dapat dilihat bahwa distribusi variabel umur berbentuk normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk
melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi
interval lakukan analisis eksplorasi data dengan perintah ‘ Explore’. Adapun
caranya sbb:
1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu
‘descriptive Statistics’, lalu pilih ‘Explore’
2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan
‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:
4. Klik ‘Continue’
5. Klik ‘OK’, hasilnya dapat dilihat di layar:
Explore
Descriptives
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu menyusui .130 50 .035 .920 50 .002
a. Lilliefors Significance Correction
7.00 1 . 9999999
20.00 2 . 00011122222333334444
10.00 2 . 5566666777
11.00 3 . 00011122244
2.00 3 . 55
Stem width: 10
Each leaf: 1 case(s)
Normal Q-Q Plot of umur ibu menyusui
1
Expected Normal
-1
-2
15 20 25 30 35
Observed Value
35
30
25
20
15
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x
Variabel Mean SD Minimal- Maksimal 95% CI
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72
– 26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur
tertua 35 tahun. Dari hasil estimasi interval dapat disimpulkan bahwa 95%
diyakini bahwa rata-rata umur ibu adalah diantara 23,72 sampai dengan 26,48
tahun.
ANALISIS BIVARIAT
6
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan
analisis lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis
pembayaran berobat dan kepuasan pasien, kita hanya melakukan
pendeskripsian sendiri-sendiri untuk variabel jenis pembayaran dan kepuasan
pasien. Untuk variabel jenis pembayaran akan diketahui berapa persen yang
berobat dengan biaya sendiri dan berapa persen yang dibiayai askes. Begitu juga
untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan
berapa persen yang tidak puas.
Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh
diatas berarti kita ingin mengetahui hubungan jenis pembayaran dengan
kepuasan pasien, maka analisis dilanjutkan pada tingkat bivariat. Pada analisis
bivariat kita dapat mengetahui apakah ada perbedaan kepuasan pasien antara
pasien dengan membayar sendiri dengan pasien dengan biaya askes. Kegunaan
analisis bivariat bisa untuk mengetahui apakah ada hubungan yang siginifikan
antara dua variabel, atau bisa juga digunakan untuk mengetahui apakah ada
perbedaan yang signifikan antara dua atau lebih kelompok(sampel).
UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan
keputusan tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau
hubungan, cukup menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini
didasarkan pada besarnya peluang untuk memperoleh hubungan tersebut secara
kebetulan (by chance). Semakin kecil peluang tersebut (peluang adanya by
chance), semakin besar keyakinan bahwa hubungan tersebut memang ada.
Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk
memutuskan berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru
lebih baik daripada yang sekarang beraedar di pasaran. Untuk menjawab
pertanyaan ini maka perlu dilakukan pengujian hipotesis. Dengan pengujian
hipotesis akan diperoleh suatu kesimpulan secara probalistik apakah vaksin baru
tersebut lebih baik dari yang sekarang beredar di pasaran atau malah sebaliknya.
Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel
(data hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan.
Peluang untuk diterima atau ditolaknya suatu hipotesis tergantung besar
kecilnyanya perbedaan antara nilai sampel dengan nilai hipotesis. Bila perbedaan
tersebut cukup besar, maka peluang untuk menolak hipotesis besar pula,
sebaliknya bila perbedaan tersebut kecil, maka peluang untuk menolak hipotesis
menjadi kecil. Jadi, makin besar perbedaan antara nilai sampel dengan nilai
hipotesis, makin besar peluang untuk menolak hipotesis.
Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua
kemungkinan yaitu menolak hipotesis dan menerima hipotesis (gagal menolak
hipotesis). Perlu dipahami bahwa arti menerima hipotesis sebetulnya kurang
tepat, yang tepat adalah gagal menolak hipotesis. Dalam uji hipotesis bila
kesimpulannya menerima hipotesis, bukan berarti bahwa kita telah membuktikan
hipotesis tersebut benar, karena benar atau tidaknya suatui hipotesis hanya
dapat dibuktikan dengan mengadakan observasi pada seluruh populasi, dan hal
ini sangat sulit bahkan tidak mungkin untuk dilakukan. Jadi menerima hipotesis
sebetulnya artinya adalah kita tidak cukup bukti untuk menolak hipotesis, dengan
kata lain dapat diartikan kita gagal menolak hipotesis. Untuk memperjelas
pengertian bahwa “gagal menolak hipotesis berbeda dengan mengakui
kebenaran hipotesis (menerima hipotesis”, kita coba analogkan proses
persidangan kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan
membuktikan kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau
sitertuduh benar. Pengadilan memutuskan bahwa si tertuduh tidak dapat
dibuktikan bersalah, bukan memutuskan tidak bersalah. Dari uraian tersebut
sangatlah jelas bahwa istilah yang tepat dalam kesimpulan uji hipotesis adalah
gagal menolak hiopotesis, dan bukan menerima hipotesis.
1. Hipotesis
Hipotesis berasal dari kata hupo dan thesis. Hupo artinya
sementara/lemah kebenarannya dan thesis artinya pernyataan/teopri. Dengan
demikian hipotesis berarti pernyataan yang perlu diuji kebenarannya. Untuk
menguji kebenaran sebuah hipotesis digunakan pengujian yang disebut
pengujian hipotesis.
Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol
(Ho) dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang
masing-masing hipotesis tersebut.
a. Hipotesis Nol (Ho).
Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara
kedua kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara
variabel satu dengan variabel lainnya
Contoh:
1). Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari
ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak
merokok
2). Tidak ada hubungan antara merokok dengan berat badan bayi
Pengertian Nilai P
Nilai p merupakan nilai yang menunjukkan besarnya peluang salah
menolak Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai
besarnya peluang hasil penelitian (misal adanya perbedaan mean atau proporsi)
terjadi karena faktor kebetulan (by chance). Harapan kita nilai p adalah sekecil
mungkin, sebab bila nilai p-nya kecil maka kita yakin bahwa adanya perbedaan
pada hasil penelitian menunjukkan pula adanya perbedaan di populasi. Dengan
kata lain kalau nilai p-nya kecil maka perbedaan yang ada pada penelitian terjadi
bukan karena faktor kebetulan (by chance).
Contoh:
Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan
berat badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa rata-
rata berat badan bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat
badan bayi yang lahir dari ibu yang tidak hipertensi adalah 3000 gram.
Perbedaan berat bayi antara ibu yang hipertensi dengan ibu yang tidak
hipertensi sebesar 100 gram. Pertanyaan yang timbul adalah apakah perbedaan
berat badan bayi tersebut juga berlaku untuk seluruh populasi yang diteliti atau
hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut kemudian
dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p = 0,0110
maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat
dari faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena
peluangnya sangat kecil (p=0,0110), maka dapat diartikan bahwa adanya
perbedaan tersebut bukan karena faktor kebetulan namun karena memang
karena adanya riwayat hipetensi.
Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat
- Fisher Exact
- ANOVA
- Regresi
ANALISIS BIVARIAT HUBUNGAN
7 KATAGORIKDENGAN NUMERIK
Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah
parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan
tekanan darah penduduk dewasa orang kota dengan orang desa. Atau, apakah
ada perbedaan berat badan antar sebelum mengikuti program diet dengan
sesudahnya. Uji statistik yang membandingkan mean dua kelompok data ini
disebut uji beda dua mean. Pendekatan ujinya dapat menggunakan pendekatan
distribusi Z dan distribusi t , sehingga pada uji beda dua mean bisa
menggunakan uji Z atau uji t, namun lebih sering digunakan uji t.
Sebelum kita melakukan uji statistik dua kelompok data, kita perlu
mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok
yang independen atau berasal dari dua kelompok yang
dependen/pasangan. Dikatakan kelompok independen bila data kelompok
yang satu tidak tergantung dari kelopok kedua, misalnya membandingkan mean
tekanan darah sistolik orang desa dengan orang kota. Tekanan darah orang
kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua
kelompok data dikatakan dependen/pasangan bila kelompok data yang
dibandingkan datanya saling mempunyai ketergantungan, misalnya data berat
badan sebelum dan sesudah mengikuti program diet berasal dari orang yang
sama (data sesudah dependen/tergantung dengan data sebelum).
Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi
dalam dua kelompok, yaitu: uji beda mean independen (uji T independen) dan
uji beda mean dependen (uji T dependen).
Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua
kelompok data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah
varian kedua kelompok yang diuji sama atau tidak. Bentuk varian kedua
kelompok data akan berpengaruh pada nilai standar error yang akhirnya akan
membedakan rumus pengujiannya.
a. Uji untuk varian sama
Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. uji
Z dapat digunakan bila standar deviasi populasi () diketahui dan jumlah
sampel besar (>30). Apabila kedua syarat tersebut tidak terpenuhi maka
dilakukan uji . pada umumnya nilai sulit diketahui, sehingga uji beda dua
mean biasanya menggunakan uji T (T Test). Untuk varian yang sama maka
bentuk ujinya sbb:
X1 – X2
T=
Sp(1/n1) + (1/n2)
X1 – X2
T=
(S12/n1) + (S22/n2)
[(S12/n1) + (S22/n2)]2
df = [(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]
S12
F=
S22
d
T=
S_d / n
1. Uji t independen
Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji hubungan
perilaku menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada
perbedaan kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang
menyusuinya tidak eksklusif, caranya:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
3. Pada layar tampak kotak yang di dalamnya ada kotak ‘ Test variable (s)’I dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’
5. Klik variabel ‘eksklu’ dan masukkan ke kotak‘Grouping Variable’.
6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada contoh ini, kita
tahu bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’ untuk Yang
eksklusif. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2”
7. Klik “Continue”
8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
Std. Error
status menyusui asi N Mean Std. Deviation Mean
kadar hb pengukuran tdk EKSKLUSIVE 24 10.421 1.4712 .3003
pertama EKSKLUSIVE 26 10.277 1.3228 .2594
Levene's Test
for Equality of
Variances t-test for Equality of Means
Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan
standar error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb
ibu yang menyusui ekslusif adalah 10,277 gr% dengan standar deviasi 1,322
gr%, sedangkan untuk ibu yang menyusui non eksklusif, rata-rata kadar Hb-nya
adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua
uji T, yaitu uji T dengan asumsi varian kedua kelompok sama ( equal variances
assumed) dan uji T dengan asumsi varian kedua kelompok tidak sama ( equal
variances not assumed). Untuk, memilih uji mana yang kita pakai, dapat dilihat
uji kesamaan varian melalui uji Levene. Lihat nilai p Levene test, nilai p < alpha
(0,05) maka varian berbeda dan bila nilai p > alpha (0,05) maka varian sama
(equal). Pada uji Levene di atas menghasilkan nilai p = 0,790 sehingga dapat
disimpulkan bahwa pada alpha 5%, didapat tidak ada perbedaan varian (varian
kedua kelompok sama). Selanjutnya dicari p value uji t pada bagian varian sama
(equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717 artinya tidak ada
perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui eksklusif
dengan ibu yang menyusui non eksklusif.
Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan
standar deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif
rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji statistik didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak
ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui
secara eksklusif dengan non eksklusif.
2. Uji T Dependen
Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji
T dependen sering digunakan pada analisis data penelitian eksperimen. Seperti
sudah dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau
kedua kelompok sampel yang dibandingkan mempunyai subyek yang sama.
Dengan kata lain disebut dependen bila responden diukur dua kali/diteliti dua
kali, sering orang mengatakan penelitian pre dan post. Misalnya kita ingin
membandingkan berat badan antara sebelum dan sesudah mengikuti program
diet.
Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb
pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui
apakah ada perbedaan kadar Hb antara pengukuran pertama dengan
pengukuran kedua. Disini terlihat sampelnya dependen karena orangnya sama
diukur dua kali. Adapun langkahnya:
1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file ini.
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Paired-Samples T Test”
3. Klik ‘hb1’
4. Klik ‘hb2’
5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan
6. Klik ‘OK’ hasilnya tampak sbb
T-Test
Std. Error
Mean N Std. Deviation Mean
Pair kadar hb pengukuran
10.346 50 1.3835 .1957
1 pertama
kadar hb pengukuran
10.860 50 1.0558 .1493
kedua
N Correlation Sig.
Pair kadar hb pengukuran
1 pertama & kadar 50 .707 .000
hb pengukuran
kedua
Paired Differences
95% Confidence
Std. Std. Interval of the Sig.
Deviati Error Difference (2-taile
Mean on Mean Lower Upper t df d)
Pair kadar hb
1 pengukuran
pertama - kadar -.5140 .9821 .1389 -.7931 -.2349 -3.701 49 .001
hb pengukuran
kedua
8 KATEGORIKDENGAN NUMERIK
UJI ANOVA
Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data
baik yang independen maupun dependen. Namun seringkali kita jumpai jumlah
kelompok yang lebih dari dua, misalnya ingin mengetahui perbedaan mean berat
badan bayi untuk daerah Bekasi, Bogor dan Tangerang. Dalam menganalisis data
seperti ini (> 2 kelompok) sangat tidak dianjurkan menggunakan uji T.
kelemahan menggunakan uji T adalah; pertama kita melakukan uji berulang kali
sesuai kombinasi yang mungkin, kedua, bila melakukan uji T berulang kali akan
meningkatkan (inflasi) nilai , artinya akan meningkatkan peluang hasil yang
keliru.
Perubahan inflasi sebesar = 1 – (1-)n
Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang
tepat) dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji
F.
Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua
sumber variasi yaitu variasi dalam kelompok ( within) dan variasi antar kelompok
(between). Bila variasi within dan between sama (nilai perbandingan kedua
varian sama dengan 1) maka mean-mean yang dibandingkan tidak ada
perbedaan, sebaliknya bila hasil perbandingan tersebut menghasilkan lebih dari
1, maka mean yang dibandingkan menunjuk ada perbedaan.
Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor
(one way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas
analisis varian satu faktor (one way).
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1. Varian homogen
2. Sampel/kelompok independen
3. Data berdistribusi normal
4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk
katagori yang lebih dari 2 kelompok.
Sb2
F= df = k-1 € untuk
Sw2
pembilang n-k € untuk
penyebut
(n1-1)S12 + (n2-1)S
2 2 ++ (nk-1)Sk2
Sw2 = N-k
df = n – k
Dengan level of significance () sbb:
* =
(k2)
Kasus:
UJI ANOVA
Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan
berat badan bayi. Variabel pendidikan merupakan variabel katagorik dengan 4
katagori. Variabel berat bayi berbentuk numerik sehingga uji yang digunakan
ANOVA. Adapun caranya sbb:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul menu
One Way NOVA
3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak
Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik dan kotak
‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada kotak
Dependen diisi variabel “bbbayi” pada kotak Factor diisi variabel “Didik”.
4.
5. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”
6. Klik “Continue”
7. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”
8. Klik “Continue”
9. Klik “OK”
Oneway
Descriptives
ANOVA
Multiple Comparisons
(I) (J)
pendidika pendidikan Mean
n formal formal ibu 95% Confidence Interval
Difference
ibu menyusui (I-J) Std. Error Sig. Lower Bound Upper Bound
SD SMP -257.273 129.294 .315 -613.76 99.21
SMU -961.250* 119.286 .000 -1290.14 -632.36
PT -1291.538* 124.468 .000 -1634.72 -948.36
SMP SD 257.273 129.294 .315 -99.21 613.76
SMU -703.977* 115.902 .000 -1023.54 -384.42
PT -1034.266* 121.228 .000 -1368.51 -700.02
SMU SD 961.250* 119.286 .000 632.36 1290.14
SMP 703.977* 115.902 .000 384.42 1023.54
PT -330.288* 110.492 .027 -634.93 -25.64
PT SD 1291.538* 124.468 .000 948.36 1634.72
SMP 1034.266* 121.228 .000 700.02 1368.51
SMU 330.288* 110.492 .027 25.64 634.93
*. The mean difference is significant at the .05 level.
Dari print out ini diperoleh rata-rata berat bayi dan stndar deviasi masing-masing
kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah
2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang
berpendidikan SMP rata-rata berat bayinya adalah 2727,2 gram dengan standar
deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat
bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka
yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan
standar deviasi 386,3 gram.
Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”,
terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005),
berarti pada alpha 5%, dapat disimpulkan ada perbedaan berat bayi diantara
keempat jenjang pendidikan.
Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons Bonferroni”
yang berguna untuk menelusuri lebih lanjut kelompok mana saja yang
berhubungan signifikan. Untuk mengetahui kelompok yang signifikan dapat
terlihat dari kolom Sig. Ternyata kelompok signifikan adalah tingkat pendidikan
SD dengan SMU, SD dengan PT, SMP dengan SMU, SMP dengan PT dan SMU
dengan PT.
9 KATAGORIKDENGAN KATAGORIK
Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat
dinyatakan dalam bentuk angka-angka pengukuran (data numerik). Sebaliknya
justru yang kita jumpai adalah data hasil dari menghitung jumlah pengamatan
yang diklasifikasikan atas beberapa katagori. Data seperti ini disebut data
katagorik (kualitatif), misalnya jenis kelamin yang mempunyai katagori: laki-laki
dan perempuan; status merokok yang mempunyai katagori; perokok berat,
perokok ringan dan tidak merokok. Dalam penelitian kesehatan seringkali peneliti
perlu melakukan analisis hubungan variabel katagorik dengan variabel katagorik.
Analisis ii bertujuan untuk menguji perbedaan proporsi dua atau lebih kelompok
sampel. Uji statistik yang digunakan untuk menjawab kasus tersbut adalah UJI
KAI KUADRAT (CHI SQUARE).
Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku
menyusui ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif
antara ibu yang bekerja dengan ibu yang tidak bekerja. Dari contoh terlihat
bahwa variabel jenis pekerjaan (bekerja/tidak bekerja) merupakan variabel
katagorik, dan variabel perilaku menyusui (eksklusif/non eksklusif) juga
merupakan variabel katagorik.
Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita
pahami dengan benar apa itu variabel katagorik. Suatu variabel disebut
katagorik bila isi variabel tersebut terbentuk dari hasil klasifikasi/penggolongan,
misalnya variabel sex, jenis pekerjaan, golongan darah, pendidikan. Di lain
pihakvariabel numerik (misalnya berat badan, umur dll) dapat masuk/dapat
SUTANTO PRIYO HASTONO: Analisis
Data
menjadi variabel katagorik bila variabel tersebut sudah mengalami
pengelompokan. Misalkan kita ambil satu contoh variabel berat badan, berat
badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih termasuk variabel
numerik, namun bila sudah dilakukan pengelompokan menjadi (<50 kg (kurus),
50-60 kg (sedang) dan > 60 (gemuk) maka variabel tersebut sudah berjenis
katagorik.
df = (k-1)(n-1)
ket :
O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan
dalam bentuk tabel silang:
Variabel 2
Variabel 1 Jumlah
Tinggi Rendah
Ya a b a+b
Tidak c d c+d
Jumlah a+c b+d n
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan)
masing-masing sel dicari dengan rumus:
N (ad-bc)2
X2 =
(a+c)(b+d)(a+b)(c+d)
118
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang
besar. Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya
digunakan uji kai kuadrat yang sudah dikoreksi ( Yate Corrected atau Yate’s
Correction). Formula kai kuadrat Yate’s Correction adalah sbb:
(|O – E| - 0,5)2 X2 =
E
atau
N {|ad-bc|2 – (N/2)]2 X2 =
(a+c)(b+d)(a+b)(c+d)
Pengkodean Variabel :
Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hati-
hati jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada
konsistensi antara variabel independen dengan variabel dependen. Untuk
variabel independen, kelompok yang berisiko/expose diberi kode tinggi (kode
1) dan kode rendah (kode 0)untuk kelompok yang tidak berisiko/non expose.
Pada variabel dependennya, kode tinggi (kode 1) untuk kelompok kasus atau
kelompok yang menjadi fokus pembahasan penelitian dan kode rendah (kode 0)
untuk kelompok non kasus atau yang bukan menjadi fokus penelitian. Sebagai
contoh data di atas pengkodeannya adalah sbb: Ibu tidak bekerja diberi kode 1
dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi kode 1 dan
non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus
konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0,
tdk eksklusive =1.
Tabel …
Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan
Total
Pendidikan Rendah Tinggi
N % n % n %
SD 25 50,0 25 50,0 50 34,4
SMP 16 40,0 24 60,0 40 27,6
SMU 10 33,3 20 66,7 30 20,7
PT 5 20,0 20 80,0 25 17,3
Jumlah 56 38,7 89 61,3 145 100,0
Kanker Paru
Jenis Total
Kasus Kontrol
Kelamin
n % N % n %
Laki-laki 75 75,0 30 30,0 105 52,5
Perempuan 25 25,0 70 70,0 95 47,5
Jumlah 100 50,0 100 50,0 200 100,0
Interpretasinya:
Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden
berjenis kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita
kanker paru, ada sebanyak (30%) responden yang berjenis kelamin laki-laki.
KASUS :
UJI KAI KUADRAT
6. Klik “Continue”
7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”
8. Klik “Continue”
9. Klik “OK” hasilnya tampak sbb:
Crosstabs
Chi-Square Tests
Risk Estimate
95% Confidence
Interval
Value Lower Upper
Odds Ratio for status
pekerjaan ibu (TIDAK 5.464 1.627 18.357
KERJA / KERJA)
For cohort status
menyusui asi = YA 2.250 1.209 4.189
EKSKLUSIVE
For cohort status
menyusui asi = .412 .208 .816
TIDAK EKSKLUS
N of Valid Cases 50
Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola
menyusui, dengan angka di masing-masing selnya. Angka yang paling atas
adalah jumlah kasus masing-masing sel, angka kedua adalah persentase
menurut baris (data yang kita analisis “ASI.SAV, berasal dari penelitian Cross
Sectional sehingga persen yang ditampilkan adalah persentase baris, namun bila
junis penelitiannya Case Control angka persentase yang digunakan adalah
persentase kolom)
Dari analisis data di atas maka interpretasinya:
Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara
eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui
secara eksklusif.
Hasil uji Chi Square dapat dilihat pada kotak “Chi Square Test”. Dari print
out muncul dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan,
“Angka yang mana yang kita pakai?”, apakah Pearson, Continuity Correction,
Likelihood atau Fisher?”
Aturan yang berlaku pada Chi Square adalah sbb:
a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang
digunakan adalah “Fisher’s Exact Test”
b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya
“Continuity Correction (a)”
c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji
“Pearson Chi Square”
d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya
digunakan untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada
bidang epidemiologi dan juga untuk mengetahui hubungan linier dua variabel
katagorik, sehingga kedua jenis ini jarang digunakan.
Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b
dibawah kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti
pada tabel silang diatas tidak ditemukan ada nilai E < 5
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan
koreksi (Continuity Correction) dengan p value dapat dilihat pada kolom
“Asymp. Sig” dan terlihat p valuenya = 0,011. berarti kesimpulannya ada
perbedaan perilaku menyusui eksklusif antara ibu yang bekerja dengan ibu yang
tidak bekerja. Dengan kata lain dapat disimpulkan bahwa ada hubungan status
pekerjaan dengan perilaku menyusui eksklusif.
Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya
hubungan dua variabel, sehingga uji ini tidak dapat untuk mengetahui
derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan
hubungan banyak metodenya tergantung latar belakangdisiplin keilmuannya,
misal untuk ilmu sosial dengan melihat koefisien Phi, koefisien Contingency dan
cramer’s V. sedangkan untuk bidang kesehatan terutama kesehatan masyarakat
digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis penelitian Cross
Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis penelitiannya
Kohort.
Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464
(95% CI: 1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort
yaitu bearnya 2,250 (95% CI: 1,209 – 4,189). Pada data ini berasal dari
penelitian Cross Sectional maka kita dapat menginterpretasikan nialai OR=5,464
sbb: Ibu yang tidak bekerja mempunyai peluang 5,46 kali untuk menyusui
eksklusif dibandingkan ibu yang bekerja.. Pada perintah Crosstab nilai OR akan
keluar bila tabel silang 2 x 2, bila tabel silang lebih dari 2 x 2, misalnya 3 x 2, 4 x
2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi logistik sederhana
dengan cara membuat “Dummy variable”
Penyajian dan Interpretasi di Laporan Penelitian:
Tabel …
Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui
10 NUMERIKDENGAN NUMERIK
1. Korelasi
Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan,
korelasi dapat juga untuk mengetahui arah hubungan dua variabel numerik.
Misalnya, apakah huubungan berat badan dan tekanan darah mempunyai derajat
yang kuat atau lemah, dan juga apakah kedua variabel tersebut berpola positif
atau negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat
dari diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang
menunjukkan titik-titik perpotongan nilai data dari dua variabel (X dan Y). Pada
umumnya dalam grafik, variabel independen (X) diletakkan pada garis horizontal
sedangkan variabel dependen (Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan
antara dua variabel X dan Y. selain memberi informasi pola hubungan dari kedua
variabel diagram tebar juga dapat menggambarkan keeratan hubungan dari
kedua variabel tersebut.
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya
antara –1 s.d. +1.
r = 0 € tidak ada hubungan linier
r = -1 € hubungan linier negatif
sempurna r = +1 € hubungan linier
positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan
positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya
semakin bertambah berat badannya (semakin gemuk) semakin tinggi tekanan
darahnya. Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel
diikuti penurunan variabel yang lain, misalnya semakin bertambah umur
(semakin tua) semakin rendah kadar Hb-nya.
Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat
dibagi dalam 4 area, yaitu:
r = 0,00 – 0,25 € tidak ada hubungan/hubungan elmah r = 0,00 – 0,25 € hubungan sedang
r = 0,00 – 0,25 € hubungan kuat
r = 0,00 – 0,25 € hubungan sangat kuat / sempurna
Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama
untuk menjelaskan derajat hubungan derajat hubungan linier anatara dua
variabel. Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah
hubungan antara dua variabelteradi secara signifikan atau hanya karena faktor
kebetulan dari random sample (by chance). Uji hipotesis dapat dilakukan dengan
dua cara, yaitu pertama: membandingkan nilai r hitung dengan r tabel, kedua:
menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita
gunakan pendekatan distribusi t, dengan formula:
n–2
t=r
1 – r2
df = n – 2
n = jumlah sampel
132
Y = a + bx + e
SUTANTO PRIYO HASTONO: Analisis
Data
dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan
garis yang dibentuk menjadi:
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X
berubah satu unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati
dengan nilai Y yang sesungguhnya pada titik X tertentu
XY – (XY)/n
b= a = Y - bX
X2 – (X)2/n
134
Se =Y2 - aY - bXY
n-2
Correlations
berat berat
badan ibu badan bayi
berat badan ibu Pearson Correlation 1 .684**
Sig. (2-tailed) .000
N 50 50
berat badan bayi Pearson Correlation .684** 1
Sig. (2-tailed) .000
N 50 50
**. Correlation is significant at the 0.01 level (2-tailed).
Regression
Model Summary
Sum of
Model Squares df Mean Square F Sig.
1 Regression 7820262 1 7820261.965 42.154 .000a
Residual 8904738 48 185515.376
Total 16725000 49
a. Predictors: (Constant), berat badan ibu
b. Dependent Variable: berat badan bayi
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 657.929 391.676 1.680 .099
berat badan ibu 44.383 6.836 .684 6.493 .000
a. Dependent Variable: berat badan bayi
Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu
nilai berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada
kolom Sig T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak
hipotesis nol, berarti ada hubngan linier antara berat badan ibu dengan berat
badan bayi. Dari nilai b=44,38 berarti bahwa variabel berat badan bayi akan
bertambah sebesar 44,38 gr bila berat badan ibu bertambah setiap satu
kilogram.
Tabel …
Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi
Variabel R R2 Persamaan garis P value
Umur 0,684 0,468 bbayi =657,93 + 44,38*bbibu 0,0005
Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan
kuat (r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu
semakin besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468
artinya , persamaan garis regresi yang kita peroleh dapat menerangkan 46,8,6%
variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk
menjelaskan variabel berat badan bayi. Hasil uji statistik didapatkan ada
hubungan yang signifikan antara berat badan ibu dengan berat badan bayi
(p=0,005).
Ingat prediksi regresi tidak dapat menghasil;kan angka yang tepat seperti di
atas, namun perkiraannya tergantung dari nilai ‘ Std, Error of The estimate’(SEE)
yang besarnya adalah 430,715 (lihat di kotak Model Summary). Dengan
demikianvariasi variabel dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan
tingkat kepercyaan 95% dan didapat nilai Z = 1,96, sehingga variasinya 1,96 *
430,715 = 844,201
Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg
diprediksikan berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr
5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek
reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok.
Untuk masing-masing sampel dibuat model dengan variabel yang sama,
kemudian bandingkan antara model 1 dan model 2, bila hasilnya
sama/hampir sama maka model regresi reliabel. Bila model reliabel maka
seluruh sampel dapat digunakan untuk pembuatan model.
KASUS:
REGRESI LINIER GANDA
Sebagai latihan kita melakukan analisis penelitian “faktor-faktor yang
berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV.
Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur
ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami
prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya
berat badan bayi (BWT).
Kode variabel pada file data : LBW.SAV
Nama Definisi Operasional Hasil Ukur
Id Nomor Identitas
Low Kondisi bayi dalam klasifikasi BBLR 0 = ≥ 2500 g
1 = < 2500 g
Age Umur ibu tahun
Lwt Berat ibu pada saat menstruasi terakhir pounds
Race Suku bangsa/ras 1= putih
2= hitam
3 = lainnya
Smoke Kebiasaan merokok selama hamil 0 = tidak
1 = ya
Ptl Riwayat mengalami prematur 0 = tidak
1 = ya
Ht Riwayat menderita hipertensi 0 = tidak
1 = ya
Ui Terjadi/mengalami iritability Uterine 0 = tidak
1 = ya
Ftv Frekuensi periksa hamil pada trimester pertama 0 ,1, 2 dst..
Bwt Berat badan bayi gram
Data selengkapnya ada di lampiran:
Correlations
No
Weight of physician History Birth
Age of mother visits in of weight
mother (pounds) first prematur (gram)
trimester e labor
Age of mother Pearson Correlation 1 .180* . .072 .090
215**
Sig. (2-tailed) .013 .003 .328 .219
N 189 189 189 189 189
Weight of mother Pearson Correlation .180* 1 .141 -.140 .186*
(pounds) Sig. (2-tailed) .013 .054 .055 .010
N 189 189 189 189 189
No physician visits Pearson Correlation . .141 1 -.044 .058
in first trimester Sig. (2-tailed) 215** .054 .544 .426
.003
N
189 189 189 189 189
9. Klik “Continue”
10. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
Std. Error
Smoking status N Mean Std. Deviation Mean
Birth weight (gram) No 115 3054.96 752.409 70.163
Yes 74 2773.24 660.075 76.732
Independent Samples Test
Levene's Test
for Equality of
Variances t-test for Equality of Means
95% Confidence
Sig. Mean Std. Error Interval of the
(2-tail Differen Differenc Difference
F Sig. t df ed) ce e Lower Upper
Birth Equal
weight variances 1.508 .221 2.634 187 .009 281.713 106.969 70.693 492.7
(gram) assumed
Equal
variances
2.709 170.0 .007 281.713 103.974 76.467 487.0
not
assumed
2. Riwayat Hipertensi
Langkahnya:
1.Dari menu utama SPSS, pilih menu ‘ Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
2.Pada layar tampak kotak yang di dalamnya ada kotak ‘ Test variable’ dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’
4.Klik variabel ‘ht’ dan masukkan ke kotak ‘Grouping Variable’. (variabel yang
sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
6.Klik “Continue”
7.Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
Group Statistics
Std. Error
History of hypertension N Mean Std. Deviation Mean
Birth weight (gram) No 177 2972.31 709.226 53.309
Yes 12 2536.75 917.341 264.813
Independent Samples Test
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan
berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga
variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat
Regression
Model Summary
Sum of
Model Squares df Mean Square F Sig.
1 Regression 11543236 6 1923872.611 3.962 .001a
Residual 88373817 182 485570.423
Total 99917053 188
a. Predictors: (Constant), No physician visits in first trimester, Smoking status,
History of hypertension, History of premature labor, Age of mother, Weight of
mother (pounds)
b. Dependent Variable: Birth weight (gram)
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2315.862 299.442 7.734 .000
Age of mother 7.162 10.022 .052 .715 .476
Weight of mother
4.793 1.777 .201 2.698 .008
(pounds)
Smoking status -232.253 105.928 -.156 -2.193 .030
History of premature labor -154.002 106.574 -.104 -1.445 .150
History of hypertension -574.230 215.481 -.193 -2.665 .008
No physician visits in first
-2.847 49.705 -.004 -.057 .954
trimester
a. Dependent Variable: Birth weight (gram)
Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya
keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar
11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik
(lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi
secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus
yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di
cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model.
Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3
variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur
(history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap
berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel
dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba
keluarkan adalah frekuensi anc(No physician..).
Langkahnya:
1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan
biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel,
namun sekarang anda harus keluarkan variabel ‘no physician’ dan
masukkan ke kotak Variable di sebelah kiri.
3. Klik OK, dan hasilnya sbb:
Model Summary
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2317.608 297.074 7.801 .000
Age of mother 7.051 9.807 .051 .719 .473
Weight of mother
4.781 1.759 .201 2.718 .007
(pounds)
Smoking status -232.224 105.638 -.156 -2.198 .029
History of premature labor -153.747 106.191 -.104 -1.448 .149
History of hypertension -573.011 213.841 -.192 -2.680 .008
a. Dependent Variable: Birth weight (gram)
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah
dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square
dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi
dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R
Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk
coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum
dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Model Summary
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026
History of premature labor -145.412 105.417 -.098 -1.379 .169
History of hypertension -582.566 213.148 -.195 -2.733 .007
a. Dependent Variable: Birth weight (gram)
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %,
dengan demikian variabel umur kita keluarkan dari model.
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 2390.105 230.391 10.374 .000
Weight of mother
5.352 1.710 .224 3.130 .002
(pounds)
Smoking status -263.009 103.812 -.177 -2.534 .012
History of hypertension -586.722 213.646 -.197 -2.746 .007
a. Dependent Variable: Birth weight (gram)
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan
perubahan Coef. B dapat dilihat sbb:
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
7. Klik Continue
8. Klik tombol ‘Plot”
9. Masukkan ‘SRESID’ ke kotak Y, dan masukan ‘ZPRED’ ke kotak X (perintah ini
untuk uji asumsi Homoscedasity)
10. Klik kotak ‘histogram’ dan kotak ‘Normal probability plot” (perintah ini untuk
uji asumsi Normality)
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan
standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi
b. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai
dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk
mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin
Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Model Summaryb
Dari hasil uji didapatkan koefisien Durbin Watson 0,222, berarti asumsi
independensi terpenuhi.
c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X 1, X2, X3, …, Xk terletak
pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)
bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil
uji asumsi :
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 11291987 4 2822996.778 5.861 .000a
Residual 88625066 184 481657.965
Total 99917053 188
a. Predictors: (Constant), History of premature labor, History of hypertension,
Smoking status, Weight of mother (pounds)
b. Dependent Variable: Birth weight (gram)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas
terpenuhi
d. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity
dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran
tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka
dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi
homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola
tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka
diduga variannya terjadi heteroscedasticity.
Scatterplot
3
Regression Studentized Residual
-1
-2
-3
-4
-3 -2 -1 0 1 2 3
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara
titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi
homoscedasity terpenuhi
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
Histogram
40
30
Frequency
20
10
Mean = -2.53E-16
Std. Dev. = 0.989
0 N = 189
-4 -3 -2 -1 0 1 2 3
0.8
Expected Cum Prob
0.6
0.4
0.2
0.0
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk
distribusinya normal, berarti asumsi normality terpenuhi.
f. Diagostik Multicollinearity
Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi
secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari
nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka
mengindikasikan telah terjadi collinearity.
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian
tidak ada Multicollinearity antara sesama variabel indepeden
Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi
sehingga model dapat digunakan untuk memprediksi berat badan bayi.
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
a. Dependent Variable: Birth weight (gram)
Interpretasi model:
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada
kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut
dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara
proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang
landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut
menyerupai huruf S.
Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara
untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita
ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel
dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut
sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai
dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan
berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka
untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata
(mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai
E(Y/x) akan berkisar antara 0 s.d (0 ≤ E(Y/x) ≤ ).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada
sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh
karena pada regresi logistik dependennya adalah dikotom maka variabel
dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti
pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk
mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian
PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu
berada antara nol dan satu (0 ≤ E(Y/x) ≤ 1).
2. Model Logistik
f(z) = 1.
1 + e-z
1 + e-(– )
Bila nilai Z mendekati + maka f(+ ) = 1 . =1
1 + e-(+ )
Fungsi Logistik dapat digambarkan sbb:
- 0 +
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada
regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang
variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk
huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur
pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang
pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian
seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada
ketinggian tertentu garisnya akan mendatar mendekati nilai 1.
Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu
probabilitas kejadian pada dependen yang dikotom maka model regresi logistik
adalah pilihan yang tepat.
3. Model Logistik
Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan
penjumlahan linear konstanta () ditambah dengan 1X1, ditambah 2X2 dan
seterusnya sampai iXi. Variabel X adalah variabel Independen.
Z = + 1X1 (Regresi logistik sederhana)
Z = + 1X1 + 2X2 + … + iXi (Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah
f(z) = 1 .
-( + 1X1 + 2X2 + … + iXi)
1+e
4. Contoh Kasus
Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari
mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama
vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama
variabel KAT).
Pemberian kode nilai variabel adalah sbb:
Untuk variabel PJK € 1 = timbul penyakit jantung koroner
0 = tidak ada penyakit jantung
koroner Untuk variabel KAT € 1 = kadar katekolamin darah
tinggi
0 = kadar katekolamin darah rendah
Pertanyaan:
a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko
untuk terjadi PJK?
b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko
untuk terjadi PJK?
c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya
tinggi dengan yang kadar katekolaminnya rendah?
Jawab:
Dengan model regresi logistik maka pada soal tersebut modelnya adalah:
f(z) = 1 .
1 + e-z
Nilai f(z) dapat diganti dengan P(X), maka rumusnya:
P(X) = 1 .
1 + e-z
Bila Z = + 1KAT, maka modelnya :
P(X) = 1 .
1 + e- + 1KAT
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb:
= -3,911 dan 1 = 0,652, maka:
P(X) = 1 .
-(-3,911 + 0,652KAT)
1+e
Dari model tersebut coba kita jawab pertanyaan di atas:
a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi.
Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai
KAT=1 pada model di atas, hasilnya:
P(X) = 1 . = 0,037 atau sekitar 4%
1 + e-(-3,911 + 0,652*1)
jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up.
b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah
Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai
KAT=0 pada model di atas, hasilnya:
P(X) = 1 . = 0,019 atau sekitar 2%
1 + e-(-3,911 + 0,652*0)
jadi mereka/individu yang kadar katekolaminnya rendah dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up.
c. Besar risiko kedua kelompok tersebut
P1(X) = 0,037 = 1,947 = 2,0
P0(X) 0,019
Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh
secara direk. Arti dari angka di atas adalah mereka yang kaadar
katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi
dibandingkan mereka yang kadar katekolaminnya rendah.
Model regresi logistik dapat digunakan pada data yang dikumpulkan
melalui rancangan kohort, case control maupun cross sectional.
Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko
individual. Sedangkan pada rancangan case control dan cross sectional tidak
dapat digunakan untuk menghitung risiko individual karena 0 pada rancangan ini
tidak sahih. Nilai 0 dapat dihitung/diestimasi bila sampling fraction populasi
yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket:
sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit).
Namun dengan memperlakukan rancangan case control dan cross sectional
sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan
perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan
perhitungan eksponensial dari persamaan garis regresi logistik.
P(X) = 1.
1 + e-( + 1X1 + 2X2 + … + iXi
B. REGRESI LOGISTIK GANDA
Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik
sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda
adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model.
Pada regresi logistik, variabel independennya boleh campuran antara variabel
katagorik dan numerik. Namun sebaiknya variabel independennya berupa
katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah.
X1 X2 X3 X4
Y
Prosedur pemodelan:
Agar diperoleh model regresi yang hemat dan mampu menjelaskan
hubungan variabel independen dan independen dalam populasi, diperlukan
prosedur pemilihan variabel sbb:
1). Melakukan analisis bivariat antara masing-masing variabel independen
dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p <
0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa
saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara
substansi penting.
2). Memilih variabel yang dianggap penting yang masuk dalam model,
dengan cara mempertahankan variabel yang mempunyai p value < 0,05
dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel
tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara
bertahap dimulai dari variabel yang mempunyai p value terbesar.
3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan
apakah variabel numerik dijadikan variabel katagorik atau tetap variabel
numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4
kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik
dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok
menunjukkan bentuk garis lurus, maka variabel numerik dapat
dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka
dapat dipertimbangkan dirubah dalam bentuk katagorik.
4). Setelah memperoleh model yang memuat variabel-variabel penting, maka
langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke
dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan
logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik.
Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting
dimasukkan dalam model.
X2 X3 X4
Tahapan pemodelan:
1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat
konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama
dengan semua variabel konfonding).
2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi
yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara
berurutan satu per satu dari nilai p Wald yang terbesar.
3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel
kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald
terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel
utama antara sebelum dan sesudahvariabel kovariat (X 1) dikeluarkan lebih
besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding
dan harus tetap berada dalam model.
KASUS I :
REGRESI LOGISTIK MODEL PREDIKSI
Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS
(race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA
HAMIL (ftv) dengan BBLR (low).
Adapun langkahnya:
A. SELEKSI BIVARIAT
Masing-masing variabel independen dilakukan analisis bivariat dengan variabel
dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel
tersebut langsung masuk tahap multivariat. Untuk variabel independen yang
hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting,
maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi
bivariat menggunakan uji regresi logistik sederhana.
Chi-square df Sig.
Step 1 Step 2.760 1 .097
Block 2.760 1 .097
Model 2.760 1 .097
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep age -.051 .032 2.635 1 .105 .950 .893 1.011
1 Const
.385 .732 .276 1 .599 1.469
ant
a. Variable(s) entered on step 1: age.
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada
bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25
sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan
SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI:
0,89-1,01)
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis
katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras
putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari
kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada
bagian Reference category, lalu klik Change, dan tampilannya:
Parameter coding
Frequency (1) (2)
Race White 96 .000 .000
Black 26 1.000 .000
Other 67 .000 1.000
Chi-square df Sig.
Step 1 Step 5.010 2 .082
Block 5.010 2 .082
Model 5.010 2 .082
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea race 4.922 2 .085
p1 race(1) .845 .463 3.323 1 .068 2.328 .939 5.772
race(2) .636 .348 3.345 1 .067 1.889 .955 3.736
Constant -1.155 .239 23.330 1 .000 .315
a. Variable(s) entered on step 1: race.
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras
dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy,
terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam
akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit
putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai
risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih.
Chi-square df Sig.
Step 1 Step 4.022 1 .045
Block 4.022 1 .045
Model 4.022 1 .045
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep ht 1.214 .608 3.979 1 .046 3.365 1.021 11.088
1 Constant -.877 .165 28.249 1 .000 .416
a. Variable(s) entered on step 1: ht.
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam
multivariat
4. Analisis bivariat antara “kelainan uterus” dengan “bblr”
7. Pilih “Analyze”
8. Pilih “Regression”
9. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak
Dependent dan kotak Covariates.
10. Pada kotak Dependent tetap berisi “low” dan pada kotak
Covariates isikan “ui”. Klik OK, Tampilannya sbb:
Chi-square df Sig.
Step 1 Step 5.076 1 .024
Block 5.076 1 .024
Model 5.076 1 .024
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep ui .947 .417 5.162 1 .023 2.578 1.139 5.834
1 Constant -.947 .176 29.072 1 .000 .388
a. Variable(s) entered on step 1: ui.
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat
lanjut ke multivariat
5. Analisis bivariat antara “periksa hamil” dengan “bblr”
1.Pilih “Analyze”
2.Pilih “Regression”
3. Klik
“Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
“ftv”. Klik OK, Tampilannya sbb:
Chi-square df Sig.
Step 1 Step .773 1 .379
Block .773 1 .379
Model .773 1 .379
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak
dapat lanjut ke multivariat, namun karena secara substansi variabel periksa
hamil sangat penting, maka variabel ini dapat dianalisis multivariat.
Chi-square df Sig.
Step 1 Step 4.867 1 .027
Block 4.867 1 .027
Model 4.867 1 .027
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep smoke .704 .320 4.852 1 .028 2.022 1.081 3.783
1 Constant -1.087 .215 25.627 1 .000 .337
a. Variable(s) entered on step 1: smoke.
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian
variabel merokok dapat masuk ke multivariat.
Chi-square df Sig.
Step 1 Step 6.779 1 .009
Block 6.779 1 .009
Model 6.779 1 .009
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep ptl .802 .317 6.391 1 .011 2.230 1.197 4.151
1 Constant -.964 .175 30.370 1 .000 .381
a. Variable(s) entered on step 1: ptl.
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel
riwayat adanya prematur dapat masuk ke multivariat
B. PEMODELAN MULTIVARIAT
Selanjutnya dilakukan analisis multivariat keenam variabel tersebut
dengan kejadian bblr.
1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel
dependen.
1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy.
5. Klik Option, pilih ‘CI for exp(B)’
6. Klik ‘Continue’
7. Kilik ‘OK’
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep age -.041 .036 1.249 1 .264 .960 .894 1.031
1 race 6.783 2 .034
race(1) 1.009 .502 4.034 1 .045 2.743 1.025 7.345
race(2) 1.003 .426 5.560 1 .018 2.727 1.185 6.280
smoke .964 .391 6.090 1 .014 2.622 1.219 5.639
ptl .630 .340 3.429 1 .064 1.877 .964 3.654
ht 1.361 .631 4.648 1 .031 3.902 1.132 13.451
ui .802 .458 3.066 1 .080 2.229 .909 5.468
ftv .009 .161 .003 1 .954 1.009 .736 1.384
Constant -1.183 .919 1.659 1 .198 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui
dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv
dikeluarkan dari model.
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep age -.040 .036 1.275 1 .259 .960 .896 1.030
1 race 6.781 2 .034
race(1) 1.009 .503 4.035 1 .045 2.744 1.025 7.347
race(2) 1.002 .425 5.562 1 .018 2.723 1.184 6.262
smoke .963 .390 6.086 1 .014 2.620 1.219 5.632
ptl .629 .340 3.423 1 .064 1.875 .963 3.651
ht 1.358 .629 4.663 1 .031 3.889 1.134 13.341
ui .800 .457 3.063 1 .080 2.226 .908 5.454
Constant -1.184 .919 1.661 1 .197 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race,
smoke, ptl, ht, dan ui.
Variabel OR ftv ada OR ftv tak ada perubahan OR
Age 0.960 0.960 0%
Race(1) 2.743 2.744 0%
Race(2) 2.727 2.723 0%
Smoke 2.622 2.620 0%
Ptl 1.877 1.875 0,1 %
Ht 3.902 3.889 0.3 %
ui 2.229 2.226 0,1 %
ftv 1.009
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian
dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah
umur, dengan demikian dikelurkan dar model dan hasilnya
Hasilnyanya :
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel
yang masih aktif di model.
Variabel OR age ada OR age tak ada perubahan OR
Age 0.960 -
Race(1) 2.743 2.968 8,2 %
Race(2) 2.727 2.883 5,7 %
Smoke 2.622 2.694 2,7 %
Ptl 1.877 1.779 5,2 %
Ht 3.902 3.912 0.3 %
ui 2.229 2.350 5,4 %
ftv 1.009
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep race 8.245 2 .016
1 race(1) 1.064 .499 4.545 1 .033 2.897 1.090 7.704
race(2) 1.083 .413 6.877 1 .009 2.955 1.315 6.640
smoke 1.094 .380 8.299 1 .004 2.986 1.419 6.286
ht 1.359 .630 4.660 1 .031 3.894 1.133 13.379
ui 1.006 .438 5.262 1 .022 2.734 1.158 6.458
Constant -2.092 .380 30.307 1 .000 .123
a. Variable(s) entered on step 1: race, smoke, ht, ui.
Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan
hasilnya sbb:
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep race 8.286 2 .016
1 race(1) 1.062 .500 4.513 1 .034 2.894 1.086 7.712
race(2) 1.085 .411 6.949 1 .008 2.958 1.321 6.626
smoke .996 .382 6.794 1 .009 2.707 1.280 5.726
ht 1.221 .629 3.764 1 .052 3.390 .988 11.640
ptl .696 .325 4.596 1 .032 2.007 1.062 3.793
Constant -2.025 .372 29.586 1 .000 .132
a. Variable(s) entered on step 1: race, smoke, ht, ptl.
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
C. UJI INTERAKSI
Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi,
kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus
sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi.
Langkahnya:
1. klik analysis, klik regression, klik binary ogistik
2. Kotak dependen isikan low
3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui
4. Klik tombol Next
5. isikan : smoke*ht ke kotak kovariat
6. klik OK
Chi-
square df Sig.
Step 1 Step .000 1 .994
Block .000 1 .994
Model 26.560 7 .000
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep race 7.900 2 .019
1 race(1) 1.088 .502 4.692 1 .030 2.969 1.109 7.946
race(2) 1.059 .419 6.387 1 .011 2.883 1.268 6.555
smoke .990 .397 6.211 1 .013 2.692 1.236 5.865
ptl .576 .336 2.937 1 .087 1.779 .921 3.438
ht 1.360 .831 2.680 1 .102 3.896 .765 19.852
ui .854 .451 3.584 1 .058 2.350 .970 5.693
ht by smoke .010 1.283 .000 1 .994 1.010 .082 12.491
Constant -2.146 .386 30.875 1 .000 .117
a. Variable(s) entered on step 1: ht * smoke .
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa
ada interaksi:
MODEL TERAKHIR
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
Interpretasi:
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat
Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
control, interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B)
pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka
nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada model.
Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan
kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel
riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis
didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang
menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi
dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race,
merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk
variabel yang lain.
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea kerja -20.275 28420.722 .000 1 .999 .000 .000 .
p1 umur1 1.681 1.197 1.972 1 .160 5.372 .514 56.109
sikap -.052 .114 .208 1 .648 .949 .760 1.186
kerja by umur1 20.279 28420.722 .000 1 .999 6E+008 .000 .
kerja by sikap .148 .159 .869 1 .351 1.160 .849 1.583
Constant -1.505 1.432 1.105 1 .293 .222
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan
berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara
bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan
secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di
atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar
(p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model
menjadi:
Logistic Regression
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea kerja -.445 1.718 .067 1 .795 .641 .022 18.557
p1 umur1 2.217 1.146 3.741 1 .053 9.177 .971 86.749
sikap -.060 .114 .274 1 .601 .942 .753 1.178
kerja by
.175 .156 1.264 1 .261 1.191 .878 1.616
sikap
Constant -1.881 1.483 1.610 1 .205 .152
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .
Dari output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model
karana p valuenya > 0,05. Setelah dikeluarkan hasilnya:
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep kerja 1.376 .666 4.273 1 .039 3.959 1.074 14.592
1 umur1 2.260 1.157 3.812 1 .051 9.582 .991 92.609
sikap .035 .076 .212 1 .645 1.036 .893 1.202
Consta
-2.876 1.239 5.384 1 .020 .056
nt
a. Variable(s) entered on step 1: kerja, umur1, sikap.
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel
interasksi, langkah selanjutnya uji konfounding
UJI KONFOUNDING
Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan
dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka
varaibel tsb dianggap sebagai variabel konfounding.
Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model
hasiilnya sbb:’
Model terakhir :
Variables in the Equation
95.0% C.I.for EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Stea kerja 1.413 .660 4.585 1 .032 4.110 1.127 14.985
p1 umur1 2.378 1.135 4.389 1 .036 10.783 1.165 99.754
Constant -2.624 1.113 5.555 1 .018 .073
a. Variable(s) entered on step 1: kerja, umur1.
Interpretasi:
Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding
hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb:
Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai
peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah
dikontrol variabel ”umur”.
Lampiran data LBW. SAV.