ANALISIS DATA SPSS (SUTANTO FKM UI 2006-Dikonversi

SUTANTO PRIYO HASTONO: Analisis
Data
ANALISIS
DATA
SUTANTO PRIYO HASTONO

FAKULTAS KESEHATAN MASYARAKAT
UNIVERSITAS INDONESIA, 2006
1
PENDAHULUAN
1 STATISTIK dan PENELITIAN
1. Statistik dan Penelitian
Statistik dalam arti sempit berarti angka/data. Sedangkan dalam arti luas statistik
sebagi suatu prosedur atau metode pengumpulan data, pengolahan data,
analisis data dan penyajian data. Sedangkan penelitian adalah cara ilmiah untuk
mendapatkan data dengan tujuan dan kegunaan tertentu.
Data yang diperoleh melalui penelitian harus akurat, artinya data yang dihasilkan
harus memenuhi kriteria: valid, reliabel dan obyektif. Valid artinya
ketepatan/kecermatan pengukuran, artinya ketepatan antara data yang
sesungguhnya terjadi pada obyek dengan data yang dapat dikumpulkan oleh
peneliti. Misalkan data dalam obyek berwarna merah, maka data yang terkumpul
oleh peneliti juga berwarna merah. Contoh lain, kita akan mengukur waktu
lomba lari cepat, kalau mengukurnya dengan jam tangan tentunya hasilnya tidak
valid, untuk lomba lari cepat akan valid bila menggunakan alat Stop watch.
Contoh lain, bila survei melakukan wawancara dengan orang pedesaan Cianjur
tidak valid kalau wawancaranya menggunakan bahasa batak, akan valid bila
menggunakan bahasa sunda.
Reliabel menunjukkan kekonsistensian pengukuran, artinya pengukuran diulang-

ulang akan mendapatkan hasil yang sama. Misalkan data yang terkumpul dari
obyek kemarin berwarna hijau, maka sekarang atau besuk juga masih tetap
berwarna hijau.
Objektif menunjukkan derajat persamaan persepsi antar orang. Jadi misalkan
orang tertentu melihat bahwa obyek itu bewarna putih, maka orang lainpun
akan menyatakan sama, yaitu putih.
2. Peran Statistik dalam Penelitian

Peran statistik dalam suatu penelitian dimulai dari tahap awal sampai dengan
akhir penelitian. Adapun perannya:
a. Alat untuk menghitung besarnya sampel yang akan diteliti
b. Alat untuk menguji validitas dan reliabilitas instrumen
c. Alat untuk pengolahan data
d. Alat untuk analisis data
e. Alat untuk penyajian data
3. Kegunaan statistik/penelitian di Bidang Kesehatan

a. Mengukur status kesehatan masyarakat dan mengetahui permaslahan
kesehatan
b. Membandingkan status kesehatan di satu tempat dengan tempat lain, atau
membandingkan status kesehatan waktu lampau dengan saat sekarang
c. Evaluasi dan monitoring kegagalan dan keberhasilan program kesehatan yang
sedang dilaksanakan
d. Keperluan estimasi tentang kebutuhan pelayanan kesehatan
e. Perencanaa program kesehatan
d. keperluan Research dan publikasi masalah-maslash kesehatan
4. Jenis Data
Dalam menggunakan statistik perlu dipahami benar mengenai definisi data
dan jenis-jenis data. Data merupakan kumpulan angka/huruf hasil dari penelitian
terhadap sfat/karakteristik yang kita teliti. Isi data pada umumnya bervariasi
(misalnya data berat badan dalam suatu kelompok orang ada yang beratnya 60
kg, 50 kg, 75 kg dst) sehingga muncul istilah variabel. Jadi variabel merupakan
karakteristik yang nilai datanya bervariasi dari suatu pengukuran ke pengukuran
berikutnya.
Menurut skala pengukurannya, variabel dibagi empat jenis, yaitu nominal,
ordinal, interval dan rasio.
a. Nominal, variabel yang hanya dapat membedakan nilai datanya dan tidak
tahu nilai data mana yang lebih tinggi atau rendah. Contoh; jenis kelamin,
suku dll. Jenis kelamin laki-laki tidak lebih tinggi dibandingkan perempuan .
Suku Jawa tidak dapat dikatakan lebih baik/lebih buruk dari suku sunda.
Dengan ilustrasi ini dapat dijelaskan bahwa variabel nominal, nilai datanya
sederajat.
b. Ordinal, variabel yang dapat membedakan nilai datanya dan juga sudah
diketahui tingkatan lebih tinggi atau lebih rendah, tapi belum diketahui besar
beda antar nilai datanya. Contoh pendidikan, pangkat, stadium penyakit dll.
Pendidikan SD pengetahuannya lebih rendah dibandingkan SMP. Namun
demikian, kita tidak dapat tahu besar perbedaan pengetahuan orang SD
dengan SMP.
c. Interval, variabel yang dapat dibedakan, diketahui tingkatannya dan
diketahui juga besar beda antar nilainya, namun pada variabel interval belum
diketahui kelipatan suatu nilai terhadap nilai yang lain dan pada skala interval
tidak mempunyai titik nol mutlak. Contohnya variabel suhu, misalnya benda A
suhunya 40 derajat dan benda B 10 derajat. Benda A lebih panas dari benda
B dan beda panas anta benda A dan B 30 derajat, namun kita tidak bisa
mengatakan bahwa benda A panasnya 4 kali dari benda B (ini berarti tidak
ada kelipatannya!). Selanjutnya, kalau suatu benda suhunya 0 derajat, ini
tidak berart bahwa benda tersebut tidak punya panas (tidak mempunyai nilai
nol mutlak),
d. Rasio, variabel yang paling tinggi skalanya, yaitu bisa dibedakan, ada
tingkatan, ada besar beda dan ada kelipatannya serta ada nol mutlak. Contoh
berat badan, tinggi badan dll. Misal A beratnya 30 kg dan B beratnya 60 kg.
Dalam hal ini dapat dikatakan bahwa A lebih ringan dari B, selisih berat
antara A dan B adalah 30 kg, berat b dua kali lebih tinggi dari berat A. berat
0 kg, ini berarti tidak ada berat (tidak ada bendanya) sehingga ada nol
mutlak.
Dalam analisis seringkali digunakan pembagian data/variabel menjadi dua
kelompok yaitu; data katagorik dan data numerik.
a. Katagorik (kualitatif), merupakan data hasil
pengklasifikasian/penggolongan suatu data. Cirinya: isisnya berupa kata-kata.
Contoh; sex, jenis pekerjaan, pendidikan
b. Numerik (kuantitatif), merupakan variabel hasil dari penghitungan dan
pengukuran. Cirinya: isi variabel berbentuk angka-angka. Variabel numerik
dibagi menjadi dua macam: Diskrit dan Kontinyu.
Diskrit merupakan variabel hasil dari penghitungan. Misalnya jumlah anak,
jumlah pasien tiap ruang, kontinyu merupakan hasol dari pengukuran,
misalkan tekanan darah, Hb dll.
Variabel katagorik pada umumnya berisi variabel yang berskala nominal dan
ordinal. Sedangkan variabel numerik berisi variabel yang berskala interval dan
rasio.
Dalam analisis statistik, seringkali data numerik diubah ke dalam data
katagorik dengan cara dilakukan pengelompokan/pengklasifikasian. Misalnya
variabel berat badan data riilnya merupakan data numeric, namun bila
dikelompokkan menjadi kurus (<50 kg), sedang (50-60 kg) dan gemuk (>60 kg)
maka jenis variabelnya sudah berubah menjadi katagorik.
PENGOLAHAN DATA
2
1. Pengantar Pengolahan Data
Pengolahan data merupakan salah satu bagian rangkaian kegiatan penelitian
setelah pengumpulan data. Setelah dilakukan pengumpulan data, seringkali
orang bingung “mau diapakan data yang telah terkumpul?, Bagaimana
menghubungkan data di kuesioner dengan tujuan penelitian?”. Untuk itu data
yang masih mentah (raw data) perlu diolah sedemikian rupa sehingga menjadi
informasi yang akhirnya dapat digunakan untuk menjawab tujuan penelitian.
Agar analisis penelitian menghasilkan informasi yang benar, paling tidak
ada empat tahapan dalam pengolahan data yang harus dilalui, yaitu:
1. Editing
Merupakan kegiatan untuk melakukan pengecekan isian formulir atau
kuesioner apakah jawaban yang ada di kuesioner sudah:
a. Lengkap: semua pertanyaan sudah terisi jawabannya
b. Jelas: jawaban pertanyaan apakah tulisannya cukup jelas terbaca.
c. Relevan: jawaban yang tertulis apakah relevan dengan pertanyaan
d. Konsisten: apakah antara beberapa pertanyaan yang berkaitan isi
jawabannya konsisiten, misalnya antara pertanyaan usia dengan
pertanyaan jumlah anak. Bila dipertanyaan usia terisi 15 tahun dan di
pertanyaan jumlah anak 9, ini berarti tidak konsisten.
2. Coding
Coding merupakan kegiatan merubah data berbentuk huruf menjadi data
berbentuk angka/bilangan. Misalnya untuk variabel pendidikan dilakukan
koding 1 = SD, 2 = SMP, 3 = SMU dan 4 = PT. Jenis kelamin: 1 = laki-laki
dan 2 = perempuan, dsb. Kegunaan dari coding adalah untuk mempermudah
pada saat analisis data dan juga mempercepat pada saat entry data.
3. Processing
Setelah semua kuesioner terisi penuh dan benar, serta sudah melewati
pengkodean, maka langkah selanjutnya adalah memproses data agar data
yang sudah di-entry dapat dianalisis. Pemrosesan data dilakukan dengan cara
meng-entry data dari kuesioner ke paket program komputer. Ada bermacam-
macam paket program yang dapat digunakan untuk pemrosesan data dengan
masing-masing mempunyai kelebihan dan kekurangan. Salah satu paket
program yang sudah umum digunakan untuk entry data adalah paket
program SPSS for Window.
4. Cleaning
Cleaning (pembersihan data) merupakan kegiatan pengecekan kembali data
yang sudah di-entry apakah ada kesalahan atau tidak. Kesalahan tersebut
dimungkinkan terjadi pada saat kita meng- entry ke komputer Misalnya untuk
variabel pendidikan ada data yang bernilai 7, mestinya berdasarkan coding
yang ada pendidikan kodenya hanya antara 1 s.d. 4 (1=SD, 2=SMP, 3=SMU
dan 4=PT). Contoh lain misalnya dalam variabel status perkawinan terisi data
1 (misalnya 1=belum kawin) dan dalam variabel jumlah anak terisi nilai . ini
berarti ada data yang salah (tidak konsisten) karena statusnya belum kawin
tetapi mempunyai anak 5?.
Berikut akan diuraikan cara meng-cleaning data:
a. Mengetahui Missing Data
Cara mendetekdi adanya missing data adalah dengan melakukan list
(distribusi frekuensi) dari variabel yang ada. Misalnya data yang diolah 100
responden, kemudoian dikeluarkan variabel jenis kelamin dan pendidikan.
Tabel 1 Jenis kelamin pasien
Jenis Kelamin Jumlah
Laki-laki 40
Perempuan 60
Total 100
Tabel 2 Jenis pendidikan pasien

Pendidikan Jumlah
SD 40
SMP 10
SMU 30
PT 15
Total 100
Dari kedua tabel di atas memperlihatkan bahwa tabel jenis kelamin tidak
ada nilai yang hilang (missing), sedangkan pada tabel pendidikan ada 5
pasien yang missing, karena total jumlahnya hanya 95 (seharusnya 100).
b. Mengetahui variasi data
Dengan mengetahui variasi data akan diketahui apakah data yang di-
entry benar atau salah. Cara mendeteksi dengan mengeluarkan distribusi
frekuensi masing-masing variabel. Dalam entry data biasanya data
dimasukkan dalam bentuk kode/coding, misalnya untuk variabel
pendidikan SD kode 1, SMP kode 2, SMU kode 3, dan PT kode 4. Untuk
mengetahui kesalahan data berikut ilustrasi keluaran dari variabel
pendidikan:
Tabel 3 Jenis pendidikan pasien
Pendidikan Jumlah
1 40
2 30
3 20
4 6
7 4
Total 100
Dari tampilan di atas kendati jumlah total sudah benar 100, namun
terlihat ada data yang salah, yaitu munculnya kode pendidikan angka 7
yang berjumlah 4 pasien. Seharusnya variabel pendidikan variasi
angkanya hanya dari angka 1 s.d. 4.
c. Mengetahui konsistensi data

Cara mendeteksi adanya ketidakkonsistensi data dengan menghubungkan
dua variabel.
Contoh:
1). membandingkan dua tabel
Tabel 4 Keikutsertaan KB
KB Jumlah
Ya 20
Tidak 80
Total 100
Tabel 5 Jenis Alat Kontrasepsi Yang Dipakai
Pendidikan Jumlah
Suntik 5
Pil 5
Kondom 4
IUD 10
Total 24
Dari kedua tabel tersebut terlihat bahwa ada ketidak konsistenan antara
jumlah peserta KB (20 orang) dengan total jenis alat kontrasepsi yang
dipakai (24 orang). Seharusnya pada baris total jenis alat kontrasepsi
jumlahnya 20 orang.
2). Membuat tabel silang
Contoh menghubungkan variabel umur dan jumlah anak
Umur Jumlah Anak
0 1 2 3 4 5 6 7 8 9 10
15 1 2 2*
16 1 2
19 2 4 2
20 3
24
25
35
40
Keterangan:
* = ada 2 responden dengan umur 15 tahun dan anaknya ada 10 orang (ada
kesalahan entry data!!!)
2. ENTRY DATA
Setelah kita mengetahui langkah-langkah pengolahan data, selanjutnya
akan dibahas entry data menggunakan SPSS. Kepanjangan dari SPSS yaitu
Statistical Program For Social Science . SPSS merupakan paket program ststistik
yang berguna untuk mengolah dan menganalisis data penelitian. Dengan SPSS
semua kebutuhan pengolahan dan analisis data dapat diselesaikan dengan
mudah dan cepat. Kemampuan yang dapat diperoleh dari SPSS meliputi
pemrosesan segala bentuk file data, modifikasi data, membuat tabulasi
berbentuk distribusi frekuensi, analisis statistik deskriptif, analisis lanjut yang
sederhana maupun komplek, pembuatan grafik, dsb. Perkembangan program
SPSS sangat cepat dimulai dari program SPSS/PC+(masih under DOS) kemudian
berkembang menjadi SPSS for Windows dari versi 6 dan berkembang terus
sampai sekarang sudah memasuki versi 11. Dan untuk latihan digunakan SPSS
for Windows versi 10.
a. MEMANGGIL SPSS
Pertama kali anda harus pastikan bahwa komputer sudah ter-install
program SPSS for Windows. Untuk memanggil program SPSS dapat dilakukan
dua cara :
Pertama :
Bila tampilan pertama komputer sudah muncul Icon SPSS, maka klik dengan
mouse icon tersebut dua kali.
Kedua :
Bila di layar belum ada icon SPSS, maka klik “Start”, pilih “File Program” dan
sorot “SPSS” dan klik dua kali.
Di dalam operasionalnya, SPSS mengenal 2 jenis jendela (Window) yang utama
yaitu:
a. SPSS Data Editor
Jendela ini berisis tampilan data yang kita olah dan analisis dengan tampilan
sejenis Spreadsheet (seperti tampilan Program Excel).
b. SPSS Output
Hasil olahan (hasil analisis) yang anda lakukan akan ditampilkan pada Output
window. Window ini merupakan teks editor, artinya dapat mengedit hasil
analisis yang ditampilkan.
b. STRUKTUR DATA DI SPSS

Agar dapat diolah dengan SPSS, data harus mempunyai struktur, format
dan jenis tertentu. Dalam SPSS (dan yang umum terjadi pada program lain),
data yang diolah tersususn berdasarkan kolom dan baris. Tiap kolom
melambangkan satu variabel (dalam data base dikenal Field), misalnya tiap
pertanyaan pada kuesioner menunjukkan satu variabel. Tiap baris data
dinamakan case (kasus/responden) sebagaimana istilah record di Data Base.
Variabel Nama Umur Berat
Anita 23 40
Cases Bambang 25 56
Dari contoh di atas menunjukkan ada 3 variabel (nama, umur dan berat badan)
dan 2 kasus/responden.
TAMPILAN UTAMA SPSS FOR WINDOWS

Setelah program SPSS dipanggil di layar akan muncul logo SPSS for
Windows, tunggulah sesaat hingga logo tersebut menghilang, maka pada layar
monitor akan didapati tampilan utama SPSS sebagai berikut:
a. tampilan data
b. tampilan variabel
Sistem kerja SPSS for Windows dikendalikan oleh menu (bar menu)./ Bar menu
terletak di sebelah atas dengan urutan dari kiri ke kanan sbb: File, Edit, View,
Data, Transform, Analyze, Graphs, Utilities, Window, Help.
 File: digunakan untuk membuat file data baru, membuka file data yang telah
tersimpan (ekstensi SAV), atau membaca file data dari program lain, seperti
dbase, excell dll.
 Edit: digunakan untuk memodifikasi, mengcopy, menghapus, mencari, dan
mengganti data.
 View: digunakan untuk mengatur tampilan font, tampilan kode/label
 Data: digunakan untuk membuat/mendefinisikan nama variabel, mengambil/
menganalisis sebagian data, menggabungkan data.
 Transform: digunakan untuk transformasi/modifikasi data seperti
pengelompokan variabel, pembuatan variabel baru dari
perkalian/penjumlahan variabel yang ada dll.
 Analyze: digunakan untuk memilih berbagai prosedur statistik, dari statistik
sederhana (deskriptif) sampai dengan analisis statistik komplek (multivariat).
 Graphs: digunakan untuk membuat grafik meliputi grafik Bar, Pie, garis,
Histogram, scatter plot dsb.
 Utilities: digunakan untuk menampilkan berbagai informasi tentang isi file.
 Window: digunakan untuk berpindah-pindah antar jendela, misalnya dari
jendela data ke jendela output.
 Help: memuat informasi bantuan bagaimana menggunakan berbagai fasilitas
pada SPSS.
I. MEMASUKKAN DATA
Entry data dapat langsung dilakukan pada data editor. Data editor
memiliki bentuk tampilan sejenis spreadsheet (seperti Excel) yang digunakan
sebagai fasilitas untuk memasukkan/engisikan data. Ada tiga hal yang harus
diperhatikan:
Baris menunjukkan kasus/responden
Kolom menunjukkan variabel
Sel merupakan perpotongan antara kolom dan baris menunjukkan nilai/data
Dalam memasukan data ke SPSS, ada 4 hal yang harus dieperhatikan:
a. Memberi Nama Variabel

Pertama kali yang harus dilakukan pada saat entry data adalah memberi
nama variabel. Satu variabel mewakili/melambangkan satu pertanyaan. Agar
tidak menemui kesulitan dalam membuat nama variabel, berikut akan diuraikan
ketentuan / persyaratan nama variabel:
* Nama variabel maksimum berisi 8 huruf/karakter, untuk SPSS versi 13 jumalh
karakter dapat lebih dari 8 huruf
* Nama variabel tidak boleh ada spasi
* Nama variabel tidak ada yang sama ( tidak boleh ada 2 atau lebih variabel
yang memiliki nama sama)
b. Mendefinisikan Tipe Variabel

Tipe data harus ditentukan kalau kita akan memasukan data di SPSS, adapun
jenis tipenya antara laian:
1. Numerik-------> untuk data berbentuk angka/nomer
2. String-------€ untuk data berbentuk huruf
3. Date----------> untuk data berbentuk date/tanggal
4. dll….
Note: yang sering digunakan adalah tipe Numerik, karena data yang akan kita
olah biasanya berbentuk angka.
c. Mendefinisakan Adanya Desimal

Bila data yang akan dimasukkan berbentuk dsimal, seperti kadar HB, maka perlu
ditentukan berapa desimal yang kita inginkan. SPSS secara default/standar
memberikan dua angka desimal untuk setiap data yang akan di entry.
Kebanyakan data penelitian berbentuk tidak ada desimal, oleh karena itu untuk
data yang tidak ada desimal kita harus seting di SPSS isian jumlah desimal diberi
angka 0 atau dikosongkan.
d. Memberi Label Variabel

Nama variabel biasanya tertulis dengan kata/huruf yang singkat, pada bagian ini
kita dapat menuliskan keterangan nama variabel sehingga dapat memperjelas
arti dari masing-masing variabel. Misalnya nama variabel BWT diberi label “Berat
badan bayi pada saat lahir dalam satuan gram”
e. Memberi Value Label
Untuk variabel yang berbentuk koding kita harus memberi keterangan untuk
setiap kode yang ada dalam kode tsb, misalnya untuk variabel Sex, 0 = pria dan
1 = wanita.
Sekarang kita coba lakukan entry untuk data:

Penelitian “Faktor-faktor yang berhubungan dengan perilaku menyusui eksklusif di
Daerah X tahun 2001” . Berikut ini instrumen yang digunakan dalam penelitian:
POLA MENYUSUI
Nomor Responden
Berapa umur ibu? …. Tahun
pendidikan ibu yang telah ditamatkan?
SD2. SMP3. SMU 4. PT
Apakah ibu bekerja?
bekerja1. Tidak bekerja
Berapa berat badan ibu ? … kg
Apakah ibu menyusui secara Eksklusif (menyusui sampai usia bayi 4 bulan)?
tidak1. ya
a.Kadar Hb ibu pengukuran pertama : …. gr% b.Kadar Hb ibu pengukuran kedua: …. gr%
Berat badan bayi ibu? …….gram
PERTANYAAN SIKAP
Bayi yang baru lahir sesegera mungkin diberi ASI?
STS2. TS3.KS4. S 5.SS
Bayi yang baru lahir diberi kolostrum
STS2. TS3.KS4. S5.SS
Bayi sejak lahir sampai usia 4 bulan hanya diberi ASI saja?
ASI diberikan sampai bayi berusia 2 tahun?
Survei dilakukan dengan jumlah responden sebanyak 50 orang, datanya sbb:
no umur didik kerja bbibu eksklu Hb1 Hb2 bbbayi Segera Kolos Lahir sampai
1 23 1 0 46 0 10.1 11.1 2,500 2 1 2 1
2 24 4 0 47 1 9.8 10.2 3,000 4 3 3 4
3 34 4 1 60 0 11.1 11.5 4,000 1 2 2 1
4 35 3 0 50 0 10.2 9.8 3,600 2 3 4 2
5 19 3 1 55 1 10.4 10.1 3,500 3 2 4 3
6 24 2 1 45 1 11.2 10.0 2,700 5 4 4 4
7 22 1 1 47 1 12.5 12.2 2,900 3 4 2 2
8 19 1 0 46 0 11.4 11.4 2,600 2 1 1 2
9 26 3 0 52 1 13.2 12.3 3,500 3 2 2 4
10 25 4 1 65 0 9.2 9.1 4,000 4 4 5 4
11 21 3 1 60 0 10.1 11.1 3,300 2 1 2 1
12 22 4 0 65 1 10.1 11.1 4,100 2 4 2 4
13 19 2 1 50 1 10.2 9.8 2,800 2 1 2 1
14 20 3 0 55 0 10.2 9.8 3,600 2 3 4 4
15 23 1 1 48 1 10.2 9.8 2,400 1 1 2 2
16 26 3 0 68 0 10.2 10.0 3,000 5 4 4 4
17 27 4 1 70 1 10.2 10.0 3,900 5 4 4 4
18 30 2 1 46 1 10.2 10.0 2,800 5 4 4 4
19 31 4 0 47 0 13.2 12.3 3,300 1 1 2 2
20 32 2 0 48 0 13.2 12.3 2,100 3 2 4 4
21 23 2 0 47 0 11.1 11.1 2,500 2 1 2 1
22 24 3 0 56 1 9.8 10.2 3,000 4 3 3 4
23 34 4 1 74 0 10.4 11.5 4,000 1 2 2 1
24 35 3 0 72 0 7.2 9.8 3,600 2 1 1 2
25 19 3 1 60 1 7.4 10.1 3,500 3 4 2 2
26 24 1 1 49 1 8.9 10.0 2,700 5 4 4 4
27 22 2 1 46 1 11.2 12.2 2,900 1 2 2 2
28 19 1 0 48 0 11.4 11.4 2,600 2 1 1 2
29 26 3 0 57 1 12.0 12.3 3,500 3 2 1 1
30 25 3 1 75 0 8.8 9.1 4,000 4 4 5 4
31 21 4 1 64 0 10.1 11.1 3,300 2 1 2 1
32 22 4 0 67 1 10.1 11.1 4,100 2 1 2 1
33 19 2 1 50 1 8.1 9.8 2,800 2 3 4 2
34 20 3 0 63 0 7.8 9.8 3,600 2 3 1 1
35 23 1 1 50 1 9.2 9.8 2,400 2 3 4 2
36 26 2 0 51 0 9.4 10.0 3,000 5 4 4 4
37 27 4 1 53 1 9.0 10.0 3,900 5 4 4 4
38 30 2 1 54 1 8.3 10.0 2,800 5 4 4 4
39 31 4 0 67 0 10.2 12.3 3,300 1 1 2 2
40 32 1 0 46 0 10.1 12.3 2,100 3 2 2 2
41 21 3 1 60 0 10.1 11.1 3,300 2 1 2 1
42 22 4 0 68 1 10.2 11.1 4,100 2 1 2 1
43 19 2 1 67 1 10.2 12.1 2,800 1 1 2 2
44 20 3 0 60 0 10.2 11.3 3,600 2 3 4 2
45 23 1 1 63 1 11.2 10.2 2,400 2 3 1 2
46 26 3 0 64 0 11.2 11.4 3,000 5 4 4 4
47 27 4 1 72 1 11.2 10.0 3,900 5 4 4 4
48 30 2 1 49 1 11.2 12.4 2,800 5 4 4 4
49 31 3 0 58 0 13.2 13.3 3,300 3 2 4 2
50 32 1 0 50 1 11.2 12.3 2,100 3 1 1 2
A. Langkah pertama : Memberi/membuat nama variabel:

Layar pada tampilan Workshet di menu data SPSS ada 2 jenis, yaitu jendela
“Data View” dan “Variabel View”.
Untuk membuat nama variabel, layar/jendela posisikan pada “Variable View”.

Sekarang lakukan : klik “Variable View” di bagian kiri bawah, sehingga
muncul tampilan layar “Variable View”
Pada tampilan “Variable View” diatas terlihat kolom: Name, Type, Width,
Decimals, dst.. Selanjutnya kita dapat membuat nama variabelnya dimulai
dari No, umur, didik, dst..sbb:
a. Membuat Variabel No
Adapun tahapannya sbb:
1. Sekarang pada kolom name ketik nama variabel “No”, kemudian
2. Pindahkan kursor ke kolom Type. Jenis variabel yang tersedia ada
beberapa jenis meliputi numeric untuk tipe angka, string untuk tipe
karakter/huruf dll. Untuk varibel No karena datanya yang akan masuk
berbentuk angka berarti anda pilih numeric (secara otomatis SPSS
memberikan default Numeric)
3. Gerakkan kursor ke sebelah kanan ke bagian Width, pada bagian ini anda
juga dapat mengatur lebar kolom dan desimal sesuai kebutuhan. Secara
standar lebar kolom sudah diatur SPSS lebar kolom (Width) 8 karakter,
jadi abaikan saja untuk width nya
4. Geser kursor ke kanan masuk ke kolom Decimal, SPSS secara otomatis
memberi ruang untuk 2 desimal, untuk variabel No tentunya berbentuk
bilangan bulat(tidak ada desimal) jadi kolom Decimal diberi angka 0 atau
dikosongkan.
5. Geser korsor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel No, misalnya diketik “Nomor Responden”
6. Langkah selanjutnya harusnya kursor kita geser kekanan mengisi kolom
Values, namun kolom Values ini diisi kalau variabel yang kita buat
berbentuk variabel koding (atau variabel katagorik) misalnya variabel sex
yang isinya ada koding 1=pria dan 2=wanita. Untuk variabel No bukan
merupakan variabel koding, maka kolom Value tidak diisi/diabaikan saja,
sehingga proses pembuatan variabel No sudah selesai, dan tampilan
lengkapnya menjadi sebagai berikut
b.Membuat Variabel Umur
Proses pembuatannya sama dengan ketika membuat variabel No sbb:
1. Sekarang pada kolom name ketik nama variabel Umur, kemudian
2. Pindahkan kursor ke kolom Type.. Untuk variabel Umur karena datanya
yang akan masuk berbentuk angka berarti anda pilih numeric (secara
otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi
kolom Type jangan diubah)
standar lebar kolom sudah diatur SPSS, lebar kolom ( Width) 8 karakter,
jadi abaikan/biarkan saja untuk width nya
memberi ruang untuk 2 desimal, untuk variabl Umur tentunya berbentuk
bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan.
5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel Umur, isikan: Umur ibu menyusui
6. Karena variabel umur berjenis numerik (bukan variabel yg isinya koding)
maka kolom Values diabaikan saja, dan dengan demikian proses
pembuatan variabel umur telah selessai
c. Variabel Pendidikan
Proses pembuatannya sama dengan ketika membuat variabel No sbb:
1. Sekarang pada kolom name ketik nama variabel Didik, kemudian
2. Pindahkan kursor ke kolom Type.. Untuk variabel Didik karena datanya
yang akan masuk berbentuk angka berarti anda pilih numeric (secara
otomatis SPSS memberikan default Numeric, jadi abaikan saja untuk isi
kolom Type jangan diubah)
standar lebar kolom sudah diatur SPSS, lebar kolom ( Width) 8 karakter,
jadi abaikan/biarkan saja untuk width nya
memberi ruang untuk 2 desimal, untuk variabl Didik tentunya berbentuk
bilangan bulat jadi kolom Decimal diberi angka 0 atau dikosongkan.
5. Geser kursor kekanan ke kolom Label, ketik/isikan keterangan untuk
memperjelas variabel Didik, isikan: Pendidikan formal ibu menyusui
6. Langkah selanjutnya geser kekanan ke kolom Values, untuk variabel
Didik kolom Values ada isinya oleh karena variabel Didik merupakan
variabel yang berbentuk koding, yaitu kode 1 = SD, 2=SMP, 3=SMU,
4=PT. Klik kolom Value akan muncul menu:
Klik disini
Pada kotak Value isikan angka 1, lalu klik kotak Value Label isikan:
SD,hasilnya nampak sbb:
Kemudian klik tombol Add sehinga di kotak bagian bawah akan muncul:
Seterusnya klik kotak Value, isikan angka 2, klik kotak Value Label dan
isikan: SMP, kemudian klik tombol Add
Seterusnya klik kotak Value, isikan angka 3, klik kotak Value Label dan
isikan: SMU, kemudian klik tombol Add Seterusnya klik kotak Value, isikan
angka 4, klik kotak Value Label dan isikan: PT, kemudian klik tombol Add
sehingga kotak menu akan tertampil sbb:
Kemudian, klik tombol OK sehingga selesailah pembuatan variabel
Didik.
d. Variabel Kerja
1. Pada kolom Name isikan Kerja
2. Geser kekanan ke kolom Decimal, isikan 0
3. Geser ke kolom Label isikan: Status pekerjaan ibu
4. Geser kekanan ke kolom Value, isikan koding 0=bekerja 1=tdk kerja
Proses pembuatan variabel kerja selesai
e. Variabel BBibu
1. Pada kolom Name isikan Bbibu
3. Geser ke kolom Label isikan: Berat badan ibu
4. Kolom Value, abaikan/biarkan aja karena variabel Bbibu berbentuk numerik
Proses pembuatan variabel Bbibu selesai
f. Variabel Eksklu
1. Pada kolom Name isikan Eksklu
3. Geser ke kolom Label isikan: Status menyusui eksklusive
4. Geser kekanan ke kolom Value, isikan koding 0=tdk eksklusive
1=eksklusive
Proses pembuatan variabel Eksklu selesai
g. Variabel Hb1
1. Pada kolom Name isikan Hb1
2. Geser kekanan ke kolom Decimal, untuk variabel HB1 sesuai dengan
datanya, ada satu desimal, maka isikan angka 1
3. Geser ke kolom Label isikan: Hb pengukuran pertama
4. Abaikan kolom Values, karena variabel HB1 berbentuk numerik
h. Variabel Hb2
1. Pada kolom Name isikan Hb2
2. Geser kekanan ke kolom Decimal, untuk variabel HB2 sesuai dengan
datanya, ada satu desimal, maka isikan angka 1
3. Geser ke kolom Label isikan: Hb pengukuran kedua
4. Abaikan kolom Values, karena variabel HB2 berbentuk numerik
i. Variabel BBbayi
1. Pada kolom Name isikan BBbayi
3. Geser ke kolom Label isikan: Berat badan bayi
4. Abaikan kolom Value,
Proses pembuatan variabel bbbayi selesai
Dengan cara sama kemudian dapat dibuat untuk variabel: Segera, Kolos,
Lahir, Sampai
Akhirnya tampilan kseluruhannya sbb:
B. Memasukkan/entry Data
Setelah semua variabel sudah dibuat, maka langkah selanjutnya adalah
memasukkan data hasil survei kedalam format yang telah dibuat diatas. Untuk
memasukkan data anda harus berpindah ke layar/jendela Data View, yaitu
dengan Klik tombol Data View, nampak tampilannya sbb:
Memasukkan data bisa menyamping satu persatu responden di entry datanya,

atau bisa juga perkolom kearah bawah.
Coba sekarang masukan data diatas sebanyak 10 responden , dan hasil
tampilannya sbb:
c. Mengedit Data
1. Menghapus isi sel
a. Klik sel yang akan dihapus isinya
b. Tekan tombol ‘Delete’ (pada Keyboard)/clear pada edit. Bila kita nggak
jadi menghapus, klik Undo
Untuk menghapus isi sejumlah sel sekaligus, pilihlah sejumlah sel tersebut
dengan drag (menyorot/memblok) dengan mouse.
Dari tampilan di atas berarti kita membuat blok untuk variabel Kerja pada
responden no 3 s/d 5
Tekan ‘delete’ untuk menghapusnya.
2. Menghapus isi sel satu kolom (menghapus variabel)
a. Klik heading kolom (nama variabel) yang akan dihapus isi-isi
selnya, misalkan akan dihapus variabel BBibu: klik heading BBibu
seperi tampilan sbb:
Klik disini
b. Tekan tombol delete
Untuk menghapus isi sel sejumlah kolom sekaligus, pilihlah sejumlah

kolom tersebut dengan drag (menyorot dan memblok) dengan mouse
pada bagian heading.
3. Menghapus baris (menghapus case/responden)

a. klik baris yang akan dihapus, contoh nomer responden 5 akan dihapus
Klik disini
b. Tekan tombol delete

Nomor responden akan terhapus
Untuk menghapus beberapa case sekaligus, pilihlah sejumlah case

tersebut dengan drag (menyorot dan memblok) pada bagian nomor case.
4. Mengcopy isi sel

a. Pilih sel (sejumlah sel dengan mnyorot) yang akan dicopy isinya.
b. Tekan ‘Ctrl+C’
c. Pindahkan penunjuk sel ke sel yang akan dituju
d. Tekan ‘Ctrl+V’
Hal yang perlu diperhatikan dalam mengcopy isi sel atau sejumlah sel
adalah, bahwa format hasil copy akan selalu menyesuaikan dengan format
variabel dimana isi sel atau sejumlah sel itu dicopykan.
5. Mengcopy isi satu kolom (mengcopy variabel)

a. Klik heading kolom (nama variabel) yang akan dicopy isinya
c. Klik Heading kolom yang dituju
Hasil dari instruksi di atas adalah mengcopy kolom sekaligus format
variabelnya (type variabel, lebar kolom, value label dsb), dan sudah pasti
tetap tidak merubah nama variabel. Bila dikehendaki tidak ada perubahan
format variabel kolom yang dituju, yang dilakukan adalah:
a. Klik heading kolom (nama variabel) yang akan dicopy isinya
c. Pindahkan penunjuk sel ke baris pertama kolom yang dituju
Untuk mengcopy isi sel sejumlah kolom sekaligus, pilihlah sejumlah kolom
tsb dengan drag pada bagian heading
6. Mengcopy isi satu baris (case/responden)
a. Tekan ‘Ctrl+C’
b. Klik nomor case yang akan dituju atau pindahkan penunjuk sel ke
kolom Klik nomer Case yang akan dicopy
c. pertama baris yang dituju
7. Menyisipkan Kolom
a. Pindahkan penunujuk sel pada kolom yang disisipi
b. Klik ‘Data’, pilih ‘Insert Variable’, terlihat kolom baru muncul.
8. Menyisipkan Baris
a. Pindahkan penunjuk sel pada baris yang akan disisipi
b. Klik ’Data’, pilih ‘Insert Case’, terlihat kasus/ responden baru muncul
B. MENYIMPAN FILE DATA

Data yang telah dimasukkan dapat disimpan ke berbagai format data.
Secara pengaturan dasar, SPSS for Window akan menyimpan data tersebut
dengan format SPSS, bentuk formatnya dicirikan dengan ekstensi “.sav” (Nama
file.sav). untuk menyimpan data yang telah anda masukkan:
1.Pilihlah “File”, bawa kursor ke “Save”, nampak tampilannya:
Pada tampilan di atas terdapat beberapa isian kotak:
Save in : Anda dapat memilih direktori (drive A untuk disket) tempat
menyimpan file. Bila pada kotak “Save in” tidak dirubah berarti data
disimpan dalam direktori program SPSS.
File name : Anda harus mengetikkan nama file di kotak ini. SPSS akan
menambahkan ekstension “.sav”, sehingga anda cukup mengetikkan nama
filenya saja dan tidak perlu mengetikkan ekstensionnya.
Save as type : data dapat disimpan dalam berbagai format. Untuk data
SPSS akan disimpan dengan format “sav”.
2. Misalkan kita akan menyimpan data di drive C direktori my document dan
diberi nama “latihan”. Klik kotak “ file name” , isikan “latihan”. Terlihat
tampilannya sbb:
]
3. Klik “Save “, data akan tersimpan
C. MENGAKTIFKAN/MEMANGGIL FILE DATA

Untuk membuka/mengaktifkan file data yang telah ada:
1. Klik “File”, pilih “Open”, geser ke “Data” akan tampil sbb:
Terlihat ada beberapa kotak isian
Look in : Anda dapat memilih/mengganti direktori tempat file disimpan.
Secara otomatis tampilan pertama akan muncul direktori SPSS.
File Name : tempat untuk mengetikkan nama file, atau dapat juga dilakukan
dengan meng-klik nama file yang tertampil pada kotak bagian atas file name.
File of type : data dapat disimpan dalam berbagai format yang dapat dipilih
dalam kotak ini. Secara otomatis akan muncul file format SPSS (.sav)
2. Misalkan sekarang akan diaktifkan file data: “Latihan” dari drive c direktori My
Documen, maka caranya klik kotak File name: ketik “latihan”, atau klik
“latihan yang terlihat/tertampil pada kotak di atasnya.
3. Kemudian klik Open, data akan muncul di layar.
3. TRANSFORMASI / MODIFIKASI DATA
Setelah semua data di-entry pada dasarnya anda dapat langsung melakukan
analisis untuk mengetahui informasi yang diinginkan. Namun seringkali data
yang ada tidak semuanya dapat langsung dilakukan analisis. Beberapa data bisa
jadi masih perlu dilakukan modifikasi/transformasi, misalnya untuk keperluan
analisis kita harus mengelompokkan umur menjadi tiga katagori misalnya < 20
th, 20 – 35 th dan > 35 th. Kasus lain, misalnya kita akan membuat variabel
baru hasil dari gabungan beberapa variabel (misalnya variabel sikap diukur oleh
10 pertanyaan/variabel), maka kita harus melakukan aktifitas di SPSS untuk
menggabungkan beberapa variabel tersebut.
Dari uraian di atas tentunya sekarang menjadi jelas ternyata seringkali kita
tidak dapat langsung melakukan analisis, kita harus melakukan
modifikasi/transformasi data. Perlu tidaknya modifikasi dilakukan dapat
dilihat/dicek pada “Definisi Operasional Variabel” dari penelitian/tesis/skripsi kita.
Misalkan dalam penelitian anda definisi variabelnya sbb:
No Variabel Definisi Operasional Hasil Ukur/Skala
1 Lama tugas Rentang waktu berkeja sebagai Tahun/Rasio
petugas puskesmas
2 Umur Lama waktu hidup yang diukur dari Muda dan tua/
ulang tahun terakhir Ordinal
3 Sikap Pernyataan setuju/tidak setuju Baik dan Buruk/
terhadap sistem pencatatan dan Ordinal
pelaporan yang diukur melalui 10
pertanyaan
Dari contoh definisis operasional di atas dapat diketahui bahwa variabel ‘Lama
tugas” dapat langsung dianalisis, sedangkan variabel umur dan sikap masih perlu
dilakukan modifikasi/transformasi dengan SPSS. Variabel umur perlu dilakukan
pengelompokan menjadi umur muda (misalnya  30 th) dan tua (< 30 th).
Variabel sikap perlu dibuat dengan cara menjumlahkan skor 10 pertanyaan sikap,
kemudian variabel baru tersebut dilakukan pengelompkkan untuk membuat
katagori baik dan buruk (misal menggunakan cut point: mean). Berikut akan
diuraikan beberapa jenis modifikasi data yang dapat dilakukan di program SPSS
for Window.
1. Mengelompokkan data
#perintah : RECODE
Pengelompokan biasanya digunakan untuk mengubah variabel numerik
menjadi variabel katagorik. Pengelompokan dapat dilakukan pada variabel
yang sama atau ke variabel baru yang berbeda. Dianjurkan kalau melakukan
pengelompokan sebaiknya digunakan variabel baru sehingga masih dimiliki
nilai yang asli pada file data.
Coba aktifkan file data ASI.SAV (file ini berisi data penelitian menyusui
eksklusive, yang telah di entry lengkap 50 rsponden)
Sebagai contoh kita akan melakukan pengelompokan umur. Umur akan

diklasifikasikan menjadi 3 kelompok yaitu: <20, 20-30 th, >30 th.
Langkahnya:
1). Pilih “Transform”, sorot “Recode” sorot “Into different variables”
Kemudian Klik ‘Into different Variable’
4). Sorot variabel “umur”, lalu klik tanda panah ke kanan sehingga
“umur” berpindah di kotak Input variable € Output Variable:
5). Pada kotak Output variable, pada bagian Name ketiklah umur1 (nama
variabel baru untuk umur yang bentuknya sudah katagorik)
6). Klik change sehingga pada kotak Input Variable € Output Variable terlihat
umur € umur1
7). Klik Option “Old and New Value”, nampak kotak Old and New di monitor.
Pada kotak dialog tersebut ada beberapa ada beberapa isian yang harus
diisi. Secara garis besar ada 2 isian yang harus diisi, yaitu ‘ Old Value’
(nilai lama yang akan direcode) dan New Value (nilai baru sebagai hasil
‘recode’ dari nilai lama). Me-recode dapat dilakukan per satu nilai lama
atau jangkauan nilai (range).
8). Sekarang kita akan merecode nilai umur < 20 th menjadi kode 1. Umur
dibawah 20 th, artinya umur terendah/paling muda sampai dengan umur 19
th.
Pindahkan kursor ke kotak Range: ‘lowest , ketiklah 19 dan
through bawa kursor ke bagian kotak ‘new 1 kemudian klik Add,
Value’, ketik hasilnya sbb
Langkah 3
Langkah 1
Langkah 4
Langkah 2
9). Pindahkan kursor ke kotak Range: throug , kita akan

h
merecode umur 20 s.d 30 th menjadi 2. Pada 2 kotak tersebut isilah 20
dan 30. lalu pindahkan kursor ke kotak ‘New Value’, ketiklah 2, klik ‘Add’.
10). Kita akan melakukan pengkodean berat > 30 th menjadi kode 3. Pada
kotak Range: thrugh highest ketiklah 31. Lalu pindahkan kursor ke
kotak ‘New Value’, ketiklah 3, klik ‘Add’. Langkahnya seperti diatas, dan
akhirnya setelah selesai hasilnya sbb:
11). Klik “Continoue”
12). Klik “OK”, terlihat variabel baru “umur1” sudah terbentuk berada dikolom
paling kanan
nampak variabel baru “umur1” masih menampilkan angka dengan 2 desimal,

anda dapat masuk ke “Variable View”, pada kolom decimal ketik “0”,
kemudian anda dapat juga memberi value label untuk kode 1=  20 th, 2 =
21 – 30 th dan 3=  31 th.
2. Membuat variabel baru hasil perhitungan matematik
# perintah : COMPUTE
Selain fasilitas me-recode yang sudahkita coba untuk mengelompokkan
data, fasilitas SPSS yang lain yaitu membuat variabel baru hasil dari operasi
matematik dari beberapa variabel yang sudah di entry, misal melakukan
penjumlahan, pengurangan, pembagian dan perkalian dll.
Sebagai contoh pada data ASI.SAV ada data berat badan bayi dalam bentuk
satuan gram, sekarang anda diminta untuk membuat variabel baru, berat
badan bayi dalam satuan kilogram.
Adapun caranya:
1). Pastikan anda di posisi tampilan data editor
2). Pilih “Transform”
3). Pilih “Compute”, kemudian muncul kotak dialog ”Compute Variable”.
Pada kotak tersebut terdapat kotak:

“Target Variable” : diisi nama variabel yang akan dibuat, dapat merupakan
variabel yang lama atau yang baru, sebaiknya nama baru
“numeric Expression” : diisi rumus yang akan digunakan untuk
menghitung nilai baru pada Target Variable. Rumus yang tertulis dapat
mengandung nama variabel yang sudah ada, operasi matematik dan fungsi.
Adapun operasi matematik yang dapat dilakukan:
+ = penjumlahan
- = pengurangan
* = perkalian
/ = pembagian
** = pangkat
(.) = kurung
4). Misalkan akan membuat variabel baru berat bayi, dengan nama “bayikilo”,
maka pada kotak ‘Target Variable’, ketiklah “bayikilo”
5). Kemudian klik kotak ‘Numeric Expression’, sorot dan pindahkan variabel Bwt
setelah itu bagilah 1000, tampilannya : bbbayi/1000, sehingga terlihat di
layar:
6). Klik “OK”, sesaat kemudian variabel “bayikilo” akan muncul dibagian paling
kanan.
3. Membuat variabel baru dengan kondisi
# perintah : IF
Dalam pembuatan variabel baru seringkali dihasilkan dari kondisi
beberapa variabel yang ada. Misalnya dalam file “ASI.SAV” terdapat variabel
“umur” dan variabel “berat ibu”. Kemudian kita ingin membuat variabel baru
yang berisi dua kelompok yaitu: risiko tinggi dan ririko rendah. Misalkan variabel
tersebut diberi nama “Risk” dan untuk kelompok risiko rendah (kode 0) dan risiko
tinggi (kode 1). Adapun kriteria risiko tinggi adalah bila responden berumur di
atas 30 tahun dan berat badan dibawah 50 kg. Selain kondisi tersebut
dikelompokkan ke dalam risiko rendah. Dari kasus ini berarti kita diharapkan
membuat variabel baru dengan kondisi variabel umur dan hipertensi. Bagaimana
cara membuat variabel “Risk” tersebut? Ada dua langkah untuk menyelesaikan
kasus ini:
Langkah pertama:
= membuat variabel RISK yang isinya semuanya 0 (risiko rendah)=
1). Pilih “Transform”
2). Pilih “Compute”
3). Pada kotak “Target Variable”, ketiklah “risk”
4). Pada kotak “Numeric Expression”, ketiklah
“0”
5). Klik “OK”, terlihat dilayar variabel “risk” sudah terbentuk dengan semua
selnya berisi angka 0.
Langkah kedua:
=membuat kondisi risiko tinggi (kode 1) untuk umur >30 dan bb<50
6). Pilih kembali menu “Transform”
7). Pilih kembali ‘Compute”
8). Pada kotak “Target Variable” biarkan tetap berisi “RISK”.
9). Pada kotak “Numeric Expression”, hapus angka 0 dan gantilah dengan angka
1.
10). Klik tombol “If ”, sesaat kemudian muncul dialog “ComputeVariable: If

Cases”
11). Klik tombol berbentuk lingkaran kecil: Include if case satisfies condition.
12). Pada kotak di bawah option include …. : ketiklah: umur > 30 & bbibu < 50
13). Klik “Continue”
14). Klik “OK”, akan muncul pesan:
15). Klik “OK”, maka terbentuklah variabel “RISK” pada kolom paling kanan
dengan isi 0 dan 1 (0=risiko rendah dan 1= risiko tinggi), kalau menemui data
yang berisi umur diatas 30 tahun dan berat ibu dibawah 50 th, maka isi variabel
RISK akan berubah dari 0 menjadi 1, coba dicek !!!!
Note : setiap kita melakukan perintah : Compute, Recode, atau IF

sebaiknya di croscek, apakah hasilnya betul sesuai yang kita kehendaki
4. Memilih sebagian data (SUBSET)
# perintah : SELECT
Dalam kondisi tertentu seringkali kita hanya menginginkan mengolah dan
menganalisis hanya data dari kelompok tertentu saja. Misalkan kita punya data
seluruh DKI, tapi kita hanya ingin mengetahui distribusi aktifitas pada ibu hamil
yang tinggal di Jakarta Selatan. Di dalam data tentunya ada variabel yang
menunjukkan wilayah tempat tinggal ibu hamil.
Sebagai contoh kita ingin menganalisis data, hanya untuk ibu yang
menyusui saja,(dalam contoh ini kita masih menggunakan file data ASI.SAV).
caranya:
1). Pilih menu “Data”
2). Pih “Select Cases”
3). Klik pada tombol : If Conditin is satisfied
4). Klik “If “

5). Ketiklh/sorot dan pindah pada kotak dan tuliskan kondisinya yaitu: Eksklu=0
Ket: ibu yang menyusui eksklusive kodenya=0
6). Klik “Continue”
7). Perhatikan di bagian bawah pada kotak: Unselected cases are: filtered atau
deleted. Pilihlah filtered artinya data yang tidak dianalisis hanya ditandai
dengan pencoretan nomor kasus. Sedangkan untuk Deleted, artinya kasus
yang tidak terpilih akan dihapus secara permanen. Biasanya digunakan
option: filtered.
8). Klik “OK” sehingga anda kembali ke data editor. Perhatikan pada data editor
ada beberapa kasus yang tidak terpilih (dimatikan), yang ditandai dengan
pencoretan nomor kasusnya. Nomor batang yang dicoret artinya dikeluarkan
dari data, sedangkan yang tidak dicoret merupakan data yang aktif (ibu yang
menyusui eksklusive)
5. MENGGABUNG FILE DATA
# perintah : MERGE
Dalam pengolahan data seringkali kita mempunyai tidak satu file data, melainkan
beberapa file data yang tentunya harus digabung kalau kita akan melakukan
analisis data. Teknik penggabungan data ada dua jenis yaitu penggabungan
responden dan penggabungan variabel.
a. Penggabungan responden/case
Misal:
data file pertama, berisi: nomor responden 1 s/d 3
No Umur Didik
1 20 1
2 23 3
3 19 2
Data file kedua, berisi: nomor responden 4 s/d 7

No Umur Didik
4 21 1
5 23 4
6 20 2
7 24 3
Data hasil gabungan, berisi : nomor rsponden 1 s/d 7

No umur Didik
1 20 1
2 23 3
3 19 2
4 21 1
5 23 4
6 20 2
7 24 3
Aplikasi di SPSS:
Pastikan anda sudah memasukkan data kedua file, misalnya data pertama
dengan nama Data1.sav dan data kedua dengan nama Data2.sav.
Langkahnya:
1. File ‘data1.sav’ dalam kondisi aktif
2. klik data, sorot Merge Files, sorot Add Cases
3. klik Add Cases

4. Isikan pada kota file name : data2
5. klik Open
6. Klik OK, dan akhirnya tergabunglah kedua file data
7. Untuk menyimpan file gabungan, klik Save As isikan nama file baru,
misalnya data12
b. Penggabungan variabel
Data pertama : berisi variabel : no, umur dan didik

no umur Didik
1 20 1
2 23 3
3 19 2
4 21 1
5 23 4
6 20 2
7 24 3
Data kedua, berisi variabel : no, sex, kerja dan berat badan
no sex kerja bb
1 2 1 60
2 2 3 45
3 1 2 56
4 2 1 76
5 2 3 56
6 1 2 60
7 2 3 55
Data gabungan, berisi : no, umur, didik, sex, kerja dan bb

no umur Didik sex kerja bb
1 20 1 2 1 60
2 23 3 2 3 45
3 19 2 1 2 56
4 21 1 2 1 76
5 23 4 2 3 56
6 20 2 1 2 60
7 24 3 24 3 55
Langkahnya:
Aplikasi di SPSS:
Pastikan anda sudah memasukkan data kedua file, misalnya data pertama
dengan nama Data3.sav dan data kedua dengan nama Data4.sav.
Langkahnya:
1. File ‘data3.sav’ dalam kondisi aktif
2. klik data, sorot Merge Files, sorot Add Variables
3. klik Add Variables
4. klik Open, Klik OK
5. Tampilan sudah tergabung variabelnya, anda tinggal melakukan
penyimpanan “ klik Save As” beri nama file misal namanya Data34
6. Menyimpan hasil olahan/hasil analisis

Hasil analisis akan ditampung pada jendela output ( output windows)
seperti tampak pada gambar di bawah ini. Anda dapat mengedit teks langsung
pada windows tersebut. Prosedur yang sering digunakan untuk edit teks, seperti
Cut, Copy dan Paste juga dapat digunakan di jendela output ini. Bila anda akan
menyimpan hasil analisis:
1). Pilih “File”
2). Pilih “Save SPSS
Output” 3). Ketik/isikan
nama file-nya 4). Klik “OK”
Frequencies
Statistics
RISK
N Valid 5
Missing 0
RISK
Cumulative
Frequency Percent Valid Percent Percent
Valid 1 2 40.0 40.0 40.0
2 3 60.0 60.0 100.0
Total 5 100.0 100.0
UJI INSTRUMEN
3
A. Uji validitas dan Reliabilitas Kuesioner
Salah satu masalah dalam suatu penelitian adalah bagaimana data yang
diperoleh adalah akurat dan objektif. Hal ini sangat penting dalam penelitian
karena kesimpulan penelitian hanya akan dapat dipercaya (akurat). Data yang
kita kumpulkan tidak akan berguna bilamana alat pengukur yang digunakan
untuk mengumpulkan data penelitian tidak mempunyai validitas dan reliabilitas
yang tinggi.
VALIDITAS
Validitas berasal dari kata Validity yang mempunyai arti sejauhmana
ketepatan suatu alat ukur dalam mengukur suatu data. Misalnya bila seseorang
akan mengukur cincin, maka dia harus menggunakan timbangan emas. Dilain
pihak bila seseorang ingin menimbang berat badan, maka dia harus
menggunakan timbangan berat badan. Jadi dapat disimpulkan bahwa timbangan
emas valid untuk mengukur berat cincin, tapi timbangan emas tidak valid untuk
menimbang berat badan.
RELIABILITAS
Realibilitas adalah suatu ukuran yang menunjukkan sejauhmana hasil
pengukuran tetap konsisten bila dilakukan pengukuran dua kali atau lebih
terhadap gejala yang sama dan dengan alat ukur yang sama. Misalkan seseorang
ingin mengukur jarak dari satu tempat ke tempat lain dengan menggunakan dua
jenis alat ukur. Alat ukur pertama denganmeteran yang dibuatdari logam,
sedangkan alat ukur kedua dengan menghitung langkah kaki. Pengukuran
dengan meteran logam akan mendapatkan hasil yang sama kalau
pengukurannya diulang dua kali atau lebih. Sebaliknya pengukuran yang
dilakukan dengan kaki, besar kemungkinan akan didapatkan hasil yang berbeda
kalau pengukurannya diulang dua kali atau lebih. Dari ilustrasi ini berarti meteran
logam lebih reliable dibandingkan langkah kaki untuk mengukur jarak.
CARA MENGUKUR VALIDITAS

Untuk mengetahui validitas suatu instrumen (dalam hal ini kuesioner)
dilakukan dengan cara melakukan korelasi antar skor masing-masing variabel
dengan skor totalnya. Suatu variabel (pertanyaan) dikatakan valid bila skor
variabel tersebut berkorelasi secara signifikan dengan skor totalnya.
Teknik korelasi yang digunakan korelasi Pearson Product Moment:
N (XY)-
r= (XY) V[NX2 – (X)2][NY2 – (Y)2]
Keputusan uji:
Bila r hitung lebih besar dari r tabel € Ho ditolak, artinya variabel valid
Bila r hitung lebih kecil dari r tabel € Ho gagal ditolak, artinya variabel
tidak valid
CARA MENGUKUR RELIABILITAS

Pertanyaan dikatakan reliabel jika jawaban seseorang terhadap
pertanyaan adalah konsisten atau stabil dari waktu ke waktu. Jadi jika misalnya
responden menjawab “tidak setuju” terhadap perilaku merokok dapat
mempertinggi kepercayaan diri, maka jika beberapa waktu kemudian ia ditanya
lagi untuk hal yang sama, maka seharusnya tetap konsisten pada jawabab
semula yaitu tidak setuju.
Pengukuran reliabilitas pada dasarnya dapat dilakukan dengan dua cara :
a. Repeated Measure atau ukur ulang. Pertanyaan ditanyakan pada
reponden berulang pada waktu yang berbeda (misal sebulan kemudian),
dan kemudian dilihat apakah ia tetap konsistendengan jawabannya
b. One Shot atau diukur sekali saja. Disini pengukurannya hanya sekali dan
kemudian hasilnya dibandingkan dengan pertanyaan lain. Pada umumnya
pengukuran dilakukan dengan One Shot dengan beberapa pertanyaan
Pengujian reliabilitas dimulai dengan menguji validitas terlebih dahulu.
Jadi jika pertanyaan tidak valid, maka pertanyaan tersebut dibuang. Pertanyaan-
pertanyaan yang sudah valid kemudian baru secara bersama-sama diukur
reliabilitasnya.
KASUS:
UJI VALIDITAS DAN RELIABILITAS KUESIONER
Lakukan uji validitas dan reliabilitas kuesioner untuk mengetahui

tingkat stress pekerja industri. Untuk mengukur stress digunakan 5
pertanyaan. Uji coba dilakukan pada 15 responden dengan bentuk
pertanyaan sbb:
1. Apkah anda sering terpaksa bekerja lembur?
1. tidak pernah 2. jarang 3.kadang-kadang 4. sering 5. selalu
2. Menurut anda, apakah dalam hidup ini perlu bersaing?
1. tidak pernah 2. jarang 3. kadang-kadang 4. perlu 5. sangat perlu
3. Apakah anda mudah marah?
1. tidak 2. jarang 3. kadang-kadang 4. sering 5. Ya
4. Apakah anda sering terjadi konflik dengan keluarga?
5. Apakah anda sering terjadi konflik dengan teman kerja?
Hasil pretest pada 15 responden, sbb:

No P1 P2 P3 P4 P5
1 4 3 4 4 4
2 1 1 1 1 1
3 1 2 1 1 1
4 4 4 3 4 4
5 2 4 2 2 2
6 3 3 3 3 3
7 4 1 4 4 4
8 1 1 1 1 1
9 3 3 3 3 3
10 2 3 2 2 2
11 1 1 1 1 1
12 2 2 2 2 2
13 4 2 4 3 4
14 3 1 3 3 3
15 2 3 2 2 2
Ujilah kelima pertanyaan diatas apakah sudah valid dan reliabel
Penyelesaian:
Langkahnya:
1. Masukkan data tersebut ke SPSS
2. Klik ‘Analyze’
3. Pilih ‘Scale’
4. Pilih ‘Reliability Analysis’
5. Masukkan semua variabel ke dalam kotak ‘Items’ (ingat variabel yang

masuk hanya variabel yang akan diuji saja, yaitu P1, P2, P3, P4 dan P5)
bentuknya sbb:
6. Pada ‘Model’, biarkan pilihan pada ‘Alpha’
7. Klik Option ‘Statistics’
8. Pada bagian ‘Descriptives for’ klik pilihan ‘ítem’, Scale if Item deleted.
9. Klik ‘Continue’
10. Klik ‘OK’., terlihat hasil outputnya sbb :
Reliability Statistics
Cronbach's
Alpha N of Items
.928 5
Item Statistics
Mean Std. Deviation N

sering terpaksa lembur 2.47 1.187 15
Bersaing dlm hidup 2.27 1.100 15
Mudah marah 2.40 1.121 15
konflik keluarga 2.40 1.121 15
konflik dgn teman 2.47 1.187 15
Item-Total Statistics
Scale Corrected Cronbach's

Scale Mean if Variance if Item-Total Alpha if Item
Item Deleted Item Deleted Correlation Deleted
sering terpaksa lembur 9.53 15.124 .963 .881
Bersaing dlm hidup 9.73 20.924 .328 .993
Mudah marah 9.60 15.971 .915 .892
konflik keluarga 9.60 15.686 .955 .884
konflik dgn teman 9.53 15.124 .963 .881
Interpretasi:
Hasil analisis reliability memperlihatkan dua bagian. Bagian utama menunjukkan
hasil statistik deskriptif masing-masing variabel dalam bentuk mean, varian dll.
Pada bagian kedua memperlihatkan hasil dari proses validitas dan reliabilitas.
Kaidah yang berlaku bahwa pengujian dimulai dengan menguji validitas
kuesioner baru dilanjutkan uji reliabilitas.
a. Uji Validitas
Untuk mengetahui validitas kuesioner dilakukan dengan membandingkan nilai r
tabel dengan nilai r hitung.
*) Menentukan nilai r tabel
Nilai r tabel dilihat dengan tabel r (pada lampiran) dengan menggunakan df
= n- 2 € 15-2=13. Pada tingkat kemaknaan 5%, didapat angka r tabel =
0,514
**) Menentukan nilai r hasil perhitungan
Nilai r hasil dapat dilihat pada kolom “Corrected item-Total Correlation”
***) Keputusan
Masing-masing pertanyaan/variabel dibandingkan nilai r hasil dengan nilai r
tabel, ketentuan: bila r hasil > r tabel, maka pertanyaan tersebut valid.
Kesimpulan:
Terlihat dari 5 pertanyaan, ada satu pertanyaan yaitu P2 (r=0,3275) yang
nilainya lebih rendah dari r tabel (r=0,514). Sehingga pertanyaan P2 tidak valid,
sedangkan untuk pertanyaan P1, P3, P4 dan P5 dinyatakan valid.
Langkah selanjutnya melakukan analisis lagi dengan mengeluarkan pertanyaan
yang tidak valid. Lakukan prosedur/langkah seperti di atas yaitu:
1. Klik ‘Analyze’
2. Pilih ‘Scale’
3. Pilih ‘Reliability Analysis’
4. Masukkan keempat variabel ke dalam kotak ‘Items’ (variabel P2 tidak ikut
dianalisis)
5. Klik “OK” Kemudian muncul tampilan Output sbb:
Reliability Statistics
Cronbach's
Alpha N of Items
.993 4
Item Statistics
Mean Std. Deviation N

sering terpaksa lembur 2.47 1.187 15
Mudah marah 2.40 1.121 15
konflik keluarga 2.40 1.121 15
konflik dgn teman 2.47 1.187 15
Item-Total Statistics
Scale Corrected Cronbach's

Scale Mean if Variance if Item-Total Alpha if
Item Deleted Item Correlation Item
Deleted Deleted
sering terpaksa lembur 7.27 11.495 .996 .988
Mudah marah 7.33 12.095 .971 .994
konflik keluarga 7.33 12.095 .971 .994
konflik dgn teman 7.27 11.495 .996 .988
Interpretasi:
Sekarang terlihat bahwa dari keempat pertanyaan, semua mempunyai nilai r
hasil (Corrected item-Total Correlation) berada di atas dari niali r tabel
(r=0,514), sehingga dapat disimpulkan keempat pertanyaan tersebut valid.
b. Uji Reliabilitas
setelah semua pertanyaan valid semua, amnalisis dilanjutkan dengan uji
reliabilitas. Untuk mengetahui reliabilitas caranya adalah; membandingkan nialia
r hasil dengan r tabel.dalam uji reliabilitas sebagai nilai r hasil adalah nilai
“Alpha” (terletak di akhir output). Ketentuannya: bila r Alpha > r tabel, maka
pertanyaan tersebut reliabel
Dari hasil uji di atas ternyata, nilai r Alpha (0,9935) lebih besar dibandingkan
dengan nilai r tabel, maka keempat pertanyaan di atas dinyatakan reliabel.
B. Uji Interrater Reliability

Dalam melakukan penelitian dengan metode observasi seringkali antara peneliti
dengan numerator (pengumpul data) terjadi perbedaan persepsi terhadap
kejadian yang diamati. Agar data yang dihasilkannya valid, maka harus ada
penyamaan persepsi antara peneliti dengan petugas pengumpul data
(numerator). Uji interrater Reliability merupakan jenis uji yang digunakan untuk
menyamakan persepsi antara peneliti dengan petugas pengumpul data. Alat
yang digunakan untuk uji Interrater adalah uji statistik Kappa.
Prinsip ujinya: bila hasil uji Kappa signifikan/bermakna maka persepsi antara
peneliti dengan numerator sama, sebaliknya bila hasil uji kappa tidak
signifikan/bermakna, maka persepsi antara peneliti dengan numerator terjadi
perbedaan.
Contoh :
Suatu penelitian praktek keperawatan keluarga terdapat instrumen yang
berbentuk observasi terhadap perilaku perawat merawat pasien. Pertanyaanya:
Apakah dalam melakukan komunikasi dengan pasien bersifat ramah ?
1. ya 2. tidak
Kemudian dilakukan uji coba dengan pengamatan sebanyak 10 pasien, adapun

hasilnya sbb:
No pasien peneliti numerator
1 1 2
2 2 2
3 1 1
4 2 1
5 1 1
6 2 2
7 1 1
8 2 2
9 2 2
10 2 2
Ujilah apakah ada kesepakatan antara peneliti dengan numerator:
Langkah:
1. data di entry di SPSS
2. Klik analysis, sorot Descriptif, sorot dan klik Crostab
3. Masukkan variabel ‘peneliti’ ke bagian Row dan masukkan variabel
‘numerator’ ke bagian colom.
4. Klik tombol Statistic, klik Kappa
5. Klik Continue
6. Klik OK, dan hasilnya
Symmetric Measures
Asymp. b
a
Value Std. Error Approx. T Approx. Sig.
Measure of Agreement Kappa .583 .262 1.845 .065
N of Valid Cases 10
a. Not assuming the null hypothesis.
b. Using the asymptotic standard error assuming the null hypothesis.
Hasil uji didapatkan nilai koefisien kapaa sebesar 0,583 dan p valuenya sebesar
0,065. Dengan hasil ini berarti p value > alpha berarti hasil uji kappa tidak
signifikan/bermakna, sehingga kesimpulannya: ada perbedaan persepsi
mengenai aspek yang diamati antara peneliti dengan numerator.
PENGANTAR
4 ANALISIS DATA
1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya
adalah menganalisis data. Data mentah (raw data) yang sudah susah payah kita
kumpulkan tidak akan ada artinya jika tidak dianalisis. Analisis data merupakan
kegiatan yang sangat penting dalam suatu penelitian, karena dengan analisislah
data dapat mempunyai arti/makna yang dapat berguna untuk memecahkan
masalah penelitian.
Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu
dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat
langsung memberi jawaban penelitian, untuk itu perlu diketahui bagaimana
menginterpretasi hasil penelitian tersebut. Menginterpretasi berarti kita
menjelaskan hasil analisis guna memperoleh makna/arti.
Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas.
Interpretasi dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya
sebatas pada masalah penelitian yang diteliti berdasarkan data yang
dikumpulkan dan diolah untuk keperluan penelitian tersebut. Sedangkan
interpretasi dalam arti luas (analitik) yaitu interpretasi guna mencari makna data
hasil penelitian dengan jalan tidak hanya menjelaskan/menganalisis data hasil
penelitian tersebut, tetapi juga melakukan inferensi (generalisasi) dari data yang
diperoleh dengan teori-teori yang relevan dengan hasil-hasil penelitian tersebut.
Pada umumnya analisis data bertujuan untuk:

a. Memperoleh gambaran/deskripsi masing-masing variabel
b. Membandingkan dan menguji teori atau konsep dengan informasi yang
ditemukan
c. Menemukan adanya konsepbaru dari data yang dikumpulkan
d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau hanya
berlaku pada kondisi tertentu
Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari:

a. Jenis penelitian
b. Jenis sampel
c. Jenis data/variabel
d. Asumsi kenormalan distribusi data
a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat
masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan
survei. Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan
kuantitatif. Namun bila kita menginginkan untuk mendapatkan
pendapat/gambaran yang mendalam tentang suatu fenomena, maka data dapat
dikumpulkan dengan fokus grup diskusi atau observasi, maka analisisnya
menggunakan pendekatan analisis kualitatif.
c. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah kedua
sampel independen atau dependen. Misalnya pada penelitian survei yang tidak
menggunakan sampel yang sama, dapat digunakan uji statistik yang
mengasumsikan sampel yang independen. Misalkan survei untuk mengetahui
apakah ada perbedaan berat badan bayi antara bayi-bayi yang dilahirkan dari ibu
perokok dengan bayi-bayi dari ibu yang tidak merokok. Disini berarti kelompok
ibu perokok dan kelompok ibu bukan perokok bersifat independen.
Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum dan
sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang
digunakanadalah uji statistik utnuk data yang dependen. Misalnya, suatu
penelitian ingin mengetahui pengaruh penelitian manajemen terhadap kinerja
petugas kesehatan. Pertanyaan penelitiannya “Apakah ada perbedaan kinerja
petugas kesehatan antara sebelum dan sesudah mendapatkan pelatihan
manajemen?”. Dalam penelitian ini sampel kelompok petugas kesehatan bersifat
dependen, karena pada kelompok (orang) yang sama diukur dua kali yaitu pada
saat sebelum pelatihan (pre test) dan sesudah dilakukan pelatihan (Post Test).
c. Jenis Data/Variabel
Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik.
Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai
contoh, nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk
menjelaskan data berjenis katagorik, sedangkan untuk data jenis numerik
biasanya dapat menggunakan nilai rata-rata untuk menjelaskan karakteristiknya.
Untuk analisis hubungan dua variabel (analsis bivariat), uji kai kuadrat hanya
dapat dipakai untuk mengetahui hubungan data katagori dengan data katagori.
Sebaliknya untuk mengetahui hubungan numerik dengan numerik digunakan uji
korelasi/regresi.
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi
datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan
prosedur uji statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat
dipenuhi maka dapat digunakan uji statistik parametrik.
Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan
kuantitatif):
1. Analisis Deskriptif (Univariat).
Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan
karakteristik masing-masing variabel yang diteliti. Bentuknya tergantung dari
jenis datanya. Untuk data numerik digunakan nilai mean (rata-rata), median,
standard deviasi dan inter kuartil range, minimal maksimal.
2. Analisis Analitik (Bivariat)
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan
analisis lebih lanjut. Apabila diinginkan analisis hubungan antar dua variabel,
maka analisis dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui
hubungan antara berat badan dengan tekanan darah. Untuk mengetahui
hubungan dua variabel tersebut biasanya digunakan pengujian statistik. Jenis
uji statistik yang digunakan sangat tergantung jenis data/variabel yang
dihubungkan.
3. Analisis Multivariat
Merupakan analisis yang menghubungkan antara beberapa variabel
independen dengan satu variabel dependen.
Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan

dipelajari pada bab tersendiri yaitu bab 5, 6 dan 7
ANALISIS UNIVARIAT
5 ( DESKTIPTIF)
Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan

karakteristik masing-masing variabel yang diteliti. Dalam analisis data kuantitatif
kita dihadapkan pada kumpulan data yang besar/banyak yang belum jelas
maknanya. Fungsi analisis sebetulnya adalah menyederhanakan atau meringkas
kumpulan data hasil pengukuran sedemikian rupa sehingga kumpulan data
tersebut berubah menjadi informasi yang berguna. Peringkasan tersebut berupa
ukuran-ukuran statistik, tabel dan juga grafik.
Secara teknis pada dasarnya analisis merupakan kegiatan meringkas
kumpulan data menjadi ukuran tengah dan ukuran variasi. Selanjutnya
membandingkan gambaran-gambaran tersebut antara satu kelompok subyek dan
kelompok subyek lain, sesuai dengan tujuan yang ingin dicapai dalam analisis.
Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran
variasi) jenis data (apakah numerik atau katagorik) akan sangat menentukan
bentuk peringkasan datanya. Berikut akan diuraikan bentuk/cara peringkasan
data untuk data numerik dan data katagorik.
1. Peringkasan Data Untuk Data Jenis Numerik

a. Ukuran Tengah
Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil
pengukuran. Berbagai ukuran dikembangkan utnuk mencerminkan ukuran
tengah tersebut, dan yang paling sering dipakai adalah mean, median dan
mode/modus.
1). Mean
Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah
semua nilai pengukuran dibagioleh banyaknya pengukuran. Secara sederhana
perhitungan nilai mean dapat dituliskan dengan rumus :
X =  Xi / n
Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan

seluruh data dalam penghitungannya. Namun kelemahan dari nilai mean
adalah sangat dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi maupun
rendah. Oleh karena itu pada kelompok data yang ada nilai ekstrimnya
(sering dikenal dengan ‘distribusi data yang menceng/miring’), Mean tidak
dapat mewakili rata-rata kumpulan nilai pengamatan. Sebagai contoh data
yang ada nilai ekstrimnya adalah data penghasilan. Apabila mean
perndapatan perbulan adalah Rp 10.000.000,- , sebenarnya sebagian besar
orang pendapatannya di bawah Rp 10.000.000,- . Mean sebesar Rp
10.000.000,- diperoleh karena tarikan sekelompok kecil orang (misalnya
konglomerat) yang pendapatannya sangat tinggi. Dengan demikian
penggunaan mean untuk data yang ada nilai ekstrimnya (data yang
distribusinya menceng) kurang tepat.
Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr.
Mean = (1+3+4+2+90)/5 = 20 hr.
Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini
tendtunya tidak dapat mewakili karena secara visual datanya sebagian besar
kurang dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada
nilai ekstrimnya.
2). Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai
nialai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda
dengan nilai mean, penghitungan median hanya mempertimbangkan urutan
nilai dasil pengukuran, besar beda antar nilai di abaikan. Karena
mengabaikan besar beda, maka median tidak dipengaruhi oleh nilai ekstrim.
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke
besar b). Hitung posisi median dengan rumus
(n+1)/2 c). Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th
Data diurutkan: 20, 24, 26, 30, 36, 40
Posisi = (6+1)/2 = 3,5
Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28
Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa
berumur di atas 28 tahun
3). Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun
Bentuk Distribusi Data

Hubungan nilai mean, median dan mode akan menentukan bentuk
distribusi data:
- Bila nilai mean, median dan mode sama, maka bentuk distribusi datanya
normal
- Bila nilai mean > median > mode, maka bentuk distribusi datanya
menceng/miring ke kanan
- Bila nilai mean < median < mode, maka bentuk distribusi datanya menceng
/miring ke kiri
b. Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain
atau dengan kata lain hasil pengamatan akan bervariasi. Untuk menegtahui
seberapa jauh data bervariasi digunakan ukuran variasi antara lain range, jarak
linier kuartil dan standard deviasi.
1). Range
Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai
terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai
ekstrim. Keuntungan penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian
ditentukan kuartil bawah dan atas. Kuartil merupakan pembagiandata
menjadi 4 bagian yang dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil
II dan kuartil III.
Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di
atasnya.
Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data
berada di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di
atasnya.
Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih
baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi
sangat menyebar.
3). Standard Deviasi
Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai
pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi
terhadap mean disebut varian, yang rumusnya;
Varian = (Xi – X)2

n
Semakin besar nilai varian akan semakin bervariasi, karena satuan varian
(kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka
dikembangkan suatu ukuran variasi yang mempunyai satuan yang sama
dengan satuan pengamatan, yaitu Standard Deviasi.
Standard Deviasi merupakan akar dari varian:
Standard deviasi (S atau SD =(Xi – X)2

n
Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila

tidak ada variasi, maka SD=0
Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan

niali mean (rata-rata), median, standard deviasi dan inter quartil range, miinimal
dan maksimal. Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim
(distribusi normal), maka perhituungan nilai mean dan standard deviasi
merupakan cara analisis univariat yang tepat. Seddangkan bila dijumpai nilai
ekstrim 9distribusi data tidak normal), maka nilai nedian dan inter quartil range
(IQR) yang lebih tepat dibandingkan nilai mean.
2. Peringkasan Data Katagorik

Berbeda dengan data numerik, peringkasan, (baik ukuran tengah maupun
ukuran variasi) tidak beragam jenisnya. Pada data katagorik peringkasan data
hanya menggunakan distribusi frekuensi dengan ukuran persentase atau
proporsi. Bila data berjenis katagorik, tentunya informasi/peringkasan yang
penting disampaikan tidak mungkin/tidak lazim menggunakan ukuran mean atau
median. melainkan informasi jumlah dan persentase yang disajikan. Untuk
ukuran variasi, pada data katagorik variasi maksimal apabila jumlah antar
katagori sama.
Contoh: Kelas A: mahasiswa 50 dan mahasiswi 50
Kelas B: mahasiswa 90 dan mahasiswi 10
Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria
dan 50% wanita.
Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria)
karena pria 90% dan wanita hanya 10%.
3. Bentuk Penyajian Data

Bentuk penyajian analisis univariat dapat berupa tabel atau grafik. Namun
perlu diingat bahwa kita dianjurkan hanya memilih salah satu, tidak
diperkenankan secara sekaligus menggunakan tabel dan juga grafik dalam
m,enyampaikan informasi suatu data/variabel.
Contoh penyajian analisis deskriptif:
a. Data numerik
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999
Variabel Mean SD Minimal- Maksimal
Median
1. Umur 30,3 10,1 17 – 60
31,1
2. Lama hari rawat 10,1 8,9 2 – 60
7,0
b. Data katagorik
Tabel 2
Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X
tahun 1999
Pendidikan Jumlah Persentase

SD 60 60,0
SMP 30 30,0
SMU 10 10,0
Total 100 100,0
Bagaimana menginterpretasi tabel di atas?

“dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana?”
Selain untuk mendeskripsikan masing-masing variabel, analisis univariat
dapat juga sekaligus untuk mengeksplorasi variabel yang dapat berguna dalam
mendiagnosis asumsi statistik lanjut (terutama untuk variabel jenis numerik),
misalnya apakah variannya homogen atau heterogen, apakah distribusinya
normal atau tidak. Eksplorasi data juga dapat untuk mendeteksi adanya nilai
ekstrim/outlier, bila ada nilai ekstrim sangat menentukan analisis selanjutnya
(bivariat) apakah nilainya akan berkurang.
KASUS :
ANALISIS DESKRIPTIF (UNIVARIAT)
Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-
masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk
data numerik digunakan nialai mean (rata-rata), median, standard deviasi dll.
Sedangkan untuk data katagorik tentunya hanya dapat menjelaskan angka/nilai
jumlah dan persentase masing-masing kelompok. Berikut akan dipelajari cara
mengeluarkan analisis deskriptif di SPAA, dimulai untuk variabel katagorik
(sebagai latihan digunakan variabel ‘pendidikan’) dan kemudian dilanjutkan
variabel numerik (variabel umur).
a. Data Katagorik
Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi.
Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel
pendidikan dari file ‘ASI.SAV’.
1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive Statistic’ dan
pilih ‘Frequencies’, sehingga muncul tampilan:
2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak “ Variable (s)”
3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:
Frequencies
Statistics
pendidikan formal ibu menyusui

N Valid 50
Missing 0
pendidikan formal ibu menyusui
Cumulative
Valid 1 10 20.0 20.0 20.0
2 11 22.0 22.0 42.0
3 16 32.0 32.0 74.0
4 13 26.0 26.0 100.0
Total 50 100.0 100.0
Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai. Pada
contoh di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang
berpendidikan SD, proporsi dapat dilihat pada kolom ‘ Percent’, pada contoh di
atas ada 20% ibu yang berpendidikan SD. Kolom ‘Valid Percent’ memberi hasil
yang sama karena pada data ini tidak ada ’missing cases’. ‘Cumulative Percent’
menjelaskan tentang persent kumulatif. Pada contoh di atas ada 42,0% ibu yang
tingkat pendidikannya SD dan SMP. Dalam menginterpretasikan tabel katagorik
dapat dilihat dari variasi dan konsentrasi datanya.
Penyajian dan Interpretasi di Laporan Penelitian

Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di
laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya sbb:
Tabel …
Distribusi Responden Menurut Tingkat Pendidikan
Di............X tahun ….
Pendidikan Jumlah Persentase
SD 10 20,0
SMP 11 22,0
SMU 16 32,0
PT 13 26,0
Total 50 100,0
Distribusi tingkat pendidikan responden hampir merata untuk masing-masing

tingkat pendidikan. Paling banyak responden berpendidikan SMU yaitu 16 orang
(32,0%) sedangkan untuk pendidikan SD, SMP dan PT masing-masing 20,0%,
22,0% dan 26,0%.
b. Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan
ukuran tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata,
median dan modus. Sedangkan ukuran sebarannya (variasi) yang digunakan
adalah range, standard deviasi, minimal dan maksimal. Pada SPSS ada dua cara
untuk mengeluarkan analisis deskriptif yaitu dapat melalaui perintah
‘Frequencies’ atau perintah ‘Expolre’. Biasanya yang digunakan adalah
Frequencies oleh karena ukuran statistik yang dapat dihasilkan pada menu
‘Frequencies’ sangat lengkap (seperti mean, median, varian dll), selain itu pada
perintah ini juga dapat ditampilkan grafik histogram dan kurve normalnya.
Berikut akan dicoba mengeluarkan analisis deskriptif untuk variabel umur dengan
menggunakan perintah frequencies.
1. Aktifkan data “susu.sav”
2. Pilih ‘Analyze’
3. Pilih ‘Descriptive Statistic’
4. Pilih ‘Frequencies’, terlihat kotak frequencies:
5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda
panahsehingga umur masuk ke kotak variable (s).
6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya mean,
median, standard seviasi, minimum, maximum, SE.
8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’, lalu
klik ‘With Normal Curve’
10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran statistik
yang diminta dan dibawahnya tampak grafik histogram beserta curve
normalnya.
Frequencies
Statistics
Umur ibu menyusui

N Valid 50
Missing 0
Statistics
umur ibu menyusui

N Valid 50
Missing 0
Mean 25.10
Std. Error of Mean .686
Median 24.00
Mode 19
Std. Deviation 4.850
Minimum 19
Maximum 35
umur ibu menyusui
Cumulative
Valid 19 7 14.0 14.0 14.0
20 3 6.0 6.0 20.0
21 3 6.0 6.0 26.0
22 5 10.0 10.0 36.0
23 5 10.0 10.0 46.0
24 4 8.0 8.0 54.0
25 2 4.0 4.0 58.0
26 5 10.0 10.0 68.0
27 3 6.0 6.0 74.0
30 3 6.0 6.0 80.0
31 3 6.0 6.0 86.0
32 3 6.0 6.0 92.0
34 2 4.0 4.0 96.0
35 2 4.0 4.0 100.0
Total 50 100.0 100.0
Histogram
5
Frequency
Mean = 25.1
Std. Dev. = 4.85
0
N = 50
15 20
25 30 35
umur ibu menyusui
Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan
nilai standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas,
rata-rata umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi
4,85 tahun dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi
frekuensi ditampilkan menurut umur termuda sampai dengan umur tertua
dengan informasi tentang jumlah dan persentasenya. Bentuk distribusi data
dapat diketahui dari grafik histogram dan kurve normalnya. Dari tampilan grafik
dapat dilihat bahwa distribusi variabel umur berbentuk normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk
melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi
interval lakukan analisis eksplorasi data dengan perintah ‘ Explore’. Adapun
caranya sbb:
1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu
‘descriptive Statistics’, lalu pilih ‘Explore’
2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’ dan
‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:
3. Klik tombol ‘Plots’, dan pilih ‘Normality Plots With Test’
5. Klik ‘OK’, hasilnya dapat dilihat di layar:
Explore
Descriptives
Statistic Std. Error

umur ibu menyusui Mean 25.10 .686
95% Confidence Lower Bound 23.72
Interval for Mean Upper Bound
26.48
5% Trimmed Mean 24.90

Median 24.00
Variance 23.520
Std. Deviation 4.850
Minimum 19
Maximum 35
Range 16
Interquartile Range 9
Skewness .547 .337
Kurtosis -.812 .662
Tests of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu menyusui .130 50 .035 .920 50 .002
a. Lilliefors Significance Correction
umur ibu menyusui

umur ibu menyusui Stem-and-Leaf Plot
Frequency Stem & Leaf
7.00 1 . 9999999
20.00 2 . 00011122222333334444
10.00 2 . 5566666777
11.00 3 . 00011122244
2.00 3 . 55
Stem width: 10
Each leaf: 1 case(s)
Normal Q-Q Plot of umur ibu menyusui
1
Expected Normal
-1
-2
15 20 25 30 35
Observed Value
35
30
25
20
15
umur ibu menyusui

Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun
yang paling penting dari tampilan explore munculnya angka estimasi interval.
Dari hasil tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita
dapat menghitung 95% confidence interval umur yaitu 23,72 s.d. 26,48. jadi kita
95% yakin bahwa rata-rata umur ibu di populasi berada pada selang 23,72
sampai 26,48 tahun.
Uji kenormalan data:

Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk
mengetahuinya yaitu:
1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai bel
shape, berarti distribusi normal
2. Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi
standar errornya menghasilkan angka ≤ 2, maka distribusinya normal
3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value < 0,05) maka
distribusi normal. Namun uji kolmogorov sangat sensitif dengan jumlah
sampel, maksudnya : untuk jumlah sampel yang besar uji kolmogorov
cenderung menghasilkan uji yang signifikan (yang artinya bentuk
distribusinya tidak normal). Atas dasar kelemahan ini dianjurkan untuk
mengetahui kenormalan data lebih baik menggunakan angka skewness atau
melihat grafik histogram dan kurve normal
Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat
bentuk yang normal, selain itu hasil dari perbandingan skwness dan standar
error didapatkan: 0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti
distribusi normal. Dari hasil tersebut diatas dengan demikian variabel umur
disimpulkan berdistribusi normal.
Penyajian dan Interpretasi di Laporan Penelitian

Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di
laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah
sbb:
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x
Variabel Mean SD Minimal- Maksimal 95% CI
Umur 25,10 4,85 19 - 35 23,72 – 26,48
Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72
– 26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur
tertua 35 tahun. Dari hasil estimasi interval dapat disimpulkan bahwa 95%
diyakini bahwa rata-rata umur ibu adalah diantara 23,72 sampai dengan 26,48
tahun.
ANALISIS BIVARIAT
6
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan
analisis lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis
pembayaran berobat dan kepuasan pasien, kita hanya melakukan
pendeskripsian sendiri-sendiri untuk variabel jenis pembayaran dan kepuasan
pasien. Untuk variabel jenis pembayaran akan diketahui berapa persen yang
berobat dengan biaya sendiri dan berapa persen yang dibiayai askes. Begitu juga
untuk variabel kepuasan pasien, akan diketahui berapa persen yang puas dan
berapa persen yang tidak puas.
Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh
diatas berarti kita ingin mengetahui hubungan jenis pembayaran dengan
kepuasan pasien, maka analisis dilanjutkan pada tingkat bivariat. Pada analisis
bivariat kita dapat mengetahui apakah ada perbedaan kepuasan pasien antara
pasien dengan membayar sendiri dengan pasien dengan biaya askes. Kegunaan
analisis bivariat bisa untuk mengetahui apakah ada hubungan yang siginifikan
antara dua variabel, atau bisa juga digunakan untuk mengetahui apakah ada
perbedaan yang signifikan antara dua atau lebih kelompok(sampel).
Perbedaan Substansi/Klinis dan perbedaan Statistik

Perlu dipahami/disadari bagi peneliti bahwa berbeda bermakna/signifikan
secara statistik tidak berarti (belum tentu) bahwa perbedaan tersebut juga
bermakna dipandang dari segi substansi/klinis. Seperti diketahui bahwa semakin
besar sampel yang dianalisis akan semakin besar menghasilkan kemungkinan
berbeda bermakna. Dengan sampel besar perbedaan-perbedaan sangat kecil,
yang sedikit atau bahkan tidak mempunyai manfaat secara substansi/klinis dapat
berubah menjadi bermakna secara statitik. Oleh karena itu arti kegunaan dari
setiap penemuan jangan hanya dilihat dari aspek statistik semata, namun harus
juga dinilai/dilihat kegunaannya dari segi klinis/substansi. Sebagai contoh ada
studi eksperimen yang akan menguji dua obat (katakanlah obat A dan Obat B)
untuk mengathui pengaruhnya terhadap penurunan tekanan darah. Kemudian
obat A dan B diujicobakan pada dua kelompok relawan penderita hipertensi.
Hasil eksperimen didapatkan bahwa rata-rata penurunan tekanan darah setelah
minum obat A adalah 40 mmHg dan pada kelompok yang minum Obat B rata-
rata penurunannya 39 mmHg. Kemudian dilakukan uji statistik dan hasilnya
signifikan/bermakna (p value < alpha), apa yang dapat disimpulkan dari temuan
ini? Secara statistik memang terjadi perbedaan bermakna, namun secara
substansi tidaklah mempunyai perbedaan yang berarti, oleh karena perbedaan
mean penurunan tekanan darah antara obat A dan B hanya 1 mmHg. Dengan
hasil ini dapat disimpulkan bahwa sebenarnya antara obat A dan B tidak ada
perbedaan (sama saja) kasiatnya.
UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan
keputusan tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau
hubungan, cukup menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini
didasarkan pada besarnya peluang untuk memperoleh hubungan tersebut secara
kebetulan (by chance). Semakin kecil peluang tersebut (peluang adanya by
chance), semakin besar keyakinan bahwa hubungan tersebut memang ada.
Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk
memutuskan berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru
lebih baik daripada yang sekarang beraedar di pasaran. Untuk menjawab
pertanyaan ini maka perlu dilakukan pengujian hipotesis. Dengan pengujian
hipotesis akan diperoleh suatu kesimpulan secara probalistik apakah vaksin baru
tersebut lebih baik dari yang sekarang beredar di pasaran atau malah sebaliknya.
Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel
(data hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan.
Peluang untuk diterima atau ditolaknya suatu hipotesis tergantung besar
kecilnyanya perbedaan antara nilai sampel dengan nilai hipotesis. Bila perbedaan
tersebut cukup besar, maka peluang untuk menolak hipotesis besar pula,
sebaliknya bila perbedaan tersebut kecil, maka peluang untuk menolak hipotesis
menjadi kecil. Jadi, makin besar perbedaan antara nilai sampel dengan nilai
hipotesis, makin besar peluang untuk menolak hipotesis.
Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua
kemungkinan yaitu menolak hipotesis dan menerima hipotesis (gagal menolak
hipotesis). Perlu dipahami bahwa arti menerima hipotesis sebetulnya kurang
tepat, yang tepat adalah gagal menolak hipotesis. Dalam uji hipotesis bila
kesimpulannya menerima hipotesis, bukan berarti bahwa kita telah membuktikan
hipotesis tersebut benar, karena benar atau tidaknya suatui hipotesis hanya
dapat dibuktikan dengan mengadakan observasi pada seluruh populasi, dan hal
ini sangat sulit bahkan tidak mungkin untuk dilakukan. Jadi menerima hipotesis
sebetulnya artinya adalah kita tidak cukup bukti untuk menolak hipotesis, dengan
kata lain dapat diartikan kita gagal menolak hipotesis. Untuk memperjelas
pengertian bahwa “gagal menolak hipotesis berbeda dengan mengakui
kebenaran hipotesis (menerima hipotesis”, kita coba analogkan proses
persidangan kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan
membuktikan kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau
sitertuduh benar. Pengadilan memutuskan bahwa si tertuduh tidak dapat
dibuktikan bersalah, bukan memutuskan tidak bersalah. Dari uraian tersebut
sangatlah jelas bahwa istilah yang tepat dalam kesimpulan uji hipotesis adalah
gagal menolak hiopotesis, dan bukan menerima hipotesis.
1. Hipotesis
Hipotesis berasal dari kata hupo dan thesis. Hupo artinya
sementara/lemah kebenarannya dan thesis artinya pernyataan/teopri. Dengan
demikian hipotesis berarti pernyataan yang perlu diuji kebenarannya. Untuk
menguji kebenaran sebuah hipotesis digunakan pengujian yang disebut
pengujian hipotesis.
Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol
(Ho) dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang
masing-masing hipotesis tersebut.
a. Hipotesis Nol (Ho).
Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara
kedua kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara
variabel satu dengan variabel lainnya
Contoh:
1). Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari
ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak
merokok
2). Tidak ada hubungan antara merokok dengan berat badan bayi
b. Hipotesis Alternatif (Ha)

Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua
kelompok. Atau hipotesis yang menyatakan ada hubungan antara variabel
satu dengan variabel lainnya
Contoh:
1). Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu
yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok
2). Ada hubungan antara merokok dengan berat badan bayi
2. Arah dan bentuk hipotesis

Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu
arah (one tail) atau dua arah (twa tail)
a. One tail (satu sisi): bila hipotesis alternatifnya menyatakan adanya
perbedaan dan ada pernyataan yang mengatakan hal satu lebih tinggi/rendah
dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan
bayi dari ibu tidak merokok.
b. Two tail (dua sisi) merupakan hipotesis alternatif yang hanya menyatakan
perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi
dari ibu tidak merokok. Atau dengan kata lain: ada perbedaan berat badan
bayi antara mereka yang dilahirkan dari ibu yang merokok dibandingkan dari
ibu yang tidak merokok.
Contoh penulisan hipotesis:
Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan
tekanan darah, maka hipotesisnya sbb:
Ho : A = B
Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau
Tidak ada hubungan antara jenis kelamin dengan tekanan darah.
Ho : A  B
Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau
Ada hubungan antara jenis kelamin dengan tekanan darah
3. Menentukan Tingkat Kemaknaan (Level of Significance)

Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang biasanya
diberi notasi ‘’. Seperti sudah diketahui bahwa tujuan dari pengujian hipotesis
adalah untuk membuat suatu pertimbangan tentang perbedaan antara nilai
sampel dengan keadaan populasi sebagai suatu hipotesis. Langkah selanjutnya
setelah ktriteria/batasan yang digunakan untuk memutuskan apakah hipotesis
nol ditolak atau gagal ditolak yang disebut dengan tingkat kemaknaan (Level of
Significance). Tingkat kemakanaan, atau sering disebut dengan nilai ,
merupakan nilai yang menunjukkan besarnya peluang salah dalam menolak
hipotesis nol. Atau dengan kata lain, nilai  merupakan batas toleransi peluang
salah dalam menolak hipotesis nol. Dengan kata-kata yang lebih sederhana, nilai
 merupakan batas maksimal kesalahan menolak Ho. Bila kita menolak Ho
berarti menyatakan adanya perbedaan/hubungan. Sehingga nilai  dapat
diartikan pula sebagai batas maksimal kita salah dalam menyatakan adanya
perbedaan.
Penentuan nilai  (alpha) tergantung dari tujuan dan kondisi penelitian.
Nilai  yang sering digunakan adalah 10%, 5%, atau 1%. Untuk bidang
kesehatan masyarakat biasanya digunakan nilai  sebesar 5%. Sedangkan
unutuk pengujian obat-obatan digunakan batas toleransi kesalahan yang lebih
kecil misalnya 1%, karena mengandung risiko yang fatal. Misalkan seorang
peneliti yang akan menentukan apakah suatu obat bius berkhasiat akan
menentukan nilai  yang kecil sekali, peneliti tersebut tidak akan mau mengambil
risiko bahwaketidak berhasilan obat bius besar karena akan berhubungan
dengan nyawa seseorang yang akan dibius.
4. Pemilihan Jenis Uji Parametrik atau Non Parametrik

Dalam pengujian hipotesis sangat berhubungan dengan distribusi data
populasi yang akan diuji. Bila distribusi data populasi yang akan diuji berbentuk
normal/simetris/Gauss, maka proses pengujian dapat digunakan dengan
pendekatan uji statistik parametrik. Sedangkan bila distribusi data populasinya
tidak normal atau tidak diketahuidistribusinya maka dapat digunakan pendekatan
uji statistik non parametrik. Kenormalan suatu distribusi data dapat juga dilihat
dari jenis variabelnya, bila variabelnya berjenis numerik/kuantitatif biasanya
distribusi datanya mendekati normal/simetris, sehingga dapat digunakan uji
statistik parametrik. Bila jenis variabelnya katagorik (kualitatif), maka bentuk
distribusinya tidak normal, sehingga uji non parametrik dapat digunakan.
Penentuan jenis uji juga ditentukan oleh jumlah data yang dianalisis, bila jumlah
data kecil (<30) cenderung digunakan uji non parametrik.
PROSEDUR/LANGKAH UJI HIPOTESIS

Menetapkan Hipotesis
Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan
hipotesis alternatif (Ha).
1). Hipotesis nol (Ho)
Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara
kedua kelompok.
Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang
dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu
yang tidak merokok
2). Hipotesis alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua
kelompok.
Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari
ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak
merokok.
Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu
arah (one tail) atau dua arah (two tail).
Penentuan Uji Statistik Yang Sesuai

Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji statistik
mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena itu harus
digunakan uji statistik yang tepat sesuai dengan data yang diuji. Jenis uji statistik
sangat tergantung dari:
1). Jenis variabel yang akan dianalisis
2). Jenis data apakah dependen atau independen
3). Jenis distribusi data populasinya apakah mengikuti distribusi normal atau
tidak.
Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean
akan berbeda dengan uji statistik untuk mengetahui perbedaan
proporsi/persentase. Uji beda mean menggunakan uji t atau inova, sedangkan
uji untuk mengetahui perbedaan proporsi digunakan uji Kai kuadrat.
Menentukan Batas atau Tingkat Kemaknaan (Level og Significance)

Batas/tingkat kemaknaan, sering juga disebut dengan nilai . Penggunaan
nilai alpha tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan
masyarakat biasanya menggunakan nilai alpha 5%.
Penghitungan Uji Statitik

Penghitungan uji statistik adalah menghitung data sampel ke dalam uji
hipotesis yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara dua
kelompok, maka data hasil pengukuran dimasukkan ke rumus uji t. Dari hasil
dengan nilai populasi untuk mengetahui apakah ada hipotesis ditolak atau gagal
menolak hipotesis.
Keputusan Uji Statistik

Seperti telah disebutkan pada langkah D, bahwa hasil pengujian statistik
akan menghasilkan dua kemungkinan keputusan yaitu menolak hipotesis nol
(Ho) dan gagal menolak hipotesisi nol.
Seiring dengan kemajuan perkembangan komputer maka uji statistik
dengan mudah dan cepat dapat dilakukan dengan program-program statistik
yang tersedia di pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita melakukan
uji statistik melalui program komputer maka yang akan kita cari adalalah nilai p
(p value). Dengan nilai p ini kita dapat menggunakan untuk keputusan uji
statistik dengan cara membandingkan nilai p dengan  (alpha). Ketentuan yang
berlaku adalah:
a). Bila nilai p ≤ , maka keputusannya adalah Ho ditolak
b). Bila nilai p > , maka keputusannya adalah Ho gagal ditolak
Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti
kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang
dilakukan adalah two tail maka nilai p dari tabel harus dikalikan 2. dengan
demikian dapat disederhanakan dengan rumus : nilai p two tail = 2 x nilai p one
tail.
Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para
ahli statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam
memutuskan uji statistik menggunakan pendekatan ini.
Pengertian Nilai P
Nilai p merupakan nilai yang menunjukkan besarnya peluang salah
menolak Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai
besarnya peluang hasil penelitian (misal adanya perbedaan mean atau proporsi)
terjadi karena faktor kebetulan (by chance). Harapan kita nilai p adalah sekecil
mungkin, sebab bila nilai p-nya kecil maka kita yakin bahwa adanya perbedaan
pada hasil penelitian menunjukkan pula adanya perbedaan di populasi. Dengan
kata lain kalau nilai p-nya kecil maka perbedaan yang ada pada penelitian terjadi
bukan karena faktor kebetulan (by chance).
Contoh:
Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan
berat badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa rata-
rata berat badan bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat
badan bayi yang lahir dari ibu yang tidak hipertensi adalah 3000 gram.
Perbedaan berat bayi antara ibu yang hipertensi dengan ibu yang tidak
hipertensi sebesar 100 gram. Pertanyaan yang timbul adalah apakah perbedaan
berat badan bayi tersebut juga berlaku untuk seluruh populasi yang diteliti atau
hanya faktor kebetulan saja?. Untuk menjawab pertanyaan tersebut kemudian
dilakukan uji statistik yang tepat yaitu uji t. Miisalnya dihasilkan nilai p = 0,0110
maka berarti peluang adanya perbedaan berat bayi sebesar 1000 gram akibat
dari faktor kebetulan (by chance) adalah sebesar 0,0110. oleh karena
peluangnya sangat kecil (p=0,0110), maka dapat diartikan bahwa adanya
perbedaan tersebut bukan karena faktor kebetulan namun karena memang
karena adanya riwayat hipetensi.
Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat
Variabel I Variabel II Jenis uji statistik yang

digunakan
Katagorik  Katagorik - Kai kuadrat
- Fisher Exact
Katagorik  Numerik - Uji T
- ANOVA
Numerik  Numerik - Korelasi
- Regresi
ANALISIS BIVARIAT HUBUNGAN
7 KATAGORIKDENGAN NUMERIK
Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah
parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan
tekanan darah penduduk dewasa orang kota dengan orang desa. Atau, apakah
ada perbedaan berat badan antar sebelum mengikuti program diet dengan
sesudahnya. Uji statistik yang membandingkan mean dua kelompok data ini
disebut uji beda dua mean. Pendekatan ujinya dapat menggunakan pendekatan
distribusi Z dan distribusi t , sehingga pada uji beda dua mean bisa
menggunakan uji Z atau uji t, namun lebih sering digunakan uji t.
Sebelum kita melakukan uji statistik dua kelompok data, kita perlu
mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok
yang independen atau berasal dari dua kelompok yang
dependen/pasangan. Dikatakan kelompok independen bila data kelompok
yang satu tidak tergantung dari kelopok kedua, misalnya membandingkan mean
tekanan darah sistolik orang desa dengan orang kota. Tekanan darah orang
kota independen (tidak tergantung) dengan orang desa. Dilain pihak, kedua
kelompok data dikatakan dependen/pasangan bila kelompok data yang
dibandingkan datanya saling mempunyai ketergantungan, misalnya data berat
badan sebelum dan sesudah mengikuti program diet berasal dari orang yang
sama (data sesudah dependen/tergantung dengan data sebelum).
Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi
dalam dua kelompok, yaitu: uji beda mean independen (uji T independen) dan
uji beda mean dependen (uji T dependen).
1. Uji beda dua mean independen

Tujuan: untuk mengetahui perbedaan mean dua dua kelompok data independen,
syarat yang harus dipenuhi:
a. Data berdistribusi normal/simetris.
b. Kedua kelompok data independen.
c. Variabel yang dihubungkan berbentuk numerik dan katagorik (ket: variabel
katagorik hanya dengan dua kelompok).
Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua
kelompok data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah
varian kedua kelompok yang diuji sama atau tidak. Bentuk varian kedua
kelompok data akan berpengaruh pada nilai standar error yang akhirnya akan
membedakan rumus pengujiannya.
a. Uji untuk varian sama
Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. uji
Z dapat digunakan bila standar deviasi populasi () diketahui dan jumlah
sampel besar (>30). Apabila kedua syarat tersebut tidak terpenuhi maka
dilakukan uji . pada umumnya nilai  sulit diketahui, sehingga uji beda dua
mean biasanya menggunakan uji T (T Test). Untuk varian yang sama maka
bentuk ujinya sbb:
X1 – X2
T=
Sp(1/n1) + (1/n2)
(n1-1) S12 + (n2 – 1) S22

Sp2 =
n1 – n2 - 2
df = n1 – n2 - 2
Ket :
n1 atau n2 = jumlah sampel kelompok 1 atau 2
S1 atau S2 = standar deviasi sampel kelompok 1 atau 2
b. Uji untuk varian berbeda
X1 – X2
T=
(S12/n1) + (S22/n2)
[(S12/n1) + (S22/n2)]2
df = [(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]
c. Uji homogenitas varian

Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data satu
apakah sama dengan kelompok data yang kedua.
S12
F=
S22
df1 = n1-1 dan df2 = n2-1

Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan varian
yang lebih kecil sebagai penyebut.
2. Uji beda dua mean dependen (Paired sample)

Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang
dependen. Contoh kasus:
 Apakah ada perbedaan tingkat pengetahuan antara sebelum dan sesudah
dilakukan pelatihan.
 Apakah ada perbedaan berat badan antara sebelum dan sesudah
mengikuti program diet.
Syarat :
a. Distribusi data normal
b. Kedua kelompok data dependen/pair
c. Jenis variabel: numerik dan katagorik (dua kelompok)
Formula :
d
T=
S_d / n
d = rata-rata deviasi/selisih sampel 1 dengan sampel 2

S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2
KASUS:
UJI t INDEPENDEN DAN UJI t DEPENDEN
1. Uji t independen
Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji hubungan
perilaku menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada
perbedaan kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang
menyusuinya tidak eksklusif, caranya:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub menu
“Compare Means’, lalu pilih “Independen-Samples T Test”
3. Pada layar tampak kotak yang di dalamnya ada kotak ‘ Test variable (s)’I dan
‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan variabel
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.
4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’
5. Klik variabel ‘eksklu’ dan masukkan ke kotak‘Grouping Variable’.
6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada contoh ini, kita
tahu bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’ untuk Yang
eksklusif. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2”
7. Klik “Continue”
8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
Std. Error
status menyusui asi N Mean Std. Deviation Mean
kadar hb pengukuran tdk EKSKLUSIVE 24 10.421 1.4712 .3003
pertama EKSKLUSIVE 26 10.277 1.3228 .2594
Independent Samples Test
Levene's Test
for Equality of
Variances t-test for Equality of Means
Std. 95% Confidence

Sig. Mean Error Interval of the
(2-taile Differen Differe Difference
F Sig. t df d) ce nce Lower Upper
kadar hb Equal
pengukur variances .072 .790 -.364 48 .717 -.1439 .3951 -.9384 .6505
an assumed
pertama Equal
variances
not -.363 46.4 .719 -.1439 .3968 -.9425 .6547
assumed
Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan
standar error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb
ibu yang menyusui ekslusif adalah 10,277 gr% dengan standar deviasi 1,322
gr%, sedangkan untuk ibu yang menyusui non eksklusif, rata-rata kadar Hb-nya
adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua
uji T, yaitu uji T dengan asumsi varian kedua kelompok sama ( equal variances
assumed) dan uji T dengan asumsi varian kedua kelompok tidak sama ( equal
variances not assumed). Untuk, memilih uji mana yang kita pakai, dapat dilihat
uji kesamaan varian melalui uji Levene. Lihat nilai p Levene test, nilai p < alpha
(0,05) maka varian berbeda dan bila nilai p > alpha (0,05) maka varian sama
(equal). Pada uji Levene di atas menghasilkan nilai p = 0,790 sehingga dapat
disimpulkan bahwa pada alpha 5%, didapat tidak ada perbedaan varian (varian
kedua kelompok sama). Selanjutnya dicari p value uji t pada bagian varian sama
(equal variances) di kolom sig (2 tailed) ,yaitu sebesar p=0,717 artinya tidak ada
perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui eksklusif
dengan ibu yang menyusui non eksklusif.
Penyajian dan Interpretasi di laporan penelitian:

Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy dan
disajikan di laporan penelitian. Pada laporan penelitian kita harus membuat tabel
baru untuk menyajikan hasil print out analisis di atas. Adapun bentuk penyajian
dan interpretasinya adlah sbb:
Tabel …
Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th..
Menyusui Mean SD SE P value N
Ya Eksklusif 10,277 1,322 0,259 0,717 26

Tdk Eksklusif 10,421 1,471 0,300 24
Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan
standar deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif
rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji statistik didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak
ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui
secara eksklusif dengan non eksklusif.
2. Uji T Dependen
Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji
T dependen sering digunakan pada analisis data penelitian eksperimen. Seperti
sudah dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau
kedua kelompok sampel yang dibandingkan mempunyai subyek yang sama.
Dengan kata lain disebut dependen bila responden diukur dua kali/diteliti dua
kali, sering orang mengatakan penelitian pre dan post. Misalnya kita ingin
membandingkan berat badan antara sebelum dan sesudah mengikuti program
diet.
Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb
pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui
apakah ada perbedaan kadar Hb antara pengukuran pertama dengan
pengukuran kedua. Disini terlihat sampelnya dependen karena orangnya sama
diukur dua kali. Adapun langkahnya:
1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file ini.
“Compare Means’, lalu pilih “Paired-Samples T Test”
3. Klik ‘hb1’
4. Klik ‘hb2’
5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan
6. Klik ‘OK’ hasilnya tampak sbb
T-Test
Paired Samples Statistics
Std. Error
Mean N Std. Deviation Mean
Pair kadar hb pengukuran
10.346 50 1.3835 .1957
1 pertama
kadar hb pengukuran
10.860 50 1.0558 .1493
kedua
Paired Samples Correlations
N Correlation Sig.
Pair kadar hb pengukuran
1 pertama & kadar 50 .707 .000
hb pengukuran
kedua
Paired Samples Test
Paired Differences
95% Confidence
Std. Std. Interval of the Sig.
Deviati Error Difference (2-taile
Mean on Mean Lower Upper t df d)
Pair kadar hb
1 pengukuran
pertama - kadar -.5140 .9821 .1389 -.7931 -.2349 -3.701 49 .001
hb pengukuran
kedua
Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan

standar deviasi kadar Hb antara pengukuran pertama dan pengukuran kedua.
Rata-rata kadar Hb pada pengukuran pertama (hb1) adalah 10,346 gr% dengan
standar deviasi 1,38 gr%. Pada pengukuran kedua (hb2) didapat rata-rata kadar
Hb adalah 10,860 gr% dengan standar deviasi 1,05 gr%.
Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean
perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan standar
deviasi 0,982. perbedaan ini diuji dengan uji T berpasangan menghasilkan nilai p
yang dapat dilihat pada kolom “Sig (2-tailed)”. Pada contoh di atas didapatkan
nilai p=0,001, maka dapat disimpulkan ada perbedaan yang signifikan kadar hb
antara pengukuran pertama dengan pengukuran kedua.
Penyajian dan Interpretasi di laporan penelitian:
Dari hasil yang didapat di atas kemudian angka-angka disusun dalam
tabel yang disajikan dalam laporan penelitian. Bentuk penyajian dan
interpretasinya sbb:
Tabel …
Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan
Kedua di …. Th……
Variabel Mean SD SE P value N
Kadar Hb
Pengukuran I 10,346 1,38 0,19 0,001 50
Pengukuran II 10,860 1,05 0,14
Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan

standar deviasi 1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb
adalah 10,860 gr% dengan standar deviasi 1,05 gr%. Terlihat nilai mean
perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan standar
deviasi 0,982. hasil uji statistik didapatkan nilai 0,001 maka dapat disimpulkan
ada perbedaan yang signifikan antara kadar Hb pengukuran pertama dan kedua.
ANALISIS HUBUNGAN
8 KATEGORIKDENGAN NUMERIK
UJI ANOVA
Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data
baik yang independen maupun dependen. Namun seringkali kita jumpai jumlah
kelompok yang lebih dari dua, misalnya ingin mengetahui perbedaan mean berat
badan bayi untuk daerah Bekasi, Bogor dan Tangerang. Dalam menganalisis data
seperti ini (> 2 kelompok) sangat tidak dianjurkan menggunakan uji T.
kelemahan menggunakan uji T adalah; pertama kita melakukan uji berulang kali
sesuai kombinasi yang mungkin, kedua, bila melakukan uji T berulang kali akan
meningkatkan (inflasi) nilai , artinya akan meningkatkan peluang hasil yang
keliru.
Perubahan inflasi  sebesar = 1 – (1-)n
Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang
tepat) dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji
F.
Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua
sumber variasi yaitu variasi dalam kelompok ( within) dan variasi antar kelompok
(between). Bila variasi within dan between sama (nilai perbandingan kedua
varian sama dengan 1) maka mean-mean yang dibandingkan tidak ada
perbedaan, sebaliknya bila hasil perbandingan tersebut menghasilkan lebih dari
1, maka mean yang dibandingkan menunjuk ada perbedaan.
Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor
(one way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas
analisis varian satu faktor (one way).
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1. Varian homogen
2. Sampel/kelompok independen
3. Data berdistribusi normal
4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk
katagori yang lebih dari 2 kelompok.
Perhitungan uji ANOVA sbb:
Sb2
F= df = k-1 € untuk
Sw2
pembilang n-k € untuk
penyebut
(n1-1)S12 + (n2-1)S
2 2 ++ (nk-1)Sk2
Sw2 = N-k
n1(X1-X)2 + n2(X2-X)2 + ………+ nk(Xk-X)2

Sb2 =
k-1
n1.X1 + n2.X2 + ……. + nk.Xk X =

N
Ket N = jumlah seluruh data (n1 + n2 + ….. + nk)
Analisis Multi Comparison (POSTHOC TEST)

Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana saja
yang berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan ada
perbedaan yang bermakna (Ho ditolak). Ada berbagaijenis analisis multiple
comparasion diantaranya adalah Bonferroni, Honestly Significant different
(HSD), Scheffe dan lain-lain. Pada modul ini yang akan dibahas adalah metode
Bonferroni.
Perhitungan Bonfrroni adalah sbb
Xi - Xj
tij =
Sw2[(1/ni) + (1/nj)]
df = n – k
Dengan level of significance () sbb:

* =
(k2)
Kasus:
UJI ANOVA
Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan
berat badan bayi. Variabel pendidikan merupakan variabel katagorik dengan 4
katagori. Variabel berat bayi berbentuk numerik sehingga uji yang digunakan
ANOVA. Adapun caranya sbb:
1. Aktifkan/bukalah file data “ASI.SAV”
“Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul menu
One Way NOVA
3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak
Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik dan kotak
‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada kotak
Dependen diisi variabel “bbbayi” pada kotak Factor diisi variabel “Didik”.
4.
5. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”
7. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”
9. Klik “OK”
Oneway
Descriptives
berat badan bayi

95% Confidence Interval for
Mean
Std. Std. Minim Maxim
N Mean Deviation Error Lower Bound Upper Bound um um
SD 10 2470.00 249.666 78.951 2291.40 2648.60 2100 2900
SMP 11 2727.27 241.209 72.727 2565.23 2889.32 2100 3000
SMU 16 3431.25 270.108 67.527 3287.32 3575.18 3000 4000
PT 13 3761.54 386.304 107.141 3528.10 3994.98 3000 4100
Total 50 3170.00 584.232 82.623 3003.96 3336.04 2100 4100
Test of Homogeneity of Variances
berat badan bayi

Levene
Statistic df1 df2 Sig.
2.506 3 46 .071
ANOVA
berat badan bayi

Sum of
Squares df Mean Square F Sig.
Between Groups 12697038 3 4232345.862 48.334 .000
Within Groups 4027962 46 87564.400
Total 16725000 49
Post Hoc Tests
Multiple Comparisons
Dependent Variable: berat badan bayi Bonferroni
(I) (J)
pendidika pendidikan Mean
n formal formal ibu 95% Confidence Interval
Difference
ibu menyusui (I-J) Std. Error Sig. Lower Bound Upper Bound
SD SMP -257.273 129.294 .315 -613.76 99.21
SMU -961.250* 119.286 .000 -1290.14 -632.36
PT -1291.538* 124.468 .000 -1634.72 -948.36
SMP SD 257.273 129.294 .315 -99.21 613.76
SMU -703.977* 115.902 .000 -1023.54 -384.42
PT -1034.266* 121.228 .000 -1368.51 -700.02
SMU SD 961.250* 119.286 .000 632.36 1290.14
SMP 703.977* 115.902 .000 384.42 1023.54
PT -330.288* 110.492 .027 -634.93 -25.64
PT SD 1291.538* 124.468 .000 948.36 1634.72
SMP 1034.266* 121.228 .000 700.02 1368.51
SMU 330.288* 110.492 .027 25.64 634.93
*. The mean difference is significant at the .05 level.
Dari print out ini diperoleh rata-rata berat bayi dan stndar deviasi masing-masing
kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah
2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang
berpendidikan SMP rata-rata berat bayinya adalah 2727,2 gram dengan standar
deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata berat
bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka
yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan
standar deviasi 386,3 gram.
Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”,
terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005),
berarti pada alpha 5%, dapat disimpulkan ada perbedaan berat bayi diantara
keempat jenjang pendidikan.
Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons Bonferroni”
yang berguna untuk menelusuri lebih lanjut kelompok mana saja yang
berhubungan signifikan. Untuk mengetahui kelompok yang signifikan dapat
terlihat dari kolom Sig. Ternyata kelompok signifikan adalah tingkat pendidikan
SD dengan SMU, SD dengan PT, SMP dengan SMU, SMP dengan PT dan SMU
dengan PT.
Penyajian dan Interpretasi di laporan Penelitian

Tabel …
Distribusi Rata-Rata berat Bayi Menurut Tingkat pendidikan
Variabel Mean SD 95% CI P value
Pendidikan
- SD 2470,0 249,6 2291,4 – 2648,6 0,0005
- SMP 2727,2 241,2 3565,2 – 2889,3
- SMU 3431,2 270,1 3287,3 – 3575,1
- PT 3761,5 386,3 3528,1 – 3994,9
Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0

gram dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP
rata-rata berat bayinya adalah 2727,20 gram dengan standar deviasi 241,2
gram. Pada mereka yang berpendidikan SMU rata-rata berat bayinya adalah
3431,2 gram dengan standar deviasi 270,1 gram. Pada mereka yang
berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram dengan standar
deviasi 386,3 gram.
Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat
disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan.
Analisis lebih lanjut membuktikan bahwa kelompok yang berbeda signifikan
adalah tingkat pendidikan SD dengan SMU, SD dengan PT, SMP dengan
SMU,SMP dengan PT dan SMU dengan PT.
ANALISIS HUBUNGAN
9 KATAGORIKDENGAN KATAGORIK
UJI KAI KUADRAT
Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat
dinyatakan dalam bentuk angka-angka pengukuran (data numerik). Sebaliknya
justru yang kita jumpai adalah data hasil dari menghitung jumlah pengamatan
yang diklasifikasikan atas beberapa katagori. Data seperti ini disebut data
katagorik (kualitatif), misalnya jenis kelamin yang mempunyai katagori: laki-laki
dan perempuan; status merokok yang mempunyai katagori; perokok berat,
perokok ringan dan tidak merokok. Dalam penelitian kesehatan seringkali peneliti
perlu melakukan analisis hubungan variabel katagorik dengan variabel katagorik.
Analisis ii bertujuan untuk menguji perbedaan proporsi dua atau lebih kelompok
sampel. Uji statistik yang digunakan untuk menjawab kasus tersbut adalah UJI
KAI KUADRAT (CHI SQUARE).
Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku
menyusui ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif
antara ibu yang bekerja dengan ibu yang tidak bekerja. Dari contoh terlihat
bahwa variabel jenis pekerjaan (bekerja/tidak bekerja) merupakan variabel
katagorik, dan variabel perilaku menyusui (eksklusif/non eksklusif) juga
merupakan variabel katagorik.
Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita
pahami dengan benar apa itu variabel katagorik. Suatu variabel disebut
katagorik bila isi variabel tersebut terbentuk dari hasil klasifikasi/penggolongan,
misalnya variabel sex, jenis pekerjaan, golongan darah, pendidikan. Di lain
pihakvariabel numerik (misalnya berat badan, umur dll) dapat masuk/dapat
Data
menjadi variabel katagorik bila variabel tersebut sudah mengalami
pengelompokan. Misalkan kita ambil satu contoh variabel berat badan, berat
badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih termasuk variabel
numerik, namun bila sudah dilakukan pengelompokan menjadi (<50 kg (kurus),
50-60 kg (sedang) dan > 60 (gemuk) maka variabel tersebut sudah berjenis
katagorik.
1. Tujuan Uji kai Kuadrat

Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji
perbedaan proporsi/persentase antara beberapa kelompok data. Dilihat dari segi
datanya uji kai kuadrat dapat digunakan untuk mengetahui hubungan antara
variabel katagorik dengan variabel katagorik. Contoh pertanyaan penelitian untuk
kasus yang dapat dipecahkan oleh uji kai kuadrat misalnya:
a. Apakah ada perbedaan kejadian hipertensi antara wanita dan pria. Kasus ii
berarti akan menguji hubungan variabel hipertensi (katagori dengan
klasifikasi ya dan tidak) dengan variabel jenis kelamin (katagori dengan
klasisfikasi wanita dan pria)
b. Apakah ada perbedaan kejadian anemia antara ibu yang kondisi soseknya
tinggi, sedang dan rendah. Pada kasus ini akan menguji hubungan variabel
anemia katagori dengan klasifikasi ya dan tidak) dengan variabel Sosek
(katagori dengan klasifikasi rendah, sedang dan tinggi).
2. Prinsip dasar Uji Kai Kuadrat

Proses pengujian kai kuadrat adalah membandingkan frekuensi yang
terjadi (observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi
observasi dengan nilai frekuensi harapan sama, maka dikatakan tidak ada
perbedaan yang bermakna (signifikan). Sebaliknya, bila niali frekuensi observasi
dan nilai frekuensi harapan berbeda, maka dikatakan ada perbedaan yang
bermakna (signifikan).
Pembuktian dengan uji kai kuadrat dengan menggunakan formula:
(O – E)2 117
X2 = 
E
Data
df = (k-1)(n-1)
ket :
O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan
dalam bentuk tabel silang:
Variabel 2
Variabel 1 Jumlah
Tinggi Rendah
Ya a b a+b
Tidak c d c+d
Jumlah a+c b+d n
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan)
masing-masing sel dicari dengan rumus:
Total barisnya X total kolomnya

E = Jumlah keseluruhan data
misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah:

Ea = (a+b) x (a+c)
n
Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama.
Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan menggunakan rumus:
N (ad-bc)2
X2 =
(a+c)(b+d)(a+b)(c+d)
118
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang
besar. Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya
digunakan uji kai kuadrat yang sudah dikoreksi ( Yate Corrected atau Yate’s
Correction). Formula kai kuadrat Yate’s Correction adalah sbb:
(|O – E| - 0,5)2 X2 =
E
atau
N {|ad-bc|2 – (N/2)]2 X2 =
(a+c)(b+d)(a+b)(c+d)
3. Keterbatasan Kai Kuadrat

Seperti kita ketahui, uji kai kuadrat menuntut frekuensi
harapan/ekspektasi (E) dalam masing-masing sel tidak boleh terlampau kecil.
Jika frekuensi sangat kecil, penggunaan uji ini mungkin kurang tepat. Oleh
karena itu dalam penggunaan kai kuadrat harus memperhatikan keterbatasan-
keterbatasan uji ini. Adapun keterbatasan uji kai kuadrat adalah sbb:
a. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 1.
b. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 5,
lebih dari 20% dari jumlah sel.
Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti harus
menggabungkan katagori-katagori yang berdekatan dalam rangka memperbesar
frekuensi harapan dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk
analisis tabel silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb). Penggabungan ini
tentunya diharapkan tidak sampai membuat datanya kehilangan makna.
Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak
bisa menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji
Fisher’s Exact.
ODDS RATIO (OR) dan RISIKO RELATIF (RR)

Hasil uji Chi Square hanya dapat menyimpulkan ada tidaknya perbedaan
proporsi antar kelompok atau dengan kata lain kita hanya dapat menyimpulkan
ada/tidaknya hubungan du variabel katagorik. Dengan demikian uji Chi Square
tidak dapat menjelaskan derajat hubungan, dalam hal ini uji Chi Square tidak
dapat mengetahui kelompok mana yang memiliki risiko lebioh besar dibanding
kelompok lain.
Dalam bidang kesehatan untuk mengetahui derajat hubungan, dikenal
ukuran Risiko Relatif (RR) dan Odds Rasio (OR). Risiko relatif membandingkan
risiko pada kelompok ter-ekspose dengan kelompok tidak terekspose. Sedangkan
Odds Rasio membandingkan Odds pada kelompok ter-ekspose dengan Odds
kelompok tidak ter-eksp[ose. Ukuuran RR pada umumnya digunakan pada disain
Kohort, sedangkan ukuran OR biasanya digunakan pada desain kasus kontrol
atau ptong lintang (Cross Sectional).
Pengkodean Variabel :
Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hati-
hati jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada
konsistensi antara variabel independen dengan variabel dependen. Untuk
variabel independen, kelompok yang berisiko/expose diberi kode tinggi (kode
1) dan kode rendah (kode 0)untuk kelompok yang tidak berisiko/non expose.
Pada variabel dependennya, kode tinggi (kode 1) untuk kelompok kasus atau
kelompok yang menjadi fokus pembahasan penelitian dan kode rendah (kode 0)
untuk kelompok non kasus atau yang bukan menjadi fokus penelitian. Sebagai
contoh data di atas pengkodeannya adalah sbb: Ibu tidak bekerja diberi kode 1
dan bekerja kode 0 dan ibu yang menyusui secara eksklusif diberi kode 1 dan
non eksklusif diberi kode 0. Sebetulnya bisa juga kodenya dibalik, tapi harus
konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0,
tdk eksklusive =1.
Tabel …
Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan
Total
Pendidikan Rendah Tinggi
N % n % n %
SD 25 50,0 25 50,0 50 34,4
SMP 16 40,0 24 60,0 40 27,6
SMU 10 33,3 20 66,7 30 20,7
PT 5 20,0 20 80,0 25 17,3
Jumlah 56 38,7 89 61,3 145 100,0
Pembuatan persentase pada analisis tabel silang harus diperhatikan agar

tidak salah dalam menginterpretasi. Pada jenis penelitian survei/ Cross sectional
atau Kohort, pembuatan persentasenya berdasarkan nilai variabel independen.
Contoh di atas jenis penelitiannya Cross Sectional, variabel pendidikan sebagai
variabel independen dan pengetahuan sebagai variabel dependen. Dapat dilihat
di tabel persentasenya berdasarkan masing-masing kelompok tingkat pendidikan
(persentase baris). Contoh di atas dapat di interpretasikan sbb:
Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%) pasien
mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan SMP, ada
sebanyak 24 (60,0%) yang berpengetahuan tinggi. Dari 30 pasien yang
berpendidikan SMU ada sebanyak 20 (66,7%) yang berpengetahuan tinggi. Dan
dari 25 pasien yang berpendidikan PT, ada sebanyak 20 (80,0%) yang
berpengetahuan tinggi. Dari data ini terlihat ada kecenderungan bahwa semakin
tinggi tingkat pendidikan akan semakin tinggi tingkat pengetahuannya.
Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan
persentasenya berdasarkan variabel dependennya, misalkan terlihat pada tabel
berikut:
Tabel …
Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin
Kanker Paru
Jenis Total
Kasus Kontrol
Kelamin
n % N % n %
Laki-laki 75 75,0 30 30,0 105 52,5
Perempuan 25 25,0 70 70,0 95 47,5
Jumlah 100 50,0 100 50,0 200 100,0
Interpretasinya:
Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden
berjenis kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita
kanker paru, ada sebanyak (30%) responden yang berjenis kelamin laki-laki.
KASUS :
UJI KAI KUADRAT
Suatu penelitian ingin mengetahui hubngan pekerjaan dengan perilaku

menyusui. Variabel pekerjaan berisi dua nilai yaitu tidak bekerja dan bekerja,
dan variabel menyusui berisi dua nilai yaitu eksklusif dan non eksklusif. Untuk
mengerjakan soal ini gunakan data “Susu. SAV”.
Adapun prosedur di SPSS sbb:

1. Pastikan anda berada pada data editor ASI.SAV
2. Dari menu SPSS, klik “Analyze”, kemudian pilih “Descriptive statistic”, lalu
pilih “Crosstab”, sesaat akan muncul menu Crosstabs
3. Dari menu crosstab, ada dua kotak yang harus diisi, pada kotak “ Row(s)’ diisi
variabel independen (variabel bebas), dalam contoh ini variabel pekerjaan
masuk ke kotak “Row(s)”.
4. pada kotak “Column(s)” diisi variabel dependennya, dalam contoh ini variabel
perilaku menyusui masuk ke kotak “Column(s)”.
5. Klik option “Statistics..”, klik pilihan “Chi Square” dan klik pilihan “Risk”
7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”
9. Klik “OK” hasilnya tampak sbb:
Crosstabs
status pekerjaan ibu * status menyusui asi Crosstabulation
status menyusui asi

tdk
EKSKLUSIVE EKSKLUSIVE Total
status pekerjaan KERJA Count 17 8 25
ibu % within status
68.0% 32.0% 100.0%
pekerjaan ibu
tidak kerja Count 7 18 25
% within status
28.0% 72.0% 100.0%
pekerjaan ibu
Total Count 24 26 50
% within status
48.0% 52.0% 100.0%
pekerjaan ibu
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.

Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 8.013b 1 .005
Continuity Correctiona 6.490 1 .011
Likelihood Ratio 8.244 1 .004
Fisher's Exact Test .010 .005
Linear-by-Linear
7.853 1 .005
Association
N of Valid Cases 50
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
12. 00.
Risk Estimate
95% Confidence
Interval
Value Lower Upper
Odds Ratio for status
pekerjaan ibu (TIDAK 5.464 1.627 18.357
KERJA / KERJA)
For cohort status
menyusui asi = YA 2.250 1.209 4.189
EKSKLUSIVE
For cohort status
menyusui asi = .412 .208 .816
TIDAK EKSKLUS
N of Valid Cases 50
Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola
menyusui, dengan angka di masing-masing selnya. Angka yang paling atas
adalah jumlah kasus masing-masing sel, angka kedua adalah persentase
menurut baris (data yang kita analisis “ASI.SAV, berasal dari penelitian Cross
Sectional sehingga persen yang ditampilkan adalah persentase baris, namun bila
junis penelitiannya Case Control angka persentase yang digunakan adalah
persentase kolom)
Dari analisis data di atas maka interpretasinya:
Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara
eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui
secara eksklusif.
Hasil uji Chi Square dapat dilihat pada kotak “Chi Square Test”. Dari print
out muncul dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan,
“Angka yang mana yang kita pakai?”, apakah Pearson, Continuity Correction,
Likelihood atau Fisher?”
Aturan yang berlaku pada Chi Square adalah sbb:
a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang
digunakan adalah “Fisher’s Exact Test”
b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya
“Continuity Correction (a)”
c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji
“Pearson Chi Square”
d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya
digunakan untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada
bidang epidemiologi dan juga untuk mengetahui hubungan linier dua variabel
katagorik, sehingga kedua jenis ini jarang digunakan.
Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b
dibawah kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti
pada tabel silang diatas tidak ditemukan ada nilai E < 5
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan
koreksi (Continuity Correction) dengan p value dapat dilihat pada kolom
“Asymp. Sig” dan terlihat p valuenya = 0,011. berarti kesimpulannya ada
perbedaan perilaku menyusui eksklusif antara ibu yang bekerja dengan ibu yang
tidak bekerja. Dengan kata lain dapat disimpulkan bahwa ada hubungan status
pekerjaan dengan perilaku menyusui eksklusif.
Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya
hubungan dua variabel, sehingga uji ini tidak dapat untuk mengetahui
derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan
hubungan banyak metodenya tergantung latar belakangdisiplin keilmuannya,
misal untuk ilmu sosial dengan melihat koefisien Phi, koefisien Contingency dan
cramer’s V. sedangkan untuk bidang kesehatan terutama kesehatan masyarakat
digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis penelitian Cross
Sectional dan Case Control, sedangkan nilai RR digunakan bila jenis penelitiannya
Kohort.
Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464
(95% CI: 1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort
yaitu bearnya 2,250 (95% CI: 1,209 – 4,189). Pada data ini berasal dari
penelitian Cross Sectional maka kita dapat menginterpretasikan nialai OR=5,464
sbb: Ibu yang tidak bekerja mempunyai peluang 5,46 kali untuk menyusui
eksklusif dibandingkan ibu yang bekerja.. Pada perintah Crosstab nilai OR akan
keluar bila tabel silang 2 x 2, bila tabel silang lebih dari 2 x 2, misalnya 3 x 2, 4 x
2 dsb, maka nilai OR dapat diperoleh dengan analisis regresi logistik sederhana
dengan cara membuat “Dummy variable”
Penyajian dan Interpretasi di Laporan Penelitian:
Tabel …
Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui
Jenis Menyusui Total OR P

Pekerjaan Tdk Eksklusif Eksklusif (95% CI) value
n % n % n %
bekerja 17 68,0 8 32,0 25 100 5,464 0,011
Tdk Bekerja 7 28,0 18 72,0 25 100 1,6 – 18,3
Jumlah 26 52,0 24 48,0 50 100
Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui

eksklusif diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui
bayi secara eksklusif. Sedangkan diantara ibu yang tidak bekerja, ada 18
(72,0%) yang menyusui secara eksklusif. Hasil uji statistik diperoleh nilai
p=0,011 maka dapat disimpulkan ada perbedaan proporsi kejadian menyusui
eksklusif antara ibu tidak bekerja dengan ibu yang bekerja (ada hubungan yang
signifikan antara pekerjaan dengan perilaku menyusui). Dari hasil analisis
diperoleh pula nilai OR=5,464, artinya ibu tidak bekerja mempunyai peluang 5,46
kali untuk menyusui eksklusif dibanding ibu yang bekerja.
ANALISIS HUBUNGAN
10 NUMERIKDENGAN NUMERIK
UJI KORELASI DAN REGRESI LINIER SEDERHANA
Seringkali dalam suatu penelitian kita ingin mengetahui hubungan antara

dua variabel yang berjenis numerik, misalnya huubungan berat badan dengan
tekanan darah, hubungan umur dengan kadar Hb, dsb. Hubungan antara dua
variabel numerik dapat dihasilkan dua jenis, yaitu derajat/keeratan hubungan,
digunakan korelasi. Sedangkan bila ingin mengetahui bentuk hubungan antara
dua variabel digunakan analisis regresi linier.
1. Korelasi
Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan,
korelasi dapat juga untuk mengetahui arah hubungan dua variabel numerik.
Misalnya, apakah huubungan berat badan dan tekanan darah mempunyai derajat
yang kuat atau lemah, dan juga apakah kedua variabel tersebut berpola positif
atau negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat
dari diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang
menunjukkan titik-titik perpotongan nilai data dari dua variabel (X dan Y). Pada
umumnya dalam grafik, variabel independen (X) diletakkan pada garis horizontal
sedangkan variabel dependen (Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan
antara dua variabel X dan Y. selain memberi informasi pola hubungan dari kedua
variabel diagram tebar juga dapat menggambarkan keeratan hubungan dari
kedua variabel tersebut.
Derajat keeratan hubungan (kuat lemahnya hubungan) dapat dilihat dari

tebaran datanya, semakin rapat tebarannya semakin kuat hubungannya dan
sebaliknya semakin melebar tebarannya menunjukkan hubungannya semakin
lemah. Linier PositifLinier NegatifTak ada hubungan
Untuk mengetahui lebih tepat besar/ derajat hubungan dua variabel
digunakan Koefisien Korelasi Pearson Product Moment. Koefisien korelasi
disimbbolkan dengan r (huruf r kecil).

Koefisien korelasi (r) dapat diperoleh dari formula berikut:
N ( XY) – (X Y)

r=
[NX2 – (X)2] [NY – (Y)2
Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya
antara –1 s.d. +1.
r = 0 € tidak ada hubungan linier
r = -1 € hubungan linier negatif
sempurna r = +1 € hubungan linier
positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan
positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya
semakin bertambah berat badannya (semakin gemuk) semakin tinggi tekanan
darahnya. Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel
diikuti penurunan variabel yang lain, misalnya semakin bertambah umur
(semakin tua) semakin rendah kadar Hb-nya.
Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat
dibagi dalam 4 area, yaitu:
r = 0,00 – 0,25 € tidak ada hubungan/hubungan elmah r = 0,00 – 0,25 € hubungan sedang
r = 0,00 – 0,25 € hubungan kuat
r = 0,00 – 0,25 € hubungan sangat kuat / sempurna
Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama
untuk menjelaskan derajat hubungan derajat hubungan linier anatara dua
variabel. Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah
hubungan antara dua variabelteradi secara signifikan atau hanya karena faktor
kebetulan dari random sample (by chance). Uji hipotesis dapat dilakukan dengan
dua cara, yaitu pertama: membandingkan nilai r hitung dengan r tabel, kedua:
menggunakan pengujian dengan pendekatan distribusi t. Pada modul ini kita
gunakan pendekatan distribusi t, dengan formula:
n–2
t=r
1 – r2
df = n – 2
n = jumlah sampel
2. Regresi Linier Sederhana

Seperti sudah diuraikan di depan bahwa analisis hubungzn dua variabel
dapat digunakan untuk mengetahui bentuk hubungan dua variabel, yaitu dengan
analisis regresi.
Analisis regresi merupakan suatu model matematis yang dapat digunakan
untuk mengetahui bentuk hubungan antar dua atau lebih variabel. Tujuan
Data
analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu variabel
(variabel dependen) melalui variabel yang lain (variabel independen).
Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat
badan dan tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel
independen dan tekanan darah sebagai variabel dependen, sehingga dengan
regresi kita dapat memperkirakan besarnya nilai tekanan darah bila diketahui
data berat badan.
Untuk melakukan prediksi digunakan persamaan garis yang dapat
diperoleh dengan berbagai cara/metode. Salah satu cara yang sering digunakan
oleh peneliti adalah dengan menggunakan metode kuadrat terkecil ( least
square). Metode least square merupakan suatu metode pembuatan garis regresi
dengan cara meminimalkan jumlah kuadrat jarak antara nilai Y yang teramati
dan Y yang diramalkan oleh garis regresi itu. Secara matematis persamaan garis
sbb:
Y = a + bx
Persamaan di atas merupakan model deterministik yang secara sempurna/tepat
dapat digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi,
yang ditemukan oleh Issac Newton adalah contoh model deterministik. Variabel
kecepatan benda jatuh (variabel dependen) pada keadaan yang ideal adalah
fungsi matematik sempurna (bebas dari kesalahan) dari variabel independen
berat beda dan gaya gravitasi.
Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius
dapat dibuat persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat
dihitung/diprediksi secara sempurna/tepat (bebas kesalahan) bila suhu Celcius
(X) diketahui.
Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada
kemungkinan kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa
nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya
hubungan berat badan dengan tekanan darah, tidak setiap orang yang berat
badannya sama memiliki tekanan darah yang sama. Oleh karena hubungan X
132
Y = a + bx + e
Data
dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan
garis yang dibentuk menjadi:
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X
berubah satu unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati
dengan nilai Y yang sesungguhnya pada titik X tertentu
XY – (XY)/n
b= a = Y - bX
X2 – (X)2/n
Kesalahan Standar Estimasi (Standard Error of Estimate/Se)

Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan
persamaan estimasi untuk menjelaskan nilai variabel dependen yang
sesungguhnya. Semakin kecil nilai Se, makin tinggi ketepatan persamaan
estimasi yang dihasilkan untuk menjelaskan niali variabel dependen yang
sesungguhnya. Dansebaliknya, semakin besar nilai Se, makin rendah ketepatan
persamaan estimasi yang dihasilkan untuk menjelaskan nilai variabel dependen
yang sesungguhnya. Untuk mengetahhui besarnya Se dapat dihitung melalui
133
Data
formula sbb:
134
Se =Y2 - aY - bXY
n-2
Koefisien Determinasi (R2)

Ukuran yang penting dan sering digunakan dalam analisisregresi adalah
koefisien determinasi atau disimbolkan R2 (R Square). Koefisien determinasi
dapat dihitung dengan mengkuadratkan nilai r, atau dengan formula R 2=r2.
Koeifisien determinasi berguna untuk mengetahui seberapa besar variasi variabel
dependen (Y) dapat dijelaskan oleh variabel independen (X). atau dengan kata
lain R2 menunjukkan seberapa jauh variabel independen dapat memprediksi
variabel dependen.Semakin besar nilai R square semakin baik/semakin tepat
variabel independen memprediksi variabel dependen. Besarnya nialai R square
antara 0 s.d. 1 atau antara 0% s.d. 100%.
KASUS :
KORELASI DAN REGRESI
Sebagai contoh kita akan melakukan analisis korelasi dan regresi

menggunakan data ‘ASI.SAV’ dengan mengambil variabel yang bersifat numerik
yaitu umur dengan kadar Hb (diambil Hb pengukuran pertama: Hb1).
A. Korelasi
Untuk mengeluarkan uji korelasi langkahnya adalah sbb:
1. Aktifkan data ‘ASI.SAV’
2. Dari menu utama SPSS, klik ‘Analyze’, kemudian pilih ‘Correlate’, dan lalu
pilih ‘Bivariate’, dan muncullah menu Bivariate Correlations:
3. Sorot variabel ‘Umur dan Hb1, lalu masukkan ke kotak sebelah kanan
‘variables’.
4. Klik ‘OK” dan terlihat hasilnya sbb:

Correlations
Correlations
berat berat
badan ibu badan bayi
berat badan ibu Pearson Correlation 1 .684**
Sig. (2-tailed) .000
N 50 50
berat badan bayi Pearson Correlation .684** 1
Sig. (2-tailed) .000
N 50 50
**. Correlation is significant at the 0.01 level (2-tailed).
Tampilan analisis korelasi berupa matrik antar variabel yang di korelasi,

informasi yang muncul terdapat tiga baris, baris pertama berisi nilai korelasi (r),
baris kedua menapilkan nilai p (P value), dan baris ketiga menampilkan N
(jumlah data). Pada hasil di atas diperoleh nilai r = 0,684 dan nilai p = 0,0005.
Kesimpulan dari hasil tersebut: hubungan berat badan ibu dengan berat badan
bayi menunjukkan hubungan yang kuat dan berpola positif artinya semakin
bertambah berat badannya semakin tinggi berat bayinya. Hasil uji statistik
didapatkan ada hubungan yang signifikan antara berat badan ibu dengan berat
badan bayi (p = 0,0005).
B. Regresi Linier Sederhana

Berikut akan dilakukan analisis regresi linier dengan menggunakan
variabel ‘berat badan ibu’ dan ‘berat badan bayi’ dari data ASI.SAV. dalam
analisis regresi kita harus menentukan variabel dependen dan variabel
independennya. Dalam kasus ini berarti berat badan ibu sebagai variabel
independen dan berat badan bayi sebagai variabel dependen. Adapun caranya:
1. Pastikan tampilan berada pada data editor ASI.SAV, jika belum aktifkan data
tersebut.
2. Dari menu SPSS, Klik ‘Analysis’, pilih ‘Regression’, pilih ‘Linear’
3. Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak
‘Dependen’ isikan variabel yang kita perlakukan sebagai dependen (dalam
contoh ini berarti berat badan bayi) dan pada kotak Independent isikan
variabel independennnya (dalam contoh ini berarti berat badan ibu), caranya
4. klik ‘berat badan bayi’, masukkan ke kotak Dependent
5. Klik ‘berat badan ibu’, masukkan ke kotak Independent
6. Klik ‘OK’, dan hasilnya sbb:
Regression
Model Summary
Adjusted Std. Error of

Model R R Square R Square the Estimate
1 .684a .468 .456 430.715
a. Predictors: (Constant), berat badan ibu
ANOVAb
Sum of
Model Squares df Mean Square F Sig.
1 Regression 7820262 1 7820261.965 42.154 .000a
Residual 8904738 48 185515.376
Total 16725000 49
a. Predictors: (Constant), berat badan ibu
b. Dependent Variable: berat badan bayi
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 657.929 391.676 1.680 .099
berat badan ibu 44.383 6.836 .684 6.493 .000
a. Dependent Variable: berat badan bayi
Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang

penting dalam regresi linier diantaranya: koefisien determinasi, persamaan garis
dan p value. Nilai koefisien determinasi dapat dilihat dari nilai R Square (anda
dapat lihat pada tabel ‘Model Summary’) yaitu besarnya 0,468 artinya,
persamaan garis regresi yang kita peroleh dapat menerangkan 46,8% variasi
berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk
menjelaskan variabel berat badan bayi. Selanjutnya pada tabel ANOVA b ,
diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada alpha 5% kita dapat
menyimpulkan bahwa regresi sederhana cocok (fit) dengan data yang ada
persamaan garis regresi dapat dilihat pada tabel ‘Coefficienta’ yaitu pada kolom
B. Dari hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept atau
nilai a) sebesar 657,93 dan nilai b = 44,38, sehingga persamaan regresinya:
Y = a + bX
Berat badan bayi = 657,93 + 44,38(berat badan ibu)
Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu
nilai berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada
kolom Sig T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak
hipotesis nol, berarti ada hubngan linier antara berat badan ibu dengan berat
badan bayi. Dari nilai b=44,38 berarti bahwa variabel berat badan bayi akan
bertambah sebesar 44,38 gr bila berat badan ibu bertambah setiap satu
kilogram.
Penyajian dan Interpretasi
Tabel …
Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi
Variabel R R2 Persamaan garis P value
Umur 0,684 0,468 bbayi =657,93 + 44,38*bbibu 0,0005
Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan
kuat (r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu
semakin besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468
artinya , persamaan garis regresi yang kita peroleh dapat menerangkan 46,8,6%
variasi berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk
menjelaskan variabel berat badan bayi. Hasil uji statistik didapatkan ada
hubungan yang signifikan antara berat badan ibu dengan berat badan bayi
(p=0,005).
Memprediksi variabel Dependen

Dari persamaan garis yang didapat tersebut kita dapat memprediksi
variabel dependen (berat badan bayi) dengan variabel independen (berat badan
ibu). Misalkan kita ingin mengetahui berat badan bayi jika diketahui berat badan
ibu sebesar 60 kg, maka:
Berat badan bayi =657,93 + 44,38(berat badan ibu)
Berat badan bayi= 657,93 + 44,38(60)
Berat badan bayi = 3320,73
Ingat prediksi regresi tidak dapat menghasil;kan angka yang tepat seperti di
atas, namun perkiraannya tergantung dari nilai ‘ Std, Error of The estimate’(SEE)
yang besarnya adalah 430,715 (lihat di kotak Model Summary). Dengan
demikianvariasi variabel dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan
tingkat kepercyaan 95% dan didapat nilai Z = 1,96, sehingga variasinya 1,96 *
430,715 =  844,201
Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg
diprediksikan berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr
C. Membuat Grafik Prediksi

Langkahnya:
1. Klik ‘Graphs, pilih ‘Scatter’
2. Klik Sampel klik ‘Define’
3. Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel
dependennya (masukkan Hb1)
4. Pada kotak X Axis isikan variabel independennya (masukkan veriabel
dependennya (masukkan Umur)
5. Klik ‘OK’
6. Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?)
7. Untuk mengeluarkan garisnya, klik grafiknya 2 kali
8. klik’Chart’
9. pada kotak ‘Fit Line, Klik Total
10. klik ‘OK’ maka muncul garis regresi
ANALISIS MULTIVARIAT
11
Proses analisis multivariat dengan menghubungkan beberapa variabel
independen dengan satu variabel dependen pada waktu yang bersamaan.
Jumlah sampel dalam analisis multivariat sangat penting diperhatikan, sebaiknya
jangan terlalu sedikit, pedoman yang berlaku adalah setiap variabel minimal
diperlukan 10 responden. Bila dalam penelitian terdapat 10 variabel, maka
diperlukan jumlah sampel minimal = 10 x 10 responden = 100 responden.
Dari analisis multivariat kita dapat mengetahui:
a. Variabel independen mana yang paling besar pengaruhnya terhadap variabel
dependen?
b. Apakah variabel independen berhubungan dengan variabel dependen
dipengaruhi variabel lain atau tidak?
c. Bentuk hubungan beberapa variabel independen dengan variabel dependen,
apakah berhubungan langsung atau pengeruh tidak langsung.
Prosedur pengujian tergantung dari jenis data yang diuji apakah katagori
atau numerik. Berikut adalah gambaran secara garisbesar beberapa analisis
statistik yang dapat digunakan untuk analisis multivariat:
Variabel Independen Variabel Dependen Jenis Uji

Numerik Numerik Uji Regresi Linier
(minimal 1 variabel numerik)
Katagori Numerik ANOVA
Katagori Katagori Uji Regresi Logistik
(dapat dengan numerik)
Kontinyu Katagori Uji Diskriminan
Numerik/Katgori Numerik waktu Uji Regresi Cox
Dalam melakukan analisis multivariat kita harus mengetahui terlebih
dahulu mengenai konsep konfounding dan Interaksi.
a.Konfounding
Konfounding merupakan kondisi bias dalam mengestimasi efek
pajanan/expose terhadap kejadian penyakit/masalah kesehatan, akibat dari
perbandingan yang tidak seimbang antara kelompok expose dengan kelompok
non expose. Masalah ini terjadi dikarenakan pada dasarnya sudah ada perbedaan
risiko terjadinya penyakit pada kelompok expose dengan kelompok non expose.
Artinya risiko terjadinya penyakit pada kedua kelompok itu berbeda meskipun
expose dihilangkan pada kedua kelompok tersebut.
Satu variabel disebut konfounding bila variabel tersebut merupakan faktor
risiko terjadinya penyakit dan memiliki hubungan dengan expose. Seorang ahli
statistik menyatkan bahwa suatu variabel dikatakan konfounding jika variabel
tersebut merupakan faktor risiko untuk terjadinya penyakit(outcome) dan
berhubungan dengan variabel independen tapi tidak merupakan hasil dari
variabel independen.
b.Interaksi
Interaksi atau efek modifikasi adalah heterogenitas efek dari satu expose
Pada tingkat expose yang lain. Jadi efek satu expose pada kejadian penyakit
berbeda pada kelompok expose lainnya. Tidak adanya modifikasi efek, berarti
efek expose homogen. Modisikasi efek merupakan konsep yang penting dalam
analisis karena pada saat analisis kita harus menentukan apakah akan
melaporkan efek bersama (yang terkontrol konfounder) atau efek yang terpisah
untuk masing-masing strata.
Pada analisis multivariat, jika ditemukan adanya interaksi antar variabel
expose dengan variabel lainnya, maka nilai koefisien, misalnya OR, harus
dilaporkan secarfa terpisah menurut strata dari variabel tersebut. Nilai OR yang
tertera pada variabel menjadi tidak berlaku dan nilai OR untuk masing-masing
strata harus dihitung
ANALISIS
12 REGRESI LINIER GANDA
Analisis Multiple regression Linear atau sering disebut juga analisis

regresi linier ganda merupakan perluasan analiss Simple Linear Regression
(regresi linier sederhana). Dalam analisis Simple Linear Regression hanya ada
satu variabel independen (variabel bebas) dihubungkan dengan satu variabel
dependen (terikat).. Sedangkan pada Multiple regression Linear merupakan
analisis hubugan antara beberapa variabel independen dengan satu variabel
dependen. Misalkan untuk mengetahui faktor-faktor yang berhubungan dengan
tekanan darah, dilakukan analisis dengan melibatkan variabel independen: umur,
berat badan, dan jenis kelamin.
Dalam regresi linier ganda variabel dependennya harus numerik
sedangkan variabel independen boleh semuanya numerik dan boleh juga
campuran numerik dan katagorik. Model persamaan regresi linier ganda
merupakan perluasan regresi linier sederhana, yaitu:
Y = a + b1X1 + b2X2 + …. + bkXk + e
1. Asumsi Regresi Linier

Seperti pada umumnya pengujian statistik, dari analisis regresi linier
ganda diharapkan dapat memberikan informasi yang lebih banyak bukan sekedar
diskripsi data teramati. Kita tentu ingin menarik inferensi (menggeneralisasi)
tentang hubungan variabel-variabel dalam populasi asal dari sampel diambil.
Bagaimanakanh hubungan antara umur, berat badan dan jenis kelamin ‘pada
semua orang (populasi)’, tidak hanya seperti yang teramati di sejumlah orang
pada sampel?. Oleh karena itu agar inferensi kita valid maka dalam analisis
regresi dianjurkan untuk mengikuti kaidah-kaidah yang dipersyaratkan dalam
analisis regresi. Dengan kata lain, setiap melakukan analisis Multiple regression
Linear harus memenuhi asumsi/persyaratan yang ditetapkan. Adapun asumsi
yang digunakan dalam Multiple regression Lineari sebagai berikut
a. Asumsi Eksistensi (Variabel Random)
Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen)
adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi
ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini,
sampel yang diambil harus dilakukan secara random. Cara mengetahui
asumsi eksistensi dengan cara melakukan analisis deskriptif vareiabel residual
dari model, bila residual menunjukkan adanya mean dan sebaran (varian ata
satandar deviasi) maka asumsi eksistensi terpenuhi.
b. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai
dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk
mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin
Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X 1, X2, X3, …, Xk terletak
pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)
bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier.
d. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity
dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran
tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka
dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi
homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola
tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka
diduga variannya terjadi heteroscedasticity.
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
2. Kegunaan Analisis Regresi Ganda

Tujuan analisis regresi linier ganda adalah untuk menemukan model
regresi yang paling sesuai menggambarkan faktor-faktor yang berhubungan
dengan variabel dependen. Pada prinsipnya, model regresi ganda dapat berguna
untuk dua hal:
a. Prediksi, memperkirakan variabel dependen dengan menggunakan informasi
yang ada pada sebuah atau beberapa variabel independen. Disini dapat
diketahui secara probabilitas nilai variabel dependen bila seseorang/individu
mempunyai suatu set variabel dengan independen tertentu. Misalnya kita
melakukan analisis variabel independen umur, BB dan jenis kelamin
dihubungkan dengan variabel dependen tekanan darah. Dari hasil regresi,
seseorang iindividu dapat diperkirakantekanan darahnya pada umur, berat
badan dan jenis kelamin tertentu.
b. Estimasi, menguantifikasihubungan sebuah atau beberapa variabel
independen dengan sebuah variabel dependen. Pada fungsi ini regresi dapat
digunakan untuk mengetahui variabel indepeden apa saja yang berhubungan
dengan variabel dependen. Selain itu kita juga dapat mengetahui seberapa
besar hubungan masing-masing independen terhadap variabel independen
lainnya. Dari analisis ini dapat diketahui variabel mana yang paling
besar/dominan mempengaruhi variabel dependen, yang ditunjukkan dari
koefisien regresi (b) yang sudah distandardisasi yaitu nilai beta.
3. Pemodelan
Satu hal yang penting dalam regresi ganda adalah bagaimana memilih
variabel independen sehingga terbentuk sebuah model yang paling sesuai
menjelaskan/ mengambarkan variabel dependen yang sesungguhnya dalam alam
(populasi).
Dalam pembuatan model seringkali dijumpai pandangan yang kurang
tepat yaitu “memasukkan semua/sebanyak mungkin variabel independen ke
dalam model”. Alasannya, dengan memasukkan sebanyak mungkin variabel
independen ke dalam model, maka variabel dependen diharapkan diprediksi
dengan sempurna. Perlu diketahui bahwa penambahan variabel independen tidak
selalu meningkatkan kemampuan prediksi variabel independen terhadap variabel
dependen, sebab semakin banyak variabel independen (lebih-lebih variabel yang
tidak relevan) mengakibatkan makin besarnya nilai standar error (Se). disamping
itu, model dengan banyak variabel seringkali malah menyulitkan dalam
interpretasi.
Berdasarkanpertimbangan tersebut pemilihan variabel independen
hendaknya dengan memperhatikan aspek statistik dan substansi. Model yang
dihasilkan diharapkan model yang PARSIMONI, artinya variabel yang masuk
dalam model sebaiknya yang sedikit jumlahnya, namun cukup baik untuk
menjelaskan faktor-faktor penting yang berhubngan dengan variabel dependen.
Banyak Kriteria yang dapat digunakan untuk memilih variabel masuk
dalam model, salah satu kriteria yang sering digunakan adalah melihat
perubahan R2 (R Square). Namun penggunaan kriteria ini perlu hati-hati, karena
setiap penambahan satu variabel independen akan meningkatkan R 2 walaupun
variabel tersebuttidak cukup penting. Oleh karena itu model yang digunakan
adalah model dengan nilai R2 yang besar namun variabel independennya dengan
jumlah sedikit.
Berikut langkah-langkah dalam pemodelan regresi linier ganda:
1). Melakukan analisis bivariat untuk menentukan variabel yang menjadi kandidat
model. Masing-masing variabel independen dihubungkan dengan variabel
dependen (bivariat), bila hasil uji bivariat mempunyai nilai p<0,25, maka
variabel tersebut masuk dalam model multivariat. Untuk variabel yang p
value-nya > 0,25 namun secara substansi penting, maka variabel tersebut
dapat masuk ke multivariat.
2) Lakukan analisis secara bersamaan, lakukan pemilihan variabel yang masuk
dalam model. Ada beberapa metode untuk melakukan pemilihan variabel
independen dalam analisis multivariat regresi linier ganda, yaitu:
a). ENTER, memasukkan semua variabel independen dengan serentak satu
langkah, tanpa melewati kriteria kemanaan statistik tertentu. Metode ini
yang tepat/sering digunakan, karena dalam pemodelan kita dapat
melakukan pertimbangan aspek substansi.
b). FORWARD, measukkan satu persatu variabel dari hasil pengkorelasian
variabel dan memenuhi kriteria kemaknaan statistik untuk masuk ke
dalam model, sampai semua variabel yang memenuhi kriteria tersebut
masuk ke dalam model. Variabel yang masuk pertama kali adalah variabel
yang mempunyai korelasi parsial terbesar dengan variabel dependen dan
yang memenuhi kriteria tertentu untuk dapat masuk model. Korelasi
parsial adalah adalah korelasi antara variabel independen dengan
dependen, kriteria variabel yang dapat masuk P-in (PIN) adalah 0,005
artinya variabel yang dapat masuk model bila variabel tersebut
mempunyai nilai P lebih kecil atau sama dengan 0,05.
c). BACKWARD, meamasukkan semua variabel ke dalam model, tetapi
kemudian satu persatu variabel independen dikeluarkan dari model
berdasarkan kriteria kemaknaan tertentu, variabel yang pertama kali
dikeluarkan adalah variabel yang mempunyai korelasi parsial terkecil
dengan variabel dependen. Kriteria pengeluaran atau P-out (POUT) adalah
0,10, artinya variabel yang mempunyai nilai P lebih besar atau sama
dengan 0,10 dikeluarkan dari model.
d). STEPWISE, model ini merupakan kombinasi antara metode backward dan
Forward. Seperti halnya forward, metode Stepwise dimulai dari tanpa
variabel sama sekali di dalam model. Lalu satu variabel hasil
pengkorelasian variabel dimasukkan ke dalam model. Lalu satu persatu
variabel hasil pengkorelasian dimasukkan ke dalam model dan
dikeluartkan dari model dengan kriteria tertentu. Variabel yang pertama
masuk sama dengan metode forward yakni variabel yang mempunyai
korelasi parsial terbesar. Selanjutnya setelah masuk, variabel pertama ini
diperiksa lagi apakah harus dikeluarkan dari model menurut kriteria
pengeluaran seperti metode backward.
e). REMOVE, mengeluarkan semua variabel independen dengan serentak satu
langkah, tanpa melewati kriteria kemaknaan statistik tertentu.
3) Melakukan diagnostik regresi linier,

a). Melakukan pengujian terhadap kelima asumsi.
b). Melakukan pengujian adanya kolinearitas. Kolinearitas terjadi bila antar
variabel independen terjadi saling hubungan yang kuat. Untuk mengetahui
adanya kolinearitas dapat dilihat dai nilai koefisien korelasi ®, bila nilai r
lebih tinggi dari 0,8 maka terjadi kolinearitas. Selain itu dapat diketahui
dari nilai VIF atau tolerance, bila nilai VIF > 10, atau tolerance sekitar 1
(satu) maka model terjadi kolinearitas.
4). Melakukan analisis interaksi. Setelah memperoleh model yang memuat

variabel-variabel penting, maka langkah selanjutnya adalah memeriksa
adanya interaksi antar variabel independen. Interaksi merupakan keadaan
dimana hubungan antara satu variabel independen dengan dependen
berbeda menurut tingkat variabel independen yang lain.
5). Penilaian reliabilitas model. Model regresi yang sudah terpilih perlu dicek
reliabilitasnya dengan cara membagi (split) sampel ke dalam dua kelompok.
Untuk masing-masing sampel dibuat model dengan variabel yang sama,
kemudian bandingkan antara model 1 dan model 2, bila hasilnya
sama/hampir sama maka model regresi reliabel. Bila model reliabel maka
seluruh sampel dapat digunakan untuk pembuatan model.
KASUS:
REGRESI LINIER GANDA
Sebagai latihan kita melakukan analisis penelitian “faktor-faktor yang
berhubungan dengan berat badan bayi”. Gunakan/aktifkan file data LBW.SAV.
Variabel independennya meliputi berat badan ibu dlm pounds (BWT), umur
ibu(AGE), riwayat hipetensi(HT), riwayat merokok(SMOKE), frekuensi mengalami
prematur (PTL) dan frekuensi melakukan ANC (FTV). Variabel dependennya
berat badan bayi (BWT).
Kode variabel pada file data : LBW.SAV
Nama Definisi Operasional Hasil Ukur
Id Nomor Identitas
Low Kondisi bayi dalam klasifikasi BBLR 0 = ≥ 2500 g
1 = < 2500 g
Age Umur ibu tahun
Lwt Berat ibu pada saat menstruasi terakhir pounds
Race Suku bangsa/ras 1= putih
2= hitam
3 = lainnya
Smoke Kebiasaan merokok selama hamil 0 = tidak
1 = ya
Ptl Riwayat mengalami prematur 0 = tidak
1 = ya
Ht Riwayat menderita hipertensi 0 = tidak
1 = ya
Ui Terjadi/mengalami iritability Uterine 0 = tidak
1 = ya
Ftv Frekuensi periksa hamil pada trimester pertama 0 ,1, 2 dst..
Bwt Berat badan bayi gram
Data selengkapnya ada di lampiran:
A. Langkah pertama pemodelan: SELEKSI BIVARIAT

Seleksi bivariat masing-masing variabel independen dengan variabel dependen.
Variabel yang dapat masuk model multivariat adalah variabel yang pada analisis
bivariatnya mempunyai nilai p (p value) < 0,25. Namun ketentuan p value<0,25
ini tidaklah harus dipenuhi manakala dijumpai ada suatu variabel yang walaupun
p value-nya > 0,25 karena secara substansi sangat penting berhubungan dengan
variabel dependen, maka variabel tersebut dapat diikutkan dalam model
multivariat.
Uji yang digunakan pada analisis bivariat tergantung dari variabel yang
digunakan, bila : variabel independennya numerik -> uji korelasi, bila
independennya katagorik -> uji t atau uji anova.
a. Bivariat uji korelasi : melakukan analisis bivariat untuk variabel independen

berjenis numerik: variabel berat badan ibu, umur ibu, frekuensi prematur,
frekuensi anc :
Langkahnya :
1. Klik ‘Analysis’, sorot ke ‘Correlate’, sorot dan klik ‘Bivariate’
2. Muncul dilayar menu ‘Bivariate Correlations’
3. Pada kotak Variables, isikan semua variabel numerik baik untuk variabel
independen (age,lwt,ptl,ftv) dan dependen (bwt)
4. Klik tombol ‘OK’
Muncul dilayar hasil sbb:
Correlations
Correlations
No
Weight of physician History Birth
Age of mother visits in of weight
mother (pounds) first prematur (gram)
trimester e labor
Age of mother Pearson Correlation 1 .180* . .072 .090
215**
Sig. (2-tailed) .013 .003 .328 .219
N 189 189 189 189 189
Weight of mother Pearson Correlation .180* 1 .141 -.140 .186*
(pounds) Sig. (2-tailed) .013 .054 .055 .010
N 189 189 189 189 189
No physician visits Pearson Correlation . .141 1 -.044 .058
in first trimester Sig. (2-tailed) 215** .054 .544 .426
.003
N
189 189 189 189 189
History of Pearson .072 -.140 -.044 1 -.155*

Correlation premature labor Sig. (2- .328 .055 .544 .034
tailed)
N 189 189 189 189 189
Birth weight (gram) Pearson Correlation .090 .186* .058 -.155* 1
Sig. (2-tailed) .219 .010 .426 .034
N 189 189 189 189 189
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
Hasil dari analisis bivariat dengan korelasi didapatkan nilai p value untuk variabel
umur (p=219), berat badan (p=0,010), frekuensi anc (p=0,426), frekuensi
prematur (p=0,034). Dari hasil ini dapat kita simpulkan bahwa variabel umur,
berat badan dan frekuensi prematur mempunayi p value < 0,25, dengan
demikian ketiga variabel tersebut dapat lanjut masuk ke pemodelan multivariat.
Sedangkan untuk variabel frekuensi anc mempunyai p value > 0,25 (yaitu
p=0,426) sehingga tidak bisa masuk ke multivariat, namun demikian oleh karena
secara substansi frekuensi anc merupakan faktor yang sangat penting
mempengaruhi berat badan bayi, maka variabel frekuensi anc tetap diikutkan
dalam analisis multivariat.
b. Bivariat uji t: melakukan analisis bivariat untuk variabel independen

berjenis katagorik: merokok dan riwayat hipertensi
1. Merokok
Langkahnya:
1.Dari menu utama SPSS, pilih menu ‘ Analyze”, kemudian pilih sub menu
2.Pada layar tampak kotak yang di dalamnya ada kotak ‘ Test variable’ dan
3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’
4.Klik variabel ‘smoke’ dan masukkan ke kotak‘Grouping Variable’.
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak merokok dan kode ‘1’ untuk Yang merokok. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
10. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
T-Test
Group Statistics
Std. Error
Smoking status N Mean Std. Deviation Mean
Birth weight (gram) No 115 3054.96 752.409 70.163
Yes 74 2773.24 660.075 76.732
Levene's Test
for Equality of
95% Confidence
Sig. Mean Std. Error Interval of the
(2-tail Differen Differenc Difference
F Sig. t df ed) ce e Lower Upper
Birth Equal
weight variances 1.508 .221 2.634 187 .009 281.713 106.969 70.693 492.7
(gram) assumed
Equal
variances
2.709 170.0 .007 281.713 103.974 76.467 487.0
not
assumed
Hasil analisis hubungan merokok dengan berat bayi menghasilkan p value =

0,009, dengan demikian p value yang dihasilkan < 0,25 maka variabel merokok
dapat lanjut ke multivariat.
2. Riwayat Hipertensi
Langkahnya:
1.Dari menu utama SPSS, pilih menu ‘ Analyze”, kemudian pilih sub menu
2.Pada layar tampak kotak yang di dalamnya ada kotak ‘ Test variable’ dan
3.Klik ‘bwt’ dan msukkan ke kotak ‘Test variable’
4.Klik variabel ‘ht’ dan masukkan ke kotak ‘Grouping Variable’. (variabel yang
sebelumnya (variabel smoke) dikeluarkan dahulu baru ‘ht’ dimasukkan
5.Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel ‘smoke’ ke dalam kedua kotak. Pada contoh ini, kita tahu
bahwa ‘0’ tidak ada hipertensi dan kode ‘1’ ada hipertensi’. Jadi ketiklah 0 pada
Group 1” dan 1 pada “Group 2”
6.Klik “Continue”
7.Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:
Group Statistics
Std. Error
History of hypertension N Mean Std. Deviation Mean
Birth weight (gram) No 177 2972.31 709.226 53.309
Yes 12 2536.75 917.341 264.813
Levene's Test for

Equality of
Std. 95% Confidence

Sig. Mean Error Interval of the
(2-taile Differe Differen Difference
F Sig. t df d) nce ce Lower Upper
Birth Equal
weight variances 1.419 .235 2.019 187 .045 435.56 215.709 10.024 861.1
(gram) assumed
Equal
variances
1.612 11.908 .133 435.56 270.126 -153.5 1025
not
assumed
Dari hasil analisis bivariat uji t antara variabel riwayat adanya hipertensi dengan
berat bayi didapatkan p value = 0,045, berarti p valuenya < 0,25 sehiingga
variabel riwayat adanya hipertensi dapat lanjut ke analisis multivariat
Dengan demikian selesailah sudah seleksi semua variabel independen, dari 6

variabel independen semuaanya masuk ke proses berikutnya yaitu ke analisis
multivariat.
B. Langkah Kedua : Pemodelan Multivariat
Setelah tahap bivariat selesai, tahap berikutnya melakukan analisis multivariat

secara bersama-sama. Variabel yang valid dalam model multivariat adalah
variabel yang mempunyai p value < 0,05. Bila dalam model multivariat dijumpai
variabel yang p value nya > 0,05, maka variabel tersebut harus dikeluarkan
dalam model. Pengeluaran variabel dilakukan tidak serempak, melainkan
bertahap satu per satu dikeluarkan dimulai dari p value yang terbesar. Adapun
proses selengkapnya sbb:
1. Klik ‘Analyisis’, sorot ‘Regression’, sorot dan klik ‘Linier’ lalu muncul menu
regresi linier,
a. Pada kotak ‘dependen isikan variabel dependen (dalam hal ini
berarti bwt) dan kotak ‘independen’ isikan variabel independennya
(dalam hal ini age, lwt, smoke, ht, ptl, ftv)
5. Pada kotak ‘Method’, pilih Enter’
6. Abaikan lainnya
7. Klik ‘OK’, dan hasilnya
Regression
Model Summary

1 .340a .116 .086 696.829
a. Predictors: (Constant), No physician visits in first
trimester, Smoking status, History of hypertension,
History of premature labor, Age of mother, Weight of
mother (pounds)
ANOVAb
Sum of
1 Regression 11543236 6 1923872.611 3.962 .001a
Residual 88373817 182 485570.423
Total 99917053 188
a. Predictors: (Constant), No physician visits in first trimester, Smoking status,
History of hypertension, History of premature labor, Age of mother, Weight of
mother (pounds)
b. Dependent Variable: Birth weight (gram)
Coefficientsa
1 (Constant) 2315.862 299.442 7.734 .000
Age of mother 7.162 10.022 .052 .715 .476
Weight of mother
4.793 1.777 .201 2.698 .008
(pounds)
Smoking status -232.253 105.928 -.156 -2.193 .030
History of premature labor -154.002 106.574 -.104 -1.445 .150
History of hypertension -574.230 215.481 -.193 -2.665 .008
No physician visits in first
-2.847 49.705 -.004 -.057 .954
trimester
a. Dependent Variable: Birth weight (gram)
Dari kotak ‘Model Sumarry” didapatkan nilai R Square sebesar 0,116, artinya
keenamm variabel independen dapat menjelaskan variabel berat bayi sebesar
11,6 % sedangkan sisanya dijelaskan oleh variabel lain. Dari hasil uji statistik
(lihat kotak anova) didapatkan p value = 0,001 berarti persamaan garis regresi
secara keseluruhan sudah signifikan. Namun demikian prinsip pemodelan harus
yang sederhana variabelnya sehingga masing-masing variabel indepeden perlu di
cek nilai p valuenya, variabel yang p valuenya > 0,05 dikeluarkan daari model.
Ternyata dari 6 variabel indepeden (lihat kolom sig di kotak Coefficients) ada 3
variabel yang p valuenya > 0,05, yaitu umur (age) p=0,476, riwayat prematur
(history prematur) p=0,150 dan frekuensi anc (no physician) p=0,954. Tahap
berikutnya mengeluarkan variabel yang p valuenya > 0,05, pengeluaran variabel
dimulai dari p value yang terbesar. Dengan demikian variabel yang kita coba
keluarkan adalah frekuensi anc(No physician..).
Langkahnya:
1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan
biarkan saja. Pada kotak Independen juga masih lengkap ada 6 variabel,
namun sekarang anda harus keluarkan variabel ‘no physician’ dan
masukkan ke kotak Variable di sebelah kiri.
3. Klik OK, dan hasilnya sbb:
Model Summary

1 .340a .116 .091 694.929
a. Predictors: (Constant), History of hypertension,
Smoking status, Age of mother, History of premature
labor, Weight of mother (pounds)
Coefficientsa
1 (Constant) 2317.608 297.074 7.801 .000
Age of mother 7.051 9.807 .051 .719 .473
Weight of mother
4.781 1.759 .201 2.718 .007
(pounds)
Smoking status -232.224 105.638 -.156 -2.198 .029
Setelah variabel frekuensi anc dikeluarkan, kita cek dulu apakah setelah
dikeluarkan, ada perubahan besar( berubah lebih dari 10 %) untuk R Square
dan Coef. B. Bila ada perubahan yang besar maka variabel tersebut tidak jadi
dikeluarkan dalam model (tetap dipertahankan di model). Untuk nilai R
Square ternyata tidak ada perunbahan yaitu tetap 0,116. Sedangkan untuk
coefisian B, Sekarang kita bandingkan nilai coefisien B untuk variabel umur,
berat ibu, merokok, riwayat prematur dan riwayat hiperteni antara sebelum
dan sesudah variabel frekuensi anc dikeluarkan, hasil perhitungannya sbb:
Variabel Anc msih ada Anc dikeluarkan perubahan Coef.

Age 7,1 7,0 1,4 %
bwt 4,7 4,7 0%
smoke -232,2 -232,2 0%
ptl -154,0 153,7 0,1 %
hi -574,2 573,0 0,1 %
ftv -2,8 -
Dari perhitungan perubahan nilai coefisien B pada masing-masing variabel,

ternyata tidak ada yang berubah lebih dari 10 %, dengan demikian variabel
frekuensi anc kita keluarkan dari model.
Selankutnya kita lihat kembali bahwa pada model masih ada variabel yang p
value > 0,05. Sekarang kita akan keluarkan variabel umur (p value =0,473).
Langkah/proses :
1. Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Di layar nampak pada kotak Dependen masih terisi ‘bwt’ lewati dan
biarkan saja. Pada kotak Independen juga masih terisi ada 5 variabel,
namun sekarang anda harus keluarkan variabel ‘umur (age)’ dan
masukkan ke kotak Variable di sebelah kiri.
3. Klik OK, dan hasilnya sbb:
Model Summary

1 .336a .113 .094 694.016
Smoking status, History of premature labor, Weight of
mother (pounds)
Coefficientsa
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026
Setelah variabel umur dikeluarkan, nilai R Square ternyata ada sedikit

perunbahan yaitu menjadi 0,113. sedangkan untuk coefisian B, , hasil
perhitungannya sbb:
Variabel Masih lengkap umur dikeluarkan perubahan Coef.

Age 7,1 - -
bwt 4,7 5,0 6,3 %
smoke -232,2 -236,4 1,8 %
ptl -154,0 145,4 6,1 %
hi -574,2 582,5 1,3 %
ftv -2,847 -
Dari hasil perhitungan perubahan coef. Ternyata tidak ada yang lebih dari 10 %,
dengan demikian variabel umur kita keluarkan dari model.
Langkah selanjutnya mengeluarkan variabel Riwayat mengalami prematur,

Prosesnya/langkahnya sama dengan diatas, Klik Analysis, sorot Regression, ..dst.
Pada kotak independen variabel riwayat mengalami prematur dikeluarkan dan
dimasukkan ke kotak variable disebelah kiri, dan hasilnya sbb:
Model Summary

1 a
.322 .104 .089 695.707
Smoking status, Weight of mother (pounds)
Coefficientsa
1 (Constant) 2390.105 230.391 10.374 .000
Weight of mother
5.352 1.710 .224 3.130 .002
(pounds)
Smoking status -263.009 103.812 -.177 -2.534 .012
Hasil R Square turun sedikit yaitu menjadi 0,104. Sedangkan hasil perhitungan
perubahan Coef. B dapat dilihat sbb:
Variabel Masih lengkap Prematur keluar perubahan Coef.

Age 7,1 - -
bwt 4,7 5,3 12,3 %
smoke -232,2 -236,4 1,7 %
ptl -154,0 - -
hi -574,2 582,5 1,3 %
ftv -2,847 -
Hasil perhitungan setelah dikeluarkan variabel prematur, ternyata coefisin B pada

variabel beat badan ibu (bwt) beubah sebesar 12,3 % dengan demikian variabel
riwayat mengalami prematur tidak jadi dikeluarkan dan tetap dipertahankan
dalam model multivariat. Dari hasil analisis ternyata tidak ada lagi yang p value-
nya > 0,05 dengan demikian proses pencarian variabel yang masuk dalam model
telah selesai dan model yang terakhir adalah sbb:
Model Summaryb
Adjusted Std. Error of Durbin-

Model R R Square R Square the Estimate Watson
1 .336a .113 .094 694.016 .222
a. Predictors: (Constant), History of premature labor, History
of hypertension, Smoking status, Weight of mother
(pounds)
Coefficientsa
Stand
ardize
d
Unstandardized Coeffi Collinearity
Mo Coefficients cients Statistics
de Tolera
l B Std. Error Beta t Sig. nce VIF
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
History of hypertension -582.566 213.148 -.195 -2.733 .007 .943 1.060
History of premature
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
Langkah selanjutnya UJI ASUMSI

Agar persaman garis yang digunkan untuk memprediksi menghasilkan angka
yang valid, maka persamaan yang dihasilkan harus memenuhi asumsi-asumsi
yang diersyaratkan uji regresi linier ganda. Adapun uji asumsinya sbb:
Langkahnya:
1.Klik ‘Analysis’, sorot ‘Regression’, sorot dan klik ‘Linier’
2. Masukkan dalam kotak Dependen variabel ‘bwt’
3. Masukan dalam kotak Independen variabel berat badan ibu (lwt),
merokok(smoke), riwayat hipertensi (hi) dan variabel riwayat prematur(ptl)
4.Klik tombol Statistics
5. Klik kotak ‘Collinearity diagnostic’ dan klik kotak ‘Covariance matrix’ (perintah
ini untuk uji asumsi multicoliniarity)
6. Klik kotak ‘Durbin-Watson’ (perintah ini untuk uji asumsi Independensi)
7. Klik Continue
8. Klik tombol ‘Plot”
9. Masukkan ‘SRESID’ ke kotak Y, dan masukan ‘ZPRED’ ke kotak X (perintah ini
untuk uji asumsi Homoscedasity)
10. Klik kotak ‘histogram’ dan kotak ‘Normal probability plot” (perintah ini untuk
uji asumsi Normality)
11. Klik Continue

Hasilnya :
a. Asumsi Eksistensi (Variabel Random)
Untuk tiap nilai dari variabel X (variabel independen), variabel Y (dependen)
adalah variabel random yang mempunyai mean dan varian tertentu. Asumsi
ini berkaitan dengan teknik pengambilan sampel. Untuk memenuhi asumsi ini,
sampel yang diambil harus dilakukan secara random. Cara mengetahui asunsi
eksistensi dengan cara melakukan analisis deskriptif vareiabel residual dari
model, bila residual menunjukkan adanya mean mendekati nilai nol dan ada
sebaran (varian ata satandar deviasi) maka asumsi eksistensi terpenuhi. Hasil
analisis:
Residuals Statisticsa
Minimum Maximum Mean Std. Deviation N

Predicted Value 2249.77 3602.03 2944.66 245.079 189
Std. Predicted Value -2.835 2.682 .000 1.000 189
Standard Error of
67.193 292.804 103.399 45.407 189
Predicted Value
Adjusted Predicted Value 1955.43 3616.97 2943.73 251.196 189
Residual -2082.610 1921.631 .000 686.593 189
Std. Residual -3.001 2.769 .000 .989 189
Stud. Residual -3.015 2.782 .001 1.005 189
Deleted Residual -2102.316 1940.423 .923 708.619 189
Stud. Deleted Residual -3.084 2.835 .000 1.010 189
Mahal. Distance .768 32.469 3.979 5.320 189
Cook's Distance .000 .209 .007 .019 189
Centered Leverage Value .004 .173 .021 .028 189
Hasil dari output diatas menunjukkan angka residual dengan mean 0,000 dan
standar deviasi 686,59. Dengan demikian asumsi Eksistensi terpenuhi
b. Asumsi Independensi
Suatu keadaan dimana masing-masing nilai Y bebas satu sama lain. Jadi nilai
dari tiap-tiap individu saling berdiri sendiri. Tidak diperbolehkan nilai
observasi yang berbeda yang diukur dari satu individu diukur dua kali. Untuk
mengetahui asuamsi ini dilakukan dengan cara mengeluarkan uji Durbin
Watson, bila nilai Durbin –2 s.d. +2 berarti asumsi independensi terpenuhi,
sebaliknya bila nilai Durbin < -2 atau > +2 berarti asumsi tidak terpenuhi
Model Summaryb

1 .336a .113 .094 694.016 .222
(pounds)
Dari hasil uji didapatkan koefisien Durbin Watson 0,222, berarti asumsi
independensi terpenuhi.
c. Asumsi Linieritas
Nilai mean dari variabel Y untuk suatu kombinasi X 1, X2, X3, …, Xk terletak
pada garis/bidang linier yang dibentuk dari persamaan regresi. Untuk
mengetahui asumsi linieritas dapat diketahui dari uji ANOVA (overall F test)
bila hasilnya signifilan (p value<alpha) maka moodel berbentuk linier. Hasil
uji asumsi :
ANOVAb
Sum of
1 Regression 11291987 4 2822996.778 5.861 .000a
Residual 88625066 184 481657.965
Total 99917053 188
a. Predictors: (Constant), History of premature labor, History of hypertension,
Smoking status, Weight of mother (pounds)
Dari output diatas menghasilkan uji anova 0,0005, berarti asumsi linearitas
terpenuhi
d. Asumsi Homoscedascity
Varian nilai variabel Y sama untuk semua nilai variabel X. Homoscedasticity
dapat diketahui dengan melakukan pembuatan plot residual. Bila titik tebaran
tidak berpola tertentu dan menyebar merata disekitar garis titik nol maka
dapat disebut varian homogen pada setiap nilai X dengan demikian asumsi
homoscedasticity terpenuhi. Sebaliknya bila titik tebaran membentuk pola
tertentu misalnya mengelompok di bawah atau di atas garis tengah nol, maka
diduga variannya terjadi heteroscedasticity.
Scatterplot
Dependent Variable: Birth weight (gram)
3
Regression Studentized Residual
-1
-2
-3
-4
-3 -2 -1 0 1 2 3
Regression Standardized Predicted Value
Dari hasil plot diatas terlihat tebaran titik mempunyai pola yang sama antara
titik-titik diatas dan dibawah garis diagonal 0. Dengan demikian asumsi
homoscedasity terpenuhi
e. Asumsi Normalitas
Variabel Y mempunyai distribusi normal untuk setiap pengamatan variabel X.
dapat diketahui dari Normal P-P Plot residual, bila data menyebar di sekitar
garis diagonal dan mengikuti arah garis diagonal, maka model regresi
memenuhi asumsi model regresi tidak memenuhi asumsi normalitas.
Histogram
40
30
Frequency
20
10
Mean = -2.53E-16
Std. Dev. = 0.989
0 N = 189
-4 -3 -2 -1 0 1 2 3
Regression Standardized Residual

Normal P-P Plot of Regression Standardized Residual

1.0
0.8
Expected Cum Prob
0.6
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Observed Cum Prob
Dari grafik histogram dan grafik normal P-P plot terbukti bahwa bentuk
distribusinya normal, berarti asumsi normality terpenuhi.
f. Diagostik Multicollinearity
Dalam regresi linier tidak boleh terjadi sesama variabel independen berkorelasi
secara kuat (multicollinearity). Untuk mendeteksi collinearity dapat diketahui dari
nilai VIF (variance inflation factor), bila nilai VIF lebih dari 10 maka
mengindikasikan telah terjadi collinearity.
Coefficientsa
Stand
ardize
d
de Tolera
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
Dari hasil uji asumsi didapatkan nilai VIF tidak lebih dari 10, dengan demikian
tidak ada Multicollinearity antara sesama variabel indepeden
Dari hasil uji asumsi dan uji kolinearitas ternyata semua asumsi terpenuhi
sehingga model dapat digunakan untuk memprediksi berat badan bayi.
Langkah sekanjutnya adalah UJI INTERAKSI, Namun karena secara substansi

antar variabel dipandang tidak interaksi maka uji interaksi tidak dilakukan.
Sehingga model yang terakhir adalah sbb:
Model Summaryb

1 .336a .113 .094 694.016 .222
(pounds)
Coefficientsa
Stand
ardize
d
de Tolera
1 (Constant) 2449.121 233.779 10.476 .000
Weight of mother
5.035 1.721 .211 2.925 .004 .925 1.081
(pounds)
Smoking status -236.420 105.338 -.159 -2.244 .026 .964 1.037
-145.412 105.417 -.098 -1.379 .169 .947 1.056
labor
Interpretasi model:
Setelah dilakuikan analisis ,ternyata variabel independen yang masuk

model regresi adalah berat badan ibu, ibu merokok, riwayat hipertensi, dan
riwayat prematur. Pada tabel ‘Model Summary’ terlihat koefisien determinasi (R
square) menunjukkan nilai 0,113 artinya bahwa model regresi yang diperoleh
dapat menjelaskan 11,3 % variasi variabel dependen berat bayi. Atau dengan
kata lain keempat variabel independen tsb dapat menjelaskan variasi variabel
berat bayi sebesar 11,3 %.. Kemudian pada kotak ‘ ANOVA’, kita lihat hasil uji F
yang menunjukkan nilai P (sig) = 0,000, berarti pada alpha 5% kita dapat
menyatakan bahwa model regresi cocok (fit) dengan data yang ada. Atau dapat
diartikan kedua variabel tersebut secara signifikan dapat utnuk memprediksi
variabel berat bayi.
Pada kotak ‘Coefficient’ kita dapat memperoleh persamaaan garisnya, pada
kolom B (di bagian Variabel In Equation) di atas, kita dapat mengetahui
koefisien regresi masing-masing variabel. Dari hasil di atas, peresamaat regresi
yang diperoleh adalah
Berat Bayi = 2449,1+5,0 Lwt – 236,4 smoke - 582Hi – 145,4 Ptl

Dengan model persamaan ini, kita dapat memperkirakan berat badan bayi
dengan menggunakan variabel berat badan ibu, merokok dan hipertensi. Adapun
arti koef. B untuk masing-masing variabel adalah sbb:
- Setiap kenaikan berat badan ibu sebesar 1 kg, maka berat badan bayi
akan naik sebesar 5,0 gram setelah dikontrol variabel merokok, hipertensi
dan prematur
- Pada ibu yang merokok berat bayinya akan lebih rendah sebesar 236,4
gram setelah dikontrol variabel berat badan, hipertensi dan prematur.
- Pada ibu yang menderita hipertensi,berat bayinya akan lebih rendah
sebesar 582,5 gram setelah dikontrol variabel berat badan ibu, merokok
dan prematur.
Kolom Beta dapat digunakan untuk mengetahui variabel mana yang paling besar
peranannya (pengaruhnya) dalam menentukan variabel dependennya (berat
badan bayi). Semakin besar nilai beta semakin besar pengaruh nya terhadap
variabel dependennya. Pada hasil di atas berarti variabel yang paling besar
pengaruhnya terhadap penentuan berat badan bayi adalah berat badan ibu..
REGRESI LOGISTIK
13
Berbeda dengan regresi linier yang variabel dependennya numerik,
regreesi logistik merupakan jenis regresi yang mempunyai ciri khusus, yaitu
variabel dependennya berbentuk variabel katagorik (terutama yang dikotomus,
artinya katagorik yang terdiri dari dua kelompok, misalnya hidup/mati, puas/tidak
puas dll).
A. REGRESI LOGISTIK SEDERHANA
1. Pendahuluan
Analisis regresi logistik adalah salah satu pendekatan model matematis
yang digunakan untuk menganalisis hubungan satu atau beberapa variabel
independen dengan sebuah variabel dependen katagorik yang bersifat
dikotom/binary. Variabel katagorik yang dikotom adalah variabel yang
mempunyai dua nilai variasi, misalnya sakit-tidak Sakit, bayi BBLR dan Normal,
merokok dan tidak merokok, dan lain-lain
Perbedaan antara regresi linear dengan regresi logistik terletak pada jenis
variabel dependennya. Regresi linear digunakan apabila variabel dependennya
numerik , sedangkan regresi logistik diogunakan pada data yang dependennya
berbentuk katagorik yang dikotom.
Untuk memahami lebih jelas tentang regresi logistik coba kita lihat contoh
analisis penelitian yang mempelajari hubungan antara variabel umur dengan
kejadian penyakit jantung koroner. Pengamatan dilakukan pada 100 orang
sampel, didapatkan hasil :
No 1 2 3 4 5 6 7 8 9 10 11 … … 100
Umur 20 22 23 24 25 27 28 29 30 32 33 … … 70
PJK 0 0 1 0 0 1 0 1 1 0 0 … … 1
Nomor merupakan nomor urut responden dan PJK merupakan variabel kejadian
jantung koroner. Variabel PJK diberi kode 1 bila responden menderita PJK dan
diberi kode 0 bila mereka tiodak menderita PJK.
Bila data tersebut kita perlakukan analisisnya menggunakan regresi linier,
misalnya dibuat penyajian dalam bentuk diagram tebar ( Scatter Plot), maka
hubungannya tidak jelas terlihattebaran data pada Scatter Plot membentuk dua
garis yang sejajar. Diagram tebat menunjukkan adanya kecenderungan kejadian
penyakit jantung koroner yang lebih sedikit pada responden yang berusia muda.
Walaupun grafik tersebut telah dapat menggambarkan/menjelaskan variabel
dependen (kejadiab PJK) yang cukup jelas, namun grafik tersebut tidak mampu
menggambarkan dengan lebih tajam/jelas hubungan antara umur dangan
kejadian PJK.
Untuk mempertajam analisis kita, sekarang dicoba untuk

mengelompokkan variabel independen (variabel umur) dan menhitung nilai
tengah (dalam hal ini menghitung proporsi) variabel dependen (variabel PJK)
untuk setiap kelompok variabel umur dan kejadian jantung dapat dilihat pada
tabel berikut:
PJK Proporsi
Umur Jumlah
Tidak Ya Kejadian
20 – 29 10 9 1 0,10
30 – 34 15 13 2 0,13
35 – 39 12 9 3 0,25
40 – 44 15 10 5 0,33
45 – 49 13 7 6 0,46
50 – 54 8 3 5 0,63
55 – 59 17 4 13 0,76
60 – 69 10 2 8 0,80
Total 100 57 43 0,43
Pada tabel terlihat bahwa ada peningkatan proporsi kejadian jantung pada
kelompok umur semakin tua/lanjut. Kemudian kita coba sajikan data tersebut
dengan grafik dan hasilnya dapat dilihat pada grafik berikut:
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
20 - 29 30 – 34 35 – 39 40 – 44 45 – 49 50 – 54 55 – 59 60 – 69
Pada grafik tyer;lihat jelas adanya peningkatan yang tidak linear antara
proporsi kejadian PJK dengan peningkatan umur. Diawali peningkatan yang
landai, kemudian meningkat tajam dan kemudian landai kembali, garis tersebut
menyerupai huruf S.
Kalau kita cermati, pembuatan diagram tebar tersebut merupakan cara
untuk mendeteksi/mengetahui hubungan pada analisis regresi linier, namun ada
sedikit perbedaan hal dalam hal meringkas variabel dependennya. Seperti kita
ketahui bahwa pada regresi linier kita ingin mengestimasi nilai mean variabel
dependen berdasarkan setiap nilai variabel independen. Nilai tersebut disebut
sebagai mean kondisional yang dinyatakan dengan E(Y/x), dengan Y sebagai
dependen dan x sebagi independen. E(Y/x) adalah nilai Y yang diharapkan
berdasarkan nilai x. misal Y variabel tekanan darah dan x variabel umur, maka
untuk mengetahui estimasi tekanan darah berdasarkan umu, dihitung rata-rata
(mean) tekanan darah pada masing-masing nilai umur. Pada regresi linier nilai
E(Y/x) akan berkisar antara 0 s.d  (0 ≤ E(Y/x) ≤ ).
Pada regresi logistik dapat juga diperlakukan hal tersebut namun ada
sedikit perbedaan dalam menghitung rata-rata variabel dependennya (Y). oleh
karena pada regresi logistik dependennya adalah dikotom maka variabel
dependen dihitung bukan dengan mean namun menggunakan proporsi. Seperti
pada data di atas variabel Y kejadia PJK dan x variabel umur, maka untuk
mengetahui estimasi kejadian PJK berdasarkan umur, dihitung proporsi kejadian
PJK pada tiap kelompok umur. Pada regresi logistik, nilai E(Y/x) akan selalu
berada antara nol dan satu (0 ≤ E(Y/x) ≤ 1).
2. Model Logistik
f(z) = 1.
1 + e-z
f(Z) merupakan propbabilitas kejadian suatu penyakit berdasarkan faktor risiko

tertentu. Misalnya probabilitas kejadian jantung pada umur tertentu.
Nilai Z merupakan nilai indeks variabel independen. Nilai Z bervariasi antara -
sampai +.
Bila nilai Z mendekati –  maka f(– ) = 1 . =0
1 + e-(– )
Bila nilai Z mendekati +  maka f(+ ) = 1 . =1
1 + e-(+ )
Fungsi Logistik dapat digambarkan sbb:
- 0 +
Terlihat bahwa fungsi f(Z) nilai berkisar 0 dan 1 berapapun nilai Z. kisaran pada
regresi logistik ini berari cocok/sesuai digunakan untuk model hubungan yang
variabel dependennya dikotom. Grafik f(Z) membentuk garis yang berbentuk
huruf S, ini berarti sesuai dengan contoh plot hubungan antara PJK dengan umur
pada kasus yang telah kita bahas di atas. Bentuk S ini mencerminkan tentang
pengaruh nilai Z pada risiko individu yang minimal pada nilai Z rendah kemudian
seiring dengan meningkatnya nilai Z risiko juga semakin meningkat, dan pada
ketinggian tertentu garisnya akan mendatar mendekati nilai 1.
Berdasarkan uaraian tersebut maka bila ingin mengestimasi suatu
probabilitas kejadian pada dependen yang dikotom maka model regresi logistik
adalah pilihan yang tepat.
3. Model Logistik
Model logistik dikembangkan dari funsi logistik dengan nilai Z merupakan
penjumlahan linear konstanta () ditambah dengan 1X1, ditambah 2X2 dan
seterusnya sampai iXi. Variabel X adalah variabel Independen.
Z =  + 1X1 (Regresi logistik sederhana)
Z =  + 1X1 + 2X2 + … + iXi (Regresi logistik berganda)
Bila nilai Z dimasukkan pada fungsi Z, maka rumus fungsi Z adalah
f(z) = 1 .
-( + 1X1 + 2X2 + … + iXi)
1+e
4. Contoh Kasus
Contoh studi follow up selama 9 tahun. Dalam studi ini dipelajari
mengenai hubungan antara kejadian penyakit jantung koroner (dengan nama
vaiabel PJK) dengan tinggi rendahnya kadar katekolamin dalam darah (nama
variabel KAT).
Pemberian kode nilai variabel adalah sbb:
Untuk variabel PJK € 1 = timbul penyakit jantung koroner
0 = tidak ada penyakit jantung
koroner Untuk variabel KAT € 1 = kadar katekolamin darah
tinggi
0 = kadar katekolamin darah rendah
Pertanyaan:
a. Berapa peluang mereka yang kadar katekolaminnya tinggi mempunyai risiko
untuk terjadi PJK?
b. Berapa peluang mereka yang kadar katekolaminnya rendah mempunyai risiko
untuk terjadi PJK?
c. Bandingkan risiko terjadi PJK antara mereka yang kadar katekolaminnya
tinggi dengan yang kadar katekolaminnya rendah?
Jawab:
Dengan model regresi logistik maka pada soal tersebut modelnya adalah:
f(z) = 1 .
1 + e-z
Nilai f(z) dapat diganti dengan P(X), maka rumusnya:
P(X) = 1 .
1 + e-z
Bila Z =  + 1KAT, maka modelnya :
P(X) = 1 .
1 + e- + 1KAT
Misdalkan didapatkan hasil analisis dengan paket program statistik sbb:
 = -3,911 dan 1 = 0,652, maka:
P(X) = 1 .
-(-3,911 + 0,652KAT)
1+e
Dari model tersebut coba kita jawab pertanyaan di atas:
a. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya tinggi.
Oleh karena kadar katekolamin tinggi diberi angka 1, maka masukkan nilai
KAT=1 pada model di atas, hasilnya:
P(X) = 1 . = 0,037 atau sekitar 4%
1 + e-(-3,911 + 0,652*1)
jadi mereka/individu yang kadar katekolaminnya tinggi dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 4% selama periode follow up.
b. Besar risiko terjadinya PJK pada mereka yang kadar katekolaminnya rendah
Oleh karena kadar katekolamin rendah diberi angka 0, maka masukkan nilai
KAT=0 pada model di atas, hasilnya:
P(X) = 1 . = 0,019 atau sekitar 2%
1 + e-(-3,911 + 0,652*0)
jadi mereka/individu yang kadar katekolaminnya rendah dalam darah
mempunyai risiko untuk terjadinya PJK sebesar 2% selama periode follow up.
c. Besar risiko kedua kelompok tersebut
P1(X) = 0,037 = 1,947 = 2,0
P0(X) 0,019
Angka tersebut di atas sebenarnya adalah risiko relatif (RR)yang diperoleh
secara direk. Arti dari angka di atas adalah mereka yang kaadar
katekolaminnya tinggi mempunyai risiko terjadi PJK dua (2) kali lebih tinggi
dibandingkan mereka yang kadar katekolaminnya rendah.
Model regresi logistik dapat digunakan pada data yang dikumpulkan
melalui rancangan kohort, case control maupun cross sectional.
Pada rancangan kohort prospektif dapat digunakan untuk memperkirakan risiko
individual. Sedangkan pada rancangan case control dan cross sectional tidak
dapat digunakan untuk menghitung risiko individual karena 0 pada rancangan ini
tidak sahih. Nilai 0 dapat dihitung/diestimasi bila sampling fraction populasi
yang disampel diketahui-kondisis ini hanya terjadi pada rancangan kohort (ket:
sampling fraction adalah proporsi terpapar yang menjadi sakit atau tidak sakit).
Namun dengan memperlakukan rancangan case control dan cross sectional
sebagai studi follow up, maka dapat dihitung OR (Odds Ratio), yang merupakan
perhitungan RR yang indirek. Nilai OR yang merupakan yang merupakan
perhitungan eksponensial  dari persamaan garis regresi logistik.
Odds Ratio (OR) = exp() atau dapat ditulis OR = e()
Dengan demikian dapat disimpulkan bahwa Individual Risk (ririko

individu) hanya dapat diperoleh dari rancangan kohor prospektif. Sedangkan
pada rancangan case control, cross sectional tidak dapat melakukan prediskis
risiko individual. Pada rancangan case control dan cross sectional dan cohort
dapat dihitung nilai Odds Ratio (OR), yang merupakan perhitungan RR indirek.
Pada rancangan kohort prospektif regresi logistik dapat digunakan untuk
memprediksi/menaksir probabilitas individu untuk sakit (atau meninggal)
berdasarkan nilai-nilai sejumlah variabel yang diukur padanya. Prediksi dapat
digunakan dengan model:
P(X) = 1.
1 + e-( + 1X1 + 2X2 + … + iXi
B. REGRESI LOGISTIK GANDA
Pada pembahasan di atas sudah diperkenalkan mengenai regresi logistik
sederhana. Seperti juga pada regresi linier, keuntunngan regresi logistik ganda
adalah kemampuannya untuk memasukkan beberapa variabel dalam satu model.
Pada regresi logistik, variabel independennya boleh campuran antara variabel
katagorik dan numerik. Namun sebaiknya variabel independennya berupa
katagorik karena dalam menginterpretasi hasil analisis akan lebih mudah.
Kegunaan analisis regresi logistik ganda mencakup dua hal, yaitu:

a. Model Prediksi
Pemodelan dengan tujuan untuk memperoleh model yang tediri dari
beberapa variabel independen yang dianggap terbaik untuk memprediksi
kejadian variabel dependen. Pada pemodelan ini semua variabel dianggap
penting sehingga estimasi dapat dilakukan estimasi beberapa koefisien
regresi logistik sekaligus.
Bentuk kerangka konsep model regresi :
X1 X2 X3 X4
Y
Prosedur pemodelan:
Agar diperoleh model regresi yang hemat dan mampu menjelaskan
hubungan variabel independen dan independen dalam populasi, diperlukan
prosedur pemilihan variabel sbb:
1). Melakukan analisis bivariat antara masing-masing variabel independen
dengan variabel dependennya. Bila hasil uji bivariat mempunyai nilai p <
0,25, maka variabel tersebut dapat masuk model multivariat. Namun bisa
saja p value > 0,25 tetap diikutkan ke multivariat bila variabel tsb secara
substansi penting.
2). Memilih variabel yang dianggap penting yang masuk dalam model,
dengan cara mempertahankan variabel yang mempunyai p value < 0,05
dan mengeluarkan variabel yang p valuenya > 0,05. Pengeluaran variabel
tidak serentak semua yang p valuenya > 0,05, namun dilakukan secara
bertahap dimulai dari variabel yang mempunyai p value terbesar.
3). Identifikasi linearitas variabel numerik dengan tujuan untuk menentukan
apakah variabel numerik dijadikan variabel katagorik atau tetap variabel
numerik. Caranya dengan mengelompokkan variabel numerik ke dalam 4
kelompok berdasarkan nilai kuartilnya. Kemudian lakukan analisis logistik
dan dihitung nilai OR-nya. Bila nilai OR masing-masing kelompok
menunjukkan bentuk garis lurus, maka variabel numerik dapat
dipertahankan. Namun bila hasilnya menunjukkan adanya patahan, maka
dapat dipertimbangkan dirubah dalam bentuk katagorik.
4). Setelah memperoleh model yang memuat variabel-variabel penting, maka
langkah terakhir adalah memeriksa kemungkinan interaksi variabel ke
dalam model. Penentuan variabel interaksi sebiknya melalui pertimbangan
logika substantif. Pengukian interaksi dilihat dari kemaknaan uji statistik.
Bila variabel mempunyai nilai bermakna, maka variabel interaksi penting
dimasukkan dalam model.
b. Model Faktor Risiko

Pemodelan dengan tujuan mengestimasi secara valid hubungan satu variabel
utama dengan variabel dependen dengan mengontrol beberapa variabel
konfonding.
Bentuk kerangka konsep model faktor risiko:
X1 Y
X2 X3 X4
Tahapan pemodelan:
1). Lakukan pemodelan lengkap, mencakup variabel utama , semua kandidat
konfonding dan kandidat interaksi (interaksi diabuat antara variabel utama
dengan semua variabel konfonding).
2). Lakukan penilaian interaksi, dengan cara mengeluarkan variabel interaksi
yang nilai p Wald-nya tidak signifikan dikeluarkan dari model secara
berurutan satu per satu dari nilai p Wald yang terbesar.
3). Lakukan penilaian konfonding, dengan cara mengeluarkan variabel
kovariat/ konfonding satu per satu dimuali dari yang memiliki nilai p Wald
terbesar, bila setelah dikeluarkan diperoleh selisih OR faktor/variabel
utama antara sebelum dan sesudahvariabel kovariat (X 1) dikeluarkan lebih
besar dari 10%, maka variabel tersebut dinyatakan sebagai konfonding
dan harus tetap berada dalam model.
KASUS I :
REGRESI LOGISTIK MODEL PREDIKSI
Untuk latihan, gunakan file data “LBW.SAV”
Suatu penelitian ingin mengetahui hubungan antara UMUR IBU (age) , RAS
(race), MENDERITA HIPERTENSI (ht), ADA KELAINAN UTERUS (ui) dan PERIKSA
HAMIL (ftv) dengan BBLR (low).
Adapun langkahnya:
A. SELEKSI BIVARIAT
Masing-masing variabel independen dilakukan analisis bivariat dengan variabel
dependen. Bila hasil bivariat menghasilkan p value < 0,25, maka variabel
tersebut langsung masuk tahap multivariat. Untuk variabel independen yang
hasil bivariatnya menghasilkan p value > 0,25 namun secara substansi penting,
maka variabel tersebut dapat dimasukkan dalam model multivariat. Seleksi
bivariat menggunakan uji regresi logistik sederhana.
1. Analisis bivariat antara “umur” dengan”bblr”

1. Pilih “Analyze”
2. Pilih “Regression”
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent
dan kotak Covariates.
4. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai
dependen (dalam hal ini berarti masukkan “low”) dan pada kotak
independen isikan variabel independennya (dalam hal ini berarti masukkan
“age”).
Sehingga tampilannya sbb:
5. Klik tombol ‘Options’ , klik ‘CI for Exp(B)’
7. Klik “OK”, dan hasilnya sbb:
Block 1: Method = Enter
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 2.760 1 .097
Block 2.760 1 .097
Model 2.760 1 .097
Variables in the Equation
95.0% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Satep age -.051 .032 2.635 1 .105 .950 .893 1.011
1 Const
.385 .732 .276 1 .599 1.469
ant
a. Variable(s) entered on step 1: age.
Dari hasil output, pada tampilan Block 1 didapatkan hasil omnibus test pada
bagian Bloc dengan p value 0,097 berarti variabel umur p value nya <0,25
sehingga variabel umur dapat dilanjutkan ke analisis multivariat. Dari tampilan
SPSS nilai OR dapat diketahui dari kolom Exp(B) yaitu sebesar 0,950 (95% CI:
0,89-1,01)
2. Analisis bivariat antara “ras” dengan “bblr”

4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates
variabel ‘age’ dikeluarkan dan gantilah dengan mengisikan variabel ‘race’.
Tampilannya sbb:
5. Pada variabel ras perlu dilakukan dummy oleh karena variabel ras berjenis
katagorik dengan isi lebih dari 2 nilai, tepatnya 3 kelompok(yaitu :ras
putih, hitam dan lainnya). Klik tombol Categorical, pindahkan ‘race’ dari
kotak covariates ke kotak categorical covariates, klik pilihan ‘first’ pada
bagian Reference category, lalu klik Change, dan tampilannya:
6. Klik Continue, layar ke menu logistic

7. Klik OK
Categorical Variables Codings
Parameter coding
Frequency (1) (2)
Race White 96 .000 .000
Black 26 1.000 .000
Other 67 .000 1.000
Chi-square df Sig.
Step 1 Step 5.010 2 .082
Block 5.010 2 .082
Model 5.010 2 .082
95.0% C.I.for
EXP(B)
Stea race 4.922 2 .085
p1 race(1) .845 .463 3.323 1 .068 2.328 .939 5.772
race(2) .636 .348 3.345 1 .067 1.889 .955 3.736
Constant -1.155 .239 23.330 1 .000 .315
a. Variable(s) entered on step 1: race.
Hasil uji didapatkan p value 0,087 berarti p value < 0,25, sehingga variabel ras
dapt lanjut ke multivariat. Dari output dapat diketahui juga nilai OR dummy,
terlihat ada dua nilai OR yaitu OR untuk race(1) 2,328 artinya ras kuliat hitam
akan berisiko bayinya bblr sebesar 2,3 kali lebih tinggi dibandingkan ras kulit
putih. OR untuk race(2) besarnya 1,89 artinya ras kelompok lainnya mempunyai
risiko bayinya bblr sebesar 1,89 kali lebi tinggi dibandingkan ras kulit putih.
3. Analisis bivariat antara “hipertensi” dengan “bblr”

4. Pada kotak Dependent tetap berisi “low” dan pada kotak Covariates isikan
“ht”. Klik OK, Tampilannya sbb:
Chi-square df Sig.
Step 1 Step 4.022 1 .045
Block 4.022 1 .045
Model 4.022 1 .045
95.0% C.I.for
EXP(B)
Satep ht 1.214 .608 3.979 1 .046 3.365 1.021 11.088
1 Constant -.877 .165 28.249 1 .000 .416
a. Variable(s) entered on step 1: ht.
Hasil uji didapatkan p value = 0,045 (p value < 0,25) berarti masuk dalam
multivariat
4. Analisis bivariat antara “kelainan uterus” dengan “bblr”
9. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak
Dependent dan kotak Covariates.
10. Pada kotak Dependent tetap berisi “low” dan pada kotak
Covariates isikan “ui”. Klik OK, Tampilannya sbb:
Chi-square df Sig.
Step 1 Step 5.076 1 .024
Block 5.076 1 .024
Model 5.076 1 .024
95.0% C.I.for
EXP(B)
Satep ui .947 .417 5.162 1 .023 2.578 1.139 5.834
1 Constant -.947 .176 29.072 1 .000 .388
a. Variable(s) entered on step 1: ui.
Hasil p value 0,024 (p value < 0,25), maka variabel kelainan uterus dapat
lanjut ke multivariat
5. Analisis bivariat antara “periksa hamil” dengan “bblr”
1.Pilih “Analyze”
2.Pilih “Regression”
3. Klik
“Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
“ftv”. Klik OK, Tampilannya sbb:
Chi-square df Sig.
Step 1 Step .773 1 .379
Block .773 1 .379
Model .773 1 .379
95.0% C.I.for EXP(B)

Satep ftv -.135 .157 .744 1 .389 .874 .643 1.188
1 Constant -.687 .195 12.427 1 .000 .503
a. Variable(s) entered on step 1: ftv.
Hasil uji p value = 0,379 (p value > 0,25) sehingga secara statistik tidak
dapat lanjut ke multivariat, namun karena secara substansi variabel periksa
hamil sangat penting, maka variabel ini dapat dianalisis multivariat.
6. Analisis bivariat antara “merokok” dengan “bblr”
Chi-square df Sig.
Step 1 Step 4.867 1 .027
Block 4.867 1 .027
Model 4.867 1 .027
95.0% C.I.for
EXP(B)
Satep smoke .704 .320 4.852 1 .028 2.022 1.081 3.783
1 Constant -1.087 .215 25.627 1 .000 .337
a. Variable(s) entered on step 1: smoke.
Hasil analisis bivariat didapatkan p value = 0,027 ( < 0,25) dengan demikian
variabel merokok dapat masuk ke multivariat.
7. Analisis bivariat antara “prematur” dengan “bblr”
Chi-square df Sig.
Step 1 Step 6.779 1 .009
Block 6.779 1 .009
Model 6.779 1 .009
95.0% C.I.for
EXP(B)
Satep ptl .802 .317 6.391 1 .011 2.230 1.197 4.151
1 Constant -.964 .175 30.370 1 .000 .381
a. Variable(s) entered on step 1: ptl.
Hasil analisis didapatkan p value sebesar 0,009 berarti < 0,25 sehingga variabel
riwayat adanya prematur dapat masuk ke multivariat
Hasil seleksi bivariat :

Variabel P value
Umur 0,097
Ras 0,082
Hipertensi 0,045
Kelainan uterus 0,024
Periksa hamil 0,379
Merokok 0,027
Prematur 0,009
Hasil seleksi bivariat semua variabel menghasilkan p value < 0,25, hanya periksa
hamil yang p valuenya > 0,25. namun variabel periksa hamil tetap dianalisis
multivariat oleh karena secara substansi periksa hamil merupakan variabel yang
sangat penting berhubungan dengan kejadian bblr.
B. PEMODELAN MULTIVARIAT
Selanjutnya dilakukan analisis multivariat keenam variabel tersebut
dengan kejadian bblr.
1.. Lakukan pemilihan variabel yang berhubungan signifikan dengan variabel
dependen.
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
kotak Covariates.
variabel age, race, smoke, ptl, ht, ui, ftv. Ingat untuk Race dilakukan dummy.
5. Klik Option, pilih ‘CI for exp(B)’
7. Kilik ‘OK’
Logistic Regression
95.0% C.I.for
EXP(B)
Satep age -.041 .036 1.249 1 .264 .960 .894 1.031
1 race 6.783 2 .034
race(1) 1.009 .502 4.034 1 .045 2.743 1.025 7.345
race(2) 1.003 .426 5.560 1 .018 2.727 1.185 6.280
smoke .964 .391 6.090 1 .014 2.622 1.219 5.639
ptl .630 .340 3.429 1 .064 1.877 .964 3.654
ht 1.361 .631 4.648 1 .031 3.902 1.132 13.451
ui .802 .458 3.066 1 .080 2.229 .909 5.468
ftv .009 .161 .003 1 .954 1.009 .736 1.384
Constant -1.183 .919 1.659 1 .198 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui, ftv.
Dari hasil analisis terlihat ada 4 variabel yang p valuenya > 0,05 yaitu age, ptl, ui
dan ftv, yang terbesar adalah ftv, sehingga pemodelan selanjutnya variabel ftv
dikeluarkan dari model.
Dengan langkah yang sama akhirnya diperoleh hasil sbb.

Logistic Regression
95.0% C.I.for
EXP(B)
Satep age -.040 .036 1.275 1 .259 .960 .896 1.030
1 race 6.781 2 .034
race(1) 1.009 .503 4.035 1 .045 2.744 1.025 7.347
race(2) 1.002 .425 5.562 1 .018 2.723 1.184 6.262
smoke .963 .390 6.086 1 .014 2.620 1.219 5.632
ptl .629 .340 3.423 1 .064 1.875 .963 3.651
ht 1.358 .629 4.663 1 .031 3.889 1.134 13.341
ui .800 .457 3.063 1 .080 2.226 .908 5.454
Constant -1.184 .919 1.661 1 .197 .306
a. Variable(s) entered on step 1: age, race, smoke, ptl, ht, ui.
Setelah ftv dikeluarkan kita lihat perubahan nilai OR untuk variabel age, race,
smoke, ptl, ht, dan ui.
Variabel OR ftv ada OR ftv tak ada perubahan OR
Age 0.960 0.960 0%
Race(1) 2.743 2.744 0%
Race(2) 2.727 2.723 0%
Smoke 2.622 2.620 0%
Ptl 1.877 1.875 0,1 %
Ht 3.902 3.889 0.3 %
ui 2.229 2.226 0,1 %
ftv 1.009
Dengan hasil perbandingan OR terlihat tidak ada yang > 10 % dengan demikian
dikeluarkan dalam model. Selanjutnya variabel yang terbesar p valuenya adalah
umur, dengan demikian dikelurkan dar model dan hasilnya
Hasilnyanya :
95.0% C.I.for
EXP(B)
Satep race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
a. Variable(s) entered on step 1: race, smoke, ptl, ht, ui.
Setelah variabel umur dikeluarkan, kita cek lagi perubahan OR untuk variabel
yang masih aktif di model.
Variabel OR age ada OR age tak ada perubahan OR
Age 0.960 -
Race(1) 2.743 2.968 8,2 %
Race(2) 2.727 2.883 5,7 %
Smoke 2.622 2.694 2,7 %
Ptl 1.877 1.779 5,2 %
Ht 3.902 3.912 0.3 %
ui 2.229 2.350 5,4 %
ftv 1.009
Dari analisis perbandingan OR, ternyata perubahannya < 10 %, dengan

demikian variabel umur dikeluarkan dari model
Langkah selanjutnya mengeluarkan variabel yang p valuenya > 0,05, variabel ptl
dikeluarkan model, hasilnya
95.0% C.I.for
EXP(B)
Satep race 8.245 2 .016
1 race(1) 1.064 .499 4.545 1 .033 2.897 1.090 7.704
race(2) 1.083 .413 6.877 1 .009 2.955 1.315 6.640
smoke 1.094 .380 8.299 1 .004 2.986 1.419 6.286
ht 1.359 .630 4.660 1 .031 3.894 1.133 13.379
ui 1.006 .438 5.262 1 .022 2.734 1.158 6.458
Constant -2.092 .380 30.307 1 .000 .123
a. Variable(s) entered on step 1: race, smoke, ht, ui.
Setelah ptl dikeluarkan, kita lihat perubahan OR nya:

Variabel OR ptl ada OR ptl tak ada perubahan OR
Age 0.960 -
Race(1) 2.743 2.897 5,6 %
Race(2) 2.727 2.955 8,3 %
Smoke 2.622 2.986 13,8 %
Ptl 1.877 - -
Ht 3.902 3.894 0.2 %
ui 2.229 2.734 22,6 %
ftv 1.009 -
Ternyata setelah ptl dikeluarkan, OR variabel merokok dan kelainan uterus

berubah > 10 %, dengan demikian variabel ptl dimasukkan kembali dalam
model.
Kemudian variabel ui dikeluarkan dalam model karena p valuenya > 0,05, dan
hasilnya sbb:
95.0% C.I.for
EXP(B)
Satep race 8.286 2 .016
1 race(1) 1.062 .500 4.513 1 .034 2.894 1.086 7.712
race(2) 1.085 .411 6.949 1 .008 2.958 1.321 6.626
smoke .996 .382 6.794 1 .009 2.707 1.280 5.726
ht 1.221 .629 3.764 1 .052 3.390 .988 11.640
ptl .696 .325 4.596 1 .032 2.007 1.062 3.793
Constant -2.025 .372 29.586 1 .000 .132
a. Variable(s) entered on step 1: race, smoke, ht, ptl.
Kita lihat kembali perubahan nilai OR setelah variabel ui dikeluarkan :

Variabel OR ui ada OR ui tak ada perubahan OR
Age 0.960 -
Race(1) 2.743 2.894 5,5 %
Race(2) 2.727 2.958 8,4 %
Smoke 2.622 2.707 3,2 %
Ptl 1.877 2.007 6,9 %
Ht 3.902 3.390 13.1 %
ui 2.229 - -
ftv 1.009 - -
Setelah dilakukan perbandingan OR, ternyata variabel ht berubah > 10 %,

dengan demikian variabel ui masuk kembali dalam model. Akhirnya model yang
dihasilkan adalah sbb:
95.0% C.I.for
EXP(B)
Satep race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
C. UJI INTERAKSI
Uji interaksi dilakukan pada variabel yang diduga secara substansi ada interaksi,
kalau memang tidak ada tidak perlu dilakukan uji interaksi. Dalam kasus
sekarang, misalkan kita duga merokok berinteraksi dengan hipertensi.
Langkahnya:
1. klik analysis, klik regression, klik binary ogistik
2. Kotak dependen isikan low
3. Kotak Kovariat isikan Race, smoke, ptl, ht dan ui
4. Klik tombol Next
5. isikan : smoke*ht ke kotak kovariat
6. klik OK
lihat hasilnya pada bagian Block 2
Block 2: Method = Enter

Chi-
square df Sig.
Step 1 Step .000 1 .994
Block .000 1 .994
Model 26.560 7 .000
95.0% C.I.for
EXP(B)
Satep race 7.900 2 .019
1 race(1) 1.088 .502 4.692 1 .030 2.969 1.109 7.946
race(2) 1.059 .419 6.387 1 .011 2.883 1.268 6.555
smoke .990 .397 6.211 1 .013 2.692 1.236 5.865
ptl .576 .336 2.937 1 .087 1.779 .921 3.438
ht 1.360 .831 2.680 1 .102 3.896 .765 19.852
ui .854 .451 3.584 1 .058 2.350 .970 5.693
ht by smoke .010 1.283 .000 1 .994 1.010 .082 12.491
Constant -2.146 .386 30.875 1 .000 .117
a. Variable(s) entered on step 1: ht * smoke .
Pada output bagian Block 2:Methode=Enter, terlihat hasil uji omnibusnya

memperlihatkan p value = 0,994 (lihat bagian step) berarti lebih besar dari 0,05,
berarti : tidak ada interaksi antara merokok dengan hipertensi.
Dengan demikian pemodelan telah selesai, model yang valid adalah model tanpa
ada interaksi:
MODEL TERAKHIR
95.0% C.I.for
EXP(B)
Satep race 7.968 2 .019
1 race(1) 1.088 .501 4.723 1 .030 2.968 1.113 7.916
race(2) 1.059 .418 6.422 1 .011 2.883 1.271 6.538
smoke .991 .387 6.569 1 .010 2.694 1.263 5.747
ptl .576 .334 2.975 1 .085 1.779 .925 3.422
ht 1.364 .633 4.640 1 .031 3.912 1.131 13.537
ui .855 .451 3.585 1 .058 2.350 .970 5.692
Constant -2.146 .386 30.917 1 .000 .117
Interpretasi:
Model regresi logistik hanya dapat digunakan untuk penelitian yang bersifat
Kohort. Sedangkan unutk penelitian yang bersifat cross sectional atau case
control, interpretasi yang dapat dilakukan hanya menjelaskan nilai OR (Exp B)
pada masing-masing variabel. Oleh karena analisisnya multivariat/ganda maka
nilai OR-nya sudah terkontrol (adjusted) oleh variabel lain yang ada pada model.
Dari analisis multivariat ternyata variabel yang berhubungan bermakna dengan
kejadian BBLR adalah variabel ras, merokok dan hipertensi. Sedangkan variabel
riwayat prematur dan kelainan uterus sebagai variabel konfounding. Hasil analisis
didapatkan Odds Ratio (OR) dari variabel hipertensi adalah 3,9, artinya Ibu yang
menderita hipertensi akan melahirkan bayi BBLR sebesar 4 kali lebih tinggi
dibandingkan ibu yang tidak menderita hipertensi setelah dikontrol variabel race,
merokok, prematur dan uterus. Secara sama dapat diinterpretasikan untuk
variabel yang lain.
Untuk melihat variabel mana yang paling besar pengaruhnya terhadap

variabel dependen, dilihat dari exp (B) untuk variabel yang signifikan, semakin
besar nilai exp (B) berarti semakin besar pengaruhnya terhadap variabel
dependen yang dianalisis. Dalam data ini berarti hipertensi yang paling besar
pengaruhnya terhadap kejadian bayi BBLR.
KASUS KEDUA :
REGRESI LOGISTIK MODEL FAKTOR RISIKO
Tujuan analisis :
Untuk mengetahui hubungan pekerjaan dengan menyusui eksklusive
Variabel independen utama : Pkerjaan
Variabel dependen : Eksklusive
Variabel konfounding : umur, berat badan ibu dan sikap
A. Langkah pertama: menyusun model mencakup semua variabel dan variabel
interaksi
Cara
3. Klik “Binary Logistic”, muncul menu dialog yang berisi kotak Dependent dan
Covariat. Pada kotak Dependen isikan variabel yang kita perlakukan sebagai
dependen (dalam contoh ini berarti eksklu) dan pada kotak Covariat isikan
variabel independen utama beserta variabel konfounding dan interaksinya
(dalam hal ini berarti: kerja, umur1, bbibu, sikap, kerja*umur1,kerja*bbibu,
kerja*sikap)
4. Klik ‘OK’, dan hasilnya sbb:
Logistic Regression
95.0% C.I.for
EXP(B)
Stea kerja -20.275 28420.722 .000 1 .999 .000 .000 .
p1 umur1 1.681 1.197 1.972 1 .160 5.372 .514 56.109
sikap -.052 .114 .208 1 .648 .949 .760 1.186
kerja by umur1 20.279 28420.722 .000 1 .999 6E+008 .000 .
kerja by sikap .148 .159 .869 1 .351 1.160 .849 1.583
Constant -1.505 1.432 1.105 1 .293 .222
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * umur1 , kerja * sikap .
Dari output model penuh/lengkap ini kita lakukan uji interaksi, variabel dikatakan
berinteraksi bila p valuenya < 0,05. Seleksinya dengan mengeluarkan secara
bertahapVariabel interaksi yang tidak signifikan (p>0,05), pengeluaran dilakukan
secara bertahap dari variabel interaksi yang p value-nya terbesar. Dari hasil di
atas variabel interaksi ”Pekerjaan by umur” mempunyai nilai p terbesar
(p=0,999) sehingga variabel tersebut dikeluarkan dari model. Dan model
menjadi:
Logistic Regression
95.0% C.I.for
EXP(B)
Stea kerja -.445 1.718 .067 1 .795 .641 .022 18.557
p1 umur1 2.217 1.146 3.741 1 .053 9.177 .971 86.749
sikap -.060 .114 .274 1 .601 .942 .753 1.178
kerja by
.175 .156 1.264 1 .261 1.191 .878 1.616
sikap
Constant -1.881 1.483 1.610 1 .205 .152
a. Variable(s) entered on step 1: kerja, umur1, sikap, kerja * sikap .
Dari output diatas, variabel interaksi ‘kerja by sikap’ harus dikeluarkan dari model
karana p valuenya > 0,05. Setelah dikeluarkan hasilnya:
95.0% C.I.for
EXP(B)
Satep kerja 1.376 .666 4.273 1 .039 3.959 1.074 14.592
1 umur1 2.260 1.157 3.812 1 .051 9.582 .991 92.609
sikap .035 .076 .212 1 .645 1.036 .893 1.202
Consta
-2.876 1.239 5.384 1 .020 .056
nt
a. Variable(s) entered on step 1: kerja, umur1, sikap.
Dengan demikian hasil uji interaksi sudah selesai, kesimpulannya tidak ada variabel
interasksi, langkah selanjutnya uji konfounding
UJI KONFOUNDING
Uji konfounding dengan cara melihat perbedaan nilai OR untuk variabel utama dengan
dikeluarkannya variabel kandidat konfounding, bila perubahannya > 10 %, maka
varaibel tsb dianggap sebagai variabel konfounding.
Tahap pertama : akan dikeluarkan variabel Sikap, setelah dikeluarkan dari model
hasiilnya sbb:’

Stea kerja 1.413 .660 4.585 1 .032 4.110 1.127 14.985
p1 umur1 2.378 1.135 4.389 1 .036 10.783 1.165 99.754
Constant -2.624 1.113 5.555 1 .018 .073
a. Variable(s) entered on step 1: kerja, umur1.
Setelah variabel sikap dikeluarkan terlihat perubahan OR variabel utama kerja

sebesar : (4,111 – 3,959)/4,111 =3,6 % . Dengan demikian variabel sikap bukan
konfounding, dan harus dikeluarkan dari model
Langkah selanjutnya mengeluarkan variabel umur, setelah dikeluarkan hasilnya:


Satep kerja 1.698 .618 7.545 1 .006 5.464 1.627 18.357
1 Const
-.754 .429 3.091 1 .079 .471
ant
a. Variable(s) entered on step 1: kerja.
Setelah variabel umur dikeluarkan terlihat perubahan OR variabel utama: kerja

sebesar : (5,464-4,111)/4,111 =32,9 % . Dengan demikian variabel umur
merupakan variabel konfounding. Untuk itu variabel umur harus tetap ikut dalam
model sebagai konfounding hubungan kerja dengan menyusui eksklusive.
Model terakhir :
Stea kerja 1.413 .660 4.585 1 .032 4.110 1.127 14.985
p1 umur1 2.378 1.135 4.389 1 .036 10.783 1.165 99.754
Constant -2.624 1.113 5.555 1 .018 .073
a. Variable(s) entered on step 1: kerja, umur1.
Interpretasi:
Setelah dilakukan analisis confounding, ternyata, umur merupakan confounding
hubungan pekerjaan dengan menyusui eksklusif, maka modelnya adalah sbb:
Dari model di atas dapat dijelaskan bahwa ibu yang tidak bekerja mempunyai
peluang menyusui eksklusif 4 kali dibandingkan ibu yang tidak bekerja setelah
dikontrol variabel ”umur”.
Lampiran data LBW. SAV.
Id Low age lwt race smoke ptl ht ui ftv bwt

1 1 28 120 3 1 1 0 1 0 709
2 1 29 130 1 0 0 0 1 2 1021
3 1 34 187 2 1 0 1 0 0 1135
4 1 25 105 3 0 1 1 0 0 1330
5 1 25 85 3 0 0 0 1 0 1474
6 1 27 150 3 0 0 0 0 0 1588
7 1 23 97 3 0 0 0 1 1 1588
8 1 24 128 2 0 1 0 0 1 1701
9 1 24 132 3 0 0 1 0 0 1729
10 1 21 165 1 1 0 1 0 1 1790
11 1 32 105 1 1 0 0 0 0 1818
12 1 19 91 1 1 2 0 1 0 1885
13 1 25 115 3 0 0 0 0 0 1893
14 1 16 130 3 0 0 0 0 1 1899
15 1 25 92 1 1 0 0 0 0 1928
16 1 20 150 1 1 0 0 0 2 1928
17 1 21 200 2 0 0 0 1 2 1928
18 1 24 155 1 1 1 0 0 0 1936
19 1 21 103 3 0 0 0 0 0 1970
20 1 20 125 3 0 0 0 1 0 2055
21 1 25 89 3 0 2 0 0 1 2055
22 1 19 102 1 0 0 0 0 2 2082
23 1 19 112 1 1 0 0 1 0 2084
24 1 26 117 1 1 1 0 0 0 2084
25 1 24 138 1 0 0 0 0 0 2100
26 1 17 130 3 1 1 0 1 0 2125
27 1 20 120 2 1 0 0 0 3 2126
28 1 22 130 1 1 1 0 1 1 2187
29 1 27 130 2 0 0 0 1 0 2187
30 1 20 80 3 1 0 0 1 0 2211
31 1 17 110 1 1 0 0 0 0 2225
32 1 25 105 3 0 1 0 0 1 2240
33 1 20 109 3 0 0 0 0 0 2240
34 1 18 148 3 0 0 0 0 0 2282
35 1 18 110 2 1 1 0 0 0 2296
36 1 20 121 1 1 1 0 1 0 2296
37 1 21 100 3 0 1 0 0 4 2301
38 1 26 96 3 0 0 0 0 0 2325
39 1 31 102 1 1 1 0 0 1 2353
40 1 15 110 1 0 0 0 0 0 2353
41 1 23 187 2 1 0 0 0 1 2367
42 1 20 122 2 1 0 0 0 0 2381
43 1 24 105 2 1 0 0 0 0 2381
44 1 15 115 3 0 0 0 1 0 2381
45 1 23 120 3 0 0 0 0 0 2395
46 1 30 142 1 1 1 0 0 0 2410
47 1 22 130 1 1 0 0 0 1 2410
48 1 17 120 1 1 0 0 0 3 2414
49 1 23 110 1 1 1 0 0 0 2424
50 1 17 120 2 0 0 0 0 2 2438
51 1 26 154 3 0 1 1 0 1 2442
52 1 20 105 3 0 0 0 0 3 2450
53 1 26 190 1 1 0 0 0 0 2466
54 1 14 101 3 1 1 0 0 0 2466
55 1 28 95 1 1 0 0 0 2 2466
56 1 14 100 3 0 0 0 0 2 2495
57 1 23 94 3 1 0 0 0 0 2495
58 1 17 142 2 0 0 1 0 0 2495
59 1 21 130 1 1 0 1 0 3 2495
60 0 19 182 2 0 0 0 1 0 2523
61 0 33 155 3 0 0 0 0 3 2551
62 0 20 105 1 1 0 0 0 1 2557
63 0 21 108 1 1 0 0 1 2 2594
64 0 18 107 1 1 0 0 1 0 2600
65 0 21 124 3 0 0 0 0 0 2622
66 0 22 118 1 0 0 0 0 1 2637
67 0 17 103 3 0 0 0 0 1 2637
68 0 29 123 1 1 0 0 0 1 2663
69 0 26 113 1 1 0 0 0 0 2665
70 0 19 95 3 0 0 0 0 0 2722
71 0 19 150 3 0 0 0 0 1 2733
72 0 22 95 3 0 0 1 0 0 2750
73 0 30 107 3 0 1 0 1 2 2750
74 0 18 100 1 1 0 0 0 0 2769
75 0 18 100 1 1 0 0 0 0 2769
76 0 15 98 2 0 0 0 0 0 2778
77 0 25 118 1 1 0 0 0 3 2782
78 0 20 120 3 0 0 0 1 0 2807
79 0 28 120 1 1 0 0 0 1 2821
80 0 32 121 3 0 0 0 0 2 2835
81 0 31 100 1 0 0 0 1 3 2835
82 0 36 202 1 0 0 0 0 1 2836
83 0 28 120 3 0 0 0 0 0 2863
84 0 25 120 3 0 0 0 1 2 2877
85 0 28 167 1 0 0 0 0 0 2877
86 0 17 122 1 1 0 0 0 0 2906
87 0 29 150 1 0 0 0 0 2 2920
88 0 26 168 2 1 0 0 0 0 2920
89 0 17 113 2 0 0 0 0 1 2920
90 0 17 113 2 0 0 0 0 1 2920
91 0 24 90 1 1 1 0 0 1 2948
92 0 35 121 2 1 1 0 0 1 2948
93 0 25 155 1 0 0 0 0 1 2977
94 0 25 125 2 0 0 0 0 0 2977
95 0 29 140 1 1 0 0 0 2 2977
96 0 19 138 1 1 0 0 0 2 2977
97 0 27 124 1 1 0 0 0 0 2992
98 0 31 215 1 1 0 0 0 2 3005
99 0 33 109 1 1 0 0 0 1 3033
100 0 21 185 2 1 0 0 0 2 3042
101 0 19 189 1 0 0 0 0 2 3062
102 0 23 130 2 0 0 0 0 1 3062
103 0 21 160 1 0 0 0 0 0 3062
104 0 18 90 1 1 0 0 1 0 3076
105 0 18 90 1 1 0 0 1 0 3076
106 0 32 132 1 0 0 0 0 4 3080
107 0 19 132 3 0 0 0 0 0 3090
108 0 24 115 1 0 0 0 0 2 3090
109 0 22 85 3 1 0 0 0 0 3090
110 0 22 120 1 0 0 1 0 1 3100
111 0 23 128 3 0 0 0 0 0 3104
112 0 22 130 1 1 0 0 0 0 3132
113 0 30 95 1 1 0 0 0 2 3147
114 0 19 115 3 0 0 0 0 0 3175
115 0 16 110 3 0 0 0 0 0 3175
116 0 21 110 3 1 0 0 1 0 3203
117 0 30 153 3 0 0 0 0 0 3203
118 0 20 103 3 0 0 0 0 0 3203
119 0 17 119 3 0 0 0 0 0 3225
120 0 17 119 3 0 0 0 0 0 3225
121 0 23 119 3 0 0 0 0 2 3232
122 0 24 110 3 0 0 0 0 0 3232
123 0 28 140 1 0 0 0 0 0 3234
124 0 26 133 3 1 2 0 0 0 3260
125 0 20 169 3 0 1 0 1 1 3274
126 0 24 115 3 0 0 0 0 2 3274
127 0 28 250 3 1 0 0 0 6 3303
128 0 20 141 1 0 2 0 1 1 3317
129 0 22 158 2 0 1 0 0 2 3317
130 0 22 112 1 1 2 0 0 0 3317
131 0 31 150 3 1 0 0 0 2 3321
132 0 23 115 3 1 0 0 0 1 3331
133 0 16 112 2 0 0 0 0 0 3374
134 0 16 135 1 1 0 0 0 0 3374
135 0 18 229 2 0 0 0 0 0 3402
136 0 25 140 1 0 0 0 0 1 3416
137 0 32 134 1 1 1 0 0 4 3430
138 0 20 121 2 1 0 0 0 0 3444
139 0 23 190 1 0 0 0 0 0 3459
140 0 22 131 1 0 0 0 0 1 3460
141 0 32 170 1 0 0 0 0 0 3473
142 0 30 110 3 0 0 0 0 0 3475
143 0 20 127 3 0 0 0 0 0 3487
144 0 23 123 3 0 0 0 0 0 3544
145 0 17 120 3 1 0 0 0 0 3572
146 0 19 105 3 0 0 0 0 0 3572
147 0 23 130 1 0 0 0 0 0 3586
148 0 36 175 1 0 0 0 0 0 3600
149 0 22 125 1 0 0 0 0 1 3614
150 0 24 133 1 0 0 0 0 0 3614
151 0 21 134 3 0 0 0 0 2 3629
152 0 19 235 1 1 0 1 0 0 3629
153 0 25 95 1 1 3 0 1 0 3637
154 0 16 135 1 1 0 0 0 0 3643
155 0 29 135 1 0 0 0 0 1 3651
156 0 29 154 1 0 0 0 0 1 3651
157 0 19 147 1 1 0 0 0 0 3651
158 0 19 147 1 1 0 0 0 0 3651
159 0 30 137 1 0 0 0 0 1 3699
160 0 24 110 1 0 0 0 0 1 3728
161 0 19 184 1 1 0 1 0 0 3756
162 0 24 110 3 0 1 0 0 0 3770
163 0 23 110 1 0 0 0 0 1 3770
164 0 20 120 3 0 0 0 0 0 3770
165 0 25 241 2 0 0 1 0 0 3790
166 0 30 112 1 0 0 0 0 1 3799
167 0 22 169 1 0 0 0 0 0 3827
168 0 18 120 1 1 0 0 0 2 3856
169 0 16 170 2 0 0 0 0 4 3860
170 0 32 186 1 0 0 0 0 2 3860
171 0 18 120 3 0 0 0 0 1 3884
172 0 29 130 1 1 0 0 0 2 3884
173 0 33 117 1 0 0 0 1 1 3912
174 0 20 170 1 1 0 0 0 0 3940
175 0 28 134 3 0 0 0 0 1 3941
176 0 14 135 1 0 0 0 0 0 3941
177 0 28 130 3 0 0 0 0 0 3969
178 0 25 120 1 0 0 0 0 2 3983
179 0 16 95 3 0 0 0 0 1 3997
180 0 20 158 1 0 0 0 0 1 3997
181 0 26 160 3 0 0 0 0 0 4054
182 0 21 115 1 0 0 0 0 1 4054
183 0 22 129 1 0 0 0 0 0 4111
184 0 25 130 1 0 0 0 0 2 4153
185 0 31 120 1 0 0 0 0 2 4167
186 0 35 170 1 0 1 0 0 1 4174
187 0 19 120 1 1 0 0 0 0 4238
188 0 24 116 1 0 0 0 0 1 4593
189 0 45 123 1 0 0 0 0 1 4990

ANALISIS DATA SPSS (SUTANTO FKM UI 2006-Dikonversi

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

ANALISIS DATA SPSS (SUTANTO FKM UI 2006-Dikonversi

Diunggah oleh

Hak Cipta:

Format Tersedia

SUTANTO PRIYO HASTONO: Analisis

SUTANTO PRIYO HASTONO

1. Statistik dan Penelitian

Reliabel menunjukkan kekonsistensian pengukuran, artinya pengukuran diulang-

2. Peran Statistik dalam Penelitian

3. Kegunaan statistik/penelitian di Bidang Kesehatan

Tabel 2 Jenis pendidikan pasien

c. Mengetahui konsistensi data

b. STRUKTUR DATA DI SPSS

TAMPILAN UTAMA SPSS FOR WINDOWS

Dalam memasukan data ke SPSS, ada 4 hal yang harus dieperhatikan:

a. Memberi Nama Variabel

b. Mendefinisikan Tipe Variabel

c. Mendefinisakan Adanya Desimal

d. Memberi Label Variabel

Sekarang kita coba lakukan entry untuk data:

A. Langkah pertama : Memberi/membuat nama variabel:

Untuk membuat nama variabel, layar/jendela posisikan pada “Variable View”.

Memasukkan data bisa menyamping satu persatu responden di entry datanya,

b. Tekan tombol delete

Untuk menghapus isi sel sejumlah kolom sekaligus, pilihlah sejumlah

3. Menghapus baris (menghapus case/responden)

b. Tekan tombol delete

Untuk menghapus beberapa case sekaligus, pilihlah sejumlah case

4. Mengcopy isi sel

5. Mengcopy isi satu kolom (mengcopy variabel)

B. MENYIMPAN FILE DATA

C. MENGAKTIFKAN/MEMANGGIL FILE DATA

Sebagai contoh kita akan melakukan pengelompokan umur. Umur akan

9). Pindahkan kursor ke kotak Range: throug , kita akan

nampak variabel baru “umur1” masih menampilkan angka dengan 2 desimal,

Pada kotak tersebut terdapat kotak:

10). Klik tombol “If ”, sesaat kemudian muncul dialog “ComputeVariable: If

Note : setiap kita melakukan perintah : Compute, Recode, atau IF

4). Klik “If “

Data file kedua, berisi: nomor responden 4 s/d 7

Data hasil gabungan, berisi : nomor rsponden 1 s/d 7

3. klik Add Cases

Data pertama : berisi variabel : no, umur dan didik

Data gabungan, berisi : no, umur, didik, sex, kerja dan bb

6. Menyimpan hasil olahan/hasil analisis

CARA MENGUKUR VALIDITAS

CARA MENGUKUR RELIABILITAS

Lakukan uji validitas dan reliabilitas kuesioner untuk mengetahui

Hasil pretest pada 15 responden, sbb:

5. Masukkan semua variabel ke dalam kotak ‘Items’ (ingat variabel yang

Mean Std. Deviation N

Scale Corrected Cronbach's

Mean Std. Deviation N

Scale Corrected Cronbach's

B. Uji Interrater Reliability

Kemudian dilakukan uji coba dengan pengamatan sebanyak 10 pasien, adapun

Ujilah apakah ada kesepakatan antara peneliti dengan numerator:

Pada umumnya analisis data bertujuan untuk:

Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari:

Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan

Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan

1. Peringkasan Data Untuk Data Jenis Numerik

Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan

Bentuk Distribusi Data

Varian = (Xi – X)2

Standard deviasi (S atau SD =(Xi – X)2

Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila