Anda di halaman 1dari 68

MODUL

ANALISA DATA

PROGRAM STUDI S3 KESEHATAN MASYARAKAT


PASCA SARJANA UNIVERSITAS ANDALAS

PENGANTAR ANALISIS DATA


1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah selanjutnya
adalah menganalisis data. Data mentah (raw data) yang sudah susah payah kita
kumpulkan tidak akan ada artinya jika tidak dianalisis. Analisis data merupakan
kegiatan yang sangat penting dalam suatu penelitian, karena dengan analisislah data
dapat mempunyai arti/makna yang dapat berguna untuk memecahkan masalah
penelitian.
Analisis mempunyai posisi strategis dalam suatu penelitian. Namun perlu
dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya dapat langsung
memberi jawaban penelitian, untuk itu perlu diketahui bagaimana menginterpretasi
hasil penelitian tersebut. Menginterpretasi berarti kita menjelaskan hasil analisis guna
memperoleh makna/arti.
Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas. Interpretasi
dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan hanya sebatas pada
masalah penelitian yang diteliti berdasarkan data yang dikumpulkan dan diolah untuk
keperluan penelitian tersebut. Sedangkan interpretasi dalam arti luas (analitik) yaitu
interpretasi guna mencari makna data hasil penelitian dengan jalan tidak hanya
menjelaskan/menganalisis data hasil penelitian tersebut, tetapi juga melakukan
inferensi (generalisasi) dari data yang diperoleh dengan teori-teori yang relevan
dengan hasil-hasil penelitian tersebut.
Pada umumnya analisis data bertujuan untuk:
a.

Memperoleh gambaran/deskripsi masing-masing variabel

b.

Membandingkan dan menguji teori atau konsep dengan informasi yang


ditemukan

c.

Menemukan adanya konsepbaru dari data yang dikumpulkan

d.

Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau hanya
berlaku pada kondisi tertentu
Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari:

a.

Jenis penelitian

b.

Jenis sampel

c.

Jenis data/variabel

d.

Asumsi kenormalan distribusi data

a.

Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata) pendapat

masyarakat akan suatu hal tertentu, maka pengumpulan data dilakukan dengan survei.
Dari kasus ini maka dapat dilakukan analisis data dengan pendekatan kuantitatif.
Namun bila kita menginginkan untuk mendapatkan pendapat/gambaran yang
mendalam tentang suatu fenomena, maka data dapat dikumpulkan dengan fokus grup
diskusi atau observasi, maka analisisnya menggunakan pendekatan analisis kualitatif.
b.

Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan, apakah

kedua sampel independen atau dependen. Misalnya pada penelitian survei yang tidak
menggunakan sampel yang sama, dapat digunakan uji statistik yang mengasumsikan
sampel yang independen. Misalkan survei untuk mengetahui apakah ada perbedaan
berat badan bayi antara bayi-bayi yang dilahirkan dari ibu perokok dengan bayi-bayi
dari ibu yang tidak merokok. Disini berarti kelompok ibu perokok dan kelompok ibu
bukan perokok bersifat independen.
Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post (sebelum
dan sesudah adanya perlakuan tertentu dilakukan pengukuran) maka uji yang
digunakan adalah uji statistik untuk data yang dependen. Misalnya, suatu penelitian
ingin mengetahui pengaruh penelitian manajemen terhadap kinerja petugas kesehatan.
Pertanyaan penelitiannya Apakah ada perbedaan kinerja petugas kesehatan antara
sebelum dan sesudah mendapatkan pelatihan manajemen?. Dalam penelitian ini
sampel kelompok petugas kesehatan bersifat dependen, karena pada kelompok
(orang) yang sama diukur dua kali yaitu pada saat sebelum pelatihan (pre test) dan
sesudah dilakukan pelatihan (Post Test).
c.

Jenis Data/Variabel
Data denganjenis katagori berbeda cara analisisnya dengan data jenis numerik.

Beberapa pengukuran/uji statistik hanya cocok untuk jenis data tertentu. Sebagai
contoh, nilai proporsi/persentase (pada analisis univariat) biasanya cocok untuk
menjelaskan data berjenis katagorik, sedangkan untuk data jenis numerik biasanya
dapat menggunakan nilai rata-rata untuk menjelaskan karakteristiknya. Untuk analisis
hubungan dua variabel (analsis bivariat), uji kai kuadrat hanya dapat dipakai untuk
3

mengetahui hubungan data katagori dengan data katagori. Sebaliknya untuk


mengetahui hubungan numerik dengan numerik digunakan uji korelasi/regresi.
d.

Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk distribusi

datanya. Bila distribusi datanya tidak normal, maka sebaiknya digunakan prosedur uji
statitik nonparametrik. Sedangkan bila asumsi kenormalan dapat dipenuhi maka dapat
digunakan uji statistik parametrik.
Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan kuantitatif):
1.

Analisis Deskriptif (Univariat)


Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan karakteristik
masing-masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya.
Untuk data numerik digunakan nilai mean (rata-rata), median, standard deviasi
dan inter kuartil range, minimal maksimal.

2.

Analisis Analitik (Bivariat)


Setelah diketahui karakteristik masing-masing variabel dapat diteruskan analisis
lebih lanjut. Apabila diinginkan analisis hubungan antar dua variabel, maka
analisis dilanjutkan pada tingkat bivariat. Misalnya ingin diketahui hubungan
antara berat badan dengan tekanan darah. Untuk mengetahui hubungan dua
variabel tersebut biasanya digunakan pengujian statistik. Jenis uji statistik yang
digunakan sangat tergantung jenis data/variabel yang dihubungkan.

3.

Analisis Multivariat
Merupakan analisis yang menghubungkan antara beberapa variabel independen
dengan satu variabel dependen.
Secara lebih khusus/detail analisis univariat, bivariat dan multivariat akan

dipelajari pada bab tersendiri.

ANALISIS UNIVARIAT
( DESKTIPTIF)
Tujuan dari

analisis

ini

adalah

untuk menjelaskan/mendeskriptifkan

karakteristik masing-masing variabel yang diteliti. Dalam analisis data kuantitatif kita
dihadapkan pada kumpulan data yang besar/banyak yang belum jelas maknanya.
Fungsi analisis sebetulnya adalah menyederhanakan atau meringkas kumpulan data
hasil pengukuran sedemikian rupa sehingga kumpulan data tersebut berubah menjadi
informasi yang berguna. Peringkasan tersebut berupa ukuran-ukuran statistik, tabel
dan juga grafik. Secara teknis pada dasarnya analisis merupakan kegiatan meringkas
kumpulan

data

menjadi

ukuran

tengah

dan

ukuran

variasi.

Selanjutnya

membandingkan gambaran-gambaran tersebut antara satu kelompok subyek dan


kelompok subyek lain, sesuai dengan tujuan yang ingin dicapai dalam analisis.
Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran variasi)
jenis data (apakah numerik atau katagorik) akan sangat menentukan bentuk
peringkasan datanya. Berikut akan diuraikan bentuk/cara peringkasan data untuk data
numerik dan data katagorik.
1.

Peringkasan Data Untuk Data Jenis Numerik

a.

Ukuran Tengah
Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil

pengukuran. Berbagai ukuran dikembangkan utnuk mencerminkan ukuran tengah


tersebut, dan yang paling sering dipakai adalah mean, median dan mode/modus.
).1

Mean
Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua
nilai

pengukuran

dibagioleh

banyaknya

pengukuran.

Secara

sederhana

perhitungan nilai mean dapat dituliskan dengan rumus :


X = Xi / n
Keuntungan nilai mean adalah mudah menghitungnyadan sudah melibatkan
seluruh data dalam penghitungannya. Namun kelemahan dari nilai mean adalah
sangat dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi maupun rendah. Oleh
5

karena itu pada kelompok data yang ada nilai ekstrimnya (sering dikenal dengan
distribusi data yang menceng/miring), Mean tidak dapat mewakili rata-rata
kumpulan nilai pengamatan. Sebagai contoh data yang ada nilai ekstrimnya adalah
data penghasilan. Apabila mean pendapatan perbulan adalah Rp 10.000.000,- ,
sebenarnya sebagian besar orang pendapatannya di bawah Rp 10.000.000,- . Mean
sebesar Rp 10.000.000,- diperoleh karena tarikan sekelompok kecil orang
(misalnya konglomerat) yang pendapatannya sangat tinggi. Dengan demikian
penggunaan mean untuk data yang ada nilai ekstrimnya (data yang distribusinya
menceng) kurang tepat.
Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90 hr.
Mean = (1+3+4+2+90)/5 = 20 hr.
Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil ini
tentunya tidak dapat mewakili karena secara visual datanya sebagian besar kurang
dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di atas ada nilai
ekstrimnya.
).2

Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nilai di
bawahnya dan setengahnya lagi mempunyai nilai di atasnya. Berbeda dengan nilai
mean, penghitungan median hanya mempertimbangkan urutan nilai dasil
pengukuran, besar beda antar nilai di abaikan. Karena mengabaikan besar beda,
maka median tidak dipengaruhi oleh nilai ekstrim.
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke besar
b). Hitung posisi median dengan rumus (n+1)/2
c). Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th
Data diurutkan: 20, 24, 26, 30, 36, 40
Posisi = (6+1)/2 = 3,5
Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28
Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa berumur di
atas 28 tahun

3).

Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun

Bentuk Distribusi Data


Hubungan nilai mean, median dan mode akan menentukan bentuk distribusi data:
-

Bila nilai mean, median dan mode sama, maka


bentuk distribusi datanya normal

Bila nilai mean > median > mode, maka bentuk


distribusi datanya menceng/miring ke kanan

Bila nilai mean < median < mode, maka bentuk


distribusi datanya menceng/miring ke kiri

b.

Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama lain atau

dengan kata lain hasil pengamatan akan bervariasi. Untuk mengetahui seberapa jauh
data bervariasi digunakan ukuran variasi antara lain range, jarak linier kuartil dan
standard deviasi.
1).

Range
Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih nilai
terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi nilai ekstrim.
Keuntungan penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian ditentukan
kuartil bawah dan atas. Kuartil merupakan pembagian data menjadi 4 bagian yang
dibatasi oleh tiga ukuran kuartil, yaitu kuartil I, kuartil II dan kuartil III.
Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di
atasnya.
Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data berada
di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di
atasnya.

Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini lebih
baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi sangat
menyebar.
3).

Standard Deviasi
Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai
pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi
terhadap mean disebut varian, yang rumusnya;
Varian = (Xi X)2
n
Semakin besar nilai varian akan semakin bervariasi, karena satuan varian
(kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka dikembangkan
suatu ukuran variasi yang mempunyai satuan yang sama dengan satuan
pengamatan, yaitu Standard Deviasi.
Standard Deviasi merupakan akar dari varian:
Standar deviasi (S atau SD) =

(Xi X)2
n

Seperti halnya varian, semakin besar SD semakin besar variasinya. Apabila tidak
ada variasi, maka SD=0
Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan nilai
mean (rata-rata), median, standard deviasi dan inter quartil range, minimal dan
maksimal. Bila data yang terkumpul tidak menunjukkan adanya nilai ekstrim
(distribusi normal), maka perhituungan nilai mean dan standard deviasi merupakan
cara analisis univariat yang tepat. Seddangkan bila dijumpai nilai ekstrim 9 distribusi
data tidak normal), maka nilai nedian dan inter quartil range (IQR) yang lebih tepat
dibandingkan nilai mean.
2.

Peringkasan Data Katagorik


Berbeda dengan data numerik, peringkasan, (baik ukuran tengah maupun

ukuran variasi) tidak beragam jenisnya. Pada data katagorik peringkasan data hanya
menggunakan distribusi frekuensi dengan ukuran persentase atau proporsi. Bila data
8

berjenis katagorik, tentunya informasi/peringkasan yang penting disampaikan tidak


mungkin/tidak lazim menggunakan ukuran mean atau median. melainkan informasi
jumlah dan persentase yang disajikan. Untuk ukuran variasi, pada data katagorik
variasi maksimal apabila jumlah antar katagori sama.
Contoh:

Kelas A: mahasiswa 50 dan mahasiswi 50


Kelas B: mahasiswa 90 dan mahasiswi 10

Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50% pria dan
50% wanita.
Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria) karena
pria 90% dan wanita hanya 10%.
3.

Bentuk Penyajian Data


Bentuk penyajian analisis univariat dapat berupa tabel atau grafik. Namun

perlu diingat bahwa kita dianjurkan hanya memilih salah satu, tidak diperkenankan
secara sekaligus menggunakan tabel dan juga grafik dalam menyampaikan informasi
suatu data/variabel.
Contoh penyajian analisis deskriptif:

a.

Data numerik
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999
Variabel

Mean

SD

Minimal- Maksimal

1. Umur

Median
30,3

10,1

17 60

2. Lama hari rawat

31,1
10,1

8,9

2 60

7,0

b.

Data katagorik

Tabel 2
Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X
tahun 1999
Pendidikan
SD
SMP
SMU
Total

Jumlah
60
30
10
100

Persentase
60,0
30,0
10,0
100,0

Bagaimana menginterpretasi tabel di atas?


dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana?
Selain untuk mendeskripsikan masing-masing variabel, analisis univariat dapat
juga sekaligus untuk mengeksplorasi variabel yang dapat berguna dalam
mendiagnosis asumsi statistik lanjut (terutama untuk variabel jenis numerik),
misalnya apakah variannya homogen atau heterogen, apakah distribusinya normal
atau tidak. Eksplorasi data juga dapat untuk mendeteksi adanya nilai ekstrim/outlier,
bila ada nilai ekstrim sangat menentukan analisis selanjutnya (bivariat) apakah
nilainya akan berkurang.

10

KASUS :
ANALISIS DESKRIPTIF (UNIVARIAT)
Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-masing
variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk data numerik
digunakan nialai mean (rata-rata), median, standard deviasi dll. Sedangkan untuk data
katagorik tentunya hanya dapat menjelaskan angka/nilai jumlah dan persentase
masing-masing kelompok. Berikut akan dipelajari cara mengeluarkan analisis
deskriptif di SPAA, dimulai untuk variabel katagorik (sebagai latihan digunakan
variabel pendidikan) dan kemudian dilanjutkan variabel numerik (variabel umur).
a.

Data Katagorik
Untuk menampilkan tabulasi data katagorik digunakan tampilan frekuensi.

Sebagai contoh kita akan menampilkan tabel distribusi frekuensi untuk variabel
pendidikan dari file ASI.SAV.
1.

Dari menu utama SPSS pilih Analyze, kemudian Descriptive


Statistic dan pilih Frequencies, sehingga muncul tampilan:

2.

Sorot variabel didik. Klik tanda panah dan masukkan ke kotak


Variable (s)

11

3.

Klik OK, hasil dapat dilihat di jendela output, seperti sbb:

Frequencies
Statistics
pendidikan formal ibu menyusui
N

Valid

50

Missing

0
pendidikan formal ibu menyusui

Valid

Frequency

Percent

Valid Percent

10
11
16
13
50

20.0
22.0
32.0
26.0
100.0

20.0
22.0
32.0
26.0
100.0

1
2
3
4
Total

Cumulative
Percent
20.0
42.0
74.0
100.0

Kolom Frequency menunjukkan jumlah kasus dengan nilai yang sesuai. Pada contoh
di atas, total responden 50 orang, dari jumlah tersebut 10 ibu yang berpendidikan SD,
proporsi dapat dilihat pada kolom Percent, pada contoh di atas ada 20% ibu yang
berpendidikan SD. Kolom Valid Percent memberi hasil yang sama karena pada data
ini tidak ada missing cases. Cumulative Percent menjelaskan tentang persent
kumulatif. Pada contoh di atas ada 42,0% ibu yang tingkat pendidikannya SD dan
SMP. Dalam menginterpretasikan tabel katagorik dapat dilihat dari variasi dan
konsentrasi datanya.
12

Penyajian dan Interpretasi di Laporan Penelitian


Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan
penelitian/laporan tesis. Adapun penyajian dan interpretasinya sbb:
Tabel
Distribusi Responden Menurut Tingkat Pendidikan
Di X tahun .
Pendidikan
SD
SMP
SMU
PT
Total

Jumlah
10
11
16
13
50

Persentase
20,0
22,0
32,0
26,0
100,0

Distribusi tingkat pendidikan responden hampir merata untuk masing-masing tingkat


pendidikan. Paling banyak responden berpendidikan SMU yaitu 16 orang (32,0%)
sedangkan untuk pendidikan SD, SMP dan PT masing-masing 20,0%, 22,0% dan
26,0%.
b.

Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan melaporkan

ukuran tengah dan sebarannya. Ukuran yang digunakan adalah rata-rata, median dan
modus. Sedangkan ukuran sebarannya (variasi) yang digunakan adalah range,
standard deviasi, minimal dan maksimal. Pada SPSS ada dua cara untuk
mengeluarkan analisis deskriptif yaitu dapat melalaui perintah Frequencies atau
perintah Expolre. Biasanya yang digunakan adalah Frequencies oleh karena ukuran
statistik yang dapat dihasilkan pada menu Frequencies sangat lengkap (seperti
mean, median, varian dll), selain itu pada perintah ini juga dapat ditampilkan grafik
histogram dan kurve normalnya. Berikut akan dicoba mengeluarkan analisis deskriptif
untuk variabel umur dengan menggunakan perintah frequencies.
1. Aktifkan data susu.sav
2. Pilih Analyze
3. Pilih Descriptive Statistic
4. Pilih Frequencies, terlihat kotak frequencies:

13

5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda panah
sehingga umur masuk ke kotak variable (s).

6. Klik tombol option Statistics, pilih ukuran yang anda minta misalnya
mean, median, standard seviasi, minimum, maximum, SE.

7. Klik Continue
8. Klik tombol option Charts lalu muncul menu baru dan klik Histogram, lalu
klik With Normal Curve

14

9. Klik Continue
10. Klik OK, dan pada layar terlihat distribusi frekuensi disertai ukuran statistic
yang diminta dan dibawahnya tampak grafik histogram beserta curve
normalnya.

Frequencies
Statistics
Umur ibu menyusui
N

Valid
Missing

50
0

Statistics
Umur ibu menyusui
N
Mean
Std. Error of Mean
Median
Mode
Std. Deviation
Minimum
Maximum

Valid
Missing

50
0
25.10
.686
24.00
19
4.850
19
35

15

Umur ibu menyusui

Valid

Cumulative

Frequency

Percent

Valid Percent

19

14.0

14.0

Percent
14.0

20

6.0

6.0

20.0

21

6.0

6.0

26.0

22

10.0

10.0

36.0

23

10.0

10.0

46.0

24

8.0

8.0

54.0

25

4.0

4.0

58.0

26

10.0

10.0

68.0

27

6.0

6.0

74.0

30

6.0

6.0

80.0

31

6.0

6.0

86.0

32

6.0

6.0

92.0

34

4.0

4.0

96.0

35

4.0

4.0

100.0

Total

50

100.0

100.0

Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean, sedangkan nilai
standard deviasi dapat dilihat pada baris std. Seviation. Pada contoh di atas, rata-rata

16

umur ibu adalah 25,10 tahun, median 24,0 tahun dan standard deviasi 4,85 tahun
dengan umur termuda 19 tahun dan yang tertua 35 tahun. Distribusi frekuensi
ditampilkan menurut umur termuda sampai dengan umur tertua dengan informasi
tentang jumlah dan persentasenya. Bentuk distribusi data dapat diketahui dari grafik
histogram dan kurve normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi
variabel umur berbentuk normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting untuk
melakukan estimasi parameter populasi. Bila anda ingin memperoleh estimasi interval
lakukan analisis eksplorasi data dengan perintah Explore. Adapun caranya sbb:
1.

Dari menu utama SPSS, pilih menu Analyze, kemudian pilih submenu

descriptive Statistics, lalu pilih Explore


2.

Isikan kotak Dependent List dengan variabel umur, kotak Factor List dan

Label Cases By biarkan kosong, sehingga tampilannya sbb:

3.

Klik tombol Plots, dan pilih Normality Plots With Test

17

4.

Klik Continue

5.

Klik OK, hasilnya dapat dilihat di layar:

Explore
Descriptives
umur ibu menyusui

Statistic
25.10

Mean
95% Confidence

Lower Bound

23.72

Interval for Mean

Upper Bound

26.48

5% Trimmed Mean

24.90

Median

24.00

Variance

23.520

Std. Deviation

4.850

Minimum

19

Maximum

35

Range

16

Interquartile Range

Std. Error
.686

Skewness

.547

.337

Kurtosis

-.812

.662

18

Tests of Normality
Kolmogorov-Smirnova
Statistic
df
Sig.
umur ibu menyusui
.130
50
.035
a
. Lilliefors Significance Correction

Statistic
.920

Shapiro-Wilk
df
50

umur ibu menyusui


umur ibu menyusui Stem-and-Leaf Plot
Frequency

Stem & Leaf

7.00

1 . 9999999

20.00

2 . 00011122222333334444

10.00

2 . 5566666777

11.00

3 . 00011122244

2.00

3 . 55

Stem width:

10

Each leaf:

1 case(s)

19

Sig.
.002

Dari hasil analisis Explore terlihat juga nilai mean, median dan mode. Namun yang
paling penting dari tampilan explore munculnya angka estimasi interval. Dari hasil
tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita dapat menghitung
95% confidence interval umur yaitu 23,72 s.d. 26,48. Jadi kita 95% yakin bahwa ratarata umur ibu di populasi berada pada selang 23,72 sampai 26,48 tahun.

20

Uji kenormalan data:


Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk mengetahuinya
yaitu:
1.

Dilihat dari grafik histogram dan kurve normal, bila bentuknya menyerupai
bel shape, berarti distribusi normal

2.

Menggunakan nilai Skewness dan standar errornya, bila nilai Skewness dibagi
standar errornya menghasilkan angka 2, maka distribusinya normal

3.

Uji kolmogorov smirnov, bila hasil uji signifkan (p value > 0,05) maka
distribusi normal. Namun uji kolmogorov sangat sensitif dengan jumlah sampel,
maksudnya : untuk jumlah sampel yang besar uji kolmogorov cenderung
menghasilkan uji yang signifikan (yang artinya bentuk distribusinya tidak
normal). Atas dasar kelemahan ini dianjurkan untuk mengetahui kenormalan data
lebih baik menggunakan angka skewness atau melihat grafik histogram dan kurve
normal

Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat bentuk
yang normal, selain itu hasil dari perbandingan skwness dan standar error didapatkan:
0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti distribusi normal. Dari hasil
tersebut diatas dengan demikian variabel umur disimpulkan berdistribusi normal.
Penyajian dan Interpretasi di Laporan Penelitian
Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di laporan
penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah sbb:
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x
Variabel

Mean

SD

Minimal- Maksimal

95% CI

Umur

25,10

4,85

19 - 35

23,72 26,48

Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI: 23,72
26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun dan umur tertua
35 tahun. Dari hasil estimasi interval dapat disimpulkan bahwa 95% diyakini bahwa
rata-rata umur ibu adalah diantara 23,72 sampai dengan 26,48 tahun.

ANALISIS BIVARIAT
21

Setelah diketahui karakteristik masing-masing variabel dapat diteruskan


analisis lebih lanjut. Pada analisis univariat, misalnya ada dua variabel : jenis
pembayaran berobat dan kepuasan pasien, kita hanya melakukan pendeskripsian
sendiri-sendiri untuk variabel jenis pembayaran dan kepuasan pasien. Untuk variabel
jenis pembayaran akan diketahui berapa persen yang berobat dengan biaya sendiri dan
berapa persen yang dibiayai askes. Begitu juga untuk variabel kepuasan pasien, akan
diketahui berapa persen yang puas dan
berapa persen yang tidak puas.
Apabila diinginkan analisis hubungan antara dua variabel, dalam contoh diatas
berarti kita ingin mengetahui hubungan jenis pembayaran dengan kepuasan pasien,
maka analisis dilanjutkan pada tingkat bivariat. Pada analisis bivariat kita dapat
mengetahui apakah ada perbedaan kepuasan pasien antara pasien dengan membayar
sendiri dengan pasien dengan biaya askes. Kegunaan analisis bivariat bisa untuk
mengetahui apakah ada hubungan yang siginifikan antara dua variabel, atau bisa juga
digunakan untuk mengetahui apakah ada perbedaan yang signifikan antara dua atau
lebih kelompok(sampel).
Perbedaan Substansi/Klinis dan perbedaan Statistik
Perlu dipahami/disadari bagi peneliti bahwa berbeda bermakna/signifikan
secara statistik tidak berarti (belum tentu) bahwa perbedaan tersebut juga bermakna
dipandang dari segi substansi/klinis. Seperti diketahui bahwa semakin besar sampel
yang dianalisis akan semakin besar menghasilkan kemungkinan berbeda bermakna.
Dengan sampel besar perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan
tidak mempunyai manfaat secara substansi/klinis dapat berubah menjadi bermakna
secara statitik. Oleh karena itu arti kegunaan dari setiap penemuan jangan hanya
dilihat dari aspek statistik semata, namun harus juga dinilai/dilihat kegunaannya dari
segi klinis/substansi. Sebagai contoh ada studi eksperimen yang akan menguji dua
obat (katakanlah obat A dan Obat B) untuk mengatahui pengaruhnya terhadap
penurunan tekanan darah. Kemudian obat A dan B diujicobakan pada dua kelompok
relawan penderita hipertensi. Hasil eksperimen didapatkan bahwa rata-rata penurunan
tekanan darah setelah minum obat A adalah 40 mmHg dan pada kelompok yang
minum Obat B ratarata penurunannya 39 mmHg. Kemudian dilakukan uji statistik dan

22

hasilnya signifikan/bermakna (p value < alpha), apa yang dapat disimpulkan dari
temuan ini? Secara statistik memang terjadi perbedaan bermakna, namun secara
substansi tidaklah mempunyai perbedaan yang berarti, oleh karena perbedaan mean
penurunan tekanan darah antara obat A dan B hanya 1 mmHg. Dengan hasil ini dapat
disimpulkan bahwa sebenarnya antara obat A dan B tidak ada perbedaan (sama saja)
kasiatnya.

UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan keputusan
tentang apakah suatu hipotesis yang diajukan, seperti perbesaan atau hubungan, cukup
menyakinkan untuk ditolak atau tidak ditolak. Keyakinan ini didasarkan pada
besarnya peluang untuk memperoleh hubungan tersebut secara kebetulan (by chance).
Semakin kecil peluang tersebut (peluang adanya by chance), semakin besar keyakinan
bahwa hubungan tersebut memang ada.
Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk
memutuskan berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin baru lebih
baik daripada yang sekarang beraedar di pasaran. Untuk menjawab pertanyaan ini
maka perlu dilakukan pengujian hipotesis. Dengan pengujian hipotesis akan diperoleh
suatu kesimpulan secara probalistik apakah vaksin baru tersebut lebih baik dari yang
sekarang beredar di pasaran atau malah sebaliknya.
Prinsip uji hipotesis adalah melakukan perbandingan antara nilai sampel (data
hasil penelitian) dengan nilai hipotesis (nilai populasi) yang diajukan. Peluang untuk
diterima atau ditolaknya suatu hipotesis tergantung besar kecilnyanya perbedaan
antara nilai sampel dengan nilai hipotesis. Bila perbedaan tersebut cukup besar, maka
peluang untuk menolak hipotesis besar pula, sebaliknya bila perbedaan tersebut kecil,
maka peluang untuk menolak hipotesis menjadi kecil. Jadi, makin besar perbedaan
antara nilai sampel dengan nilai hipotesis, makin besar peluang untuk menolak
hipotesis.
Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua kemungkinan
yaitu menolak hipotesis dan menerima hipotesis (gagal menolak hipotesis). Perlu
dipahami bahwa arti menerima hipotesis sebetulnya kurang tepat, yang tepat adalah
gagal menolak hipotesis. Dalam uji hipotesis bila kesimpulannya menerima hipotesis,
bukan berarti bahwa kita telah membuktikan hipotesis tersebut benar, karena benar

23

atau tidaknya suatui hipotesis hanya dapat dibuktikan dengan mengadakan observasi
pada seluruh populasi, dan hal ini sangat sulit bahkan tidak mungkin untuk dilakukan.
Jadi menerima hipotesis sebetulnya artinya adalah kita tidak cukup bukti untuk
menolak hipotesis, dengan kata lain dapat diartikan kita gagal menolak hipotesis.
Untuk memperjelas pengertian bahwa gagal menolak hipotesis berbeda dengan
mengakui kebenaran hipotesis (menerima hipotesis, kita coba analogkan proses
persidangan kriminal di pengadilan. Seperti dalam sidang pengadilan, kegagalan
membuktikan kesalahan tertuduh bukan berarti si tertudauh tidak bersalah atau
sitertuduh benar. Pengadilan memutuskan bahwa si tertuduh tidak dapat dibuktikan
bersalah, bukan memutuskan tidak bersalah. Dari uraian tersebut sangatlah jelas
bahwa istilah yang tepat dalam kesimpulan uji hipotesis adalah gagal menolak
hiopotesis, dan bukan menerima hipotesis.
3.

Hipotesis
Hipotesis berasal dari kata hupo dan thesis. Hupo artinya sementara/lemah

kebenarannya dan thesis artinya pernyataan/teopri. Dengan demikian hipotesis berarti


pernyataan yang perlu diuji kebenarannya. Untuk menguji kebenaran sebuah hipotesis
digunakan pengujian yang disebut pengujian hipotesis.
Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis nol
(Ho) dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas tentang masingmasing hipotesis tersebut.
a.

Hipotesis Nol (Ho).


Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua
kelompok. Atau hipotesis yang menyatakan tidak ada hubungan antara variabel
satu dengan variabel lainnya
Contoh:
1) Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu
yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok
2) Tidak ada hubungan antara merokok dengan berat badan bayi

b.

Hipotesis Alternatif (Ha)


Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua
kelompok. Atau hipotesis yang menyatakan ada hubungan antara variabel satu
dengan variabel lainnya
Contoh:
24

1) Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu yang
merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok
2) Ada hubungan antara merokok dengan berat badan bayi
2.

Arah dan bentuk hipotesis


Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah satu arah

(one tail) atau dua arah (twa tail)


a.

One tail (satu sisi): bila hipotesis alternatifnya menyatakan


adanya perbedaan dan ada pernyataan yang mengatakan hal satu lebih
tinggi/rendah dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan bayi
dari ibu tidak merokok.

b.

Two tail (dua sisi) merupakan hipotesis alternatif yang hanya


menyatakan perbedaan tanpa melihat apakah hal satu lebih tinggi/rendah dari hal
lain.
Contoh:
Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan bayi dari
ibu tidak merokok. Atau dengan kata lain: ada perbedaan berat badan bayi antara
mereka yang dilahirkan dari ibu yang merokok dibandingkan dari ibu yang tidak
merokok.

Contoh penulisan hipotesis:


Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan tekanan
darah, maka hipotesisnya sbb:
Ho : A = B
Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Tidak
ada hubungan antara jenis kelamin dengan tekanan darah.
Ho : A B
Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau Ada
hubungan antara jenis kelamin dengan tekanan darah

25

3.

Menentukan Tingkat Kemaknaan (Level of Significance)


Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang biasanya diberi

notasi . Seperti sudah diketahui bahwa tujuan dari pengujian hipotesis adalah untuk
membuat suatu pertimbangan tentang perbedaan antara nilai sampel dengan keadaan
populasi sebagai suatu hipotesis. Langkah selanjutnya setelah ktriteria/batasan yang
digunakan untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang
disebut dengan tingkat kemaknaan (Level of Significance). Tingkat kemaknaan, atau
sering disebut dengan nilai , merupakan nilai yang menunjukkan besarnya peluang
salah dalam menolak hipotesis nol. Atau dengan kata lain, nilai merupakan batas
toleransi peluang salah dalam menolak hipotesis nol. Dengan kata-kata yang lebih
sederhana, nilai merupakan batas maksimal kesalahan menolak Ho. Bila kita
menolak Ho berarti menyatakan adanya perbedaan/hubungan. Sehingga nilai dapat
diartikan pula sebagai batas maksimal kita salah dalam menyatakan adanya
perbedaan. Penentuan nilai (alpha) tergantung dari tujuan dan kondisi penelitian.
Nilai yang sering digunakan adalah 10%, 5%, atau 1%. Untuk bidang kesehatan
masyarakat biasanya digunakan nilai sebesar 5%. Sedangkan untuk pengujian obatobatan digunakan batas toleransi kesalahan yang lebih kecil misalnya 1%, karena
mengandung risiko yang fatal. Misalkan seorang peneliti yang akan menentukan
apakah suatu obat bius berkhasiat akan menentukan nilai yang kecil sekali, peneliti
tersebut tidak akan mau mengambil risiko bahwaketidak berhasilan obat bius besar
karena akan berhubungan dengan nyawa seseorang yang akan dibius.
4.

Pemilihan Jenis Uji Parametrik atau Non Parametrik


Dalam pengujian hipotesis sangat berhubungan dengan distribusi data populasi

yang akan diuji. Bila distribusi data populasi yang akan diuji berbentuk
normal/simetris/Gauss, maka proses pengujian dapat digunakan dengan pendekatan
uji statistik parametrik. Sedangkan bila distribusi data populasinya tidak normal atau
tidak diketahui distribusinya maka dapat digunakan pendekatan uji statistik non
parametrik. Kenormalan suatu distribusi data dapat juga dilihat dari jenis variabelnya,
bila variabelnya berjenis numerik/kuantitatif biasanya distribusi datanya mendekati
normal/simetris, sehingga dapat digunakan uji statistik parametrik. Bila jenis
variabelnya katagorik (kualitatif), maka bentuk distribusinya tidak normal, sehingga
uji non parametrik dapat digunakan. Penentuan jenis uji juga ditentukan oleh jumlah
26

data yang dianalisis, bila jumlah data kecil (<30) cenderung digunakan uji non
parametrik.
PROSEDUR/LANGKAH UJI HIPOTESIS
Menetapkan Hipotesis
Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan hipotesis
alternatif (Ha).
1).

Hipotesis nol (Ho)


Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara kedua
kelompok.
Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan dari
ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok

2).

Hipotesis alternatif (Ha)


Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara kedua
kelompok.
Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari ibu
yang merokok dengan mereka yang dilahirkan dari ibu yang tidak merokok.

Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu arah
(one tail) atau dua arah (two tail).
Penentuan Uji Statistik Yang Sesuai
Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji statistik
mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena itu harus
digunakan uji statistik yang tepat sesuai dengan data yang diuji. Jenis uji statistik
sangat tergantung dari:
1).

Jenis variabel yang akan dianalisis

2).

Jenis data apakah dependen atau independen

3).

Jenis distribusi data populasinya apakah mengikuti distribusi normal atau


tidak.
Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan mean akan

berbeda dengan uji statistik untuk mengetahui perbedaan proporsi/persentase. Uji


beda mean menggunakan uji t atau inova, sedangkan uji untuk mengetahui perbedaan
proporsi digunakan uji Kai kuadrat.

27

Menentukan Batas atau Tingkat Kemaknaan (Level og Significance)


Batas/tingkat kemaknaan, sering juga disebut dengan nilai . Penggunaan nilai
alpha tergantung tujuan penelitian yang dilakukan, untuk bidang kesehatan
masyarakat biasanya menggunakan nilai alpha 5%.
Penghitungan Uji Statitik
Penghitungan uji statistik adalah menghitung data sampel ke dalam uji
hipotesis yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara dua
kelompok, maka data hasil pengukuran dimasukkan ke rumus uji t. Dari hasil dengan
nilai populasi untuk mengetahui apakah ada hipotesis ditolak atau gagal menolak
hipotesis.
Keputusan Uji Statistik
Seperti telah disebutkan pada langkah D, bahwa hasil pengujian statistik akan
menghasilkan dua kemungkinan keputusan yaitu menolak hipotesis nol (Ho) dan
gagal menolak hipotesisi nol.
Seiring dengan kemajuan perkembangan komputer maka uji statistik dengan
mudah dan cepat dapat dilakukan dengan program-program statistik yang tersedia di
pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita melakukan uji statistik melalui
program komputer maka yang akan kita cari adalalah nilai p (p value). Dengan nilai p
ini kita dapat menggunakan untuk keputusan uji statistik dengan cara membandingkan
nilai p dengan (alpha). Ketentuan yang berlaku adalah:
a).

Bila nilai p , maka keputusannya adalah Ho ditolak

b).

Bila nilai p > , maka keputusannya adalah Ho gagal ditolak


Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti

kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang
dilakukan adalah two tail maka nilai p dari tabel harus dikalikan 2. dengan demikian
dapat disederhanakan dengan rumus : nilai p two tail = 2 x nilai p one tail.
Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para ahli
statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam
memutuskan uji statistik menggunakan pendekatan ini.

28

Pengertian Nilai P
Nilai p merupakan nilai yang menunjukkan besarnya peluang salah menolak
Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai besarnya peluang
hasil penelitian (misal adanya perbedaan mean atau proporsi) terjadi karena faktor
kebetulan (by chance). Harapan kita nilai p adalah sekecil mungkin, sebab bila nilai pnya kecil maka kita yakin bahwa adanya perbedaan pada hasil penelitian
menunjukkan pula adanya perbedaan di populasi. Dengan kata lain kalau nilai p-nya
kecil maka perbedaan yang ada pada penelitian terjadi bukan karena faktor kebetulan
(by chance).
Contoh:
Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil dengan
berat badan bayi yang dikandungnya. Hasil penelitian melaporkan bahwa rata-rata
berat badan bayi dari ibu hipertensi 200 gram, sedangkan rata-rata berat badan bayi
yang lahir dari ibu yang tidak hipertensi adalah 3000 gram. Perbedaan berat bayi
antara ibu yang hipertensi dengan ibu yang tidak hipertensi sebesar 100 gram.
Pertanyaan yang timbul adalah apakah perbedaan berat badan bayi tersebut juga
berlaku untuk seluruh populasi yang diteliti atau hanya faktor kebetulan saja?. Untuk
menjawab pertanyaan tersebut kemudian dilakukan uji statistik yang tepat yaitu uji t.
Miisalnya dihasilkan nilai p = 0,0110 maka berarti peluang adanya perbedaan berat
bayi sebesar 1000 gram akibat dari faktor kebetulan (by chance) adalah sebesar
0,0110. oleh karena peluangnya sangat kecil (p=0,0110), maka dapat diartikan bahwa
adanya perbedaan tersebut bukan karena faktor kebetulan namun karena memang
karena adanya riwayat hipetensi.
Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat
Variabel I
Katagorik
Katagorik
Numerik

Variabel II

Jenis uji statistik yang

Katagorik

digunakan
- Kai kuadrat

Numerik

- Fisher Exact
- Uji T

Numerik

- ANOVA
- Korelasi
- Regresi

29

ANALISIS BIVARIAT HUBUNGAN


KATAGORIK DENGAN NUMERIK
Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah
parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan tekanan
darah penduduk dewasa orang kota dengan orang desa. Atau, apakah ada perbedaan
berat badan antar sebelum mengikuti program diet dengan sesudahnya. Uji statistik
yang membandingkan mean dua kelompok data ini disebut uji beda dua mean.
Pendekatan ujinya dapat menggunakan pendekatan distribusi Z dan distribusi t ,
sehingga pada uji beda dua mean bisa menggunakan uji Z atau uji t, namun lebih
sering digunakan uji t.
Sebelum kita melakukan uji statistik dua kelompok data, kita perlu
mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok yang
independen atau berasal dari dua kelompok yang dependen/pasangan. Dikatakan
kelompok independen bila data kelompok yang satu tidak tergantung dari kelopok
kedua, misalnya membandingkan mean tekanan darah sistolik orang desa dengan
orang kota. Tekanan darah orang kota independen (tidak tergantung) dengan orang
desa. Dilain pihak, kedua kelompok data dikatakan dependen/pasangan bila kelompok
data yang dibandingkan datanya saling mempunyai ketergantungan, misalnya data
berat badan sebelum dan sesudah mengikuti program diet berasal dari orang yang
sama (data sesudah dependen/tergantung dengan data sebelum).
Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi dalam
dua kelompok, yaitu: uji beda mean independen (uji T independen) dan uji beda mean
dependen (uji T dependen).
1.

Uji beda dua mean independen

Tujuan: untuk mengetahui perbedaan mean dua dua kelompok data independen, syarat
yang harus dipenuhi:
a.

Data berdistribusi normal/simetris.

b.

Kedua kelompok data independen.

30

c.

Variabel yang dihubungkan berbentuk numerik dan katagorik (ket:


variabel katagorik hanya dengan dua kelompok).

Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi kedua
kelompok data. Oleh karena itu dalam pengujian ini diperlukan informasi apakah
varian kedua kelompok yang diuji sama atau tidak. Bentuk varian kedua kelompok
data akan berpengaruh pada nilai standar error yang akhirnya akan membedakan
rumus pengujiannya.
a.

Uji untuk varian sama


Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T. Uji Z
dapat digunakan bila standar deviasi populasi () diketahui dan jumlah sampel
besar (>30). Apabila kedua syarat tersebut tidak terpenuhi maka dilakukan uji .
pada umumnya nilai sulit diketahui, sehingga uji beda dua mean biasanya
menggunakan uji T (T Test). Untuk varian yang sama maka bentuk ujinya sbb:
X1 X2
T=
Sp

(1/n1) + (1/n2)

(n1 - 1)S12 + (n2 - 1) S22


Sp2 =
n1 - n2 - 2

df = n1 n2 - 2
Ket :
n1 atau n2 = jumlah sampel kelompok 1 atau 2
S1 atau S2 = standar deviasi sampel kelompok 1 atau 2
b.

Uji untuk varian berbeda


X1 X2
T=
(S12/n1) + (S22/n2)
[(S12/n1) + (S22/n2)]2
df =
[(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]

31

c.

Uji homogenitas varian


Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data satu
apakah sama dengan kelompok data yang kedua.
S12
F=
S22
df1 = n1-1 dan df2 = n2-1
Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan varian
yang lebih kecil sebagai penyebut.

2.

Uji beda dua mean dependen (Paired sample)

Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang
dependen. Contoh kasus:
o

Apakah ada perbedaan tingkat pengetahuan antara sebelum dan sesudah


dilakukan pelatihan.

Apakah ada perbedaan berat badan antara sebelum dan sesudah mengikuti
program diet.

Syarat :
a.

Distribusi data normal

b.

Kedua kelompok data dependen/pair

c.

Jenis variabel: numerik dan katagorik (dua kelompok)

Formula :
d
T=
S_d /
d

= rata-rata deviasi/selisih sampel 1 dengan sampel 2

S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2

32

KASUS:
UJI t INDEPENDEN DAN UJI t DEPENDEN
1.

Uji t independen

Sebagai contoh kita gunakan data ASI.SAV dengan melakukan uji hubungan
perilaku menyusui dengan kadar Hb (misal digunakan variabel Hb1), apakah ada
perbedaan kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang
menyusuinya tidak eksklusif, caranya:
1.

Aktifkan/bukalah file data ASI.SAV

2.

Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu
Compare Means, lalu pilih Independen-Samples T Test

3.

Pada layar tampak kotak yang di dalamnya ada kotak Test variable (s)I dan
Grouping Variable. Ket: kotak test varibles tempat memasukkan variable
numeriknya, sedangkan kotak grouping variable untuk memasukkan variabel
katagoriknya, ingat jangan sampai terbalik.

4.

Klik hb1 dan msukkan ke kotak Test variable

5.

Klik variabel eksklu dan masukkan ke kotak Grouping Variable.

6.

Klik Define Group, kemudian di layar nampak kotak isian. Anda diminta
mengisi kode variabel menyusui ke dalam kedua kotak. Pada contoh ini, kita
tahu bahwa 0 kode untuk yang tidak eksklusif dan kode 1 untuk Yang eksklusif.
Jadi ketiklah 0 pada Group 1 dan 1 pada Group 2

33

7.

Klik Continue

8.

Klik OK untuk menjalankan prosedur perintahnya, dan hasilnya sbb:

T-Test
Group Statistics
Std. Error
status menyusui asi
kadar hb pengukuran tdk EKSKLUSIVE
pertama

N
24

Mean
10.421

Std. Deviation
1.4712

Mean
.3003

26

10.277

1.3228

.2594

EKSKLUSIVE

Independent Samples Test


Levene's Test
for Equality of
Variances

t-test for Equality of Means

Sig.
F
kadar hb Equal
pengukur variances
an
assumed
pertama
Equal
variances
not
assumed

.072

df

Sig.
(2-taile
d)

Mean
Differen
ce

.790

Std.
Error
Differe
nce

95% Confidence
Interval of the
Difference
Lower

Upper

-.364

48

.717

-.1439

.3951

-.9384

.6505

-.363

46.4

.719

-.1439

.3968

-.9425

.6547

Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan standar
error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar Hb ibu yang
menyusui ekslusif adalah 10,277 gr% dengan standar deviasi 1,322 gr%, sedangkan
untuk ibu yang menyusui non eksklusif, rata-rata kadar Hb-nya adalah 10,421 gr%
dengan standar deviasi 1,471 gr%.

34

Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan dua uji T,
yaitu uji T dengan asumsi varian kedua kelompok sama (equal variances assumed)
dan uji T dengan asumsi varian kedua kelompok tidak sama (equal variances not
assumed). Untuk, memilih uji mana yang kita pakai, dapat dilihat uji kesamaan varian
melalui uji Levene. Lihat nilai p Levene test, nilai p < alpha (0,05) maka varian
berbeda dan bila nilai p > alpha (0,05) maka varian sama (equal). Pada uji Levene di
atas menghasilkan nilai p = 0,790 sehingga dapat disimpulkan bahwa pada alpha 5%,
didapat tidak ada perbedaan varian (varian kedua kelompok sama). Selanjutnya dicari
p value uji t pada bagian varian sama (equal variances) di kolom sig (2 tailed) ,yaitu
sebesar p=0,717 artinya tidak ada perbedaan yang signifikan rata-rata kadar Hb antara
ibu yang menyusui eksklusif dengan ibu yang menyusui non eksklusif.
Penyajian dan Interpretasi di laporan penelitian:
Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy dan
disajikan di laporan penelitian. Pada laporan penelitian kita harus membuat tabel baru
untuk menyajikan hasil print out analisis di atas. Adapun bentuk penyajian dan
interpretasinya adalah sbb:
Tabel
Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th..
Menyusui

Mean

SD

SE

P value

Ya Eksklusif

10,277

1,322

0,259

0,717

26

Tdk Eksklusif

10,421

1,471

0,300

24

Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan standar
deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif rata-rata kadar
Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%. Hasil uji statistik
didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak ada perbedaan yang
signifikan rata-rata kadar Hb antara ibu yang menyusui secara eksklusif dengan non
eksklusif.

2.

Uji T Dependen

35

Uji T dependen seringkali disebut uji T Paired/Related atau pasangan. Uji T


dependen sering digunakan pada analisis data penelitian eksperimen. Seperti sudah
dijelaskan di depan bahwa disebut kedua sampel bersifat dependen kalau kedua
kelompok sampel yang dibandingkan mempunyai subyek yang sama. Dengan kata
lain disebut dependen bila responden diukur dua kali/diteliti dua kali, sering orang
mengatakan penelitian pre dan post. Misalnya kita ingin membandingkan berat badan
antara sebelum dan sesudah mengikuti program diet.
Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara kadar Hb
pengukuran pertama dengan kadar Hb pengukuran kedua, ingin diketahui apakah ada
perbedaan kadar Hb antara pengukuran pertama dengan pengukuran kedua. Disini
terlihat sampelnya dependen karena orangnya sama diukur dua kali. Adapun
langkahnya:
1.

Pastikan anda berada di file ASI.SAV, jika belum aktifkan/bukalah file ini.

2.

Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu
Compare Means, lalu pilih Paired-Samples T Test

3.

Klik hb1

4.

Klik hb2

5.

Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan
36

6.

Klik OK hasilnya tampak sbb:

T-Test
Paired Samples Statistics

Pair

kadar hb pengukuran

pertama
kadar hb pengukuran

Mean

Std. Deviation

10.346

50

1.3835

Std. Error
Mean
.1957

10.860

50

1.0558

.1493

kedua

Paired Samples Correlations


N
Pair

Kadar hb pengukuran pertama

& kadar hb pengukuran kedua

50

Correlation
.707

Sig.
.000

Paired Samples Test

Mean
Pair
1

kadar hb
pengukuran
pertama - kadar
hb pengukuran
kedua

-.5140

Paired Differences
95% Confidence
Interval of the
Std.
Std.
Difference
Deviati
Error
on
Mean Lower Upper

.9821

.1389

-.7931

df
t

-.2349 -3.701

49

Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan standar
deviasi kadar Hb antara pengukuran pertama dan pengukuran kedua. Rata-rata kadar
Hb pada pengukuran pertama (hb1) adalah 10,346 gr% dengan standar deviasi 1,38 gr
%. Pada pengukuran kedua (hb2) didapat rata-rata kadar Hb adalah 10,860 gr%
dengan standar deviasi 1,05 gr%.
Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean perbedaan
antara pengukuran pertama dan kedua adalah 0,514 dengan standar deviasi 0,982.
perbedaan ini diuji dengan uji T berpasangan menghasilkan nilai p yang dapat dilihat
pada kolom Sig (2-tailed). Pada contoh di atas didapatkan nilai p=0,001, maka
37

Sig.
(2taile
d)

.001

dapat disimpulkan ada perbedaan yang signifikan kadar hb antara pengukuran


pertama dengan pengukuran kedua.
Penyajian dan Interpretasi di laporan penelitian:
Dari hasil yang didapat di atas kemudian angka-angka disusun dalam tabel
yang disajikan dalam laporan penelitian. Bentuk penyajian dan interpretasinya sbb:
Tabel
Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan
Kedua di . Th
Variabel
Mean
SD
SE
P value
Kadar Hb
Pengukuran I

10,346

1,38

0,19

Pengukuran II

10,860

1,05

0,14

0,001

N
50

Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan standar
deviasi 1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb adalah 10,860 gr
% dengan standar deviasi 1,05 gr%. Terlihat nilai mean perbedaan antara pengukuran
pertama dan kedua adalah 0,514 dengan standar deviasi 0,982. hasil uji statistik
didapatkan nilai 0,001 maka dapat disimpulkan ada perbedaan yang signifikan antara
kadar Hb pengukuran pertama dan kedua.

38

ANALISIS HUBUNGAN
KATEGORIK DENGAN NUMERIK
UJI ANOVA
Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data baik
yang independen maupun dependen. Namun seringkali kita jumpai jumlah kelompok
yang lebih dari dua, misalnya ingin mengetahui perbedaan mean berat badan bayi
untuk daerah Bekasi, Bogor dan Tangerang. Dalam menganalisis data seperti ini (> 2
kelompok) sangat tidak dianjurkan menggunakan uji T. kelemahan menggunakan uji
T adalah; pertama kita melakukan uji berulang kali sesuai kombinasi yang mungkin,
kedua, bila melakukan uji T berulang kali akan meningkatkan (inflasi) nilai , artinya
akan meningkatkan peluang hasil yang keliru.
Perubahan inflasi sebesar = 1 (1-)n
Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang tepat)
dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau uji F.
Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi dua
sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar kelompok
(between). Bila variasi within dan between sama (nilai perbandingan kedua varian
sama dengan 1) maka mean-mean yang dibandingkan tidak ada perbedaan, sebaliknya
bila hasil perbandingan tersebut menghasilkan lebih dari 1, maka mean yang
dibandingkan menunjuk ada perbedaan.
Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu faktor (one
way) dan analisis faktor (two way). Pada bab ini hanya akan dibahas analisis varian
satu faktor (one way).
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1.

Varian homogen

2.

Sampel/kelompok independen

3.

Data berdistribusi normal

4.

Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk


katagori yang lebih dari 2 kelompok.

39

Perhitungan uji ANOVA


Sb2

df = k-1 untuk pembilang

F=
Sw

n-k untuk penyebut

(n1-1)S12 + (n2-1)S22 + ..+ (nk-1)Sk2


Sw2 =
N-k
n1(X1-X)2 + n2(X2-X)2 + + nk(Xk-X)2
Sb2 =
k-1
n1.X1 + n2.X2 + . + nk.Xk
X=
N
Ket N = jumlah seluruh data (n1 + n2 + .. + nk)
Analisis Multi Comparison (POSTHOC TEST)
Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana saja
yang berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan ada perbedaan
yang bermakna (Ho ditolak). Ada berbagai jenis analisis multiple comparasion
diantaranya adalah Bonferroni, Honestly Significant different (HSD), Scheffe dan
lain-lain. Pada modul ini yang akan dibahas adalah metode Bonferroni.
Perhitungan Bonfrroni adalah sbb:
Xi - Xj
tij =
Sw2[(1/ni) +(1/nj)]
df = n k
Dengan level of significance () sbb:

* =
(k2)

40

Kasus:
UJI ANOVA
Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan berat
badan bayi. Variabel pendidikan merupakan variabel katagorik dengan 4 katagori.
Variabel berat bayi berbentuk numerik sehingga uji yang digunakan ANOVA. Adapun
caranya sbb:
1.

Aktifkan/bukalah file data ASI.SAV

2.

Dari menu utama SPSS, pilih menu Analyze, kemudian pilih sub menu
Compare Means, lalu pilih One-Way ANOVA sesaat akan muncul menu One
Way ANOVA

3.

Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan kotak
Factor perlu diisi variabel. Kotak dependent diisi variabel numerik dan kotak
factor diisi variabel katagoriknya. Pada contoh ini berarti pada kotak Dependen
diisi variabel bbbayi pada kotak Factor diisi variabel Didik.

4.

Klik tombol Options tandai dengan pada kotak Descriptive

5.

Klik Continue

6.

Klik tombol Post Hoc, tandai dengan pada kotak Bonferroni


41

7.

Klik Continue

8.

Klik OK

42

Oneway
Descriptives
berat badan bayi
95% Confidence Interval for
Mean
Lower
Upper Bound
Bound

Mean

Std.
Deviation

Std.
Error

Minim
um

Maxim
um

SD

10

2470.00

249.666

78.951

2291.40

2648.60

2100

2900

SMP

11

2727.27

241.209

72.727

2565.23

2889.32

2100

3000

SMU

16

3431.25

270.108

67.527

3287.32

3575.18

3000

4000

PT

13

3761.54

386.304

107.141

3528.10

3994.98

3000

4100

Total

50

3170.00

584.232

82.623

3003.96

3336.04

2100

4100

Test of Homogeneity of Variances


berat badan bayi
Levene
Statistic
2.506

df1
3

df2
46

Sig.
.071

ANOVA
berat badan bayi
Sum of
Between Groups
Within Groups
Total

Squares
12697038

Mean
df

Square
3 4232345.862

4027962

46

16725000

49

F
48.334

Sig.
.000

87564.400

43

Post Hoc Tests


Multiple Comparisons
Dependent Variable: berat badan bayi
Bonferroni
(I)
pendidika
n formal
ibu

(J)
pendidikan
formal ibu
menyusui

Mean
Difference
(I-J)

SD

SMP
SMU
PT
SD
SMU
PT
SD
SMP
PT
SD
SMP
SMU

-257.273
-961.250*
-1291.538*
257.273
-703.977*
-1034.266*
961.250*
-703.977*
-330.288*
1291.538*
1034.266*
330.288*

SMP
SMU
PT

95% Confidence Interval


Std. Error

129.294
119.286
124.468
129.294
115.902
121.228
119.286
115.902
110.492
124.468
121.228
110.492

Sig.

.315
.000
.000
.315
.000
.000
.000
.000
.027
.000
.000
.027

Lower Bound

Upper Bound

-613.76
-1290.14
-1634.72
-99.21
-1023.54
-1368.51
632.36
384.42
-634.93
948.36
700.02
25.64

99.21
-632.36
-948.36
613.76
-384.42
-700.02
1290.14
1023.54
-25.64
1634.72
1368.51
634.93

*. The mean difference is significant at the .05 level.

Dari print out ini diperoleh rata-rata berat bayi dan standar deviasi masing-masing
kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0
gram dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP ratarata berat bayinya adalah 2727,2 gram dengan standar deviasi 241,2 gram. Pada
mereka yang berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan
standar deviasi 270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat
bayinya adalah 3761,5 gram dengan standar deviasi 386,3 gram.
Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom F dan Sig,
terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi p=0,0005), berarti
pada alpha 5%, dapat disimpulkan ada perbedaan berat bayi diantara keempat jenjang
pendidikan.
Pada Box paling bawah terlihat hasil dari uji Multiple Comparisons Bonferroni yang
berguna untuk menelusuri lebih lanjut kelompok mana saja yang berhubungan
signifikan. Untuk mengetahui kelompok yang signifikan dapat terlihat dari kolom Sig.
Ternyata kelompok signifikan adalah tingkat pendidikan SD dengan SMU, SD dengan
PT, SMP dengan SMU, SMP dengan PT dan SMU dengan PT.
44

Penyajian dan Interpretasi di laporan Penelitian


Tabel
Distribusi Rata-Rata berat Bayi Menurut Tingkat pendidikan
Variabel
Pendidikan

Mean

SD

95% CI

P value
0,0005

- SD

2470,0

249,6

2291,4 2648,6

- SMP

2727,2

241,2

3565,2 2889,3

- SMU

3431,2

270,1

3287,3 3575,1

- PT

3761,5

386,3

3528,1 3994,9

Rata-rata berat bayi pada mereka yang berpendidikan SD adalah 2470,0 gram
dengan standar deviasi 249,6 gram. Pada mereka yang berpendidikan SMP rata-rata
berat bayinya adalah 2727,20 gram dengan standar deviasi 241,2 gram. Pada mereka
yang berpendidikan SMU rata-rata berat bayinya adalah 3431,2 gram dengan standar
deviasi 270,1 gram. Pada mereka yang berpendidikan PT rata-rata berat bayinya
adalah 3761,5 gram dengan standar deviasi 386,3 gram.
Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat disimpulkan ada
perbedaan berat bayi diantara keempat jenjang pendidikan. Analisis lebih lanjut
membuktikan bahwa kelompok yang berbeda signifikan adalah tingkat pendidikan SD
dengan SMU, SD dengan PT, SMP dengan SMU,SMP dengan PT dan SMU dengan
PT.

45

ANALISIS HUBUNGAN
KATAGORIK DENGAN KATAGORIK
UJI KAI KUADRAT
Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat dinyatakan
dalam bentuk angka-angka pengukuran (data numerik). Sebaliknya justru yang kita
jumpai adalah data hasil dari menghitung jumlah pengamatan yang diklasifikasikan
atas beberapa katagori. Data seperti ini disebut data katagorik (kualitatif), misalnya
jenis kelamin yang mempunyai katagori: laki-laki dan perempuan; status merokok
yang mempunyai katagori; perokok berat, perokok ringan dan tidak merokok. Dalam
penelitian kesehatan seringkali peneliti perlu melakukan analisis hubungan variabel
katagorik dengan variabel katagorik. Analisis ii bertujuan untuk menguji perbedaan
proporsi dua atau lebih kelompok sampel. Uji statistik yang digunakan untuk
menjawab kasus tersbut adalah UJI KAI KUADRAT (CHI SQUARE).
Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku menyusui
ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif antara ibu yang
bekerja dengan ibu yang tidak bekerja. Dari contoh terlihat bahwa variabel jenis
pekerjaan (bekerja/tidak bekerja) merupakan variabel katagorik, dan variabel perilaku
menyusui (eksklusif/non eksklusif) juga merupakan variabel katagorik.
Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita
pahami dengan benar apa itu variabel katagorik. Suatu variabel disebut katagorik
bila isi variabel tersebut terbentuk dari hasil klasifikasi/penggolongan, misalnya
variabel sex, jenis pekerjaan, golongan darah, pendidikan. Di lain pihak variabel
numerik (misalnya berat badan, umur dll) dapat masuk/dapat menjadi variabel
katagorik bila variabel tersebut sudah mengalami pengelompokan. Misalkan kita
ambil satu contoh variabel berat badan, berat badan bila nilainyamasih riil (50 kg, 63
kg dst) maka masih termasuk variabel numerik, namun bila sudah dilakukan
pengelompokan menjadi (<50 kg (kurus), 50-60 kg (sedang) dan > 60 (gemuk) maka
variabel tersebut sudah berjenis katagorik.

46

1.

Tujuan Uji kai Kuadrat


Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji

perbedaan proporsi/persentase antara beberapa kelompok data. Dilihat dari segi


datanya uji kai kuadrat dapat digunakan untuk mengetahui hubungan antara variabel
katagorik dengan variabel katagorik. Contoh pertanyaan penelitian untuk kasus yang
dapat dipecahkan oleh uji kai kuadrat misalnya:
a.

Apakah ada perbedaan kejadian hipertensi antara wanita dan pria.


Kasus ii berarti akan menguji hubungan variabel hipertensi (katagori dengan
klasifikasi ya dan tidak) dengan variabel jenis kelamin (katagori dengan
klasisfikasi wanita dan pria)

b.

Apakah ada perbedaan kejadian anemia antara ibu yang kondisi


soseknya tinggi, sedang dan rendah. Pada kasus ini akan menguji hubungan
variabel anemia katagori dengan klasifikasi ya dan tidak) dengan variabel Sosek
(katagori dengan klasifikasi rendah, sedang dan tinggi).

2.

Prinsip dasar Uji Kai Kuadrat


Proses pengujian kai kuadrat adalah membandingkan frekuensi yang terjadi

(observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi observasi


dengan nilai frekuensi harapan sama, maka dikatakan tidak ada perbedaan yang
bermakna (signifikan). Sebaliknya, bila niali frekuensi observasi dan nilai frekuensi
harapan berbeda, maka dikatakan ada perbedaan yang bermakna (signifikan).
Pembuktian dengan uji kai kuadrat dengan menggunakan formula:
(O E)2
X2 =
E

df = (k-1)(n-1)
ket :
O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan dalam
bentuk tabel silang:
47

Variabel 1

Variabel 2

Jumlah

Tinggi
Rendah
Ya
a
b
a+b
Tidak
c
d
c+d
Jumlah
a+c
b+d
n
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan) masingmasing sel dicari dengan rumus:
Total barisnya X total kolomnya
E=
Jumlah keseluruhan data

misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah:


Ea = (a+b) x (a+c)
n
Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama.
Khususnya untuk tabel 2x2, dapat mencari nilai X2 dengan menggunakan rumus:
N (ad-bc)2
2

X =
(a+c)(b+d)(a+b)(c+d)
Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang besar.
Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya digunakan uji kai
kuadrat yang sudah dikoreksi (Yate Corrected atau Yates Correction). Formula kai
kuadrat Yates Correction adalah sbb:
(|O E| - 0,5)2
X2 =
E
Atau
N {|ad-bc|2 (N/2)]2
X2 =
(a+c)(b+d)(a+b)(c+d)

3.

Keterbatasan Kai Kuadrat

48

Seperti kita ketahui, uji kai kuadrat menuntut frekuensi harapan/ekspektasi (E)
dalam masing-masing sel tidak boleh terlampau kecil. Jika frekuensi sangat kecil,
penggunaan uji ini mungkin kurang tepat. Oleh karena itu dalam penggunaan kai
kuadrat harus memperhatikan keterbatasanketerbatasan uji ini. Adapun keterbatasan
uji kai kuadrat adalah sbb:
a.

Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 1.

b.

Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari 5,
lebih dari 20% dari jumlah sel.
Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti harus

menggabungkan katagori-katagori yang berdekatan dalam rangka memperbesar


frekuensi harapan dari sel-sel tersebut (penggabungan ini dapat dilakukan untuk
analisis tabel silang lebih dari 2 x 2, misalnya 3 x 2, 3 x 4 dsb). Penggabungan ini
tentunya diharapkan tidak sampai membuat datanya kehilangan makna.
Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti tidak bisa
menggabung katagori-katagorinya lagi), maka dianjurkan menggunakan uji Fishers
Exact.
ODDS RATIO (OR) dan RISIKO RELATIF (RR)
Hasil uji Chi Square hanya dapat menyimpulkan ada tidaknya perbedaan
proporsi antar kelompok atau dengan kata lain kita hanya dapat menyimpulkan
ada/tidaknya hubungan du variabel katagorik. Dengan demikian uji Chi Square tidak
dapat menjelaskan derajat hubungan, dalam hal ini uji Chi Square tidak dapat
mengetahui kelompok mana yang memiliki risiko lebih besar disbanding kelompok
lain.
Dalam bidang kesehatan untuk mengetahui derajat hubungan, dikenal ukuran
Risiko Relatif (RR) dan Odds Rasio (OR). Risiko relatif membandingkan risiko pada
kelompok terekspose dengan kelompok tidak terekspose. Sedangkan Odds Rasio
membandingkan Odds pada kelompok ter-ekspose dengan Odds kelompok tidak tereksp[ose. Ukuuran RR pada umumnya digunakan pada disain Kohort, sedangkan
ukuran OR biasanya digunakan pada desain kasus kontrol atau ptong lintang (Cross
Sectional).

Pengkodean Variabel :
49

Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus hati hati
jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus ada konsistensi
antara variabel independen dengan variabel dependen. Untuk variabel independen,
kelompok yang berisiko/expose diberi kode tinggi (kode 1) dan kode rendah (kode
0)untuk kelompok yang tidak berisiko/non expose. Pada variabel dependennya,
kode tinggi (kode 1) untuk kelompok kasus atau kelompok yang menjadi fokus
pembahasan penelitian dan kode rendah (kode 0) untuk kelompok non kasus atau
yang bukan menjadi fokus penelitian. Sebagai contoh data di atas pengkodeannya
adalah sbb: Ibu tidak bekerja diberi kode 1 dan bekerja kode 0 dan ibu yang menyusui
secara eksklusif diberi kode 1 dan non eksklusif diberi kode 0. Sebetulnya bisa juga
kodenya dibalik, tapi harus
konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0, tdk
eksklusive =1.
Tabel
Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan
Pendidikan
SD
SMP
SMU
PT
Jumlah

Rendah

Total

Tinggi

N
25

%
50,0

n
25

%
50,0

n
50

%
34,4

16
10

40,0
33,3

24
20

60,0
66,7

40
30

27,6

5
56

20,0
38,7

20
89

80,0
61,3

25
145

17,3
100,0

20,7

Pembuatan persentase pada analisis tabel silang harus diperhatikan agar tidak
salah dalam menginterpretasi. Pada jenis penelitian survei/Cross sectional atau
Kohort, pembuatan persentasenya berdasarkan nilai variabel independen. Contoh di
atas jenis penelitiannya Cross Sectional, variabel pendidikan sebagai variabel
independen dan pengetahuan sebagai variabel dependen. Dapat dilihat di tabel
persentasenya berdasarkan masing-masing kelompok tingkat pendidikan (persentase
baris). Contoh di atas dapat di interpretasikan sbb:
Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%) pasien
mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan SMP, ada
sebanyak 24 (60,0%) yang berpengetahuan tinggi. Dari 30 pasien yang berpendidikan

50

SMU ada sebanyak 20 (66,7%) yang berpengetahuan tinggi. Dan dari 25 pasien yang
berpendidikan PT, ada sebanyak 20 (80,0%) yang berpengetahuan tinggi. Dari data ini
terlihat ada kecenderungan bahwa semakin tinggi tingkat pendidikan akan semakin
tinggi tingkat pengetahuannya.
Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan persentasenya
berdasarkan variabel dependennya, misalkan terlihat pada tabel berikut:
Tabel
Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin
Jenis
Kelamin
Laki-laki
Perempuan
Jumlah

Kanker Paru
Kasus
Kontrol
N
%
n
75
75,0
30

%
30,0

n
105

%
52,5

25
100

70,0
50,0

95
200

47,5
100,0

25,0
50,0

70
100

Total

Interpretasinya:
Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden berjenis
kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita kanker paru, ada
sebanyak (30%) responden yang berjenis kelamin laki-laki.

51

KASUS :
UJI KAI KUADRAT
Suatu penelitian ingin mengetahui hubngan pekerjaan dengan perilaku menyusui.
Variabel pekerjaan berisi dua nilai yaitu tidak bekerja dan bekerja, dan variabel
menyusui berisi dua nilai yaitu eksklusif dan non eksklusif. Untuk mengerjakan soal
ini gunakan data Susu. SAV.
Adapun prosedur di SPSS sbb:
1.

Pastikan anda berada pada data editor ASI.SAV

2.

Dari menu SPSS, klik Analyze, kemudian pilih Descriptive statistic, lalu
pilih Crosstab, sesaat akan muncul menu Crosstabs

3.

Dari menu crosstab, ada dua kotak yang harus diisi, pada kotak Row(s) diisi
variabel independen (variabel bebas), dalam contoh ini variabel pekerjaan masuk
ke kotak Row(s).

4.

pada kotak Column(s) diisi variabel dependennya, dalam contoh ini variabel
perilaku menyusui masuk ke kotak Column(s).

5.

Klik option Statistics.., klik pilihan Chi Square dan klik pilihan Risk

52

6.

Klik Continue

7.

Klik option Cells, bawa bagian Percentages dan klik Row

8.

Klik Continue

9.

Klik OK hasilnya tampak sbb:

53

Crosstabs
status pekerjaan ibu * status menyusui asi Crosstabulation
status menyusui asi
Total
status pekerjaan
ibu

KERJA

tidak kerja

Total

Count
%
within
status
pekerjaan
ibu
Count
%
within
status
pekerjaan
ibu
Count
%
within
status
pekerjaan
ibu

tdk
EKSKLUSIVE
17

EKSKLUSIVE
8

25

68.0%

32.0%

100.0%

18

25

28.0%

72.0%

100.0%

24

26

50

48.0%

52.0%

100.0%

Chi-Square Tests
Value
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases

df

8.013b
6.490
8.244
7.853

1
1
1
1

Asymp. Sig.
(2-sided)
.005
.011
.004

Exact Sig.
(2-sided)

Exact Sig.
(1-sided)

.010

.005

.005

50

a.

Computed only for a 2x2 table

b.

0 cells (.0%) have expected count less than 5. The minimum expected count is
12. 00.

54

Risk Estimate
95% Confidence
Interval
Lower
Upper

Value
Odds Ratio for status
pekerjaan ibu (TIDAK
KERJA / KERJA)
For cohort status
menyusui asi = YA
EKSKLUSIVE
For cohort status
menyusui asi =
TIDAK EKSKLUS
N of Valid Cases

5.464

1.627

18.357

2.250

1.209

4.189

.412

.208

.816

50

Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola
menyusui, dengan angka di masing-masing selnya. Angka yang paling atas adalah
jumlah kasus masing-masing sel, angka kedua adalah persentase menurut baris (data
yang kita analisis ASI.SAV, berasal dari penelitian Cross Sectional sehingga persen
yang ditampilkan adalah persentase baris, namun bila jenis penelitiannya Case
Control angka persentase yang digunakan adalah persentase kolom.
Dari analisis data di atas maka interpretasinya:
Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara
eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang menyusui secara
eksklusif. Hasil uji Chi Square dapat dilihat pada kotak Chi Square Test. Dari print
out muncul dengan beberapa bentuk/angka sehingga menimbulkan pertanyaan,
Angka yang mana yang kita pakai?, apakah Pearson, Continuity Correction,
Likelihood atau Fisher?
Aturan yang berlaku pada Chi Square adalah sbb:
a.

Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka yang
digunakan adalah Fishers Exact Test

b.

Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai sebaiknya
Continuity Correction (a)

c.

Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka digunakan uji


Pearson Chi Square

d.

Uji Likelihood Ratio dan Linear-by-Linear Assciation, biasanya


digunakan untuk keperluan lebih spesifik, misalnya analisis stratifikasi pada

55

bidang epidemiologi dan juga untuk mengetahui hubungan linier dua variable
katagorik, sehingga kedua jenis ini jarang digunakan.
Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b dibawah
kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti pada tabel
silang diatas tidak ditemukan ada nilai E < 5
Dengan demikian kita menggunakan uji Chi Square yang sudah dilakukan
koreksi (Continuity Correction) dengan p value dapat dilihat pada kolom Asymp.
Sig dan terlihat p valuenya = 0,011. berarti kesimpulannya ada perbedaan perilaku
menyusui eksklusif antara ibu yang bekerja dengan ibu yang tidak bekerja. Dengan
kata lain dapat disimpulkan bahwa ada hubungan status pekerjaan dengan perilaku
menyusui eksklusif.
Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya
hubungan dua variabel,

sehingga uji ini tidak

dapat untuk mengetahui

derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan hubungan


banyak metodenya tergantung latar belakangdisiplin keilmuannya, misal untuk ilmu
sosial dengan melihat koefisien Phi, koefisien Contingency dan cramers V.
sedangkan untuk bidang kesehatan terutama kesehatan masyarakat digunakan nilai
OR atau RR. Nilai OR digunakan untuk jenis penelitian Cross Sectional dan Case
Control, sedangkan nilai RR digunakan bila jenis penelitiannya Kohort.
Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464 (95% CI:
1,627 18,357). Sedangkan nilai RR terlihat dari baris For Cohort yaitu bearnya
2,250 (95% CI: 1,209 4,189). Pada data ini berasal dari penelitian Cross Sectional
maka kita dapat menginterpretasikan nialai OR=5,464 sbb: Ibu yang tidak bekerja
mempunyai peluang 5,46 kali untuk menyusui eksklusif dibandingkan ibu yang
bekerja.. Pada perintah Crosstab nilai OR akan keluar bila tabel silang 2 x 2, bila tabel
silang lebih dari 2 x 2, misalnya 3 x 2, 4 x 2 dsb, maka nilai OR dapat diperoleh
dengan analisis regresi logistik sederhana dengan cara membuat Dummy variable

56

Penyajian dan Interpretasi di Laporan Penelitian:


Tabel
Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui
Jenis
Pekerjaan

Menyusui
Tdk Eksklusif
Eksklusif

Total

Bekerja

n
17

%
68,0

n
8

%
32,0

n
25

%
100

Tdk Bekerja
Jumlah

7
26

28,0
52,0

18
24

72,0
48,0

25
50

100
100

OR

(95% CI)

value

5,464

0,011

1,6 18,3

Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui eksklusif
diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui bayi secara
eksklusif. Sedangkan diantara ibu yang tidak bekerja, ada 18 (72,0%) yang menyusui
secara eksklusif. Hasil uji statistik diperoleh nilai p=0,011 maka dapat disimpulkan
ada perbedaan proporsi kejadian menyusui eksklusif antara ibu tidak bekerja dengan
ibu yang bekerja (ada hubungan yang signifikan antara pekerjaan dengan perilaku
menyusui). Dari hasil analisis diperoleh pula nilai OR=5,464, artinya ibu tidak
bekerja mempunyai peluang 5,46 kali untuk menyusui eksklusif dibanding ibu yang
bekerja.

57

ANALISIS HUBUNGAN
NUMERIK DENGAN NUMERIK
UJI KORELASI DAN REGRESI LINIER SEDERHANA
Seringkali dalam suatu penelitian kita ingin mengetahui hubungan antara dua
variabel yang berjenis numerik, misalnya huubungan berat badan dengan tekanan
darah, hubungan umur dengan kadar Hb, dsb. Hubungan antara dua variabel numerik
dapat dihasilkan dua jenis, yaitu derajat/keeratan hubungan, digunakan korelasi.
Sedangkan bila ingin mengetahui bentuk hubungan antara dua variabel digunakan
analisis regresi linier.
1.

Korelasi
Korelasi di samping dapat untuk mengetahui derajat/keeratan hubungan,

korelasi dapat juga untuk mengetahui arah hubungan dua variabel numerik. Misalnya,
apakah huubungan berat badan dan tekanan darah mempunyai derajat yang kuat atau
lemah, dan juga apakah kedua variabel tersebut berpola positif atau negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat dilihat dari
diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik yang menunjukkan
titik-titik perpotongan nilai data dari dua variabel (X dan Y). Pada umumnya dalam
grafik, variabel independen (X) diletakkan pada garis horizontal sedangkan variabel
dependen (Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan antara
dua variabel X dan Y. selain memberi informasi pola hubungan dari kedua variabel
diagram tebar juga dapat menggambarkan keeratan hubungan dari kedua variabel
tersebut.

58

disimbolkan dengan r (huruf r kecil).


Koefisien korelasi (r) dapat diperoleh dari formula berikut:
N ( XY) (X Y)
r=
[NX2 (X)2] [NY (Y)2

Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya antara 1
s.d. +1.
r = 0 tidak ada hubungan linier
r = -1 hubungan linier negatif sempurna
r = +1 hubungan linier positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif. Hubungan
positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain, misalnya
semakin bertambah berat badannya (semakin gemuk) semakin tinggi tekanan
darahnya. Sedangkan hubungan negatif dapat terjadi bila kenaikan satu variabel
diikuti penurunan variabel yang lain, misalnya semakin bertambah umur (semakin
tua) semakin rendah kadar Hb-nya.
Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat dibagi dalam
4 area, yaitu:
r = 0,00 0,25 tidak ada hubungan/hubungan lemah
r = 0,00 0,25 hubungan sedang
r = 0,00 0,25 hubungan kuat
r = 0,00 0,25 hubungan sangat kuat / sempurna

59

Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama untuk
menjelaskan derajat hubungan derajat hubungan linier anatara dua variabel.
Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah hubungan antara
dua variabelteradi secara signifikan atau hanya karena faktor kebetulan dari random
sample (by chance). Uji hipotesis dapat dilakukan dengan dua cara, yaitu pertama:
membandingkan nilai r hitung dengan r tabel, kedua: menggunakan pengujian dengan
pendekatan distribusi t. Pada modul ini kita gunakan pendekatan distribusi t, dengan
formula:
n2
t=r
df = n 2

1 r2

n = jumlah sampel
2.

Regresi Linier Sederhana


Seperti sudah diuraikan di depan bahwa analisis hubungan dua variabel dapat

digunakan untuk mengetahui bentuk hubungan dua variabel, yaitu dengan analisis
regresi.
Analisis regresi merupakan suatu model matematis yang dapat digunakan
untuk mengetahui bentuk hubungan antar dua atau lebih variabel. Tujuan analisis
regresi adalah untuk membuat perkiraan (prediksi) nilai suatu variabel (variabel
dependen) melalui variabel yang lain (variabel independen).
Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat badan
dan tekanan darah. Dalam kasus ini berarti berat badan sebagai variabel independen
dan tekanan darah sebagai variabel dependen, sehingga dengan regresi kita dapat
memperkirakan besarnya nilai tekanan darah bila diketahui data berat badan.
Untuk melakukan prediksi digunakan persamaan garis yang dapat diperoleh
dengan berbagai cara/metode. Salah satu cara yang sering digunakan oleh peneliti
adalah dengan menggunakan metode kuadrat terkecil (least square). Metode least
square merupakan suatu metode pembuatan garis regresi dengan cara meminimalkan
jumlah kuadrat jarak antara nilai Y yang teramati dan Y yang diramalkan oleh garis
regresi itu. Secara matematis persamaan garis sbb:
Y = a + bx

60

Persamaan di atas merupakan model deterministik yang secara sempurna/tepat dapat


digunakan hanya untuk peristiwa alam, misalnya hukum gravitasi bumi, yang
ditemukan oleh Issac Newton adalah contoh model deterministik. Variabel kecepatan
benda jatuh (variabel dependen) pada keadaan yang ideal adalah fungsi matematik
sempurna (bebas dari kesalahan) dari variabel independen berat beda dan gaya
gravitasi.
Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius dapat
dibuat persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat
dihitung/diprediksi secara sempurna/tepat (bebas kesalahan) bila suhu celsius (X)
diketahui.
Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada
kemungkinan kesalahan/penyimpangan (tidak eksak), aretinya untuk beberapa nilai X
yang sama kemungkinan diperoleh nilai Y yang berbeda. Misalnya hubungan berat
badan dengan tekanan darah, tidak setiap orang yang berat badannya sama memiliki
tekanan darah yang sama. Oleh karena hubungan X
Y = a + bx + e
dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka persamaan garis
yang dibentuk menjadi:
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel X
berubah satu unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati
dengan nilai Y yang sesungguhnya pada titik X tertentu
XY (XY)/n
a = Y - bX

b=
2

X (X) /n

61

Kesalahan Standar Estimasi (Standard Error of Estimate/Se)


Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan persamaan estimasi
untuk menjelaskan nilai variabel dependen yang sesungguhnya. Semakin kecil nilai
Se, makin tinggi ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan
niali variabel dependen yang sesungguhnya. Dansebaliknya, semakin besar nilai Se,
makin rendah ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai
variabel dependen yang sesungguhnya. Untuk mengetahhui besarnya Se dapat
dihitung melalui formula sbb:
Se =

Y2 - aY - bXY
n-2

Koefisien Determinasi (R2)


Ukuran yang penting dan sering digunakan dalam analisisregresi adalah koefisien
determinasi atau disimbolkan R2 (R Square). Koefisien determinasi dapat dihitung
dengan mengkuadratkan nilai r, atau dengan formula R2 = r2. Koeifisien determinasi
berguna untuk mengetahui seberapa besar variasi variabel dependen (Y) dapat
dijelaskan oleh variabel independen (X). atau dengan kata lain R2 menunjukkan
seberapa jauh variabel independen dapat memprediksi variabel dependen.Semakin
besar nilai R square semakin baik/semakin tepat variabel independen memprediksi
variabel dependen. Besarnya nilai R square antara 0 s.d. 1 atau antara 0% s.d. 100%.

62

KASUS :
KORELASI DAN REGRESI
Sebagai contoh kita akan melakukan analisis korelasi dan regresi
menggunakan data ASI.SAV dengan mengambil variabel yang bersifat numerik
yaitu umur dengan kadar Hb (diambil Hb pengukuran pertama: Hb1).
A.

Korelasi

Untuk mengeluarkan uji korelasi langkahnya adalah sbb:


1.

Aktifkan data ASI.SAV

2.

Dari menu utama SPSS, klik Analyze, kemudian pilih Correlate,


dan lalu pilih Bivariate, dan muncullah menu Bivariate Correlations:

3.

Sorot variabel Umur dan Hb1, lalu masukkan ke kotak sebelah kanan
variables.

4.

Klik OK dan terlihat hasilnya sbb:

Correlations
Correlations
berat
badan ibu
berat badan ibu
berat badan bayi

Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N

1
50
.684**
.000
50

berat
badan bayi
.684**
.000
50
1
50
63

**. Correlation is significant at the 0.01 level (2-tailed).


Tampilan analisis korelasi berupa matrik antar variabel yang di korelasi,
informasi yang muncul terdapat tiga baris, baris pertama berisi nilai korelasi (r), baris
kedua menapilkan nilai p (P value), dan baris ketiga menampilkan N (jumlah data).
Pada hasil di atas diperoleh nilai r = 0,684 dan nilai p = 0,0005. Kesimpulan dari hasil
tersebut: hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan
yang kuat dan berpola positif artinya semakin bertambah berat badannya semakin
tinggi berat bayinya. Hasil uji statistik didapatkan ada hubungan yang signifikan
antara berat badan ibu dengan berat badan bayi (p = 0,0005).
B.

Regresi Linier Sederhana


Berikut akan dilakukan analisis regresi linier dengan menggunakan variabel

berat badan ibu dan berat badan bayi dari data ASI.SAV. dalam analisis regresi kita
harus menentukan variabel dependen dan variabel independennya. Dalam kasus ini
berarti berat badan ibu sebagai variabel independen dan berat badan bayi sebagai
variabel dependen. Adapun caranya:
1.

Pastikan tampilan berada pada data editor ASI.SAV, jika belum aktifkan data
tersebut.

2.

Dari menu SPSS, Klik Analysis, pilih Regression, pilih Linear

3.

Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak
Dependen isikan variabel yang kita perlakukan sebagai dependen (dalam contoh
ini berarti berat badan bayi) dan pada kotak Independent isikan variabel
independennya (dalam contoh ini berarti berat badan ibu), caranya

4.

klik berat badan bayi, masukkan ke kotak Dependent

5.

Klik berat badan ibu, masukkan ke kotak Independent

64

6.

Klik OK, dan hasilnya sbb:

Regression
Model Summary
Model

R Square

Adjusted
R Square
1
.684a
.468
.456
a. Predictors: (Constant), berat badan ibu

Std. Error of
the Estimate
430.715

ANOVAb
Model
1

Sum of
Regression
Residual

df

Mean

Squares
7820262
8904738

Square
1 7820261.965

F
42.154

Sig.
.000a

48 185515.376

a.

Total
16725000
49
Predictors: (Constant), berat badan ibu

b.

Dependent Variable: berat badan bayi

Coefficientsa
65

Unstandardized
Coefficients
Model
B
Std. Error
1
(Constant)
657.929
391.676
berat badan ibu
44.383
6.836
a. Dependent Variable: berat badan bayi

Standardized
Coefficients
Beta
.684

Sig.

1.680
6.493

.099
.000

Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang penting
dalam regresi linier diantaranya: koefisien determinasi, persamaan garis dan p value.
Nilai koefisien determinasi dapat dilihat dari nilai R Square (anda dapat lihat pada
tabel Model Summary) yaitu besarnya 0,468 artinya, persamaan garis regresi yang
kita peroleh dapat menerangkan 46,8% variasi berat badan bayi atau persamaan garis
yang diperoleh cukup baik untuk menjelaskan variabel berat badan bayi. Selanjutnya
pada tabel ANOVAb, diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada
alpha 5% kita dapat menyimpulkan bahwa regresi sederhana cocok (fit) dengan data
yang ada persamaan garis regresi dapat dilihat pada tabel Coefficient a yaitu pada
kolom B. Dari hasil diatas didapat nilai konstant (nilai ini merupakan nilai intercept
atau nilai a) sebesar 657,93 dan nilai b = 44,38, sehingga persamaan regresinya:

Y = a + bX
Berat badan bayi = 657,93 + 44,38(berat badan ibu)
Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita tahu nilai
berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat pada kolom Sig
T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita menolak hipotesis nol,
berarti ada hubngan linier antara berat badan ibu dengan berat badan bayi. Dari nilai
b=44,38 berarti bahwa variabel berat badan bayi akan bertambah sebesar 44,38 gr bila
berat badan ibu bertambah setiap satu kilogram.

Penyajian dan Interpretasi


Tabel
Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi
Variabel
Umur

R
0,684

R2
0,468

Persamaan garis
bbayi =657,93 + 44,38

P value
*bbibu 0,0005

66

Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan kuat
(r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu semakin
besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468 artinya,
persamaan garis regresi yang kita peroleh dapat menerangkan 46,8,6% variasi berat
badan bayi atau persamaan garis yang diperoleh cukup baik untuk menjelaskan
variabel berat badan bayi. Hasil uji statistik didapatkan ada hubungan yang signifikan
antara berat badan ibu dengan berat badan bayi (p=0,005).

Memprediksi variabel Dependen


Dari persamaan garis yang didapat tersebut kita dapat memprediksi variabel dependen
(berat badan bayi) dengan variabel independen (berat badan ibu). Misalkan kita ingin
mengetahui berat badan bayi jika diketahui berat badan ibu sebesar 60 kg, maka:
Berat badan bayi =657,93 + 44,38(berat badan ibu)
Berat badan bayi= 657,93 + 44,38(60)
Berat badan bayi = 3320,73
Ingat prediksi regresi tidak dapat menghasilkan angka yang tepat seperti diatas,
namun perkiraannya tergantung dari nilai Std, Error of The estimate(SEE) yang
besarnya adalah 430,715 (lihat di kotak Model Summary). Dengan demikian variasi
variabel dependen = Z*SEE. Nilai Z dihitung dari tabel Z dengan tingkat kepercyaan
95% dan didapat nilai Z = 1,96, sehingga variasinya 1,96 * 430,715 = 844,201
Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg diprediksikan
berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr
C.

Membuat Grafik Prediksi

Langkahnya:
1.

Klik Graphs, pilih Scatter

2.

Klik Sampel klik Define

3.

Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel


dependennya (masukkan Hb1)

4.

Pada kotak X Axis isikan variabel independennya (masukkan veriabel


dependennya (masukkan Umur)

5.

Klik OK

6.

Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?)

67

7.

Untuk mengeluarkan garisnya, klik grafiknya 2 kali

8.

klikChart

9.

pada kotak Fit Line, Klik Total

10. klik OK maka muncul garis regresi

68

Anda mungkin juga menyukai