Anda di halaman 1dari 70

MODUL

ANALISA DATA

PROGRAM STUDI PASCA SARJANA S2 KEPERAWATAN


FAKULTAS KEPERAWATAN
UNIVERSITAS ANDALAS

Untuk dipakai di lingkungan sendiri 1


PENGANTAR ANALISIS DATA

1. Pendahuluan
Setelah kita selesai melakukan pengolahan data, maka langkah
selanjutnya adalah menganalisis data. Data mentah (raw data) yang sudah
susah payah kita kumpulkan tidak akan ada artinya jika tidak dianalisis.
Analisis data merupakan kegiatan yang sangat penting dalam suatu
penelitian, karena dengan analisislah data dapat mempunyai arti/makna yang
dapat berguna untuk memecahkan masalah penelitian.
Analisis mempunyai posisi strategis dalam suatu penelitian. Namun
perlu dimengerti bahwa dengan melakukan analisis tidak dengan sendirinya
dapat langsung memberi jawaban penelitian, untuk itu perlu diketahui
bagaimana menginterpretasi hasil penelitian tersebut. Menginterpretasi berarti
kita menjelaskan hasil analisis guna memperoleh makna/arti.
Interpretasi mempunyai dua bentuk, yaitu arti sempit dan arti luas.
Interpretasi dalam arti sempit (deskriptif) yaitu interpretasi data dilakukan
hanya sebatas pada masalah penelitian yang diteliti berdasarkan data yang
dikumpulkan dan diolah untuk keperluan penelitian tersebut. Sedangkan
interpretasi dalam arti luas (analitik) yaitu interpretasi guna mencari makna
data hasil penelitian dengan jalan tidak hanya menjelaskan/menganalisis data
hasil penelitian tersebut, tetapi juga melakukan inferensi (generalisasi) dari
data yang diperoleh dengan teori-teori yang relevan dengan hasil-hasil
penelitian tersebut.
Pada umumnya analisis data bertujuan untuk:
a. Memperoleh gambaran/deskripsi masing-masing variabel
b. Membandingkan dan menguji teori atau konsep dengan informasi yang
ditemukan
c. Menemukan adanya konsepbaru dari data yang dikumpulkan
d. Mencari penjelasan apakah konsep baru yang diuji berlaku umum atau
hanya berlaku pada kondisi tertentu
Seberapa jauh analisis suatu penelitian akan dilakukan tergantung dari:
a. Jenis penelitian
b. Jenis sampel

Untuk dipakai di lingkungan sendiri 2


c. Jenis data/variabel
d. Asumsi kenormalan distribusi data

a. Jenis Penelitian
Jika ingin mengeahui bagaimana pada umumnya (secara rata-rata)
pendapat masyarakat akan suatu hal tertentu, maka pengumpulan data
dilakukan dengan survei. Dari kasus ini maka dapat dilakukan analisis data
dengan pendekatan kuantitatif. Namun bila kita menginginkan untuk
mendapatkan pendapat/gambaran yang mendalam tentang suatu fenomena,
maka data dapat dikumpulkan dengan fokus grup diskusi atau observasi,
maka analisisnya menggunakan pendekatan analisis kualitatif.
b. Jenis Sampel
Analisis sangat tergantung pada jenis sampel yang dibandingkan,
apakah kedua sampel independen atau dependen. Misalnya pada penelitian
survei yang tidak menggunakan sampel yang sama, dapat digunakan uji
statistik yang mengasumsikan sampel yang independen. Misalkan survei
untuk mengetahui apakah ada perbedaan berat badan bayi antara bayi-bayi
yang dilahirkan dari ibu perokok dengan bayi-bayi dari ibu yang tidak
merokok. Disini berarti kelompok ibu perokok dan kelompok ibu bukan
perokok bersifat independen.
Sedangkan untuk penelitian eksperimen yang sifatnya pre dan post
(sebelum dan sesudah adanya perlakuan tertentu dilakukan pengukuran)
maka uji yang digunakan adalah uji statistik untuk data yang dependen.
Misalnya, suatu penelitian ingin mengetahui pengaruh penelitian manajemen
terhadap kinerja petugas kesehatan. Pertanyaan penelitiannya “Apakah ada
perbedaan kinerja petugas kesehatan antara sebelum dan sesudah
mendapatkan pelatihan manajemen?”. Dalam penelitian ini sampel kelompok
petugas kesehatan bersifat dependen, karena pada kelompok (orang) yang
sama diukur dua kali yaitu pada saat sebelum pelatihan (pre test) dan
sesudah dilakukan pelatihan (Post Test).
c. Jenis Data/Variabel
Data denganjenis katagori berbeda cara analisisnya dengan data jenis
numerik. Beberapa pengukuran/uji statistik hanya cocok untuk jenis data
tertentu. Sebagai contoh, nilai proporsi/persentase (pada analisis univariat)

Untuk dipakai di lingkungan sendiri 3


biasanya cocok untuk menjelaskan data berjenis katagorik, sedangkan untuk
data jenis numerik biasanya dapat menggunakan nilai rata-rata untuk
menjelaskan karakteristiknya. Untuk analisis hubungan dua variabel (analsis
bivariat), uji kai kuadrat hanya dapat dipakai untuk mengetahui hubungan
data katagori dengan data katagori. Sebaliknya untuk mengetahui hubungan
numerik dengan numerik digunakan uji korelasi/regresi.
d. Asumsi Kenormalan
Jenis analisis yang akan dilakukan sangat tergantung dari bentuk
distribusi datanya. Bila distribusi datanya tidak normal, maka sebaiknya
digunakan prosedur uji statitik nonparametrik. Sedangkan bila asumsi
kenormalan dapat dipenuhi maka dapat digunakan uji statistik parametrik.
Berikut ini akan dijelaskan langkah-langkah analisis (pendekatan
kuantitatif):
1. Analisis Deskriptif (Univariat)
Tujuan dari analisis ini adalah untuk menjelaskan/mendiskripsikan
karakteristik masing-masing variabel yang diteliti. Bentuknya tergantung
dari jenis datanya. Untuk data numerik digunakan nilai mean (rata-rata),
median, standard deviasi dan inter kuartil range, minimal maksimal.
2. Analisis Analitik (Bivariat)
Setelah diketahui karakteristik masing-masing variabel dapat diteruskan
analisis lebih lanjut. Apabila diinginkan analisis hubungan antar dua
variabel, maka analisis dilanjutkan pada tingkat bivariat. Misalnya ingin
diketahui hubungan antara berat badan dengan tekanan darah. Untuk
mengetahui hubungan dua variabel tersebut biasanya digunakan
pengujian statistik. Jenis uji statistik yang digunakan sangat tergantung
jenis data/variabel yang dihubungkan.
3. Analisis Multivariat
Merupakan analisis yang menghubungkan antara beberapa variabel
independen dengan satu variabel dependen.

Secara lebih khusus/detail analisis univariat, bivariat dan multivariat


akan dipelajari pada bab tersendiri.

Untuk dipakai di lingkungan sendiri 4


ANALISIS UNIVARIAT
( DESKTIPTIF)

Tujuan dari analisis ini adalah untuk menjelaskan/mendeskriptifkan


karakteristik masing-masing variabel yang diteliti. Dalam analisis data
kuantitatif kita dihadapkan pada kumpulan data yang besar/banyak yang
belum jelas maknanya. Fungsi analisis sebetulnya adalah menyederhanakan
atau meringkas kumpulan data hasil pengukuran sedemikian rupa sehingga
kumpulan data tersebut berubah menjadi informasi yang berguna.
Peringkasan tersebut berupa ukuran-ukuran statistik, tabel dan juga grafik.
Secara teknis pada dasarnya analisis merupakan kegiatan meringkas
kumpulan data menjadi ukuran tengah dan ukuran variasi. Selanjutnya
membandingkan gambaran-gambaran tersebut antara satu kelompok subyek
dan kelompok subyek lain, sesuai dengan tujuan yang ingin dicapai dalam
analisis.
Berbicara peringkasan data (yang berwujud ukuran tengah dan ukuran
variasi) jenis data (apakah numerik atau katagorik) akan sangat menentukan
bentuk peringkasan datanya. Berikut akan diuraikan bentuk/cara peringkasan
data untuk data numerik dan data katagorik.

1. Peringkasan Data Untuk Data Jenis Numerik


a. Ukuran Tengah
Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil
pengukuran. Berbagai ukuran dikembangkan utnuk mencerminkan ukuran
tengah tersebut, dan yang paling sering dipakai adalah mean, median dan
mode/modus.
1). Mean
Mean/average adalah ukuran rata-rata yang merupakan hasil dari jumlah
semua nilai pengukuran dibagioleh banyaknya pengukuran. Secara
sederhana perhitungan nilai mean dapat dituliskan dengan rumus :

X = Σ Xi / n

Untuk dipakai di lingkungan sendiri 5


Keuntungan nilai mean adalah mudah menghitungnyadan sudah
melibatkan seluruh data dalam penghitungannya. Namun kelemahan dari
nilai mean adalah sangat dipengaruhi oleh nilai ekstrim, baik ekstrim tinggi
maupun rendah. Oleh karena itu pada kelompok data yang ada nilai
ekstrimnya (sering dikenal dengan ‘distribusi data yang menceng/miring’),
Mean tidak dapat mewakili rata-rata kumpulan nilai pengamatan. Sebagai
contoh data yang ada nilai ekstrimnya adalah data penghasilan. Apabila
mean pendapatan perbulan adalah Rp 10.000.000,- , sebenarnya
sebagian besar orang pendapatannya di bawah Rp 10.000.000,- . Mean
sebesar Rp 10.000.000,- diperoleh karena tarikan sekelompok kecil orang
(misalnya konglomerat) yang pendapatannya sangat tinggi. Dengan
demikian penggunaan mean untuk data yang ada nilai ekstrimnya (data
yang distribusinya menceng) kurang tepat.
Contoh; ada 5 pasien diukur lama hari rawatnya : 1 hr, 3 hr, 4 hr, 2 hr, 90
hr.
Mean = (1+3+4+2+90)/5 = 20 hr.
Dari hasil penghitungan didapatkan rata-rata lama hari rawat 20 hari, hasil
ini tentunya tidak dapat mewakili karena secara visual datanya sebagian
besar kurang dari 5 hari. Keadaan ini bisa terjadi karena kumpulan data di
atas ada nilai ekstrimnya.

2). Median
Median adalah nilai dimana setengah banyaknya pengamatan mempunyai
nilai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya.
Berbeda dengan nilai mean, penghitungan median hanya
mempertimbangkan urutan nilai dasil pengukuran, besar beda antar nilai
di abaikan. Karena mengabaikan besar beda, maka median tidak
dipengaruhi oleh nilai ekstrim.
Prosedur penghitungan median melalui langkah
a). Data diurutkan/di-array dari nilai kecil ke besar
b). Hitung posisi median dengan rumus (n+1)/2
c). Hitung nilai mediannya
Contoh ada usia 6 mahasiswa 20 th, 26 th, 24 th, 30 th, 40 th, 36 th
Data diurutkan: 20, 24, 26, 30, 36, 40

Untuk dipakai di lingkungan sendiri 6


Posisi = (6+1)/2 = 3,5
Mediannya adalah data yang urutannya ke 3,5 yaitu (26 + 30)/2 = 28
Jadi 50% mahasiswa berumur dibawah 28 tahun dan 50% mahasiswa
berumur di atas 28 tahun
3). Mode/Modus
Mode adalah nilai pengamatan yang mempunyai frekuensi/jumlah
terbanyak.
Contoh mode data umur mahasiswa: 18 th, 22 th, 21 th, 20 th, 23th, 20 th.
Dari data tersebut berarti mode-nya adalah 20 tahun

Bentuk Distribusi Data


Hubungan nilai mean, median dan mode akan menentukan bentuk distribusi
data:
- Bila nilai mean, median dan mode sama, maka
bentuk distribusi datanya normal
- Bila nilai mean > median > mode, maka bentuk
distribusi datanya menceng/miring ke kanan
- Bila nilai mean < median < mode, maka bentuk
distribusi datanya menceng/miring ke kiri

b. Ukuran Variasi
Nilai-nilai hasil pengamatan akan cenderung saling berbeda satu sama
lain atau dengan kata lain hasil pengamatan akan bervariasi. Untuk
mengetahui seberapa jauh data bervariasi digunakan ukuran variasi antara
lain range, jarak linier kuartil dan standard deviasi.
1). Range
Range merupakan ukuran variasi yang paling dasar, dihitung dari selisih
nilai terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi
nilai ekstrim. Keuntungan penghitungan dapat dilakukan dengan cepat.
2). Jarak Inter Quartil
Nilai observasi disusun berurutan dari nilai ke cil ke besar, kemudian
ditentukan kuartil bawah dan atas. Kuartil merupakan pembagian data
menjadi 4 bagian yang dibatasi oleh tiga ukuran kuartil, yaitu kuartil I,
kuartil II dan kuartil III.

Untuk dipakai di lingkungan sendiri 7


Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di
atasnya.
Kuartil II (median) mencakup 50% data berada di bawahnya dan 50% data
berada di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada
di atasnya.
Jarak inter kuartil adalah selisih anatar kuaril III dan kuaril I. Ukuran ini
lebih baik dari range, terutama kalau frekuensi pengamatan banyak dan
distribusi sangat menyebar.
3). Standard Deviasi
Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai
pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat
deviasi terhadap mean disebut varian, yang rumusnya;

Varian = Σ(Xi – X)2


n

Semakin besar nilai varian akan semakin bervariasi, karena satuan varian
(kuadrat) yang tidak sama dengan satuan nilai pengamatan, maka
dikembangkan suatu ukuran variasi yang mempunyai satuan yang sama
dengan satuan pengamatan, yaitu Standard Deviasi.
Standard Deviasi merupakan akar dari varian:

Standar deviasi (S atau SD) = Σ(Xi – X)2


n

Seperti halnya varian, semakin besar SD semakin besar variasinya.


Apabila tidak ada variasi, maka SD=0

Dari uraian tersebut dapat disimpulkan, untuk data numerik digunakan


nilai mean (rata-rata), median, standard deviasi dan inter quartil range,
minimal dan maksimal. Bila data yang terkumpul tidak menunjukkan adanya
nilai ekstrim (distribusi normal), maka perhituungan nilai mean dan standard
deviasi merupakan cara analisis univariat yang tepat. Seddangkan bila
dijumpai nilai ekstrim 9 distribusi data tidak normal), maka nilai nedian dan
inter quartil range (IQR) yang lebih tepat dibandingkan nilai mean.

Untuk dipakai di lingkungan sendiri 8


2. Peringkasan Data Katagorik
Berbeda dengan data numerik, peringkasan, (baik ukuran tengah
maupun ukuran variasi) tidak beragam jenisnya. Pada data katagorik
peringkasan data hanya menggunakan distribusi frekuensi dengan ukuran
persentase atau proporsi. Bila data berjenis katagorik, tentunya
informasi/peringkasan yang penting disampaikan tidak mungkin/tidak lazim
menggunakan ukuran mean atau median. melainkan informasi jumlah dan
persentase yang disajikan. Untuk ukuran variasi, pada data katagorik variasi
maksimal apabila jumlah antar katagori sama.
Contoh: Kelas A: mahasiswa 50 dan mahasiswi 50
Kelas B: mahasiswa 90 dan mahasiswi 10
Pada kelas A, jenis kelamin mahasiswa bervariasi (heterogen) karena 50%
pria dan 50% wanita.
Pada kelas B, jenis kelamin mahasiswa tidak bervariasi (homogen pada pria)
karena pria 90% dan wanita hanya 10%.

3. Bentuk Penyajian Data


Bentuk penyajian analisis univariat dapat berupa tabel atau grafik.
Namun perlu diingat bahwa kita dianjurkan hanya memilih salah satu, tidak
diperkenankan secara sekaligus menggunakan tabel dan juga grafik dalam
menyampaikan informasi suatu data/variabel.
Contoh penyajian analisis deskriptif:
a. Data numerik
Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun 1999
Variabel Mean SD Minimal- Maksimal
Median
1. Umur 30,3 10,1 17 – 60
31,1
2. Lama hari rawat 10,1 8,9 2 – 60
7,0

b. Data katagorik

Untuk dipakai di lingkungan sendiri 9


Tabel 2
Distribusi Responden Menurut Tingkat Pendidikan Pasien Rumah sakit X
tahun 1999
Pendidikan Jumlah Persentase
SD 60 60,0
SMP 30 30,0
SMU 10 10,0
Total 100 100,0

Bagaimana menginterpretasi tabel di atas?


“dilihat konsentrasi/jumlah yang terbesar data pada kelompok mana?”
Selain untuk mendeskripsikan masing-masing variabel, analisis
univariat dapat juga sekaligus untuk mengeksplorasi variabel yang dapat
berguna dalam mendiagnosis asumsi statistik lanjut (terutama untuk variabel
jenis numerik), misalnya apakah variannya homogen atau heterogen, apakah
distribusinya normal atau tidak. Eksplorasi data juga dapat untuk mendeteksi
adanya nilai ekstrim/outlier, bila ada nilai ekstrim sangat menentukan analisis
selanjutnya (bivariat) apakah nilainya akan berkurang.

Untuk dipakai di lingkungan sendiri 10


KASUS :
ANALISIS DESKRIPTIF (UNIVARIAT)
Tujuan analisis ini adalah untuk mendeskripsikan karakteristik masing-
masing variabel yang diteliti. Bentuknya tergantung dari jenis datanya. Untuk
data numerik digunakan nialai mean (rata-rata), median, standard deviasi dll.
Sedangkan untuk data katagorik tentunya hanya dapat menjelaskan
angka/nilai jumlah dan persentase masing-masing kelompok. Berikut akan
dipelajari cara mengeluarkan analisis deskriptif di SPAA, dimulai untuk
variabel katagorik (sebagai latihan digunakan variabel ‘pendidikan’) dan
kemudian dilanjutkan variabel numerik (variabel umur).

a. Data Katagorik
Untuk menampilkan tabulasi data katagorik digunakan tampilan
frekuensi. Sebagai contoh kita akan menampilkan tabel distribusi frekuensi
untuk variabel pendidikan dari file ‘ASI.SAV’.
1. Dari menu utama SPSS pilih ‘Analyze’, kemudian ‘Descriptive
Statistic’ dan pilih ‘Frequencies’, sehingga muncul tampilan:

2. Sorot variabel ‘didik’. Klik tanda panah dan masukkan ke kotak


“Variable (s)”

Untuk dipakai di lingkungan sendiri 11


3. Klik ‘OK’, hasil dapat dilihat di jendela output, seperti sbb:
Frequencies
Statistics
pendidikan formal ibu menyusui
N Valid 50
Missing 0

pendidikan formal ibu menyusui


Cumulative
Frequency Percent Valid Percent
Percent
Valid 1 10 20.0 20.0 20.0
2 11 22.0 22.0 42.0
3 16 32.0 32.0 74.0
4 13 26.0 26.0 100.0
Total 50 100.0 100.0

Kolom ‘Frequency’ menunjukkan jumlah kasus dengan nilai yang sesuai.


Pada contoh di atas, total responden 50 orang, dari jumlah tersebut 10 ibu
yang berpendidikan SD, proporsi dapat dilihat pada kolom ‘Percent’, pada
contoh di atas ada 20% ibu yang berpendidikan SD. Kolom ‘Valid Percent’
memberi hasil yang sama karena pada data ini tidak ada ’missing cases’.
‘Cumulative Percent’ menjelaskan tentang persent kumulatif. Pada contoh di
atas ada 42,0% ibu yang tingkat pendidikannya SD dan SMP. Dalam

Untuk dipakai di lingkungan sendiri 12


menginterpretasikan tabel katagorik dapat dilihat dari variasi dan konsentrasi
datanya.

Penyajian dan Interpretasi di Laporan Penelitian


Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di
laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya sbb:

Tabel …
Distribusi Responden Menurut Tingkat Pendidikan
Di ………… X tahun ….
Pendidikan Jumlah Persentase
SD 10 20,0
SMP 11 22,0
SMU 16 32,0
PT 13 26,0
Total 50 100,0

Distribusi tingkat pendidikan responden hampir merata untuk masing-masing


tingkat pendidikan. Paling banyak responden berpendidikan SMU yaitu 16
orang (32,0%) sedangkan untuk pendidikan SD, SMP dan PT masing-masing
20,0%, 22,0% dan 26,0%.

b. Data Numerik
Pada data numerik, peringkasan data dapat dilakukan dengan
melaporkan ukuran tengah dan sebarannya. Ukuran yang digunakan adalah
rata-rata, median dan modus. Sedangkan ukuran sebarannya (variasi) yang
digunakan adalah range, standard deviasi, minimal dan maksimal. Pada
SPSS ada dua cara untuk mengeluarkan analisis deskriptif yaitu dapat
melalaui perintah ‘Frequencies’ atau perintah ‘Expolre’. Biasanya yang
digunakan adalah Frequencies oleh karena ukuran statistik yang dapat
dihasilkan pada menu ‘Frequencies’ sangat lengkap (seperti mean, median,
varian dll), selain itu pada perintah ini juga dapat ditampilkan grafik histogram

Untuk dipakai di lingkungan sendiri 13


dan kurve normalnya. Berikut akan dicoba mengeluarkan analisis deskriptif
untuk variabel umur dengan menggunakan perintah frequencies.
1. Aktifkan data “susu.sav”
2. Pilih ‘Analyze’
3. Pilih ‘Descriptive Statistic’
4. Pilih ‘Frequencies’, terlihat kotak frequencies:
5. Sorot variabel yang akan dianalisis, sorot umur, dan klik tanda panah
sehingga umur masuk ke kotak variable (s).

6. Klik tombol option ‘Statistics…’, pilih ukuran yang anda minta misalnya
mean, median, standard seviasi, minimum, maximum, SE.

7. Klik ‘Continue’
8. Klik tombol option ‘Charts’ lalu muncul menu baru dan klik ‘Histogram’,
lalu klik ‘With Normal Curve’

Untuk dipakai di lingkungan sendiri 14


9. Klik ‘Continue’
10. Klik ‘OK’, dan pada layar terlihat distribusi frekuensi disertai ukuran
statistic yang diminta dan dibawahnya tampak grafik histogram beserta
curve normalnya.

Frequencies
Statistics
Umur ibu menyusui
N Valid 50
Missing 0

Statistics
Umur ibu menyusui
N Valid 50
Missin 0
g 25.10
Mean .686
Std. Error of Mean 24.00
Median 19
Mode 4.850
Std. Deviation 19
Minimum 35
Maximum

Umur ibu menyusui


Frequency Percent Valid Percent Cumulative

Untuk dipakai di lingkungan sendiri 15


Percent
Valid 7 14.0 14.0 14.0
19 3 6.0 6.0 20.0
20 3 6.0 6.0 26.0
21 5 10.0 10.0 36.0
22 5 10.0 10.0 46.0
23 4 8.0 8.0 54.0
24 2 4.0 4.0 58.0
25 5 10.0 10.0 68.0
26 3 6.0 6.0 74.0
27 3 6.0 6.0 80.0
30 3 6.0 6.0 86.0
31 3 6.0 6.0 92.0
32 2 4.0 4.0 96.0
34 2 4.0 4.0 100.0
35 50 100.0 100.0
Total

Dari hasil di atas, nilai rata-rata dapat dilihat pada baris mean,
sedangkan nilai standard deviasi dapat dilihat pada baris std. Seviation. Pada
contoh di atas, rata-rata umur ibu adalah 25,10 tahun, median 24,0 tahun dan

Untuk dipakai di lingkungan sendiri 16


standard deviasi 4,85 tahun dengan umur termuda 19 tahun dan yang tertua
35 tahun. Distribusi frekuensi ditampilkan menurut umur termuda sampai
dengan umur tertua dengan informasi tentang jumlah dan persentasenya.
Bentuk distribusi data dapat diketahui dari grafik histogram dan kurve
normalnya. Dari tampilan grafik dapat dilihat bahwa distribusi variabel umur
berbentuk normal
Dari hasil di atas belum diperoleh informasi estimasi interval yang penting
untuk melakukan estimasi parameter populasi. Bila anda ingin memperoleh
estimasi interval lakukan analisis eksplorasi data dengan perintah ‘Explore’.
Adapun caranya sbb:
1. Dari menu utama SPSS, pilih menu ‘Analyze’, kemudian pilih submenu
‘descriptive Statistics’, lalu pilih ‘Explore’
2. Isikan kotak ‘Dependent List’ dengan variabel ‘umur’, kotak ‘Factor List’
dan ‘Label Cases By’ biarkan kosong, sehingga tampilannya sbb:

3. Klik tombol ‘Plots’, dan pilih ‘Normality Plots With Test’

4. Klik ‘Continue’

Untuk dipakai di lingkungan sendiri 17


5. Klik ‘OK’, hasilnya dapat dilihat di layar:

Explore
Descriptives
Statistic Std. Error

umur ibu menyusui Mean 25.10 .686


95% Confidence Lower 23.72
Bound 26.48
Interval for Mean Upper 24.90
Bound 24.00
5% Trimmed Mean 23.520
Median 4.850
Variance 19
Std. Deviation 35
Minimum 16
Maximum 9
Range .547 .337
Interquartile Range -.812 .662
Skewness
Kurtosis

Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
umur ibu menyusui .130 50 .035 .920 50 .002
a
. Lilliefors Significance Correction

Untuk dipakai di lingkungan sendiri 18


umur ibu menyusui
umur ibu menyusui Stem-and-Leaf Plot
Frequency Stem & Leaf
7.00 1 . 9999999
20.00 2 . 00011122222333334444
10.00 2 . 5566666777
11.00 3 . 00011122244
2.00 3 . 55
Stem width: 10
Each leaf: 1 case(s)

Untuk dipakai di lingkungan sendiri 19


Dari hasil analisis ‘Explore’ terlihat juga nilai mean, median dan mode. Namun
yang paling penting dari tampilan explore munculnya angka estimasi interval.
Dari hasil tersebut kita dapat melakukan estimasi interval dari umur ibu. Kita
dapat menghitung 95% confidence interval umur yaitu 23,72 s.d. 26,48. Jadi
kita 95% yakin bahwa rata-rata umur ibu di populasi berada pada selang
23,72 sampai 26,48 tahun.

Uji kenormalan data:


Untuk mengetahui suatu data berdistribusi normal, ada 3 cara untuk
mengetahuinya yaitu:
1. Dilihat dari grafik histogram dan kurve normal, bila bentuknya
menyerupai bel shape, berarti distribusi normal
2. Menggunakan nilai Skewness dan standar errornya, bila nilai
Skewness dibagi standar errornya menghasilkan angka ≤ 2, maka
distribusinya normal
3. Uji kolmogorov smirnov, bila hasil uji signifkan (p value > 0,05) maka
distribusi normal. Namun uji kolmogorov sangat sensitif dengan jumlah
sampel, maksudnya : untuk jumlah sampel yang besar uji kolmogorov
cenderung menghasilkan uji yang signifikan (yang artinya bentuk
distribusinya tidak normal). Atas dasar kelemahan ini dianjurkan untuk
mengetahui kenormalan data lebih baik menggunakan angka skewness
atau melihat grafik histogram dan kurve normal

Untuk variabel umur diatas, dilihat dari histogram dan kurve normal terlihat
bentuk yang normal, selain itu hasil dari perbandingan skwness dan standar
error didapatkan: 0,547/0,337 =1,62 , hasilnya masih dibawah 2, berarti
distribusi normal. Dari hasil tersebut diatas dengan demikian variabel umur
disimpulkan berdistribusi normal.

Penyajian dan Interpretasi di Laporan Penelitian


Dari angka-angka tersebut kemudian kita masukkan ke tabel penyajian di
laporan penelitian/laporan tesis. Adapun penyajian dan interpretasinya adalah
sbb:

Untuk dipakai di lingkungan sendiri 20


Tabel 1
Distribusi Umur dan Lama Hari Rawat pasien Rumah sakit X Tahun x
Variabel Mean SD Minimal- 95% CI
Maksimal
Umur 25,10 4,85 19 - 35 23,72 – 26,48

Hasil analisis didapatkan rata-rata umur ibu adalah 25,10 tahun (95% CI:
23,72 – 26,48), dengan standar deviasi 4,85 tahun. Umujr termuda 19 tahun
dan umur tertua 35 tahun. Dari hasil estimasi interval dapat disimpulkan
bahwa 95% diyakini bahwa rata-rata umur ibu adalah diantara 23,72 sampai
dengan 26,48 tahun.

Untuk dipakai di lingkungan sendiri 21


ANALISIS BIVARIAT

Setelah diketahui karakteristik masing-masing variabel dapat


diteruskan analisis lebih lanjut. Pada analisis univariat, misalnya ada dua
variabel : jenis pembayaran berobat dan kepuasan pasien, kita hanya
melakukan pendeskripsian sendiri-sendiri untuk variabel jenis pembayaran
dan kepuasan pasien. Untuk variabel jenis pembayaran akan diketahui
berapa persen yang berobat dengan biaya sendiri dan berapa persen yang
dibiayai askes. Begitu juga untuk variabel kepuasan pasien, akan diketahui
berapa persen yang puas dan
berapa persen yang tidak puas.
Apabila diinginkan analisis hubungan antara dua variabel, dalam
contoh diatas berarti kita ingin mengetahui hubungan jenis pembayaran
dengan kepuasan pasien, maka analisis dilanjutkan pada tingkat bivariat.
Pada analisis bivariat kita dapat mengetahui apakah ada perbedaan
kepuasan pasien antara pasien dengan membayar sendiri dengan pasien
dengan biaya askes. Kegunaan analisis bivariat bisa untuk mengetahui
apakah ada hubungan yang siginifikan antara dua variabel, atau bisa juga
digunakan untuk mengetahui apakah ada perbedaan yang signifikan antara
dua atau lebih kelompok(sampel).

Perbedaan Substansi/Klinis dan perbedaan Statistik


Perlu dipahami/disadari bagi peneliti bahwa berbeda
bermakna/signifikan secara statistik tidak berarti (belum tentu) bahwa
perbedaan tersebut juga bermakna dipandang dari segi substansi/klinis.
Seperti diketahui bahwa semakin besar sampel yang dianalisis akan semakin
besar menghasilkan kemungkinan berbeda bermakna. Dengan sampel besar
perbedaan-perbedaan sangat kecil, yang sedikit atau bahkan tidak
mempunyai manfaat secara substansi/klinis dapat berubah menjadi bermakna
secara statitik. Oleh karena itu arti kegunaan dari setiap penemuan jangan
hanya dilihat dari aspek statistik semata, namun harus juga dinilai/dilihat
kegunaannya dari segi klinis/substansi. Sebagai contoh ada studi eksperimen
yang akan menguji dua obat (katakanlah obat A dan Obat B) untuk

Untuk dipakai di lingkungan sendiri 22


mengatahui pengaruhnya terhadap penurunan tekanan darah. Kemudian obat
A dan B diujicobakan pada dua kelompok relawan penderita hipertensi. Hasil
eksperimen didapatkan bahwa rata-rata penurunan tekanan darah setelah
minum obat A adalah 40 mmHg dan pada kelompok yang minum Obat B
ratarata penurunannya 39 mmHg. Kemudian dilakukan uji statistik dan
hasilnya signifikan/bermakna (p value < alpha), apa yang dapat disimpulkan
dari temuan ini? Secara statistik memang terjadi perbedaan bermakna,
namun secara substansi tidaklah mempunyai perbedaan yang berarti, oleh
karena perbedaan mean penurunan tekanan darah antara obat A dan B
hanya 1 mmHg. Dengan hasil ini dapat disimpulkan bahwa sebenarnya
antara obat A dan B tidak ada perbedaan (sama saja) kasiatnya.

UJI HIPOTESIS
Pengujian hipotesis dapat berguna untuk membantu pengambilan
keputusan tentang apakah suatu hipotesis yang diajukan, seperti perbesaan
atau hubungan, cukup menyakinkan untuk ditolak atau tidak ditolak.
Keyakinan ini didasarkan pada besarnya peluang untuk memperoleh
hubungan tersebut secara kebetulan (by chance). Semakin kecil peluang
tersebut (peluang adanya by chance), semakin besar keyakinan bahwa
hubungan tersebut memang ada.
Sebagai contoh, seorang peneliti masalah imunisasi diminta untuk
memutuskan berdasarkan bukti-bukti hasil percobaan, apakah suatu vaksin
baru lebih baik daripada yang sekarang beraedar di pasaran. Untuk
menjawab pertanyaan ini maka perlu dilakukan pengujian hipotesis. Dengan
pengujian hipotesis akan diperoleh suatu kesimpulan secara probalistik
apakah vaksin baru tersebut lebih baik dari yang sekarang beredar di pasaran
atau malah sebaliknya.
Prinsip uji hipotesis adalah melakukan perbandingan antara nilai
sampel (data hasil penelitian) dengan nilai hipotesis (nilai populasi) yang
diajukan. Peluang untuk diterima atau ditolaknya suatu hipotesis tergantung
besar kecilnyanya perbedaan antara nilai sampel dengan nilai hipotesis. Bila
perbedaan tersebut cukup besar, maka peluang untuk menolak hipotesis
besar pula, sebaliknya bila perbedaan tersebut kecil, maka peluang untuk

Untuk dipakai di lingkungan sendiri 23


menolak hipotesis menjadi kecil. Jadi, makin besar perbedaan antara nilai
sampel dengan nilai hipotesis, makin besar peluang untuk menolak hipotesis.
Kesimpulan yang didapat dari hasil pengujian hipotesis ada dua
kemungkinan yaitu menolak hipotesis dan menerima hipotesis (gagal
menolak hipotesis). Perlu dipahami bahwa arti menerima hipotesis sebetulnya
kurang tepat, yang tepat adalah gagal menolak hipotesis. Dalam uji hipotesis
bila kesimpulannya menerima hipotesis, bukan berarti bahwa kita telah
membuktikan hipotesis tersebut benar, karena benar atau tidaknya suatui
hipotesis hanya dapat dibuktikan dengan mengadakan observasi pada
seluruh populasi, dan hal ini sangat sulit bahkan tidak mungkin untuk
dilakukan. Jadi menerima hipotesis sebetulnya artinya adalah kita tidak cukup
bukti untuk menolak hipotesis, dengan kata lain dapat diartikan kita gagal
menolak hipotesis. Untuk memperjelas pengertian bahwa “gagal menolak
hipotesis berbeda dengan mengakui kebenaran hipotesis (menerima
hipotesis”, kita coba analogkan proses persidangan kriminal di pengadilan.
Seperti dalam sidang pengadilan, kegagalan membuktikan kesalahan
tertuduh bukan berarti si tertudauh tidak bersalah atau sitertuduh benar.
Pengadilan memutuskan bahwa si tertuduh tidak dapat dibuktikan bersalah,
bukan memutuskan tidak bersalah. Dari uraian tersebut sangatlah jelas
bahwa istilah yang tepat dalam kesimpulan uji hipotesis adalah gagal
menolak hiopotesis, dan bukan menerima hipotesis.

3. Hipotesis
Hipotesis berasal dari kata hupo dan thesis. Hupo artinya
sementara/lemah kebenarannya dan thesis artinya pernyataan/teopri. Dengan
demikian hipotesis berarti pernyataan yang perlu diuji kebenarannya. Untuk
menguji kebenaran sebuah hipotesis digunakan pengujian yang disebut
pengujian hipotesis.
Dalam pengujian hipotesis dijumpai dua jenis hipotesis yaitu hipotesis
nol (Ho) dan hipotesis alternatif (Ha). Berikut akan diuraikan lebih jelas
tentang masing-masing hipotesis tersebut.
a. Hipotesis Nol (Ho).

Untuk dipakai di lingkungan sendiri 24


Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara
kedua kelompok. Atau hipotesis yang menyatakan tidak ada hubungan
antara variabel satu dengan variabel lainnya
Contoh:
1) Tidak ada perbedaan berat badan bayi antara mereka yang dilahirkan
dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang
tidak merokok
2) Tidak ada hubungan antara merokok dengan berat badan bayi
b. Hipotesis Alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara
kedua kelompok. Atau hipotesis yang menyatakan ada hubungan antara
variabel satu dengan variabel lainnya
Contoh:
1) Ada perbedaan berat badan bayi antara mereka yang dilahirkan dari
ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak
merokok
2) Ada hubungan antara merokok dengan berat badan bayi

2. Arah dan bentuk hipotesis


Bentuk hipotesis alternatif akan menentukan arah uji statistik apakah
satu arah (one tail) atau dua arah (twa tail)
a. One tail (satu sisi): bila hipotesis alternatifnya
menyatakan adanya perbedaan dan ada pernyataan yang mengatakan hal
satu lebih tinggi/rendah dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok lebih kecil dibanding berat badan
bayi dari ibu tidak merokok.
b. Two tail (dua sisi) merupakan hipotesis alternatif yang
hanya menyatakan perbedaan tanpa melihat apakah hal satu lebih
tinggi/rendah dari hal lain.
Contoh:
Berat badan bayi dari ibu yang merokok Berbeda dibanding berat badan
bayi dari ibu tidak merokok. Atau dengan kata lain: ada perbedaan berat

Untuk dipakai di lingkungan sendiri 25


badan bayi antara mereka yang dilahirkan dari ibu yang merokok
dibandingkan dari ibu yang tidak merokok.

Contoh penulisan hipotesis:


Suatu penelitian ingin mengetahui hubungan antara jenis kelamin dengan
tekanan darah, maka hipotesisnya sbb:
Ho : μA = μB
Tidak ada perbedaan mean tekanan darah antara laki-laki dan perempuan,
atau Tidak ada hubungan antara jenis kelamin dengan tekanan darah.

Ho : μA ≠ μB
Ada perbedaan mean tekanan darah antara laki-laki dan perempuan, atau
Ada hubungan antara jenis kelamin dengan tekanan darah

3. Menentukan Tingkat Kemaknaan (Level of Significance)


Tingkat kemaknaan merupakan kesalahan tipe I suatu uji yang
biasanya diberi notasi ‘α’. Seperti sudah diketahui bahwa tujuan dari
pengujian hipotesis adalah untuk membuat suatu pertimbangan tentang
perbedaan antara nilai sampel dengan keadaan populasi sebagai suatu
hipotesis. Langkah selanjutnya setelah ktriteria/batasan yang digunakan
untuk memutuskan apakah hipotesis nol ditolak atau gagal ditolak yang
disebut dengan tingkat kemaknaan (Level of Significance). Tingkat
kemaknaan, atau sering disebut dengan nilai α, merupakan nilai yang
menunjukkan besarnya peluang salah dalam menolak hipotesis nol. Atau
dengan kata lain, nilai α merupakan batas toleransi peluang salah dalam
menolak hipotesis nol. Dengan kata-kata yang lebih sederhana, nilai α
merupakan batas maksimal kesalahan menolak Ho. Bila kita menolak Ho
berarti menyatakan adanya perbedaan/hubungan. Sehingga nilai α dapat
diartikan pula sebagai batas maksimal kita salah dalam menyatakan adanya
perbedaan. Penentuan nilai α (alpha) tergantung dari tujuan dan kondisi
penelitian. Nilai α yang sering digunakan adalah 10%, 5%, atau 1%. Untuk
bidang kesehatan masyarakat biasanya digunakan nilai α sebesar 5%.
Sedangkan untuk pengujian obat-obatan digunakan batas toleransi kesalahan
yang lebih kecil misalnya 1%, karena mengandung risiko yang fatal. Misalkan

Untuk dipakai di lingkungan sendiri 26


seorang peneliti yang akan menentukan apakah suatu obat bius berkhasiat
akan menentukan nilai α yang kecil sekali, peneliti tersebut tidak akan mau
mengambil risiko bahwaketidak berhasilan obat bius besar karena akan
berhubungan dengan nyawa seseorang yang akan dibius.

4. Pemilihan Jenis Uji Parametrik atau Non Parametrik


Dalam pengujian hipotesis sangat berhubungan dengan distribusi data
populasi yang akan diuji. Bila distribusi data populasi yang akan diuji
berbentuk normal/simetris/Gauss, maka proses pengujian dapat digunakan
dengan pendekatan uji statistik parametrik. Sedangkan bila distribusi data
populasinya tidak normal atau tidak diketahui distribusinya maka dapat
digunakan pendekatan uji statistik non parametrik. Kenormalan suatu
distribusi data dapat juga dilihat dari jenis variabelnya, bila variabelnya
berjenis numerik/kuantitatif biasanya distribusi datanya mendekati
normal/simetris, sehingga dapat digunakan uji statistik parametrik. Bila jenis
variabelnya katagorik (kualitatif), maka bentuk distribusinya tidak normal,
sehingga uji non parametrik dapat digunakan. Penentuan jenis uji juga
ditentukan oleh jumlah data yang dianalisis, bila jumlah data kecil (<30)
cenderung digunakan uji non parametrik.

PROSEDUR/LANGKAH UJI HIPOTESIS


Menetapkan Hipotesis
Hipotesis dalam statistik dikenal dua macam yaitu hipotesis nol (Ho) dan
hipotesis alternatif (Ha).
1). Hipotesis nol (Ho)
Hipotesis yang menyatakan tidak ada perbedaan sesuatu kejadian antara
kedua kelompok.
Contoh: Tidak ada perbedaan berat badan bayi antara mereka yang
dilahirkan dari ibu yang merokok dengan mereka yang dilahirkan dari ibu
yang tidak merokok
2). Hipotesis alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan sesuatu kejadian antara
kedua kelompok.

Untuk dipakai di lingkungan sendiri 27


Contoh: Ada perbedaan berat badan bayi antara mereka yang dilahirkan
dari ibu yang merokok dengan mereka yang dilahirkan dari ibu yang tidak
merokok.
Dari hipotesis alternatif akan diketahui apakah uji statistik menggunakan satu
arah (one tail) atau dua arah (two tail).

Penentuan Uji Statistik Yang Sesuai


Ada beragam jenis uji statistik yang dapat digunakan. Setiap uji
statistik mempunyai persyaratan tertentu yang harus dipenuhi. Oleh karena
itu harus digunakan uji statistik yang tepat sesuai dengan data yang diuji.
Jenis uji statistik sangat tergantung dari:
1). Jenis variabel yang akan dianalisis
2). Jenis data apakah dependen atau independen
3). Jenis distribusi data populasinya apakah mengikuti distribusi normal
atau tidak.
Sebagai gambaran, jenis uji statistik untuk mengetahui perbedaan
mean akan berbeda dengan uji statistik untuk mengetahui perbedaan
proporsi/persentase. Uji beda mean menggunakan uji t atau inova,
sedangkan uji untuk mengetahui perbedaan proporsi digunakan uji Kai
kuadrat.

Menentukan Batas atau Tingkat Kemaknaan (Level og Significance)


Batas/tingkat kemaknaan, sering juga disebut dengan nilai α.
Penggunaan nilai alpha tergantung tujuan penelitian yang dilakukan, untuk
bidang kesehatan masyarakat biasanya menggunakan nilai alpha 5%.

Penghitungan Uji Statitik


Penghitungan uji statistik adalah menghitung data sampel ke dalam uji
hipotesis yang sesuai. Misalnya kalau ingin menguji perbedaan mean antara
dua kelompok, maka data hasil pengukuran dimasukkan ke rumus uji t. Dari
hasil dengan nilai populasi untuk mengetahui apakah ada hipotesis ditolak
atau gagal menolak hipotesis.

Keputusan Uji Statistik

Untuk dipakai di lingkungan sendiri 28


Seperti telah disebutkan pada langkah D, bahwa hasil pengujian
statistik akan menghasilkan dua kemungkinan keputusan yaitu menolak
hipotesis nol (Ho) dan gagal menolak hipotesisi nol.
Seiring dengan kemajuan perkembangan komputer maka uji statistik
dengan mudah dan cepat dapat dilakukan dengan program-program statistik
yang tersedia di pasaran seperti Epi Info, SPSS, SAS dll. Setiap kita
melakukan uji statistik melalui program komputer maka yang akan kita cari
adalalah nilai p (p value). Dengan nilai p ini kita dapat menggunakan untuk
keputusan uji statistik dengan cara membandingkan nilai p dengan α (alpha).
Ketentuan yang berlaku adalah:
a). Bila nilai p ≤ α, maka keputusannya adalah Ho ditolak
b). Bila nilai p > α, maka keputusannya adalah Ho gagal ditolak
Perlu diketahui bahwa nilai p two tail adalah 2 kali nilai p one tail berarti
kalau tabel yang digunakan adalah tabel one tail sedangkan uji statistik yang
dilakukan adalah two tail maka nilai p dari tabel harus dikalikan 2. dengan
demikian dapat disederhanakan dengan rumus : nilai p two tail = 2 x nilai p
one tail.
Pendekatan probabilistik ini sekarang sudah mulai digunakan oleh para
ahli statistik dalam pengambilan keputusan uji statistik. Pada modul ini dalam
memutuskan uji statistik menggunakan pendekatan ini.

Pengertian Nilai P
Nilai p merupakan nilai yang menunjukkan besarnya peluang salah
menolak Ho dari data penelitian. Nilai P dapat diartikan pula sebagai nilai
besarnya peluang hasil penelitian (misal adanya perbedaan mean atau
proporsi) terjadi karena faktor kebetulan (by chance). Harapan kita nilai p
adalah sekecil mungkin, sebab bila nilai p-nya kecil maka kita yakin bahwa
adanya perbedaan pada hasil penelitian menunjukkan pula adanya
perbedaan di populasi. Dengan kata lain kalau nilai p-nya kecil maka
perbedaan yang ada pada penelitian terjadi bukan karena faktor kebetulan
(by chance).
Contoh:

Untuk dipakai di lingkungan sendiri 29


Suatu penelitian ingin mengetahui hubungan riwayat hipertensi ibu hamil
dengan berat badan bayi yang dikandungnya. Hasil penelitian melaporkan
bahwa rata-rata berat badan bayi dari ibu hipertensi 200 gram, sedangkan
rata-rata berat badan bayi yang lahir dari ibu yang tidak hipertensi adalah
3000 gram. Perbedaan berat bayi antara ibu yang hipertensi dengan ibu yang
tidak hipertensi sebesar 100 gram. Pertanyaan yang timbul adalah apakah
perbedaan berat badan bayi tersebut juga berlaku untuk seluruh populasi
yang diteliti atau hanya faktor kebetulan saja?. Untuk menjawab pertanyaan
tersebut kemudian dilakukan uji statistik yang tepat yaitu uji t. Miisalnya
dihasilkan nilai p = 0,0110 maka berarti peluang adanya perbedaan berat bayi
sebesar 1000 gram akibat dari faktor kebetulan (by chance) adalah sebesar
0,0110. oleh karena peluangnya sangat kecil (p=0,0110), maka dapat
diartikan bahwa adanya perbedaan tersebut bukan karena faktor kebetulan
namun karena memang karena adanya riwayat hipetensi.

Berikut adalah berbagai uji statistik yang dapat digunakan untuk analisis bivariat
Variabel I Variabel II Jenis uji statistik yang
digunakan
Katagorik ↔ Katagorik - Kai kuadrat
- Fisher Exact
Katagorik ↔ Numerik - Uji T
- ANOVA
Numerik ↔ Numerik - Korelasi
- Regresi

Untuk dipakai di lingkungan sendiri 30


ANALISIS BIVARIAT HUBUNGAN
KATAGORIK DENGAN NUMERIK

Uji t
Di bidang kesehatan sering kali kita harus menarik kesimpulan apakah
parameter dua populasi berbeda atau tidak. Misalnya, apakah ada perbedaan
tekanan darah penduduk dewasa orang kota dengan orang desa. Atau,
apakah ada perbedaan berat badan antar sebelum mengikuti program diet
dengan sesudahnya. Uji statistik yang membandingkan mean dua kelompok
data ini disebut uji beda dua mean. Pendekatan ujinya dapat menggunakan
pendekatan distribusi Z dan distribusi t , sehingga pada uji beda dua mean
bisa menggunakan uji Z atau uji t, namun lebih sering digunakan uji t.
Sebelum kita melakukan uji statistik dua kelompok data, kita perlu
mengetahui apakah dua kelompok data tersebut berasal dari dua kelompok
yang independen atau berasal dari dua kelompok yang
dependen/pasangan. Dikatakan kelompok independen bila data kelompok
yang satu tidak tergantung dari kelopok kedua, misalnya membandingkan
mean tekanan darah sistolik orang desa dengan orang kota. Tekanan darah
orang kota independen (tidak tergantung) dengan orang desa. Dilain pihak,
kedua kelompok data dikatakan dependen/pasangan bila kelompok data yang
dibandingkan datanya saling mempunyai ketergantungan, misalnya data
berat badan sebelum dan sesudah mengikuti program diet berasal dari orang
yang sama (data sesudah dependen/tergantung dengan data sebelum).
Berdasarkan karakteristik data tersebut maka uji beda dua mean dibagi
dalam dua kelompok, yaitu: uji beda mean independen (uji T independen) dan
uji beda mean dependen (uji T dependen).

1. Uji beda dua mean independen


Tujuan: untuk mengetahui perbedaan mean dua dua kelompok data
independen, syarat yang harus dipenuhi:
a. Data berdistribusi normal/simetris.
b. Kedua kelompok data independen.

Untuk dipakai di lingkungan sendiri 31


c. Variabel yang dihubungkan berbentuk numerik dan katagorik
(ket: variabel katagorik hanya dengan dua kelompok).

Prinsip pengujian dua mean dua mean adalah melihat perbedaan variasi
kedua kelompok data. Oleh karena itu dalam pengujian ini diperlukan
informasi apakah varian kedua kelompok yang diuji sama atau tidak. Bentuk
varian kedua kelompok data akan berpengaruh pada nilai standar error yang
akhirnya akan membedakan rumus pengujiannya.
a. Uji untuk varian sama
Uji beda dua mean dapat dilakukan dengan menggunakan uji Z atau uji T.
Uji Z dapat digunakan bila standar deviasi populasi (σ) diketahui dan
jumlah sampel besar (>30). Apabila kedua syarat tersebut tidak terpenuhi
maka dilakukan uji . pada umumnya nilai σ sulit diketahui, sehingga uji
beda dua mean biasanya menggunakan uji T (T Test). Untuk varian yang
sama maka bentuk ujinya sbb:

X1 – X2
T=
Sp (1/n1) + (1/n2)

(n1 - 1)S12 + (n2 - 1) S22


Sp =2

n1 - n2 - 2

df = n1 – n2 - 2
Ket :
n1 atau n2 = jumlah sampel kelompok 1 atau 2
S1 atau S2 = standar deviasi sampel kelompok 1 atau 2
b. Uji untuk varian berbeda

X1 – X2
T=
(S12/n1) + (S22/n2)

[(S12/n1) + (S22/n2)]2
df =
[(S12/n1)2/(n1-1)] + [(S22/n2)2/(n2-1)]

Untuk dipakai di lingkungan sendiri 32


c. Uji homogenitas varian
Tujuan dari uji ini adalah untuk mengetahui varian antara kelompok data
satu apakah sama dengan kelompok data yang kedua.

S12
F=
S22

df1 = n1-1 dan df2 = n2-1


Pada perhitungan uji F, varian yang lebih besar sebagai pembilang dan
varian yang lebih kecil sebagai penyebut.

2. Uji beda dua mean dependen (Paired sample)


Tujuan : Untuk menguji perbedaan mean anatara dua kelompok data yang
dependen. Contoh kasus:
o Apakah ada perbedaan tingkat pengetahuan antara sebelum dan
sesudah dilakukan pelatihan.
o Apakah ada perbedaan berat badan antara sebelum dan sesudah
mengikuti program diet.
Syarat :
a. Distribusi data normal
b. Kedua kelompok data dependen/pair
c. Jenis variabel: numerik dan katagorik (dua kelompok)
Formula :

d
T=
S_d / n

d = rata-rata deviasi/selisih sampel 1 dengan sampel 2


S_d = standar deviasi dari deviasi/selisih sampel sampel 1 dan sampel 2

KASUS:
UJI t INDEPENDEN DAN UJI t DEPENDEN

Untuk dipakai di lingkungan sendiri 33


1. Uji t independen
Sebagai contoh kita gunakan data “ASI.SAV” dengan melakukan uji
hubungan perilaku menyusui dengan kadar Hb (misal digunakan variabel
Hb1), apakah ada perbedaan kadar Hb antara ibu yang menyusui eksklusif
dengan ibu yang menyusuinya tidak eksklusif, caranya:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub
menu “Compare Means’, lalu pilih “Independen-Samples T Test”
3. Pada layar tampak kotak yang di dalamnya ada kotak ‘Test variable
(s)’I dan ‘Grouping Variable’. Ket: kotak test varibles tempat memasukkan
variable numeriknya, sedangkan kotak grouping variable untuk
memasukkan variabel katagoriknya, ingat jangan sampai terbalik.
4. Klik ‘hb1’ dan msukkan ke kotak ‘Test variable’
5. Klik variabel ‘eksklu’ dan masukkan ke kotak ‘Grouping Variable’.

6. Klik ‘Define Group’, kemudian di layar nampak kotak isian. Anda


diminta mengisi kode variabel ‘menyusui’ ke dalam kedua kotak. Pada
contoh ini, kita tahu bahwa ‘0’ kode untuk yang tidak eksklusif dan kode ‘1’
untuk Yang eksklusif. Jadi ketiklah 0 pada Group 1” dan 1 pada “Group 2”

7. Klik “Continue”

Untuk dipakai di lingkungan sendiri 34


8. Klik “OK” untuk menjalankan prosedur perintahnya, dan hasilnya sbb:

T-Test
Group Statistics
Std. Error
status menyusui asi N Mean Std. Deviation Mean
kadar hb pengukuran tdk 24 10.421 1.4712 .3003
EKSKLUSIVE 26 10.277 1.3228 .2594
pertama EKSKLUSIVE

Independent Samples Test


Levene's
Test t-test for Equality of Means
for Equality
of
Variances
95% Confidence
Sig. Mean Std. Interval of the
(2-taile Differen Error Difference
Sig. df d) ce Differe
F t nce Lower Upper
kadar hb Equal
pengukur .072 .790 -.364 48 .717 -.1439 .3951 -.9384 .6505
variances
an
assumed
pertama Equal -.363 46.4 .719 -.1439 .3968 -.9425 .6547
varianc
es
not
assum
ed

Pada tampilan di atas dapat dilihat nilai rata-rata, standar deviasi dan
standar error kadar Hb ibu untuk masing-masing kelompok. Rata-rata kadar
Hb ibu yang menyusui ekslusif adalah 10,277 gr% dengan standar deviasi
1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif, rata-rata kadar
Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji T dapat dilihat pada tabel bawah, SPSS akan menampilkan
dua uji T, yaitu uji T dengan asumsi varian kedua kelompok sama (equal

Untuk dipakai di lingkungan sendiri 35


variances assumed) dan uji T dengan asumsi varian kedua kelompok tidak
sama (equal variances not assumed). Untuk, memilih uji mana yang kita
pakai, dapat dilihat uji kesamaan varian melalui uji Levene. Lihat nilai p
Levene test, nilai p < alpha (0,05) maka varian berbeda dan bila nilai p >
alpha (0,05) maka varian sama (equal). Pada uji Levene di atas menghasilkan
nilai p = 0,790 sehingga dapat disimpulkan bahwa pada alpha 5%, didapat
tidak ada perbedaan varian (varian kedua kelompok sama). Selanjutnya dicari
p value uji t pada bagian varian sama (equal variances) di kolom sig (2
tailed) ,yaitu sebesar p=0,717 artinya tidak ada perbedaan yang signifikan
rata-rata kadar Hb antara ibu yang menyusui eksklusif dengan ibu yang
menyusui non eksklusif.

Penyajian dan Interpretasi di laporan penelitian:


Seperti pada analisis deskriptif, print out di atas tidak boleh langsung di copy
dan disajikan di laporan penelitian. Pada laporan penelitian kita harus
membuat tabel baru untuk menyajikan hasil print out analisis di atas. Adapun
bentuk penyajian dan interpretasinya adalah sbb:
Tabel …
Distribusi Rata-Rata Kadar Hb Responden Menurut Perilaku Menyusui di..th..
Menyusui Mean SD SE P value N

Ya Eksklusif 10,277 1,322 0,259 0,717 26


Tdk Eksklusif 10,421 1,471 0,300 24

Rata-rata kadar Hb ibu yang menyusui eksklusif adalah 10,277 gr% dengan
standar deviasi 1,322 gr%, sedangkan untuk ibu yang menyusui non eksklusif
rata-rata kadar Hb-nya adalah 10,421 gr% dengan standar deviasi 1,471 gr%.
Hasil uji statistik didapatkan nilai p=0,717, berarti pada alpha 5% terlihat tidak
ada perbedaan yang signifikan rata-rata kadar Hb antara ibu yang menyusui
secara eksklusif dengan non eksklusif.

2. Uji T Dependen

Untuk dipakai di lingkungan sendiri 36


Uji T dependen seringkali disebut uji T Paired/Related atau pasangan.
Uji T dependen sering digunakan pada analisis data penelitian eksperimen.
Seperti sudah dijelaskan di depan bahwa disebut kedua sampel bersifat
dependen kalau kedua kelompok sampel yang dibandingkan mempunyai
subyek yang sama. Dengan kata lain disebut dependen bila responden diukur
dua kali/diteliti dua kali, sering orang mengatakan penelitian pre dan post.
Misalnya kita ingin membandingkan berat badan antara sebelum dan
sesudah mengikuti program diet.
Untuk contoh ini akan dilakukan uji beda rata-rata kadar Hb antara
kadar Hb pengukuran pertama dengan kadar Hb pengukuran kedua, ingin
diketahui apakah ada perbedaan kadar Hb antara pengukuran pertama
dengan pengukuran kedua. Disini terlihat sampelnya dependen karena
orangnya sama diukur dua kali. Adapun langkahnya:
1. Pastikan anda berada di file “ASI.SAV”, jika belum aktifkan/bukalah file
ini.
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub
menu “Compare Means’, lalu pilih “Paired-Samples T Test”

3. Klik ‘hb1’
4. Klik ‘hb2’
5. Klik tanda panah sehingga kedua variabel masuk kotak sebelah kanan
6. Klik ‘OK’ hasilnya tampak sbb:

Untuk dipakai di lingkungan sendiri 37


T-Test
Paired Samples Statistics
Mean N Std. Deviation Std. Error
Mean
Pair kadar hb 10.346 50 1.3835 .1957
pengukuran
1 pertama 10.860 50 1.0558 .1493
kadar hb
pengukuran
kedua

Paired Samples Correlations


N Correlation Sig.
Pair Kadar hb pengukuran 50 .707 .000
pertama 1
& kadar hb pengukuran kedua

Paired Samples Test


Paired Differences
95%
Confidence Sig.
Std. Std. Interval of the (2-
Mean Deviati Error Difference df taile
on Mean Lower Upper t d)
Pair kadar hb
1 pengukuran
pertama - -.514 .9821 .1389 -.793 -.234 - 49 .001
kadar 0 1 9 3.701
hb pengukuran
kedua

Pada tabel pertama terlihat statistik deskriptif berupa rata-rata dan


standar deviasi kadar Hb antara pengukuran pertama dan pengukuran kedua.
Rata-rata kadar Hb pada pengukuran pertama (hb1) adalah 10,346 gr%

Untuk dipakai di lingkungan sendiri 38


dengan standar deviasi 1,38 gr%. Pada pengukuran kedua (hb2) didapat rata-
rata kadar Hb adalah 10,860 gr% dengan standar deviasi 1,05 gr%.
Uji T berpasangan dilaporkan pada tabel kedua, terlihat nilai mean
perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan
standar deviasi 0,982. perbedaan ini diuji dengan uji T berpasangan
menghasilkan nilai p yang dapat dilihat pada kolom “Sig (2-tailed)”. Pada
contoh di atas didapatkan nilai p=0,001, maka dapat disimpulkan ada
perbedaan yang signifikan kadar hb antara pengukuran pertama dengan
pengukuran kedua.
Penyajian dan Interpretasi di laporan penelitian:
Dari hasil yang didapat di atas kemudian angka-angka disusun dalam
tabel yang disajikan dalam laporan penelitian. Bentuk penyajian dan
interpretasinya sbb:
Tabel …
Distribusi Rata-Rata Kadar Hb Responden Menurut Pengukuran pertama dan
Kedua di …. Th……
Variabel Mean SD SE P value N
Kadar Hb
Pengukuran I 10,346 1,38 0,19 0,001 50
Pengukuran II 10,860 1,05 0,14

Rata-rata kadar Hb pada pengukuran pertama adalah 10,346 gr% dengan


standar deviasi 1,38 gr%. Pada pengukuran kedua didapat rata-rata kadar Hb
adalah 10,860 gr% dengan standar deviasi 1,05 gr%. Terlihat nilai mean
perbedaan antara pengukuran pertama dan kedua adalah 0,514 dengan
standar deviasi 0,982. hasil uji statistik didapatkan nilai 0,001 maka dapat
disimpulkan ada perbedaan yang signifikan antara kadar Hb pengukuran
pertama dan kedua.

Untuk dipakai di lingkungan sendiri 39


ANALISIS HUBUNGAN
KATEGORIK DENGAN NUMERIK

UJI ANOVA

Pada bab terdahulu telah dijelaskan uji beda mean dua kelompok data
baik yang independen maupun dependen. Namun seringkali kita jumpai
jumlah kelompok yang lebih dari dua, misalnya ingin mengetahui perbedaan
mean berat badan bayi untuk daerah Bekasi, Bogor dan Tangerang. Dalam
menganalisis data seperti ini (> 2 kelompok) sangat tidak dianjurkan
menggunakan uji T. kelemahan menggunakan uji T adalah; pertama kita
melakukan uji berulang kali sesuai kombinasi yang mungkin, kedua, bila
melakukan uji T berulang kali akan meningkatkan (inflasi) nilai α, artinya akan
meningkatkan peluang hasil yang keliru.
Perubahan inflasi α sebesar = 1 – (1-α)n
Untuk mengatasi masalah tersebut maka uji statistik yang dianjurkan (uji yang
tepat) dalam menganalisis beda lebih dari dua mean adalah uji ANOVA atau
uji F.
Prinsip uji ANOVA adalah melakukan telaah variabilitas data menjadi
dua sumber variasi yaitu variasi dalam kelompok (within) dan variasi antar
kelompok (between). Bila variasi within dan between sama (nilai
perbandingan kedua varian sama dengan 1) maka mean-mean yang
dibandingkan tidak ada perbedaan, sebaliknya bila hasil perbandingan
tersebut menghasilkan lebih dari 1, maka mean yang dibandingkan menunjuk
ada perbedaan.
Analisis varian (ANOVA) mempunyai dua jenis analisi varian satu
faktor (one way) dan analisis faktor (two way). Pada bab ini hanya akan
dibahas analisis varian satu faktor (one way).
Beberapa asumsi yang harus dipenuhi pada uji ANOVA adalah:
1. Varian homogen
2. Sampel/kelompok independen
3. Data berdistribusi normal

Untuk dipakai di lingkungan sendiri 40


4. Jenis data yang dihubungkan adalah : Numerik dengan katagori (untuk
katagori yang lebih dari 2 kelompok.

Perhitungan uji ANOVA

Sb2
F= df = k-1 → untuk pembilang
Sw 2
n-k → untuk penyebut

(n1-1)S12 + (n2-1)S22 + ……..+ (nk-1)Sk2


Sw =2

N-k

n1(X1-X)2 + n2(X2-X)2 + ………+ nk(Xk-X)2


Sb =
2

k-1

n1.X1 + n2.X2 + ……. + nk.Xk


X=
N

Ket N = jumlah seluruh data (n1 + n2 + ….. + nk)

Analisis Multi Comparison (POSTHOC TEST)


Analisis ini bertujuam untuk mengetahui lebih lanjut kelompok mana
saja yang berbeda mean-nya bilamana pada pengujian ANOVA dihasilkan
ada perbedaan yang bermakna (Ho ditolak). Ada berbagai jenis analisis
multiple comparasion diantaranya adalah Bonferroni, Honestly Significant
different (HSD), Scheffe dan lain-lain. Pada modul ini yang akan dibahas
adalah metode Bonferroni.
Perhitungan Bonfrroni adalah sbb:

Xi - Xj
tij =
Sw2[(1/ni) +(1/nj)]

df = n – k
Dengan level of significance (α) sbb:

Untuk dipakai di lingkungan sendiri 41


α
α* =
(k2)

Kasus:
UJI ANOVA
Pada contoh ini aka dicoba dihubungkan antara tingkat pendidikan dengan
berat badan bayi. Variabel pendidikan merupakan variabel katagorik dengan
4 katagori. Variabel berat bayi berbentuk numerik sehingga uji yang
digunakan ANOVA. Adapun caranya sbb:
1. Aktifkan/bukalah file data “ASI.SAV”
2. Dari menu utama SPSS, pilih menu ‘Analyze”, kemudian pilih sub
menu “Compare Means’, lalu pilih “One-Way ANOVA” sesaat akan muncul
menu One Way ANOVA
3. Dari menu One way ANOVA, terlihat bahwa kotak Dependent List dan
kotak Factor perlu diisi variabel. Kotak ‘dependent’ diisi variabel numerik
dan kotak ‘factor’ diisi variabel katagoriknya. Pada contoh ini berarti pada
kotak Dependen diisi variabel “bbbayi” pada kotak Factor diisi variabel
“Didik”.

4. Klik tombol ‘Options” tandai dengan √ pada kotak “Descriptive”


5. Klik “Continue”

Untuk dipakai di lingkungan sendiri 42


6. Klik tombol “Post Hoc”, tandai dengan √ pada kotak “Bonferroni”

7. Klik “Continue”
8. Klik “OK”

Untuk dipakai di lingkungan sendiri 43


Oneway
Descriptives
berat badan bayi
95% Confidence Interval
for
Mean
Std. Std. Lower Upper Minim Maxim
N Mean Deviation Error Bound Bound um um
SD 10 2470.00 249.666 78.951 2291.40 2648.60 2100 2900
SMP 11 2727.27 241.209 72.727 2565.23 2889.32 2100 3000
SMU 16 3431.25 270.108 67.527 3287.32 3575.18 3000 4000
PT 13 3761.54 386.304 107.141 3528.10 3994.98 3000 4100
Total 50 3170.00 584.232 82.623 3003.96 3336.04 2100 4100

Test of Homogeneity of Variances


berat badan bayi
Levene
Statistic df1 df2 Sig.
2.506 3 46 .071

ANOVA
berat badan bayi
Sum of Mean
Squares df Square F Sig.
Between 12697038 3 4232345.862 48.334 .000
Groups 4027962 46 87564.400
Within Groups 16725000 49
Total

Untuk dipakai di lingkungan sendiri 44


Post Hoc Tests

Multiple Comparisons
Dependent Variable: berat badan bayi
Bonferroni
(I) (J) 95% Confidence Interval
pendidika pendidikan Mean
n formal formal ibu Difference
ibu menyusui (I-J) Std. Error Sig. Lower Bound Upper Bound
SD SMP -257.273 129.294 .315 -613.76 99.21
SMU -961.250* 119.286 .000 -1290.14 -632.36
PT -1291.538* 124.468 .000 -1634.72 -948.36
SMP SD 257.273 129.294 .315 -99.21 613.76
SMU -703.977* 115.902 .000 -1023.54 -384.42
PT -1034.266* 121.228 .000 -1368.51 -700.02
SMU SD 961.250* 119.286 .000 632.36 1290.14
SMP -703.977* 115.902 .000 384.42 1023.54
PT -330.288* 110.492 .027 -634.93 -25.64
PT SD 1291.538* 124.468 .000 948.36 1634.72
SMP 1034.266* 121.228 .000 700.02 1368.51
SMU 330.288* 110.492 .027 25.64 634.93
*. The mean difference is significant at the .05 level.

Dari print out ini diperoleh rata-rata berat bayi dan standar deviasi masing-
masing kelompok. Rata-rata berat bayi pada mereka yang berpendidikan SD
adalah 2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang
berpendidikan SMP rata-rata berat bayinya adalah 2727,2 gram dengan
standar deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata
berat bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada
mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram
dengan standar deviasi 386,3 gram.
Pada hasil di atas nilai p uji ANOVA dapat diketahui pada kolom “F” dan “Sig”,
terlihat p=0,000 (kalau desimalnya 0, maka penulisannnya menjadi
p=0,0005), berarti pada alpha 5%, dapat disimpulkan ada perbedaan berat
bayi diantara keempat jenjang pendidikan.
Pada Box paling bawah terlihat hasil dari uji ‘Multiple Comparisons
Bonferroni” yang berguna untuk menelusuri lebih lanjut kelompok mana saja
yang berhubungan signifikan. Untuk mengetahui kelompok yang signifikan
dapat terlihat dari kolom Sig. Ternyata kelompok signifikan adalah tingkat

Untuk dipakai di lingkungan sendiri 45


pendidikan SD dengan SMU, SD dengan PT, SMP dengan SMU, SMP
dengan PT dan SMU dengan PT.

Penyajian dan Interpretasi di laporan Penelitian


Tabel …
Distribusi Rata-Rata berat Bayi Menurut Tingkat pendidikan
Variabel Mean SD 95% CI P value
Pendidikan
- SD 2470,0 249,6 2291,4 – 2648,6 0,0005
- SMP 2727,2 241,2 3565,2 – 2889,3
- SMU 3431,2 270,1 3287,3 – 3575,1
- PT 3761,5 386,3 3528,1 – 3994,9

Rata-rata berat bayi pada mereka yang berpendidikan SD adalah


2470,0 gram dengan standar deviasi 249,6 gram. Pada mereka yang
berpendidikan SMP rata-rata berat bayinya adalah 2727,20 gram dengan
standar deviasi 241,2 gram. Pada mereka yang berpendidikan SMU rata-rata
berat bayinya adalah 3431,2 gram dengan standar deviasi 270,1 gram. Pada
mereka yang berpendidikan PT rata-rata berat bayinya adalah 3761,5 gram
dengan standar deviasi 386,3 gram.
Hasil uji statistik didapat niali p=0,0005, berarti pada alpha 5% dapat
disimpulkan ada perbedaan berat bayi diantara keempat jenjang pendidikan.
Analisis lebih lanjut membuktikan bahwa kelompok yang berbeda signifikan
adalah tingkat pendidikan SD dengan SMU, SD dengan PT, SMP dengan
SMU,SMP dengan PT dan SMU dengan PT.

Untuk dipakai di lingkungan sendiri 46


ANALISIS HUBUNGAN
KATAGORIK DENGAN KATAGORIK

UJI KAI KUADRAT


Seringkali dalam suatu penelitian, kita menemui data yang tidak dapat
dinyatakan dalam bentuk angka-angka pengukuran (data numerik).
Sebaliknya justru yang kita jumpai adalah data hasil dari menghitung jumlah
pengamatan yang diklasifikasikan atas beberapa katagori. Data seperti ini
disebut data katagorik (kualitatif), misalnya jenis kelamin yang mempunyai
katagori: laki-laki dan perempuan; status merokok yang mempunyai katagori;
perokok berat, perokok ringan dan tidak merokok. Dalam penelitian
kesehatan seringkali peneliti perlu melakukan analisis hubungan variabel
katagorik dengan variabel katagorik. Analisis ii bertujuan untuk menguji
perbedaan proporsi dua atau lebih kelompok sampel. Uji statistik yang
digunakan untuk menjawab kasus tersbut adalah UJI KAI KUADRAT (CHI
SQUARE).
Misalnya ingin diketahui hubungan jenis pekerjaan dengan perilaku
menyusui ibu, apakah ada perbedaan proporsi kejadian menyusui eksklusif
antara ibu yang bekerja dengan ibu yang tidak bekerja. Dari contoh terlihat
bahwa variabel jenis pekerjaan (bekerja/tidak bekerja) merupakan variabel
katagorik, dan variabel perilaku menyusui (eksklusif/non eksklusif) juga
merupakan variabel katagorik.
Sebelum berlanjut lebih dalam tentang kai kuadrat terlebih dahulu kita
pahami dengan benar apa itu variabel katagorik. Suatu variabel disebut
katagorik bila isi variabel tersebut terbentuk dari hasil
klasifikasi/penggolongan, misalnya variabel sex, jenis pekerjaan, golongan
darah, pendidikan. Di lain pihak variabel numerik (misalnya berat badan, umur
dll) dapat masuk/dapat menjadi variabel katagorik bila variabel tersebut sudah
mengalami pengelompokan. Misalkan kita ambil satu contoh variabel berat
badan, berat badan bila nilainyamasih riil (50 kg, 63 kg dst) maka masih
termasuk variabel numerik, namun bila sudah dilakukan pengelompokan

Untuk dipakai di lingkungan sendiri 47


menjadi (<50 kg (kurus), 50-60 kg (sedang) dan > 60 (gemuk) maka variabel
tersebut sudah berjenis katagorik.

1. Tujuan Uji kai Kuadrat


Tujuan dari digunakannya uji kai kuadrat adalah untuk untuk menguji
perbedaan proporsi/persentase antara beberapa kelompok data. Dilihat dari
segi datanya uji kai kuadrat dapat digunakan untuk mengetahui hubungan
antara variabel katagorik dengan variabel katagorik. Contoh pertanyaan
penelitian untuk kasus yang dapat dipecahkan oleh uji kai kuadrat misalnya:
a. Apakah ada perbedaan kejadian hipertensi antara wanita dan
pria. Kasus ii berarti akan menguji hubungan variabel hipertensi (katagori
dengan klasifikasi ya dan tidak) dengan variabel jenis kelamin (katagori
dengan klasisfikasi wanita dan pria)
b. Apakah ada perbedaan kejadian anemia antara ibu yang kondisi
soseknya tinggi, sedang dan rendah. Pada kasus ini akan menguji
hubungan variabel anemia katagori dengan klasifikasi ya dan tidak)
dengan variabel Sosek (katagori dengan klasifikasi rendah, sedang dan
tinggi).

2. Prinsip dasar Uji Kai Kuadrat


Proses pengujian kai kuadrat adalah membandingkan frekuensi yang
terjadi (observasi) dengan frekuensi harapan (ekspektasi). Bila nilai frekuensi
observasi dengan nilai frekuensi harapan sama, maka dikatakan tidak ada
perbedaan yang bermakna (signifikan). Sebaliknya, bila niali frekuensi
observasi dan nilai frekuensi harapan berbeda, maka dikatakan ada
perbedaan yang bermakna (signifikan).
Pembuktian dengan uji kai kuadrat dengan menggunakan formula:

(O – E)2
X2 = Σ
E

df = (k-1)(n-1)
ket :

Untuk dipakai di lingkungan sendiri 48


O = nilai observasi
E = nilai ekspektasi (harapan)
k = jumlah kolom
b = jumlah baris
Untuk mempermudah analisis kai kuadrat, nilai data kedua variabel disajikan
dalam bentuk tabel silang:
Variabel 1 Variabel 2 Jumlah
Tinggi Rendah
Ya a b a+b
Tidak c d c+d
Jumlah a+c b+d n
a, b, c, d merupakan nilai observasi, sedangkan niali ekspektasi (harapan)
masing-masing sel dicari dengan rumus:

Total barisnya X total kolomnya


E=
Jumlah keseluruhan data

misalkan untuk mencari nilai ekspektasi (E) untuk sel a adalah:


Ea = (a+b) x (a+c)
n
Untuk Eb, Ec dan Ed dapat dicari dengan cara yang sama.
Khususnya untuk tabel 2x2, dapat mencari nilai X 2 dengan menggunakan
rumus:

N (ad-bc)2
X =
2

(a+c)(b+d)(a+b)(c+d)

Uji kai kuadrat sangat baik untuk tabel dengan derajat kebebasan (df) yang
besar. Sedangkan khusus untuk tabel 2 x 2 (df-nya adalah 1) sebaiknya
digunakan uji kai kuadrat yang sudah dikoreksi (Yate Corrected atau Yate’s
Correction). Formula kai kuadrat Yate’s Correction adalah sbb:

(|O – E| - 0,5)2
X2 =
E

Untuk dipakai di lingkungan sendiri 49


Atau

N {|ad-bc|2 – (N/2)]2
X =
2

(a+c)(b+d)(a+b)(c+d)

3. Keterbatasan Kai Kuadrat


Seperti kita ketahui, uji kai kuadrat menuntut frekuensi
harapan/ekspektasi (E) dalam masing-masing sel tidak boleh terlampau kecil.
Jika frekuensi sangat kecil, penggunaan uji ini mungkin kurang tepat. Oleh
karena itu dalam penggunaan kai kuadrat harus memperhatikan
keterbatasanketerbatasan uji ini. Adapun keterbatasan uji kai kuadrat adalah
sbb:
a. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari
1.
b. Tidak boleh ada sel yang mempunyai nilai harapan (nilai E) kurang dari
5, lebih dari 20% dari jumlah sel.
Jika keterbatasan tersebut terjadi pada saat uji kai kuadrat, peneliti
harus menggabungkan katagori-katagori yang berdekatan dalam rangka
memperbesar frekuensi harapan dari sel-sel tersebut (penggabungan ini
dapat dilakukan untuk analisis tabel silang lebih dari 2 x 2, misalnya 3 x 2, 3 x
4 dsb). Penggabungan ini tentunya diharapkan tidak sampai membuat
datanya kehilangan makna.
Andai saja keterbatasan tersebut terjadi pada tabel 2 x 2 (ini berarti
tidak bisa menggabung katagori-katagorinya lagi), maka dianjurkan
menggunakan uji Fisher’s Exact.

ODDS RATIO (OR) dan RISIKO RELATIF (RR)


Hasil uji Chi Square hanya dapat menyimpulkan ada tidaknya
perbedaan proporsi antar kelompok atau dengan kata lain kita hanya dapat
menyimpulkan ada/tidaknya hubungan du variabel katagorik. Dengan
demikian uji Chi Square tidak dapat menjelaskan derajat hubungan, dalam hal

Untuk dipakai di lingkungan sendiri 50


ini uji Chi Square tidak dapat mengetahui kelompok mana yang memiliki risiko
lebih besar disbanding kelompok lain.
Dalam bidang kesehatan untuk mengetahui derajat hubungan, dikenal
ukuran Risiko Relatif (RR) dan Odds Rasio (OR). Risiko relatif
membandingkan risiko pada kelompok terekspose dengan kelompok tidak
terekspose. Sedangkan Odds Rasio membandingkan Odds pada kelompok
ter-ekspose dengan Odds kelompok tidak ter-eksp[ose. Ukuuran RR pada
umumnya digunakan pada disain Kohort, sedangkan ukuran OR biasanya
digunakan pada desain kasus kontrol atau ptong lintang (Cross Sectional).

Pengkodean Variabel :
Perlu diketahui bahwa dalam mengeluarkan nilai OR dan RR harus
hati hati jangan sampai terjadi kesalahan pengkodean. Pemberian kode harus
ada konsistensi antara variabel independen dengan variabel dependen.
Untuk variabel independen, kelompok yang berisiko/expose diberi kode tinggi
(kode 1) dan kode rendah (kode 0)untuk kelompok yang tidak berisiko/non
expose. Pada variabel dependennya, kode tinggi (kode 1) untuk kelompok
kasus atau kelompok yang menjadi fokus pembahasan penelitian dan kode
rendah (kode 0) untuk kelompok non kasus atau yang bukan menjadi fokus
penelitian. Sebagai contoh data di atas pengkodeannya adalah sbb: Ibu tidak
bekerja diberi kode 1 dan bekerja kode 0 dan ibu yang menyusui secara
eksklusif diberi kode 1 dan non eksklusif diberi kode 0. Sebetulnya bisa juga
kodenya dibalik, tapi harus
konsisten, misalnya kodenya: tidak bekerja =0, bekerja =1 dan eksklusive =0,
tdk eksklusive =1.
Tabel …
Distribusi Responden menurut Tingkat Pendidikan dan Pengetahuan
Pengetahuan
Total
Pendidikan Rendah Tinggi
N % n % n %
SD 25 50,0 25 50,0 50 34,4
SMP 16 40,0 24 60,0 40 27,6
10 33,3 20 66,7 30
SMU 20,7

Untuk dipakai di lingkungan sendiri 51


PT 5 20,0 20 80,0 25 17,3
Jumlah 56 38,7 89 61,3 145 100,0

Pembuatan persentase pada analisis tabel silang harus diperhatikan


agar tidak salah dalam menginterpretasi. Pada jenis penelitian survei/Cross
sectional atau Kohort, pembuatan persentasenya berdasarkan nilai variabel
independen. Contoh di atas jenis penelitiannya Cross Sectional, variabel
pendidikan sebagai variabel independen dan pengetahuan sebagai variabel
dependen. Dapat dilihat di tabel persentasenya berdasarkan masing-masing
kelompok tingkat pendidikan (persentase baris). Contoh di atas dapat di
interpretasikan sbb:
Dari 50 pasien yang berpendidikan SD, ada sebanyak 25 (50,0%)
pasien mempunyai pengetahuan tinggi. Dari 40 pasien yang berpendidikan
SMP, ada sebanyak 24 (60,0%) yang berpengetahuan tinggi. Dari 30 pasien
yang berpendidikan SMU ada sebanyak 20 (66,7%) yang berpengetahuan
tinggi. Dan dari 25 pasien yang berpendidikan PT, ada sebanyak 20 (80,0%)
yang berpengetahuan tinggi. Dari data ini terlihat ada kecenderungan bahwa
semakin tinggi tingkat pendidikan akan semakin tinggi tingkat
pengetahuannya.
Pada penelitian yang berjenis kasus kontrol (Case Control) pembuatan
persentasenya berdasarkan variabel dependennya, misalkan terlihat pada
tabel berikut:
Tabel …
Distribusi Responden Menurut Kasus kanker paru dan Jenis Kelamin
Kanker Paru
Jenis Total
Kasus Kontrol
Kelamin
N % n % n %
Laki-laki 75 75,0 30 30,0 105 52,5
Perempuan 25 25,0 70 70,0 95 47,5
Jumlah 100 50,0 100 50,0 200 100,0

Interpretasinya:

Untuk dipakai di lingkungan sendiri 52


Dari mereka yang menderita kanker paru, ada sebanyak 75 (75%) responden
berjenis kelamin laki-laki. Sedangkan pada kelompok yang tidak menderita
kanker paru, ada sebanyak (30%) responden yang berjenis kelamin laki-laki.

Untuk dipakai di lingkungan sendiri 53


KASUS :
UJI KAI KUADRAT

Suatu penelitian ingin mengetahui hubngan pekerjaan dengan perilaku


menyusui. Variabel pekerjaan berisi dua nilai yaitu tidak bekerja dan bekerja,
dan variabel menyusui berisi dua nilai yaitu eksklusif dan non eksklusif. Untuk
mengerjakan soal ini gunakan data “Susu. SAV”.

Adapun prosedur di SPSS sbb:


1. Pastikan anda berada pada data editor ASI.SAV
2. Dari menu SPSS, klik “Analyze”, kemudian pilih “Descriptive statistic”,
lalu pilih “Crosstab”, sesaat akan muncul menu Crosstabs
3. Dari menu crosstab, ada dua kotak yang harus diisi, pada kotak
“Row(s)’ diisi variabel independen (variabel bebas), dalam contoh ini
variabel pekerjaan masuk ke kotak “Row(s)”.
4. pada kotak “Column(s)” diisi variabel dependennya, dalam contoh ini
variabel perilaku menyusui masuk ke kotak “Column(s)”.

5. Klik option “Statistics..”, klik pilihan “Chi Square” dan klik pilihan “Risk”

Untuk dipakai di lingkungan sendiri 54


6. Klik “Continue”
7. Klik option “Cells”, bawa bagian “Percentages” dan klik “Row”

8. Klik “Continue”
9. Klik “OK” hasilnya tampak sbb:

Untuk dipakai di lingkungan sendiri 55


Crosstabs
status pekerjaan ibu * status menyusui asi Crosstabulation
status menyusui asi
Total
tdk
EKSKLUSIVE EKSKLUSIVE
status KERJA Count 17 8 25
pekerjaan % within
ibu status 68.0% 32.0% 100.0%
pekerjaan
ibu
tidak kerja Count 7 18 25
% within
status 28.0% 72.0% 100.0%
pekerjaan
ibu
Total Count 24 26 50
% within
status 48.0% 52.0% 100.0%
pekerjaan
ibu

Chi-Square Tests
Asymp. Exact Sig. Exact
Value df Sig. (2-sided) Sig.
(2-sided) (1-sided)
Pearson Chi-Square 8.013b 1 .005
Continuity 6.490 1 .011
Correctiona 8.244 1 .004
Likelihood Ratio .010 .005
Fisher's Exact Test 7.853 1 .005
Linear-by-Linear
Association 50
N of Valid Cases

a. Computed only for a 2x2 table


b. 0 cells (.0%) have expected count less than 5. The minimum expected
count is 12. 00.

Untuk dipakai di lingkungan sendiri 56


Risk Estimate
95% Confidence
Value Interval
Lower Upper
Odds Ratio for
status 5.464 1.627 18.357
pekerjaan ibu
(TIDAK
KERJA / KERJA) 2.250 1.209 4.189
For cohort status
menyusui asi = YA
EKSKLUSIVE .412 .208 .816
For cohort status
menyusui asi = 50
TIDAK EKSKLUS
N of Valid Cases

Pada hasil di atas tertampil tabel silang antara pekerjaan dengan pola
menyusui, dengan angka di masing-masing selnya. Angka yang paling atas
adalah jumlah kasus masing-masing sel, angka kedua adalah persentase
menurut baris (data yang kita analisis “ASI.SAV, berasal dari penelitian Cross
Sectional sehingga persen yang ditampilkan adalah persentase baris, namun
bila jenis penelitiannya Case Control angka persentase yang digunakan
adalah persentase kolom.
Dari analisis data di atas maka interpretasinya:
Ada sebanyak 18 (72,0%) ibu yang tidak bekerja menyusui bayi secara
eksklusif. Sedangkan diantara ibu yang bekerja, ada 8 (32,0%) yang
menyusui secara eksklusif. Hasil uji Chi Square dapat dilihat pada kotak “Chi
Square Test”. Dari print out muncul dengan beberapa bentuk/angka sehingga
menimbulkan pertanyaan, “Angka yang mana yang kita pakai?”, apakah
Pearson, Continuity Correction, Likelihood atau Fisher?”
Aturan yang berlaku pada Chi Square adalah sbb:
a. Bila pada 2 x 2 dijumpai nilai Expected (harapan) kurang dari 5, maka
yang digunakan adalah “Fisher’s Exact Test”
b. Bila tabel 2 x 2, dan tidak ada nilai E < 5, maka uji yang dipakai
sebaiknya “Continuity Correction (a)”
c. Bila tabelnya lebih dari 2 x 2, misalnya 3 x 2, 3 x 3 dsb, maka
digunakan uji “Pearson Chi Square”

Untuk dipakai di lingkungan sendiri 57


d. Uji “Likelihood Ratio” dan “Linear-by-Linear Assciation”, biasanya
digunakan untuk keperluan lebih spesifik, misalnya analisis stratifikasi
pada bidang epidemiologi dan juga untuk mengetahui hubungan linier dua
variable katagorik, sehingga kedua jenis ini jarang digunakan.

Untuk mengetahui adanya nilai E kurang dari 5, dapat dilihat pada footnote b
dibawah kotak Chi-Square Test, dan tertulis diatas nilainya 0 cell (0 %) berarti
pada tabel silang diatas tidak ditemukan ada nilai E < 5
Dengan demikian kita menggunakan uji Chi Square yang sudah
dilakukan koreksi (Continuity Correction) dengan p value dapat dilihat pada
kolom “Asymp. Sig” dan terlihat p valuenya = 0,011. berarti kesimpulannya
ada perbedaan perilaku menyusui eksklusif antara ibu yang bekerja dengan
ibu yang tidak bekerja. Dengan kata lain dapat disimpulkan bahwa ada
hubungan status pekerjaan dengan perilaku menyusui eksklusif.
Uji Chi square hanya dapat digunakan untuk mengetahuiada/tidaknya
hubungan dua variabel, sehingga uji ini tidak dapat untuk mengetahui
derajat/kekuatan hubungan dua variabel. Untuk mengetahui besar/kekuatan
hubungan banyak metodenya tergantung latar belakangdisiplin keilmuannya,
misal untuk ilmu sosial dengan melihat koefisien Phi, koefisien Contingency
dan cramer’s V. sedangkan untuk bidang kesehatan terutama kesehatan
masyarakat digunakan nilai OR atau RR. Nilai OR digunakan untuk jenis
penelitian Cross Sectional dan Case Control, sedangkan nilai RR digunakan
bila jenis penelitiannya Kohort.
Pada hasil di atas nilai OR terdapat pada baris Odds ratio yaitu 5,464
(95% CI: 1,627 – 18,357). Sedangkan nilai RR terlihat dari baris For Cohort
yaitu bearnya 2,250 (95% CI: 1,209 – 4,189). Pada data ini berasal dari
penelitian Cross Sectional maka kita dapat menginterpretasikan nialai
OR=5,464 sbb: Ibu yang tidak bekerja mempunyai peluang 5,46 kali untuk
menyusui eksklusif dibandingkan ibu yang bekerja.. Pada perintah Crosstab
nilai OR akan keluar bila tabel silang 2 x 2, bila tabel silang lebih dari 2 x 2,
misalnya 3 x 2, 4 x 2 dsb, maka nilai OR dapat diperoleh dengan analisis
regresi logistik sederhana dengan cara membuat “Dummy variable”

Untuk dipakai di lingkungan sendiri 58


Penyajian dan Interpretasi di Laporan Penelitian:
Tabel …
Distribusi Responden Menurut Jenis Pekerjaan dan Perilaku menyusui
Menyusui Total
Jenis OR P
Tdk Eksklusif Eksklusif
Pekerjaan (95% CI) value
n % n % n %
Bekerja 17 68,0 8 32,0 25 100 5,464 0,011
Tdk 7 28,0 18 72,0 25 100 1,6 –
Bekerja 18,3
Jumlah 26 52,0 24 48,0 50 100

Hasil analisis hubungan antara status pekerjaan dengan perilaku menyusui


eksklusif diperoleh bahwa ada sebanyak 8 (32%) ibu yang bekerja menyusui
bayi secara eksklusif. Sedangkan diantara ibu yang tidak bekerja, ada 18
(72,0%) yang menyusui secara eksklusif. Hasil uji statistik diperoleh nilai
p=0,011 maka dapat disimpulkan ada perbedaan proporsi kejadian menyusui
eksklusif antara ibu tidak bekerja dengan ibu yang bekerja (ada hubungan
yang signifikan antara pekerjaan dengan perilaku menyusui). Dari hasil
analisis diperoleh pula nilai OR=5,464, artinya ibu tidak bekerja mempunyai
peluang 5,46 kali untuk menyusui eksklusif dibanding ibu yang bekerja.

Untuk dipakai di lingkungan sendiri 59


ANALISIS HUBUNGAN
NUMERIK DENGAN NUMERIK

UJI KORELASI DAN REGRESI LINIER SEDERHANA

Seringkali dalam suatu penelitian kita ingin mengetahui hubungan


antara dua variabel yang berjenis numerik, misalnya huubungan berat badan
dengan tekanan darah, hubungan umur dengan kadar Hb, dsb. Hubungan
antara dua variabel numerik dapat dihasilkan dua jenis, yaitu derajat/keeratan
hubungan, digunakan korelasi. Sedangkan bila ingin mengetahui bentuk
hubungan antara dua variabel digunakan analisis regresi linier.

1. Korelasi
Korelasi di samping dapat untuk mengetahui derajat/keeratan
hubungan, korelasi dapat juga untuk mengetahui arah hubungan dua variabel
numerik. Misalnya, apakah huubungan berat badan dan tekanan darah
mempunyai derajat yang kuat atau lemah, dan juga apakah kedua variabel
tersebut berpola positif atau negatif.
Secara sederhana atau secara visual hubungan dua variabel dapat
dilihat dari diagram tebar/pencar (Scatter Plot). Diagram tebar adalah grafik
yang menunjukkan titik-titik perpotongan nilai data dari dua variabel (X dan
Y). Pada umumnya dalam grafik, variabel independen (X) diletakkan pada
garis horizontal sedangkan variabel dependen (Y) pada garis vertikal.
Dari diagram tebar dapat diperoleh informasi tentang pola hubungan
antara dua variabel X dan Y. selain memberi informasi pola hubungan dari
kedua variabel diagram tebar juga dapat menggambarkan keeratan hubungan
dari kedua variabel tersebut.

Untuk dipakai di lingkungan sendiri 60


disimbolkan dengan r (huruf r kecil).
Koefisien korelasi (r) dapat diperoleh dari formula berikut:

N (Σ XY) – (ΣX ΣY)


r=
[NΣX2 – (ΣX)2] [NΣY – (ΣY)2

Nilai korelasi (r) berkisar 0 s.d. 1 atau bila dengan disertai arahnya nilainya
antara –1 s.d. +1.
r = 0 → tidak ada hubungan linier
r = -1 → hubungan linier negatif sempurna
r = +1 → hubungan linier positif sempurna
Hubungan dua variabel dapat berpola positif maupun negatif.
Hubungan positif terjadi bila kenaikan satu diikuti kenaikan variabel yang lain,
misalnya semakin bertambah berat badannya (semakin gemuk) semakin
tinggi tekanan darahnya. Sedangkan hubungan negatif dapat terjadi bila
kenaikan satu variabel diikuti penurunan variabel yang lain, misalnya semakin
bertambah umur (semakin tua) semakin rendah kadar Hb-nya.

Menurut Colton, kekuatan hubungan dua variabel secara kualitatif dapat


dibagi dalam 4 area, yaitu:
r = 0,00 – 0,25 → tidak ada hubungan/hubungan lemah
r = 0,00 – 0,25 → hubungan sedang
r = 0,00 – 0,25 → hubungan kuat
r = 0,00 – 0,25 → hubungan sangat kuat / sempurna

Untuk dipakai di lingkungan sendiri 61


Uji Hipotesis
Koefisien korelasi yang telah dihasilkan merupakan langkah pertama
untuk menjelaskan derajat hubungan derajat hubungan linier anatara dua
variabel. Selanjutnya perlu dilakukan uji hipotesis untuk mengetahui apakah
hubungan antara dua variabelteradi secara signifikan atau hanya karena
faktor kebetulan dari random sample (by chance). Uji hipotesis dapat
dilakukan dengan dua cara, yaitu pertama: membandingkan nilai r hitung
dengan r tabel, kedua: menggunakan pengujian dengan pendekatan distribusi
t. Pada modul ini kita gunakan pendekatan distribusi t, dengan formula:
n–2
t=r
1 – r2
df = n – 2
n = jumlah sampel

2. Regresi Linier Sederhana


Seperti sudah diuraikan di depan bahwa analisis hubungan dua
variabel dapat digunakan untuk mengetahui bentuk hubungan dua variabel,
yaitu dengan analisis regresi.
Analisis regresi merupakan suatu model matematis yang dapat
digunakan untuk mengetahui bentuk hubungan antar dua atau lebih variabel.
Tujuan analisis regresi adalah untuk membuat perkiraan (prediksi) nilai suatu
variabel (variabel dependen) melalui variabel yang lain (variabel independen).
Sebagai contoh kita ingin menghuubungkan dua variabel numerik berat
badan dan tekanan darah. Dalam kasus ini berarti berat badan sebagai
variabel independen dan tekanan darah sebagai variabel dependen, sehingga
dengan regresi kita dapat memperkirakan besarnya nilai tekanan darah bila
diketahui data berat badan.
Untuk melakukan prediksi digunakan persamaan garis yang dapat
diperoleh dengan berbagai cara/metode. Salah satu cara yang sering
digunakan oleh peneliti adalah dengan menggunakan metode kuadrat terkecil
(least square). Metode least square merupakan suatu metode pembuatan
garis regresi dengan cara meminimalkan jumlah kuadrat jarak antara nilai Y

Untuk dipakai di lingkungan sendiri 62


yang teramati dan Y yang diramalkan oleh garis regresi itu. Secara matematis
persamaan garis sbb:

Y = a + bx

Persamaan di atas merupakan model deterministik yang secara


sempurna/tepat dapat digunakan hanya untuk peristiwa alam, misalnya
hukum gravitasi bumi, yang ditemukan oleh Issac Newton adalah contoh
model deterministik. Variabel kecepatan benda jatuh (variabel dependen)
pada keadaan yang ideal adalah fungsi matematik sempurna (bebas dari
kesalahan) dari variabel independen berat beda dan gaya gravitasi.
Contoh lain misalnya hubungan antar suhu Fahrenheit dengan suhu Celcius
dapat dibuat persamaan Y = 32 + 9/5X. variabel suhu Fahrenheit (Y) dapat
dihitung/diprediksi secara sempurna/tepat (bebas kesalahan) bila suhu
celsius (X) diketahui.
Ketika berhadapan pada kondisis ilmu sosial, hubungan antar variabel ada
kemungkinan kesalahan/penyimpangan (tidak eksak), aretinya untuk
beberapa nilai X yang sama kemungkinan diperoleh nilai Y yang berbeda.
Misalnya hubungan berat badan dengan tekanan darah, tidak setiap orang
yang berat badannya sama memiliki tekanan darah yang sama. Oleh karena
hubungan X

Y = a + bx + e

dan Y pada ilmu sosial/kesehatan masyarakat tidaklah eksak, maka


persamaan garis yang dibentuk menjadi:
Y = Variabel Dependen
X = Variabel Independen
a = Intercept, perbedaan besarnya rata-rata variabel Y ketika variabel X = 0
b = Slope, perkiraan besarnya perubahan nialia variabel Y bila nilai variabel
X berubah satu unit pengukuran
e = nilai kesalahan (error) yaitu selisih antara niali Y individual yang teramati
dengan nilai Y yang sesungguhnya pada titik X tertentu

ΣXY – (ΣXΣY)/n
b= a = Y - bX
ΣX2 – (ΣX)2/n

Untuk dipakai di lingkungan sendiri 63


Kesalahan Standar Estimasi (Standard Error of Estimate/Se)
Besarnya kesalahan standar estimasi (Se) menunjukkan ketepatan
persamaan estimasi untuk menjelaskan nilai variabel dependen yang
sesungguhnya. Semakin kecil nilai Se, makin tinggi ketepatan persamaan
estimasi yang dihasilkan untuk menjelaskan niali variabel dependen yang
sesungguhnya. Dansebaliknya, semakin besar nilai Se, makin rendah
ketepatan persamaan estimasi yang dihasilkan untuk menjelaskan nilai
variabel dependen yang sesungguhnya. Untuk mengetahhui besarnya Se
dapat dihitung melalui formula sbb:

Se = ΣY2 - aΣY - bΣXY


n-2

Koefisien Determinasi (R2)


Ukuran yang penting dan sering digunakan dalam analisisregresi adalah
koefisien determinasi atau disimbolkan R 2 (R Square). Koefisien determinasi
dapat dihitung dengan mengkuadratkan nilai r, atau dengan formula R 2 = r2.
Koeifisien determinasi berguna untuk mengetahui seberapa besar variasi
variabel dependen (Y) dapat dijelaskan oleh variabel independen (X). atau
dengan kata lain R2 menunjukkan seberapa jauh variabel independen dapat
memprediksi variabel dependen.Semakin besar nilai R square semakin
baik/semakin tepat variabel independen memprediksi variabel dependen.
Besarnya nilai R square antara 0 s.d. 1 atau antara 0% s.d. 100%.

Untuk dipakai di lingkungan sendiri 64


KASUS :
KORELASI DAN REGRESI
Sebagai contoh kita akan melakukan analisis korelasi dan regresi
menggunakan data ‘ASI.SAV’ dengan mengambil variabel yang bersifat
numerik yaitu umur dengan kadar Hb (diambil Hb pengukuran pertama: Hb1).
A. Korelasi
Untuk mengeluarkan uji korelasi langkahnya adalah sbb:
1. Aktifkan data ‘ASI.SAV’
2. Dari menu utama SPSS, klik ‘Analyze’, kemudian pilih
‘Correlate’, dan lalu pilih ‘Bivariate’, dan muncullah menu Bivariate
Correlations:

3. Sorot variabel ‘Umur dan Hb1, lalu masukkan ke kotak sebelah


kanan ‘variables’.
4. Klik ‘OK” dan terlihat hasilnya sbb:
Correlations
Correlations
berat berat
badan ibu badan bayi
berat badan ibu Pearson 1 .684**
Correlation .000
Sig. (2-tailed) 50 50
N
berat badan bayi Pearson .684** 1
Correlation .000
Sig. (2-tailed) 50 50
N

Untuk dipakai di lingkungan sendiri 65


**. Correlation is significant at the 0.01 level (2-tailed).
Tampilan analisis korelasi berupa matrik antar variabel yang di
korelasi, informasi yang muncul terdapat tiga baris, baris pertama berisi nilai
korelasi (r), baris kedua menapilkan nilai p (P value), dan baris ketiga
menampilkan N (jumlah data). Pada hasil di atas diperoleh nilai r = 0,684 dan
nilai p = 0,0005. Kesimpulan dari hasil tersebut: hubungan berat badan ibu
dengan berat badan bayi menunjukkan hubungan yang kuat dan berpola
positif artinya semakin bertambah berat badannya semakin tinggi berat
bayinya. Hasil uji statistik didapatkan ada hubungan yang signifikan antara
berat badan ibu dengan berat badan bayi (p = 0,0005).

B. Regresi Linier Sederhana


Berikut akan dilakukan analisis regresi linier dengan menggunakan
variabel ‘berat badan ibu’ dan ‘berat badan bayi’ dari data ASI.SAV. dalam
analisis regresi kita harus menentukan variabel dependen dan variabel
independennya. Dalam kasus ini berarti berat badan ibu sebagai variabel
independen dan berat badan bayi sebagai variabel dependen. Adapun
caranya:
1. Pastikan tampilan berada pada data editor ASI.SAV, jika belum
aktifkan data tersebut.
2. Dari menu SPSS, Klik ‘Analysis’, pilih ‘Regression’, pilih ‘Linear’
3. Pada tampilan di atas ada beberpa kotak yang harus diisi. Pada kotak
‘Dependen’ isikan variabel yang kita perlakukan sebagai dependen (dalam
contoh ini berarti berat badan bayi) dan pada kotak Independent isikan
variabel independennya (dalam contoh ini berarti berat badan ibu),
caranya
4. klik ‘berat badan bayi’, masukkan ke kotak Dependent
5. Klik ‘berat badan ibu’, masukkan ke kotak Independent

Untuk dipakai di lingkungan sendiri 66


6. Klik ‘OK’, dan hasilnya sbb:

Regression
Model Summary
Model R R Square Adjusted Std. Error of
R Square the Estimate
1 .684a .468 .456 430.715
a. Predictors: (Constant), berat badan ibu

ANOVA
b
Model Sum of df Mean F Sig.
Squares Square
1 Regressio 7820262 1 7820261.965 42.154 .000a
n 8904738 48 185515.376
Residual 16725000 49
Total
a. Predictors: (Constant), berat badan ibu
b. Dependent Variable: berat badan bayi’

Untuk dipakai di lingkungan sendiri 67


Coefficients
a
Unstandardized Standardized t Sig.
Coefficients Coefficients
Model B Std. Error Beta
1 (Constant) 657.929 391.676 1.680 .099
berat badan 44.383 6.836 .684 6.493 .000
ibu
a. Dependent Variable: berat badan bayi

Dari hasil di atas dapat diinterpretasikan dengan mengkaji nilai-nilai yang


penting dalam regresi linier diantaranya: koefisien determinasi, persamaan
garis dan p value. Nilai koefisien determinasi dapat dilihat dari nilai R Square
(anda dapat lihat pada tabel ‘Model Summary’) yaitu besarnya 0,468 artinya,
persamaan garis regresi yang kita peroleh dapat menerangkan 46,8% variasi
berat badan bayi atau persamaan garis yang diperoleh cukup baik untuk
menjelaskan variabel berat badan bayi. Selanjutnya pada tabel ANOVA b,
diperoleh nilai p (di kolom Sig) sebesar 0,0005, berarti pada alpha 5% kita
dapat menyimpulkan bahwa regresi sederhana cocok (fit) dengan data yang
ada persamaan garis regresi dapat dilihat pada tabel ‘Coefficient a’ yaitu pada
kolom B. Dari hasil diatas didapat nilai konstant (nilai ini merupakan nilai
intercept atau nilai a) sebesar 657,93 dan nilai b = 44,38, sehingga
persamaan regresinya:
Y = a + bX
Berat badan bayi = 657,93 + 44,38(berat badan ibu)

Dengan persamaan tersebut, berat badan bayi dapat diperkirakan jika kita
tahu nilai berat badan ibu. Uji uji statistik untuk koefisien regresi dapat dilihat
pada kolom Sig T, dan menghasilkan nilai p=0,0005. Jadi pada alpha 5% kita
menolak hipotesis nol, berarti ada hubngan linier antara berat badan ibu
dengan berat badan bayi. Dari nilai b=44,38 berarti bahwa variabel berat
badan bayi akan bertambah sebesar 44,38 gr bila berat badan ibu bertambah
setiap satu kilogram.

Untuk dipakai di lingkungan sendiri 68


Penyajian dan Interpretasi
Tabel …
Analisis Korelasi dan regresi berat badan ibu dengan berat badan bayi
Variabel R R2 Persamaan garis P value
Umur 0,684 0,468 bbayi =657,93 + 44,38 *bbibu 0,0005

Hubungan berat badan ibu dengan berat badan bayi menunjukkan hubungan
kuat (r=0,684) dan berpola positif artinya semakin bertambah berat badan ibu
semakin besar berat badan bayinya. Nilai koefisien dengan determinasi 0,468
artinya, persamaan garis regresi yang kita peroleh dapat menerangkan
46,8,6% variasi berat badan bayi atau persamaan garis yang diperoleh cukup
baik untuk menjelaskan variabel berat badan bayi. Hasil uji statistik
didapatkan ada hubungan yang signifikan antara berat badan ibu dengan
berat badan bayi (p=0,005).

Memprediksi variabel Dependen


Dari persamaan garis yang didapat tersebut kita dapat memprediksi variabel
dependen (berat badan bayi) dengan variabel independen (berat badan ibu).
Misalkan kita ingin mengetahui berat badan bayi jika diketahui berat badan
ibu sebesar 60 kg, maka:
Berat badan bayi =657,93 + 44,38(berat badan ibu)
Berat badan bayi= 657,93 + 44,38(60)
Berat badan bayi = 3320,73
Ingat prediksi regresi tidak dapat menghasilkan angka yang tepat seperti
diatas, namun perkiraannya tergantung dari nilai ‘Std, Error of The
estimate’(SEE) yang besarnya adalah 430,715 (lihat di kotak Model
Summary). Dengan demikian variasi variabel dependen = Z*SEE. Nilai Z
dihitung dari tabel Z dengan tingkat kepercyaan 95% dan didapat nilai Z =
1,96, sehingga variasinya 1,96 * 430,715 = ± 844,201
Jadi dengan tingkat kepercayaan 95%, untuk berat badan ibu 60 kg
diprediksikan berat badan bayinya adalah diantara 2476,5 gr s.d 4164,9 gr

C. Membuat Grafik Prediksi

Untuk dipakai di lingkungan sendiri 69


Langkahnya:
1. Klik ‘Graphs, pilih ‘Scatter’
2. Klik Sampel klik ‘Define’
3. Pada kotak Y Axis isikan variabel dependennya (masukkan veriabel
dependennya (masukkan Hb1)
4. Pada kotak X Axis isikan variabel independennya (masukkan veriabel
dependennya (masukkan Umur)
5. Klik ‘OK’
6. Terlihat di layar grafik scatter plot-nya (garis regresi belum ada?)
7. Untuk mengeluarkan garisnya, klik grafiknya 2 kali
8. klik’Chart’
9. pada kotak ‘Fit Line, Klik Total
10. klik ‘OK’ maka muncul garis regresi

Sumber :
Analisis Data, Sutanto Priyohastomo, Departemen Biostatistik, Fakultas
Kesehatan Masyarakat Universitas Indonesia.

Untuk dipakai di lingkungan sendiri 70

Anda mungkin juga menyukai