KEDOKTERAN DAN
KESEHATAN
Penulis :
Dr. Sumardiyono, S.KM, M.Kes.
dr. Ratnawati, M.Kes
dr. Nining Lestari, MPH
dr. Siti Thomas Zulaikhah, M.Kes
dr. Denny Anggoro Prakoso M.Sc, FISPH
dr. Hari Peni Julianti, M.Kes, Sp.KFR
dr. Ronny Isnuwardana, MIH
dr. Jessica Christanti, M.Kes
dr. Slamet Sunarno Harjosuwarno, MPH
dr. Lutfan Lazuardi, M.Sc., PhD
Badan Kerjasama
Bagian Ilmu Kesehatan Masyarakat-Ilmu Kedokteran
Pencegahan-Ilmu Kedokteran Komunitas
Fakultas Kedokteran Se-Indonesia
Regional IV
i
BIOSTATISTIKA KEDOKTERAN DAN
KESEHATAN
Penulis
Dr. Sumardiyono, S.KM, M.Kes.
dr. Ratnawati, M.Kes
dr. Nining Lestari, MPH
dr. Siti Thomas Zulaikhah, M.Kes
dr. Denny Anggoro Prakoso M.Sc, FISPH
dr. Hari Peni Julianti, M.Kes, Sp.KFR
dr. Ronny Isnuwardana, MIH
dr. Jessica Christanti, M.Kes
dr. Slamet Sunarno Harjosuwarno, MPH
dr. Lutfan Lazuardi, M.Sc., PhD
Editor
Dr. Sumardiyono, S.KM, M.Kes.
dr. Nining Lestari, MPH
dr. Siti Thomas Zulaikhah, M.Kes
ISBN 978-623-95253-1-6
Dimensi
29,7 x 21 cm
Jumlah Halaman
i-viii + 1-358
Penerbit
Badan Kerjasama Bagian Ilmu Kesehatan Masyarakat-Ilmu
Kedokteran Pencegahan-Ilmu Kedokteran Komunitas Fakultas
Kedokteran Se-Indonesia Regional IV
Fakultas Kedokteran
Universitas Islam Sultan Agung
Jalan Raya Kaligawe KM. 4, Semarang (50112)
Jawa Tengah, Indonesia
Telp (024) 6583584
Fax. (024) 6582455
ii
09-KATA PENGANTAR
iii
Tim Penulis
iv
SAMBUTAN
Ratnawati
Ketua
BKS-IKM-IKP-IKK FK
Se-Indonesia Regional IV
Oktober, 2020
v
DAFTAR ISI
vi
BAB XII. ANALISIS REGRESI LOGISTIK (dr. Ronny
Isnuwardana, MIH) ................................................ 251
BAB XIII. UJI DIAGNOSTIK (dr. Jessica Christanti, M.Kes) ... 271
BAB XIV. PENALARAN STATISTIK UNTUK DOKTER
UMUM (dr. Slamet Sunarno Harjosuwarno, MPH) ... 295
BAB XV. VISUALISASI DATA DALAM PUBLIC HEALTH
REPORT (dr. Lutfan Lazuardi, PhD)....................... 323
BAB XVI. CONTOH DAN PEMBAHASAN SOAL UKMPPD
(Dr. Sumardiyono, S.KM, M.Kes) ............................ 337
BIODATA PENULIS ............................................................. 351
vii
viii
BAB I
PENGANTAR BIOSTATISTIKA
KEDOKTERAN DAN KESEHATAN
Tujuan Pembelajaran
1. Mahasiswa memahami pengertian dasar biostatistika.
2. Mahasiswa memahami penggolongan statistika.
3. Mahasiswa memahami perbedaan antara data dan informasi.
4. Mahasiswa memahami pengorganisasian data.
Ringkasan
Biostatistika merupakan ilmu terapan dari statistika yang
membahas tentang makhluk hidup. Statistika merupakan
metode atau alat bantu untuk mengembangkan statistik.
Dalam perkembangannya, biostatistika dipandang sebagai
ilmu statistik terapan pada bidang biologi, farmasi, dan
kesehatan (kedokteran dan kesehatan masyarakat). Statistik
digolongkan menjadi dua yaitu statistik deskriptif dan statistik
inferensial, sedangkan statistik inferensial digolongkan lagi
menjadi statistik parametris dan non parametris. Statistik pada
dasarnya untuk mengelola data menjadi informasi. Dalam
pengorganisasiannya, statistik dilakukan melalui tahap
pengumpulan data (data collecting),pengolahan data (data
processing), penyajian data (data presentation), dan analisis
dan interpretasi (analysis & interpretation).
1
Pesan dalam Belajar
Untuk mempelajari Bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir Bab
karena penjelasan disajikan secara berurutan sampai akhir
Bab. Pada akhir pembelajaran, penting untuk mencoba
menjawab pertanyaan-pertanyaan pada latihan untuk menguji
seberapa besar pengetahuan dan pemahaman dalam
mempelajari Bab ini.
Materi Belajar
A. Pengertian Biostatistika
Secara etimologis, kata “Statistik” berasal darai kata
Status (Bahasa Latin), State (Bahasa Inggris), atau Staat
(Bahasa Belanda) yang berarti “Negara”. Secara umum
statistic merupakan kumpulan bahan/ keterangan berupa data
baik kualitatif maupun kuantitatif yang mempunyai arti penting
dan kegunaan bagi negara. Dalam proses perkembangannya,
statistik dibatasi pada data yang berwujud angka.
Sebelum memahami lebih jauh tentang biostatistika,
marilah kita cermati terlebih dahulu beberapa pengertian dari
istitah-istiilah di bawah ini yang berhubungan dengan
biostatistika:
1. Statistik dalam arti sempit adalah semua yang
menunjukkan kenyataan yang berwujud angka-angka
tentang kejadian khusus.
2
2. Statistik dalam arti luas adalah cara-cara ilmiah yang
dipersiapkan untuk mengumpulkan, menyusun,
menyajikan, dan menganalisis data penelitian yang
berwujud angka-angka dengan tujuan sebagai dasar dalam
menarik kesimpulan yang benar dan untuk mengambil
keputusan yang baik.
3. Penambahan huruf a (+ a) pada kata statistik menjadi
statistika, mengandung makna bahwa statistika merupakan
metode atau alat bantu untuk mengembangkan statistik.
4. Biostatistika berasal dari kata “bio” dan “statistika”. Bio
berarti hidup dan statistika berarti metode statistik yang
membahas tentang kumpulan angka-angka, maka
biostatistika secara harafiah berarti kumpulan angka-angka
tentang kehidupan. Dalam pengertian lain, dikatakan
bahwa biostatistika merupakan ilmu terapan dari statistika
yang membahas tentang makhluk hidup. Dalam
perkembangannya, biostatistik dipandang sebagai ilmu
statistik terapan pada bidang biologi, farmasi, dan
kesehatan (kedokteran dan kesehatan masyarakat).
Dengan demikian statistik sebagai bagian dari ilmu
statistika dapat dikatakan sebagai ilmu pengetahuan yang
membahas dan mengembangkan prinsip-prinsip, metode dan
prosedur yang ditempuh dalam rangka:
1. Pengumpulan data,
2. Penyusunan data,
3. Penyajian data,
4. Penganalisaan data,
3
5. Penarikan kesimpulan, pembuatan perkiraan (estimasi)
serta menyusun prediksi secara ilmiah berdasarkan data.
Dalam bidang kesehatan (kedokteran dan kesehatan
masyarakat), maka dalam hal ini, statistika adalah semua
yang berkaitan dengan pencatatan dalam penilaian
kedokteran dan kesehatan masyarakat masyarakat. Fungsi
statistika dalam bidang kedokteran dan kesehatan
masyarakat, antara lain:
1. Memeberikan gambaran/ keterangan tentang masalah
kedokteran dan kesehatan masyarakat.
2. Menentukan prioritas masalah kedokteran dan kesehatan
masyarakat yang yang perlu ditanggulangi.
3. Menjadi bahan yang dapat digunakan untuk perencanaan
bidang kedokteran dan kesehatan masyarakat.
4. Dapat membandingkan tingkat kesehatan masyarakat antar
kelompok.
5. Menilai dan menganalisis hasil usaha di bidang kedokteran
dan kesehatan masyarakat.
6. Dapat untuk menentukan kebutuhan dalam bidang
kedokteran dan kesehatanmasyarakat yang sudah atau
belum dipenuhi.
7. Dapat digunakan untuk membuktikan hubungan sebab dan
akibat yang berkaitan dengan masalah kedokteran dan
kesehatan masyarakat.
8. Dapat menjadi dokumen data kedokteran dan kesehatan
masyarakat.
4
Penggolongan Statistik
Secara umum, statistik digolongkan menjadi dua kategori
berdasarkan ruang lingkup kajiannya seperti tersaji pada
bagan di bawah ini.
DESKRIPTIF
STATISTIK PARAMETRIS
INFERENSIAL
NON PARAMETRIS
1. Statistik deskriprif
Statistik deskriptif adalah statistik yang digunakan untuk
menggambarkan atau menganalisis suatu data hasil
penelitian, tetapi tidak digunakan untuk membuat
kesimpulan yang lebih luas (generalisasi/ inferensi).
Penelitian yang tidak menggunakan data sampel,
analisisnya menggunakan statistik deskriptif. Akan tetapi,
penelitian yang menggunakan data sampel namun tidak
bermaksud untuk membuat kesimpulan terhadap populasi
dari mana sampel diambil tetap analisisnya menggunakan
statistik deskriptif.
Secara umum statistik deskriptif mendeskripsikan atau
menggambarkan tentang data misalnya:
a. Distribusi frekuensi
1) Tabel, diagram, grafik (histogram, ogive, poligon).
2) Ukuran pemusatan data (mean, median, modus,
kuartil. Desil, persentil).
5
3) Ukuran penyebaran data (jangkauan, jangkauan
antar kuartil, simpangan kuartil, standar deviasi,
varians).
b. Data berkala/ times series (runtut waktu), untuk
mengetahui tren, misalnya perkembangan suatu kasus
penyakit.
c. Regresi dan korelasi, untuk melakukan peramalan
(prediksi) dengan menggunakan analisis regresi linier,
membuat perbandingan (komparatif), tetapi dalam
analisis korelasi, regresi maupun komparatif ini tidak
mengunakan uji signifikansi karena tidak bermaksud
membuat generalisasi (bersifat umum).
2. Statistik inferensial
Dalam arti luas, statistik dikenal juga dengan satistik
inferensial/ statistik induktif/ statistik probabilitas ialah suatu
kegiatan pengumpulan data, pengolahan data, penarikan
kesimpulan, dan membuat tindakan berdasarkan analisis
data yang dikumpulkan atau statistik yang digunakan untuk
menganalisis data sampel yang hasilnya dimanfaatkan atau
digeneralisasikan untuk populasi dimana sampel penelitian
diambil.
Statistik Inferensial dikelompokkan menjadi 2 (dua),
yaitu statistik Parametris dam Statistik Nonparametris.
a. Statistik parametris
Statistik parametris digunakan untuk menganalisis data
penelitian berskala pengukuran interval atau rasio yang
datanya berdistribusi normal. Contoh uji statistik
parametris:
6
1) Uji korelatif antara dua variabel, misalnya uji Person
Product Moment (r).
2) Uji komparatif untuk dua kelompok data tidak
berpasangan, misalnya Independent samples t-test.
3) Uji komparatif untuk lebih dari dua kelompok data
tidak berpasangan, misalnya uji One way anova,
Two way anova.
4) Uji komparatif untuk dua kelompok data
berpasangan, misalnya Paired samples t-test.
5) Uji komparatif untuk lebih dari dua kelompok data
berpasangan uji Repeated anova.
b. Statistik non parametris.
Statistik Nonparametris digunakan untuk menganalisis
data ordinal, nominal, data numerik (rasio atau interval)
yang distribusi datanya tidak normal, atau bebas
distribus. Contoh uji statistik non parametris:
1) Uji korelatif dua variabel data ordinal atau data
numerik berdistribusi tidak normal, misalnya uji
Rank Spearman, uji Somers’d.
2) Uji korelatif dua variabel data nominal, misalnya uji
Koefisien Kontingensi.
3) Uji komparatif dua kelompok data tidak
berpasangan berskala pengukuran ordinal, atau
data numerik berdistribusi data tidak normal,
misalnya uji Mann Whitney.
4) Uji komparatif lebih dari dua kelompok data yang
tidak berpasangan berskala ordinal atau data
7
numerik (rasio dan interval) berdistribusi data tidak
normal, misalnya uji Kruskal-Wallis.
5) Uji komparatif dua kelompok data berpasangan
berskala ordinal, atau data numerik (rasio dan
interval) berdistribusi data tidak normal, misalnya uji
Wilcoxon.
6) Uji komparatif lebih dari dua kelompok data
berpasangan, atau data numerik (rasio dan interval)
berdistribusi data tidak normal, misalnya uji
Friedman.
7) Uji komparatif dua kelompok data tidak
berpasangan berskala nominal, misalnya uji Chi
Square, uji Fisher Exact, uji Kolmogorov Smirnov.
8) Uji komparatif lebih dari dua kelompok data tidak
berpasangan berskala nominal, misalnya uji Chi
Square.
9) Uji komparatif dua kelompok data berpasangan
berskala niminal, misalnya uji Mc Nemar.
10) Uji komparatif lebih dari dua kelompok data tidak
berpasangan berskala nominal, misalnya uji
Cochran.
Pertanyaan latihan
1. Jelaskan pengertian biostatistika!
2. Jelaskan penggolongan statistik!
3. Berikan contoh uji untuk statistik parametris dan non
parameteris!
4. Apa perbedaan data dan informasi, berikan contohnya!
5. Bagimana pengorganisasian data dalam biostatistik?
15
Referensi
16
BAB II
SKALA PENGUKURAN DATA
Tujuan Pembelajaran
1. Mahasiswa mampu mengidentifikasi skala pengukuran data.
2. Mahasiswa mampu menjelaskan kegunaan skala pengukuran
data.
3. Mahasiswa mampu menginput data di SPSS.
4. Mahasiswa mampu mengubah skala data numerik menjadi skala
data kategorik.
5. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Skala pengukuran data digunakan untuk mengidentifikasi
data variabel penelitian. Kesalahan dalam mengidentifikasi
skala pengukuran dapat menimbulkan kesalahan dalam
pemilihan uji statistik dan penyajian data. Untuk itu dalam BAB
ini akan dijelaskan mengenai defisini, manfaat, klasifikasi dan
aplikasi dari skala pengukuran data. Pada umumnya, skala
pengukuran data dibagi menjadi skala numerik (interval dan
rasio), serta skala kategorik (nominal dan ordinal).
Materi Belajar
A. Pengantar Skala Pengukuran Data
Pengukuran adalah prosedur menentukan kualitas atau
kuantitas dari karakteristik subyek penelitian atau variabel
penelitian, sedangkan variabel adalah karakteristik dari
individu atau subyek penelitian yang memiliki variasi atau
atribut baik variasi antar waktu atau antar individu.
Pengukuran variabel ini akan menghasilkan sekumpulan nilai
atau atribut yang disebut data (Murti, 2016).
Data merupakan komponen penting dalam penelitian,
tetapi beberapa peneliti masih kesulitan dalam
mengidentifikasi jenis data sehingga menimbulkan kesalahan
dalam menentukan uji statistik dan mempresentasikan data
dengan benar. Maka dari itu, pengetahuan mengenai skala
pengukuran data sangat penting untuk mengetahui
karakteristik dari data tersebut, sehingga dapat digunakan
untuk menentukan jenis uji statistik yang tepat dan
memvisualisasikan data dengan baik (Mishra et al., 2018).
B. Klasifikasi Skala Pengukuran Data
Terdapat beberapa variasi dalam menentukan skala
pengukuran data sesuai dengan bahan rujukan yang dijadikan
18
acuan. Secara garis besar data dapat dibedakan menjadi
kualitatif dan kuantitatif (Walliman, 2011), atau data
kontinu/numerik dan data diskret/kategorik (Murti, 2016), serta
data kategorik dan numerik (Sastroasmoro & Ismael, 2011).
Dalam buku ini, skala pengukuran data dibedakan menjadi
skala kategorik (nominal/ordinal) dan skala numerik (interval
dan rasio) (Sastroasmoro & Ismael, 2011; Walliman, 2011).
Untuk mempermudah klasifikasi skala pengukuran data dapat
dilihat pada gambar 2.1.
2. Skala ordinal
Pada skala ordinal adalah skala kategorik yang memiliki
informasi peringkat, dapat diurutkan, serta jarak antar
peringkatnya tidak sama. Contoh skala ordinal:
Derajat penyakit: ringan, sedang, berat
Tingkat Pendidikan: SD, SMP, SMU, S1, S2
Stadium kanker: I, II, III, IV
Tingkatan esselon: I, II, III, IV
Status gizi: buruk, kurang, cukup, lebih
Meskipun memiliki nilai peringkat, tetapi nilainya tidak
dapat dimanipulasi secara matematis (ditambah, dibagi atau
dikalikan), skala ordinal juga tidak dapat dihitung mean (Murti,
2016; Sastroasmoro & Ismael, 2011).
20
3. Skala interval
Skala interval yaitu skala numerik yang tidak memiliki nol
absolut/alami sebagai titik perbandingan. Contoh skala
interval: suhu (celcius), interval suhu 1 derajat ke 2 derajat
celcius memiliki nilai kalor/panas yang sama dengan interval
2 derajat ke 3 derajat celsius, sehingga disini dikatakan jarak
intervalnya memiliki nilai yang sama sehingga dapat dihitung
meannya. Namun perlu diingat bahwa suhu 0 derajat celcius
bukan nol absolut maka suhu 15 derajat celcius tidak
dikatakan 2 kali lebih panas daripada suhu 30 derajat celcius
(Murti, 2016) (Sastroasmoro & Ismael, 2011).
4. Skala rasio
Skala rasio yaitu skala numerik yang memiliki nilai nol
absolut atau alami sebagai titik perbandingan. Contoh skala
rasio: suhu (Fahrenheit), berat badan, tinggi badan, kadar
kolesterol, tinggi badan (Murti, 2016; Sastroasmoro & Ismael,
2011).
Data numerik (interval dan rasio) mempunyai jarak atau
interval yang sama sehingga memiliki distribusi frekuensi,
maka keduanya dapat dilakukan uji t dan uji F yang berbasis
distribusi normal untuk menguji perbedaan kelompok
sampelnya. Berbeda dengan skala kategorik (nominal dan
ordinal), keduanya tidak memiliki jarak interval yang sama
sehingga tidak bisa dibuat distribusi frekuensi, tidak mengenal
distribusi normal dan tidak memiliki mean. Hal ini
mengakibatkan data kategorik tidak bisa diuji dengan data
statistik parametrik seperti uji t dan uji F, namun diuji dengan
21
uji nonparametrik seperti uji Chi square, uji proporsi, Wilcoxon,
Mann Withney, Friedman, Krusskall-Wallis dan sebagainya
(Murti, 2016).
Penyajian data numerik dan kategorik juga berbeda.
Untuk data numerik, penyajian data digambarkan dengan
histogram karena memiliki distribusi frekuensi (mean, median,
nilai minimal, nilai maksimal). Untuk data kategorik karena
tidak memiliki distribusi frekuensi sehingga tidak dapat
digambarkan dengan histogram dan alternatinya dapat dibuat
dengan diagram diagram bar maupun pie chart untuk
menunjukkan proporsi (Nugroho, 2020).
Dalam gambar 2.2 terlihat hierarki skala pengukuran data,
tingkatan ini didasarkan atas kekuatan dan karakteristik dari
data tersebut. Skala rasio dianggap lebih kuat dibandingkan
skala interval, skala interval lebih kuat dibandingkan skala
ordinal, dan skala ordinal dianggap lebih kuat daripada skala
nominal. Kekuatan ini dilihat dari perspektif bahwa dalam
penelitian seringkali skala numerik dapat diubah menjadi skala
kategorik (nominal dan ordinal) namun tidak berlaku
sebaliknya, sehingga dalam hal ini skala numerik dianggap
lebih kuat daripada skala kategorik (Sastroasmoro & Ismael,
2011).
Dasar klasifikasi dari skala pengukuran data adalah jenis
variabel yang diukur. Dalam pengukuran atau pengumpulan
data sebaiknya mengukur variabel dalam skala numerik
meskipun dalam penelitiannya nanti hanya memerlukan skala
kategorik (ordinal/nominal) (Sastroasmoro & Ismael, 2011).
Seperti contoh berikut, seorang peneliti ingin mengetahui
22
prevalensi obesitas pada wanita di India. Variabel obesitas
diukur dengan indeks massa tubuh (IMT). IMT diukur dari
berat badan dibagi tinggi badan kuadrat (BB/TB2). Data BB,
TB, IMT sebaiknya diukur sebagai data numerik, kemudian
peneliti dapat membuat kategori IMT menjadi data yang
mempunyai dua nilai/dikotomi (obese=IMT≥ 25,
nonobese=IMT <25 lebih) atau data ordinal dengan lebih dari
dua nilai/ polikotomi (IMT kurang, normal, overweight, obese)
(Pengpid & Peltzer, 2019).
Semua variabel dianggap sama penting meskipun dari
kekuatannnya skala numerik dianggap memiliki kekuatan lebih
dibandingkan skala kategorik, sehingga kita tidak dapat
menganggap bahwa skala rasio itu lebih baik dari skala
interval, skala interval lebih baik daripada skala nominal dan
ordinal. Bahkan skala numerik pada penelitian di bidang
kedokteran dan kesehatan sering diubah menjadi skala
nominal untuk menegaskan kesimpulan secara kualitatif
(pernyataan “Ya” atau “tidak”). Contohnya seorang dokter
akan diagnosis dengan menentukan pasien sakit atau tidak
sakit dan membuat prognosis baik atau buruk untuk
mempertegas kesimpulan (Murti, 2016).
23
Pada tabel 2.1 disajikan karakteristik dari masing-masing
skala pengukuran data.
24
Berikut ini disajikan contoh data dari sebuah penelitian.
Data ini bukan data sesungguhnya hasil penelitian, jadi tidak
memperhitungkan jumlah sampel yang diperlukan.
25
Tabel 2.3 Penjelasan kolom dalam variebel view
Kolom Keterangan
27
D. Mengubah Skala Pengukuran Data (Transformasi
skala pengukuran data)
28
2. Masukkan IMT lalu dalam output variabel ketikkan nama variabel
yang baru pada kolom name dengan IMT_Kat , dan pada kolom
label dengan Klasifikasi IMT Asia. Setelah output variabel diisi
lalu klik change, lalu akan muncul seperti ini.
29
4. Lalu klik continueok. Tampilan pada data view dan variabel
view akan muncul variabel IMT_Kat. Kita klik variabel view lalu
kita sesuaikan values, measures, Pada kolom valuesIMT_Kat
kode 0= nonobese, kode 1= obese. Pada kolom measures
dijadikan ordinal.
30
Pertanyaan latihan
6. Apa persamaan dan perbedaan antara skala pengukuran data
nominal, ordinal, rasio dan interval?
7. Bagaimana hierarki atau kekuatan dari skala data nominal,
ordinal, rasio dan interval?
8. Apa manfaat pengklasifikasian skala pengukuran data?
9. Bagaimana cara mengubah data numerik menjadi data
kategorik?
10. Praktekkan input data penelitian dari Tabel 2.2. Contoh data
penelitian!
Referensi
Dahlan, M. S. (2014). Statistik Untuk Kedokteran dan
Kesehatan (Edisi 6). Epidemiologi Indonesia.
Mishra, P., Pandey, C. M., Singh, U., & Gupta, A. (2018).
Scales of measurement and presentation of statistical
data. Annals of Cardiac Anaesthesia, 21(4), 419–422.
https://doi.org/10.4103/aca.ACA_131_18
Murti, B. (2016). Variabel dan Pengukuran. In Prinsip dan
Metode Riset Epidemiologi (1st ed., p. 287). Yuma
Pustaka.
Nugroho, P. S. (2020). Analisis Data Penelitian Bidang
Kesehatan (1st ed.). Gosyen Publishing.
Pengpid, S., & Peltzer, K. (2019). Prevalence and correlates
31
of underweight and overweight/obesity among women in
India: results from the National Family Health Survey
2015–2016. Diabetes, Metabolic Syndrome and Obesity:
Targets and Therapy, Volume 12, 647–653.
https://doi.org/10.2147/DMSO.S206855
Sastroasmoro, S., & Ismael, S. (2011). Pengukuran. In Dasar-
dasar Metodologi Penelitian Klinis (4th ed., pp. 66–70).
Sagung Seto.
Walliman, N. (2011). The Nature of Data. In Research Method
The Basic (1st ed., pp. 65–77). Routledge.
32
BAB III
STATISTIK DESKRIPTIF
Tujuan Pembelajaran
1. Mahasiswa memahami pengertian statistik deskriptif.
2. Mahasiswa memahami deskripsi data numerik dan kategorik.
3. Mahasiswa mampu mendeskripsikan data numerik
menggunakan software statistik.
4. Mahasiswa menginterpretasikan hasil penyajian data.
Ringkasan
Statistik deskriptif merupakan bagian dari statistik yang
paling mendasar yang tidak bisa dipisahakan dalam analisis
data. Statistik deskriptif merupakan proses analisis statistik
yang fokus kepada manejemen, penyajian, dan klasifikasi
data. Dengan proses ini, data yang disajikan akan menjadi
lebih menarik lebih mudah dipahami, dan mampu memberikan
makna lebih bagi pengguna data sebelum dianalisis lebih
mendalam. Penyajian data numerik dapat berupa ukuran
pemusatan data, ukuran penyebaran data, nilai letak data, dan
distribusi data. Penyajian data kategorik dapat menggunakan
tabel, diagram batang, ataupun diagram lingkaran. Alat bantu
untuk mempermudah pembuatan diskripsi data sangat
banyak, antara lain software SPSS dan Excel.
33
Pesan dalam Belajar
Untuk mempelajari Bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir Bab
karena penjelasan disajikan secara berurutan sampai akhir
Bab. Pada akhir pembelajaran, penting untuk mencoba
menjawab pertanyaan-pertanyaan pada latihan untuk menguji
seberapa besar pengetahuan dan pemahaman dalam
mempelajari Bab ini.
Materi Belajar
34
paling mendasar yang tidak bisa dipisahakan dalam analisis
data. Statistik deskriptif merupakan proses analisis statistik
yang fokus kepada manejemen, penyajian, dan klasifikasi
data. Dengan proses ini, data yang disajikan akan menjadi
lebih menarik lebih mudah dipahami, dan mampu memberikan
makna lebih bagi pengguna data. Penyajian data secara
deskriptif memiliki manfaat:
1. Memberikan gambaran atau deskripsi bagaimana informasi
yang dimiliki data tersebut. Dalam hal ini, statistik deskriptif
haruslah mampu memberikan gambaran informasi apa saja
yang bisa didapat dari data yang digunakan, akan lebih
menarik bila ditampilan dalam bentuk tabel dan atau grafik.
2. Menjelaskan karakteristik sebuah data. Dalam hal ini,
statistik deskriptif memberikan karakteristik tentang data
yang digunakan. Hal ini penting karena kondisi data yang
digunakan akan memengaruhi seluruh analisis data yang
kita lakukan.
Penyajian data pada analisis deskriptif tergantung skala
pengukuran data variabel penelitian dan jumlah variablel yang
akan disajikan. Untuk skala pengukuran data variabel
penelitian silahkan melihat kembali Bab II. Secara garis besar
penyajian data pada statistik deskriptif berdasarkan 2 kategori,
yaitu: data numerik (interval dan rasio) dan kategorik (nominal
dan ordinal).
36
median dan modus sering digunakan untuk mewakili
seperangkat data dalam analisis statistik.
Pada suatu distribusi frekuensi, hubungan antara mean,
median dan modus adalah sebagai berikut:
a. Jika mean (µ), median (Md) dan modus (Mo) memiliki nilai
yang sama, maka nilai mean, median dan modus akan
terletak pada satu titik dalam kurva distribusi frekuensi. Kurva
distribusi frekuensi tersebut akan terbentuk secara simetris.
b. Jika mean lebih besar dari median, dan median lebih besar
dari modus, maka pada kurva distribusi frekuensi, nilai mean
terletak di sebelah kanan, median terletak di tengahnya dan
modus di sebelah kiri. Kurva distribusi frekuensi yang
terbentuk adalah miring/ menceng kanan atau kemiringan/
kemencengan positif.
37
c. Jika mean lebih kecil dari median, dan median lebih kecil dari
modus, maka pada kurva distribusi frekuensi, nilai mean akan
terletak di sebelah kiri, sedangkan median terletak di
tengahnya dan modus di sebelah kanan. Kurva distribusi
frekuensi yang terbentuk adalah miring/menceng kiri atau
kemiringan/kemencengan negatif.
38
Range atau rentang merupakan selisih dari nilai terbesar
dan nilai terkecil. Range merupakan hal yang sederhana dan
mudah dipahami dalam ukuran penyebaran data. Range
menunjukkan seberapa jauh sebaran dengan mengabaikan
bentuk distribusinya.
b. Varians
Varians merupakan ukuran seberapa jauh menyebar dari
nilai rata-ratanya. Semakin kecil nilai varians, semakin dekat
sebaran data dengan rata-rata. Semakin besar nilai varian,
semakin besar sebaran data terhadap nilai rata-ratanya.
c. Standar deviasi
Standar deviasi merupakan ukuran lain dari sebaran data
terhadap rata-ratanya. Bila kita menggunakan varians, maka
nilai yang kita dapatkan sangatlah besar. Nilai ini tidak mampu
menggambarkan bagaimana sebaran data sebenarnya
terhadap rata-rata. Untuk mendapatkan nilai yang lebih
mudah diinterpretasikan, maka lebih tepat menggunakan
standar deviasi. Standar deviasi menghasilkan nilai yang lebih
kecil dan mampu menjelaskan bagaimana sebaran data
terhadap rata-rata. Standar deviasi disebut juga dengan
simpangan baku.
3. Nilai Letak data
a. Persentile (persentile)
Persentil merupakan ukuran penyebaran yang membagi
data menjadi 100 bagian sama besar. Misal Persentil 5 artinya
data yang dimaksud mencakup 5% dari keseluruhan data,
Persentil 95 artinya data yang dimaksud mencakup 95%.
b. Quartiles Range (rentang kuartil)
Range Quartiles atau rentang kuartil merupakan ukuran
penyebaran yang membagi data menjadi 4 bagian. Sesuai
39
dengan namanya, kuartil membagi data menjadi 25 persen di
setiap bagiannya. Ada 3 jenis nilai kuartil yang perlu kita
ketahui, yaitu:
1) Q1 atau kuartil bawah yang memuat 25 persen dari data
dengan nilai terendah (= Persentil 25).
2) Q2 atau kuartil tengah, yang membagi data menjadi 2
bagian sama besar 50 persen terkecil dan 50 persen
terbesar. Q2 juga memiliki nilai yang sama dengan median
(= Persentil 50).
3) Q3 atau kuartil atas yang memuat 25 persen dari data
dengan nilai tertinggi (= Persentil 75).
c. Desile (desil)
Desil merupakan ukuran penyebaran yang membagi data
menjadi 10 bagian sama besar (= Persentil 0-10, 10-20, 20-
30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100).
4. Distribusi data
a. Skewness
Skewness (Sk) merupakan ukuran yang menunjukkan
bagaimana kemiringan/kemencengan sebuah distribusi data
terhadap nilai mean (rerata). Skewness juga bisa dikatakan
sebagai ukuran ketidaksimetrisan sebuah data. Skewness
dapat digunakan untuk menguji apakah distribusi data normal
atau tidak.
b. Kurtosis
Kurtosis merupakan ukuran yang menunjukkan
keruncingan sebuah data di dalam distribusinya. Kurtosis
disebut juga derajat keruncingan. Kurtosis dapat digunakan
untuk menguji apakah distribusi data normal atau tidak.
40
C.Mendeskripsikan Data Numerik Menggunakan
Software Statistik
Dalam contoh ini, misalkan ada data 30 data (n = 30)
variabel usia (dalam tahun) dan kadar HbA1c (dalam %)
seperti tersaji pada tabel 3.2.
Tabel 3.2. Data Kadar HbA1c Ibu Rumah Tangga
No. Usia (th) HbA1c (%) No. Usia (th) HbA1c (%)
1 25 6.9 16 38 7
2 53 8.1 17 39 7.3
3 31 7.9 18 39 4
4 34 6.7 19 40 7.1
5 42 4.9 20 36 5.7
6 41 6.7 21 35 5.7
7 40 6.4 22 43 7.2
8 42 6.9 23 51 6.9
9 43 8.5 24 48 7
10 50 5.7 25 39 7.1
11 34 6.3 26 40 6.4
12 38 7.8 27 62 3.8
13 42 6.9 28 54 6.9
14 42 6.5 29 52 3.7
15 45 5.7 30 45 4.8
3. Lakukan analisis
a. Klik Analyze Descriptive Statistics Frequencies
42
b. Klik pada Frequencies, muncul kotak dialog Frequencies,
pindahkan kedua variabel ke kotak Variable(s)
43
e. Klik Continue, klik OK, muncul output analisis deskriptif
statistik.
44
Deskripsi Nilai Usia Nilai HbA1c
Kurtosis 0,883 0,304
Std. Error of kurtosis 0,883 0,883
Range (rentang) 37 4,8
Persentil 5% 28,30 3,755
Persentil 95% 57,60 8,280
Kuartil Persentil 25 38,00 5,700
Persentil 50 41,50 6,800
Persentil 75 45,75 7,100
Desil Persentil 10 34,00 4,080
Persentil 20 36,40 5,700
Persentil 30 39,00 5,880
Persentil 40 40,00 6,440
Persentil 50 41,50 6,800
Persentil 60 42,00 6,900
Persentil 70 44,40 7,000
Persentil 80 49.60 7,180
Persentil 90 52,90 7,890
D.Visualisasi Data
Tujuan visualisasi data untuk menyampaikan dan
menyajikan data agar informasi tersebut lebih mudah
dipahami oleh pengguna data melalui bentuk yang menarik
dan memilika makna yang berarti. Visualisasi dapat disajikan
dalam bentuk tabel, grafik garis, diagram batang, diagram
lingkaran. Untuk membuat visualisasi data tersebut dapat
digunakan berbagai software statistik antara lain SPSS,
47
STATA, Excel dan lain-lain. Dalam contoh ini akan digunakan
SPSS untuk memvisualisasikan data variabel.
1. Tabel
Visualisasi data menggunakan tabel paling seringi
digunakan, bisa disajikan secara tunggal (menyajikan
frekuensi data) maupun tabel silang (2 variabel atau lebih).
Berikut contoh pembuatan tabel.
a. Visualisasi tabel untuk 1 variabel
Dalam contoh ini, digunakan contoh variabel usia.
Data variabel usia dikelompokkan menjadi 8 kategori
seperti tersaji pada tabel 3.4.
49
3) Klik Analyze Descriptive Statistics Frequencies
50
5) Klik OK, muncul output SPSS.
51
Pengerjaan dengan SPSS:
1) Input nama variabel
a. Variabel Usia
Untuk kolom Values, isikan kode kategorinya:
1 = < 40
2 = > 40-50
3 = > 50
b. Variabel HbA1c
Untuk kolom Values, isikan kode kategorinya:
1 = Normal
2 = Prediabetes
3 = Diabetes
52
2) Input data variabel
53
yang dimaksudkan untuk mendeskripsikan persentasi
nilai frekuensi berdasarkan baris. Jika yang dicentang
Column maka persentase frekuensi berdasarkan kolom.
Jika dicentang Total maka akan muncul deskripsi
persentase total. Pada contoh ini dipilih Row.
Interpretasi:
Diabetes melitus lebih banyak diderita oleh kelompok
usia < 40 tahun dan kelompok > 40 hingga 50 tahun,
sedangkan usia diatas 50 tahun tidak ditemukan kasus
diabetes melitus. Berdasarkan kategori usia, subjek
penelitian yang tidak mengalami diabeles melitus (kadar
54
HbA1c normal) adalah berimbang (hampir sama).
2. Grafik garis
Contoh grafik garis yang akan disajikan dengan SPSS
versi 23 ini diambil dari data tabel 3.2. namun data variabel
usia sudah diurutkan dari yang terkecil hingga terbesar
secara urut. Langkah-langkahnya sebagai berikut:
a. Input nama variabel
55
d. Klik Line, muncul kotak dialog: Line Charts, pilih Simple
dan Values of individual cases.
56
f. Klik OK, muncul output grafik garis.
g. Interpretasi
Secara umum, terlihat bahwa semakin bertambahnya
usia, kadar HbA1c cenderung mengalami penurunan.
3. Diagram batang
Diagram batang adalah bentuk diagram menggunakan
batang-batang persegi atau balok untuk menampilkan suatu
data. Diagram ini digunakan untuk menyajikan data untuk
kepentingan perbandingan tertentu. Diagram ini dapat digunakan
untuk membandingkan lebih dari satu kategori untuk variabel
tunggal ataupun untuk melihat hubungan antara dua variabel
dalam bentuk grafik batang. Contoh diagram batang yang akan
disajikan dengan SPSS versi 23 ini diambil dari data tabel 3.5.
sub judul Tabel: Visualisasi tabel lebih dari 1 variabel (tabel
silang).
a. Visualisasi diagram batang dalam satu variabel,
57
1) Input nama variabel
58
3) Klik Analyze Descriptive Statistics Frequencies.
59
6) Klik Continue, lalu klik OK, muncul output diagram
batang variabel usia dan diabetes melitus.
2) Klik Insert, lalu Bar Chart, pilih 2-D Column, lalu klik,
muncul draf diagram batang.
61
4) Jika menghendaki warna gambar dirubah, arahkan
kursor pada balok diagram lalu klik kanan, klik Fill
pilih warna yang dikehendaki.
5) Interpretasi
Kejadian diabetes melitus paling banyak dialami usia
kurang dari 40 tahun, diikuti oleh usia lebih dari 40 hingga
50 tahun dan lebih dari 50 tahun.
4. Diagram lingkaran
Diagram lingkaran (pie chart) adalah sebuah grafik
visualisasi data statistik berbentuk lingkaran yang dibagi menjadi
irisan-irisan untuk menggambarkan proporsi numerik. Data yang
disajikan berupa distribusi frekuensi satu data. Dalam contoh ini
dibuat diagram lingkaran frekuensi diabetes melitus pada usia <
40 tahun, digunakan software Excel (Office 2019). Data
menggunakan tabel 3.5.
62
a. Blok data yang akan dibuat grafik.
b. Klik Insert, lalu Pie Chart, pilih Pie, lalu klik, muncul draf
diagram lingkaran.
63
d. Jika menghendaki warna gambar dirubah, arahkan
kursor pada bagian diagram yang akan dirubah
warnanya lalu klik 2 kali (bagian yang akan dirubah
menjadi aktif), lalu klik Fill pilih warna yang dikehendaki,
lakukan juga pada bagian lain jika dikehendaki
perubahan warna.
64
http://www.portal-statistik.com/2014/02/statistik-deskriptif-
dengan-spss.html
Pertanyaan latihan
11. Jelaskan apa yang dimaksud dengan statistik deskriptif?
12. Apa manfaat penyajian data secara deskriptif?
13. Apa yang dimaksud dengan ukuran pemusatan data, ukuran
penyebaran data, nilai letak data, dan distribusi data pada
deskripsi data numerik? Berilah contoh masing-masing!
14. Buatlah contoh pembuatan tabel, diagram garis, diagram
batang, dan diagram lingkaran dengan menggunakan software
statistik!
Referensi
65
66
BAB IV
ANALISIS KORELASI DATA NUMERIK
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji
korelasi Pearson Product Moment.
2. Mahasiswa mampu melakukan analisis data menggunakan uji
korelasi Rank Spearman.
3. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Analisis korelasi data numerik uji korelasi Pearson Product
Moment untuk data berdistribusi normal dan korelasi Rank
Spearman untuk data tidak berdistribusi normal merupakan uji
statistik yang bertujuan untuk menentukan hubungan antara 2
variabel (variabel bebas dan variabel terikat) dengan
interpretasi signifikansi, arah hubungan, kekuatan hubungan,
dan koefisien determinasi. Bab ini memberikan pengalaman
belajar kepada mahasiswa berupa cara menginput data ke
software SPSS (Statistical Product and Service Solutions),
melakukan uji normalitas data, cara melakukan uji Pearson
Product Moment dan Rank Spearman, serta cara melakukan
interpretasi hasil uji statistiknya sehingga dapat menyimpulkan
hasil analisisnya.
67
Pesan dalam Belajar
Untuk mempelajari Bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir Bab
karena penjelasan disajikan secara berurutan sampai akhir
Bab. Pada akhir pembelajaran, penting untuk mencoba
menjawab pertanyaan-pertanyaan pada latihan untuk menguji
seberapa besar pengetahuan dan pemahaman dalam
mempelajari Bab ini.
Materi Belajar
68
lihat tabel 4.1.
69
STATA, MINITAB, SAS, EVIEWS, PAST, SOFA, JASP,
Jamovi, Statcato, KyPlot, Epi Info, Gretl, dan lain-lainnya.
Dalam contoh perhitungan uji statistik pada Bab ini digunakan
software SPSS (Statistical Product and Service Solutions).
Hasil uji korelasi dapat memberikan informasi arah
korelasi (arah hubungan), kekuatan hubungan, dan koefisien
determinasi.
1. Arah Korelasi
Nilai korelasi diberi simbol r (uji Pearson Product
Moment) dan ρ (uji Rank Spearman). Arah korelasi ada dua,
yaitu korelasi positif dan korelasi negatif. Nilai r atau ρ
angkanya antara -1 dan 1. Nilai 0 berarti tidak ada korelasi,
dan nilai 1 berarti korelasi positif sempurna, dan nilai -1 berarti
korelasi negatif sempurna. Korelasi positif artinya
meningkatnya nilai variabel bebas diikuti oleh meningkatnya
nilai variabel terikat, sebaliknya korelasi negatif artinya
meningkatnya nilai variabel bebas diikuti oleh menurunnya
nilai variabel terikat.
Dalam contoh judul di atas, jika arah korelasi positif berarti
meningkatnya stres menyebabkan meningkatnya kadar gula
darah (stres meningkat, kadar gula darah meningkat) dan jika
arah korelasi negatif berarti meningkatnya stres menyebabkan
menurunnya kadar gula darah (stres meningkat, kadar gula
darah menurun). Secara umum, arah korelasi dapat
diilustrasikan pada gambar 4.1.
70
Gambar 4.1. Arah korelasi
2. Kekuatan korelasi
Uji Pearson Product Moment dan Rank Spearman
menghasilkan nilai koefisien korelasi. Koefisien korelasi
Pearson Product Moment disimbolkan dengan huruf r kecil (r),
sedangkan koefisien korelasi Rank Spearman yang biasa
disebut juga dengan nama Spearman Rho disimbolkan
dengan huruf Yunani yaitu rho (ρ). Interpretasi kekuatan hasil
uji dapat dilihat pada tabel 4.2.
3. Koefisien determinasi
Koefisien determinasi diberikan simbol r kuadrat
(berdasarkan referensi, ada yang menuliskan r dan ada yang
menuliskan R, r adalah nilai koefisien hasil uji korelasi
Pearson Product Moment atau ρ pada uji Rank Spearman),
maka dapat dituliskan r2 atau R2. Nilai koefisien determinasi
merupakan nilai yang menggambarkan seberapa besar
71
kontribusi variabel bebas dalam mempengaruhi variabel
terikat. Nilai koefisien determinasi adalah kuadrat dari nilai r
atau r2, nilai koefisien determinasi disajikan dalam satuan
persen (%), misalkan hasil uji korelasi Pearson Product
Moment Pearson menghasilkan nilai r = 0,852; maka nilai
koefisien determinasi adalah r2 = 0,852 x 0,852 = 0,726.
Dengan demikian variabel bebas memberikan kontribusi untuk
mempengaruhi variabel terikat sebesar 0,726; karena
disajikan dalam persen, maka koefisien determinasinya
adalah 0,726 x 100% = 72,6%. Oleh karena yang
mempengaruhi variabel terikat selain variabel bebas adalah
variabel pengganggu yang tidak dijelaskan dalam uji statistik,
maka variabel pengganggu ini bisa disebut juga variabel lain.
Dengan demikian dapat dijelaskan bahwa besar variabel
bebas mempengaruhi variabel terikat sebesar 72,6%,
sedangkan besar variabel lain yang juga mempengaruhi
variabel terikat tetapi tidak dijelaskan dalam uji korelasi ini,
adalah sebesar 100% – 72,6% = 27,4%. Semakin besar nilai
koefisien determinasi (mendekati 100%), maka semakin
menguatkan dugaan variabel bebas dapat mempengaruhi
variabel terikat (variabel bebas dominan), pengaruh variabel
penganggu lebih kecil. Sebaliknya jika nilai koefisien
determinasi kecil (mendekati 0%), maka semakin
memperlemah dugaan variabel bebas tidak dapat
mempengaruhi variabel terikat (variabel bebas tidak dominan),
pengaruh variabel penganggu lebih besar.
72
B.Contoh Data Hasil Penelitian
Contoh data yang akan disajikan di bawah ini adalah data
bukan dari hasil penelitian sebenarnya, hanya sebagai contoh
saja. Mengenai jumlah data pada penelitian yang
sesungguhnya, harus disertai dengan perhitungan jumlah
sampel minimal sesuai dengan teknik samplingnya. Pada
metode pengambilan sampel secara random sebaiknya
menggunakan rumus penentuan minimal sampel yang
tersedia, sedangkan penentuan jumlah sampel non random
disesuaikan dengan teknik yang digunakan. Jadi sekali lagi
mengingatkan bahwa jumlah sampel pada contoh ini belum
tentu sesuai dengan jumlah minimal sampel, sehingga pada
penelitian sesungguhnya penentuan jumlah sampel sesuai
metode sampling yang dipilih.
Data akan dianalisis menggunakan uji Pearson Product
Moment dan Rank Spearman. Misalkan, judul penelitiannya
adalah ‘Hubungan antara Stres dengan Kadar Gula Darah
pada Ibu Rumah Tangga di Semarang’. Stres diukur
menggunakan kuesioner stres dan kadar gula darah diukur
menggunakan glucometer. Pengukuran kedua variabel
tersebut menghasilkan data lapangan seseperti tersaji pada
tabel 4.3.
Pada contoh data yang disajikan, sesuai dengan alat ukur
variabel masing-masing, berdasarkan data hasil pengukuran
lapangan (data hasil penelitian), diinformasikan:
1. Variabel stres diukur dengan menggunakan kuesioner DASS-42.
Pada kuesioner DASS-42, stres diukur menggunakan 14
pertanyaan/pernyataan dengan pilihan jawaban ada 4 yaitu 0, 1,
73
2, dan 3. Dengan demikian skor jawaban terendah adalah 0 (jika
responden memilih pilihan jawaban 0 semua, 0 x 14 = 0) dan
jawaban tertinggi adalah 42 (jika responden memilih pilihan
jawaban 3 semua, 3 x 14 = 42). Jadi skor stres pada range
antara 0 s/d 42.
2. Pada variabel kadar gula darah puasa yang diukur dengan
menggunakan glucometer dengan satuan hasil pengukuran
adalah mg/dL.
Contoh-contoh cara menguji dan interpretasi hasil uji
statistik yang akan disampaikan pada Bab ini, perhitungan
menggunakan software analisis statistik. Software analisis
statistik dalam contoh ini menggunakan software SPSS versi
23.
74
C.Uji Korelasi Pearson Product Moment
Contoh Uji korelasi Pearson Product Moment dalam
contoh ini diambil dari data tabel 4.3. Sebelum melalukan uji,
terlebih dahulu diidentifikasi informasi yang berhubungan
dengan uji korelasi Pearson Product Moment sebagai berikut:
Judul = Hubungan antara Stres dengan Kadar Gula
Darah pada Ibu Rumah Tangga di
Semarang.
Variabel bebas = Stres, merupakan data numerik dengan
skala pengukuran interval.
Variabel terikat = Kadar gula darah, merupakan data
numerik dengan skala pengukuran interval.
Syarat uji korelasi Person Product Moment adalah jenis
data numerik (rasio, interval) dan datanya berdistribusi normal.
Pada contoh data hasil pengukuran, diinformasikan:
1. Data lapangan sudah berupa data numerik, sehingga tidak perlu
pengkategorian.
2. Terlebih dahulu dilakukan uji normalitas data (karena uji Pearson
Product Moment merupakan jenis analisis statistik Parametrik,
jenis data rasio atau interval).
Uji normalitas data, menurut referensi ada dua macam, yaitu uji
normalitas dilakukan pada data kedua variabel dan uji normalitas
data hanya dilakukan pada data residual. Pada Bab ini akan
dicontohkan kedua cara menguji normalitas tersebut.
Nilai Residual adalah selisih antara nilai duga (predicted value)
dengan nilai pengamatan sebenarnya apabila data yang
digunakan adalah data sampel.
75
Predicted value adalah nilai duga yang dihasilkan dari model
regresi yang diperoleh. Misal model regresi yang diperoleh: Y = 5
+ 2X. Jika nilai X = 1, maka predicted value dalam model regresi
ini adalah y = 5 + (2 x 1) = 7.
Langkah-langkah uji Product Moment Pearson pada
contoh data di atas, sebagai berikut:
76
Langkah 2. Uji Normalitas
1. Uji Normalitas data kedua variabel
Klik Analyze Descriptive Satistics Explore, lalu Klik,
muncul kotak dialog Explore.
77
Klik Continue, Klik OK
Pada output, pilih output Tests of Normality
78
memenuhi syarat untuk dilanjutkan menggunakan uji
korelasi Pearson Product Moment.
80
Lakukan proses uji normalitas seperti pada contoh
sebelumnya, hanya saja yang diuji normalitas adalah data
pada variabel baru yaitu variabel Unstandardized Residual
(RES_1).
Jika langkah-langkahnya sudah benar, maka akan muncul
output uji normalitas Unstandardized Residual (RES_1),
sebagai berikut:
81
Pada kotak dialog Bivariate Correlations, masukkan variabel
Skor Stres dan Kadar gula darah ke kotak Variables.
Pada Correlation Coefficients dicentang pada Pearson (sudah
default, jadi tidak perlu diubah; Jika menggunakan uji lain,
maka centang tinggal dipindah).
82
Dari output tersebut diperoleh informasi hasil uji Pearson
Produvt Moment (r) sebagai berikut:
1) Nilai r bertanda positif.
2) Nilai r = 0,532.
3) Nilai p atau p value = 0,041 (p = 0,041).
4) Jumlah sampel (n) = 15 sampel.
Interpretasi hasil uji Pearson Product Moment adalah:
1) Signifikansi
Apakah ada hubungan antara Stres dengan Kadar gula
darah pada Ibu Rumah Tangga di Semarang? Untuk
menjawab signifikan atau tidak berdasarkan 2 cara, yaitu:
a. Membandingkan nilai rhitung dengan nilai kritis r tabel 5%
(rt5%). Apabila nilai rhitung > nilai rt5%, maka hasilnya
signifikan, berarti ada hubungan antara kedua variabel.
Sebaliknya, jika nilai rhitung < nilai rt5%, maka hasilnya tidak
signifikan, berarti tidak ada hubungan antara kedua
variabel.
b. Membandingkan nilai p (p value) dengan nilai kritis pada
α = 0,05.
Interpretasi nilai p:
1) Jika nilai p < 0,05, maka dinyatakan signifikan
(menolak H0, menerima Ha), berarti ada hubungan
antara kedua variabel.
83
2) Jika nilai p > 0,05, maka hasilnya tidak signifikan
(menerima H0, menolak Ha), berarti tidak ada
hubungan antara kedua variabel.
Dalam contoh ini hanya digunakan cara kedua (b),
yaitu dengan membandingkan nilai p dengan nilai α =
0,05. Hasilnya menunjukkan, nilai p < 0,05 (0,041 <
0,05), maka hasilnya dinyatakan signifikan (menolak
H0, menerima Ha), yang berarti ada hubungan antara
Stres dengan Kadar gula darah.
2) Arah korelasi
Nilai korelasi bertanda positif (r = +0,532), maka
meningkatnya skor Stres akan menyebabkan meningkatnya
nilai Kadar gula darah.
3) Kekuatan korelasi
Kekuatan korelasi dapat dilihat pada tabel 4.2. Nilai r = 0,532
terletak antara 0,40 s/d 0,50 dengan kategori kekuatan uji
“Cukup kuat”.
4) Koefisien determinasi
Koefisien determinasi dihitung dari nilai r dikuadratkan (r 2), r2
= 0,532 x 0,532 = 0,283. Besarnya pengaruh Stres terhadap
Kadar gula darah, atau variabel Stres dapat menjelaskan
variasi nilai pada Kadar gula darah sebesar 0,283 x 100% =
28,3%, sedangkan faktor lain yang tidak dijelaskan dalam
penelitian ini adalah 100% – 28,3% = 71,7%.
Keterangan:
r adalah nilai koefisien korelasi Pearson Product Moment.
p adalah nilai kesalahan yang diperoleh peneliti dari hasil
perhitungan uji statistik. Nilai p merupakan besarnya peluang
(probabilitas) untuk menerima atau menolak H o.
n adalah jumlah sampel/ jumlah responden penelitian.
D.Uji Korelasi Rank Spearman
Uji Rank Spearman bisa juga disebut dengan uji
Spearman Rho. Seperti pada contoh Uji Pearson Product
Moment dalam contoh uji Rank Spearman juga menggunakan
data tabel 4.3. Identifikasi informasi variabel sama dengan uji
korelasi Pearson Product Moment; hanya saja pada contoh uji
Rank Spearman ini, diandaikan saja, kalau distribusi data
tidak normal (andaikan dalam uji normalitas disimpulkan
bahwa salah satu atau kedua data tidak berdistrubusi normal,
nilai Sig. < 0,05). Dengan demikian, ketika diperoleh pada uji
normalitas salah satu atau kedua data dinyatakan tidak
berdistribusi normal, maka uji yang lebih tepat menggunakan
uji Rank Spearman.
Langkah-langkah pada uji Rank Spearman pada
85
prinsipnya seperti langkah-langkah uji korelasi Product
Moment Pearson. Pada contoh ini tidak disajikan gambar
lengkap seperti pada langkah-langkah uji korelasi Product
Moment Pearson, oleh karena itu silahkan melakukan sendiri
langkah-langkahnya:
Input Nama variabel dan Data variabel ke SPSS.
Lakukan uji normalitas Diandaikan saja hasil uji data tidak
berdistribusi normal (nilai Sig. < 0,05).
Lakukan uji Rank Spearman, Analyze Correlate Bivariate
masukkan nama variabel ke kotak Variables.
Selanjutnya, pada Correlation Coefficients hilangkan centang
yang terdapat pada Pearson, pindahkan/ganti centang pada
Spearman.
86
Cara menginterpretasi hasil uji Rank Spearman pada
prinsipnya sama dengan cara interpretasi uji Pearson Product
Moment (lihat kembali cara interpretasi uji Pearson Product
Moment), hanya simbolnya saja yang berbeda, yaitu r untuk uji
Pearson Product Moment dan ρ untuk uji Rank Spearman. Dari
output uji Rank Spearman diperoleh informasi sebagai berikut:
1) Nilai ρ bertanda positif.
2) Nilai ρ = 0,517.
3) Nilai p atau p value = 0,048 (p = 0,048).
4) Jumlah sampel (n) = 15 sampel.
Interpretasi terhadap hasil uji korelasi Rank Spearman adalah:
1) Signifikansi
Hasil uji menunjukkan nilai p < 0,05 (0,048 < 0,05),
maka hasilnya dinyatakan signifikan, yang berarti ada
hubungan antara Stres dengan Kadar gula darah.
2) Arah korelasi
Nilai korelasi bertanda positif (ρ = +0,517), maka dapat
dinyatakan meningkatnya Stres akan diikuti oleh
meningkatnya Kadar gula darah.
3) Kekuatan korelasi
Kekuatan korelasi dapat dilihat pada tabel 4.2. Nilai r = 0,517
terletak antara 0,40 s/d 0,50 dengan kategori kekuatan uji
“Cukup kuat”.
4) Koefisien determinasi
87
Koefisien determinasi diperoleh ρ2 = 0,517 x 0,517 = 0,267.
Besarnya pengaruh Stres terhadap Kadar gula darah, atau
variabel Stres dapat menjelaskan variasi nilai pada Kadar
gula darah sebesar 0,267 x 100% = 26,7%, sedangkan
faktor lain yang tidak dijelaskan dalam penelitian ini adalah
100% – 26,7% = 73,3%.
Keterangan:
ρ adalah nilai koefisien korelasi Rank Spearman.
p adalah nilai kesalahan yang diperoleh peneliti dari hasil
perhitungan uji statistik. Nilai p merupakan besarnya peluang
(probabilitas) yang diamati dari uji statistik untuk menerima atau
menolak Ho.
n adalah jumlah sampel/ jumlah responden penelitian.
Pertanyaan latihan
15. Apa persamaan dan perbedaan antara uji Pearson Product
Moment dan Rank Spearman?
88
16. Apa yang dimaksud dengan statistik parametrik?
17. Buatlah contoh data untuk diuji dengan uji Pearson Product
Moment, lalu lakukan ujinya menggunakan SPSS dan
interpretasikan hasilnya!
18. Buatlah contoh data untuk diuji dengan uji Rank Spearman,
lalu lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
89
90
BAB V
ANALISIS KORELASI DATA KATEGORIK
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji
Somers’d.
2. Mahasiswa mampu melakukan analisis data menggunakan uji
Koefisien Kontingensi (C).
3. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Analisis korelasi data kategorik dapat menggunakan uji
Somers’d (untuk skala pengukuran data ordinal) dan Koefisien
Kontingensi (C) (untuk skala pengukuran data nominal).
Keduanya merupakan uji statistik yang bertujuan untuk
menentukan hubungan antara 2 variabel (variabel bebas dan
variabel terikat). Bab ini memberikan pengalaman belajar
kepada mahasiswa berupa cara menginput data kedua uji
tersebut ke software SPSS (Statistical Product and Service
Solutions), cara melakukan uji Somers’d dan Koefisien
Kontingensi (C), serta cara melakukan interpretasi hasil uji
sehingga dapat menyimpulkan hasil analisisnya.
91
Pesan dalam Belajar
Untuk mempelajari Bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir Bab
karena penjelasan disajikan secara berurutan. Pemahaman
skala pengukuran data variabel juga dianjurkan untuk lebih
dipahami lagi agar dapat membedakanya dalam memilih uji
statistik yang tepat. Materi Bab V berkaitan dengan Bab IV,
oleh karena itu mahasiswa sangat perlu memahami lagi Bab
IV. Pada akhir pembelajaran, penting untuk mencoba
menjawab pertanyaan-pertanyaan pada latihan untuk menguji
seberapa besar pengetahuan dan pemahaman dalam
mempelajari Bab ini.
Materi Belajar
92
Kontingensi (Contingency Coefficient).
93
pengelompokan kategorinya, kategori paling tinggi adalah
Stres Sedang, dan paling rendah adalah Tidak Stres.
Dalam hal ini, kode kategori (sekaligus untuk koding di
SPSS), ada 3 yaitu:
a. Kategori Stres Sedang, diberikan kode 1.
b. Kategori Stres Ringan, diberikan kode 2.
c. Kategori Tidak Stres, diberikan kode 3.
2. Pengkategorian Kadar gula darah berdasarkan pengukuran
kadar gula darah puasa yang diukur menggunakan Glucometer,
sebagai berikut:
a. Kategori Diabetes, jika kadar gula darah > 126 mg/dL
b. Kategori Prediabetes, jika kadar gula darah antara 100 – 125
mg/dL
c. Kategori Normal, jika kadar gula darah < 100 mg/dL
Informasi data tabel 4.3 pada Bab IV, skor Kadar gula
darah puasa terendah = 80 mg/dL dan tertinggi = 192
mg/dL. Oleh karena itu, berdasarkan pengelompokan
kategorinya, ketegori paling tinggi adalah Diabetes, dan
paling rendah adalah Normal. Dalam hal ini, kategori
(sekaligus untuk koding di SPSS), ada 3 yaitu:
a. Karegori Diabetes, diberikan kode 1.
b. Kategori Prediabetes, diberikan kode 2.
c. Kategori Normal, diberikan kode 3.
Catatan:
Memberikan koding (untuk input ke SPSS) data ordinal
kategorik sebaiknya dimulai dari bobot kategori terbesar.
Kategori Stres diurutkan dari peringkat paling tinggi adalah
94
Stres Sedang (kode 1), diikuti oleh peringkat kedua yaitu
Stres Ringan (kode 2), dan peringkat terakhir adalah Tidak
Stres (kode 3). Demikian juga dengan kategori Kadar gula
darah, diurutkan kategori peringkat paling berat adalah
Diabetes (kode 1), diikuti peringkat kedua yaitu Prediabetes
(kode 2), dan peringkat terakhir adalah Normal (kode 3).
Setelah dilakukan pemeringkatan terhadap hasil
pengukuran kedua variabel (variabel Stres dan Kadar gula
darah), hasilnya dapat dilihat pada tabel 5.1.
Catatan:
Pada uji Somers’d, untuk input ke SPSS, data yang
diinputkan adalah data pada Kode Kategori Stres (kode 1,
2, dan 3) dan Kode Kategori Kadar gula darah puasa (kode
95
1, 2, dan 3).
3 = Normal
96
2. Input Data Variabel, dilakukan pada Data View
97
Masukkan variabel Skor Stres ke kotak Row(s) dan Kadar gula
darah ke kotak Columnn(s).
98
Klik Continue, muncul kotak dialog Crosstabs lagi.
Klik Cells, muncul kotak dialog Crosstabs: Cell Display. Pada
Percentage, Berikan tambahan centang pada Row.
1) Deskripsi statistik
99
Interpretasi:
Dari 15 orang responden, paling banyak kategori Stres
Sedang (7 orang), diikuti Tidak Stres (6 orang), dan
Stres Ringan (2 orang).
Dari 15 orang responden, paling banyak mengalami
Prediabetes (6 orang), diikuti Diabetes (5 orang), dan
Normal (4 orang).
Catatan:
Uji Somers’d dapat digunakan untuk hubungan antar
variabel yang sifatnya simetris maupun asimetris.
Notasi untuk korelasi Somers’d adalah dxy (jika Y
adalah variabel dependen), dan simbol d yx (jika X
adalah variabel dependen).
Pada output uji Somers’d nilai p dilihat pada
Approximate Significance.
100
Interpretasi:
Hasil uji Somers’d yang dibaca sesuai hipotesisnya.
Dalam penelitian ini, variabel Kadar gula darah
sebagai variabel dependen (variabel terikat), maka
yang dibaca hasilnya pada baris ‘Kadar Gula Darah
Puasa Dependent’. Keputusan uji sama kriterianya
dengan uji Pearson Product Moment dan Rank
Spearman, yaitu dengan membandingkan nilai p
dengan α = 0,05, yaitu:
1) Jika p < 0,05 maka hasilnya signifikan (menolak
H0, menerima Ha), berarti ada hubungan antar
variabel.
2) Jika p > 0,05 maka hasilnya tidak signifikan
(menerima H0, menolak Ha), berarti tidak ada
hubungan antar variabel.
Pada output uji Somers’d nilai p (Approximate
Significance), nilai p = 0,002. Oleh karena p <
0,05 (0,002 < 0,05), maka hasilnya signifikan
(menolak H0, menerima Ha), berarti ada hubungan
antara Stres dengan Kadar gula darah pada Ibu
Rumah Tangga di Semarang.
101
Tabel 5.2. Cara menyajikan hasil uji Somers’d
Kadar gula darah
Jumlah
Diabetes Prediabetes Normal dxy p
n % n % n % n %
Stres Stres Sedang 4 57,1 3 42,9 0 0,0 7 100 0,632 0,002
Stres Ringan 0 0,0 2 100,0 0 0,0 7 100
Tidak Stres 1 16,7 1 16,7 4 66,7 6 100
Jumlah 5 33,3 6 40,0 4 26,7 15 100
Keterangan:
n adalah nilai frekuensi hasil pengukuran/ pengamatan.
% adalah persentase n berdasaran penghitungan nilai frekuensi
hasil pengukuran/ pengamatan.
dxy adalah nilai koefisien korelasi Somers’d.
p adalah nilai kesalahan yang diperoleh peneliti dari hasil
perhitungan uji statistik. Nilai p merupakan besarnya peluang
(probabilitas) yang diamati dari uji statistik untuk menerima atau
menolak Ho.
Catatan:
Seperti uji Somers’d, pada uji Koefisien Kontingensi (C), untuk
input ke SPSS, data yang diinputkan adalah Kode Kategori
Stres (kode 1 dan 2) dan Kode Kategori Kadar gula darah
(kode 1 dan 2).
104
b. Isikan kode variabel Kadar gula darah, yaitu:
1 = Diabetes
2 = Tidak Diabetes
105
Langkah 2. Uji Normalitas (tidak dilakukan)
Uji normalitas tidak dilakukan, karena uji Koefisien
Kontingensi (C) merupakan jenis statistik non parametrik,
sehingga tidak memerlukan asumsi uji normalitas data.
106
Klik Statistics, muncul kotak dialog Crosstabs: Statistics. Pada
Nominal beri tanda centang pada Contingency Coefficient.
107
Klik Continue, lalu klik OK. Lihat output.
Interpretasi terhadap hasil uji Koefisien Kontingensi (C) adalah:
1) Deskripsi statistik
Interpretasi:
Dari 15 orang responden, yang mengalami stres (9
orang) lebih banyak daripada tidak stres (6 orang).
Dari 15 orang responden, mengalami Diabetes (11
orang) lebih banyak daripada tidak diabetes (4 orang).
108
Interpretasi:
Keputusan uji Koefisien Kontingensi C sama
kriterianya dengan uji sebelumnya, dengan
membandingkan nilai p dengan α = 0,05, yaitu:
1) Jika p < 0,05 maka hasilnya signifikan (menolak
H0, menerima Ha), berarti ada hubungan antar
variabel.
2) Jika p > 0,05 maka hasilnya tidak signifikan
(menerima H0, menolak Ha), berarti tidak ada
hubungan antar variabel.
Pada output uji Koefisien Kontingensi (C) nilai p
dilihat pada Approximate Significance, dengan nilai p =
0,004. Oleh karena p < 0,05 (0,004 < 0,05), maka
hasilnya signifikan (menolak H0, menerima Ha), berarti
ada hubungan antara Stres dengan Kadar gula darah
pada Ibu Rumah Tangga di Semarang.
109
Tabel 5.4. Cara menyajikan hasil uji Kontingensi Koefisien (C)
Kadar gula darah
Jumlah
Diabetes Tidak diabetes C p
n % n % n %
Stres Stres 9 100,0 0 0,0 9 100 0,594 0,004
Tidak Stres 2 33,3 4 66,7 6 100
Jumlah 11 73,3 4 26,7 15 100
Keterangan:
n adalah nilai frekuensi hasil pengukuran/ pengamatan.
% adalah persentase n berdasaran penghitungan nilai frekuensi
hasil pengukuran/ pengamatan.
C adalah nilai koefisien korelasi Koefisien Kontingensi (C)
p adalah nilai kesalahan yang diperoleh peneliti dari hasil
perhitungan uji statistik. Nilai p merupakan besarnya peluang
(probabilitas) yang diamati dari uji statistik untuk menerima atau
menolak Ho.
Pertanyaan latihan
1. Apa persamaan dan perbedaan antara uji Somers’d, dan
Koefisien Kontingensi (C)?
2. Apa yang dimaksud dengan statistik non parametrik?
3. Buatlah contoh data untuk diuji dengan uji Somers’d, lalu lakukan
ujinya menggunakan SPSS dan interpretasikan hasilnya!
4. Buatlah contoh data untuk diuji dengan uji Koefisien Kontingensi
(C), lalu lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
Gale, L. (2015) ‘Social Work Practice & Skill, Anxiety and
Depression Assessment: Using the Depression Anxiety Stress
Scales.’ Available at: https://www.ebscohost.com/assets-
110
sample-
content/Anxiety_and_Depression_Assessment_SWPS.pdf.
111
112
BAB VI
ANALISIS KOMPARATIF DATA NUMERIK 2
SAMPEL TIDAK BERPASANGAN
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji t-
tidak berpasangan dan menginterpretasikan hasil uji
2. Mahasiswa mampu melakukan analisis data menggunakan uji
Mann-Whitney dan menginterpretasikan hasil uji
3. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Analisis komparatif data numerik 2 sampel tidak berpasangan
merupakan uji statistik yang bertujuan untuk mengetahui perbedaan
mean/rerata 2 kelompok data yang tidak berpasangan
(independen). Bab ini memberikan pengalaman belajar kepada
mahasiswa mulai dari entry data ke software SPSS (Statistical
Product and Service Solutions), melakukan uji normalitas
data, melakukan uji dengan t-tidak berpasangan dan uji
Mann-Whitney serta cara melakukan interpretasi hasil uji
sehingga dapat menyimpulkan hasil analisisnya.
Materi Belajar
114
metode komparatif. Contoh perbandingan adalah odds rasio
(OR), risiko relatif (RR). Sementara contoh selisih adalah
selisih proporsi, selisih rerata dan lain-lain. Dari contoh judul di
atas keluaran yang diinginkan adalah selisih rerata kadar
TNF-α maka yang paling tepat menggunakan analisis
komparatif, jumlah kelompok 2 (perokok dan bukan perokok)
sehingga dapat dikatakan komparatif numerik tidak
berpasangan 2 kelompok. Asumsi dasar atau persayaratan
melakukan uji t-tidak berpasangan data numerik (skala
unterval atau rasio) dalam penelitian, dapat dilihat dari
distribusi dan varian data, yaitu:
1. Apabila distribusi /sebaran data normal dan varian sama
(homogen) gunakan uji t-tidak berpasangan dengan
menggunakan equal varian assumed.
2. Apabila distribusi /sebaran data normal tetapi varian
berbeda (tidak homogen) gunakan uji t-tidak berpasangan
dengan menggunakan equal varian not assumed.
3. Apabila distribusi /sebaran data tidak normal, lakukan
transformasi, analisis yang dilakukan tergantung pada
sebaran dan varian hasil transformasi.
4. Apabila distribusi /sebaran data tidak normal, gunakan uji
Mann-Whitney
115
diwajibkan menyusun skripsi. Salah satu judul skripsi mahasiswa
adalah “Perbedaan rerata kadar TNF-α antara perokok dan non
perokok”. Data yang diperoleh sebanyak 80 yang berasal dari 40
kelompok perokok dan 40 non perokok.Untuk menentukan uji
hipotesis/uji statistik, maka harus dilakukan melalui langkah-langkah
sebagai berikut:
1. Menetapkan hipotesis
Hipotesis dalam statistik ada 2 jenis yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha)
a. Hipotesis Nol (Ho)
Hipotesis yang menyatakan tidak ada perbedaan suatu
kejadian antara kedua kelompok. Atau hipotesis yang
menyatakan tidak ada hubungan antara variabel satu dengan
variabel yang lain.
Contoh: Tidak ada perbedaan rerata kadar TNF-α antara
perokok dan non perokok.
b. Hipotesis Alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan suatu kejadian
antara kedua kelompok. Atau hipotesis yang menyatakan ada
hubungan antara variabel satu dengan variabel yang lain.
Contoh: ada perbedaan rerata kadar TNF-α antara perokok
dan non perokok.
Dari hipotesis alternatif akan diketahui apakah uji statitik
menggunakan satu arah (one tail) atau dua arah (two tail)
1) Satu arah (one tail) : bila hipotesis alternatifnya
menyatakan adanya perbedaan dan ada pernyataan yang
mengatakan hal yang satu lebih tinggi/rendah dari hal
yang lain.
116
Contoh: rerata kadar TNF-α pada perokok lebih besar
dibandingkan dengan rerata kadar TNF-α pada non
perokok
2) Dua arah (two tail) : merupakan hipotesis alternatif yang
hanya menyatakan perbedaan tanpa melihat apakah hal
yang satu lebih tinggi/rendah dari hal yang lain
Contoh : ada perbedaan rerata kadar TNF-α antara
perokok dan non perokok.
117
1) Jenis variabel yang akan dianalisis, dari contoh judul skripsi di
atas:
a. Varabel bebas:
Perilaku merokok (perokok dan non perokok)
Skala : kategorik (nominal dikotom)
b. Variabel terikat
Kadar TNF-α
Skala : rasio (numerik)
2) Jenis data berpasangan atau tidak berpasangan
3) Distribusi/sebaran data
Jika distribusi/sebaran data normal, maka proses pengujian
dapat menggunakan uji statistik parametrik
Jika distribusi/sebaran data tidak normal, maka proses
pengujian dapat menggunakan uji statistik non parametrik.
118
5. Keputusan Uji Statistik
Dari judul skripsi diatas “Perbedaan rerata kadar TNF-α
antara perokok dan non perokok” kita akan menetapkan kriteria:
Arah hipotesis 2 arah (two tail) (kita tetapkan)
Jenis hipotesis komparatif (variabel yang dihubungkan
berbentuk numerik dan kategorik dan luaran yang diinginkan
selisih rerata)
Batas kemaknaan atau α 5% (kita tetapkan)
Skala variabel bebas: kategorik (perokok dan non perokok)
dan variabel terikat numerik (kadar TNF- α)
Jenis data Tidak berpasangan (perokok dan non perokok)
Jumlah kelompok 2 (perokok dan non perokok)
119
Untuk mengetahui data berdistribusi normal atau tidak harus
dilakukan uji normalitas data. Syarat yang harus dipenuhi dalam
analisis statistik parametrik untuk data numerik adalah berdistribusi
normal, jika data tidak berdistribusi normal maka dapat dilakukan
analisis menggunakan statistik non parametrik. Cara untuk menguji
distribusi data normal atau tidak dapat dilakukan dengan
Kolmogorov Smirnov (apabila jumlah data/sampel lebih dari 50),
atau menggunakan Shapiro Wilks (apabila jumlah data/sampel
kurang dari 50).
3. Entry data
a. Input nama Variabel dan data ke SPSS
120
b. Input Nama Variabel, dilakukan pada Variable View
121
Jika tersedia data numerik seperti berikut, lakukan uji
normalitasnya.
a. Buka lembar kerja SPSS, klik Variabel View, selanjutnya
masukkan data, isi baris 1 dengan kadar TNF- α dan baris 2
dengan kelompok. Untuk mengisi pada bagian “values” pada
variabel kelompok, maka klik None baris kedua sehingga muncul
kotak dialog “Value Label”, pada kotak value isikan 1 dan kotak
Label isikan perokok, lalu klik Add. Tampak di layar :
122
d. Berikutnya klik Data View akan tampak sebagai berikut:
123
f. maka muncul kotak dialog “Explore” masukkan variabel kadar
TNF- α ke kotak Dependent List, lalu masukkan variabel
kelompok ke kotak Faktor List, pada bagian “Display” pilih Both,
selanjutnya klip Plots
h. Langkah terakhir klik OK. Maka akan muncul ouput SPSS. Untuk
uji normalitas menurut Santosa S (2014) menggunakan teknik
Kolmogorov Smirnov, jika sampel lebih dari 50 dan
menggunakan Shapiro-Wilk jika sampel ≤ 50. Pengambilan
keputusan uji normalitas menurut Santosa S (2014), data
124
dikatakan berdistribusi normal jika nilai Sig (p-value) lebih besar
dari 0,05
i. Tabel output uji normalitas dengan Kolmogorov Smirnov yang
terdapat pada tabel “Test of Normality” adalah sebagai berikut:
125
5. Uji t-tidak berpasangan (Independent Sample T-Test)
Uji ini merupakan Uji hipotesis komparatif data numerik 2
kelompok tidak berpasangan distribusi normal). Uji Independent
Sample T-Test merupakan bagian dari statistik parametrik.
Langkah-langkah melakukan uji Independent Sample T-Test
1. Buka lembar kerja SPSS, lalu klik Variabel View, maka
akan tampak:
126
4. Langkah selanjutnya klik data View, maka akan tambak di
layar sebagai berikut:
127
6. Muncul kotak dialog “Independent Sample T Test”,
kemudian masukkan variabel Kadar TNF ke kotak Test
Variable (s), lalu masukkan variabel kelompok ke kotak
Grouping Variable, akan tampak pada layar sebagai
berikut:
128
8. Terakhir klik OK, maka akan muncul oupput SPSS
dengan judul “T-Test” yang selanjutkan akan kita
interpretasikan
9. Dasar pengambilan keputusan uji Independent Sampel T
Test
a. Jika nila Sig (2-tailed) <0,05 maka H0 ditolak dan
Ha diterima, artinya terdapat perbedaan yang
signifikan rerata kadar TNF- α antara perokok
dan non perokok.
b. Jika nila Sig (2-tailed) ≥0,05 maka H0 diterima
dan Ha ditolak, artinya tidak ada perbedaan
rerata kadar TNF- α antara perokok dan non
perokok.
10. Interpretasi Output hasil uji Independent Sampel T Test
Tabel Output pertama “Group Statistics”
Group Statistics
129
1,19, sementara untuk kelompok non perokok 59,79 pg/dL
dengan standar deviasi 5,84
Tabel Output Kedua “Independent Sampel Test”
131
Contoh:
Seorang mahasiswa kedokteran ingin mengetahui “ apakah
ada perbedaan rerata kadar MDA antara penderita DM dan
bukan DM” sehingga mahasiswa tersebut melakukan
penelitian dengan judul “Perbedaan rerata kadar MDA
antara penderita DM dan bukan DM”. Peneliti menetapkan
hipotesis yang digunakan one tail (satu arah), batas
kemaknaan (α) 5%.
Langkah-langkah melakukan uji Mann Whitney
1. Buka lembar Kerja SPSS, klik variabel view, pada
kolom name baris ke satu tuliskan MDA, dan pada
baris kedua tuliskan kelompok, pada bagian Label
untuk MDA tuliskan kadar MDA, dan untuk kelompok
tuliskan penderita, lalu klik kolom kedua dari Values
(None)
132
3. Langkah selanjutnya klik Data View, tampak di layar
ada 2 variabel yaitu MDA dan kelompok. Masukkan
data kadar MDA ke kotak MDA. Pada variabel
kelompok masukkan data kode untuk DM dan bukan
DM, maka akan tambak di layar sebagai berikut:
133
5. Maka akan muncul kotak dialog “Two-Independent-
Samples Test”, kemudian masukkan kadar MDA ke
kolom Test Variable List, kemudian masukkan
variabel kelompok (penderita) ke kotak Grouping
Variable, kemudian pada bagian Test Type berikan
tanda cek (v) pada pilihan Mann-Whiney U, lalu klik
tombol Define Grouping
134
tuliskan angka 1 dan pada Group 2 tulis angka 2,
kemudian klik Continue, dan klik OK
Ranks
Total 20
135
dibandingkan dengan rerata kadar MDA pada bukan
DM”
Dasar pengambilan keputusan:
1) Jika nilai Signifikansi atau Asymp.Sig. (2-
tailed) < 0,05 maka hipotesis atau Ha diterima
dan H0 ditolak
2) Jika nilai Signifikansi atau Asymp.Sig. (2-
tailed) ≥ 0,05 maka hipotesis atau Ha ditolak
dan H0 diterima
interpretasi output:
a. Dari output pada kotak “Ranks” yang dilihat
adalah Mean Rank (Selisi median MDA antar
kelompok yaitu kelompok DM dan bukan DM).
Dari output diperoleh 10 (15,50 – 5,50),
artinya secara klinik kadar MDA pada
penderita DM lebih besar jika dibandingkan
dengan rerata kadar MDA pada kelompok
bukan DM
b. Dari output pada kotak “Test Statistics”,
yang dilihat adalah nilai Asymp. Sig (2-
tailed) diperoleh nilai sig. (p-value):
0,000. Karena nilai p<0,05 maka H0 ditolak
dan Ha diterima, sehingga dapat disimpulkan
bahwa secara statistik rerata kadar MDA
pada penderita DM lebih besar jika
dibandingkan dengan rerata kadar MDA pada
kelompok bukan DM
c. Kesimpulan : Rerata kadar MDA pada
penderita DM lebih besar jika dibandingkan
dengan rerata kadar MDA pada kelompok
bukan DM
136
9. Penyajian dan interpretasi di laporan penelitian
Ouput hasil analisis data tidak boleh langsung dicopy
dan disajikan di laporan penelitian. Pada laporan
penelitian kita harus membuat tabel baru untuk
menyajikan hasil ouput analisis data di atas. Bentuk
penyajian dan interpretasinya sebagai berikut:
Tebel ....................
Hasil analisis uji Mann-Whitney
n Median p-
(Minimum-Maksimum) value
- Kadar MDA - DM 10 6,45 (4,99-7,30) 0,000
- Kadar MDA – Bukan DM 10 3,10 (2,0-3,78)
Pertanyaan latihan
19. Apa persamaan dan perbedaan antara uji Uji Independent
Sample T-Test dan uji Mann Whitney?
20. Apa persamaan dan perbedaan antara statistik parametrik
dan statistik non parametrik?
137
21. Buatlah contoh data untuk diuji dengan uji Independent
Sample T-Test lalu lakukan ujinya menggunakan SPSS dan
interpretasikan hasilnya!
22. Buatlah contoh data untuk diuji dengan uji Mann Whitney, lalu
lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
Brace N., Snelgar R.S. and Kemp R., (2012) SPSS for
Psychologists. edisi 5. London: Palgrave Macmillan.
138
BAB VII
ANALISIS KOMPARATIF
DATA NUMERIK 2 SAMPEL
BERPASANGAN
Dr. Siti Thomas Zulaikhah, S.KM, M.Kes*
*Bagian IKM Fakultas Kedokteran, Universitas Islam Sultan Agung
(UNISSULA) Semarang
*Anggota BKS IKM IKK IKP FK Se-Indonesia Regional IV
*e-mail: sitithomas@unissula.ac.id
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji t
berpasangan/ paired t-test dan menginterpretasikan hasil uji.
2. Mahasiswa mampu melakukan analisis data menggunakan uji
Wilcoxon dan menginterpretasikan hasil uji.
3. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Analisis komparatif data numerik 2 sampel berpasangan
merupakan uji statistik yang bertujuan untuk mengetahui perbedaan
mean/ rerata 2 kelompok data yang berpasangan (dependen). Bab
ini memberikan pengalaman belajar kepada mahasiswa mulai dari
entry data ke software SPSS (Statistical Product and Service
Solutions), melakukan uji t berpasangan (paired t-test) dan uji
Wilcoxon serta cara melakukan interpretasi hasil uji sehingga dapat
menyimpulkan hasil analisisnya.
139
karena penjelasan disajikan secara berurutan sampai akhir
bab. Pada akhir pembelajaran, jawablah pertanyaan-
pertanyaan pada latihan untuk menguji seberapa besar
pengetahuan dan pemahaman dari mempelajari bab ini.
Materi Belajar
A.Pengantar Analisis Komparatif Data Numerik 2
Sampel Berpasangan
Analisis komparatif data numerik 2 sampel berpasangan
merupakan uji statistik yang membandingkan mean/ rerata 2
kelompok data yang berpasangan. Pada Komparatif numerik 2
sampel berpasangan, pengukuran dilakukan berulang (2 kali)
pada individu yang sama, umumnya pengukuran dilakukan
sebelum dan sesudah (pre and post test).
Pada umumnya menggunakan judul/ tema perbandingan
atau perbedaan, sebagai contoh “Perbedaan berat Badan
(BB) sebelum dan sesudah mengikuti program diet”. Dari judul
ini maka data dapat dianalisis menggunakan uji statistik yaitu
uji beda rerata 2 kelompok data yang berpasangan. Variabel
BB mempunyai skala pengukuran numerik, sementara
program diet mempunyai skala pengukuran kategorik dikotom.
Hubungan antar variabel numerik dan kategorik bisa dianalisis
menggunakan korelatif atau komparatif. Pemilihan korelatif
atau komparatif tergantung keluaran yang diinginkan. Apabila
keluaran yang diinginkan adalah koefisien korelasi, kita harus
memilih metode korelasi. Sementara, bila keluaran yang
dinginkan adalah konsep selisih atau perbandingan, kita harus
140
memilih metode komparatif. Contoh perbandingan adalah
odds rasio (OR), risiko relatif (RR). Sementara contoh selisih
adalah selisih proporsi, selisih rerata dan lain-lain. Dari contoh
judul di atas keluaran yang diinginkan adalah selisih rerata BB
sebelum dan sesudah (pre and post test) maka yang paling
tepat menggunakan analisis komparatif, jumlah kelompok 2
karena kita akan mengukur variabel BB sebelum dan
sesudah, sehingga dapat dikatakan komparatif numerik
berpasangan 2 kelompok. Asumsi dasar atau persayaratan
melakukan uji t berpasangan data numerik (skala interval atau
rasio) dalam penelitian, dapat dilihat dari distribusi data, yaitu:
5. Apabila distribusi/ sebaran data normal gunakan uji t
berpasangan (paired t-test).
6. Apabila distribusi/ sebaran data normal gunakan uji
Wilcoxon.
Di bawah ini adalah contoh skenario untuk memahami isi
bab ini:
Untuk memenuhi salah satu syarat dalam menyelesaikan
Pendidikan Sarjana Kedokteran, maka semua mahasiswa
diwajibkan menyusun skripsi. Salah satu judul skripsi mahasiswa
adalah “Perbedaan rerata BB sebelum dan sesudah mengikuti
program diet”. Sampel yang digunakan sebanyak 30 responden.
Untuk menentukan uji hipotesis/uji statistik, maka harus dilakukan
melalui langkah-langkah sebagai berikut:
6. Menetapkan hipotesis
Hipotesis dalam statistik ada 2 jenis yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha):
c. Hipotesis Nol (Ho)
141
Hipotesis yang menyatakan tidak ada perbedaan suatu
kejadian antara kedua kelompok. Atau hipotesis yang
menyatakan tidak ada hubungan antara variabel satu
dengan variabel yang lain.
Contoh: Tidak ada perbedaan rerata BB sebelum
dan sesudah mengikuti program diet.
d. Hipotesis Alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan suatu
kejadian antara kedua kelompok. Atau hipotesis yang
menyatakan ada hubungan antara variabel satu dengan
variabel yang lain.
Contoh: ada perbedaan rerata rerata BB sebelum dan
sesudah mengikuti program diet.
Dari hipotesis alternatif akan diketahui apakah uji statitik
menggunakan satu arah (one tail) atau dua arah (two tail)
3) Satu arah (one tail): bila hipotesis alternatifnya
menyatakan adanya perbedaan dan ada pernyataan
yang mengatakan hal yang satu lebih tinggi/rendah dari
hal yang lain.
Contoh: rerata BB sesudah mengikuti program diet lebih
rendah dibandingkan rerata BB sebelum mengikuti
program diet.
4) Dua arah (two tail): merupakan hipotesis alternatif yang
hanya menyatakan perbedaan tanpa melihat apakah hal
yang satu lebih tinggi/rendah dari hal yang lain.
Contoh: ada perbedaan rerata BB sebelum dan sesudah
mengikuti program diet.
7. Menetapkan Jenis hipotesis (Korelatif atau komparatif)
Pertimbangan menggunakan korelatif atau komparatif
tergantung pada skala pengukuran variabel yang dianalisis.
142
Jika variabel yang dihubungan mempunyai skala
pengukuran numerik dengan numerik pasti menggunakan
metode korelatif. Sementara itu, Jika variabel yang
dihubungkan mempunyai skala pengukuran numerik dengan
kategorik serta variabel yang dihubungkan mempunyai skala
pengukuran kategorik dengan kategorik dapat menggunakan
metode korelatif maupun komparatif. Pemilihan korelatif atau
komparatif juga tergantung pada keluaran yang diinginkan.
Apabila keluaran yang diinginkan adalah koefisien korelasi,
maka kita harus memilih metode korelatif. Semantara,
apabila keluaran yang diinginkan adalah konsep selisih atau
perbandingan, kita harus memilih metode komparatif.
Contoh perbandingan adalah odds rasio (OR), risiko relatif
(RR) dan lain-lain. Sementara contoh selisih adalah selisih
proporsi, selisih rerata dan lain-lain.
8. Menentukan Uji statistik yang sesuai
Ada beragam uji statistik yang dapat digunakan. Setiap uji
statistik mempunyai persayaratan tertentu yang harus
dipenuhi. Jenis uji statistik sangat tergantung dari:
4) Jenis variabel yang akan dianalisis, dari contoh judul
skripsi di atas:
a. Varabel bebas: program diet
Skala : kategorik (nominal dikotom)
b. Variabel terikat: berat badan
Skala : rasio (numerik)
5) Jenis data berpasangan atau tidak berpasangan
6) Distribusi/sebaran data
Jika distribusi/sebaran data normal, maka proses
pengujian dapat menggunakan uji statistik
parametrik.
143
Jika distribusi/sebaran data tidak normal, maka
proses pengujian dapat menggunakan uji statistik
non parametrik.
9. Menentukan batas atau tingkat kemaknaan (level of
significance)
Batas/tingkat kemaknaan sering disebut dengan nilai α,
batasan ini yang digunakan untuk memutuskan apakah
hipotesis nol ditolak atau diterima. Nilai α merupakan nilai
yang menunjukkan besarnya peluang salah dalam menolak
hipotesis nol, atau batas toleransi peluang salah dalam
menolak hipotesis nol, atau batas maksimal kesalahan
menolak Ho, atau matas maksimal kita salah menyatakan
adanya perbedaan/hubungan/pengaruh. Penggunaan α
tergantung tujuan dan kondisi penelitian. Nilai α yang sering
digunakan adalah 10%, 5% atau 1%. Untuk bidang
kesehatan masyarakat biasanya menggunakan α 5%,
sedang untuk pengujian obat-obatan digunakan batas
toleransi kesalahan yang lebih kecil misalnya 1%, karena
terdapat risiko yang fatal.
10. Keputusan Uji Statistik
Dari judul skripsi diatas “Perbedaan rerata BB sebelum dan
sesudah mengikuti program diet” kita akan menetapkan
kriteria:
Arah hipotesis 2 arah (two tail) (kita tetapkan)
Jenis hipotesis komparatif (variabel yang
dihubungkan berbentuk numerik dan kategorik dan
luaran yang diinginkan selisih rerata)
Batas kemaknaan atau α 5% (kita tetapkan)
Skala variabel bebas: kategorik (program diet) dan
variabel terikat numerik (BB)
144
Jenis data berpasangan (dari pengukuran sebelum
dan sesudah mengikuti program diet)
Jumlah kelompok 2 (sebelum dan sesudah atau pre
and post)
Kesimpulan: Komparatif data numerik berpasangan 2
kelompok
145
B. Uji t berpasangan (Paired Sample T-Test/ dependent
Sample T-Test)
Syarat uji ini yaitu distribusi data normal, kedua kelompok data
berpasangan (dependent/ pair), skala variabel numerik dan
kategorik ( 2 kelompok). Uji ini merupakan bagian dari statistik
parametrik.
Langkah-langkau uji paired sample t-test:
1. Buka lembar kerja SPSS, kemudian klik Variable View. Pada
bagian Name ketik pretest dan post test. Pada bagian
Desimal diubah menjadi 0 (karena data berat badan dalam
bentuk angka bulat, bukan pecahan desimal). Pada bagian
Label ketikan BB Pre Test dan BB Post Test. Pada bagian
Measure pilih scale. Sementara untuk kolom yang lainnya
biarkan otomatis SPSS saja tidak perlu diubah-ubah. Di
layar akan tampak sebagai berikut:
146
3. Berikutnya, dari menu bar yang terdapat pada SPSS klik
menu Analyze, lalu pilih Compare Means, kemudian klik
Paired-Sample t-test.
148
6. Setelah semua prosedur atau cara melakukan uji paired
sample t-test dengan SPSS sudah dilakukan, langkah
terakhir klik OK, maka akn muncul output SPSS berjudul “T-
Test” yang selanjutnya kita interpretasikan.
7. Dasar pengambilan keputusan uji Paired Samples T Test
a. Jika nila Sig (2-tailed) <0,05 maka H0 ditolak dan Ha
diterima, artinya terdapat perbedaan yang signifikan
rerata berat badan sebelum dan sesudah diet
b. Jika nila Sig (2-tailed) ≥0,05 maka H0 diterima dan
Ha ditolak, artinya tidak ada perbedaan rerata berat
badan sebelum dan sesudah diet
8. Interpretasi tabel output “Paired Samples Statistics”
150
H0 : tidak ada perbedaan rerata berat badan (BB)
sebelum dan sesudah diet
Ha : Ada perbedaan rerata berat badan (BB) sebelum
dan sesudah diet
151
sebelum dan sesudah diet adalah antara 3,118
sampai 4,216.
153
12. Langkah selanjutnya klik menu Analyze, pilih
Nonparametric Test, kemudian pilih 2 Related Samples
154
14. Di layar akan muncul output “Wilcoxon Signed Ranks
Test” sebagai berikut:
Ranks
Sum
Mean of
N Rank Ranks
Diastolik Negativ
20a 10.50 210.00
Sesudah - e Ranks
Diastolik Positive
Sebelum 0b .00 .00
Ranks
Ties 0c
Total 20
155
Test Statisticsb
Diastolik Sesudah -
Diastolik Sebelum
Z -3.957a
Asymp. Sig.
.000
(2-tailed)
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
156
16. Interpretasi output uji wilcoxon
157
Output kedua “Test Statistics”
a. Berdasarakan ouput “Test Statistics” di atas,
diperoleh Asymp.Sig. (2-tailed): 0,000. Karena nilai
0,000 < 0,05, maka dapat disimpulkan bahwa “H0
ditolak dan Ha diterima” artinya terdapat perbedaan
tekanan diastolik sebelum dan sesudah pemberian
obat antihipertensi X pada penderita hipertensi
b. Kesimpulan : terdapat perbedaan tekanan diastolik
sebelum dan sesudah pemberian obat antihipertensi
X pada penderita hipertensi
Median p-value
(Minimum-
Maksimum)
Pertanyaan latihan
23. Apa persamaan dan perbedaan antara uji Paired Samples T-
Test dan uji Wilcoxon?
24. Buatlah contoh data untuk diuji dengan uji Paired Samples T-
Test lalu lakukan ujinya menggunakan SPSS dan
interpretasikan hasilnya!
25. Buatlah contoh data untuk diuji dengan uji Wilcoxon, lalu
lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
159
Yogyakarta : Nuha Medika
Santosa S. (2015) Menguasai Statistik Non Parametrik
Konsep Dasar dan Aplikasi dengan SPSS. Jakarta: Alex
Media Komputindo
160
BAB VIII
ANALISIS KOMPARATIF DATA NUMERIK
LEBIH DARI 2 SAMPEL TIDAK
BERPASANGAN
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis dan menginterpretasikan
Uji one way ANOVA
2. Mahasiswa mampu melakukan analisis dan menginterpretasikan
Uji Kruskal Wallis
3. Mahasiswa mampu menjawab pertanyaan latihan
Ringkasan
Pemilihan jenis uji statistik harus sesuai dengan bentuk
hipotesisnya. Uji komparatif digunakan apabila bentuk hipotesisnya
adalah jenis uji yang mengukur perbedaan (uji beda) antara dua
kelompok atau lebih, baik kelompok berpasangan maupun tidak
berpasangan. Uji komparatif parametrik menggunakan data numerik
(interval atau rasio) yang terdistribusi normal, sedangkan data
numerik yang tidak berditribusi normal maka perlakuannya sama
dengan perlakuan data ordinal yaitu menggunakan uji komparatif
non parametrik. Analisis uji komparatif data numerik lebih dari 2
sampel tidak berpasangan digunakan untuk menguji hipotesis pada
uji statistik variabel dengan skala data numerik (interval atau rasio)
pada sampel lebih dari 2. Uji komparatif parametrik yang dibahas
161
disini adalah uji Anova, sedangkan uji komparatif non parametrik
adalah uji Kruskal Wallis. Pada bab ini akan dibahas uji komparatif
skala numerik lebih dari 2 kelompok tidak berpasangan meliputi uji
Anova dan Uji Kruskal Wallis. Pada bab ini juga dibahas bagaimana
melakukan analisis SPSS dengan disertai cara membaca hasil out
put SPSS (Statistical Product and Service Solutions). Analisis
dilakukan dengan mengunakan software statistik SPSS.
.
Pesan dalam Belajar
Pemahaman isi bab akan didapatkan dengan membaca isi
bab dari awal bab sampai akhir bab secara berurutan. Pada
akhir pembelajaran, jawablah pertanyaan-pertanyaan pada
latihan untuk menguji seberapa besar pengetahuan dan
pemahaman yang anda dapatkan dari mempelajari bab ini.
Materi Belajar
A. Pengantar Analisis Uji Komparatif Data
Numerik Lebih Dari 2 Sampel Tidak
Berpasangan
Di dalam sebuah penelitian seringkali dihadapkan pada
permasalahan membandingkan nilai rerata (mean) dari
sejumlah k populasi, lebih dari dua kelompok (K>2). Selain
itu juga untuk melihat efek satu atau lebih faktor dengan
perlakuan lebih dari 2. Tentunya terdapat perbedaan dalam
pemilihan uji statistik pada kondisi tersebut. Dalam analisis
statistik dengan jumlah lebih dari dua kelompok kita tidak
dilarang menggunakan uji t, tetapi sangat tidak dianjurkan.
Karena uji t untuk mean 2 populasi memiliki kelemahan yaitu
162
antara lain :
a. Kita melakukan pengujian berulang kali sesuai kombinasi
yang mungkin. Hal ini meningkatkan risiko kesalahan tipe I
(menolak H0 bila tidak ada bedanya).
b. Bila melakukan uji t berulang akan meningkatkan (inflasi)
nilai , artinya akan meningkatkan peluang hasil yang keliru.
Pada tingkat signifikansi 0.05 artinya dengan 100 uji
perbandingan yang sama, lima akan menunjukkan
perbedaan padahal sebanarnya tidak ada (kesalahan
menolak Ho yang benar).
Uji statistik yang tepat digunakan adalah uji varian atau uji
F atau disebut juga uji Anova (Analysis of varians). Uji Anova
akan melakukan uji secara simultan untuk melihat adanya
perbedaan mean dari p populasi atau tidak. Berdasarkan
faktor yang menimbulkan variansi, maka Uji Anova
dibedakan menjadi one-way Anova dan two way Anova. One
way Anova digunakan apabila hanya ada 1 faktor yang
diamati, sedangkan apabila faktor yang diamati >2 maka
menggunkan uji two way Anova.
Uji paramaterik pada pada uji Anova memerlukan
beberapa prasyarat uji asumsi yang harus dipenuhi yaitu :
a) Kelompok atau sampel independen
b) Variasi sama atau varian homogen (uji homogenitas).
c) Data terdistribusi normal (uji normalitas)
d) Jenis data yang dihubungkan adalah numerik dengan
kategori (untuk kategori yang lebih dari dua kelompok)
Prinsip uji anova adalah melakukan telaah variabilitas data
menjadi dua sumber variasi, yaitu variasi dalam kelompok
(within) dari variasi antar kelompok (between). Bila variasi
163
dalam kelompok dan antar kelompok sama (nilai
perbandingan kedua varian sama dengan 1), mean yang
dibandingkan tidak ada perbedaan. Sebaliknya, bila hasil
perbandingan kedua varian tersebut menghasilkan nilai lebih
dari 1, mean yang dibandingkan menunjukkan ada
perbedaan.
165
Langkah Menjawab Pertanyaan
Terdapat beberapa langkah yang harus dijalankan untuk dapat
menjawab pertanyaan tersebut dengan benar, yaitu :
1. Menentukan variabel yang dihubungkan pada penelitian
ini variabel yang dihubungkan variabel bebas indeks masa
tubuh dan variabel terikat adalah kadar kolesterol darah.
2. Menentukan jenis hipotesis pada penelitian ini jenis
hipotesis yang digunakan adalah hipotesis komparatif.
3. Menentukan jenis skala variabel pada penelitian ini skala
yang digunakan adalah skala numerik.
4. Menentukan jenis data/kelompok berpasangan atau tidak
berpasangan pada penelitian ini jenis data tidak
berpasangan.
5. Menentukan jenis kelompok pada penelitian ini terdapat
kelompok > 2 yaitu ada 3 kelompok.
6. Menentukan jenis uji yang digunakan jenis uji yang sesuai
pada penelitian ini adalah uji one way Anova jika data
memenuhi persyaratan uji parametrik atau uji Kruskal wallis
jika data termasuk nonparametrik.
166
4. Jika transformasi tidak berhasil maka dipilih uji alternatif
yaitu uji Kruskal wallis.
5. Jika hasil uji Anova atau Kruskal wallis didapatkan nilai p
<0.05 maka diteruskan dengan analisis multiple comparison
atau Post Hoc.
167
- Kemudian klik Continue lanjutkan klik OK
IMT Cases
Descriptives
IMT Std.
Statistic Error
Median 186.00
Variance 236.884
Minimum 165
Maximum 220
Range 55
Interquartile Range 27
168
Kurtosis -.718 .992
Median 207.50
Variance 245.987
Minimum 185
Maximum 240
Range 55
Interquartile Range 25
Median 230.00
Variance 156.513
Minimum 210
Maximum 255
Range 45
Interquartile Range 19
Tests of Normality
170
- Hasil ouput analisis didapatkan data di bawah ini.
.512 2 57 .602
ANOVA
Kolesterol
171
MCA yang sering digunakan adalah LSD, Benferoni atau
Tukey. Uji ini juga dikenal dengan uji Post-Hoc. Hasil uji Post
Hoc data kolesterol dengan post hoc LSD ada pada tabel
berikut.
Langkah uji multiple comparison atau Post Hoc
- Buka file data set kolesterol dan IMT
- Pada toolbar Analyze Compare means One way
Anova
- Masukkan data kolesterol pada kotak dependent list
sedangkan factor diisikan IMT.
- Klik Post hoc dan centanglah LSD pada kotak Equal
Variances Assumed
- Klik Continue kemudian OK
Mean Interval
172
Obese Normal 43.650* 4.617 .000 34.41 52.89
173
Ilustrasi Kasus Uji Kruskal Wallis
Anda ingin mengetahui apakah ada perbedaan lama tidur
dalam 1 minggu pada kelompok dengan kecemasan ringan,
sedang dan berat dengan jumlah pasien masing-masing 20
orang. Pertanyaan penelitian yang anda susun “Apakah
terdapat perbedaan lama tidur antara kelompok dengan
kecemasan ringan, sedang dan berat?.”
174
Langkah melakukan Uji Kruskal Wallis
1. Melakukan pemeriksaan data ditemukan :
Data terdistribusi tidak normal atau
Data tidak homogen (varians berbeda)
2. Setelah dilakukan transformasi data tidak berhasil
membuat distribusi normal dan varians menjadi sama.
3. Jika hasil uji Kruskal wallis didapatkan nilai p <0.05 maka
diteruskan dengan analisis multiple comparison atau
Post Hoc.
TingkatCemas Cases
dimension1
Sedang 20 100.0% 0 .0% 20 100.0%
175
Descriptives
TingkatCemas Std.
Statistic Error
Variance 32.305
Minimum 32
Maximum 52
Range 20
Interquartile Range 9
Median 40.00
Variance 21.734
Minimum 30
Maximum 48
Range 18
Interquartile Range 7
176
5% Trimmed Mean 25.78
Median 23.00
Variance 64.000
Minimum 16
Maximum 40
Range 24
Interquartile Range 15
Tests of Normality
dimension1
Sedang .150 20 .200* .977 20 .897
178
Masukkan Define range
- Masukkan kode 1 (untuk kecemasan ringan)
- Masukkan kode 3 (untuk kecemasan berat)
Setelah selesai klik Continue, lalu klik OK.
Ranks
Sedang 20 37.13
dimension1
Berat 20 13.68
Total 60
Test Statisticsa,b
Durasitidur
Chi-square 28.411
Df 2
Asymp. Sig. .000
179
Agar kita bisa mengetahui kelompok mana yang memiliki
perbedaan maka langkah selanjutnya adalah melakukan uji
multiple comparison atau post Hoc. Uji yang digunakan
adalah dengan uji Mann-whitney. Dalam uji ini kita
melakukan uji beda antara kelompok kecemasan ringan
dengan sedang, kelompok ringan dengan berat dan
kelompok sedang dengan berat.
Ranks
dimension1
Sedang 20 18.80 376.00
Total 40
Test Statisticsb
Durasitidur
Mann-Whitney U 166.000
Wilcoxon W 376.000
Z -.924
Asymp. Sig. (2-tailed) .356
Exact Sig. [2*(1-tailed Sig.)] .369a
Ranks
dimension1
Berat 20 12.00 240.00
Total 40
182
Test Statisticsb
Durasitidur
Mann-Whitney U 30.000
Wilcoxon W 240.000
Z -4.610
Asymp. Sig. (2-tailed) .000
Exact Sig. [2*(1-tailed Sig.)] .000a
a. Not corrected for ties.
b. Grouping Variable: TingkatCemas
183
Hasil output analisis
Ranks
dimension1
Berat 20 12.18 243.50
Total 40
Test Statisticsb
Durasitidur
Mann-Whitney U 33.500
Wilcoxon W 243.500
Z -4.517
Asymp. Sig. (2-tailed) .000
Exact Sig. [2*(1-tailed Sig.)] .000a
184
Pertanyaan Latihan
26. Sebutkan apa sajakah syarat dilakukan uji statistik
Anova?
27. Kapan analisis statistik uji Kruskal wallis digunakan?
28. Apakah yang dimaksud dengan uji multiple comparison
atau post hoc dan bagaimana cara analisisnya?
29. Pada hasil uji Kruskal wallis yang menunjukkan hasil
bermakna, uji statistik apakah yang selanjutnya dipilih?
Referensi
Analisis of Varians (Anova) Uji F uji beda mean tiga atau lebih
sampel. Oleh: Roni Saputra, M.Si - PDF Free Download
[Internet]. [cited 2020 Dec 3]. Available from:
https://docplayer.info/77270578-Analisis-of-varians-
anova-uji-f-uji-beda-mean-tiga-atau-lebih-sampel-oleh-
roni-saputra-m-si.html
Cara Melakukan Uji Homogenitas dengan SPSS beserta
Contoh Lengkap [Internet]. SPSS Indonesia. [cited 2020
Dec 3]. Available from:
https://www.spssindonesia.com/2014/02/uji-homogenitas-
dengan-spss.html
Dahlan, Sopiyudin. (2018). ‘Pintu Gerbang Memahami
Epidemiologi Statistik, Dan Metode Penelitian', Edisi 2,
Cetakan 2. Jakarta : PT Epidemiologi Indonesia
Dahlan, Sopiyudin. (2014). 'Statistik Untuk Kedokteran Dan
Kesehatan Deskriptif, Bivariat, dan Multivariat Dilengkapi
Aplikasi Mengunakan SPSS' Edisi 6, Cetakan 11, Jakarta
: PT Epidemiologi Indonesia
Sastroasmoro, Sudigdo. (2011). ‘Dasar-dasar Metodologi
Penelitian Klinis’, Edisi 4, Jakarta : Sagung Seto
Sugiyono. 2016. ‘Statistika Untuk Penelitian’, Cetakan 27,
Bandung : Penerbit Alfabeta
Sunyoto, Danang. (2014). 'Analisis Data Penelitian Kesehatan
Dengan SPSS', Cetakan I. Yogyakarta : Nuha Medika
Tyastirin, Esti, (2017). ‘Statistik Parametrik untuk Penelitian
kesehatan, Cetakan I, Program Studi Arsitektur UIN
Sunan Ampel, Surabaya
Uji ANOVA - One Way Anova dalam SPSS - Uji Statistik
185
[Internet]. [cited 2020 Dec 3]. Available from:
https://www.statistikian.com/2012/11/one-way-anova-
dalam-spss.html
186
BAB IX
ANALISIS KOMPARATIF DATA
KATEGORIK LEBIH DARI 2 SAMPEL
BERPASANGAN
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji
Cochrane dan menginterpretasikan hasil uji.
2. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Analisis komparatif data kategorik lebih dari 2 sampel
berpasangan merupakan uji statistik yang bertujuan untuk
mengetahui perbedaan mean/ rerata lebih dari 2 kelompok
data yang berpasangan (dependen). Bab ini memberikan
pengalaman belajar kepada mahasiswa mulai dari entry data
ke software SPSS (Statistical Product and Service Solutions),
melakukan uji dengan uji Cochrane serta cara melakukan
interpretasi hasil uji sehingga dapat menyimpulkan hasil
analisisnya.
187
karena penjelasan disajikan secara berurutan sampai akhir
Bab. Pada akhir pembelajaran, jawablah pertanyaan-
pertanyaan pada latihan untuk menguji seberapa besar
pengetahuan dan pemahaman dari mempelajari bab ini.
Materi Belajar
A. Pengantar Analisis Komparatif Data Numerik
2 Sampel Berpasangan
Sebagaimana halnya dengan uji dua sampel berkaitan/
berpasangan, pengujian k sampel berkaitan dilakukan pada
tiga kelompok atau lebih (k sampel). Sampel berkaitan/
berhubungan/ berpasangan mengandung arti semua sampel
diambil berdasarkan pada karakteristik populasi yang sama
atau populasi yang identik. Data dapat diperoleh dari sampel
yang sama yang memperoleh k perlakuan atau pada k kondisi
yang berbeda sehingga setiap subyek menjadi 'pengontrol'
bagi dirinya sendiri terhadap berbagai macam kondisi. Yang
kedua, subyek pada k kelompok yang berbeda dan
dipasangkan ke dalam k kelompok atau diperlakukan ke
dalam k kondisi yang berbeda. Contoh uji data lebih dari dua
sampel berhubungan adalah uji Cochrane dan Uji Friedman.
188
mengukur/ menilai tiga sampel atau lebih dengan catatan reaksi
(hasil) terhadap suatu perlakuan hanya dinyatakan dalam dua nilai,
yaitu 0 dan 1. Karena itu, Uji Cochrane dilakukan pada penelitian
untuk uji sampel yang mempunyai data berskala nominal
(kategorik).
Kasus:
Dokter Puskesmas Ramai sedang mempertimbangkan tiga mesin
mana yang dirasakan paling memuaskan analis laboratorium
sederhana yang berkerja di Puskesmas. Dokter memutuskan untuk
mengambil 8 orang analis sebagai sampel, dan masing-masing
analis diminta menilai 3 mesin tersebut. Tiap analis memberi
penilaian sebagai berikut:
o Angka 0 jika Mesin dirasakan tidak memuaskan
o Angka I jika Mesin dirasakan memuaskan.
190
Tampak di layar kotak dialog, dengan pengisian:
→Test Variable List; masukkan variabel mesin_a,
mesin_b, dan mesin_c.
→Untuk Test Type atau tipe uji, karena dalam kasus
akan diuji dengan Cochrane, maka klik mouse pada
pilihan Cochrane.
Tekan OK untuk proses data.
Analisis Hipotesis
Hipotesis untuk kasus ini:
191
H0 = Semua perlakuan mempunyai efek yang Sama. Atau,
dalam kasus ini ketiga mesin mempunyai kinerja yang sama.
Hi = Tidak semua perlakuan mempunyai efek yang sama.
Atau, dalam kasus ini ketiga mesin mempunyai kinerja yang
berbeda.
Pengambilan Keputusan
Dengan membandingkan Statistik Hitung dengan Statistik tabel
Jika Statistik Hitung < Statistik Tabel, maka H0 diterima.
Jika Statistik Hitung > Statistik Tabel, maka H0 ditolak.
Keputusan:
Karena Statistik Hitung < Statistik Tabel (0,333 > 5,991), maka H0
diterima.
Berdasarkan Probabilitas
o Jika probabilitas > 0,05, maka H0 diterima.
o Jika probabilitas < 0,05 maka H0 ditolak.
192
Keputusan:
Terlihat bahwa pada kolom asymp. Sig / asymptotic significance
adalah 0,846 atau probabilitas di atas 0,05 (0,846 > 0,05). Maka H0
diterima, atau ketiga Mesin memberikan kinerja yang relatif
sama.
Pertanyaan Latihan
1. Analisis kategorik lebih dari 2 sampel berpasangan dapat
digunakan uji…
a. T-paired test
b. Wilcoxon
c. Chi-square
d. Cochrane
e. Saphiro-wilk
2. Skala yang sapat dipakai dalam uji Cochrane adalah…
a. Nominal
b. Ordinal
c. Numerik
d. A dan B
e. A, B, dan C
3. Interpretasi P<0,05 adalah…
a. H0 diterima
b. H0 ditolak
c. H1 ditolak
d. H0 ditolak, H1 ditolak
e. Semua salah
193
b. Tingkat kebenaran 5%
c. Tingkat kesalahan 5%
d. Tingkat kesalahan 95%
e. A dan C
5. Uji Cochrane merupakan perluasan dari uji…
a. McNemar
b. Wilcoxon
c. ANOVA
d. T berpasangan
e. T-independen
Referensi
194
BAB X
ANALISIS KOMPARATIF
DATA KATEGORIK 2 SAMPEL TIDAK
BERPASANGAN
dr. Ratnawati, M.Kes*
*Bagian IKM Fakultas Kedokteran, Universitas Islam Sultan Agung
*Anggota BKS IKM IKK IKP FK Se-Indonesia Regional IV
*e-mail: ratnawati@unissula.ac.id
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis dan menginterpretasi-kan
Uji Chi square.
2. Mahasiswa mampu melakukan analisis dan menginterpretasi-kan
Uji Fisher.
3. Mahasiswa mampu menjawab pertanyaan Latihan.
Ringkasan
Analisis uji komparatif kategorik tidak berpasangan digunakan
untuk menguji hipotesa pada uji statistik variabel dengan skala data
kategorik (Nominal dan ordinal). Disebut Analisis komparatif karena
tujuan analisis untuk mengetahui hubungan dengan
membandingkan selisih proporsi. Disebut tidak berpasangan karena
pengukuran variabel pada sampel hanya sekali. Pada Bab ini akan
membahas uji komparatif kategorik tidak berpasangan meliputi uji
Chi Square (Uji Kai - Kuadrat (Uji X2) dan Uji Fisher. Pada bab ini
juga dibahas bagaimana menghitung Expected Count, PR, OR, RR
secara manual dan melakukan analisis SPSS dengan disertai cara
membaca hasil output SPSS (Statistical Product and Service
Solutions). Analisis dilakukan dengan mengunakan software
statistik SPSS.
195
Pesan dalam Belajar
Pemahaman isi bab akan didapatkan dengan membaca isi bab
dari awal bab sampai akhir bab secara berurutan. Pada akhir
pembelajaran, jawablah pertanyaan-pertanyaan pada latihan untuk
menguji seberapa besar pengetahuan dan pemahaman yang
mahasiswa dapatkan dari mempelajari bab ini.
Materi Belajar
A. Pengantar Analisis Uji Komparatif Kategorik
Tidak Berpasangan
Uji komparatif kategorik digunakan untuk menganalisis atau
menguji penelitian dengan hipotesa hubungan variabel bebas dan
terikat skala data kategorik dengan cara membandingkan. Adapun
yang dilakukan perbandingan adalah persamaan dan perbedaan
dua atau lebih fakta/sifat obyek yang diteliti berdasarkan kerangka
pemikiran tertentu.
Tujuan dari analisis komparasi ada beberapa, anatara lain:
1. Membandingakan persamaan dan perbedaan dua atau lebih
fakta/sifat obyek yang diteliti.
2. Membuat generalisasi tingkat perbandingan.
3. Membantu dalam menentukan pilihan mana yang yang lebih baik
atau mana yang sebaiknya dipilih.
4. Membantu mengetahui kemungkinan sebab akibat berdasarkan
hasil pengamatan terhadap akibat yang ada dan mencari kembali
faktor yang mungkin menjadi penyebab melalui data hasil
pengamatan.
Dalam menentukan pilihan analisis yang digunakan kita harus,
kita harus mengetahui:
1. Tujuan Penelitian
196
2. Skala data variabel
3. Jenis hipotesa yang diharapkan.
Berikut adalah contoh skenario penelitian yang bisa digunakan
untuk memahami isi bab ini.
Skenario:
Mahasiswa akan melakukan penelitan tentang “Pengaruh status
marital terhadap kejadian stunting pada balita“. Desain yang
digunakan adalah cross sectional.
Untuk menentukan analisis yang digunakan maka kita harus
melakukan identifikasi dengan langkah-langkah sebagai berikut:
1. Tujuan Penelitian:
- Untuk mengetahui hubungan status marital ibu dengan
kejadian stunting pada anak balita
- Mengetahui besarnya faktor risiko
2. Skala data:
a. Variabel bebas:
- Status Marital: Janda dan bersuami
- Skala data: Nominal
b. Variabel Terikat: Kejadian Stunting
- Stunting: - Ya : HAZ < -2 SD
- Tidak : HAZ ≥ -2 SD
- Skala Data: Ordinal
197
Hipotesa penelitan
a. Ho : Tidak terdapat hubungan yang signifikan antara status
marital ibu dengan kejadian stunting pada anak balita.
b. Ha : Terdapat hubungan yang signifikan antara status marital
ibu dengan kejadian stunting pada anak balita.
Uji hipotesa dapat dilakukan dengan memilih uji analisis
seperti pada Tabel 10.1 dibawah ini
Trend: Trend:
Chi Square for Trend + Post hoc Kruskal Walls + Post hoc
Pengabungan sel
Nominal Chi Square + Pos hoc Tidak dapat digaubungan
⇨Beberapa Tabel B x K
198
1. Tujuan Uji Chi Square
Tujuan pengunaan uji ini adalah sebagai berikut:
a. Menguji ketidaktergantungan (independence) atau hubungan
(association) antara dua variabel.
b. Menguji homogenitas apakah dua variabel berasal dari
populasi yang sama.
c. Menguji kesesuaian (goodnes of fit), apakah suatu sampel
berasal dari suatu populasi yang berdistribusi tertentu.
d. Untuk menguji proporsi, apakah proporsi kedua kelompok
sampel ada perbedaan.
3. Prinsip pengujian
a. Membandingkan frekwensi teramati (O: Observed value)
dengan frekwensi yang diharapkan (E: Expected value).
Asumsi yang digunakan adalah:
1) Ho = O=E
2) Jika perbedaan O dan E cukup besar (significant), maka
dapat disimpulkan:
199
b. Ada ketergantungan / hubungan antara kedua variabel yang
diuji
c. Kedua variabel yang diuji berasal dari populasi yang sama
(homogen)
d. Sampel yang diuji tidak berasal dari populasi yang
berdistribusi normal
200
Tabel 10.2 Contoh Tabel Kontigensi 2X2 (2 Baris X 2 Kolom)
Stunting Jumlah
Ya Tidak
Status Janda a b a+b
Marital Bersuami c d c+d
Jumlah a+c b+d
Keterangan: cell : Kotak a, b, c, d
Observed : nilai a, b, c, d
Jumlah cell : 4 kotak
201
adalah bersuami. Jika dengan SPSS cukup meletakkan
variabel Status marital pada Row dan Stunting Pada Colom
(Lihat Tabel 10.4)
202
4. Uji Chi Square Pada Pengujian Komparattif Asosiasi
(Hubungan) Mengunakan SPSS
Berdasarkan skenario diatas (Pada sub bab pengantar pada
bab ini) maka langkah-langkah yang dilakukan adalah sebagai
berikut:
203
d. Melakukan analisis chi square
Langkah-langkah melakukan analisis chi square adalah
sebagai berikut:
1) Buka file data spss
2) Klik: Analyze ⇨Descriptif statistic ⇨Crosstabs
204
PR pada desain penelitian cross sectional. OR pada desain
case control dan RR pada desain Cohort). Tampilan seperti
Gambar 10.5
205
e. Output Analisis Chi Square
206
1) Gambar 10.7 mengambarkan deskripsi masing-masing sel
untuk nilai observed dan persentase 100 % ke arah baris.
2) Tabel 2x2 ini memenuhi kriteria chi Square
3) Sehingga hasil analisis yang dilihat pada gamabr 10.8
adalah Pearson Chi Square Asymp. Sig. (2-sided)
didapatkan P = 0,000, artinya secara statistic terdapat
hubungan yang bermakna antara status marital ibu dengan
kejadian stunting anak karena p <0,005.
4) Parameter hubungan yang digunakan adalah PR karena
desainnya cross sectional. Nilai yang digunakan pada
gambar 10.9 adalah adalah For cohort status stunting =
Stunting, Bukan for cohort status stunting = tidak stunting
(ini berdasarkan pada sel a tabel 2x2 diatas yang menjadi
faktor resiko adalah stunting. Nilai PR=5,833; CI(2,898–
11,741). Cara menginterpretasikan nilai PR adalah dengan
melihat sel a pada Tabel 2 X 2. Ibu dengan status marital
janda berisiko 5,833 kali lebih berisiko mempunyai anak
stunting dibandingkan dengan ibu yang mempunyai suami.
CI mendiskripsikan apakah PR merupakan faktor risiko /
faktor protektif / tidak faktor protektif maupun faktor risiko.
Jika range CI tidak mencakup angka 1 dan > 1 maka
variabel bebas merupakan faktor risiko, tetapi jika range CI
< 1 maka variabel bebas merupakan faktor protektif.
5) PR bisa dihitung secara manual dengan mengunakan
rumus: PR = a/(a+b) : c/(c+d). Jika kita lihat Tabel 10.4
atau gambar 10.7 kita ketahui sel a = 20 ; b=10 ; c=8 ;
d=62. Sehingga hitungan PR sebagai berikut:
PR = 20/(20+10) : 8/(8+62)
= (20/30) : (8/70)
= 5,833
207
Hasil hitungan manual dan SPSS menunjukkan hasil yang
sama.
Jika desain penelitian adalah case control maka besarnya
faktor risiko adalah Odd Rasio (OR), hasil analisis SPSS
yang dilihat pada gambar 10.9 adalah nilai Odds Ratio for
status pernikahan ibu (janda/bersuami), didapatkan nilai
OR = 15,5.
Jika kita hitung dengan manual dengan mengunakan
rumus OR = (a.d) / (b.c)
OR = (20 x 62) / (10 x 8)
= 15,5
Jika desain penelitian cohort maka rumus faktor risiko
sama dengan PR.
208
Untuk mengetahuai bahwa kejadian stunting adalah hanya
dipengaruhi pengetahuan ibu maka perlu dilakukan uji homogenitas
dari sampel terkait pendapatannya apakah sudah homogen atau
belum. Pendapatan dijadikan perancu karena bisa mempergaruhi
kemampuan belanja untuk pemenuhan gizi yang akan
mempergaruhi status anak stunting atau tidak. Perhatikan Gambar
10.10 dibawah ini untuk memahami apakah pendapatan sampel ibu
antara kasus dan control sudah homogeny
Chi-Square Tests
Pendapatan Ibu * Anak Stunting Crosstabulation
Count
Anak Stunting
Stunting Tidak Stunting Total
Pendapatan Dibawah UMR 8 3 11
Ibu Diatas UMR 22 27 49
Total 30 30 60
a. 0 cells (0.0%) have expected count less than 5. The minimum expected
count is 5.50.
b. Computed only for a 2x2 table
Gambar 10.10 Uji Beda Pendapatan ibu Sampel Kasus dan Kontrol
209
Berdasarkan Gambar 10.10 kita dapat mengetahui bahwa p =
0.095 (p > 0.005) sehingga dapat disimpulkan bahwa pendidikan
antara kelompok kasus dan control adalah homogeny, artinya
tidak ada beda pendapatan keluarga antara kelompok kasus
(stunting) dan control (tidak stunting) dan karena homogeny
maka pendapatan tidak mempergaruhi kejadian stunting.
Tabel 4.4 Perbedaan Chi Square for Propotion dan Chi Square
for Trend
No Proporsi Stunting Apakah terdapat Apakah terdapat
Pada Pendidikan Ibu Perbedaan Tren Makin Tinggi
Rendah, sedang, Proporsi Stunting Pendidikan ibu
Tinggi Pada Pendidikan makin rendah
Ibu Rendah, kejadian stunting?
sedang, Tinggi?
1 75%, 66,7%, 14,3% Ya Ya
2 75%, 14,3%, 66,7% Ya Tidak
210
Pendidikan Ibu1 * status stunting Crosstabulation
status stunting
tidak
Stunting stunting Total
Pendidikan SD- Count 15 5 20
Ibu1 SLTP % within Pendidikan Ibu1 75.0% 25.0% 100.0%
SLTA Count 30 15 45
% within Pendidikan Ibu1 66.7% 33.3% 100.0%
PT Count 5 30 35
% within Pendidikan Ibu1 14.3% 85.7% 100.0%
Total Count 50 50 100
% within Pendidikan Ibu1 50.0% 50.0% 100.0%
Chi-Square Tests
Asymp. Sig. (2-
Value df sided)
Pearson Chi-Square 27.857a 2 .000
Likelihood Ratio 30.142 2 .000
Linear-by-Linear Association 22.991 1 .000
N of Valid Cases 100
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count
is 10.00.
Gambar 10.11 Hasil Analisis Chi Square Tren
211
Chi-Square Tests
Asymp. Sig. (2-
Value df sided)
Pearson Chi-Square 35.714 a 2 .000
Likelihood Ratio 39.624 2 .000
Linear-by-Linear Association 9.556 1 .002
N of Valid Cases 100
a. 0 cells (0.0%) have expected count less than 5. The minimum expected
count is 15.00.
Gambar 10.12 Hasil Analisis Chi Square Proporsi
Hasil analisis Chi Square for propotion pada gambar 10.10 dan
Gambar 10.11 adalah sama yaitu p = 0,000, artinya uji statistik
secara proporsi adalah sama. Untuk uji statistic Chi Square untuk
tren hasilnya berbeda (p=0,000 pada Gambar 10.11 dan pada
Gambar 10.12 didapatkan p= 0.002).
Pada Tabel 2x2 hasil analisis Chi Square untuk proporsi dan tren
adalah sama, tidak ada perbedaan.
7. Uji Fisher
Uji fisher Exact Test digunakan sebagai uji alternative untuk tabel
silang (kontingensi) 2x2 dimana uji chi square tidak memenuhi
syarat.
Sebagai contoh perhatikan ilustrasi hasil analisis scenario kasus
diatas, hubungan pendidikan ibu dengan kejadian stunting (lihat
gambar 10.13).
212
% within Pendidikan Ibu 25.0% 75.0% 100.0%
Total Count 28 72 100
Expected Count 28.0 72.0 100.0
% within Pendidikan Ibu 28.0% 72.0% 100.0%
213
- Klik pada old values range values through highest ketik angka
3 dan pada new values klik values ketik 2.
- Klik continue
- Klik OK
- Lakukan langkah analisis Chi Square dengan variabel
katpendidikan sebagai variabel bebas dan stunting sebagai
variabel terikat
- Lihat Gambar 10.15 (a,b,c) untuk mengetahui langkah dari
awal hingga akhir
- Lihat Gambar 10.16 untuk mengetahui hasil tabel
penyederhanaan
- Lihat Gambar 10.17 untuk mengetahui hasil analisis
(a) (b)
(c)
Gambar 10.15 (a, b, c) Langkah Penyederhanaan Sel
214
Kategori Pendidikan ibu * status stunting Crosstabulation
status stunting
Stuntin tidak
g stunting Total
Kategori SD-SLTA Count 27 69 96
Pendidikan Expected Count 26.9 69.1 96.0
ibu % within Kategori
28.1% 71.9% 100.0%
Pendidikan ibu
PT Count 1 3 4
Expected Count 1.1 2.9 4.0
% within Kategori
25.0% 75.0% 100.0%
Pendidikan ibu
Total Count 28 72 100
Expected Count 28.0 72.0 100.0
% within Kategori
28.0% 72.0% 100.0%
Pendidikan ibu
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square .019 a 1 .892
Continuity Correctionb .000 1 1.000
Likelihood Ratio .019 1 .890
Fisher's Exact Test 1.000 .688
Linear-by-Linear Association .018 1 .892
N of Valid Cases 100
a. 2 cells (50.0%) have expected count less than 5. The minimum expected count
is 1.12.
b. Computed only for a 2x2 table
215
4.16 ( 2 cells 50.0% have expected count less than 5 sehingga
tidak memenuhi analisis Chi Square. sehingga analisis yang
digunakan adalah Uji Fisher Exact Test. Hasil analisis Uji Fisher
Exact Test pada gambar 4.16 didapatkan pada Asymp. Sig. (2-
sided), p = 1.00. Sehingga dapat kita simpulkan hasil analisis Uji
Fisher Exact Test menunjukan tidak terdapat hubungan yang
bermakna antara kategori pendidikan ibu dengan kejadian
stunting karena p > 0,005 (p =1.00).
Pertanyaan latihan
1. Kapan kita mengunakan uji Chi Square dan Fisher?
2. Interpretasikan hasil analisis SPSS dibawah ini
a. Berapakah observed sel a, b, c, d
b. Berapakah ecpected cound sel a, b, c, d
c. Jika desain penelitian cross sectional, berapakah PR hasil
analisis dengan mengunakan SPSS
d. Hitunglah dan interpretasikan PR, OR, RR secara manual
dengan mengunakan Tabel Kontingensi dibawah ini:
216
Chi-Square Tests
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count
is 8.16.
b. Computed only for a 2x2 table
Risk Estimate
Referensi
Dahlan, Sopiyudin. (2018). ‘Pintu Gerbang Memahami Epidemiologi
Statistik, Dan Metode Penelitian', Edisi 2, Cetakan 2. Jakarta :
PT Epidemiologi Indonesia
Dahlan, Sopiyudin. (2014). 'Statistik Untuk Kedokteran Dan
Kesehatan Deskriptif, Bivariat, dan Multivariat Dilengkapi
Aplikasi Mengunakan SPSS' Edisi 6, Cetakan 11, Jakarta : PT
Epidemiologi Indonesia
Endra, Febri BS. (2017). ‘Penghantar Metodologi Penelitian
(Statistika Praktis)’, Malang : FK UMM
217
Ngambut, Karolus.(2011). 'Pengantar Biostatistik (Aplikasi
Penggunaan SPSS)', Cetakan 1, Yogyakarta : Gosyen
Publishing
Sastroasmoro, Sudigdo. (2011). ‘Dasar-dasar Metodologi
Penelitian Klinis’, Edisi 4, Jakarta : Sagung Seto
Sugiyono. 2016. ‘Statistika Untuk Penelitian’, Cetakan 27, Bandung
: Penerbit Alfabeta
Sunyoto, Danang. (2014). 'Analisis Data Penelitian Kesehatan
Dengan SPSS', Cetakan I. Yogyakarta : Nuha Medika
218
BAB XI
ANALISIS REGRESI LINEAR
dr. Ronny Isnuwardana, MIH*
*Laboratorium IKM dan KK Pendidikan Dokter S-1, Universitas
Mulawarman
*Anggota BKS IKM IKK IKP FK Se-Indonesia Regional IV
*e-mail: isnuwardana@gmail.com
Tujuan pembelajaran:
1. Mahasiswa mampu memahami dan menerapkan konsep
regresi linear sederhana dalam uji hipotesis
2. Mahasiswa mampu memahami dan menerapkan konsep
regresi linear berganda dalam uji hipotesis
3. Mahasiswa mengetahui asumsi dan hal-hal yang perlu
diperhatikan dalam regresi linear
Ringkasan
Regresi linear adalah uji hipotesis yang memprediksi
hubungan antara variabel dependen numerik dengan satu variabel
independen numerik lainnya dalam regresi linear sederhana dan
beberapa variabel independen dalam regresi linear berganda.
Pesan Belajar
Pemahaman isi bab akan didapatkan dengan membaca isi bab
dari awal bab sampai akhir bab secara berurutan. Pada akhir
pembelajaran, jawablah pertanyaan-pertanyaan pada latihan untuk
menguji seberapa besar pengetahuan dan pemahaman yang
mahasiswa dapatkan dari mempelajari bab ini.
Materi Belajar
A. Regresi linear sederhana
Regresi linear sederhana (simple linear
regression) merupakan alternatif dari uji yang menilai
219
hubungan antara dua variabel yang sifatnya
numerik/kontinu1, terutama jika tujuannya untuk menaksir
nilai satu variabel terhadap nilai variabel lainnya jika
variabel lainnya ini diberi nilai. Misalnya jika kita ingin
mengetahui berapa perkiraan nilai tekanan darah sistolik
jika usia seseorang 38 tahun, maka penggunaan analisis
korelasi, meskipun sama-sama menilai asosiasi yang
linear (Bab V dan VI), namun tidak tepat digunakan,
karena hanya menunjukkan kekuatan hubungan dalam
satu nilai konstanta korelasi. Oleh karena itu, untuk
kasus seperti ini, metode analisis regresi lebih tepat
digunakan.
220
oleh garis lurus, seperti gambar 1, maka analisis regresi
linear tidak dapat digunakan.
luaran
luaran
Gambar 1 Hubungan linear dan non-linear antara prediktor dan luaran yang kontinu
B. Set data
Jika kita ingin mengetahui apakah ada persamaan
yang bisa memprediksi nilai tekanan darah sistolik
berdasarkan usia, kita membutuhkan data kedua
variabel tersebut. Data yang digunakan dalam bab ini
221
adalah data 303 pasien dengan atau tanpa penyakit
jantung dari Heart Disease UCI.3
Variabel Keterangan
age usia
sex Jenis kelamin (1 laki-laki 0
perempuan)
cp jenis nyeri dada (4 kategori)
trestbps tekanan darah sistolik istirahat
chol serum kolesterol dalam mg/dl
fbs gula darah puasa> 120 mg/dl
restecg hasil elektrokardiograf istirahat (3
kategori)
thalach denyut jantung maksimum
exang angina yang diinduksi latihan
oldpeak depresi ST yang disebabkan oleh
olahraga relatif terhadap istirahat
slope kemiringan puncak latihan
segmen ST saat latihan (1 naik 2
datar 3 turun)
ca jumlah pembuluh besar (0-3)
yang ditandai fluoroskop
thal 1 normal 2 cacat tetap 3 cacat
reversibel
target penyakit jantung
222
Impor file csv ini ke program statistik yang Anda
gunakan. Kali ini kita menggunakan contoh Microsoft
Excel, IBM SPSS Statistics dan Stata. Jika Anda
berminat menggunakan perangkat lunak sumber
terbuka, Anda juga dapat menggunakan BlueSky, JASP
atau Jamovi yang dibuat dari bahasa pemrograman R, di
mana tampilan-muka menu kedua program menyerupai
dengan IBM SPSS Statistics.
223
Masukkan kolom yang mencantumkan data “age” ke
Input X Range dan data “trestbps” ke Input Y Range, centang
“Labels” jika mengikutkan judul kolom data dan Confidence
Level 95% .
Hasil
SUMMARY
OUTPUT
Regression
Statistics
M 0
u .
l 2
t 7
i 9
p 3
l 5
e 1
R
R 0
.
S 0
q 7
u 8
a 0
r 3
e 7
A 0
d .
224
j 0
u 7
s 4
t 9
e 7
d 4
S
q
u
a
r
e
S 1
t 6
a .
n 8
d 6
a 7
r 8
d 8
E
r
r
o
r
O 3
b 0
s 3
e
r
v
a
t
i
o
n
s
A
N
O
V
A
S
i
g
n
i
f
i
c
a
n
c
e
d S M
f S S F F
225
R 1 7 7 2 7
e 2 2 5 .
g 4 4 . 7
r 8 8 4 6
e . . 7 E
s 9 9 7 -
s 3 3 2 0
i 7 7 8 7
o
n
R 3 8 2
e 0 5 8
s 1 6 4
i 4 .
d 2 5
u . 2
a 1 5
l 7 5
T 3 9
o 0 2
t 2 8
a 9
l 1
.
1
1
S
t
C a
o n
e d
f a L U
f r o p
i d P w p
c t - e e
i E v r r
e r S a
n r t l 9 9
t o a u 5 5
s r t e % %
I 1 5 1 2 9 1
n 0 . 7 . 0 1
t 2 8 . 7 . 3
e . 9 3 8 7 .
r 2 0 6 E 0 8
c 9 5 6 - 4 8
e 6 8 0 4 1 8
p 1 3 4 7 6
t
a 0 0 5 7 0 0
g . . . . . .
e 5 1 0 7 3 7
3 0 4 6 2 4
9 6 7 E 9 9
4 8 5 - 1 7
4 7 0 0 3 5
5 4 3 7 1 9
226
Hasil dari Microsoft Excel menunjukkan dari 303 kasus,
besar R2 = 0,078037 menunjukkan model regresi linear usia ini
hanya bisa menjelaskan 7,80 persen dari keseluruhan varians
data.
Uji F memiliki nilai F hitung adalah 25,47728 memiliki
signifikansi <0.01untuk hubungan linear antara usia dan
tekanan darah sistolik. Nilai SS (Sum of Squares) dan MS
(Mean Square) beserta derajat kebebasannya (df: degree of
freedom) merupakan bagian dari perhitungan metode least
square.
Model regresi dapat dituliskan sebagai
227
2. Regresi linear sederhana dengan IBM SPSS
Statistics
Luaran: tekanan darah sistolik (trestbps)
Prediktor: usia (age)
Metode Menu: Analyze > Regression > Linear
trestbps > Dependent
age > Independent(s)
Klik “OK”
Metode Sintak:
REGRESSION
/DEPENDENT trestbps
/METHOD=ENTER age.
Hasil
Variables Entered/Removeda
Variables Variables
Model Entered Removed Method
228
1 ageb . Enter
Model Summary
ANOVAa
Sum of Mean
Model Squares df Square F Sig.
229
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
230
atau menggunakan sintak berikut:
REGRESSION
/STATISTICS COEFF OUTS
CI(95) R ANOVA
/DEPENDENT trestbps
/METHOD=ENTER age.
Hasil
Coefficientsa
Standardize
Unstandardized d 95.0% Confidence
Coefficients Coefficients Interval for B
231
95% baik untuk koefisien usia dan intercept tidak melalui angka
0.
Hasil
Source | SS df MS Number of obs =
303
-------------+---------------------------------- F(1, 301) = 25.48
Model | 7248.93687 1 7248.93687 Prob > F =
0.0000
Residual | 85642.172 301 284.525489 R-squared
= 0.0780
-------------+---------------------------------- Adj R-squared =
0.0750
Total | 92891.1089 302 307.586453 Root MSE =
16.868
------------------------------------------------------------------------------
trestbps | Coef. Std. Err. t P>|t| [95% Conf.
Interval]
-------------+----------------------------------------------------------------
age | .5394452 .1068737 5.05 0.000 .329131
.7497595
_cons | 102.2961 5.890583 17.37 0.000 90.70416
113.888
233
merokok”, “pernah merokok”, dan “aktif merokok”, maka kita
akan membentuk (3-1) = 2 variabel dummy, misalnya kita
gunaan “tidak merokok” sebagai acuan, maka konsepnya
adalah sebagai berikut:
Riwayat
Dumm Dumm
meroko
y1 y2
k
Tidak
meroko 0 0
k
Pernah
meroko 1 0
k
Aktif
meroko 0 1
k
Dari sini kita dapat membuat 2 variabel dummy, yaitu
variabel “Pernah merokok” dan variabel “Aktif merokok”,
dengan nilai 0 untuk “Tidak merokok” dan 1 untuk sesuai
masing-masing nama variabelnya.
234
seleksi area. Pastikan variabel kategorikal sudah mengikuti
konsep
Menu: Data > Data Analysis > Regression > OK
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.32
2696
R Square 0.10
4133
Adjusted 0.09
R Square 2108
Standard 16.7
Error 1094
Observati 303
ons
ANOVA
df SS MS F Signifi
cance
F
Regressio 4 9672.9 24 8.6 1.27E-
n 94 18. 59 06
24 63
9
Residual 298 83218. 27
11 9.2
235
55
4
Total 302 92891.
11
Metode Sintak:
REGRESSION
/STATISTICS COEFF OUTS CI(95) R ANOVA
/DEPENDENT trestbps
/METHOD=ENTER age sex chol fbs..
Hasil
Variables Entered/Removeda
Variables Variables
Model Entered Removed Method
238
Model Summary
ANOVAa
Sum of Mean
Model Squares df Square F Sig.
Coefficientsa
Standardi
zed 95.0%
Unstandardized Coefficien Confidence
Coefficients ts Interval for B
239
Interpretasinya serupa dengan hasil SPSS sebelumnya
dan sama seperti hasil Microsoft Excel.
b. Seleksi model
Namun dalam memilih prediktor yang terlibat dalam
persamaan regresi ada konsep yang disebut parsimoni atau
hemat dalam prediktor, artinya model regresi menggunakan
sesedikit mungkin prediktor namun tetap tangguh dalam
menjelaskan hubungan antara prediktor dengan luaran.
Untuk itu kita perlu melakukan seleksi terhadap prediktor
yang akan dimasukkan ke dalam persamaan, dan tidak semua
prediktor layak dimasukkan ke dalam model. Apabila kita punya
cukup banyak prediktor, umumnya kita mengambil prediktor
yang memiliki signifikansi yang memadai dari uji bivariat yang
akan dimasukkan ke dalam model, dan tidak harus signifikansi
di level p-value <0.05, namun kita bisa longgarkan hingga p-
value <0.1 atau <0.15, dengan harapan apabila secara uji
hipotesis hubungan bivariat kurang bermakna maka
kemungkinan dalam model multivariabel bisa bermakna
bersama-sama variabel lainnya. Demikian pula jika kita memiliki
prediktor yang dianggap penting atau utama dalam penelitian
kita, dapat pula dimasukkan ke dalam model regresi meskipun
(untuk sementara) tidak bermakna dalam uji hipotesis hubungan
bivariat.1
Setelah kita memiliki variabel prediktor yang kita seleksi,
maka kita masukkan ke dalam metode seleksi, yaitu:
1. Forward selection, di mana model dimulai tanpa
prediktor, kemudian hanya prediktor yang memenuhi
syarat korelasi yang paling besar yang dimasukkan dan
dihitung signifikansinya, kemudian dimasukkan lagi
240
prediktor berikutnya yang lebih kecil korelasinya
demikian seterusnya dan berhenti saat tidak ada lagi
prediktor yang korelasinya lebih kecil namun masih
memiliki signifikansi.
2. Backward elimination adalah kebalikan forward selection,
di mana model dimulai dengan seluruh prediktor,
kemudian prediktor dengan korelasi terkecil dikeluarkan
dan dihitung signifikansinya, kemudian dikeluarkan lagi
prediktor berikutnya yang lebih besar korelasinya
demikian seterusnya dan berhenti saat tidak ada lagi
prediktor yang korelasinya lebih besar namun masih
memiliki signifikansi.
3. Stepwise adalah modifikasi gabungan kedua metode
forward dan backward selection, di mana model kosong
diisi menurut model forward selection dalam satu tahap
kemudian prediktor dieliminasi secara backward
elimination satu tahap, lalu prediktor yang tereliminasi
dimasukkan kembali secara forward, demikian
seterusnya.
4. Remove adalah metode eliminasi secara blok.
Namun demikian dalam pemilihan model yang tepat,
tidak harus juga menggunakan metode seleksi. Metode lainnya
misalnya dengan menggunakan perhitungan Akiake Information
Criterion (AIC) atau Bayesian Information Criterion.(BIC), namun
hal ini di luar pembahasan bab ini.1
241
Berikut ini contoh penggunaan metode Stepwise
Hasil
Variables Entered/Removeda
242
Model Summary
ANOVAa
Sum of Mean
Model Squares df Square F Sig.
243
Coefficientsa
Standardiz
ed 95.0%
Unstandardized Coefficient Confidence
Coefficients s Interval for B
Collinearity Statistics
Partial
Model Beta In t Sig. Correlation Tolerance
------------------------------------------------------------------------------
trestbps | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .4734467 .1094205 4.33 0.000 .2581118
.6887816
1.sex | -1.006015 2.112099 -0.48 0.634 -5.162533
3.150504
chol | .0214956 .0193139 1.11 0.267 -.0165133
.0595044
1.fbs | 7.294392 2.724271 2.68 0.008 1.933147
12.65564
_cons | 100.1946 7.275698 13.77 0.000 85.87631
114.5128
------------------------------------------------------------------------------
245
b. Metode stepwise forward
Command
sw, pe(0.05): regress trestbps age i.sex chol i.fbs
Hasil
note: 0b.sex dropped because of estimability
note: 0b.fbs dropped because of estimability
begin with empty model
p = 0.0000 < 0.0500 adding age
p = 0.0087 < 0.0500 adding 1.fbs
------------------------------------------------------------------------------
trestbps | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .5052938 .1066163 4.74 0.000 .2954834
.7151043
1.fbs | 7.1782 2.718432 2.64 0.009 1.82859 12.52781
_cons | 103.0867 5.840676 17.65 0.000 91.59283
114.5806
------------------------------------------------------------------------------
------------------------------------------------------------------------------
trestbps | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .5052938 .1066163 4.74 0.000 .2954834
.7151043
1.fbs | 7.1782 2.718432 2.64 0.009 1.82859 12.52781
_cons | 103.0867 5.840676 17.65 0.000 91.59283 114.5806
------------------------------------------------------------------------------
247
Selain itu perlu diperhatikan untuk regresi linear:
6. Hindari multikolinearitas atau korelasi yang tinggi
antara prediktor-prediktor, contoh indeks massa
tubuh dan lingkar perut
7. Data yang tak wajar atau yang berpengaruh besar:
adanya outlier, data yang high leverage.
Metode diagnostik regresi linear untuk menilai asumsi-
asumsi di atas di luar pembahasan bab ini.
Pertanyaan Latihan
Gunakan data Liver Disorder Data Set4
(“indian_liver_patient.csv”) yang bisa diunduh dari
https://www.kaggle.com/uciml/indian-liver-patient-records.
Referensi
1. Woodward M. Epidemiology: Study Design and Data
Analysis, Third Edition: Taylor & Francis 2013.
2. Illowsky B, Dean SL, OpenStax C, et al. Introductory
statistics OpenStax 2013.
3. Janosi A, Steinbrunn W, Pfisterer M, et al. UCI machine
learning repository: heart disease data set 1989
[Available from:
https://archive.ics.uci.edu/ml/datasets/heart+disease.
4. BUPA Medical Research Ltd. UCI machine learning
repository: liver disorders data set 1990 [Available
from:
https://archive.ics.uci.edu/ml/datasets/Liver+Disorders.
249
250
BAB XII
ANALISIS REGRESI LOGISTIK
Tujuan pembelajaran:
1. Mahasiswa mampu memahami dan menerapkan
konsep regresi linear sederhana dalam uji
hipotesis
2. Mahasiswa mampu memahami dan menerapkan
konsep regresi linear berganda dalam uji
hipotesis
3. Mahasiswa mengetahui asumsi dan hal-hal yang
perlu diperhatikan dalam regresi linear
Ringkasan
Regresi logistik adalah uji hipotesis yang
memprediksi hubungan antara variabel dependen
dikotomi dengan satu variabel independen lainnya
dalam regresi logistik sederhana dan beberapa
variabel independen dalam regresi logistik
berganda.
251
secara berurutan sampai akhir Bab. Pada akhir
pembelajaran, jawablah pertanyaan-pertanyaan
pada latihan untuk menguji seberapa besar
pengetahuan dan pemahaman dari mempelajari
Bab ini.
Materi Belajar
252
luaran berupa 1 atau 0, yang secara matematis
ditulis dalam persamaan:
253
rasio peluang juga dapat dihitung dengan regresi
logistik, yang akan dijelaskan di bawah ini.
B. Set data
Sama seperti regresi linear, bab ini kita akan
menggunakan data 303 pasien dengan atau tanpa
penyakit jantung dari Heart Disease UCI. Variabel
luaran yang kita gunakan adalah “target, yaitu”: 1-
penyakit jantung 0-bukan penyakit jantung
Seperti sebelumnya data berupa file “heart.csv”
yang bisa diunduh dari
“https://www.kaggle.com/ronitf/heart-disease-uci”.
Impor file csv ini ke program statistik yang Anda
gunakan. Kali ini kita menggunakan contoh IBM
SPSS Statistics dan Stata. Jika Anda berminat
menggunakan perangkat lunak sumber terbuka,
Anda juga dapat menggunakan BlueSky, JASP atau
Jamovi yang dibuat dari bahasa pemrograman R, di
mana tampilan-muka menu kedua program
menyerupai dengan IBM SPSS Statistics.
254
Method: Enter
Options: CI for exp(B): 95%
Klik “OK”
Dependent Variable
Encoding
Original Internal
Value Value
0 0
1 1
Classification Tablea,b
Predicted
target Percentage
Observed 0 1 Correct
Step 0 target 0 0 138 .0
1 0 165 100.0
Overall 54.5
Percentage
a. Constant is included in the model.
b. The cut value is .500
256
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constan .179 .115 2.400 1 .121 1.196
t
257
Tabel pertama dari blok ini menunjukkan signifikansi dari
keseluruhan koefisien model regresi logistik. Karena ini
adalah regresi logistik sederhana dengan metode enter,
maka step, block dan model yang terakhir adalah sama.
Signifikansi per spesifik koefisien bisa dilihat di tabel akhir.
Model Summary
-2 Log Cox & Snell R Nagelkerke R
Step likelihood Square Square
1 392.797a .079 .105
a. Estimation terminated at iteration number 4 because
parameter estimates changed by less than .001.
b.
Tabel simpulan model menunjukkan bahwa jenis
kelamin bisa menjelaskan 7,9 persen dari seluruh
hubungan menurut R2 dari Cox & Snell atau 10,5
persen kalau menurut R2 dari Nagelkerke.
Classification Tablea
Predicted
target Percentage
Observed 0 1 Correct
Step 1 target 0 114 24 82.6
1 93 72 43.6
Overall Percentage 61.4
a. The cut value is .500
259
dalam sampel data tersebut) dan peluang ini berkisar antara
0,159 kali hingga 0,465 kali, sehingga hal ini signifikan
(karena nilai interval kepercayaan tersebut tidak melalui
angka 1).
----------------------------------------------------------------------------
--
target | Coef. Std. Err. z P>|z| [95% Conf.
Interval]
-------------+-------------------------------------------------------------
---
260
sex | -1.302211 .2740076 -4.75 0.000 -
1.839256 -.7651662
_cons | 1.098612 .2357023 4.66 0.000
.6366443 1.56058
----------------------------------------------------------------------------
--
logit, or
------------------------------------------------------------------------------
target | Odds Ratio Std. Err. z P>|z| [95% Conf.
Interval]
-------------+----------------------------------------------------------------
sex | .2719298 .0745108 -4.75 0.000 .1589356
.4652566
_cons | 3 .7071068 4.66 0.000 1.890128
4.761583
------------------------------------------------------------------------------
Note: _cons estimates baseline odds.
261
Luaran: penyakit jantung (target)
Prediktor: usia (age), jenis kelamin(sex), kadar
kolesterol (chol) dan hiperglikemia (fbs)
Metode Menu: Analyze > Regression > Binomial
Logistics ...
target > Dependent
age, sex, chol, fbs > Block 1 of 1
Method: Forward LR
Options: CI for exp(B): 95%
Klik “OK”
Logistic Regression
262
Case Processing Summary
Unweighted Casesa N Percent
Selected Cases Included in Analysis 303 100.0
Missing Cases 0 .0
Total 303 100.0
Unselected Cases 0 .0
Total 303 100.0
a. If weight is in effect, see classification table for the total
number of cases.
Dependent Variable
Encoding
Original Value Internal Value
0 0
1 1
263
Score df Sig.
Step 0 Variables sex 23.914 1 .000
age 15.399 1 .000
chol 2.202 1 .138
fbs .238 1 .625
Overall Statistics 46.329 4 .000
Model Summary
-2 Log Cox & Snell R Nagelkerke R
Step likelihood Square Square
1 392.797a .079 .105
a
2 370.574 .144 .192
a. Estimation terminated at iteration number 4 because
parameter estimates changed by less than .001.
Classification Tablea
Predicted
target Percentage
Observed 0 1 Correct
Step 1 target 0 114 24 82.6
1 93 72 43.6
264
Overall Percentage 61.4
Step 2 target 0 86 52 62.3
1 55 110 66.7
Overall Percentage 64.7
a. The cut value is .500
265
Variables not in the Equation
Score df Sig.
Step 1 Variables age 21.414 1 .000
chol 7.166 1 .007
fbs .077 1 .781
Overall Statistics 24.807 3 .000
Step 2 Variables chol 3.645 1 .056
fbs .097 1 .756
Overall Statistics 3.720 2 .156
266
F. Regresi logistik berganda dengan Stata
Luaran: penyakit jantung (target)
Prediktor: usia (age), jenis kelamin(sex), kadar
kolesterol (chol) dan hiperglikemia (fbs)
Untuk kali ini kita menggunakan metode Stepwise
Backward Elimination. Bisa kita lihat hasilnya kebetulan
serupa dengan hasil dari Stepwise Forward Selection
SPSS.
------------------------------------------------------------------------------
target | Coef. Std. Err. z P>|z| [95% Conf.
Interval]
-------------+---------------------------------------------------------------
-
age | -.0664935 .0148322 -4.48 0.000 -
.0955641 -.0374228
|
sex |
male | -1.537477 .2928881 -5.25 0.000 -
2.111527 -.9634266
_cons | 4.8946 .8996541 5.44 0.000
3.13131 6.657889
------------------------------------------------------------------------------
267
Untuk mengetahui hasil rasio peluang, kita tinggal
mengulang perintah sebelumnya dan
menambahkan pilihan “,or”.logit, or
-------------------------------------------------------------------
-----------
target | Odds Ratio Std. Err. z P>|z|
[95% Conf. Interval]
-------------+----------------------------------------------------
------------
age | .935669 .0138781 -4.48 0.000
.9088601 .9632688
|
sex |
male | .2149227 .0629483 -5.25 0.000
.121053 .3815831
_cons | 133.5665 120.1636 5.44 0.000
22.90396 778.905
-------------------------------------------------------------------
-----------
Note: _cons estimates baseline odds.
Pertanyaan Latihan
Dengan menggunakan data Liver Disorder Data
Set4 (“indian_liver_patient.csv”) sebelumnya, tetapkan
persamaan regresi logistik sederhana dan berganda
dari variabel luaran gangguan hati(“dataset”: 1 sakit 2
sehat) dengan variabel-variabel prediktor sebagai
berikut:
7. Usia(“age”) dan jenis kelamin (“gender”: jangan
lupa transformasi data variabel dari string
menjadi kategorikal)
8. “alkaline_phosphatase”
9. “aspartate_aminotransferase” dan
“alanine_aminotransferase”
269
10. “total_bilirubin” atau “direct_bilirubin”
11. “total_proteins” atau “albumin”
12. “albumin_and_globulin_ratio”
Referensi
270
BAB XIII
UJI DIAGNOSTIK
TUJUAN PEMBELAJARAN
1. Mahasiswa mampu menjelaskan mengenai uji diagnostik
dan menentukan variabel dalam uji diagnostik
2. Mahasiswa mampu menjelaskan prinsip tabel 2x2 dalam uji
diagnosis
3. Mahasiswa mampu menjelaskan mengenai sensitivitas,
spesifisitas, nilai prediksi positif, nilai prediksi negatif, dan
indeks youden (J)
4. Mahasiswa mampu menjelaskan receiver operator curve
dan area under curved untuk menentukkan cut off point
dalam uji diagnostik
RINGKASAN
Uji Diagnostik bermanfaat untuk menentukan
faktor kekuatan diagnostik suatu pemeriksaan terbaru
terhadap pemeriksaan yang telah ada. Oleh karena itu
Bab ini akan menjabarkan pengertian, tabel 2x2, analisa
tabel 2x2, analisis deskriptif Area Under Curve ( AUC),
dan titik potong pada Uji Diagnostik.
Pesan dalam Belajar
Mahasiswa secara perlahan mempelajari istilah
dari penelitian diagnostik dalam bab ini dari awal hingga
271
akhir. Kemudian, analisis soal latihan untuk menguji
pemahaman dalam bab ini.
Materi Belajar
A. Pengertian Uji Diagnostik
Diagnostik merupakan proses melabel seorang
pasien masuk dalam kategori sakit atau sehat oleh
klinisi. Hasil dari proses ini disebut sebagai diagnosis.
Diagnosis yang akurat dan tepat sangat diperlukan untuk
menunjang penatalaksanaan. Diagnostik suatu penyakit
memerlukan suatu standard atau pedoman yang
memiliki tingkat akurasi dan ketepatan yang tinggi dalam
menegakkan diagnosis. Standar dan pedoman ini
disebut sebagai suatu “gold standard” atau baku emas.
Gold standard dalam materi uji diagnostik ini disebut
dengan variabel standar (David, 1991).
Selain gold standard ada pula pemeriksaan lain
yang dapat membantu menegakkan diagnosis namun
mempunyai akurasi yang lebih rendah dibandingkan gold
standard. Pemeriksaan ini sering kita sebut sebagai
variabel prediktor. Variabel prediktor memiliki kelebihan
dibandingkan pemeriksaan variabel standard pada
umumnya (Sastroasmoro & Ismael, 2011).
Kelebihan tersebut dapat berupa:
- Pemeriksaan lebih nyaman untuk pasien atau klinisi
dibandingkan gold standard
- Pemeriksaan lebih mudah dibandingkan gold standard
- Harga pemeriksaan lebih murah dibandingkan gold standard
- Waktu pemeriksaan lebih cepat dibandingkan gold standard
272
Bila variabel prediktor tidak memiliki keunggulan
dibandingkan variabel standar, maka uji diagnostik tidak
diperlukan atau tidak memberikan suatu manfaat. Uji
diagnostik adalah sebuah uji statistik untuk menilai
apakah suatu variabel prediktor dapat memiliki tingkat
akurasi dan ketepatan yang mendekati variabel standar.
Untuk memudahkan memahami mengenai uji diagnostik
marilah kita cermati sebuah kasus dibawah
(Sastroasmoro & Ismael, 2011).
276
- Sel kiri atas; merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang positif,
dengan baris variabel prediktor yang positif. Pada sel
ini parameter yang akan diuji menghasilkan nilai positif
atau sakit dan sesuai dengan hasil dari pemeriksaan
gold standard. Sel ini sering disebut sebagai positif
benar (true positive).
- sel kanan atas; merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang
negatif, dengan baris variabel prediktor yang positif.
Pada sel ini terdapat diskrepansi dimana parameter
yang akan diuji menghasilkan nilai positif atau sakit,
namun hasil pemeriksaan gold standard menunjukan
bahwa pasien negative atau tidak menderita penyakit.
Sel ini sering disebut sebagai positif palsu (false
positive). Beberapa literatur menggunakan label false
positive dengan istilah 1-Sp
- sel kiri bawah, merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang positif,
dengan baris variabel prediktor yang negatif. Pada sel
ini terdapat diskrepansi dimana parameter yang akan
diuji menghasilkan nilai negative atau sehat, namun
hasil pemeriksaan gold standard menunjukan bahwa
pasien positif atau sedang menderita penyakit. Sel ini
sering disebut sebagai negatif palsu (false negative).
- sel kanan bawah; merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang
negatif, dengan baris variabel prediktor yang negatif.
277
Pada sel ini parameter yang akan diuji menghasilkan
nilai negatif atau sehat dan sesuai dengan hasil dari
pemeriksaan gold standard. Sel ini sering disebut
sebagai negatif benar (true negative).
Pola keempat sel ini bersifat tetap dan tidak boleh
dibolak-balik. Agar dapat memahami mengenai skema
tabel 2x2 maka dapat melihat pada gambar 1.
(Sastroasmoro & Ismael, 2011)
279
8. Output : Hasil diperoleh sebagai berikut
C. ANALISA TABEL 2 X 2
Seperti telah dijelaskan sebelumnya, uji redictor
diperlukan untuk menilai tingkat keakuratan dan
ketepatan suatu parameter pemeriksaan
dibandingkan dengan pemeriksaan yang sudah
diakui tingkat akurasi dan ketepatannya. Untuk
menilai akurasi dan ketepatan suatu parameter
pemeriksaan dapat dengan menghitung
sensitivitas dan spesifisitas suatu parameter
pemeriksaan. Pengukuran uji diagnostik (
sensitivitas, spesifisitas, positive predictive value,
negative predictive value, dan Likehood ratio)
dalam SPSS tidak bisa dilakukan. (Sopiyudin,
2018)
Sensitivitas merupakan proporsi orang yang benar-benar
sakit dalam suatu populasi yang juga diidentifikasikan sakit oleh
redicto redictor. Sensitivitas digambarkan sebagai persentase
orang dengan penyakit dan hasil test positif dengan pemeriksaan
280
gold standard yang menunjukan hasil positif. Sensitifitas yang tinggi
diperlukan untuk melakukan skrinning suatu penyakit. Bila suatu
parameter pemeriksaan dengan sensitivitas rendah digunakan
sebagai skrinning maka akan dijumpai banyak redicto palsu
(Sastroasmoro & Ismael, 2011).
Sensitivitas dapat diukur dengan menggunakan rumus :
281
Nilai prediksi digunakan bila gold standard masih belum tersedia,
atau diramalkan ada pergeseran gold standard. Terdapat 2 macam
nilai prediksi yaitu: nilai prediksi positif dan nilai prediksi negatif
(Sastroasmoro & Ismael, 2011).
Nilai prediksi positif (positive predictive value/ PPV) adalah
proporsi pasien yang benar-benar positif (true positive) di antara
keseluruhan penderita yang menunjukkan hasil tes pemeriksaan
positif. Nilai ini menunjukkan berapa besar hasil tes positif adalah
benar-benar positif atau menderita penyakit. Jika dibandingkan
dengan standard PPV probabilitas subjek yang diidentifikasikan
positif oleh alat ukur, akan benar-benar positif pada gold standard
(Sastroasmoro & Ismael, 2011).
282
LR+ = sensitivitas/ (1- spesifisitas)
LR- = (1-sensitivitas) / spesifisitas
Nilai diagnostik yang baik disimpulkan bila LR+ memiliki nilai
diatas 10 dan LR- memiliki nilai dibawah 0,1
(maria,2008)(sopiyudin,2018).
SPSS juga tidak bisa menghitung nilai 95% confidence
interval dari masing-masing nilai diagnostic. Akan tetapi, hal
tersebut dapat diatasi dengan menghitung mengunakan kalkulator
online pada https://www.medcalc.org/calc/diagnostic_test.php.
283
Gambar 2. Kurva ROC dengan AUC
Sumber: Šimundić, A., 2008. [online] Measures of diagnostic accuracy:
basic definitions. Available at:
<https://www.ifcc.org/media/476873/ejifcc2008vol19no4pp203-
211.pdf> [Accessed 16 October 2020].
Bentuk dari kurva ROC dan AUC membantu peneliti untuk
memberikan keseimpulan bila pemeriksaan tersebut dapat
membedakan ada tidaknya suatu penyakit pada suatu penelitian.
Dalam kurva ROC terdapat garis diagonal dimana nilai sensitifitas dan
spesifiitas selalu 0.5. Bila kurva condong ke sisi kiri atau semakin luas
area AUC, maka pemeriksaan tersebut dapat membedakan ada
tidaknya suatu penyakit (Šimundić,2008)(sopiyudin,2018).
Interpretasi nilai AUC dengan pendekatan statistik memiliki
klasifikasi akurasi diagnostik menjadi sangat lemah, lemah, sedang,
baik dan sangat baik (tabel).
Tabel. Interpretasi Nilai AUC
NILAI AUC AKURASI DIAGNOSIS
>0.5-0.6 Sangat lemah
284
>0.6-0.7 Lemah
>0.7-0.8 Sedang
>0.8-0.9 Baik
>0.9-1 Sangat baik
285
4. Klik TBanak ke dalam test variable
5. Input angka 1 dalam value of state variable
6. Klik skoringTB ke dalam test variable
7. Klik ‘with diagonal reference line’ , ‘standard error and
confidence interval’, dan’ coordinate points of ther ROC
Curve’ hingga terdapat ‘√’ pada Display
8. Tampilan sebagai berikut
286
9. Klik OK
10. Output yang dihasilkan sebagai berikut
287
Interpretasi hasil output:
1. Pada case processing summary, sampel penelitian
dengan TB sebanyak 12 dari 25 sampel. Oleh karena itu,
prevalensi TB adalah 48%
2. Pada output, kurva ROC menunjukan skor TB memiliki
nilai diagnostic cukup baik karena kurva diatas garis 0.5 dan
mendekati 1
3. Nilai AUC sebesar 0.85 (95%CI 0.67-1), p<0.003. Secara
statistic, nilai AUC tergolong baik.
4. Interpretasi interval kepercayaan ditemukan bahwa nilai
AUC pada skor TB terhadap seluruh sampel berkisar 0.67
sampai 1.
5. Uji hipotesis pada SPSS bertujuan untuk membandingkan
variable predictor dengan nilai AUC 0.5. Nilai p<0.05
memiliki nilai signifikansi secara statistik.
289
1. Copy-Paste semua data output dari SPSS ke Ms.Excel
2. Tambahkan kolom baru pada sisi paling kiri dengan label
nomor dan sisi paling kanan dengan label spesifitas.
3. Pada label spesifisitas menggunakan rumus
1- (1-specificity)
290
7. Titik potong yang diambil adalah nilai titik potong dengan
youden index paling besar.
Interpretasi :
1. Pada nomor 11 diperoleh nilai youden index 0.75. Pada
nomor 11 juga didapat nilai positif sebesar ≥ 10,5 dengan
sensitivitas 75% dan spesifisitas 100%. Oleh karena itu
pasien TB dengan nilai ≥ 10,5 akan terdiagnosis sebagai
pasien TB.
Pertanyaan Latihan
Implementasi kasus (Rapid test SARS Cov-2 “X”)
Seorang peneliti ingin meneliti mengenai akurasi
pemeriksaan rapid test “X” dalam mendeteksi penyakit
Covid-19. Rapid test “X” yang diperiksa adalah dengan
menggunakan specimen darah untuk diperiksa antibody
terhadap SARS COV-2. Bila dalam darah sampel
ditemukan antibody SARS COV-2 maka sampel akan
dikelompokan sebagai kelompok sakit, sedangkan bila
291
Gold standard diagnosis untuk pemeriksaan Covid-19
adalah dengan pemeriksaan RT-PCR dengan
mengggunakan spesimen swab nasofaring dan
orofaring. Bila hasil pemeriksaan RT PCR menunjukan
nilai positif maka dapat dipastikan pasien menderita
Covid-19, sedangkan bila RT PCR negative maka dapat
disimpulkan pasien sehat atau terbebas dari Covid-19
Dari hasil pengamatan observasional selama penelitian
didapatkan 200 sampel pasien. Dari pemeriksaan RT
PCR didapatkan 100 sampel positif Covid-19 dan 100
pasien siasanya negative atau sehat. Dari 100 sampel
positif Covid-19, hanya 80 sampel yang memiliki hasil
antibody positif dengan pemeriksaan rapid test “X”,
sisanya rapid test “X” negative. Sedangkan dari 100
sampel sehat, 70 sampel memiliki hasil rapid test “X”
negative, sedangkan sisanya hasil rapid positif.
Tugas :
1. Buatlah tabel 2x2 dari kasus diatas
2. Hitunglah sensitivitas, spesifisitas, indeks Jouden,
3. Hitunglah nilai prediksi positif dan nilai prediksi positif?
292
Referensi
David L Sackett, R Brian Haynes, Gordon H Guyatt, Peter
Tugwell. 1991. Clinical Epidemiology a Basic Science for Clinical
Medicine. Little Brown Company. Boston p: 3- 153
293
294
BAB XIV
PENALARAN STATISTIK BUAT DOKTER
UMUM
Tujuan Pembelajaran
Ringkasan
297
lebih baik, untuk makin menghargai, dan menyenangi sehingga
mau mempelajari lebih seksama.
Materi Belajar
299
bagaimana dokter menyikapi manusia, dan bagaimana dokter
menyikapi pekerjaannya. Dalam hal menyikapi manusia, dokter
harus mencintai manusia dan kehidupannya. Dokter harus
seorang filantropis. Dokter tidak boleh menjahati kepada siapa ia
harus memberi pelayanan.
300
dipinjam dari Kostler yang melihat fenomena setiap satuan
kehidupan adalah suatu whole yang sekali gus juga part, dan
olehnya satuan kehidupan itu dinamai holon. (Anderson & Carter,
1978: 11)
302
B. Masalah Kesehatan dan Kebutuhan Penalaran
Statistik
Pernyataan bahwa pekerjaan dokter adalah melakukan
upaya kesehatan menunjukkan bahwa yang ditangani dokter
adalah masalah kesehatan. Kesehatan adalah kualitas hidup
yang terkait dengan struktur dan fungsi kehidupan. Karena
kesehatan itu kualitas hidup, maka sejak manusia sudah
memulai kehidupan sampai dengan kehidupan berakhir, ada
303
masih ditambah seperti masalah lingkungan, bencana, serta
masalah manajemen atau organisasi.
304
Masalah penelitian kesehatan adalah masalah berkaitan dengan
pengembangan iptek kesehatan yang bersifat murni keilmuan
atau bersifat terapan. Ketrampilan yang diperlukan adalah
ketrampilan penelitian.
306
ilmuwan kesehatan untuk menyukseskan upaya promotif
priventif yang secara statistik sangat meyakinkan
manfaatnya, tetapi tidak diterima oleh awam.
307
berbeda dengan belajar pengetahuan. Untuk memiliki
kompetensi mawas diri dan pengembangan diri, dokter, perlu
belajar meta learning, belajar bagaimana cara belajar.
308
Belajar, memerlukan kemampuan mengingat, menalar, dan
mempraktikkan. Semua diperlukan dan masing-masing punya
keunggulan sesuai apa yang dihadapi dan siapa yang
melakukan.
309
Mempraktikkan, mengaplikasikan teori atau metode
dalam memecahkan masalah baik dalam simulasi atau dalam
realitas kehidupn merupakan kegiatan belajar yang akan
memberi pemahaman yang sangat penting. Sudah barang
tentu praktik yang menyangkut kehidupan manusia tidak
boleh sembarangan, harus menggunakan prosedur yang
sangat ketat.
313
Dalam penelitian, termasuk dalam olah statistik, tidak dapat
dihindarkan adanya asumsi yang digunakan yang secara
umum sudah diterima. Di balik pembuatan rumus matematik/
statistik pun ada asumsi yang digunakan. Kalau asumsi yang
digunakan tersebut ternyata salah, akan salah juga
kesimpulan hasil kajiannya. Hal ini perlu disadari untuk
dipikirkan dan diantisipasi, dicegah dengan tes yang sesuai.
(Misalnya dalam statistik biasa diasumsikan normalitas data,
dan kalau hal idicurigai distribusi data tidak normal, lakukan
dulu uji normalitas data)
317
dan distribusinya, serta upaya penangannya. Epidemiologi itu
sangat erat dengan statistik, sehingga ada kesamaan dalam
pembagianya: ada epidemiologi deskrptif dan analitik dan
pada statistik juga ada statistka deskriptif dan statistik
analitik. Penalaran epidemiologik sangat bersinergi dengan
penalaran statistik.
318
nyata kegiatan ilmu, perlu membangun literasi ilmu melalui
penalran statistik.
319
Referensi
320
Buku Penyelenggaraan Praktik Dokter yang Baik di
Indonesia
321
322
BAB XV
VISUALISASI DATA DALAM KESEHATAN
MASYARAKAT
Tujuan Pembelajaran
4. Pembaca mengenal berbagai perangkat untuk visualisasi data
kesehatan masyarakat.
5. Pembaca mampu melakukan visualisasi data kesehatan
masyarakat.
6. Pembaca mampu menjawab pertanyaan latihan.
Ringkasan
Visualisasi data kesehatan bertujuan untuk
mempresentasikan informasi menggunakan format yang
lebih mudah dipahami oleh pembaca. Visualisasi data
kesehatan mempermudah untuk memahami data yang
kompleks apabila dipresentasikan dalam wujud informasi
yang menarik dan intuitif melalui berbagai macam grafik,
peta dan infografis. Penyajian dalam bentuk visualisasi yang
menarik akan memudahkan dalam memahami data untuk
membantu dalam proses pengambilan keputusan, termasuk
juga dalam kegiatan advokasi atau pemaparan kepada
323
masyarakat awam yang umumnya tidak mudah apabila data
disajikan dengan menggunakan format tabulasi seperti
kebanyakan penyajian data kesehatann selama ini. Salah
satu tokoh pelopor dalam memperkenalkan visualisasi data
kesehatan adalah Profesor Hans Rosling, seorang dokter
ahli epidemiologi dan statistik dari Karolinska Institute di
Swedia yang memperkenalkan Gapminder dan Trendalyzer.
Profesor Hans Rosling merubah cara menampilkan data
kesehatan yang biasanya dengan format tabulasi yang
‘kering’, menjadi format yang menarik dan interaktif.
Materi Belajar
324
tidak kelihatan pola uniknya apabila data disajikan dalam
format tabulasi. Dengan memvisualisasikannya dalam
peta, akan kelihatan bahwa distribusi dokter ternyata
mengelompok di pusat kota.
325
berbayar (Tableau Dekstop) ataupun versi gratis (Tableau
Public).
326
Line chart
Model yang umum dipergunakan untuk
memperlihatkan perubahan antar waktu.
Setiap titik dihubungkan untuk
menekankan pergerakan atau
perubahan antar waktu
Bar chart
Setiap periode waktu tertentu
digambarkan dalam sebuah batang
(bar). Besaran nilainya
direpresentasikan dengan tingginya
batang.
Box plot
Setiap periode waktu digambarkan
dalam sebuah box.
Visualisasi ini bisa dipergunakan untuk
memperlihatkan distribusi data dan juga
membandingkan data antar periode
waktu, atau juga bisa untuk
membandingkan distribusi data antar
kelompok
Pie chart
Setiap potongan atau bagian adalah
mencerminkan proporsi dari setiap
kategori atau kelompok dibandingkan
dengan keseluruhan lingkaran. Terlihat
jelas apabila kategorinya kurang atau
tidak lebih dari 5 buah.
Doughnut chart
Variasi dari pie chart dengan lubang di
tengah yang umumnya dipergunakan
untuk menunjukkan sebuah nilai numerik
yang ingin ditonjolkan
327
Stacked bar chart
Setiap batang dibagi dalam beberapa
bagian untuk menunjukkan
perbandingan kategorinya.
Bar chart
Samping untuk memperlihatkan
perubahan antar waktu, grafik batang
juga bisa digunakan untuk
membandingkan jumlah atau frekuensi
dari data antar kelompok atau kategori
yang berbeda
Histogram
Mirip dengan grafik batang, akan tetapi
histogram digunakan apabila datanya
numerik
Box plot
Setiap periode waktu digambarkan
dalam sebuah box.
Visualisasi ini bisa dipergunakan untuk
memperlihatkan distribusi data dan juga
membandingkan data antar periode
waktu, atau juga bisa untuk
membandingkan distribusi data antar
kelompok
328
4. Memperlihatkan hubungan antar variabel
Scatter plot
Untuk menggambarkan hubungan antar
dua variabel numerik. Posisi dari titik
mengindikasikan nilai dari sumbu vertikal
dan horizontal.
Bubble chart
Perluasan dari scatter plot, dimana ada
3 variabel numerik, dan ukuran
gelembung menunjukkan nilai dari
variabel ketiga
Bubble map
Peta gelembung, dimana besaran
gelembung mencerminkan besaran
angka
329
ada. Dasbor tersebut umumnya dipergunakan untuk membantu
memudahkan dalam pengambilan keputusan yang berdasarkan
data.
331
Grafik Batang (Bar chart)
332
Gambar XII.3 Grafik garis kecenderungan pertambahan jumlah
kasus positif Covid-19.
333
3. Visualisasi hubungan
4. Visualisasi geospatial
Untuk memudahkan melihat variasi geografis, kita mencoba
memetakan kasus meninggal per provinsi di Indonesia dari
data BNPB dengan format bubble map sebagai berikut:
334
Gambar XII.6 Bubble map untuk memperlihatkan jumlah
kasus meninggal dari masing-masing provinsi.
Pertanyaan latihan
30. Apa tujuan dari melakukan visualisasi data kesehatan?
31. Apa saja bentuk-bentuk visualisasi data kesehatan?
Referensi
335
336
BAB XVI
CONTOH DAN PEMBAHASAN SOAL
UKMPPD
Tujuan Pembelajaran
7. Mahasiswa memahami pengertian dasar biostatistika.
8. Mahasiswa memahami penggolongan statistika.
9. Mahasiswa memahami perbedaan antara data dan informasi.
10. Mahasiswa memahami pengorganisasian data.
Ringkasan
Biostatistika merupakan ilmu terapan dari statistika yang
membahas tentang makhluk hidup. Statistika merupakan
metode atau alat bantu untuk mengembangkan statistik.
Dalam perkembangannya, biostatistika dipandang sebagai
ilmu statistik terapan pada bidang biologi, farmasi, dan
kesehatan (kedokteran dan kesehatan masyarakat). Statistik
digolongkan menjadi dua yaitu statistik deskriptif dan statistik
inferensial, sedangkan statistik inferensial digolongkan lagi
menjadi statistik parametris dan non parametris. Statistik
pada dasarnya untuk mengelola data menjadi informasi.
Dalam pengorganisasiannya, statistik dilakukan melalui
tahap pengumpulan data (data collecting),pengolahan data
337
(data processing), penyajian data (data presentation), dan
analisis dan interpretasi (analysis & interpretation).
Materi Belajar
338
Teknologi, dan Pendidikan Tinggi (Kemristekdikti) dengan
menggaet beberapa instansi dan organisasi profesi.
Diantaranya Kementerian Kesehatan, Konsil Kedokteran
Indonesia, Pengurus Besar Ikatan Dokter Indonesia, dan
Asosiasi Institusi Pendidikan Kedokteran Indonesia. Uji
kompetensi ini terdiri dua jenis tes, yaitu Computer Based
Test (CBT) dan Objective Structured Clinical Examination
(OSCE). Singkatnya, CBT merupakan ujian tertulis dan
OSCE adalah ujian praktik. Pengumuman UKMPPD adalah
pada bulan setelah ujian.
CBT UKMPPD adalah ujian teori berbasis pilihan ganda
yang dilaksanakan menggunakan komputer secara serentak
bagi seluruh peserta. CBT UKMPPD diuji dengan
mengerjakan 150 soal pilihan ganda yang diberi waktu
pengerjaan 200 menit. Ujian lain yang juga wajib dijalani oleh
peserta UKMPPD adalah OSCE (Objective Structured
Clinical Examination). Penilaian OSCE UKMPPD dilakukan
berbasis roleplay antara Anda sebagai dokter umum dan
pasien. Biasanya setiap peserta OSCE UKMPPD akan diuji
melewati 12 station dengan 12 topik berbeda, waktu yang
diberikan adalah 15 menit di setiap station. Para peserta
ujian diwajibkan untuk mempraktekkan skill sesuai standar
kompetensi dokter umum Indonesia.
339
B.Contoh Soal UKMPPD dan Pembahasan yang
berhubungan dengan Statistik
1. Manakah di bawah ini merupakan besarnya faktor risiko
dengan desain kasus-kontrol?
A. Ratio Prevalence
B. Relative Risk
C. Odds Ratio
D. Cumulative incidence
E. Case fatality rate
Jawaban: C. Odds Ratio
Pembahasan:
Ratio Prevalence: besarnya faktor risiko dengan desain
cross-sectional.
Relative Risk: besarnya faktor risiko dengan desain kohort.
Odds Ratio: besarnya faktor risiko dengan desain kasus-
kontrol.
Cumulative incidence: probabilitas/ risiko (risk) seseorang
untuk terkena penyakit (atau untuk hidup) dalam periode
waktu tertentu.
Case fatality rate: suatu angka yang dinyatakan ke dalam
persentase yang berisikan data orang mengalami kematian
akibat suatu penyakit tertentu.
341
A chi-square test: uji komparatif untuk menilai perbedaan
antara dua kelompok data berskala nominal.
A correlation analysis: uji hubungan (korelatif) antara dua
kelompok data.
342
Skala rasio: skala data yang menunjukkan derajat
perbedaan diantara item, ada jarak, bisa diperbandingkan,
dan memiliki nilai nol mutlak.
Skala ordinal: skala data kualitatif di mana data
dikelompokkan menjadi orde atau tingkatan-tingkatan.
Skala nominal: skala data kualitatif yang berfungsi hanya
untuk membedakan dan tidak ada tingkatan diantaranya.
Skala interval: skala data yang menunjukkan derajat
perbedaan diantara item, ada jarak, tetapi tidak memiliki nilai
nol mutlak.
Skala Gutmann: skala menggunakan binary skor (0 dan 1).
4. Data tabel:
Penyakit
(+) (-)
Paparan (+) a b a+b
Paparan (-) c d c+d
a+c b+d a+b c+d
343
Jawaban: B
Pembahasan:
Kelompok terpapar
344
Kata kunci dalam soal tersebut adalah kuesioner dan respon
sikap.
Ordinal: skala pengukuran berupa peringkat.
Albert: bukan respon kuesioner.
Interval: skala pengukuran data yang membedakan antar
item, ada jarak, tetapi tidak memiliki nilai nol mutlak.
Alpha: bukan respon kuesioner.
Likert: skala penelitian yang digunakan untuk mengukur
sikap dan pendapat, terdiri dari 5 pilihan.
346
sudah tersedia data sekunder (rekam medis), maka dapat
dianalisis dengan cepat dan murah, pilihannya adalah
Case control.
347
Wilcoxon: variabel bebas kategori, variabel terikat numerik,
lebih dari dua kelompok berpasangan.
348
Ordinal: Ada tingkatan, tidak ada jarak.
Rasio: Ada tingkatan, ada jarak, memiliki nilai nol mutlak,
bisa diperbandingkan.
Jawaban: C
Pembahasan: Odds ratio dirumuskan (a x d) / (b x c)
Odds Ratio = 16 x 392 / 8 x 384
Referensi
349
Emitatallulembang. (2018). Latihan Soal IKM UKMPPD
2017.
https://www.scribd.com/document/370086390/LATIHAN
-SOAL-IKM-UKMPPD-2017-docx
Sumardiyono, Probandari, A. N. and Widyaningsih, V. (2020)
Statistik Dasar Untuk Kesehatan Dan Kedokteran, Analisis
Menggunakan SPSS Versi 23. 1st edn. Edited by E. P.
Pamungkasari. Surakarta: UNS Press.
Probandari, A. N., Pamungkasari, E. P., Febrinasari, R. P.,
Sumardiyono, & Widyaningsih, V. (2020). Metode Penelitian
Kuantitatif, Strategi Menulis Proposal Penelitian Kesehatan
(Hartono (ed.); 1st ed.). UNS Press.
350
BIOGRAFI PENULIS
351
dr. Ratnawati, M.Kes lahir di
Kudus Jawa Tengah. Riwayat
pendidikan SD di Kudus,
Pendidikan SMP di SMPN 2 Pati
dan SMA Negeri I Pati. Pendidikan
Sarjana dan Profesi Dokter dari
Fakultas Kedokteran Universitas
Islam Sultan Agung (UNISSULA),
Pasca Sarjana di Fakultas Ilmu Kesehatan Masyarakat
(FKM) UNDIP pada Konsentrasi Kesehatan Ibu dan Anak.
Saat ini sedang menempuh pendidikan Program Studi
Doktoral di FKM UNDIP. Sejak tahun 2009 menjadi staf
pengajar bagian IKM Fakultas Kedokteran UNISSULA.
352
Dr. Siti Thomas Zulaikhah,
SKM.MKes, lahir di Klaten pada
tanggal 20 Mei 1964. Penulis
memperoleh gelar Doktor dari Program
Doktor Ilmu Kedokteran/Kesehatan
(DIKK) Fakultas Kedokteran
Universitas Diponegoro tahun 2016.
Penulis adalah dosen di Fakultas
Kedokteran Universitas Islam Sultan
Agung (UNISSULA) Semarang dan
saat ini menjabat sebagai Kepala Bagian Ilmu Kesehatan
Masyarakat (IKM). Selain itu, penulis juga mengajar sebagai
dosen tidak tetap pada program studi D3, D4 dan S2
Teknologi Laboratorium Medis (TLM) Fakultas Ilmu
Keperawatan dan Kesehatan Universitas Muhammadiyah
(UNIMUS) Semarang. Penulis aktif dalam kegiatan Tridarma
yaitu kegiatan penelitian, pengabdian masyarakat dan
publikasi artikel di berbagai jurnal ilmiah bidang kesehatan
baik nasional maupun Internasional. Penulis juga aktif di
organisasi Persatuan Ahli Teknologi Laboratorium Medik
(PATELKI) tingkat pusat sebagai pengurus Koligium dan
tingkat Provinsi Jawa Tengah (DPW) sebagai Sie Ilmiah.
Oleh Perguruan Tinggi, saat ini penulis diamanati sebagai
Kepala Bidang Penelitian di Lembaga Penelitian dan
Pengabdian Masyarakat (LPPM) UNISSULA.
353
dr. Denny Anggoro Prakoso, MSc, FISPH,
FISCM, Sp.KKLP lahir di Bantul, 21 Juni
1981. Riwayat pendidikan SD Ngotho
Bantul, SMP 10 Yogyakarta, SMA 3
Yogyakarta, pendidikan dokter dari Fakultas
Kedokteran Universitas Gadjah Mada
(UGM), pasca sarjana di Ilmu Kedokteran
Klinis UGM bidang epidemiologi klinis. Mulai
tahun 2020 dokter Denny sedang
menempuh pendidikan Program studi Doktor di FKKMK
UGM. Dokter Denny mendapatkan kompetensi dokter
Spesialis Kedokteran Keluarga Layanan Primeri (SpKKLP)
dari Kolegium Ilmu Kedokteran Keluarga Indonesia (KIKKI).
Dokter Denny saat ini menjadi staf dosen bagian IKM-IKK
Fakultas Kedokteran dan Ilmu Kesehatan Universitas
Muhammadiyah Yogyakarta sejak 2007. Dokter Denny telah
menulis 2 buku : Buku saku “dokter pintar mengobati” dan
buku saku “ilustrasi kasus dan peresepan pada praktik
dokter di layanan primer”.
354
dr. Hari Peni Julianti, MKes, SpKFR-
K, FISPH, FISCM saat ini menjabat
Manager SDM dan Pendidikan di RS
Nasional Diponegoro UNDIP,
Koordinator Modul 5.3 Kedokteran
Keluarga dan Kedokteran Komunitas,
Pengelola Kepaniteraan Komprehensif
Kedokteran Keluarga, Dosen di
Bagian Ilmu Kesehatan Masyarakat-
Kedokteran Pencegahan dan Program
Studi Ilmu Kedokteran Fisik dan
Rehabilitasi FK UNDIP. Menyelesaikan Sarjana Kedokteran
dan Profesi Dokter di FK UNDIP, S2 Ilmu Kesehatan
Masyarakat Konsentrasi Epidemiologi di Program
Pascasarjana UNDIP, Sp 1 Ilmu Kedokteran Fisik dan
Rehabilitasi FK UNDIP, Fellow of The Indonesian Society of
Public Health dan Fellow of The Indonesian Society
Community Medicine oleh Badan Kerjasama IKM IKP IKK
FKI dan Sp2 Kolegium IKFR Indonesia. Saat ini aktif
mengajar di S1 dan Profesi Dokter FK UNDIP, Prodi Ilmu
Kedokteran Fisik dan Rehabilitasi FK UNDIP
355
dr. Jessica Christanti, M.Kes
lahir di DKI Jakarta. Pendidikan
Sarjana dan Profesi Dokter dari
Fakultas Kedokteran Universitas
Diponegoro, Pasca Sarjana di
Fakultas Ilmu Kesehatan
Masyarakat (FKM) UNDIP pada
Konsentrasi Administrasi Rumah
Sakit. Sejak tahun 2019
menjadi staf pengajar bagian
IKM Fakultas Kedokteran
Universitas Katholik Soegijapranata
357
358