Buku Biostatistik Kedokteran Dan Kesehatan-BKS

BIOSTATISTIKA
KEDOKTERAN DAN
KESEHATAN
Penulis :
Dr. Sumardiyono, S.KM, M.Kes.
dr. Ratnawati, M.Kes
dr. Nining Lestari, MPH
dr. Siti Thomas Zulaikhah, M.Kes
dr. Denny Anggoro Prakoso M.Sc, FISPH
dr. Hari Peni Julianti, M.Kes, Sp.KFR
dr. Ronny Isnuwardana, MIH
dr. Jessica Christanti, M.Kes
dr. Slamet Sunarno Harjosuwarno, MPH
dr. Lutfan Lazuardi, M.Sc., PhD
Badan Kerjasama
Bagian Ilmu Kesehatan Masyarakat-Ilmu Kedokteran
Pencegahan-Ilmu Kedokteran Komunitas
Fakultas Kedokteran Se-Indonesia
Regional IV
i
BIOSTATISTIKA KEDOKTERAN DAN
KESEHATAN
Penulis
dr. Ratnawati, M.Kes
dr. Denny Anggoro Prakoso M.Sc, FISPH
dr. Hari Peni Julianti, M.Kes, Sp.KFR
dr. Ronny Isnuwardana, MIH
dr. Lutfan Lazuardi, M.Sc., PhD
Editor
ISBN 978-623-95253-1-6
Desain Sampul dan Tata Letak

Yusuf Wisnu Mandaya
Dimensi
29,7 x 21 cm
Jumlah Halaman
i-viii + 1-358
Penerbit
Badan Kerjasama Bagian Ilmu Kesehatan Masyarakat-Ilmu
Kedokteran Pencegahan-Ilmu Kedokteran Komunitas Fakultas
Kedokteran Se-Indonesia Regional IV
Fakultas Kedokteran
Universitas Islam Sultan Agung
Jalan Raya Kaligawe KM. 4, Semarang (50112)
Jawa Tengah, Indonesia
Telp (024) 6583584
Fax. (024) 6582455
ii
09-KATA PENGANTAR
Dengan memanjatkan puja dan puji syukur kehadirat Allah

SWT, buku berjudul “Biostatistika Kedokteran dan Kesehatan“
telah dapat diterbitkan dengan baik berkat kerjasama yang solid
dari Ketua, Sekretaris, Pengurus, beserta Anggota Badan
Kerjasama Bagian Ilmu Kesehatan Masyarakat-Ilmu Kedokteran
Pencegahan-Ilmu Kedokteran Komunitas Fakultas Kedokteran Se-
Indonesia (BKS-IKM-IKP-IKK) Regional IV periode 2020-2023.
Terbitnya buku ini merupakan rangkaian kegiatan Workshop
Pembuatan Buku Ajar sekaligus Pelantikan Pengurus dan Rapat
Kerja BKS-IKM-IKP-IKK Fakultas Kedokteran dan Perhimpunan
Dokter Kedokteran dan Kesehatan Masyarakat Indonesia (PD3MI)
Wilayah IV, yang diselenggarakan pada tanggal 26 Februari 2020
di Fakultas Kedokteran Universitas Muhammadiyah Semarang
yang dilanjutkan finalisasinya pada Webinar Tindak Lanjut
Pembuatan Buku Text untuk BKS-IKM-IKP-IKK FK Se-Indonesia
Regional IV pada tanggal 19 September 2020.
Buku ini berisi tentang pengantar statistika kedokteran dan
kesehatan, analisis statistika, sampai dengan penalaran statistik
untuk dokter umum dan juga visualisasi data dalam public health
report. Untuk memperkuat mahasiswa dalam belajar kompetensi
soal, maka ditambahkan pada Bab terakhir yaitu contoh dan
pembahasan soal UKMPPD. Buku ini diharapkan bisa menjadi
salah satu pedoman pembelajaran bagi mahasiswa S1 Program
Studi Kedokteran di Indonesia yang menempuh mata kuliah yang
berhubungan dengan boistatistika.
Dalam penyusunan buku ini, tim penulis masih merasa kurang
sempurna walaupun sudah mengeluarkan daya upaya yang
dimiliki. Untuk kesempurnaan buku ini, tim penulis menerima
masukan, kritikan, dan saran-saran serta partisipasi semua pihak
yang bersifat membangun dalam upaya meningkatkan kualitas
dan kesempurnaan buku ini di masa mendatang.
Akhir kata, tim penulis mengucapkan banyak terima kasih
kepada semua pihak yang secara langsung maupun tidak
langsung telah menyumbangkan pemikiran, tenaga, dan telah
berpartisipasi dalam penyusunan buku “Statistika Kedokteran
dan Kesehatan“.
iii
Tim Penulis
Badan Kerjasama Bagian IKM-IKP-IKK

Fakultas Kedokteran Se-Indonesia
Regional IV
Oktober 2020
iv
SAMBUTAN
Assalamu’alaikum Warrahmatullahi Wabarakatuh

Puji syukur Alhamdulillah atas segala segala nikmat dan
kesempatan yang telah diberikan kepada kita semua sehingga
dapat menerbitkan buku yang menjadi cita-cita bersama dari
Badan Kerja Sama Bagian (BKS) IKM-IKP-IKK Fakultas
Kedokteran Se Indonesia Regional IV.
Buku tentang Biostatistika harus dipahami oleh Mahasiswa
kedokteran sebagai bekal dalam melakukan penelitian.
Pengetahuan tentang Biostatistika juga dapat digunakan sebagai
alat dalam melakukan Critical Appraisal dalam memahami hasil
penelitian (Evidence Based Medicine) untuk melakukan terapi
yang terbaik untuk pasien. Buku ini dapat juga dimanfaatkan oleh
mahasiswa di institusi pendidikan kesehatan selain kedokteran
seperti fakultas ilmu keperawatan, kebidanan, farmasi dan institusi
kesehatan lainnya.
Badan Kerja Sama Bagian (BKS) IKM-IKP-IKK sebagai
perhimpunan dengan anggota Dosen-dosen Ilmu Kesehatan
Masyarakat-Ilmu Kedokteran Pencegahan-Ilmu Kedokteran
Komunitas yang mengajar di Fakultas Kedokteran di Indonesia.
Buku Biostatistik sebagai salah satu disiplin ilmu yang ada di
bagian IKM-IKP-IKK. Buku ini disusun sebagai salah satu sarana
memfasilitasi mahasiswa untuk mencapai kompetensi dalam
penelitian yang menjadi salah satu kompetensi yang harus
dikuasai oleh Mahasiswa kedokteran yang terdapat di Standar
Kompetensi Dokter Indonesia.
Semoga buku Biostatistika Kedokteran dan Kesehatan ini
dapat membantu Mahasiswa dalam pencapaian kompetensi lebih
optimal. Kami juga berharap buku ini mampu membekali
mahasiswa dalam melakukan penelitian maupun dalam
pemanfaatan hasil penelitian.
Wassalamualaikum warahmatullahi wabarakatuh.
Ratnawati
Ketua
BKS-IKM-IKP-IKK FK
Se-Indonesia Regional IV
Oktober, 2020
v
DAFTAR ISI
KATA PENGANTAR ........................................................... iv

SAMBUTAN ..................................................................... vi
DAFTAR ISI ..................................................................... vii
BAB I PENGANTAR BIOSTATISTIKA KEDOKTERAN

DAN KESEHATAN (Dr. Sumardiyono, S.KM,
M.Kes) .................................................................. 1
BAB II. SKALA PENGUKURAN DATA (dr. Nining Lestari,
MPH) .................................................................... 17
BAB III. STATISTIK DESKRIPTIF (Dr. Sumardiyono, S.KM,
M.Kes) .................................................................. 33
BAB IV. ANALISIS KORELASI DATA NUMERIK (Dr.
Sumardiyono, S.KM, M.Kes)................................... 67
BAB V. ANALISIS KORELASI DATA KATEGORIK (Dr.
Sumardiyono, S.KM, M.Kes)................................... 91
BAB VI. ANALISIS KOMPARATIF DATA NUMERIK 2
SAMPEL TIDAK BERPASANGAN (Dr. Siti Thomas
Zulaikhah, S.KM, M.Kes) ........................................ 113
BAB VII. ANALISIS KOMPARATIF DATA NUMERIK 2
SAMPEL BERPASANGAN (Dr. Siti Thomas
Zulaikhah, S.KM, M.Kes) ........................................ 139
BAB VIII. ANALISIS KOMPARATIF DATA NUMERIK LEBIH
DARI 2 SAMPEL TIDAK BERPASANGAN (dr.
Denny Anggoro Prakoso MSc FISPH FISCM) .... 161
BAB IX. ANALISIS KOMPARATIF DATA KATEGORIK
LEBIH DARI 2 SAMPEL BERPASANGAN (dr.
Hari Peni Julianti, M.Kes, Sp.KFR(K), FISPH,
FISCM) ................................................................ 187
BAB X. ANALISIS KOMPARATIF DATA KATEGORIK 2
SAMPEL TIDAK BERPASANGAN (dr. Ratnawati,
M.Kes) .................................................................. 195
BAB XI. ANALISIS REGRESI LINEAR (dr. Ronny
Isnuwardana, MIH) ................................................ 219
vi
BAB XII. ANALISIS REGRESI LOGISTIK (dr. Ronny
Isnuwardana, MIH) ................................................ 251
BAB XIII. UJI DIAGNOSTIK (dr. Jessica Christanti, M.Kes) ... 271
BAB XIV. PENALARAN STATISTIK UNTUK DOKTER
UMUM (dr. Slamet Sunarno Harjosuwarno, MPH) ... 295
BAB XV. VISUALISASI DATA DALAM PUBLIC HEALTH
REPORT (dr. Lutfan Lazuardi, PhD)....................... 323
BAB XVI. CONTOH DAN PEMBAHASAN SOAL UKMPPD
(Dr. Sumardiyono, S.KM, M.Kes) ............................ 337
BIODATA PENULIS ............................................................. 351
vii
viii
BAB I
PENGANTAR BIOSTATISTIKA
KEDOKTERAN DAN KESEHATAN
Dr. Sumardiyono, S.KM, M.Kes*

*Bagian IKM-KP Fakultas Kedokteran, Universitas Sebelas Maret
*Anggota BKS IKM IKK IKP FK Se-Indonesia Regional IV
*e-mail: sumardiyono@staff.uns.c.id
Tujuan Pembelajaran
1. Mahasiswa memahami pengertian dasar biostatistika.
2. Mahasiswa memahami penggolongan statistika.
3. Mahasiswa memahami perbedaan antara data dan informasi.
4. Mahasiswa memahami pengorganisasian data.
Ringkasan
Biostatistika merupakan ilmu terapan dari statistika yang
membahas tentang makhluk hidup. Statistika merupakan
metode atau alat bantu untuk mengembangkan statistik.
Dalam perkembangannya, biostatistika dipandang sebagai
ilmu statistik terapan pada bidang biologi, farmasi, dan
kesehatan (kedokteran dan kesehatan masyarakat). Statistik
digolongkan menjadi dua yaitu statistik deskriptif dan statistik
inferensial, sedangkan statistik inferensial digolongkan lagi
menjadi statistik parametris dan non parametris. Statistik pada
dasarnya untuk mengelola data menjadi informasi. Dalam
pengorganisasiannya, statistik dilakukan melalui tahap
pengumpulan data (data collecting),pengolahan data (data
processing), penyajian data (data presentation), dan analisis
dan interpretasi (analysis & interpretation).
1
Pesan dalam Belajar
Untuk mempelajari Bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir Bab
karena penjelasan disajikan secara berurutan sampai akhir
Bab. Pada akhir pembelajaran, penting untuk mencoba
menjawab pertanyaan-pertanyaan pada latihan untuk menguji
seberapa besar pengetahuan dan pemahaman dalam
mempelajari Bab ini.
Materi Belajar
A. Pengertian Biostatistika
Secara etimologis, kata “Statistik” berasal darai kata
Status (Bahasa Latin), State (Bahasa Inggris), atau Staat
(Bahasa Belanda) yang berarti “Negara”. Secara umum
statistic merupakan kumpulan bahan/ keterangan berupa data
baik kualitatif maupun kuantitatif yang mempunyai arti penting
dan kegunaan bagi negara. Dalam proses perkembangannya,
statistik dibatasi pada data yang berwujud angka.
Sebelum memahami lebih jauh tentang biostatistika,
marilah kita cermati terlebih dahulu beberapa pengertian dari
istitah-istiilah di bawah ini yang berhubungan dengan
biostatistika:
1. Statistik dalam arti sempit adalah semua yang
menunjukkan kenyataan yang berwujud angka-angka
tentang kejadian khusus.
2
2. Statistik dalam arti luas adalah cara-cara ilmiah yang
dipersiapkan untuk mengumpulkan, menyusun,
menyajikan, dan menganalisis data penelitian yang
berwujud angka-angka dengan tujuan sebagai dasar dalam
menarik kesimpulan yang benar dan untuk mengambil
keputusan yang baik.
3. Penambahan huruf a (+ a) pada kata statistik menjadi
statistika, mengandung makna bahwa statistika merupakan
4. Biostatistika berasal dari kata “bio” dan “statistika”. Bio
berarti hidup dan statistika berarti metode statistik yang
membahas tentang kumpulan angka-angka, maka
biostatistika secara harafiah berarti kumpulan angka-angka
tentang kehidupan. Dalam pengertian lain, dikatakan
bahwa biostatistika merupakan ilmu terapan dari statistika
yang membahas tentang makhluk hidup. Dalam
perkembangannya, biostatistik dipandang sebagai ilmu
statistik terapan pada bidang biologi, farmasi, dan
kesehatan (kedokteran dan kesehatan masyarakat).
Dengan demikian statistik sebagai bagian dari ilmu
statistika dapat dikatakan sebagai ilmu pengetahuan yang
membahas dan mengembangkan prinsip-prinsip, metode dan
prosedur yang ditempuh dalam rangka:
1. Pengumpulan data,
2. Penyusunan data,
3. Penyajian data,
4. Penganalisaan data,
3
5. Penarikan kesimpulan, pembuatan perkiraan (estimasi)
serta menyusun prediksi secara ilmiah berdasarkan data.
Dalam bidang kesehatan (kedokteran dan kesehatan
masyarakat), maka dalam hal ini, statistika adalah semua
yang berkaitan dengan pencatatan dalam penilaian
kedokteran dan kesehatan masyarakat masyarakat. Fungsi
statistika dalam bidang kedokteran dan kesehatan
masyarakat, antara lain:
1. Memeberikan gambaran/ keterangan tentang masalah
kedokteran dan kesehatan masyarakat.
2. Menentukan prioritas masalah kedokteran dan kesehatan
masyarakat yang yang perlu ditanggulangi.
3. Menjadi bahan yang dapat digunakan untuk perencanaan
bidang kedokteran dan kesehatan masyarakat.
4. Dapat membandingkan tingkat kesehatan masyarakat antar
kelompok.
5. Menilai dan menganalisis hasil usaha di bidang kedokteran
dan kesehatan masyarakat.
6. Dapat untuk menentukan kebutuhan dalam bidang
kedokteran dan kesehatanmasyarakat yang sudah atau
belum dipenuhi.
7. Dapat digunakan untuk membuktikan hubungan sebab dan
akibat yang berkaitan dengan masalah kedokteran dan
kesehatan masyarakat.
8. Dapat menjadi dokumen data kedokteran dan kesehatan
masyarakat.
4
Penggolongan Statistik
Secara umum, statistik digolongkan menjadi dua kategori
berdasarkan ruang lingkup kajiannya seperti tersaji pada
bagan di bawah ini.
DESKRIPTIF
STATISTIK PARAMETRIS
INFERENSIAL
NON PARAMETRIS
1. Statistik deskriprif
Statistik deskriptif adalah statistik yang digunakan untuk
menggambarkan atau menganalisis suatu data hasil
penelitian, tetapi tidak digunakan untuk membuat
kesimpulan yang lebih luas (generalisasi/ inferensi).
Penelitian yang tidak menggunakan data sampel,
analisisnya menggunakan statistik deskriptif. Akan tetapi,
penelitian yang menggunakan data sampel namun tidak
bermaksud untuk membuat kesimpulan terhadap populasi
dari mana sampel diambil tetap analisisnya menggunakan
statistik deskriptif.
Secara umum statistik deskriptif mendeskripsikan atau
menggambarkan tentang data misalnya:
a. Distribusi frekuensi
1) Tabel, diagram, grafik (histogram, ogive, poligon).
2) Ukuran pemusatan data (mean, median, modus,
kuartil. Desil, persentil).
5
3) Ukuran penyebaran data (jangkauan, jangkauan
antar kuartil, simpangan kuartil, standar deviasi,
varians).
b. Data berkala/ times series (runtut waktu), untuk
mengetahui tren, misalnya perkembangan suatu kasus
penyakit.
c. Regresi dan korelasi, untuk melakukan peramalan
(prediksi) dengan menggunakan analisis regresi linier,
membuat perbandingan (komparatif), tetapi dalam
analisis korelasi, regresi maupun komparatif ini tidak
mengunakan uji signifikansi karena tidak bermaksud
membuat generalisasi (bersifat umum).
2. Statistik inferensial
Dalam arti luas, statistik dikenal juga dengan satistik
inferensial/ statistik induktif/ statistik probabilitas ialah suatu
kegiatan pengumpulan data, pengolahan data, penarikan
kesimpulan, dan membuat tindakan berdasarkan analisis
data yang dikumpulkan atau statistik yang digunakan untuk
menganalisis data sampel yang hasilnya dimanfaatkan atau
digeneralisasikan untuk populasi dimana sampel penelitian
diambil.
Statistik Inferensial dikelompokkan menjadi 2 (dua),
yaitu statistik Parametris dam Statistik Nonparametris.
a. Statistik parametris
Statistik parametris digunakan untuk menganalisis data
penelitian berskala pengukuran interval atau rasio yang
datanya berdistribusi normal. Contoh uji statistik
parametris:
6
1) Uji korelatif antara dua variabel, misalnya uji Person
Product Moment (r).
2) Uji komparatif untuk dua kelompok data tidak
berpasangan, misalnya Independent samples t-test.
3) Uji komparatif untuk lebih dari dua kelompok data
tidak berpasangan, misalnya uji One way anova,
Two way anova.
4) Uji komparatif untuk dua kelompok data
berpasangan, misalnya Paired samples t-test.
5) Uji komparatif untuk lebih dari dua kelompok data
berpasangan uji Repeated anova.
b. Statistik non parametris.
Statistik Nonparametris digunakan untuk menganalisis
data ordinal, nominal, data numerik (rasio atau interval)
yang distribusi datanya tidak normal, atau bebas
distribus. Contoh uji statistik non parametris:
1) Uji korelatif dua variabel data ordinal atau data
numerik berdistribusi tidak normal, misalnya uji
Rank Spearman, uji Somers’d.
2) Uji korelatif dua variabel data nominal, misalnya uji
Koefisien Kontingensi.
3) Uji komparatif dua kelompok data tidak
berpasangan berskala pengukuran ordinal, atau
data numerik berdistribusi data tidak normal,
misalnya uji Mann Whitney.
4) Uji komparatif lebih dari dua kelompok data yang
tidak berpasangan berskala ordinal atau data
7
numerik (rasio dan interval) berdistribusi data tidak
normal, misalnya uji Kruskal-Wallis.
5) Uji komparatif dua kelompok data berpasangan
berskala ordinal, atau data numerik (rasio dan
interval) berdistribusi data tidak normal, misalnya uji
Wilcoxon.
6) Uji komparatif lebih dari dua kelompok data
berpasangan, atau data numerik (rasio dan interval)
berdistribusi data tidak normal, misalnya uji
Friedman.
7) Uji komparatif dua kelompok data tidak
berpasangan berskala nominal, misalnya uji Chi
Square, uji Fisher Exact, uji Kolmogorov Smirnov.
8) Uji komparatif lebih dari dua kelompok data tidak
berpasangan berskala nominal, misalnya uji Chi
Square.
9) Uji komparatif dua kelompok data berpasangan
berskala niminal, misalnya uji Mc Nemar.
10) Uji komparatif lebih dari dua kelompok data tidak
berpasangan berskala nominal, misalnya uji
Cochran.
Data dan Informasi dalam statistik

Bekerja dengan statistik tidak akan lepas dari apa yang
disebut dengan data. Namun data tidak akan ada manfaatnya
kalau tidak diolah menjadi informasi. Apakah perbedaan data
dan informasi?
Data merupakan suatu fakta ataupun kumpulan fakta dari
8
suatu peristiwa yang masih mentah atau belum diolah; atau
busa juga diartikan hasil yang diperoleh dari lapangan
sebelum ada pengolahan. Data berfungsi sebagai:
1. Dasar perencanaan, sebab data-data yang dikumpulkan
oleh seseorang pasti berisi tentang fakta terkait kejadian
yang diperlukan untuk analisis dengan benar.
2. Alat pengendali suatu aktivitas atau untuk meminimalisir
ketidaksesuaian dari jalannya penelitian yang sudah
ditetapkan.
Contoh data sebagai berikut:
1. Dalam kegiatan posyandu, dilakukan penimbangan berat
badan balita, diperoleh data si A 7 kg, si B 3 kg, si C 8 kg,
dan seterusnya. Angka-angka tersebut adalah data hasil
penimbangan balita di posyandu.
2. Ketika peneliti membagikan kuesioner kepada responden
dengan 5 pilihan jawaban pada masing-masing pertanyaan
(diberi nilai 1 hingga 5), dan responden merespon dengan
memberikan jawaban, misalnya pertanyaan 1 dijawab oleh
responden 1 dengan pilihan 3 dan responden 2 dengan
pilihan jawaban 4, dan jawaban responden lainnya. Angka-
angka pilihan jawaban 2 dan 4 tersebut merupakan data.
Berbeda dengan data, informasi merupakan kumpulan
data yang sudah diolah sedemikian rupa, sehingga
selanjutnya dapat memberikan informasi (bersifat informatif)
yang bermanfaat bagi kalangan tertentu atau semua orang.
Fungsi utama informasi adalah untuk memberikan informasi
pada orang lain berupa pengetahuan; sedangkan manfaat
informasi adalah:
9
1. Membuat seseorang dapat memahami sesuatu yang
sebelumnya tidak diketahui.
2. Membantu peneliti, dalam penelitian akan menjadi tahu apa
yang sedang terjadi.
3. Menjadi dasar untuk prediksi tentang apa yang sedang
terjadi, sehingga dapat membantu mengantisipasi risiko
bahaya tertentu.
Contoh informasi sebagai berikut:
1. Data penimbangan berat badan balita di posyandu,
diperoleh nilai rerata berat badan untuk anak perempuan
berusia 4 hingga 5 tahun adalah 14,1 kg padahal standar
normal untuk anak dengan usia tersebut adalah 16,1
hingga 18,2 kg. Data tersebut memberikan informasi anak
perempuan berusia 5 hingga 5 tahun ada kemungkinan
kekurangan gizi, sehingga perlu antisipasi dengan suatu
program kesehatan untuk mencukupi gizi balita ke
depannya.
2. Misalkan kuesioner untuk mengetahui pendapat
masyarakat terhadap suatu program pemerintah setuju
dilanjutkan atau tidak tentang program peningkatan gizi
pada balita di suatu daerah dengan 5 pilihan jawaban
masing-masing pernyataan (1 = sangat tidak, 2 = tidak
setuju, 3 = netral, 4 = setuju, dan 5 = sangat setuju).
Apabila setelah diolah jawaban responden dominan
menjawab setuju dan sangat setuju, maka hal tersebut
memberikan informasi bahwa program pemerintah tentang
peningkatan gizi pada balita pada daerah tersebut tetap
dilanjutkan.
10
Pengorganisasian data dalam statistik
Berhubungan dengan data statistik, maka tugas seorang
peneliti adalah melakukan peringkasan data hasil penelitian
agar dapat menjadi informasi bagi orang lain. Adapun tahap-
tahap yang perlu dilakukan untuk menjadikan data menjadi
suatu informasi sebagai berikut:
1. Pengumpulan data (data collecting)
Berdasarkan sumbernya, data penelitian dapat
kelompokkan menjadi 2, yaitu:
a. Data primer, merupakan data yang diperoleh langsung
dari sumbernya pengumpulan data, bisa dilakukan
sendiri oleh peneliti atau dibantu enumerator, yaitu
subjek atau responden penelitian. Contoh data primer
misalnya data tekanan darah subjek penelitian yang
diukur langsung oleh peneliti menggunakan tensimeter,
data hasil jawaban responden yang mengisi kuesioner.
b. Data sekunder, merupakan data yang diperoleh dari
institusi tempat pengumpulan data atau instansi sejenis
yang sesuai ruang lingkup penelitian, jadi tidak langsung
ke subjek penelitiannya. Contoh data sekunder misalnya
data Riset Kesehatan Dasar (Riskesdas), data
Indonesian Family Life Survey (IFLS), Riset ketenagaan
di bidang kesehatan (Risnakes).
2. Pengolahan data (data processing)
Tahapan pengolahan data atau sering disebut sebagai
proses pra analisis memiliki tahapan-tahapan sebagai
berikut:
11
a. Editing data (pemeriksaan data)
Editing daya adalah proses meneliti hasil survei
apakah sudah lengkap atau belum. Proses editing
merupakan proses yang dilakukan peneliti untuk
klarifikasi, keterbacaan, konsistensi, dan kelengkapan
data yang sudah terkumpul. Dengan adanya proses
editing ini, diharapkan tidak mengganggu proses analisis
selanjutnya yang dapat menimbulkan bias penelitian
sehingga dapat dengan tepat untuk menjawab
permasalahan penelitian yang sudah ditentukan.
b. Koding data
Jika peneliti menggunakan software dalam
analisisnya, misalnya SPSS, maka perlu mengubah data
kualitatif menjadi koding angka, misalnya:
1) Variabel pekerjaan dengan koding 1 = PNS, 2 =
Swasta, 3 = Pensiunan, 4 = Belum bekerja;
2) Variabel jenis kelamin dengan koding 1 = laki-laki, 2
perempuan.
Kegunaan koding tersebut untuk mempermudah pada
saat entry data dan analisis data
c. Entry data
Peneliti membuat struktur data mencakup semua
data yang akan diinput ke software statistik.
Penyimpanan data dalam software statistik
mempertimbangkan: apakah data disimpan sesuai dan
konsisten sesuai petunjuk software komputer yang
digunakan?, apakah ada data yang belum terinput?,
bagaimana mengatasi data yang hilang/ belum terinput?,
12
sudah lengkapkah data yang dipindah?
d. Cleaning data
Cleaning data merupakan proses pengecekan data
untuk konsistensi. Data yang tidak lengkap bisa dihapus
atau substitusi nilai bersadarkan aturan yang berlaku
untuk substitusi data yang hilang.
3. Penyajian data (data presentation)
Penyajian data yang disajikan secara sederhana
bertujuan agar data yang diperoleh mudah dibaca,
dipahami dan dianalisis sesuai dengan tujuan penelitian.
Penyajian data padat berupa:
a. Tekstual
Data disajikan dalam bentuk kalimat yang menerangkan
kumpulan data yang diperoleh. Metode ini bisa
digunakan dengan jumlah data sedikit yang memerlukan
kesimpulan sederhana.
b. Tabulasi
Data disajikan dalam bentuk tabel yang terdiri dari baris
dan kolom. Penyajian data menggunakan tabel bertujuan
untuk menggambarkan data beberapa variabel hasil
penelitian. Suatu tabel memuat:
1) Kepala tabel, berisi: nomor tabel dan judul tabel
2) Leher tabel, memuat keterangan atau judul kolom.
3) Badan tabel, memuat data variabel.
4) Kaki tabel, memuat keterangan tambahan atau
sumber data.
c. Diagram/ Grafik
Selain tekstual dan tabulasi data juga dapat disajikan
13
dalam bentuk diagram/ grafik. Jenis-jenis diagram/ grafik
sebagai berikut:
1) Histogram, merupakan bentuk grafik yang
menunjukkan adanya dispersi data. Histogram
dikenal juga sebagai grafik distribusi frekuensi.
2) Diagram garis (line diagram), merupakan grafik
berupa garis yang diperoleh dari beberapa ruas garis
yang menghubungankan antar titik pada batang
bilangan.
3) Diagram baratang (bar diagram), merupakan grafik
berbentuk persegi Panjang yang lebarnya sama dan
dilengkapi dengan skala tertentu, bisa disajikan
tunggal atau berganda.
4) Diagram lingkaran(pie diagram), merupakan grafik
berupa lingkaran yang telah dibagi-bagi menjadi
bagian-bagian sesuai kategori pada data.
5) Diagram tebar (scatter plot), merupakan diagram
untuk menganalisis hubungan antara dua variabel,
satu variabel di plot horizontal dan satu variabel di
plot vertikal.
6) Pictogram, merupakan grafik yang menggunakan
gambar atau lambang dari data itu sendiri dengan
skala tertentu.
7) Mapgram, merupakan grafik berupa peta yang
menunjukkan kepadatan penduduk, jumlah kasus,
atau lainnya.
4. Analisis dan interpretasi (analysis & interpretation)
Analisis data kuantitatif dapat dilakukan melalui
14
beberapa cara, yaitu:
a. Analisis univariat
Analisis dilakukan terhadap satu variabel untuk
mendeskripsikan data, dapat berupa: nilai minimum, nilai
maksimum, rerata, median, modus, standar deviasi,
varians, distribusi frekuensi, grafik.
b. Analisis bivariat
Analisis bivariat bertujuan untuk menganalisis hubungan
antara dua variabel, misalnya:
1) Uji hubungan, contoh: uji korelasi Pearson Product
Moment, uji korelasi Rank Spearman, uji Chi Square.
Uji regresi linear sederhana, uji regresi logistik
sederhana.
2) Uji komparatif, contoh: independent samples t-test,
paired samples t-test, uji Mann Whitney.
c. Analisis multivariat
Analisis multivariat untuk menguji lebih dari satu variabel
bebas terhadap variabel terikat, contoh: uji regresi linear
berganda, uji regresi logistik berganda.
Pertanyaan latihan
1. Jelaskan pengertian biostatistika!
2. Jelaskan penggolongan statistik!
3. Berikan contoh uji untuk statistik parametris dan non
parameteris!
4. Apa perbedaan data dan informasi, berikan contohnya!
5. Bagimana pengorganisasian data dalam biostatistik?
15
Referensi
Daniel, W. W., & Cross, C. L. (2013). BIOSTATISTICS A

Foundation for Analysis in the Health Sciences (Tenth Edit).
John Wiley & Sons, Inc.
https://www.pdfdrive.com/biostatistics-a-foundation-for-
analysis-for-the-health-sciences-e16669920.html
Goos, P., & Meintrup, D. (1396). Statistics with JMP: Graphs,
Descriptive Statistics, and Probability (first edit). John Wiley &
Sons, Ltd. https://www.pdfdrive.com/statistics-with-jmp-
graphs-descriptive-statistics-and-probability-d157942765.html
Jackson, S. L. (2009). Research Methods and Statistics A Critical
Thinking Approach (E. Evans (ed.); Third Edit). Macmillan
Publishing Solutions. www.ichapters.com
Sumardiyono, Probandari, A. N. and Widyaningsih, V. (2020)
Statistik Dasar Untuk Kesehatan Dan Kedokteran, Analisis
Menggunakan SPSS Versi 23. 1st edn. Edited by E. P.
Pamungkasari. Surakarta: UNS Press.
Probandari, A. N., Pamungkasari, E. P., Febrinasari, R. P.,
Sumardiyono, & Widyaningsih, V. (2020). Metode Penelitian
Kuantitatif, Strategi Menulis Proposal Penelitian Kesehatan
(Hartono (ed.); 1st ed.). UNS Press.
16
BAB II
SKALA PENGUKURAN DATA
dr. Nining Lestari, MPH*

*Bagian IKM-KK Fakultas Kedokteran, Universitas Muhammadiyah Surakarta
*e-mail: nl209@ums.ac.id
Tujuan Pembelajaran
1. Mahasiswa mampu mengidentifikasi skala pengukuran data.
2. Mahasiswa mampu menjelaskan kegunaan skala pengukuran
data.
3. Mahasiswa mampu menginput data di SPSS.
4. Mahasiswa mampu mengubah skala data numerik menjadi skala
data kategorik.
5. Mahasiswa mampu menjawab pertanyaan latihan.
Ringkasan
Skala pengukuran data digunakan untuk mengidentifikasi
data variabel penelitian. Kesalahan dalam mengidentifikasi
skala pengukuran dapat menimbulkan kesalahan dalam
pemilihan uji statistik dan penyajian data. Untuk itu dalam BAB
ini akan dijelaskan mengenai defisini, manfaat, klasifikasi dan
aplikasi dari skala pengukuran data. Pada umumnya, skala
pengukuran data dibagi menjadi skala numerik (interval dan
rasio), serta skala kategorik (nominal dan ordinal).
Pesan dalam Belajar

Untuk mempelajari Bab ini, mahasiswa perlu memahami
17
secara urut dari awal sampai dengan akhir Bab karena
penjelasan disajikan secara berurutan sampai akhir Bab. Pada
akhir pembelajaran, jawablah pertanyaan-pertanyaan pada
latihan untuk menguji seberapa besar pengetahuan dan
pemahaman dari mempelajari Bab ini.
Materi Belajar
A. Pengantar Skala Pengukuran Data
Pengukuran adalah prosedur menentukan kualitas atau
kuantitas dari karakteristik subyek penelitian atau variabel
penelitian, sedangkan variabel adalah karakteristik dari
individu atau subyek penelitian yang memiliki variasi atau
atribut baik variasi antar waktu atau antar individu.
Pengukuran variabel ini akan menghasilkan sekumpulan nilai
atau atribut yang disebut data (Murti, 2016).
Data merupakan komponen penting dalam penelitian,
tetapi beberapa peneliti masih kesulitan dalam
mengidentifikasi jenis data sehingga menimbulkan kesalahan
dalam menentukan uji statistik dan mempresentasikan data
dengan benar. Maka dari itu, pengetahuan mengenai skala
pengukuran data sangat penting untuk mengetahui
karakteristik dari data tersebut, sehingga dapat digunakan
untuk menentukan jenis uji statistik yang tepat dan
memvisualisasikan data dengan baik (Mishra et al., 2018).
B. Klasifikasi Skala Pengukuran Data
Terdapat beberapa variasi dalam menentukan skala
pengukuran data sesuai dengan bahan rujukan yang dijadikan
18
acuan. Secara garis besar data dapat dibedakan menjadi
kualitatif dan kuantitatif (Walliman, 2011), atau data
kontinu/numerik dan data diskret/kategorik (Murti, 2016), serta
data kategorik dan numerik (Sastroasmoro & Ismael, 2011).
Dalam buku ini, skala pengukuran data dibedakan menjadi
skala kategorik (nominal/ordinal) dan skala numerik (interval
dan rasio) (Sastroasmoro & Ismael, 2011; Walliman, 2011).
Untuk mempermudah klasifikasi skala pengukuran data dapat
dilihat pada gambar 2.1.
Gambar 2.1. Klasifikasi skala pengukuran data
Skala kategorik disebut juga skala kualitatif, merupakan

skala yang terdiri dari kategori-kategori yang berbeda secara
kualitatif dan terpisah satu dengan lainnya. Skala kategorik
dibedakan menjadi skala nominal dan ordinal. Sedangkan
skala numerik disebut juga skala kuantitatif dibedakan menjadi
nominal dan rasio.
1. Skala nominal
Skala nominal adalah skala kategorik yang hanya
memberikan informasi label atau atribut saja, tidak memiliki
peringkat, serta antar label tidak memiliki jarak yang sama.
Contoh skala nominal sebagai berikut:
19
 Jenis kelamin: laki-laki dan perempuan
 Benua: Asia, Amerika, Afrika, Australia, Eropa
 Agama: Islam, Kristen, Katolik, Hindu, dan Budha
 Ras: Maukasoid, Mongoloid, Negroid
 Suku: Jawa, Batak, Sunda, Betawi
Meskipun dalam penelitian kita bisa memberikan labei
0,1,2 dan seterusnya, tetapi setiap label tidak dapat diurutkan,
tidak dapat diperingkatkan, jadi pemberian label 0,1,2 dan
seterusnya bisa dibolak balik urutannya. Pada skala nominal
tidak memiliki jarak yang sama antar label tersebut, sehingga
tidak dapat dihitung rata-ratanya (mean). Skala nominal juga
tidak dapat dimanipulasi secara matematis (dibagi, ditambah,
atau dikalikan) (Murti, 2016; Sastroasmoro & Ismael, 2011).
2. Skala ordinal
Pada skala ordinal adalah skala kategorik yang memiliki
informasi peringkat, dapat diurutkan, serta jarak antar
peringkatnya tidak sama. Contoh skala ordinal:
 Derajat penyakit: ringan, sedang, berat
 Tingkat Pendidikan: SD, SMP, SMU, S1, S2
 Stadium kanker: I, II, III, IV
 Tingkatan esselon: I, II, III, IV
 Status gizi: buruk, kurang, cukup, lebih
Meskipun memiliki nilai peringkat, tetapi nilainya tidak
dapat dimanipulasi secara matematis (ditambah, dibagi atau
dikalikan), skala ordinal juga tidak dapat dihitung mean (Murti,
2016; Sastroasmoro & Ismael, 2011).
20
3. Skala interval
Skala interval yaitu skala numerik yang tidak memiliki nol
absolut/alami sebagai titik perbandingan. Contoh skala
interval: suhu (celcius), interval suhu 1 derajat ke 2 derajat
celcius memiliki nilai kalor/panas yang sama dengan interval
2 derajat ke 3 derajat celsius, sehingga disini dikatakan jarak
intervalnya memiliki nilai yang sama sehingga dapat dihitung
meannya. Namun perlu diingat bahwa suhu 0 derajat celcius
bukan nol absolut maka suhu 15 derajat celcius tidak
dikatakan 2 kali lebih panas daripada suhu 30 derajat celcius
(Murti, 2016) (Sastroasmoro & Ismael, 2011).
4. Skala rasio
Skala rasio yaitu skala numerik yang memiliki nilai nol
absolut atau alami sebagai titik perbandingan. Contoh skala
rasio: suhu (Fahrenheit), berat badan, tinggi badan, kadar
kolesterol, tinggi badan (Murti, 2016; Sastroasmoro & Ismael,
2011).
Data numerik (interval dan rasio) mempunyai jarak atau
interval yang sama sehingga memiliki distribusi frekuensi,
maka keduanya dapat dilakukan uji t dan uji F yang berbasis
distribusi normal untuk menguji perbedaan kelompok
sampelnya. Berbeda dengan skala kategorik (nominal dan
ordinal), keduanya tidak memiliki jarak interval yang sama
sehingga tidak bisa dibuat distribusi frekuensi, tidak mengenal
distribusi normal dan tidak memiliki mean. Hal ini
mengakibatkan data kategorik tidak bisa diuji dengan data
statistik parametrik seperti uji t dan uji F, namun diuji dengan
21
uji nonparametrik seperti uji Chi square, uji proporsi, Wilcoxon,
Mann Withney, Friedman, Krusskall-Wallis dan sebagainya
(Murti, 2016).
Penyajian data numerik dan kategorik juga berbeda.
Untuk data numerik, penyajian data digambarkan dengan
histogram karena memiliki distribusi frekuensi (mean, median,
nilai minimal, nilai maksimal). Untuk data kategorik karena
tidak memiliki distribusi frekuensi sehingga tidak dapat
digambarkan dengan histogram dan alternatinya dapat dibuat
dengan diagram diagram bar maupun pie chart untuk
menunjukkan proporsi (Nugroho, 2020).
Dalam gambar 2.2 terlihat hierarki skala pengukuran data,
tingkatan ini didasarkan atas kekuatan dan karakteristik dari
data tersebut. Skala rasio dianggap lebih kuat dibandingkan
skala interval, skala interval lebih kuat dibandingkan skala
ordinal, dan skala ordinal dianggap lebih kuat daripada skala
nominal. Kekuatan ini dilihat dari perspektif bahwa dalam
penelitian seringkali skala numerik dapat diubah menjadi skala
kategorik (nominal dan ordinal) namun tidak berlaku
sebaliknya, sehingga dalam hal ini skala numerik dianggap
lebih kuat daripada skala kategorik (Sastroasmoro & Ismael,
2011).
Dasar klasifikasi dari skala pengukuran data adalah jenis
variabel yang diukur. Dalam pengukuran atau pengumpulan
data sebaiknya mengukur variabel dalam skala numerik
meskipun dalam penelitiannya nanti hanya memerlukan skala
kategorik (ordinal/nominal) (Sastroasmoro & Ismael, 2011).
Seperti contoh berikut, seorang peneliti ingin mengetahui
22
prevalensi obesitas pada wanita di India. Variabel obesitas
diukur dengan indeks massa tubuh (IMT). IMT diukur dari
berat badan dibagi tinggi badan kuadrat (BB/TB2). Data BB,
TB, IMT sebaiknya diukur sebagai data numerik, kemudian
peneliti dapat membuat kategori IMT menjadi data yang
mempunyai dua nilai/dikotomi (obese=IMT≥ 25,
nonobese=IMT <25 lebih) atau data ordinal dengan lebih dari
dua nilai/ polikotomi (IMT kurang, normal, overweight, obese)
(Pengpid & Peltzer, 2019).
Semua variabel dianggap sama penting meskipun dari
kekuatannnya skala numerik dianggap memiliki kekuatan lebih
dibandingkan skala kategorik, sehingga kita tidak dapat
menganggap bahwa skala rasio itu lebih baik dari skala
interval, skala interval lebih baik daripada skala nominal dan
ordinal. Bahkan skala numerik pada penelitian di bidang
kedokteran dan kesehatan sering diubah menjadi skala
nominal untuk menegaskan kesimpulan secara kualitatif
(pernyataan “Ya” atau “tidak”). Contohnya seorang dokter
akan diagnosis dengan menentukan pasien sakit atau tidak
sakit dan membuat prognosis baik atau buruk untuk
mempertegas kesimpulan (Murti, 2016).
Gambar 2.2. Hierarki skala pengukuran data.
23
Pada tabel 2.1 disajikan karakteristik dari masing-masing
skala pengukuran data.
Tabel 2.1 Karakteristik skala pengukuran

Skala Karakteristik
pengukuran
Kategorik
Nominal  Hanya merupakan nama atau label
 Tidak memiliki peringkat
 Tidak dapat dimanipulasi secara matematis
(penambahan,pegurangan dan perkalian), tidak bisa
diukur mean.
 Dapat dihitung proporsi, persentase
 Skala binomial/dikotomi dapat dihitung RR (kohor) dan
pada kasus dan OR (kasus control)
 Uji statistik umumnya nonparametrik: uji chi square
 Penyajian data dengan pie chart, bar.
ordinal  Memiliki nilai peringkat, tetapi jarak antar peringkatnya
tidak sama sehingga tidak dapat dimanipulasi secara
matematis (penambahan, pengurangan dan perkalian),
tidak bisa diukur mean.
 Sama dengan nominal: dapat dihitung proporsi,
presentasi, RR dan OR.
 Uji statistik umumnya nonparametrik.
 Penyajian data dengan pie chart, bar.
Numerik
Interval  Memiliki peringkat dengan interval yang dapat diukur
 Memiliki jarak yang sama sehingga dapat dihitung
distribusi frekuensi (mean, median, nilai minimal,
maksimal).
 Tidak mempunyai nilai 0 alamiah.
 Uji yang digunakan: uji parametrik (uji t atau F) apabila
memenuhi syarat uji parametrik.
 Penyajian data dengan histogram.
Rasio  Memiliki jarak yang sama sehingga dapat dihitung
distribusi frekuensi (mean, median, modus)
 Penyajian data dengan histogram
 Perbedaan dengan interval:
 Rasio mempunyai nilai 0 alamiah
 Uji yang digunakan: uji parametrik uji parametrik (uji t atau
F) apabila memenuhi syarat uji parametrik.
C.Contoh Mengidentifikasi Skala Pengukuran dan

Cara Input Data dari Hasil Penelitian
24
Berikut ini disajikan contoh data dari sebuah penelitian.
Data ini bukan data sesungguhnya hasil penelitian, jadi tidak
memperhitungkan jumlah sampel yang diperlukan.
Tabel 2.2. Contoh data penelitian

Nama Pendapatan Kadar Kadar Stroke Usia Jenis IMT Sistolik Diastolik
(Rp) GDS LDL (th) Kelamin (kg/m2) (mmHg) (mmHg)
(mg/dl) (mg/dl)
An 5000000 200 200 stroke 72 laki-laki 28 120 70
Nn 1000000 100 150 tidak stroke 58 perempuan 24 142 66
Yt 3000000 90 80 stroke 85 perempuan 20 103 71
Tb 500000 300 220 tidak stroke 59 perempuan 17 137 89
Un 3880000 220 120 tidak stroke 66 laki-laki 28 130 80
hs 1000000 440 150 stroke 65 perempuan 24 110 60
Tw 1000000 160 130 tidak stroke 50 laki-laki 38 110 90
Tn 1000000 130 110 tidak stroke 70 laki-laki 23 110 90
Dy 1500000 110 270 stroke 50 perempuan 34 130 80
At 3500000 270 320 tidak stroke 62 laki-laki 21 120 70
Hr 1200000 320 300 stroke 46 perempuan 22 120 60
Sm 1000000 300 250 tidak stroke 64 laki-laki 29 160 100
Pr 1000000 250 300 stroke 77 perempuan 20 130 80
Tk 500000 300 80 tidak stroke 65 perempuan 27 140 80
Am 1000000 90 220 tidak stroke 54 perempuan 22 130 90
Sk 1300000 220 120 stroke 62 perempuan 25 148 100
Ht 200000 120 150 tidak stroke 67 perempuan 24 197 93
Dn 3000000 220 130 tidak stroke 55 laki-laki 24 156 85
Rn 1000000 440 110 stroke 76 perempuan 25 160 80
Pj 2000000 250 270 tidak stroke 68 laki-laki 20 111 68
Data yang didapatkan dari hasil pengukuran selanjutnya

diinput ke dalam data SPSS. Pada contoh ini, SPSS yang
digunakan adalah SPSS 22. Berikut langkah-langkah dalam
menginput data di program SPSS:
1. Buka program SPSSlihat pada bagian kiri bawah terdapat
variabel view dan data view.
2. Untuk mengisi variabel view maka kita klik pada variabel view
sehingga akan terlihat kolom sebagai berikut:
25
Tabel 2.3 Penjelasan kolom dalam variebel view
Kolom Keterangan
Name kita tuliskan variabel di sini, tidak menggunakan

spasi
Type pilihan umumnya adalah numeric agar bisa dilakukan
proses uji dalam SPSS, sedangkan string berupa nama
label yang tidak dimasukkan dalam proses uji/ bukan
termasuk variabel penelitian
Width jumlah digit karakter, bisa diisi sesuai keinginan,
maksimal jumlah karakter disesuaikan dengan
jumlah karakter pada variabel, apabila tidak diisi
maka akan otomatis tersetting pada angka 8.
Decimal jumlah angka di belakang koma
Labels penjelasan lebih rinci dari variabel yang kita tulis pada
kolom nama
Values kode yang diberikan bila data kita kategorik (nominal
atau ordinal)
Collum width lebar kolom, biasanya sdh tersetting 8, namun bisa
disesuaikan
Alignment pilihan tampilan variabel, bisa rata kiri, tengah atau kanan
Measures skala pengukuran variabel. Terdiri dari nominal, ordinal dan
scale. Scale digunakan untuk data numerik baik rasio dan
interval, sehingga tidak dibedakan antara rasio dan interval
dalam SPSS ini
(Dahlan, 2014).
3. Isikan kolom variabel view sesuai dengan variabel yang

terdapat dalam data contoh. Setelah lengkap dan betul makan
tampilan yang muncul sebagai berikut:
26
4. Setelah variabel view diisi lengkap, lalu kita klik data view dan
akan muncul sebagai berikut. Isikan data sesuai kolom
varibelnya:
5. Setelah kita isikan dengan benar, maka akan muncul tampilan

data view ini. Apabila kita mengklik value label maka pada
skala jenis kelamin dan stroke akan berubah value menjadi 0
dan 1.
27
D. Mengubah Skala Pengukuran Data (Transformasi
skala pengukuran data)
Kita dapat mengubah data skala numerik menjadi skala

kategorik tetapi tidak sebaliknya. Berikut ini ditampilkan cara
mengubah dari satu skala numerik menjadi skala kategorik
baik nominal atau ordinal.
Dari contoh sebelumnya pada Langkah input data table
2.3. terdapat variabel IMT berskala numerik akan kita ubah
menjadi skala kategorik. Berikut Langkah-langkahnya:
1. Klik data viewTranform  Recode into Different variable
28
2. Masukkan IMT lalu dalam output variabel ketikkan nama variabel
yang baru pada kolom name dengan IMT_Kat , dan pada kolom
label dengan Klasifikasi IMT Asia. Setelah output variabel diisi
lalu klik change, lalu akan muncul seperti ini.
3. Lalu klik Old and New Values

Kita mengubah IMT menjadi variabel IMT_Kat dengan
cara: IMT<25 diberi kode 0. IMT kurang dari 25 yaitu angka
paling rendah sampai angka 24 diberi kode 0, maka kita
isikan Old value (Range, LOWEST through value) diisi
angka 24 lalu new value kita beri kode 0. IMT ≥ 25 diberi
kode 1, IMT 25 ke atas diberi nilai 1 maka pada Old value
(Range, value through HIGHEST) diisi angka 25 lau new
value kita beri kode 1. Lalu klik continue lalu ok.
29
4. Lalu klik continueok. Tampilan pada data view dan variabel
view akan muncul variabel IMT_Kat. Kita klik variabel view lalu
kita sesuaikan values, measures, Pada kolom valuesIMT_Kat
kode 0= nonobese, kode 1= obese. Pada kolom measures
dijadikan ordinal.
5. Apabila sudah disesuaikan maka tampilan pada data view akan

terlihat sebagai berikut. value label dapat diubah dari angka
menjadi huruf atau sebaliknya dengan mengklik symbol ini
30
Pertanyaan latihan
6. Apa persamaan dan perbedaan antara skala pengukuran data
nominal, ordinal, rasio dan interval?
7. Bagaimana hierarki atau kekuatan dari skala data nominal,
ordinal, rasio dan interval?
8. Apa manfaat pengklasifikasian skala pengukuran data?
9. Bagaimana cara mengubah data numerik menjadi data
kategorik?
10. Praktekkan input data penelitian dari Tabel 2.2. Contoh data
penelitian!
Referensi
Dahlan, M. S. (2014). Statistik Untuk Kedokteran dan
Kesehatan (Edisi 6). Epidemiologi Indonesia.
Mishra, P., Pandey, C. M., Singh, U., & Gupta, A. (2018).
Scales of measurement and presentation of statistical
data. Annals of Cardiac Anaesthesia, 21(4), 419–422.
https://doi.org/10.4103/aca.ACA_131_18
Murti, B. (2016). Variabel dan Pengukuran. In Prinsip dan
Metode Riset Epidemiologi (1st ed., p. 287). Yuma
Pustaka.
Nugroho, P. S. (2020). Analisis Data Penelitian Bidang
Kesehatan (1st ed.). Gosyen Publishing.
Pengpid, S., & Peltzer, K. (2019). Prevalence and correlates
31
of underweight and overweight/obesity among women in
India: results from the National Family Health Survey
2015–2016. Diabetes, Metabolic Syndrome and Obesity:
Targets and Therapy, Volume 12, 647–653.
https://doi.org/10.2147/DMSO.S206855
Sastroasmoro, S., & Ismael, S. (2011). Pengukuran. In Dasar-
dasar Metodologi Penelitian Klinis (4th ed., pp. 66–70).
Sagung Seto.
Walliman, N. (2011). The Nature of Data. In Research Method
The Basic (1st ed., pp. 65–77). Routledge.
32
BAB III
STATISTIK DESKRIPTIF

Tujuan Pembelajaran
1. Mahasiswa memahami pengertian statistik deskriptif.
2. Mahasiswa memahami deskripsi data numerik dan kategorik.
3. Mahasiswa mampu mendeskripsikan data numerik
menggunakan software statistik.
4. Mahasiswa menginterpretasikan hasil penyajian data.
Ringkasan
Statistik deskriptif merupakan bagian dari statistik yang
paling mendasar yang tidak bisa dipisahakan dalam analisis
data. Statistik deskriptif merupakan proses analisis statistik
yang fokus kepada manejemen, penyajian, dan klasifikasi
data. Dengan proses ini, data yang disajikan akan menjadi
lebih menarik lebih mudah dipahami, dan mampu memberikan
makna lebih bagi pengguna data sebelum dianalisis lebih
mendalam. Penyajian data numerik dapat berupa ukuran
pemusatan data, ukuran penyebaran data, nilai letak data, dan
distribusi data. Penyajian data kategorik dapat menggunakan
tabel, diagram batang, ataupun diagram lingkaran. Alat bantu
untuk mempermudah pembuatan diskripsi data sangat
banyak, antara lain software SPSS dan Excel.
33
Pesan dalam Belajar
Materi Belajar
A. Pengertian Statistik Deskriptif

Pada Bab I sudah disampaikan bahwa statistik deskriptif
adalah statistik yang digunakan untuk menggambarkan atau
menganalisis suatu data hasil penelitian, tetapi tidak
digunakan untuk membuat kesimpulan yang lebih luas
(generalisasi/ inferensi). Penelitian yang tidak menggunakan
data sampel, analisisnya menggunakan statistik deskriptif.
Akan tetapi, penelitian yang menggunakan sampel namun
tidak bermaksud untuk membuat kesimpulan terhadap
populasi dari mana sampel diambil tetap analisisnya
menggunakan statistik deskriptif. Untuk mempermudah
analisis deskriptif dapat menggunakan software statistik
misalnya SPSS, Stata, Excel dan lain-lain sesuai dengan
kebutuhan dengan tujuan agar deskripsi datanya lebih
menarik dan lebih mudah dipahami.
Statistik deskriptif merupakan bagian dari statistik yang
34
paling mendasar yang tidak bisa dipisahakan dalam analisis
data. Statistik deskriptif merupakan proses analisis statistik
yang fokus kepada manejemen, penyajian, dan klasifikasi
data. Dengan proses ini, data yang disajikan akan menjadi
lebih menarik lebih mudah dipahami, dan mampu memberikan
makna lebih bagi pengguna data. Penyajian data secara
deskriptif memiliki manfaat:
1. Memberikan gambaran atau deskripsi bagaimana informasi
yang dimiliki data tersebut. Dalam hal ini, statistik deskriptif
haruslah mampu memberikan gambaran informasi apa saja
yang bisa didapat dari data yang digunakan, akan lebih
menarik bila ditampilan dalam bentuk tabel dan atau grafik.
2. Menjelaskan karakteristik sebuah data. Dalam hal ini,
statistik deskriptif memberikan karakteristik tentang data
yang digunakan. Hal ini penting karena kondisi data yang
digunakan akan memengaruhi seluruh analisis data yang
kita lakukan.
Penyajian data pada analisis deskriptif tergantung skala
pengukuran data variabel penelitian dan jumlah variablel yang
akan disajikan. Untuk skala pengukuran data variabel
penelitian silahkan melihat kembali Bab II. Secara garis besar
penyajian data pada statistik deskriptif berdasarkan 2 kategori,
yaitu: data numerik (interval dan rasio) dan kategorik (nominal
dan ordinal).
B.Statistik Deskriptif Data Numerik

Statistik deskriptif untuk data numerik (interval dan rasio)
untuk suatu variabel penelitian dapat disajikan dalam bentuk:
35
1. Ukuran pemusatan data (kecenderungan terpusat/ measure
of central tendency)
Ukuran pemusatan merupakan metode paling lazim yang
digunakan dalam analisis deskriptif. Fokus metode ini untuk
menggambarkan kondisi data di titik pusat. Secara umum, dapat
kita lihat distribusi data dengan melihat dimana letak pusat data
tersebut. Pada umumnya, pusat data berada pada nilai tengah,
meskipun tida selalu demikian. Untuk mendiskripsikan hal hal
tersebut secara matematis pengukuran yang sering digunakan
adalah mean, median, dan modus.
a. Mean (nilai rerata)
Mean merupakan nilai rerata dari data, dengan rumus:
jumlah nilai dari seluruh data dibagi dengan jumlah data
tersebut.
b. Median (nilai tengah)
Median merupakan nilai tengah dari data. Nilai data
tersebut diurutkan dari nilai terkecil hingga terbesar. Jika
jumlah data adalah ganjil, maka nilai tengah data tersebut
langsung menjadi median. Namun bila jumlah data adalah
genap, kita perlu menemukan nilai rata-rata dari nilai tengah
data tersebut.
c. Modus (mode)
Mode merupakan nilai yang paling sering muncul dalam
sekelompok data. Kita hanya perlu melihat nilai mana yang
paling sering muncul dalam kelompok tersebut. Bila jumlah
frekuensi setiap data adalah sama, maka nilai modus tidak
ada.
Pada analisis data, pada umumnya fokus perhatian tidak
terletak pada keseluruhan data, tetapi terletak hanya dimana
data tersebut memusat. Oleh karena itulah nilai-nilai mean,
36
median dan modus sering digunakan untuk mewakili
seperangkat data dalam analisis statistik.
Pada suatu distribusi frekuensi, hubungan antara mean,
median dan modus adalah sebagai berikut:
a. Jika mean (µ), median (Md) dan modus (Mo) memiliki nilai
yang sama, maka nilai mean, median dan modus akan
terletak pada satu titik dalam kurva distribusi frekuensi. Kurva
distribusi frekuensi tersebut akan terbentuk secara simetris.
Gambar 3.1. Kurve simetris (µ = Md = Mo)
b. Jika mean lebih besar dari median, dan median lebih besar
dari modus, maka pada kurva distribusi frekuensi, nilai mean
terletak di sebelah kanan, median terletak di tengahnya dan
modus di sebelah kiri. Kurva distribusi frekuensi yang
terbentuk adalah miring/ menceng kanan atau kemiringan/
kemencengan positif.
Gambar 3.2. Kurve miring ke kiri (µ > Md > Mo)
37
c. Jika mean lebih kecil dari median, dan median lebih kecil dari
modus, maka pada kurva distribusi frekuensi, nilai mean akan
terletak di sebelah kiri, sedangkan median terletak di
tengahnya dan modus di sebelah kanan. Kurva distribusi
frekuensi yang terbentuk adalah miring/menceng kiri atau
kemiringan/kemencengan negatif.
Gambar 3.3. Kurve miring ke kiri (µ < Md < Mo)
d. Jika kurva distribusi frekuensi tidak simetris (miring/menceng

ke kiri atau ke kanan), pada umumnya akan berlaku hubungan
antara mean, median dan modus sebagai berikut:
Mean – Modus = 3 (Rata-rata – Median)
Penyajian data menggunakan mean, median, dan modus

memiliki kelebihan dan kekurangan masing-masing (table 3.1).
2. Ukuran penyebaran data (keragaman)
Ukuran penyebaran data menunjukkan deskripsi penyebaran
data pada kelompok data, untuk menganalisis seberapa jauh
data-data tersebut tersebar dari ukuran pemusatannya. Bila
sebaran datanya rendah menunjukkan data tersebar tidak jauh
dari pusatnya. Bila sebarannya jauh menunjukkan data tersebar
jauh dari pusatnya. Untuk menggambarkan hal ini, bisa
menggunakan beberapa nilai pengukuran sebagai berikut:
a. Range
38
Range atau rentang merupakan selisih dari nilai terbesar
dan nilai terkecil. Range merupakan hal yang sederhana dan
mudah dipahami dalam ukuran penyebaran data. Range
menunjukkan seberapa jauh sebaran dengan mengabaikan
bentuk distribusinya.
b. Varians
Varians merupakan ukuran seberapa jauh menyebar dari
nilai rata-ratanya. Semakin kecil nilai varians, semakin dekat
sebaran data dengan rata-rata. Semakin besar nilai varian,
semakin besar sebaran data terhadap nilai rata-ratanya.
c. Standar deviasi
Standar deviasi merupakan ukuran lain dari sebaran data
terhadap rata-ratanya. Bila kita menggunakan varians, maka
nilai yang kita dapatkan sangatlah besar. Nilai ini tidak mampu
menggambarkan bagaimana sebaran data sebenarnya
terhadap rata-rata. Untuk mendapatkan nilai yang lebih
mudah diinterpretasikan, maka lebih tepat menggunakan
standar deviasi. Standar deviasi menghasilkan nilai yang lebih
kecil dan mampu menjelaskan bagaimana sebaran data
terhadap rata-rata. Standar deviasi disebut juga dengan
simpangan baku.
3. Nilai Letak data
a. Persentile (persentile)
Persentil merupakan ukuran penyebaran yang membagi
data menjadi 100 bagian sama besar. Misal Persentil 5 artinya
data yang dimaksud mencakup 5% dari keseluruhan data,
Persentil 95 artinya data yang dimaksud mencakup 95%.
b. Quartiles Range (rentang kuartil)
Range Quartiles atau rentang kuartil merupakan ukuran
penyebaran yang membagi data menjadi 4 bagian. Sesuai
39
dengan namanya, kuartil membagi data menjadi 25 persen di
setiap bagiannya. Ada 3 jenis nilai kuartil yang perlu kita
ketahui, yaitu:
1) Q1 atau kuartil bawah yang memuat 25 persen dari data
dengan nilai terendah (= Persentil 25).
2) Q2 atau kuartil tengah, yang membagi data menjadi 2
bagian sama besar 50 persen terkecil dan 50 persen
terbesar. Q2 juga memiliki nilai yang sama dengan median
(= Persentil 50).
3) Q3 atau kuartil atas yang memuat 25 persen dari data
dengan nilai tertinggi (= Persentil 75).
c. Desile (desil)
Desil merupakan ukuran penyebaran yang membagi data
menjadi 10 bagian sama besar (= Persentil 0-10, 10-20, 20-
30, 30-40, 40-50, 50-60, 60-70, 70-80, 80-90, 90-100).
4. Distribusi data
a. Skewness
Skewness (Sk) merupakan ukuran yang menunjukkan
bagaimana kemiringan/kemencengan sebuah distribusi data
terhadap nilai mean (rerata). Skewness juga bisa dikatakan
sebagai ukuran ketidaksimetrisan sebuah data. Skewness
dapat digunakan untuk menguji apakah distribusi data normal
atau tidak.
b. Kurtosis
Kurtosis merupakan ukuran yang menunjukkan
keruncingan sebuah data di dalam distribusinya. Kurtosis
disebut juga derajat keruncingan. Kurtosis dapat digunakan
untuk menguji apakah distribusi data normal atau tidak.
40
C.Mendeskripsikan Data Numerik Menggunakan
Software Statistik
Dalam contoh ini, misalkan ada data 30 data (n = 30)
variabel usia (dalam tahun) dan kadar HbA1c (dalam %)
seperti tersaji pada tabel 3.2.
Tabel 3.2. Data Kadar HbA1c Ibu Rumah Tangga
No. Usia (th) HbA1c (%) No. Usia (th) HbA1c (%)
1 25 6.9 16 38 7
2 53 8.1 17 39 7.3
3 31 7.9 18 39 4
4 34 6.7 19 40 7.1
5 42 4.9 20 36 5.7
6 41 6.7 21 35 5.7
7 40 6.4 22 43 7.2
8 42 6.9 23 51 6.9
9 43 8.5 24 48 7
10 50 5.7 25 39 7.1
11 34 6.3 26 40 6.4
12 38 7.8 27 62 3.8
13 42 6.9 28 54 6.9
14 42 6.5 29 52 3.7
15 45 5.7 30 45 4.8
Dalam contoh ini akan disajikan cara menghitung ukuran

pemusatan data (mean, median, modus) dan ukuran
penyebaran data (Range, Varians, Standar deviasi), Nilai letak
data (Persentil, Kuartil, Desil), distribusi data (Skewness,
Kurtosis). Khusus skewnws dan kurtosis sekaligus akan
digunakan untuk menilai apakah distribudi data normal atau
tidak. Analisis ini menggunakan software SPSS versi 23.
Langkah-langkah analisis menggunakan SPSS sebagai
41
berikut:
1. Input nama variabel
2. Input data variabel
3. Lakukan analisis
a. Klik Analyze  Descriptive Statistics  Frequencies
42
b. Klik pada Frequencies, muncul kotak dialog Frequencies,
pindahkan kedua variabel ke kotak Variable(s)
c. Klik Statistics, muncul kotak dialog Frequencies: Statistics,

centang pada Mean, Median, Mode, Std. Deviation, Variance,
Range. Skewness, Kurtosis, Quartile, Cut of points, dan pada
percentile(s) isikan 5 lalu Add, 96 lalu Add.
d. Klik Continue, muncul kotak dialog Frequencies: Charts,

centang Histogram dan centang Show normal curve on
histogram.
43
e. Klik Continue, klik OK, muncul output analisis deskriptif
statistik.
Dari output SPSS tersebut terjawab nilai-nilai

deskriptif dari variabel usia dan variabel HbA1c seperti
pada tabel berikut.
Tabel 3.3. Deskripsi data variabel Usia dan HbA1c
Deskripsi Nilai Usia Nilai HbA1c
mean (rerata) 42,10 6,417
median (nilai tangah) 41,50 6,800
mode (modus) 42 6,9
Std. deviation (standar 7,567 1,2132
deviasi, simpangan baku)
varians 57,266 1,472
skewness 0,427 -0,801
Std. Error of Skewness 0,427 0,427
44
Deskripsi Nilai Usia Nilai HbA1c
Kurtosis 0,883 0,304
Std. Error of kurtosis 0,883 0,883
Range (rentang) 37 4,8
Persentil 5% 28,30 3,755
Persentil 95% 57,60 8,280
Kuartil Persentil 25 38,00 5,700
Persentil 50 41,50 6,800
Persentil 75 45,75 7,100
Desil Persentil 10 34,00 4,080
Persentil 20 36,40 5,700
Persentil 30 39,00 5,880
Persentil 40 40,00 6,440
Persentil 50 41,50 6,800
Persentil 60 42,00 6,900
Persentil 70 44,40 7,000
Persentil 80 49.60 7,180
Persentil 90 52,90 7,890
Sedangkan grafik distribusi data kedua variabel (usia

dan HbA1c) tersaji pada gambar di bawah ini.
Gambar 3.4. Kurve distribusi data variabel Usia

45
Gambar 3.5. Kurve distribusi data variabel HbA1c
Selanjutnya akan diselidiki apakah distribusi data

kedua variabel tersebut (Usia, HbA1c) normal atau tidak,
maka dapat ditentukan dari nilai Skewness, Kurtosis.
Distribusi data dinyatakan normal apabila:
a. Rasio skewness terletak antara -2 hingga 2
Rumus Rasio Skewness = Skewness / Std. Error
b. Rasio kurtosis terletak antara -2 hingga 2
Rumus Rasio Kurtosis = Kurtosis / Std. Error
Dari data tabel 3.3. diketahui bahwa pada:
a. Variabel Usia
1) Skewness = 0,427
Std. Error of Skewness = 0,427
Jadi rasio skewness = 0,424 / 0,424 = 1
Dilihat dari nilai rasio Skewness = 1 terletak antara -2
hingga 2, maka distribusi data usia dinyatakan
Normal.
46
2) Kurtosis = 0,883
Std. Error of Kurtosis = 0,883
Jadi rasio skewness = 0,883 / 0,883 = 1
Dilihat dari nilai rasio Kurtosis = 1 terletak antara -2
hingga 2, maka distribusi data usia dinyatakan
Normal.
b. Variabel HbA1c
1) Skewness = -0,801
Std. Error of Skewness = 0,427
Jadi rasio skewness = -0,801 / 0,427 = -1,878
Dilihat dari nilai rasio Skewness = -1,878 terletak
antara -2 hingga 2, maka distribusi data usia
dinyatakan Normal.
2) Kurtosis = 0,304
Std. Error of Kurtosis = 0,833
Jadi rasio skewness = 0,304 / 0,833 = 0,365
Dilihat dari nilai rasio Kurtosis = 0,365 terletak antara
-2 hingga 2, maka distribusi data usia dinyatakan
Normal.
D.Visualisasi Data
Tujuan visualisasi data untuk menyampaikan dan
menyajikan data agar informasi tersebut lebih mudah
dipahami oleh pengguna data melalui bentuk yang menarik
dan memilika makna yang berarti. Visualisasi dapat disajikan
dalam bentuk tabel, grafik garis, diagram batang, diagram
lingkaran. Untuk membuat visualisasi data tersebut dapat
digunakan berbagai software statistik antara lain SPSS,
47
STATA, Excel dan lain-lain. Dalam contoh ini akan digunakan
SPSS untuk memvisualisasikan data variabel.
1. Tabel
Visualisasi data menggunakan tabel paling seringi
digunakan, bisa disajikan secara tunggal (menyajikan
frekuensi data) maupun tabel silang (2 variabel atau lebih).
Berikut contoh pembuatan tabel.
a. Visualisasi tabel untuk 1 variabel
Dalam contoh ini, digunakan contoh variabel usia.
Data variabel usia dikelompokkan menjadi 8 kategori
seperti tersaji pada tabel 3.4.
Tabel 3.4. Tabel distribusi frekuensi kelompok Usia

Kategori Usia Jumlah Persen
25-30 1 3.3
31-35 4 13.3
36-40 9 30.0
41-45 9 30.0
46-50 2 6.7
51-55 4 13.3
56-60 0 -
61-65 1 3.3
Total 30 100
Pengerjaan dengan SPSS:

1) Input nama variabel
Untuk kolom Values, isikan kode kategorinya:
1 = 25-30
2 = 31-35
48
3 = 36-40
4 = 41-45
5 = 46-50
6 = 51-55
7 = 56-60
8 = 61-65
2) Input data variabel

Isikan sesuai kodingnya dengan jumlah sesuai jumlah
data masing-masing kategori.
49
3) Klik Analyze  Descriptive Statistics  Frequencies
4) Klik pada Frequencies, muncul kotak dialog

Frequencies, pindahkan variabel Usia ke kotak
Variable(s)
50
5) Klik OK, muncul output SPSS.
b. Visualisasi tabel lebih dari 1 variabel (tabel silang).

Tabel silang merupakan penyajian tabel yang
mengkombinasikan 2 variabel atau lebih. Dalam contoh
ini disajikan tabel silang 3 x 3, maksudnya variabel
pertama (Usia) dikategorikan menjadi 3 kategori, dan
variabel HbA1c dikategorikan menjadi 3 kategori seperti
pada tabel 3.5.
Tabel 3.5. Tabel silang Usia dan HbA1c
HbA1c
Jumlah
Usia (tahun) Normal Prediabetes Diabetes
< 40 3 2 9 14
> 40-50 4 0 7 11
> 50 2 0 3 5
Jumlah 9 2 19 30
51
Pengerjaan dengan SPSS:
a. Variabel Usia
1 = < 40
2 = > 40-50
3 = > 50
b. Variabel HbA1c
1 = Normal
2 = Prediabetes
3 = Diabetes
52
3) Klik Analyze  Descriptive Statistics  Crosstabs
4) Klik Crosstabs. Lalu masukkan variabel Usia ke kotak

Row(s) dan variabel Diabetes Melitus ke Column(s)
5) Klik Cells muncul kotak dialog Crosstabs: Cell Display.

Beri tanda centang pada Percentages bagian Row,
53
yang dimaksudkan untuk mendeskripsikan persentasi
nilai frekuensi berdasarkan baris. Jika yang dicentang
Column maka persentase frekuensi berdasarkan kolom.
Jika dicentang Total maka akan muncul deskripsi
persentase total. Pada contoh ini dipilih Row.
6) Klik Continue, lalu klik OK. Muncuk output SPSS,
Interpretasi:
Diabetes melitus lebih banyak diderita oleh kelompok
usia < 40 tahun dan kelompok > 40 hingga 50 tahun,
sedangkan usia diatas 50 tahun tidak ditemukan kasus
diabetes melitus. Berdasarkan kategori usia, subjek
penelitian yang tidak mengalami diabeles melitus (kadar
54
HbA1c normal) adalah berimbang (hampir sama).
2. Grafik garis
Contoh grafik garis yang akan disajikan dengan SPSS
versi 23 ini diambil dari data tabel 3.2. namun data variabel
usia sudah diurutkan dari yang terkecil hingga terbesar
secara urut. Langkah-langkahnya sebagai berikut:
a. Input nama variabel
b. Input data variabel
c. Klik Graph  Legacy Dialogs  Line
55
d. Klik Line, muncul kotak dialog: Line Charts, pilih Simple
dan Values of individual cases.
e. Klik Define, muncul kotak dialog: Define Simple Line:

Values of Individual Cases. Masukkan variabel Usia ke
Category Labels: Variable dan variabel HbA1c ke kotak
Line Represents.
56
f. Klik OK, muncul output grafik garis.
g. Interpretasi
Secara umum, terlihat bahwa semakin bertambahnya
usia, kadar HbA1c cenderung mengalami penurunan.
3. Diagram batang
Diagram batang adalah bentuk diagram menggunakan
batang-batang persegi atau balok untuk menampilkan suatu
data. Diagram ini digunakan untuk menyajikan data untuk
kepentingan perbandingan tertentu. Diagram ini dapat digunakan
untuk membandingkan lebih dari satu kategori untuk variabel
tunggal ataupun untuk melihat hubungan antara dua variabel
dalam bentuk grafik batang. Contoh diagram batang yang akan
disajikan dengan SPSS versi 23 ini diambil dari data tabel 3.5.
sub judul Tabel: Visualisasi tabel lebih dari 1 variabel (tabel
silang).
a. Visualisasi diagram batang dalam satu variabel,
57
58
3) Klik Analyze  Descriptive Statistics  Frequencies.
4) Muncul kotak dialog Frequencies. Pindahkan variabel

Usia dan diabetes melitus ke kotak Variable(s)
5) Klik Charts. Muncul kotak dialog Frequencies: Charts.

Pada Charts Type pilih Bar charts dan pada Charts
Values pilih Frequencies (untuk menampilkan jumlah).
59
6) Klik Continue, lalu klik OK, muncul output diagram
batang variabel usia dan diabetes melitus.
Interpretasi variabel usia:

Kelompok usia responden dominan pada usia dibawah 40
tahun diikuti oleh usia lebih dari 40 hingga 50 dan di atas
50 tahun.
Interpretasi variabel Diabetes melitus:

Responden dominan mengalami diabetes melitus, diikuti
oleh kategori normal dan prediabetes.
b. Visualisasi diagram batang hubungan antara dua variabel.
Dalam contoh ini digunakan software Excel (Office 2019).
Data menggunakan tabel 3.5.
60
1) Blok data yang akan dibuat grafik
2) Klik Insert, lalu Bar Chart, pilih 2-D Column, lalu klik,
muncul draf diagram batang.
3) Untuk memberi judul, klik pada Title kemudian

tuliskan judulnya (misal diberi judul: Hubungan Usia
dengan Kejadian DM). Bila menghendaki beda
tampilan bisa pilih gambar dengan cara klik kotak
diagram batang (kotak diagram batang di Excel
menjadi aktif)  pilih Design  pilih (klik) pada
format gambar yang dikehendaki.
61
4) Jika menghendaki warna gambar dirubah, arahkan
kursor pada balok diagram lalu klik kanan, klik Fill
pilih warna yang dikehendaki.
5) Interpretasi
Kejadian diabetes melitus paling banyak dialami usia
kurang dari 40 tahun, diikuti oleh usia lebih dari 40 hingga
50 tahun dan lebih dari 50 tahun.
4. Diagram lingkaran
Diagram lingkaran (pie chart) adalah sebuah grafik
visualisasi data statistik berbentuk lingkaran yang dibagi menjadi
irisan-irisan untuk menggambarkan proporsi numerik. Data yang
disajikan berupa distribusi frekuensi satu data. Dalam contoh ini
dibuat diagram lingkaran frekuensi diabetes melitus pada usia <
40 tahun, digunakan software Excel (Office 2019). Data
menggunakan tabel 3.5.
62
a. Blok data yang akan dibuat grafik.
b. Klik Insert, lalu Pie Chart, pilih Pie, lalu klik, muncul draf
diagram lingkaran.
c. Untuk memberi judul, klik pada kotak <40 kemudian

tuliskan judulnya (misal diberi judul: DM pada usia
kurang dari 40 tahun). Bila menghendaki beda tampilan
bisa pilih gambar dengan cara klik kotak diagram (kotak
diagram batang di Excel menjadi aktif)  pilih Design 
pilih (klik) pada format diagram lingkaran yang
dikehendaki.
63
d. Jika menghendaki warna gambar dirubah, arahkan
kursor pada bagian diagram yang akan dirubah
warnanya lalu klik 2 kali (bagian yang akan dirubah
menjadi aktif), lalu klik Fill pilih warna yang dikehendaki,
lakukan juga pada bagian lain jika dikehendaki
perubahan warna.
64
http://www.portal-statistik.com/2014/02/statistik-deskriptif-
dengan-spss.html
Pertanyaan latihan
11. Jelaskan apa yang dimaksud dengan statistik deskriptif?
12. Apa manfaat penyajian data secara deskriptif?
13. Apa yang dimaksud dengan ukuran pemusatan data, ukuran
penyebaran data, nilai letak data, dan distribusi data pada
deskripsi data numerik? Berilah contoh masing-masing!
14. Buatlah contoh pembuatan tabel, diagram garis, diagram
batang, dan diagram lingkaran dengan menggunakan software
statistik!
Referensi
Goos, P., & Meintrup, D. (1396). Statistics with JMP: Graphs,

Descriptive Statistics, and Probability (first edit). John Wiley &
Sons, Ltd. https://www.pdfdrive.com/statistics-with-jmp-
graphs-descriptive-statistics-and-probability-d157942765.html
Portal Statistik. (2014). Statistik Deskriptif dengan SPSS.
http://www.portal-statistik.com/2014/02/statistik-deskriptif-
dengan-spss.html
65
66
BAB IV
ANALISIS KORELASI DATA NUMERIK

Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji
korelasi Pearson Product Moment.
korelasi Rank Spearman.
Ringkasan
Analisis korelasi data numerik uji korelasi Pearson Product
Moment untuk data berdistribusi normal dan korelasi Rank
Spearman untuk data tidak berdistribusi normal merupakan uji
statistik yang bertujuan untuk menentukan hubungan antara 2
variabel (variabel bebas dan variabel terikat) dengan
interpretasi signifikansi, arah hubungan, kekuatan hubungan,
dan koefisien determinasi. Bab ini memberikan pengalaman
belajar kepada mahasiswa berupa cara menginput data ke
software SPSS (Statistical Product and Service Solutions),
melakukan uji normalitas data, cara melakukan uji Pearson
Product Moment dan Rank Spearman, serta cara melakukan
interpretasi hasil uji statistiknya sehingga dapat menyimpulkan
hasil analisisnya.
67
Pesan dalam Belajar
Materi Belajar
A. Pengantar Analisis Korelasi

Analisis korelasi merupakan salah satu analisis statistik
yang sering digunakan oleh mahasiswa dalam menyusun
skripsinya, pada umumnya menggunakan judul/tema
Hubungan, ‘Hubungan ….. dengan ……’ atau “Korelasi …..
dengan ……”. Sebagai contoh, skripsi berjudul: ‘Hubungan
antara Stres dengan Kadar Gula Darah pada Ibu Rumah
Tangga di Semarang’. Dari judul ini, maka analisis statistiknya
menggunakan analisis korelasi. Namun, analisis korelasi ada
beberapa macam, oleh karena itu, mahasiswa perlu
mengidentifikasi terlebih dahulu analisis korelasinya
menggunakan yang mana? Apakah uji Pearson Product
Moment, uji Rank Spearman, uji Somers’d, atau uji Koefisien
Kontingensi (C)? Untuk itu mahasiswa dipersilahkan
mengingat kembali cara memilih uji statistik (catatan: tabel ini
hanya menyajikan cara pemilihan uji korelasi, bukan uji beda),
68
lihat tabel 4.1.
Tabel 4.1. Memilih Uji Korelasi

Skala Pengukuran Hipotesis Korelatif
Numerik (Rasio, Uji normalitas Pearson Product
Interval) data (terpenuhi) Moment
Ordinal (Ordinal Asumsi tidak Rank Spearrman

Numerik) terpenuhi
Ordinal (Ordinal Tidak perlu Somers’d
Kategorik) asumsi
Kategorik Tidak perlu Koefisien
(Nominal) asumsi Kontingensi (C)
Tabel 4.1. memberikan gambaran bahwa memilih salah

satu uji statistik dalam analisis korelasi terlebih dahulu harus
mengetahui skala pengukuran data variabel. Jika skala
pengukuran variabel keduanya adalah numerik (rasio, interval)
dan memenuhi asumsi normalitas, maka analisis statistik
dapat menggunakan uji Pearson Product Moment. Jika skala
pengukuran variabel keduanya adalah numerik (rasio,
interval), tetapi tidak memenuhi asumsi normalitas, maka
analisis statistik dapat menggunakan uji Rank Spearman.
Sedangkan uji lainnya (Somers’d dan Koefisien Kontingensi
(C)) tidak memerlukan uji asumsi.
Bab ini menyajikan uji korelasi data numerik, sehingga
hanya dibahas uji Pearson Product Moment dan Rank
Spearman. Untuk mempermudah analisis statistik, mahasiswa
dapat menggunakan software statistik, antara lain SPSS,
69
STATA, MINITAB, SAS, EVIEWS, PAST, SOFA, JASP,
Jamovi, Statcato, KyPlot, Epi Info, Gretl, dan lain-lainnya.
Dalam contoh perhitungan uji statistik pada Bab ini digunakan
software SPSS (Statistical Product and Service Solutions).
Hasil uji korelasi dapat memberikan informasi arah
korelasi (arah hubungan), kekuatan hubungan, dan koefisien
determinasi.
1. Arah Korelasi
Nilai korelasi diberi simbol r (uji Pearson Product
Moment) dan ρ (uji Rank Spearman). Arah korelasi ada dua,
yaitu korelasi positif dan korelasi negatif. Nilai r atau ρ
angkanya antara -1 dan 1. Nilai 0 berarti tidak ada korelasi,
dan nilai 1 berarti korelasi positif sempurna, dan nilai -1 berarti
korelasi negatif sempurna. Korelasi positif artinya
meningkatnya nilai variabel bebas diikuti oleh meningkatnya
nilai variabel terikat, sebaliknya korelasi negatif artinya
meningkatnya nilai variabel bebas diikuti oleh menurunnya
nilai variabel terikat.
Dalam contoh judul di atas, jika arah korelasi positif berarti
meningkatnya stres menyebabkan meningkatnya kadar gula
darah (stres meningkat, kadar gula darah meningkat) dan jika
arah korelasi negatif berarti meningkatnya stres menyebabkan
menurunnya kadar gula darah (stres meningkat, kadar gula
darah menurun). Secara umum, arah korelasi dapat
diilustrasikan pada gambar 4.1.
70
Gambar 4.1. Arah korelasi
2. Kekuatan korelasi
Uji Pearson Product Moment dan Rank Spearman
menghasilkan nilai koefisien korelasi. Koefisien korelasi
Pearson Product Moment disimbolkan dengan huruf r kecil (r),
sedangkan koefisien korelasi Rank Spearman yang biasa
disebut juga dengan nama Spearman Rho disimbolkan
dengan huruf Yunani yaitu rho (ρ). Interpretasi kekuatan hasil
uji dapat dilihat pada tabel 4.2.
Tabel 4.2. Interpretasi kekuatan hasil uji korelasi

Koefisien korelasi (r, ρ) Kekuatan hasil uji
> 0,80 – 1,00 Sangat tinggi (Sangat kuat)
> 0,60 – 0,80 Tinggi (Kuat)
> 0,40 – 0,60 Cukup (Kuat)
> 0,20 – 0,40 Rendah (Lemah)
0,00 – 0,20 Sangat rendah (Sangat lemah)
3. Koefisien determinasi
Koefisien determinasi diberikan simbol r kuadrat
(berdasarkan referensi, ada yang menuliskan r dan ada yang
menuliskan R, r adalah nilai koefisien hasil uji korelasi
Pearson Product Moment atau ρ pada uji Rank Spearman),
maka dapat dituliskan r2 atau R2. Nilai koefisien determinasi
merupakan nilai yang menggambarkan seberapa besar
71
kontribusi variabel bebas dalam mempengaruhi variabel
terikat. Nilai koefisien determinasi adalah kuadrat dari nilai r
atau r2, nilai koefisien determinasi disajikan dalam satuan
persen (%), misalkan hasil uji korelasi Pearson Product
Moment Pearson menghasilkan nilai r = 0,852; maka nilai
koefisien determinasi adalah r2 = 0,852 x 0,852 = 0,726.
Dengan demikian variabel bebas memberikan kontribusi untuk
mempengaruhi variabel terikat sebesar 0,726; karena
disajikan dalam persen, maka koefisien determinasinya
adalah 0,726 x 100% = 72,6%. Oleh karena yang
mempengaruhi variabel terikat selain variabel bebas adalah
variabel pengganggu yang tidak dijelaskan dalam uji statistik,
maka variabel pengganggu ini bisa disebut juga variabel lain.
Dengan demikian dapat dijelaskan bahwa besar variabel
bebas mempengaruhi variabel terikat sebesar 72,6%,
sedangkan besar variabel lain yang juga mempengaruhi
variabel terikat tetapi tidak dijelaskan dalam uji korelasi ini,
adalah sebesar 100% – 72,6% = 27,4%. Semakin besar nilai
koefisien determinasi (mendekati 100%), maka semakin
menguatkan dugaan variabel bebas dapat mempengaruhi
variabel terikat (variabel bebas dominan), pengaruh variabel
penganggu lebih kecil. Sebaliknya jika nilai koefisien
determinasi kecil (mendekati 0%), maka semakin
memperlemah dugaan variabel bebas tidak dapat
mempengaruhi variabel terikat (variabel bebas tidak dominan),
pengaruh variabel penganggu lebih besar.
72
B.Contoh Data Hasil Penelitian
Contoh data yang akan disajikan di bawah ini adalah data
bukan dari hasil penelitian sebenarnya, hanya sebagai contoh
saja. Mengenai jumlah data pada penelitian yang
sesungguhnya, harus disertai dengan perhitungan jumlah
sampel minimal sesuai dengan teknik samplingnya. Pada
metode pengambilan sampel secara random sebaiknya
menggunakan rumus penentuan minimal sampel yang
tersedia, sedangkan penentuan jumlah sampel non random
disesuaikan dengan teknik yang digunakan. Jadi sekali lagi
mengingatkan bahwa jumlah sampel pada contoh ini belum
tentu sesuai dengan jumlah minimal sampel, sehingga pada
penelitian sesungguhnya penentuan jumlah sampel sesuai
metode sampling yang dipilih.
Data akan dianalisis menggunakan uji Pearson Product
Moment dan Rank Spearman. Misalkan, judul penelitiannya
adalah ‘Hubungan antara Stres dengan Kadar Gula Darah
pada Ibu Rumah Tangga di Semarang’. Stres diukur
menggunakan kuesioner stres dan kadar gula darah diukur
menggunakan glucometer. Pengukuran kedua variabel
tersebut menghasilkan data lapangan seseperti tersaji pada
tabel 4.3.
Pada contoh data yang disajikan, sesuai dengan alat ukur
variabel masing-masing, berdasarkan data hasil pengukuran
lapangan (data hasil penelitian), diinformasikan:
1. Variabel stres diukur dengan menggunakan kuesioner DASS-42.
Pada kuesioner DASS-42, stres diukur menggunakan 14
pertanyaan/pernyataan dengan pilihan jawaban ada 4 yaitu 0, 1,
73
2, dan 3. Dengan demikian skor jawaban terendah adalah 0 (jika
responden memilih pilihan jawaban 0 semua, 0 x 14 = 0) dan
jawaban tertinggi adalah 42 (jika responden memilih pilihan
jawaban 3 semua, 3 x 14 = 42). Jadi skor stres pada range
antara 0 s/d 42.
2. Pada variabel kadar gula darah puasa yang diukur dengan
menggunakan glucometer dengan satuan hasil pengukuran
adalah mg/dL.
Contoh-contoh cara menguji dan interpretasi hasil uji
statistik yang akan disampaikan pada Bab ini, perhitungan
menggunakan software analisis statistik. Software analisis
statistik dalam contoh ini menggunakan software SPSS versi
23.
Tabel 4.3. Hasil pengukuran stres dan kadar gula darah

No. Sbj. Skor Stres Kadar Gula darah puasa (mg/dL)
1 6 130
2 19 110
3 24 192
4 12 80
5 10 82
6 22 123
7 20 175
8 14 93
9 20 180
10 25 103
11 15 120
12 21 161
13 16 100
14 10 97
15 11 116
74
C.Uji Korelasi Pearson Product Moment
Contoh Uji korelasi Pearson Product Moment dalam
contoh ini diambil dari data tabel 4.3. Sebelum melalukan uji,
terlebih dahulu diidentifikasi informasi yang berhubungan
dengan uji korelasi Pearson Product Moment sebagai berikut:
Judul = Hubungan antara Stres dengan Kadar Gula
Darah pada Ibu Rumah Tangga di
Semarang.
Variabel bebas = Stres, merupakan data numerik dengan
skala pengukuran interval.
Variabel terikat = Kadar gula darah, merupakan data
numerik dengan skala pengukuran interval.
Syarat uji korelasi Person Product Moment adalah jenis
data numerik (rasio, interval) dan datanya berdistribusi normal.
Pada contoh data hasil pengukuran, diinformasikan:
1. Data lapangan sudah berupa data numerik, sehingga tidak perlu
pengkategorian.
2. Terlebih dahulu dilakukan uji normalitas data (karena uji Pearson
Product Moment merupakan jenis analisis statistik Parametrik,
jenis data rasio atau interval).
Uji normalitas data, menurut referensi ada dua macam, yaitu uji
normalitas dilakukan pada data kedua variabel dan uji normalitas
data hanya dilakukan pada data residual. Pada Bab ini akan
dicontohkan kedua cara menguji normalitas tersebut.
Nilai Residual adalah selisih antara nilai duga (predicted value)
dengan nilai pengamatan sebenarnya apabila data yang
digunakan adalah data sampel.
75
Predicted value adalah nilai duga yang dihasilkan dari model
regresi yang diperoleh. Misal model regresi yang diperoleh: Y = 5
+ 2X. Jika nilai X = 1, maka predicted value dalam model regresi
ini adalah y = 5 + (2 x 1) = 7.
Langkah-langkah uji Product Moment Pearson pada
contoh data di atas, sebagai berikut:
Langkah 1. Input nama Variabel dan data ke SPSS

1. Input Nama Variabel, dilakukan pada Variable View
2. Input Data Variabel, dilakukan pada Data View
76
Langkah 2. Uji Normalitas
1. Uji Normalitas data kedua variabel
 Klik Analyze  Descriptive Satistics  Explore, lalu Klik,
muncul kotak dialog Explore.
 Pada kotak dialog Explore, masukkan variabel Skor Stres

dan Kadar Gula Darah ke kotak Dependent List.
 Klik Plots, muncul kotak dialog Explore: Plots, beri tanda

centang pada Normality plots with test.
77
 Klik Continue, Klik OK
 Pada output, pilih output Tests of Normality
 Pada output hasil uji normalitas, tersaji nilai Kolmogorov-

Smirnov (dibaca bila jumlah data > 50) dan Saphiro-Wilk
(dibaca bila jumlah data ≤ 50). Oleh karena jumlah data = 15
atau kurang dari 50, maka yang dibaca adalah Saphiro-Wilk.
Interpretasi uji normalitas adalah:
a. Data berdistribusi normal bila nilai Sig. > 0,05.
b. Data tidak berdistibusi normal bila nilai Sig. < 0,05.
Pada output hasil uji normalitas semuanya menghasilkan
nilai Sig. > 0,05 pada kedua variabel, yaitu:
a. Stres (0,661 > 0,05), berarti berdistribusi normal.
b. Kadar gula darah puasa (0,093 > 0,05), berarti
berdistribusi normal.
 Kesimpulan uji normalitas menghasilkan kedua data variabel
(Stres dan Kadar gula darah) berdistribusi normal, maka
78
memenuhi syarat untuk dilanjutkan menggunakan uji
korelasi Pearson Product Moment.
2. Uji normalitas data residual

 Klik Analyze  Regression  Linear, lalu Klik, muncul kotak
dialog Linear Regression.
 Pada kotak dialog Linear Regression, masukkan Skor stres

ke kotak Independent(s) dan Kadar gula darah ke kotak
Dependent.
 Klik Save, muncul kotak dialog Linear Regression: Save.

Pada Residuals berikan centang pada Unstandardized.
79
 Klik Continue, Klik OK
 Tidak perlu memperhatikan output, tapi perhatikan
munculnya variabel baru beserta datanya dengan nama
RES_1.
80
 Lakukan proses uji normalitas seperti pada contoh
sebelumnya, hanya saja yang diuji normalitas adalah data
pada variabel baru yaitu variabel Unstandardized Residual
(RES_1).
 Jika langkah-langkahnya sudah benar, maka akan muncul
output uji normalitas Unstandardized Residual (RES_1),
sebagai berikut:
 Pembacaan seperti hasil pada contoh sebelumnya. Dari

hasil uji diperoleh nilai Sig. = 0,094, dengan demikian data
residual berdistribusi normal karena nilai Sig. melebihi 0,05
(0,094 > 0,05).
Langkah 3. Melakukan Uji Product Moment Pearson

Uji asumsi normalitas data sudah terpenuhi, yaitu data
berdistribusi normal, maka dapat dilanjutkan uji korelasi
Pearson Product Moment, sebagai berikut:
 Klik Analyze  Correlate  Bivariate..., lalu Klik, muncul kotak
dialog Bivariate Correlations.
81
 Pada kotak dialog Bivariate Correlations, masukkan variabel
Skor Stres dan Kadar gula darah ke kotak Variables.
 Pada Correlation Coefficients dicentang pada Pearson (sudah
default, jadi tidak perlu diubah; Jika menggunakan uji lain,
maka centang tinggal dipindah).
 Klik OK. Lihat output.
82
 Dari output tersebut diperoleh informasi hasil uji Pearson
Produvt Moment (r) sebagai berikut:
1) Nilai r bertanda positif.
2) Nilai r = 0,532.
3) Nilai p atau p value = 0,041 (p = 0,041).
4) Jumlah sampel (n) = 15 sampel.
 Interpretasi hasil uji Pearson Product Moment adalah:
1) Signifikansi
Apakah ada hubungan antara Stres dengan Kadar gula
darah pada Ibu Rumah Tangga di Semarang? Untuk
menjawab signifikan atau tidak berdasarkan 2 cara, yaitu:
a. Membandingkan nilai rhitung dengan nilai kritis r tabel 5%
(rt5%). Apabila nilai rhitung > nilai rt5%, maka hasilnya
signifikan, berarti ada hubungan antara kedua variabel.
Sebaliknya, jika nilai rhitung < nilai rt5%, maka hasilnya tidak
signifikan, berarti tidak ada hubungan antara kedua
variabel.
b. Membandingkan nilai p (p value) dengan nilai kritis pada
α = 0,05.
Interpretasi nilai p:
1) Jika nilai p < 0,05, maka dinyatakan signifikan
(menolak H0, menerima Ha), berarti ada hubungan
antara kedua variabel.
83
2) Jika nilai p > 0,05, maka hasilnya tidak signifikan
(menerima H0, menolak Ha), berarti tidak ada
hubungan antara kedua variabel.
Dalam contoh ini hanya digunakan cara kedua (b),
yaitu dengan membandingkan nilai p dengan nilai α =
0,05. Hasilnya menunjukkan, nilai p < 0,05 (0,041 <
0,05), maka hasilnya dinyatakan signifikan (menolak
H0, menerima Ha), yang berarti ada hubungan antara
Stres dengan Kadar gula darah.
2) Arah korelasi
Nilai korelasi bertanda positif (r = +0,532), maka
meningkatnya skor Stres akan menyebabkan meningkatnya
nilai Kadar gula darah.
3) Kekuatan korelasi
Kekuatan korelasi dapat dilihat pada tabel 4.2. Nilai r = 0,532
terletak antara 0,40 s/d 0,50 dengan kategori kekuatan uji
“Cukup kuat”.
4) Koefisien determinasi
Koefisien determinasi dihitung dari nilai r dikuadratkan (r 2), r2
= 0,532 x 0,532 = 0,283. Besarnya pengaruh Stres terhadap
Kadar gula darah, atau variabel Stres dapat menjelaskan
variasi nilai pada Kadar gula darah sebesar 0,283 x 100% =
28,3%, sedangkan faktor lain yang tidak dijelaskan dalam
penelitian ini adalah 100% – 28,3% = 71,7%.
Langkah 4. Melaporkan hasil uji Pearson Product Moment

Ketika uji statistik sudah dilakukan menggunakan SPSS,
maka hal penting adalah menyajikan secara informatif hasil uji
tersebut. Jika output hasil uji Pearson Product Moment di
copy-paste pada saat penyajian data, hal tersebut kurang
84
informatif. Oleh karena itu output hasil uji Pearson Product
Moment pada contoh uji di atas, secara ringkas dapat
disajikan seperti pada tabel berikut ini.
Tabel 4.4. Cara menyajikan hasil uji Pearson Product Moment

Variabel Kadar gula darah
Stres r 0,532
p 0,041
n 15
Keterangan:
 r adalah nilai koefisien korelasi Pearson Product Moment.
 p adalah nilai kesalahan yang diperoleh peneliti dari hasil
perhitungan uji statistik. Nilai p merupakan besarnya peluang
(probabilitas) untuk menerima atau menolak H o.
 n adalah jumlah sampel/ jumlah responden penelitian.
D.Uji Korelasi Rank Spearman
Uji Rank Spearman bisa juga disebut dengan uji
Spearman Rho. Seperti pada contoh Uji Pearson Product
Moment dalam contoh uji Rank Spearman juga menggunakan
data tabel 4.3. Identifikasi informasi variabel sama dengan uji
korelasi Pearson Product Moment; hanya saja pada contoh uji
Rank Spearman ini, diandaikan saja, kalau distribusi data
tidak normal (andaikan dalam uji normalitas disimpulkan
bahwa salah satu atau kedua data tidak berdistrubusi normal,
nilai Sig. < 0,05). Dengan demikian, ketika diperoleh pada uji
normalitas salah satu atau kedua data dinyatakan tidak
berdistribusi normal, maka uji yang lebih tepat menggunakan
uji Rank Spearman.
Langkah-langkah pada uji Rank Spearman pada
85
prinsipnya seperti langkah-langkah uji korelasi Product
Moment Pearson. Pada contoh ini tidak disajikan gambar
lengkap seperti pada langkah-langkah uji korelasi Product
Moment Pearson, oleh karena itu silahkan melakukan sendiri
langkah-langkahnya:
 Input Nama variabel dan Data variabel ke SPSS.
 Lakukan uji normalitas  Diandaikan saja hasil uji data tidak
berdistribusi normal (nilai Sig. < 0,05).
 Lakukan uji Rank Spearman, Analyze  Correlate  Bivariate
 masukkan nama variabel ke kotak Variables.
 Selanjutnya, pada Correlation Coefficients hilangkan centang
yang terdapat pada Pearson, pindahkan/ganti centang pada
Spearman.
 Lalu, Klik OK, muncul output:
86
 Cara menginterpretasi hasil uji Rank Spearman pada
prinsipnya sama dengan cara interpretasi uji Pearson Product
Moment (lihat kembali cara interpretasi uji Pearson Product
Moment), hanya simbolnya saja yang berbeda, yaitu r untuk uji
Pearson Product Moment dan ρ untuk uji Rank Spearman. Dari
output uji Rank Spearman diperoleh informasi sebagai berikut:
1) Nilai ρ bertanda positif.
2) Nilai ρ = 0,517.
3) Nilai p atau p value = 0,048 (p = 0,048).
4) Jumlah sampel (n) = 15 sampel.
 Interpretasi terhadap hasil uji korelasi Rank Spearman adalah:
1) Signifikansi
Hasil uji menunjukkan nilai p < 0,05 (0,048 < 0,05),
maka hasilnya dinyatakan signifikan, yang berarti ada
hubungan antara Stres dengan Kadar gula darah.
2) Arah korelasi
Nilai korelasi bertanda positif (ρ = +0,517), maka dapat
dinyatakan meningkatnya Stres akan diikuti oleh
meningkatnya Kadar gula darah.
3) Kekuatan korelasi
Kekuatan korelasi dapat dilihat pada tabel 4.2. Nilai r = 0,517
terletak antara 0,40 s/d 0,50 dengan kategori kekuatan uji
“Cukup kuat”.
4) Koefisien determinasi
87
Koefisien determinasi diperoleh ρ2 = 0,517 x 0,517 = 0,267.
Besarnya pengaruh Stres terhadap Kadar gula darah, atau
variabel Stres dapat menjelaskan variasi nilai pada Kadar
gula darah sebesar 0,267 x 100% = 26,7%, sedangkan
faktor lain yang tidak dijelaskan dalam penelitian ini adalah
100% – 26,7% = 73,3%.
Langkah 4. Menyajikan hasil uji Rank Spearman

Seperti pada penyajian output hasil uji Pearson Product
Moment, maka hasil uji Rank Spearman penyajiannya jangan
di copy-paste. Contoh penyajian data hasil uji Rank Spearman
pada contoh uji di atas, seperti pada tabel berikut ini.
Tabel 4.4. Menyajikan hasil uji Rank Spearman

Variabel Kadar gula darah
Stres ρ 0,532
p 0,041
n 15
Keterangan:
 ρ adalah nilai koefisien korelasi Rank Spearman.
(probabilitas) yang diamati dari uji statistik untuk menerima atau
menolak Ho.
 n adalah jumlah sampel/ jumlah responden penelitian.
Pertanyaan latihan
15. Apa persamaan dan perbedaan antara uji Pearson Product
Moment dan Rank Spearman?
88
16. Apa yang dimaksud dengan statistik parametrik?
17. Buatlah contoh data untuk diuji dengan uji Pearson Product
Moment, lalu lakukan ujinya menggunakan SPSS dan
interpretasikan hasilnya!
18. Buatlah contoh data untuk diuji dengan uji Rank Spearman,
lalu lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
Gale, L. (2015) ‘Social Work Practice & Skill, Anxiety and

Depression Assessment: Using the Depression Anxiety Stress
Scales.’ Available at: https://www.ebscohost.com/assets-
sample-
content/Anxiety_and_Depression_Assessment_SWPS.pdf.
Kent State University (2020) ‘SPSS Tutorials: Pearson Correlation’.
Available at:
https://libguides.library.kent.edu/SPSS/PearsonCorr.
Laerd Statistics (2020b) ‘Spearman’s Rank-Order Correlation using
SPSS Statistics’. Available at: https://statistics.laerd.com/spss-
tutorials/spearmans-rank-order-correlation-using-spss-
statistics.php.
Soelistijo, S. A. et al. (2015) ‘Konsensus Pengelolaan dan
Pencegahan Diabetes Melitus Tipe 2 di Indonesia 2015’.
Available at: https://pbperkeni.or.id/wp-
content/uploads/2019/01/4.-Konsensus-Pengelolaan-dan-
Pencegahan-Diabetes-melitus-tipe-2-di-Indonesia-PERKENI-
2015.pdf.
89
90
BAB V
ANALISIS KORELASI DATA KATEGORIK

Tujuan Pembelajaran
Somers’d.
Koefisien Kontingensi (C).
Ringkasan
Analisis korelasi data kategorik dapat menggunakan uji
Somers’d (untuk skala pengukuran data ordinal) dan Koefisien
Kontingensi (C) (untuk skala pengukuran data nominal).
Keduanya merupakan uji statistik yang bertujuan untuk
menentukan hubungan antara 2 variabel (variabel bebas dan
variabel terikat). Bab ini memberikan pengalaman belajar
kepada mahasiswa berupa cara menginput data kedua uji
tersebut ke software SPSS (Statistical Product and Service
Solutions), cara melakukan uji Somers’d dan Koefisien
Kontingensi (C), serta cara melakukan interpretasi hasil uji
sehingga dapat menyimpulkan hasil analisisnya.
91
Pesan dalam Belajar
karena penjelasan disajikan secara berurutan. Pemahaman
skala pengukuran data variabel juga dianjurkan untuk lebih
dipahami lagi agar dapat membedakanya dalam memilih uji
statistik yang tepat. Materi Bab V berkaitan dengan Bab IV,
oleh karena itu mahasiswa sangat perlu memahami lagi Bab
IV. Pada akhir pembelajaran, penting untuk mencoba
Materi Belajar
A. Pengantar Analisis Korelasi Data Kategorik

Statistika non parametrik merupakan bagian analisis
statistika yang tidak perlu persyaratan uji normalitas. Analisis
statistik korelasi yang termasuk dalam statistika non
parametrik, juga memberikan gambaran tentang derajat
keeratan hubungan antar variabel, yang dinamakan koefisien
korelasi (the correlation coefficient) seperti juga pada statistika
parametrik. Jika data hasil pengukuran/ pengamatan adalah
data ordinal, maka analisis korelasi untuk mengujinya dapat
menggunakan uji Somers’d, dan apabila data hasil
pengukuran/ pengamatan adalah data kategorik, maka
analisis korelasinya dapat menggunakan uji Koefisien
92
Kontingensi (Contingency Coefficient).
B. Uji Korelasi Somers’d

Untuk memahami uji Somers’d dan Koefisien Kontingensi
(C) perlu memahami juga materi Bab IV tentang uji Pearson
Product Moment dan uji Rank Spearman. Seperti juga pada
kedua uji tersebut (uji Pearson Product Moment dan uji Rank
Spearman), contoh uji Somers’d juga menggunakan data tabel
4.3 pada Bab IV. Hanya saja yang membedakan, pada contoh
uji sebelumnya data dibiarkan saja dari hasil pengukuran
lapangan (karena data tersebut sudah numerik), maka pada
uji korelasi Somers’d ini data akan dikategorikan secara
bertingkat karena dipersyaratkan datanya berskala
pengukuran Ordinal (Ordinal kategorik). Berbeda dengan data
pada uji Rank Spearman, karena data uji Rank Spearman
merupakan data ordinal numerik (atau data numerik yang
distribusi datanya tidak normal).
Untuk pengkategorian/ pemeringkatan variabel Stres
sebagai berikut:
1. Pengkategorian Stres menggunakan kuesioner DASS-42
berdasarkan jumlah skor jawaban adalah:
a. 0 – 14 = Tidak stres
b. 15 – 18 = Stres Ringan
c. 15 – 25 = Stres Sedang
d. 26 – 33 = Stres Berat
e. ≥ 34 = Stres Sangat Berat
Informasi data tabel 4.3 pada Bab IV, skor Stres
terendah = 6 dan tertinggi = 25. Berdasarkan
93
pengelompokan kategorinya, kategori paling tinggi adalah
Stres Sedang, dan paling rendah adalah Tidak Stres.
Dalam hal ini, kode kategori (sekaligus untuk koding di
SPSS), ada 3 yaitu:
a. Kategori Stres Sedang, diberikan kode 1.
b. Kategori Stres Ringan, diberikan kode 2.
c. Kategori Tidak Stres, diberikan kode 3.
2. Pengkategorian Kadar gula darah berdasarkan pengukuran
kadar gula darah puasa yang diukur menggunakan Glucometer,
sebagai berikut:
a. Kategori Diabetes, jika kadar gula darah > 126 mg/dL
b. Kategori Prediabetes, jika kadar gula darah antara 100 – 125
mg/dL
c. Kategori Normal, jika kadar gula darah < 100 mg/dL
Informasi data tabel 4.3 pada Bab IV, skor Kadar gula
darah puasa terendah = 80 mg/dL dan tertinggi = 192
mg/dL. Oleh karena itu, berdasarkan pengelompokan
kategorinya, ketegori paling tinggi adalah Diabetes, dan
paling rendah adalah Normal. Dalam hal ini, kategori
(sekaligus untuk koding di SPSS), ada 3 yaitu:
a. Karegori Diabetes, diberikan kode 1.
b. Kategori Prediabetes, diberikan kode 2.
c. Kategori Normal, diberikan kode 3.
Catatan:
Memberikan koding (untuk input ke SPSS) data ordinal
kategorik sebaiknya dimulai dari bobot kategori terbesar.
Kategori Stres diurutkan dari peringkat paling tinggi adalah
94
Stres Sedang (kode 1), diikuti oleh peringkat kedua yaitu
Stres Ringan (kode 2), dan peringkat terakhir adalah Tidak
Stres (kode 3). Demikian juga dengan kategori Kadar gula
darah, diurutkan kategori peringkat paling berat adalah
Diabetes (kode 1), diikuti peringkat kedua yaitu Prediabetes
(kode 2), dan peringkat terakhir adalah Normal (kode 3).
Setelah dilakukan pemeringkatan terhadap hasil
pengukuran kedua variabel (variabel Stres dan Kadar gula
darah), hasilnya dapat dilihat pada tabel 5.1.
Tabel 5.1. Kategori peringkat data variabel Stres dan Kadar

gula darah
Kode Gula darah Kategori Kode Kategori
No. Skor
Kategori Stres Kategori puasa Kadar gula Kadar gula
Sbj. Stres
Stres (mg/dL) darah Puasa darah puasa
1 6 Tidak Stres 3 130 Diabetes 1
2 19 Stres Sedang 1 110 Prediabetes 2
3 24 Stres Sedang 1 192 Diabetes 1
4 12 Tidak Stres 3 80 Normal 3
11 15 Stres Ringan 2 120 Prediabetes 2
13 16 Stres Ringan 2 100 Prediabetes 2
15 11 Tidak Stres 3 116 Prediabetes 2
Catatan:
Pada uji Somers’d, untuk input ke SPSS, data yang
diinputkan adalah data pada Kode Kategori Stres (kode 1,
2, dan 3) dan Kode Kategori Kadar gula darah puasa (kode
95
1, 2, dan 3).
Langkah-langkah pada uji korelasi Somers’d pada contoh

data menggunakan tabel 5.1, sebagai berikut:
Langkah 1. Input Nama Variabel dan Data Variabel ke

SPSS
1. Input Nama Variabel, dilakukan pada Variable View. Perhatikan
pada kolom Values:
a. Isikan kode variabel Stres, yaitu:
1 = Stres Sedang
2 = Stres Ringan
3 = Tidak Stres
b. Isikan kode variabel Kadar gula darah, yaitu:
1 = Diabetes
2 = Prediabetes
3 = Normal
96
2. Input Data Variabel, dilakukan pada Data View
Langkah 2. Uji Normalitas (tidak dilakukan)

Uji normalitas tidak dilakukan, karena uji Somers’d
merupakan jenis statistik non parametrik, sehingga tidak
memerlukan asumsi uji normalitas data.
Langkah 3. Melakukan Uji Korelasi Somers’d

 Klik Analyze  Descriptive Statistics  Crosstabs, lalu Klik,
muncul kotak dialog Crosstabs.
97
 Masukkan variabel Skor Stres ke kotak Row(s) dan Kadar gula
darah ke kotak Columnn(s).
 Klik Statistics, muncul kotak dialog Crosstabs: Statistics. Pada

Ordinal beri tanda centang pada Somers’d.
98
 Klik Continue, muncul kotak dialog Crosstabs lagi.
 Klik Cells, muncul kotak dialog Crosstabs: Cell Display. Pada
Percentage, Berikan tambahan centang pada Row.
 Klik Continue, lalu klik OK. Lihat output.

 Interpretasi terhadap hasil uji korelasi Somers’d adalah:
1) Deskripsi statistik
99
Interpretasi:
 Dari 15 orang responden, paling banyak kategori Stres
Sedang (7 orang), diikuti Tidak Stres (6 orang), dan
Stres Ringan (2 orang).
 Dari 15 orang responden, paling banyak mengalami
Prediabetes (6 orang), diikuti Diabetes (5 orang), dan
Normal (4 orang).
2) Hasil uji Somers’d
Catatan:
 Uji Somers’d dapat digunakan untuk hubungan antar
variabel yang sifatnya simetris maupun asimetris.
Notasi untuk korelasi Somers’d adalah dxy (jika Y
adalah variabel dependen), dan simbol d yx (jika X
adalah variabel dependen).
 Pada output uji Somers’d nilai p dilihat pada
Approximate Significance.
100
Interpretasi:
 Hasil uji Somers’d yang dibaca sesuai hipotesisnya.
Dalam penelitian ini, variabel Kadar gula darah
sebagai variabel dependen (variabel terikat), maka
yang dibaca hasilnya pada baris ‘Kadar Gula Darah
Puasa Dependent’. Keputusan uji sama kriterianya
dengan uji Pearson Product Moment dan Rank
Spearman, yaitu dengan membandingkan nilai p
dengan α = 0,05, yaitu:
1) Jika p < 0,05 maka hasilnya signifikan (menolak
H0, menerima Ha), berarti ada hubungan antar
variabel.
2) Jika p > 0,05 maka hasilnya tidak signifikan
hubungan antar variabel.
Pada output uji Somers’d nilai p (Approximate
Significance), nilai p = 0,002. Oleh karena p <
0,05 (0,002 < 0,05), maka hasilnya signifikan
(menolak H0, menerima Ha), berarti ada hubungan
antara Stres dengan Kadar gula darah pada Ibu
Rumah Tangga di Semarang.
Langkah 4. Menyajikan Hasil Uji Korelasi Somers’d

Seperti pada uji Pearson Product Momen dan Rank Spearman
(lihat Bab IV) yang penyajian disajikan secara informatif, maka
penyajian hasil uji Somers’d seperti pada tabel berikut.
101
Tabel 5.2. Cara menyajikan hasil uji Somers’d
Kadar gula darah
Jumlah
Diabetes Prediabetes Normal dxy p
n % n % n % n %
Stres Stres Sedang 4 57,1 3 42,9 0 0,0 7 100 0,632 0,002
Stres Ringan 0 0,0 2 100,0 0 0,0 7 100
Tidak Stres 1 16,7 1 16,7 4 66,7 6 100
Jumlah 5 33,3 6 40,0 4 26,7 15 100
Keterangan:
 n adalah nilai frekuensi hasil pengukuran/ pengamatan.
 % adalah persentase n berdasaran penghitungan nilai frekuensi
hasil pengukuran/ pengamatan.
 dxy adalah nilai koefisien korelasi Somers’d.
menolak Ho.
C.Uji Korelasi Koefisien Kontingensi (C)

Uji Koefisien Kontingensi (C), merupakan uji statistik untuk
menganalisis keeratan hubungan antar variabel yang
tergolong jenis statistik non parametrik menggunakan data
berskala nominal. Uji Koefisien Kontingensi (C) berkaitan erat
dengan uji Chi Square. Nilai hasil uji Koefisien Kontingensi (C)
berkisar antara 0 sampai dengan 1 yang menunjukkan
keeratan hubungan antara 2 variabel yang diuji (variabel
bebas dan variabel terikat). Ketika angka korelasi mendekati
1, maka korelasi antara kedua variabel semakin kuat,
sebaliknya jika angka korelasi mendekati 0, maka korelasi
kedua variabel semakin lemah.
Seperti pada contoh uji korelasi Somers’d, data pada
102
contoh uji Koefisien Kontingensi (C) menggunakan data tabel
4.3 pada Bab IV. Hanya saja yang membedakan, data
numerik yang ada pada tabel tersebut diubah terlebih dulu ke
data nominal. Untuk kode (angka kode digunakan juga untuk
input ke SPSS) sebagai berikut:
1. Kategori Stres menggunakan kuesioner DASS-42 berdasarkan
jumlah skor jawaban bisa dilihat kembali pada sub judul Uji
Korelasi Somers’d. Pada contoh ini, karena skala data adalah
nominal, maka stres tersebut dikategorikan menjadi 2, yaitu:
Stres dan Tidak Stres, dengan kode:
a. Kode 1, adalah kode untuk kategori Stres, Jika Jumlah
Skor > 14 – 42 (termasuk dalam kategori ini adalah Stres
Ringan, Sedang, Berat, Sangat Berat).
b. Kode 2, adalah kode untuk kategori Tidak Stres, Jika
jumlah skor 0 – 14.
2. Kategori kadar gula darah berdasarkan pengukuran Kadar gula
darah puasa yang diukur menggunakan Glucometer, bisa
dilihat kembali pada sub judul uji Korelasi Somers’d. Pada
contoh ini, seperti pada variabel Stres, maka variabel Kadar
gula darah juga dikategorikan menjadi 2, yaitu kategori
Diabetes dan kategori Tidak Diabetes. Selanjutnya diberikan
koding:
a. Kode 1, adalah kode untuk kategori Diabetes, Jika nilai
Kadar Gula Darah ≥ 100 mg/dL (termasuk dalam kategori
ini adalah Diabetes dan Prediabetes).
b. Kode 2, adalah kode untuk kategori Tidak Diabetes, Jika
nilai kadar Gula Darah < 100 mg/dL.
Setelah dilakukan koding terhadap hasil pengukuran

kedua variabel, hasilnya dapat dilihat pada tabel 5.3.
103
Tabel 5.3. Kategori Stres dan Kadar gula darah
Kode Gula darah Kategori Kadar Kode Kategori
No. Skor Kategori
Kategori puasa gula darah Kadar gula
Sbj. Stres Stres
Stres (mg/dL) Puasa darah puasa
2 19 Stres 1 110 Diabetes 1
4 12 Tidak Stres 2 80 Tidak Diabetes 2
Catatan:
Seperti uji Somers’d, pada uji Koefisien Kontingensi (C), untuk
input ke SPSS, data yang diinputkan adalah Kode Kategori
Stres (kode 1 dan 2) dan Kode Kategori Kadar gula darah
(kode 1 dan 2).
Langkah-langkah uji Koefisien Kontingensi (C)

menggunakan contoh data menggunakan tabel 5.3, sebagai
berikut:
Langkah 1. Input nama Variabel dan data ke SPSS

1. Input Nama Variabel, dilakukan pada Variable View. Perhatikan
pada kolom Values:
a. Isikan kode variabel Stres, yaitu:
1 = Stres
2 = Tidak Stres
104
b. Isikan kode variabel Kadar gula darah, yaitu:
1 = Diabetes
2 = Tidak Diabetes
2. Input Data, dilakukan pada Data View
105
Langkah 2. Uji Normalitas (tidak dilakukan)
Uji normalitas tidak dilakukan, karena uji Koefisien
Kontingensi (C) merupakan jenis statistik non parametrik,
sehingga tidak memerlukan asumsi uji normalitas data.
Langkah 3. Melakukan Uji Koefisien Kontingensi (C)

 Klik Analyze  Descriptive Statistics  Crosstabs, lalu Klik,
muncul kotak dialog Crosstabs.
 Masukkan variabel Skor Stres ke kotak Row(s) dan Kadar gula

darah ke kotak Columnn(s).
106
 Klik Statistics, muncul kotak dialog Crosstabs: Statistics. Pada
Nominal beri tanda centang pada Contingency Coefficient.
 Klik Continue, muncul kotak dialog Crosstabs lagi.

 Klik Cells, muncul kotak dialog Crosstabs: Cell Display. Pada
Percentage, Berikan tambahan centang pada Row.
107
 Klik Continue, lalu klik OK. Lihat output.
 Interpretasi terhadap hasil uji Koefisien Kontingensi (C) adalah:
1) Deskripsi statistik
Interpretasi:
 Dari 15 orang responden, yang mengalami stres (9
orang) lebih banyak daripada tidak stres (6 orang).
 Dari 15 orang responden, mengalami Diabetes (11
orang) lebih banyak daripada tidak diabetes (4 orang).
2) Hasil uji Koefisien Kontingansi C
108
Interpretasi:
 Keputusan uji Koefisien Kontingensi C sama
kriterianya dengan uji sebelumnya, dengan
membandingkan nilai p dengan α = 0,05, yaitu:
1) Jika p < 0,05 maka hasilnya signifikan (menolak
H0, menerima Ha), berarti ada hubungan antar
variabel.
2) Jika p > 0,05 maka hasilnya tidak signifikan
hubungan antar variabel.
Pada output uji Koefisien Kontingensi (C) nilai p
dilihat pada Approximate Significance, dengan nilai p =
0,004. Oleh karena p < 0,05 (0,004 < 0,05), maka
hasilnya signifikan (menolak H0, menerima Ha), berarti
ada hubungan antara Stres dengan Kadar gula darah
pada Ibu Rumah Tangga di Semarang.
Langkah 4. Menyajikan Hasil Uji Koefisien Kontingensi

(C)
Seperti pada penyajian hasil uji Pearson Product Moment,
Rank Spearman (lihat Bab IV), dan Somers’d yang informatif, maka
penyajian hasil uji Koefisien Kontingensi (C) seperti pada tabel
berikut.
109
Tabel 5.4. Cara menyajikan hasil uji Kontingensi Koefisien (C)
Kadar gula darah
Jumlah
Diabetes Tidak diabetes C p
n % n % n %
Stres Stres 9 100,0 0 0,0 9 100 0,594 0,004
Tidak Stres 2 33,3 4 66,7 6 100
Jumlah 11 73,3 4 26,7 15 100
Keterangan:
 n adalah nilai frekuensi hasil pengukuran/ pengamatan.
 % adalah persentase n berdasaran penghitungan nilai frekuensi
hasil pengukuran/ pengamatan.
 C adalah nilai koefisien korelasi Koefisien Kontingensi (C)
menolak Ho.
Pertanyaan latihan
1. Apa persamaan dan perbedaan antara uji Somers’d, dan
Koefisien Kontingensi (C)?
2. Apa yang dimaksud dengan statistik non parametrik?
3. Buatlah contoh data untuk diuji dengan uji Somers’d, lalu lakukan
ujinya menggunakan SPSS dan interpretasikan hasilnya!
4. Buatlah contoh data untuk diuji dengan uji Koefisien Kontingensi
(C), lalu lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
Gale, L. (2015) ‘Social Work Practice & Skill, Anxiety and
Depression Assessment: Using the Depression Anxiety Stress
Scales.’ Available at: https://www.ebscohost.com/assets-
110
sample-
content/Anxiety_and_Depression_Assessment_SWPS.pdf.
Laerd Statistics (2020a) ‘Somers’ d using SPSS Statistics’.

Available at: https://statistics.laerd.com/spss-tutorials/somers-
d-using-spss-statistics.php.
Schenkelberg, F. (2020) ‘Contingency Coefficient’. Available at:

https://accendoreliability.com/contingency-coefficient/.
Soelistijo, S. A. et al. (2015) ‘Konsensus Pengelolaan dan

Pencegahan Diabetes Melitus Tipe 2 di Indonesia 2015’.
Available at: https://pbperkeni.or.id/wp-
content/uploads/2019/01/4.-Konsensus-Pengelolaan-dan-
Pencegahan-Diabetes-melitus-tipe-2-di-Indonesia-PERKENI-
2015.pdf.

111
112
BAB VI
ANALISIS KOMPARATIF DATA NUMERIK 2
SAMPEL TIDAK BERPASANGAN
Dr. Siti Thomas Zulaikhah, S.KM, M.Kes*

*Bagian IKM Fakultas Kedokteran, Universitas Islam Sultan Agung (UNISSULA)
Semarang
*e-mail: sitithomas@unissula.ac.id
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji t-
tidak berpasangan dan menginterpretasikan hasil uji
Mann-Whitney dan menginterpretasikan hasil uji
Ringkasan
Analisis komparatif data numerik 2 sampel tidak berpasangan
merupakan uji statistik yang bertujuan untuk mengetahui perbedaan
mean/rerata 2 kelompok data yang tidak berpasangan
(independen). Bab ini memberikan pengalaman belajar kepada
mahasiswa mulai dari entry data ke software SPSS (Statistical
Product and Service Solutions), melakukan uji normalitas
data, melakukan uji dengan t-tidak berpasangan dan uji
Mann-Whitney serta cara melakukan interpretasi hasil uji
sehingga dapat menyimpulkan hasil analisisnya.
Pesan dalam Belajar

113
Bab. Pada akhir pembelajaran, jawablah pertanyaan-
pertanyaan pada latihan untuk menguji seberapa besar
pengetahuan dan pemahaman dari mempelajari Bab ini.
Materi Belajar
A. Pengantar Analisis Komparatif data numerik

2 sampel tidak berpasangan
Analisis komparatif data numerik 2 sampel tidak
berpasangan merupakan uji statistik yang membandingkan
mean/rerata 2 kelompok data yang tidak berpasangan. Pada
umumnya menggunakan judul/tema perbandingan atau
perbedaan, sebagai contoh “Perbedaan rerata kadar TNF-α
antar kelompok perokok dan bukan perokok”. Dari judul ini
maka data dapat dianalisis menggunakan uji statistik yaitu uji
beda rerata 2 kelompok data yang tidak berpasangan.
Variabel kadar TNF-α mempunyai skala pengukuran numerik,
sementara perokok dan bukan perokok mempunyai skala
pengukuran kategorik dikotom. Hubungan antar variabel
numerik dan kategorik bisa dianalisis menggunakan korelatif
atau komparatif. Pemilihan korelatif atau komparatif
tergantung keluaran yang diinginkan. Apabila keluaran yang
diinginkan adalah koefisien korelasi, kita harus memilih
metode korelasi. Sementara, bila keluaran yang dinginkan
adalah konsep selisih atau perbandingan, kita harus memilih
114
metode komparatif. Contoh perbandingan adalah odds rasio
(OR), risiko relatif (RR). Sementara contoh selisih adalah
selisih proporsi, selisih rerata dan lain-lain. Dari contoh judul di
atas keluaran yang diinginkan adalah selisih rerata kadar
TNF-α maka yang paling tepat menggunakan analisis
komparatif, jumlah kelompok 2 (perokok dan bukan perokok)
sehingga dapat dikatakan komparatif numerik tidak
berpasangan 2 kelompok. Asumsi dasar atau persayaratan
melakukan uji t-tidak berpasangan data numerik (skala
unterval atau rasio) dalam penelitian, dapat dilihat dari
distribusi dan varian data, yaitu:
1. Apabila distribusi /sebaran data normal dan varian sama
(homogen) gunakan uji t-tidak berpasangan dengan
menggunakan equal varian assumed.
2. Apabila distribusi /sebaran data normal tetapi varian
berbeda (tidak homogen) gunakan uji t-tidak berpasangan
dengan menggunakan equal varian not assumed.
3. Apabila distribusi /sebaran data tidak normal, lakukan
transformasi, analisis yang dilakukan tergantung pada
sebaran dan varian hasil transformasi.
4. Apabila distribusi /sebaran data tidak normal, gunakan uji
Mann-Whitney
Di bawah ini adalah contoh skenario untuk memahami isi

bab ini:
Untuk memenuhi salah satu syarat dalam menyelesaikan
Pendidikan Sarjana Kedokteran, maka semua mahasiswa
115
diwajibkan menyusun skripsi. Salah satu judul skripsi mahasiswa
adalah “Perbedaan rerata kadar TNF-α antara perokok dan non
perokok”. Data yang diperoleh sebanyak 80 yang berasal dari 40
kelompok perokok dan 40 non perokok.Untuk menentukan uji
hipotesis/uji statistik, maka harus dilakukan melalui langkah-langkah
sebagai berikut:
1. Menetapkan hipotesis
Hipotesis dalam statistik ada 2 jenis yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha)
a. Hipotesis Nol (Ho)
Hipotesis yang menyatakan tidak ada perbedaan suatu
kejadian antara kedua kelompok. Atau hipotesis yang
menyatakan tidak ada hubungan antara variabel satu dengan
variabel yang lain.
Contoh: Tidak ada perbedaan rerata kadar TNF-α antara
perokok dan non perokok.
b. Hipotesis Alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan suatu kejadian
antara kedua kelompok. Atau hipotesis yang menyatakan ada
hubungan antara variabel satu dengan variabel yang lain.
Contoh: ada perbedaan rerata kadar TNF-α antara perokok
dan non perokok.
Dari hipotesis alternatif akan diketahui apakah uji statitik
menggunakan satu arah (one tail) atau dua arah (two tail)
1) Satu arah (one tail) : bila hipotesis alternatifnya
menyatakan adanya perbedaan dan ada pernyataan yang
mengatakan hal yang satu lebih tinggi/rendah dari hal
yang lain.
116
Contoh: rerata kadar TNF-α pada perokok lebih besar
dibandingkan dengan rerata kadar TNF-α pada non
perokok
2) Dua arah (two tail) : merupakan hipotesis alternatif yang
hanya menyatakan perbedaan tanpa melihat apakah hal
yang satu lebih tinggi/rendah dari hal yang lain
Contoh : ada perbedaan rerata kadar TNF-α antara
perokok dan non perokok.
2. Menetapkan Jenis hipotesis (Korelatif atau komparatif)

Pertimbangan menggunakan korelatif atau komparatif
tergantung pada skala pengukuran variabel yang dianalisis. Jika
variabel yang dihubungan mempunyai skala pengukuran
numerik dengan numerik pasti menggunakan metode korelatif.
Sementara itu, Jika variabel yang dihubungkan mempunyai skala
pengukuran numerik dengan kategorik serta variabel yang
dihubungkan mempunyai skala pengukuran kategorik dengan
kategorik dapat menggunakan metode korelatif maupun
komparatif. Pemilihan korelatif atau komparatif juga tergantung
pada keluaran yang diinginkan. Apabila keluaran yang diinginkan
adalah koefisien korelasi, maka kita harus memilih metode
korelatif. Semantara, apabila keluaran yang diinginkan adalah
konsep selisih atau perbandingan, kita harus memilih metode
komparatif. Contoh perbandingan adalah odds rasio (OR), risiko
relatif (RR) dll. Sementara contoh selisih adalah selisih proporsi,
selisih rerata dll.
3. Menentukan Uji statitik yang sesuai
Ada beragam uji statistik yang dapat digunakan. Setiap uji
statistik mempunyai persayaratan tertentu yang harus dipenuhi.
Jenis uji statistik sangat tergantung dari:
117
1) Jenis variabel yang akan dianalisis, dari contoh judul skripsi di
atas:
a. Varabel bebas:
Perilaku merokok (perokok dan non perokok)
Skala : kategorik (nominal dikotom)
b. Variabel terikat
Kadar TNF-α
Skala : rasio (numerik)
2) Jenis data berpasangan atau tidak berpasangan
3) Distribusi/sebaran data
 Jika distribusi/sebaran data normal, maka proses pengujian
dapat menggunakan uji statistik parametrik
 Jika distribusi/sebaran data tidak normal, maka proses
pengujian dapat menggunakan uji statistik non parametrik.
4. Menentukan batas atau tingkat kemaknaan (level of significance)

Batas/tingkat kemaknaan sering disebut dengan nilai α,
batasan ini yang digunakan untuk memutuskan apakah hipotesis
nol ditolak atau diterima. Nilai α merupakan nilai yang
menunjukkan besarnya peluang salah dalam menolak hipotesis
nol, atau batas toleransi peluang salah dalam menolak hipotesis
nol, atau batas maksimal kesalahan menolak Ho, atau matas
maksimal kita salah menyatakan adanya
perbedaan/hubungan/pengaruh. Penggunaan α tergantung
tujuandan kondisi penelitian. Nilai α yang sering digunakan
adalah 10%, 5% atau 1%. Untuk bidang kesehatan masyarakat
biasanya menggunakan α 5%, sedang untuk pengujian obat-
obatan digunakan batas toleransi kesalahan yang lebih kecil
misalnya 1%, karena terdapat risiko yang fatal.
118
5. Keputusan Uji Statistik
Dari judul skripsi diatas “Perbedaan rerata kadar TNF-α
antara perokok dan non perokok” kita akan menetapkan kriteria:
 Arah hipotesis 2 arah (two tail) (kita tetapkan)
 Jenis hipotesis komparatif (variabel yang dihubungkan
berbentuk numerik dan kategorik dan luaran yang diinginkan
selisih rerata)
 Batas kemaknaan atau α 5% (kita tetapkan)
 Skala variabel bebas: kategorik (perokok dan non perokok)
dan variabel terikat numerik (kadar TNF- α)
 Jenis data Tidak berpasangan (perokok dan non perokok)
 Jumlah kelompok 2 (perokok dan non perokok)
Kesimpulan : Komparatif data numerik tidak berpasangan 2

kelompok
Pemilihan uji statistik parametrik dan non parametrik untuk

Analisis komparatif data numerik 2 sampel tidak berpasangan,
dapat dilihat pada tabel di bawah ini:
Tabel 6.1. Pemilihan uji statistik Analisis komparatif data numerik 2

sampel tidak berpasangan
Distribusi Data Varian Data Uji Statistik
Parametrik Non
Parametrik
Normal Homogen t-tidak berpasangan
dengan menggunakan
equal varian assumed.
Normal Tidak t-tidak berpasangan
Homogen dengan menggunakan
equal varian not assumed.
Paling tidak ada Mann-
satu kelompok Whitney
tidak normal
119
Untuk mengetahui data berdistribusi normal atau tidak harus
dilakukan uji normalitas data. Syarat yang harus dipenuhi dalam
analisis statistik parametrik untuk data numerik adalah berdistribusi
normal, jika data tidak berdistribusi normal maka dapat dilakukan
analisis menggunakan statistik non parametrik. Cara untuk menguji
distribusi data normal atau tidak dapat dilakukan dengan
Kolmogorov Smirnov (apabila jumlah data/sampel lebih dari 50),
atau menggunakan Shapiro Wilks (apabila jumlah data/sampel
kurang dari 50).
Langkah-langkah melakukan uji statistik dari contoh data di

atas, sebagai berikut:
3. Entry data
a. Input nama Variabel dan data ke SPSS
120
b. Input Nama Variabel, dilakukan pada Variable View
c. Input Data, dilakukan pada Data View
4. Uji Normalitas Data

Seperti telah dijelaskan di atas bahwa untuk menetukan apakah
data akan diuji dengan statistik paramatrik atau non parametrik
maka harus diuji normalitas data. Untuk itu, perlu dilakukan uji
normalitas data. Berikut adalah langkah-langkah uji normalitas data.
121
Jika tersedia data numerik seperti berikut, lakukan uji
normalitasnya.
a. Buka lembar kerja SPSS, klik Variabel View, selanjutnya
masukkan data, isi baris 1 dengan kadar TNF- α dan baris 2
dengan kelompok. Untuk mengisi pada bagian “values” pada
variabel kelompok, maka klik None baris kedua sehingga muncul
kotak dialog “Value Label”, pada kotak value isikan 1 dan kotak
Label isikan perokok, lalu klik Add. Tampak di layar :
b. Selanjutnya isi kembali kotak Value dengan 2 dan kotak Label

ketik Non Perokok, lalu klik Add dan OK. Tampak di layar:
c. Jika variabel sudah diisi dengan benar, maka pada bagian

Variabel View akan tampak sebagai berikut:
122
d. Berikutnya klik Data View akan tampak sebagai berikut:
e. Langkah berikutnya dari menu SPSS klik Analyze-

Descriptive Statistics-Explore
123
f. maka muncul kotak dialog “Explore” masukkan variabel kadar
TNF- α ke kotak Dependent List, lalu masukkan variabel
kelompok ke kotak Faktor List, pada bagian “Display” pilih Both,
selanjutnya klip Plots
g. Maka akan muncul kotak dialog “Explore: Plots, dari serangkaian

pilihan yang ada, berikan tanda centang (v) pada Normality plots
with test, lalu klik continue. Tampak di layar:
h. Langkah terakhir klik OK. Maka akan muncul ouput SPSS. Untuk
uji normalitas menurut Santosa S (2014) menggunakan teknik
Kolmogorov Smirnov, jika sampel lebih dari 50 dan
menggunakan Shapiro-Wilk jika sampel ≤ 50. Pengambilan
keputusan uji normalitas menurut Santosa S (2014), data
124
dikatakan berdistribusi normal jika nilai Sig (p-value) lebih besar
dari 0,05
i. Tabel output uji normalitas dengan Kolmogorov Smirnov yang
terdapat pada tabel “Test of Normality” adalah sebagai berikut:
Berdasarkan tabel output di atas diketahui nilai df (derajad

kebebasan) untuk kelompok perokok adalah 40 dan non perokok
adalah 40. Jumlah sampel data untuk masing-masing kelompok
kurang dari 50, maka untuk mendeteksi distribusi data normal
atau tidak data menggunakan shapiro wilk.
Catatan: jika nilai df lebih dari 50, maka pengambilan keputusan
normalitas dilakukan berdasarkan hasil yang terdapat pada tabel
Kolmogorov-Smirnov
Dari output SPSS tersebut diperoleh nilai sig (p-value) untuk
kelmpok perokok sebesar 0,601 dan untuk kelompok non
perokok 0,401. Karena nilai sig (p-value) untuk kedua kelompok
tersebut > 0,05, maka dapat disimpulkan bahwa data kadar TNF-
α untuk kelompok perokok dan non perokok berdistribusi normal.
Jika kita ingin melakukan uji statistik untuk mengetahui

perbedaan rerata kadar TNF- α antara perokok dan non perokok,
karena distribusi normal maka dapat dilakukan dengan uji
parametrik yaitu uji Independent Sample T-Test (uji t sampel tidak
berpasangan)
125
5. Uji t-tidak berpasangan (Independent Sample T-Test)
Uji ini merupakan Uji hipotesis komparatif data numerik 2
kelompok tidak berpasangan distribusi normal). Uji Independent
Sample T-Test merupakan bagian dari statistik parametrik.
Langkah-langkah melakukan uji Independent Sample T-Test
1. Buka lembar kerja SPSS, lalu klik Variabel View, maka
akan tampak:
2. Untuk mengisi pada bagian”values” untuk variabel

kelompok, maka klik none baris kedua hingga muncul
kotak dialog “value Label”, kemudian pada kotak value
isikan 1 dan kotak Label isikan perokok, lalu Add, dan
akan tampak sebagai berikut:
3. Kemudian isi kembali kotak value isikan 2 dan kotak

Label isikan Non perokok, lalu Add, dan OK maka akan
tampak sebagai berikut
126
4. Langkah selanjutnya klik data View, maka akan tambak di
layar sebagai berikut:
5. Langkah berikutnya dari menus SPSS klik Analyze-

Compare Means-Independent Sampel T Test
127
6. Muncul kotak dialog “Independent Sample T Test”,
kemudian masukkan variabel Kadar TNF ke kotak Test
Variable (s), lalu masukkan variabel kelompok ke kotak
Grouping Variable, akan tampak pada layar sebagai
berikut:
7. Selanjutnya klik Define Groups, maka akan muncul kotak

dialog “Define Groups”. Pada kotak Group 1 isikan 1 dan
kotak Groip 2 isikan 2, lalu klik continue
128
8. Terakhir klik OK, maka akan muncul oupput SPSS
dengan judul “T-Test” yang selanjutkan akan kita
interpretasikan
9. Dasar pengambilan keputusan uji Independent Sampel T
Test
a. Jika nila Sig (2-tailed) <0,05 maka H0 ditolak dan
Ha diterima, artinya terdapat perbedaan yang
signifikan rerata kadar TNF- α antara perokok
dan non perokok.
b. Jika nila Sig (2-tailed) ≥0,05 maka H0 diterima
dan Ha ditolak, artinya tidak ada perbedaan
rerata kadar TNF- α antara perokok dan non
perokok.
10. Interpretasi Output hasil uji Independent Sampel T Test
Tabel Output pertama “Group Statistics”
Group Statistics
Kelompok N Mean Std. Deviation Std. Error Mean
kadar_TNF Perokok 40 81.0252 1.18601 .18752
Non perokok 40 59.7970 5.84183 .92367
Berdasarkan tabel output “Group Statistics” di atas diketahui

bahwa jumlah data kadar TNF- α pada kelompok perokok
dan non perokok masing-masing 40. Rerata kadar TNF- α
pada kelompok perokok 81,02 pg/dL dengan standar deviasi
129
1,19, sementara untuk kelompok non perokok 59,79 pg/dL
dengan standar deviasi 5,84
Tabel Output Kedua “Independent Sampel Test”
Berdasarkan output “Independent Sampel Test” :

a. Pada Levene’s Test for Equality of Variances
(nama uji hipotesis untuk menguji hipotesisi), nilai
sig : 0,000. Karena p<0,05 maka dapat dikatakan
varian berbeda.
b. Karena varian berbeda, hasil uji memakai uji t
tidak berpasangan untuk varian berbeda ( baris
ke dua equal varian not assumed), diperoleh sig
(2-tailed) sebesar 0,000. Karena nilai p<0,05
maka H0 ditolak dan Ha diterima, sehingga dapat
disimpulkan bahwa ada perbedaan yang
signifikan rerata kadar TNF- α antara kelompok
perokok dan non perokok
c. Dari tabel output di atas juga diketahui nilai
“Mean Difference” adalah sebesar 21,22825.
Nilai ini menunjukkan selisih rerata kadar TNF- α
pada kelompok perokok dengan rerata kadar
TNF- α pada kelompok non perokok (81,0252-
59,79700). Nilai IK 95% adalah antara 19,32
sampai 23,13 artinya kita percaya 95% bahwa
jika pengukuran dilakukan pada populasi, maka
perbedaan rerata kadar TNF- α antara kelompok
130
perokok dan non perokok adalah antara 19,32
sampai 23,13
11. Penyajian dan interpretasi di laporan penelitian

Ouput hasil analisis data didak boleh langsung dicopy
dan disajikan di laporan penelitian. Pada laporan
penelitian kita harus membuat tabel baru untuk
menyajikan hasil ouput analisis data di atas. Bentuk
penyajian dan interpretasinya sebagai berikut:
Tebel ....................
Rerata kadar TNF- α antara kelompok perokok dan non
perokok
Variabel n Mean SD p-value
- Perokok 40 81,02 1,19 0,000
- Non Perokok 40 59,79 5,84
Rerata kadar TNF- α pada kelompok perokok adalah 81,02

pg/dL dengan standar deviasi 1,19 pg/dL. Sedangkan pada
kelompok non perokok rerata kadar TNF- α adalah 59,79
pg/dL dengan standar deviasi 5,84 pg/dL. Hasil uji statistik
didapatkan nilai p=0,000, artinya pada α 5% terlihat ada
perbedaan yang signifikan rerata kadar TNF- α antara
kelompok perokok dan non perokok.
6. Uji Man Whitney (Uji Hipotesis Komparatif Data Numerik

2 kelompok tidak berpasangan distribusi tidak normal)
Uji Man Whitney digunakan oleh para peneliti dalam rangka
untuk mengetahui ada tidaknya perbedaan rerata (mean)
data 2 sampel yang tidak berpasangan tetapi distribusi data
tidak normal. Uji Man Whitney merupakan bagian dari
statistik non parametrik.
131
Contoh:
Seorang mahasiswa kedokteran ingin mengetahui “ apakah
ada perbedaan rerata kadar MDA antara penderita DM dan
bukan DM” sehingga mahasiswa tersebut melakukan
penelitian dengan judul “Perbedaan rerata kadar MDA
antara penderita DM dan bukan DM”. Peneliti menetapkan
hipotesis yang digunakan one tail (satu arah), batas
kemaknaan (α) 5%.
Langkah-langkah melakukan uji Mann Whitney
1. Buka lembar Kerja SPSS, klik variabel view, pada
kolom name baris ke satu tuliskan MDA, dan pada
baris kedua tuliskan kelompok, pada bagian Label
untuk MDA tuliskan kadar MDA, dan untuk kelompok
tuliskan penderita, lalu klik kolom kedua dari Values
(None)
2. Maka akan muncul kotak dialog ”Values Labels”,

pada kotak Value ketikan “1” dan pada kotak Label
ketikan “DM” lalu klik Add, masih di kotak dialog
“Value Label”, berikutnya pada kotak Value ketikan
“2” dan pada kotak Label ketikan “bukan DM” lalu klik
Add, setelah itu klik OK
132
3. Langkah selanjutnya klik Data View, tampak di layar
ada 2 variabel yaitu MDA dan kelompok. Masukkan
data kadar MDA ke kotak MDA. Pada variabel
kelompok masukkan data kode untuk DM dan bukan
DM, maka akan tambak di layar sebagai berikut:
4. Jika semua data sudah terinput dengan benar, maka

berikutnya klik menu Analyze, kemudian klik Non
Parametrik Test, lalu klik 2 Independent Samples
133
5. Maka akan muncul kotak dialog “Two-Independent-
Samples Test”, kemudian masukkan kadar MDA ke
kolom Test Variable List, kemudian masukkan
variabel kelompok (penderita) ke kotak Grouping
Variable, kemudian pada bagian Test Type berikan
tanda cek (v) pada pilihan Mann-Whiney U, lalu klik
tombol Define Grouping
6. Muncul kotak dialog “Two-Independent-

Samples:Define”, selanjutnya pada bagian Group 1
134
tuliskan angka 1 dan pada Group 2 tulis angka 2,
kemudian klik Continue, dan klik OK
7. Dengan begitu maka pada layar akan muncul output

Mann-Whitney Test seperti berikut ini:
Ranks
Penderita N Mean Rank Sum of Ranks
Kadar MDA DM 10 15.50 155.00
Bukan DM 10 5.50 55.00
Total 20
8. Cara membaca /interpretasi output hasil uji Mann

Whitney
Hipotesis peneliti: satu arah dan α : 5%
Hipotesis yang diajukan dalam penelitian ini “ rerata
kadar MDA pada penderita DM lebih besar jika
135
dibandingkan dengan rerata kadar MDA pada bukan
DM”
Dasar pengambilan keputusan:
1) Jika nilai Signifikansi atau Asymp.Sig. (2-
tailed) < 0,05 maka hipotesis atau Ha diterima
dan H0 ditolak
2) Jika nilai Signifikansi atau Asymp.Sig. (2-
tailed) ≥ 0,05 maka hipotesis atau Ha ditolak
dan H0 diterima
interpretasi output:
a. Dari output pada kotak “Ranks” yang dilihat
adalah Mean Rank (Selisi median MDA antar
kelompok yaitu kelompok DM dan bukan DM).
Dari output diperoleh 10 (15,50 – 5,50),
artinya secara klinik kadar MDA pada
penderita DM lebih besar jika dibandingkan
dengan rerata kadar MDA pada kelompok
bukan DM
b. Dari output pada kotak “Test Statistics”,
yang dilihat adalah nilai Asymp. Sig (2-
tailed) diperoleh nilai sig. (p-value):
0,000. Karena nilai p<0,05 maka H0 ditolak
dan Ha diterima, sehingga dapat disimpulkan
bahwa secara statistik rerata kadar MDA
pada penderita DM lebih besar jika
dibandingkan dengan rerata kadar MDA pada
kelompok bukan DM
c. Kesimpulan : Rerata kadar MDA pada
penderita DM lebih besar jika dibandingkan
dengan rerata kadar MDA pada kelompok
bukan DM
136
Ouput hasil analisis data tidak boleh langsung dicopy
dan disajikan di laporan penelitian. Pada laporan
penelitian kita harus membuat tabel baru untuk
menyajikan hasil ouput analisis data di atas. Bentuk
penyajian dan interpretasinya sebagai berikut:
Tebel ....................
Hasil analisis uji Mann-Whitney
n Median p-
(Minimum-Maksimum) value
- Kadar MDA - DM 10 6,45 (4,99-7,30) 0,000
- Kadar MDA – Bukan DM 10 3,10 (2,0-3,78)
Dari tabel di atas, terlihat median kadar MDA pada kelompok

DM adalah 6,45 nmol/mL dengan kadar minimum 4,99
nmol/mL dan kadar maksimum 7,30 nmol/mL. Sedang
median kadar MDA pada kelompok bukan DM adalah 3,10
nmol/mL dengan kadar minimum 2,00 nmol/mL dan kadar
maksimum 3,78 nmol/mL. (hasil ini dapat dilihat pada kotak
output “Descriptives”). Hasil uji statistik diperoleh nilai
p=0,000, p<0,05 artinya rerata kadar MDA pada penderita
DM lebih besar jika dibandingkan dengan rerata kadar MDA
pada kelompok bukan DM
Pertanyaan latihan
19. Apa persamaan dan perbedaan antara uji Uji Independent
Sample T-Test dan uji Mann Whitney?
20. Apa persamaan dan perbedaan antara statistik parametrik
dan statistik non parametrik?
137
21. Buatlah contoh data untuk diuji dengan uji Independent
Sample T-Test lalu lakukan ujinya menggunakan SPSS dan
22. Buatlah contoh data untuk diuji dengan uji Mann Whitney, lalu
lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
Dahlan M.S. (2014) Statitik untuk Kedokteran dan Kesehatan.

Jakarta: Epidemiologi Indonesia.
Santosa S. (2014) Panduan lengkap SPSS versi 20 (edisi

Revisi). Jakarta: Alex Media Komputindo
Sastroasmoro S dan Ismael S. (2014) Dasar-dasar Metodologi

Penelitian Klinik. edidi 5. Jakarta: Sagung Seto
Dahlan M.S. (2018) Pintu Gerbang Memahami Epidemiologi,

Biostatistik, dan Metode Penelitian. edisi 2. Jakarta:
Epidemiologi Indonesia.
Brace N., Snelgar R.S. and Kemp R., (2012) SPSS for
Psychologists. edisi 5. London: Palgrave Macmillan.
Hastono S.P. (2006) Analisis Data. Jakarta: Universitas

Indonesia. Fakultas Kesehatan Masyarakat
Hastono S.P. (2020) Analisis Data pada Bidang

Kesehatan. Jakarta: Rajawali Pers
138
BAB VII
ANALISIS KOMPARATIF
DATA NUMERIK 2 SAMPEL
BERPASANGAN
Dr. Siti Thomas Zulaikhah, S.KM, M.Kes*
*Bagian IKM Fakultas Kedokteran, Universitas Islam Sultan Agung
(UNISSULA) Semarang
*e-mail: sitithomas@unissula.ac.id
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis data menggunakan uji t
berpasangan/ paired t-test dan menginterpretasikan hasil uji.
Wilcoxon dan menginterpretasikan hasil uji.
Ringkasan
Analisis komparatif data numerik 2 sampel berpasangan
merupakan uji statistik yang bertujuan untuk mengetahui perbedaan
mean/ rerata 2 kelompok data yang berpasangan (dependen). Bab
ini memberikan pengalaman belajar kepada mahasiswa mulai dari
entry data ke software SPSS (Statistical Product and Service
Solutions), melakukan uji t berpasangan (paired t-test) dan uji
Wilcoxon serta cara melakukan interpretasi hasil uji sehingga dapat
menyimpulkan hasil analisisnya.
Pesan dalam Belajar

Untuk mempelajari bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir bab
139
bab. Pada akhir pembelajaran, jawablah pertanyaan-
pengetahuan dan pemahaman dari mempelajari bab ini.
Materi Belajar
A.Pengantar Analisis Komparatif Data Numerik 2
Sampel Berpasangan
Analisis komparatif data numerik 2 sampel berpasangan
merupakan uji statistik yang membandingkan mean/ rerata 2
kelompok data yang berpasangan. Pada Komparatif numerik 2
sampel berpasangan, pengukuran dilakukan berulang (2 kali)
pada individu yang sama, umumnya pengukuran dilakukan
sebelum dan sesudah (pre and post test).
Pada umumnya menggunakan judul/ tema perbandingan
atau perbedaan, sebagai contoh “Perbedaan berat Badan
(BB) sebelum dan sesudah mengikuti program diet”. Dari judul
ini maka data dapat dianalisis menggunakan uji statistik yaitu
uji beda rerata 2 kelompok data yang berpasangan. Variabel
BB mempunyai skala pengukuran numerik, sementara
program diet mempunyai skala pengukuran kategorik dikotom.
Hubungan antar variabel numerik dan kategorik bisa dianalisis
menggunakan korelatif atau komparatif. Pemilihan korelatif
atau komparatif tergantung keluaran yang diinginkan. Apabila
keluaran yang diinginkan adalah koefisien korelasi, kita harus
memilih metode korelasi. Sementara, bila keluaran yang
dinginkan adalah konsep selisih atau perbandingan, kita harus
140
memilih metode komparatif. Contoh perbandingan adalah
odds rasio (OR), risiko relatif (RR). Sementara contoh selisih
adalah selisih proporsi, selisih rerata dan lain-lain. Dari contoh
judul di atas keluaran yang diinginkan adalah selisih rerata BB
sebelum dan sesudah (pre and post test) maka yang paling
tepat menggunakan analisis komparatif, jumlah kelompok 2
karena kita akan mengukur variabel BB sebelum dan
sesudah, sehingga dapat dikatakan komparatif numerik
berpasangan 2 kelompok. Asumsi dasar atau persayaratan
melakukan uji t berpasangan data numerik (skala interval atau
rasio) dalam penelitian, dapat dilihat dari distribusi data, yaitu:
5. Apabila distribusi/ sebaran data normal gunakan uji t
berpasangan (paired t-test).
6. Apabila distribusi/ sebaran data normal gunakan uji
Wilcoxon.
Di bawah ini adalah contoh skenario untuk memahami isi
bab ini:
Untuk memenuhi salah satu syarat dalam menyelesaikan
Pendidikan Sarjana Kedokteran, maka semua mahasiswa
diwajibkan menyusun skripsi. Salah satu judul skripsi mahasiswa
adalah “Perbedaan rerata BB sebelum dan sesudah mengikuti
program diet”. Sampel yang digunakan sebanyak 30 responden.
Untuk menentukan uji hipotesis/uji statistik, maka harus dilakukan
melalui langkah-langkah sebagai berikut:
6. Menetapkan hipotesis
Hipotesis dalam statistik ada 2 jenis yaitu hipotesis nol (Ho)
dan hipotesis alternatif (Ha):
c. Hipotesis Nol (Ho)
141
Hipotesis yang menyatakan tidak ada perbedaan suatu
menyatakan tidak ada hubungan antara variabel satu
dengan variabel yang lain.
Contoh: Tidak ada perbedaan rerata BB sebelum
dan sesudah mengikuti program diet.
d. Hipotesis Alternatif (Ha)
Hipotesis yang menyatakan ada perbedaan suatu
menyatakan ada hubungan antara variabel satu dengan
variabel yang lain.
Contoh: ada perbedaan rerata rerata BB sebelum dan
sesudah mengikuti program diet.
Dari hipotesis alternatif akan diketahui apakah uji statitik
menggunakan satu arah (one tail) atau dua arah (two tail)
3) Satu arah (one tail): bila hipotesis alternatifnya
menyatakan adanya perbedaan dan ada pernyataan
yang mengatakan hal yang satu lebih tinggi/rendah dari
hal yang lain.
Contoh: rerata BB sesudah mengikuti program diet lebih
rendah dibandingkan rerata BB sebelum mengikuti
program diet.
4) Dua arah (two tail): merupakan hipotesis alternatif yang
hanya menyatakan perbedaan tanpa melihat apakah hal
yang satu lebih tinggi/rendah dari hal yang lain.
Contoh: ada perbedaan rerata BB sebelum dan sesudah
mengikuti program diet.
7. Menetapkan Jenis hipotesis (Korelatif atau komparatif)
Pertimbangan menggunakan korelatif atau komparatif
tergantung pada skala pengukuran variabel yang dianalisis.
142
Jika variabel yang dihubungan mempunyai skala
pengukuran numerik dengan numerik pasti menggunakan
metode korelatif. Sementara itu, Jika variabel yang
dihubungkan mempunyai skala pengukuran numerik dengan
kategorik serta variabel yang dihubungkan mempunyai skala
pengukuran kategorik dengan kategorik dapat menggunakan
metode korelatif maupun komparatif. Pemilihan korelatif atau
komparatif juga tergantung pada keluaran yang diinginkan.
Apabila keluaran yang diinginkan adalah koefisien korelasi,
maka kita harus memilih metode korelatif. Semantara,
apabila keluaran yang diinginkan adalah konsep selisih atau
perbandingan, kita harus memilih metode komparatif.
Contoh perbandingan adalah odds rasio (OR), risiko relatif
(RR) dan lain-lain. Sementara contoh selisih adalah selisih
proporsi, selisih rerata dan lain-lain.
8. Menentukan Uji statistik yang sesuai
Ada beragam uji statistik yang dapat digunakan. Setiap uji
statistik mempunyai persayaratan tertentu yang harus
dipenuhi. Jenis uji statistik sangat tergantung dari:
4) Jenis variabel yang akan dianalisis, dari contoh judul
skripsi di atas:
a. Varabel bebas: program diet
Skala : kategorik (nominal dikotom)
b. Variabel terikat: berat badan
Skala : rasio (numerik)
5) Jenis data berpasangan atau tidak berpasangan
6) Distribusi/sebaran data
 Jika distribusi/sebaran data normal, maka proses
pengujian dapat menggunakan uji statistik
parametrik.
143
 Jika distribusi/sebaran data tidak normal, maka
proses pengujian dapat menggunakan uji statistik
non parametrik.
9. Menentukan batas atau tingkat kemaknaan (level of
significance)
Batas/tingkat kemaknaan sering disebut dengan nilai α,
batasan ini yang digunakan untuk memutuskan apakah
hipotesis nol ditolak atau diterima. Nilai α merupakan nilai
yang menunjukkan besarnya peluang salah dalam menolak
hipotesis nol, atau batas toleransi peluang salah dalam
menolak hipotesis nol, atau batas maksimal kesalahan
menolak Ho, atau matas maksimal kita salah menyatakan
adanya perbedaan/hubungan/pengaruh. Penggunaan α
tergantung tujuan dan kondisi penelitian. Nilai α yang sering
digunakan adalah 10%, 5% atau 1%. Untuk bidang
kesehatan masyarakat biasanya menggunakan α 5%,
sedang untuk pengujian obat-obatan digunakan batas
toleransi kesalahan yang lebih kecil misalnya 1%, karena
terdapat risiko yang fatal.
10. Keputusan Uji Statistik
Dari judul skripsi diatas “Perbedaan rerata BB sebelum dan
sesudah mengikuti program diet” kita akan menetapkan
kriteria:
 Arah hipotesis 2 arah (two tail) (kita tetapkan)
 Jenis hipotesis komparatif (variabel yang
dihubungkan berbentuk numerik dan kategorik dan
luaran yang diinginkan selisih rerata)
 Batas kemaknaan atau α 5% (kita tetapkan)
 Skala variabel bebas: kategorik (program diet) dan
variabel terikat numerik (BB)
144
 Jenis data berpasangan (dari pengukuran sebelum
dan sesudah mengikuti program diet)
 Jumlah kelompok 2 (sebelum dan sesudah atau pre
and post)
Kesimpulan: Komparatif data numerik berpasangan 2
kelompok
Pemilihan uji statistik parametrik dan non parametrik untuk analisis

komparatif data numerik 2 sampel berpasangan, dapat dilihat pada
tabel di bawah ini:
Tabel 7.1. Pemilihan uji statistik Analisis komparatif data numerik 2
sampel berpasangan
Distribusi Data Uji Statistik
Parametrik Non Parametrik

Normal Uji t dependent
atau paired t-test
Tidak Normal Uji Wilcoxon
Untuk mengetahui data berdistribusi normal atau tidak harus

dilakukan uji normalitas data. Syarat yang harus dipenuhi dalam
analisis statistik parametrik untuk data numerik adalah berdistribusi
normal, jika data tidak berdistribusi normal maka dapat dilakukan
analisis menggunakan statistik non parametrik. Cara untuk menguji
distribusi data normal atau tidak dapat dilakukan dengan
Kolmogorov Smirnov (apabila jumlah data/ sampel lebih dari 50),
atau menggunakan Shapiro Wilks (apabila jumlah data/ sampel
kurang dari 50). Langkah-langkah bagaimana cara melakukan uji
normalitas sudah diuraikan pada bab sebelumnya yaitu BAB VI,
sehingga pada BAB VII ini tidak perlu diuraikan ulang
145
B. Uji t berpasangan (Paired Sample T-Test/ dependent
Sample T-Test)
Syarat uji ini yaitu distribusi data normal, kedua kelompok data
berpasangan (dependent/ pair), skala variabel numerik dan
kategorik ( 2 kelompok). Uji ini merupakan bagian dari statistik
parametrik.
Langkah-langkau uji paired sample t-test:
1. Buka lembar kerja SPSS, kemudian klik Variable View. Pada
bagian Name ketik pretest dan post test. Pada bagian
Desimal diubah menjadi 0 (karena data berat badan dalam
bentuk angka bulat, bukan pecahan desimal). Pada bagian
Label ketikan BB Pre Test dan BB Post Test. Pada bagian
Measure pilih scale. Sementara untuk kolom yang lainnya
biarkan otomatis SPSS saja tidak perlu diubah-ubah. Di
layar akan tampak sebagai berikut:
2. Jika sudah, lalu klik Data View, berikutnya kita masuk ke

tahap pengisian atau input data ke SPSS, yaitu dengan cara
menulis BB (berat badan) yang sudah terkumpul ke kolom
pretest dan posttest, Di layar akan tampak sebagai berikut:
146
3. Berikutnya, dari menu bar yang terdapat pada SPSS klik
menu Analyze, lalu pilih Compare Means, kemudian klik
Paired-Sample t-test.
4. Setelah langkah tersebut dilakukan dengan benar, maka

akan muncul dialog dengan nama “Paired Samples T- Test”.
Karena disini kita akan menguji perbedaan antara BB pada
pretest dan posttest, maka klik mouse pada data pretest lalu
klik tombol yang tersedia untuk memasukkan data pretest ke
kotak sebelah kanan (Paired Variables, setelah data pretest
147
masuk, lakukan cara yang sama pada data posttest. Supaya
lebih jelas lihat gambar di bawah ini:
Gambar sebelum data pretest dan posttest dimasukkan ke
kotak Paired Variables:
Gambar sesudah data pretest dan posttest dimasukkan ke

kotak Paired Variables:
5. Berikutnya klik Options, maka akan muncul kotak dialog

“Paired-Samples T Test: Option”. Pada Confidence Interval
Percentage tulis 95% (artinya kita menggunakan batas
kemaknaan 95% atau α 5% atau 0,05), lalu klik continue. Di
layar akan tampak sebagai berikut:
148
6. Setelah semua prosedur atau cara melakukan uji paired
sample t-test dengan SPSS sudah dilakukan, langkah
terakhir klik OK, maka akn muncul output SPSS berjudul “T-
Test” yang selanjutnya kita interpretasikan.
7. Dasar pengambilan keputusan uji Paired Samples T Test
a. Jika nila Sig (2-tailed) <0,05 maka H0 ditolak dan Ha
diterima, artinya terdapat perbedaan yang signifikan
rerata berat badan sebelum dan sesudah diet
b. Jika nila Sig (2-tailed) ≥0,05 maka H0 diterima dan
Ha ditolak, artinya tidak ada perbedaan rerata berat
badan sebelum dan sesudah diet
8. Interpretasi tabel output “Paired Samples Statistics”
Berdasarkan tabel ouput “Paired Samples Statistics” di

atas terlihat ringkasan hasil statistik deskriptif dari
kedua sampel yang diteliti yaitu BB pretest dan BB
posttest. Pada kelompok pretest diperoleh rerata BB
atau mean sebesar 73,63 kg dengan sandar deviasi
149
7,13; sedangkan rerata BB atau mean pada kelompok
posttest adalah 69,97 kg dengan sandar deviasi 7,42.
9. Interpretasi tabel output “paired Samples Correlations”
Berdasarkan tabel output “Paired Samples

Correlations” menunjukkan hasil uji korelasi atau
hubungan antara kedua kelompok data atau hubungan
variabel BB pretest dan BB posttest, diketahui nilai
signifikansi (sig) sebesar 0,000 dan nilai koefisien
korelasi (Correlation) sebesar 0,980. Karena nilai sig
0,000>0,05, dapat dikatakan bahwa terdapat
hubungan atau korelasi antara variabel BB pretest dan
posttest dengan kekuatan hubungan yang sangat kuat
(Correlation: 0,980), dengan demikian kedua variabel
dapat dibedakan
10. Interpretasi tabel output “Paired Samples Test”
Sebelum kita melakukan interpretasi dari tabel output

“ Paired Samples Test” maka kita perlu tetapkan
hipotesis dan pedoman pengambilan keputusan:
A. Hipotesis Penelitian
150
H0 : tidak ada perbedaan rerata berat badan (BB)
sebelum dan sesudah diet
Ha : Ada perbedaan rerata berat badan (BB) sebelum
dan sesudah diet
B. Pedoman Pengambilan Keputusan

- Jika nilai Sig (2-tailed) <0,05 maka H0 ditolak
dan Ha diterima, artinya terdapat perbedaan yang
signifikan rerata berat badan (BB) sebelum dan
sesudah diet
- Jika nilai Sig (2-tailed) ≥ 0,05 maka H0 dterima
dan Ha ditolak, artinya tidak ada perbedaan yang
signifikan rerata berat badan (BB) sebelum dan
sesudah diet
Berdasarkan tabel output “ Paired Samples Test”
di atas,
a) Diketahui nilai Sig. (2-tailed) adalah 0,000. Karena
nilai sig < 0,05, maka H0 ditolak dan Ha diterima,
artinya ada perbedaan yang signifikan antara rerata
berat badan (BB) sebelum dan sesudah diet.
b) Dari tabel diatas juga memuat informasi tentang nilai
“Mean Paired Differens” yaitu 3,667; nilai ini
menunjukkan selisih antara rerata BB sebelum dan
sesudah diet.
c) Pada 95% Confidence Interval of the Difference
Lower dan Upper terlihat selisih perbedaan sebesar
3,118 sampai dengan 4,216; artinya kita percaya
95% bahwa jika pengukuran dilakukan pada
populasi, maka perbedaan antara rerata berat badan
151
sebelum dan sesudah diet adalah antara 3,118
sampai 4,216.

Ouput hasil analisis data didak boleh langsung
dicopy dan disajikan di laporan penelitian. Pada
laporan penelitian kita harus membuat tabel baru
untuk menyajikan hasil ouput analisis data di atas.
Bentuk penyajian dan interpretasinya sebagai
berikut:
Rerata Berat Badan Sebelum dan Sesudah Diet (pretest-posttest)
Variabel n Mean±SD Selisih ±SD IK 95% p-value
- BB pretest 30 73,63±7,13 3,667±1,47 3,118 - 4,216 0,000

- BB posttest
69,97±7,42
Rerata BB sebelum diet (pretest) 73,63 Kg dengan standar

deviasi 7,13 Kg. Pada pengukuran BB sesudah diet
(posttest) diperoleh rerata 69,97 Kg dengan standar deviasi
7,42 Kg. Selisih antara rerata BB sebelum dan sesudah diet
sebesar 3,667 Kg dengan standar deviasi 7,13 Kg. Hasil uji
statistik diperoleh nilai p=0,000, dengan IK 95% 3,118- 4,216
(tidak melewati nol) artinya pada α 5% terdapat perbedaan
yang signifikan antara rerata berat badan (BB) sebelum dan
sesudah diet (p<0,05).
C. Uji Wilcoxon (Uji Hipotesis Komparatif Data Numerik 2

kelompok berpasangan distribusi tidak normal)
Uji Wilcoxon digunakan untuk mengetahui ada tidaknya
perbedaan rerata (mean) data numerik 2 sampel yang
152
berpasangan tetapi distribusi data tidak normal. Uji Wilcoxon
merupakan bagian dari statistik non parametrik
Contoh: Seorang mahasiswa FK membuat skripsi dengan judul
“Perbedaan tekanan darah diastolik sebelum dan sesudah
pemberian obat antihipertensi X pada penderita hipertensi.
Peneliti menetapkan hipotesis yang digunakan two tail (dua
arah), batas kemaknaan (α) 5%.
Langkah-langkah melakukan uji Wilcoxon
10. Buka lembar kerja SPSS, kemudian klik Variable
View. Pada bagian Name ketik sebelum dan sesudah. Pada
bagian Desimal ubah menjadi 0 (karena data tekanan darah
diastolik dalam bentuk angka bulat, bukan pecahan
desimal). Pada bagian Label ketikan Diastolik Sebelum dan
Diatolik sesudah. Pada bagian Measure pilih scale.
Sementara untuk kolom yang lainnya biarkan otomatis SPSS
saja tidak perlu diubah-ubah. Di layar akan tampak sebagai
berikut:
11. Langkah selanjutnya klik Data View, kemudian isikan

data, sehingga di layar akan tampak sebagai berikut:
153
12. Langkah selanjutnya klik menu Analyze, pilih
Nonparametric Test, kemudian pilih 2 Related Samples
13. Tampak di layar muncul kotak dialog “Two-Related

Sample Test”, kemudian masukkan variabel sebelum dan
sesudah ke kotak Test Pairs secara bersamaan, lalu pada
bagian “Test Type” berikan tanda centang (v) pada pilihan
Wilcoxon, dan kemudian klik OK.
154
14. Di layar akan muncul output “Wilcoxon Signed Ranks
Test” sebagai berikut:
Wilcoxon Signed Ranks Test
Ranks
Sum
Mean of
N Rank Ranks
Diastolik Negativ
20a 10.50 210.00
Sesudah - e Ranks
Diastolik Positive
Sebelum 0b .00 .00
Ranks
Ties 0c
Total 20
a. Diastolik Sesudah < Diastolik Sebelum

b. Diastolik Sesudah > Diastolik Sebelum
c. Diastolik Sesudah = Diastolik Sebelum
155
Test Statisticsb
Diastolik Sesudah -
Diastolik Sebelum
Z -3.957a
Asymp. Sig.
.000
(2-tailed)
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
15. Sebelum kita melakukan interpretasi dari tabel

output “Wilcoxon Signed Ranks Test” maka kita perlu
tetapkan hipotesis dan pedoman pengambilan keputusan:
a. Hipotesis Penelitian
i. H0 : tidak ada perbedaan tekanan diastolik sebelum
dan sesudah pemberian obat antihipertensi X pada
penderita hipertensi
ii. Ha : ada perbedaan tekanan diastolik sebelum dan
sesudah pemberian obat antihipertensi X pada
penderita hipertensi
b. Pedoman Pengambilan Keputusan
i. Jika nilai Sig (2-tailed) <0,05 maka H0 ditolak dan Ha
diterima, artinya terdapat perbedaan yang signifikan
tekanan diastolik sebelum dan sesudah pemberian
obat antihipertensi X pada penderita hipertensi.
ii. Jika nilai Sig (2-tailed) ≥0,05 maka H0 dterima dan Ha
ditolak, artinya tidak ada perbedaan yang signifikan
obat antihipertensi X pada penderita hipertensi.
156
16. Interpretasi output uji wilcoxon
Ouput Pertama “Ranks”

Output ini menunjukkan perbedaan rerata tekanan diastolik
sebelum dan sesudah pemberian obat antihipertensi X pada
penderita hipertensi:
i. Negatif Ranks atau selisih (negatif) antara tekanan diastolik
sebelum dan sesudah pemberian obat antihipertensi X.
Disini terdapat 20 data negatif (N) yang artinya ke 20
orang mengalami penurunan tekanan diastolik dari
sebelum ke sesudah, atau dapat dikatakan bahwa
terdapat 20 orang yang mempunyai tekanan diastolik
sesudah pemberian obat antihipertensi X lebih rendah
jika dibandingkan dengan sebelum. Mean Ranks atau
rerata penurunan tersebut sebesar 10,50; sedangkan
jumlah ranking negatif atau Sum of Ranks adalah
sebesar 210,00
ii. Positif Ranks atau selisih (positif) antara tekanan diastolik
sebelum dan sesudah pemberian obat antihipertensi X
adalah 0, baik itu nilai N, Mean Ranks, maupun Sum
Ranks. Nilai 0 ini menunjukkan tidak ada satu
orangpun yang mengalami peningkatan tekanan
diastolik dari sebelum ke sesudah pemberian obat
antihipertensi X.
iii. Ties adalah kesamaan nilai sebelum dan sesudah, di sini
nilai Ties adalah 0, sehingga dapat dikatakan bahwa
tidak ada satu orangpun yang mempunyai tekanan
diastolik sama antara sebelum dan sesudah
pemberian obat antihipertensi X.
157
Output kedua “Test Statistics”
a. Berdasarakan ouput “Test Statistics” di atas,
diperoleh Asymp.Sig. (2-tailed): 0,000. Karena nilai
0,000 < 0,05, maka dapat disimpulkan bahwa “H0
ditolak dan Ha diterima” artinya terdapat perbedaan
obat antihipertensi X pada penderita hipertensi
b. Kesimpulan : terdapat perbedaan tekanan diastolik
sebelum dan sesudah pemberian obat antihipertensi
X pada penderita hipertensi

Ouput hasil analisis data tidak boleh langsung dicopy dan
disajikan di laporan penelitian. Pada laporan penelitian kita
harus membuat tabel baru untuk menyajikan hasil ouput
analisis data di atas. Bentuk penyajian dan interpretasinya
sebagai berikut:
Tabel. Hasil analisis Uji Wilcoxon
Median p-value
(Minimum-
Maksimum)
- Tekanan Diatolik 112,5 (100-125)

sebelum pemberian obat
antihipertensi X 0,000
- Tekanan Diatolik 100 (80-120)
sesudah pemberian obat
antihipertensi X 100
Dari tabel di atas, dapat dilihat bahwa median tekanan

diastolik sebelum pemberian obat antihipertensi X adalah 112,5
mmHg dengan tekanan diastolik terendah 100 mmHg dan
158
tertinggi 125 mmHg. Median tekanan diastolik sesudah
pemberian obat antihipertensi X adalah 100 mmHg dengan
tekanan diastolik terendah 80 mmHg dan tertinggi 120 mmHg.
Hasil analisis diperoleh sig (p-value) : 0,000, p<0,05 artinya pada
α 5% terdapat perbedaan tekanan diastolik sebelum dan
sesudah pemberian obat antihipertensi X pada penderita
hipertensi.
Pertanyaan latihan
23. Apa persamaan dan perbedaan antara uji Paired Samples T-
Test dan uji Wilcoxon?
24. Buatlah contoh data untuk diuji dengan uji Paired Samples T-
Test lalu lakukan ujinya menggunakan SPSS dan
25. Buatlah contoh data untuk diuji dengan uji Wilcoxon, lalu
lakukan ujinya menggunakan SPSS dan interpretasikan
hasilnya!
Referensi
Dahlan M.S. (2014) Statitik untuk Kedokteran dan Kesehatan.

Jakarta: Epidemiologi Indonesia.
Santosa S. (2014) Panduan lengkap SPSS versi 20 (edisi
Revisi). Jakarta: Alex Media Komputindo
Sastroasmoro S dan Ismael S. (2014) Dasar-dasar Metodologi
Penelitian Klinik. edidi 5. Jakarta: Sagung Seto
Dahlan M.S. (2018) Pintu Gerbang Memahami Epidemiologi,
Biostatistik, dan Metode Penelitian. edisi 2. Jakarta:
Epidemiologi Indonesia.
Brace N., Snelgar R.S. and Kemp R., (2012) SPSS for
Psychologists. edisi 5. London: Palgrave Macmillan.
Sunyoto D. (2017) Statistik Non Parametrik untuk Kesehatan.
159
Yogyakarta : Nuha Medika
Santosa S. (2015) Menguasai Statistik Non Parametrik
Konsep Dasar dan Aplikasi dengan SPSS. Jakarta: Alex
Media Komputindo
160
BAB VIII
ANALISIS KOMPARATIF DATA NUMERIK
LEBIH DARI 2 SAMPEL TIDAK
BERPASANGAN
dr. Denny Anggoro Prakoso MSc FISPH FISCM*

*Bagian IKM-IKK Fakultas Kedokteran, Universitas Muhammadiyah
Yogyakarta
*e-mail: denny.anggoro@umy.ac.id atau denny7_fkumy@yahoo.com
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis dan menginterpretasikan
Uji one way ANOVA
2. Mahasiswa mampu melakukan analisis dan menginterpretasikan
Uji Kruskal Wallis
3. Mahasiswa mampu menjawab pertanyaan latihan
Ringkasan
Pemilihan jenis uji statistik harus sesuai dengan bentuk
hipotesisnya. Uji komparatif digunakan apabila bentuk hipotesisnya
adalah jenis uji yang mengukur perbedaan (uji beda) antara dua
kelompok atau lebih, baik kelompok berpasangan maupun tidak
berpasangan. Uji komparatif parametrik menggunakan data numerik
(interval atau rasio) yang terdistribusi normal, sedangkan data
numerik yang tidak berditribusi normal maka perlakuannya sama
dengan perlakuan data ordinal yaitu menggunakan uji komparatif
non parametrik. Analisis uji komparatif data numerik lebih dari 2
sampel tidak berpasangan digunakan untuk menguji hipotesis pada
uji statistik variabel dengan skala data numerik (interval atau rasio)
pada sampel lebih dari 2. Uji komparatif parametrik yang dibahas
161
disini adalah uji Anova, sedangkan uji komparatif non parametrik
adalah uji Kruskal Wallis. Pada bab ini akan dibahas uji komparatif
skala numerik lebih dari 2 kelompok tidak berpasangan meliputi uji
Anova dan Uji Kruskal Wallis. Pada bab ini juga dibahas bagaimana
melakukan analisis SPSS dengan disertai cara membaca hasil out
put SPSS (Statistical Product and Service Solutions). Analisis
dilakukan dengan mengunakan software statistik SPSS.
.
Pesan dalam Belajar
Pemahaman isi bab akan didapatkan dengan membaca isi
bab dari awal bab sampai akhir bab secara berurutan. Pada
akhir pembelajaran, jawablah pertanyaan-pertanyaan pada
latihan untuk menguji seberapa besar pengetahuan dan
pemahaman yang anda dapatkan dari mempelajari bab ini.
Materi Belajar
A. Pengantar Analisis Uji Komparatif Data
Numerik Lebih Dari 2 Sampel Tidak
Berpasangan
Di dalam sebuah penelitian seringkali dihadapkan pada
permasalahan membandingkan nilai rerata (mean) dari
sejumlah k populasi, lebih dari dua kelompok (K>2). Selain
itu juga untuk melihat efek satu atau lebih faktor dengan
perlakuan lebih dari 2. Tentunya terdapat perbedaan dalam
pemilihan uji statistik pada kondisi tersebut. Dalam analisis
statistik dengan jumlah lebih dari dua kelompok kita tidak
dilarang menggunakan uji t, tetapi sangat tidak dianjurkan.
Karena uji t untuk mean 2 populasi memiliki kelemahan yaitu
162
antara lain :
a. Kita melakukan pengujian berulang kali sesuai kombinasi
yang mungkin. Hal ini meningkatkan risiko kesalahan tipe I
(menolak H0 bila tidak ada bedanya).
b. Bila melakukan uji t berulang akan meningkatkan (inflasi)
nilai , artinya akan meningkatkan peluang hasil yang keliru.
Pada tingkat signifikansi 0.05 artinya dengan 100 uji
perbandingan yang sama, lima akan menunjukkan
perbedaan padahal sebanarnya tidak ada (kesalahan
menolak Ho yang benar).
Uji statistik yang tepat digunakan adalah uji varian atau uji
F atau disebut juga uji Anova (Analysis of varians). Uji Anova
akan melakukan uji secara simultan untuk melihat adanya
perbedaan mean dari p populasi atau tidak. Berdasarkan
faktor yang menimbulkan variansi, maka Uji Anova
dibedakan menjadi one-way Anova dan two way Anova. One
way Anova digunakan apabila hanya ada 1 faktor yang
diamati, sedangkan apabila faktor yang diamati >2 maka
menggunkan uji two way Anova.
Uji paramaterik pada pada uji Anova memerlukan
beberapa prasyarat uji asumsi yang harus dipenuhi yaitu :
a) Kelompok atau sampel independen
b) Variasi sama atau varian homogen (uji homogenitas).
c) Data terdistribusi normal (uji normalitas)
d) Jenis data yang dihubungkan adalah numerik dengan
kategori (untuk kategori yang lebih dari dua kelompok)
Prinsip uji anova adalah melakukan telaah variabilitas data
menjadi dua sumber variasi, yaitu variasi dalam kelompok
(within) dari variasi antar kelompok (between). Bila variasi
163
dalam kelompok dan antar kelompok sama (nilai
perbandingan kedua varian sama dengan 1), mean yang
dibandingkan tidak ada perbedaan. Sebaliknya, bila hasil
perbandingan kedua varian tersebut menghasilkan nilai lebih
dari 1, mean yang dibandingkan menunjukkan ada
perbedaan.
B. Uji One Way Anova

One way Anova atau Anova satu arah merupakan
perluasan dari uji beda mean 2 populasi tidak berpasangan.
Dalam uji Anova ini kita ingin menguji secara kesamaan k
populasi (perlakuan) dengan jumlah > 2, secara bersamaan,
dan tidak menguji antar 2 mean populasi.
Tujuan dari uji one way Anova
1. Membandingkan mean dari beberapa populasi (lebih dari 2
populasi)
2. Melihat efek faktor (variabel independen yang akan
dianalisis dalam penelitian) terhadap variabel dependen
dengan level faktor (bentuk/kondisi khusus dari faktor,
perlakuan dalam Anova satu arah sama dengan level faktor)
lebih dari 2.
Seperti yang sudah dijelaskan diatas, sebelum
melakukan uji hipotesis one way Anova, terdapat beberapa
asumsi yang harus dipenuhi yaitu data terdistribusi normal,
data memiliki variansi homogen atau relatif sama serta data
bersifat bebas independen.
1. Data terdistibusi normal
Untuk menilai apakah data yang akan diolah terdistibusi
normal kita bisa menggunakan beberapa cara, yaitu antara
164
lain melalui histogram, diagram batang dan daun, PP plot,
dan sebagainya. Sedangkan uji normalitas yang lain yang
bisa digunakan adalah menggunakan uji Kolmogorov-
Smirnov (jumlah data > 50), Saphiro wilk (jumlah data < 50).
2. Data mempunyai variansi yang relatif sama.
Uji kesamaaan variansi yang sering digunakan adalah uji
Levene (Levene’s test). Uji lain yang dapat digunakan
adalah uji Bartlet dan uji Hartley.
3. Data bersifat independen.
Asumsi ini dapat diupayakan untuk dipenuhi dengan cara
melakukan pengacakan atau randomisasi pada pengambilan
sampel. Randomisasi akan memperkecil kemungkinan
terjadi dependensi pada setiap observasi. Bila randomisasi
tidak dapat dipastikan maka kita tidak dapat melakukan
analisis variansi karena dapat menghasilkan kesimpulan
yang keliru.
Jika persyaratan di atas tidak dapat dipenuhi maka ada
prosedur khusus yang harus dilakukan misalnya dengan
melakukan transformasi data (jika data tidak terdistribusi
normal) atau dengan melakukan uji komparatif non
parametrik seperti uji Mann whithey atau Kruskal wallis, dan
lain-lain.
Ilustrasi Kasus Uji One Way Anova
Anda ingin mengetahui apakah ada perbedaan kadar
kolesterol antara kelompok dengan indeks masa tubuh
normal, overweight dan obesitas. Pertanyaan penelitian yang
anda susun “Apakah terdapat perbedaan kadar kolesterol
darah antara kelompok dengan indeks masa tubuh (IMT)
normal, overweight dan obesitas?.”
165
Langkah Menjawab Pertanyaan
Terdapat beberapa langkah yang harus dijalankan untuk dapat
menjawab pertanyaan tersebut dengan benar, yaitu :
1. Menentukan variabel yang dihubungkan  pada penelitian
ini variabel yang dihubungkan variabel bebas indeks masa
tubuh dan variabel terikat adalah kadar kolesterol darah.
2. Menentukan jenis hipotesis  pada penelitian ini jenis
hipotesis yang digunakan adalah hipotesis komparatif.
3. Menentukan jenis skala variabel  pada penelitian ini skala
yang digunakan adalah skala numerik.
4. Menentukan jenis data/kelompok berpasangan atau tidak
berpasangan  pada penelitian ini jenis data tidak
berpasangan.
5. Menentukan jenis kelompok  pada penelitian ini terdapat
kelompok > 2 yaitu ada 3 kelompok.
6. Menentukan jenis uji yang digunakan  jenis uji yang sesuai
pada penelitian ini adalah uji one way Anova jika data
memenuhi persyaratan uji parametrik atau uji Kruskal wallis
jika data termasuk nonparametrik.
Langkah melakukan Uji Anova

1. Melakukan pemeriksaan data
 Data wajib terdistribusi normal
 Data wajib memiliki varians yang sama
2. Jika data memenuhi persyaratan tersebut  data parametrik
maka uji statistik yang dipilih adalah uji Anova.
3. Melakukan transformasi data jika persyaratan tidak
terpenuhi dengan tujuan agar data menjadi distribusi normal
dan varians menjadi sama.
166
4. Jika transformasi tidak berhasil maka dipilih uji alternatif
yaitu uji Kruskal wallis.
5. Jika hasil uji Anova atau Kruskal wallis didapatkan nilai p
<0.05 maka diteruskan dengan analisis multiple comparison
atau Post Hoc.
Langkah Uji Anova dengan SPSS

1. Uji normalitas
Langkah uji normalitas
- Buka file data set kolesterol dan IMT
- Pada toolbar Analyze  Descriptive statistics 
Explore
- Masukkan data kolesterol sebagai dependent list dan

factor list adalah indeks massa tubuh.
- Pada plots centang normality plots with test
167
- Kemudian klik Continue lanjutkan klik OK
Case Processing Summary
IMT Cases
Valid Missing Total
N Percent N Percent N Percent
Kolesterol Normal 20 100.0% 0 .0% 20 100.0%
Overweight 20 100.0% 0 .0% 20 100.0%
Obese 20 100.0% 0 .0% 20 100.0%
Descriptives
IMT Std.
Statistic Error
Kolesterol Normal Mean 188.60 3.442
95% Confidence Lower Bound 181.40
Interval for Mean Upper Bound 195.80
5% Trimmed Mean 188.17
Median 186.00
Variance 236.884
Std. Deviation 15.391
Minimum 165
Maximum 220
Range 55
Interquartile Range 27
Skewness .426 .512
168
Kurtosis -.718 .992
Overweight Mean 209.75 3.507
Median 207.50
Variance 245.987
Minimum 185
Maximum 240
Range 55
Skewness .392 .512
Kurtosis -.756 .992
Obese Mean 232.25 2.797
Median 230.00
Variance 156.513
Minimum 210
Maximum 255
Range 45
Skewness .346 .512
Kurtosis -.592 .992
Tests of Normality
IMT Kolmogorov-Smirnova Shapiro-Wilk
Statistic Df Sig. Statistic df Sig.
Kolesterol Normal .114 20 .200* .959 20 .516

169
Overweight .127 20 .200* .955 20 .457
Obese .169 20 .137 .937 20 .211
a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.
Analisis Hasil uji normalitas

Hasil uji normalitas dengan Shapiro Wilk (n < 50)
menunjukkan bahwa distribusi ketiga kelompok adalah normal
(nilai p>0.05), hal ini menunjukkan bahwa data masuk kategori
data normal.
2. Uji Varians
Data kemudian dilakukan pemeriksaan uji varians. Uji yang
sering digunakan adalah dengan uji Levene.
Langkah uji Levene
- Buka file data set kolesterol dan IMT.
- Pada toolbar Analyze  Compare means  One way
Anova
- Masukkan data kolesterol pada kotak dependent list
sedangkan factor diisikan IMT.
- Klik Options dan centanglah Homogeneity of variance
test
- Klik Continue kemudian OK.
170
- Hasil ouput analisis didapatkan data di bawah ini.
Test of Homogeneity of Variances

Kolesterol
Levene Statistic df1 df2 Sig.
.512 2 57 .602
ANOVA
Kolesterol
Sum of Squares df Mean Square F Sig.
Between Groups 19059.300 2 9529.650 44.713 .000

Within Groups 12148.300 57 213.128
Total 31207.600 59
Analisis Hasil uji homogenitas varians
Tingkat kemaknaan dari uji homogenitas varians

menunjukkan angka 0.602. Oleh karena p >0.05 maka data
ditarik kesimpulan bahwa varians dari dua kelompok atau
lebih adalah sama atau homogen. Karena varians data
homogen, maka uji Anova yang ada pada tabel berikutnya
adalah VALID. Pada tabel hasil Anova nilai p= 0,000 yang
artinya “Paling tidak terdapat peredaan kadar kolesterol
yang bermakna pada dua kelompok”.
3. Uji Multiple Comparison Analysis (MCA) atau Post Hoc

Uji ini dilakukan jika setelah dilakukan analisis uji Anova
terdapat perbedaan bermakna pada rerata populasi. Uji
171
MCA yang sering digunakan adalah LSD, Benferoni atau
Tukey. Uji ini juga dikenal dengan uji Post-Hoc. Hasil uji Post
Hoc data kolesterol dengan post hoc LSD ada pada tabel
berikut.
Langkah uji multiple comparison atau Post Hoc
- Buka file data set kolesterol dan IMT
- Pada toolbar Analyze  Compare means  One way
Anova
- Masukkan data kolesterol pada kotak dependent list
sedangkan factor diisikan IMT.
- Klik Post hoc dan centanglah LSD pada kotak Equal
Variances Assumed
- Klik Continue kemudian OK
- Hasil output analisis ada di bawah ini.

Multiple Comparisons
Kolesterol
LSD
(I) IMT (J) IMT 95% Confidence
Mean Interval
Difference Std. Lower Upper

(I-J) Error Sig. Bound Bound
Normal Overweight -21.150* 4.617 .000 -30.39 -11.91
Obese -43.650* 4.617 .000 -52.89 -34.41

Overweight Normal 21.150* 4.617 .000 11.91 30.39
Obese -22.500* 4.617 .000 -31.74 -13.26
172
Obese Normal 43.650* 4.617 .000 34.41 52.89
Overweight 22.500* 4.617 .000 13.26 31.74
*. The mean difference is significant at the 0.05 level.
Analisis Hasil post hoc

Dari hasil post hoc didapatkan hasil
 Kelompok dengan indeks massa tubuh normal dengan
overweight didapatkan nilai p = 0.000, confidence
interval 95% tidak tercakup nilai 0
 Kelompok dengan indeks massa tubuh normal dengan
obese didapatkan nilai p = 0.000, confidence interval
95% tidak tercakup nilai 0
 Kelompok dengan indeks massa tubuh overweight
dengan obese didapatkan nilai p = 0.000, confidence
interval 95% tidak tercakup nilai 0.
Dari hasil ini dapat ditarik kesimpulan perbedaan kadar
kolesterol darah berbeda secara bermakna pada semua
indeks massa tubuh.
C. Uji Kruskal Wallis
Uji Kruskal Wallis adalah salah satu pilihan uji yang

digunakan untuk uji hipotesis komparatif variabel numerik
dengan data sebaran tidak normal lebih dari dua kelompok
tidak berpasangan. Uji ini dapat dilakukan jika persyaratan data
pada kategori data parametrik atau persyaratan uji Anova tidak
dapat terpenuhi atau transformasi data untuk mengupayakan
distribusi data menjadi normal tidak berhasil.
173
Ilustrasi Kasus Uji Kruskal Wallis
Anda ingin mengetahui apakah ada perbedaan lama tidur
dalam 1 minggu pada kelompok dengan kecemasan ringan,
sedang dan berat dengan jumlah pasien masing-masing 20
orang. Pertanyaan penelitian yang anda susun “Apakah
terdapat perbedaan lama tidur antara kelompok dengan
kecemasan ringan, sedang dan berat?.”
Langkah Menjawab Pertanyaan

Sesuai dengan panduan pada uji Anova sebelumnya
terdapat beberapa langkah yang harus dijalankan untuk dapat
menjawab pertanyaan tersebut dengan benar, yaitu :
1. Menentukan variabel yang dihubungkan  pada
penelitian ini variabel yang dihubungkan variabel bebas
derajat kecemasan dan variabel terikat adalah lama tidur
dalam 1 minggu.
2. Menentukan jenis hipotesis  pada penelitian ini jenis
hipotesis yang digunakan adalah hipotesis komparatif.
3. Menentukan jenis skala variabel  pada penelitian ini
skala yang digunakan adalah skala numerik.
4. Menentukan jenis data/kelompok berpasangan atau tidak
berpasangan  pada penelitian ini jenis data tidak
berpasangan.
5. Menentukan jenis kelompok  pada penelitian ini
terdapat kelompok > 2 yaitu ada 3 kelompok
(kecemasan ringan, sedang dan berat).
6. Menentukan jenis uji yang digunakan  Jika memenuhi
persyaratan data parametric maka menggunakan uji one
way Anova, namun jika data tidak terpenuhi maka
menggunakan uji Kruskal wallis.
174
Langkah melakukan Uji Kruskal Wallis
1. Melakukan pemeriksaan data ditemukan :
 Data terdistribusi tidak normal atau
 Data tidak homogen (varians berbeda)
2. Setelah dilakukan transformasi data tidak berhasil
membuat distribusi normal dan varians menjadi sama.
3. Jika hasil uji Kruskal wallis didapatkan nilai p <0.05 maka
diteruskan dengan analisis multiple comparison atau
Post Hoc.
Langkah Uji Kruskal Wallis dengan SPSS

1. Uji normalitas
Langkah uji normalitas sama seperti uji normalitas di uji
Anova. Dari data set lama tidur dalam 1 minggu dengan
jumlah sampel 20 pada masing-masing kelompok dilakukan
uji normalitas pada data. Data durasi tidur sebagai
dependent list dan factor list adalah derajat kecemasan
dimasukkan dalam analisis SPSS.
TingkatCemas Cases
Valid Missing Total
N Percent N Percent N Percent
Durasitidur Ringan 20 100.0% 0 .0% 20 100.0%
dimension1
Sedang 20 100.0% 0 .0% 20 100.0%
Berat 20 100.0% 0 .0% 20 100.0%
175
Descriptives
TingkatCemas Std.
Statistic Error
Durasitidur Ringan Mean 41.10 1.271


Median 41.00
Variance 32.305
Minimum 32
Maximum 52
Range 20
Skewness -.037 .512
Kurtosis -.781 .992
Sedang Mean 39.55 1.042

Median 40.00
Variance 21.734
Minimum 30
Maximum 48
Range 18
Skewness -.271 .512
Kurtosis -.342 .992
Berat Mean 26.00 1.789

176
Median 23.00
Variance 64.000
Minimum 16
Maximum 40
Range 24
Skewness .510 .512
Kurtosis -1.188 .992
Tests of Normality
TingkatCemas Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Durasitidur Ringan .095 20 .200* .967 20 .694
dimension1
Sedang .150 20 .200* .977 20 .897
Berat .191 20 .053 .893 20 .031
a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.
Analisis Hasil uji normalitas

Dari hasil uji normalitas pada data set pada tabel uji
Saphiro wilk didapatkan terdapat dua data dengan nilai p >
0.05 dan satu data dengan nilai p < 0.05. Hal ini
menunjukkan bahwa data yang dimiliki tidak terdistribusi
normal. Sehingga uji Anova pada data penelitian ini tidak
terpenuhi. Selanjutnya akan dilakukan uji Kruskal Wallis
sebagai pilihannya. Uji homogenitas tidak perlu dilakukan
karena apapun hasilnya jika salah satu uji telah
menunjukkan tidak memenuhi persyaratan parametrik maka
uji tersebut pasti akan menggunakan pilihan uji untuk data
non parametric.
177
2. Transformasi data
Langkah selanjutnya adalah melakukan transformasi
data dengan tujuan distribusi data menjadi normal.
Kemudian dilanjutkan dengan melakukan uji normalitas
kembali variabel hasil transformasi.
Catatan: Pada data ini setelah dilakukan transformasi

(diasumsikan) ternyata tidak berhasil.
3. Uji Kruskal Wallis

Langkah Uji Kruskal Wallis pada program SPSS
 Pada toolbar pilih Analyze  Nonparametric test 
k-independent samples
 Memasukkan durasi tidur ke dalam test variabel list

 Berikan check pada uji Kruskal-wallis
 Masukkan tingkat kecemasan ke dalam grouping
variable.
178
 Masukkan Define range
- Masukkan kode 1 (untuk kecemasan ringan)
- Masukkan kode 3 (untuk kecemasan berat)
 Setelah selesai klik Continue, lalu klik OK.
 Hasil Output Analisis
Ranks
TingkatCemas N Mean Rank
Durasitidur Ringan 20 40.70
Sedang 20 37.13
dimension1
Berat 20 13.68
Total 60
Test Statisticsa,b
Durasitidur
Chi-square 28.411
Df 2
Asymp. Sig. .000
a. Kruskal Wallis Test

b. Grouping Variable:
TingkatCemas
Analisis Hasil uji Kruskal wallis

Dari tabel uji Kruskal wallis didapatkan nilai p = 0.000
(p<0.05). Sehingga dapat diambil kesimpulan “paling tidak
terdapat perbedaan lama tidur selama 1 minggu antara dua
kelompok”.
179
Agar kita bisa mengetahui kelompok mana yang memiliki
perbedaan maka langkah selanjutnya adalah melakukan uji
multiple comparison atau post Hoc. Uji yang digunakan
adalah dengan uji Mann-whitney. Dalam uji ini kita
melakukan uji beda antara kelompok kecemasan ringan
dengan sedang, kelompok ringan dengan berat dan
kelompok sedang dengan berat.
4. Uji Post Hoc

Uji yang digunakan adalah uji Mann-Whitney. Pada data
tersebut dilakukan analisis dengan urutan sebagai berikut :
a. Uji Mann Whitney antara kelompok kecemasan ringan
dengan kecemasan sedang
Lakukan prosedur :
 Pada toolbar pilih Analyze  Non parametric test  2
independent samples
 Masukkan variabel durasi tidur pada test variable

180
 Masukkan variabel tingkat kecemasan ke dalam
grouping variable
 Berikan centang pada uji Mann-Whitney.
 Klik kata Define group
- Masukkan angka 1 (Kode kecemasan ringan)
- Masukkan angka 2 (Kode kecemasan sedang)
 Klik Continue lalu OK
 Hasil output analisis
Ranks
TingkatCemas N Mean Rank Sum of Ranks
Durasitidur Ringan 20 22.20 444.00
dimension1
Sedang 20 18.80 376.00
Total 40
Test Statisticsb
Durasitidur
Mann-Whitney U 166.000
Wilcoxon W 376.000
Z -.924
Asymp. Sig. (2-tailed) .356
Exact Sig. [2*(1-tailed Sig.)] .369a
a. Not corrected for ties.

b. Grouping Variable: TingkatCemas
181
b. Uji Mann Whitney antara kelompok kecemasan ringan
dengan kecemasan berat.
Lakukan prosedur yang sama dengan point a:
 Analyze  Non parametric test  2 independent
samples
grouping variable
 Klik kata Define group
- Masukkan angka 1 (Kode kecemasan ringan)
- Masukkan angka 3 (Kode kecemasan berat)
Ranks
Durasitidur Ringan 20 29.00 580.00
dimension1
Berat 20 12.00 240.00
Total 40
182
Test Statisticsb
Durasitidur
Wilcoxon W 240.000
Z -4.610
c. Uji Mann Whitney antara kelompok kecemasan sedang

dengan kecemasan berat.
Lakukan prosedur yang sama dengan point a atau b:
 Analyze  Non parametric test  2 independent
samples
grouping variable
 Klik kota Define group
- Masukkan angka 2 (Kode kecemasan sedang)
- Masukkan angka 3 (Kode kecemasan berat)
183
Ranks
Durasitidur Sedang 20 28.83 576.50
dimension1
Berat 20 12.18 243.50
Total 40
Test Statisticsb
Durasitidur
Wilcoxon W 243.500
Z -4.517

Analisis Hasil uji Mann-whitney

Dari uji Mann-whitney yang telah dilakukan dapat diperoleh hasil
sebagai berikut :
1. Kelompok kecemasan ringan dan sedang, nilai p = 0.369
2. Kelompok kecemasan ringan dan berat, nilai p = 0.000
3. Kelompok kecemasan sedang dan berat, nilai p = 0.000
Dengan demikian dapat diambil kesimpulan terdapat perbedaan
durasi/lama tidur selama 1 minggu dengan tingkat kecemasan
yaitu antara kelompok kecemasan ringan dengan kecemasan
berat, dan antara kelompok kecemasan sedang dengan
kecemasan berat. Sedangkan antara kelompok kecemasan ringan
dan kecemasan sedang tidak terdapat perbedaan dalam
durasi/lama tidur selama 1 minggu.
184
Pertanyaan Latihan
26. Sebutkan apa sajakah syarat dilakukan uji statistik
Anova?
27. Kapan analisis statistik uji Kruskal wallis digunakan?
28. Apakah yang dimaksud dengan uji multiple comparison
atau post hoc dan bagaimana cara analisisnya?
29. Pada hasil uji Kruskal wallis yang menunjukkan hasil
bermakna, uji statistik apakah yang selanjutnya dipilih?
Referensi
Analisis of Varians (Anova) Uji F uji beda mean tiga atau lebih
sampel. Oleh: Roni Saputra, M.Si - PDF Free Download
[Internet]. [cited 2020 Dec 3]. Available from:
https://docplayer.info/77270578-Analisis-of-varians-
anova-uji-f-uji-beda-mean-tiga-atau-lebih-sampel-oleh-
roni-saputra-m-si.html
Cara Melakukan Uji Homogenitas dengan SPSS beserta
Contoh Lengkap [Internet]. SPSS Indonesia. [cited 2020
Dec 3]. Available from:
https://www.spssindonesia.com/2014/02/uji-homogenitas-
dengan-spss.html
Dahlan, Sopiyudin. (2018). ‘Pintu Gerbang Memahami
Epidemiologi Statistik, Dan Metode Penelitian', Edisi 2,
Cetakan 2. Jakarta : PT Epidemiologi Indonesia
Dahlan, Sopiyudin. (2014). 'Statistik Untuk Kedokteran Dan
Kesehatan Deskriptif, Bivariat, dan Multivariat Dilengkapi
Aplikasi Mengunakan SPSS' Edisi 6, Cetakan 11, Jakarta
: PT Epidemiologi Indonesia
Sastroasmoro, Sudigdo. (2011). ‘Dasar-dasar Metodologi
Penelitian Klinis’, Edisi 4, Jakarta : Sagung Seto
Sugiyono. 2016. ‘Statistika Untuk Penelitian’, Cetakan 27,
Bandung : Penerbit Alfabeta
Sunyoto, Danang. (2014). 'Analisis Data Penelitian Kesehatan
Dengan SPSS', Cetakan I. Yogyakarta : Nuha Medika
Tyastirin, Esti, (2017). ‘Statistik Parametrik untuk Penelitian
kesehatan, Cetakan I, Program Studi Arsitektur UIN
Sunan Ampel, Surabaya
Uji ANOVA - One Way Anova dalam SPSS - Uji Statistik
185
[Internet]. [cited 2020 Dec 3]. Available from:
https://www.statistikian.com/2012/11/one-way-anova-
dalam-spss.html
186
BAB IX
ANALISIS KOMPARATIF DATA
KATEGORIK LEBIH DARI 2 SAMPEL
BERPASANGAN
dr. Hari Peni Julianti, M.Kes, Sp.KFR(K), FISPH, FISCM *

*Bagian IKM-IKP Fakultas Kedokteran, Universitas Diponegoro (UNDIP)
Semarang
*e-mail: hari_peni@yahoo.com
Tujuan Pembelajaran
Cochrane dan menginterpretasikan hasil uji.
Ringkasan
Analisis komparatif data kategorik lebih dari 2 sampel
berpasangan merupakan uji statistik yang bertujuan untuk
mengetahui perbedaan mean/ rerata lebih dari 2 kelompok
data yang berpasangan (dependen). Bab ini memberikan
pengalaman belajar kepada mahasiswa mulai dari entry data
ke software SPSS (Statistical Product and Service Solutions),
melakukan uji dengan uji Cochrane serta cara melakukan
interpretasi hasil uji sehingga dapat menyimpulkan hasil
analisisnya.
Pesan dalam Belajar

Untuk mempelajari bab ini, mahasiswa sangat perlu
memahami secara urut dari awal sampai dengan akhir bab
187
Bab. Pada akhir pembelajaran, jawablah pertanyaan-
pengetahuan dan pemahaman dari mempelajari bab ini.
Materi Belajar
A. Pengantar Analisis Komparatif Data Numerik
2 Sampel Berpasangan
Sebagaimana halnya dengan uji dua sampel berkaitan/
berpasangan, pengujian k sampel berkaitan dilakukan pada
tiga kelompok atau lebih (k sampel). Sampel berkaitan/
berhubungan/ berpasangan mengandung arti semua sampel
diambil berdasarkan pada karakteristik populasi yang sama
atau populasi yang identik. Data dapat diperoleh dari sampel
yang sama yang memperoleh k perlakuan atau pada k kondisi
yang berbeda sehingga setiap subyek menjadi 'pengontrol'
bagi dirinya sendiri terhadap berbagai macam kondisi. Yang
kedua, subyek pada k kelompok yang berbeda dan
dipasangkan ke dalam k kelompok atau diperlakukan ke
dalam k kondisi yang berbeda. Contoh uji data lebih dari dua
sampel berhubungan adalah uji Cochrane dan Uji Friedman.
B.Uji Data Lebih Dari Dua Sampel Berhubungan

(Dependen)
Salah satu alat statistik non-parametrik untuk pengujian dua
sampel atau lebih yang berhubungan (paired samples) adalah
dengan menggunakan Uji Cochrane. Uji Cochrane digunakan untuk
188
mengukur/ menilai tiga sampel atau lebih dengan catatan reaksi
(hasil) terhadap suatu perlakuan hanya dinyatakan dalam dua nilai,
yaitu 0 dan 1. Karena itu, Uji Cochrane dilakukan pada penelitian
untuk uji sampel yang mempunyai data berskala nominal
(kategorik).
Kasus:
Dokter Puskesmas Ramai sedang mempertimbangkan tiga mesin
mana yang dirasakan paling memuaskan analis laboratorium
sederhana yang berkerja di Puskesmas. Dokter memutuskan untuk
mengambil 8 orang analis sebagai sampel, dan masing-masing
analis diminta menilai 3 mesin tersebut. Tiap analis memberi
penilaian sebagai berikut:
o Angka 0 jika Mesin dirasakan tidak memuaskan
o Angka I jika Mesin dirasakan memuaskan.
Berikut adalah hasil penilaian kedelapan analis laboratorium:

Pasien Mesin A Mesin B Mesin C
1 0 0 1
2 0 1 0
3 1 1 0
4 1 1 1
5 1 0 0
6 0 0 1
7 0 1 1
8 0 1 0
NB: Keterangan pada baris pertama. Analis nomor satu

menilai Mesin A adalah 0 (tidak memuaskan kinerja
mesinnya), Mesin B juga dengan 0, dan Mesin C dengan
1 (memuaskan kinerjanya). Demikian seterusnya untuk
189
data yang lain. Perhatikan bahwa input data hanya ada
dua, yaitu 1 atau O.
Penyelesaian:
Di sini akan dilihat apakah ketiga mesin memberikan
kepuasan yang relatif sama?
1. Pemasukan Data ke SPSS

 Menu File → New → Data.
 Kemudian klik mouse pada sheet tab Variable View.
 Pengisian variabel MESIN A:
→ Name. Sesuai kasus, ketik mesin_a.
Pengisian variabel MESIN B:
→ Name. Sesuai kasus, ketik mesin b.
Pengisian variabel MESIN C:
→ Name. Sesuai kasus, ketik mesin_c.
 Abaikan bagian yang lain, dan tekan CTRL-T untuk
kembali ke DATA VIEW.
2. Mengisi Data
 Untuk mengisi Kolom mesin_a, letakkan pointer pada
baris I kolom tersebut, lalu ketik menurun sesuai data
penilaian Mesin A (8 data). Demikian seterusnya hingga
ketiga kolom terisi dengan masing-masing 8 baris
sesuai dengan di kasus di atas. Data di atas disimpan
dengan prosedur nama Cochrane
3. Pengolahan Data dengan SPSS
Langkah-langkah:
 Buka file Cochrane.
 Menu Analyze → Nonparametric Tests → Legacy
Dialogs → k Related Samples...
190
 Tampak di layar kotak dialog, dengan pengisian:
→Test Variable List; masukkan variabel mesin_a,
mesin_b, dan mesin_c.
→Untuk Test Type atau tipe uji, karena dalam kasus
akan diuji dengan Cochrane, maka klik mouse pada
pilihan Cochrane.
 Tekan OK untuk proses data.
Output SPSS dan Analisis

Berikut output dari test Cochrane:
Analisis Hipotesis
Hipotesis untuk kasus ini:
191
 H0 = Semua perlakuan mempunyai efek yang Sama. Atau,
dalam kasus ini ketiga mesin mempunyai kinerja yang sama.
 Hi = Tidak semua perlakuan mempunyai efek yang sama.
Atau, dalam kasus ini ketiga mesin mempunyai kinerja yang
berbeda.
Pengambilan Keputusan
Dengan membandingkan Statistik Hitung dengan Statistik tabel
 Jika Statistik Hitung < Statistik Tabel, maka H0 diterima.
 Jika Statistik Hitung > Statistik Tabel, maka H0 ditolak.
Mendapatkan Statistik Hitung

Dari tabel output di atas terlihat bahwa statistik hitung Cochrane Q
adalah 0,333.
Mendapatkan Statistik Tabel

Disini digunakan tabel Chi-square sebagai pembanding. Dengan
melihat tabel Chi-square, untuk df (derajat kebebasan) = k — 1 = 3
— 1 = 3 dan tingkat signifikansi (u) = 5%, maka didapat Statistik
tabel = 5,991.
Keputusan:
Karena Statistik Hitung < Statistik Tabel (0,333 > 5,991), maka H0
diterima.
Berdasarkan Probabilitas
o Jika probabilitas > 0,05, maka H0 diterima.
o Jika probabilitas < 0,05 maka H0 ditolak.
192
Keputusan:
Terlihat bahwa pada kolom asymp. Sig / asymptotic significance
adalah 0,846 atau probabilitas di atas 0,05 (0,846 > 0,05). Maka H0
diterima, atau ketiga Mesin memberikan kinerja yang relatif
sama.
Pertanyaan Latihan
1. Analisis kategorik lebih dari 2 sampel berpasangan dapat
digunakan uji…
a. T-paired test
b. Wilcoxon
c. Chi-square
d. Cochrane
e. Saphiro-wilk
2. Skala yang sapat dipakai dalam uji Cochrane adalah…
a. Nominal
b. Ordinal
c. Numerik
d. A dan B
e. A, B, dan C
3. Interpretasi P<0,05 adalah…
a. H0 diterima
b. H0 ditolak
c. H1 ditolak
d. H0 ditolak, H1 ditolak
e. Semua salah
4. Apakah yang dimaksud dengan makna confidence interval

95%?
a. Tingkat kebenaran 95%
193
b. Tingkat kebenaran 5%
c. Tingkat kesalahan 5%
d. Tingkat kesalahan 95%
e. A dan C
5. Uji Cochrane merupakan perluasan dari uji…
a. McNemar
b. Wilcoxon
c. ANOVA
d. T berpasangan
e. T-independen
Referensi
Santoso S. Menguasai Statistik Dengan SPSS. Jakarta:

Elex Media Komputindo; 2019. 480 p.
Heryana A. Uji McNemar dan Uji Wilcoxon (Uji Hipotesa

Non-Parametrik Dua Sampel Berpasangan). Jakarta:
Universitas Esa Unggul. 2020;(May):3–8.
Oswari T. Uji Data Tiga atau Lebih Sample Berhubungan

( Dependent ). 2005;1–6.
194
BAB X
ANALISIS KOMPARATIF
DATA KATEGORIK 2 SAMPEL TIDAK
BERPASANGAN
dr. Ratnawati, M.Kes*
*Bagian IKM Fakultas Kedokteran, Universitas Islam Sultan Agung
*e-mail: ratnawati@unissula.ac.id
Tujuan Pembelajaran
1. Mahasiswa mampu melakukan analisis dan menginterpretasi-kan
Uji Chi square.
2. Mahasiswa mampu melakukan analisis dan menginterpretasi-kan
Uji Fisher.
3. Mahasiswa mampu menjawab pertanyaan Latihan.
Ringkasan
Analisis uji komparatif kategorik tidak berpasangan digunakan
untuk menguji hipotesa pada uji statistik variabel dengan skala data
kategorik (Nominal dan ordinal). Disebut Analisis komparatif karena
tujuan analisis untuk mengetahui hubungan dengan
membandingkan selisih proporsi. Disebut tidak berpasangan karena
pengukuran variabel pada sampel hanya sekali. Pada Bab ini akan
membahas uji komparatif kategorik tidak berpasangan meliputi uji
Chi Square (Uji Kai - Kuadrat (Uji X2) dan Uji Fisher. Pada bab ini
juga dibahas bagaimana menghitung Expected Count, PR, OR, RR
secara manual dan melakukan analisis SPSS dengan disertai cara
membaca hasil output SPSS (Statistical Product and Service
Solutions). Analisis dilakukan dengan mengunakan software
statistik SPSS.
195
Pesan dalam Belajar
Pemahaman isi bab akan didapatkan dengan membaca isi bab
dari awal bab sampai akhir bab secara berurutan. Pada akhir
pembelajaran, jawablah pertanyaan-pertanyaan pada latihan untuk
menguji seberapa besar pengetahuan dan pemahaman yang
mahasiswa dapatkan dari mempelajari bab ini.
Materi Belajar
A. Pengantar Analisis Uji Komparatif Kategorik
Tidak Berpasangan
Uji komparatif kategorik digunakan untuk menganalisis atau
menguji penelitian dengan hipotesa hubungan variabel bebas dan
terikat skala data kategorik dengan cara membandingkan. Adapun
yang dilakukan perbandingan adalah persamaan dan perbedaan
dua atau lebih fakta/sifat obyek yang diteliti berdasarkan kerangka
pemikiran tertentu.
Tujuan dari analisis komparasi ada beberapa, anatara lain:
1. Membandingakan persamaan dan perbedaan dua atau lebih
fakta/sifat obyek yang diteliti.
2. Membuat generalisasi tingkat perbandingan.
3. Membantu dalam menentukan pilihan mana yang yang lebih baik
atau mana yang sebaiknya dipilih.
4. Membantu mengetahui kemungkinan sebab akibat berdasarkan
hasil pengamatan terhadap akibat yang ada dan mencari kembali
faktor yang mungkin menjadi penyebab melalui data hasil
pengamatan.
Dalam menentukan pilihan analisis yang digunakan kita harus,
kita harus mengetahui:
1. Tujuan Penelitian
196
2. Skala data variabel
3. Jenis hipotesa yang diharapkan.
Berikut adalah contoh skenario penelitian yang bisa digunakan
untuk memahami isi bab ini.
Skenario:
Mahasiswa akan melakukan penelitan tentang “Pengaruh status
marital terhadap kejadian stunting pada balita“. Desain yang
digunakan adalah cross sectional.
Untuk menentukan analisis yang digunakan maka kita harus
melakukan identifikasi dengan langkah-langkah sebagai berikut:
1. Tujuan Penelitian:
- Untuk mengetahui hubungan status marital ibu dengan
kejadian stunting pada anak balita
- Mengetahui besarnya faktor risiko
2. Skala data:
a. Variabel bebas:
- Status Marital: Janda dan bersuami
- Skala data: Nominal
b. Variabel Terikat: Kejadian Stunting
- Stunting: - Ya : HAZ < -2 SD
- Tidak : HAZ ≥ -2 SD
- Skala Data: Ordinal
3. Hipotesis: Asosiasi Komparatif

Berdasarkan tujuan variabel yang ingin dicapai oleh peneliti
untuk mengetahui hubungan dengan membandingkan proporsi
maka peneliti bisa memilih Uji komparatif.
197
Hipotesa penelitan
a. Ho : Tidak terdapat hubungan yang signifikan antara status
marital ibu dengan kejadian stunting pada anak balita.
b. Ha : Terdapat hubungan yang signifikan antara status marital
ibu dengan kejadian stunting pada anak balita.
Uji hipotesa dapat dilakukan dengan memilih uji analisis
seperti pada Tabel 10.1 dibawah ini
Tabel 10.1. Pilihan Uji Komparatif Kategorik Tidak Berpasangan

Tabel Skala Data Hipotesis Asosiasi Komperatif
Tidak Berpasangan
Syarat X2 Terpenuhi Syarat X2 Tidak Terpenuhi
2x2 Kategorik Chi Square Fisher
dengan koreksi Yates
K: Skala Proporsi: Proporsi:
2xK data Chi Square + Pos hoc beberapa tabel 2x2
ordinal
Trend: Chi Square for Trend Trend: Mann-Whitney
K: Skala Chi Square Pengabungan sel
data
nominal
BxK Salah satu Proporsi: Proporsi:
> 2 x >2 Ordinal Chi Square + Pos hoc Beberapa tabel B x K
Trend: Trend:
Chi Square for Trend + Post hoc Kruskal Walls + Post hoc
Pengabungan sel
Nominal Chi Square + Pos hoc Tidak dapat digaubungan
⇨Beberapa Tabel B x K
Pengabungan sel Tabel

BxK
K = Kolom (Variabel Terikat); B = Baris (Variabel Bebas)
B. Uji Chi Square (Uji Kai Kuadrat / X2)

Uji Chi Square nama lainnya adalah Kai Kuadrat (X 2) digunakan
untuk menguji hipotesis komparatif dua sampel bila skala data
kategorik dan sampel besar.
198
1. Tujuan Uji Chi Square
Tujuan pengunaan uji ini adalah sebagai berikut:
a. Menguji ketidaktergantungan (independence) atau hubungan
(association) antara dua variabel.
b. Menguji homogenitas apakah dua variabel berasal dari
populasi yang sama.
c. Menguji kesesuaian (goodnes of fit), apakah suatu sampel
berasal dari suatu populasi yang berdistribusi tertentu.
d. Untuk menguji proporsi, apakah proporsi kedua kelompok
sampel ada perbedaan.
2. Persyaratan uji Chi Square

Syarat uji Chi Square adalah sebagai berikut:
a. Tidak ada cell dengan nilai frekwensi / Actual count (FO) / nilai
observed 0 (nol).
b. Apabila tabel kontingensi 2x2, maka tidak boleh ada cell yang
memiliki frekwensi harapan atau disebut juga expected count
(FE) yang kurang dari 5
c. Apabila bentuk tabel lebih dari 2x2, misal 2x3 (2xK) atau 3x2
(BX2) maka jumlah cell dengan expected count yang kurang
dari 5 tidak boleh lebih dari 20%.
3. Prinsip pengujian
a. Membandingkan frekwensi teramati (O: Observed value)
dengan frekwensi yang diharapkan (E: Expected value).
Asumsi yang digunakan adalah:
1) Ho = O=E
2) Jika perbedaan O dan E cukup besar (significant), maka
dapat disimpulkan:
199
b. Ada ketergantungan / hubungan antara kedua variabel yang
diuji
c. Kedua variabel yang diuji berasal dari populasi yang sama
(homogen)
d. Sampel yang diuji tidak berasal dari populasi yang
berdistribusi normal
Jika syarat Uji Chi Square tidak terpenuhi maka bisa

digunakan uji alternative yaitu Uji Fisher.
Adapun syarat uji Fisher Tabel Kontigensi harus 2x2 (2 Baris
X 2 Kolom), sedangkan pada Uji Chi Square tabel bisa > 2x2
(Bisa 3x2, 2x3 atau lebih) sehingga tabel harus
disederhanakan menjadi tabel 2x2 jika harus mengunakan
uji Fisher.
Beberapa istilah yang harus dimengerti untuk memahami syarat

uji Chi Square adalah cell, Actual count (FO) / nilai observed 0
(nol) dan expected count (FE). Pada Tabel 10.2 dan Tabel 10.3
akan membantu kita memahami istilah tersebut.
Pada prinsipnya uji hipotesis berbentuk Tabel kontigensi BXK
(Baris X Kolom). Pembuatan tabel BXK ini dengan aturan
sebagai berikut:
B = Variabel Bebas (Pada contoh dibawah ini variabel
bebasnya adalah Status Marital dan pendidikan)
K = Variabel Terikat (Pada contoh dibawah ini variabel
terikatnya adalah stunting)
200
Tabel 10.2 Contoh Tabel Kontigensi 2X2 (2 Baris X 2 Kolom)
Stunting Jumlah
Ya Tidak
Status Janda a b a+b
Marital Bersuami c d c+d
Jumlah a+c b+d
Keterangan: cell : Kotak a, b, c, d
Observed : nilai a, b, c, d
Jumlah cell : 4 kotak
Tabel 10.3 Contoh Tabel Kontigensi 3x2 (3 Baris X 2 Kolom)

Stunting Jumlah
Ya Tidak
Pendidikan Rendah (SD-SLTP) a b a+b
Sedang (SLTA) c d c+d
Tinggi (PT) e f e+f
Jumlah a+c+e b+d+f a+b+c+d+e+f
Untuk menghitung expected count perhatikan dibawah ini:

Dari skenario penelitian diatas didapatkan hasil pengumpulan
data dan entri data (Entri data ke SPSS langkahnya seperti
pada BAB Uji korelasi) didapatkan hasil sebagai berikut:
Ibu yang bersuami ada 70 orang, terdiri dari 62 anak tidak
mengalami stunting dan 8 anak mengalami stunting.
Ibu yang bestatus janda ada 30 orang, terdiri dari 10 anak
tidak mengalami stunting dan 20 anak mengalami stunting.
Maka jika data dimasukkan dalam tabel kontingensi akan
tampak seperti 10.3.
Penentuan letak cell a, b, c, d dengan dasar bahwa cell a
secara teori merupakan faktor resiko positif dan efek juga
positif. Berdasarkan skenario diatas, secara teori yang
berisiko mempunyai anak stunting adalah Janda dan yang
merupakan efek positif masalah dari stunting. Jika efek positif
yang diharapkan adalah tidak stunting maka faktor risiko
201
adalah bersuami. Jika dengan SPSS cukup meletakkan
variabel Status marital pada Row dan Stunting Pada Colom
(Lihat Tabel 10.4)
Tabel 10.4 Tabel Silang Status Marital dengan Stunting

Stunting Total
Ya Tidak
Status Janda 20 10 30
Marital Bersuami 8 62 70
Total 30 70 100
1. Syarat FO (Nilai observed a = 20 ; b= 10 ; c=8 ; d = 62 )

sel tidak ada yang nol
2. Syarat nilai expected count (FE)
Rumus menghitung expected count (FE)
fe = (∑ Baris X ∑ Kolom) / Total
Nilai expected count sel a = (30x30) / 100 = 9

Nilai expected count sel b = (30x70)/100 = 21
Nilai expected count sel c = (30x70)/100 = 21
Nilai expected count sel d = (70x70)/100 = 49
Berdasarkan syarat pertama dan hitungan expected count

(FE) sel a, b, c, d semuanya menunjukkkan hasil > 5.
Dengan demikian memenuhi syarat mengunakan Uji Chi
Square.
202
4. Uji Chi Square Pada Pengujian Komparattif Asosiasi
(Hubungan) Mengunakan SPSS
Berdasarkan skenario diatas (Pada sub bab pengantar pada
bab ini) maka langkah-langkah yang dilakukan adalah sebagai
berikut:
a. Membuka SPSS, Klik Variabel View ⇨isikan variabel nama,

status marital, pendidikan dan stunting
b. Entri data dengan klik data view dan isikan pada kolom nama,
status marital, pendidikan dan stunting
c. Langkah-langkah pembuatan tabel kontingensi pada SPSS.
Untuk Posisi Efek stunting dan faktor risiko janda di cell a
maka harus diberi value 1 pada stunting dan pada janda (Lihat
Gambar 10.1)
Gambar 10.1 SPSS pemberian value untuk status marital
Gambar 10.2 SPSS pemberian value untuk stunting
203
d. Melakukan analisis chi square
Langkah-langkah melakukan analisis chi square adalah
sebagai berikut:
1) Buka file data spss
2) Klik: Analyze ⇨Descriptif statistic ⇨Crosstabs
Gambar 10.3 Gambar langkah analisis SPSS Chi Square

3) Masukkan variabel status marital ke dalam Row (Karena
status marital sebagai variabel bebas) dan masukkan
variabel stunting pada Columns (Karena stunting sebagai
variabel terikat). Tampilan layar seperti gambar 10.4.
Gambar 10.4 memasukkan variabel bebas dan terikat

4) Klik kotak statististics ⇨Klik Chi Square ⇨Klik Risk ⇨Klik
Continue. (Risk merupakan besarnya nilai faktor risiko, nilai
204
PR pada desain penelitian cross sectional. OR pada desain
case control dan RR pada desain Cohort). Tampilan seperti
Gambar 10.5
Gambar 10.5 Langkah anailisis SPSS Chi Square

5) Klik Cells ⇨ Klik Observerd ⇨ Klik Row (untuk
menampilkan nilai 100% kearah baris ⇨ untuk desain
penelitian cross sectional / cohort). Klik Columns untuk
menampilkan nilai 100% pada arah columns ⇨untuk
desain penelitian case control. Tampilan seperti pada
gambar 10.6
Gambar 10.6 Langkah anailisis SPSS Chi Square % cell

6) Langkah analisis Chi Square sudah selesai. Klik Continue
⇨ Continue ⇨ klik Ok.
205
e. Output Analisis Chi Square
status pernikahan ibu * status stunting Crosstabulation

status stunting Total
Ya tidak
status janda Count 20 10 30
pernikahan ibu Expected Count 8.4 21.6 30.0
% within status
66.7% 33.3% 100.0%
pernikahan ibu
bersuami Count 8 62 70
Expected Count 19.6 50.4 70.0
% within status
11.4% 88.6% 100.0%
pernikahan ibu
Total Count 28 72 100
% within status
28.0% 72.0% 100.0%
pernikahan ibu
Gambar 10.7 Nilai observed dan persentasse sel kearah Baris
Chi-Square Tests
Asymp. Sig. Exact Sig. Exact Sig.
Value df (2-sided) (2-sided) (1-sided)
Pearson Chi-Square 31.784a 1 .000
Continuity Correctionb 29.103 1 .000
Likelihood Ratio 30.646 1 .000
Fisher's Exact Test .000 .000
Linear-by-Linear Association 31.466 1 .000
N of Valid Cases 100
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count is
8.40.
b. Computed only for a 2x2 table
Gambar 10.8 Hasil Uji Chi Square
Risk Estimate
95% Confidence Interval
Value Lower Upper
Odds Ratio for status
pernikahan ibu (janda / 15.500 5.383 44.628
bersuami)
For cohort status stunting =
5.833 2.898 11.741
Stunting
For cohort status stunting =
.376 .225 .629
tidak stunting
Gambar 10.9 Hasil Analisis Faktor Risiko
f. Interpretasi Hasil Analisis
206
1) Gambar 10.7 mengambarkan deskripsi masing-masing sel
untuk nilai observed dan persentase 100 % ke arah baris.
2) Tabel 2x2 ini memenuhi kriteria chi Square
3) Sehingga hasil analisis yang dilihat pada gamabr 10.8
adalah Pearson Chi Square Asymp. Sig. (2-sided)
didapatkan P = 0,000, artinya secara statistic terdapat
hubungan yang bermakna antara status marital ibu dengan
kejadian stunting anak karena p <0,005.
4) Parameter hubungan yang digunakan adalah PR karena
desainnya cross sectional. Nilai yang digunakan pada
gambar 10.9 adalah adalah For cohort status stunting =
Stunting, Bukan for cohort status stunting = tidak stunting
(ini berdasarkan pada sel a tabel 2x2 diatas yang menjadi
faktor resiko adalah stunting. Nilai PR=5,833; CI(2,898–
11,741). Cara menginterpretasikan nilai PR adalah dengan
melihat sel a pada Tabel 2 X 2. Ibu dengan status marital
janda berisiko 5,833 kali lebih berisiko mempunyai anak
stunting dibandingkan dengan ibu yang mempunyai suami.
CI mendiskripsikan apakah PR merupakan faktor risiko /
faktor protektif / tidak faktor protektif maupun faktor risiko.
Jika range CI tidak mencakup angka 1 dan > 1 maka
variabel bebas merupakan faktor risiko, tetapi jika range CI
< 1 maka variabel bebas merupakan faktor protektif.
5) PR bisa dihitung secara manual dengan mengunakan
rumus: PR = a/(a+b) : c/(c+d). Jika kita lihat Tabel 10.4
atau gambar 10.7 kita ketahui sel a = 20 ; b=10 ; c=8 ;
d=62. Sehingga hitungan PR sebagai berikut:
PR = 20/(20+10) : 8/(8+62)
= (20/30) : (8/70)
= 5,833
207
Hasil hitungan manual dan SPSS menunjukkan hasil yang
sama.
Jika desain penelitian adalah case control maka besarnya
faktor risiko adalah Odd Rasio (OR), hasil analisis SPSS
yang dilihat pada gambar 10.9 adalah nilai Odds Ratio for
status pernikahan ibu (janda/bersuami), didapatkan nilai
OR = 15,5.
Jika kita hitung dengan manual dengan mengunakan
rumus OR = (a.d) / (b.c)
OR = (20 x 62) / (10 x 8)
= 15,5
Jika desain penelitian cohort maka rumus faktor risiko
sama dengan PR.
5. Uji Chi Square Pada Pengujian Homogenitas Mengunakan

SPSS
Skenario:
Mahasiswa akan melakukan penelitian tentang hubungan
pengetahuan ibu tentang gizi dengan kejadian stunting. Desain
penelitian case control dengan sampel 30 ibu dan anak stunting
sebagai kasus dan 30 ibu dan anak tidak stunting sebagai
kontrol.
Identifikasi Variabel:
Variabel bebas : pengetahuan ibu
Variabel terikat : kejadian stunting
208
Untuk mengetahuai bahwa kejadian stunting adalah hanya
dipengaruhi pengetahuan ibu maka perlu dilakukan uji homogenitas
dari sampel terkait pendapatannya apakah sudah homogen atau
belum. Pendapatan dijadikan perancu karena bisa mempergaruhi
kemampuan belanja untuk pemenuhan gizi yang akan
mempergaruhi status anak stunting atau tidak. Perhatikan Gambar
10.10 dibawah ini untuk memahami apakah pendapatan sampel ibu
antara kasus dan control sudah homogeny
Chi-Square Tests
Pendapatan Ibu * Anak Stunting Crosstabulation
Count
Anak Stunting
Stunting Tidak Stunting Total
Pendapatan Dibawah UMR 8 3 11
Ibu Diatas UMR 22 27 49
Total 30 30 60


Linear-by-Linear
2.737 1 .098
Association
N of Valid Cases 60
a. 0 cells (0.0%) have expected count less than 5. The minimum expected
count is 5.50.
Gambar 10.10 Uji Beda Pendapatan ibu Sampel Kasus dan Kontrol
209
Berdasarkan Gambar 10.10 kita dapat mengetahui bahwa p =
0.095 (p > 0.005) sehingga dapat disimpulkan bahwa pendidikan
antara kelompok kasus dan control adalah homogeny, artinya
tidak ada beda pendapatan keluarga antara kelompok kasus
(stunting) dan control (tidak stunting) dan karena homogeny
maka pendapatan tidak mempergaruhi kejadian stunting.
6. Membedakan Chi Square for Propotion atau Chi Square for

Trend
Untuk memahami perbedaan proporsi dan trend dapat
diperhatikan Tabel 10.4 dan Gambar 10.10
Tabel 4.4 Perbedaan Chi Square for Propotion dan Chi Square
for Trend
No Proporsi Stunting Apakah terdapat Apakah terdapat
Pada Pendidikan Ibu Perbedaan Tren Makin Tinggi
Rendah, sedang, Proporsi Stunting Pendidikan ibu
Tinggi Pada Pendidikan makin rendah
Ibu Rendah, kejadian stunting?
sedang, Tinggi?
1 75%, 66,7%, 14,3% Ya Ya
2 75%, 14,3%, 66,7% Ya Tidak
Berdasarkan Tabel 4.4 kita dapat mengetahui secara proporsi

antara 75%, 66,7%, 14,3% dan 675%, 14,3%, 66,7% adalah
sama tetapi secara tren berbeda. Pada perbandingan proporsi
urutan diabaikan tetapi pada tren urutan sangat penting. Untuk
memperjelas makna secara statistik perhatikan hasil analisis
pada gambar 10.11 dibawah ini yang menunjukkan Chi Square
tren dan pada gambar 10.12 Chi Square proporsi.
210
Pendidikan Ibu1 * status stunting Crosstabulation
status stunting
tidak
Stunting stunting Total
Pendidikan SD- Count 15 5 20
Ibu1 SLTP % within Pendidikan Ibu1 75.0% 25.0% 100.0%
SLTA Count 30 15 45
% within Pendidikan Ibu1 66.7% 33.3% 100.0%
PT Count 5 30 35
Chi-Square Tests
Asymp. Sig. (2-
Value df sided)
a. 0 cells (0.0%) have expected count less than 5. The minimum expected count
is 10.00.
Gambar 10.11 Hasil Analisis Chi Square Tren
Pendidikan ibu2 * status stunting Crosstabulation

status stunting
tidak
Pendidikan Rendah Count 30 5 35
ibu2 (SD- % within Pendidikan
SLTP) 85.7% 14.3% 100.0%
ibu2
Sedang Count 5 30 35
(SLTA) % within Pendidikan
14.3% 85.7% 100.0%
ibu2
Tinggi Count 15 15 30
(PT) % within Pendidikan
50.0% 50.0% 100.0%
ibu2
% within Pendidikan
50.0% 50.0% 100.0%
ibu2
211
Chi-Square Tests
Asymp. Sig. (2-
Value df sided)
Pearson Chi-Square 35.714 a 2 .000
a. 0 cells (0.0%) have expected count less than 5. The minimum expected
count is 15.00.
Gambar 10.12 Hasil Analisis Chi Square Proporsi
Hasil analisis Chi Square for propotion pada gambar 10.10 dan
Gambar 10.11 adalah sama yaitu p = 0,000, artinya uji statistik
secara proporsi adalah sama. Untuk uji statistic Chi Square untuk
tren hasilnya berbeda (p=0,000 pada Gambar 10.11 dan pada
Gambar 10.12 didapatkan p= 0.002).
Pada Tabel 2x2 hasil analisis Chi Square untuk proporsi dan tren
adalah sama, tidak ada perbedaan.
7. Uji Fisher
Uji fisher Exact Test digunakan sebagai uji alternative untuk tabel
silang (kontingensi) 2x2 dimana uji chi square tidak memenuhi
syarat.
Sebagai contoh perhatikan ilustrasi hasil analisis scenario kasus
diatas, hubungan pendidikan ibu dengan kejadian stunting (lihat
gambar 10.13).
Pendidikan Ibu * status stunting Crosstabulation

status stunting
tidak
Pendidikan SD- Count 11 20 31
Ibu SLTP Expected Count 8.7 22.3 31.0
% within Pendidikan Ibu 35.5% 64.5% 100.0%
SLTA Count 16 49 65
PT Count 1 3 4
212
Gambar 10.13 Tabel 3 Baris x 2 Kolom

Chi-Square Tests
Asymp. Sig. (2-
Value df sided)
Linear-by-Linear
1.055 1 .304
Association
a. 2 cells (33.3%) have expected count less than 5. The minimum
expected count is 1.12.
Gambar 10.14 Hasil Analisis Uji Chi Square
Berdasarkan hasil analisis Uji Chi Square tidak memenuhi syarat

maka uji alternatifnya adalah Uji Fisher Exact Test. Karena Uji
Fisher Exact Test hanya bisa digunakan untuk Tabel 2x2
sedangkan Tabel Gambar 10.13 adalah Tabel 3X2 sehingga
tabel perlu disederhanakan menjadi Tabel 2x2. Pada kategori
pendidikan bisa disederhanakan dari rendah, sedang dan tinggi
disederhanakan menjadi dua (rendah dan sedang digabung dan
tinggi). Langkah untuk membuat menyederhanakan tabel 3x2
menjadi 2x2 adalah sebagai berikut:
- Klik transform
- Klik Recode into Defferent variabels
- Klik pendidikan
- Ketik pada kotak name katpendidikan
- Ketik pada kotak label dengan Kategori Pendidikan Ibu
- Klik change
- Klik old and new values
- Klik range pada old values 1 through 2 dan pada new values
klik values angka 1.
213
- Klik pada old values range values through highest ketik angka
3 dan pada new values klik values ketik 2.
- Klik continue
- Klik OK
- Lakukan langkah analisis Chi Square dengan variabel
katpendidikan sebagai variabel bebas dan stunting sebagai
variabel terikat
- Lihat Gambar 10.15 (a,b,c) untuk mengetahui langkah dari
awal hingga akhir
- Lihat Gambar 10.16 untuk mengetahui hasil tabel
penyederhanaan
- Lihat Gambar 10.17 untuk mengetahui hasil analisis
(a) (b)
(c)
Gambar 10.15 (a, b, c) Langkah Penyederhanaan Sel
214
Kategori Pendidikan ibu * status stunting Crosstabulation
status stunting
Stuntin tidak
g stunting Total
Kategori SD-SLTA Count 27 69 96
Pendidikan Expected Count 26.9 69.1 96.0
ibu % within Kategori
28.1% 71.9% 100.0%
Pendidikan ibu
PT Count 1 3 4
% within Kategori
25.0% 75.0% 100.0%
Pendidikan ibu
% within Kategori
28.0% 72.0% 100.0%
Pendidikan ibu
Gambar 10.16 Hasil penyederhanaan Sel
Chi-Square Tests
Pearson Chi-Square .019 a 1 .892
Continuity Correctionb .000 1 1.000
Likelihood Ratio .019 1 .890
Fisher's Exact Test 1.000 .688
Linear-by-Linear Association .018 1 .892
is 1.12.
Gambar 4.17 Hasil Analisis Chi Square Pendidikan Ibu Dengan

Stunting
Interpretasi hasil analisis gambar 10.17 kita tentukan apakah

memenuhi syarat analisis Chi Square atau tidak. Ada dua cara
untuk melihat nilai expected count yang kurang dari 5 secara
langsung pada gambar 10.15 dapat kita ketahui bahwa ada
sebanyak 2 sel yang mempunyai nilai < 5 (yaitu sel c dengan
nilai 1,1 dan pada sel d nilainya 2,9). Cara yang kedua dapat kita
lihat secara langsung keterangan dibawah tabel pada gambar
215
4.16 ( 2 cells 50.0% have expected count less than 5 sehingga
tidak memenuhi analisis Chi Square. sehingga analisis yang
digunakan adalah Uji Fisher Exact Test. Hasil analisis Uji Fisher
Exact Test pada gambar 4.16 didapatkan pada Asymp. Sig. (2-
sided), p = 1.00. Sehingga dapat kita simpulkan hasil analisis Uji
Fisher Exact Test menunjukan tidak terdapat hubungan yang
bermakna antara kategori pendidikan ibu dengan kejadian
stunting karena p > 0,005 (p =1.00).
Pertanyaan latihan
1. Kapan kita mengunakan uji Chi Square dan Fisher?
2. Interpretasikan hasil analisis SPSS dibawah ini
a. Berapakah observed sel a, b, c, d
b. Berapakah ecpected cound sel a, b, c, d
c. Jika desain penelitian cross sectional, berapakah PR hasil
analisis dengan mengunakan SPSS
d. Hitunglah dan interpretasikan PR, OR, RR secara manual
dengan mengunakan Tabel Kontingensi dibawah ini:
kategori tujuan kontrasepsi * Mkjp dan non mkjp Crosstabulation

Count
Mkjp dan non mkjp
non mkjp mkjp Total
kategori tujuan Menunda 59 14 73

kontrasepsi Menghakiri 16 14 30
Total 75 28 103
216
Chi-Square Tests


Linear-by-Linear
8.038 1 .005
Association
is 8.16.
Risk Estimate
95% Confidence Interval
Value Lower Upper
Odds Ratio for kategori

3.688 1.464 9.291
tujuan kontrasepsi (1 / 2)
For cohort Mkjp dan non
1.515 1.065 2.157
mkjp = non mkjp
For cohort Mkjp dan non
.411 .224 .754
mkjp = mkjp
Referensi
Dahlan, Sopiyudin. (2018). ‘Pintu Gerbang Memahami Epidemiologi
Statistik, Dan Metode Penelitian', Edisi 2, Cetakan 2. Jakarta :
PT Epidemiologi Indonesia
Dahlan, Sopiyudin. (2014). 'Statistik Untuk Kedokteran Dan
Kesehatan Deskriptif, Bivariat, dan Multivariat Dilengkapi
Aplikasi Mengunakan SPSS' Edisi 6, Cetakan 11, Jakarta : PT
Epidemiologi Indonesia
Endra, Febri BS. (2017). ‘Penghantar Metodologi Penelitian
(Statistika Praktis)’, Malang : FK UMM
217
Ngambut, Karolus.(2011). 'Pengantar Biostatistik (Aplikasi
Penggunaan SPSS)', Cetakan 1, Yogyakarta : Gosyen
Publishing
Sastroasmoro, Sudigdo. (2011). ‘Dasar-dasar Metodologi
Penelitian Klinis’, Edisi 4, Jakarta : Sagung Seto
Sugiyono. 2016. ‘Statistika Untuk Penelitian’, Cetakan 27, Bandung
: Penerbit Alfabeta
Sunyoto, Danang. (2014). 'Analisis Data Penelitian Kesehatan
Dengan SPSS', Cetakan I. Yogyakarta : Nuha Medika
218
BAB XI
ANALISIS REGRESI LINEAR
dr. Ronny Isnuwardana, MIH*
*Laboratorium IKM dan KK Pendidikan Dokter S-1, Universitas
Mulawarman
*e-mail: isnuwardana@gmail.com
Tujuan pembelajaran:
1. Mahasiswa mampu memahami dan menerapkan konsep
regresi linear sederhana dalam uji hipotesis
2. Mahasiswa mampu memahami dan menerapkan konsep
regresi linear berganda dalam uji hipotesis
3. Mahasiswa mengetahui asumsi dan hal-hal yang perlu
diperhatikan dalam regresi linear
Ringkasan
Regresi linear adalah uji hipotesis yang memprediksi
hubungan antara variabel dependen numerik dengan satu variabel
independen numerik lainnya dalam regresi linear sederhana dan
beberapa variabel independen dalam regresi linear berganda.
Pesan Belajar
Pemahaman isi bab akan didapatkan dengan membaca isi bab
dari awal bab sampai akhir bab secara berurutan. Pada akhir
pembelajaran, jawablah pertanyaan-pertanyaan pada latihan untuk
menguji seberapa besar pengetahuan dan pemahaman yang
mahasiswa dapatkan dari mempelajari bab ini.
Materi Belajar
A. Regresi linear sederhana
Regresi linear sederhana (simple linear
regression) merupakan alternatif dari uji yang menilai
219
hubungan antara dua variabel yang sifatnya
numerik/kontinu1, terutama jika tujuannya untuk menaksir
nilai satu variabel terhadap nilai variabel lainnya jika
variabel lainnya ini diberi nilai. Misalnya jika kita ingin
mengetahui berapa perkiraan nilai tekanan darah sistolik
jika usia seseorang 38 tahun, maka penggunaan analisis
korelasi, meskipun sama-sama menilai asosiasi yang
linear (Bab V dan VI), namun tidak tepat digunakan,
karena hanya menunjukkan kekuatan hubungan dalam
satu nilai konstanta korelasi. Oleh karena itu, untuk
kasus seperti ini, metode analisis regresi lebih tepat
digunakan.
Lebih lanjut lagi, jika dibandingkan dengan

korelasi, variabel yang diperhitungkan dalam regresi
tidaklah simetris (koefisien korelasi berlaku dua arah dari
variabel pertama ke variabel kedua), melainkan berlaku
variabel bebas (independen/ faktor/ prediktor) dan
variabel terikat (dependen/ respons/ luaran) di mana
variabel terikat hasilnya dijelaskan oleh variabel bebas.
Dalam kasus di atas, kalau seseorang ingin memprediksi
tekanan darah sistolik dari usia, maka tekanan darah
sistolik adalah variabel terikat dan usia adalah variabel
bebas.2
Jika variabel yang terlibat dalam analisis regresi

ini dipetakan ke dalam grafik, maka akan tampak
hubungan yang merepresentasikan garis lurus (linear).
Jika hubungan antara prediktor dan luaran tidak terwakili
220
oleh garis lurus, seperti gambar 1, maka analisis regresi
linear tidak dapat digunakan.
Dalam persamaan matematika, model regresi

linear, sebagaimana yang pernah dipelajari di sekolah
menengah dulu, dapat dituliskan sebagai:
di mana yi adalah luaran, xi adalah prediktor, sedangkan

ŷi adalah estimasi besar luaran untuk tiap nilai xi; a dan b
adalah koefisien regresi, di mana a disebut intercept dan
b disebut slope sedangkan ei adalah residual, atau
perbedaan antara yi terobservasi dan ŷi yang
diestimasi.1 Untuk membentuk model regresi, digunakan
teknik yang disebut sebagai metode least square.2
luaran
luaran
luaran
prediktor prediktor prediktor
Hubungan linear Hubungan linear Hubungan non-linear
Gambar 1 Hubungan linear dan non-linear antara prediktor dan luaran yang kontinu
B. Set data
Jika kita ingin mengetahui apakah ada persamaan
yang bisa memprediksi nilai tekanan darah sistolik
berdasarkan usia, kita membutuhkan data kedua
variabel tersebut. Data yang digunakan dalam bab ini
221
adalah data 303 pasien dengan atau tanpa penyakit
jantung dari Heart Disease UCI.3
Data berupa file “heart.csv” yang bisa diunduh dari

“https://www.kaggle.com/ronitf/heart-disease-uci”
Variabel Keterangan
age usia
sex Jenis kelamin (1 laki-laki 0
perempuan)
cp jenis nyeri dada (4 kategori)
trestbps tekanan darah sistolik istirahat
chol serum kolesterol dalam mg/dl
fbs gula darah puasa> 120 mg/dl
restecg hasil elektrokardiograf istirahat (3
kategori)
thalach denyut jantung maksimum
exang angina yang diinduksi latihan
oldpeak depresi ST yang disebabkan oleh
olahraga relatif terhadap istirahat
slope kemiringan puncak latihan
segmen ST saat latihan (1 naik 2
datar 3 turun)
ca jumlah pembuluh besar (0-3)
yang ditandai fluoroskop
thal 1 normal 2 cacat tetap 3 cacat
reversibel
target penyakit jantung
222
Impor file csv ini ke program statistik yang Anda
gunakan. Kali ini kita menggunakan contoh Microsoft
Excel, IBM SPSS Statistics dan Stata. Jika Anda
berminat menggunakan perangkat lunak sumber
terbuka, Anda juga dapat menggunakan BlueSky, JASP
atau Jamovi yang dibuat dari bahasa pemrograman R, di
mana tampilan-muka menu kedua program menyerupai
dengan IBM SPSS Statistics.
C. Cara Dalam Melakukan Regresi Linier

Sederhana
1. Regresi linear sederhana dengan Microsoft

Excel
Luaran: tekanan darah sistolik (trestbps)
Prediktor: usia (age)
Menu: Data > Data Analysis > Regression > OK
Jika menu Data Analysis belum tampak, bisa diaktifkan di
Windows dan Microsoft Menu: File > Options >
Office 2007 atau lebih Add-ins >
baru Manage: Excel
Add-ins > Go ... >
Analysis ToolPak
(centang) > OK
MacOS dan Microsoft Office Tools > Add-ins >
2016 atau lebih baru Analysis ToolPak
> Ok > Yes
223
Masukkan kolom yang mencantumkan data “age” ke
Input X Range dan data “trestbps” ke Input Y Range, centang
“Labels” jika mengikutkan judul kolom data dan Confidence
Level 95% .
Hasil
SUMMARY
OUTPUT
Regression
Statistics
M 0
u .
l 2
t 7
i 9
p 3
l 5
e 1
R
R 0
.
S 0
q 7
u 8
a 0
r 3
e 7
A 0
d .
224
j 0
u 7
s 4
t 9
e 7
d 4
S
q
u
a
r
e
S 1
t 6
a .
n 8
d 6
a 7
r 8
d 8
E
r
r
o
r
O 3
b 0
s 3
e
r
v
a
t
i
o
n
s
A
N
O
V
A
S
i
g
n
i
f
i
c
a
n
c
e
d S M
f S S F F
225
R 1 7 7 2 7
e 2 2 5 .
g 4 4 . 7
r 8 8 4 6
e . . 7 E
s 9 9 7 -
s 3 3 2 0
i 7 7 8 7
o
n
R 3 8 2
e 0 5 8
s 1 6 4
i 4 .
d 2 5
u . 2
a 1 5
l 7 5
T 3 9
o 0 2
t 2 8
a 9
l 1
.
1
1
S
t
C a
o n
e d
f a L U
f r o p
i d P w p
c t - e e
i E v r r
e r S a
n r t l 9 9
t o a u 5 5
s r t e % %
I 1 5 1 2 9 1
n 0 . 7 . 0 1
t 2 8 . 7 . 3
e . 9 3 8 7 .
r 2 0 6 E 0 8
c 9 5 6 - 4 8
e 6 8 0 4 1 8
p 1 3 4 7 6
t
a 0 0 5 7 0 0
g . . . . . .
e 5 1 0 7 3 7
3 0 4 6 2 4
9 6 7 E 9 9
4 8 5 - 1 7
4 7 0 0 3 5
5 4 3 7 1 9
226
Hasil dari Microsoft Excel menunjukkan dari 303 kasus,
besar R2 = 0,078037 menunjukkan model regresi linear usia ini
hanya bisa menjelaskan 7,80 persen dari keseluruhan varians
data.
Uji F memiliki nilai F hitung adalah 25,47728 memiliki
signifikansi <0.01untuk hubungan linear antara usia dan
tekanan darah sistolik. Nilai SS (Sum of Squares) dan MS
(Mean Square) beserta derajat kebebasannya (df: degree of
freedom) merupakan bagian dari perhitungan metode least
square.
Model regresi dapat dituliskan sebagai
Seseorang dengan usia 40 tahun maka prediksi tekanan

darah sistoliknya adalah 123,87 mmHg.
Besaran koefisien untuk usia (age) dan koefisien

Intercept signifikan (atau p-value < 0.01) untuk uji t dengan
hipotesis null koefisien = 0 (atau kedua koefisien berbeda
bermakna dari 0) serta batas bawah hingga batas atas interval
kepercayaan 95% baik untuk koefisien usia (0,329131;
0,749759) dan intercept (90.70416; 113.888) tidak melalui
angka 0.
Interpretasi dari besaran slope (koefisien usia) adalah
setiap kenaikan 1 unit akan menambah slope dari luaran, jadi
dalam hal ini setiap kenaikan usia 1 tahun akan menambah
tekanan darah sistolik 0,54 mmHg.
227
2. Regresi linear sederhana dengan IBM SPSS
Statistics
Metode Menu: Analyze > Regression > Linear
trestbps > Dependent
age > Independent(s)
Klik “OK”
Metode Sintak:
REGRESSION
/DEPENDENT trestbps
/METHOD=ENTER age.
Hasil
Variables Entered/Removeda
Variables Variables
Model Entered Removed Method
228
1 ageb . Enter
a. Dependent Variable: trestbps

b. All requested variables entered.
Tabel ini menunjukkan variabel yang terlibat dalam

model, berhubung kita hanya melakukan regresi linear
sederhana, jadi hanya ada satu variabel yang dimasukkan: age
Model Summary
Adjusted R Std. Error of the

Model R R Square Square Estimate
1 .279a .078 .075 16.868
a. Predictors: (Constant), age
Tabel berikutnya adalah simpulan model, di mana nilai

2
R = 0.078, artinya model regresi linear usia ini hanya bisa
menjelaskan 7,8 persen dari keseluruhan varians data.
ANOVAa
Sum of Mean
Model Squares df Square F Sig.
1 Regression 7248.937 1 7248.937 25.477 .000b
Residual 85642.172 301 284.525
Total 92891.109 302

b. Predictors: (Constant), age
Tabel uji F, di mana hipotesis null-nya adalah tidak ada

hubungan linear antara kedua variabel (R2 = 0). Nilai F hitung
adalah 25,5 dan derajat kebebasan 302 (jumlah sampel
dikurangi 1) memiliki signifikansi <0.01, sehingga ada
hubungan linear antara usia dengan luaran tekanan darah
sistolik.
229
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 102.296 5.891 17.366 .000
age .539 .107 .279 5.048 .000
Tabel ini menunjukkan koefisien model regresi kita, yang

dapat dituliskan sebagai
Besaran koefisien untuk usia (age) dan koefisien

intercept (Constant) signifikan (atau p < 0.01) untuk uji t dengan
bermakna dari 0). Jika kita menginginkan nilai interval
kepercayaan 95% maka pada menu “Linear Regression”
sebelumnya kita pilih tombol “Statistics...” lalu centang
“Confidence intervals” dan klik “Continue”.
230
atau menggunakan sintak berikut:
REGRESSION
/STATISTICS COEFF OUTS
CI(95) R ANOVA
/DEPENDENT trestbps
/METHOD=ENTER age.
Hasil
Coefficientsa
Standardize
Unstandardized d 95.0% Confidence
Coefficients Coefficients Interval for B
Std. Lower Upper

Model B Error Beta t Sig. Bound Bound
1 (Constan 102.296 5.891 17.366 .000 90.704 113.888

t)
age .539 .107 .279 5.048 .000 .329 .750
Hasil ini juga dapat digunakan untuk menilai signifikansi

karena batas bawah hingga batas atas interval kepercayaan
231
95% baik untuk koefisien usia dan intercept tidak melalui angka
0.
3. Regresi linear sederhana dengan Stata

Command
regress trestbps age
Hasil
Source | SS df MS Number of obs =
303
-------------+---------------------------------- F(1, 301) = 25.48
Model | 7248.93687 1 7248.93687 Prob > F =
0.0000
Residual | 85642.172 301 284.525489 R-squared
= 0.0780
-------------+---------------------------------- Adj R-squared =
0.0750
Total | 92891.1089 302 307.586453 Root MSE =
16.868
------------------------------------------------------------------------------
trestbps | Coef. Std. Err. t P>|t| [95% Conf.
Interval]
-------------+----------------------------------------------------------------
age | .5394452 .1068737 5.05 0.000 .329131
.7497595
_cons | 102.2961 5.890583 17.37 0.000 90.70416
113.888
Hasil dari Stata menunjukkan dari 303 kasus, uji F

memiliki nilai F hitung adalah 25,5 memiliki signifikansi
<0.01untuk hubungan linear antara usia dan tekanan darah
sistolik, di mana R2 = 0,078 menunjukkan model regresi linear
usia ini hanya bisa menjelaskan 7,8 persen dari keseluruhan
varians data. Besaran koefisien untuk usia (age) dan koefisien
intercept (_cons) signifikan (atau p < 0.01) untuk uji t dengan
bermakna dari 0) serta batas bawah hingga batas atas interval
232
kepercayaan 95% baik untuk koefisien usia (0,33; 0,75) dan
intercept (90.70; 113.89) tidak melalui angka 0. Model regresi
dapat dituliskan sebagai:
D. Regresi linear berganda

Model dari regresi linear sederhana dengan satu luaran dan
satu prediktor dapat dikembangkan lebih lanjut di mana satu luaran
(variabel dependen) dapat dipengaruhi oleh beberapa prediktor
(variabel independen), misalnya tekanan darah sistolik dapat
dipengaruhi oleh usia, kadar kolesterol atau bahkan prediktor lain
yang skalanya kategorikal seperti jenis kelamin (“laki-laki” dan
“perempuan”) atau status hiperglikemia (“ya” dan ”tidak”).
Persamaan regresi linear berganda dapat ditulis sebagai:
di mana b1, b2,..., bk adalah slope bagi masing-masing prediktor

x1, x2,..., xk.
Khusus untuk prediktor kategorikal, dikenal konsep variabel
dummy, yaitu variabel yang dibuat untuk persamaan regresi dengan
nilai hanya berupa angka 0 atau 1. Untuk variabel dikotomi, seperti
jenis kelamin, maka hanya perlu satu variabel saja, di mana salah
satu kategori jenis kelamin menjadi acuan terhadap kategori
lainnya, misalnya 0 untuk perempuan menjadi acuan terhadap 1
untuk “laki-laki”, sehingga nilai koefisien slope nantinya akan
dikalikan 1 jika “laki-laki” atau dikalikan 0 jika “perempuan”.
Jika ada lebih dari 2 kategori, maka perlu dibentuk k-1
variabel dummy, dengan k = jumlah kategori. Misalkan kita
memiliki variabel riwayat merokok dengan 3 kategori: “tidak
233
merokok”, “pernah merokok”, dan “aktif merokok”, maka kita
akan membentuk (3-1) = 2 variabel dummy, misalnya kita
gunaan “tidak merokok” sebagai acuan, maka konsepnya
adalah sebagai berikut:
Riwayat
Dumm Dumm
meroko
y1 y2
k
Tidak
meroko 0 0
k
Pernah
meroko 1 0
k
Aktif
meroko 0 1
k
Dari sini kita dapat membuat 2 variabel dummy, yaitu
variabel “Pernah merokok” dan variabel “Aktif merokok”,
dengan nilai 0 untuk “Tidak merokok” dan 1 untuk sesuai
masing-masing nama variabelnya.
E. Cara dalam melakukan Regresi Linier

Berganda
1. Regresi linear berganda dengan Microsoft
Excel
Prediktor: usia (age), jenis kelamin(sex), kadar
kolesterol (chol) dan hiperglikemia (fbs)
Kita perlu mengatur data terlebih dahulu sehingga
kolom-kolom variabel independen/ prediktor berurutan satu
di samping dengan lainnya, sehingga saat dimasukkan ke
kolom Input X Range, semuanya masuk dalam satu kali
234
seleksi area. Pastikan variabel kategorikal sudah mengikuti
konsep
Menu: Data > Data Analysis > Regression > OK
SUMMARY OUTPUT
Regression Statistics
Multiple R 0.32
2696
R Square 0.10
4133
Adjusted 0.09
R Square 2108
Standard 16.7
Error 1094
Observati 303
ons
ANOVA
df SS MS F Signifi
cance
F
Regressio 4 9672.9 24 8.6 1.27E-
n 94 18. 59 06
24 63
9
Residual 298 83218. 27
11 9.2
235
55
4
Total 302 92891.
11
Coeff Standa t P- Lower Upp

icient rd Sta val 95% er
s Error t ue 95%
Intercept 100. 7.2756 13. 9.9 85.876 114.
1946 98 77 6E- 31 5128
11 34
3
age 0.47 0.1094 4.3 2.0 0.2581 0.68
3447 21 26 7E- 12 8782
85 05
3
sex - 2.1120 - 0.6 - 3.15
1.00 99 0.4 34 5.1625 0504
601 76 20 3
31 2
chol 0.02 0.0193 1.1 0.2 - 0.05
1496 14 12 66 0.0165 9504
96 62 1
3
fbs 7.29 2.7242 2.6 0.0 1.9331 12.6
4392 71 77 07 47 5564
55 82
8 7
Hasil dari Microsoft Excel menunjukkan dari 303

kasus, besar R2 = 0,104133 menunjukkan model regresi
linear berganda ini hanya bisa menjelaskan 10,41 persen
dari keseluruhan varians data, namun setidaknya lebih
baik dari model regresi linear sederhana sebelumnya .
Uji F memiliki nilai F hitung adalah 8.65963 dan
memiliki signifikansi <0.01untuk hubungan linear antara
prediktor-prediktor dengan tekanan darah sistolik. Uji t
menunjukkan hanya prediktor usia (age) dan
hiperglikemia(fbs) yang bermakna dalam model (masing-
masing p-value <0,01 dan 0.007). Prediktor jenis kelamin
(sex) dan kadar kolesterol (chol) tidak bermakna, sehingga
tidak dimasukkan ke dalam persamaan regresi, sehingga
model regresi dapat dituliskan sebagai
236
Seseorang dengan usia 55 tahun dan memiliki
diabetes melitus, maka prediksi tekanan darah sistoliknya
adalah 133,5 mmHg.
Interpretasi dari besaran slope adalah setiap

kenaikan usia 1 tahun akan menambah tekanan darah
sistolik 0,47 mmHg, sedangkan kondisi hiperglikemia akan
menambah tekanan sistolik 7,29 mmHg.
Sebagai catatan, analisis regresi linear berganda
dengan Microsoft Excel menggunakan metode Enter, di
mana seluruh prediktor dimasukkan bersama-sama ke
dalam persamaan. Metode lainnya akan dibahas
berikutnya.
2. Regresi linear berganda dengan IBM SPSS

Statistics
a. Metode enter
Metode Menu: Analyze > Regression > Linear
trestbps > Dependent
age, sex, chol, fbs > Independent(s)
237
Statistics ... > Confidence Intervals
Klik “OK”
Metode Sintak:
REGRESSION
/STATISTICS COEFF OUTS CI(95) R ANOVA
/DEPENDENT trestbps
/METHOD=ENTER age sex chol fbs..
Hasil
Variables Variables
Model Entered Removed Method
1 fbs, chol, sex, . Enter

ageb

b. All requested variables entered.
238
Model Summary

1 .323a .104 .092 16.711
a. Predictors: (Constant), fbs, chol, sex, age
ANOVAa
Sum of Mean
1 Regres 9672.994 4 2418.249 8.660 .000b

sion
Residu 83218.115 298 279.255

al
Total 92891.109 302

b. Predictors: (Constant), fbs, chol, sex, age
Coefficientsa
Standardi
zed 95.0%
Unstandardized Coefficien Confidence
Coefficients ts Interval for B
Std. Lower Upper

1 (Consta 100.19 7.276 13.771 .000 85.876 114.51

nt) 5 3
age .473 .109 .245 4.327 .000 .258 .689
sex -1.006 2.112 -.027 -.476 .634 -5.163 3.151
chol .021 .019 .064 1.113 .267 -.017 .060
fbs 7.294 2.724 .148 2.678 .008 1.933 12.656
239
Interpretasinya serupa dengan hasil SPSS sebelumnya
dan sama seperti hasil Microsoft Excel.
b. Seleksi model
Namun dalam memilih prediktor yang terlibat dalam
persamaan regresi ada konsep yang disebut parsimoni atau
hemat dalam prediktor, artinya model regresi menggunakan
sesedikit mungkin prediktor namun tetap tangguh dalam
menjelaskan hubungan antara prediktor dengan luaran.
Untuk itu kita perlu melakukan seleksi terhadap prediktor
yang akan dimasukkan ke dalam persamaan, dan tidak semua
prediktor layak dimasukkan ke dalam model. Apabila kita punya
cukup banyak prediktor, umumnya kita mengambil prediktor
yang memiliki signifikansi yang memadai dari uji bivariat yang
akan dimasukkan ke dalam model, dan tidak harus signifikansi
di level p-value <0.05, namun kita bisa longgarkan hingga p-
value <0.1 atau <0.15, dengan harapan apabila secara uji
hipotesis hubungan bivariat kurang bermakna maka
kemungkinan dalam model multivariabel bisa bermakna
bersama-sama variabel lainnya. Demikian pula jika kita memiliki
prediktor yang dianggap penting atau utama dalam penelitian
kita, dapat pula dimasukkan ke dalam model regresi meskipun
(untuk sementara) tidak bermakna dalam uji hipotesis hubungan
bivariat.1
Setelah kita memiliki variabel prediktor yang kita seleksi,
maka kita masukkan ke dalam metode seleksi, yaitu:
1. Forward selection, di mana model dimulai tanpa
prediktor, kemudian hanya prediktor yang memenuhi
syarat korelasi yang paling besar yang dimasukkan dan
dihitung signifikansinya, kemudian dimasukkan lagi
240
prediktor berikutnya yang lebih kecil korelasinya
demikian seterusnya dan berhenti saat tidak ada lagi
prediktor yang korelasinya lebih kecil namun masih
memiliki signifikansi.
2. Backward elimination adalah kebalikan forward selection,
di mana model dimulai dengan seluruh prediktor,
kemudian prediktor dengan korelasi terkecil dikeluarkan
dan dihitung signifikansinya, kemudian dikeluarkan lagi
prediktor berikutnya yang lebih besar korelasinya
demikian seterusnya dan berhenti saat tidak ada lagi
prediktor yang korelasinya lebih besar namun masih
memiliki signifikansi.
3. Stepwise adalah modifikasi gabungan kedua metode
forward dan backward selection, di mana model kosong
diisi menurut model forward selection dalam satu tahap
kemudian prediktor dieliminasi secara backward
elimination satu tahap, lalu prediktor yang tereliminasi
dimasukkan kembali secara forward, demikian
seterusnya.
4. Remove adalah metode eliminasi secara blok.
Namun demikian dalam pemilihan model yang tepat,
tidak harus juga menggunakan metode seleksi. Metode lainnya
misalnya dengan menggunakan perhitungan Akiake Information
Criterion (AIC) atau Bayesian Information Criterion.(BIC), namun
hal ini di luar pembahasan bab ini.1
241
Berikut ini contoh penggunaan metode Stepwise
Hasil
Mod Variables Variables

el Entered Removed Method
1 age . Stepwise (Criteria: Probability-of-F-to-enter

<= .050, Probability-of-F-to-remove >=
.100).
2 fbs . Stepwise (Criteria: Probability-of-F-to-enter
<= .050, Probability-of-F-to-remove >=
.100).
Dari tabel pertama ini tampak ada 2 tahap dari proses

Stepwise, yaitu tahap pertama berhasil memasukkan variabel
age dan tahap kedua memasukkan variabel fbs (selain sudah
ada variabel age yang telah berhasil masuk di model pertama)
242
Model Summary

1 .279a .078 .075 16.868

2 .315b .099 .093 16.703
a. Predictors: (Constant), age

b. Predictors: (Constant), age, fbs
Dapat dilihat nilai R2 pada model kedua (yang

memiliki variabel age dan fbs) lebih mampu menjelaskan
varians daripada model pertama (yang hanya memiliki
variabel age)
ANOVAa
Sum of Mean
1 Regression 7248.937 1 7248.937 25.477 .000b
Residual 85642.172 301 284.525
Total 92891.109 302

2 Regression 9194.218 2 4597.109 16.478 .000c
Residual 83696.891 300 278.990
Total 92891.109 302

b. Predictors: (Constant), age
c. Predictors: (Constant), age, fbs
Tabel uji F menunjukkan kedua model memiliki

hubungan secara signifikan antara prediktor dengan luaran
(p-value <0.01)
243
Coefficientsa
Standardiz
ed 95.0%
Unstandardized Coefficient Confidence
Coefficients s Interval for B
Std. Lower Upper

1 (Consta 102.29 5.891 17.36 .000 90.704 113.88
nt) 6 6 8
age .539 .107 .279 5.048 .000 .329 .750

2 (Consta 103.08 5.841 17.65 .000 91.593 114.58
nt) 7 0 1
age .505 .107 .262 4.739 .000 .295 .715
fbs 7.178 2.718 .146 2.641 .009 1.829 12.528
Koefisien persamaan regresi dari kedua model

ditunjukkan dalam tabel ini. Karena model kedua lebih
baik, kita ambil model tersebut yang mengikutsertakan
variabel age dan fbs.
Excluded Variablesa
Collinearity Statistics
Partial
Model Beta In t Sig. Correlation Tolerance
1 sex -.030b -.531 .596 -.031 .990
chol .067b 1.175 .241 .068 .954
fbs .146b 2.641 .009 .151 .985
2 sex -.038c -.690 .491 -.040 .987
chol .068c 1.221 .223 .070 .954

b. Predictors in the Model: (Constant), age
c. Predictors in the Model: (Constant), age, fbs
244
Tabel terakhir menunjukkan variabel-variabel yang
gagal dimasukkan ke dalam model pada tiap tahap.
3. Regresi linear berganda dengan Stata

Berikut disajikan command dan output dari Stata
untuk regresi linear berganda dengan metode enter,
stepwise forward dan stepwise backward. Interpretasinya
serupa dengan pembahasan sebelumnya. Prefiks ”i.”
sebelum nama variabel menunjukkan variabel kategorikal.
a. Metode enter
Command
regress trestbps age i.sex chol i.fbs
Hasil
Source | SS df MS Number of obs = 303
-------------+---------------------------------- F(4, 298) = 8.66
Model | 9672.99439 4 2418.2486 Prob > F = 0.0000
Residual | 83218.1145 298 279.255418 R-squared =
0.1041
-------------+---------------------------------- Adj R-squared = 0.0921
Total | 92891.1089 302 307.586453 Root MSE =
16.711
------------------------------------------------------------------------------
trestbps | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
age | .4734467 .1094205 4.33 0.000 .2581118
.6887816
1.sex | -1.006015 2.112099 -0.48 0.634 -5.162533
3.150504
chol | .0214956 .0193139 1.11 0.267 -.0165133
.0595044
1.fbs | 7.294392 2.724271 2.68 0.008 1.933147
12.65564
_cons | 100.1946 7.275698 13.77 0.000 85.87631
114.5128
------------------------------------------------------------------------------
245
b. Metode stepwise forward
Command
sw, pe(0.05): regress trestbps age i.sex chol i.fbs
Hasil
note: 0b.sex dropped because of estimability
note: 0b.fbs dropped because of estimability
begin with empty model
p = 0.0000 < 0.0500 adding age
p = 0.0087 < 0.0500 adding 1.fbs

-------------+---------------------------------- F(2, 300) = 16.48
Model | 9194.21767 2 4597.10883 Prob > F =
0.0000
0.0990
-------------+---------------------------------- Adj R-squared = 0.0930
Total | 92891.1089 302 307.586453 Root MSE =
16.703
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
age | .5052938 .1066163 4.74 0.000 .2954834
.7151043
1.fbs | 7.1782 2.718432 2.64 0.009 1.82859 12.52781
_cons | 103.0867 5.840676 17.65 0.000 91.59283
114.5806
------------------------------------------------------------------------------
c. Metode stepwise backward

Command
sw, pr(0.05): regress trestbps age i.sex chol i.fbs
Hasil
begin with full model
p = 0.6342 >= 0.0500 removing 1.sex
p = 0.2230 >= 0.0500 removing chol

-------------+---------------------------------- F(2, 300) = 16.48
Model | 9194.21767 2 4597.10883 Prob > F =
0.0000
0.0990
246
-------------+---------------------------------- Adj R-squared = 0.0930
Total | 92891.1089 302 307.586453 Root MSE =
16.703
------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
age | .5052938 .1066163 4.74 0.000 .2954834
.7151043
1.fbs | 7.1782 2.718432 2.64 0.009 1.82859 12.52781
_cons | 103.0867 5.840676 17.65 0.000 91.59283 114.5806
------------------------------------------------------------------------------
F. Asumsi dan hal yang perlu diperhatikan

dalam regresi linear
Asumsi regresi linear adalah sebagai berikut:
1. Variabel-variabel memiliki hubungan linear(!),
sehingga jika dibuat grafik plot, akan terwakili oleh
garis lurus
2. Pengamatan variabel-variabel bersifat independen,
pengamatan satu tidak terkait pengamatan
lainnya(!), misalnya pengukuran dari satu orang
sampel hanya terjadi sekali, bukan berkali-kali.
3. Variabel-variabel kontinu, artinya memiliki skala
interval atau rasio, perkecualian dalam analisis
multivariabel.
4. Homoskedastisitas: varians kesalahan serupa pada
tiap tingkatan prediktor, sehingga pada grafik
tersebar merata pada awal tengah dan akhir nilai
prediktor.
5. Residual memiliki sebaran normal. Variabel yang
terlibat masih diperbolehkan jika tidak terdistribusi
normal.
247
Selain itu perlu diperhatikan untuk regresi linear:
6. Hindari multikolinearitas atau korelasi yang tinggi
antara prediktor-prediktor, contoh indeks massa
tubuh dan lingkar perut
7. Data yang tak wajar atau yang berpengaruh besar:
adanya outlier, data yang high leverage.
Metode diagnostik regresi linear untuk menilai asumsi-
asumsi di atas di luar pembahasan bab ini.
Pertanyaan Latihan
Gunakan data Liver Disorder Data Set4
(“indian_liver_patient.csv”) yang bisa diunduh dari
https://www.kaggle.com/uciml/indian-liver-patient-records.
Tetapkan persamaan regresi linear sederhana dan

berganda dari variabel luaran “alkaline_phosphatase”
dengan variabel-variabel prediktor sebagai berikut:
1. Usia(“age”) dan jenis kelamin (“gender”: jangan lupa
transformasi data variabel dari string menjadi
kategorikal)
2. “aspartate_aminotransferase” dan
“alanine_aminotransferase”
3. “total_bilirubin” atau “direct_bilirubin”
4. “total_proteins” atau “albumin”
5. “albumin_and_globulin_ratio”
248
6. Gangguan hati(“dataset”: 1 sakit 2 sehat)
Mengapa Anda sebaiknya memilih salah satu variabel
saja dari pasangan variabel (c.) dan pasangan variabel (d.),
atau bahkan pada pasangan variabel (b.)?
Referensi
1. Woodward M. Epidemiology: Study Design and Data
Analysis, Third Edition: Taylor & Francis 2013.
2. Illowsky B, Dean SL, OpenStax C, et al. Introductory
statistics OpenStax 2013.
3. Janosi A, Steinbrunn W, Pfisterer M, et al. UCI machine
learning repository: heart disease data set 1989
[Available from:
https://archive.ics.uci.edu/ml/datasets/heart+disease.
4. BUPA Medical Research Ltd. UCI machine learning
repository: liver disorders data set 1990 [Available
from:
https://archive.ics.uci.edu/ml/datasets/Liver+Disorders.
249
250
BAB XII
ANALISIS REGRESI LOGISTIK
dr. Ronny Isnuwardana, MIH*

*Laboratorium IKM dan KK Pendidikan Dokter S-1, Universitas
Mulawarman
*e-mail: isnuwardana@gmail.com
Tujuan pembelajaran:
1. Mahasiswa mampu memahami dan menerapkan
konsep regresi linear sederhana dalam uji
hipotesis
2. Mahasiswa mampu memahami dan menerapkan
konsep regresi linear berganda dalam uji
hipotesis
3. Mahasiswa mengetahui asumsi dan hal-hal yang
perlu diperhatikan dalam regresi linear
Ringkasan
Regresi logistik adalah uji hipotesis yang
memprediksi hubungan antara variabel dependen
dikotomi dengan satu variabel independen lainnya
dalam regresi logistik sederhana dan beberapa
variabel independen dalam regresi logistik
berganda.
Pesan dalam Belajar

Untuk mempelajari Bab ini, mahasiswa sangat
perlu memahami secara urut dari awal sampai
dengan akhir Bab karena penjelasan disajikan
251
secara berurutan sampai akhir Bab. Pada akhir
pembelajaran, jawablah pertanyaan-pertanyaan
pada latihan untuk menguji seberapa besar
pengetahuan dan pemahaman dari mempelajari
Bab ini.
Materi Belajar
A. Regresi logistik sederhana

Regresi logistik merupakan pengembangan dari
regresi linear yang telah kita bahas sebelumnya
namun pada variabel luaran dalam skala dikotomi.
Oleh karena itu sebaiknya baca terlebih dahulu bab
regresi linear sebelumnya karena ada hal-hal yang
sudah dijelaskan di bab regresi linear hanya akan
disinggung sedikit atau tidak akan dijelaskan lagi
dalam bab ini. Hal ini membuatnya bermanfaat
banyak dalam konsep klinis kedokteran, mengingat
banyak sekali luaran klinis bersifat biner: ya atau
tidak, terutama dalam konsep sakit atau tidak sakit,
contoh kasus penyakit jantung terhadap kontrol
orang sehat. Dengan demikian variabel luaran ini
secara matematis akan hanya memiliki nilai 1 dan 0,
di mana dalam klinis umumnya 1 adalah “sakit” dan
0 adalah “sehat”. Dengan konsep demikian, maka
model regresi logistik serupa dengan model regresi
linear, namun sedemikian rupa sehingga variabel
252
luaran berupa 1 atau 0, yang secara matematis
ditulis dalam persamaan:
Persamaan di atas serupa dengan persamaan

regresi linear, terutama pada ekspresi sisi kanan,
namun berbeda pada ekspresi sisi kiri yang
merupakan transformasi logit dari variabel
dependen yang umumnya kita kenal sebagai y.
Dalam bidang epidemiologi istilah disebut juga
sebagai peluang (odds) dari suatu kejadian,

sehingga adalah “logit” dari peluang tersebut.
Harap diingat bahwa asumsi linearitas juga berlaku

sama dalam hubungan antara logit odds dan x i.
Kita bisa menggunakan konsep logit odds ini dalam
contoh kasus, misalnya jika kita ingin memprediksi
berapa peluang terjadinya penyakit jantung pada
jenis kelamin pria dibandingkan wanita. Kita telah
mengenal konsep rasio peluang (odds ratio) dalam
analisis variabel kategorikal. Jika kita memiliki
sekelompok sampel pasien, di mana sebagian
menderita penyakit jantung, kita bisa membuat tabel
kontingensi 2x2 antara faktor risiko jenis kelamin
terhadap luaran penyakit jantung, di mana rasio
peluang dapat dihitung dengan rumus . Namun
253
rasio peluang juga dapat dihitung dengan regresi
logistik, yang akan dijelaskan di bawah ini.
B. Set data
Sama seperti regresi linear, bab ini kita akan
menggunakan data 303 pasien dengan atau tanpa
penyakit jantung dari Heart Disease UCI. Variabel
luaran yang kita gunakan adalah “target, yaitu”: 1-
penyakit jantung 0-bukan penyakit jantung
Seperti sebelumnya data berupa file “heart.csv”
yang bisa diunduh dari
“https://www.kaggle.com/ronitf/heart-disease-uci”.
Impor file csv ini ke program statistik yang Anda
gunakan. Kali ini kita menggunakan contoh IBM
SPSS Statistics dan Stata. Jika Anda berminat
menggunakan perangkat lunak sumber terbuka,
Anda juga dapat menggunakan BlueSky, JASP atau
Jamovi yang dibuat dari bahasa pemrograman R, di
mana tampilan-muka menu kedua program
menyerupai dengan IBM SPSS Statistics.
C. Regresi logistik sederhana dengan IBM

SPSS Statistics
Luaran: penyakit jantung (target)
Prediktor: jenis kelamin (sex)
Metode Menu: Analyze > Regression >
Binomial Logistics ...
target > Dependent
sex > Block 1 of 1
254
Method: Enter
Options: CI for exp(B): 95%
Klik “OK”
Atau dengan metode sintak:

LOGISTIC REGRESSION VARIABLES target
/METHOD=ENTER sex
/PRINT=CI(95).
Hasil regresi logistik oleh SPSS berupa tabel-tabel berikut:

Unweighted Casesa N Percent
Selected Included in 303 100.0
Cases Analysis
Missing Cases 0 .0
Total 303 100.0
Unselected Cases 0 .0
Total 303 100.0
a. If weight is in effect, see classification table for
the total number of cases.
255
Tabel ini menjelaskan jumlah kasus yang diproses: 303
pasien dalam data, keseluruhannya digunakan untuk
membentuk model regresi logistik
Dependent Variable
Encoding
Original Internal
Value Value
0 0
1 1
Block 0: Beginning Block

Blok 0 ini memulai tahapan regresi logistik, di mana
persamaan hanya berisi intercept. Kita akan lebih
banyak membahas tahap blok berikutnya.
Classification Tablea,b
Predicted
target Percentage
Observed 0 1 Correct
Step 0 target 0 0 138 .0
1 0 165 100.0
Overall 54.5
Percentage
a. Constant is included in the model.
b. The cut value is .500
256
Variables in the Equation
B S.E. Wald df Sig. Exp(B)
Step 0 Constan .179 .115 2.400 1 .121 1.196
t
Variables not in the Equation

Score df Sig.
Step 0 Variable sex 23.914 1 .000
s
Overall Statistics 23.914 1 .000
Block 1: Method = Enter

Blok ini berisi hasil akhir regresi logistik, karena kita
menggunakan metode Enter. Jika kita menggunakan
metode forward atau backward stepwise, seperti yang
sudah dibahas di bab regresi linear, bisa jadi kita akan
menemukan lebih dari satu tahap blok. Metode
stepwise selection dalam regresi logistik dapat
menggunakan metode Conditional, Wald atau
Likelihood Ratio.
Omnibus Tests of Model Coefficients

Chi-square df Sig.
Step 1 Step 24.841 1 .000
Block 24.841 1 .000
Model 24.841 1 .000
257
Tabel pertama dari blok ini menunjukkan signifikansi dari
keseluruhan koefisien model regresi logistik. Karena ini
adalah regresi logistik sederhana dengan metode enter,
maka step, block dan model yang terakhir adalah sama.
Signifikansi per spesifik koefisien bisa dilihat di tabel akhir.
Model Summary
-2 Log Cox & Snell R Nagelkerke R
Step likelihood Square Square
1 392.797a .079 .105
a. Estimation terminated at iteration number 4 because
parameter estimates changed by less than .001.
b.
Tabel simpulan model menunjukkan bahwa jenis
kelamin bisa menjelaskan 7,9 persen dari seluruh
hubungan menurut R2 dari Cox & Snell atau 10,5
persen kalau menurut R2 dari Nagelkerke.
Classification Tablea
Predicted
target Percentage
Step 1 target 0 114 24 82.6
1 93 72 43.6
Overall Percentage 61.4
a. The cut value is .500
Tabel ini adalah tabel kontingensi diagnostik dari

regresi logistik. Serupa dengan yang akan dijelaskan di
uji diagnostik, regresi logistik tentu memiliki
kemampuan prediksi, dalam kasus kita menentukan
apakah seseorang berisiko menderita penyakit jantung
258
atau tidak. Tabel klasifikasi di atas berturut-turut
menunjukkan negatif sejati, positif palsu, negatif palsu
dan positif sejati dari prediksi model terhadap luaran
penyakit jantung. Namun khusus untuk bab ini kita tidak
akan membahas lebih lanjut mengenai analisis regresi
logistik sebagai alat prediksi (prediction tool).
95% C.I.for
EXP(B)
B S.E. Wald df Sig. Exp(B) Lower Upper
Step 1a sex - .274 22.58 1 .000 .272 .159 .465
1.302 6
Constant 1.099 .236 21.72 1 .000 3.000
5
a. Variable(s) entered on step 1: sex.
Tabel terakhir menunjukkan koefisien slope dan intercept (B)
dalam persamaan, sehingga:
Persamaan ini serupa dengan regresi linear, namun

terhadap luaran logit dari penyakit jantung.
Namun demikian, yang terpenting adalah besar eksponen
dari koefisien ini, di mana setara dengan nilai rasio peluang
(odds rasio: OR), sehingga nilai OR dari jenis kelamin
adalah 0,272 (95%CI 0,159:0,465). Interpretasinya adalah
jenis kelamin laki-laki (kode kategori 1 dalam variabel sex)
memiliki peluang mengalami penyakit jantung 0,272 kali lipat
dibanding jenis kelamin perempuan (kode kategori 0 dalam
variabel sex sebagai acuannya), atau dengan kata lain jenis
kelamin laki-laki terlindungi dari penyakit jantung (setidaknya
259
dalam sampel data tersebut) dan peluang ini berkisar antara
0,159 kali hingga 0,465 kali, sehingga hal ini signifikan
(karena nilai interval kepercayaan tersebut tidak melalui
angka 1).
D. Regresi logistik sederhana dengan Stata

Perintah untuk regresi logistik dengan stata adalah
logit diikuti variabel dependen dan variabel independen.
Jika kita menginginkan hasil berupa rasio peluang (odds
ratio) kita tambahkan pilihan “,or”. Interpretasi hasilnya
serupa dengan SPSS. Pseudo R2 yang dilaporkan di
Stata adalah menurut McFadden, sehingga hasilnya
berbeda dengan hasil dari SPSS (di sini tampak bahwa
jenis kelamin mampu menjelaskan 5,95 persen dari
keseluruhan hubungan).
logit target sex
Iteration 0: log likelihood = -208.81903

Logistic regression Number of obs =

303
LR chi2(1) = 24.84
Prob > chi2 = 0.0000
Log likelihood = -196.39859 Pseudo R2
= 0.0595
----------------------------------------------------------------------------
--
target | Coef. Std. Err. z P>|z| [95% Conf.
Interval]
-------------+-------------------------------------------------------------
---
260
sex | -1.302211 .2740076 -4.75 0.000 -
1.839256 -.7651662
_cons | 1.098612 .2357023 4.66 0.000
.6366443 1.56058
----------------------------------------------------------------------------
--
logit, or

303
LR chi2(1) = 24.84
Prob > chi2 = 0.0000
Log likelihood = -196.39859 Pseudo R2 =
0.0595
------------------------------------------------------------------------------
target | Odds Ratio Std. Err. z P>|z| [95% Conf.
Interval]
-------------+----------------------------------------------------------------
sex | .2719298 .0745108 -4.75 0.000 .1589356
.4652566
_cons | 3 .7071068 4.66 0.000 1.890128
4.761583
------------------------------------------------------------------------------
Note: _cons estimates baseline odds.
E. Regresi logistik berganda dengan IBM

SPSS Statistics
Untuk regresi logistik berganda, kita dapat
membuat persamaan terhadap luaran penyakit jantung
dari beberapa prediktor, dalam hal ini kita akan
mempertimbangkan usia, jenis kelamin, kadar
kolesterol dan status hiperglikemia. Segala
pertimbangan yang berlaku pada regresi linear
berganda juga berlaku pada regresi logistik berganda.
Untuk contoh berikut ini kita menggunakan metode
pemilihan model menggunakan Forward Stepwise
Selection berdasarkan Likelihood Ratio (LR).
261
Metode Menu: Analyze > Regression > Binomial
Logistics ...
target > Dependent
age, sex, chol, fbs > Block 1 of 1
Method: Forward LR
Options: CI for exp(B): 95%
Klik “OK”
LOGISTIC REGRESSION VARIABLES target

/METHOD=FSTEP(LR) sex age chol fbs
/PRINT=CI(95)
/CRITERIA=PIN(0.05) POUT(0.10) ITERATE(20)
CUT(0.5).
Logistic Regression
262
Unweighted Casesa N Percent
Selected Cases Included in Analysis 303 100.0
Missing Cases 0 .0
Total 303 100.0
Unselected Cases 0 .0
Total 303 100.0
a. If weight is in effect, see classification table for the total
number of cases.
Dependent Variable
Encoding
Original Value Internal Value
0 0
1 1
Block 0: Beginning Block

Classification Tablea,b
Predicted
target Percentage
Step 0 target 0 0 138 .0
1 0 165 100.0
a. Constant is included in the model.
b. The cut value is .500

B S.E. Wald df Sig. Exp(B)
Step 0 Constant .179 .115 2.400 1 .121 1.196
263
Score df Sig.
Step 0 Variables sex 23.914 1 .000
age 15.399 1 .000
chol 2.202 1 .138
fbs .238 1 .625
Block 1: Method = Forward Stepwise

(Likelihood Ratio)
Omnibus Tests of Model Coefficients
Chi-square df Sig.
Step 1 Step 24.841 1 .000
Block 24.841 1 .000
Model 24.841 1 .000
Step 2 Step 22.223 1 .000
Block 47.064 2 .000
Model 47.064 2 .000
Model Summary
-2 Log Cox & Snell R Nagelkerke R
Step likelihood Square Square
1 392.797a .079 .105
a
2 370.574 .144 .192
a. Estimation terminated at iteration number 4 because
parameter estimates changed by less than .001.
Classification Tablea
Predicted
target Percentage
Step 1 target 0 114 24 82.6
1 93 72 43.6
264
Step 2 target 0 86 52 62.3
1 55 110 66.7
a. The cut value is .500

95% C.I.for
Exp(B EXP(B)
B S.E. Wald df Sig. ) Lower Upper
Step 1a sex - .274 22.58 1 .000 .272 .159 .465
1.302 6
Constant 1.099 .236 21.72 1 .000 3.000
5
Step 2b sex - .293 27.55 1 .000 .215 .121 .382
1.537 6
age -.066 .015 20.09 1 .000 .936 .909 .963
8
Constant 4.895 .900 29.59 1 .000 133.5
9 67
a. Variable(s) entered on step 1: sex.
b. Variable(s) entered on step 2: age.
Model if Term Removed

Model Log Change in -2 Sig. of the
Variable Likelihood Log Likelihood df Change
Step 1 sex -208.819 24.841 1 .000
Step 2 sex -200.931 31.287 1 .000
age -196.399 22.223 1 .000
265
Score df Sig.
Step 1 Variables age 21.414 1 .000
chol 7.166 1 .007
fbs .077 1 .781
Step 2 Variables chol 3.645 1 .056
fbs .097 1 .756
Dari hasil SPSS di atas, maka persamaan yang

didapat adalah:
Odds ratio untuk jenis kelamin laki-laki terhadap

perempuan adalah 0.215 (95%CI 0,121; 0,382),
sehingga dalam sampel ini jika disesuaikan
dengan usia, laki-laki akan memiliki peluang
mengalami penyakit jantung 0,215 kali
dibandingkan perempuan, sedangkan jika
disesuaikan dengan jenis kelamin, untuk usia
adalah 0.936 (95%CI 0.909; 0,963) atau
penurunan risiko 6,4 persen (dari 1 – 0,936) per
kenaikan usia per tahun.
266
F. Regresi logistik berganda dengan Stata
Untuk kali ini kita menggunakan metode Stepwise
Backward Elimination. Bisa kita lihat hasilnya kebetulan
serupa dengan hasil dari Stepwise Forward Selection
SPSS.
sw, pr(0.05): logit target age i.sex chol i.fbs

begin with full model
p = 0.7839 >= 0.0500 removing 1.fbs
p = 0.0599 >= 0.0500 removing chol

303
LR chi2(2) = 47.06
Prob > chi2 = 0.0000
Log likelihood = -185.28708 Pseudo R2
= 0.1127
------------------------------------------------------------------------------
target | Coef. Std. Err. z P>|z| [95% Conf.
Interval]
-------------+---------------------------------------------------------------
-
age | -.0664935 .0148322 -4.48 0.000 -
.0955641 -.0374228
|
sex |
male | -1.537477 .2928881 -5.25 0.000 -
2.111527 -.9634266
_cons | 4.8946 .8996541 5.44 0.000
3.13131 6.657889
------------------------------------------------------------------------------
267
Untuk mengetahui hasil rasio peluang, kita tinggal
mengulang perintah sebelumnya dan
menambahkan pilihan “,or”.logit, or
Logistic regression Number of

obs = 303
LR chi2(2) =
47.06
Prob > chi2 =
0.0000
Log likelihood = -185.28708 Pseudo
R2 = 0.1127
-------------------------------------------------------------------
-----------
target | Odds Ratio Std. Err. z P>|z|
[95% Conf. Interval]
-------------+----------------------------------------------------
------------
age | .935669 .0138781 -4.48 0.000
.9088601 .9632688
|
sex |
male | .2149227 .0629483 -5.25 0.000
.121053 .3815831
_cons | 133.5665 120.1636 5.44 0.000
22.90396 778.905
-------------------------------------------------------------------
-----------
Note: _cons estimates baseline odds.
Asumsi dan hal yang perlu diperhatikan

dalam regresi logistik
Asumsi regresi logistik serupa dengan asumsi regresi linear,
8. Prediktor memiliki hubungan linear terhadap transformasi
logit dari luaran(!), sehingga jika dibuat grafik plot, akan
terwakili oleh garis lurus
9. Pengamatan variabel-variabel bersifat independen,
pengamatan satu tidak terkait pengamatan lainnya(!),
268
sehingga pengukuran berulang pada orang yang sama
tidak dapat menggunakan model ini.
10. Homoskedastisitas: varians kesalahan serupa pada tiap
tingkatan prediktor, sehingga tampak pada grafik
tersebar merata pada awal, tengah, dan akhir nilai
prediktor.
11. Residual memiliki sebaran normal. Variabel yang terlibat
masih diperbolehkan jika tidak terdistribusi normal.
Selain itu perlu diperhatikan untuk regresi linear:
12. Hindari multikolinearitas atau korelasi yang tinggi antara
prediktor-prediktor, contoh indeks massa tubuh dan
lingkar perut
13. Data yang tak wajar atau yang berpengaruh besar:
adanya outlier, data yang high leverage.
Metode diagnostik regresi logistik untuk menilai asumsi-
asumsi di atas di luar pembahasan bab ini.
Pertanyaan Latihan
Dengan menggunakan data Liver Disorder Data
Set4 (“indian_liver_patient.csv”) sebelumnya, tetapkan
persamaan regresi logistik sederhana dan berganda
dari variabel luaran gangguan hati(“dataset”: 1 sakit 2
sehat) dengan variabel-variabel prediktor sebagai
berikut:
7. Usia(“age”) dan jenis kelamin (“gender”: jangan
lupa transformasi data variabel dari string
menjadi kategorikal)
8. “alkaline_phosphatase”
9. “aspartate_aminotransferase” dan
“alanine_aminotransferase”
269
10. “total_bilirubin” atau “direct_bilirubin”
11. “total_proteins” atau “albumin”
12. “albumin_and_globulin_ratio”
Referensi
270
BAB XIII
UJI DIAGNOSTIK
dr. Jessica Christanti,M.Kes*

*Bagian IKM Fakultas Kedokteran, Universitas Katolik Soegijapranata,
Semarang
*e-mail: jessica@unika.ac.id
TUJUAN PEMBELAJARAN
1. Mahasiswa mampu menjelaskan mengenai uji diagnostik
dan menentukan variabel dalam uji diagnostik
2. Mahasiswa mampu menjelaskan prinsip tabel 2x2 dalam uji
diagnosis
3. Mahasiswa mampu menjelaskan mengenai sensitivitas,
spesifisitas, nilai prediksi positif, nilai prediksi negatif, dan
indeks youden (J)
4. Mahasiswa mampu menjelaskan receiver operator curve
dan area under curved untuk menentukkan cut off point
dalam uji diagnostik
RINGKASAN
Uji Diagnostik bermanfaat untuk menentukan
faktor kekuatan diagnostik suatu pemeriksaan terbaru
terhadap pemeriksaan yang telah ada. Oleh karena itu
Bab ini akan menjabarkan pengertian, tabel 2x2, analisa
tabel 2x2, analisis deskriptif Area Under Curve ( AUC),
dan titik potong pada Uji Diagnostik.
Pesan dalam Belajar
Mahasiswa secara perlahan mempelajari istilah
dari penelitian diagnostik dalam bab ini dari awal hingga
271
akhir. Kemudian, analisis soal latihan untuk menguji
pemahaman dalam bab ini.
Materi Belajar
A. Pengertian Uji Diagnostik
Diagnostik merupakan proses melabel seorang
pasien masuk dalam kategori sakit atau sehat oleh
klinisi. Hasil dari proses ini disebut sebagai diagnosis.
Diagnosis yang akurat dan tepat sangat diperlukan untuk
menunjang penatalaksanaan. Diagnostik suatu penyakit
memerlukan suatu standard atau pedoman yang
memiliki tingkat akurasi dan ketepatan yang tinggi dalam
menegakkan diagnosis. Standar dan pedoman ini
disebut sebagai suatu “gold standard” atau baku emas.
Gold standard dalam materi uji diagnostik ini disebut
dengan variabel standar (David, 1991).
Selain gold standard ada pula pemeriksaan lain
yang dapat membantu menegakkan diagnosis namun
mempunyai akurasi yang lebih rendah dibandingkan gold
standard. Pemeriksaan ini sering kita sebut sebagai
variabel prediktor. Variabel prediktor memiliki kelebihan
dibandingkan pemeriksaan variabel standard pada
umumnya (Sastroasmoro & Ismael, 2011).
Kelebihan tersebut dapat berupa:
- Pemeriksaan lebih nyaman untuk pasien atau klinisi
dibandingkan gold standard
- Pemeriksaan lebih mudah dibandingkan gold standard
- Harga pemeriksaan lebih murah dibandingkan gold standard
- Waktu pemeriksaan lebih cepat dibandingkan gold standard
272
Bila variabel prediktor tidak memiliki keunggulan
dibandingkan variabel standar, maka uji diagnostik tidak
diperlukan atau tidak memberikan suatu manfaat. Uji
diagnostik adalah sebuah uji statistik untuk menilai
apakah suatu variabel prediktor dapat memiliki tingkat
akurasi dan ketepatan yang mendekati variabel standar.
Untuk memudahkan memahami mengenai uji diagnostik
marilah kita cermati sebuah kasus dibawah
(Sastroasmoro & Ismael, 2011).
Implementasi kasus : mammografi vs biopsi

Seorang wanita dengan suatu benjolan pada payudara
pergi ke dokter. Dokter yang menangani wanita tersebut
melakukan anamnesis dan pemeriksaan fisik seputar
benjolan payudara. Dari hasil anamnesis dan
pemeriksaan fisik dokter mencurigai adanya keganasan
payudara; sehingga menyarankan pasien untuk
melakukan pemeriksaan mammografi, dan biopsi
jaringan.
Pada kasus dengan benjolan payudara suspek

keganasan; gold standard diagnosis keganasan adalah
dengan pemeriksaan biopsi jaringan. Saat pemeriksaan
biopsi, jaringan payudara akan diambil untuk dilihat
dibawah mikroskopis. Bila hasil biopsi menandakan
adanya keganasan, maka diagnosis kanker payudara
akan tegak. Namun bila hasil biopsi tidak menandakan
adanya keganasan, maka diagnosis kanker payudara
273
sudah dapat disingkirkan. Pemeriksaan biopsi ini
dianggap sebagai gold standard yang menentukan
diagnosis. Bila dijumpai hasil anamnesis dan
pemeriksaan fisik mendukung adanya keganasan
payudara, namun hasil biopsi didapatkan kesimpulan
bukan keganasan, maka diagnosis keganasan sudah
dapat disingkirkan.
Dokter pada kasus tersebut juga meminta
pemeriksaan mammografi dengan menggunakan sinar
rontgen untuk melihat jaringan payudara. Jaringan
payudara yang tercetak pada plat film sinar rontgen
dapat dijadikan panduan dokter dalam memperkirakan
pasien tersebut menderita keganasan atau tidak.
Pemeriksaan mammografi cenderung tidak invasif dan
lebih nyaman untuk pasien dibandingkan dengan
pemeriksaan biopsi. Bila hasil pemeriksaan mammografi
menyimpulkan adanya suatu keganasan, namun
pemeriksaan biopsi menyimpulkan bukan keganasan
maka diagnosis keganasan sudah dapat disingkirkan.
Atau sebaliknya bila hasil mammografi menyimpulkan
bukan keganasan, akan tetapi hasil biopsi menyimpulkan
keganasan, maka diagnosis keganasan sudah dapat
ditegakkan berdasarkan hasil biopsi.
Pada kasus ini pemeriksaan biopsi terlihat lebih
superior dibandingkan pemeriksaan mammografi karena
memiliki akurasi dan ketepatan yang lebih baik.
Sehingga dapat disimpulkan bahwa pemeriksaan biopsi
disini berperan sebagai variabel standard, dan
274
pemeriksaan mammografi berperan sebagai variabel
prediktor. Sebuah uji diagnostik dapat dilakukan pada
kasus ini yaitu untuk melihat seberapa besar keakuratan
dan ketepatan pemeriksaan mammografi dibandingkan
dengan pemeriksaan gold standard biopsi.
Setelah mengetahui mengenai konsep uji
diagnostik, pertanyaan selanjutnya adalah bagaimana
kita mengetahui variabel mana yang akan masuk
kedalam kategori gold standard “variabel standard” dan
variabel mana yang akan masuk kedalam kategori
variabel prediktor. Jawaban atas pertanyaan tersebut
dapat dicari melalui evidence based medicine
(pengalaman klinik) yang sudah terpublikasi secara baik
dalam jurnal. Butuh effort atau usaha dari peneliti untuk
membaca jurnal dan mencari tahu parameter
pemeriksaan yang memiliki keakuratan dan ketepatan
yang paling baik dibandingkan pemeriksaan lainnya.
Sebagai contoh untuk mendiagnosis penyakit
tuberculosis (TB). Berdasarkan evidence based medicine
diagnosis TB dapat dilakukan dengan pemeriksaan TB
score, pemeriksaan Tuberkulin Skin Test (TST),
pemeriksaan sputum 3 kali, pemeriksaan rapid antibody
TB, pemeriksaan interferon gamma release assay
(IGRA), pemeriksaan kultur, dan tes cepat molekular
(TCM). Sekilas ada 7 macam pemeriksaan yang dapat
dilakukan untuk menegakkan diagnosis TB. Dari literatur
bacaan yang didapat, pemeriksaan TCM lebih unggul
dalam hal akurasi dan ketepatan dibandingkan dengan
275
pemeriksaan lainnya. Sehingga TCM dapat
dikategorikan kedalam variabel standard. Keenam
pemeriksaan lainnya dapat kita kategorikan ke dalam
variabel prediktor. Bila TCM tidak dapat dilaksanakan
karena keterbatasan sarana dan prasarana di suatu
daerah, maka pemeriksaan yang memiliki tingkat akurasi
dan ketepatan tertinggi nomer dua yang akan masuk
dalam kategori gold standard.
B. Tabel 2x2
Tabel 2x2 merupakan struktur dasar dari uji
diagnostik yang paling sederhana. Disebut sebagai tabel
2x2 karena tabel tersebut memiliki 2 kolom dan 2 baris.
Pada kolom akan diisi oleh variabel standar yang
berperan sebagai gold standard; sedangkan pada baris
akan diisi oleh variabel predictor (Sastroasmoro &
Ismael, 2011)
Baik variabel standard maupun variabel prediktor pada
uji diagnostik memiliki skala kategorikal yang bersifat
dikotom. Istilah dikotom menandakan bahwa skala pada
variabel tersebut bersifat nominal dan hanya memiliki 2
nilai, misal hasil ‘positif dan negatif’; atau ‘sakit dan
sehat’; atau ‘tidak normal dan normal’ dan sebagainya.
Untuk kelompok kategori yang pertama setiap variabel
selalu dimulai dari kelompok yang sakit atau positif
terlebih dahulu kemudian diikuti oleh kelompok sehat
atau normal. (Sastroasmoro & Ismael, 2011)
Pada tabel 2x2 terdapat 4 sel yaitu:
276
- Sel kiri atas; merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang positif,
dengan baris variabel prediktor yang positif. Pada sel
ini parameter yang akan diuji menghasilkan nilai positif
atau sakit dan sesuai dengan hasil dari pemeriksaan
gold standard. Sel ini sering disebut sebagai positif
benar (true positive).
- sel kanan atas; merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang
negatif, dengan baris variabel prediktor yang positif.
Pada sel ini terdapat diskrepansi dimana parameter
yang akan diuji menghasilkan nilai positif atau sakit,
namun hasil pemeriksaan gold standard menunjukan
bahwa pasien negative atau tidak menderita penyakit.
Sel ini sering disebut sebagai positif palsu (false
positive). Beberapa literatur menggunakan label false
positive dengan istilah 1-Sp
- sel kiri bawah, merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang positif,
dengan baris variabel prediktor yang negatif. Pada sel
ini terdapat diskrepansi dimana parameter yang akan
diuji menghasilkan nilai negative atau sehat, namun
hasil pemeriksaan gold standard menunjukan bahwa
pasien positif atau sedang menderita penyakit. Sel ini
sering disebut sebagai negatif palsu (false negative).
- sel kanan bawah; merupakan sel yang berasal dari
pertemuan antara kolom variabel standard yang
negatif, dengan baris variabel prediktor yang negatif.
277
Pada sel ini parameter yang akan diuji menghasilkan
nilai negatif atau sehat dan sesuai dengan hasil dari
pemeriksaan gold standard. Sel ini sering disebut
sebagai negatif benar (true negative).
Pola keempat sel ini bersifat tetap dan tidak boleh
dibolak-balik. Agar dapat memahami mengenai skema
tabel 2x2 maka dapat melihat pada gambar 1.
(Sastroasmoro & Ismael, 2011)
Gambar 1: skema tabel 2x2 dalam uji diagnostik

Variabel standard
Uji Diagnosis (Gold standard) TOTAL
Sakit (+) Sehat (-)
Variabel Sakit A B A+B
prediktor (+) (true (false
(Hasil uji) positive) positive)
Sehat (- C D C+D
) (false (true
negative) negative)
TOTAL A+C B+D A+B+C+D
Sumber: Sastroasmoro, S., & Ismael, S. (2011).
Pengukuran. In Dasar-dasar Metodologi
Penelitian Klinis (4th ed., pp. 66–70). Sagung
Seto.
Syarat suatu uji redictor yang baik adalah adanya
gold standard pemeriksaan untuk menegakkan
diagnosis, dan semua sel yang ada dalam tabel 2x2
harus terisi atau tidak boleh ada nilai kosong.
278
Bila kita dihadapkan suatu kasus dimana seorang peneliti ingin
mengetahui nilai diagnostik USG paru untuk keperluan diagnosis
COVID-19 di Unit Gawat Darurat Rumah Sakit. Berapakah nilai
diagnostik USG paru untuk mendiagnosis COVID-19?
Berikut penggunaan SPSS untuk menghasilkan tabel 2x2 dalam uji

diagnostik (Sopiyudin, 2018).
1. Buka program SPSS
2. Buka file uji diagnostik 2x2.sav
3. Klik analyse
4. Pilih Descriptive Statistics
5. Pilih Cross Tabs
6. Masukan variabel USG ke Row(s) dan Variabel CTScan

Paru ke Column(s)
7. Prosedur telah selesai, klik OK
279
8. Output : Hasil diperoleh sebagai berikut
C. ANALISA TABEL 2 X 2
Seperti telah dijelaskan sebelumnya, uji redictor
diperlukan untuk menilai tingkat keakuratan dan
ketepatan suatu parameter pemeriksaan
dibandingkan dengan pemeriksaan yang sudah
diakui tingkat akurasi dan ketepatannya. Untuk
menilai akurasi dan ketepatan suatu parameter
pemeriksaan dapat dengan menghitung
sensitivitas dan spesifisitas suatu parameter
pemeriksaan. Pengukuran uji diagnostik (
sensitivitas, spesifisitas, positive predictive value,
negative predictive value, dan Likehood ratio)
dalam SPSS tidak bisa dilakukan. (Sopiyudin,
2018)
Sensitivitas merupakan proporsi orang yang benar-benar
sakit dalam suatu populasi yang juga diidentifikasikan sakit oleh
redicto redictor. Sensitivitas digambarkan sebagai persentase
orang dengan penyakit dan hasil test positif dengan pemeriksaan
280
gold standard yang menunjukan hasil positif. Sensitifitas yang tinggi
diperlukan untuk melakukan skrinning suatu penyakit. Bila suatu
parameter pemeriksaan dengan sensitivitas rendah digunakan
sebagai skrinning maka akan dijumpai banyak redicto palsu
Sensitivitas dapat diukur dengan menggunakan rumus :
Sensitivitas = true positive / (true positive + false negative) x 100%
Spesifisitas merupakan proporsi orang yang tidak sakit

dalam suatu populasi yang juga diidentifikasikan sehat oleh
redicto redictor. Spesifisitas digambarkan sebagai persentase
orang tanpa penyakit dengan pemeriksaan gold standard yang
secara test dinyatakan redicto. Spesifisitas yang tinggi diperlukan
untuk melakukan diagnosis suatu penyakit. Bila suatu parameter
pemeriksaan dengan spesifisitas rendah digunakan sebagai
diagnosis maka akan dijumpai banyak positif palsu. (Sastroasmoro
& Ismael, 2011).
Spesifisitas= true negative / (true negative + false positive) x 100%
Suatu pemeriksaan untuk menegakkan diagnosis

diharapkan memiliki sensitivitas dan spesifisitas yang tinggi. Namun
ada kalanya suatu pemeriksaan memiliki sensitivitas yang tinggi
namun spesifisitas rendah atau sebaliknya. Sehingga kita harus
mencari tahu parameter apa yang memiliki sensitivitas dan
spesifisitas terbaik untuk menggantikan pemeriksaan gold standard
Nilai prediktif merujuk kepada kesesuaian antara hasil
pengukuran alat ukur sekarang dan hasil pengukuran gold standard.
281
Nilai prediksi digunakan bila gold standard masih belum tersedia,
atau diramalkan ada pergeseran gold standard. Terdapat 2 macam
nilai prediksi yaitu: nilai prediksi positif dan nilai prediksi negatif
Nilai prediksi positif (positive predictive value/ PPV) adalah
proporsi pasien yang benar-benar positif (true positive) di antara
keseluruhan penderita yang menunjukkan hasil tes pemeriksaan
positif. Nilai ini menunjukkan berapa besar hasil tes positif adalah
benar-benar positif atau menderita penyakit. Jika dibandingkan
dengan standard PPV probabilitas subjek yang diidentifikasikan
positif oleh alat ukur, akan benar-benar positif pada gold standard
PPV = true positive /(true positive + false positive) x 100%
Nilai prediksi redicto (negative predictive value/ NPV)

adalah proporsi pasien yang tidak sakit (true negative) di antara
keseluruhan orang sehat yang menunjukkan hasil tes pemeriksaan
negative. Nilai ini menunjukkan berapa besar hasil tes redicto
adalah benar-benar redicto atau sehat. Jika dibandingkan dengan
standard NPV probabilitas subjek yang diidentifikasikan redicto
oleh alat ukur, akan benar-benar redicto pada gold standard
NPV = true negative / (true negative + false negative) x 100%
NPV dan PPV dipengaruhi oleh suatu prevalensi penyakit
dan nilainya akan berubah jika dilakukan pada kondisi prevalensi
yang berbeda. Likehood ratio for positive test (LR+) dan Likehood
ratio for negative test (LR-) merupakan parameter yang tidak
dipengaruhi oleh suatu prevalensi. LR+ dan LR – dapat dikalkulasi
dengan rumus
282
LR+ = sensitivitas/ (1- spesifisitas)
LR- = (1-sensitivitas) / spesifisitas
Nilai diagnostik yang baik disimpulkan bila LR+ memiliki nilai
diatas 10 dan LR- memiliki nilai dibawah 0,1
(maria,2008)(sopiyudin,2018).
SPSS juga tidak bisa menghitung nilai 95% confidence
interval dari masing-masing nilai diagnostic. Akan tetapi, hal
tersebut dapat diatasi dengan menghitung mengunakan kalkulator
online pada https://www.medcalc.org/calc/diagnostic_test.php.
D. Analisis Area Under the Curve (AUC) pada

Kurva Receiver Operating Characteristic (ROC)
Penyusunan kurva ROC dapat dilakukan dengan menentukan
nilai 1-spesifisitas pada aksis x dan sensitivitas pada aksis y. Titik
potong pada kedua nilai tersebut ditarik garis menjadi suatu kurva.
Biasanya kurva ROC dapat dilakukan pada variable prediktor berskala
nurmerik, meskipun bisa juga dilakukan pada skala kategorik
(Šimundić,2008)(sopiyudin,2018).
283
Gambar 2. Kurva ROC dengan AUC
Sumber: Šimundić, A., 2008. [online] Measures of diagnostic accuracy:
basic definitions. Available at:
<https://www.ifcc.org/media/476873/ejifcc2008vol19no4pp203-
211.pdf> [Accessed 16 October 2020].
Bentuk dari kurva ROC dan AUC membantu peneliti untuk
memberikan keseimpulan bila pemeriksaan tersebut dapat
membedakan ada tidaknya suatu penyakit pada suatu penelitian.
Dalam kurva ROC terdapat garis diagonal dimana nilai sensitifitas dan
spesifiitas selalu 0.5. Bila kurva condong ke sisi kiri atau semakin luas
area AUC, maka pemeriksaan tersebut dapat membedakan ada
tidaknya suatu penyakit (Šimundić,2008)(sopiyudin,2018).
Interpretasi nilai AUC dengan pendekatan statistik memiliki
klasifikasi akurasi diagnostik menjadi sangat lemah, lemah, sedang,
baik dan sangat baik (tabel).
Tabel. Interpretasi Nilai AUC
NILAI AUC AKURASI DIAGNOSIS
>0.5-0.6 Sangat lemah
284
>0.6-0.7 Lemah
>0.7-0.8 Sedang
>0.8-0.9 Baik
>0.9-1 Sangat baik
Meskipun demikaian, pendekatan lain secara klinis terhadap

nilai AUC menjadi penting apabila nilai AUC tidak sejalan. Pendekatan
klinis digunakan apabila nilai AUC secara statistic masuk dalam
klasifikasi sangat lemah tetapi nilai AUC tersebut memiliki nilai lebih
besar daripada pemeriksaan yang telah ada. Pendekatan statistik
digunakan bila pemeriksaan tersebut tidak memiliki landasan untuk
dilakukan pendekatan secara statistik
(Šimundić,2008)(sopiyudin,2018).
Bila kita dihadapkan suatu kasus dimana peneliti ingin
menilai akurasi diagnosis pada skoring TB anak sebagai alat
diagnostic TB anak. Peneliti kemudian memasukan skoring TB anak
dengan skala pengukuran numeric (1-13) dan TB anak dengan
skala pengukuran kategorik ( 1 = TB dan 0= normal). Langkah input
SPSS dijabarkan sebagai berikut :
1. Buka file
2. Pilih Analyze, ROC Curve atau Graphs, ROC Curve
(sesuai seri SPSS)
3. Tampilan sebagai berikut
285
4. Klik TBanak ke dalam test variable
5. Input angka 1 dalam value of state variable
6. Klik skoringTB ke dalam test variable
7. Klik ‘with diagonal reference line’ , ‘standard error and
confidence interval’, dan’ coordinate points of ther ROC
Curve’ hingga terdapat ‘√’ pada Display
8. Tampilan sebagai berikut
286
9. Klik OK
10. Output yang dihasilkan sebagai berikut
287
Interpretasi hasil output:
1. Pada case processing summary, sampel penelitian
dengan TB sebanyak 12 dari 25 sampel. Oleh karena itu,
prevalensi TB adalah 48%
2. Pada output, kurva ROC menunjukan skor TB memiliki
nilai diagnostic cukup baik karena kurva diatas garis 0.5 dan
mendekati 1
3. Nilai AUC sebesar 0.85 (95%CI 0.67-1), p<0.003. Secara
statistic, nilai AUC tergolong baik.
4. Interpretasi interval kepercayaan ditemukan bahwa nilai
AUC pada skor TB terhadap seluruh sampel berkisar 0.67
sampai 1.
5. Uji hipotesis pada SPSS bertujuan untuk membandingkan
variable predictor dengan nilai AUC 0.5. Nilai p<0.05
memiliki nilai signifikansi secara statistik.
Titik potong (cut off point)

Titik potong atau cut off point merupakan perbatasan yang
digunakan pada variabel uji diagnostik untuk membedakaan antara
hasil positif dan hasil negatif. Titik potong diperlukan pada variabel
yang memiliki skala ordinal (bukan dikotom) atau pada skala
288
numerik agar dapat diubah menjadi skala kategorikal dikotom. Misal
pada skala ordinal didapatkan nilai variabel adalah negatif, positif 1
(+), positif 2 (++), dan positif 3 (+++). Agar dapat dimasukkan
kedalam tabel 2 x 2, haruslah diubah menjadi variabel dikotom
Pemilihan titik potong bisa secara klinis dan statistik.
Pemilihan titik potong secara klinis disesuaikan oleh peneliti. Bila
titik potong digunakan untuk kebutuhan skrining maka titik potong
dipilih dari nilai sensitivitas yang tinggi. Bila titik potong digunakan
untuk kebutuhan diagnosis, maka titik potong dipilih dari nilai
spesifitas yang tinggi. Apabila peneliti kesulitan dalam menentukan
titik potong secara klinis, maka penentuan titik potong secara
statistic dapat dilakukan dengan youden index. (sopiyudin,2018)
Indeks Youden (J index) merupakan statistik yang dapat
menggambarkan performa suatu parameter pemeriksaan dalam uji
diagnostik. Diperkenalkan pertama kali oleh WJ Youden pada tahun
1950. J index merupakan kesimpulan dari variabel prediktor yang
meliputi gabungan antara sensitivitas dan spesifisitas. Nilai referensi
J index adalah 0 hingga nilai 1. Semakin mendekati angka 1,
semakin mendekati angka 1 maka persentase untuk false positive
atau false negative menjadi semakin kecil. Bila nilai J index
mendekati 0, maka tingkat keakuratan dan ketepatan dari variabel
prediktor sangat buruk, atau pelabelan positif dan negatif tertukar
J Index = (sensitivitas + spesifisitas) – 1
Program SPSS tidak dapat mengolah youden index oleh

karena itu Microsoft office excel dapat dimanfaatkan dengan
langkah-langkah sebagai berikut (sopiyudin,2018):
289
1. Copy-Paste semua data output dari SPSS ke Ms.Excel
2. Tambahkan kolom baru pada sisi paling kiri dengan label
nomor dan sisi paling kanan dengan label spesifitas.
3. Pada label spesifisitas menggunakan rumus
1- (1-specificity)
4. Sembunyikan kolom 1-specificity dan tambahkan kolom

paling kanan dengan label youden index
5. Pada kolom youden index dihitung dengan rumus
Sensitivitas + spesifisitas -1
6. Setelah diperoleh hasil perhitungan, pada kolom youden
index dicari nilai paling besar
290
7. Titik potong yang diambil adalah nilai titik potong dengan
youden index paling besar.
Interpretasi :
1. Pada nomor 11 diperoleh nilai youden index 0.75. Pada
nomor 11 juga didapat nilai positif sebesar ≥ 10,5 dengan
sensitivitas 75% dan spesifisitas 100%. Oleh karena itu
pasien TB dengan nilai ≥ 10,5 akan terdiagnosis sebagai
pasien TB.
Pertanyaan Latihan
Implementasi kasus (Rapid test SARS Cov-2 “X”)
Seorang peneliti ingin meneliti mengenai akurasi
pemeriksaan rapid test “X” dalam mendeteksi penyakit
Covid-19. Rapid test “X” yang diperiksa adalah dengan
menggunakan specimen darah untuk diperiksa antibody
terhadap SARS COV-2. Bila dalam darah sampel
ditemukan antibody SARS COV-2 maka sampel akan
dikelompokan sebagai kelompok sakit, sedangkan bila
291
Gold standard diagnosis untuk pemeriksaan Covid-19
adalah dengan pemeriksaan RT-PCR dengan
mengggunakan spesimen swab nasofaring dan
orofaring. Bila hasil pemeriksaan RT PCR menunjukan
nilai positif maka dapat dipastikan pasien menderita
Covid-19, sedangkan bila RT PCR negative maka dapat
disimpulkan pasien sehat atau terbebas dari Covid-19
Dari hasil pengamatan observasional selama penelitian
didapatkan 200 sampel pasien. Dari pemeriksaan RT
PCR didapatkan 100 sampel positif Covid-19 dan 100
pasien siasanya negative atau sehat. Dari 100 sampel
positif Covid-19, hanya 80 sampel yang memiliki hasil
antibody positif dengan pemeriksaan rapid test “X”,
sisanya rapid test “X” negative. Sedangkan dari 100
sampel sehat, 70 sampel memiliki hasil rapid test “X”
negative, sedangkan sisanya hasil rapid positif.
Tugas :
1. Buatlah tabel 2x2 dari kasus diatas
2. Hitunglah sensitivitas, spesifisitas, indeks Jouden,
3. Hitunglah nilai prediksi positif dan nilai prediksi positif?
292
Referensi
David L Sackett, R Brian Haynes, Gordon H Guyatt, Peter
Tugwell. 1991. Clinical Epidemiology a Basic Science for Clinical
Medicine. Little Brown Company. Boston p: 3- 153
Sastroasmoro, S., & Ismael, S. (2011). Pengukuran.

In Dasar-dasar Metodologi Penelitian Klinis (4th ed.,
pp. 66–70). Sagung Seto.
Šimundić, A., 2008. [online] Measures of diagnostic accuracy:

basic definitions. Available at:
Sopiyudin Dahlan. 2018. Penelitian Diagnosis, Validitas &

Reliabilitas. edisi 2. Salemba Medika. Jakarta
293
294
BAB XIV
PENALARAN STATISTIK BUAT DOKTER
UMUM

Bag Ilmu Kesehatan Masyarakat & Kedokteran
Keluarga
UNIVERSITAS KRISTEN DUTA WACANA
YOGYAKARTA
*Anggota BKS IKM IKK IKP FK Se-Indonesia
Regional IV
*e-mail: sshs@staff.ukdw.ad.id atau
sshsgaksipat@yahoo.com
Tujuan Pembelajaran
Membangun literasi ilmu/statistik kritis
Diimensi pengetahuan dan ketrampilan (knowledge &skill)
1. Mampu menjelaskan peran dokter umum dalam

upaya kesehatan
2. Mampu menjelaskan peran penalaran dalam

kegiatan belajar ilmu ataupun bekerja
3. Mampu menjelaskan kriteria penalaran yang tepat
4. Mampu memberi contoh dan penjelasan

miskonsepsi terkait ilmu/statistik
5. Mampu menjelaskan peran data dalam statistik
6. Mampu menerapkan penalaran statistik dalam mengkaji

artikel/sistem informasi kesehatan atupun dalam
menyusun laporan kerja sebagai masukan bagi sistem
informasi kesehatan
295
Dimensi Sikap (affective)
Membangun sikap kritis/skeptis ilmiah
Ringkasan
Untuk menjadi dokter umum, mahasiswa kedokteran

harus lulus sarjana ilmu kedokteran terlebih dahulu; seorang
dokter haruslah ilmuwan. Dokter seharusnya mempunyai
kompetensi belajar sepanjang hayat. Ada 3 komponen utama
yang dilakukan dalam belajar: mengingat (memorizing),
menalar (reasoning), dan mempraktikkan (practicing, bahasa
Jawa: nglakoni). Ketiganya diperlukan dan masing-masing
punya keunggulan, tetapi untuk menjadi kritis, tidak mungkin
tanpa belajar penalaran.
Pekerjaan dokter umum adalah melakukan layanan

kesehatan (baik klinik maupun komunitas) di lini depan
(primary health care provider) sehingga selalu terbeber (ter-
expose) ragam masalah kesehatan yang terus berkembang.
Kompetensi mawas diri dan pengembangan diri (self concept
and self directed learning) serta literasi statistilk adalah
keniscayaan (necesarry).
Statististik adalah disiplin ilmu yang menangani data
empirik yang bersifat agregat (kumpulan banyak data) dengan

pendekatan probabilitas. Perhitungan probabilitas
menggunakan formula matematik dengan simbol-simbol yang
sering membuat pemakainya tidak konfiden.
Kalau statistik masuk ranah (domain) ilmu yang empirik,

maka penalaran masuk ranah epistemolgi, bagian dari filsafat
yang mempelajari masalah-masalah pengetahuan.
Penalaran adalah upaya memahami secara masuk akal
296
(make sense) dengan menggunakan pertimbangan-
pertimbangan dan prinsip atau asas alur pikir yang tepat.
Penalaran yang baik membuahkan pemahaman kritis (tidak
asal-asalan) serta mencegah pemahaman yang keliru
(misconception). Pemahaman selalu memerlukan bahasa,
sedangkan bahasa tidak bisa dipisahan dari konteksnya.
Supaya jangan salah, pikirkanlah konteks masalahnya.
Dengan pertimbangan dan prinsip yang tepat, penalaran

akan menghasilkan simpulan (inferensi) yang tepat pula;
simpulan ini digunakan untuk membuat keputusan dalam
solusi masalah. Kunci penalaran adalah prinsip yang tepat
dan pertimbangan yang relevan dan benar. Bahan
utama (main ingradient) suatu penalaran adalah data,
eviden.
Ilmu yang menangani masalah data adalah statistik. Di

sinilah terjadi sinergi antara penalaran dan statistik, dan
kalau itu dimanfaatkan dengan tepat untuk penanganan
masalah kesehatan, baik masalah klinik maupun masalah
komunitas.
Dengan kemampuan statistik dan penalaran yang baik,

serta terus meningkatkan literasinya, dokter umum
(individual atau tim) dapat menangani masalah kesehatan
secara lebih terukur dan efektif.
Pesan dalam Belajar
Materi ajar ini tidak mungkin menyediakan secara lengkap

apa yang harus dipelajari dan petunjuk-petunjuk bagaimana cara
mempelajarinya. Bab ini lebih tepat dipahami sebagai pengantar
apresiatif terhadap statistik: mengenal dan memahami statistik
297
lebih baik, untuk makin menghargai, dan menyenangi sehingga
mau mempelajari lebih seksama.
Pemahaman, kepandaian, kesehatan, semuanya itu

bukanlah
sesuatu yang dapat diberikan ataupun dibeli. Kesehatan

ataupun kepandain adalah kualitas hidup, jadi keduanya
menyatu dengan hidup. Pandai bukanlah hasil dari diajar, tetapi
hasil belajar. Siapa yang memerlukan kepandaian harus
belajar. Belajar dalam kelompok kecil melalui diskusi akan lebih
efektif terutama dalam membangun kompetensi keputusan
kesepakatan (commonsial decision making), yang sangat berguna
dalam memberikan layanan kedokteran.
Asumsi dasar dari penyusunan materi ajar ini adalah pemakai

atau pembaca sudah memahami konsep, teori, atau prinsip dasar
dari logika, statistika, probabilitas, epidemiologi, serta metode
penelitian. Sekiranya mengalami kesulitan dalam memahami
materi ajar ini, lakukanlah konsultasi antarteman (peer
consultation), dosem, atau kepada siapa yang berkompeten.
Lakukanlah diskusi kritis dengan rasa hormat dan rendah hati.
Materi Belajar
A. Dokter, Pekerjaan dan Kompetensinya

Kita sering mendengar ujaran praktik kedokteran adalah
praktik ilmu dan seni kedokteran. Ilmu adalah kegiatan
berdasarkan atas akal, sedangkan seni adalah kegiatan
berdasarkan atas rasa. Ilmu bercirikan adanya teori dan metode
yang penuh disiplin, sedang seni bersifat luwes, mengedepankan
soal keindahan, keharmonisan keserasian berdasar imajinasi dan
kreativitas. Ilmu kedokteran dikembangkan melalui penelitian,
298
pembelajaran, dan prakti penerapan atau dikenal dengan istilah
pengabdian masyarakat, sedang seni kedokteran
dikembangkan dari praktik berkelanjutan. Bagaimana pun, dalam
praktik kegiatan kedokteran, ilmu kedokteran adalah sebagai
yang utama, yang primer; dan seni adalah sebagai penunjang,
yang sekunder. Makin diketemukan seninya, makin nyata kinerja
ilmunya.
Seperti praktik kedokteran, praktik belajar dan menalarpun pun

juga adalah praktik ilmu belajar dan menalar serta seni belajar
dan menalar. Ilmu menalar disebut logika, ilmu belajar masuk
dalam ilmu pendidikan yang mestinya disebut edukologi, tetapi
lazimnya dikenal sebagai education. Makin kita mempraktikkan
menalar dan belajar, kita makin menguasai seni menalar dan
belajar. Semakin kita menemukan keindahan dan keserasiannya,
kita pun akan semakin menyenanginya.
Dahulu, pekerjaan dokter dikenal hanya menyembuhkan

orang sakit. Mengikuti dinamika jaman, pekerjaan dokter terus
bergeser sesuai dengan kebutuhan. Pekerjaan dokter sekarang
adalah melakukan praktik kedokteran berupa upaya kepada
perorangan (disebut upaya kedokteran perorangan atau
kedokteran klinik),
dan upaya kepada masyarakat (disebut upaya kedokteran

masyarakat atau kedokteran komunitas). Upaya-upaya itu dapat
berupa promotif, preventif, kuratif, atau rehabilitatif. Upaya
dapat dilakukan secara sendiri-sendiri, kombinasi, atau secara
keseluruhan. Yang terakhir itu disebut upaya kesehatan yang
komprehensif.
Meski ada perubahan tentang apa yang harus dikerjakan

dokter, tetapi satu hal yang tidak boleh berubah: yaitu
299
bagaimana dokter menyikapi manusia, dan bagaimana dokter
menyikapi pekerjaannya. Dalam hal menyikapi manusia, dokter
harus mencintai manusia dan kehidupannya. Dokter harus
seorang filantropis. Dokter tidak boleh menjahati kepada siapa ia
harus memberi pelayanan.
Dalam hal menyikapi pekerjaannya, dokter haruslah seorang

altruis, yaitu mau mendahulukan kepentingan umum dibanding
untuk kepentingannya sendiri. Dalam mendahulukan
kepentingan umum dengan baik, dokter membangun kesadaran
perlunya selalu mau menjaga kesehatan dirinya sendiri. Jangan
sampai dalam mendahulukan kepentingan umum menelantarkan
diri, menjadi jatuh sakit yang malah tidak mampu memberikan
uapaya kesehatan bagi sesamanya.
Konsil Kedokteran, dalam keputusannya tentang Standar

Kompetensi Kedokteran Indonesia (SKDI) 2012 menyatakan
bahwa kompetensi ketrampilan klinik dokter di antaranya adalah
menanganii masalah kesehatan secara holistik dan
komprehensif. Konsep komprehensif pada umumnya sudah
dipahami dengan baik, yaitu bahwa semua upaya kesehatan
(promotif, preventif, kuratif, dan rehabilitatif) dilakukan secara
menyeluruh.
Konsep Holistik dalam praktik sering dipahami sebagai upaya

yang dilakukan terhadap manusia dengan kesadaran bahwa
manusia adalah makhluk fisiko-psiko-spirituo-sosio-kultural,
yang kalau semua aspek tersebut diperhatikan maka sudah
memenuhi sebagai upaya yang holistik. Pemahaman ini tidak
salah, tetapi perlu penjelasan agar operasionalnya jelas.
Pendekatan holistik sebenarnya berangkat dari paham

holisme yang menyoroti cara memahami holon. Istilah holon
300
dipinjam dari Kostler yang melihat fenomena setiap satuan
kehidupan adalah suatu whole yang sekali gus juga part, dan
olehnya satuan kehidupan itu dinamai holon. (Anderson & Carter,
1978: 11)
Cara memahami satuan kehidupan, entitas, atau holon,

secara holisme, adalah sebagai berikut (Wolff et al, 1983:
116-118):
1. Setiap holon merupakan suatu keseluruhan (whole) sekali

gus suatu bagian (part).
Sel adalah suatu holon, maka sel adalah suatu

keseluruhan (whole), yaitu tersusun dari bagian-
bagiannya seperti nukleus, dinding sel, sitoplasma dan lain
sebagainya. Sel adalah juga merupakan suatu bagian
(part), karena ia iuga merupakan bagian dari entitas yang
lebih besar yaitu yang disebut jaringan. Sedangkan
jaringan adalah suatu holon, jadi merupakan suatu whole
yaitu yang memiliki komponen terdiri dari sel-sel, tetapi
juga merupakan suatu part dari dari holon yang lebih
besar, yaitu organ. Demikianlah seterusnya organ, sistem
(misalnya sistem kardio vaskuler), tubuh, manusia,
keluarga, komunitas …. sampai jagad raya, semuanya
adalah suatu whole sekali gus suatu part.
2. Untuk memahami entitas yang lebih tepat, caranya adalah

memahaminya sebagai whole, tidak cukup kalau
memahaminya dari part-partnya.
3. Entitas bukan sekedar mempunyai ciri-ciri sebagai

kumpulan dari part, tetapi masih ditambah hasil interaksi
antar part dan interaksi semuanya itu dengan lingkungan.
Karakter keluarga bukan sekedar penjumlahan dari
301
karakter semua warganya, tetapi masih ditambah karakter
sebagai akibat interaksi antar mereka ditambah karakter
akibat interasksi dengan lingkungan.
4. Holistik adalah pendekatan dalam memahami suatu yang

menerapkan paham holisme
Implikasi dari pendekatan holistik dalam kedokteran misalnya

dalam memahami pasien (perseorangan maupun masyarakat),
maka pasien tersebut dipahami melalui pemahaman secara

utuhnya, yaitu manusianya (dalam upaya klinik), bukan
memahmi sekedar dari bagian-bagian yang dikeluhkan sakit.
Pak Insan yang gagal ginjal janganlah direduksi menjadi si
gagal ginjal.
Pendekatan holistik dipertentangan dengan pendekatan

fragmented atau reduksionis, yaitu cara memahami suatu
masalah yang lebih mendasarkan kepada pemahaman bagian-
bagian. Pendekatan fragmented sangat memberi sumbangan
dalam pengkajian pendalaman masalah, tetapi mempunyai
ekses melupakan humanitas, pada hal kemanusian harus
dikedepankan. Pasien diperlakukan secara manusiawi, dan
bukan menjadi terreduksi disamakan dengan hasil-hasil
pemeriksaan radiologi, laboratorium, atau hasil pemeriksaan
lain.
Dalam hal upaya komunitas, dokter perlu memiliki

pemahaman komunitas as a whole. Ini menuntut pencermatan
data dan tata pikir (mind set) yang adekuat tentang komunitas.
Data komunitas pasti berupa data agregat dan oleh karenanya
memerlukan literasi statistik dan penalaran yang tepat.
302
B. Masalah Kesehatan dan Kebutuhan Penalaran
Statistik
Pernyataan bahwa pekerjaan dokter adalah melakukan
upaya kesehatan menunjukkan bahwa yang ditangani dokter
adalah masalah kesehatan. Kesehatan adalah kualitas hidup
yang terkait dengan struktur dan fungsi kehidupan. Karena
kesehatan itu kualitas hidup, maka sejak manusia sudah
memulai kehidupan sampai dengan kehidupan berakhir, ada
kualitas hidupnya, ada kekesehatannya yang dapat dinyatakan

kualitasnya, dinyatakan status kesehatannya.
Masalah adalah sesuatu yang membutuhkan solusi,

misalnya adanya sakit, cacat, kelemahan, atau keadaan yang
tidak well being. Seperti pemilahan pada upaya kesehatan,
demi praktisnya masalah kesehatan juga dipilah menjadi
masalah kesehatan perseorangan (klinik), dan masalah
kesehatan masyarakat (komunitas).
Masalah kesehatan perseorangan dapat dikenali dari apa

yang dikeluhkan pasien serta hasil pemeriksaan ketika
berkonsultasi ke dokter. Sedangkan masalah kesehatan
komunitas dapat diketahui dari data komunitas melalui catatan-
catan laporan layanan kesehatan, hasil wawan cara denan
marga masyarakat, observasi lapangan, ataupun hasil
pemeriksaan laboratorium yang dilakukan.
Pengertian masalah kesehatan komunitas yang tepat

bukanlah masalah kesehatan di komunitas, tetapi masalah
kesehatan yang diidap/diderita oleh komunitas (sebagai unit
kehidupan, entitas). Wujud masalah kesehatan komunitas
tidak berbeda dengan masalah perseorangan, misalnya
keberadaan banyaknya kejadian sakit atau kematian, tetapi
303
masih ditambah seperti masalah lingkungan, bencana, serta
masalah manajemen atau organisasi.
Dalam rangka membangun kemampuan kerja (capasiy

building) dalam organisai layan kesehatan, masalah kesehatan
bagi dokter dapat dikategrikan:
1. Masalah teknis operasional kesehatan
2. Masalah organisasi manajemen kesehatan
3. Masalah wawasan/perspektif Kesehatan
4. Masalah penelitian kesehatan
Masalah teknis operasional adalah masalah yang terkait

dengan kegiatan praktik layanan dokter terhadap pasien klinik
atau pun komunitas. Itu meliputi teknik diagnosis, prognosis dan
terapi/ treatment. Ketrampilan (skill) yang dperlukan untuk
penanganan adalah ketrampilan teknis medis.
Masalah adminstrasi/manajemen kesehatan adalah terkait

pekrjaan institusi dalam menjalankan misinya. Ini meliputi
bagaimana melakukan pembagian tugas, merencanakan
program, melakukan evaluasi serta revisi-revisi yang
diperlukan. Ketrampilan yang diperlukan adalah ketrampilan
manajemen organisasi.
Masalah wawasan/perspektif kesehatan adalah meliputi masalah

kebijakan yang bersifat makro, menentukan prioritas organisasi
dan sesuai nilai-nilai serta visi pembangunan. Ketrampilan yang
diperlukan adalah ketrampilan wawasan, terkait dengan visi,
misi, nilai-nilai dan tujuan, mungkinjuga dapat disebut
ketrampilan kepemimpinan.
304
Masalah penelitian kesehatan adalah masalah berkaitan dengan
pengembangan iptek kesehatan yang bersifat murni keilmuan
atau bersifat terapan. Ketrampilan yang diperlukan adalah
ketrampilan penelitian.
Dalam layanan yang mandiri, kategori ketrampilan lebih

tepat cukup dibagi dua: hard skill dan soft skill. Hard skill
adalah yng bersifat tenis medis, soft skill yang non teknis
medis yaitu yang bersifat hubungan antar manusia,
berkomunikasi ataupun
memberi empati dan perlakuan manusiawi lain. Kontribusi soft

skill untuk keberhasilan penanganan masalah tidak kalah
pentingnya.
Proses penanganan masalah, apa pun masalahnya, selalu

dimulai dengan pengumpulan dan pengkajian data untuk
perumusan masalah, yang dilanjutkan dengan perencanaan
berikut eksekusi beserta pemantauan dan evaluasinya.
Dalam kesemuany itu, data merupakan kunci pembuka
keberhasilan.
Data adalah komponen utama, sebagai masukan (in put) yang

menentukan jalannya proses dan yang kemudian menghasilkan
keluaran (out put). Keluaran itu memunculkan data baru, dan
data baru itu selanjutnya masuk siklus in put–processs–out put
berikut dan seterusnya. Sampah yang masuk, sampah pula yang
keluar (garbage in garbage out). Agar data yang masuk tidak
berupa sampah, diperlukan kompetensi penangan data.
Ilmu tentang penangan data itu adalah statistik. Sebagai

ilmu, statistik memiliki teori – teori (penjelasan tepercaya) tentang
data. Statistik juga memiliki metode-metode dalam penanganan
data: bagaimana menetapkan dari siapa data diperoleh,
305
bagaimana melakukan pengukuran, mengorganisasi hasil
pengukuran, melakukan uji data ataupun memberikan
interpretasinya.
Statistik dapat dilihat sebagai ilmu dalam menangani

data,mdapat pula dilihat sebagai himpunan data.
Sebagai ilmu, yang mendasari statistik adalah teori

probabilitas. Oleh karena itu turunan dari kegiatan yang
berbasis statistik, baik berupa pembuatan simpulan penelitian,
penyusunan teori baru, ataupun revisi teori dalam
pengembangan ilmu, semuanya adalah juga bersifat probabilitas
(Colton, 1974:63, Lwanga.1986: 55). Signifikansi kesimpukan
suatu fenomena, dan bahkan dalam hal berpercaya pun semua
diekspresikan dalam probabilitas.
Teori probabilitas menyadarkan tentang hakikat adanya

peluang (chance) terjadinya kesalahan (error). Kesadaran itu
dieksplisitkan dengan pernyataan seberapa besar kesalahan
itu masih dapat ditoleransi. Ilmuwan seharusnya betul-betul
mengandalkan statistik beserta teori probabilitasnya, dan
konsisten dengan itu juga menerima akan adanya peluang
kesalahan. Jadi hasil uji statistik jangan dimutlak- pastikan
kebenarannya.
Penalaran probabilitas dalam penyimpulan statistik tentu

tidak mudah dipahami oleh awam (sesuai asas kesiapan
dalam belajar yang akan dibahas kemudian), termasuk
penjelasan faktor risiko atau pun sebab akibat yang
menggunakan pendekatan statistik. Inilah kiranya yang
menjelaskan kenapa pekerjaan preventif tidak populer.
Hasilnya tidak segera kelihatan, dan nyatanya apa yang
dikatakan dicegah, masih bisa terjadi. Tantangan bagi
306
ilmuwan kesehatan untuk menyukseskan upaya promotif
priventif yang secara statistik sangat meyakinkan
manfaatnya, tetapi tidak diterima oleh awam.
Selain sebagai ilmu, statistik juga merupakan himpunan

data. Statistik kesehatan adalah himpunan data kondisi atau
masalah kesehatan yang penting, terukur dan tertata secara
sistematis dalam bentuk tabel angka-angka atau grafik.
Dengan rancangan statistik yang tepat, evaluasi penanganan
masalah kesehatan dapat divisualisasikan lebih efektif dan
menarik.
C. Tantangan Pembelajaran Dokter Umum

Dokter umum ditempatkan sebagai pemberi layanan pada lini
depan dalam menjalankan praktik dokter. Ia disyaratkan dapat
memberi layanan kesehatan klinik atau pun komunitas. Masalah
kesehatan terus berkembang, dokter umum pun perlu mampu
mengembangkan wawasannya dalam pelayanan kedokteran agar
dapat mengambil keputusan yang tepat menangani sendiri atau
merujuk. Itulah kompetensi dokter yang sangat dasar, yaitu
kompetensi mawas diri dan pengembangan diri (self concept &
self directed learning).
Belajar bukanlah hanya kegiatan, tetapi juga proses. Proses
belajar bukan hanya terjadi di otak tetapi di setiap komponen
kehidupan. Belajar sepanjang kehidupan bukanlah sekedar
semboyan, tetapi juga pernyataan keyakinan. Ada hidup berarti
ada pembelajaran. Hidup yang salah berarti belajar yang salah.
Cara belajar sesuatu juga mengandung keunikan, baik dari

sudut pandang si pembelar maupun dari sudut apa yang
dipelajari. Belajar naik sepeda atau berenang berbeda
dengan belajar matematika atau sejarah, belajar ketrampilan
307
berbeda dengan belajar pengetahuan. Untuk memiliki
kompetensi mawas diri dan pengembangan diri, dokter, perlu
belajar meta learning, belajar bagaimana cara belajar.
Nama dokter beasal dari kata docere yang berarti

mengajar. Selain “mengajar” orang lain, dokter juga perlu
dapat mengajar dirinya sendiri. Dokter perlu tahu asas dan
prinsip belajar. Bebarapa butir asas dan konsep berikut perlu
dicermati:
1. belajar perlu kesiapan, baik persiapan mental, fisik,

maupun kesiapan ekonomi. Jer basuki mawa beya (bhs
Jawa: setiap kenyamanan memerlukan biaya). Setiap
jenjang pembelajaran memiliki persyaratan asas kesiapan

(jadi perlu dipersiapkan) untuk bisa mempelajari lebih
lanjut. Kesiapan di sini bersifat spesifik. Seseorang yang
sudah bisa membaca dengan baik belum berarti sudah
siap untuk mempelajari statistik, karena statistik perlu
syarat pengetahuan dasar matematika dan probabilitas..
2. Belajar, juga bekerja pada hakikatnya adalah untuk

mengatasi masalah, untuk membebaskan dari jerat
kebodohan, kebingungan. Secara filosofi, belajar yang
hakiki adalah belajar memanusiawi, memanusiawikan diri
dan sesamamanya. Jangan rancu antara tujuan dengan
kendaraan yang dipakai.
3. belajar yang efektif memerlukan pernyataan tujuan secara

spesifik, learning objective, sehingga memiliki fokus
pembelajaran. Learning objective dijadikan penuntun apa
yang dipelajari dan kapan aktuvitas belajar ini telah
mencapai tujuan belajarnya.
308
Belajar, memerlukan kemampuan mengingat, menalar, dan
mempraktikkan. Semua diperlukan dan masing-masing punya
keunggulan sesuai apa yang dihadapi dan siapa yang
melakukan.
Mengingat adalah proses membuka kembali (recall) apa

yang pernah diketahui, dirasakan, atau dikerjakan yang
disimpan dalam ingatan, dengan cara melacaknya kembali
(retrieving). Proses ini akan dipermudah kalau ada catatan
atau betuk rekaman lain. Dokter diwajibkan oleh undang-
undang dalam melakukan pratik kedokteran. Rekam medik
bukan saja untuk kepentingan dokter, tetapi juga untuk
kepentingan yang lebih beasar: demi keselamatan pasien.

Ketrampilan mencatat hendaknya terus dikembangkan.
Mengenali konsep-konsep kunci, detail dari pembahasan,
serta contoh-contoh yang relevans, akan membangun
sekaligus tingkat kemampuan mengingat efektif.
Menalar adalah kegiatan yang menjadikan pikiran,

gagasan, penyimpulan, atau keputusan yang dibuat adalah
masuk akal (make sense). Yang membuat masuk akal adalah
adanya kesesuaian dari apa yang dihadapi dengan prinsip,
kaidah, teori atau pertimbangan yang telah dipahami. Tanpa
penalaran, sesuatu yang dihadapi dipahami seperti apa
adanya menurut persepsi yang dimiliki, tanpa penalaran
akannmenjadi rentan terhadap miskonsepsi.
Pada dasarnya penalaran menggunakan pertimbangan

(premis) dan prinsip (asas atau kaidah) dalam membuat
simpulan (inferens). Penalaran adalah syarat utama untuk
menjadi kritis. Kritis berarti memiliki pertimbangan yang tepat,
dalam memikirkan mengerjakan sesuatu, bukan asal-asalan.
309
Mempraktikkan, mengaplikasikan teori atau metode
dalam memecahkan masalah baik dalam simulasi atau dalam
realitas kehidupn merupakan kegiatan belajar yang akan
memberi pemahaman yang sangat penting. Sudah barang
tentu praktik yang menyangkut kehidupan manusia tidak
boleh sembarangan, harus menggunakan prosedur yang
sangat ketat.
Instrumen penting dalam belajar pemahaman adalah

bahasa. Tanpa bahasa tidak mungkin ada kegiatan
memahami. Membangun gagasan, berbagi dan bertukar
pendapat, memberi penjelasan, semua menggunakan
bahasa. Ada berbagai bahasa yang digunakan, bahasa tulis,

lisan, bahkan bisa berupa isyarat atau simbol.
Bahasa pemahanan tersusun dari kata, kata itu

menyatakan suatu unit pemahaman. Unit pemahaman
terkecil disebut konsep. Satu kata bisa menyampaikan
konsep yang berbeda tergantung konteksnya. Pemahaman
yang baik terhadap konteks sangat penting untuk mencegah
salah memahami (miskonsepsi). Jika kita paham konsep
dengan tepat, kita tidak keliru terhadap apa yang kita bahas.
Kalau kita paham prinsipnya, kita tidak keliru dalam membuat
keputusannya. Belajar bahasa dengan baik adalah syarat
mutlak untuk menguasai pemahaman. Tanpa bahasa tidak
mungkin ada pemahaman yang dapat disampaikan kepada
sesama. Tanpa bahasa tidak mungkin melakukan penalaran.
D. Penalaran Statistik dalam Pendidikan Dokter

Seorang dokter, profesional dokter haruslah juga
ilmuwan kedokteran. Sebelum lulus menjadi dokter, ia
310
harus lulus sebagai sarjana kedokteran Strata 1 lebih
dahulu. Ketentuan undang-undang meyatakan bahwa
Program pendidikan profesi dokter merupakan program
lanjutan yang tak terpisahkan dari program sarjana (UU
Pendidikan Kedokteran Pasa 4 (6)). Penalaran lugas dari
pasal ini adalah terminal yang diarah pendidikan kedokteran
adalah dokter umum, dan untuk mencapai itu perlu
dipersyaratan lagi soal pencapaian IPK tertentu dari lulusan
S1 untuk diterima masuk pada prodi profesi dokter.
Persyaratan itu mestinya lebih tepat kalau diterapkan
untuk masuk prodi akademik pada strata lebih lanjut. (S2
atau S3)
Kualifikasi lulusan S1 adalah analis terkait keilmuan, ilmu

kedokteran bagi S1 kedokteran. Lulusan harus mampu
bersikap kritis ilmiah, dan mampu mengkaji secara ilmiah
penanganan masalah kesehatan umum yang prevalen di
wilayah tertentu. Sikap kritis ilmiah, berarti tidak asal-asalan,
dan ini ditunjukkan dengan apa yang disebut skeptis ilmiah
atau skeptis metodik (Komaruddin 2000: 248). Jangan apa
yang disampaikan terus diterima mentah-mentah, tetapi
ragukanlah dan ujilah terlebih dulu dengan penalaran. Baik itu
teori, metode, atau datanya dengan mempertanyakan
evidennya.
Yang dimaksud dengan mampu menangani masalah

kesehatan umum adalah adalah masalah tersebut tidak
memerlukan teori atau metode yang rumit/multi approach.
Kompetensi lulusan S1 yang lain adalh mampu melakukan
kerja sama, komunikasi, serta mampu menerima informasi
ilmiah dan memanfaatkannya untuk penanganan masalah.
Istilahnya sekarang memiliki kemampuan literasi ilmu
311
kesehatan. Sesuai tuntutan zaman, juga wajib memiliki
literasi teknologi informasi/ teknologi komputer
Lulusan prodi akademik dipersyaratkan membuat

penelitian ilmiah (riset). Penelitian ilmiah tidak sekedar
kegiatan yang menuntut ketelitian, tetapi juga hasilnya dapat
digeneralisasikan (Hulley, 2007: 3), dan pada kegiatan
penelitian ini kompetensi statistika paling nyata diperlukan.
Penelitian adalah demonstrasi kegiatan ilmiah yang paling
lengkap: penguasaan teori, metodologi, dan prinsip-

prisiputama ilmu, serta penerapannya dalam mengungkap
ketidak- tahuan.
Perumusan masalah, penyusunan pertanyaan penelitian,

dan penetapan variabel (sekali gus identifikasi variabel
perancu/confounding variable) serta penyusunan hipotesis
perlu pemilihan sumber teori dan dan evidensi atau data awal
yang tepat. Kesemanya itu penting untuk mendapatkan solusi
yang tepat sekaligus mencegah kesalahan sistemik.
Inti dari kajian penelitian adalah pengkajian data. Hanya

data yang relevan, valid, dan reliabel yang memberi hasil
sesuai rancangan/tujuan. Hasil penelitian yang harus dapat
digeneralisasikan memerlukan sampel yang benar, tidak
boleh asal-asalan, tidak asal gampang (convinient sample).
Penalaran statistik bukan terbatas kepada masalah

pemilihan formula yang dipakai, tetapi juga bagaimana
menangani data yang sesuai untuk mencari solusi masalah.
Penalaran statistik bukan hanya untuk menemukan
penjelasan hubungan antar variabel (apakah itu bermakna
sebab akibat, korelasi atau sekedar asosiatif, yang ranah
pembelajaran statistik analitik), tetapi juga menjelaskan
312
gambaran distribusi variabel berdasar hasil ukur (level of
measurement) atau frekuensinya yang menjadi ranah
pembelajaran statistik deskriptif.
Seperti telah disampaikan sebelumnya, yang mendasari

kajian statistik adalah teori matematik probabilitas. Formula/
rumus perhitungannya menggunakan simbol-simbol, tampak
keren, tetapi membingungkan bagi kaum awam matematik.
Timbullah miskonsepsi bahwa makin rumit rumus
statistiknya, makin hebat kualitas penelitiannya. Ini
bertentangan dengan asas Pisau Ockham (Ockham Rizor)

yang intinya dalam mengambil pilihan terhadap cara
penanganan (hipotesis, teori, metode, ataun pendekatan)
yang mempunyai potensi seimbang, pilihlah yang lebih
sederhana (Southwell, 2013:56-59)
Penelitian yang hebat adalah yang memberi solusi masalah

secara tepat dengan eror minimal untuk menangani masalah
besar. Solusi yang tepat dihasilkan dari perumusan masalah
penelitian yang tepat, pertanyaan penelitian yang tajam, serta
hipotesis yang mengena. Untuk itu perlu penggalian dasar
teori yang kuat. Kesalahan timbul karena data yang
digunakan tidak sesuai, dan kalkulasi yang meleset.
Bagi mahasiswa prodi akademik, yang utama bukan

penelitian yang hebat, tetapi penelitian yang relevan dengan
level studinya, dan menggunakan metode secara tepat.
Pilihan rancangan penelitian ataupun metode statistik harus

sesuai dengan masalah yang dihadapi, Statistik analitik
maupun deskriptif ataupun gabungannya mempunyai
kekuatan masing-masing dalam upaya mencari solusi.
313
Dalam penelitian, termasuk dalam olah statistik, tidak dapat
dihindarkan adanya asumsi yang digunakan yang secara
umum sudah diterima. Di balik pembuatan rumus matematik/
statistik pun ada asumsi yang digunakan. Kalau asumsi yang
digunakan tersebut ternyata salah, akan salah juga
kesimpulan hasil kajiannya. Hal ini perlu disadari untuk
dipikirkan dan diantisipasi, dicegah dengan tes yang sesuai.
(Misalnya dalam statistik biasa diasumsikan normalitas data,
dan kalau hal idicurigai distribusi data tidak normal, lakukan
dulu uji normalitas data)
Lulusan prodi profesi disyaratkan memiliki kompetensi

bekerja. Profesi adalah kualifikasi kerja yang memiliki standar
pofesi (biasanya dalam bentuk standar perilaku) standar
etika, dan standar disiplin. Untuk masuk prodi profesi dokter
harus sudah lulus prodi akademik S1 kedokteran, artinya
peserta prodi profesi harus sudah memiliki kompetensi
keilmuan. Kualifikasi lulusan prodi profesi bukan lagi analis,
tetapi sudah sebagai ahli.
Kegiatan pembelajaran prodi profesi dokter dilaksanakan

dalam bentuk kepaniteraan, sering disebut koskap.
Kepaniteraan adalah pembelajaran melakukan pelayanan di
institusi layanan profesi (dokter) dalam supervisi profesi
dokter sebagai dosennya. Kalau pembelajaran prodi
akademik berorintasi kepada mahasiswa sebagai pusatnya
(student centered orienred), maka pada program profesi
berorientasikan kepada pasien sebagai pusatnya (patient
centered oriented). Patient dan student keduanya adalah
sama-sama kelompok penerima benefit (beneficiary group)
Pada hakikatnya kedua prodi tetap satu kesatuan, prodi

profesi dokter adalah kelanjutan dari prodi akademik. Dari
314
pernyataan praktik kedokteran adalah praktik ilmu dan seni
kedokteran, maka prodi profesi adalah pembelajaran untuk
melakukan praktik kedokteran, ilmunya dipersiapkan pada
prodi akademik. Dalam prodi akademi dilaksanakan problem
based learning, pada prodi profesi: case based discusion,
case adalah problem yang ditemukan dalam praktik. Pada
prodi akademik dilaksanakan tutorial, dalam prodi profesi
dilakukan preseptorial, yang berarti bimbingan cara-cara
menangani kasus di lapangan.
Kalau dalam prodi akademik keluasan materi pembelaran

pembelajaran diperhitungkan meliputi displin ilmu kedokteran
yang dikelompokkan kedalam kedokteran dasar (biomedik),
kedokteran humanitas, kedokteran pendidikan, kedokteran
klinik, dan kedokteran komunitas, maka pembelajaran pada
prodi profesi hanya dikelompkkan menjadi kedokteran klinik
(perseorangan) dan kedokteran komunitas, Baik dalam
praktik kedokteran klinik maupun komunitas, yang diterapkan
adalah seluruh seluruh disiplin ilmu kedokteran.
Statistik kedokteran, atau secara lebih luas biostatistik

biasanya dimasukkanan dalam subdisiplin ilmu kedokteran
komunitas berdasar segi praktisnya. Sedang perkuliahan
yang formal sering diberikan pada perkuliahan metode
penelitihan yang masuk subdisiplin kedokteran pendidikan.
Namun beberapa topik statistik juga dibahas dalm
epidemiologi, yang juga termasuk rumpun subdisiplin
kedokteran komunitas. Bagaimanapun, sebagai ilmu,
penalaran statistik dipakai oleh seluruh ilmu kedokteran.
Praktik kedokteran komunitas memerlukan praktik

kedokteran klinik, sebaliknya praktik klinik yang tanpa
pendekatan komunitas akan masuk siklus berulang sembuh
315
sakit yang tanpa ujung. Penanganan pasien anak, pasien
dengan disabelitas, pasien penyakt menular vektorial adalah
contoh-contoh yang memerlukan pendekatan komunitas.
Sudah barang tentu penalaran statistika lebih nyata dalam
kasus-kasus komunitas, tetapi dalam penerapan kedokteran
berbasis eviden, baik kedokteran klinik maupun kedokteran
kmunitas memerlukan penalaran statistik.
E. Penalaran Statistik dalam Pekerjaan Dokter

Dalam bekerja ataupun melakukan praktik, dokter
sebagai ahli dan ilmuwan mendasarkan pada nilai ilmiah,
manfaat, keadilan, kemanusiaan, keseimbangan, serta
perlindungan dan keselamatan pasien (Konsil Kedokteran
2006: 6). Ilmuwan wajib terus membangun siikap kritis dan
skeptis ilmiah, meningkatkan literasi statistik yang menyatu
dengan literasi ilmu. Tergantung apakah dokter sedang
melaksanakan pekerjaan institusi ataukah praktik dokter,
kompetensi statistik perlu dikombinasikan dengan dan
bersama berbagai pendekatan.
Pendekatan sistem merupakan pendekatan yang sangat

berharga untuk berbagai penangan masalah, termasuk
masalah statistik. Yang dimaksud pendekatan di sini adalah
apa yang digunakan dalam memahami atau merespon ketika
berhadapan dengan suatu masalah. Misalnya untuk
menangani masalah ekonomi digunakan pendekatan
statistik, maka yang dipakai untuk memahami, mengkaji, atau
menyikaptindaki masalah ekonomi tersebut adalah konsep,
teori, atau metode statistik. Atau dalam mengatasi
kemacetan lalu lintas digunakan pendekatan praktis, maka
pengalaman praktik, apa yang dipahami atau apa yang biasa
dilakukan dalam praktik kehidupan, itulah yang digunakan
316
dalam menangani kemacetan. Ada pendekatan ilmu, filsafat,
seni, adat dan lain-lain.
Pendekatan sistem, berarti menggunakan pemahaman

sistem untuk menangani masalah. Teori sistem memandang
kinerja dari suatu entitas merupakan hasil interaksi dan
interdependensi dari komponen- komponennya. Bagaimana
bekerjanya itu dikaji melaui telaah aspek in put, proses, dan
out put. Semua yang berkinerja disebut sistem, jadi ada
sistem belajar, sistem kehidupan, sistem pemerintahan, dan
lain-lain. Pemahaman sistem menuntun dan memudahkan
dalam menalar masalah, baik masalah pekerjaan, masalah
kesehatan, pendidikan dan lain-lain.
Semua penanganan masalah, memerlukan data

beserta cara penanganan data. Jadi, semua masalah
memerlukan pendekatan statistik yang tepat. Tetapi,
kalau literasi statistik masyarakat rendah, masyarakat
mudah dibingungkan oleh statistik. Ada juga pihak-pihak
yang berIktikat tidak baik, yang membuat sajian statistik
secara manipulatif untuk mempengaruhi psikologi
khalayak agar menjadi seperti yang diinginkan. Statistik
sering dimanipulasi untuk kepentingan politik praktis. Ini
merupakan tantangan bagi ilmuwan statistik dalam
membangun literasi statistik.
Bagi dokter yang bekerja di instusi kesehatan, selain

pendekatan sistem, pendekatan epidemiologik sangat perlu
dipahami dengan baik. Epidemiologi adalah ilmu yang
mepelajari masalah-masalah kesehatan masyarakat dengan
memokuskan kepada determinan
317
dan distribusinya, serta upaya penangannya. Epidemiologi itu
sangat erat dengan statistik, sehingga ada kesamaan dalam
pembagianya: ada epidemiologi deskrptif dan analitik dan
pada statistik juga ada statistka deskriptif dan statistik
analitik. Penalaran epidemiologik sangat bersinergi dengan
penalaran statistik.
Program- program kesehatan memerlukan informasi

masalah kesehatan yang andal. Pengertian informasi di sini
bukan hanya pemberitahuan, tetapi data yang telah diolah
menjadi masukan dalam pembuatan keputusan. Penalaran
statistik yang tepat, bersinergi dengan kajian epidemiologi
yag kuat akan memberi informasi yang tertata sistematis
sehingga jelas masalah apa, serta data yang akurat terukur
tentang (apa, siapa, mengapa, bagaimana, kapan, di mana)-
nya.
Pemahaman-pemahaman tentang pencegahan, termasuk

pemahaman yang tepat tentang penyebab, faktor risiko,
serta risiko atau konsekuensi dari keputusan, misalnya soal
penggnan maker dan risiko tertular penyakit yang
ditularkan melalui droplet, memerlukan penalaran statistik.
Semua pembuatan perencanaan, pemantauan, pelaporan,
serta evaluasi program, memerlukan penalaran statistik.
Dokter yang bertugas pada institusi pendidikan dan juga

penelitian, menghadapi dan mengerjakan secara
318
nyata kegiatan ilmu, perlu membangun literasi ilmu melalui
penalran statistik.
Dokter yang praktik dokter mandiri mempunyai tugas

memberi edukasi kepada pasiennya, dan melindungi
masyarakat baik dari penyakit menular maupun tidak
menular. Dokter perlu paham apakah pasien, atau keluarga,
atau masyrakat di mana ia hidup, termasuk dalam status
yang mana: terpapar, populaton at risk, atau relatif aman.
Dokter harus paham normalitas dan abnormalitas. Semua
itu memerlukan penalaran statistik.
Dalam pemikiran mempraktikkan tindakan atau
penggunaan obat berdasar informasi jurnal ilmiah, perlu

paham tindakan medis berbasis eviden, tahu level evidensi
suatu hasil penelitian serta penelitian yang memerlukan uji
statistik.
Penalaran statistik bagi dokter, bagi ilmuwan, adalah

keniscayaan. Penalaran yang baik juga membebaskan dari
berbagai miskonsepsi. Jadi semua dokter perlu belajar
dengan senang hati. Ini adalah tantangan, dan mari kita
terima dengan saling membantu dengan senang hati pula.
319
Referensi
Amirin, T.M. (1984) Pokok-Pokok Teori Sistem, Jakarta:

PT Raja
Grafindo Persada
Anderson, R, Carter, I (1978) Human Behavior in the

Social
Environment (2nd Ed). New York: Alding Publishing
Co
Backet et al (1980) The Risk Approach in Health Care, Geneva:

WHO
Beaglehole, R., et al (1993) Basic Epidemiology, Genva: WHO

Colton, T (1974) Statistics in Medicine. Boston: Little, Brown &
Co
Halliday, M.A.K., Hasan, R., (1994) Bahasa, Kontek, dan Teks,

Aspek-aspek bahasa dalam pandangan semiotik
sosial,
diterjemahkan dari Language, Context, & Text,
Yogyakarta: Gadjah Mada University Press
Kementrian Pendidikan dan Kebudayaan RI, Keputusan no

3/2020 ttg Standar Nasional Pendidikan Tinggi
Komaruddin, Komaruddin, Y.T.S., (2000) Kamus Penulisan

Ilmiah, Bandung: Penerbit Bumi Aksara
Konsil Kedokteran Indonedia, Peraturan no11/2012 ttg

Standar
Kompetensi Dokter Indonesia
Konsil Kedokteran Indonesia, Keputusan

no18/KKI/KEP/IX/2006 ttg
320
Buku Penyelenggaraan Praktik Dokter yang Baik di
Indonesia
Lwanga, S.K., Cho Yook Tye, (1986) Teaching Health Statistics,

Geneva: WHO
Nugroho, A. (2004) Konsep Pengembangan Sistem Basis Data,

Bandung: Informatika
Piskurich, G.M., (1995) Self Directed Learning, A practical guide

to design, development, and implementation, San
Fransisco: Jorsey Bars Publisher
Poespoprodjo, W., (1987) Logika, Ilmu Menalar, Bandung:

Penerbit
Remaja Karya CV
Phillips Jr., J., Statistical Thinking (2 nd Ed) San

Fransisco: W.H.
Fresmen & CO
Southwell, G., (2013) 50 Phylosophy of Schience Ideas, London:

Quercus Edition Ltd
Amirin, T.M. (1984) Pokok-Pokok Teori Sistem, Jakarta:
PT Raja
Grafindo Persada
Wolff, L. et al (1983) Fundamental Nursing (7th Ed),

Philadelphia: JB Lippincott & Co
321
322
BAB XV
VISUALISASI DATA DALAM KESEHATAN
MASYARAKAT
dr. Lutfan Lazuardi, PhD*

*Departemen Kebijakan dan Manajemen Kesehatan, Fakultas
Kedokteran, Kesehatan Masyarakat dan Keperawatan, Universitas
Gadjah Mada
*e-mail: lutfan.lazuardi@ugm.ac.id
Tujuan Pembelajaran
4. Pembaca mengenal berbagai perangkat untuk visualisasi data
kesehatan masyarakat.
5. Pembaca mampu melakukan visualisasi data kesehatan
masyarakat.
6. Pembaca mampu menjawab pertanyaan latihan.
Ringkasan
Visualisasi data kesehatan bertujuan untuk
mempresentasikan informasi menggunakan format yang
lebih mudah dipahami oleh pembaca. Visualisasi data
kesehatan mempermudah untuk memahami data yang
kompleks apabila dipresentasikan dalam wujud informasi
yang menarik dan intuitif melalui berbagai macam grafik,
peta dan infografis. Penyajian dalam bentuk visualisasi yang
menarik akan memudahkan dalam memahami data untuk
membantu dalam proses pengambilan keputusan, termasuk
juga dalam kegiatan advokasi atau pemaparan kepada
323
masyarakat awam yang umumnya tidak mudah apabila data
disajikan dengan menggunakan format tabulasi seperti
kebanyakan penyajian data kesehatann selama ini. Salah
satu tokoh pelopor dalam memperkenalkan visualisasi data
kesehatan adalah Profesor Hans Rosling, seorang dokter
ahli epidemiologi dan statistik dari Karolinska Institute di
Swedia yang memperkenalkan Gapminder dan Trendalyzer.
Profesor Hans Rosling merubah cara menampilkan data
kesehatan yang biasanya dengan format tabulasi yang
‘kering’, menjadi format yang menarik dan interaktif.
Materi Belajar
B. Bercerita dengan data kesehatan

Salah satu cara terbaik untuk mengeksplorasi dan
memahami data yang jumlahnya sangat banyak adalah
dengan pendekatan visualisasi. Merubah angka menjadi
sebuah visualisasi akan membantu memudahkan otak
kita untuk mengetahui pola dari data kita. Terkadang akan
lebih mudah mendapatkan cerita dari data kita yang
divisualisasikan daripada dengan metode statistik yang
umum kita gunakan yang barangkali tidak mudah untuk
langsung dipahami. John Tukey, seorang ahli statistik dan
analisis data juga meyakini bahwa visualisasi data
memiliki tempat. Beliau percaya bahwa terkadang bisa
muncul informasi yang tidak terduga dari data yang
divisualisasikan. Seperti contoh gambar dibawah ini yang
324
tidak kelihatan pola uniknya apabila data disajikan dalam
format tabulasi. Dengan memvisualisasikannya dalam
peta, akan kelihatan bahwa distribusi dokter ternyata
mengelompok di pusat kota.
Gambar XII.1 Peta distribusi dokter di DIY hasil analisis

dan visualisasi dari data Survei Potensi Desa (2005)
Aplikasi pendukung visualisasi data kesehatan

Berbagai aplikasi perangkat lunak tersedia untuk
mendukung kegiatan visualisasi data Anda. Contohnya
adalah Microsoft Excel, Google Spreadsheet, PowerBI,
QlikView dan tentu saja berbagai perangkat lunak statistik
seperti SAS dan R. Anda juga bisa menggunakan Bahasa
pemrograman Phyton, atau HTML, Javascript dan CSS.
Visualisasi data bisa juga dilakukan dengan software
pemetaan misalnya QuantumGIS atau OpenJump. Dalam
bab ini, akan banyak ditampilkan hasil visualisasi dengan
menggunakan perangkat lunak Tableau
(www.tableau.com). Tableau tersedia dalam versi
325
berbayar (Tableau Dekstop) ataupun versi gratis (Tableau
Public).
C.Memilih visualisasi data kesehatan

Secara umum ada berbagai strategi untuk visualisasi data yang
akan ditentukan oleh jenis data dan tujuannya. Jenis data bisa
berwujud data kategori, angka, atau kombinasi keduanya.
Tujuan dari visualisasi data sangat beragam antara lain sebagai
berikut:
- Membandingkan nilai antar kelompok
- Memperlihatkan perubahan antar waktu
- Memperlihatkan hubungan antar variabel
- Memperlihatkan distribusi data
- Membandingkan sebagian dari keseluruhan data
- Menunjukkan variasi geografis
Secara umum berbagai tujuan tadi, berbagai format visualisasi

data yang umum dapat dirangkum sebagai berikut:
1. Memperlihatkan perubahan antar waktu

Satu tujuan umum untuk visualisasi adalah melihat
perubahan data antar waktu. Visualisasi ini biasanya
memiliki variabel waktu sebagai aksis horizontal, yang
berubah dari kiri ke kanan, dibandingkan dengan variabel
yang diamati pada aksis vertikal. Beberapa model
visualisasi untuk memperlihatkan perubahan antar waktu
326
Line chart
Model yang umum dipergunakan untuk
memperlihatkan perubahan antar waktu.
Setiap titik dihubungkan untuk
menekankan pergerakan atau
perubahan antar waktu
Bar chart
Setiap periode waktu tertentu
digambarkan dalam sebuah batang
(bar). Besaran nilainya
direpresentasikan dengan tingginya
batang.
Box plot
Setiap periode waktu digambarkan
dalam sebuah box.
Visualisasi ini bisa dipergunakan untuk
memperlihatkan distribusi data dan juga
membandingkan data antar periode
waktu, atau juga bisa untuk
membandingkan distribusi data antar
kelompok
2. Membandingkan sebagian dari keseluruhan data
Pie chart
Setiap potongan atau bagian adalah
mencerminkan proporsi dari setiap
kategori atau kelompok dibandingkan
dengan keseluruhan lingkaran. Terlihat
jelas apabila kategorinya kurang atau
tidak lebih dari 5 buah.
Doughnut chart
Variasi dari pie chart dengan lubang di
tengah yang umumnya dipergunakan
untuk menunjukkan sebuah nilai numerik
yang ingin ditonjolkan
327
Stacked bar chart
Setiap batang dibagi dalam beberapa
bagian untuk menunjukkan
perbandingan kategorinya.
Stacked area chart

Grafik garis (line chart) yang
memperlihatkan area yang
mencerminkan sub-grup atau kelompok
yang berbeda
3. Memperlihatkan distribusi data
Bar chart
Samping untuk memperlihatkan
perubahan antar waktu, grafik batang
juga bisa digunakan untuk
membandingkan jumlah atau frekuensi
dari data antar kelompok atau kategori
yang berbeda
Histogram
Mirip dengan grafik batang, akan tetapi
histogram digunakan apabila datanya
numerik
Box plot
Setiap periode waktu digambarkan
dalam sebuah box.
Visualisasi ini bisa dipergunakan untuk
memperlihatkan distribusi data dan juga
membandingkan data antar periode
waktu, atau juga bisa untuk
membandingkan distribusi data antar
kelompok
328
4. Memperlihatkan hubungan antar variabel
Scatter plot
Untuk menggambarkan hubungan antar
dua variabel numerik. Posisi dari titik
mengindikasikan nilai dari sumbu vertikal
dan horizontal.
Bubble chart
Perluasan dari scatter plot, dimana ada
3 variabel numerik, dan ukuran
gelembung menunjukkan nilai dari
variabel ketiga
5. Memperlihatkan variasi geografis

Choropleth
Peta tematik dengan visualisasi warna
yang berbeda untuk menggambarkan
variasi datanya
Bubble map
Peta gelembung, dimana besaran
gelembung mencerminkan besaran
angka
Visualisasi diatas adalah visualisasi dasar yang umum

dipergunakan. Dari tipe visualisasi tersebut, bisa dikembangkan
berbagai variasinya dengan tujuan untuk lebih mempermudah
ditangkap pesannya. Kombinasi dari berbagai visualisasi tersebut,
memungkinkan untuk ditampilkan dalam format dasbor
(dashboard) yang merupakan pilihan dari berbagai informasi untuk
memudahkan dalam memahami pesan penting dari informasi yang
329
ada. Dasbor tersebut umumnya dipergunakan untuk membantu
memudahkan dalam pengambilan keputusan yang berdasarkan
data.
D.Latihan visualisasi data kesehatan

Banyak data kesehatan sudah dikumpulkan oleh institusi dan
organisasi kesehatan baik yang bersifat data rutin yang
dikumpulkan berbasis institusi seperti data pasien dan program
kesehatan, maupun juga data berbasis populasi seperti data
hasil survei misalnya Riset Kesehatan Dasar (Riskesdas) dan
Survei Potensi Desa (Podes). Banyak dari data tersebut sudah
dalam format elektronik yang akan memudahkan proses
analisis lebih lanjut. Berbagai format data yang ada bisa
disiapkan dalam bentuk file Microsoft Excel (XLS atau XLSX),
format tab-delimited text dalam format TXT atau comma-
separated value (CSV). Data bisa juga dipersiapkan dalam
format yang sesuai dengan perangkat lunak statistik, misalnya
SAV atau DTA.
Untuk kebutuhan latihan data visualisasi ini, dipergunakan data

sekunder terkait Covid-19 yang dapat diunduh dari situs berikut:
1. https://www.ecdc.europa.eu/en/publications-
data/download-todays-data-geographic-distribution-
covid-19-cases-worldwide
2. https://opendata.ecdc.europa.eu/covid19/testing/xlsx
3. https://bnpb-inacovid19.hub.arcgis.com/datasets/data-
harian-kasus-per-provinsi-covid-19-indonesia
Data pertama dari European CDC merupakan data pelaporan
kasus Covid-19 per tanggal pelaporan yang terdiri dari data kasus
330
terkonfirmasi dan data kasus meninggal dari negara-negara yang
melaporkan.
Data kedua adalah data jumlah tes RT-PCR per minggu dan
jumlah kasus baru yang dikonfirmasi positif dari tes tersebut yang
dilakukan di negara-negara Eropa.
Data ketiga adalah data dari BNPB terkait akumulasi kasus positif,
sembuh dan meninggal per provinsi, yang dilaporkan sampai
tanggal data tersebut diunduh.
Beberapa contoh visualisasi berikut ini adalah bersumber dari data
tersebut. Visualisasi dilakukan dengan perangkat lunak Tableau
(www.tableau.com). Visualisasi data ini bersifat dinamis sehingga
apabila di klik, akan bisa menunjukkan informasi pendukung yang
dibutuhkan.
1. Visualisasi pola berdasar waktu

Hal yang umum yang dicari dari data yang disusun berdasarkan
waktu (temporal) adalah untuk melihat kecenderungan (trend).
Apakah ada kecenderungan meningkat atau menurun? Apakah
ada pola musiman (seasonal)?. Data temporal dapat
dikategorikan sebagai data diskret (discrete) atau kontinyu
(continuous). Untuk menentukan visualisasi apa yang tepat
perlu mengetahui kategori data tersebut. Data diskrit adalah
data yang diperoleh dengan cara menghitung atau membilang
dan berwujud angka (bilangan) yang utuh dan tidak ada
pecahan, misalnya jumlah penduduk. Sementara data kontinyu
diperoleh dengan cara mengukur yang dapat berbentuk
bilangan bulat atau pecahan, misalnya berat badan dan tinggi
badan.
331
Grafik Batang (Bar chart)
Gambar XII.2 Grafik batang kecenderungan pertambahan

jumlah kasus positif Covid-19
Grafik Garis (Line chart)
332
Gambar XII.3 Grafik garis kecenderungan pertambahan jumlah
kasus positif Covid-19.
2. Visualisasi data proporsi

Pada proporsi umumnya kita akan melihat 3 hal,
maksimum, minimum dan distribusinya. Untuk maksimum
dan minimum umumnya tidak ditunjukkan dengan grafik,
tetapi untuk proporsi, hal yang paling menarik adalah
melihat distribusi proporsinya. Pada visualisasi proporsi ini,
kita akan mengatur semua data menjadi 100 persen, dan
membandingkan secara relatif bagian yang ingin ditonjolkan
dibandingkan dengan bagian lain.
Grafik Pai (Pie chart)
Gambar XII.4 Donut pai, modifikasi dari pie chart untuk

memperlihatkan jumlah kasus Covid-19 positif dibandingkan
dengan seluruh pemeriksaan PCR yang dilakukan
333
3. Visualisasi hubungan
Gambar XII.5 Scatter plot untuk memperlihatkan hubungan

variabel pemeriksaan PCR dan kasus yang dikonfirmasi
positif Covid-19.
4. Visualisasi geospatial
Untuk memudahkan melihat variasi geografis, kita mencoba
memetakan kasus meninggal per provinsi di Indonesia dari
data BNPB dengan format bubble map sebagai berikut:
334
Gambar XII.6 Bubble map untuk memperlihatkan jumlah
kasus meninggal dari masing-masing provinsi.
Pertanyaan latihan
30. Apa tujuan dari melakukan visualisasi data kesehatan?
31. Apa saja bentuk-bentuk visualisasi data kesehatan?
Referensi
Tableau Software (2020) ‘Tableau Dekstop’. Tableau

Software, LLC. Available at: https://www.tableau.com.
Yau, N. (2011) Visualize This: The Flowing Data Guide to
Design, Visualization, and Statistics. 1st edn. Indianapolis:
Wiley Publishing Inc.
Yi, M. (2019) How to Choose the Right Data Visualization.
Chartio. Available at: https://chartio.com/learn/charts/how-to-
choose-data-visualization/.
335
336
BAB XVI
CONTOH DAN PEMBAHASAN SOAL
UKMPPD

Tujuan Pembelajaran
7. Mahasiswa memahami pengertian dasar biostatistika.
8. Mahasiswa memahami penggolongan statistika.
9. Mahasiswa memahami perbedaan antara data dan informasi.
10. Mahasiswa memahami pengorganisasian data.
Ringkasan
Biostatistika merupakan ilmu terapan dari statistika yang
membahas tentang makhluk hidup. Statistika merupakan
Dalam perkembangannya, biostatistika dipandang sebagai
ilmu statistik terapan pada bidang biologi, farmasi, dan
kesehatan (kedokteran dan kesehatan masyarakat). Statistik
digolongkan menjadi dua yaitu statistik deskriptif dan statistik
inferensial, sedangkan statistik inferensial digolongkan lagi
menjadi statistik parametris dan non parametris. Statistik
pada dasarnya untuk mengelola data menjadi informasi.
Dalam pengorganisasiannya, statistik dilakukan melalui
tahap pengumpulan data (data collecting),pengolahan data
337
(data processing), penyajian data (data presentation), dan
analisis dan interpretasi (analysis & interpretation).
Pesan dalam Belajar

Contoh soal yang disajikan di Bab ini hanya Sebagian
kecil dari contoh soal UKMPPD yang berhubungan dengan
mata kuliah statistik, maka untuk mempelajari statistik secara
lengkap mahasiswa tetap harus mempelajari berbagai buku
referensi tentang statistik kedokteran dan kesehatan.
Materi Belajar
A. Uji Kompetensi Mahasiswa Program Profesi

Dokter (UKMPPD)
UKMPPD merupakan satu-satunya ujian yang
diselenggarakan oleh negara bagi calon dokter Indonesia
untuk mendapatkan gelar dokternya. Ujian ini dulu lebih
dikenal dengan nama Uji Kompetensi Dokter Indonesia
(UKDI). Syarat utama untuk dapat mengikuti UKMPPD
adalah setiap mahasiswa kedokteran harus menyelesaikan
pendidikan preklinik, klinik, dan dinyatakan lulus oleh fakultas
kedokteran masing-masing. UKMPPD bertujuan untuk
menjaga mutu lulusan pendidikan dokter, dan merupakan
bentuk perlindungan terhadap masyarakat serta pengguna
jasa layanan kedokteran.
UKMPPD diselenggarakan oleh Kementerian Riset,
338
Teknologi, dan Pendidikan Tinggi (Kemristekdikti) dengan
menggaet beberapa instansi dan organisasi profesi.
Diantaranya Kementerian Kesehatan, Konsil Kedokteran
Indonesia, Pengurus Besar Ikatan Dokter Indonesia, dan
Asosiasi Institusi Pendidikan Kedokteran Indonesia. Uji
kompetensi ini terdiri dua jenis tes, yaitu Computer Based
Test (CBT) dan Objective Structured Clinical Examination
(OSCE). Singkatnya, CBT merupakan ujian tertulis dan
OSCE adalah ujian praktik. Pengumuman UKMPPD adalah
pada bulan setelah ujian.
CBT UKMPPD adalah ujian teori berbasis pilihan ganda
yang dilaksanakan menggunakan komputer secara serentak
bagi seluruh peserta. CBT UKMPPD diuji dengan
mengerjakan 150 soal pilihan ganda yang diberi waktu
pengerjaan 200 menit. Ujian lain yang juga wajib dijalani oleh
peserta UKMPPD adalah OSCE (Objective Structured
Clinical Examination). Penilaian OSCE UKMPPD dilakukan
berbasis roleplay antara Anda sebagai dokter umum dan
pasien. Biasanya setiap peserta OSCE UKMPPD akan diuji
melewati 12 station dengan 12 topik berbeda, waktu yang
diberikan adalah 15 menit di setiap station. Para peserta
ujian diwajibkan untuk mempraktekkan skill sesuai standar
kompetensi dokter umum Indonesia.
339
B.Contoh Soal UKMPPD dan Pembahasan yang
berhubungan dengan Statistik
1. Manakah di bawah ini merupakan besarnya faktor risiko
dengan desain kasus-kontrol?
A. Ratio Prevalence
B. Relative Risk
C. Odds Ratio
D. Cumulative incidence
E. Case fatality rate
Jawaban: C. Odds Ratio
Pembahasan:
 Ratio Prevalence: besarnya faktor risiko dengan desain
cross-sectional.
 Relative Risk: besarnya faktor risiko dengan desain kohort.
 Odds Ratio: besarnya faktor risiko dengan desain kasus-
kontrol.
 Cumulative incidence: probabilitas/ risiko (risk) seseorang
untuk terkena penyakit (atau untuk hidup) dalam periode
waktu tertentu.
 Case fatality rate: suatu angka yang dinyatakan ke dalam
persentase yang berisikan data orang mengalami kematian
akibat suatu penyakit tertentu.
2. Sebuah program pendidikan klinik merencanakan untuk

mengevaluasi reliabilitas metode penilaian diri mengenai
kemampuan keterampilan klinik sebagai sebuah alat untuk
mengukur hasil belajar mahasiswa. Setelah kegiatan
belajar selesai, mahasiswa diminta untuk memberikan
340
ranking (skala 1-5) pada kemampuan dirinya untuk 10
prosedur pemeriksaan. Instruktur juga diminta untuk
membuat ranking mengenai kemampuan mahasiswa
berdasarkan skala yang sama. Hasil dari kedua penilaian
tersebut kemudian dibandingkan. Manakah di bawah ini
merupakan uji statistik yang paling tepat untuk
membandingkan hasil tersebut?
A. A Kappa statistics test
B. A student t test
C. A Wilcoxon rank sum test
D. A chi-square test
E. A correlation analysis
Jawaban: C. A Wilcoxon rank sum test
Pembahasan:
Kata kunci dalam soal tersebut adalah datanya berupa ranking
(skala 1-5) dan dibandingkan.
 A Kappa statistics test: mengukur keeratan dari 2 variabel
pada tabel kontingensi yang diukur pada kategori yang sama
atau untuk mengetahui tingkat kesepakatan dari 2 juri dalam
menilai.
 A student t test: uji komparatif untuk menilai perbedaan
antara nilai tertentu dengan rata-rata kelompok untuk data
numerik (interval/rasio).
 A Wilcoxon rank sum test: uji perbandingan (komparatif)
untuk mengetahui perbedaan jumlah ranking (peringkat)
antara 2 kelompok. Atau uji perbandingan (komparatif) 2
kelompok data numerik (interval/ rasio) tetapi tidak
341
 A chi-square test: uji komparatif untuk menilai perbedaan
antara dua kelompok data berskala nominal.
 A correlation analysis: uji hubungan (korelatif) antara dua
kelompok data.
3. Seorang dokter akan melakukan penelitian observasional

analitik dengan pendekatan kasus kontrol berjudul
“Hubungan antara Kadar HbA1C dengan Retinopati
Diabetika pada penderita DM tipe II. Populasi target
adalah penderita diabetes mellitus (DM), sedangkan
populasi terjangkau adalah penderita DM tipe II. Variabel
kadar HbA1c dibagi menjadi 3 kelompok, yaitu kurang dari
normal, normal dan lebih dari normal. Manakah di bawah
ini merupakan jenis skala yang paling sesuai dengan
variabel tersebut?
A. Skala rasio
B. Skala ordinal
C. Skala nominal
D. Skala interval
E. Skala Gutmann
Jawaban: B. Skala ordinal
Pembahasan:
Kata kunci dari soal tersebut adalah data dikelompokkan
menjadi kurang dari normal, normal dan lebih dari normal,
ini merupakan data tingkatan (urutan peringkat).
342
 Skala rasio: skala data yang menunjukkan derajat
perbedaan diantara item, ada jarak, bisa diperbandingkan,
dan memiliki nilai nol mutlak.
 Skala ordinal: skala data kualitatif di mana data
dikelompokkan menjadi orde atau tingkatan-tingkatan.
 Skala nominal: skala data kualitatif yang berfungsi hanya
untuk membedakan dan tidak ada tingkatan diantaranya.
 Skala interval: skala data yang menunjukkan derajat
perbedaan diantara item, ada jarak, tetapi tidak memiliki nilai
nol mutlak.
 Skala Gutmann: skala menggunakan binary skor (0 dan 1).
4. Data tabel:
Penyakit
(+) (-)
Paparan (+) a b a+b
Paparan (-) c d c+d
a+c b+d a+b c+d
Pada Tabel 2 x 2 di atas, manakah perhitungan analisis

kuatnya hubungan antara paparan dengan penyakit bila
menggunakan studi kasus kontrol yang paling tepat?
343
Jawaban: B
Pembahasan:
 Prevalence Ratio untuk Cross sectional, atau
Relative Risk untuk Cohort.
 Odds Ratio, Case control
 Kelompok terpapar 
  Kelompok tidak terpapar 
5. Seorang dokter umum melakukan penelitian di tempat

kerjanya menggunakan kuesioner. Pendapat responden
tersebut terbagi atas “sangat setuju”, “setuju”, “netral”,
“tidak setuju”, ”sangat tidak setuju”. Manakah di bawah ini
merupakan skala yang paling sesuai dengan kasus
tersebut?
A. Ordinal
B. Albert
C. Interval
D. Alpha
E. Likert
Jawaban: E. Likert
Pembahasan:
344
Kata kunci dalam soal tersebut adalah kuesioner dan respon
sikap.
 Ordinal: skala pengukuran berupa peringkat.
 Albert: bukan respon kuesioner.
 Interval: skala pengukuran data yang membedakan antar
item, ada jarak, tetapi tidak memiliki nilai nol mutlak.
 Alpha: bukan respon kuesioner.
 Likert: skala penelitian yang digunakan untuk mengukur
sikap dan pendapat, terdiri dari 5 pilihan.
6. Sebuah uji klinik membandingkan efek obat penurun

lemak baru bernama “lipicide” dengan obat standar
simvastatin. Sebanyak 84 partisipan dengan dislipidemia
berpartisipasi dalam studi ini dan dikelompokkan secara
acak pada dua kelompok perlakukan. Setelah 12 minggu
perlakuan, kolesterol total (mg/dl) diukur pada dua
kelompok tersebut. Setelah pengolahan data dilakukan, uji
normalitas data dengan uji kolmogorov-smirnov
menunjukkan nilai p = 0,45 (= tak beda bermakna dg data
normal = berdistribusi normal). Apakah metode analisis
data yang paling tepat untuk penelitian tersebut?
A. Uji Kruskal-Wallis
B. Uji T Independen
C. Uji T berpasangan
D. Uji Mann-Whitney
E. Uji Wilcoxon
Jawaban: B. Uji T Independen
Pembahasan:
345
Kata kuncinya membandingkan (beda) dua kelompok data
(tidak berpasangan), data numerik (satuan mg/dl), data
 Uji Kruskal-Wallis: Uji beda lelih dari dua kelompok.
 Uji T Independen: Uji beda dua kelompok, data tidak
berpasangan, data berdistribusi normal.
 Uji T berpasangan: Uji beda dua kelompok, data
berpasangan, data berdistribusi normal.
 Uji Mann-Whitney: Uji beda dua kelompok, data tidak
berpasangan, data tidak berdistribusi normal.
 Uji Wilcoxon: Uji beda dua kelompok, data berpasangan,
data tidak berdistribusi normal.
7. Seorang dokter puskesmas menjumpai TBC pada balita.

Dia melakukan penelitian untuk mengetahui asosiasi
antara kelengkapan imunisasi dengan kejadian TBC. Dia
akan melakukan penelitian yang cepat dan biaya yang
efisien. Apakah rancangan penelitiannya?
A. Case control
B. Case report
C. Case series
D. Cohort
E. Cross sectional
Jawab: A. Case control
Pembahasan:
Kata kunci: Asosiasi, cepat, biaya efisien. Asosiasi
pilihannya Case control, Cohort, dan Cross sectional. Jika
346
sudah tersedia data sekunder (rekam medis), maka dapat
dianalisis dengan cepat dan murah, pilihannya adalah
Case control.
8. Seorang peneliti melakukan penelitian untuk melihat

hubungan antara BMI ibu dengan berat badan bayi. BMI
ibu dibagi menjadi kelompok normal dan abnormal, berat
badan bayi dibagi menjadi kelompok normal dan BBLR.
Uji statistik yang digunakan dalam penelitian ini adalah?
A. T-test tidak berpasangan
B. T-test berpasangan
C. Chi kuadrat
D. ANOVA
E. Wilcoxon
Jawab: C. Chi kuadrat
Pembahasan:
Kata kunci: Data yang akan diuji merupakan data kategori:
variabel BMI (normal dan abnormal), dan variabel berat
badan bayi (normal dan BBLR).
 T-test tidak berpasangan: variabel bebas kategori, variabel
terikat numerik, dua kelompok tidak berpasangan.
 T-test berpasangan: variabel bebas kategori, variabel terikat
numerik, dua kelompok berpasangan.
 Chi kuadrat: variabel bebas kategori, variabel terikat
kategori.
 ANOVA: variabel bebas kategori, variabel terikat numerik,
lebih dari dua kelompok tidak berpasangan.
347
 Wilcoxon: variabel bebas kategori, variabel terikat numerik,
lebih dari dua kelompok berpasangan.
9. Suatu hipotesis penelitian dinyatakan: “ada hubungan

antara pengetahuan ibu tentang gizi dengan status gizi
balita.” Pada definisi operasional variabel, pengetahuan
ibu diukur dengan cara memberikan kuesioner yang berisi
100 pertanyaan pilihan ganda mengenai gizi balita dan
nilai tiap pertanyaan adalah 1. Jadi bila ibu dapat
menjawab semua pertanyaan dengan benar maka nilainya
adalah 100, dan bila salah semua nilainya 0. Apakah
skala ukuran variabel pengetahuan ibu di atas?
A. Nominal polikotomik
B. Nominal dikotomik
C. Interval
D. Ordinal
E. Rasio
Jawab: E. Rasio
Pembahasan:
Pengetahuan memiliki nilai antara 0 hingga 100, ini adalah
data rasio karena struktur datanya memiliki tingkatan,
jarak, bisa diperbandingkan, dan memiliki nilai nol mutlak.
 Nominal polikotomik: Tidak ada tingkatan, tidak ada jarak,
kategori lebih dari dua.
 Nominal dikotomik: Tidak ada tingkatan, tidak ada jarak,
kategori berjumlah dua.
 Interval: Ada tingkatan, ada jarak, tidak memiliki nol mutlak.
348
 Ordinal: Ada tingkatan, tidak ada jarak.
 Rasio: Ada tingkatan, ada jarak, memiliki nilai nol mutlak,
bisa diperbandingkan.
10. Dilakukan sebuah penelitian yang menghubungkan

antara hipertensi dengan faktor risiko obesitas.
Kasus hipertensi (+) Kasus hipertensi (-)

Obesitas 16 (a) 8 (b)
Non obesitas 384 (c) 392 (d)
Jumlah 400 400
Odds rationya adalah ….

A. 16 x 384 / 8 x 392
B. 8 x 392 / 16 x 384
C. 16 x 392 / 8 x 384
D. 8 x 384 / 16 x 392
E. 8 x 400 / 16 x 400
Jawaban: C
Pembahasan: Odds ratio dirumuskan (a x d) / (b x c)
Odds Ratio = 16 x 392 / 8 x 384
Referensi
Asif, R. J. (2017). Kumpulan Soal dan Pembahasan Materi

Statistika UKDI UNDIP.
https://kupdf.net/download/kumpulan-soal-dan-
pembahasan-materi-statistika-ukdi-
undip_58e9049adc0d60811eda981d_pdf
Dokcbt. (n.d.). Tentang UKMPPD.
https://www.dokcbt.com/tentang-ukmppd
349
Emitatallulembang. (2018). Latihan Soal IKM UKMPPD
2017.
https://www.scribd.com/document/370086390/LATIHAN
-SOAL-IKM-UKMPPD-2017-docx
350
BIOGRAFI PENULIS
Dr. Sumardiyono, S.KM, M.Kes, lahir di

Surakarta, 6 Juli 1965. Penulis
menyelesaikan pendidikan dari D3
Hiperkes dan KK FK UNS (1988), S1
FKM UNDIP (2004), S2 IKK
Pascasarjana UGM (2007), dan S3 Ilmu
Lingkungan Pascasarjana UNS (2019).
Saat ini aktif mengajar di Universitas
Sebelas Maret pada prodi S3 Ilmu
Kesehatan Masyarakat, S2 Ilmu
Kesehatan Masyarakat, S2 Ilmu Gizi, S2 Ilmu Lingkungan,
S1 Pendidikan Kedokteran, S1 Pendidikan Profesi Dokter,
D4 Keselamatan dan Kesehatan Kerja, dan D3 Manajemen
Perdagangan. Jabatan saat ini adalah Kepala Laboratorium
Ilmu Kesehatan Masyarakat dan Kedokteran Pencegahan
FK UNS, dan Ketua Senat Sekolah Vokasi UNS. Tahun 2020
juga menulis 3 buku dan sudah terbit berjudul “Statistik
Dasar Untuk Kesehatan dan Kedokteran, Analisis
Menggunakan SPSS Versi 23”, “Metode Penelitian
Kuantitatif: Strategi Menulis Proposal Penelitian Kesehatan”,
dan “Bunga Rampai, Lansia Sehat Lansia Bahagia”.
351
dr. Ratnawati, M.Kes lahir di
Kudus Jawa Tengah. Riwayat
pendidikan SD di Kudus,
Pendidikan SMP di SMPN 2 Pati
dan SMA Negeri I Pati. Pendidikan
Sarjana dan Profesi Dokter dari
Fakultas Kedokteran Universitas
Islam Sultan Agung (UNISSULA),
Pasca Sarjana di Fakultas Ilmu Kesehatan Masyarakat
(FKM) UNDIP pada Konsentrasi Kesehatan Ibu dan Anak.
Saat ini sedang menempuh pendidikan Program Studi
Doktoral di FKM UNDIP. Sejak tahun 2009 menjadi staf
pengajar bagian IKM Fakultas Kedokteran UNISSULA.
dr. Nining Lestari MPH, lahir di

Sragen Jawa Tengah pada 30 April
1984. Riwayat Pendidikan: SD di
SDN Krikilan I Sragen, SMP di SMPN
VI Surakarta, SMA Negeri I
Surakarta. Pendidikan Sarjana dan
Profesi Dokter dari Fakultas
Kedokteran Universitas Sebelas
Maret (UNS). Pasca Sarjana di
Fakultas Ilmu Kesehatan Masyarakat UNS. Sejak tahun 2011
aktif menjadi staf pengajar bagian IKM-KK Fakultas
Kedokteran Universitas Muhammadiyah Surakarta (UMS).
352
Dr. Siti Thomas Zulaikhah,
SKM.MKes, lahir di Klaten pada
tanggal 20 Mei 1964. Penulis
memperoleh gelar Doktor dari Program
Doktor Ilmu Kedokteran/Kesehatan
(DIKK) Fakultas Kedokteran
Universitas Diponegoro tahun 2016.
Penulis adalah dosen di Fakultas
Kedokteran Universitas Islam Sultan
Agung (UNISSULA) Semarang dan
saat ini menjabat sebagai Kepala Bagian Ilmu Kesehatan
Masyarakat (IKM). Selain itu, penulis juga mengajar sebagai
dosen tidak tetap pada program studi D3, D4 dan S2
Teknologi Laboratorium Medis (TLM) Fakultas Ilmu
Keperawatan dan Kesehatan Universitas Muhammadiyah
(UNIMUS) Semarang. Penulis aktif dalam kegiatan Tridarma
yaitu kegiatan penelitian, pengabdian masyarakat dan
publikasi artikel di berbagai jurnal ilmiah bidang kesehatan
baik nasional maupun Internasional. Penulis juga aktif di
organisasi Persatuan Ahli Teknologi Laboratorium Medik
(PATELKI) tingkat pusat sebagai pengurus Koligium dan
tingkat Provinsi Jawa Tengah (DPW) sebagai Sie Ilmiah.
Oleh Perguruan Tinggi, saat ini penulis diamanati sebagai
Kepala Bidang Penelitian di Lembaga Penelitian dan
Pengabdian Masyarakat (LPPM) UNISSULA.
353
dr. Denny Anggoro Prakoso, MSc, FISPH,
FISCM, Sp.KKLP lahir di Bantul, 21 Juni
1981. Riwayat pendidikan SD Ngotho
Bantul, SMP 10 Yogyakarta, SMA 3
Yogyakarta, pendidikan dokter dari Fakultas
Kedokteran Universitas Gadjah Mada
(UGM), pasca sarjana di Ilmu Kedokteran
Klinis UGM bidang epidemiologi klinis. Mulai
tahun 2020 dokter Denny sedang
menempuh pendidikan Program studi Doktor di FKKMK
UGM. Dokter Denny mendapatkan kompetensi dokter
Spesialis Kedokteran Keluarga Layanan Primeri (SpKKLP)
dari Kolegium Ilmu Kedokteran Keluarga Indonesia (KIKKI).
Dokter Denny saat ini menjadi staf dosen bagian IKM-IKK
Fakultas Kedokteran dan Ilmu Kesehatan Universitas
Muhammadiyah Yogyakarta sejak 2007. Dokter Denny telah
menulis 2 buku : Buku saku “dokter pintar mengobati” dan
buku saku “ilustrasi kasus dan peresepan pada praktik
dokter di layanan primer”.
354
dr. Hari Peni Julianti, MKes, SpKFR-
K, FISPH, FISCM saat ini menjabat
Manager SDM dan Pendidikan di RS
Nasional Diponegoro UNDIP,
Koordinator Modul 5.3 Kedokteran
Keluarga dan Kedokteran Komunitas,
Pengelola Kepaniteraan Komprehensif
Kedokteran Keluarga, Dosen di
Bagian Ilmu Kesehatan Masyarakat-
Kedokteran Pencegahan dan Program
Studi Ilmu Kedokteran Fisik dan
Rehabilitasi FK UNDIP. Menyelesaikan Sarjana Kedokteran
dan Profesi Dokter di FK UNDIP, S2 Ilmu Kesehatan
Masyarakat Konsentrasi Epidemiologi di Program
Pascasarjana UNDIP, Sp 1 Ilmu Kedokteran Fisik dan
Rehabilitasi FK UNDIP, Fellow of The Indonesian Society of
Public Health dan Fellow of The Indonesian Society
Community Medicine oleh Badan Kerjasama IKM IKP IKK
FKI dan Sp2 Kolegium IKFR Indonesia. Saat ini aktif
mengajar di S1 dan Profesi Dokter FK UNDIP, Prodi Ilmu
Kedokteran Fisik dan Rehabilitasi FK UNDIP
Ronny Isnuwardana, dr.,

MIH lahir di Malang, Jawa
Timur. Penulis bekerja di
Fakultas Kedokteran
Universitas Mulawarman,
Samarinda sejak tahun
2005. Riwayat pendidikan
yang ditempuh adalah
gelar Dokter di Universitas
Brawijaya, Malang dan
dilanjutkan dengan Master
of International Health di Monash University,
Melbourne. Saat penulisan buku ini sedang menempuh
pendidikan untuk Doctor of Philosophy in Clinical
Epidemiology di Mahidol University, Bangkok.
355
lahir di DKI Jakarta. Pendidikan
Sarjana dan Profesi Dokter dari
Fakultas Kedokteran Universitas
Diponegoro, Pasca Sarjana di
Fakultas Ilmu Kesehatan
Masyarakat (FKM) UNDIP pada
Konsentrasi Administrasi Rumah
Sakit. Sejak tahun 2019
menjadi staf pengajar bagian
IKM Fakultas Kedokteran
Universitas Katholik Soegijapranata
Slamet Sunarno Harjosuwarno, lahir

tahun 1944 di Solo. Pendidikan di
Sekolah Rakyat Sawahan 2
Kabupaten Boyolali, SMPN 3 dan
SMAN 1 keduanya di Surakarta.
Lulus dokter dari Universitas Gadjah
Mada Yogyakarta, dan menyelesaikan
M.P.H. jurusan International Health
dari School of Public Health of Hawaii
di Honolulu. Sejak SR kelas 6
mendapat bimbingan pemikiran
filsafat dari kakaknya Sunarso Harjosuwarno, dosen Ilmu
Fisafat UKSW Salatiga. Ketika di Hawaii mendapat
bimbingan belajar tentang filsafat belajar dan filsafat
pendidikan dari Profesor Voulgaropoulos. Selama bekerja
sebagai dokter/pegawai negri Depkes (di Merauke,
Jayapura, dan Manado) terlibat mengajar pada sekolah
perawat, PGSLP, Fakultas Pendidikan dan D3 Perawatan
Uncen Jayapura, dan Program S2 Ilmu Kesehatan
Masyarakat yang diselenggarakan Fakultas Kedokteran
Unsrat. Setelah pensiun dari pegawai negri, bekerja pada
Family Health Intermational, RTI, dan Inisiatif Anti Malaria
dalam penanganan HIV-AIDS maupun Malaria srts sebagai
konsultan manajemen kesehatan dan rumah sakit. Sejak
2009 bekerja pada Fakultas Kedokteran Universitas Kristen
Duta Wacana pada Bagian Ilmu Kesehatan Masyarakat.
356
dr. Lutfan Lazuardi adalah
dosen di Departemen Kebijakan
dan Manajemen Kesehatan dan
pengelola minat Sistem Informasi
Manajemen Kesehatan (SIMKES)
di Program Magister Ilmu
Kesehatan Masyarakat, Fakultas
Kedokteran, Kesehatan
Masyarakat dan Keperawatan,
Universitas Gadjah Mada. Ia
memperoleh gelar Dokter (1999) dan Magister
Kesehatan Masyarakat (2002) dari Universitas Gadjah
Mada. Memperoleh gelar PhD dari Innsbruck Medical
University pada tahun 2007. Memiliki minat di bidang
informatika kesehatan dan telah terlibat dalam berbagai
kegiatan pemanfaatan data untuk mendukung program
kesehatan. Saat ini terlibat dalam kegiatan HDSS
Sleman (Health Demographic and Surveillance
System), suatu survei longitudinal berbasis populasi di
Sleman yang sudah berjalan selama 5 tahun.
357
358

Buku Biostatistik Kedokteran Dan Kesehatan-BKS

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Buku Biostatistik Kedokteran Dan Kesehatan-BKS

Diunggah oleh

Hak Cipta:

Format Tersedia

BIOSTATISTIKA

Desain Sampul dan Tata Letak

Dengan memanjatkan puja dan puji syukur kehadirat Allah

Badan Kerjasama Bagian IKM-IKP-IKK

Assalamu’alaikum Warrahmatullahi Wabarakatuh

KATA PENGANTAR ........................................................... iv

BAB I PENGANTAR BIOSTATISTIKA KEDOKTERAN

Dr. Sumardiyono, S.KM, M.Kes*

Data dan Informasi dalam statistik

Daniel, W. W., & Cross, C. L. (2013). BIOSTATISTICS A

dr. Nining Lestari, MPH*

Pesan dalam Belajar

Gambar 2.1. Klasifikasi skala pengukuran data

Skala kategorik disebut juga skala kualitatif, merupakan

Gambar 2.2. Hierarki skala pengukuran data.

Tabel 2.1 Karakteristik skala pengukuran

C.Contoh Mengidentifikasi Skala Pengukuran dan

Tabel 2.2. Contoh data penelitian

Data yang didapatkan dari hasil pengukuran selanjutnya

Name kita tuliskan variabel di sini, tidak menggunakan

3. Isikan kolom variabel view sesuai dengan variabel yang

5. Setelah kita isikan dengan benar, maka akan muncul tampilan

Kita dapat mengubah data skala numerik menjadi skala

3. Lalu klik Old and New Values

5. Apabila sudah disesuaikan maka tampilan pada data view akan

Dr. Sumardiyono, S.KM, M.Kes*

A. Pengertian Statistik Deskriptif

B.Statistik Deskriptif Data Numerik

Gambar 3.1. Kurve simetris (µ = Md = Mo)

Gambar 3.2. Kurve miring ke kiri (µ > Md > Mo)

Gambar 3.3. Kurve miring ke kiri (µ < Md < Mo)

d. Jika kurva distribusi frekuensi tidak simetris (miring/menceng

Penyajian data menggunakan mean, median, dan modus

Dalam contoh ini akan disajikan cara menghitung ukuran

2. Input data variabel

c. Klik Statistics, muncul kotak dialog Frequencies: Statistics,

d. Klik Continue, muncul kotak dialog Frequencies: Charts,

Dari output SPSS tersebut terjawab nilai-nilai

Sedangkan grafik distribusi data kedua variabel (usia

Gambar 3.4. Kurve distribusi data variabel Usia

Selanjutnya akan diselidiki apakah distribusi data

Tabel 3.4. Tabel distribusi frekuensi kelompok Usia

Pengerjaan dengan SPSS:

2) Input data variabel

4) Klik pada Frequencies, muncul kotak dialog

b. Visualisasi tabel lebih dari 1 variabel (tabel silang).

3) Klik Analyze  Descriptive Statistics  Crosstabs

4) Klik Crosstabs. Lalu masukkan variabel Usia ke kotak

5) Klik Cells muncul kotak dialog Crosstabs: Cell Display.

6) Klik Continue, lalu klik OK. Muncuk output SPSS,

b. Input data variabel

c. Klik Graph  Legacy Dialogs  Line

e. Klik Define, muncul kotak dialog: Define Simple Line:

2) Input data variabel

4) Muncul kotak dialog Frequencies. Pindahkan variabel

5) Klik Charts. Muncul kotak dialog Frequencies: Charts.

Interpretasi variabel usia:

Interpretasi variabel Diabetes melitus:

3) Untuk memberi judul, klik pada Title kemudian

c. Untuk memberi judul, klik pada kotak <40 kemudian

Goos, P., & Meintrup, D. (1396). Statistics with JMP: Graphs,

Dr. Sumardiyono, S.KM, M.Kes*

A. Pengantar Analisis Korelasi

Tabel 4.1. Memilih Uji Korelasi