Univariat
Statistik Deskriptif
dr. Henry M.F. Palandeng, M.Sc, FISPH, FISCM
Bagian Ilmu Kedokteran Komunitas
Fakultas Kedokteran – UNSRAT
2018
Tujuan pembelajaran:
• Penelitian Ilmiah
• Penelitian deskriptif
• ‘Descriptive statistic’
• Klasifikasi cara penyajian
• Jenis pengukuran
• Pengenalan SPSS
Penelitian Ilmiah
Statistic Statistics
Penelitian Ilmiah
• Tahapan penelitian
• Penemuan – identifikasi masalah
• Desain riset (Jenis dan Desain Penelitian)
• Sampling
• Pengumpulan data
• Pemrosesan dan analisis data
• Kesimpulan dan laporan
Penelitian Ilmiah
• Klasifikasi
• Berdasarkan tujuan
• Berdasarkan karakteristik masalah atau metode
• Berdasarkan strategi
• Berdasarkan tingkat eksplanasi
• Deskriptif
• Komparatif
• Asosiatif
• Berdasarkan sifat dan jenis data
Main branch of statistics
Descriptive Inferential
Descriptive statistics
What is “descriptive statistic”
Mengumpulkan
data
Analisis
Menyajikan data
interpretasi
Mengolah data
Apa yang dideskripsikan...
• Pelayanan kesehatan
• Menelaah kasus tunggal
• Mengadakan perbandingan
• Melihat hubungan antara suatu gejala dengan peristiwa yang mungkin akan
timbul dengan munculnya gejala tersebut
Contoh
Statistik
Parametrik
Statistik
Uji Statistik
Inferensial
Statistik
Statistik non-
parametrik
Statistik
Deskriptif
Statistik deskriptif (1)
• Statistik deskriptif ialah statistik yang mengumpulkan,
menyusun, menyajikan, dan menjelaskan karakteristik dari
sekumpulan data.
• Statistik deskriptif tidak mempunyai hipotesis dan tidak bersifat
analitik
• Parameter yang diukur ialah:
• Nilai tengah: mean (rerata), median, modus
• Nilai minimum dan maksimum
• Pengukuran dispersi : standard deviation (SD, = simpang
baku), standard error (SE), varians, koefisien variasi, rentang
(range), skewness, kurtosis
Statistik deskriptif (2)
Contoh:
1. Ingin diketahui gambaran perilaku ibu menyusui di suatu
wilayah tertentu
2. Ingin diketahui rerata dan simpang baku (Standard
Deviation, SD) berat badan bayi baru lahir di daerah
perkotaan
3. Ingin diketahui rerata dan SD kadar kolesterol LDL dari
penderita2 yang mengalami infark jantung akut
4. Ingin diketahui proporsi mahasiswa FK yang merokok
Question needed to be answered
Survey
Case Study
Comparative Study
Correlation Study
Prediction Study
Evaluation Study
Jenis Penelitian Deskriptif
• Memperkirakan kemungkinan
Prediction munculnya suatu gejala
berdasarkan gejala lain yang sudah
study muncul dan diketahui sebelumnya
Contoh:
1. Ingin diketahui apakah rerata berat badan bayi baru lahir di daerah
perkotaan lebih tinggi dari rerata berat badan bayi yang lahir di pedesaan
2. Ingin diketahui apakah obat A atau B yang lebih efektif menurunkan kadar
asam urat pada penderita hiperurisemia
Kelebihan Penelitian Deskriptif
• Tidak dapat digunakan untuk uji etiologi hipotesa karena tidak ada
kelompok kontrol atau pembanding
• Tidak dapat menentukan adanya asosiasi atau hubungan antara
faktor risiko dan masalah kesehatan atau penyakit
Data in Descriptive statistics
DATA
• Jenis data:
• Data diskrit; adalah data yang sifatnya terputus-putus, nilainya bukan
merupakan pecahan (angka utuh).
• Contoh: data tentang jumlah penduduk, kendaraan dan sebagainya
• Data kontinyu; adalah data yang sifatnya sinambung atau kontinyu, nilainya
bisa berupa pecahan.
• Contoh:
• Data kwalitatif
• Data kwantitatif
• Data diskrit adalah data yang sifatnya terputus-putus, nilainya bukan merupakan pecahan (angka utuh). Contoh data diskrit adalah data tentang jumlah penduduk, kendaraan dan sebagainya,
• Data kontinyu adalah data yang sifatnya sinambung atau kontinyu, nilainya bisa berupa pecahan. Contoh data kontinyu adalah data tentang hasil panen padi, panjang jalan, berat sapi dan sebagainya.
• Data nominal adalah ukuran yang paling sederhana, dimana angka yang diberikan kepada objek mempunyai arti sebagai label saja, dan tidak menunjukkan tingkatan apapun. Ciri-ciri data nominal adalah hanya
memiliki atribut, atau nama, atau diskrit. Data nominal merupakan data diskrit dan tidak memiliki urutan. Bila objek dikelompokkan ke dalam set-set, dan kepada semua anggota set diberikan angka, set-set
tersebut tidak boleh tumpang tindih dan bersisa. Misalnya tentang jenis olah raga yakni tenis, basket dan renang. Kemudian masing-masing anggota set di atas kita berikan angka, misalnya tenis (1), basket (2)
dan renang (3). Jelas kelihatan bahwa angka yang diberikan tidak menunjukkan bahwa tingkat olah raga basket lebih tinggi dari tenis ataupun tingkat renang lebih tinggi dari tenis. Angka tersebut tidak
memberikan arti apa-apa jika ditambahkan. Angka yang diberikan hanya berfungsi sebagai label saja. Begitu juga tentang suku, yakni Dayak, Bugis dan Badui. Tentang partai, misalnya Partai Bulan, Partai
Bintang dan Partai Matahari. Masing-masing kategori tidak dinyatakan lebih tinggi dari atribut (nama) yang lain. Seseorang yang pergi ke Jakarta, tidak akan pernah mengatakan dua setengah kali, atau tiga
seperempat kali. Tetapi akan mengatakan dua kali, lima kali, atau tujuh kali. Begitu juga tentang ukuran jumlah anak dalam suatu keluarga. Numerik yang dihasilkan akan selalu berbentuk bilangan bulat,
demikian seterusnya. Tidak akan pernah ada bilangan pecahan. Data nominal ini diperoleh dari hasil pengukuran dengan skala nominal.
• Data Ordinal bagian lain dari data kontinum adalah data ordinal. Data ini, selain memiliki nama (atribut), juga memiliki peringkat atau urutan. Angka yang diberikan mengandung tingkatan. Ia digunakan untuk
mengurutkan objek dari yang paling rendah sampai yang paling tinggi, atau sebaliknya. Ukuran ini tidak memberikan nilai absolut terhadap objek, tetapi hanya memberikan peringkat saja. Jika kita memiliki
sebuah set objek yang dinomori, dari 1 sampai n, misalnya peringkat 1, 2, 3, 4, 5 dan seterusnya, bila dinyatakan dalam skala, maka jarak antara data yang satu dengan lainnya tidak sama. Ia akan memiliki
urutan mulai dari yang paling tinggi sampai paling rendah. Atau paling baik sampai ke yang paling buruk. Misalnya dalam skala Likert (Moh Nazir), mulai dari sangat setuju, setuju, ragu-ragu, tidak setuju
sampai sangat tidak setuju. Atau jawaban pertanyaan tentang kecenderungan masyarakat untuk menghadiri rapat umum pemilihan kepala daerah, mulai dari tidak pernah absen menghadiri, dengan kode 5,
kadang-kadang saja menghadiri, dengan kode 4, kurang menghadiri, dengan kode 3, tidak pernah menghadiri, dengan kode 2 sampai tidak ingin menghadiri sama sekali, dengan kode 1. Dari hasil pengukuran
dengan menggunakan skala ordinal ini akan diperoleh data ordinal. Alat analisis (uji hipotesis asosiatif) statistik nonparametrik yang lazim digunakan untuk data ordinal adalah Spearman Rank Correlation dan
Kendall Tau.
• Data interval Pemberian angka kepada set dari objek yang mempunyai sifat-sifat ukuran ordinal dan ditambah satu sifat lain, yakni jarak yang sama pada pengukuran dinamakan data interval. Data ini
memperlihatkan jarak yang sama dari ciri atau sifat objek yang diukur. Akan tetapi ukuran interval tidak memberikan jumlah absolut dari objek yang diukur. Data yang diperoleh dari hasil pengukuran
menggunakan skala interval dinamakan data interval. Misalnya tentang nilai ujian 6 orang mahasiswa, yakni A, B, C, D, E dan F diukur dengan ukuran interval pada skala prestasi dengan ukuran 1, 2, 3, 4, 5 dan
6, maka dapat dikatakan bahwa beda prestasi antara mahasiswa C dan A adalah 3 – 1 = 2. Beda prestasi antara mahasiswa C dan F adalah 6 – 3 = 3. Akan tetapi tidak bisa dikatakan bahwa prestasi mahasiswa
E adalah 5 kali prestasi mahasiswa A ataupun prestasi mahasiswa F adalah 3 kali lebih baik dari prestasi mahasiswa B. Dari hasil pengukuran dengan menggunakan skala interval ini akan diperoleh data
interval. Alat analisis (uji hipotesis asosiatif) statistik parametrik yang lazim digunakan untuk data interval ini adalah Pearson Korelasi Product Moment, Partial Correlation, Multiple Correlation, Partial
Regression, dan Multiple Regression.
• Data ratio Ukuran yang meliputi semua ukuran di atas ditambah dengan satu sifat yang lain, yakni ukuran yang memberikan keterangan tentang nilai absolut dari objek yang diukur dinamakan ukuran rasio
(data rasio). Data rasio, yang diperoleh melalui pengukuran dengan skala rasio memiliki titik nol. Karenanya, interval jarak tidak dinyatakan dengan beda angka rata-rata satu kelompok dibandingkan dengan
titik nol di atas. Oleh karena ada titik nol, maka data rasio dapat dibuat perkalian ataupun pembagian. Angka pada data rasio dapat menunjukkan nilai sebenarnya dari objek yang diukur. Jika ada 4 orang
pengemudi, A, B, C dan D mempunyai pendapatan masing-masing perhari Rp. 10.000, Rp.30.000, Rp. 40.000 dan Rp. 50.000. Bila dilihat dengan ukuran rasio maka pendapatan pengemudi C adalah 4 kali
pendapatan pengemudi A. Pendapatan pengemudi D adalah 5 kali pendapatan pengemudi A. Pendapatan pengemudi C adalah 4/3 kali pendapatan pengemudi B. Dengan kata lain, rasio antara pengemudi C
dan A adalah 4 : 1, rasio antara pengemudi D dan A adalah 5 : 1, sedangkan rasio antara pengemudi C dan B adalah 4 : 3. Interval pendapatan pengemudi A dan C adalah 30.000, dan pendapatan pengemudi C
adalah 4 kali pendapatan pengemudi A. Contoh data rasio lainnya adalah berat badan bayi yang diukur dengan skala rasio. Bayi A memiliki berat 3 Kg. Bayi B memiliki berat 2 Kg dan bayi C memiliki berat 1 Kg.
Jika diukur dengan skala rasio, maka bayi A memiliki rasio berat badan 3 kali dari berat badan bayi C. Bayi B memiliki rasio berat badan dua kali dari berat badan bayi C, dan bayi C memiliki rasio berat badan
sepertiga kali berat badan bayi A, dst. Dari hasil pengukuran dengan menggunakan skala rasio ini akan diperoleh data rasio. Alat analisis (uji hipotesis asosiatif) yang digunakan adalah statistik parametrik dan
yang lazim digunakan untuk data rasio ini adalah Pearson Korelasi Product Moment, Partial Correlation, Multiple Correlation, Partial Regression, dan Multiple Regression.Sesuai dengan ulasan jenis
pengukuran yang digunakan, maka variabel penelitian lazimnya bisa di bagi menjadi 4 jenis variabel, yakni variabel (data) nominal, variabel (data) ordinal, variabel (data) interval, dan variabel (data) rasio.
Variabel nominal, yaitu variabel yang dikategorikan secara diskrit dan saling terpisah satu sama lain, misalnya status perkawinan, jenis kelamin, suku bangsa, profesi pekerjaan seseorang dan sebagainya.
Variabel ordinal adalah variabel yang disusun atas dasar peringkat, seperti motivasi seseorang untuk bekerja, peringkat perlombaan catur, peringkat tingkat kesukaran suatu pekerjaan dan lain-lain. Variabel
interval adalah variabel yang diukur dengan ukuran interval seperti indek prestasi mahasiswa, skala termometer dan sebagainya, sedangkan variabel rasio adalah variabel yang disusun dengan ukuran rasio
seperti tingkat penganggguran, penghasilan, berat badan, dan sebagainya
Skala Pengukuran
• Skala nominal disebut juga skala kategori, tidak ada tumpang tindih misal:
agama, jenis kelamin,
Interval Suhu Badan
Numerik/
Kuantitatif/
Kontinyu
Kadar Gula
Rasio Darah
Rendah
Skala Ordinal Normal
Pengukuran Tinggi
Kategorik/
Kualitatif
Laki-laki
Nominal Perempuan
Persamaan
pengamatan/pengelomp ya ya ya ya
okkan, klasifikasi bisa
• Distribusi Frekuensi:
• Susunan data angka menurut besarnya (kuantitas) atau menurut kategorinya
(kualitas)
• Nilai tengah
• Nilai yang dianggap mewakili kelompok data tsb
• Mean, Median, Modus, geometric mean, harmonic mean
• Mean dipengaruhi nilai ekstrim (kecil maupun besar)
Simpulan Numerik/interpretasi
Σx
Mean = ----------
n
x1 + x2 + x3 + …….. + xn
Mean = ---------------------------------------
n
Contoh :
Sampel lima mahasiswa ditanya berapa
jumlah saudara kandungnya (n = 5)
∑ x 5+4+2+6+3
Mean = ------------- = ---------------- = 4
n 5
Dipengaruhi oleh nilai Ekstrim.
Data : 2, 3, 2, 1, 2, 2
Mean(1) = (2+3+2+1+2+2) / 6 = 2
Data : 2, 3, 2, 1, 2, 2, 14
Mean(2) = (2+3+2+1+2+2+14) / 7 = 4
2. MEDIAN
Data : 2, 3, 4, 5, 14 Median = 4
1,2,2,2,3,5 Mode = 2
3,3,7,8,12,16
3,3,4,5,6,7,7,
4,6,8,10,13,15,17
1,2,2,2,3,5 Mode = 2
3,3,7,8,12,16 Mode = 3
3,3,4,5,6,7,7, Mode = 3 dan 7
4,6,8,10,13,15,17 Mode = Tidak ada.
Hitunglah Mean, Median, Mode
Data : 6, 4, 5, 5, 4, 4, 2, 3, 2, 3.
∑x 6+4+5+5+4+4+2+3+2+3.
Mean = -------- = ----------------------------------
n 10
Mean = 3.8
Mean Deviation.
Variance = Varians
1, 3, 2, 4, 7, 16 Range = 16 – 1 = 15
23,25,28,37,38 Range = 38 – 23 = 15
2. MEAN DEVIATION
Merupakan deviasi (penyimpangan) dg mean :
x x-mean (x-mean)2
----------------------------------------------------------
2 2-4 = - 2 4
3 3-4 = -1 1
4 4-4 = 0 0
5 5-4 = 1 1
6 6-4 = 2 4
------------- ------------ ---------------
Mean = 4 0 10
n=5
2. MEAN DEVIATION.
Merupakan deviasi (penyimpangan) dg mean :
x | x-mean |
-------------------------------- Dipakai harga mutlak.
2 2-4 = 2 Mengabaikan tanda (-).
3 3-4 = 1
4 4-4 = 0
5 5-4 = 1
6 6-4 = 2
------------- ------------
Mean = 4 6 M.D. = 6/5 = 1.2
n=5
3. V A R I A N C E.
Kuadrat penyimpangan x dg mean :
∑(x – Mean) 2 10
∑(x – mean) 2
s = √ { ---------------- }
n–1
5. STANDARD ERROR.
SD s
SE = ---------- = -----------
√n √n
6. COEFFICIENT OF VARIATION.
COV ialah SD dibagi Mean x 100%.
s
COV = --------- (100%)
Mean
COV TB = (8/160)x100% = 5 %.
COV BB = (11/55)x100% = 20 %
Kesimpulan : BB lebih bervariasi dp TB.
Hitunglah : Range.
Mean Deviation.
Variance.
Standard Deviation.
Standard Error.
Coefficient of Variation.
Data : 6, 4, 5, 5, 4, 4, 2, 3, 2, 3.
Array : 2, 2, 3, 3, 4, 4, 4, 5, 5, 6
(1). Range = 6 – 2 = 4.
s 1.316
(5). Standard Error = --------- = ---------- = 0.416
√n √ 10
s
(6). Cov = --------- (100%) = 34.646 %
Mean
7.(1). QUARTILES.
Ialah NILAI-NILAI yg membagi suatu array menjadi
EMPAT bagian SAMA BESAR.
3(n+1)
Q3 = -----------
4
7. (2) QUINTILES.
Ialah NILAI-NILAI yg membagi sebuah array
menjadi LIMA bagian SAMA BESAR.
n+1 2(n+1)
Posisi D1 = ---------- D2 = ------------
10 10
5(n+1) n+1
Posisi D5 = ----------- = ----------- Ini Posisi APA?
10 2
7. (4). PERCENTILES.
Ialah NILAI-NILAI yg membagi sebuah array
Menjadi SERATUS bagian SAMA BESAR.
n+1 2(n+1)
Posisi P1 = ---------- P2 = ------------
100 100
50(n+1) n+1
P50 = -------------- = --------- Ini Posisi APA ?
100 2
Hitunglah : Quartiles, Quintiles, Deciles,
dan Percentiles data di bawah .
Data : 6, 4, 5, 5, 4, 4, 2, 3, 2, 3.
Array : 2, 2, 3, 3, 4, 4, 4, 5, 5, 6
(1). Quartiles. n+1
Posisi Q1 = ---------- = 11 / 4 = 2.75
4
Array : 2, 2, 3, 3, 4, 4, 4, 5, 5, 6
x : 1 = 0.75 : 1
x = 0.75 Q1 = 2.75
(1). Quartiles. 3(n + 1)
Posisi Q3 = ---------- = 33 / 4 = 8.25
4
Array : 2, 2, 3, 3, 4, 4, 4, 5, 5, 6
Q1 = 2.75
Q2 = 4
Q3 = 5.25
(3). SKEWNESS = KEMIRINGAN.
Nilai-nilai Skewness tidak perlu dihitung.
Cukup dinyatakan :
1. Tidak miring = Normal = Simetris.
2. Skewed to the right.
3. Skewed to the left.
Coefficient of Skewness.
Mean - Mode
Coef of Skewness = -----------------------
s
1. NORMAL = SIMETRIS.
Grafik atau
• Metode untuk memperlihatkan data kuantitatif
diagram atau dengan menggunakan sistem koordinat
gambar
Tekstular Tabular Grafik
Master Histogram
Diagram garis
Hasil Penelitian
Gambar 3. Distribusi Responden
menurut Program Studi
Gambar 13. Distribusi Responden tentang
Pengetahuan HIV/AIDS
Smoking: Increased Coronary Artery Disease
(CAD) Mortality
12
10
Relative Risk (95% CI)a
6 5.4
3.7
4
1.7
2 1.0
0
Nonsmokers 1-14/Day 15-24/Day 25/Day
Fatal CAD Cigarettes/Day
Current
a The probability of an event (developing a disease) occurring in exposed people compared Smokers
with the probability of the event in
nonexposed people. Adjusted for age.
Willett et al. N Engl J Med. 1987;317(21):1303-1309.
Smoking: Effect on Coronary Artery Disease
50 P=.002 50 P=.007
40 37 40 36
Patients (%)
Patients (%)
30 30
20
20 20
10 10
0 0
Nonsmokers Current Nonsmokers Current
Smokers Smokers
4
Relative Risk (95% CI)a
3 2.6
2.0
2 1.6
1.0
1
0
Nonsmokers 1-14/Day 15-24/Day 25/Day
Cigarettes/Day
aThe probability of an event (developing a disease) occurring in exposed people compared
Current Smokers
with the probability of the event in nonexposed people. Adjusted for age.
Willett et al. N Engl J Med. 1987;317(1):1303-1309.
Smoking: Increased Risk of Hemorrhagic Stroke
10
Relative Risk (95% CI)a
6
2.06 4.04
1.74
4 3.43 2.39 2.89
2
0
Total Hemorrhagic Intracerebral Subarachnoid
Stroke Hemorrhage Hemorrhage
aThe probability of an event (developing a disease) occurring in exposed people compared
with the probability of the event in nonexposed people.
Adjusted for age, exercise, alcohol consumption, body mass index, history of hypertension,
and history of diabetes.
Kurth et al. Stroke. 2003;34:2792-2795.
Environmental Tobacco Smoke: Prevalence of Heart Disease
Exposure to environmental tobacco smoke increases the risk of heart
disease among nonsmokers by 30%
0.20
Proportion With Major CAD
Light activea
0.15 Heavy passiveb
0.10
0
0 5 10 15 20
Years of Follow up
Adjusted for age, systolic blood pressure, diastolic blood pressure, total cholesterol, HDL cholesterol, FEV, height, preexisting CAD, body mass
index, triglycerides, white cell count, diabetes, physical activity, alcohol intake, and social class.
aLight active refers to men smoking 1-9 cigarettes a day. bHeavy passive refers to upper three quarters of cotinine concentration combined (0.8
to 14.0 ng/mL). cLight passive refers to lowest quarter of cotinine concentration among nonsmokers (0-0.07 ng/mL).
Whincup et al. BMJ. 2004;329:200-205.
Environmental Tobacco Smoke:
Risk of Acute Myocardial Infarction (MI)
Exposure to environmental tobacco smoke increased the risk
of non-fatal acute MI in a graded manner
4
Nonsmokers
Odds Ratio (95% CI)a
1
Never 1-7 8-14 15-21 22
0.75
aThe ratio of the oddsEnvironmental
of development of disease in exposed
Tobacco Smoke Exposurepersons
(Hoursto the
per odds of
Week)
development of disease in nonexposed persons. Adjusted for age, sex, region, physical activity,
and consumption of fruits, vegetables, and alcohol. Adapted from Teo et al. Lancet.
2006;368:647-658.
Tugas