Anda di halaman 1dari 51

ANALISIS DESKRIPTIF

dan
PENYAJIAN DATA NUMERIK

Ni Made Dian Kurniasari, SKM., MPH


dr. Putu Ayu Swandewi Astuti,MPH, Ph.D
Department of Demography, Biostatistics and Reproductive Health, School
of Public Health, Udayana University
Tujuan Pembelajaran
• Memamahi prinsip dan cara membuat
distribusi data
• Memahami prinsip dan cara penyajian data
numerik
• Memahami jenis, ciri, dan pemanfaatan
tendensi central
• Memahami jenis, dan pemanfaatan ukuran
sebaran
• Memahami pengertian persentil, decil, quartil,
inter quartil
• Memahami cara pembuatan dan interpretasi
Box Plot
Penyajian data numerik
• Statistik
Tendensi sentral, sebaran, percentile, decile,
quartil
• Tabel
Distribusi Frekuensi tunggal
Distribusi Frekuensi berkelompok
• Grafik
Histogram, Boxplot, Scatter plot, stem and leaf plot
Statistik
• Tendensi sentral  ukuran pusat pada suatu data
- Mean Rata-rata (average)

Arithmetic Mean

X   x i

n
Ciri2 dari Mean : unik dan hanya ada satu
dalam data, mudah dimengerti, sangat
dipengaruhi oleh nilai ekstrim
Tendensi Sentral

- Median nilai tengah

Median = X ke (n  1) / 2
n= 15  median adalah nilai x ke?
n= 10  median adalah nilai x ke?
Ciri median : unik, mudah dimengerti dan dihitung, tidak terlalu dipengaruhi
oleh nilai ekstrim

- Modus nilai yang paling sering muncul


Distribusi Data

Distribusi :
• Normal  mean, median dan modus berhimpit
• Skewed/ Menceng
Kanan mean lebih besar dari median
Kiri  mean lebih kecil dari median
Skewness and Kurtosis
• Skewness
• Menunjukkan apakah distribusi datanya simetris atau tidak simetris.
• Simetris  distribusi normal (right half and left half of the graph
are a mirror images of each other)
• Tidak simetris
• data menceng kanan/mengekor di kanan (positive skewed)
• data menceng kiri/mengekor di kiri (negative skewed)

• Kurtosis
Degree of which a distribution is “peaked” or “flat” in
comparison to a normal distribution whose graph is characterised in
a bell-shaped appearance
Ukuran Sebaran/
Variability
• Range

Range= nilai terbesar-terkecil


• Standar Deviasi

 x   x 
 i 
2 2
2
/n x  x
SD  atau SD 
n 1 n 1

 Variance= SD2
Sebaran… cont)

• Koefisien Variasi
• standar deviasi dalam ukuran mean
• Untuk membandingkan variabilitas data
dengan 2 unit pengukuran yang berbeda
• Untuk membandingkan data dengan alat ukur
yang berbeda (misal kadar kolesterol dalam
miligram per 100ml vs bb dalam pounds atau
bb siswa sd vs bb siswa SMA)

SD
C.V  x100%
x
Sebaran

• Quartil Data yang menempati posisi


tertentu bila rangkaian data dikelompokkan
menjadi 4 kelompok (25% range)
 Q1,Q2 (median),Q3

X ke (n  1) / 4 X ke 3(n  1) / 4

• Inter-quartil range range antara Q1 dan


Q3 (IQR= Q3-Q1)
Sebaran… cont)

• Percentil Dibagi menjadi 100

Percentil 1- 100
k ( n  1)
k percentil= 100

• Decile Dibagi menjadi 10

• Quintile Dibagi menjadi 5


Quartil dan Inter quartile range (IQR)
Nilai observasi Quartil 1 (nilai orang ke 25%)
X1 = 1 Antara orang ke 2 dan 3 = (3+5)/2 = 4
X2 = 3
X3 = 5 Quartile 2 (nilai orang yang ke 50%),
X4 = 10 antara orang ke 5 dan 6 = 12 + 15)/2
X5 = 12 = 13,5
X6 = 15
X7 = 20 Quartile 3 (nilai orang ke 75%) antara
X8 = 22 orang ke 7 dan 8 = (20 + 22)/2 = 21
X9 = 25
X10 = 30 Inter Quartile range =
Quartile 3 – Quartile 1 = 21 - 4 = 17
Statistik deskriptif data numerikal

• Mean (rerata) dipakai meringkas data numerikal


berdistribusi normal
• Median dipakai meringkas data yang tidak berdistribusi
normal
• Sd (simpang baku) dipakai meringkas sebaran data
yang berdistribusi normal)
• IQR (inter quartile range) dipakai menggambarkan
sebaran data tidak normal
Tabel distribusi

• Tabel distribusi tunggal


- range data sempit
- penting menampilkan individual value
- Sampel kecil
• Tabel distribusi berkelompok
- range lebar
- Bisa dikelompokkan atau lebih berarti
sesuai dgn tujuan
Tabel Distribusi Frekuensi
Tabel 1. Distribusi umur pasien UGD RS X pada bulan oktober 2009

x f f kumulatif f relatif f relatif


(%) kumulatif

Sumber: Database rumah sakit X


Tabel distribusi
Berkelompok
• Cara membuat:

1. Urutkan data dari terkecilterbesar


2. Tentukan range dari data
(data terbesar- data terkecil)
3. Tentukan jumlah kelas
4. Tentukan intervalnya
Sturge Rules range
i
k  1  3.322(log n) k
Grafik
• Histogram

• Polygon

• Line chart

• Box plot (Box and whisker plot)

• Stem and Leaf Plot

• Scatter plot/scatter gram


Scatter plot histogram

Polygon
STEM AND LEAF PLOT

umur_jln Stem-and-Leaf Plot

Frequency Stem & Leaf

7.00 9. 0555577
5.00 10 . 00005
.00 11 .
6.00 12 . 000055
6.00 13 . 055577

Stem width: 1.00


Each leaf: 1 case(s)
Box Plot, percentile, quartile, dan inter-
quartile
30.00
95%
25.00

20.00
75% (quartile 3)
15.00
Inter
quartie = 50% (quartile 2 = median)
10.00
IQ3-IQ1)
5.00 25% (quartile 1)
0.00
5%
VAR00001
BOXPLOT PERBANDINGAN 2 KELOMPOK
Kapan suatu nilai bisa dikatakan
outlier?
• Outlier
Observasi dimana nilai x terlalu kecil atau terlalu besar,
yang melebihi nilai pada Q3 (lebih dari 1.5(IQR)) atau yang
kurang dari nilai pada Q1 (lebih dari 1.5 (IQR)).

Yaitu…..

Observasi nilai x > Q3 + 1.5(IQR) atau


x < Q1 -1.5(IQR)
Contoh outlier
• Misal pada data berikut (diurutkan dari kecil - besar)

Sumber : Buku Daniel hal 51

Diketahui: Q1 =27.25; Q3 = 33.525; IQR = 6.275


Outlier : x > Q3 + 1.5(IQR) = x > 33.525 + 1.5(6.275)
= x > 42.9375  outlier
Atau
x < Q1 -1.5(IQR) = x < 27.25 – 1.5 (6.275)
= x < 17.8375  outlier
Pada data yaitu : nilai 14.6 dan 44.0 adalah outlier
Reference
 Daniel WW, 1999. Biostatistics: A Foundation for Analysis in Th
Health Sciences (Seventh ed). New York: John Wiley & Sons.
 Kirkwood B R. & Stern JAC, 2003. Medical Statistics (Second ed).
Oxford: Blackwell Science.
 Widarsa, IKT. 2009. Biostatistik Dasar. Buku Ajar. Program Studi
Kesehatan Masyarakat, FK, Universitas Udayana.
STATA command
Ringkasan statistik
• sum varlist, detail

• Tab var

• Tabstat varlist, option

Pengelompokan variabel :
• Recode var (rule) (rule), gen(newvar)
• Kemudian tab var
• Grafik
• histogram variable_name,
• histogram variable_name, normal by (variable_name)
Contoh pada data low birth
weight
• Ringkasan statistik dapat diperoleh dari berbagai command
berikut :
• sum sbp, detail
• by sex, sort: sum sbp, detail
• tabstat sbp, by (sex) stat (mean p50 sd iqr skew kurtosis)
• tab sex, missing
• tab sex tox  untuk tabulasi silang

• Pengelompokan variabel (
• Grafik
• histogram sbp
• histogram sbp, bin(10) normal by(sex)
• graph box sbp
• graph box sbp, by(sex)
ANALISIS DESKRIPTIF
Data Kategorikal

dr. Ayu Swandewi,MPH, Ph.D


Department of Demography and Biostatistics
School of Public health, Udayana University
Learning Objective
• Terampil menyajikan data kategorikal dalam bentuk
tabel, grafik dan statistik
Presenting Categorical Data

TABLE GRAPH
• SINGLE TABLE • BAR
• CROSS-TABLE • PIE

STATISTICS
• PERCENT
• RATIO
Tingkat pendidikan 16 sampel ibu hamil
1. SD 9. SMP
2. SD 10.Tdk Sekolah
3. SMA 11. PT
4. SMP 12. Tdk sekolah
5. SD 13. SD
6. SMP 14. SMP
7. SMP 15. SMA
8. SMA 16. SMA
Coba sajikan informasi ini!
Tabel distribusi frekuensi
Tabel 1. Distribusi tingkat pendidikan ibu hamil
Tingkat Pendidikan Frekuensi Persentase
Tdk Sekolah 2 12.5%
SD 4 25%
SMP 5 31.25%
SMA 4 25%
PT 1 6.25%
Total 16 100%
5
4.5
4
3.5 Tdk Sklh
3
Grafik
2.5
SD
SMP
2
SMA
1.5
1 PT
0.5
0
Tingkat Pendidikan
Anemia Data
(1= anemia; 2=non anemia)

1 1 2 1 2 1 2 1 2 2 1 2 2 2
1 1 2 2 2 1 1 2 2 2 1 2 2 1
2 2
2 2 1 2 2 1 2 2 1 2 1 1 2 2
2
1 1 2 2 2 2 2 1 1 2 2 2 1 2
1
1 1 2 1 2 1 2 1 2 2 1 2 2 2
1 1 2 2 2 1 1 2 2 2 1 2 2 1
2 2
2 2 1 2 2 1 2 2 1 2 1 1 2 2
2
1 1 2 2 2 2 2 1 1 2 2 2 1 2
Berapakah Prevalensi Anemia ?
1
One Categorical Variable

What is the prevalence of anemia among pregnant women?


Variable : Anemia
Table : Single frequency distribution
Statistic : Percent
Graph : Bar or Pie
Table 1. Frequency distribution of anemia among
pregnant women in Bali 2008
Categories Frequency Percent
Anemia 59 25,5
Non Anemia 172 74,5
Total 231 100,0
Source: Bali Health Division
The prevalence of anemia among pregnant women is about 25,5%
One Categorical Variable …cont)
Graph 1. Pie chart of anemic status of Graph 1. Bar chart of anemic status of
pregnant womens in Bali 2008 pregnant womens in Bali 2008

80

60

40 Anem ia
Non Anemia
20

0
Pregnant w omen

Source: Bali Health Division Source: Bali Health Division


DATA ANEMIA
(1= anemia; 2=non anemia)
GIANYAR:
1 1 2 1 2 1 2 1 2 2 1 2 2 2
1 1 2 2 2 1 1 2 2 2 1 2 2 1
2 2
2 2 1 2 2 1 2 2 1 2 1 1 2 2
2
1 1 2 2 2 2 2 1 1 2 2 2 1 2
1
1 1 2 1 2 1 2 1 2 2 1 2 2 2
1
KARANGASEM:
1 2 2 2 1 1 2 2 2 1 2 2 1 2
2
2 2 1 2 2 1 2 2 1 2 1 1 2 2
2 Berapa prevalensi anemia berdasarkan kabupaten ?
Two Categorical Variables (bi-variate)
What is the prevalence of anemia among pregnant women in each
district?
Variable : Anemia and District
Table : Cross-Tabulation
Statistics : Percent (specific prevalence), Ratio
Graph : Bar (clustered or stacked bar)
Table 2. Cross tabulation of districts and anemic status of pregnant women in 2008
District Anemia Non Total
Anemia
Gianyar : count 33 102 135
row% 24,4% 75,6% 100%
Krgasem : count 26 70 96
row% 27,1% 72,9% 100%
Total : count 59 172 231
row% 25,5% 74,5% 100%
Bar Chart
Clustered Bar Stacked Bar
Two Categorical Variables (bi-variate)
Does smoking increase the risk for CHD?
Variable : smoking (independent) and CHD (dependent)
Table : Cross-Tabulation
Statistic : Percent, Ratio (RR or OR)
Table 3. Cross-tabulation of smoking and CHD

Smoking CHD Non CHD Total


Yes : count 85 25 110
colm% 85% 25% 55%

No : count 15 75 90
colm% 15% 75% 45%
Total : count 100 100 200
colm% 100% 100% 100%
Pengertian

• Penelitian prospektif
suatu penelitian dengan pengamatan terjadinya out-
come ke depan, dimana pd saat mulai pengamatan, out-
come belum ada.

Misal:
Penelitian risiko jantung koroner pada perokok,
Pengertian

• Penelitian retrospektif
suatu penelitian dengan pengamatan terjadinya faktor
risiko ke belakang, dimana pd saat mulai pengamatan,
out-come sudah terjadi.

Misal:
Penelitian risiko jantung koroner pada perokok
Relatif Risk (RR)
• Risk (p)

kemungkinan kejadian suatu penyakit (p)


• Relatif Risk (RR)

ratio risk antara kelompok terpapar dengan kelompok tidak terpapar


(kontrol).

Kelompok Sakit Tidak Total


p1 a/n1
Terpapar a b n1 RR = ----- = -------
p2 c/n2
Tdk c d n2
terpapar
Odd Ratio (OR)
• Odd
perbandingan kejadian sakit (p) dan tidak sakit (1-p)
• Odd Ratio (OR)
ratio Odd antara kelompok terpapar dengan kelompok tidak
terpapar

Odd(+) (a/n1)/(b/n1)
Terpapar Sakit Tidak Total
OR = ----------- = -----------------
Ya a b n1 Odd(-) (c/n2)/(d/n2)

Tidak c d n2 a/b ad
= ---------- = -------
c/d bc
Indikasi
Relatif Risk (RR)
mempelajari faktor risiko pada penelitian prospektif
RR>1, meningkatkan risiko
RR=1, bukan faktor risiko
RR<1, menurunkan risiko (efek pencegahan)

Odd Ratio (OR)


mempelajari faktor risiko pada penelitian retrospektif
OR>1, meningkatan risiko
OR=1, bukan risk faktor
OR<1, mengurangi risiko (efek pencegahan)
Kasus
Pengamatan dilakukan pada 100 perokok dan 100 non
perokok selama 10 tahun, kemudian dilihat kejadian CHD

Rokok CHD + CHD - Total


Perokok 60 40 100
Bkn 10 90 100
Perokok
Total 70 130 200

Hitung RR!!
• P1= 60/100

• P2 = 10/100

• RR= P1/P2 =6

• Interpretasi: Resiko CHD 6 kali lebih tinggi pada perokok


dibandingkan bukan perokok
Kasus
• Studi case control dilakukan pada 50 penderita Ca Paru
dan 150 kontrol yang sehat. Kemudian ditelusuri
riwayat merokoknya. Ternyata 35 orang penderita Ca
Paru adalah perokok dan 50 kontrol adalah perokok

Tugas:
Sajikan data dalam tabel silang
Hitung OR!!
Perhitungan
Rokok Case Kontrol Total

Perokok 35 50 85

Bkn 15 100 115


Perokok
Total 50 150 200

OR=(35x100)/(15x50)
OR= 4.6
Interpretasi: Odds Ca Paru pada perokok 6 kali
lebih tinggi dibandingkan bukan perokok

Anda mungkin juga menyukai