Anda di halaman 1dari 92

BIOSTATISTIK

Hardian
Clinical Epidemiology and Biostatistics Unit
FK UNDIP

Hardian – CEU FK UNDIP


Statistical quotations

• There are three kinds of lies:


lies, damn lies, and statistics.
– Benjamin Disraeli / Mark Twain

• It is easy to lie with statistics,


but easier to lie without them.
– Frederick Mosteller
Statistik – metoda yang digunakan
untuk mendeskripsikan dan
mengukur karakteristik alamiah
sampel

Statistik menyebabkan kita dapat


mengkuantifikasi uncertainty dari
pengukuran
• Statistik adalah metode yang digunakan
untuk mengumpulkan, mengorganisir,
menganalisis dan menginterpretasi
informasi numerik dari data
• Biostatistik—metode untuk
mengumpulkan, mendeskripsikan,
menganalisis dan menginterpretasi data
yang berhubungan dengan kesehatan
manusia
Kepentingan Biostatistik

• Kemampuan melakukan riset


• Alat untuk analisa data
• Alat untuk interpretasi data & hasil uji
statistik
• Pengelolaan pasien yang baik
• Lulus ujian
Tujuan statistik

• Estimasi
– Menduga suatu nilai pada populasi
dengan menggunakan data dari
sampel
• Uji Hipotesis
• Prediksi  model persamaan
statistik
METODE ILMIAH
Adalah salah satu cara mencari kebenaran yang bila ditinjau
dari segi penerapannya, resiko untuk keliru paling kecil.

LANGKAH-LANGKAH DALAM METODE ILMIAH


1. Merumuskan masalah
2. Melakukan studi literatur
3. Membuat dugaan-dugaan, pertanyaan-pertanyaan atau
hipotesis
4. Mengumpulkan dan mengolah data, menguji
hipotesis, atau menjawab pertanyaan
5. Mengambil kesimpulan

INSTRUMEN
SAMPEL
SIFAT DATA PERAN
BIOSTATISTIK
VARIABEL
METODE ANALISIS
Karl Pearson Sir Ronald Fisher Douglas G Altman

Tidak perlu menjadi ahli matematika


untuk menggunakan statistik
Prinsip Biostatistik

1. Menguasai metodologi penelitian


 desain penelitian
2. Matematika sederhana
3. Logika
Analisis statistik
• untuk data kuantitatif, yaitu data yang
berupa angka atau bisa diangkakan, analisis
statistik lebih tepat digunakan
• statistik deskriptif dan statistik inferensial
• Statistik deskriptif digunakan untuk
membantu memaparkan (menggambarkan)
keadaan yang sebenarnya (fakta) dari satu
sampel penelitian  penelitian deskriptif
• Penelitian deskriptif tidak untuk menguji suatu
hipotesis.

budi murtiyasa ums


solo
Statistika inferensial

• Digunakan untuk mengolah data


kuantitatif dengan tujuan untuk menguji
kebenaran suatu teori baru yang
diajukan peneliti yang dikenal dengan
hipotesis  penelitian inferensial
• Dalam penelitian inferensial, teknik
analisis statistik yang digunakan
mengacu kepada suatu pengujian
hipotesis

budi murtiyasa ums


solo
Analisis non-statistik
• Data kualitatif, yaitu data-data yang tidak
bisa di-angka-kan, analisis non-statistik lebih
tepat digunakan
• Data kualitatif biasanya diolah atau
dianalisis berdasarkan isinya (subtansinya).
• analisis non statistik ini sering juga disebut
dengan analisis isi (content analysis), yang
mencakup analisis deskriptif, kritis,
komparatif, dan sintesis.
• Penelitian yang menggunakan data kualitatif
disebut penelitian kualitatif.
budi murtiyasa ums
solo
Kunci analisis data

Research Question yang bisa


diukur
• Mengetahui dengan baik variabel
penelitian  terutama out come
penelitian
• Mengetahui skala variabel penelitan
• Memahami desain penelitian
Hal yang diperoleh dengan Research
Question yang bisa diukur
• Membuat hipothesis yang benar
• Menentukan desain penelitian
• Cara menghitung besar sampel
yang tepat
• Memilih uji hipothesis yang tepat
Research Question yang bisa diukur

• Menyebutkan apa yang dicari  beda,


hubungan (korelasi atau asosiasi), risiko.
• Menyebutkan apa yang
dibandingkan/dihubungkan/menjadi faktor
risiko
• Menyebutkan outcome
• Menyebutkan derajat perbedaan/hubungan
yang akan dicapai  pertimbangan klinis
Contoh:

Apakah obat anti-hipertensi A


lebih baik daripada obat B? 

Apakah pasien yang dapat obat


anti-hipertensi A tekanan 
darahnya lebih rendah dibanding
yang obat B
Apakah obat anti-hipertensi A dapat
menurunkan tekanan darah lebih rendah 20
mmHg dibanding obat B

• Ada 2 kelompok  A dan B


• Penurunan  perbedaan
• Outcome berskala numerik 
mmHg
• Magnitude perbedaan  20 mmHg
Apakah obat anti-hipertensi A dapat
menurunkan tekanan darah lebih rendah 20
mmHg dibanding obat B
• Hipothesis jelas !
• Rumus besar sampel untuk beda rerata
2 populasi
• Uji beda dengan uji-t atau uji Mann-
Whitney
Data

• Hasil pengamatan pada subyek


penelitian (sampel)  mewakili
populasi yang menjadi interes
• Terdiri dari 1 atau lebih variabel
• Variabel  sesuatu yang
bervariasi  umur, jenis kelamin,
berat badan, dsb.
Variabel

• Suatu variabel adalah


karakteristik yang diukur pada
individu yang diambil dari individu
yang berasal dari populasi yang
diteliti
• Data adalah hasil pengukuran 1
atau lebih variabel yang diambil
dari sekelompok individu
Explanatory dan response variabel

Kita menjelaskan atau meprediksi


suatu response variabel dari
suatu explanatory variabel
• Variabel bebas (exlanatory/independent variabel):
variabel yang mempengaruhi
• Variabel terikat (response/dependent) : variabel
yang dipengaruhi
• Variabel Perancu (confounding)
• Variabel luar
Confounding
• Variabel ke-3 yang DAPAT berpengaruh
terhadap variabel bebas (variabel pengaruh)
atau variabel terikat (variabel terpengaruh)

Variabel Variabel
bebas Terikat

Confounding

• Confounding dikontrol dengan desain dan atau


uji multivariat
Populasi dan sampel

• Populasi rujukan semua


pengukuran atau observasi yang
diteliti
• Sampel adalah bagian dari populasi
akan tetapi HARUS mewakili
populasi
Populasi

Sampel
Ciri sampel yang baik

• Memiliki karakteristik yang Kriteria


sama dengan populasi inklusi/eksklusi

• Setiap individu mempunyai Metode


kesempatan yang sama sampling
untuk dipilih 
 random
Perhitungan
• Jumlahnya cukup besar
besar sampel
Populasi  Parameter
Sampel  Estimate
• Parameter adalah karakteristik numerik
atau kategorial dari populasi
- Bersifat tetap
- Umumnya tidak diketahui
• Statistik adalah karakteristik numerik atau
kategorial dari sampel.
- Digunakan untuk estimasi
(menduga) parameter populasi
- Bersifat random
- Untuk uji hipotesis
parameter

Populasi

Sampel statistik
Jenis Data
• Kategorial tidak mempunyai urutan matematis

1.Nominal
a. Dikotomus: Pria / Wanita
b. Politomus: A, B, AB, O
2. Ordinal mempunyai urutan: Grade 0, I, II,
III

• Numerik  mempunyai urutan logis/matematis


1. Rasio  mempunyai nol absolut: suhu
2. Interval  tidak mempunyai nol absolut: TB
Variabel skala numerik

• Kontinyu
– Rentang suatu nilai
• Tinggi badan dalam cm
• Diskret
– Ada batasan nilai
• # rokok dalam sehari
• # jumlah anak dalam keluarga
Contoh Dataset
Macam Analisis Data

• Analisis Univariat
Satu variabel  umur
• Analisis Bivariat
Dua variabel  umur & jenis kelamin
• Analisis Multivariat
Lebih dari dua variabel
 umur & jenis kelamin & tinggi badan
Macam Analisis Data (2)

• Analisa deskriptif • Univariat


• Bivariat
• Uji hipothesis

Statistik inferensial
Menduga suatu nilai di populasi
Inferential statistics

Dari sampel
• Menentukan estimasi parameter populasi
• Uji hipotesis
• Membuat model yang menggambarkan
populasi
Interval kepercayaan (Confidence
Interval = CI)

• Untuk inferensi nilai parameter dipopulasi


• Rentang oleh karena nilainya tidak diketahui pasti
• Dinotasikan dalam: 100-
• Rentang CI: 90%, 95%, 99%
• Nilai bawah dan nilai atas
• Contoh: 3,7 (95% CI= 2,2 s/d 5,9)
• Dalam statistik tidak ada kepercayaan 100% 
harus ukur seluruh populasi
Nilai rerata
pada
sampel
95% interval kepercayaan
Rentang nilai X pada
populasi
Rerata Hb
ibu hamil di Peneliti 1: 12,0 g/dL
Indonesia? Peneliti 2: 12,5 g/dL
Peneliti 3: 11 g/dL

Saya percaya dengan


tingkat kepercayaan 95%
rerata Hb ibu hamil di
Indonesia adalah antara
10,5 g/dL s/d 14 g/dL
• Hati-hati interpretasi CI yang terlalu
lebar !
• Misal: 23,6 (95% CI= 14,2 s/d 725,3)
• Tidak ada informasi yang bermakna !

CI semakin sempit semakin baik


Contoh interpretasi CI untuk risiko

A
B
C
D

A = Definitif faktor risko


B = Definitif faktor protektif
C = Inkonklusif, tetapi tidak ada kecenderungan
D = Cenderung faktor risiko
E = Cenderung faktor protektif
Statistical Package for the Social Sciences
Statistical Package for the Stupid Students

Stata Minitab

S-plus
SAS

Epi Info

Statview
Jenis analisis

• Analisa univariat  1 variabel 


analisa deskriptif
• Analisa bivariat  2 variabel 
analisa deskriptif & uji hipothesis
• Analisa multivariat  > 2 variabel
 untuk mengontrol faktor
perancu (confounding)
Statistik deskriptif – membuat data kasar (raw
data) menjadi informasi yang dapat diolah /
dimengerti
• Merangkum dan mempresentasikan data
untuk
– Menyederhanakan
– Membuat data menjadi dapat
dimengerti
– Mendukung pengambilan keputusan
Analisa deskriptif

Data numerik
1. Tendensi sentral
• Rerata
• Median
2. Dispersi
• Range
• Interquartil range
• Simpang baku
Nomenklatur

Parameter Statistik
Populasi Sampel

Mean  

Varians  s2

Standar  s
Deviasi
• FREKUENSI : banyaknya data untuk satu
kelompok/klasifikasi
• DISTRIBUSI FREKUENSI : mengelompokkan
data interval/rasio dan menghitung banyaknya
data dalam satu kelompok/klasifikasi
USIA FREKUENSI
20 5
21 6
22 13
23 4 KELOMPOK USIA DISTRIBUSI
24 7 FREKUENSI

25 7 20 – 21 11

26 7 22 – 23 17

27 5 24 – 25 14

28 3 26 – 27 12

29 4 28 – 29 7

30 15 30 – 31 18

31 3 32 - 33 5

33 5 34 - 35 1

35 1
• RATA-RATA : suatu bilangan yang
bertindak mewakili sekumpulan bilangan
• RATA-RATA HITUNG (RERATA) : jumlah
bilangan dibagi banyaknya
Bilangan Frekuensi Xi f i
(Xi) (fi)
70 3 210
63 5 315
85 2 170
Jumlah 10 695

Rerata = X = 695 = 69,5


10
• MEDIAN : nilai tengah dari sekumpulan data
setelah diurutkan yang fungsinya membantu
memperjelas kedudukan suatu data.
• MODUS : bilangan yang paling banyak muncul
dari sekumpulan bilangan yang fungsinya
untuk melihat kecenderungan dari sekumpulan
bilangan tersebut.
Nilai ujian adalah : 10 10 8 7 7 6 5 5 5 5 4
maka rata-rata hitung = 6,55, median = 6

Nilai ujian adalah : 8 8 8 8 8 8 7 5 5 4 3


maka rata-rata hitung = 6,55, median = 8

Kesimpulan untuk nilai 7 ?

Jika sekumpulan data jumlahnya genap  tidak mempunyai


bilangan tengah
Median adalah rerata dari dua bilangan yang ditengahnya.
Contoh : 1 2 3 4 5 6 7 8 8 9 median= (5+6) : 2 = 5,5
Contoh : nilai Ujian 10 10 8 7 7 6 5 5 5 5 4
Maka : rata-rata hitung = 6.55 ; median = 6
modus = 5 ; kelas modus = 5 - 7

Nilai Frekuensi
10 2
Nilai Frekuensi
8 1
8 – 10 3
7 2
5–7 7
6 1
2–4 1
5 4
Jumlah 11
4 1
Jumlah 11
UKURAN YANG MENYATAKAN
HOMOGENITAS / HETEROGENITAS :

1. RENTANG (Range)
2. DEVIASI RATA-RATA (Average Deviation)
3. VARIANS (Variance)
4. DEVIASI STANDAR (Standard Deviation)
• Rentang (range) : selisih bilangan terbesar
dengan bilangan terkecil. Sebaran
merupakan ukuran penyebaran yang sangat
kasar, sebab hanya bersangkutan dengan
bilangan terbesar dan terkecil.

A : 100 90 80 70 60 50 40 30 20 10
B : 100 100 100 100 100 10 10 10 10 10
C : 100 100 100 90 80 30 20 10 10 10

x = 55
r = 100 – 10 = 90
Deviasi Rata-rata : penyebaran  Berdasarkan
harga mutlak simpangan bilangan-bilangan terhadap
reratanya.
Nilai X X-X |X – X|
100 45 45
90 35 35 n |Xi – X|
80 25 25 DR = Σ
70 15 15
n
i=1
60 5 5
50 -5 5
40 -15 15
30 -25 25
20 -35 35 DR = 250 = 25
10 -45 45 10
Jumlah 0 250

Rerata = 55
• Varians : penyebaran berdasarkan jumlah
kuadrat simpangan bilangan-bilangan
terhadap rata-ratanya  melihat
ketidaksamaan sekelompok data
• Deviasi Standar : penyebaran berdasarkan
akar dari varians  menunjukkan
keragaman kelompok data
Sample 1 Sample 2 Sample 3 Sample 4
9 6 5 8
2 6 3 1
1 8 6 7
  8 4 1
  3 7 3
  8 2 3
    6 4
    9 7
    7 1
    1 8
    1 9
    7 9
      3
      1
      6
      8
      3
      4
       
       
Mean: 4.00 6.50 4.83 4.78
Std dev, s: 4.36 1.97 2.62 2.96
Sample size,
n: 3 6 12 18
sqrt(n): 1.73 2.45 3.46 4.24
Standard error,
s/sqrt(n): 2.52 0.81 0.76 0.70
Nilai X X -X (X–X)2
100 45 2025
90 35 1225
Simpang baku: 80 25 625
70 15 225
n 60 5 25

s= (Xi – X)2
Σ n-1 50 -5 25

i=1 40 -15 225


30 -25 625
20 -35 1225
10 -45 2025
Rerata=55 Jumlah = 8250

8250
s =√ = 30,28
9
Diagram batang
SD
Error bar

SE
Des criptives

Statistic Std. Error


Umur (tahun) Mean 49,91 1,348
95% Confidence Low er Bound 47,21
Interval for Mean Upper Bound
52,60

5% Trimmed Mean 50,21


Median 51,00
Variance 118,116
Std. Deviation 10,868
Minimum 13
Max imum 71
Range 58
Interquartile Range 13
Skew ness -,533 ,297
Kurtosis 1,003 ,586
Contoh Tabel . Karakteristik subyek penelitian

Variabel Kelompok
P
Perlakuan Kontrol (-) Kontrol (+)
Umur; rerata (SB) 44,9 (11,04) 46,3 (9,37) 40,6 (9,95) 0,1§
Jenis kelamin; n(%)
- Pria 9 (15,3%) 14 (23,7%) 12 (20,3%)
- Wanita 10 (16,9%) 7 (11,9%) 7 (11,9%) 0,4*
Pekerjaan; n(%)
- PNS/TNI/Polri 14 (23,7%) 21 (35,6%) 16 (27,1%)
- Pegawai swasta 1 (1,7%) 0 (0,0%) 2 (3,4%)
- Wiraswasta 0 (0,0%) 0 (0,0%) 1 (1,7%)
- Tidak bekerja 4 (6,8%) 0 (0,0%) 0 (0,0%) 0,04*
§
Uji Kruskall Wallis
*Uji χ2
Diagram batang Diagram box-plot

Diagram sebar Diagram pie


Scatter-plot
Diagram garis Histogram

Pictograph Map graph


3.5
Outlier: nilai diantara 1,5 s/d
3.4 3 X lebar kotak (90-95%)
Nilai ekstrem: nilai
Serum MDA level ( ng/mL)

3.3  diantara 3 X lebar


kotak (95%)
3.2

3.1 90 % Whisker
75 % kuartil
3.0
Median
2.9
25 % kuartil
10 % Whisker Whisker= rentang/range
2.8  Outlier: nilai diantara 1,5 s/d = 1,5 rentang
3 X lebar kotak (5-10%) inter kuartil
2.7
Without sepsis Sepsis
Group
3.5
p=0.8
3.4
Serum MDA level ( ng/mL)

3.3


3.2

3.1
Without
Group sepsis Sepsis
3.0
Mean 2.96
2.97 2.97
2.9 SD 0.117 0.138
Median 2.96 2.93
2.8  Minimum 2.80 2.79
Maximum 3.22 3.39
2.7
Without sepsis Sepsis
Group
Figure 1. MDA level of women with sepsis and without
sepsis
Langkah-langkah pokok dalam
pengujian hipotesis

• membuat asumsi  kondisi apa yang


dapat “diterima “ oleh peneliti
• menentukan statistik uji
• Memilih suatu tingkat kemaknaan
• Menghitung harga statistik uji
• Membuat keputusan uji (diterima / ditolak)

budi murtiyasa ums


solo
Hipothesis: Jawaban sementara dari
permasalahan penelitian

• Ho: Hipothesis nol


Hipotesis yang menyatakan tidak ada
perbedaan atau hubungan antar beberapa
variabel
Uji statistik Diterima atau ditolak
• Ha: Hipothesis alternatif
Hipotesis yang menyatakan ada perbedaan
atau hubungan antar beberapa variabel
Kondisi sebenarnya

Alternative
Null BENAR
BENAR

Meneri Kesimpulan Type II


ma H0 Benar error
Kesimpulan
Menolak Type I Kesimpulan
H0 error Benar
1. Alfa: derajat kemaknaan yang
ditetapkan untuk menolak
hipothesis nol
• Probabilitas menolak Ho•
• Nilai  (p) maksimal yang
diperbolehkan 5 % (p< 0.05)
2. Beta: probabilitas terjadinya
kesalahan type II
2. Beta: probabilitas terjadinya
kesalahan type II
• menentukan power penelitian
 kemampuan memisahkan
kesalahan type II
• maksimal 20 % (0.2)

Dari tabel:
=0.05  z=1.96
=0.2 z=0.84
Hipotesis mayor
• Hipotesis secara umum
• Dapat dipecah mejadi beberapa
hipotesis minor

Hipotesis minor
• Hipotesis secara spesifik  Bivariat
• Hipotesis kerja
Rambu-rambu Pemilihan Teknik
Analisis Statistika
• Tipe penelitian (deskriptif, inferensial)
• Jenis variabel (terikat, bebas)
• Tingkat pengukuran variabel (nominal,
ordinal, interval)
• Banyaknya variabel (satu, lebih dari satu )
• Maksud statistik (kecenderungan memusat,
variabilitas, hubungan (korelasi, asosiasi),
pembandingan (komparasi), interaksi,
kecocokan, dan sebagainya).

budi murtiyasa ums


solo
Uji statistik 1 arah atau 2 arah
(One tail atau Two tails)

• 1 arah bila peneliti sudah yakin bahwa


terapi akan memberikan hasil yang
lebih baik, tidak ada kemungkinan
lebih buruk
• 2 arah digunakan bila masih belum
pasti  lebih umum dipakai
Uji statistik parametrik dan
non-parametrik

• Uji parametrik  uji statistik yang


berdasarkan asumsi, misal: normalitas
distribusi pada uji-t dan homogenitas
varians
• Uji non-parametrik tidak memerlukan
asumsi  lebih mudah untuk signifikan
Contoh: Asumsi uji-t

1. Distribusi harus normal  bila


tidak normal ditransformasi  log
transformasi
2. Varians harus homogen 
Levene’s Test for equality of
varians (pada SPSS secara
otomatis akan dilakukan)
• Parametrik: Distribusi Data Jelas (Normal,
Keluarga Eksponensial lain: Poisson,
Binomial, Eksponensial, dll)
• Non Parametrik: Distribusi Data tidak Jelas
(umumnya berdasar ranking, atau sampel
kecil)
• Resampling termasuk Non parametrik tetapi
berbasis komputer
KURVE BELL
Normalitas distribusi data
Parameter Kriteria normal
Koefisien varians < 30%

Skewness - 2 s/d 2
Kurtosis
Histogram Kurve Bell, simetris

Normal & detrendend QQ Menyebar sekitar garis


plot (garis 0)
Box plot Simteris, median
ditengah, tidak ada out
lier dan nilai ekstrem
Rerata : Simpang baku Rerata > 2 X SB
Normalitas distribusi data

Parameter Kriteria normal


Uji Kolmogorov-Smirnov p > 0,05
(dengan koreksi
Lilliefours)
Uji Saphiro Wilk p > 0,05
Tes ts of Normality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Umur (tahun) ,083 65 ,200* ,975 65 ,210
*. This is a low er bound of the true signif icanc e.
a. Lilliefors Significance Correction
Tes ts of Norm ality
a
Kolmogorov-Smirnov Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
IL-6 ,264 65 ,000 ,630 65 ,000
a. Lilliefors Significance Correction
Pemilahan statistik
Statistik

Statistik Statistik
deskriptif inferensial

Uji Statistik

Statistik Statistik non-


parametrik parametrik
Penutup

• Statistik hanyalah alat yang membantu peneliti


untuk memudahkan memahami dan memberikan
makna dari data penelitian yang diperoleh
• Tugas peneliti untuk memberikan interpretasi
terhadap data yang diperoleh dan membahasnya
lebih lanjut secara lebih mendalam dan
komprehensif berdasarkan teori-teori yang
mendukung serta fakta yang terjadi di lapangan.
• Pada ruang ‘interpretasi hasil analisis data’ inilah
karya utama seorang peneliti diperoleh

budi murtiyasa ums


solo
Terima Kasih

Anda mungkin juga menyukai