Hadyana Sukandar
1. KONSEP DASAR :
- Pengertian statistik
- kegunaan statistik
- data
- sumber data
- jenis data
- skala pengukuran
- ukuran statistik (ukuran sentral tendensi dan dispersi) dan ukuran statistik
kesehatan(rate, ratio dan proporsi).
- Statistika deskriptif
- Statistika inferensial/analitik
------------------------------------------------------
Statistik (statistic) : kumpulan fakta/data
: ukuran (ukuran statistik)
Statistik kesehatan :
- Morbiditas
- Mortalitas
- Fertilitas
- Pelayanan kesehatan
- Statistik kedokteran
- Statistik keperawatan
Penyalahgunaan statistik ?
Data (data statistik) : keterangan atau fakta mengenai sesuatu persoalan, bisa berbentuk kategori atau
bilangan.
Syarat kuesioner :
a. singkat, jelas, mudah dipahami responden
b. responden dapat menjawab dengan benar
c. tidak menyimpang dari tujuan penelitian
d. tidak menyinggung perasaan responden
e. tiap pertanyaan hanya mempunyai satu makna
f. tiap pertanyaan harus ada jawabnya
g. pertanyaan bersifat netral
h. jumlah pertanyaan tidak boleh terlalu banyak
i. pertanyaan tidak bersifat hipotesis
Isi kuesioner :
a. pertanyaan tentang fakta/karakteristik
b. pertanyaan tentang pendapat/sikap
c. pertanyaan tentang informasi (menyangkut apa yang diketahui oleh responden)
d. pertanyaan tentang persepsi diri
Skala pengukuran :
- Variabel kualitatif ----> Nominal
Ordinal
- Variabel kuantitatif ---> Interval
Rasio
Variabel : karakteristik daripada orang, objek, atau gejala yang dapat mengambil nilai yang berbeda.
Ukuran statistik :
a. Ukuran sentral tendensi :
- rata-rata
- median
- modus
- rata-rata yang ditimbang
- rata-rata logaritma
b. Ukuran variabilitas/dispersi :
- range
- standard deviasi
- varians
- koefisien variasi
Ukuran Frekuensi :
1. Rasio
2. Proporsi
3. Rate
Berdasarkan riwayat alamiah penyakit, kejadian penyakit dapat dibedakan menjadi 2 jenis :
(1) Insidensi (2) Prevalensi
Insidensi :
(1) Insidensi kumulatif (CI)
(2) Insidensi rate (laju insidensi) atau
Insidensi density (ID)
Rumus :
Contoh :
- Attack rate (risk) keracunan setelah makan tempe bongkrek
- Angka kematian kasus (case fatality rate) untuk tuberkulosis
- Probabilitas kelangsungan hidup dlm setahun setelah didiagnosis kanker paru
- Risiko dlm 5 tahun untuk terkena penyakit jantung koroner pada pria Indonesia
umur 50 th.
Cara menghitung CI :
- Metode kumulatif sederhana
- Metode aktuarial (life table)
Laju insidensi :
Contoh :
Kecepatan insidensi HIV pada anggota klub “sextacy” di Jakarta. Pengamatan antara 1 Jan 1995 –
akhir tahun 1996.
A. 20 orang mulai menjadi anggota 1 Jan 95 dan berhenti pada 1 Jan 97 tanpa pernah menderita
positip HIV
B. 10 orang mulai menjadi anggota 1Jan 95 dan menjadi positip HIV pada 31 Jan 96
C. 5 orang mulai menjadi anggota 31 Juli 95 dan berhenti pada 1 Juli 96 karena positip HIV
D. 5 orang mulai menjadi anggota 1 Jan 95 dan berhenti pada 1 Juli 96 karena meninggal.
Pembilang : kasus = 15
Penyebut : Kel A = 20 x 24
Kel B = 10 x 13
Kel C = 5 x 11
Kel D = 5 x 18
ID = 15 kasus/ 755 orang bulan
= 0,020 per orang bulan pengamatan
= 2 positip HIV per 100 orang bulan
Artinya : kecepatan insidensi adalah 2 orang positip HIV dari 100 orang yang terpapar selama sebulan.
Prevalensi adalah kejadian penyakit pada satu saat atau satu periode waktu, baik yang baru saja
memasuki fase klinik maupun yang telah beberapa waktu lamanya berkembang sepanjang fase klinik
(kasus baru+kasus lama).
Dalam riset prognosis, untuk mempelajari faktor-faktor yang mempengaruhi akibat lanjut penyakit,
jenis data yang digunakan adalah prevalensi.
Prevalensi :
Prevalensi titik
Prevalensi periode
Prevalensi = kasus penyakit
titik Populasi total
3. SAMPLING
Populasi : Sampel :
N
n
X
p
. s
.
..
Parameter Statistik
(,, dsb) (X,p,s dsb)
Alasan sampling :
1. ukuran populasi: terhingga, tak terhingga
2. masalah biaya
3. d
masalah waktu
4. percobaan yg sifatnya merusak
5. masalah ketelitian
6. faktor ekonomis
SAMPLING FRACTION : Proporsi dari unit sampling yang akan dipilih dari spesifik sampling
frame.
SAMPLING FRAME (kerangka sampling) : Daftar dari unit sampling yang akan dipilih.
UNIT SAMPLING : Unit terkecil yang akan dipilih secara sampling, misal orang, kepala keluarga,
desa, dsb.
2 macam kekeliruan :
- kekeliruan sampling
- kekeliruan tak sampling
Kekeliruan sampling terjadi karena pemeriksaan tak lengkap tentang populasi (penelitian dilakukan
berdasarkan sampel)
Kekeliruan tak sampling penyebabnya :
- populasi tidak didefinisikan sebagaimana mestinya
- populasi yang menyimpang dari populasi yang seharusnya dipelajari
- kuesioner tidak dirumuskan sebagai mana mestinya
- istilah-istilah tidak didefinisikan secara tidak tepat
- responden tdk memberikan jawaban yang akurat
JENIS SAMPLING :
1. Probabilitas sampling
2. Non probabilitas sampling
Probabilitas sampling :
1. simple random sampling
2. stratified sampling
3. systematic sampling
4. cluster sampling
5. multistage sampling
- setiap unit sampling dalam kerangka sampling mempunyai kemungkinan yang sama untuk
dipilih.
- pemilihan random dari kerangka sampling dapat dipilih dengan menggunakan bilangan random
atau komputer.
- populasinya bersifat homogen.
- populasi dibagi kedalam group atau strata menurut karakteristik yang diperhatikan, misal jenis
kelamin, usia, lokasi geografi (populasi heterogen dibagi kedalam beberapa sub populasi yang
homogen).
- dari setiap strata, dilakukan simple random sample : bisa secara proporsional, seragam atau alokasi
optimum.
Contoh :
Strata Nh nh Xh Sh
1 400 96 - -
2 140 33 - -
3 80 19 - -
4 100 24 - -
5 100 24 - -
JUMLAH 820 196
Systematic sampling :
- pemilihan dilakukan secara sistematis dengan memilih unit pertama secara random dari k unit. 1/k
disebut sampling fraction.
- contoh N=100, n = 10; maka
n/N = 10/100 = 1/10 (artinya 1
dari setiap 10).
Cluster sampling :
- cluster (kelompok)hendaknya tersusun dari elemen-elemen yang heterogen sehingga setiap cluster
dipandang dapat mewakili ciri atau sifat populasi.
- banyaknya elemen (M) dalam cluster disebut ukuran cluster, dan banyaknya cluster (N) dalam
populasi disebut ukuran populasi cluster.
- sampel cluster dipilih secara random.
- semua unit yang ada pada cluster terpilih menjadi subjek penelitian.
Multistage sampling :
Dari 8500 penduduk akan dipilih secara random sebanyak 100, bagaimana caranya ?
Bilangan random :
Kolom
12345678901234……
36458831287359
90514066184695
98419022483780
55257127146864
02991075772188
79855566638408
dst
catatan : jika setiap bilangan random ingin dipergunakan caranya adalah dengan mengurangi dengan
kelipatannya.
Misal 9845 ingin dipakai maka bilangan random terpilih no = 9845 – 8500 = 1345.
Latihan kelas :
DASAR PERTIMBANGAN :
a. Rancangan sampling
b. Parameter yang akan ditaksir ( atau ).
Untuk rancangan sampling ’simple random sampling’ pertimbangan lainnya diperlukan presisi
(kekeliruan maksimum yang masih dapat ditolerir), tingkat reliabilitas yang dikehendaki dan
besarnya variabilitas.
N Z2 p(1-p)
n=
(N-1)d2 + Z2 p(1-p)
(N diketahui)
Untuk rancangan sampling ’stratified random sampling’
N Nh sh2
n=
N2d2/Z2 + Nh sh2
(alokasi proporsional)
nh = Nh/N x n
L Nh2 sh2
n=
N2d2/Z2 + Nh sh2
(alokasi equal)
N Nh ph (1-ph)
n=
N2d2/Z2 + Nh ph (1-ph)
(alokasi proporsional)
nh = Nh/N x n
L Nh2 ph (1-ph)
n=
N2d2/Z2 + Nh ph (1-ph)
(alokasi equal)
2 (Z1- + Z1-)2
n = ---------------------
(X - )2
c. Menguji 2 proporsi
2 2 (Z1- + Z1-)2
n = ---------------------
(1 - 2)2
(paired observation)
(paired observation)
f. Besar Sampel Untuk Studi Kohor
p1 = a/(a+c)
p2 = b/(b+d) p1 = p2 x RR
KASUS KONTROL
----------------------------------------------
Exposed a (p1n) c (p2n)
-> p1 = OR x p2 / (1 + p2(OR-1) )
n = c+1/ 2c x n
Contoh kasus : kontrol = 1 : 2
Maka c = 2
n = jumlah subject untuk kasus
2 x n = jumlah subject untuk kontrol.
n = 1/(1-f) x n
r = koefisien korelasi
POPULASI :
- POPULASI TARGET
- POPULASI TERJANGKAU
SAMPEL :
- SAMPEL YANG DIRENCANAKAN
- SAMPEL YANG BENAR-BENAR
DITELITI
LOST TO FOLLOW UP :
- PENELITIAN KLINIS : 5 – 10 %
- PENELITIAN LAPANGAN : 15 %
- PENELITIAN LABORATORIUM : 5 %
TABEL KONTINGENSI
Untuk data yang terdiri atas dua klasifikasi atau variabel, di mana klasifikasi satu ada b dan lainnya
ada k bagian, dapat dibuat tabel kontingensi berukuran bxk, di mana b menyatakan banyak baris dan k
menyatakan banyak kolom.
Tabel kontingensi ini merupakan hasil tabula-
si silang dari 2 variabel atau lebih (analitik).
Tabulasi silang :
Deskriptif
Analitik
Menentukan perbedaan
Mencari hubungan
Tempat tinggal
Tenaga ------------------------------------------- Jumlah
Kesehatan Rural Urban
----------------------------------------------------------------------------
Dokter L 8 (10%) 35 (21%) 43
P 2 (3%) 16 (10%) 18
----------------------------------------------------------------------------
Tingkat peng. Nutrisi
Kelompok ibu --------------------------------------- Jumlah
R S T
----------------------------------------------------------------------------
Aktif PKK 70 70 110 250
(… %) (… %) (… %)
---------------------------------------------------------------------------
Lama menyusui bayi (bl)
Umur ibu ----------------------------------------- Jumlah
(tahun) 0-5 6-11 12
---------------------------------------------------------------------------
15-19 10 30 60 100
(… %) (… %) (… %)
20-24 20 50 80 150
25-29 30 50 70 150
30-34 45 70 60 175
40 + 40 80 5 125
----------------------------------------------------------------------------
Jumlah 245 340 315 900
----------------------------------------------------------------------------
a. Tabel 2x2
--------------------------------------------------
+ - Jumlah
---------------------------------------------------
Sampel 1 a b a+b
Sampel 2 c d c+d
---------------------------------------------------
Jumlah a+c b+d n
---------------------------------------------------
Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (2-1) (2-1) = 1 (program komputer
akan keluar
Hasil 2 berikut nilai p).
Contoh : Percobaan klinik penggunaan aspirin untuk sakit kepala
--------------------------------------------------
- + Jumlah
---------------------------------------------------
Aspirin 70 30 100 + = Sakit
kepala
Placebo 55 55 110
--------------------------------------------------- - = Tdk sakit
Jumlah 125 85 210 kepala
---------------------------------------------------
b. Tabel Kx2 :
--------------------------------------------------
+ - jumlah
--------------------------------------------------
sampel 1 n1
2 n2
3 n3
4 n4
. .
. .
. .
k nk
------------------------------------------------
Jumlah x n-x n
------------------------------------------------
n2
2 = ----------- xi 2 / ni - x2 / n
x (n-x)
Baris 1 n.1
2 n.2
3 n.3
4 n.4
. .
. .
. .
B n.B
--------------------------------------------------------------------
Total n1. n2. n3. n4. nK. N
--------------------------------------------------------------------
Not
Satisfied 30 (g) 50 (h) 80
---------------------------------------------------------------------
Total 180 70 250
---------------------------------------------------------------------
Untuk menguji hipotesis (H0) proporsi satisfied antara Obat A dan obat B sama, digunakan
rumus :
Pengertian :
Analisis regresi adalah suatu analisis statistika yang memanfaatkan hubungan antara dua variabel atau
lebih. Variabel yang terlibat dalam hubungan ini adalah variabel Y (biasa dinamakan variabel dependen
atau respons) dan variabel X (bisa X1, X2, X3 , … , Xn), yang biasa dinamakan variabel independen atau
prediktor. Model hubungan fungsional berbentuk :
Y = f (X). Misalnya, Y = 7 + 2 X; atau Y = 12 + 7 X – 0,5 X2
Analisis korelasi adalah menunjukkan kuatnya hubungan antara kedua variabel atau lebih, dan ini
ditunjukkan oleh besarnya koefisien determinasi (r2), r sendiri adalah koefisien korelasi.
Untuk memperoleh model regresi yang masih dapat ditangani, maka banyaknya variabel independen
harus terbatas. Ini harus dipilih sedemikian rupa sehingga benar-benar merupakan himpunan variabel
independen yang terbaik untuk tujuan analisis.
Pemilihan bentuk fungsional persamaan regresi berhubungan dengan pemilihan variabel independen.
Kadang-kadang teori disiplin yang bersangkutan dapat menunjukkan bentuk fungsional yang cocok
dari persamaan regresi. Tetapi dalam banyak hal bentuk fungsional persamaan regresi tidak diketahui
sebelumnya dan harus ditentukan setelah data terkumpul dan dianalisis.
Strategi memilih model yang cocok :
1. Mulai dengan mengasumsikan bahwa model yang cocok adalah regresi linier
2. Tentukan taksiran model regresi terbaiknya
3. Tentukan apakah model regresi (pada langkah 2) secara signifikan membantu menjelaskan
variabel dependen Y
4. Jika ya (langkah 3), maka model regresi linier adalah model yang cocok untuk digunakan sebagai
peramal Y
5. Jika tidak (langkah 3), cari model lain sampai model yang cocok diperoleh.
Catatan : Sebaiknya untuk memilih model yang cocok untuk hubungan dua buah variabel, terlebih dahulu
gambarkan scatter diagramnya, dan buat perkiraan model yang bisa dipakai.
Model-model regresi :
1. Regresi linier :Y=A+BX
2. Regresi multipel : Y = A + B X1 + C X2 + D X3
3. regresi parabola (kuadratik) : Y = A + B X + C X2
4. Regresi geometrik : Y = A XB
5. Regresi eksponensial : Y = A BX
6. Dlsb.
Analisis regresi :
Outcome (variabel dependen) : kontinu
Variabel independen : kontinu dan kategori
Analisis diskriminan :
Outcome (variabel dependen) : 2 kategori
Variabel independen : kontinu (normal)
8. Pasen yang datang ke RSHS dengan myocardial infark. Diukur tekanan darah sistolik, tekanan
darah diastolik, heart rate, stroke index, dan tekanan darah arteri. Apakah mungkin untuk
meramalkan bahwa pasen akan hidup ?
9. Data yang dikumpulkan di bagian kebidanan :
Variabel independen : umur sekarang; merokok (Y,T); Hb masuk; paritas; pendidikan (tahun);
lama persalinan (jam)
Variabel dependen : berat badan lahir; keadaan bayi lahir (mati, hidup); komplikasi persalinan
(ada/tidak ada)
Variabel confounding : Status sosial ekonomi; pemakain KB sebelum kehamilan sekarang.
Analisis apa saja yang bisa dibuat ?
Regresi linier sederhana :
Hanya terlibat satu variabel independen (X) dan satu variabel dependen (Y).
Bentuk persamaan regresi :
Y=+X+ (populasi)
Ditaksir oleh :
Y=a+bX (sampel)
Y = Y taksiran (taksiran rata-rata Y untuk X diketahui)
a = intercept, konstanta
= titik potong garis regresi terhadap sumbu Y
b = koefisien regresi
Rumus :
n XY - X Y
b= --------------------------
n X2 – (X)2
a=Y–bX
n XY - X Y
r = --------------------------------------------------
n X2 – (X)2 n Y2 – (Y)2
-1 r 1
\\
Analisis varians (ANAVA)
H0 : 12 = 22
H1 : 12 22
Varians terbesar
F maks = --------------------
Varians terkecil
distribusi F dengan derajat bebas (degree of freedom) yaitu (n1 –1; n2 –1)
Dari tabel F untuk taraf signifikansi 5 % dengan derajat bebas (14;13) diperoleh F = 2,55 dan untuk
taraf signifikansi 1 % didapat F = 3,85.
Kesimpulan : karena F hitung (7,5) > F tabel = 1 % maka H0 ditolak (kedua varians tidak sama).
Untuk membandingkan varians lebih dari 2 kelompok digunakan uji Bartlett atau uji Levene(program
SPSS windows).
Contoh :
Treatment
-------------------------------------------------
A B C tr nr
-------------------------------------------------
7 12 13 32 3
5 11 14 30 3
8 13 15 36 3
6 12 14 32 3
7 12 14 33 3
--------------------------------------------------
t1 = 33 t2 = 60 t3 = 70 T = 163
n1 = 5 n2 = 5 n3 = 5 N = 15
Tabel ANAVA :
--------------------------------------------------------------------------------
Sumber variasi SS df MS=SS/df F
--------------------------------------------------------------------------------
Antar kolom t C2 /nC – T2 /N k-1 MSG MSG/MSE
(between groups) = SSG
Antar subyek t R2 /nR – T2 /N N-k MSR
(between subyek) = SSR
Residu SST-SSC-SSR (c-1) (r-1) MSE
= SSE
--------------------------------------------------------------------------------
Total X2 – T2/N =SST N – 1
---------------------------------------------------------------------------------
Factorial design (ANOVA two way)
ada 2 variabel (treatment + 1 variabel lain)
interaksi ada/tidak ada
Contoh :
---------------------------------------------------------------
Variabel II Treatment (var I)
(kel umur) A B C
---------------------------------------------------------------
Muda 7 12 13
5 11 14
8 13 15
Tua 6 12 14
7 12 14
8 13 16
---------------------------------------------------------------
Tabel ANAVA :
--------------------------------------------------------------------------------
Sumber variasi SS df MS=SS/df F
------------------------------------------------------------------------------------------
Antar kolom tC 2 /nC – T2 /N c-1 MSC MSC/MSW
(between groups) = SSC
Antar subyek tR 2 /nR – T2 /N r-1 MSR MSR/MSW
(between subyek) = SSR
Interaksi tcells 2 /ncells – (c-1)(r-1) MSJ MSJ/MSW
(kolomxbaris) T /N-SSC –SSR
2
= SSJ
Within cells SST-SSC-SSR-SSj N - cr MSW
= SSW
------------------------------------------------------------------------------------------
Total X2 – T2/N =SST N–1
------------------------------------------------------------------------------------------
Source : - variabel 1
- variabel 2
- variabel 3
- interaksi var 1 x var 2
- Interaksi var 1 x var 3
- Interaksi var 2 x var 3
- Interaksi var 1 x var 2 x var 3
- Within cells
-------------------------------------------------------
Jika hasil analisis varians (uji F) bermakna, untuk melihat perlakuan mana yang berbeda (rata-ratanya)
digunakan analisis “multiple comparisons” .