Anda di halaman 1dari 25

BIOSTATISTIKA

Hadyana Sukandar

1. KONSEP DASAR :

- Pengertian statistik
- kegunaan statistik
- data
- sumber data
- jenis data
- skala pengukuran
- ukuran statistik (ukuran sentral tendensi dan dispersi) dan ukuran statistik
kesehatan(rate, ratio dan proporsi).

Definisi Statistika (statistics) :


Sekumpulan konsep dan metode yang digunakan untuk mengumpulkan dan menginterpretasikan data
tentang bidang kegiatan tertentu dan mengambil kesimpulan dalam situasi dimana ada ketidakpastian
dan variasi.

- Statistika deskriptif
- Statistika inferensial/analitik

Dari definisi di atas, statistika mencakup:


- pengumpulan data
- pengolahan data
- penyajian data
- analisis data
- penarikan kesimpulan

------------------------------------------------------
Statistik (statistic) : kumpulan fakta/data
: ukuran (ukuran statistik)

Statistik kesehatan :

- Morbiditas
- Mortalitas
- Fertilitas
- Pelayanan kesehatan
- Statistik kedokteran
- Statistik keperawatan

Kegunaan statistik kesehatan :


- menentukan besarnya masalah
- menentukan prioritas masalah
- merencanakan suatu program
- menentukan potensi masyarakat beserta sumberdaya lainnya
- melakukan evaluasi terhadap suatu program
- melakukan analisis perbandingan

Penyalahgunaan statistik ?
Data (data statistik) : keterangan atau fakta mengenai sesuatu persoalan, bisa berbentuk kategori atau
bilangan.

Data dapat diklasifikasikan berdasarkan :


- jenis data
- sumber data
- skala pengukuran

Jenis data : kualitatif, kuantitatif

Sumber data : Intern


Ekstern (primer, sekunder, tersier)

Cara memperoleh data primer :


1. Melakukan observasi (pengamatan)
2. Wawancara (interview)
3. Kuesioner
4. Pengukuran
5. Diskusi mendalam (FGD)
6. Sumber lainnya : lab, pemeriksaan rontgen, dsb.

Syarat kuesioner :
a. singkat, jelas, mudah dipahami responden
b. responden dapat menjawab dengan benar
c. tidak menyimpang dari tujuan penelitian
d. tidak menyinggung perasaan responden
e. tiap pertanyaan hanya mempunyai satu makna
f. tiap pertanyaan harus ada jawabnya
g. pertanyaan bersifat netral
h. jumlah pertanyaan tidak boleh terlalu banyak
i. pertanyaan tidak bersifat hipotesis

Jenis kuesioner : terbuka, tertutup, campuran

Isi kuesioner :
a. pertanyaan tentang fakta/karakteristik
b. pertanyaan tentang pendapat/sikap
c. pertanyaan tentang informasi (menyangkut apa yang diketahui oleh responden)
d. pertanyaan tentang persepsi diri

Sumber data sekunder :


1. Sensus penduduk
2. Survey kesehatan rumah tangga
3. Survey sosial ekonomi nasional
4. SUPAS
5. Survey angkatan kerja nasional
6. Profil kelurahan, kecamatan
7. Sumber data lainnya.

Skala pengukuran :
- Variabel kualitatif ----> Nominal
Ordinal
- Variabel kuantitatif ---> Interval
Rasio

Kontinu (hasil mengukur)


Diskrit (hasil menghitung)

Statistik yang cocok :


Nominal : modus, persentase
Ordinal : modus, median
Interval/rasio : semua ukuran statistik bisa dihitung

Variabel : karakteristik daripada orang, objek, atau gejala yang dapat mengambil nilai yang berbeda.

Klasifikasikan data/variabel di bawah ini :


1. Penilaian ujian : A, B, C, D, E
: Nilai skor 70, 76, dst
2. Pendapatan keluarga/bulan
3. Tingkat pendidikan
4. Status gizi
5. Jenis pekerjaan
6. IQ
7. Produksi padi/Ha
8. APGAR skor
9. PH

Ukuran statistik kesehatan :

1. Rate (angka) misal rate kematian


2. Rasio : perbandingan dua angka (X/Y)
3. Proporsi : X/(X+Y)

Ukuran statistik :
a. Ukuran sentral tendensi :
- rata-rata
- median
- modus
- rata-rata yang ditimbang
- rata-rata logaritma

b. Ukuran variabilitas/dispersi :
- range
- standard deviasi
- varians
- koefisien variasi
Ukuran Frekuensi :

1. Rasio
2. Proporsi
3. Rate
Berdasarkan riwayat alamiah penyakit, kejadian penyakit dapat dibedakan menjadi 2 jenis :
(1) Insidensi (2) Prevalensi

Insidensi sering dikatakan kasus baru.


Dalam riset etiologi, untuk mengetahui faktor-faktor penyebab penyakit sehingga manifes secara
klinik, jenis data yang digunakan adalah insidensi.

Insidensi :
(1) Insidensi kumulatif (CI)
(2) Insidensi rate (laju insidensi) atau
Insidensi density (ID)
Rumus :

 orang yg terkena penyakit dlm suatu jangka waktu


CI = --------------------------------------------------------------------------------
 semua orang dlm risiko untuk terkena penyakit dlm jangka waktu itu

Contoh :
- Attack rate (risk) keracunan setelah makan tempe bongkrek
- Angka kematian kasus (case fatality rate) untuk tuberkulosis
- Probabilitas kelangsungan hidup dlm setahun setelah didiagnosis kanker paru
- Risiko dlm 5 tahun untuk terkena penyakit jantung koroner pada pria Indonesia
umur 50 th.

Cara menghitung CI :
- Metode kumulatif sederhana
- Metode aktuarial (life table)

Laju insidensi :

 kasus baru penyakit


--------------------------------------------------------------------------------
ID =
 orang dalam risiko x lamanya masing-masing dlm risiko

Contoh :

Kecepatan insidensi HIV pada anggota klub “sextacy” di Jakarta. Pengamatan antara 1 Jan 1995 –
akhir tahun 1996.
A. 20 orang mulai menjadi anggota 1 Jan 95 dan berhenti pada 1 Jan 97 tanpa pernah menderita
positip HIV
B. 10 orang mulai menjadi anggota 1Jan 95 dan menjadi positip HIV pada 31 Jan 96
C. 5 orang mulai menjadi anggota 31 Juli 95 dan berhenti pada 1 Juli 96 karena positip HIV
D. 5 orang mulai menjadi anggota 1 Jan 95 dan berhenti pada 1 Juli 96 karena meninggal.

Pembilang :  kasus = 15
Penyebut : Kel A = 20 x 24
Kel B = 10 x 13
Kel C = 5 x 11
Kel D = 5 x 18
ID = 15 kasus/ 755 orang bulan
= 0,020 per orang bulan pengamatan
= 2 positip HIV per 100 orang bulan

Artinya : kecepatan insidensi adalah 2 orang positip HIV dari 100 orang yang terpapar selama sebulan.

Prevalensi adalah kejadian penyakit pada satu saat atau satu periode waktu, baik yang baru saja
memasuki fase klinik maupun yang telah beberapa waktu lamanya berkembang sepanjang fase klinik
(kasus baru+kasus lama).
Dalam riset prognosis, untuk mempelajari faktor-faktor yang mempengaruhi akibat lanjut penyakit,
jenis data yang digunakan adalah prevalensi.

Prevalensi :
 Prevalensi titik
 Prevalensi periode
Prevalensi =  kasus penyakit
titik  Populasi total

Prevalensi =  kasus saat ini +  kasus baru


periode Rata-rata populasi

Rata-rata populasi bisa diganti oleh populasi pada t0 .

3. SAMPLING

ISTILAH-ISTILAH YANG DIGUNAKAN :


---------------------------------------------------------
- POPULASI
- SAMPEL
- SAMPLING
- SAMPLING FRACTION
- SAMPLING FRAME
- SAMPLING UNIT
- JENIS SAMPLING
- BESAR SAMPEL
---------------------------------------------------------
POPULASI : Totalitas semua nilai yang mungkin, hasil menghitung ataupun pengukuran, kuantitatif
maupun kualitatif daripada karakteristik tertentu mengenai sekumpulan objek yang lengkap dan jelas.

KARAKTERISTIK : Ciri atau sifat yang akan diteliti, diperiksa, diukur.

SAMPEL : Sebagian yang diambil dari populasi.


Cara pengumpulan data dimana setiap anggota populasi dikenai penelitian disebut sensus. Sedangkan
berdasarkan sampel yang diambil dari populasi disebut sampling.

Populasi : Sampel :

N
 n
 X
 p
. s
.
..
Parameter Statistik
(,, dsb) (X,p,s dsb)

Alasan sampling :
1. ukuran populasi: terhingga, tak terhingga
2. masalah biaya
3. d
masalah waktu
4. percobaan yg sifatnya merusak
5. masalah ketelitian
6. faktor ekonomis

SAMPLING FRACTION : Proporsi dari unit sampling yang akan dipilih dari spesifik sampling
frame.

SAMPLING FRAME (kerangka sampling) : Daftar dari unit sampling yang akan dipilih.

UNIT SAMPLING : Unit terkecil yang akan dipilih secara sampling, misal orang, kepala keluarga,
desa, dsb.

2 macam kekeliruan :
- kekeliruan sampling
- kekeliruan tak sampling

Kekeliruan sampling terjadi karena pemeriksaan tak lengkap tentang populasi (penelitian dilakukan
berdasarkan sampel)
Kekeliruan tak sampling penyebabnya :
- populasi tidak didefinisikan sebagaimana mestinya
- populasi yang menyimpang dari populasi yang seharusnya dipelajari
- kuesioner tidak dirumuskan sebagai mana mestinya
- istilah-istilah tidak didefinisikan secara tidak tepat
- responden tdk memberikan jawaban yang akurat

JENIS SAMPLING :

1. Probabilitas sampling
2. Non probabilitas sampling

Non probabilitas sampling :


1. quota sampling
2. purposive sampling
3. convenience sampling
4. dll.

Probabilitas sampling :
1. simple random sampling
2. stratified sampling
3. systematic sampling
4. cluster sampling
5. multistage sampling

Simple random sampling :

- setiap unit sampling dalam kerangka sampling mempunyai kemungkinan yang sama untuk
dipilih.
- pemilihan random dari kerangka sampling dapat dipilih dengan menggunakan bilangan random
atau komputer.
- populasinya bersifat homogen.

Stratified random sampling :

- populasi dibagi kedalam group atau strata menurut karakteristik yang diperhatikan, misal jenis
kelamin, usia, lokasi geografi (populasi heterogen dibagi kedalam beberapa sub populasi yang
homogen).
- dari setiap strata, dilakukan simple random sample : bisa secara proporsional, seragam atau alokasi
optimum.

Contoh :

Strata Nh nh Xh Sh
1 400 96 - -
2 140 33 - -
3 80 19 - -
4 100 24 - -
5 100 24 - -
JUMLAH 820 196

Systematic sampling :

- pemilihan dilakukan secara sistematis dengan memilih unit pertama secara random dari k unit. 1/k
disebut sampling fraction.
- contoh N=100, n = 10; maka
n/N = 10/100 = 1/10 (artinya 1
dari setiap 10).

Cluster sampling :

- cluster (kelompok)hendaknya tersusun dari elemen-elemen yang heterogen sehingga setiap cluster
dipandang dapat mewakili ciri atau sifat populasi.
- banyaknya elemen (M) dalam cluster disebut ukuran cluster, dan banyaknya cluster (N) dalam
populasi disebut ukuran populasi cluster.
- sampel cluster dipilih secara random.
- semua unit yang ada pada cluster terpilih menjadi subjek penelitian.

Multistage sampling :

- pemilihan dilakukan dalam beberapa tahap sampai unit sampling terakhir/terkecil.


- dalam setiap tahap sampling bisa dilakukan secara random atau sistematis.

Penggunaan tabel bilangan random (acak) :

Dari 8500 penduduk akan dipilih secara random sebanyak 100, bagaimana caranya ?

a. buka tabel bilangan random


b. lemparkan ujung pensil ke dalam tabel bilangan random, misal jatuh pada kolom 5, baris 3.
c. Baca 4 digit bisa kekanan, kekiri atau kebawah (4 digit karena N=8500). Contoh pilih ke kanan.
d. Baca sampai diperoleh sebanyak 100 bilangan random.

Bilangan random :

Kolom

12345678901234……
36458831287359
90514066184695
98419022483780
55257127146864
02991075772188
79855566638408
dst
catatan : jika setiap bilangan random ingin dipergunakan caranya adalah dengan mengurangi dengan
kelipatannya.

Misal 9845 ingin dipakai maka bilangan random terpilih no = 9845 – 8500 = 1345.

Latihan kelas :

1. Kapan kita harus melakukan sensus dan sampling ?


2. Tujuan penelitian ingin mengetahui pengetahuan remaja tentang kesehatan reproduksi di
Jawa Barat.
Tetapkan : populasi, sampel, teknik sampling, kerangka sampling, unit sampling dan
karakteristik apa yang akan diukur ?.
3. Prosedur sampling yang cocok untuk situasi :
a. menaksir prevalensi buta warna pada anak sekolah dasar di kota Bandung.
b. Menaksir distribusi pende- rita menurut asal penderita /tempat tinggal dari pasen-pasen
yang datang ke RSHS selama periode 1 tahun.
c. Memilih 25% pasen untuk interview dari yang datang ke klinik dokter dalam satu hari.
d. Menaksir persentase pengetahuan kepala desa di Jawa Barat tentang penyakit AIDS.
e. Mengetahui kemampuan perawat lulusan AKPER dalam menangani pasen stroke.

TAKSIRAN BESAR SAMPEL

1. TAKSIRAN BESAR SAMPEL UNTUK STUDI CROSS-SECTIONAL

DASAR PERTIMBANGAN :
a. Rancangan sampling
b. Parameter yang akan ditaksir ( atau ).

Untuk rancangan sampling ’simple random sampling’ pertimbangan lainnya diperlukan presisi
(kekeliruan maksimum yang masih dapat ditolerir), tingkat reliabilitas yang dikehendaki dan
besarnya variabilitas.

Rumus untuk menaksir rata-rata populasi  :


n = Z2 2 / d2 (N -> )

n = N Z2 2 /((N-1)d2 + Z2 2)


(N diketahui)

Rumus untuk menaksir proporsi populasi  :

n = Z2 p (1-p) /d2 (N -> )

N Z2 p(1-p)
n=
(N-1)d2 + Z2 p(1-p)
(N diketahui)
Untuk rancangan sampling ’stratified random sampling’

a. Rumus untuk menaksir rata-rata populasi  :

N  Nh sh2
n=
N2d2/Z2 +  Nh sh2

(alokasi proporsional)

nh = Nh/N x n

L  Nh2 sh2
n=
N2d2/Z2 +  Nh sh2

(alokasi equal)

nh = n/L (L = banyak strata)

b. Rumus untuk menaksir proporsi populasi  :

N  Nh ph (1-ph)
n=
N2d2/Z2 + Nh ph (1-ph)

(alokasi proporsional)

nh = Nh/N x n

L  Nh2 ph (1-ph)
n=
N2d2/Z2 + Nh ph (1-ph)

(alokasi equal)

nh = n/L (L = banyak strata)

2. TAKSIRAN BESAR SAMPEL UNTUK STUDI ANALITIK

a. Menguji sebuah proporsi

(Z1- p0(1-p0) + Z1- p1(1-p1) )2


n = -----------------------------------------
(p1 – p0)2
b. Menguji sebuah rata-rata

2 (Z1- + Z1-)2
n = ---------------------
(X - )2

c. Menguji 2 proporsi

(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2


n = -----------------------------------------
(p1 – p2)2

dengan q1 = 1-p1 ; q2 = 1-p2

d. Menguji 2 proporsi untuk equivalence trials = negative trials

2p(1-p) (Z1-/2 + Z1-)2


n = --------------------------
d2

d = perbedaan maksimum yang secara klinis tidak bermakna.

e. Menguji perbedaan dua rata-rata


(H0 : 1 = 2)

2 2 (Z1- + Z1-)2
n = ---------------------
(1 - 2)2

(paired observation)

d2 (Z1- + Z1-)2


n = ---------------------
d 2 d= difference

(paired observation)
f. Besar Sampel Untuk Studi Kohor

Disease Non Disease Total


---------------------------------------------------------
Exposed a (p1n) c a+c (n)

Non Exp b (p2n) d b+d (n)


---------------------------------------------------------
a/(a+c)
Relative Risk (RR) = -----------
b/ (b+d)

p1 = a/(a+c)
p2 = b/(b+d)  p1 = p2 x RR

(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2


n = -----------------------------------------
(p1 – p2)2

dengan q1 = 1-p1 ; q2 = 1-p2

g. Besar Sampel Untuk Studi Kasus Kontrol (Case-Control Study)

KASUS KONTROL
----------------------------------------------
Exposed a (p1n) c (p2n)

Non Exp b (1-p1n) d (1-p2n)


----------------------------------------------
Total n n
----------------------------------------------
ODDS RASIO (OR) = ad/bc

p1 = proportion of exposed in cases


p2 = proportion of exposed in control

 OR = p1 (1- p2) / p2 (1-p1)

-> p1 = OR x p2 / (1 + p2(OR-1) )

(Z1- 2P(1-P) + Z1- p1q1+p2q2 )2


n = -----------------------------------------
(p1 – p2)2

(OR dan p2 diketahui)


Besar sampel untuk kontrol berganda :

n = c+1/ 2c x n
Contoh kasus : kontrol = 1 : 2
Maka c = 2
n = jumlah subject untuk kasus
2 x n = jumlah subject untuk kontrol.

Koreksi untuk drop-out


Jika f = proporsi subject drop-out

n = 1/(1-f) x n

h. Besar Sampel Untuk Mengana- Lisis Koefisien Korelasi (r) :

n =  (Z1-/2 + Z1-) : 0.5 ln ((1+r)/(1-r)) 2 + 3

r = koefisien korelasi

POPULASI DAN SAMPEL

POPULASI : DALAM METODOLOGI PENELITIAN ADALAH SEKELOMPOK INDIVIDU


(PASEN, BINATANG PERCOBAAN, REKAM MEDIK, HASIL LAB, DSB) DENGAN
KARAKTERISTIK DITENTUKAN.

SAMPEL : ADALAH SUBSET (BAGIAN) POPULASI YANG DITELITI

POPULASI :
- POPULASI TARGET
- POPULASI TERJANGKAU

SAMPEL :
- SAMPEL YANG DIRENCANAKAN
- SAMPEL YANG BENAR-BENAR
DITELITI

POPULASI TERJANGKAU : POPULASI TARGET YANG DIBATASI OLEH TEMPAT DAN


WAKTU.

SAMPEL YANG DIRENCANAKAN : SUBSET DARI POPULASI TERJANGKAU

LOST TO FOLLOW UP :

- PENELITIAN KLINIS : 5 – 10 %
- PENELITIAN LAPANGAN : 15 %
- PENELITIAN LABORATORIUM :  5 %
TABEL KONTINGENSI

Untuk data yang terdiri atas dua klasifikasi atau variabel, di mana klasifikasi satu ada b dan lainnya
ada k bagian, dapat dibuat tabel kontingensi berukuran bxk, di mana b menyatakan banyak baris dan k
menyatakan banyak kolom.
Tabel kontingensi ini merupakan hasil tabula-
si silang dari 2 variabel atau lebih (analitik).

Tabulasi silang :
 Deskriptif
 Analitik
 Menentukan perbedaan
 Mencari hubungan

1. Tabulasi silang deskriptif


- Tempat tinggal dan jenis kelamin dari tenaga kesehatan

Tempat tinggal
Tenaga ------------------------------------------- Jumlah
Kesehatan Rural Urban
----------------------------------------------------------------------------
Dokter L 8 (10%) 35 (21%) 43
P 2 (3%) 16 (10%) 18

Perawat L 46 (58%) 36 (22%) 82


P 23 (29%) 77 (47%) 100
---------------------------------------------------------------------------
Jumlah 79 (100%) 164 (100%) 243
---------------------------------------------------------------------------

2. Tabulasi silang analitik

- Tingkat pengetahuan nutrisi antara kedua kelompok

----------------------------------------------------------------------------
Tingkat peng. Nutrisi
Kelompok ibu --------------------------------------- Jumlah
R S T
----------------------------------------------------------------------------
Aktif PKK 70 70 110 250
(… %) (… %) (… %)

Tdk aktif PKK 120 80 50 250


(… %) (… %) (… %)
----------------------------------------------------------------------------
Jumlah 190 150 160 500
----------------------------------------------------------------------------
3. Hubungan antara umur ibu dengan lama menyusui

---------------------------------------------------------------------------
Lama menyusui bayi (bl)
Umur ibu ----------------------------------------- Jumlah
(tahun) 0-5 6-11  12
---------------------------------------------------------------------------
15-19 10 30 60 100
(… %) (… %) (… %)

20-24 20 50 80 150

25-29 30 50 70 150

30-34 45 70 60 175

35-39 100 60 40 200

40 + 40 80 5 125

----------------------------------------------------------------------------
Jumlah 245 340 315 900
----------------------------------------------------------------------------

Uji Chi-kuadrat (2) :

a. Tabel 2x2

--------------------------------------------------
+ - Jumlah
---------------------------------------------------
Sampel 1 a b a+b

Sampel 2 c d c+d
---------------------------------------------------
Jumlah a+c b+d n
---------------------------------------------------

n  ad - bc - n/2 2


2 = -----------------------------------
(a+b) (a+c) (b+d) (c+d)

Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (2-1) (2-1) = 1 (program komputer
akan keluar
Hasil 2 berikut nilai p).
Contoh : Percobaan klinik penggunaan aspirin untuk sakit kepala

--------------------------------------------------
- + Jumlah
---------------------------------------------------
Aspirin 70 30 100 + = Sakit
kepala
Placebo 55 55 110
--------------------------------------------------- - = Tdk sakit
Jumlah 125 85 210 kepala
---------------------------------------------------

n  ad - bc - n/2 2


2 = ----------------------------------- = 7,89 (p<0,01)
(a+b) (a+c) (b+d) (c+d)

b. Tabel Kx2 :

--------------------------------------------------
+ - jumlah
--------------------------------------------------
sampel 1 n1
2 n2
3 n3
4 n4
. .
. .
. .
k nk
------------------------------------------------
Jumlah x n-x n
------------------------------------------------

n2
2 = -----------   xi 2 / ni - x2 / n 
x (n-x)

Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (k-1).


c. Tabel BxK :
--------------------------------------------------------------------
Kolom
------------------------------------------------ Total
1 2 3 4 … K
--------------------------------------------------------------------

Baris 1 n.1
2 n.2
3 n.3
4 n.4
. .
. .
. .
B n.B
--------------------------------------------------------------------
Total n1. n2. n3. n4. nK. N
--------------------------------------------------------------------

2 =   ( Oij - Eij ) 2 / Eij

Oij = Nilai observasi baris ke i kolom ke j


Eij = Nilai ekspektasi baris ke i kolom ke j

Eij = ( ni. x n.j ) / N

Hasilnya bandingkan dengan 2 tabel untuk derajat bebas (B-1) (K-1).

d. Tabel 2x2 untuk data berpasangan (uji Mc. Nemar)

Contoh : Suatu percobaan klinik penggunaan dua obat


A dan B untuk arthritis, di mana setiap pasen diberi dua pengobatan (Randomised crossover
study), dan ditanyakan apakah merasa :
’Satisfied’ atau ’Not satisfied’ dengan obat, datanya sbb :
---------------------------------------------------------------------
Obat A
----------------------------------- Total
Satisfied Not satisfied
---------------------------------------------------------------------

Obat B Satisfied 150 (e) 20 (f) 170

Not
Satisfied 30 (g) 50 (h) 80
---------------------------------------------------------------------
Total 180 70 250
---------------------------------------------------------------------
Untuk menguji hipotesis (H0) proporsi satisfied antara Obat A dan obat B sama, digunakan
rumus :

2 =  f – g  - 1 2 / (f+g) =  20 – 30  - 1 2/(20+30)


= 1,62 ; p = 0,20

ANALISIS REGRESI DAN KORELASI

Pengertian :

Analisis regresi adalah suatu analisis statistika yang memanfaatkan hubungan antara dua variabel atau
lebih. Variabel yang terlibat dalam hubungan ini adalah variabel Y (biasa dinamakan variabel dependen
atau respons) dan variabel X (bisa X1, X2, X3 , … , Xn), yang biasa dinamakan variabel independen atau
prediktor. Model hubungan fungsional berbentuk :
Y = f (X). Misalnya, Y = 7 + 2 X; atau Y = 12 + 7 X – 0,5 X2
Analisis korelasi adalah menunjukkan kuatnya hubungan antara kedua variabel atau lebih, dan ini
ditunjukkan oleh besarnya koefisien determinasi (r2), r sendiri adalah koefisien korelasi.

Memilih variabel independen

Untuk memperoleh model regresi yang masih dapat ditangani, maka banyaknya variabel independen
harus terbatas. Ini harus dipilih sedemikian rupa sehingga benar-benar merupakan himpunan variabel
independen yang terbaik untuk tujuan analisis.

Beberapa hal yang perlu diperhatikan adalah :


a) kontribusi variabel independen yang bersangkutan
b) pentingnya variabel independen sebagai penyebab dalam proses yang dianalisis
c) adanya kemudahan akurat, dan ekonomisnya observasi independen.

Bentuk fungsional persamaan regresi

Pemilihan bentuk fungsional persamaan regresi berhubungan dengan pemilihan variabel independen.
Kadang-kadang teori disiplin yang bersangkutan dapat menunjukkan bentuk fungsional yang cocok
dari persamaan regresi. Tetapi dalam banyak hal bentuk fungsional persamaan regresi tidak diketahui
sebelumnya dan harus ditentukan setelah data terkumpul dan dianalisis.
Strategi memilih model yang cocok :
1. Mulai dengan mengasumsikan bahwa model yang cocok adalah regresi linier
2. Tentukan taksiran model regresi terbaiknya
3. Tentukan apakah model regresi (pada langkah 2) secara signifikan membantu menjelaskan
variabel dependen Y
4. Jika ya (langkah 3), maka model regresi linier adalah model yang cocok untuk digunakan sebagai
peramal Y
5. Jika tidak (langkah 3), cari model lain sampai model yang cocok diperoleh.

Catatan : Sebaiknya untuk memilih model yang cocok untuk hubungan dua buah variabel, terlebih dahulu
gambarkan scatter diagramnya, dan buat perkiraan model yang bisa dipakai.
Model-model regresi :
1. Regresi linier :Y=A+BX
2. Regresi multipel : Y = A + B X1 + C X2 + D X3
3. regresi parabola (kuadratik) : Y = A + B X + C X2
4. Regresi geometrik : Y = A XB
5. Regresi eksponensial : Y = A BX
6. Dlsb.

Analisis regresi :
 Outcome (variabel dependen) : kontinu
 Variabel independen : kontinu dan kategori

Analisis diskriminan :
 Outcome (variabel dependen) :  2 kategori
 Variabel independen : kontinu (normal)

Analisis regresi logistik :


 Outcome (variabel dependen) : 2 kategori
 Variabel independen : kontinu dan kategori
Contoh :
1. Hubungan jumlah transfusi darah dengan kadar gula
2. Dosis yang diberikan dengan kadar tertentu
3. Tinggi ayah dengan tinggi anak
4. Pendapatan (GNP) dengan TFR di negara Asia
5. Berat badan lahir dengan lingkar lengan ibu, tinggi ibu, lingkar kepala, dsb.
6. Variabel dependen : Tekanan darah sistolik variabel independen : Umur, jenis
kelamin (L,P), merokok (Y,T) Model regresi yang bisa dibuat :
- Tekanan darah Sist (Y) terhadap umur (X1)
- Tekanan darah Sist (Y) terhadap umur (X1 ) dan jenis kelamin (X2)
- Tekanan darah Sist (Y) terhadap umur (X1) , jenis kelamin (X2) dan merokok
(X3)
Bagaimana model regresi liniernya ?
7. Penelitian longitudinal untuk mempelajari tiga faktor risiko terhadap kejadian Coronary heart
disease (CHD). Pada saat penelitian terhadap 832 laki-laki yang bebas CHD dicatat umur, tekanan
darah diastolik dan kadar kolesterol. Pada periode akhir penelitian, 71 laki-laki menjadi CHD dan
sisanya 761 non CHD. Pertanyaan secara statistika yang penting apakah mungkin untuk
membedakan diantara 71 laki-laki dengan CHD dan 761 tanpa CHD, dengan memperhatikan data
dasar umur (X1), tekanan darah diastolik (X2), dan kadar kolesterol (X3).
Untuk menjawab ini gunakan analisis diskriminan.

8. Pasen yang datang ke RSHS dengan myocardial infark. Diukur tekanan darah sistolik, tekanan
darah diastolik, heart rate, stroke index, dan tekanan darah arteri. Apakah mungkin untuk
meramalkan bahwa pasen akan hidup ?
9. Data yang dikumpulkan di bagian kebidanan :
Variabel independen : umur sekarang; merokok (Y,T); Hb masuk; paritas; pendidikan (tahun);
lama persalinan (jam)
Variabel dependen : berat badan lahir; keadaan bayi lahir (mati, hidup); komplikasi persalinan
(ada/tidak ada)
Variabel confounding : Status sosial ekonomi; pemakain KB sebelum kehamilan sekarang.
Analisis apa saja yang bisa dibuat ?
Regresi linier sederhana :
Hanya terlibat satu variabel independen (X) dan satu variabel dependen (Y).
Bentuk persamaan regresi :
Y=+X+ (populasi)
Ditaksir oleh :
Y=a+bX (sampel)
Y = Y taksiran (taksiran rata-rata Y untuk X diketahui)
a = intercept, konstanta
= titik potong garis regresi terhadap sumbu Y
b = koefisien regresi

Rumus :

n  XY - X Y
b= --------------------------
n X2 – (X)2
a=Y–bX

Rumus koefisien korelasi :

n  XY - X Y
r = --------------------------------------------------
  n X2 – (X)2   n Y2 – (Y)2 

-1  r  1

\\
Analisis varians (ANAVA)

Untuk membandingkan perbedaan rata-rata lebih dari 2 kelompok.

Syarat : - Data numerik dan berdistribusi normal untuk masing -


masing kelompok
- alokasi kedalam kelompok dilakukan secara random
- varians homogen

Untuk menguji hipotesis varians homogen dengan :

H0 : 12 = 22

H1 : 12  22

Digunakan uji statistik :

Varians terbesar
F maks = --------------------
Varians terkecil

 distribusi F dengan derajat bebas (degree of freedom) yaitu (n1 –1; n2 –1)

n1 –1 = derajat bebas pembilang


n2 –1 = derajat bebas penyebut

Contoh lihat halaman 168 :


Placebo : n1 = 15 - s12 = 579,8
Test : n2 = 14 - s12 = 77,7

Maka F = 579,8/77,7 = 7,5

Dari tabel F untuk taraf signifikansi 5 % dengan derajat bebas (14;13) diperoleh F = 2,55 dan untuk
taraf signifikansi 1 % didapat F = 3,85.
Kesimpulan : karena F hitung (7,5) > F tabel  = 1 % maka H0 ditolak (kedua varians tidak sama).
Untuk membandingkan varians lebih dari 2 kelompok digunakan uji Bartlett atau uji Levene(program
SPSS windows).

ANAVA satu arah (oneway ANOVA)


Contoh :
Treatment
----------------------------------
A B C
----------------------------------
7 12 13
5 11 14
8 13 15
6 12 14
7
----------------------------------
t1 = 33 t2 = 48 t3 = 56 T = 137
n1 = 5 n2 = 4 n3 = 4 N = 13
Tabel ANAVA :
--------------------------------------------------------------------------------
Sumber variasi SS df MS=SS/df F
--------------------------------------------------------------------------------
Antar kelompok  t2 /n – T2 /N k-1 MSG MSG/MSW
(between groups) = SSG
Dalam kelompok SST – SSG =SSW N-k MSW
(within groups)
--------------------------------------------------------------------------------
Total X2 – T2/N =SST N – 1
---------------------------------------------------------------------------------
ANAVA berpasangan (Related ANOVA)
- Analisis varians untuk observasi yang berpasangan  tdk ada interaksi
- Cross- over design (> 2 way)

Contoh :
Treatment
-------------------------------------------------
A B C tr nr
-------------------------------------------------
7 12 13 32 3
5 11 14 30 3
8 13 15 36 3
6 12 14 32 3
7 12 14 33 3
--------------------------------------------------
t1 = 33 t2 = 60 t3 = 70 T = 163
n1 = 5 n2 = 5 n3 = 5 N = 15

Tabel ANAVA :

--------------------------------------------------------------------------------
Sumber variasi SS df MS=SS/df F
--------------------------------------------------------------------------------
Antar kolom  t C2 /nC – T2 /N k-1 MSG MSG/MSE
(between groups) = SSG
Antar subyek  t R2 /nR – T2 /N N-k MSR
(between subyek) = SSR
Residu SST-SSC-SSR (c-1) (r-1) MSE
= SSE
--------------------------------------------------------------------------------
Total X2 – T2/N =SST N – 1
---------------------------------------------------------------------------------
Factorial design (ANOVA two way)
 ada 2 variabel (treatment + 1 variabel lain)
 interaksi ada/tidak ada
Contoh :
---------------------------------------------------------------
Variabel II Treatment (var I)
(kel umur) A B C
---------------------------------------------------------------
Muda 7 12 13
5 11 14
8 13 15

Tua 6 12 14
7 12 14
8 13 16
---------------------------------------------------------------

Tabel ANAVA :
--------------------------------------------------------------------------------
Sumber variasi SS df MS=SS/df F
------------------------------------------------------------------------------------------
Antar kolom  tC 2 /nC – T2 /N c-1 MSC MSC/MSW
(between groups) = SSC
Antar subyek  tR 2 /nR – T2 /N r-1 MSR MSR/MSW
(between subyek) = SSR
Interaksi  tcells 2 /ncells – (c-1)(r-1) MSJ MSJ/MSW
(kolomxbaris) T /N-SSC –SSR
2

= SSJ
Within cells SST-SSC-SSR-SSj N - cr MSW
= SSW
------------------------------------------------------------------------------------------
Total X2 – T2/N =SST N–1
------------------------------------------------------------------------------------------

Factorial design (ANAVA 3 way)

Source : - variabel 1
- variabel 2
- variabel 3
- interaksi var 1 x var 2
- Interaksi var 1 x var 3
- Interaksi var 2 x var 3
- Interaksi var 1 x var 2 x var 3
- Within cells
-------------------------------------------------------

Jika hasil analisis varians (uji F) bermakna, untuk melihat perlakuan mana yang berbeda (rata-ratanya)
digunakan analisis “multiple comparisons” .

Beberapa pilihan uji multiple comparisons :

1. Metode Bonferroni (modifikasi t test)


2. Metode Tukey
3. Metode Dunnett (hanya untuk membandingkan thd kelompok kontrol)
4. Metode Scheffe
5. Metode Duncan
6. Metode Newman-Keuls

(dalam program statistika semua ada tinggal dipilih salah satu)

Anda mungkin juga menyukai