Anda di halaman 1dari 50

ESTIMASI

(penarikan kesimpulan)
Ambar Roestam
Pengantar
Merupakan area pertama dari statistik
inference (estimasi & testing hipotesa)

Statistics inference is the procedure by
which we reach a conclusion about a
population on the basis of information
contained in a sample drawn that
population


INFERENCE
population
statistics

X
S
P
inferent
parameter
sampel
m
s
p
Contoh :
Kita ingin membuat estimasi berapa rata rata bunga
chrysant yang dihasilkan dari kebun .

Pertanyaan :
- berapakah the most likely value of
dimana sampel diambil
- apakah rata-rata yang dihasilkan menggambarkan
value ?

Distribusi normal dan central limit theorem

Digunakan 2 cara perhitungan :
- point estimate
- interval estimate

PENDAHULUAN
Kebanyakan penelitian biomedik
bergantung pada kepastian bahwa apa
yang benar terjadi pada sampel juga
benar terjadi pada populasi dimana
sampel tsb diambil,
Karena itu, karakteristik dari sampel
digunakan untuk estimasi karakteristik
yang sama pada populasinya
PENDAHULUAN
Akurasi data estimasi2 tsb bergantung
pada variasi berkaitan dengan:
Teknik pengukuran (measurement error)
Jumlah dan teknik sampling (sampling error)
Variasi biologik pada karakteristik tsb (random
error)
Dinyatakan sebagai confidence interval
PENDAHULUAN
confidence interval, adalah nilai range
yang melalui nilai aktual yang terjadi pada
populasi
confidence interval yang lebar
menunjukkan presisi yang kurang baik,
demikian sebaliknya
Definisi :
A point estimate
An interval estimate consists of two
numerical value used two estimate the
corresponding population parameter

An interval estimate
consists of two numerical value defining
arange of values that, with a specified
degree of confidence, we feel the
parameter being estimate
KUMPULAN SUBYEK DENGAN SIFAT
YANG CENDERUNG SAMA


SANGAT TERGANTUNG DEFINISI
SIFAT YANG AKAN DITELITI
REFERENCE POPULATION
STUDY POPULATION


FINITE POPULATION
INFINITE POPULATION
RINGKASAN SIFAT POPULASI
DINYATAKAN DALAM HURUF
YUNANI

Nilai mean populasi
Standard Deviasi populasi
Proporsi populasi
m
s
p
Cara pengambilan :
Random
Non random
PENARIKAN KESIMPULAN
populasi
statistik

X
S
P
inferens
parameter
sampel
m
s
p
Memilih estimator :
Formula umum untuk estimasi

X =
x1
/ n

Repeated sample
Menggunakan distribusi Z atau t




Confidence Interval
Peneliti melakukan estimasi untuk
sekumpulan data dg distribusi normal
Sample size n dan menghitung x , untuk
estimasi . Namun kita tidak bisa
mengambil kesimpulan bahwa x =
Estimasi merupakan interval
Perlu pemahaman sampling distribution
Confidence Interval
Estimates the range of values
(parameter) in the population using a
statistic in the sample (as point
estimate)

Estimator (reliability coefficient) x
(standard error)

Beberapa penggunaan untuk CI :
CI untuk single measurement
CI untuk perbedaan 2 proportions (p
1
-p
2
)
CI untuk perbedaan 2 means
Relative risk (RR)
Odds ratio (OR)

Distribusi sampling :
Bila sampling merupakan distribusi
normal, maka :
-
x
= (sample mean = population mean)
- s
x
= s/n (variance)
- Angka x berada 95% , yang dalam kurva
distribusi normal merupakan area di
bawah 2 SD of mean
- - 2s
x
dan + 2s
x
atau 2s
x
Normal distribution = Z distribution (1)
- 1.96s - 1s m + 1s + 1.96s

Z value - 1.96 - 1 0 + 1 + 1.96 (95%)
Z value -1.645 +1.645 (90%)
(AUC)
Yang sering digunakan :
CI 90% = p 0.10
CI 95% = p 0.05
CI 99% = p 0.01

digunakan untuk studi analitik
digunakan untuk studi deskriptif dan analitik
1. CI untuk 1 population mean
Formula :
X 2 s
x

Contoh :
Seorang peneliti ingin mengetahui rata-rata
kadar enzym di populasi. Diambil 10 orang
untuk sample pemeriksaan kadar enzym. Hasil
yang didapat X= 22. Distribusinya normal,
SD=45. maka kita bisa melakukan estimasi
Dengan menggunakan 95% CI untuk ,
maka estimasi adalah :
X 2 s
x

22 2 45/n
22 2 (2.1213)
17.66 ; 26.24
Artinya kita 95% confident bahwa rata-rata kadar
enzym di populasi antara 17.66 sampai 26.24
Bagaimana bila populasi tidak normal ?
Digunakan central limit theorem
Jumlah sample ditingkatkan
Digunakan confident coeff kecil
Robust estimate :


Menggunakan distribusi t
Formula dasar untuk sample BESAR :
x
z = ------------
s / n
apabila s tidak diketahui, maka :
s = (x
i
x)
2
/(n-1)

Apabila sample KECIL ( distribusi tidak normal)
x
t = ------------
s / n

CI untuk dengan distribusi t

Estimator (reliability coefficient) x (standard
error)

x t
(1-/2)
s/n

Dasar pertimbangan penggunaan distribusi z
atau t
- sample size
- distribusi normal/tidak
- populasi variance diketahui/tidak
Contoh :
Salah satu studi Maffuli mengenai
effektivitas ankle mobilisasi terapi pada
penderita acute ruptured achilles tendon.
Variable yang diukur adalah isometric
gastrocsoleus muscle strength. Dari 19
subject yang diambil secara random, rata-
rata (mean)nya = 250.8 Newtons, dengan
SD 130.9. Sample ini diharapkan bisa
mengestimasi populasi
250.8 2.1009 (sn)
250.8 2.1009 (130.9/ 19)
250.8 63.1
187.7 ; 313.9
diambil dari distribusi t
Kita confident 95% bahwa dalam populasi
mean, bahwa isometric gastrocsoleus
muscle strength adalah antara 187.7
313.9 pada repeated sampling.
Tabel T
df \ P 0.1 0.05 0.025 0.01 0.005
1
2
3
4
9 1.383 1.833 2.262 2.821 3.250
12 1.356 1.782 2.179
2.681
3.055
18 2.100
2. CI untuk perbedaan 2 pop mean
Formula :

(x
1
- x
2
) z
1-/2
s
1
2
/n
1
+ s
2
2
/n
2


Contoh :
Seorang peneliti ingin mengetahui perbedaan serum
uric acid pada penderita Down syndrome dengan
yang tidak menderita DS . Pada RS besar diambil 12
sampel dan didapat x
1
= 4.5mg/100 ml . Pada RSU
diambil 15 orang sehat didapat x
2
= 3.4 . Assume
variance dengan populasi normal adalah 1 dan 1.5,
maka dengan menggunakan 95% Ci :


CI 95 % = (x
1
- x
2
) z
1-/2
s
1
2
/n
1
+ s
2
2
/n
2

= (4.5-3.4) 1.96 ( 1/12 + 1.5/15)
= 1.1 0.84
= 0.26 - 1.94

Kita confident 95% mengatakan bahwa
perbedaan kadar serum uric acid pada
kelompok DS dan non DS adalah antara
0.26 1.94 mg/100 ml

Artinya : kedua populasi ini tidak equal



CI untuk perbedaan 2 means
n2
1
n1
1
s SE
x2) - (x1

CI = (x1-x2) Z x SE
(x1-
x2)
50 smokers : x
1
syst BP = 146.4 (SD 18.5) mmHg
50 non-smokers: x
2
syst BP = 140.4 (SD 16.8) mmHg
x1 - x2 = 6.0 mmHg

95% CI(x
1
-x
2
) = (x
1
-x
2
) 1.96 x SE (x
1
-x
2
)

SE(x1-x2) = S x (1/n
1
+ 1/n
2
)
S = V [(n
1
-1) S1
2
+ (n
2
-1) S2
2
]/ (n
1
+n
2
2)
S = V (49x18.5 + 49x16.8) / 98
S = 17.7
SE(x
1
-x
2
) = 17.7 x V 1/50 + 1/50
SE(x
1
-x
2
) = 3.53
95% CI = 6.0 1.96x3.53 = 6.0 7
95% CI = -1.0 ; 13.0
(Contoh diambil dari kuliah Prof. Sudigdo)
3. CI untuk single measurement (1
proporsi)
Formula CI :
CI = p Z

x SE

p = point of estimate, dari sampel
Z = standard normal deviate for , yg
merupakan nilai Z dalam nilai distr. normal
Contoh :
Misalnya pada 100 orang pekerja wanita
di perusahaan, yang mempunyai status
anaemia sebanyak 30 orang (p=0.3)
Berapakah sebenarnya proporsi pekerja
yang anaemia di Indonesia ?

95% CI = p Z x SE(p)
SE(p) = V pq/n
95% CI = 0.3 1.96 x V 0.3 x 0.7/100
= 0.3 1.96 x 0.04
= 0.3 0.08
= (0.3 - 0.08) ; (0.3 + 0.08)
= 2.92 3.08
Kita percaya 95% bahwa nilai anaemia
pada pekerja wanita di Indonesia berada
pada 29.2 % sampai 30.8 %
4. CI perbedaan 2 proporsi (p
1
-p
2
)
We treated 50 patients with drug A, 30 cured
We treated 50 patients with drug B, 40 cured
p
1
= 0.6
p
2
= 0.8
l p
1
-p
2
l = 0.2
95% CI (p1-p2) = (p
1
-p
2
) 1.96 x SE(p1-p2)
SE(p1-p2) = V p
1
q
1
/n
1
+ p
2
q
2
/n
2

= V 0.6 x 0.4/50 + 0.8 x 0.2/50
= V 0.4/50 = 0.67/7 = 0.09
95% CI (p
1
-p
2
) = (0.2 0.09) ; (0.2 + 0.09)
= 0.11 ; 0.29

Artinya :
We are 95% confident that the sampled population,
the proportion of cases cured among who treated
with drug A and drug B, between 0.11 0.29
Artinya kedua pop proporsi ini tidak equal
Symmetry
Mesocurtic
Asymptote at +3 standard dev.
m
Penggunaan lain CI :
Relative risk (RR)
Odds ratio (OR)
Likelihood ratio (LR)
Contoh :
RR = 5.6 (95% CI = 1.2 ; 23.7)
OR = 12.8 (95% CI = 3.6 ; 44,2)

Pengambilan keputusan
Penarikan kesimpulan terhadap populasi berdasar
sampel dilakukan dengan menghitung p values
(hypothesis testing) dan confidence interval (CI)
p value menggambarkan probabilitas dari hasil
apakah karena kebetulan (by chance) dan tidak
memberikan besaran dan arah perbedaan
Confidence interval (estimation) menggambarkan
estimasi dari nilai pada populasi yang diinference
dari sampel dan menggambarkan besaran dan
arah perbedaan
Pengambilan keputusan
Apabila hanya menggunakan p value, kita
berkesimpulan apakah secara statistik terdapat
kemaknaan dan kepentingan klinis
CI bisa memberikan estimasi angka yang
secara klinis bisa tergambar kemaknaannya
apabila dimungkinkan, dianjurkan selalu
gambarkan CI terutama untuk hasil utama
suatu penelitian klinis
CI yang sering digunakan bidang kedokteran
90% (untuk sampel kecil) dan 95%

Selalu sajikan CI untuk semua hasil, baik
bermakna secara stat maupun tidak bermakna

confidence interval 95%, artinya interval tsb
dapat digunakan untuk menunjukkan apakah
estimasi perubahan tsb secara statistik
bermakna pada tingkat 0,05

Bila 95% CI estimasi beda antara 2 kelompok
tidak melibatkan angka 0 (angka 1 untuk OR),
bermakna pada tingkat 0,05
Contoh :
OR insidens terjadinya kanker pada perokok
dan non-perokok adalah 4,2 (95% CI = 1,32
sampai 13,33)

OR insidens terjadinya kanker pada perokok
dan non-perokok adalah 4,2 (95% CI = 0,92
sampai 18,63)

Beda rerata ukuran fungsi paru antar 2
kelompok adalah 0,51 L/menit (95% CI = 0,23
sampai 0,79)

Beda rerata ukuran fungsi paru antar 2 kelompok adalah
0,12 L/menit (95% CI = -0,16 sampai 0,40)




CONTOH
Sekelompok pasien dengan hipercholesterol
mendapat pengobatan dengan obat X selama 1
bulan. Kelompok ini kadar cholesterol menurun
setelah pengobatan dapat dilaporkan sbb:

Efek obat bermakna secara statistik.
Efek obat untuk menurunkan kadar cholesterol
secara statistik bermakna (p < 0,05)
Rerata kadar cholesterol dari kelompok
perlakuan turun dari 230 menjadi 190 (p = 0,01)
Obat X menurunkan dengan rerata sebesar 40,
dari 230 menjadi 190 (95% CI = 22 sampai 50 ).
Normal distribution = Z distribution (1)
- 1.96s - 1s m + 1s + 1.96s

Z value - 1.96 - 1 0 + 1 + 1.96
(AUC)
zarni amri Statistik deskrptif kurfak 2005 46
AUC of (0 1.645 ) = 95%
5%
1.645
1-tailed
2.5%
vs
2-tailed
2.5%
1.96
AUC of ( + 1.96 ) = 95%
- 1.96
Normal distribution
AUC of ( + 1.645 ) = 90%
Soal-soal :
1.Sebuah klinik menghitung angka rata-rata
menunggu pasien di meja pendaftaran
sekitar 3.75 menit. Test dilakukan pada 30
klien, didapatkan angka sebagai berikut :
3 4 3 4 1 1 0 5 3 2 4 3 1 2 0
3 4 1 3 2 1 3 2 1 3 2 4 2 5 2
Pertanyaan :
Lakukanlah perhitungan estimasi dan ambil
kesimpulannya.
2. Pada sebuah bank ingin dihitung berapa
besar rata rata tabungan setiap
nasabahnya. Secara random dari 400
nasabah diketahui rata mereka
mempunyai tabungan Rp 750.000,-
dengan SD Rp 216.000,-. Dengan
menggunakan 90 confidence limit,
hitunglah rata-rata aktual tabungan
nasabah.

3. Pada satu penelitian tentang effek dari
hormon inbalance pada makanan yang
diberikan pada tikus, secara random 8 tikus
diberi minum yang mengandung hormon .
kemudian makanan yang dimakan oleh tikus
,dihitung berapa yang dikonsumsi setiap
tikus. Hasilnya makanan yg dimakan adalah
58.6; 68.1; 55.2; 64.1; 59.6; 57;2; 57.5 dan
61.3 gram. Apakah dengan menggunakan
sampel ini cukup evidence untuk
mengindikasikan bahwa rata-rata intake
makanan tikus lebih dari 60 grams bila tikus
menggunakan hormon ? = 0.01

Anda mungkin juga menyukai