Intervals and
p - Values
Evilin Eka Yuniarti Tobing
1965050105
KEPANITERAAN KLINIK ILMU KESEHATAN MASYARAKAT
PERIODE 07 SEPTEMBER - 03 OKTOBER 2020
FAKULTAS KEDOKTERAN UNIVERSITAS KRISTEN INDONESIA
2020
CHAPTER -
13 Intervals and p -
Confidence
Values
CHAPTER OUTLINE
Introduction
Confidence Intervals
p - Values
Tertanda,
The value of the parameter cannot exactly know, but we can estimate it statistically.
The calculated statistical estimate will be imperfect due to random and systematic error.
Pendahuluan
Parameter and Estimasi
Parameter mengacu pada konstanta numerik error-free (bebas kesalahan) yang secara
statistik menggambarkan karakteristik numerik dari suatu populasi.
Nilai parameter tidak dapat diketahui secara pasti, tetapi dapat di Estimasi secara
statistik.
Estimasi statistik yang dihitung tidak akan sempurna, karena kesalahan acak dan
kesalahan sistematis.
Introduction
Population and sample
Statistical populations may be real or hypothetical, depending on the object of the
research.
● Populasi nyata terdiri dari sejumlah observasi potensial yang terbatas, seperti
yang menggambarkan situasi saat melakukan survei prevalensi.
● Populasi hipotesis mewakili jumlah observasi potensial yang tak terbatas untuk
dijadikan sampel.
Confidenc
e
Intervals
Estimatio
n
Estimation, the process of using data to ‘‘locate’’ population parameters comes in two
forms: point estimation and interval estimation.
For example : In the past we had calculated a risk difference of 10%, this was the point
estimate for risk difference parameter δ.
Estima
si
Estimasi, adalah proses menggunakan data untuk ''menemukan'' parameter populasi,
terdapat dalam dua bentuk: estimasi titik dan estimasi interval.
Misalnya: Dulu kami telah menghitung selisih risiko 10%, ini adalah estimasi poin untuk
parameter perbedaan risiko δ.
Estimatio
Interval estimation surrounds then
point estimate with a margin of error, thus creating a
confidence interval.
For example, a 95% confidence interval for a risk difference might be 0.10 ± .02. This is
written (0.08, 0.12), where 0.08 is the lower confidence limit (LCL) of the interval and 0.12
is the upper confidence limit (UCL).
Estima
si
Interval estimasi mengelilingi estimasi titik dengan margin of error, sehingga tercipta
interval kepercayaan (confidence interval).
Misalnya, confidence interval (CI) 95% untuk perbedaan risiko mungkin 0,10 ± 0,02. Ini
tertulis (0,08, 0,12), di mana 0,08 adalah lower confidence limit (LCL) dari interval dan
0,12 adalah upper confidence limit (UCL).
Confidence
Intervals
The width of this confidence interval : simply its upper limit minus its lower limit is a
measure of the estimate’s precision. (For risk ratios and rate ratios, the ratio of the
upper and lower confidence limits is a comparable measure of precision.)
Assuming observations are independent, the number of cases in a given sample will
follow a binomial distribution with parameters n and p, where n represents the sample
size and p represents the incidence proportion or prevalence parameter.
● p̂ = sample proportion
● A = number of cases in the sample
● n = sample size.
Confidence Intervals untuk Proporsi
(proporsi kejadian dan prevalensi)
Dengan asumsi observasi tidak bergantung, jumlah kasus dalam sampel tertentu akan
mengikuti distribusi binomial dengan parameter n dan p, di mana n mewakili ukuran
sampel dan p mewakili proporsi kejadian atau parameter prevalensi.
● p̂ = proporsi sampel
● A = jumlah kasus dalam sampel
● n = ukuran sampel
where A represents the number of cases in the sample and n represents the sample size.
For example, a sample of 57 people in which 17 smoke demonstrates p̂ = 15/57 = 0.298 o
fr
the characteristic of smoking.
Let qˆ = 1 − p̂. When np̂ ≥ 10, a normal approximation to the binomial can be used to
calculate a confidence 95% interval for p as follows:
Misalkan qˆ = 1 - p̂. Jika np̂ ≥ 10, perkiraan normal binomial dapat digunakan unutk
menghitung interval kepercayaan 95% untuk p sebagai berikut:
where p̂1 represents the proportion in the exposed group and p̂0 represents the proportion in
the nonexposed group.
Confidence intervals untuk rasio proposi
(rasio risiko dan rasio prevalensi)
Saat memperkirakan tingkat insiden berdasarkan penyebut orang-waktu, jumlah kasus
dalam sampel tertentu diasumsikan mengikuti distribusi Poisson dengan ekspektasi μ.
Misalkan A mewakili jumlah kasus yang diamati dalam sampel yang terdiri dari
pengalaman populasi T orang-tahun. Estimator pada parameter rate λ adalah
di mana p̂1 mewakili proporsi pada kelompok terpapar dan p̂0 mewakili proporsi p
a
d
kelompok yang tidak terpapar.
Confidence intervals for proportion ratios
(risk ratios and prevalence ratios)
The sampling distribution of the natural logarithm of φˆ is approximately normal.
Therefore, we transform the risk ratio estimate into a natural logarithmic (ln) scale before
calculating its confidence interval. (Use the ‘‘ln’’ key on your calculator.)
where λ1 represents the rate in the exposed group (= A1/T1) and λ0 represents the rate in the
nonexposed group (= A0/T0). With moderate to large samples, the random error distribution of the
natural log of the estimator (ln ωˆ ) is approximately normal with a standard error of
The 95% confidence limits for ω is derived by taking the exponents of these
limits.
Confidence intervals untuk rate
rasio
Misalkan ω mewakili parameter rasio laju. Penaksir rasio tingkat adalah
di mana λ1 mewakili tingkat dalam kelompok terpapar (= A1 / T1) dan λ0 mewakili tingkat dalam
kelompok tidak terpapar (= A0 / T0). Dengan sampel sedang hingga besar, distribusi kesalahan acak
dari log alami penduga (ln ωˆ) mendekati normal dengan kesalahan standar sebesar
Batas kepercayaan 95% untuk ω diturunkan dengan mengambil eksponen dari batas
ini.
Confidence intervals for proportion
differences
(risk differences and prevalence differences)
This section considers differences between proportions (risk differences and prevalence
differences).
Confidence intervals untuk perbedaan
porposi
(perbedaan risiko dan perbedaan prevalensi)
Bagian ini membahas perbedaan antara proporsi (perbedaan risiko dan perbedaan
prevalensi).
Confidence intervals for rate
differences
Confidence intervals untuk rate
differences
p-
Values
Hypothesis tests of statistical
significance
Two different approaches to statistical testing exist: significance testing (Fisher, 1935)
and the fixed-level hypothesis testing (Neyman and Pearson, 1933). Both methods are
used to test statistical hypotheses, and as both lead to substantially the same
conclusions.
Significance tests still have a role under some circumstances and still play a central role
in
experimental studies.
Uji hipotesis signifikansi
statistik
Ada dua pendekatan berbeda untuk pengujian statistik: pengujian signifikansi (Fisher,
1935) dan pengujian hipotesis tingkat tetap (Neyman dan Pearson, 1933). Kedua metode
ini digunakan untuk menguji hipotesis statistik, dan keduanya menghasilkan
kesimpulan yang secara substansial sama.
Tes signifikansi masih memiliki peran dalam beberapa keadaan dan masih memainkan
peran sentral dalam studi eksperimental.
Null and alternative
hypotheses
The process of conducting a statistical test begins by specifying a null hypothesis (H0).
The hypothesis competing with the null hypothesis is the alternative hypothesis (H1). An
all-purpose two-sided statement of the alternative hypothesis is ‘‘H0 is false.’’
The null hypothesis is given the benefit of the doubt until the data convince us
otherwise.
Hipotesis Nol dan Hipotesis
Proses Alternatif
melakukan uji statistik dimulai dengan menetapkan hipotesis nol (H ).
0
Dalam epidemiologi, hipotesis nol adalah pernyataan ''tidak ada hubungan antara
variabel keterpaparan dan variabel penyakit.'' Pernyataan hipotesis merujuk pada
parameter dan bukan perkiraan statistik.
Hipotesis yang bersaing dengan hipotesis nol adalah hipotesis alternatif (H1).
Pernyataan dua sisi untuk semua tujuan dari hipotesis alternatif adalah '' H0 salah. ''
Hipotesis nol memberikan manfaat dari keraguan sampai data meyakinkan kita
sebaliknya.
Basis of the p-
value
Assuming the null hypothesis is correct, we specify a probability distribution for a test
statistics calculated with data from the sample.
For example, we might specify that under H0, the logarithm (base e) of the risk ratio
estimate is normally distributed with an expectation of 0 and a standard deviation of
SElnψ ‘‘SE’’.
Schematically, this null distribution is depicted as a curve like the one drawn in Figure
13.2. The probability of observing a log risk ratio that is as extreme or more extreme than
the current ln risk ratio statistic assuming H0 is true is the p-value for the test.
Dasar nilai -
Dengan asumsi hipotesis nol p
benar, kami menetapkan distribusi probabilitas untuk
statistik uji yang dihitung dengan data dari sampel.
Sebagai contoh, kita dapat menentukan bahwa di bawah H0 , logaritma (basis e) dari
estimasi rasio risiko terdistribusi secara normal dengan ekspektasi 0 dan deviasi standar
dari SElnψ 'SE'.
Secara skematis, distribusi nol ini digambarkan sebagai kurva seperti yang digambar
pada Gambar 13.2. Probabilitas mengamati rasio risiko log yang sama ekstrim atau lebih
ekstrim dari statistik rasio risiko ln saat ini dengan asumsi H0 benar adalah nilai-p untuk
pengujian.
The one-sided p-value corresponds to the area in the tail of the null distribution beyond
the observed statistic (shaded region). This area is doubled for a two-sided p-value.
The p-value thus quantifies the degree of inconsistency between the data and H0
Nilai p satu sisi sesuai dengan area di ekor distribusi nol di luar statistik yang diamati
(wilayah yang diarsir). Area ini digandakan untuk nilai p dua sisi.
With smaller and smaller p-values providing greater and greater security that the
observed association cannot be simply ascribed to chance.
Large p-values, say, greater than 0.10 or 0.15, indicate that we ought not take too much
notice of the observed association.
Untuk studi observasional (noneksperimental), kami akan melihat nilai-p sebagai ukuran
bukti berkelanjutan — tidak hanya sebagai signifikan atau tidak signifikan.
Dengan nilai-p yang lebih kecil dan lebih kecil memberikan keamanan yang lebih besar
dan lebih besar sehingga asosiasi yang diamati tidak dapat begitu saja dianggap
kebetulan.
Nilai p yang besar, katakanlah, lebih besar dari 0,10 atau 0,15, menunjukkan bahwa kita
tidak perlu terlalu memperhatikan asosiasi yang diamati.
Testing a proportion
A binomial test is used to help determine whether a proportion in a given sample is
significantly different from what is expected under a null hypothesis.
In testing a proportion, let p0 represent the expected value of the proportion under the
null hypothesis. The value of p0 is borrowed from a previous study or survey, or from the
hypothesis itself.
Menguji
Proporsi
Uji binomial digunakan untuk membantu menentukan apakah proporsi dalam sampel
tertentu berbeda secara signifikan dari yang diharapkan dalam hipotesis nol.
where p̂ is the sample proportion, p0 is the expected proportion under the null hypothesis,
and the standard error of the proportion is
Pendekatan normal untuk distribusi binomial Bernoulli digunakan untuk melakukan
pengujian ketika np0q0 ≥ 5, di mana q0 = 1 - p0. Statistik uji adalah
di mana p̂ adalah proporsi sampel, p0 adalah proporsi yang diharapkan di bawah hipotesis
nol, dan kesalahan standar proporsinya adalah
Testing a rate
The Poisson distribution is used to test whether an observed rate (λ) is significantly
different from an expected rate (λ0).
Instead of testing the rate directly, we will direct the test toward the number of cases in
the sample. Under the null hypothesis, the number of cases in a given sample is
distributed as a Poisson variate with expectation μ0 = λ0 × T, where λ0 represents the null
rate derived from a reference population and T represents the sum of person-times
in the sample.
Calculation of Poisson probabilities is covered in Section 19.2, but is not covered here.
Instead, this chapter focuses on setting up the test and calculating the results with
WinPEPI.
Menguji
Distribusi Poisson digunakan Rate
untuk menguji apakah tingkat pengamatan (λ) berbeda
secara signifikan dari tingkat yang diharapkan (λ0).
Alih-alih menguji rate secara langsung, kami akan mengarahkan pengujian ke jumlah
kasus dalam sampel. Di bawah hipotesis nol, jumlah kasus dalam sampel tertentu
didistribusikan sebagai variasi Poisson dengan ekspektasi μ0 = λ0 × T, di mana λ0
mewakili tingkat nol yang berasal dari populasi referensi dan T mewakili jumlah waktu
orang dalam sampel.
Perhitungan probabilitas Poisson dibahas dalam Bagian 19.2, tetapi tidak tercakup di sini.
Sebaliknya, bab ini berfokus pada menyiapkan pengujian dan menghitung hasil dengan
WinPEPI.
Chi-square test of
The chi-squareassociation
test of association is used to test independent proportions from cohort
studies, cross-sectional studies, and case–control studies. It is one of the most common
statistical tests used in epidemiology.
The null hypothesis for this test is a statement of ‘‘no association.’’ In cohort and cross-
sectional studies this may be applied to the risk ratio (H0 : φ = 1) or risk difference (H0 : δ
= 0). In a case–control study, this is applied to the odds ratio (H0 : ψ = 1).
Uji Asosiasi Chi -
square
Uji asosiasi chi-square digunakan untuk menguji proporsi independen dari studi kohort,
studi cross-sectional, dan studi case-control. Ini adalah salah satu uji statistik yang
paling umum digunakan dalam epidemiologi.
Hipotesis nol untuk tes ini adalah pernyataan '' tidak ada hubungan. '' Dalam studi kohort
dan cross-sectional ini dapat diterapkan pada rasio risiko (H0 : φ = 1) atau perbedaan
risiko (H0 : δ = 0). Dalam studi kasus-kontrol, ini diterapkan pada rasio odds (H0: ψ = 1).
Fisher Exact
Chi-square tests should be Test when one of the expected frequencies in the 2-by-2
avoided
table is less than 5. In such instances, Fisher’s exact test should be used. Fisher’s exact
test is based on summing exact binomial probabilities for permutations of table counts
that are equal to or more extreme than the observed results, assuming the null
hypothesis is true and the table’s margins are fixed.
Perhitungan statistik uji Fisher dijelaskan di sebagian besar uji biostatistik pengantar dan
tidak akan dibahas di sini. Hasil tes pasti Fisher secara rutin diberikan dengan WinPEPI
→ Bandingkan2 → A. Proporsi atau Peluang, dan oleh OpenEpi.com → Hitungan → Tabel
Dua-oleh-Dua.
Testing independent
rates
We want to test the difference in two independent rates. The statistical hypotheses are
H0: δrate = 0 vs. H1: δrate à= 0, where δrate represents the rate difference parameter λ1 −
λ0. With moderate to large samples, a z test may be applied. The z statistic is
The objective of the Bayesian approach that is about to be presented is to determine the
extent to which the relation being studied becomes either more or less plausible after
considering the current data.
Pendahuluan
Tujuan dari pendekatan Bayesian yang akan disajikan adalah untuk menentukan sejauh
mana relasi yang dipelajari menjadi lebih masuk akal setelah mempertimbangkan data
saat ini.
Bayes
factors
We consider a method of obtaining minimum Bayes factors using standard significance
testing statistics (Goodman, 1999, 2001).
Using Bayes’ theorem we note that the odds of H0 being true after the test (posterior
odds) is the function of the odds of H0 being true before the test (prior odds) and a
statistic called the Bayes factor:
where
Faktor
Bayes
Kami mempertimbangkan metode untuk memperoleh faktor Bayes minimum dengan
menggunakan statistik pengujian signifikansi standar (Goodman, 1999, 2001).
Dengan menggunakan teorema Bayes kita mencatat bahwa peluang H0 menjadi benar
setelah pengujian (peluang posterior) adalah fungsi dari peluang H0 menjadi benar
sebelum pengujian (peluang sebelumnya) dan statistik yang disebut faktor Bayes:
dimana
Interpretation of Bayes
factors
The Bayes factor is a ratio of two probabilities that provides a direct measure of
evidentiary weight moving us toward or away from the null hypothesis to a stated
degree.
For example, a Bayes factor of 1 : 10 suggest that ‘‘the results under the null hypothesis
are one-tenth as likely as they are under the alternative.’’ Or, ‘‘the evidence supports the
null hypothesis one-tenth as strongly as it does the alternative.’’ Alternatively, ‘‘the odds
of the null hypothesis after the study are one-tenth what they were before the study.’’
Misalnya, faktor Bayes 1: 10 menunjukkan bahwa ''hasil di bawah hipotesis nol adalah
sepersepuluh lebih mungkin seperti di bawah alternatif.'' Atau, ''bukti mendukung
hipotesis nol sepersepuluh sama kuatnya seperti halnya alternatifnya. '' Alternatifnya, ''
kemungkinan hipotesis nol setelah penelitian adalah sepersepuluh dari apa yang mereka
lakukan sebelum penelitian.''
However, we could also argue that a prior odds should be chosen larger than 1 : 1, since
scientific research requires skepticism (Berger and Selke, 1987). For our illustrations, we
will adopt prior odds of 1 : 1 to represent ‘‘neutrality’’ and 9 : 1 to represent ‘‘skepticism.’’
Peluang
Sebelumnya
Kesulitan dengan pendekatan ini adalah subjektivitas yang terlibat dalam memilih
peluang sebelumnya dari hipotesis nol. Pilihan peluang sebelumnya 1 : 1 memiliki daya
tarik untuk tampil ''netral'.'
Namun, kami juga dapat berpendapat bahwa peluang sebelumnya harus dipilih lebih
besar dari 1 : 1, karena penelitian ilmiah membutuhkan skeptisisme (Berger dan Selke,
1987). Untuk ilustrasi kami, kami akan mengadopsi peluang sebelumnya 1 : 1 untuk
mewakili ''netralitas'' dan 9 : 1 untuk mewakili ''skeptisisme.''
Method to calculate a minimum Bayes
factor
For tests based on normal error distributions, a minimum Bayes factor can be calculated
with the formula :
where e is the universal constant and z is the number of standard errors the estimate
falls from the null value. This z score can be obtained directly from a z statistic, t
statistic, or the square root of the χ2 statistic. It can also be derived from the p-value by
recognizing the relation between p and z (Table 13.10).
For example, a two-sided p-value of 0.05 is associated with a z score of 1.96, while a
two-sided p-value of 0.01 is associated with a z score of 2.58, and so on.
Metode untuk menghitung faktor Bayes
minimum
Untuk pengujian berdasarkan distribusi kesalahan normal, faktor Bayes minimum dapat
dihitung dengan rumus :
di mana e adalah konstanta universal dan z adalah jumlah kesalahan standar yang
diperkirakan turun dari nilai nol. Skor z ini dapat diperoleh langsung dari statistik z,
statistik t, atau akar kuadrat dari statistik χ2. Itu juga dapat diturunkan dari nilai-p
dengan mengenali hubungan antara p dan z (Tabel 13.10).
Misalnya, nilai p dua sisi 0,05 dikaitkan dengan skor z 1,96, sedangkan nilai p dua sisi
0,01 dikaitkan dengan skor z 2,58, dan seterusnya.
To calculate the posterior probability of H0 being true, we must declare its prior odds.
Suppose, for Illustrative Example 13.15, we had decided on a prior odds of H0 of 1 : 1,
corresponding to ‘‘neutrality.’’ Then the posterior odds of H0 would be 1 × 0.15 = 0.15. To
convert these odds into a probability, use the formula
Thus, a posterior odds of 0.15 corresponds to posterior probability = 0.15/(1 + 0.15) = 0.13.
Notice that this does not appear as ‘‘significant’’ as the p = 0.05 from which it was
derived.
Now let us assume additional skepticism in the form of a the prior odds of H0 of 9 : 1, as
might be appropriate in a data dredging exercise. A minimum Bayes factor of 0.15 (derived
from p = 0.05) in this situation provides posterior odds = 9 × 0.15 = 1.35. A posterior odds
of
1.35 translates to a posterior probability = 1.35/(1 + 1.35) = 0.57, which is hardly convincing
evidence against H0.
Untuk menghitung probabilitas posterior H0 menjadi benar, kita harus menyatakan
peluang sebelumnya. Misalkan, untuk Contoh Ilustratif 13.15, kami telah memutuskan
peluang sebelumnya dari H0 1 : 1, sesuai dengan '' netralitas '. Maka peluang posterior H0
adalah 1 × 0,15 = 0,15. Untuk mengubah peluang ini menjadi probabilitas, gunakan
rumusnya
Jadi, peluang posterior 0,15 sesuai dengan probabilitas posterior = 0,15 / (1 + 0,15) = 0,13.
Perhatikan bahwa ini tidak muncul sebagai '' signifikan '' karena p = 0,05 dari mana itu
diturunkan.
Sekarang mari kita asumsikan skeptisisme tambahan dalam bentuk peluang sebelumnya
dari H0 9: 1, yang mungkin sesuai dalam latihan pengerukan data. Faktor Bayes minimum
0,15 (diturunkan dari p = 0,05) dalam situasi ini memberikan peluang posterior = 9 × 0,15 =
1,35. Peluang posterior 1,35 diterjemahkan menjadi probabilitas posterior = 1,35 / (1 +
1,35)
= 0,57, yang merupakan bukti yang hampir tidak meyakinkan terhadap H0.
TERIM
A
KASIH