TESTING HYPOTHESES
GUILTY INNOCENT
TRUTH
DECISION TRUTH
INNOCENT GUILTY
• GUILTY • INNOCENT
ERROR !!!
Nonstatistical Hypothesis Testing…
• Terdapat 2 hipotesis (terdakwa bersalah/tidak bersalah)
• Prosedur pengujian dimulai dengan anggapan Terdakwa tidak bersalah
• Tujuan adalah memutuskan apakah cukup bukti untuk menyatakan the alternative
hypothesis is true, or the null is not likely to be true.
• Akan terdapat 2 kemungkinan keputusan seperti halnya hipotesis yang diberikan.
Menyimpulkan cukup bukti untuk menyatakan terdakwa bersalah, atau tidak cukup
bukti untuk menyatakan terdakwa bersalah
• Terdapat 2 jenis kesalahan yang dibuat dalam pengambilan keputusan tersebut,
Type I error : muncul apabila Ho ditolak (menyatakan terdakwa bersalah) akan
tetapi sebenarnya tidak bersalah
Type II error : muncul apabila Ho diterima (menyatakan tdk ckp bukti terdakwa
bersalah) akan tetapi sebenarnya bersalah
Proses Pengujian Hipotesis Statistik
Populasi
❑ Sifat/karakteristik yg diamati dari elemen populasi →
Variabel/Peubah
❑ Skala pengukuran Variabel → nominal/ordinal (kualitatif) atau
interval/rasio(kuantitatif)
❑ Kumpulan hasil pengukuran variable → data
f : assumed to be known
𝜃: completely unknown Function of Random Samples
𝜃 ∈ Ω (𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑒𝑟 𝑠𝑝𝑎𝑐𝑒) 𝑆 = 𝑔 𝑋1 , 𝑋2 , … , 𝑋𝑛
ത 𝑆2
e.g: 𝑋,
CDF/MGF/
Transformation Pdf of statistic: 𝑓 𝑠, 𝜃
Techniques 𝑠 ∈ 𝑅 (𝑠𝑎𝑚𝑝𝑙𝑒 𝑠𝑝𝑎𝑐𝑒) 7
Hipotesis Statistik:
• What?
suatu pernyataan mengenai kondisi populasi (parameter/sebaran populasi) yang
masih harus dibuktikan kebenarannya
• Jenis Hipotesis?
Hipotesis Nol (Ho) vs Hipotesis Alternatif (Ha)
Pada umumya pertanyaan penelitian (research question) diletakkan sbg Hipotesis
Alternatif, sementara itu pernyataan yang me”niada/nol”kan research question
dinyatakan sebagai Hipotesis Nol
Nilai parameter yang dinyatakan dalam hipotesis (tunggal/komposit) merupakan
himpunan bagian dari Parameter space
Research Question →Hipotesis Statistik
50 53 55
Ilustrasi Perubahan Daerah Kritis
MP/UMP Test →Neyman Pearson lemma
Fungsi kuasa Uji
• Pada pengujian hipotesis komposit, jika diberikan daerah kritis dengan taraf
nyata (𝛼) ditetapkan (fixed) → nilai maksimum dari peluang kesalahan jenis I
yang ditolerir
• Konsekuensinya, harus terdapat suatu nilai tertentu (𝜃0 ) pada hipotesis nol
dimana 𝛼 dicapai (kurva fungsi kuasa uji melalui titik 𝜃0 , 𝛼
• Bentuk hipotesis pada 𝐻0 adalah satu diantara 3 kemungkinan berikut:
(1) 𝐻0 ∶ 𝜃 = 𝜃0 𝑣𝑠 𝐻1 ∶ 𝜃 ≠ 𝜃0
(2) 𝐻0 ∶ 𝜃 ≤ 𝜃0 𝑣𝑠 𝐻1 ∶ 𝜃 > 𝜃0
(3) 𝐻0 ∶ 𝜃 ≥ 𝜃0 𝑣𝑠 𝐻1 ∶ 𝜃 < 𝜃0
• perhatikan bahwa selalu ada tanda = pada 𝐻0 yang mengimplikasikan
ditetapkannya (dikontrolnya) nilai peluang salah jenis I (𝛼)!!!
11.17
Contoh:
• Diketahui suatu populasi berdistribusi 𝑁(𝜇, 16), diambil sampel acak
sebanyak 36 untuk menguji hipotesis
𝐻0 ∶ 𝜇 ≥ 50 𝑣𝑠 𝐻1 ∶ 𝜇 < 50
• Jika diterapkan taraf nyata pengujian 𝛼 = 0.05, tentukan
daerah kritis pengujian dalam bentuk:
a. 𝐶1 = 𝑥ҧ 𝑥ҧ < a}
b. 𝐶2 = 𝑥ҧ 𝑥ҧ > b
c. 𝐶3 = 𝑥ҧ 𝑥ҧ < c Uഥ𝑥 > d}
• Bandingkan fungsi kuasa uji dari 3 daerah kritis tersebut,
manakah yang paling reasonable ?
11.18
Jawab:
a. Untuk daerah kritis C1, saat 𝜇 = 𝜇0 = 50
𝑎−50
0,05 = 𝑃(𝑋ത < a|𝜇0 = 50) = P Z < 4 = 𝑃(𝑍 < 𝑧0.05)
6
𝐶1 = 𝑥ҧ 𝑥ҧ < 48.9033}
b. Untuk daerah kritis C2,
𝑏−50
0,05 = 𝑃(𝑋ത > b|𝜇0 = 50) = P Z > 4 = 𝑃 𝑍 > 𝑧0.95
6
𝑏−50 4
4 = 1,645 ⟺ 𝑎 = 1.645 + 50 = 51.09667
6
6
𝐶2 = 𝑥ҧ 𝑥ҧ > 51.09669
c. Untuk daerah kritis C3,
𝑐−50 𝑑−50
0,05 = 𝑃(𝑋ത < c|𝜇0 = 50) + 𝑃(𝑋ത > d|𝜇0 = 50) = P Z < 4 + P Z > 4
6 6
Daerah Kritis C1 memberikan kuasa uji yang paling dekat dengan kurva Ideal
(paling powerful) dibanding C2 dan C3
11.20
𝐻0 ∶ 𝜇 ≤ 50 𝑣𝑠 𝐻1 ∶ 𝜇 > 50
𝜇 C1 C2 C3 Ideal
45.0 1.0000 0.0000 1.0000 0.000
45.5 1.0000 0.0000 1.0000 0.000
Perbandingan Fungsi Kuasa Uji
46.0 1.0000 0.0000 1.0000 0.000 C1 C2 C3 Ideal
46.5 0.9998 0.0000 0.9995 0.000 1.00
47.0 0.9978 0.0000 0.9945 0.000 0.95
47.5 0.9824 0.0000 0.9633 0.000 0.90
0.85
48.0 0.9123 0.0000 0.8508 0.000
0.80
48.5 0.7274 0.0000 0.6141 0.000 0.75
49.0 0.4423 0.0008 0.3230 0.000 0.70
0.65
49.5 0.1854 0.0083 0.1165 0.000
0.60
50.0 0.0500 0.0500 0.0500 0.050 0.55
50.5 0.0083 0.1854 0.1165 1.000 0.50
0.45
51.0 0.0008 0.4424 0.3230 1.000
0.40
51.5 0.0000 0.7274 0.6141 1.000 0.35
52.0 0.0000 0.9123 0.8508 1.000 0.30
52.5 0.0000 0.9824 0.9633 1.000 0.25
0.20
53.0 0.0000 0.9978 0.9945 1.000 0.15
53.5 0.0000 0.9998 0.9995 1.000 0.10
54.0 0.0000 1.0000 1.0000 1.000 0.05
0.00
54.5 0.0000 1.0000 1.0000 1.000 45.0 46.0 47.0 48.0 49.0 50.0 51.0 52.0 53.0 54.0 55.0
55.0 0.0000 1.0000 1.0000 1.000
•Daerah Kritis C2 memberikan kuasa uji yang paling dekat dengan kurva Ideal
(paling powerful) dibanding C1 dan C3
11.21
𝐻0 ∶ 𝜇 = 50 𝑣𝑠 𝐻1 ∶ 𝜇 ≠ 50
𝜇 C1 C2 C3 Ideal
45.0 1.0000 0.0000 1.0000 1.000
45.5 1.0000 0.0000 1.0000 1.000
Perbandingan Fungsi Kuasa Uji
46.0 1.0000 0.0000 1.0000 1.000 C1 C2 C3 Ideal
46.5 0.9998 0.0000 0.9995 1.000 1.00
47.0 0.9978 0.0000 0.9945 1.000 0.95
47.5 0.9824 0.0000 0.9633 1.000 0.90
0.85
48.0 0.9123 0.0000 0.8508 1.000
0.80
48.5 0.7274 0.0000 0.6141 1.000 0.75
49.0 0.4423 0.0008 0.3230 1.000 0.70
0.65
49.5 0.1854 0.0083 0.1165 1.000
0.60
50.0 0.0500 0.0500 0.0500 0.050 0.55
50.5 0.0083 0.1854 0.1165 1.000 0.50
0.45
51.0 0.0008 0.4424 0.3230 1.000
0.40
51.5 0.0000 0.7274 0.6141 1.000 0.35
52.0 0.0000 0.9123 0.8508 1.000 0.30
52.5 0.0000 0.9824 0.9633 1.000 0.25
0.20
53.0 0.0000 0.9978 0.9945 1.000 0.15
53.5 0.0000 0.9998 0.9995 1.000 0.10
54.0 0.0000 1.0000 1.0000 1.000 0.05
0.00
54.5 0.0000 1.0000 1.0000 1.000 45.0 46.0 47.0 48.0 49.0 50.0 51.0 52.0 53.0 54.0 55.0
55.0 0.0000 1.0000 1.0000 1.000
Daerah Kritis C3 memberikan kuasa uji yang paling dekat dengan kurva Ideal
(paling powerful) dibanding C1 dan C2
11.22
Most Powerful Test (MP Test)
Definisi:
Suatu pengujian 𝐻0 : 𝜃 = 𝜃0 melawan 𝐻1 : 𝜃 = 𝜃1 berdasarkan suatu daerah kritis C
dikatakan most powerful critical region atau most powerful test dengan ukuran 𝛼 jika:
1. 𝐾𝐶 𝜃0 = 𝛼 dan
2. 𝐾𝐶 𝜃1 ≥ 𝐾𝐷 𝜃1 , ∀ daerah kritis D lainnya yang juga berukuran 𝛼 (𝐾𝐷 𝜃0 = 𝛼)
• Pada contoh2 sebelumnya, diberikan 2 atau lebih daerah kritis yang memiliki peluang
melakukan salah jenis I (𝛼) yang sama, kemudian untuk menentukan daerah kritis yg
lebih powerful adalah dengan membandingkan nilai 𝛽 (terkecil) atau 1 − 𝛽 (terbesar)
• Teorema Newman Pearson memberikan suatu guidance untuk mendapatkan daerah
kritis yang paling powerful (Most Powerful Critical Region/MPCR) berdasarkan sampel
acak yang diberikan.
Contoh:
• Suatu sampel acak diambil dari populasi yang berditribusi 𝐸𝑋𝑃(𝜃). Tentukan MP
CR untuk menguji 𝐻0 : 𝜃 = 𝜃0 melawan 𝐻1 : 𝜃 = 𝜃1 (jika 𝜃1 > 𝜃0)
Jawab:
1 σ𝑛
𝑖=1 𝑥𝑖
•𝐿 𝜃 = exp(− ), berdasar teorema NP, tolak 𝐻0 jika:
𝜃𝑛 𝜃
dengan syarat:
𝑛 1 1 𝜃0 𝑛
σ
𝑃{ 𝑖=1 𝑋𝑖 − ≤ ln 𝑘 𝜃0 = 𝛼 ⟺ 𝑃{σ𝑛𝑖=1 𝑋𝑖 ≥ 𝑘 ∗ 𝜃0 = 𝛼
𝜃1 𝜃0 𝜃1
∗ 𝜃0 𝑛 1 1
Dengan 𝑘 = (ln 𝑘 𝜃1
)/ 𝜃1
−𝜃 ,
0
1 1
Perhatikan perubahan tanda pertidaksamaan krn 𝜃1
−𝜃 < 0, jika 𝜃1 > 𝜃0
0
• Remember :
Distribusi sampling
statistik uji
Jika
statistik uji
• Maka:
𝑃{2 σ𝑛𝑖=1 𝑋𝑖 /𝜃0 ≥ 2𝑘 ∗ /𝜃0 } = 𝛼
2
jika 2𝑘 ∗ /𝜃0 dituliskan sebagai 𝜒1−𝛼(2𝑛) , maka daerah kritis adalah jika
2 σ𝑛𝑖=1 𝑥𝑖 /𝜃0 ≥ 𝜒1−𝛼(2𝑛)
2
konstan !!
Note: perhatikan kapan statistik uji berfungsi sebagai suatu statistik (fungsi peubah
acak) yang memiliki fungsi distribusi peluang (pdf) dan kapan berfungsi sebagai
suatu nilai observasi (konstan) !!!
Konsekuensi penetapan
• Research Question diletakkan pada Ha
• Pada Ho harus terdapat suatu nilai spesifik dari parameter (ada tanda “=“) ,
yang berasosiasi dengan nilai 𝛼
• Distribusi Statistik Uji didasarkan pada nilai parameter yang ada di Ho
• Jika berdasarkan data sampel dan daerah kritis yang ditetapkan keputusan
adalah “Menolak Ho”, maka peluang keputusan tersebut salah adalah
sebesar 𝛼
• Jika berdasarkan data sampel dan daerah kritis yang ditetapkan keputusan
adalah “Menerima Ho”, maka hanya dapat dikatakan bahwa “tidak cukup
bukti untuk mendukung Ha
(peluang keputusan tersebut salah adalah 𝛽 yg nilainya tidak kita hitung !!)
Terima Kasih