Anda di halaman 1dari 28

FUNDAMENTAL CONCEPT OF

TESTING HYPOTHESES

Erni Tri Astuti


Dosen Politeknik Statistika STIS
Badan Pusat Statistik
pembuktian Keputusan …
(data & fakta) …

dugaan sementara …. aturan …


JUSTICE !!!
• GUILTY • INNOCENT

GUILTY INNOCENT
TRUTH
DECISION TRUTH

INNOCENT GUILTY

• GUILTY • INNOCENT

ERROR !!!
Nonstatistical Hypothesis Testing…
• Terdapat 2 hipotesis (terdakwa bersalah/tidak bersalah)
• Prosedur pengujian dimulai dengan anggapan Terdakwa tidak bersalah
• Tujuan adalah memutuskan apakah cukup bukti untuk menyatakan the alternative
hypothesis is true, or the null is not likely to be true.
• Akan terdapat 2 kemungkinan keputusan seperti halnya hipotesis yang diberikan.
Menyimpulkan cukup bukti untuk menyatakan terdakwa bersalah, atau tidak cukup
bukti untuk menyatakan terdakwa bersalah
• Terdapat 2 jenis kesalahan yang dibuat dalam pengambilan keputusan tersebut,
Type I error : muncul apabila Ho ditolak (menyatakan terdakwa bersalah) akan
tetapi sebenarnya tidak bersalah
Type II error : muncul apabila Ho diterima (menyatakan tdk ckp bukti terdakwa
bersalah) akan tetapi sebenarnya bersalah
Proses Pengujian Hipotesis Statistik

Hipotesis Data Aturan


Keputusan
(populasi) (sampel) (statistik uji)
PEMODELAN STATISTIKA & STATISTIKA INFERENSIA
Theoritical Review …..
❑ Pemodelan Statistika (statistical modeling): suatu proses menjelaskan suatu fenomena/pattern pada
sekumpulan data dengan menggunakan persamaan matematika
❑ Dalam pemodelan statistika digunakan sedikit data (sampel) untuk melakukan generalisasi seluruh
data (populasi)

Populasi
❑ Sifat/karakteristik yg diamati dari elemen populasi →
Variabel/Peubah
❑ Skala pengukuran Variabel → nominal/ordinal (kualitatif) atau
interval/rasio(kuantitatif)
❑ Kumpulan hasil pengukuran variable → data

❑ Sample Space (S): Himpunan Semua kemungkinan hasil percobaan


Elemen (data)
Populasi ❑ Random variable (X): fungsi yg mentransformasi data
(kuantitatif/kualitatif) menjadi bilangan Real (diskrit atau kontinyu)
❑ Sebaran/distribusi nilai random variabel dinyatakan dalam bentuk
fungsi distribusi peluang/pdf →population pdf (𝑓(𝑥; 𝜃))
parameter
PEMODELAN STATISTIKA & STATISTIKA INFERENSIA
Theoritical Review …..

Population pdf Random Samples (iid RV’s)


𝑓(𝑥; 𝜃) 𝑋1 , 𝑋2 , … , 𝑋𝑛

X Observed Value of Random


Samples
𝑥1, 𝑥2, … , 𝑥𝑛

f : assumed to be known
𝜃: completely unknown Function of Random Samples
𝜃 ∈ Ω (𝑝𝑎𝑟𝑎𝑚𝑒𝑡𝑒𝑟 𝑠𝑝𝑎𝑐𝑒) 𝑆 = 𝑔 𝑋1 , 𝑋2 , … , 𝑋𝑛
ത 𝑆2
e.g: 𝑋,
CDF/MGF/
Transformation Pdf of statistic: 𝑓 𝑠, 𝜃
Techniques 𝑠 ∈ 𝑅 (𝑠𝑎𝑚𝑝𝑙𝑒 𝑠𝑝𝑎𝑐𝑒) 7
Hipotesis Statistik:
• What?
suatu pernyataan mengenai kondisi populasi (parameter/sebaran populasi) yang
masih harus dibuktikan kebenarannya
• Jenis Hipotesis?
Hipotesis Nol (Ho) vs Hipotesis Alternatif (Ha)
Pada umumya pertanyaan penelitian (research question) diletakkan sbg Hipotesis
Alternatif, sementara itu pernyataan yang me”niada/nol”kan research question
dinyatakan sebagai Hipotesis Nol
Nilai parameter yang dinyatakan dalam hipotesis (tunggal/komposit) merupakan
himpunan bagian dari Parameter space
Research Question →Hipotesis Statistik

Suatu obat jenis baru lebih mampu menyembuhkan penyakit tertentu

• 𝐻𝑜 : 𝑝 = 0.7 𝑣𝑠 𝐻𝑎 : 𝑝 = 0.9 , 𝑝: 𝑝𝑒𝑙𝑢𝑎𝑛𝑔 𝑠𝑒𝑚𝑏𝑢ℎ 𝑜𝑏𝑎𝑡 𝑗𝑒𝑛𝑖𝑠 𝑏𝑎𝑟𝑢


• 𝑋𝑖 ~𝐵𝐼𝑁 1, 𝑝 , 𝑖 = 1,2, … , 𝑛

Harapan hidup perempuan lebih tinggi dibandingkan laki-laki

• 𝐻𝑜 : 𝜇𝐿 = 𝜇𝑃 𝑣𝑠 𝐻𝑎 : 𝜇𝐿 < 𝜇𝑃 , 𝜇𝑃 : 𝑟𝑎𝑡𝑎 − 𝑟𝑎𝑡𝑎 𝑢𝑚𝑢𝑟 𝑝𝑒𝑟𝑒𝑚𝑝𝑢𝑎𝑛


• 𝑋𝑖 ~𝑁 𝜇𝐿 , 𝜎 2 ; 𝑌𝑗 ~𝑁 𝜇𝑝 , 𝜎 2 , 𝑖 = 1,2, … , 𝑛1 , 𝑗 = 1,2, … , 𝑛2
Data( 𝒙𝟏 , 𝒙𝟐 , … , 𝒙𝒏 )& Daerah Kritis Pengujian (C)
• Asumsi distribusi Data (populasi) → perlu diuji (goodness of fit test)
• Keputusan untuk Menolak Ho, ditetapkan berdasarkan suatu daerah
kritis C yang merupakan himpunan bagian dari sample space dari suatu
statistik (ringksan data) → (𝐶 ⊂ 𝑅)
• Statistik (uji) → fungsi distribusi/pdf 𝑓 𝑠, 𝜃 , 𝑠 ∈ 𝑅 (𝑠𝑎𝑚𝑝𝑙𝑒 𝑠𝑝𝑎𝑐𝑒)
• Jika nilai observasi dari statistik terletak pada C (𝑠 ∈ 𝐶), maka Ho
ditolak, sebaliknya Ho diterima
Kesalahan dalam Pengambilan Keputusan
Kesalahan dlm Pengujian Hipotesis
Contoh:

50 53 55
Ilustrasi Perubahan Daerah Kritis
MP/UMP Test →Neyman Pearson lemma
Fungsi kuasa Uji
• Pada pengujian hipotesis komposit, jika diberikan daerah kritis dengan taraf
nyata (𝛼) ditetapkan (fixed) → nilai maksimum dari peluang kesalahan jenis I
yang ditolerir
• Konsekuensinya, harus terdapat suatu nilai tertentu (𝜃0 ) pada hipotesis nol
dimana 𝛼 dicapai (kurva fungsi kuasa uji melalui titik 𝜃0 , 𝛼
• Bentuk hipotesis pada 𝐻0 adalah satu diantara 3 kemungkinan berikut:
(1) 𝐻0 ∶ 𝜃 = 𝜃0 𝑣𝑠 𝐻1 ∶ 𝜃 ≠ 𝜃0
(2) 𝐻0 ∶ 𝜃 ≤ 𝜃0 𝑣𝑠 𝐻1 ∶ 𝜃 > 𝜃0
(3) 𝐻0 ∶ 𝜃 ≥ 𝜃0 𝑣𝑠 𝐻1 ∶ 𝜃 < 𝜃0
• perhatikan bahwa selalu ada tanda = pada 𝐻0 yang mengimplikasikan
ditetapkannya (dikontrolnya) nilai peluang salah jenis I (𝛼)!!!

11.17
Contoh:
• Diketahui suatu populasi berdistribusi 𝑁(𝜇, 16), diambil sampel acak
sebanyak 36 untuk menguji hipotesis
𝐻0 ∶ 𝜇 ≥ 50 𝑣𝑠 𝐻1 ∶ 𝜇 < 50
• Jika diterapkan taraf nyata pengujian 𝛼 = 0.05, tentukan
daerah kritis pengujian dalam bentuk:
a. 𝐶1 = 𝑥ҧ 𝑥ҧ < a}
b. 𝐶2 = 𝑥ҧ 𝑥ҧ > b
c. 𝐶3 = 𝑥ҧ 𝑥ҧ < c Uഥ𝑥 > d}
• Bandingkan fungsi kuasa uji dari 3 daerah kritis tersebut,
manakah yang paling reasonable ?

11.18
Jawab:
a. Untuk daerah kritis C1, saat 𝜇 = 𝜇0 = 50
𝑎−50
0,05 = 𝑃(𝑋ത < a|𝜇0 = 50) = P Z < 4 = 𝑃(𝑍 < 𝑧0.05)
6

Dari table N(0,1) → 𝑧0.05 = −1.645


𝑎−50 4
4 = −1,645 ⟺ 𝑎 = −1.645 + 50 = 48. 9033
6
6

𝐶1 = 𝑥ҧ 𝑥ҧ < 48.9033}
b. Untuk daerah kritis C2,
𝑏−50
0,05 = 𝑃(𝑋ത > b|𝜇0 = 50) = P Z > 4 = 𝑃 𝑍 > 𝑧0.95
6
𝑏−50 4
4 = 1,645 ⟺ 𝑎 = 1.645 + 50 = 51.09667
6
6

𝐶2 = 𝑥ҧ 𝑥ҧ > 51.09669
c. Untuk daerah kritis C3,
𝑐−50 𝑑−50
0,05 = 𝑃(𝑋ത < c|𝜇0 = 50) + 𝑃(𝑋ത > d|𝜇0 = 50) = P Z < 4 + P Z > 4
6 6

= P Z < 𝑧0.025 + 𝑃(𝑍 > 𝑧0.9755) → 𝑐 = 48.69336 dan d=51.30664


𝐶3 = 𝑥ҧ 𝑥ҧ < 48.69336 𝑎𝑡𝑎𝑢 𝑥ҧ > d=51.30664
11.19
𝐻0 ∶ 𝜇 ≥ 50 𝑣𝑠 𝐻1 ∶ 𝜇 < 50
𝜇 C1 C2 C3 Ideal
45.0 1.0000 0.0000 1.0000 1.000
45.5 1.0000 0.0000 1.0000 1.000
Perbandingan Fungsi Kuasa Uji
46.0 1.0000 0.0000 1.0000 1.000 C1 C2 C3 Ideal
46.5 0.9998 0.0000 0.9995 1.000 1.00
47.0 0.9978 0.0000 0.9945 1.000 0.95
47.5 0.9824 0.0000 0.9633 1.000 0.90
0.85
48.0 0.9123 0.0000 0.8508 1.000
0.80
48.5 0.7274 0.0000 0.6141 1.000 0.75
49.0 0.4423 0.0008 0.3230 1.000 0.70
0.65
49.5 0.1854 0.0083 0.1165 1.000
0.60
50.0 0.0500 0.0500 0.0500 0.050 0.55
50.5 0.0083 0.1854 0.1165 0.000 0.50
0.45
51.0 0.0008 0.4424 0.3230 0.000
0.40
51.5 0.0000 0.7274 0.6141 0.000 0.35
52.0 0.0000 0.9123 0.8508 0.000 0.30
52.5 0.0000 0.9824 0.9633 0.000 0.25
0.20
53.0 0.0000 0.9978 0.9945 0.000 0.15
53.5 0.0000 0.9998 0.9995 0.000 0.10
54.0 0.0000 1.0000 1.0000 0.000 0.05
0.00
54.5 0.0000 1.0000 1.0000 0.000 45.0 46.0 47.0 48.0 49.0 50.0 51.0 52.0 53.0 54.0 55.0
55.0 0.0000 1.0000 1.0000 0.000

Daerah Kritis C1 memberikan kuasa uji yang paling dekat dengan kurva Ideal
(paling powerful) dibanding C2 dan C3
11.20
𝐻0 ∶ 𝜇 ≤ 50 𝑣𝑠 𝐻1 ∶ 𝜇 > 50
𝜇 C1 C2 C3 Ideal
45.0 1.0000 0.0000 1.0000 0.000
45.5 1.0000 0.0000 1.0000 0.000
Perbandingan Fungsi Kuasa Uji
46.0 1.0000 0.0000 1.0000 0.000 C1 C2 C3 Ideal
46.5 0.9998 0.0000 0.9995 0.000 1.00
47.0 0.9978 0.0000 0.9945 0.000 0.95
47.5 0.9824 0.0000 0.9633 0.000 0.90
0.85
48.0 0.9123 0.0000 0.8508 0.000
0.80
48.5 0.7274 0.0000 0.6141 0.000 0.75
49.0 0.4423 0.0008 0.3230 0.000 0.70
0.65
49.5 0.1854 0.0083 0.1165 0.000
0.60
50.0 0.0500 0.0500 0.0500 0.050 0.55
50.5 0.0083 0.1854 0.1165 1.000 0.50
0.45
51.0 0.0008 0.4424 0.3230 1.000
0.40
51.5 0.0000 0.7274 0.6141 1.000 0.35
52.0 0.0000 0.9123 0.8508 1.000 0.30
52.5 0.0000 0.9824 0.9633 1.000 0.25
0.20
53.0 0.0000 0.9978 0.9945 1.000 0.15
53.5 0.0000 0.9998 0.9995 1.000 0.10
54.0 0.0000 1.0000 1.0000 1.000 0.05
0.00
54.5 0.0000 1.0000 1.0000 1.000 45.0 46.0 47.0 48.0 49.0 50.0 51.0 52.0 53.0 54.0 55.0
55.0 0.0000 1.0000 1.0000 1.000

•Daerah Kritis C2 memberikan kuasa uji yang paling dekat dengan kurva Ideal
(paling powerful) dibanding C1 dan C3
11.21
𝐻0 ∶ 𝜇 = 50 𝑣𝑠 𝐻1 ∶ 𝜇 ≠ 50
𝜇 C1 C2 C3 Ideal
45.0 1.0000 0.0000 1.0000 1.000
45.5 1.0000 0.0000 1.0000 1.000
Perbandingan Fungsi Kuasa Uji
46.0 1.0000 0.0000 1.0000 1.000 C1 C2 C3 Ideal
46.5 0.9998 0.0000 0.9995 1.000 1.00
47.0 0.9978 0.0000 0.9945 1.000 0.95
47.5 0.9824 0.0000 0.9633 1.000 0.90
0.85
48.0 0.9123 0.0000 0.8508 1.000
0.80
48.5 0.7274 0.0000 0.6141 1.000 0.75
49.0 0.4423 0.0008 0.3230 1.000 0.70
0.65
49.5 0.1854 0.0083 0.1165 1.000
0.60
50.0 0.0500 0.0500 0.0500 0.050 0.55
50.5 0.0083 0.1854 0.1165 1.000 0.50
0.45
51.0 0.0008 0.4424 0.3230 1.000
0.40
51.5 0.0000 0.7274 0.6141 1.000 0.35
52.0 0.0000 0.9123 0.8508 1.000 0.30
52.5 0.0000 0.9824 0.9633 1.000 0.25
0.20
53.0 0.0000 0.9978 0.9945 1.000 0.15
53.5 0.0000 0.9998 0.9995 1.000 0.10
54.0 0.0000 1.0000 1.0000 1.000 0.05
0.00
54.5 0.0000 1.0000 1.0000 1.000 45.0 46.0 47.0 48.0 49.0 50.0 51.0 52.0 53.0 54.0 55.0
55.0 0.0000 1.0000 1.0000 1.000

Daerah Kritis C3 memberikan kuasa uji yang paling dekat dengan kurva Ideal
(paling powerful) dibanding C1 dan C2

11.22
Most Powerful Test (MP Test)
Definisi:
Suatu pengujian 𝐻0 : 𝜃 = 𝜃0 melawan 𝐻1 : 𝜃 = 𝜃1 berdasarkan suatu daerah kritis C
dikatakan most powerful critical region atau most powerful test dengan ukuran 𝛼 jika:
1. 𝐾𝐶 𝜃0 = 𝛼 dan
2. 𝐾𝐶 𝜃1 ≥ 𝐾𝐷 𝜃1 , ∀ daerah kritis D lainnya yang juga berukuran 𝛼 (𝐾𝐷 𝜃0 = 𝛼)

• Pada contoh2 sebelumnya, diberikan 2 atau lebih daerah kritis yang memiliki peluang
melakukan salah jenis I (𝛼) yang sama, kemudian untuk menentukan daerah kritis yg
lebih powerful adalah dengan membandingkan nilai 𝛽 (terkecil) atau 1 − 𝛽 (terbesar)
• Teorema Newman Pearson memberikan suatu guidance untuk mendapatkan daerah
kritis yang paling powerful (Most Powerful Critical Region/MPCR) berdasarkan sampel
acak yang diberikan.
Contoh:
• Suatu sampel acak diambil dari populasi yang berditribusi 𝐸𝑋𝑃(𝜃). Tentukan MP
CR untuk menguji 𝐻0 : 𝜃 = 𝜃0 melawan 𝐻1 : 𝜃 = 𝜃1 (jika 𝜃1 > 𝜃0)
Jawab:
1 σ𝑛
𝑖=1 𝑥𝑖
•𝐿 𝜃 = exp(− ), berdasar teorema NP, tolak 𝐻0 jika:
𝜃𝑛 𝜃

dengan syarat:
𝑛 1 1 𝜃0 𝑛
σ
𝑃{ 𝑖=1 𝑋𝑖 − ≤ ln 𝑘 𝜃0 = 𝛼 ⟺ 𝑃{σ𝑛𝑖=1 𝑋𝑖 ≥ 𝑘 ∗ 𝜃0 = 𝛼
𝜃1 𝜃0 𝜃1
∗ 𝜃0 𝑛 1 1
Dengan 𝑘 = (ln 𝑘 𝜃1
)/ 𝜃1
−𝜃 ,
0
1 1
Perhatikan perubahan tanda pertidaksamaan krn 𝜃1
−𝜃 < 0, jika 𝜃1 > 𝜃0
0
• Remember :
Distribusi sampling
statistik uji
Jika
statistik uji
• Maka:
𝑃{2 σ𝑛𝑖=1 𝑋𝑖 /𝜃0 ≥ 2𝑘 ∗ /𝜃0 } = 𝛼
2
jika 2𝑘 ∗ /𝜃0 dituliskan sebagai 𝜒1−𝛼(2𝑛) , maka daerah kritis adalah jika
2 σ𝑛𝑖=1 𝑥𝑖 /𝜃0 ≥ 𝜒1−𝛼(2𝑛)
2

Nilai obs dari statistik uji 2


Nilai tabel 𝜒(2𝑛) dgn peluang
kumulatif sebelah kiri (1 − 𝛼)
Prosedur Pengujian (metoda)
• Suatu sampel acak diambil dari populasi yang berdistribusi 𝐸𝑋𝑃(𝜃).
• Ingin diuji Hipotesis:
𝐻0 : 𝜃 = 𝜃0 melawan 𝐻1 : 𝜃 = 𝜃1 (jika 𝜃1 > 𝜃0 )
• Diberikan taraf nyata 𝛼
• Statistik Uji : statistik !!
𝑛
2 2
𝑋 = 2෍ 𝑋𝑖 /𝜃0 ~ 𝜒(2𝑛)
𝑖=1
• Keputusan:
2
Tolak 𝐻0 jika 𝑋𝑜𝑏𝑠 = 2 σ𝑛𝑖=1 𝑥𝑖 /𝜃0 > 𝜒1−𝛼(2𝑛)
2

konstan !!
Note: perhatikan kapan statistik uji berfungsi sebagai suatu statistik (fungsi peubah
acak) yang memiliki fungsi distribusi peluang (pdf) dan kapan berfungsi sebagai
suatu nilai observasi (konstan) !!!
Konsekuensi penetapan
• Research Question diletakkan pada Ha
• Pada Ho harus terdapat suatu nilai spesifik dari parameter (ada tanda “=“) ,
yang berasosiasi dengan nilai 𝛼
• Distribusi Statistik Uji didasarkan pada nilai parameter yang ada di Ho
• Jika berdasarkan data sampel dan daerah kritis yang ditetapkan keputusan
adalah “Menolak Ho”, maka peluang keputusan tersebut salah adalah
sebesar 𝛼
• Jika berdasarkan data sampel dan daerah kritis yang ditetapkan keputusan
adalah “Menerima Ho”, maka hanya dapat dikatakan bahwa “tidak cukup
bukti untuk mendukung Ha
(peluang keputusan tersebut salah adalah 𝛽 yg nilainya tidak kita hitung !!)
Terima Kasih

Anda mungkin juga menyukai