Anda di halaman 1dari 45

Pengenalan kepada ujian hipotesis

Zolkepeli 2017
Ujian Hipotisis
 Ujian hipotesis ialah kaedah menguji hujah (claim)
atau hipotesis berkaitan parameter dalam populasi
dengan menggunakan data yang diperolehi dari
sampel.
 Kita menguji hipotesis dengan menentukan sejauh
mana kemungkinan statistik sampel yang telah di
pilih menyamai atau menghampiri parameter
populasi.
Dengan kata mudah..
 Ujian Hipotesis ialah kaedah menguji sama ada hujah atau
hipotesis berbaitan populasi adalah kemungkinan benar.
Hujah (claim)
 Purata kanak-kanak malaysia menonton tv dalam sehari ialah
3 jam.
Pada kebiasaannya saya boleh menunggang basikal sejauh 100km dalam
masa kurang dari 4jam!!
Secara putara bilangan anak guru perempuan ialah 5 orang.
Hujah (claim)!!
 Pelajar dari latarbelakang sains akan cemerlang dalam
peperiksaan kursus ini!!!!
4 langkah dalam melakukan ujian
hipotesis
1. Nyatakan hipotesis
2. Tentukan kriteria untuk keputusan (menetapkan aras
signifikan)
3. Kira ujian statistik
4. Buat keputusan
Langkah 1: pernyataan hipotesis
 Hipotesis nul(H0), pernyataan berkaitan parameter
populasi, misalnya min populasi, yang ianya
dianggap betul.
 Hipotesis nul ialah titik permulaan. Kita akan menguji sama
ada nilai yang dinyatakan dalam nul hipotesis itu
kemungkinan benar.
Samb:Pernyataan hipotesis
 Hipotesis alternatif (H1 ): pernyataan yang secara langsung
berlawanan dengan apa yang dinyatakan dalam nul hipotesis;
boleh jadi kurang, lebih, atau tidak sama dengan nilai dalam
hipotesis nul.
 Hipotesis alternatif dinyatakan dengan apa yang kita fikirkan
salah berkenaan hipotesis nul.
Analogi dalam kes mahkamah
 Defenden apabila dibicarakan; juri menganggap ianya tidak
bersalah.
 Menjadi tanggungjawap pendakwa membuktikan ianya
bersalah.
 Dalam penyelidikan ,pernyataan hipotesis nul adalah benar
sebelum kajian dilakukan.
 Penyelidik menjalankan kajian bagi menunjukkan bukti
pernyataan itu tidak berlaku (tolak hipotesis nul) atau gagal
melakukanya ( kita kekalkan hipotesis nul.)
 Hipotesis Alternatif (H1) juga dikatakan sebagai menjadi
Hipotesis Kajian.
Mari belajar menulis hipotesis dari soalan
kajian!!
 Pernyataan masalah:…salah satu punca kanak-kanak tidak
aktif dan mengalami kegemukan ialah kerana mereka
mengadap tv terlalu lama.
 Soalan kajian: Adakah min jumlah jam menonton tv
dikalangan kanak-kanak obesiti di malaysia lebih dari 3 jam
sehari?
 Hipotesis:
 Hipotesis nul (Ho): purata menonton tv sehari ialah 3 jam.
 Ho: µ = 3 jam
 Hipotesis alternatif (H1): purata menonton tv sehari tidak sama
dengan 3 jam.
 H1: µ ≠ 3 jam
Langkah 2:Tentukan kriteria untuk keputusan

 Menetapkan kriteria untuk keputusan, kita nyatakan aras signifikan, α


(level of significance) untuk ujian.
 Sama seperti juri menetapkan sama ada bukti itu boleh
menimbulkan keraguan yang munasabah.
 Samalah juga dalam ujian hipotesis, kita mengumpul data dari
sampel yang berkemungkinan dari populasi bagi menunjukkan
hipotesis nul itu tidak betul. Kemungkinan itulah yang menjadi
kriteria.
 Dalam kajian sosial sains Kemungkinan atau aras signifikan
ditetapkan pada aras 5%.
 Apabila kebarangkalian memperolehi min sampel kurang dari 5%,
jika hipotesis nul adalah benar maka kita membuat kesimpulan
bahawa sampel yang kita pilih itu sangat berbeza dan kita
menolak hipotesis nul.
Aras signifikan, α
 Aras signifikan, α : menjadi kriteria atau “cut-
off” untuk membuat keputusan menolak atau
menerima hipotesis nul.
 Aras signifikan α juga menentukan risiko
melakukan ralat jenis 1 (Type I error)
 α adalah kebarangkalian kita melakukan ralat
jenis I.
µ=3
Kawasan kritikal (critical region)
 Kenalpasti kawasan kritikal. Kawasan kritikal adalah kawasan
dimana nilai min itu tidak akan berlaku jika hipotesis nul itu
benar.
 Dengan kata lain, 5% kebarangkalian kita menolak min =3,
padahal min itu adalah betul.

18
Langkah 3: Kira ujian statistik
 Ujian statistik ialah formula matematik yang membolehkan
penyelidik menentukan kemungkinan hasil dari sampel yang
di ambil jika hipotesis nul adalah benar.
 Nilai dari ujian statistik akan digunakan untuk membuat
keputusan terhadap hipotesis nul.
Apa yang berlaku ialah…
 Daripada sampel kajian anda mendapati min menonton tv
ialah 4 jam sehari.
 Melalui kiraan statistik kita akan dapat maklumat sejauh
mana, atau berapa sisihan piawai min sampel kita berbeza
dengan min populasi.
 Semakin besar nilai ujian statistik, semakin jauh min sampel
kita dari min populasi yang dinyatakan dalam hipotesis nul.
Langkah 4: Membuat keputusan
 Kita guna nilai dari ujian statistik untuk membuat keputusan
mengenai hipotesis nul.
 Keputusan adalah berdasarkan kebarangkalian
(p)memperolehi min sampel yang sama dengan yang
dinyatakan dalam hipotesisi nul.
 Jika kebarangkalian (p) memperolehi min sampel kurang
dari 5% bila hipotesis nul adalah benar, maka keputusanya
ialah kita menolak hipotesis nul.
 Jika kebarangkalian (p) min sampel besar dari 5% bila
hipotesis nul adalah benar, maka keputusannya ialah kita
kekalkan hipotesis nul.
Dua keputusan penyelidik boleh buat:
 1. Tolak hipotesis nul. Kebarangkalian yang rendah bagi
memperolehi min sampel yang menyamai seperti yang
dinyatakan dalam hipotesis nul yang di anggap betul.
 2. Kekalkan hipotesis nul. Kebarangkalian yang tinggi bagi
memperolehi min sampel yang menyamai seperti dinyatakan
dalam hipotesis nul yang di anggap betul.
Nilai p
 Nilai p adalah kebarangkalian untuk mendapatkan
nilai yang dinyatakan dalam hipotesis nul yang
dianggap benar.
 Nilai p akan dibandingkan dengan aras signifikan α
bila membuat keputusan.
 Keputusan menolak atau mengekalkan hipotesis nul
di panggil “signifikan”.
Keputusan
 Apabila nilai p kurang dari 0.05, kita mencapai signifikan;
keputusan adalah menolak hipotesis nul.
 Apabila nilai p besar dari 0.05, kita gagal mencapai signifikan ;
keputusan adalah kekalkan hipotesis nul.
Uji tahap kefahaman anda!
1. Nyatakan 4 langkah dalam ujian hipotesis.
2. Keputusan dalam ujian hipotesis adalah untuk kekal atau
tolak hipotesis mana; Hipotesis Nul atau Hipotesis
alterntif?
3. Kriteria atau aras signifikan dalam kajian sains sosial
selalunya ditetapkan pada nilai kebarangkalian berapa?
4. Jika ujian statistik nilai p kurang dari 0.05 atau 5%. Apakah
keputusan dalam ujian hipotesis ini?
5. Jika hipotesis nul ditolak, adakah kita mencapai signifikan?
Ralat-ralat dalam ujian hipotesis
 Hanya kerana min sampel (mengikuti rawatan) adalah
berbeza daripada min populasi, tidak semestinya
menunjukkan bahawa rawatan telah menyebabkan perubahan.
 Anda perlu ingat bahawa biasanya terdapat beberapa
perbezaan antara min sampel dan min populasi hanya akibat
dari ralat persampelan.

26
Ralat dalam Ujian Hipotesis (samb.)
 Oleh kerana ujian hipotesis bergantung kepada data sampel,
data sampel tidak benar-benar boleh dipercayai, sentiasa ada
risiko bahawa data yg mengelirukan akan menyebabkan ujian
hipotesis untuk mencapai kesimpulan yang salah.
 2 Jenis ralat mungkin berlaku.

27
Ralat jenis I
 Ralat Jenis Jenis I berlaku apabila data sampel muncul untuk
menunjukkan kesan rawatan apabila, pada hakikatnya tidak.
 Dalam kes ini, penyelidik akan menolak hipotesis nol dan kesilapan
menyimpulkan bahawa rawatan mempunyai kesan.
 Ralat Jenis I adalah disebabkan oleh sampel yang luar biasa dan tidak
mewakili. Hanya dengan peluang (nasib) penyelidik memilih sampel
yang melampau dengan keputusan bahawa sampel jatuh di rantau
kritikal walaupun rawatan tidak menunjukkan kesan.
 Ujian hipotesis distrukturkan supaya Ralat Jenis I adalah sangat tidak
mungkin; secara spesifik, kebarangkalian ralat Jenis I adalah sama
dengan aras signifikan α.

28
Ralat jenis II
 Ralat Jenis II berlaku apabila sampel tidak menunjukan
peningkatan, pada hakikatnya, rawatan sebenarnya
menyebabkan peningkatan.
 Dalam kes ini, penyelidik akan gagal untuk menolak
hipotesis nol dan secara silap akan menyimpulkan bahawa
rawatan tidak mempunyai kesan.
 Ralat Jenis II biasanya disebabkan oleh kesan rawatan yang
sangat kecil. Walaupun rawatan mempunyai kesan, ia tidak
cukup besar untuk muncul dalam kajian penyelidikan.

29
Rumusan: Kemungkinan ralat dalam keputusan
statistik
Ujian Berarah (Directional Tests)
 Apabila penyelidik meramalkan arah khusus untuk kesan rawatan
(kenaikan atau penurunan), ia adalah dibolehkan untuk
menggabungkan ramalan berarah ke dalam ujian hipotesis.
 Keputusannya dipanggil ujian berarah atau ujian satu hujung.
Ujian satu arah adalah termasuk ramalan arah dalam kenyataan
hipotesis dan di lokasi rantau kritikal.

31
Ujian berarah (smbg.)
 Sebagai contoh, jika populasi mempunyai min μ = 80
dan rawatan adalah diramalkan akan meningkatkan
markah, maka hipotesis nol akan menyatakan bahawa
selepas rawatan:
 H0: μ ≤ 80 (tiada peningkatan)
 Dalam kes ini, seluruh rantau kritikal akan terletak di
ekor kanan taburan kerana nilai-nilai yang besar untuk M
akan menunjukkan bahawa terdapat peningkatan dan
akan cenderung untuk menolak hipotesis nul.

32
Ujian tidak berarah (Nondirectional tests)
 Ujian Nondirectional, atau ujian dua hujung, adalah
ujian hipotesis di mana hipotesis alternatif
dinyatakan sebagai tidak sama (≠). Penyelidik
berminat dalam mana-mana alternatif dari hipotesis
nol.
Berdasarkan soalan berikut tuliskan hipotesis nul
dan hipotesis alternatif serta nyatakan arah ujian.
1. Adakah terdapat berbezaan purata gaji selepas bergraduasi
dari Universiti mengikut jantina?

 Ho: µlelaki = µperempuan


 H1: µlelaki ≠ µperempuan

 Ini adalah ujian hipotesis dua hujung.


2. Adakah terdapat perbezaan pencapaian dalam keputusan
peperiksaan kursus KP2 hasil dari tiga kaedah pengajaran?
Anggaran sela keyakinan
 Kita mempunyai maklumat mengenai populasi dan
menggunakan teori Taburan Persampelan, kita belajar
tentang sifat-sifat sampel.
 Taburan Persampelan juga memberi kita asas yang
membolehkan kita untuk mengambil sampel dan
menggunakannya untuk menganggar parameter populasi.
 Titik anggaran (point estimate) adalah satu nombor,
 Berapa banyak ketidakpastian dikaitkan dengan anggaran titik parameter populasi?
 Sela anggaran menyediakan maklumat lebih lanjut mengenai ciri-ciri populasi
daripada melakukan anggaran titik. Ia menyediakan tahap keyakinan untuk
anggaran. Anggaran sela tersebut dipanggil sela keyakinan (confidence
intervals).

Limit Atas
Limit Bawah Keyakinan
Keyakinan
Titik anggaran

Lebar sela keyakinan


 An interval gives a range of values:
 Takes into consideration variation in sample statistics from
sample to sample
 Based on observations from 1 sample (explain)
 Gives information about closeness to unknown population
parameters
 Stated in terms of level of confidence. (Can never be 100%
confident)
 The general formula for all confidence intervals is equal
to:
Point Estimate ± (Critical Value)(Standard Error)
 Suppose confidence level = 95%
 Also written (1 - ) = .95
  is the proportion of the distribution in the two tails areas
outside the confidence interval

 A relative frequency interpretation:


 If all possible samples of size n are taken and their means and
intervals are estimated, 95% of all the intervals will include the
true value of that the unknown parameter
 A specific interval either will contain or will not contain the true
parameter (due to the 5% risk)
Confidence Interval Estimation of
Population Mean, μ, when σ is known
 Assumptions
 Population standard deviation σ is known
 Population is normally distributed
 If population is not normal, use large sample

 Confidence interval estimate:

σ
x  X  Z
n
(where Z is the normal distribution’s critical value for a probability of α/2 in
each tail)
 Consider a 95% confidence interval:

1    .95   .05  / 2  .025

α .475 .475 α
 .025  .025
2 2
Z
Z= -1.96 0 Z= 1.96
Lower Upper
Confidence Point
Point Estimate
Estimate Confidence
Limit Limit

μ
μl μu
Confidence Interval Estimation of
Population Mean, μ, when σ is Unknown
 If the population standard deviation σ is unknown, we can
substitute the sample standard deviation, S
 This introduces extra uncertainty, since S varies from sample
to sample
 So we use the student’s t distribution instead of the normal Z
distribution
 Confidence Interval Estimate Use Student’s t Distribution :
S
  X  t n-1
n
(where t is the critical value of the t distribution with n-1 d.f. and an area of
α/2 in each tail)

 t distribution is symmetrical around its mean of zero, like Z dist.


 Compare to Z dist., a larger portion of the probability areas are in the tails.
 As n increases, the t dist. approached the Z dist.
 t values depends on the degree of freedom.