Anda di halaman 1dari 48

Persampelan dan Analisis Data

Oleh Mohammad Khatim Hasan

Statistik
Takrifan: Peralatan 6M bagi pemanipulasian datamengumpul, mengelas, meringkas, menyusun, menganalisis dan mentakrif data kuantitatif supaya kebolehpercayaan keputusan analisis dapat dinilai secara objektif. Ada dua: statistik berperihalan & aruhan

Pengkelasan Jenis data


Perwakilan: kuantitatif & kualitatif Bentuk: diskret & selanjar Tahap ukuran: nominal: boleh dikategori: ada nama @label tertentu: X boleh disusun. Oridinal: boleh disusun ikut tertib tapi perbezaan tak dapat ditafsirkan dgn jelas Selang: boleh disusun, perbezaan dapat ditafsirkan & termasuk bacaan negatif Nisbah: boleh disusun, perbezaan dapat ditafsirkan & bermula dgn sifar

Sumber data dan kaedah pungutan data


Ada 2: sumber primer & sekunder Sumber primer: ujikaji berekabentuk, bancian dan soal selidik, pemerhatian. Sumber sekunder: sumber terbitan

Populasi dan sampel


Populasi:set unit yang biasanya terdiri dari manusia, objek ataupun peristiwa yang ingin dikaji. Sampel: subset unit-unit dalam populasi.

Kaedah Persampelan
Dengan kebarangkalian: Persampelan rawak ringkas, bersistem, berstrata dan berkelompok. Tanpa kebarangkalian: persampelan selesa, berkuota, bola salji dan sukarela.

Pengujian Hipotesis
Oleh Mohammad Khatim Hasan

Pengenalan
1. Statistik yang membolehkan penyelidik membuat keputusan bagi sesuatu masalah yang dikaji ialah statistik aruhan / pentakbiran. 2. Penyataan mengenai ciri suatu populasi menerusi tatacara pentakbiran berstatistik dinamakan hipotesis berstatistik. 3. Hipotesis berstatistik sebenarnya cuba untuk menganggar suatu parameter populasi dengan bantuan maklumat dari sampel.

Sambungan
Hipotesis statistik adalah satu kenyataan yang dibuat tentang suatu populasi Kenyataan ini mungkin benar atau tidak Kebenaran kenyataan tersebut dibuat menggunakan ujian hipotesis

Kepentingan& Keperluan
Penting untuk menguji adakah perbezaan yang wujud diantara data dalam sampel dan populasi adalah benar-benar berbeza atau berbeza secara kebetulan sahaja.
Keputusan dapat dibuat dengan fakta saintifik.

Takrif
Takrif Hipotesis statistik adalah suatu pernyataan atau anggapan yang mungkin benar atau tidak terhadap suatu populasi atau lebih (Walpole, 1990).

Catatan:
Ho cenderung untuk di tolak. Ini bermaksud, kita seboleh-bolehnya hendak menolaknya kecuali terdapat bukti yang cukup kuat dari sampel yang menafikan penolakannya. Penolakan Ho tidak bermakna pernyataan dalam hipotesis tersebut palsu tetapi ia bermaksud bukti yang diperolehi dari sampel tidak mencukupi untuk menerimanya. Begitu juga sebaliknya.

Ralat Jenis 1 dan 2


2 jenis ralat yang wujud dalam ujian hipotesis. Ralat jenis I berlaku jika kita menolak H0 apabila dalam keadaan sebenar, ia benar dan ralat jeis II berlaku apabila kita tidak menolak H0 sedangkan dalam keadaan sebenar, ia palsu. Kb (Ralat Jenis I ) = dan Kb (Ralat Jenis II) =

Secara matematik
= kb (Ralat jenis I ) = kb ( tolak H0| H0 benar ) dan = kb (Ralat jenis II) = KB (Tidak tolak H0| H0 palsu)

Sambungan
dipanggil aras keertian dalam ujian hipotesis, dan ( 1- )100% dipanggil aras keyakinan. Nilai samada 0.01 , 0.05 , 0.10 ditentukan oleh penyelidik. Jika = 0.05 , maka kita yakin sebanyak 95% bahawa keputusan ujian adalah benar. Kita mahukan nilai dan sekecil yang mungkin.

Langkah-langkah pengujian
Penyataan hipotesis Taburan Aras keertian Statistik Ujian Kawasan Penolakan Pengiraan statistik ujian Keputusan Kesimpulan

Hipotesis nol dan alternatif


Perlu ditentukan sebelum ujian hipotesis dapat dijalankan. Hipotesis Nol
oSimbol Ho. oMesti yang membawa maksud kesamaan. oJadi ada 3 kemungkinan: sama ada = atau atau .

Sambungan
o Contoh:
Ho: = RM 2,000.00 sebulan. atau Ho: Purata pendapatan penduduk Bandar baru Bangi adalah RM2,000.00 sebulan.

sambungan
Hipotesis Alternatif oSimbol Ha.atau H1 o Mesti membawa maksud ketaksamaan. o Jadi ada 3 kemungkinan: sama ada atau < atau >. o Diterima jika Ho ditolak.

Sambungan
Contoh:
Ha: RM2,000.00 sebulan atau Ha: Purata pendapatan penduduk Bandar Baru Bangi bukan RM2,000.00 sebulan. Perhatikan!!! o Pernyataan dalam Ho dan Ha tidak boleh bertindan.

Jadual pemilihan Ho dan Ha.


Ho = Ha atau < atau > < >

Taburan
Taburan data sampel perlu di kenalpasti terlebih dahulu untuk membolehkan kita menggunakan statistik ujian yang betul. Bagi data yang diambil dari taburan normal, taburan sampel nya juga normal. Bagi data yang diambil dari taburan bukan normal, teorem had memusat diperlukan. Ujian kenormalan juga boleh digunakan untuk menguji adakah data tertabur secara normal.

Teorem Had Memusat


Bagi Min 1 sampel (2 sampel) Pertimbangkan satu populasi dengan min dan varians 2 . Katakan X1, X2,..,Xn satu sampel rawak saiz n (n1 dan n2) yang diambil daripada populasi tersebut. Untuk n besar iaitu n 30 (n1 30 dan n2 30), taburan pensampelan bagi min sampel , X akan menghampiri normal iaitu X N(,2/n)

Teorem Had Memusat


Bagi Perkadaran 1 sampel (2 sampel) taburan persampelan bagi akan menghampiri normal bagi saiz sampel yang cukup besar. Untuk kes perkadaran, saiz sampel akan dianggap besar jika np dan nq (n1p1, n2p2, n1q1 dan n2q2) kesemuanya perlu lebih besar dari 5.

Beberapa kaedah lain


oBina histogram oBina plot batang-daun oKira pekali kepencongan dan kepuncakannya. oGunakan hubungan min, mod dan median dengan bentuk taburan. oAtau gunakan perisian untuk menguji kenormalan data.

Aras Keertian
Aras keertian bagi suatu ujian adalah kebarangkalian melakukan ralat jenis I . Jika kita menggunakan =0.01, bermaksud jika Ho benar, kebarangkalian kita menolak hipotesis ini adalah bersamaan dengan 0.01.

Statistik Ujian
Jika sekiranya data tidak tertabur secara normal, kita perlu menggunakan ujian tak berparameter. Jika tertabur secara normal, boleh guna ujian berparameter.

Beberapa jenis ujian berparameter


o o o o o Ujian Z Ujian t Anova Ujian F Pekali Korelasi Pearson

Beberapa jenis ujian tak berparameter


oUjian tanda Ujian Pangkat bertanda Wilcoxon oUjian U-MannWhitney Ujian Jumlah Pangkat Wilcoxon oUjian Kruskal-Wallis Kkorelasi Pearson o Ujian Larian oUjian Friedman OUjian KolmogorovSmirnov oUjian McNemar oKorelasi Pangkat Spearman

Tetapi
Ujian yang boleh digunakan dalam teknik berparameter dan tak berparameter ialah ujian Khi-kuasa dua.

Kawasan Penolakan
o o o

Ada 3 jenis hujung ujian: 2 hujung 1 hujung sebelah kiri 1 hujung sebelah kanan
Bergantung kepada Ha. Kawasan penolakan adalah kawasan yang membolehkan Ho di tolak???

Nilai Kritikal
Nilai pemisah diantara kawasan penolakan dan kawasan penerimaan.

Keputusan Kesimpulan

Contoh Masaalah
Seorang penyelidik ingin menguji kelajuan enjin gelintar yang dibina untuk mencapai maklumat yang dikehendaki. Satu pengujian telah dijalankan ke atas 10 perkataan dan hasilnya adalah seperti di bawah (dalam saat) 2 1 3 1 2 0.5 0.9 0.8 1 0.7 Pembangun enjin tersebut mendakwa yang enjin tersebut boleh mencapai maklumat sebanyakbanyaknya 1 saat.

Hipotesis H0: min kelajuan data sebanyak-banyaknya 1 saat Ha: min kelajuan lebih dari 1 saat Taburan Jenis data selang Bilangan data 10 Bilangan sampel1 taburan t

Statistik Ujian dengan d.k=n-1 aras keertian katakan kita ingin menguji pada aras keertian 5%

Kawasan penolakan dari Ha di dapati ujian adalah ujian satu hujung. d.k.=10-1=9 Dari jadual taburan t didapati nilai kritikalnya ialah 1.833 Jadi Ho akan ditolak sekiranya nilai kiraan > 1.833

Kiraan Sebelum mengira nilai t, kita perlu kira dahulu min dan sisihan piawai bagi data di atas, Hasil dari kiraan didapati min=1.29 dan sisihan piawai=0.785211 di dapati nilai t kiraan < nilai kritikal, jadi H0 tidak ditolak. Kesimpulan Kita yakin sebanyak 95% bahawa tidak ada cukup bukti untuk menolak dakwaan yang menyatakan enjin gelintaran yang baru dibina ini mempunyai kelajuan capaian yang tinggi iaitu selewatlewatnya 1 saat.

Pokok Pemilihan Ujian

Analisis Menggunakan Excel


Installkan analisis data ke dalam Excel Beberapa langkah perlu diambil
Pilih Tool Pilih Add-ins Tandakan Analysis ToolPak Klik OK Ikut arahan untuk menginstall Data Analysis

Setelah di install
Pilihan Data Analysis akan wujud dalam menu Tool.

Kotak Dialog Data Analysis

Selain dari tadi

Contoh Penggunaannya
Menguji keberkesanan kaedah pengajaran
H1: Kaedah Pengajaran Berkesan

Hipotesis
Ho: Kaedah Pengajaran Tidak Berkesan

Taburan
Taburan t

Aras keyakinan
0.05

Sambungan
Statistik Ujian
Ujian t berpasangan

Kawasan Penolakan
Jika nilai-p (satu hujung) lebih kecil daripada aras keyakinan tolak H0

Perhatikan
Data

13 14 12 24 32

14 13 11 22 34

Pilih Data Analysis dari menu Tool

Kotak Dialog Terpapar

Hasil
t-Test: Paired Two Sample for Means sampel 1 sampel 2 Mean 19 18.8 Variance 76 89.7 Observations 5 5 Pearson Correlation 0.987085 Hypothesized Mean Difference0 df 4 t Stat 0.272166 P(T<=t) one-tail 0.399483 t Critical one-tail 2.131846 P(T<=t) two-tail 0.798966 t Critical two-tail 2.776451

Keputusan
Oleh kerana nilai-p satu hujung = 0.399483> 0.05, maka H0 tidak ditolak.

Kesimpulan
Kita yakin sebanyak 95% bahawa kaedah pengajaran itu tidak berkesan.