TM6013
ANALISIS DATA
Hazura Mohamed
DATA ANALISIS
Objektif :
Skew = 0
Skew > 0
“positive skew”
Skew < 0
“negative skew”
Analisis Bivariat
Korelasi
Arah
Kekuatan
Pearson r (interval data)
Spearman (ordinal data)
Data
Teknik--teknik berstatistik adalah
ditentukan oleh jenis data.
Pemahaman asas mengenai jenis data
membantu dalam pemilihan kaedah
analisis dan ujian statistik yang sesuai
Jenis Data
Dua jenis data iaitu:
Data Kuantitatif-numerik
nilai-nilai data adalah bilangan atau ukuran berangka.
Data kuantitatif boleh dalam bentuk:
Diskret - Boleh mengambil nilai-nilai yang tepat sahaja.
Contoh: bilangan buah bagi setiap pokok dalam kebun, saiz kasut
bagi pelajr sebuah kelas dan bilangan anak dalam setiap keluarga
dsbnya atau
Selanjar- Tidak boleh mengambil nilai yang tepat tetapi
boleh dihampirkan kepada ukuran tertentu
Contoh: tinggi pelajar, berat buah jambu , halaju kereta, PNGK pelajar-
pelajar sarjana UKM-NPC, gaji pensyarah dan sebagainya.
Jenis Data
Data Kualitatif- bukan numerik
Nilai-nilai data adalah kategori bukan
berangka.
Cth: jenis darah, jantina
Skala Pengukuran
Data Nominal
Data nominal sesuai pada data yang hanya dapat
diklasifikasikan ke dalam kategori, nama atau label.
Kategori tidak dapat disusun mengikut urutan.
Dapat memberikan nilai numerik pada kategori tapi
tidak dapat melakukan operasi matematik terhadap
nilai-nilainya.
Cth: male = 0 dan female = 1, budak ceria = 1 dan
budak tak ceria = 2
Skala Pengukuran
Data Ordinal
Sama seperti data nominal.
Membezakan ialah data boleh disusun mengikut urutan.
Tetapi kita tidak boleh mengukur perbezaan di antara dua data.
Kita dapat memberikan nilai numerik namun tidak dapat melakukan
operasi matematik
Cth:
Pengundi-pengundi diklasifikasikan sebagai low-income, middle-income, or high-
income
Frekuensis Penerbangan: tidak pernah, jarang, kadang-kadang, selalu.·
Bagaimana penilaian anda terhadap restoran itu? Sangat baik, baik, cukup, kurang.
Skala Pengukuran
Data Interval/Sela
Data interval adalah sama spt data ordinal iaitu data boleh
disusun.
Perbezaan antara data bermakna dan boleh diukur.
Cth. Senarai suhu-suhu didih bagi cecair yang berbeza. Kita
boleh tahu samada suhu didih cecair A lebih tinggi daripada
suhu didih cecair B. jika suhu didih cecair A adalah 212darjah
dan suhu didih cecair B adalah 284 darjah , suhu didih cecair
B adalah lebih tinggi daripada suhu didih cecair A.
Nilai sifar bersifat arbitrari.(tidak menggambarkan kosong
secara mutlak)
Skala Pengukuran
Data Nisbah(ratio data)
Data nisbah adalah sama seperti data interval kecuali nisbah memberi
makna..
Data ratio mempunyai nilai kosong secara mutlak. Nilai kosongnya mempunyai
bawa sekarang. Berikut adalah hasilnya : $21, $50, $65, and $300.
Adakah data ini boleh disusun ikut urutan? Ya, $21 < $50 < $65 < $300.
mereka bawa.
Individu yang mempunyai $300 adalah mempunyai 6 kali ganda daripada
Mode X X X
Median X X
Mean X
Statistik Inferens
Pengujian Hipotesis
Pengujian hipotesis merupakan kaedah yang
paling berkesan untuk membuat kesimpulan
mengenai suatu populasi yang dikaji
berpandukan keputusan yang didapati daripada
sampel.
Hipotesis statistik adalah satu kenyataan yang
dibuat tentang suatu populasi
Kenyataan ini mungkin benar atau tidak
Benar atau tidak +++> lakukan pengujian
hipotesis
Kepentingan & Keperluan
Penting untuk menguji adakah
perbezaan yang wujud di antara data
dalam sampel dan populasi adalah
benar-benar berbeza atau berbeza
secara kebetulan sahaja.
Takrif Hipotesis
Hipotesis statistik adalah suatu
pernyataan atau anggapan yang
mungkin benar atau tidak terhadap
suatu populasi atau lebih (Walpole,
1990).
Hipotesis yang baik mempunyai sifat-
sifat seperti berfokus, jelas, logik,
difahami dan dapat diuji.
Langkah-langkah Pengujian
Hipotesis
Penyataan hipotesis
Jenis Taburan Data
Aras keertian
Ujian Statistik
Kawasan Penolakan
Pengiraan ujian statistik
Keputusan
Kesimpulan
Pernyataan Hipotesis
Hipotesis nol ditandakan dengan H0 ialah
hipotesis yang hendak diuji dan diharap akan
ditolak.
atau
Ho: = RM 4,000.00 sebulan.
Pernyataan Hipotesis
Hipotesis alternatif ditandakan dengan H1 , biasanya
dinamakan hipotesis penyelidik yang dirumuskan dengan
harapan untuk menerimanya.
Kebiasaannya sebarang pernyataan yang hendak dibuktikan
benar, ditulis dalam hipotesis alternatif
Mesti membawa maksud ketaksamaan.
o Jadi ada 3 kemungkinan: sama ada atau < atau >.
o Diterima jika Ho ditolak.
atau
H1: < 4,000.00 .
Pernyataan Hipotesis
Kesilapan-kesilapan yang dibuat:
Pernyataan hipotesis penyelidikan yang terlalu
kabur. Cth: terdapat hubungan kecerdasan dan
sikap
Pernyataan hipotesis penyelidikan yang terlalu
umum. Cth: pelajar yang bijak mempunyai sikap
yang baik
Pernyataan hipotesis penyelidikan dalam bentuk
yang tidak boleh diuji. Cth: pelajar yang rajin ke
kuliah lebih beriman
Taburan Data
Taburan data sampel perlu di kenalpasti terlebih dahulu
untuk membolehkan kita menggunakan statistik ujian yang
betul.
Bagi data yang diambil dari taburan normal, taburan sampel
nya juga normal. Bagi data yang diambil dari taburan bukan
normal, teorem had memusat diperlukan.
Ujian kenormalan juga boleh digunakan untuk menguji
adakah data tertabur secara normal.
oBina histogram , Bina plot batang-daun
oKira pekali kepencongan dan kepuncakannya.
taburan.
oAtau gunakan perisian untuk menguji kenormalan data.
Aras Keertian
Menerima atau menolak H0 bergantung kepada tahap
signifikan atau aras keertian (level of significance)
Aras keertian ditandakan dengan simbol
Juga dipanggil sebagai kebarangkalian berlakunya ralat jenis I,
iaitu dalam membuat keputusan, hipotesis nol ditolak
sedangkan pada hakikat ianya benar.
Maka semakin besar nilai , semakin besar kemungkinan kita
akan menolak hipotesis nol yang benar
Lazimnya nilai yang digunakan ialah 0.1, 0.01 atau 0.05
Ujian Statistik
Sebelum memilih suatu ujian statistik , tanya:
Berapa banyak pembolehubah kajian?
Phi
Two nominal variables
Coefficient
Ordinal Spearman's r
Nominal Chi-Squared
Two-group between-
Ordinal Sign test, Wilcoxon's rank-sum test ,U-Mann
subject
Whitney test(tidak bersandar)
Interval or Ratio Student's t-test
Keputusan
Kesimpulan
Jenis ralat statistik
Semua keputusan ujian statistik bergantung kepada samada
menolak atau menerima hipotesis nol.
Namun ianya dipengaruhi oleh 2 ralat statistik
Ralat jenis I
berlaku jika kita menolak H0 apabila dalam keadaan sebenar, ia
benar dan
Ralat jeis II
berlaku apabila kita tidak menolak H 0 sedangkan dalam keadaan
sebenar, ia palsu.
Kb (Ralat Jenis I ) = dan Kb (Ralat Jenis II) =
Oleh itu penyelidik menetapkan aras keertian pada 0.05 iaitu hanya 5 dari
100 sahaja dibenarkan membuat ralat jenis 1
Secara Matematik
= kb (Ralat jenis I )
= kb ( tolak H0| H0 benar )
dan
= kb (Ralat jenis II)
= KB (Terima H0| H0 palsu)
Pokok Pemilihan Ujian
Analisis Menggunakan SPSS
Apa itu SPSS?
SPSS (Statistical Package for the Social
Sciences)
Satu sistem yang berupaya mengurus data dan
menganalisis secara berstatistik.
Mudah digunakan dan boleh memanipulasi data.
Tetapi SPSS tidak boleh menyelesaikan
sebarang masalah anda.
Ia boleh digunakan untuk menganalisis data
Yang penting, anda mesti ada pengetahuan
asas mengenai statistik untuk mentafsirkan
output.
Analisis Grafik dan Diskriptif
Data Nominal – Frequency, Crosstabs,
bar charts dan pie charts
Data Ordinal - Frequency, Crosstabs
dan descriptivee statistics, bar charts,
pie charts, steam-lesf plots
Data selanjar – descriptive statistics,
histograms, boxplots, dan scatter plot
bagi dua pembolehubah
3 kumpulan Ujian berstatistik
inferensi
Kumpulan 1. Menguji jika terdapat perbezaan
yang bererti di antara dua pembolehubah;
Kumpulan 2. Menguji kesignifikanan
hubungan di antara dua pembolehubah; dan
Kumpulan 3. Menguji jika terdapat perbezaan
yang signifikan diantara lebih daripada dua
pembolehubah.
Analisis Inferensi
Kumpulan 1. Menguji jika terdapat perbezaan yang
bererti di antara dua pembolehubah
Nominal atau ordinal – guna Crosstabs
Data selanjar –
Pertama, periksa jika data normal
Untuk periksa kenormalan, go to ‘Analyze’, ‘descriptive statistics’,
‘explore’
Kedua, jika membandingkan dua atau lebih kumpulan, periksa
kehomogenan bagi varians di antara kumpulan.
Guna ‘explore’
Bagi perbandingan dua kumpulan, guna Independent t-test bagi
independent sample dan dependet t-test bagi paired sample
Jika tidak normal guna analyze nonparametric test
independent sample atau dependent sample
Analisis Inferensi
Kumpulan 2. Menguji kesignifikan
hubungan di antara dua pembolehubah
Nominal data – guna crosstab dan pilih
ujian yang sesuai untuk nominal data
Ordinal data – guna crosstabs, bivariate
correlation spt pekali korelasi Spearman
Data Selanjar – guna bivariate correlation
spt Pearson correlation
Analisis Inferensi
Kumpulan 3. Menguji jika terdapat
perbezaan yang bererti di antara lebih
dua pembolehubah
Bagi data tidak normal pilih
Analyze nonparametric test k independet
test
Bagi data normal
Analyze compare mean ANOVA
Descriptive Statistics
Procedure
The Crosstabs Procedure in SPSS
The Crosstabs Procedure in SPSS
Adakah terdapat perbezaan di
antara kumpulan kajian
Mengkaji hubungan di antara
pembolehubah kajian
Jika taburan data bukan
tertabur normal
Sekian
Terima Kasih