Anda di halaman 1dari 44

Kuliah 1- pengenalan

Kod Kursus: SKPX 2013 Bilangan Kredit: 3 Tahap kursus: Wajib Program

Nama pengajar: Nik Hairi Omar Tel: 03-8921-3937/4422 E-mel: hairi@ukm.my Bilik: Blok D (Ground floor)

1. Pengenalan - Kepentingan statistik dan analisis data 2. Skala pengukuran 3. Ukuran kecenderungan memusat dan ukuran serakan 4. SPSS 5. Korelasi bivariate dan partial 6. Regresi sehala, regresi berganda dan logistik 7. Ujian t bebas, berpasangan dan satu sampel 8. ANOVA sehala 9. Khi kuasa dua ujian kebebasan dan satu sampel 10. lain-lain tertakluk keadaaan : SPANOVA, MANOVA, MANCOVA, ANCOVA

Membezakan antara statistik deskriptif dengan statistik inferens. Menerapkan dan memilih analisis statistik yang sesuai dengan hipotesis dan tujuan analisis. Menjelaskan kegunaan beberapa metod analisis data. Mengaplikasikan perisian pakej komputer untuk analisis data dalam penyelidikan.

Aron, A., Aron, E. N. & Coups, E. J. 2009. Statistics for psychology (Fifth Edition). New Jersey: Prentice Hall. Gravetter, F. G. & Wallnau, L. B. 2007. Statistics for the behavioral sciences. (Seventh Edition). Singapore: Thomson Wadsworth Iran Herman. 2002. Perbandingan dua kumpulan. Alor Setar: Penerbitan Ustara. Iran Herman. 2004. Statistik dan analisis data sains sosial. Alor Setar: Penerbitan Ustara. Pagano, R. T. 2004. Understanding statistics in the behavioral science. (Seventh Edition). New York: Brooke/Coles Publishing Company. Zechmeister, E. B. & Posavac, E. J. 2003. Data analysis and interpretation in the behavioral sciences. Belmont, CA: Thomson/Wadsworth. Chua Yan Piaw. 2006. StatistikPenyelidikan (buku 1, 2,3,4,5). Kuala Lumpur: McGrawhill

Tugasan statistik individu Penglibatan i-folio Peperiksaan Pertengahan Semester Peperiksaan Akhir JUMLAH

- 25% - 5% - 20 % - 50 % 100%

Definisi (Herman, 2007) Statistik merupakan suatu teknik, metod, tatacara dan sistem untuk meneliti, menganalisis, memahami dan seterusnya memperihalkan tentang sesuatu perkara yang diselidik.

Dengan statistik, orang mendapatkan maklumat, fakta dan memudahkan pembaca untuk melihat data yang dipersembahkan. Ini adalah kerana statistik boleh meringkas dan mentafsirkan data. cth. Statistik juga dapat membantu seseorang itu membuat keputusan dalam keadaan ketidakpastian. Dengan itu, statistik merupakan satu kaedah saintifik yang mudah dan ringkas. Untuk memberi makna kepada data, dalam psikologi dan sains sosial yang lain, statistik adalah satu kemestian bagi setiap penyelidik yang menjalankan penyelidikan.

Statistik sering dikaitkan dengan penggunaan fakta dan nombor. Statistik itu adalah satu set metod dan peraturan yang digunakan untuk menyusun, meringkas dan memerihalkan data. Prosedur statistik ini memastikan bahawa maklumat atau data yang terhasil itu dipersembahkan dan diperihalkan dengan cara yang tepat, munasabah dan mudah untuk difahami.

10

Malah, penggunaan statistik ini juga membantu penyelidik dari keadaan yang tidak terurus kepada suatu keadaan yang teratur. Oleh yang demikian, statistik menyediakan penyelidik tentang suatu teknik yang piawai dan ia diketahui oleh kebanyakan penyelidik di seluruh dunia. Justeru itu, penyelidik lain mampu untuk mengetahui dan memahami apa yang dilakukan oleh seseorang penyelidik itu.

11

Kajian saintifik itu sering dikatakan satu kajian yang bersifat empirikal manakala metod statistik pula membolehkan penyelidik menerang, memerihal dan menganalisis data daripada penyelidikan yang telah dijalankan. Justeru itu, statistik boleh dikatakan satu alat utama untuk sains ataupun kajian saintifik. Sains adalah sebagai satu bidang yang mengandungi tatacara untuk melakukan penyelidikan dan statistik itu adalah sebahagian daripada tatacara yang perlu ada dalam bidang sains.
12

Populasi boleh didefinisikan sebagai satu set menyeluruh yang mengandungi individu, objek, benda, peristiwa yang mempunyai ciri-ciri yang hampir sama. Misalnya, populasi pelajar luar bandar yang mendaftar untuk memasuki universiti adalah mereka yang terdiri daripada pelajar yang tinggal di pekan-pekan kecil dan kampung-kampung. Penduduk Malaysia bolehlah dianggap sebagai populasi Malaysia. Sampel merujuk kepada satu set individu yang dipilih daripada populasi, selalunya diambil untuk mewakili populasi yang hendak dikaji.
13

Ia adalah sebahagaian daripada populasi yang dipilih dengan menggunakan metod pemilihan sampel. Misalnya, Mahasiswa Tahun pertama di Fakulti Kejuruteraan adalah sampel kepada populasi mahasiswa tahun pertama di Universiti Kebangsaan Malaysia. Di dalam penyelidikan, untuk mendapatkan sampel yang dikatakan baik dan mewakili populasi, ia hendaklah dipilih secara rawak dan mempunyai ciri-ciri populasi.

14

Parameter adalah ukuran populasi. Purata sesuatu pembolehubah misalnya digelar sebagai paramater populasi. Oleh itu, parameter adalah merujuk kepada nilai yang menggambarkan ciri-ciri populasi. Sebagai contohnya, purata berat badan pelajar Tadika ialah parameter min berat badan. Min populasi ditulis dengan huruf Greek iaitu huruf (sebutannya ialah miu) merupakan parameter populasi.

15

Statistik adalah ukuran nilai sesuatu sampel yang biasanya adalah merupakan hasil daripada analisis dan manipulasi data. Pensyarah yang berminat untuk mengetahui tahap pencapaian mahasiswa tahun pertama dalam subjek Pengantar Psikologi boleh mengira min skor Pengantar Psikologi semua mahasiswa tahun satu yang mengambil Pengantar Psikologi. Min pencapaian pelajar merupakan statistik yang diperoleh daripada sampel.

16

Pembolehubah bebas merujuk kepada pembolehubah yang mempengaruhi atau memberi kesan kepada sesuatu pembolehubah yang lain. Dalam banyak keadaan, pembolehubah bebas ini juga dikenali sebagai pembolehubah aktif yang boleh dimanipulasi oleh penyelidik. Pembolehubah terikat merujuk kepada sebarang pembolehubah yang dipengaruhi oleh pembolehubah bebas dan keadaan inilah yang menjadi minat penyelidik.

17

Keadaan dan sifat pembolehubah yang terlibat di dalam sesuatu penyelidikan perlu diketahui. Ini adalah kerana sifat dan keadaan pembolehubah boleh mempengaruhi jenis dan metod statistik yang akan digunakan. Dua jenis pembolehubah itu ialah pembolehubah kualitatif dan kuantitatif. Pembolehubah kualitatif mempunyai satu set subkelas yang saling eksklusif.

18

Dengan kata lain, pembolehubah kualitatif ini adalah pembolehubah yang mempunyai ciri saling eksklusif dan mempunyai sub kelas. Sebagai contoh, pembolehubah kualitatif ialah jantina mempunyai dua sub kelas iaitu lelaki dan perempuan. Individu yang mempunyai ciri-ciri tertentu sebagai lelaki dikelaskan kepada kumpulan lelaki. Sebaliknya individu yang ciri khususnya adalah perempuan dikelaskan sebagai perempuan. Sifat inilah yang dikatakan saling eksklusif.

19

Manakala pembolehubah kuantitatif, nilai-nilainya ditentukan secara membilang dan mengukur. Pembolehubah kuantitatif juga mengandungi nilai angka yang menunjukkan sifat yang berhubungan dengan objek pembolehubah tersebut. Umpamanya, jumlah ketidakhadiran pekerja dalam sesebuah pejabat dinyatakan dalam angka yang menunjukkan jumlah hari tidak hadir misalnya 0, 1, 2, 3. Markah yang diperoleh oleh pelajar dalam sesuatu mata pelajaran adalah juga sebagai pembolehubah kuantitatif seperti 24, 37, 45 dan 55 dsb.

20

Pembolehubah kuantitatif boleh dikategorikan kepada dua jenis iaitu jenis diskrit dan selanjar. Pembolehubah kuantitatif jenis diskrit merujuk kepada konsep angka yang hanya mempunyai satu nilai yang ditentukan, biasanya nilai integer. Nilai-nilai integer tersebut boleh diperoleh dengan cara membilang seperti bilangan kedatangan ke sekolah, markat peperiksaan, jumlah penduduk. Pembolehubah diskrit seringkali dicirikan sebagai pembolehubah yang menggunakan unit sebagai petunjuk pengukurannya.
21

Manakala pembolehubah kuantitatif jenis selanjar pula mempunyai penggiraan yang mempunyai apa sahaja nilai dalam skala pengukuran yang digunakan. Nilai-nilai numerik ini diperoleh secara mengukur dan nilai ini terdiri daripada nilai nombor bulat dan pecahanpecahannya. Sifat nilai atau markat yang digunakan mempunyai ciriciri kesinambungan. Antara contoh pembolehubah kuantitatif selanjar ini ialah berat badan, ketinggian, umur kematian, dan kelajuan memandu.

22

Analisis statistik deskriptif digunakan untuk memerihalkan keadaan data yang terdapat pada sampel kajian. Namun begitu, pemerihalannya adalah terhad kepada sampel sahaja dan ia selalunya tidak digunakan untuk membuat sesuatu kesimpulan atau generalisasi menyeluruh kepada populasi yang dikaji. Dengan itu, statistik deskriptif adalah satu prosedur statistik yang digunakan untuk meringkas, menyusun dan memudahkan huraian data yang terhasil daripada penyelidikan.

23

Analisis statistik inferensi adalah satu tatacara, prosedur dan teknik yang digunakan untuk membuat generalisasi atau kesimpulan kepada populasi di mana sampel itu dipilih. Teknik analisis inferensi ini menggunakan konsep dan hukum kebarangkalian. Oleh itu, untuk menjamin bahawa generalisasi dan kesimpulan yang menyeluruh itu tepat, maka beberapa tatacara kebarangkalian perlu diikuti agar pemerihalan terhadap populasi besar yang kadangkala sifatnya sejagat dapat diyakini meskipun kita hanya menggunakan data daripada sampel kajian.
24

Dalam sains sosial, terdapat 3 pilihan dalam menjalankan penyelidikan.


kajian berbentuk kuantiatif - pemerihalan angka-angka atau memilih kajian kualitatif penganalisisan perkataan, perucapan atau gabungan kedua-duanya

Kajian kuantitatif biasanya melibatkan pengumpulan data primer melalui borang soalselidik persampelan (satu aktiviti menyeluruh dalam proses pengambilan SAMPEL dan elemennya) Kajian kuantitatif boleh juga dijalankan melalui penggunaan data sedia ada daripada arkib atau perangkaan penting contohnya manipulasi ke atas ILR, MCLJ, Statistik Buruh, Statistik Kementerian Pendidkan etc. Andaikan anda telah mempunyai satu tajuk kajian, objektifnya yang jelas, telah menjalankan literatur, menyiapkan borang soalselidik dan menjalankan kegiatan persampelankini anda telah mempunyai data.

Pertanyaan saya :
Apakah yang akan anda lakukan ke atas data yang anda perolehi itu?

Jawapannya???
Anda perlu menganalisis data berkenaan

Bagaimana nak analisis? Dalam statistik ada 2 pilihan dalam menganalisis dan membentang data
Kaedah deskriptif Kaedah inferensi

KAEDAH DESKRIPTIF = satu kaedah utk mengumpul, menyusun, menyukat dan membentangkan data secara ringkas dan bermakna agar data yang banyak dapat disimpulkan (diringkaskan) dengan menggunakan indeks seperti indeks serakan ( e.g. sisihan piawai, varian, julat,) indeks kepusatan (e.g. min, median, mod), indeks peratusan, kekerapan, kuartil, etc. Berdasarkan indeks berkenaan dapatlah dibuat kesimpulan ke atas sampel yang diperhatikan dan hasilnya boleh dibentang dalam bentuk jadual kekerapan, histogram, graf, carta etc.

Statistik inferensi = adalah satu kaedah membuat generalisasi/keputusan ke atas populasi secara munasabah berdasarkan maklumat yang terhad daripada sampel. Dalam statistik inferensi terdapatnya pengujian hipotesis ke atas maklumat daripada sampel bagi tujuan merumuskan ciri-ciri populasi. Oleh itu kaedah pengumpulan data mestilah dilakukan dengan tepat, misalnya kaedah persampelan mestilah rawak, data mestilah normal, dan boleh dipercayai (alpha test)

Pilihan kaedah analisis dalam statistik inferensi adalah luas, ia terutamanya sangat bergantung kepada persoalan/tujuan kajian.
1. 2. 3.

Meneliti / menerangkan perbezaan Meneliti perkaitan /perhubungan Membuat peramalan

Keberkesanan Sikap . Persepsi Tahap kesedaran Tahap-tahap

Kecenderungan memusat seperti min, median, mod, taburan kekerapan, julat, sisihan piawai, varian.
deskriptif

Boleh juga menggunakan analisis skor, perbandingan min, penyilangan, khikuasadua tertakluk kepada skala data

Apakah hubungan Apakah perbezaan Pengaruh A ke atas B, C Jangkaan, ramalan.

Hubungan =
korelasi, regresi Perbezaan = ujian t, anova, khi-kdua

inferensi

Pengaruh = korelasi, regresi, Pemfaktoran/fakto rial Jangkaan = regresi Penggunaan tertakluk kepada data, biasanya data

Namun demikian secara keseluruhannya penggunaan sesuatu kaedah statistik sama ada deskriptif atau inferensi bergantung kepada 5 faktor berikut:
1. 2. 3. 4. 5.

Persoalan dan tujuan kajian Jenis variabel dan skala data yang digunakan Kaedah persampelan yang digunakan Bilangan sampel Sifatnya keadaan taburan data

Hyperlink

1.

Persoalan dan tujuan kajian Semua penyelidikan bermula dengan isu/masalah. Daripada permasalahan kajian yang ditimbulkan itulah bangkitnya persoalan yang hendak dikaji. Persoalan kajian ini pula bolehlah dibahagikan secara amnya kepada 3 jenis tujuan Pada akhirnya tujuan kajian inilah yang akan menentukan corak analisis statistik yang bakal anda gunakan samada anda akan memilih statistik deskriptif atau inferensi atau menggabungkan kedua-duanya

Contoh 1: Meneliti kesan/impak sosio-ekonomi akibat daripada sesuatu fenomena yang berlaku. Contohnya mengkaji kesan kegawatan ekonomi 19971999 ke atas ekonomi Malaysia. Kesan kegawatan boleh dilihat ke atas variabel seperti pendapatan perkapita, Aliran masuk pelaburan, kadar gunatenaga, tingkat pengangguran, perbelanjaan industri dan sebagainya. Jika hanya berminat menghuraikan kesan-kesan sahaja, kita bolehlah menggunakan statsitik deskriptif yang mengaplikasikan teknik min, median, mod, julat, sisihan piawai, min sisihan, chi-square, frekuansi dan jadual silang (crosstab) untuk menerangkan keadaan di atas.

Contoh 2: Meneliti perbezaan sosio-ekonomi yang berlaku ke atas sesebuah populasi sebagai akibat daripada peristiwa-peristiwa tertentu/fenomena tertentu dsb. Misalnya kita berminat mengkaji perbezaan paras pendapatan antara etnik, jantina, negeri, wilayah, kampung etc. Kaedah statistik yang sesuai ialah kaedah inferensi seperti ujian t, ANAVA, Chi-Square, Kruskal Wallis etc

Contoh 3: Meneliti perhubungan/perkaitan/pengaruh sesuatu variabel ke atas sesuatu variabel lain. Misalnya pengaruh persekitaran pejabat ke atas tingkat kepuasan kerja atau pengaruh komponen pampasan ke atas tingkat kepuasan kerja. Di sini adalah jelas kita ingin menerangkan hubungan variabel yang dikaji, maka analisis inferensi seperti korelasi pearson atau speaman digunakan. Regresi juga sesuai digunakan

2. Jenis angkubah/variabel dan skala data yang digunakan Angkubah sebarang objek kajian, manusia atau peristiwa. Ada 2 jenis Angkubah iaitu angkubah bersandar dan angkubah bergantung Sifat Angkubah adalah bergantung pada skala pengukuran data yang digunakan. Iaitu sama ada Angkubah kategorikal atau sebenar Ada 4 jenis skala pengukuran yang menentukan ciri angkubah kajian iaitu - skala nominal, ordinal, interval dan skala nisbah

Contoh: jika kedua-dua jenis variabel kajian (variabel bergantung dan bebas) adalah variabel nominal, maka tidak mungkin statistik inferensi seperti ujian t, ANOVA, korelasi dan regresi boleh digunakan. Sebaliknya anda perlu menggunakan ujian Khi-kuasadua atau menggunakan statsitik deskriptif seperti mod atau kaedah taburan biasa dan crosstabulation (jadual silang).

Contoh 1: Ujian T : Angkubah bergantung (DV) mestilah data nisbah, rangking atau gabungan data ordinal (seperti skala Likert atau bersiri). Angkubah bebas (IV) mestilah angkubah nominal yang mengandungi dua elemen atau data nisbah yang dibahagi kepada dua bahagian (cut point). Contoh, pendapatan (DV) dan jantina (IV).

Ujian ANOVA : Angkubah bergantung mestilah data nisbah, rangking atau gabungan data ordinal dari skala Likert (bersiri). Angkubah bebas mestilah angkubah nominal yang mengandungi lebih dua elemen. Contoh: DV seperti umur sebenar dan IV seperti etnik. Ujian Korelasi dan Regresi : Kedua-dua DV dan IV mestilah data nisbah, rangking, data ordinal atau gabungan data ordinal (dalam beberapa keadaan bergantung kepada jenis korelasi/regresi). Bagi pengkaji yang telah mahir dan tinggi ilmu statistiknya, mereka barupaya menggunakan data nominal seperti jantina untuk membuat regresi sebagai dummy, tetapi ini tidak akan saya sentuh dalam perbincangan ini.

Ujian Khi-Kuasa dua :


Kedua-dua DV dan IV mestilah satu pembolehubah nominal. Misalnya kita boleh andaikan penonton mempunyai minat yang sama terhadap pasukan England, Belgium dan Brasil. Apakah ini benar dari segi kekerapan iaitu benarkah tiada beza secara statistik di antara apa yang dijangka dan apa yang dicerap? Dalam kes ini ketiga-tiga pasukan adalah DV manakala undi penonton adalah IV. Bagi menggunakan khi-kuasadua juga, data selanjar (data nisbah/berterusan) boleh ditransformasikan atau dikategorikan kepada beberapa kumpulan.

3. Kaedah persampelan yang digunakan Statistik Deskriptif Boleh menggunakan persampelan rawak atau bukan rawak. Jadi sama ada data normal atau tidak normal tidak menjadi masalah. Penggunaan kaedah persampelan ini bergantunglah pula pada tujuan kajian dan kebolehdapatan kerangka persampelan, kos penyelidikan, masa dan tenaga. Statistik Inferensi mesti melibatkan persampelan rawak, jika tidak hasil kajian akan dipersoalkan atas alasan bias dan kesilapan total persampelan.

4. Bilangan sampel :

secara amnya, sampel minimum bagi tujuan kajian inferensi adalah 30-35 orang, atau 10-15% daripada saiz populasi yang accessible dalam kajian. Biasanya kalau saiz sampel adalah kecil, statistik deskriptif sahaja. Bagi statistik inferensi mesti melibatkan sekumpulan sampel yang agak banyak (lebih banyak lebih baik) iaitu melebihi 35 orang. Kebiasaannya statistik inferensi digunakan untuk tujuan memerihalkan sifat populasi, jadi sudah tentulah sampelnya mesti mewakili sekurangkurangnya 10% populasi dan dipilih secara rawak.

5. Sifatnya keadaan taburan data

iaitu sama ada data yang dikutip itu pada akhir-akhir kajian (melalui penerokaan data) akan didapati normal atau tidak: Bertaburan normal/hampir mewakili taburan normal (data min, median, mod adalah sekata). Bermakna ciri statistik dan parameter saling mewakili. Dalam hal ini statisik inferensi bolehlah digunakan misalnya statistik ujian t, ANOVA, korelasi dan regresi. Tidak bertaburan normal (min, median, mod tidak sekata). Ini bermaksud sebaik sahaja data itu diperolehi, statistik telah memaklumkan kepada kita bahawa sifat statistik sudah tidak mewakili parameter atau ciri-ciri populasi yang hendk digenerasilasikan. Ini juga bermaksud ada data yang sangat tersisih, atau terjarak. Jadi gunakan kaedah statsitik non parametrik.