Anda di halaman 1dari 9

Pengenalan kepada Statistik

1.1

Apakah Statistik?

Perkataan statistik mempunyai berbagai makna di dalam budaya kita. Websters Third New International Dictionary memberikan definasi statistik yang komprenhensif sebagai sains yang berurusan dengan pungutan, analisis, tafsiran dan persembahan data numerik. Dari sudut pandangan ini, statistik akan kita bincangkan di dalam kursus ini. Statistik juga merupakan satu cabang matematik, dan banyak daripada sains statistik berdasarkan kepada pemikiran matematik, dan terbitannya. Banyak daripada bidang-bidang akademik, termasuk perniagaan, menawarkan kursus statistik di dalam disiplinnya. Walau bagaimanapun, statistik telah menjadi satu bidang pengajian di dalam bidangnya. Manusia kerapkali menggunakan perkataan statistik dengan merujuk kepada kumpulan data. Sebagai contoh, mereka mungkin berkata mereka memungut statistik dari operasi perniagaan mereka. Apa yang mereka rujukkan adalah mengukur kenyataan dan angka. Pilihan model kereta dan lain-lain juga menggunakan perkataan statistik untuk merujuk kepada kematian. Pernyataan statistik adalah digunakan sekurang-kurangnya di dalam dua cara yang penting. Pertama, statistik boleh merupakan pengukuran perihalan yang dikira daripada sampel dan digunakan untuk membuat penerangan terhadap populasi. Penggunaan ini akan dicincangkan kemudian. Kedua, statistik merupakan taburan yang digunakan di dalam analisis data. Sebagai contoh, penyelidik menggunakan taburan t untuk menganalisis data yang akan merujuk kepada statistik-t di dalam menganalisis data. Berikut merupakan beberapa penggunaan yang biasa bagi perkataan statistik: a. b. c. d. e. Sains yang memungut, menganalisis, mentafsir dan mempersembahkan data. Cabang metematik Kursus pengajian Kenyataan dan angka Pengukuran yang diambil dari sampel

Pengenalan Kepada Statistik

f.

Jenis taburan yang digunakan untuk menganalisis data.

1.2

Statistik Perihalan dan Pentaabiran

Kajian statistik boleh disusun di dalam berbagai-bagai cara. Salah satu daripada cara ialah membahagikan statistik kepada dua cabang: Statistik perihalan dan statistik pentaabiran. Untuk memahami perbezaan di antara statistik perihalan dan pentaabiran, definasi populasi dan sampel adalah amat berguna. Populasi didefinasikan sebagai pungutan manusia, objek, atau item yang diminati. Populasi secara meluas menerangkan kategori seperti semua kenderaan, atau boleh menerangkan secara terperinci sebagai semua kereta Proton yang dikeluarkan pada tahun 2000. Populasi boleh juga sebagai kumpulan manusia, seperti semua pelajar di FEP, UPM, atau boleh jadi set objek, seperti semua TV yang dikeluarkan oleh Sony di Petaling Jaya. Apabila penyelidik memungut data dari seluruh populasi bagi sesuatu ukuran yang diminati, ia dipanggil sebagai bancian. Semua orang biasa dengan bancian isirumah Malaysia yang dijalankan oleh Jabatan Perangkaan Malaysia. Ia dilakukan 10 tahun sekali untuk mengukur taraf kehidupan semua rakyat di Malaysia. Sampel adalah bahagian daripada keseluruhan, jika ia diambil dengan sempurna, ia mewakili keseluruhan. Untuk beberapa sebab yang tertentu, penyelidik biasanya lebih gemar untuk menggunakan sampel berbanding dengan populasi. Sebagai contoh, di dalam menjalankan ujikaji kawalan kualiti untuk mementukan purata tempoh hayat mentol lampu, pengilang mentol lampu mungkin mengambil sampel rawak hanya 75 biji mentol lampu sahaja di dalam proses pengeluarannya. Disebabkan oleh batasan masa dan kewangan, pengurusan sumber manusia mungkin hanya mengambil sampel rawak pekerja berbanding menggunakan bancian untuk mengukur moral pekerja. Jika penyelidik menggunakan data yang diambil keatas kumpulan untuk menerangkan atau membuat kesimpulan terhadap kumpulan yang sama, statistik tersebut dipanggil statistik perihalan. Sebagai contoh, jika saorang pensyarah mengeluarkan statistik untuk meringkaskan keputusan peperiksaan kelas dan menggunakan statistik tersebut untuk membuat kesimpulan hanya keatas kelas tersebut, statistik tersebut adalah perihalan. Pensyarah boleh menggunakan statistik tersebut untuk membincangkan purata kelas, bercakap mengenai jeda markah kelas, atau mempersembahkan lain-lain pengukuran data untuk kelas berdasarkan keatas ujian.

Pengenalan Kepada Statistik

Satu jenis lain statistik dipanggil sebagai statistik pentaabiran (inferen statistics). Jika penyelidik memungut data daripada sampel dan menggunakan statistik tersebut untuk membuat kesimpulan terhadap populasi dimana sampel tersebut diambil, statistik tersebut adalah statistik pentaabiran. Data yang dipungut adalah digunakan untuk mentaabir sesuatu berkaitan kumpulan yang besar. Statistik pentaabiran kadangkala dipanggil sebagai statistik induktif. Ukuran perihalan bagi populasi dipanggil sebagai parameter. Parameter biasanya ditandakan menggunakan huruf Greek. Contoh-contoh parameter adalah purata populasi (), varian populasi (2), dan sisihan piawai populasi. Ukuran perihalan bagi sampel dipanggil statistik dan biasanya ditandakan dengan huruf roman. Contoh statistik adalah purata sampel ( X ), varian sampel (S2) dan sisihan piawai sampel (S).

Perbezaan di antara parameter dan statistik adalah penting hanya di dalam penggunaan statistik pentaabiran. Ahli statistik biasanya mahu untuk menganggar nilai parameter atau menjalankan ujian terhadap parameter. Walau bagaimanapun, pengiraan parameter biasanya sama ada tidak mungkin atau tidak boleh laksana disebabkan oleh jumlah masa dan wang yang diperlukan untuk membuat bancian. Di dalam kes tersebut, ahli-ahli statistik akan mengambil sampel rawak daripada populasi, mengira statistik keatas sampel dan membuat pentaabiran dengan menganggar nilai parameter. Asas bagi statistik pentaabiran adalah kebolehannya untuk membuat keputusan berkaitan parameter tanpa melakukan bancian lengkap terhadap populasi. Pentaabiran berkaitan parameter adalah dibuat di bawah ketakpastian. Melainkan parameter adalah dikira secara terus daripada populasi, ahli-ahli statistik tidak mengetahui secara pasti sama ada penganggaran atau pentaabiran yang dibuat daripada sampel adalah benar atau tidak. Di dalam usaha untuk menganggar paras keyakinan di dalam proses menghasilkan keputusan, ahli-ahli statistik menggunakan pernyataan kebarangkalian.

1.3

Taraf Pengukuran Data

Berjuta-juta data dipungut di dalam perniagaan setiap hari. Semua data tersebut sepatutnya tidak dianalisis dengan cara yang sama secara statistik disebabkan entiti yang diwakili oleh data tersebut adalah berebza. Oleh sebab itu, ahli-ahli statistik perlu untuk mengetahui taraf pengukuran data yang diwakili oleh data tersebut. Penggunaan biasa nombor boleh digambarkan oleh nombor 2 dan 10, yang boleh mewakili berat dua jenis barangan, pemeringkatan (rating) yang

Pengenalan Kepada Statistik

diterima keatas ujian pelanggan oleh dua jenis barangan, atau nombor jersi bola sepak. Walaupun 10 kg adalah lima kali ganda 2 kg, tetapi nombor 10 pada jersi penyerang bola sepak bukanlah lima kali ganda nombor 2 pada jersi pertahanan. Melakukan purata bagi berat barangan adalah menasabah tetapi membuat purata pada nombor jersi pemain bola sepak tidak memberikan apa-apa makna. Analisis data yang bersesuaian adalah bergantung kepada taraf pengukuran data yang dikutip. Phenomena yang diwakili oleh nombor menentukan taraf pengukuran data. Empat jenis taraf pengukuran data yang biasa adalah seperti berikut: a. b. c. d. Nominal Ordinal Interval Kadar

1.3.1

Taraf Nominal
Pengukuran data yang paling rendah adalah taraf nominal. Nombor mewakili data taraf nominal boleh digunakan hanya untuk pengelasan dan kategori. Nombor pengenalan kakitangan adalah sebagai contoh data nominal. Nombor yang digunakan hanyalah untuk membezakan kakitangan dan bukanlah untuk memberikan pernyataan nilai terhadap mereka. Banyak soalan-soalan demografi di dalam survei adalah data nominal disebabkan soalan yang digunakan hanyalah untuk pengelasan sahaja. Contoh soalan seperti tersebut adalah: Manakah klasifikasi pekerjaan yang terbaik menerangkan bidang kerja anda? A. B. C. D. E. F. Pendidik Pekerjaan binaan Pekerja Perkilangan Penguam Doktor Lain-lain

Oleh yang demikian, untuk tujuan pengiraan, pendidik ditandakan sebagai 1, pekerjaan binaan sebagai 2, pekerja perkilangan sebagai 3, dan seterusnya. Nombor hanyalah digunakan untuk mengkelaskan pekerja sahaja. Nombor 1 bukan menandakan pengkelasan tertinggi. Ia hanya bertujuan untuk membezakan di antara pendidik (1) dan doktor (5).

Pengenalan Kepada Statistik

Lain-lain data demografi seperti bangsa, jantina, tempat tinggal dan lainlain merupakan data bertaraf nominal.

1.3.2

Taraf Ordinal
Pengukuran data bertaraf ordinal adalah lebih tinggi daripada nominal. Disamping itu, data ordinal boleh digunakan untuk memeringkatkan atau menyusun objek. Sebagai contoh, dengan menggunakan data ordinal, penyelia boleh menilai tiga orang pekerja dengan memeringkatkan produktiviti mereka dengan nombor 1 hingga 3. Penyelia boleh mengenalpasti, satu pekerja amat produktif, saorang pekerja kurang produktif dan saorang lagi tidak produktif menggunakan data ordinal. Walau bagaimanapun, penyelia tidak boleh menggunakan data ordinal untuk membuktikan interval di antara dua orang pekerja yang diperingkatkan sebagai 1 dan 2 atau pekerja diperingkat 2 dan 3 adalah sama. Iaitu, ia tidak boleh menyatakan bahawa perbezaan di antara oekerja diperingkat 1, 2 dan 3 adalah sama. Dengan data ordinal, jarak yang diwakili oleh nombor yang berturutan adalah tidak selalunya sama.

Beberapa soalan soal-selidik jenis skala Likert yang selalu digunakan oleh penyelidik adalah jenis ordinal. Berikut adalah contoh skala tersebut:
Kualiti perkhidmatan yang diberi oleh Bank di Malaysia adalah baik. Amat Bersetuju 1 Bersetuju 2 Tidak Pasti 3 Tidak Bersetuju 4 Amat tidak Bersetuju 5

Apabila soalan survei ini dikodkan kedalam komputer, hanya nombor 1 hingga 5 sahaja yang dimasukkan bukannya keterangannya. Secara maya semua orang bersetuju bahawa 5 lebih tinggi daripada 4 di dalam skala ini dan pemeringkatan tindakbalas adalah mungkin. Walau bagaimanapun kebanyakan responden tidak mempertimbangkan perbezaan di antara Amat Tidak Bersetuju, Tidak Bersetuju, Tidak Pasti, Bersetuju dan Amat Bersetuju adalah sama.

Sebagai contoh lain, dana pelaburan sebagai pelaburan yang diperingkatkan di dalam sebutan risiko dengan menggunakan ukuran risiko biasa, risiko kewangan dan risiko kadar faedah. Tiga ukuran ini adalah digunakan kepada pelaburan dengan

Pengenalan Kepada Statistik

memeringkatkannya sebagai mempunyai risiko yang tinggi, sederhana dan rendah. Katakan risiko tinggi ditandakan sebagai 3, sederhana risiko sebagai 2 dan tidak berisiko sebagai 1. Jika dana tersebut dilabelkan sebagai 3 berbanding 2, ia mempunyai risiko yang lebih dan seterusnya. Walau bagaimanapun, perbezaan risiko di antara kategori 1,2 dan 3 tidak semestinya sama. Oleh itu, pengukuran risiko ini hanyalah taraf pengukuran ordinal. Disebabkan oleh data nominal dan ordinal biasanya diterbitkan daripada pengukuran seperti soalan demografi, kategori manusia atau objek, atau pemeringkatan sesuatu item, data nominal dan ordinal adalah data bukan metrik atau kadangkala dipanggil sebagai data kualitatif. 1.3.3 Taraf Interval Pengukuran data interval adalah taraf data yang tertinggi sedikit. Pengukuran interval mempunyai semua kandungan data taraf ordinal, tetapi jarak di antara nombor berturutan mempunyai makna dan data selalunya adalah numerik. Jarak adalah diwakili oleh perbezaan di antara nombor berturutan adalah sama. Contoh pengukuran interval adalah nombor suhu Farenheit, suhu boleh diperingkatkan, jumlah kepanasan di antara bacaan berturutan, seperti 21o, 22o dan 23o. Disamping itu, dengan paras data interval, titik sifar hanyalah konvension atau keselesaan dan bukan semula jadi atau tetap pada titik sifar. Oleh itu, sifar hanyalah titik lain di atas skala dan tidak bermakna ia tidak ujud di dalam fenomena. Sebagai contoh, 0o F bukanlan suhu terendah yang mungkin. Contoh lain data taraf interval adalah peratus perubahan di dalam pekerjaan, peratus pulangan keatas pelaburan dan perubahan di dalam harga saham. Dengan data taraf interval, transformasi unit dari satu pengukuran kepada yang lain melibatkan pendharaban dengan faktor tertentu, , dan menambah dengan faktor lain, , oleh itu Y = + X. Sebagai contoh, untuk mengubah suhu Calcius kepada suhu Farenheit melibatkan perhubungan

Pengenalan Kepada Statistik

F =32 +

9 C 5

1.3.4

Taraf Kadar
Ukuran taraf kadar adalah taraf pengukuran data yang tertinggi. Data kadar mempunyai kandungan yang sama sebagaimana data interval, tetapi data perkadaran mempunyai nilai mutlak sifar dan kadar bagi dua nombor adalah bermakna. Notasi nilai mutlak sifar bermakna nilai sifar adalah tetap dan oleh itu ujud nilai sifar di dalam data yang mewakili ketidakhadiran ciri-ciri yang dikaji. Nilai sifar tidak boleh secara arbitrari diletakkan disebabkan ia mewakili titik tetap. Definasi ini membolehkan statistik mengujudkan kadar dengan data. Contoh data kadar adalah tinggi, berat, jumlah jualan dan sebagainya. Dengan data kadar, penyelidik boleh menyatakan 180 kg adalah lebih berat daripada 90 kg atau sebaliknya, dan membuat kadar 180:90. Disebabkan oleh data taraf interval dan kadar biasanya diperolehi daripada alatan yang biasanya digunakan di dalam proses pengeluaran dan proses kejuruteraan, di dalam ujian piawai kebangsaan, atau tatacara perakaunan piawai, ianya dipanggil data matrik dan kadangkala dirujukkan sebagai data kuantitatif.

1.4 Perbandingan Empat Taraf data


Rajah 1.1 menunjukkan perhubungan potensi penggunaan di antara empat taraf pengukuran data. Empat persegi yang tertinggi menandakan setiap kategori paras data boleh dianalisis dengan sebarang teknik yang digunakan keatas taraf data yang terendah, tetapi sebagai tambahan, boleh dianalisis menggunakan sebarang teknik statistik yang boleh digunakan terhadap lain-lain tiga jenis data ditambah dengan yang lain.

Data nominal adalah data yang amat terhad di dalam jenis analisis staistik yang boleh digunakan dengan mereka. Data ordinal membolehkan penyelidik untuk melakukan sebarang analisis yang boleh dilakukan dengan data nominal ditambah dengan yang lain. Melalui data kadar, ahliahli statistik berkebolehan untuk membuat perbandingan pendharaban dan bersesuaian melakukan sebarang analisis yang boleh dilakukan oleh data

Pengenalan Kepada Statistik

nominal, ordinal atau interval. Sesetengah teknik statistik memerlukan data kadar dan tidak boleh digunakan untuk menganalisis lain-lain taraf data.
Teknik statistik boleh digunakan di dalam dua kategori statistik parametrik dan statistik tidak berparametrik. Statistik parametrik memerlukan data interval atau kadar. Jika data adalah nominal atau ordinal, statistik tidak berparameter mesti digunakan. Statistik tidak berparameter juga boleh digunakan statistik tidak berparameter juga boleh digunakan untuk menganalisis data interval dan kadar.

Rajah 1.1 Potensi Penggunaan Berbagai Jenis Data

Kadar Interval Ordinal Nominal

Pengenalan Kepada Statistik

Anda mungkin juga menyukai