Anda di halaman 1dari 21

BBR 23303 -Asas Pengurusan Data

Nota ni kau edar2 kan ekk ngan yang lain.. Baca bab 1 baca dan faham tentang jenis-jenis data dan cuba buat carta2 palang, pai, histogram, poligon seperti contoh yang aku bagi tu... then bab 2 cuba buat contoh latihan tentang purata (min) untuk data berkelompok dan tidak berkelompok.... yang lain baca je....beri penekanan pada yang aku sebut tadi hehe.... Untuk PCK nanti aku send nota lagi ....

1
Asas Data
1.1 Jenis jenis Data

Terdapat 2 jenis data yang perlu diketahui oleh pelajar. Data ini sering digunakan dalam proses kajian dalam menentukan permasalahan atau mengenal pasti sesuatu perkara. Data tersebut adalah : 1. Data Kualitatif 2. Data Kuantitatif

1.1.1

Data Kualitatif

Data kualitatif diperoleh melalui cerapan data kajian melalui pendekatan kualitatif. Pendekatan kualitatif ialah prosedur penyelidikan yang menghasilkan data gambaran yang boleh diamati (Lexy, 2007), tradisi tertentu dalam ilmu pengetahuan sosial yang secara fundamental bergantung kepada pengamatan manusia dalam kawasannya sendiri dan berkait dengan orang-orang tersebut dalam bahasa dan peristilahannya (Kirk & Miller, 1986). Pendekatan kualitatif dalam penyelidikan ini adalah kajian kes, adalah suatu penyelidikan yang dilakukan terhadap suatu kesatuan sistem, sama ada yang berbentuk program mahupun kejadian yang terikat oleh tempat, waktu atau ikatan tertentu (Nana, 2005). Kajian kes dilaksanakan untuk menghimpun data, memperoleh makna, dan memperoleh pemahaman daripada suatu kes. Proses pengumpulan data berdasarkan Cresswell (1998) iaitu mengenalpasti tapak atau individu, mendapatkan akses dan membina rekod, persampelan bertujuan, mengumpul data, merekod maklumat, menyelesaikan isu-isu lapangan dan menyimpan data. Data Kualitatif merupakan data bukan angka (nonnumerical data) dan tidak boleh diukur melalui skala nombor. Nilai yang dinyatakan adalah melambangkan kategori dan bukanya mewakili nilai angka sebenar.
azmanh@uthm.edu.my 1

BBR 23303 -Asas Pengurusan Data Contoh data kualitatif adalah:Nominal Data yang boleh dikategorikan, mempunyai nama atau label tertentu seperti jantina, respon pelajar terhadap satu kajian: ya, tidak atau tidak pasti. Contoh :a. Saiz baju b. Jantina c. Jenama telefon Ordinal Data yang boleh disusun mengikut tertib tetapi perbezaan nilai data tidak dapat ditafsirkan atau ditentukan. Sebagai contoh, pengetahuan komputer pelajar dikelaskan kepada cemerlang, baik, sederhana atau lemah. Contoh:a. Pendapat 1 - Sangat Setuju, 2 - Setuju, 3 - Kurang Setuju, 4 - Tidak setuju, 5 - Sangat Setuju. 1 - Sangat Bersih, 2 - Bersih, 3 - Tidak Bersih, 4 - Sangat Tidak Bersih 1-Small, 2-Medium, 3-Large. 1-Lelaki, 2-Perempuan 1-Nokia, 2-Samsung, 3-Cokia, 4-Sony Erickson.

b. Tahap kebersihan -

Data di atas menunjukkan nilai yang tidak melambangkan sesuatu ukuran. Ia hanya mewakili kepada sesuatu kategori seperti nilai 1 mewakili kepada pelajar lelaki dan 2 pula mewakili pelajar perempuan. Tujuannya adalah memudahkan kelompokan dan pentadbiran data.

1.1.2

Data Kuantitatif

Data kuantitatif diperoleh melalui cerapan data kajian melalui pendekatan kuantitatif. Pendekatan kuantitatif ialah penyelidikan yang menekankan kepada fenomena-fenomena objektif dan dikawal melalui pengumpulan dan analisis data (Nana, 2005; Chua, 2006; Fraenkel, 2007). Suatu penyelidikan yang melibatkan pengukuran pemboleh ubah kajian dengan menggunakan alatan saintifik dan eksperimen. Penggunaan ujian statistik terhadap sesuatu kajian adalah sebagai usaha untuk menerangkan, menjelaskan atau mencari perhubungan antara pemboleh ubahpemboleh ubah dalam suatu penyelidikan.

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data

Data kuantitatif adalah merupakan data berbentuk bilangan atau ukuran berangka (numerical data) dan boleh diukur serta wujud dalam skala nombor. Data yang terhasil boleh dalam bentuk :-

Deskrit Data Deskrit merupakan data dengan nilai yang tepat dan boleh nyatakan dengan nombor yang negatif. Contoh :Bilangan anak dalam sesebuah keluarga 5 orang. Bilangan tandan kelapa sawit 3 tandan. Jumlah kelahiran bayi dalam tahun 2011 1200 orang

Selanjar. Data selanjar pula mempunyai sukatan data berterusan dan boleh mengambil nilai-nilai dalam satu selang. Contoh :Berat pelajar 55 kg, atau boleh dinyatakan sebagai, Berat pelajar adalah di antara 45 kg 60 kg. Tinggi Pelajar 160 cm 170 cm. Halaju Kenderaan 110 km/j 120km/

2.1

Persembahan Data

Data akan lebih mudah difahami apabila ia dianalisis dan dipersembahkan dengan baik dan berkesan. Salah satu kaedah persembahan data adalah dengan menggunakan jadual, carta dan graf. Salah satu daripada mekanisma yang paling berkesan di dalam mempersembahkan data di dalam bentuk yang bermakna untuk pembuat keputusan ialah di dalam bentuk geraf. Melalui geraf dan carta, pembuat keputusan biasanya memperolehi gambaran keseluruhan bagi data dan mencapai beberapa rumusan yang amat berguna dengan hanya mengkaji carta atau geraf. Menukarkan data kepada geraf merupakan aktiviti yang kreatif dan berseni. Salah satu daripada penggunaan penting geraf di dalam statistik adalah untuk membantu penyelidik menentukan bentuk taburan. Lima bentuk geraf yang akan dibincangkan disini: (1) histogram, (2) poligon kekerapan, (3) orgif (4) carta pai dan (4) lakaran batang dan daun.

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data

Histogram Histogram ialah jenis carta bar menegak untuk menerangkan taburan kekerapan. Pembinaannya melibatkan kita melabelkan paksi-X sebagai titik akhir kelas dan paksi Y adalah sebagai kekerapan. Rajah dibawah menunjukkan histogram bagi taburan kekerapan. Histogram merupakan alat yang berguna untuk membezakan di antara selang kelas. Dengan melihat secara imbas kepada histogram dapat menunjukkan kepada kita selang kelas yang memberikan jumlah kekerapan yang tertinggi. Rajah dibawah dengan nyata menunjukkan jeda kelas 1-di bawah 3 mempunyai kekerapan yang tertinggi (16). Histogram boleh menunjukkan kepada kita di mana peningkatan atau penurunan yang besar terjadi di antara kelas, seperti dari kelas 1-di bawah 3 kepada 3-di bawah 5, penurunan 14, dan daripada kelas 7-di bawah 9 kepada kelas 9-di bawah 11, peningkatan6.

Rajah 2.1 Histogram Taburan Kekerapan harga Saham Poligon Kekerapan Poligon kekerapan merupakan graf di mana segmen garisan menghubungi titik tengah antara taburan kekerapan. Pembinaan poligon kekerapan bermula, dengan menskalakan titik akhir kelas di sepanjang paksi-X dan nilai kekerapan di sepanjang paksi-Y. Titik adalah dilakarkan bagi nilai kekerapan pada titik tengah setiap selang kelas. Menghubungi titik tengah ini akan melengkapkan poligon. Rajah di bawah merupakan contoh poligon kekerapan taburan data. Maklumat yang diperoleh dari poligon kekerapan dan histogram adalah sama.

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data

Rajah 2.2 Poligon Kekerapan Harga Saham

Orgif Orgif adalah poligon kekerapan terkumpul. Pembinaan orgif bermula dengan melabelkan paksi-X dengan titik akhir kelas dan paksi-Y dengan kekerapan terkumpul. Rajah 2.3 menunjukkan orgif bagi kekerapan terkumpul di dalam Jadual 2.3. Orgif amat berguna apabila pembuat keputusan mahu melihat jumlah disepanjang tempoh masa. Kecerunan yang curam bagi orgive boleh digunakan untuk menunjukkan peningkatan yang mendadak di dalam kekerapan. Di dalam Rajah di bawah menunjukkan kecerunan yang curam berlaku di dalam kelas 1-di bawah 3 dan kelas 9-di bawah 11.

Rajah 2.3 : Orgif Kekerapan Terkumpul Harga Saham

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data Carta Pie Carta pie merupakan bahagian data di mana kawasan keseluruhan pie mewakili 100% daripada data yang dikaji dan kepingan pie merupakan peratus pecahan sub-level. Sebagai contohnya, ia digunakan untuk mempersembahkan data perniagaan, terutamanya untuk menggambarkan beberapa perkara seperti kategori belanjawan, bahagian pasaran, dan pengagihan masa dan sumber. Jadual di bawah menunjukkan jumlah aduan yang diterima oleh perkhidmatan kereta api dan Rajah berikutnya menunjukkan cara pie yang dibentuk. Jadual 2.4: Aduan oleh Pelanggan Keretapi Komplen Stesyen Keupayaan Keretapi Peralatan Personel Penjadualan Jumlah Bilangan 28,000 14,700 10,500 9,800 7,000 70,000 Bahagian 0.40 0.21 0.15 0.14 0.10 1.00 Darjah 144.0 75.6 50.4 50.6 36.0 360.00

Penjadualan 10.0%

Personel 14.0%

Stesyen 40.0%

Peralatan 15.0%

Keupayaan Keretapi 21.0%

Rajah 2.4 : Carta Pie Komplen Pelanggan Keretapi

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data Batang dan Daun Cara lain untuk menyusun data mentah ke dalam kumpulan ialah melalui lakaran batang dan daun. Teknik ini adalah mudah dan memberikan pandangan unik bagi data. Lakaran batang dan daun merupakan pembinaan melalui pengasingan digit bagi setiap nombor data kepada dua kumpulan, batang dan daun. Digit yang terkiri sekali sebagai batang dan mengandungi nilai digit yang tertinggi. Digit yang paling kanan sekali merupakan daun dan mengandungi nilai yang rendah. Jika set data mempunyai dua digit, batang merupakan nilai di sebelah kiri dan daun adalah nilai di sebelah kanan. Sebagai contoh, jika 34 adalah satu nombor, batang adalah 3 dan daun adalah 4. Bagi nombor yang mempunyai lebih dari dua gigit, pembahagian batang dan daun adalah bergantung kepada cita rasa penyelidik. Jadual di bawah mengandungi skor pemeriksaan polisi keselamatan kilang terhadap 35 orang pekerja. Lakaran batang dan daun ditunjukkan di dalam Jadual 2.6. Kebaikan taburan ini memberikan pembuat keputusan melihat sama ada skor terletak di kedudukan teratas atau terbawah dan menentukan serakan skor tersebut. Kebaikan kedua ialah nilai data mentah yang asal adalah dikekalkan.

Jadual 2.5 : Skor Pemeriksaan Keselamatan Kilang 86 76 23 77 81 79 68 77 92 59 68 75 83 49 91 47 72 82 74 70 56 60 88 75 97 39 78 94 55 67 83 89 67 91 81

Jadual 2.6 : Lakaran Batang dan daun Skor Pemeriksaan Keselamatan Kilang Batang 2 3 4 5 6 7 8 9 Daun 3 9 7 9 5 6 9 07788 0245567789 11233689 11247

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data Latihan 1 Berikut ialah data yang mewakili kos bagi sampel 30 harga saham harian di KLSE. 6.67 7.20 5.42 2.75 2.78 8.64 5.47 3.34 4.84 4.65 7.80 4.10 3.32 3.20 915 2.09 3.21 3.45 1.83 10.94 3.55 3.53 5.11 1.97 1.93 3.64 2.84 6.89 4.95 4.15

Menggunakan ringgit sebagai batang dan sen sebagai daun, binakan lakaran batang dan daun bagi data tersebut.

Penyelesaian: Batang 1 2 3 4 5 6 7 8 9 10 Daun 83,93,97 09,75,78,84 20,21,32,34,45,53,55,64 10,15,65,84,95 11,42,47 67,89 20,80 64 15 94

Latihan 2 Kategori manakah yang menghuraikan di mana pekerja bekerja? (tandakan satu sahaja) Jabatan runcit Gudang Akaun Persendirian Jabatan / Lokasi Jabatan runcit Gudang Akaun Persendirian Frekuensi 67 62 15 16

Jadual 2 : Bilangan Pekerja / Jabatan (Skala Nominal)

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data

Frekuensi
80 70 60 50 40 30 20 10 0 Jabatan runcit Gudang Akaun Persendirian Frekuensi

Rajah 12: Carta Bar Bagi Data Nominal Dalam Jadual 2

Persendirian 10%

Akaun 9% Jabatan runcit 42% Gudang 39%

Rajah 12.6: Carta Pai Bagi Data Nominal Dalam Jadual 2

azmanh@uthm.edu.my

BBR 23303 -Asas Pengurusan Data

2
Statistik Perihalan
2.1 Ukuran Kecenderungan Memusat

Satu jenis pengukuran yang digunakan untuk memerihalkan set data adalah ukuran kecenderungan memusat. Pengukuran kecenderungan memusat menghasilkan maklumat berkaitan dengan titik tengah pada satu kumpulan nombor.

2.1.1

Data Tidak Berkumpul

Ditunjukkan di dalam Jadual 3.1 adalah harga tawaran saham bagi 20 syarikat yang akan disenaraikan di Bursa Saham Kuala Lumpur pada tahun 2000. Bagai data ini, ukuran kecenderungan memusat boleh menghasilkan maklumat berkaitan dengan purata harga tawaran, titik tengah harga tawaran dan juga harga tawaran yang paling kerap ditawarkan. Ukuran kecenderungan memusat tidak menumpukan ke atas pengembangan set data atau berapa jauh nilai daripada titik tengah. Ukuran kecenderungan memusat bagi data yang tidak berkumpul adalah min, mod, median, peratusan dan quartile. Jadual 3.1: Harga Saham bagi 20 Kaunter KLSE (RM) 14.25 24.00 27.00 34.22 19.00 19.00 23.00 25.00 15.50 19.00 11.00 43.25 15.00 15.00 27.00 28.00 19.00 7.00 22.00 21.00

Mod Mod adalah nilai yang paling kerap wujud di dalam set data. Bagi data yang ditunjukkan di dalam Jadual 3.1, mod ialah RM19.00 kerana harga tawaran berlaku

azmanh@uthm.edu.my

10

BBR 23303 -Asas Pengurusan Data sebanyak 4 kali. Menyusun data di dalam susunan yang menaik (menyusun dari nombor terkecil hingga terbesar) membantu kita menentukan mod. Berikut adalah susunan nilai daripada Jadual 3.1.

7.00 11.00 14.25 15.00 15.00 15.50 19.00 19.00 19.00 19.00 21.00 22.00 23.00 24.00 25.00 27.00 27.00 28.00 34.22 43.25

Penyusunan ini membuatkan kita dengan mudah untuk melihat RM19.00 adalah harga yang kerap berlaku. Jika terdapat dua kumpulan angka yang kerap wujud di dalam set data, ia mempunyai dua mod. Di dalam kes seperti ini, ia dikatakan bi-model. Jika set data tidak sebenarnya bi-model, tetapi mengandungi dua nilai di mana lebih dominan daripada yang lain, sesetengah penyelidik mempunyai kebebasan dengan menunjukkan set data sebagai bi-model walaupun ia sebenarnya tidak terikat kepada mod. Data set dengan lebih daripada dua mod dipanggil sebagai berbilang-model. Di dalam dunia perniagaan, konsep mod biasanya digunakan di dalam menentukan saiz. Sebagai contoh, pengilang baju mengeluarkan baju di dalam empat saiz, S, M, L, dan XL. Setiap saiz adalah berpadanan dengan model badan manusia. Dengan pengurangan bilangan kepada beberapa model saiz, syarikat boleh mengurangkan jumlah kos pengeluaran dengan menghadkan kos penyediaan mesin dan bahan. Mod adalah ukuran kecenderungan memusat sesuai bagi data nominal. Mod boleh digunakan untuk menentukan manakah kategori yang kerap terjadi.

Median Median ialah titik tengah sesuatu kumpulan nombor yang disusun secara menaik. Jika bilangan data tersebut adalah ganjil, median ialah nombor yang di tengah. Jika bilangan data adalah genap, median ialah purata dua nombor yang terletak di tengah-tengah. Langkah berikut adalah digunakan untuk menentukan median. Langkah 1: Langkah 2: Langkah 3: Susun data di dalam susunan menaik. Jika bilangan data adalah ganjil, carikan sebutan di tengah-tengah di dalam susunan tersebut. Ia adalah median. Jika bilangan data adalah genap, kirakan purata dua angka di tengahtengah susunan tersebut. Purata ini adalah median.

azmanh@uthm.edu.my

11

BBR 23303 -Asas Pengurusan Data Katakan ahli statistik hendak mencari median bagi kumpulan data berikut: 15 11 14 3 21 17 22 16 19 16 5 7 19 8 9 20 4

Susunan nombor di dalam sebutan menaik: 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21 22

Terdapat 17 sebutan (bilangan ganjil), oleh itu median terletak di tengah-tengah susunan tersebut, iaitu 15. Jika nombor 22 dikeluarkan daripada senarai, terdapat hanya 16 sebutan (bilangan genap): 3 4 5 7 8 9 11 14 15 16 16 17 19 19 20 21

Sekarang kita mempunyai bilangan sebutan genap, median ditentukan dengan mengira purata dua nombor yang terletak di tengah-tengah susunan tersebut, 14 dan 15. Ini menghasilkan nilai median iaitu 14.5. Satu cara lain untuk menentukan median ialah mencari sebutan n2 1 di dalam susunan yang menaik. Sebagai contoh, jika set data mempunyai 77 sebutan, median adalah terletak pada sebutan yang ke 39, iaitu:
n 1 77 1 39 2 2

Formula ini amat berguna apabila melibatkan bilangan data yang besar. Median tidak dipengaruhi oleh magnitud nilai ekstrem. Ciri-ciri ini merupakan kelebihan disebabkan nilai terbesar atau terkecil tidak mempengaruhi median. Oleh sebab itu, median merupakan ukuran lokasi yang terbaik untuk digunakan di dalam analisis pembolehubah seperti kos rumah, pendapatan dan usia. Sebagai contoh, broker perumahan mahu menentukan median, harga jualan 10 buah rumah yang disenaraikan seperti berikut: 67,000 122,000 91,000 148,000 95,000 167,000 105,000 189,000 116,000 5,250,000

Median harga rumah tersebut adalah purata dua sebutan di tengah-tengah, 116,000 dan 122,000 atau 119,000. Harga ini adalah munasabah mewakili harga kesemua rumah. Perhatikan harga rumah 5,250,000 tidak termasuk di dalam analisis melainkan diambil kira sebagai satu daripada 10 rumah. Jika harga rumah yang ke 10 adalah 200,000, keputusannya masih lagi sama. Walau bagaimanapun, jika semua harga rumah dipuratakan, menghasilkan harga purata 10 rumah adalah RM635,000 dan lebih tinggi daripada harga 9 rumah yang pertama.

azmanh@uthm.edu.my

12

BBR 23303 -Asas Pengurusan Data Kelemahan median ialah tidak semua maklumat daripada data digunakan. Iaitu, maklumat berkaitan dengan harga rumah termahal tidak diambil kira di dalam pengiraan median. Paras pengeluaran data mestilah sekurang-kurangnya ordinal untuk median lebih bermakna.

Min Min aritmetik adalah susunan sinonim dengan purata kumpulan nombor dan ia dikira dengan menjumlahkan semua nombor dan membahagikannya dengan bilangan nombor tersebut. Disebabkan min aritmetik digunakan dengan meluas, kebanyakan ahli statistik hanya menggunakan istilah min sahaja. Min populasi ditandakan dengan huruf Greek mu (). Min sampel pula ditandakan dengan huruf Roman ( X ). Formula bagi mengira min bagi populasi dan min sampel adalah sebagaimana berikut: Min populasi:
X1 X 2 X 3 .......... . X N N

Min sampel:

X X1 X 2 X 3 .......... . X n
n n

Huruf Greek sigma () biasanya digunakan oleh ahli matematik untuk menunjukkan jumlah semua nombor-nombor di dalam kumpulan data. Di samping itu, N adalah bilangan nombor di dalam populasi dan n adalah bilangan nombor di dalam sampel. Algoritma untuk mengira min adalah dengan menjumlahkan nombor-nombor di dalam populasi atau sampel dan kemudiannya membahagikannya dengan bilangan populasi atau sampel. Secara amnya, definisi min adalah:

Xi
i 1

Walau bagaimanapun, untuk tujuan rujukan ini

X Menandakan

Xi
i 1

azmanh@uthm.edu.my

13

BBR 23303 -Asas Pengurusan Data Min adalah sesuai digunakan untuk menganalisis data sekurang-kurangnya data bertaraf interval di dalam pengukuran.

Contoh 1.1 Katakan syarikat mempunyai lima jabatan dengan bilangan pekerja 24, 13, 19, 26 dan 11 masing-masingnya. Min populasi adalah:

X = 24 + 13 + 19 +26 + 11
= 93

X 93 18.6
N 5

Pengiraan min sampel adalah menggunakan algoritma yang sama bagi min populasi. Walau bagaimanapun adalah tidak sesuai untuk mengira min sampel untuk populasi atau min populasi untuk sampel. Oleh kerana kedua-dua min populasi dan sampel adalah penting di dalam statistik, simbol yang berasingan adalah perlu untuk membezakan min populasi dan sampel. Min adalah dipengaruhi oleh setiap nilai di dalam data, yang merupakan kelebihannya. Ia juga merupakan kelemahannya, disebabkan nilai ekstrem yang terbesar atau terkecil boleh menyebabkan nilai min tertarik ke arah nilai ekstrem. Min amat biasa digunakan di dalam mengukur lokasi disebabkan ia menggunakan setiap data dalam pengiraannya dan ia mempunyai kandungan matematik yang membuatkannya menarik untuk digunakan di dalam analisis statistik pentadbiran.

Peratusan Peratusan adalah ukuran kecenderungan memusat yang membahagikan kumpulan data kepada 100 bahagian. Terdapat 99 peratusan, disebabkan ia mengambil 99 pembahagi untuk memisahkan data kepada 99 bahagian. Peratusan ke-n adalah nilai dimana sekurang-kurangnya n peratus data terletak di bawah nilai tersebut dan selebihlebihnya (100 n) peratus adalah di atas nilai tersebut. Khususnya, 87 peratusan adalah nilai dimana sekurang-kurangnya 87% daripada data di bawah nilai tersebut dan tidak lebih daripada 13% di atas nilai. Peratusan adalah nilai anak-tangga, sebagaimana ditunjukkan di dalam Rajah 3.1, disebabkan 87 peratusan dan 88 peratusan tetapi tiada peratusan di antaranya. Jika operator kilang mengambil ujian keselamatan 87.6% sebagai skor ujian keselamatan adalah di bawah skor pekerja, ia masih lagi mempunyai skor hanya pada 87 peratusan, walaupun lebih daripada 87% skor tersebut adalah terendah.
azmanh@uthm.edu.my 14

BBR 23303 -Asas Pengurusan Data

Rajah 3.1 Peraturan Anak Tangga

88 peratusan 86 peratusan 87 peratusan

Berikut adalah langkah-langkah di dalam menentukan kedudukan peratusan: Langkah 1: Langkah 2: Susun nombor di dalam kedudukan menaik. Kirakan kedudukan peratusan i dengan:
i P (n) 100

Di mana; P = peratusan yang dikehendaki i = kedudukan peratusan N = bilangan nombor di dalam set data. Langkah 3: Tentukan lokasi samada melalui (a) atau (b) a. Jika i adalah nombor bulat, P peratusan adalah purata nilai pada kedudukan ke i dan nilai pada kedudukan (i + 1) b. Jika i bukan nombor bulat, nilai P peratusan adalah bahagian nombor bulat (i + 1)

Contoh 3.2. Katakan kita hendak menentukan 80 peratusan daripada 1240 nombor. P = 80, n = 1240 1. Kedudukan 80 peratusan
i 80 (1240) 992 100

azmanh@uthm.edu.my

15

BBR 23303 -Asas Pengurusan Data 2. Disebabkan oleh I = 992 dan nombor bulat, ikut langkan 3(a). 80 peratusan adalah purata nombor 992 dan 993.
P80 nombor 992 nombor 993 2

= 992.5 Contoh 3.3 Tentukan 30 peratusan bagi 8 nombor berikut: 14 12 19 23 5 13 28 17 Penyelesaian: 1. Susun dalam keadaan susunan menaik 5 12 13 14 17 19 23 28

2. Kirakan kedudukan peratusan dengan P = 30 dan n = 8.


i 30 (8) 2.4 100

3. Disebabkan i bukan nombor bulat, langkah 3(b) digunakan. Nilai i + 1 = 2.4 + 1 = 3.4. Nombor bulat 3.4 ialah 3. Oleh itu 30 peratusan adalah di kedudukan pada nilai ke 3, dan nilai ketiga ialah 13. Oleh itu 13 adalah 30 peratusan. Perhatikan bahawa peratusan mungkin atau mungkin tidak satu daripada nilai data.

Sukuan Sukuan adalah ukuran kecenderungan memusat yang membahagikan kumpulan data kepada empat sub-kumpulan atau bahagian. Terdapat tiga sukuan, ditandakan sebagai Q1, Q2 dan Q3. Sukuan pertama, memisahkan pertama, atau terendah, satu per empat daripada tiga suku teratas adalah sama dengan 25 peratus. Quartil kedua, Q2, memisahkan suku kedua data daripada suku ketiga. Q2 adalah terletak pada 50 peratusan, dan sama dengan media bagi data. Sukuan ketiga, Q3, membahagikan tiga suku pertama daripada sukuan terakhir dan adalah sama dengan nilai 75 peratusan. Tiga sukuan ini ditunjukkan di dalam Rajah 3.2.

azmanh@uthm.edu.my

16

BBR 23303 -Asas Pengurusan Data Katakan kita hendak menentukan nilai Q1, Q2 dan Q3 dari nombor berikut: 106 109 114 116 121 122 125 129 Nilai Q1 adalah diperolehi pada 25 peratusan, P25; Bagi n = 8; I =
25 (8) = 2. 100

Disebabkan I adalah nombor bulat, P25, adalah ditemui dengan mempuratakan sebutan kedua dan ketiga. P25 =
109 114 = 111.5 2

Nilai Q1 adalah P25 = 111.5. Perhatikan satu per empat, atau dua, bagi nilai (106 dan 109) adalah kurang daripada 111.5. Nilai Q2 adalah sama dengan median. Oleh kerana bilangan yang genap, median adalah purata dua sebutan ditengah: Q2 = median =
116 121 = 118.5 2

Perhatikan bahawa sebenarnya separuh daripada sebutan adalah kurang daripada Q2 dan separuh lagi lebih besar daripada Q2. Nilai Q3 ditentukan oleh P75, sebagaimana berikut: I=
75 (8) = 8 100

Disebabkan i adalah angka bulat, maka P75 adalah purata kedudukan ke 6 dan 7. P75 =
122 125 = 123.5 2

Nilai Q3 adalah P75 = 123.5. Perhatikan bahawa tiga suku atau 6 sebutan, daripada nilai adalah lebih kecil daripada 123.5 dan dua daripada nilai lebih besar daripada 123.5.

azmanh@uthm.edu.my

17

BBR 23303 -Asas Pengurusan Data Data Berkumpulan Tiga ukuran kecenderungan memusat akan dibincangkan bagi data berkumpulan iaitu min, median dan mod.

Min Bagi data yang tidak terkumpul, min adalah dikira dengan menjumlahkan nilai di dalam set data dan kemudiannya membahagikannya dengan bilangan data tersebut. Tetapi bagi data yang telah terkumpul, nilai yang khusus tidak diketahui. Apakah yang boleh digunakan untuk mewakili nilai data? Titik tengah bagi setiap jeda kelas adalah digunakan untuk mewakili semua nilai di dalam jeda kelas tersebut. Titik tengah ini akan diwajarkan dengan kekerapan nilai di dalam jeda kelas tersebut. Min bagi data terkumpul kemudiannya dikira dengan menjumlahkan hasil dharab titik tengah kelas dengan kekerapan kelas dan membahagiman jumlah tersebut dengan bilangan kekerapan. Formulanya adalah sebagaimana berikut:
kumpulan

f i m i f1m1 f 2 m 2 .........f i m i f1 f 2 ... f i fi

Di mana; i = bilangan jeda f = kekerapan kelas M = titik tengah kelas N = jumlah kekarap.

Contoh 3.4: Jeda Kelas 13 35 57 79 9 11 11 - 13 Kekerapan (fi) 16 2 4 3 9 6 f = N = 40 Titik Tengah (Mi) 2 4 6 8 10 12 fiMi 32 8 24 24 90 72 fM = 250

fiMi fi

250 6.25 40

azmanh@uthm.edu.my

18

BBR 23303 -Asas Pengurusan Data

Min bagi data yang terkumpul adalah 6.25. Perlu diingat bahawa setiap jeda kelas diwakili oleh nilai titik tengah kelas tersebut bukannya nilai sebenar. Oleh sebab itu, nilai min tersebut hanyalah nilai penghampiran sahaja.

Median Nilai median bagi data tidak terkumpul adalah nilai yang terletak di tengah-tengah apabila data tersebut disusun secara menaik. Bagi data yang terkumpul, pengiraan median agak rumit dan menggunakan formula berikut:

Median L
Di mana L cfp Fmed W N = = = = =

N 2

- cfp

f med

had bawah jeda kelas median jumlah terkumpul kekerapan sehingga kelas tersebut, tetapi tidak melibatkan kekerapan median kelas kekerapan median keluasan jeda kelas median (had atas kelas had bawah kelas) jumlah bilangan kekerapan

Contoh 3.5: 1. Kirakan nilai N yang merupakan kedudukan sebutan di tengah-tengah. N 40 20 . 2 2 2 Oleh itu median terletak di kedudukan ke 20. Persoalannya di kelas manakah sebutan ke 20? 2. Kirakan kekerapan terkumpul bagi setiap kelas. Jeda Kelas 13 35 57 79 9 11 11 - 13 Kekerapan (fi) 16 2 4 3 9 6 f = N = 40 Titik Tengah (Mi) 2 4 6 8 10 12

azmanh@uthm.edu.my

19

BBR 23303 -Asas Pengurusan Data Berdasarkan kepada kekerapan terkumpul, sebutan ke 20 terletak di dalam kelas ke tiga kerana terdapat hanya 18 nilai sahaja dalam dua kelas pertama. Oleh itu nilai median terletak di mana-mana di antara 5 7 (kelas ke tiga). Jeda kelas yang mengandungi nilai median dirujukkan sebagai jeda kelas median. 3. Oleh kerana nilai ke 20 adalah di antara 5 dengan 7, nilai median adalah sekurangkurangnya 5. Tetapi apakah nilai tersebut? Perbezaan di antara kedudukan nilai median, N = 20, dan kekerapan terkumpul sehingga itu, tetapi tidak termasuk jeda 2 kelas median, cfp = 18, memberitahu berapa banyak nilai sehingga jeda kelas median bagi nilai median terletak. Ini boleh ditentukan dengan menyelesaikan N 2 cfp = 20 18 = 2. Nilai median terletak dia nilai ke dalam jeda kelas median. Walau bagaimanapun, terdapat empat nilai di dalam jeda kelas median (fmed). Nilai median adalah 2 jauh ke dalam jeda, iaitu 4
N 2

- cfp

f med

20 - 18 2 1 4 4 2

4. Oleh itu, nilai median sekurang-kurangnya 5 nilai L dan separuh jauhnya daripada jeda median. Berapa jauhkah secara geometri di sepanjang jeda median? Setiap jeda kelas adalah dua unit luas (W). Separuh daripada jarak ini memberitahu kita berapa jauh nilai median ke dalam jeda kelas.
N 2

- cfp

f med

(W)

40 2

- 18 2 1 (2) (2) (2) 1 4 4 2

5. Menambahkan jarak ini dengan had bawah jeda kelas median menghasilkan nilai median.

Median L

N 2

- cfp

f med

W 5

20 2

- 18 1 (2) 5 (2) 5 1 6 4 2

Perlu diingat bahawa nilai median ini juga merupakan nilai penghampiran. Andaian yang dibuat di dalam pengiraan ini adalah nilai sebenar adalah jatuh secara seragam di sepanjang jeda kelas median.

azmanh@uthm.edu.my

20

BBR 23303 -Asas Pengurusan Data Mod Mod bagi data terkumpul adalah titik tengah kelas mod. Kelas kod adalah jeda kelas yang mempunyai kekerapan yang tertinggi. Di dalam contoh di atas, kelas mod adalah di antara 1 3 dengan bilangan kekerapan 16. Oleh itu titik tengah kelas mod ialah 2 dan mod ialah 2.

Contoh 3.8: Kelas 1-3 3-5 5-7 7-9 9-11 11-13 Kekerapan M 16 2 4 3 9 6 f=40 fM 2 4 6 8 10 12 32 8 24 24 90 72 fM=250 (M - ) (M-)2 F(M-)2 -4.25 18.063 289.008 -2.25 5.063 10.126 -0.25 0.063 0.252 1.75 3.063 9.189 3.75 14.063 12.567 5.75 35.063 198.378 633.520

fM 250 f 40

6.25

f(M - ) 2 f

633.52 15.838 40

2 15.838 3.980

azmanh@uthm.edu.my

21