Statistik Perihalan
3.1
3.1.1
19.00
23.00
25.00
15.50
19.00
11.00
43.25
15.00
15.00
27.00
28.00
19.00
7.00
22.00
21.00
Mod
Mod adalah nilai yang paling kerap ujud didalam set data. Bagi data
yang ditunjukkan didalam Jadual 3.1, mod ialah RM19.00 kerana harga tawaran
berlaku sebanyak 4 kali. Menyusun data didalam susunan yang menaik
11.00
22.00
14.25
23.00
15.00
24.00
15.00
25.00
15.50
27.00
19.00
27.00
19.00
28.00
19.00
34.22
19.00
43.25
Statistik Perihalan
11 14
21 17 22 16 19 16
19
20
11 14 15 16 16 17 19 19 20 21 22
Terdapat 17 sebutan (bilangan ganjil), oleh itu median terletak ditengahtengah susunan tersebut, iaitu 15.
Jika nombor 22 dikeluarkan daripada senarai, terdapat hanya 16 sebutan
(bilangan genap):
3
11
14
15
16
16
17
19
19
20
21
39
2
2
91,000
148,000
95,000
167,000
105,000
189,000
116,000
5,250,000
analisis melainkan diambil kira sebagai satu daripada 10 rumah. Jika harga
rumah yang ke 10 adalah 200,000, keputusannya masih lagi sama. Walau
bagaimanapun, jika semua harga rumah dipuratakan, menghasilkan harga purata
10 rumah adalah RM635,000 dan lebih tinggi daripada harga 9 rumah yang
pertama.
Kelemahan median ialah tidak semua maklumat daripada data
digunakan. Iaitu, maklumat berkaitan dengan harga rumah termahal tidak
diambilkira didalam pengiraan median. Paras pengeluaran data mestilah
sekurang-kurangnya ordinal untuk median lebih bermakna.
Min
Min aritmatik adalah susunan sinonim dengan purata kumpulan nombor
dan ia dikira dengan menjumlahkan semua nombor dan membahagikannya
dengan bilangan nombor tersebut. Disebabkan min aritmatik digunakan dengan
meluas, kebanyakan ahli statistik hanya menggunakan istilah min sahaja.
Min populasi ditandakan dengan huruf Greek mu (). Min sampel pula
ditandakan dengan huruf Roman ( X ). Formula bagi mengira min bagi populasi
dan min sampel adalah sebagaimana berikut:
Min populasi:
X X1 X 2 X 3 ........... X N
Min sampel:
X X1 X 2 X 3 ........... X n
Xi
i 1
Statistik Perihalan
X Menandakan
Xi
i 1
Min adalah sesuai digunakan untuk menganalisis data sekurangkurangnya data bertaraf interval didalam pengukuran.
Contoh 1.1
Katakan syarikat mempunyai lima jabatan dengan bilangan pekerja 24, 13, 19, 26
dan 11 masing-masingnya. Min populasi adalah:
= 24 + 13 + 19 +26 + 11
= 93
X 93 18.6
N
88 peratusan
87 peratusan
86 peratusan
P
(n)
100
dimana;
P = peratusan yang dikehendaki
i = kedudukan peratusan
N = bilangan nombor didalam set data.
Langkah 3: Tentukan lokasi samada melalui (a) atau (b)
Statistik Perihalan
Contoh 3.2.
Katakan kita hendak menentukan 80 peratusan daripada 1240 nombor.
P = 80, n = 1240
1. Kedudukan 80 peratusan
i
80
(1240) 992
100
2. Disebabkan oleh I = 992 dan nombor bulat, ikut langkan 3(a). 80 peratusan
adalah purata nombor 992 dan 993.
P80
Contoh 3.3
Tentukan 30 peratusan bagi 8 nombor berikut:
14 12 19 23 5 13 28 17
Penyelesaian:
1. Susun dalam keadaan susunan menaik
5 12
13
14
17
19
23
28
30
(8) 2.4
100
Sukuan
Sukuan adalah ukuran kecenderungan memusat yang membahagikan kumpulan
data kepada empat sub-kumpulan atau bahagian. Terdapat tiga sukuan,
ditandakan sebagai Q1, Q2 dan Q3. Sukuan pertama, memisahkan pertama, atau
terendah, satu per empat daripada tiga suku teratas adalah sama dengan 25
peratus. Quartil kedua, Q 2, memisahkan suku kedua data daripada suku ketiga.
Q2 adalah terletak pada 50 peratusan, dan sama dengan media bagi data. Sukuan
ketiga, Q3, membahagikan tiga suku pertama daripada sukuan terakhir dan adalah
sama dengan nilai 75 peratusan. Tiga sukuan ini ditunjukkan didalam Rajah 3.2.
Katakan kita hendak menentukan nilai Q1, Q2 dan Q3 dari nombor
berikut:
106 109 114 116 121 122 125 129
Nilai Q1 adalah diperolehi pada 25 peratusan, P25;
Bagi n = 8; I =
25
(8) = 2.
100
109 114
= 111.5
2
Nilai Q1 adalah P25 = 111.5. Perhatikan satu per empat, atau dua, bagi
nilai (106 dan 109) adalah kurang daripada 111.5.
Statistik Perihalan
Nilai Q2 adalah sama dengan median. Oleh kerana bilangan yang genap,
median adalah purata dua sebutan ditengah:
Q2 = median =
116 121
= 118.5
2
75
(8) = 8
100
122 125
= 123.5
2
Nilai Q3 adalah P75 = 123.5. Perhatikah bahawa tiga suku atau 6 sebutan,
daripada nilai adalah lebih kecil daripada 123.5 dan dua daripada nilai lebih besar
daripada 123.5.
3.1.2
Data Berkumpulan
dengan menjumlahkan hasil dharab titik tengah kelas dengan kekerapan kelas
dan membahagiman jumlah tersebut dengan bilangan kekerapan. Formulanya
adalah sebagaimana berikut:
fi mi
fi
kumpulan
f 1 m1 f 2 m 2 .........f i m i
f 1 f 2 ... f i
dimana;
i = bilangan jeda
f = kekerapan kelas
M = titik tengah kelas
N = jumlah kekarap.
Contoh 3.4:
Jeda Kelas
Kekerapan (fi)
13
35
57
79
9 11
11 - 13
16
2
4
3
9
6
f = N = 40
fiMi
fi
Titik Tengah
(Mi)
2
4
6
8
10
12
fiMi
32
8
24
24
90
72
fM = 250
250
6.25
40
Min baga data yang terkumpul adalah 6.25. Perlu diingat bahawa setiap
jeda kelas diwakili oleh nilai titik tengah kelas tersebut bukannya nilai sebenar.
Oleh sebab itu, nilai min tersebut hanyalah nilai penghampiran sahaja.
Median
10
Statistik Perihalan
Nilai median bagi data tidak terkumpul adalah nilai yang terletak ditengah-tengah
apabila data tersebut disusun secara menaik. Bagi data yang terkumpul,
pengiraan median agak rumit dan menggunakan formula berikut:
Median L
N
2
- cf p
f med
dimana
L = had bawah jeda kelas median
cfp = jumlah terkumpul kekerapan sehingga kelas tersebut, tetapi tidak
melibatkan kekerapan median kelas
Fmed = kekerapan median
W = keluasan jedia kelas median (had atas kelas had bawah kelas)
N = jumlah bilangan kekerapan
Contoh 3.5:
1. Kirakan nilai
N
2
40
2
N
2
Kekerapan (fi)
16
2
4
3
9
6
f = N = 40
11
- cf p
f med
20 - 18 2 1
4
4 2
- cf p
f med
(W)
40
2
- 18
2
1
(2) (2) (2) 1
4
4
2
5. Menambahkan jarak ini dengan had bawah jeda kelas median menghasilkan
nilai median.
Median L
N
2
- cf p
f med
W 5
20
2
- 18
1
(2) 5 (2) 5 1 6
4
2
12
Statistik Perihalan
Mod
Mod bagi data terkumpul adalah titik tengah kelas mod. Kelas kod adalah jeda
kelas yang mempunyai kekerapan yang tertinggi. Di dalam contoh di atas, kelas
mod adalah di antara 1 3 dengan bilangan kekerapan 16. Oleh itu titik tengah
kelas mod ialah 2 dan mod ialah 2.
13
Rajah 3.2
Tiga Taburan dengan Min Sampel yang Sama dan Serakan Berbeza
=50
Jeda
Jeda adalah perbezaan di antara nilai terbesar dan nilai terkecil. Walaupun ia
hanya merupakan nilai numerik tunggal, sesetengah penyelidik mendefinasikan
jeda sebagai pasangan susunan nombor terkecil dan terbesar [terkecil, terbesar].
Ia merupakan ukuran serakan kasar, menerangkan jarak ke sempadan luar set
data. Ia menggambarkan nilai ekstrim disebabkan ia dibina daripadanya.
Kelebihan jeda ialah ianya mudah dikira. Satu penggunaan penting jeda ialah
didalam penentuan kualiti, dimana jeda digunakan untuk membentuk carta
kawalan. Kelemahan jeda ialah disebabkan ia dikira dengan nilaian yang
terdapat nilai ekstrim bagi data maka ia dipengaruhi oleh nilai ekstrim tersebut
dan oleh itu penggunaannya adalah untuk ukuran serakan adalah terhad.
Berdasarkan kepada Jadual 3.1, nilai terkecil ialah RM7.00 dan nilai
terbesar ialah RM43.25. Nilai jeda dikira dari perbezaan di antara nilai terbesar
dan nilai terkecil.
Jeda = Terbesar Terkecil = 43.25 7.00 = RM36.25.
Sisihan Purata Mutlah (SPM)
Sisihan purata mutlak (SPM) adalah purata nilai mutlak bagi sisihan disekitar
min bagi set nombor.
SPM
X -
N
14
Statistik Perihalan
Contoh 3.6:
Jika diberi set data 5, 9, 16, 17, dan 19, maka SPM dikira sebagaimana berikut:
X-
-8
-4
+3
+4
+5
(X -) = 0
X
5
9
16
17
18
X = 65
|X - |
+8
+4
+3
+4
+5
|X - | = 24
X 65 13
N
SPM
5
|
X
- |
N
24
4.8
5
(X - ) 2
15
X
5
9
16
17
18
X = 65
( X - |)2
64
16
9
16
25
(X - )2 = 130
SSX
(X - ) 2
N
130
26.0
5
16
Statistik Perihalan
(X - ) 2
26 5.1
Jika satu set data adalah bertaburan normal atau berbentuk lonceng,
hampir 68% daripada nilai data adalah disekitar satu sisihan piawai min, 95%
adalah disekitar dua sisihan piawai dan hampir 100% disekitar tiga sisihan
piawai.
Sebagai contoh, katakan Kementerian Perdagangan dan hal Ehwal
Pengguna menyatakan purata harga ayam di Malaysia ialah RM4.50 sekilogram.
Katakan harga ayam disemua negeri adalah bertaburan normal dengan sisihan
1
17
1.34
1.42
1.50
=RM1.42
=RM0.08
1.26
1.42
=RM1.42
=RM0.08
1.58
Perhatikan, oleh kerana 68% daripada harga ayam terletak disekitar satu
sisihan piawai daripada min, hampir 32% adalah terletak diluar jeda ini. Oleh
kerana taburan normal adalah simetri, 32% boleh dipisahkan dimana setengah
daripadanya terletak pada setia ekor taburan tersebut. Oleh itu, hampir 16%
daripada harga ayam sepatutnya kurang daripada RM4.40 dan hampir 16%
daripada harga sepatutnya lebih daripada RM4.60.
Teorem Chebyshev
18
Statistik Perihalan
kurangnya nilai 1 -
k2
Teorem Chebyshev:
Disekitar k sisihan piawai bagi min, k terletak sekurangkurangnya
k2
1
1
3
= 1- 2 =
= 0.75
2
4
k
2
1
1
= 1 = 0.84
2
k
2 .5 2
Rajah 3.6
Penggunaan Teorem Chebysev bagi Dua Sisihan Piawai.
20
Statistik Perihalan
(X - X) 2
s2
n -1
s2
Skor Z
Skor Z mewakili nombor nilai sisihan piawai di atas atau di bawah min bagi set
nombor apabila data adalah bertaburan normal.
Menggunakan skor Z
membolehkan kita menterjemahkan nilai kasar jarak daripada min kepada unit
sisihan piawai.
Z
X -
X-X
s
Jika skor Z negatif, maka nilai kasar (X) adalah di bawah min dan
sebaliknya.
Contoh 3.7
Bagi set data yang bertaburan normal dengan min adalah 50 dan sisihan piawai
10, tettukan skor Z bagi nilai 70 (X = 70).
Nilai X = 70 adalah 20 unit di atas min, oleh itu
Z
70 - 50 20
2.00
10
2
21
Skor Z ini menunjukkan skor kasar 70 adalah dua sisihan piawai di atas
min. Bagaimana skor Z ini ditafsirkan? Peraturan empirikal menyatakan bahawa
95% daripada semua nilai adalah disekitar dua sisihan piawai dari min jika data
adalah hampir bertaburan normal. Rajah 3.7 menunjukkan disebabkan nilai 70
adalah dua sisihan piawai di atas min ( Z = 2.00), 95% daripada nilai adalah di
antara 70 dan 30, iaityu dua sisihan piawai di bawah min
30 - 50
piawai daripada min dan bertaburan normal adalah simetriu, 2.5% adalah di
bawah nilai 30. Oleh itu, 97.5% daripada nilai adalah di bawah 70. Disebabkan
skor Z adalah bilangan sisihan piawai bagi nilai individu data daripada min,
peraturan empirikal boleh dinyatakan semula didalam sebutan skor Z.
Di antara Z = -1.00 dan Z = +1.00 adalah hampir 68% daripada nilai
Di antara Z = -2.00 dan Z = +3.00 adalah hampir 95% daripada nilai
Di antara Z = -3.00 dan Z = +4.00 adalah hampir 99.5% daripada nilai
Rajah 3.7:
Peratus Pecahan Skor Dua Sisihan Piawai daripada Min
95%
2.5%
2.5%
2
X=30
Z=-2.0
2
=50
Z=0
X=70
Z=+2.0
22
Statistik Perihalan
(100)
s
(100)
X
Contoh 3.8:
Katakan harga saham A selama 5 minggu adalah 57, 68, 64, 71 dan 62. Untuk
mengira CV bagi harga ini, pertamanya kirakan min dan sisihan piawai.
57 68 64 71 62
64.4
5
(57 - 64.4) 2 (68 - 64.4) 2 (64 - 64.4) 2 (71 - 64.4) 2 (62 - 64.4) 2
5
117.2
23.44
5
23.44 4.84
A2
CV A
A
23.44
(100)
(100) 7.5
A
64.4
Sisihan piawai adalah 7.5% daripada min.
menjual pada harga yang tinggi akan membuat keuntungan yang besar. Walau
bagaimanapun, jika harga jatuh daripada apa yang dia beli, terdapat potensi
mengalami kerugian. Semankin besar variabiliti, semankin tinggi potensi untuk
rugi. Oleh itu, pelabor akan menggunakan ukuran serakan seperti sisihan piawai
atau pebgkali variasi untuk menentukan risiko sesuatu saham. Apakah CV
memberitahu kita berkaitan risiko saham yang tidak dapat diberikan oleh sisihan
piawai?
Katakan purata saham B disepanjang lima minggu adalah 12, 17, 8, 15
dan 13. Min saham B ialah 13.00 dengan sisihan piawai 3.03. CV bagi saham B
ialah
CVB
B
3.03
(100)
(100) 23.3%
B
13.00
f(M - ) 2
N
24
Statistik Perihalan
dimana:
f = kekerapan
M = titik tengah kelas
N = f atau jumlah kekerapan populasi
= min kumpulan bagi populasi.
Untuk sampel, varian adalah:
s
(M - X)
n -1
s2
dimana
f = kekerapan
M = titik tengah kelas
N = f, atau jumlah kekerapan sampel
X = min kumpulan bagi sampel
25
Contoh 3.8:
Kelas
Kekerapan M
fM
(M - ) (M-)2
F(M-)2
1-3
16
2
32
-4.25
18.063
289.008
3-5
2
4
8
-2.25
5.063
10.126
5-7
4
6
24
-0.25
0.063
0.252
7-9
3
8
24
1.75
3.063
9.189
9-11
9
10
90
3.75
14.063
12.567
11-13
6
12
72
5.75
35.063
198.378
633.520
f=40
fM=250
fM 250
40
f
6.25
f(M - ) 2
f
2 15.838 3.980
633.52
15.838
40
26