Anda di halaman 1dari 26

3

Statistik Perihalan
3.1

Ukuran Kecenderungan Memusat

Satu jenis pengukuran yang digunakan untuk memerihalkan set data


adalah ukuran kecenderungan memusat. Pengukuran kecenderungan memusat
menghasilkan maklumat berkaitan dengan titik tengah pada satu kumpulan
nombor.

3.1.1

Data Tidak Berkumpul

Ditunjukkan didalam Jadual 3.1 adalah harga tawaran saham bagi 20


syarikat yang akan disenaraikan di Bursa Saham Kuala Lumpur pada tahun 2000.
Bagai data ini, ukuran kecenderungan memusat boleh menghasilkan maklumat
berkaitan dengan purata harga tawaran, titik tengah harga tawaran dan juga harga
tawaran yang paling kerap ditawarkan. Ukuran kecenderungan memusat tidak
menumpukan keatas pengembangan set data atau berapa jauh nilai daripada titik
tengah. Ukuran kecenderungan memusat bagi data yang tidak berkumpul adalah
min, mod, median, peratusan dan quantil.
Jadual 3.1
Harga Saham bagi 20 Kaunter KLSE (RM)
14.25
24.00
27.00
34.22
19.00

19.00
23.00
25.00
15.50
19.00

11.00
43.25
15.00
15.00
27.00

28.00
19.00
7.00
22.00
21.00

Mod
Mod adalah nilai yang paling kerap ujud didalam set data. Bagi data
yang ditunjukkan didalam Jadual 3.1, mod ialah RM19.00 kerana harga tawaran
berlaku sebanyak 4 kali. Menyusun data didalam susunan yang menaik

Pengenalan kepada Statistik Ekonomi dan Perniagaan

(menyusun dari nombor terkecil hingga terbesar) membantu kita menentukan


mod.
Berikut adalah susunan nilai daripada Jadual 3.1.
7.00
21.00

11.00
22.00

14.25
23.00

15.00
24.00

15.00
25.00

15.50
27.00

19.00
27.00

19.00
28.00

19.00
34.22

19.00
43.25

Penyusunan ini membuatkan kita dengan mudah untuk melihat RM19.00


adalah harga yang kerap berlaku.
Jika terdapat dua kumpulan angka yang kerap ujud didalam set data, ia
mempunyai dua mod. Didalam kes seperti ini, ia dikatakan bi-model. Jika set
data tidak sebenarnya bi-model, tetapi mengandungi dua nilai dimana lebih
dominan daripada yang lain, sesetengah penyelidik mempunyai kebebasan
dengan menunjukkan set data sebagai bi-model walaupun ia sebenarnya tidat
terikat kepada mod. Data set dengan lebih daripada dua mod dipanggil sebagai
berbilang-model.
Didalam dunia perniagaan, konsep mod biasanya digunakan didalam
menentukan saiz. Sebagai contoh, pengilang baju mengeluarkan baju didalam
empat saiz, S, M, L, dan XL. Setiap saiz adalah berpadanan dengan model badan
manusia. Dengan pengurangan bilangan kepada beberapa model saiz, syarikat
boleh mengurangkan jumlah kos pengeluaran dengan menghadkan kos
penyediaan mesin dan bahan.
Mod adalah ukuran kecenderungan memusat sesuai bagi data nominal.
Mod boleh digunakan untuk menentukan manakah kategori yang kerap terjadi.
Median
Median ialah titik tengah sesuatu kumpulan nombor yang disusun secara
menaik. Jika bilangan data tersebut adalah ganjil, median ialah nombor yang
ditengah. Jika bilangan data adalah genap, median ialah purata dua nombor yang
terletak ditengah-tengah. Langkah berikut adalah digunakan untuk menentukan
median.
LANGKAH 1:
LANGKAH 2:
LANGKAH 3:

Susun data didalam susunan menaik.


Jika bilangan data adalah ganjil, carikan sebutan ditengahtengah didalam susunan tersebut. Ia adalah median.
Jika bilangan data adalah genap, kirakan purata dua angka
ditengah-tengah susunan tersebut. Purata ini adalah median.

Statistik Perihalan

Katakan ahli statistik hendak mencari median bagi kumpulan data


berikut:
15

11 14

21 17 22 16 19 16

19

20

Susunan nombor didalam sebutan menaik:


3

11 14 15 16 16 17 19 19 20 21 22

Terdapat 17 sebutan (bilangan ganjil), oleh itu median terletak ditengahtengah susunan tersebut, iaitu 15.
Jika nombor 22 dikeluarkan daripada senarai, terdapat hanya 16 sebutan
(bilangan genap):
3

11

14

15

16

16

17

19

19

20

21

Sekarang kita mempunyai bilangan sebutan genap, median ditentukan


dengan mengira purata dua nombor yang terletak ditengah-tengah susunan
tersebut, 14 dan 15. Ini menghasilkan nilai median iaitu 14.5.
Satu cara lain untuk menentukan median ialah mencari sebutan n21
didalam susunan yang menaik. Sebagai contoh, jika set data mempunyai 77
sebutan, median adalah terletak pada sebutan yang ke 39, iaitu:
n 1 77 1

39
2
2

Formula ini amat berguna apabila melibatkan bilangan data yang


besar. Median tidak dipengaruhi oleh magnitud nilai ekstrim. Ciri-ciri ini
merpakan kelebihan disebabkan nilai terbesar atau terkecil tidak
mempengaruhi median. Oleh sebab itu, median merupakan ukuran lokasi
yang terbaik untuk digunakan didalam analisis pembolehubah seperti kos
rumah, pendapatan dan usia. Sebagai contoh, broker perumahan mahu
menentukan median, harga jualan 10 buah rumah yang disenaraikan
seperti berikut:
67,000
122,000

91,000
148,000

95,000
167,000

105,000
189,000

116,000
5,250,000

Median harga rumah tersebut adalah purata dua sebutan ditengah-tengah,


116,000 dan 122,000 atau 119,000. Harga ini adalah munasabah mewakili harga
kesemua rumah. Perhatikan harga rumah 5,250,000 tidak termasuk didalam
3

Pengenalan kepada Statistik Ekonomi dan Perniagaan

analisis melainkan diambil kira sebagai satu daripada 10 rumah. Jika harga
rumah yang ke 10 adalah 200,000, keputusannya masih lagi sama. Walau
bagaimanapun, jika semua harga rumah dipuratakan, menghasilkan harga purata
10 rumah adalah RM635,000 dan lebih tinggi daripada harga 9 rumah yang
pertama.
Kelemahan median ialah tidak semua maklumat daripada data
digunakan. Iaitu, maklumat berkaitan dengan harga rumah termahal tidak
diambilkira didalam pengiraan median. Paras pengeluaran data mestilah
sekurang-kurangnya ordinal untuk median lebih bermakna.
Min
Min aritmatik adalah susunan sinonim dengan purata kumpulan nombor
dan ia dikira dengan menjumlahkan semua nombor dan membahagikannya
dengan bilangan nombor tersebut. Disebabkan min aritmatik digunakan dengan
meluas, kebanyakan ahli statistik hanya menggunakan istilah min sahaja.
Min populasi ditandakan dengan huruf Greek mu (). Min sampel pula
ditandakan dengan huruf Roman ( X ). Formula bagi mengira min bagi populasi
dan min sampel adalah sebagaimana berikut:

Min populasi:

X X1 X 2 X 3 ........... X N

Min sampel:

X X1 X 2 X 3 ........... X n

Huruf Greek sigma () biasanya digunakan oleh ahli matematik untuk


menunjukkan jumlah semua nombor-nombor didalam kumpulan data.
Disamping itu, N adalah bilangan nombor didalam populasi dan n adalah
bilangan nombor didalam sampel. Algorithma untuk mengira min adalah dengan
menjumlahkan nombor-nombor didalam populasi atau sampel dan kemudiannya
membahagikannya dengan bilangan populasi atau sampel.
Secara amnya, definasi min adalah:
N

Xi
i 1

Statistik Perihalan

Walau bagaimanapun, untuk tujuan kursus ini

X Menandakan

Xi
i 1

Min adalah sesuai digunakan untuk menganalisis data sekurangkurangnya data bertaraf interval didalam pengukuran.

Contoh 1.1
Katakan syarikat mempunyai lima jabatan dengan bilangan pekerja 24, 13, 19, 26
dan 11 masing-masingnya. Min populasi adalah:

= 24 + 13 + 19 +26 + 11
= 93

X 93 18.6
N

Pengiraan min sampel adalah menggunakan algorithma yang sama bagi


min populasi. Walau bagaimanapun adalah tidak sesuai untuk mengira min
sampel untuk populasi atau min populasi untuk sampel. Oleh kerana kedua-dua
min populasi dan sampel adalah penting didalam statistik, simbol yang
berasingan adalah perlu untuk membezakan min populasi dan sampel.
Min adalah dipengaruhi oleh setiap nilai didalam data, yang merupakan
kelebihannya. Ia juga merupakan kelemahannya, disebabkan nilai ekstrim yang
terbesar atau terkecil boleh menyebabkan nilai min tertarik kearah nilai ekstrim.
Min amat biasa digunakan didalam mengukur lokasi disebabkan ia
menggunakan setiap data dalam pengiraannya dan ia mempunyai kandungan
matematik yang membuatkkannya menarik untuk digunakan didalam analisis
statistik pentaabiran.
Peratusan

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Peratusan adalah ukuran kecenderungan memusat yang membahagikan


kumpulan data kepada 100 bahagian. Terdapat 99 peratusan, disebabkan ia
mengambil 99 pembahagi untuk memisahkan data kepada 99 bahagian.
Peratusan ke-n adalah nilai dimana sekurang-kurangnya n peratus data terletak di
bawah nilai tersebut dan selebih-lebihnya (100 n) peratus adalah di atas nilai
tersebut. Khususnya, 87 peratusan adalah nilai dimana sekurang-kurangnya 87%
daripada data di bawah nilai tersebut dan tidak lebih daripada 13% di atas nilai.
Peratusan adalah nilai anak-tangga, sebagaimana ditunjukkan didalam Rajah
3.1, disebabkan 87 peratusan dan 88 peratusan tetapi tiada peratusan di
antaranya. Jika operator kilang mengambil ujian keselamatan 87.6% sebagai
skor ujian keselamatan adalah di bawah skor pekerja, ia masih lagi mempunyai
skor hanya pada 87 peratusan, walaupun lebih daripada 87% skor tersebut adalah
terendah.
Rajah 3.1
Peraturan Anak Tangga

88 peratusan
87 peratusan
86 peratusan

Berikut adalah langkah-langkah didalam menentukan kedudukan


peratusan:
Langkah 1: Susun nombor didalam kedudukan menaik.
Langkah 2: Kirakan kedudukan peratusan i dengan:
i

P
(n)
100

dimana;
P = peratusan yang dikehendaki
i = kedudukan peratusan
N = bilangan nombor didalam set data.
Langkah 3: Tentukan lokasi samada melalui (a) atau (b)

Statistik Perihalan

a. Jika i adalaha nombor bulat, P peratusan adalah purata nilai pada


kedudukan ke i dan nilai pada kedudukan (i + 1)
b. Jika i bukan nombor bulat, nilai P peratusan adalah bahagian nombor
bulat (i + 1)

Contoh 3.2.
Katakan kita hendak menentukan 80 peratusan daripada 1240 nombor.
P = 80, n = 1240
1. Kedudukan 80 peratusan
i

80
(1240) 992
100

2. Disebabkan oleh I = 992 dan nombor bulat, ikut langkan 3(a). 80 peratusan
adalah purata nombor 992 dan 993.
P80

nombor 992 nombor 993


2

Contoh 3.3
Tentukan 30 peratusan bagi 8 nombor berikut:
14 12 19 23 5 13 28 17
Penyelesaian:
1. Susun dalam keadaan susunan menaik
5 12

13

14

17

19

2. Kirakan kedudukan peratusan dengan P = 30 dan n = 8.

23

28

Pengenalan kepada Statistik Ekonomi dan Perniagaan

30
(8) 2.4
100

3. Disebabkan i bukan nombor bulat, langkah 3(b) digunakan. Nilai i + 1 = 2.4


+ 1 = 3.4. Nombor bulat 3.4 ialah 3. Oleh itu 30 peratusan adalah
dikedudukan pada nilai ke 3, dan nilai ketiga ialah 13. Oleh itu 13 adalah 30
peratusan. Perhatikan bahawa peratusan mungkin atau mungkin tidak satu
daripada nilai data.

Sukuan
Sukuan adalah ukuran kecenderungan memusat yang membahagikan kumpulan
data kepada empat sub-kumpulan atau bahagian. Terdapat tiga sukuan,
ditandakan sebagai Q1, Q2 dan Q3. Sukuan pertama, memisahkan pertama, atau
terendah, satu per empat daripada tiga suku teratas adalah sama dengan 25
peratus. Quartil kedua, Q 2, memisahkan suku kedua data daripada suku ketiga.
Q2 adalah terletak pada 50 peratusan, dan sama dengan media bagi data. Sukuan
ketiga, Q3, membahagikan tiga suku pertama daripada sukuan terakhir dan adalah
sama dengan nilai 75 peratusan. Tiga sukuan ini ditunjukkan didalam Rajah 3.2.
Katakan kita hendak menentukan nilai Q1, Q2 dan Q3 dari nombor
berikut:
106 109 114 116 121 122 125 129
Nilai Q1 adalah diperolehi pada 25 peratusan, P25;
Bagi n = 8; I =

25
(8) = 2.
100

Disebabkan I adalah nombor bulat, P 25, adalah ditemui dengan


mempuratakan sebutan kedua dan ketiga.
P25 =

109 114
= 111.5
2

Nilai Q1 adalah P25 = 111.5. Perhatikan satu per empat, atau dua, bagi
nilai (106 dan 109) adalah kurang daripada 111.5.

Statistik Perihalan

Nilai Q2 adalah sama dengan median. Oleh kerana bilangan yang genap,
median adalah purata dua sebutan ditengah:
Q2 = median =

116 121
= 118.5
2

Perhatikan bahawa sebenarnya separuh daripada sebutan adalah kurang


daripada Q2 dan separuh lagi lebih besar daripada Q2.
Nilai Q3 ditentukan oleh P75, sebagaimana berikut:
I=

75
(8) = 8
100

Disebabkan i adalah angka bulat, maka P75 adalah purata kedudukan ke 6


dan 7.
P75 =

122 125
= 123.5
2

Nilai Q3 adalah P75 = 123.5. Perhatikah bahawa tiga suku atau 6 sebutan,
daripada nilai adalah lebih kecil daripada 123.5 dan dua daripada nilai lebih besar
daripada 123.5.

3.1.2

Data Berkumpulan

Tiga ukuran kecenderungan memusat akan dibincangkan bagi data berkumpulan


iaitu min, median dan mod.
Min
Bagi data yang tidak terkumpul, min adalah dikira dengan menjumlahkan nilai
didalam set data dan kemudiannya membahagikannya dengan bilangan data
tersebut. Tetapi bagi data yang telah terkumpul, nilai yang khusus tidak
diketahui. Apakah yang boleh digunakan untuk mewakili nilai data? Titik
tengah bagi setiap jeda kelas adalah digunakan untuk mewakili semua nilai
didalam jeda kelas tersebut. Titik tengah ini akan diwajarkan dengan kekerapan
nilai didalam jeda kelas tersebut. Min bagi data terkumpul kemudiannya dikira

Pengenalan kepada Statistik Ekonomi dan Perniagaan

dengan menjumlahkan hasil dharab titik tengah kelas dengan kekerapan kelas
dan membahagiman jumlah tersebut dengan bilangan kekerapan. Formulanya
adalah sebagaimana berikut:

fi mi
fi

kumpulan

f 1 m1 f 2 m 2 .........f i m i
f 1 f 2 ... f i

dimana;
i = bilangan jeda
f = kekerapan kelas
M = titik tengah kelas
N = jumlah kekarap.

Contoh 3.4:
Jeda Kelas

Kekerapan (fi)

13
35
57
79
9 11
11 - 13

16
2
4
3
9
6
f = N = 40

fiMi
fi

Titik Tengah
(Mi)
2
4
6
8
10
12

fiMi
32
8
24
24
90
72
fM = 250

250
6.25
40

Min baga data yang terkumpul adalah 6.25. Perlu diingat bahawa setiap
jeda kelas diwakili oleh nilai titik tengah kelas tersebut bukannya nilai sebenar.
Oleh sebab itu, nilai min tersebut hanyalah nilai penghampiran sahaja.
Median

10

Statistik Perihalan

Nilai median bagi data tidak terkumpul adalah nilai yang terletak ditengah-tengah
apabila data tersebut disusun secara menaik. Bagi data yang terkumpul,
pengiraan median agak rumit dan menggunakan formula berikut:

Median L

N
2

- cf p

f med

dimana
L = had bawah jeda kelas median
cfp = jumlah terkumpul kekerapan sehingga kelas tersebut, tetapi tidak
melibatkan kekerapan median kelas
Fmed = kekerapan median
W = keluasan jedia kelas median (had atas kelas had bawah kelas)
N = jumlah bilangan kekerapan

Contoh 3.5:
1. Kirakan nilai
N
2

40
2

N
2

yang merupakan kedudukan sebutan ditengah-tengah.

20 . Oleh itu median terletak dikedudukan ke 20. Persoalannya

dikelas manakah sebutan ke 20?


2. Kirakan kekerapan terkumpul bagi setiap kelas.
Jeda Kelas
13
35
57
79
9 11
11 - 13

Kekerapan (fi)
16
2
4
3
9
6
f = N = 40

Titik Tengah (Mi)


2
4
6
8
10
12

Berdasarkan kepada kekerapan terkumpul, sebutan ke 20 terletak didalam


kelas ke tiga kerana terdapat hanya 18 nilai sahaja dalam dua kelas pertama.
Oleh itu nilai median terletak dimana-mana di antara 5 7 (kelas ke tiga).
Jeda kelas yang mengandungi nilai median dirujukkan sebagai jeda kelas
median.

11

Pengenalan kepada Statistik Ekonomi dan Perniagaan

3. Oleh kerana nilai ke 20 adalah di antara 5 dengan 7, nilai median adalah


sekurang-kurangnya 5. Tetapi apakah nilai tersebut? Perbezaan di antara
kedudukan nilai median, N2 = 20, dan kekerapan terkumpul sehingga itu,
tetapi tidak termasuk jeda kelas median, cf p = 18, memberitahu berapa
banyak nilai sehingga jeda kelas median bagi nilai median terletak. Ini
bolehb ditentukan dengan menyelesaikan N2 cfp = 20 18 = 2. Nilai
median terletak dia nilai kedalam jeda kelas median. Walau bagaimanapun,
terdapat empat nilai didalam jeda kelas median (f med). Nilai median adalah
2
4 jauh kedalam jeda, iaitu
N
2

- cf p

f med

20 - 18 2 1

4
4 2

4. Oleh itu, nilai median sekurang-kurangnya 5 nilai L dan separuh jauhnya


daripada jeda median. Berapa jauhkah secara geometri disepanjang jeda
median? Setiap jeda kelas adalah dua unit luas (W). Separuh daripada jarak
ini memberitahu kita berapa jauh nilai median ke dalam jeda kelas.
N
2

- cf p

f med

(W)

40
2

- 18
2
1
(2) (2) (2) 1
4
4
2

5. Menambahkan jarak ini dengan had bawah jeda kelas median menghasilkan
nilai median.

Median L

N
2

- cf p

f med

W 5

20
2

- 18
1
(2) 5 (2) 5 1 6
4
2

Perlu diingat bahawa nilai median ini juga merupakan nilai


penghampiran. Andaian yang dibuat didalam pengiraan ini adalah nilai sebenar
adalah jatuh secara seragam disepanjang jeda kelas median.

12

Statistik Perihalan

Mod
Mod bagi data terkumpul adalah titik tengah kelas mod. Kelas kod adalah jeda
kelas yang mempunyai kekerapan yang tertinggi. Di dalam contoh di atas, kelas
mod adalah di antara 1 3 dengan bilangan kekerapan 16. Oleh itu titik tengah
kelas mod ialah 2 dan mod ialah 2.

3.2 Ukuran Serakan


3.2.1 Data tidak terkumpul
Ukuran kecenderungan memusat menghasilkan maklumat berkaitan titik tertentu
bagi set data. Walau bagaimanapun, penyelidik boleh menggunakan kumpulan
alatan analisis lain untuk menerangkan set data. Alat ini ialah ukuran serakan
yang menerangkan serakan atau pencaran set data. Menggunakan ukuran
serakan bersama-sama ukuran kecenderungan memusat membuatkan
pemerihalan numerik bagi data lebih lengkap lagi.
Sebagai contoh, sebuah syarikat yang mempunyai 25 jurujual dan
median jualan tahunan bagi jurujual ini ialah RM1.2 juta. Adakah jurujual
tersebut merupakan kejayaan atau tidak? Median memberikan maklumat
berkaitan jualan individu ditengah-tengah, tetapi bagaimana dengan jurujual yang
lain? Adakah mereka semua memperolehi RM1.2 juta jualan tahunan, atau
adakah angka jualan mempunyai jeda yang luas dengan saorang jurujual menjual
RM 5 juta setahun dan yang lain hanya menjual RM0.15 juta setahun? Ukuran
serakan memberikan maklumat tambahan yang penting untuk menjawab
persoalan ini.
Rajah 3.2 menunjukkan tiga taburan dimana min bagi setiap taburan
adalah sama ( = 50), tetapi taburan ini mempunyai serakan yang berbeza.
Pemerhatian terhadap taburan ini menunjukkan bahawa ukuran serakan adalah
perlu sebagai pelengkap kepada nilai min didalam menerangkan data. Kaedah
pengiraan ukuran serakan adalah berebza bagi data tidak berkumpul dan data
berkumpul. Bahagian ini akan menumpukan kepada jenis ukuran serakan bagi
data tidak berkumpul.

13

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Rajah 3.2
Tiga Taburan dengan Min Sampel yang Sama dan Serakan Berbeza

=50

Jeda
Jeda adalah perbezaan di antara nilai terbesar dan nilai terkecil. Walaupun ia
hanya merupakan nilai numerik tunggal, sesetengah penyelidik mendefinasikan
jeda sebagai pasangan susunan nombor terkecil dan terbesar [terkecil, terbesar].
Ia merupakan ukuran serakan kasar, menerangkan jarak ke sempadan luar set
data. Ia menggambarkan nilai ekstrim disebabkan ia dibina daripadanya.
Kelebihan jeda ialah ianya mudah dikira. Satu penggunaan penting jeda ialah
didalam penentuan kualiti, dimana jeda digunakan untuk membentuk carta
kawalan. Kelemahan jeda ialah disebabkan ia dikira dengan nilaian yang
terdapat nilai ekstrim bagi data maka ia dipengaruhi oleh nilai ekstrim tersebut
dan oleh itu penggunaannya adalah untuk ukuran serakan adalah terhad.
Berdasarkan kepada Jadual 3.1, nilai terkecil ialah RM7.00 dan nilai
terbesar ialah RM43.25. Nilai jeda dikira dari perbezaan di antara nilai terbesar
dan nilai terkecil.
Jeda = Terbesar Terkecil = 43.25 7.00 = RM36.25.
Sisihan Purata Mutlah (SPM)
Sisihan purata mutlak (SPM) adalah purata nilai mutlak bagi sisihan disekitar
min bagi set nombor.

SPM

X -
N

14

Statistik Perihalan

Contoh 3.6:
Jika diberi set data 5, 9, 16, 17, dan 19, maka SPM dikira sebagaimana berikut:
X-
-8
-4
+3
+4
+5
(X -) = 0

X
5
9
16
17
18
X = 65

|X - |
+8
+4
+3
+4
+5
|X - | = 24

X 65 13
N

SPM

5
|
X
- |
N

24
4.8
5

Disebabkan ia dikira menggunakan nilai mutlak, SPM adalah kurang


berguna didalam statistik berbanding dengan lain-lain ukuran serakan. Walau
bagaimanapun, didalam bidang unjuran ia biasanya digunakan untuk mengukur
ralat.
Varian
Disebabkan nilai mutlak tidak bersesuaian untuk pengiraan yang mudah, ahli-ahli
matematik membentuk mekanisma alternatif untuk menyelesaikan jumlah sifar
sisihan daripada min. Pendekatan ini menggunakan sisihan kuasa dua daripada
min. Ukuran tersebut ialah varian dan merupakan ukuran penting bagi serakan.
Varian ialah purata sisihan kuasadua dari min bagi set nombor. Populasi
varian ditandakan dengan huruf Greek, 2 dan formulanya:

(X - ) 2

15

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Menggunakan set nombor di atas, varian dikira sebagaimana berikut:


X-
-8
-4
+3
+4
+5
(X -) = 0

X
5
9
16
17
18
X = 65

( X - |)2
64
16
9
16
25
(X - )2 = 130

Jumlah sisihan kuasadua daripada min (X - )2 bagi set nombor dipanggil


sebagai Jumlah Kuasadua X (SS X). Bagi data di atas jumlah kuasadua (SS X)
adalah 130. Membahagikan SSX dengan bilangan data akan menghasilkan
varian.
SSX = (X - )2 = 130
Varian = 2

SSX

(X - ) 2
N

130
26.0
5

Disebabkan varian adalah dikira daripada sisihan kuasadua, keputusan


akhir adalah dinyatakan didalam sebutan unit pengukuran kuasadua. Ukuran
statistik didalam unit kuasadua mempunyai masalah didalam tafsiran. Oleh yang
demikian, apabila digunakan didalam ukuran pemerihalan, varian hanya
dipertimbangkan sebagai pengiraan pertengahan didalam proses memperolehi
sisihan piawai sampel.
Sisihan Piawai
Sisihan piawai adalah ukuran serakan yang popular. Didalam penggunaan
sebagai entiti yang berasingan atau sebagai sebahagian analisis lain seperti
pengiraan selang keyakinan dan juga didalam pengujian hipotesis.
Sisihan piawai ialah punca kuasadua varian. Sisihan piawai populasi
ditandakan sebagai , dan dikira sebagaimana berikut:

16

Statistik Perihalan

(X - ) 2

Berdasarkan kepada contoh di atas, nilai sisihan piawai ialah

26 5.1

Makna Sisihan Piawai


Apakah sisihan piawai? Apakah maknanya? Dua cara menggunakan sishan
piawai iaitu peraturan empirikal dan Teorem Chebyshev
Peraturan Empirikal
Peraturan empirikal adalah peraturan asas yang amat penting yang digunakan
untuk menyatakan paras penghampiran nilai yang terletak disekitar sesuatu
nombor sisihan piawai.
Peraturan empirikal menggunakan hanya tiga nombor sisihan piawai: 1,
2 dan 3. Keperluan data adalah bertaburan normal mengandungi beberapa
toleran, dan peraturan empirikal secara amnya digunakan selagi taburan data
mempunyai bentuk lonceng.
Peraturan Empirikal1
Jarak dari min
1
2
3

Nilai di antara jarak


68%
95%
99%

Jika satu set data adalah bertaburan normal atau berbentuk lonceng,
hampir 68% daripada nilai data adalah disekitar satu sisihan piawai min, 95%
adalah disekitar dua sisihan piawai dan hampir 100% disekitar tiga sisihan
piawai.
Sebagai contoh, katakan Kementerian Perdagangan dan hal Ehwal
Pengguna menyatakan purata harga ayam di Malaysia ialah RM4.50 sekilogram.
Katakan harga ayam disemua negeri adalah bertaburan normal dengan sisihan
1

Berdasarkan kepada andaian taburan data adalah hampir bertaburan normal.

17

Pengenalan kepada Statistik Ekonomi dan Perniagaan

piawai RM0.10. Menurut peraturan empirikal, hampir 68% daripada harga


sepatutnya jatuh disekitar 1, atau RM4.50 1(0.10). Hampir 68% daripada
harga di antara RM4.40 dan RM4.60, sebagaimana ditunjukkan didalam Rajah
3.5a. Hampir 95% sepatutnya jatuh disekitar 2 atau RM4.50 2(0.10) =
RM4.50 0.20 atau di antara RM4.30 dan RM4.70, sebagaimana ditunjukkan
didalam Rajah 3.5b.
Rajah 3.5
Peraturan Empirikal bagi 1 dan 2 Harga Ayam.

1.34

1.42
1.50
=RM1.42
=RM0.08

1.26

1.42
=RM1.42
=RM0.08

1.58

Perhatikan, oleh kerana 68% daripada harga ayam terletak disekitar satu
sisihan piawai daripada min, hampir 32% adalah terletak diluar jeda ini. Oleh
kerana taburan normal adalah simetri, 32% boleh dipisahkan dimana setengah
daripadanya terletak pada setia ekor taburan tersebut. Oleh itu, hampir 16%
daripada harga ayam sepatutnya kurang daripada RM4.40 dan hampir 16%
daripada harga sepatutnya lebih daripada RM4.60.

Teorem Chebyshev

18

Statistik Perihalan

Peraturan empirikal digunakan hanya apabila data diketahui hampir bertaburan


normal. Apakah yang perlu dilakukan apabila data tidak bertaburan normal atau
bentuk taburan tidak diketahui? Teorem Chebyshev digunakan untuk semua
taburan walaupun bentuk taburan data tidak diketahui atau tidak normal.
Walaupun teorem Chebyshev secara teorinya boleh digunakan kepada data yang
mempunyai taburan normal, peraturan empirikal lebih luas digunakan dan
digemari apabila bersesuaian. Teorem Chebshev bukan peraturan umum
sebagaimana peraturan empirikal, tetapi mempunyai formula tertentu dan oleh itu
boleh digunakan dengan meluas. Teorem Chebyshev menyatakan semurang-

kurangnya nilai 1 -

k2

adalah terletak disekitar k sisihan piawai daripada

min bergantung kepada bentuk taburan.

Teorem Chebyshev:
Disekitar k sisihan piawai bagi min, k terletak sekurangkurangnya

k2

bahagian nilai dengan andaian k > 1.

Khususnya teorem Chebyshev menyatakan sekurang-kurangnya 75%


daripada semua nilai adalah disekitar 2 daripada min bergantung kepada
kentuk taburan disebabkan jika k = 2, maka

1
1
3

= 1- 2 =
= 0.75
2
4
k
2

Rajah 3.6 menggambarkan secara grafik. Sebaliknya, peraturan empirikal


menyatakan bahawa jika data adalah bertaburan normal, 95% daripada semua
nilai adalah disekitar 2. Menurut teorem Chebysev, peratus nilai disekitar
tiga sisihan piawai bagi min adalah sekirang-kurangnya 89%, sebaliknya 99.7%
bagi peraturan empirikal. Disebabkan formula adalah digunakan untuk mengira
19

Pengenalan kepada Statistik Ekonomi dan Perniagaan

kandungan didalam teorem Chebysev, sebarang nilai k > 1 boleh digunakan.


Sebai contoh, jika k = 2.5, sekurang-kurangnya semua nilai adalah disekitar
2.5, disebabkan

1
1

= 1 = 0.84
2
k
2 .5 2

Rajah 3.6
Penggunaan Teorem Chebysev bagi Dua Sisihan Piawai.

Sisihan Piawai Populasi dan Sampel


Varian sampel ditandakan sebagai s2 dan sisihan piawai sampel ialah s.
Pengiraan varian dan sisihan piawai untuk sampel berbeza sedikit daripada
pengiraan untuk populasi. Tujuan utama pengiraan varian dan sisihan piawan
untuk sampel adalah untuk menganggar varian dan sisihan piawai untuk
populasi. Menggunakan n 1 sebagai pembahagi (denominator) bagi sampel
berbanding N untuk populasi, menghasilkan penganggaran yang lebih baik untuk
nilai populasi. Oleh itu, formula berikut boleh digunakan untuk mengira varian
dan sisihan piawai untuk sampel.

20

Statistik Perihalan

Varian untuk sampel:

(X - X) 2

s2

n -1

Sisihan piawai untuk sampel


s

s2

Skor Z
Skor Z mewakili nombor nilai sisihan piawai di atas atau di bawah min bagi set
nombor apabila data adalah bertaburan normal.
Menggunakan skor Z
membolehkan kita menterjemahkan nilai kasar jarak daripada min kepada unit
sisihan piawai.
Z

X -

X-X
s

dan untuk sampel

Jika skor Z negatif, maka nilai kasar (X) adalah di bawah min dan
sebaliknya.

Contoh 3.7
Bagi set data yang bertaburan normal dengan min adalah 50 dan sisihan piawai
10, tettukan skor Z bagi nilai 70 (X = 70).
Nilai X = 70 adalah 20 unit di atas min, oleh itu
Z

70 - 50 20

2.00
10
2

21

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Skor Z ini menunjukkan skor kasar 70 adalah dua sisihan piawai di atas
min. Bagaimana skor Z ini ditafsirkan? Peraturan empirikal menyatakan bahawa
95% daripada semua nilai adalah disekitar dua sisihan piawai dari min jika data
adalah hampir bertaburan normal. Rajah 3.7 menunjukkan disebabkan nilai 70
adalah dua sisihan piawai di atas min ( Z = 2.00), 95% daripada nilai adalah di
antara 70 dan 30, iaityu dua sisihan piawai di bawah min
30 - 50

- 2.00 . Oleh kerana 5% daripada nilai diluar jeda dua sisihan


Z
10

piawai daripada min dan bertaburan normal adalah simetriu, 2.5% adalah di
bawah nilai 30. Oleh itu, 97.5% daripada nilai adalah di bawah 70. Disebabkan
skor Z adalah bilangan sisihan piawai bagi nilai individu data daripada min,
peraturan empirikal boleh dinyatakan semula didalam sebutan skor Z.
Di antara Z = -1.00 dan Z = +1.00 adalah hampir 68% daripada nilai
Di antara Z = -2.00 dan Z = +3.00 adalah hampir 95% daripada nilai
Di antara Z = -3.00 dan Z = +4.00 adalah hampir 99.5% daripada nilai
Rajah 3.7:
Peratus Pecahan Skor Dua Sisihan Piawai daripada Min

95%
2.5%

2.5%

2
X=30
Z=-2.0

2
=50
Z=0

X=70
Z=+2.0

Pengkali Variasi (CV)


Pengkali variasi adalah statistik dimana kadar sisihan piawai terhadap min
dinyatakan sebagai peratus dan ditandakan sebagai CV.

22

Statistik Perihalan

Pengkali Variasi (CV)

(100)

Pengkali Variasi (CV)

s
(100)
X

dan bagi sampel

Pengkali variasi adalah perbandingan relatif sisihan piawai terhadap min.


CV amat berguna didalam membandingkan sisihan piawai yang dikira daripada
data dengan min yang berbeza.

Contoh 3.8:
Katakan harga saham A selama 5 minggu adalah 57, 68, 64, 71 dan 62. Untuk
mengira CV bagi harga ini, pertamanya kirakan min dan sisihan piawai.

57 68 64 71 62
64.4
5

(57 - 64.4) 2 (68 - 64.4) 2 (64 - 64.4) 2 (71 - 64.4) 2 (62 - 64.4) 2
5
117.2

23.44
5
23.44 4.84

A2

CV A

A
23.44
(100)
(100) 7.5
A
64.4
Sisihan piawai adalah 7.5% daripada min.

Pelabor-pelabor kewangan menggunakan CV atau sisihan piawai atau


kedua-duanya untuk mengukur risiko. Bayangkan saham dengan harga yang
tidak pernah berubah. Ia tidak mempunyai risiko kehilangan wang dari harga
yang menurun disebabkan tiada variabiliti harga. Sebaliknya, katakan harga
saham turun-naik dengan meluas. Pelabor yang membeli pada harga rendah dan
23

Pengenalan kepada Statistik Ekonomi dan Perniagaan

menjual pada harga yang tinggi akan membuat keuntungan yang besar. Walau
bagaimanapun, jika harga jatuh daripada apa yang dia beli, terdapat potensi
mengalami kerugian. Semankin besar variabiliti, semankin tinggi potensi untuk
rugi. Oleh itu, pelabor akan menggunakan ukuran serakan seperti sisihan piawai
atau pebgkali variasi untuk menentukan risiko sesuatu saham. Apakah CV
memberitahu kita berkaitan risiko saham yang tidak dapat diberikan oleh sisihan
piawai?
Katakan purata saham B disepanjang lima minggu adalah 12, 17, 8, 15
dan 13. Min saham B ialah 13.00 dengan sisihan piawai 3.03. CV bagi saham B
ialah

CVB

B
3.03
(100)
(100) 23.3%
B
13.00

Sisiham piawai bagi saham B ialah 23.3% daripada min.


Dengan sisihan piawai sebagai ukuran risiko, saham A adalah lebih
berisiko disepanjang tempoh masa tersebut disebabkan ia mempunyai sisihan
piawai yang besar. Walau bagaimanapun, purata harga saham A adalah kurang
lima kali ganda saham B. Relatif terhadap jumlah yang dilaburkan didalam
saham A, sisihan piawai sebanyak RM4.04 mungkin tidak menggambarkan risiko
yang lebih berbanding sisihan piawai RM3.03 bagi saham B, dimana puratanya
hanyalah RM13.00. Pengkali variasi menunjukkan risiko bagi saham didalam
bentuk saiz sisihan piawai relatif terhadap saiz didalam min (didalam peratus).
Saham B mempunyai CV hampir tiga kali ganda CV saham A.
Menggunakan CV sebagai ukuran risiko menunjukkan saham B lebih berisiko.
Pilihan samada untuk menggunakan CV atau sisihan piawai untuk
membandingkan sisihan piswai yang berbilang adalah menurut citarasa sahaja.
CV juga memberikan kaedah pilihan untuk mentafsirkan nilai sisihan piawai.

3.2.2 Data Terkumpul


Dua ukuran serakan bagi data terkumpul dibincangkan disini, iaitu varian dan
sisihan piawai.
Untuk populasi, varian adalah

f(M - ) 2
N

dan sisihan piawai

24

Statistik Perihalan

dimana:
f = kekerapan
M = titik tengah kelas
N = f atau jumlah kekerapan populasi
= min kumpulan bagi populasi.
Untuk sampel, varian adalah:
s

(M - X)

n -1

dan sisihan piawai


s

s2

dimana
f = kekerapan
M = titik tengah kelas
N = f, atau jumlah kekerapan sampel
X = min kumpulan bagi sampel

25

Pengenalan kepada Statistik Ekonomi dan Perniagaan

Contoh 3.8:
Kelas
Kekerapan M
fM
(M - ) (M-)2
F(M-)2
1-3
16
2
32
-4.25
18.063
289.008
3-5
2
4
8
-2.25
5.063
10.126
5-7
4
6
24
-0.25
0.063
0.252
7-9
3
8
24
1.75
3.063
9.189
9-11
9
10
90
3.75
14.063
12.567
11-13
6
12
72
5.75
35.063
198.378
633.520
f=40
fM=250

fM 250
40
f

6.25

f(M - ) 2
f

2 15.838 3.980

633.52
15.838
40

Sebagaimana dengan pengiraan min data terkumpul, titik tengah kelas


adalah digunakan untuk mewakili semua nilai didalam jeda kelas. Ini mungkin
bersesuaian atau tidak, bergantung kepada samada nilai purata adalah pada titik
tengah. Jika situasi ini tidak ujud, maka varian dan sisihan piawai adalah hanya
penghampiran. Disebabkan oleh data terkumpul hanya dikira tanpa mengetahui
nilai data sebenar, terdapat hanya potensi bagi statistik yang dikira hanya sebagai
penghampiran sahaja.

26

Anda mungkin juga menyukai