A. PENDAHULUAN
Seperti yang sudah dibahas pada bab 1, bahwa statistika ada 2 macam yaitu statistics
deskriptif dan statistics inference. Maka pada bab ini akan dibahas tentang pengolahan
data untuk menggambarkan keadaan data tersebut atau mendeskripsikan data.
Contoh 1 :
Data berikut adalah nilai index prestasi kumulatif 100 mahasiswa teknik :
3,10 3,26 3,12 3,00 2,64 2,70 2,59 1,93 3,15 2,41
2,24 3,67 3,48 3,18 2,66 2,47 2,92 2,96 2,13 0,07
3,04 3,41 3,94 3,33 3,54 1,77 2,17 2,38 2,79 2,17
2,97 2,83 3,71 3,90 1,75 2,96 3,26 2,89 0,92 2,33
3,54 2,56 3,37 3,32 2,61 1,58 2,25 2,55 0,98 1,38
3,70 2,67 2,85 2,78 2,60 2,70 2,93 1,13 2,19 3,15
3,51 3,28 3,14 3,44 2,77 2,14 3,50 2,00 3,31 3,09
3,22 3,18 2,41 3,36 2,78 2,02 2,76 2,45 3,47 3,30
3,80 2,50 3,32 0,22 3,00 2,28 2,71 1,14 2,62 1,93
3,01 2,07 3,61 1,78 2,50 2,58 0,44 3,03 1,77 2,50
Tahapan :
1. Data disajikan tanpa ada pengolahan, maka orang lain tidak dapat memperoleh
gambaran apapun.
2. Diberi informasi nilai maximum = 3,94 dan minimum = 0,07. Orang mulai
mempunyai gambaran bahwa ada kesenjangan yang begitu besar.
3. Disajikan dengan kategori seperti dibawah ini akan memperjelas informasi
Frekuensi
IPK Frekuensi
kumulatif
0,0 - 1,0 5 5
1,0 - 1,5 8 3,00
1,5 - 2,0 15 7,00
2,0 - 2,5 32 17,00
2,5 - 3,0 61 29,00
3,0 - 3,5 89 28,00
3,5 - 4,0 100 11,00
4. Disajikan dalam bentuk diagram, akan dapat memberikan gambaran yang lebih
jelas lagi, tetapi penyeji tetap tidak boleh membuat kesimpulan.
11,00
3,5 - 4,0
28,00
3,0 - 3,5
2,5 - 3,0
2,0 - 2,5
29,00 1,5 - 2,0
IPK 17,00
1,0 - 1,5
0,0 - 1,0
7,00
3,00
5
0 10 20 30 40
Bab 2-2
35
29,0028,00
30
0,0 - 1,0
25 1,0 - 1,5
20 1,5 - 2,0
17,00 2,0 - 2,5
15 2,5 - 3,0
11,00
3,0 - 3,5
10 7,00 3,5 - 4,0
5
5 3,00
0
IPK
Penekanan statistic deskripsi pada materi ini bukan pada bagaimana menyajikan dalam
bentuk table atau grafik, tetapi lebih pada perhitungan ukuran sentral dan disperse
dengan pertimbangan bahwa pembuatan table dan grafik dapat dipelajari sendiri melalui
praktikum statistik maupun belajar sendiri dengan menggunakan computer (paket-paket
program misalnya minitab, SPSS, S-Plus, Mat-Lab, Excel dll).
Sebagai dasar dalam perhitungan statistik adalah suatu notasi penjumlahan yang
biasanya dirumuskan secara umum sbb :
n
Notasi diatas artinya adalah menjumlahkan data dari data ke-1 (X1) sampai dengan data
ke-n (Xn). ∑ Xi = X1+X2+X3+……+Xn
i=1
Bab 2-3
∑ aXi = a ∑Xi
CONTOH 2 :
∑Xi
∑ (Xi – 5) = ∑Xi - n.5 = 60 – 10x5 = 60 – 50 = 10
Untuk menunjukkan nilai pusat dari data dibutuhkan perhitungan sentral yang biasanya
diwakili dengan nilai rata-rata dan atau median. Nilai rata-rata yang umum dipakai
dengan rumusan :
n N
– Xi X i
=
i= 1 i=1
X= n N
Dari contoh 1, misalnya 10 data dianggap sample, maka nilai rata-ratanya adalah sbb :
60
= =6
X 10
Nilai median adalah nilai yang posisinya berada ditengah-tengah data setelah data
tersebut diurutkan. Dari contoh 2, data diurutkan menjadi :
2 3 5 5 6 7 7 8 8 9
Data yang ke 5 dan ke 6 adalah 6 dan7, jadi median adalah (6+7)/2 = 6,5.
Rumus nilai rata-rata tidak hanya seperti yang tertulis diatas, tetapi ada juga rata-rata
terboboti, rata-rata harmoni, rata-rata geometri, rata-rata trimmed, rata-rata Winzorized.
Selain ukuran sentral yang tujuannya menunjukkan pusat dari sebuah data, juga perlu
ditunjukkan penyebaran dari data, yaitu ukuran dispersi. Ukuran dispersi biasa diwakili
dengan range, varians (variasi), standar deviasi/simpangan baku.
–X
n n
( Xi ( X i – )2
) 2
S2= i=1
2= i=1
n 1 N
Bab 2-5
n n
( X X2
i
i=1
) ( X i
)2
i=1
S= =
n 1 N
Cobalah untuk rumus varian dan standar deviasi diterapkan pada data contoh 2.
D. TEOREMA CHEBYSHEV’S
Rata-rata dan simpangan baku atau varian adalah ukuran yang sangat penting dalam
pengembangan statistic berikutnya. Banyak teori-teori yang dikembangkan dengan
dasar 2 ukuran tersebut. Ditinjau dari sudut ilmu matematika memang rumus median
sulit untuk dikembangkan karena rumus median cenderung berupa definisi
sedangkan rata-rata adalah sebuah rumus yang secara matematika dapat
dikembangkan melalui penurunan ataupun integral. Demikian halnya dengan range,
yang merupakan rumus berupa definisi dibandingkan dengan simpangan baku.
Teorema Chebyshev’s adalah salah satu contoh teori dasar yang dikembangkan dari
2 ukuran tersebut untuk menunjukkan ciri-ciri data secara umum. Ada tiga teorema
dinyatakan dalam teorema Chebyshev’s yaitu :
2. Interval antara
X – 3.S sampai X + 3S akan berisi paling sedikit adalah
(1-1/3² ) = 8/9 dari seluruh data.
Contoh 3 :
Dari data yang akan dikelompokkan berjumlah 80 data dengan rata-rata 58.325 dan varians
265.1944 ( S = 16.28479045 )
Jika k = 1.5, maka jumlah data yang berada pada interval
Kerjakan seperti pada contoh 3, untuk data pada contoh 1, kemudian buktikan dengan
menghitung banyaknya data tersebut.
E. KODING DATA
Jika X = aY + b, maka
X =aY +b
S2X= a 2 S 2Y
Contoh 4 :
Y =6 X = 3x6-5 = 13
(A) I only
(B) II only
(C) III only
(D) I and II
(E) I and III
Solution
The correct answer is (E). All variables can be classified as quantitative or categorical
variables. Discrete variables are indeed a category of quantitative variables. Categorical
Bab 2-7
variables, however, are not numeric. Therefore, they cannot be classified as continuous
variables.
Problem 2
Four friends take an IQ test. Their scores are 96, 100, 106, 114. Which of the following
statements is true?
(A) I only
(B) II only
(C) III only
(D) IV only
(E) None is true
Solution
The correct answer is (B). The mean score is computed from the equation:
Since there are an even number of scores (4 scores), the median is the average of the two
middle scores. Thus, the median is (100 + 106) / 2 = 103.
Problem 3
(A) 2
(B) 4
(C) 5
(D) 6
(E) None of the above
Solution
The correct answer is (B). First, we need to compute the population mean.
μ=(1+3+5+7)/4=4
Then we plug all of the known values into formula for the variance of a population, as
shown below:
σ2 = Σ ( Xi - μ )2 / N
σ = [ ( 1 - 4 ) + ( 3 - 4 )2 + ( 5 - 4 )2 + ( 7 - 4 )2 ] / 4
2 2
σ2 = [ ( -3 )2 + ( -1 )2 + ( 1 )2 + ( 3 )2 ] / 4
σ2 = [ 9 + 1 + 1 + 9 ] / 4 = 20 / 4 = 5
Bab 2-8
Problem 4
A sample consists of four observations: {1, 3, 5, 7}. What is the standard deviation?
(A) 2
(B) 2.58
(C) 6
(D) 6.67
(E) None of the above
Solution
The correct answer is (B). First, we need to compute the sample mean.
x=(1+3+5+7)/4=4
Then we plug all of the known values into formula for the standard deviation of a sample,
as shown below:
s = sqrt [ Σ ( xi - x )2 / ( n - 1 ) ]
s = sqrt { [ ( 1 - 4 )2 + ( 3 - 4 )2 + ( 5 - 4 )2 + ( 7 - 4 )2 ] / ( 4 - 1 ) }
s = sqrt { [ ( -3 )2 + ( -1 )2 + ( 1 )2 + ( 3 )2 ] / 3 }
s = sqrt { [ 9 + 1 + 1 + 9 ] / 3 } = sqrt (20 / 3) = sqrt ( 6.67 ) = 2.58
Problem 5
A national achievement test is administered annually to 3rd graders. The test has a mean
score of 100 and a standard deviation of 15. If Jane's z-score is 1.20, what was her score
on the test?
(A) 82
(B) 88
(C) 100
(D) 112
(E) 118
Solution
z = (X - μ) / σ
where z is the z-score, X is the value of the element, μ is the mean of the population, and
σ is the standard deviation.