Anda di halaman 1dari 8

Bab 2-1

BAB 2. DESKRIPSI DATA

A. PENDAHULUAN
Seperti yang sudah dibahas pada bab 1, bahwa statistika ada 2 macam yaitu statistics
deskriptif dan statistics inference. Maka pada bab ini akan dibahas tentang pengolahan
data untuk menggambarkan keadaan data tersebut atau mendeskripsikan data.
Contoh 1 :
Data berikut adalah nilai index prestasi kumulatif 100 mahasiswa teknik :
3,10 3,26 3,12 3,00 2,64 2,70 2,59 1,93 3,15 2,41
2,24 3,67 3,48 3,18 2,66 2,47 2,92 2,96 2,13 0,07
3,04 3,41 3,94 3,33 3,54 1,77 2,17 2,38 2,79 2,17
2,97 2,83 3,71 3,90 1,75 2,96 3,26 2,89 0,92 2,33
3,54 2,56 3,37 3,32 2,61 1,58 2,25 2,55 0,98 1,38
3,70 2,67 2,85 2,78 2,60 2,70 2,93 1,13 2,19 3,15
3,51 3,28 3,14 3,44 2,77 2,14 3,50 2,00 3,31 3,09
3,22 3,18 2,41 3,36 2,78 2,02 2,76 2,45 3,47 3,30
3,80 2,50 3,32 0,22 3,00 2,28 2,71 1,14 2,62 1,93
3,01 2,07 3,61 1,78 2,50 2,58 0,44 3,03 1,77 2,50
Tahapan :
1. Data disajikan tanpa ada pengolahan, maka orang lain tidak dapat memperoleh
gambaran apapun.
2. Diberi informasi nilai maximum = 3,94 dan minimum = 0,07. Orang mulai
mempunyai gambaran bahwa ada kesenjangan yang begitu besar.
3. Disajikan dengan kategori seperti dibawah ini akan memperjelas informasi

Frekuensi
IPK Frekuensi
kumulatif
0,0 - 1,0 5 5
1,0 - 1,5 8 3,00
1,5 - 2,0 15 7,00
2,0 - 2,5 32 17,00
2,5 - 3,0 61 29,00
3,0 - 3,5 89 28,00
3,5 - 4,0 100 11,00

4. Disajikan dalam bentuk diagram, akan dapat memberikan gambaran yang lebih
jelas lagi, tetapi penyeji tetap tidak boleh membuat kesimpulan.

11,00
3,5 - 4,0
28,00
3,0 - 3,5
2,5 - 3,0
2,0 - 2,5
29,00 1,5 - 2,0
IPK 17,00
1,0 - 1,5
0,0 - 1,0
7,00

3,00

5
0 10 20 30 40
Bab 2-2

35

29,0028,00
30
0,0 - 1,0
25 1,0 - 1,5

20 1,5 - 2,0
17,00 2,0 - 2,5
15 2,5 - 3,0
11,00
3,0 - 3,5
10 7,00 3,5 - 4,0
5
5 3,00

0
IPK

5. Diinformasikan nilai ukuran sentral, misalnya rata-rata = 2,6652. dan median


=2,50. Nilai rata-rata dan median menunjukkan nilai tengah dari sekumpulan data.

Meskipun deskripsi hanya bersifat memberikan gambaran, tetapi semakin banyak


informasi yang diberikan maka orang yang melihat penyajian kita semakin mendapatkan
gambaran dengan baik.

B. NOTASI DASAR STATISTIK

Penekanan statistic deskripsi pada materi ini bukan pada bagaimana menyajikan dalam
bentuk table atau grafik, tetapi lebih pada perhitungan ukuran sentral dan disperse
dengan pertimbangan bahwa pembuatan table dan grafik dapat dipelajari sendiri melalui
praktikum statistik maupun belajar sendiri dengan menggunakan computer (paket-paket
program misalnya minitab, SPSS, S-Plus, Mat-Lab, Excel dll).

Sebagai dasar dalam perhitungan statistik adalah suatu notasi penjumlahan yang
biasanya dirumuskan secara umum sbb :

n
Notasi diatas artinya adalah menjumlahkan data dari data ke-1 (X1) sampai dengan data
ke-n (Xn). ∑ Xi = X1+X2+X3+……+Xn
i=1
Bab 2-3

Pengembangan dari notasi diatas adalah sbb :

∑ aXi = a ∑Xi

∑ (Xi – b) = ∑Xi – n.b

∑(aXi – b) = a∑Xi – n.b


∑ (Xi – b)² = ∑(Xi² – 2Xi.b + b²)

∑ (Xi – b)² = ∑Xi² – 2b∑Xi + nb²

CONTOH 2 :

Data sebuah pengamatan berjumlah 10 (n) adalah sbb :

DATA KE 1 2 3 4 5 6 7 8 9 10 Jumlah


X  5 8 2 7 6 7 5 8 9 3 60
(X-5)  0 3 -3 2 1 2 0 3 4 -2 10
3X  15 24 6 21 18 21 15 24 27 9 180
(3X-5)  10 19 1 16 13 16 10 19 22 4 130

∑Xi
∑ (Xi – 5) = ∑Xi - n.5 = 60 – 10x5 = 60 – 50 = 10

∑ (3Xi) = 3∑Xi = 3x 60 = 180

∑ (3Xi –5) = 3∑Xi - n.5 = 3x60 – 10x5 = 180 – 50 = 130


Bab 2-4

C. UKURAN SENTRAL DAN DISPERSI

Untuk menunjukkan nilai pusat dari data dibutuhkan perhitungan sentral yang biasanya
diwakili dengan nilai rata-rata dan atau median. Nilai rata-rata yang umum dipakai
dengan rumusan :

Rata-rata Sampel Rata-rata Populasi

n N
–  Xi X i

=
i= 1 i=1
X= n N

Dari contoh 1, misalnya 10 data dianggap sample, maka nilai rata-ratanya adalah sbb :
60

= =6
X 10
Nilai median adalah nilai yang posisinya berada ditengah-tengah data setelah data
tersebut diurutkan. Dari contoh 2, data diurutkan menjadi :

2 3 5 5 6 7 7 8 8 9

Data yang ke 5 dan ke 6 adalah 6 dan7, jadi median adalah (6+7)/2 = 6,5.

Rumus nilai rata-rata tidak hanya seperti yang tertulis diatas, tetapi ada juga rata-rata
terboboti, rata-rata harmoni, rata-rata geometri, rata-rata trimmed, rata-rata Winzorized.

Selain ukuran sentral yang tujuannya menunjukkan pusat dari sebuah data, juga perlu
ditunjukkan penyebaran dari data, yaitu ukuran dispersi. Ukuran dispersi biasa diwakili
dengan range, varians (variasi), standar deviasi/simpangan baku.

Range = nilai maksimum – nilai minimum

VARIANS UNTUK SAMPEL VARIANS UNTUK POPULASI


–X
n n
 ( Xi ( X i –  )2
) 2

S2= i=1
2= i=1
n 1 N
Bab 2-5

STANDAR DEVIASI SAMPEL STANDAR DEVIASI POPULASI

n  n

 ( X X2
i
i=1
) ( X  i
)2
i=1
S= =
n 1 N

Cobalah untuk rumus varian dan standar deviasi diterapkan pada data contoh 2.

D. TEOREMA CHEBYSHEV’S

Rata-rata dan simpangan baku atau varian adalah ukuran yang sangat penting dalam
pengembangan statistic berikutnya. Banyak teori-teori yang dikembangkan dengan
dasar 2 ukuran tersebut. Ditinjau dari sudut ilmu matematika memang rumus median
sulit untuk dikembangkan karena rumus median cenderung berupa definisi
sedangkan rata-rata adalah sebuah rumus yang secara matematika dapat
dikembangkan melalui penurunan ataupun integral. Demikian halnya dengan range,
yang merupakan rumus berupa definisi dibandingkan dengan simpangan baku.

Teorema Chebyshev’s adalah salah satu contoh teori dasar yang dikembangkan dari
2 ukuran tersebut untuk menunjukkan ciri-ciri data secara umum. Ada tiga teorema
dinyatakan dalam teorema Chebyshev’s yaitu :

1. Interval antara X – 2.S sampai X + 2S akan berisi paling sedikit adalah


(1-1/2² ) = ¾ dari seluruh data.

2. Interval antara
X – 3.S sampai X + 3S akan berisi paling sedikit adalah
(1-1/3² ) = 8/9 dari seluruh data.

3. Secara umum, untuk k>1, maka Interval antara X – k.S sampai X + kS


akan berisi paling sedikit adalah (1-1/k² ) dari seluruh data.

Contoh 3 :

Dari data yang akan dikelompokkan berjumlah 80 data dengan rata-rata 58.325 dan varians
265.1944 ( S = 16.28479045 )
Jika k = 1.5, maka jumlah data yang berada pada interval

L = 58.325 – 1.5x16.28479045 = 33.89781433 U =


58.325 + 1.5x16.28479045 = 82.75218567

paling sedikit berjumlah 80x (1-1/(1.5)²)= 80x 5/9 = 44.444 ≈ 44 data


Bab 2-6

Kerjakan seperti pada contoh 3, untuk data pada contoh 1, kemudian buktikan dengan
menghitung banyaknya data tersebut.

E. KODING DATA

Jika X = aY + b, maka

X =aY +b

S2X= a 2 S 2Y

Contoh 4 :

DATA KE 1 2 3 4 5 6 7 8 9 10 Jumlah


Y  5 8 2 7 6 7 5 8 9 3 60
(3Y-5)  10 19 1 16 13 16 10 19 22 4 130

Y =6 X = 3x6-5 = 13

S 2 = 5,11 S X = 3 x5,11 = 45,99


2 2
Y

F. Test Your Understanding of This Lesson


Problem 1
Which of the following statements are true?

I. All variables can be classified as quantitative or categorical variables.


II. Categorical variables can be continuous variables.
III. Quantitative variables can be discrete variables.

(A) I only
(B) II only
(C) III only
(D) I and II
(E) I and III

Solution

The correct answer is (E). All variables can be classified as quantitative or categorical
variables. Discrete variables are indeed a category of quantitative variables. Categorical
Bab 2-7

variables, however, are not numeric. Therefore, they cannot be classified as continuous
variables.

Problem 2

Four friends take an IQ test. Their scores are 96, 100, 106, 114. Which of the following
statements is true?

I. The mean is 103.


II. The mean is 104.
III. The median is 100.
IV. The median is 106.

(A) I only
(B) II only
(C) III only
(D) IV only
(E) None is true

Solution
The correct answer is (B). The mean score is computed from the equation:

Mean score = Σx / n = (96 + 100 + 106 + 114) / 4 = 104

Since there are an even number of scores (4 scores), the median is the average of the two
middle scores. Thus, the median is (100 + 106) / 2 = 103.

Problem 3

A population consists of four observations: {1, 3, 5, 7}. What is the variance?

(A) 2
(B) 4
(C) 5
(D) 6
(E) None of the above

Solution

The correct answer is (B). First, we need to compute the population mean.

μ=(1+3+5+7)/4=4

Then we plug all of the known values into formula for the variance of a population, as
shown below:
σ2 = Σ ( Xi - μ )2 / N
σ = [ ( 1 - 4 ) + ( 3 - 4 )2 + ( 5 - 4 )2 + ( 7 - 4 )2 ] / 4
2 2

σ2 = [ ( -3 )2 + ( -1 )2 + ( 1 )2 + ( 3 )2 ] / 4
σ2 = [ 9 + 1 + 1 + 9 ] / 4 = 20 / 4 = 5
Bab 2-8

Problem 4

A sample consists of four observations: {1, 3, 5, 7}. What is the standard deviation?

(A) 2
(B) 2.58
(C) 6
(D) 6.67
(E) None of the above

Solution

The correct answer is (B). First, we need to compute the sample mean.

x=(1+3+5+7)/4=4

Then we plug all of the known values into formula for the standard deviation of a sample,
as shown below:
s = sqrt [ Σ ( xi - x )2 / ( n - 1 ) ]
s = sqrt { [ ( 1 - 4 )2 + ( 3 - 4 )2 + ( 5 - 4 )2 + ( 7 - 4 )2 ] / ( 4 - 1 ) }
s = sqrt { [ ( -3 )2 + ( -1 )2 + ( 1 )2 + ( 3 )2 ] / 3 }
s = sqrt { [ 9 + 1 + 1 + 9 ] / 3 } = sqrt (20 / 3) = sqrt ( 6.67 ) = 2.58

Problem 5
A national achievement test is administered annually to 3rd graders. The test has a mean
score of 100 and a standard deviation of 15. If Jane's z-score is 1.20, what was her score
on the test?

(A) 82
(B) 88
(C) 100
(D) 112
(E) 118

Solution

The correct answer is (E). From the z-score equation, we know

z = (X - μ) / σ

where z is the z-score, X is the value of the element, μ is the mean of the population, and
σ is the standard deviation.

Solving for Jane's test score (X), we get

X = ( z * σ) + 100 = ( 1.20 * 15) + 100 = 18 + 100 = 118

Anda mungkin juga menyukai