Anda di halaman 1dari 33

DESKRIPSI

DATA

Pendahuluan :
2

Sering digunakan peneliti, khususnya


dalam memperhatikan perilaku data
dan penentuan dugaan-dugaan yang
selanjutnya akan diuji dalam analisis
inferensi.

Analisis Statistik Deskriptif :


3

Sari numerik (ringkasan angka)

Distribusi

Menyatakan nilai-nilai penting dalam


statistik meliputi ukuran pemusatan dan
dispersi.
Menyatakan pola atau model dari
penyebaran data.

Pencilan

Menyatakan nilai data yang berada


diluar kelompok nilai data yang lainnya.

Sari Numerik (ringkasan


angka):

Ukuran pemusatan

merupakan ukuran yang menyatakan pusat


dari sebaran data. Ada tiga macam ukuran
pemusatan yaitu Rata-rata, Median, dan
Modus.

Ukuran penyebaran (dispersi)

adalah ukuran yang dipakai untuk mengukur


tingkat penyebaran data.
Semakin kecil ukuran penyebaran semakin
seragam data tersebut dan semakin besar
ukuran penyebaran semakin beragam data
tersebut.

Ukuran Pemusatan
5

Rata-rata adalah sebuah nilai yang khas yang


dapat mewakili suatu himpunan data.

Rata-rata dari suatu himpunan n bilangan x1,


x2 , .., xn ditunjukkan oleh dan
didefinisikan sbb :
n

x1 x 2 ..... x n
X

x
1

Ukuran Pemusatan
6

Jika bilangan-bilangan x1, x2 , .., xn


masing-masing terjadi f1, f2 , .., fn
maka nilai rata-ratanya adalah :
n

f 1 x1 f 2 x 2 ..... f n x n
X

f 1 f 2 .... f n

f x
i

f
1

Sifat Rata-Rata
7

Responsif terhadap perubahan datum dalam


distribusinya
Nilai rata-rata merupakan suatu nilai penyeimbang
Sangat sensitif terhadap keberadaan datum yang
extreme.
Merupakan ukuran yang berdasarkan hasil
pengukuran sehingga rata-rata dapat
mencerminkan total skor.
Rata-rata merupakan pengukuran yang stabil jika
diambil beberapa sampel dari populasi yang
sama.

Ukuran Pemusatan (3):


8

Median adalah besaran yang membagi data


menjadi dua kelompok yang memiliki persentase
sama besar, dengan himpunan bilangan disusun
menurut urutan besarnya.

n
2 f
Median L1
f med

Dimana
L1 = batas kelas bawah dari kelas median.
n
= banyak data
( f)1= jumlah frekuensi semua kelas yang lebih rendah
dari kelas
median
f med = frekuensi kelas median
c
= panjang kelas

Sifat-Sifat Median
9

Median kurang sensitif terhadap datum


yang ekstrim.
Jika dalam data terdapat suatu data
yang menyimpang dari distribusi maka
ukuran median baik digunakan
Median menempati posisi kedua setelah
rata-rata dalam hal resistensi terhadap
fluktuasi data.

Ukuran Pemusatan (4):


10

Modus suatu himpunan bilangan adalah


nilai yang paling sering muncul (memiliki
frekuensi maksimum). Modus mungkin tidak
ada. Modus dapat diperoleh dari rumus :

1
Modus L1
c

1 2

Dimana
L1 = batas kelas bawah dari kelas modus.
1 = selisih frekuensi kelas modus dan frekuensi kelas
sebelumnya
2 = selisih frekuensi kelas modus dan frekuensi
kelas
sesudahnya
c
= panjang kelas

Sifat-Sifat Modus
11

Modus sangat mudah ditentukan, tetapi


sangat tidak stabil dari satu sampel ke
sampel lainnya
Modus mungkin tidak tunggal ( atau
bahkan tidak ada modus)
Modus ukuran yang paling cocok
digunakan untuk ukuran data nominal.

12

Ukuran
Dispersi/Penyebaran (1):

Derajat atau ukuran sampai seberapa


jauh data numerik cenderung untuk
tersebar disekitar nilai rata-ratanya.
Yang paling umum adalah Range
(rentang), Variansi, dan Simpangan
Baku.
Ukuran dispersi lain adalah kuartil,
persentil, semi inter quartil.

Range / Rentang (R):


13

adalah selisih antara bilangan terbesar


dan terkecil dalam himpunan.
Nilai R akan selalu positif.
Interpretasi nilai R adalah:

R = 0, menunjukkan bahwa data terbesar


sama dengan data terkecil, akibatnya
semua data memiliki harga yang sama
R kecil, memberikan informasi bahwa data
akan mengumpul di sekitar pusat data
R besar, menyatakan bahwa paling sedikit
ada satu data yang harganya berbeda jauh
dengan data lainnya

14

Simpangan baku (deviasi


standar) (1):

Simpangan Baku (Deviasi Standar)


suatu himpunan bilangan x1, x2, ,
xn dinyatakan dengan s dan
didefinisikan sebagai berikut :

n 1

1
2

2
i

nx

1
2

n 1

15

Simpangan baku (deviasi


standar) (2):

Jika x1, x2, , xn masing-masing


muncul dengan frekuensi f1, f2, ,
fn, maka simpangan baku dapat
dituliskan :

f x x
f 1

1
2

n f i

f x

f x

2
i

1
2

Simpangan baku (deviasi


standar) (3):
16

Kuadrat dari simpangan baku adalah variansi.


Nilai variansi dan simpangan baku selalu nonnegatif.
Interpretasi nilai s 2 adalah:

s2 = 0 atau s = 0 berarti nilai data sama sengan


rata-ratanya, sehingga nilai semua data sama
s2 atau s kecil, berarti perbedaa
n harga data
yang satu dengan lainnya kecil Akibatnya semua
data akan mengumpul disekitar pusat data.
s2 atau s besar menyatakan bahwa paling sedikit
ada satu data yang harganya berbeda jauh
dengan data lainnya.

Sifat-Sifat Simpangan Baku


17

Sangat responsif terhadap posisi untuk


setiap datum dalam distribusi
Standar deviasi kurang baik jika data
memuat datum yang ekstrim atau
kemencengan (skewness) yang jelek.
Sangat resisten dari sampel ke sampel.
Standar deviasi menjadi dasar baik
dalam statistik deskriptif maupun dalam
statistik inferensi.

18

Ukuran Penyebaran
Lain :

Suatu himpunan data yang dibagi atas


empat bagian yang sama. Nilai-nilai
ini disebut Kuartil dan dinyatakan
dengan Q1, Q2, dan Q3.
Suatu himpunan data yang dibagi atas
sepuluh bagian yang sama disebut
Desil dan dinyatakan dengan D1, D2,
D3, ., D9.
Suatu himpunan data yang dibagi atas
seratus bagian disebut Persentil dan
dinyatakan dengan P1, P2, P3, ..,
P99.

Range Semi Interquartil


19

Untuk menghitung range semi


interquartil sbb:

Range semi interquartil lebih sensitif


terhadap datum yang ekstrim
dibandingkan dengan standar deviasi.

Kuartil :
20

Rumus Kuartil ke-N (N = 1,2,3) :


n
N. 4 f N

f QN

Q N LQN

Di mana
L
= batas kelas bawah dari kelas kuartil ke-N
QN
n
= banyak data
( f) = jumlah frekuensi semua kelas sebelum kelas
N
kuartil
ke N
f
= frekuensi kelas kuartil ke-N
QN
c
= panjang kelas

Bentuk distribusi
21

Dalam statistika, mempelajari distribusi


merupakan suatu hal yang penting,
karena akan menentukan metodologi
statistika yang akan digunakan.
Distribusi adalah pola atau model
penyebaran yang merupakan gambaran
kondisi sekelompok data.

22

Ciri Bentuk Distribusi


Simetri:
Mean = median = modus

10

11

12

Ciri Bentuk Distribusi Menjulur


ke kanan (positif):
23

Mean > median > modus

10

11

12

24

Ciri Bentuk Distribusi


Menjulur ke kiri (negatif):
Mean < median < modus

10

11

12

25

Mengukur derajat
kemencengan distribusi
data:

Rumus Pearson

x Mo
SK
S
Dimana
SK
= derajat kemiringan (skewness)

X = mean
Mo
= Modus
S
= Standar Deviasi

26

Interpretasi nilai derajat


kemenjuluran:
Bila nilai SK = 0 atau mendekati
nol, maka dikatakan distribusi data
simetri
Bila nilai SK bertanda negatif,
maka distribusi data menjulur ke
kiri
Bila nilai SK bertanda positif, maka
distribusi data menjulur ke kanan

Pencilan (Outlier)
27

Memberikan informasi mengenai data


yang harganya jauh berbeda dari harga
data lainnya.
Dalam statistika, mendeteksi pencilan
sangat penting karena data yang masuk
dalam pencilan akan mengganggu hasil
analisis data.
Oleh karena itu, data pencilan harus
dianalisis tersendiri, terpisah dari
kelompoknya.

28

Langkah-langkah mendeteksi
pencilan:
Hitung besarnya nilai sebaran tengah,
yaitu dq = QA QB
Hitung nilai batas bawah pencilan (BBP),
yaitu : BBP = QB (1,5 x dq)
Hitung nilai batas atas pencilan (BAP),
yaitu : BAP = QA + (1,5 x dq)
Apabila terdapat data dengan nilai lebih
kecil atau sama dengan BBP maka data
tersebut disebut pencilan bawah.
Apabila terdapat data dengan nilai lebih
besar atau sama dengan BAP maka data
tersebut disebut pencilan atas.

Soal 1
29

Distribusi frekuensi dari upah karyawan


suatu perusahaan dalam ribuan rupiah
per bulan adalah sbb.:
Nilai upah

Banyaknya
karyawan

100 199

15

200 299

20

300 399

30

400 499

25

500 599

15

600 699

10

700 799

Hitung

mean dan
modus
Hitung
kuartil ke-3
dan
simpangan
baku

Soal 2
30

Diketahui besarnya pinjaman 7 orang


nasabah suatu bank sbb. (dalam juta Rp).
Nama

Pinjama
n

12.5
7

14.6
5

Selidiki,

25.5 5.75
0

11.8
0

16.5
5

15.8
9

apakah terdapat nasabah yang


pinjamannya cukup sedikit atau sangat
besar dibandingkan dengan nasabah
lainnya

Soal 3
31

Sebuah obyek wisata di Bandung diamati


selama 30 hari. Setiap hari dicatat banyaknya
wisatawan domestik (satuan orang) yang
mengunjungi obyek wisata tersebut yang
ditampilkan dalam tabel berikut .
85

42

45

71

97

48

60

49

45

55

21

75

80

62

54

62

41

95

45

25

81

76

84

45

68

59

15

Dengan

memanfaatkan analisis data


statistik secara deskriptif, berikan
analisis anda terkait dengan masalah
di atas.

Soal 4 :
32

Banyaknya mobil pribadi yang melewati 7


titik pengamatan pada jam 06.30 07.30
di kawasan jalan pahlawan adalah sbb.:

Loka
si

Jml
mbl

70

73

93

71

109

75

71

Setelah

data di atas dibakukan (*),


selidiki betuk distribusinya melalui
nilai rata-rata dan median.

33

Catatan (*):
Membakukan data bertujuan untuk
mentransformasikan nilai-nilai data
menjadi suatu kumpulan data baru
dengan nilai rata-rata sama dengan
nol dan variansi sama dengan 1.
Rumus pembakuan data adalah :
xi x ukuran pemusa tan data
Zi

sx
simpangan baku

Anda mungkin juga menyukai