Anda di halaman 1dari 33

1

DESKRIPSI DATA
Ukuran dispersi dan bentuk
distribusi frekuensi

Kelompok 2 Sulistyana dan Dewi


Pendahuluan :
2

 Sering digunakan peneliti, khususnya dalam


memperhatikan perilaku data dan penentuan
dugaan-dugaan yang selanjutnya akan diuji
dalam analisis inferensi.
Analisis Statistik Deskriptif :
3

 Sari numerik (ringkasan angka)


◦ Menyatakan nilai-nilai penting dalam statistik
meliputi ukuran pemusatan dan dispersi.
 Distribusi
◦ Menyatakan pola atau model dari penyebaran data.
 Pencilan
◦ Menyatakan nilai data yang berada diluar
kelompok nilai data yang lainnya.
Sari Numerik (ringkasan angka):
4

 Ukuran pemusatan
◦ merupakan ukuran yang menyatakan pusat dari sebaran
data. Ada tiga macam ukuran pemusatan yaitu Rata-
rata, Median, dan Modus.
 Ukuran penyebaran (dispersi)
◦ adalah ukuran yang dipakai untuk mengukur tingkat
penyebaran data.
◦ Semakin kecil ukuran penyebaran semakin seragam
data tersebut dan semakin besar ukuran penyebaran
semakin beragam data tersebut.
Ukuran Pemusatan
5

 Rata-rata adalah sebuah nilai yang khas yang


dapat mewakili suatu himpunan data.

 Rata-rata dari suatu himpunan n bilangan x1, x2 ,


….., xn ditunjukkan oleh dan didefinisikan sbb :
n

x1  x 2  .....  x n x i
X   1

n n
Ukuran Pemusatan
6

 Jika bilangan-bilangan x1, x2 , ….., xn masing-


masing terjadi f1, f2 , ….., fn maka nilai rata-
ratanya adalah :

f 1 x1  f 2 x 2  .....  f n x n f x i i
X  1

f 1  f 2  ....  f n n

f 1
i
Sifat Rata-Rata
7
 Responsif terhadap perubahan datum dalam
distribusinya
 Nilai rata-rata merupakan suatu nilai penyeimbang
 Sangat sensitif terhadap keberadaan datum yang
extreme.
 Merupakan ukuran yang berdasarkan hasil pengukuran
sehingga rata-rata dapat mencerminkan total skor.
 Rata-rata merupakan pengukuran yang stabil jika
diambil beberapa sampel dari populasi yang sama.
Ukuran Pemusatan (3):
8

 Median adalah besaran yang membagi data menjadi dua


kelompok yang memiliki persentase sama besar, dengan
himpunan bilangan disusun menurut urutan besarnya.

 2   f 
n 
1 
Median  L1   c
 f med 
 
Dimana
L1 = batas kelas bawah dari kelas median.
n = banyak data
(Σ f)1= jumlah frekuensi semua kelas yang lebih rendah dari kelas
median
f med = frekuensi kelas median
c = panjang kelas
Sifat-Sifat Median
9

 Median kurang sensitif terhadap datum yang


ekstrim.
 Jika dalam data terdapat suatu data yang
menyimpang dari distribusi maka ukuran median
baik digunakan
 Median menempati posisi kedua setelah rata-rata
dalam hal resistensi terhadap fluktuasi data.
Ukuran Pemusatan (4):
10

 Modus suatu himpunan bilangan adalah nilai yang


paling sering muncul (memiliki frekuensi maksimum).
Modus mungkin tidak ada. Modus dapat diperoleh dari
rumus :
 1 
Modus  L1    c
 1   2 
Dimana
L1 = batas kelas bawah dari kelas modus.
1 = selisih frekuensi kelas modus dan frekuensi kelas
sebelumnya
2 = selisih frekuensi kelas modus dan frekuensi kelas
sesudahnya
c = panjang kelas
Sifat-Sifat Modus
11

 Modus sangat mudah ditentukan, tetapi sangat


tidak stabil dari satu sampel ke sampel lainnya
 Modus mungkin tidak tunggal ( atau bahkan tidak
ada modus)
 Modus ukuran yang paling cocok digunakan untuk
ukuran data nominal.
Ukuran Dispersi/Penyebaran (1):
12

 Derajat atau ukuran sampai seberapa jauh data


numerik cenderung untuk tersebar disekitar nilai
rata-ratanya.
 Yang paling umum adalah Range (rentang),
Variansi, dan Simpangan Baku.
 Ukuran dispersi lain adalah kuartil, persentil,
semi inter quartil.
Range / Rentang (R):
13

 adalah selisih antara bilangan terbesar dan


terkecil dalam himpunan.
 Nilai R akan selalu positif.
 Interpretasi nilai R adalah:
◦ R = 0, menunjukkan bahwa data terbesar sama
dengan data terkecil, akibatnya semua data
memiliki harga yang sama
◦ R kecil, memberikan informasi bahwa data akan
mengumpul di sekitar pusat data
◦ R besar, menyatakan bahwa paling sedikit ada satu
data yang harganya berbeda jauh dengan data
lainnya
Simpangan baku (deviasi standar) (1):
14

 Simpangan Baku (Deviasi Standar) suatu


himpunan bilangan x1, x2, …, xn dinyatakan
dengan s dan didefinisikan sebagai berikut :

1 1
   xi  x  2 
2   x 2  nx 2  2

s   i

 n  1   n 1 
Simpangan baku (deviasi standar) (2):
15

 Jika x1, x2, …, xn masing-masing muncul


dengan frekuensi f1, f2, …, fn, maka
simpangan baku dapat dituliskan :

1 1

  f i  xi  x  
   f i xi 
2
2
 2
f i xi
2

2

s     
   f i   1  n  n  
    

n f i
Simpangan baku (deviasi standar) (3):
16

 Kuadrat dari simpangan baku adalah variansi.


 Nilai variansi dan simpangan baku selalu non-negatif.

 Interpretasi nilai s2 adalah:

◦ s2 = 0 atau s = 0 berarti nilai data sama sengan rata-


ratanya, sehingga nilai semua data sama
◦ s2 atau s kecil, berarti perbedaa n harga data yang
satu dengan lainnya kecil Akibatnya semua data akan
mengumpul disekitar pusat data.
◦ s2 atau s besar menyatakan bahwa paling sedikit ada satu
data yang harganya berbeda jauh dengan data lainnya.
Sifat-Sifat Simpangan Baku
17

 Sangat responsif terhadap posisi untuk setiap


datum dalam distribusi
 Standar deviasi kurang baik jika data memuat
datum yang ekstrim atau kemencengan (skewness)
yang jelek.
 Sangat resisten dari sampel ke sampel.
 Standar deviasi menjadi dasar baik dalam statistik
deskriptif maupun dalam statistik inferensi.
Ukuran Penyebaran Lain :
18

 Suatu himpunan data yang dibagi atas empat


bagian yang sama. Nilai-nilai ini disebut Kuartil
dan dinyatakan dengan Q1, Q2, dan Q3.
 Suatu himpunan data yang dibagi atas sepuluh
bagian yang sama disebut Desil dan dinyatakan
dengan D1, D2, D3, …., D9.
 Suatu himpunan data yang dibagi atas seratus
bagian disebut Persentil dan dinyatakan dengan
P1, P2, P3, ….., P99.
Range Semi Interquartil
19

 Untuk menghitung range semi interquartil sbb:

𝑄3 − 𝑄1 𝑃75− 𝑃25
𝑄= =
2 2
 Range semi interquartil lebih sensitif terhadap
datum yang ekstrim dibandingkan dengan standar
deviasi.
Kuartil :
20

Rumus Kuartil ke-N (N = 1,2,3) :

 N. 4   f  N
 n 

Q N  LQN  c
 f QN 
 

Di mana
 L = batas kelas bawah dari kelas kuartil ke-N
QN
 n = banyak data
 (Σ f) = jumlah frekuensi semua kelas sebelum kelas kuartil
N

ke N
 f = frekuensi kelas kuartil ke-N
QN
 c = panjang kelas
Bentuk distribusi
21

 Dalam statistika, mempelajari distribusi merupakan


suatu hal yang penting, karena akan menentukan
metodologi statistika yang akan digunakan.
 Distribusi adalah pola atau model penyebaran yang
merupakan gambaran kondisi sekelompok data.
Ciri Bentuk Distribusi Simetri:
22

Mean = median = modus

1 2 3 4 5 6 7 8 9 10 11 12
Ciri Bentuk Distribusi Menjulur ke
kanan (positif):
23

Mean > median > modus

1 2 3 4 5 6 7 8 9 10 11 12
Ciri Bentuk Distribusi Menjulur ke
kiri (negatif):
24

Mean < median < modus

1 2 3 4 5 6 7 8 9 10 11 12
Mengukur derajat kemencengan
distribusi data:
25

 Rumus Pearson
x  Mo
SK 
S
Dimana
 SK = derajat kemiringan (skewness)

X = mean
 Mo = Modus

 S = Standar Deviasi
Interpretasi nilai derajat kemenjuluran:
26

 Bila nilai SK = 0 atau mendekati nol,


maka dikatakan distribusi data simetri
 Bila nilai SK bertanda negatif, maka

distribusi data menjulur ke kiri


 Bila nilai SK bertanda positif, maka

distribusi data menjulur ke kanan


Pencilan (Outlier)
27

 Memberikan informasi mengenai data yang


harganya jauh berbeda dari harga data lainnya.
 Dalam statistika, mendeteksi pencilan sangat

penting karena data yang masuk dalam pencilan


akan mengganggu hasil analisis data.
 Oleh karena itu, data pencilan harus dianalisis

tersendiri, terpisah dari kelompoknya.


Langkah-langkah mendeteksi
28
pencilan:
 Hitung besarnya nilai sebaran tengah, yaitu dq = QA –
QB
 Hitung nilai batas bawah pencilan (BBP), yaitu : BBP

= QB – (1,5 x dq)
 Hitung nilai batas atas pencilan (BAP), yaitu : BAP =

QA + (1,5 x dq)
 Apabila terdapat data dengan nilai lebih kecil atau

sama dengan BBP maka data tersebut disebut pencilan


bawah.
 Apabila terdapat data dengan nilai lebih besar atau

sama dengan BAP maka data tersebut disebut pencilan


atas.
Soal 1
29
 Distribusi frekuensi dari upah karyawan suatu
perusahaan dalam ribuan rupiah per bulan adalah
sbb.:
Nilai upah Banyaknya
karyawan  Hitung mean
100 – 199 15 dan modus
200 – 299 20  Hitung kuartil
300 – 399 30
ke-3 dan
400 – 499 25
500 – 599 15
simpangan
600 – 699 10
baku
700 – 799 5
Soal 2
30

 Diketahui besarnya pinjaman 7 orang nasabah


suatu bank sbb. (dalam juta Rp).

Nama A B C D E F G

Pinjaman 12.57 14.65 25.50 5.75 11.80 16.55 15.89

 Selidiki,apakah terdapat nasabah yang pinjamannya


cukup sedikit atau sangat besar dibandingkan dengan
nasabah lainnya
Soal 3
31
 Sebuah obyek wisata di Bandung diamati selama 30
hari. Setiap hari dicatat banyaknya wisatawan
domestik (satuan orang) yang mengunjungi obyek
wisata tersebut yang ditampilkan dalam tabel berikut .

85 42 45 3 71 97 6 48 60 49

45 55 21 75 80 62 54 62 41 6

95 45 25 81 76 84 45 68 59 15

Dengan memanfaatkan analisis data statistik


secara deskriptif, berikan analisis anda terkait
dengan masalah di atas.
Soal 4 :
32
 Banyaknya mobil pribadi yang melewati 7
titik pengamatan pada jam 06.30 – 07.30 di
kawasan jalan pahlawan adalah sbb.:

Lokasi 1 2 3 4 5 6 7
Jml 70 73 93 71 109 75 71
mbl

Setelah data di atas dibakukan (*), selidiki


betuk distribusinya melalui nilai rata-rata dan
median.
33

Catatan (*):
 Membakukan data bertujuan untuk

mentransformasikan nilai-nilai data menjadi


suatu kumpulan data baru dengan nilai rata-
rata sama dengan nol dan variansi sama
dengan 1.
 Rumus pembakuan data adalah :

xi  x ukuran pemusa tan data


Zi  
sx simpangan baku

Anda mungkin juga menyukai