Anda di halaman 1dari 68

STATISTIK DESKRIPTIF

POKOK BAHASAN
• Pengumpulan, Pengorganisasian, dan
Penyajian Data
• Distribusi Frekuensi
• Ukuran Pemusatan (Sentral)
• Ukuran Penyebaran (Dispersi)
• Momen, Skewness dan Kurtosis
• Soal soal Latihan dan Praktek
Pengumpulan Data
▪ Metode Pengumpulan Data
1. Sensus : cara pengumpulan data dimana seluruh
elemen populasi diselidiki satu per satu
2. Sampling : cara pengumpulan data dimana yg
diselidiki adalah sampel dari populasi

Parameter : nilai yg dihitung berdasarkan seluruh elemen populasi


Statistik : nilai yg dihitung berdasarkan sampel
Cara pengambilan sampel
1. Cara acak : cara pemilihan sejumlah elemen dari pop
untuk menjadi anggota sampel, dimana setiap elemen
mempunyai kesempatan yg sama untuk terpilih
objektif

2. Cara bukan acak : cara pemilihan sejumlah elemen dari


pop untuk menjadi anggota sampel, dimana setiap
elemen tdk mempunyai kesempatan yg sama untuk
terpilih subjektif
Alat pengumpulan data
• Kuesioner
• Wawancara
• Observasi atau pengamatan langsung
• Melalui pos, telepon, atau alat komunikasi lainnya
Metode pengolahan data
Pengolahan data : proses untuk memperoleh data/angka
ringkasan berdasarkan kelompok data mentah
1. Pengolahan data secara manual
2. Pengolahan data secara elektronik
Pengolahan Data

MULAI

Statistik NOMINAL INTERVAL


Statistik
Non Parametrik ORDINAL Jenis RASIO Parametrik
Data
?

Analisis SATU DUA / LEBIH Analisis


Univariat Jumlah Multivariat
Variabel
?
Penyajian Data
Penyajian data dapat menggunakan
Tabel, Grafik (Diagram) atau secara
narasi. Metode Penyajian data dapat
juga dikelompokkan menjadi
• Teknik Grafis (Graphical Technique)
• Teknik Numeris (Numerical Technique)
Penyajian Data dengan Tabel
Tabel : kumpulan angka-angka yang disusun menurut kategori-kategori.

Tabel 1. Tingkat Pendidikan Penduduk Kelurahan Kampung Enam Tahun 2008 Judul Tabel
No Tingkat Pendidikan Jumlah (orang) Persentasi (%)
Judul Kolom
1 Belum sekolah, tidak sekolah dan 697 14,65
/tidak tamat SD
2 SD 1.252 26,30
3 SLTP 889 18,68
4 SLTA 1.557 32,72
Badan Tabel
5 Perguruan Tinggi 364 7,65
JUMLAH 4.759 100

Sumber Data : Monografi Kelurahan Kampung Enam Tahun 2008 Kaki Tabel
Ada berbagai bentuk tabel yang dikenal, yaitu :

1. Tabel Satu Arah (One way table),


2. Tabel Dua Arah (Two way table),
3. Tabel Tiga Arah (Three way table).
Tabel Satu Arah (one way table)
Yaitu tabel yang memuat keterangan mengenai satu hal atau satu karakteristik
saja. Misalnya data Produksi kedelai menurut jenis varietas yang ditanam

Tabel 1. Produksi Kedelai (Ton/ha) berdasarkan varietas

Varietas Kedelai Produksi (ton/ha)


Wilis 120
Sindoro 125
Slamet 140
Galunggung 145
Orba 155
Total 685
Sumber : Data Primer, 2009
Tabel dua arah (two way table)
Yaitu tabel yang menunjukkan hubungan dua hal atau dua karakteristik yang berbeda.
Misalnya data Produksi kedelai menurut jenis varietas dan daerah panen.

Tabel 2. Produksi Kedelai (Ton/ha) berdasarkan varietas dan daerah


Varietas Kedelai Mamburungan Karang Harapan Total

Wilis 125 130 255


Sindoro 150 135 285
Slamet 163 140 303
Galunggung 170 155 325
Orba 175 174 349

Total 783 734 1517

Sumber : Data Primer, 2009


Teknik Grafis (Graphical Techniques)
• Peringkasan data secara visual atau grafis yang menggunakan
gambar-gambar berdasarkan tabel data yang telah ada sebelumnya
• Teknik Grafis :
- Pie Chart
- Bar Chart, Line Chart
- Histogram Frekuensi
- Ogive, Pictogram Chart
- Stem and Leaf Plot
- Box Plot
Pie Chart (Diagram Pia)
• Data digambarkan
dengan suatu lingkaran
yang sektor-sektornya
menggambarkan
proporsi variabel yang
berbeda
Bar Chart (Diagram Batang)
• Data digambarkan
menggunakan sumbu X
dan Y dimana sumbu X
menunjukkan variabel
yang digunakan
sedangkan sumbu Y
menunjukkan
banyaknya kejadian
Histogram & Poligon Frekuensi
• Data diringkas dalam
bentuk grafik yang
mencerminkan distribusi
frekuensi. Diperlukan
sumbu X untuk
menyatakan interval kelas
dan sumbu Y untuk
menyatakan frekuensi
kelas
Ogive (Poligon Frekuensi Kumulatif)
• Data diringkas dalam
bentuk grafik yang
merupakan grafik dari
distribusi frekuensi
kumulatif lebih dari
atau kurang dari.
Stem and Leaf Plot
(Diagram Batang dan Daun)
• Diperkenalkan oleh John
Tuckey (1977)
• Data dirangkum dalam
bentuk batang dan daun
(stem and leaf).
• Jika ukuran data besar
maka stem dapat dibuat
menjadi dua baris
Box Plot (Diagram Kotak – Box and Whisker plot)
• Peringkasan data
menggunakan diagram
kotak untuk
menggambarkan
apakah data
mempunyai outlier
(data ekstrim) atau
tidak
Untuk membuat Box Plot, ada beberapa hal yang harus diketahui :
▪ Nilai minimum
▪ Nilai maksimum
▪ Median (Q2 = kuartil ke-2)
▪ Lower Quartile (Q1 = kuartil ke-1)
▪ Upper Quartile (Q3 = kuartil ke-3)
▪ IQR (Inter Quartile Range ) = Q3-Q1
▪ LIF (Lower Inner Fence) = Q1 – 1,5 IQR
▪ UIF (Upper Inner Fence) = Q3 + 1,5 IQR
▪ LOF (Lower Outer Fence) = Q1 – 3 IQR
▪ UOF (Upper Outer Fence) = Q3 + 3 IQR
Contoh

Misalkan dimiliki data berikut :


5,3 4,0 12,5 3,0 3,9 6,4 5,2 2,6 15,8 6,2 4,0
7,1 3,4 4,4 3,5 3,4 3,2 5,6 3,2 3,4 8,6 3,1

n = 22, nilai minimum = 2,6, nilai maksimum = 15,8

Data terurut :
2,6 3,0 3,1 3,2 3,2 3,4 3,4 3,5 3,7 3,9 4,0
4,0 4,4 5,2 5,3 5,6 6,2 6,4 7,1 8,6 12,5 15,8
• Lokasi Median : (n+1)/2 = 23/2 = 11,5
• Median (4,0 + 4,0)/2 = 4,0
• Mean = 5,4
• Lokasi Q1 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai minimum
Q1 = 3,4
• Lokasi Q3 :
(lokasi median dibulatkan ke bawah + 1)/2
yaitu lokasi ke 6 dari nilai maksimum
Q3 = 6,2
• IQR = Q3-Q1 = 6,2 – 3,4 = 2,8
• LIF = Q1 - 1,5 IQR = 3,4 – 1,5 (2,8) = - 0,8
• UIF = Q3 + 1,5 IQR = 6,2 + 1,5 (2,8) = 10,4
• LOF = Q1 - 3 IQR = 3,4 – 3 (2,8) = - 5
• UOF = Q3 + 3 IQR = 6,2 + 3 (2,8) = 14,6

Data yang terletak antara LIF dan UIF bukan outlier


Data yang terletak di luar LIF dan UIF adalah outlier yang dibedakan
menjadi 2 yaitu mild outlier dan extrem outlier
Boxplot - Contoh
• Bila semua data terletak
terletak antara LIF dan UIF
maka data tidak memiliki
outlier
• Data terletak antara IF dan
OF disebut mild outlier
(tanda bulat)
• Data terletak di luar OF
disebut extreme outlier
(tanda bintang)
Latihan 1
1. Dalam suatu suvai pendidikan umum, 400 sekolah di teliti kualitas
pendidikannya. Hasilnya untuk masing-masing sekolah dikategorikan
masuk kualitas A, B, C, atau D. Dari survey diperoleh Kategori A= 35,
B=260, C=93 dan D=12 Sekolah. Hasil survey disajikan dalam bentuk
tabel statistik:
a. Pie chart dan
b. Bar chart
2. Sebuah perusahaan teh memiliki 3 kebun yaitu di Puncak, Pangelangan
dan Batu. Perusahaan tersebut memproduksi beberapa jenis teh, yaitu
teh melati, teh hitam dan teh hijau. Buatlah Tabel dari produksi teh
perusahaan tersebut selama 10 tahun?
Latihan 2
1. Sebutkan tujuan dari pengolahan Data
2. Mengapa penyajian data diperlukan ? Jelaskan menurut pendapatmu.
3. Cari olehmu contoh-contoh tabel dan grafik berikut :
a. Tabel frekuensi
b. Tabel klasifikasi
c. Tabel kontingensi
d. Tabel korelasi
e. Grafik histogram, pie, poligon
DISTRIBUSI FREKUENSI
• Distribusi Frekuensi adalah Susunan data menurut
kelas-kelas interval tertentu atau menurut katagori
tertentu dalam sebuah daftar. Hasan (2009).

• Distribusi frekuensi adalah Penyusunan suatu data


mulai dari terkecil sampai terbesar yang membagi
banyaknya data kedalam beberapa kelas.
Kegunaan data yang masuk dalam distribusi
frekuensi adalah Untuk memudahkan data dalam
penyajian, mudah dipahami, dan mudah dibaca
sebagai informasi, pada gilirannya digunakan
untuk perhitungan membuat gambar statistik
dalam berbagai bentuk penyajian data. Riduwan
(2003)
Jenis-Jenis Distribusi Frekuensi
1. Distribusi Frekuensi Biasa
2. Distribusi Frekuensi Relatif
3. Distribusi Frekuensi Kumulatif
Bagian-Bagian Distribusi Frekuensi
• Kelas-Kelas
Kelompok nilai data
• Batas Kelas
adalah nilai –nilai yang membatasi kelas yang satu dengan kelas yang lain.
Ada dua batas kelas yaitu:
1. Batas bawah kelas terdapat disebelah kiri deretan kelas
2. Batas atas kelas terdapat disebelah kanan deretan kelas
• Tepi Kelas
Adalah batas kelas yang tidak memiliki lubang untuk angka tertentu antara
kelas yang satu dengan kelas yang lain.
Bagian-Bagian Distribusi Frekuensi
• Titik tengah kelas
Adalah nilai data yang terletak ditengah-tengah kelas
Titik tengah kelas = ½(batas atas kelas + batas bawah kelas)

• Interval
adalah selang yang memisahkan kelas yang satu dengan kelas yang lain

• Panjang interval kelas


Adalah jarak antara tepi atas kelas dan tepi bawah kelas

• Frekuensi kelas
Adalah banyaknya data yang termasuk kedalam kelas tertentu.
Penyusunan distribusi frekuensi

1. Interval kelas harus dipilih dengan ketentuan


a. Seluruh data harus disertakan
b. Data harus dimasukkan sekali, hanya di satu kelas.
2. Lebar interval kelas dianjurkan sama. Sebagai perkiraan
awal lebar interval kelas digunakan rumus :
c = R/K
dengan c = lebar interval kelas,
R = kisaran data (range)
K = banyaknya kelas
▪ Banyaknya kelas dapat dihitung dengan rumus
Sturge : k = 1 + 3,3 log(n)
dengan k = banyaknya kelas dan
n = ukuran sampel data (sample size)
▪ Range : nilai maks – nilai min
4. Dihindari interval kelas terbuka karena untuk
keperluan analisis tidak bisa digunakan
5. Jika mungkin, interval kelas dipilih sedemikian rupa
sehingga nilai tengah kelasnya bersesuaian dengan
nilai dimana data aktual terkonsentrasi
6. Menyusun interval kelas dalam tabel distribusi frekuensi
7. Periksalah apakah syarat menentukan interval kelas tidak
dilanggar
a. Tidak tumpang asuh (Overlap), suatu data dapat dimasukkan dalam
dua kelas sekaligus.
b. Tidak boleh terdapat celah, suatu data tidak dapat masuk kedalam
suatu kelas
c. Mempunyai lebar yang sama, interval kelas yang satu sama dengan
interval kelas lainnya. Lebar interval kelas yang sama akan
memudahkan perhitunganperhitungan.
Contoh Distribusi Frekuensi

Diketahui data nilai ujian statistika untuk 80 orang mahasiswa sebagai berikut:

79 79 48 74 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86
90 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 91 88 81
70 74 99 95 80 59 71 77
63 60 83 82 60 67 89 63
76 63 88 70 66 67 79 75
• Data terbesar = 99; Data terkecil = 35
Rentang = 99-35 = 64
• Banyak kelas = 1 + 3,3 log(n)
= 1 + 3,3 log(80)
= 1 + 3,3 (1,9031)
= 7,2 (7 atau 8)
• P = rentang/banyak kelas = 64/7 = 9,14
(Gunakan 9 atau 10)
• Pilih batas bawah kelas interval pertama. Bisa diambil
sama dengan data terkecil atau nilai data yang lebih kecil
dari data terkecil tetapi selisihnya harus kurang dari
panjang/lebar kelas yang telah ditentukan.
• Dengan p=9 dan mulai dengan data yang lebih kecil dari
data terkecil, dipilih 31 maka kelas interval pertama 31-
40, 41-50 dst.
• Buatlah tabel untuk memasukkan kelas-kelas interval
yang sudah dibentuk.
Nilai Ujian Mahasiswa
• Interval kelas (Class interval) :
interval yang mendefinisikan sebuah kelas, sebagai contoh
pada tabel adalah 31-40, 41-50, . . . , dst .
• Batas kelas (class limit) :
angka-angka pada ujung interval kelas , sebagai contoh 31,
40, 41, 50 , dst.
• Batas kelas bawah (lower class limit) :
batas kelas untuk angka yang lebih kecil dibandingkan
batas kelas lain pada interval kelas yang sama, sebagai
contoh 31, 41, 51, dst.
• Batas kelas atas (upper class limit) :
batas kelas untuk angka yang lebih besar dibandingkan batas kelas
lain pada interval kelas yang sama, sebagai contoh 40, 50, 60, dst.
• Batas Nyata kelas (class boundary) :
batas kelas atas suatu interval ditambah batas kelas bawah interval
kelas berikutnya dibagi dua, sebagai contoh 30,5 dan 40,5, dst.
• Lebar Interval Kelas (width of interval class) : selisih antara batas
atas nyata kelas dengan batas bawah nyata kelas, sebagai contoh
c = 40,5-30,5 = 10.
• Nilai Tengah Kelas (Class Midpoint/Class Mark) :
nilai yang diperoleh dengan membagi dua jumlah dari
batas kelas bawah dan batas kelas atas suatu interval
kelas, sebagai contoh untuk interval kelas 31-40 nilai
tengah kelasnya adalah
(31+40)/2 = 35,5.
Dari tabel distribusi frekuensi tersebut dapat juga dibuat :
- Histogram frekuensi
- Poligon frekuensi
Distribusi frekuensi kumulatif :
▪ Kurang dari → disusun dengan menjumlahkan
seluruh frekuensi dari semua nilai yang lebih kecil dari
pada batas nyata interval kelas.
▪ Lebih dari disusun dengan menjumlahkan seluruh
frekuensi dari semua nilai yang lebih besar dari pada
atau sama dengan batas bawah nyata interval kelas.
Ukuran Pemusatan
• Rata-rata (Average)
• Median
• Modus
• Quartil
• Desil
• Persentil
Ukuran Pemusatan

• Ukuran Pemusatan menunjukkan di mana suatu data terpusat atau


mengelompok
• Pada umumnya data akan memusat pada nilai-nilai : Rata-rata
hitung, Median dan Modus
Rata-rata Hitung (Arithmatic Mean)
• Rata-rata merupakan hasil bagi dari sejumlah nilai dengan banyaknya responden
atau sample. Perhitungan mean merupakan perhitungan yang sederhan, karena
hanya membutuhkan jumlah nilai dan jumlah responden (n).
• Jika sebaran nilai berdistribusi normal, maka rata-rata nilai merupakan nilai tengah
dari distribusi frekuensi nilai tersebut.
Secara matematis dirumuskan sebagai berikut :
Dimana ;
X =
 X
N
X = X bar yang merupakan notasi rata-rata
 = Sigma = jumlah
X = nilai dari keseluruhan data
N = jumlah data
Ukuran Rata-rata Hitung (Arithmatic Mean)

• Berikut ini adalah jumlah saudara kandung dari 5 mahasiswa


yang dipilih secara acak, yaitu ; 2; 4; 6; 8; 10., Maka rata-rata
jumlah saudara kandung ke-5 mahasiswa tersebut adalah
2 + 4 + 6 + 8 + 10
X= =6
5
Ukuran Rata-rata Hitung (Arithmatic Mean)

• Untuk data yang dikelompokkan ke dalam distribusi frekuensi, maka cara


perhitungan adalah sebagai berikut :
1. Cari Nilai tengah untuk setiap kelas
2. Kalikan nilai tengah dengan frekuensi
3. Hitung rata-rata dengan menggunakan rumus Sigma, rumus Coding
atau rata-rata duga

X =
 f . Xi
N
Rata-rata Hitung (Arithmatic Mean)

• Data mengelompok
Kelas Batas Kelas ttk tengah f x.f
1 20 – 29 24,5 4 98
2 30 – 39 34,5 7 241,5
3 40 – 49 44,5 8 356
4 50 – 59 54,5 12 654
5 60 – 69 64,5 9 580,5
6 70 – 79 74,5 8 596
7 80 - 89 84,5 2 169
50 2695
___

X = 2695 / 50 = 53,9
Rata-rata ukur adalah akar pangkat n dari hasil perkalian datanya

Mg = n X 1  X 2  .........  X n
Rata-rata harmoni
Rata-rata harmoni adalah kebalikan dari rata-rata hitung

N
Mh =
1 X
Rata-rata kuadrat adalah akar pangkat dua dari kuadrat nilai rata-ratanya

Mq =
 X 2

N
Median
Median adalah nilai yang berada di tengah, yang membagi dua jumlah
data sama banyak (setelah data terurut).

1. Data diurut dari nilai kecil ke besar


2. Tentukan posisi median = (n+1)/2
3. Tentukan nilai median

Contoh : data : 9 5 7 8 4 5
1. Sort data : 4 5 5 7 8 9
2. Posisi median = (6+1)/2 = 3,5
3. Nilai median pada posisi 3,5 adalah 6
Median
Pada data yang dikelompokkan

 (n / 2) − F 
Md = B +  .i
 fm 
Md : Nilai Median
B : Tepi batas bawah kelas median
F : frekuensi kumulatif sebelum kelas median
Fm : frekuensi pada kelas median
i : interval kelas median

Contoh : Lihat tabel belakang cara penghitungan md

Md = 49,5 + [( 25 – 19) / 12] x 10


Md = 54,5
Cara penghitungan median
frek kum frek x ttk
kelas Batas kelas frek ttk tngh tngh
1 20-29 4 24.5 4 98
2 30-39 7 34.5 11 241.5
3 40-49 8 44.5 19 356
4 50-59 12 54.5 31 654
5 60-69 9 64.5 40 580.5
6 70-79 8 74.5 48 596
7 80-89 2 84.5 50 169
50 2695
Modus

Modus adalah nilai yang paling sering muncul.

 d1 
Mo = B +  .i
 d1 + d 2 

Mo = Nilai Modus
B = Tepi Batas Bawah kelas modus
d1 = beda frekuensi antara kelas modus dg kelas sebelumnya
d2 = beda frekuensi antara kelas modus dg kelas sesudahnya
i = interval kelas modus
Modus

Contoh : Lihat tabel 1


Tentukan kelas modusnya (kelas yg memiliki frekuensi
terbesar) : 50 – 59
d1 = 12 – 8 = 4
d2 = 12 – 9 = 3

Mo = 49,5 + [4 / (4+3)] 10 = 55,21


Ukuran Kelebihan Kekurangan
Pemusatan
1. Melibatkan semua nilai 1. Peka thd nilai ekstrim
Rata-rata 2. menggambarkan mean populasi 2. Kurang baik unutk data heterogen
hitung 3. Cocok untuk data homogen

1. Tidak terpengaruh oleh data ekstrim 1. Tidak mempertimbangkan semua


Median 2. Cocok untuk data heterogen ( nilai
nominal) 2. Kurang menggambarkan mean
populasi
1. Tidak terpengaruh oleh nilai ekstrim 1. Kurang menggambarkan mean
Modus 2. Cocok untuk data homogen / populasi
heterogen 2. Modus bisa lebih dari satu
3. Open ended data
Ukuran Letak

• Kuartil : membagi data menjadi 4 bagian sama banyak.


• Desil : membagi data menjadi 10 bagian sama banyak
• Persentil : membagi data menjadi 100 bagian sama
banyak
Ukuran Penyebaran
• Jangkauan (Range)
• Simpangan Kuartil
• Simpangan Mutlak Rata-rata (Mean
Deviation)
• Standar Deviasi (Simpangan Baku)
• Varians
• Koefisien Variasi
• Momen, Skewness dan Kurtosis
Ukuran Penyebaran
Ukuran Penyebaran menggambarkan bagaimana suatu
kelompok data menyebar terhadap pusat data.
Macam-macam ukuran penyebaran :
1. Jarak (Range)
2. Deviasi rata-rata (MD)
3. Deviasi Standar
4. Koefisien Variasi
Ukuran Penyebaran
Deviasi Standar
Pada data yang tidak dikelompokkan

 (x −  )
2

• Untuk data populasi : =


N

 (x − X )
2

s=
• Untuk data sampel : n −1
Deviasi Standar
Contoh :
Data populasi : 5 3 7 5 8 2
=5
(5 − 5) 2 + (3 − 5) 2 + (7 − 5) 2 + (5 − 5) 2 + (8 − 5) 2 + (2 − 5) 2
=
6

 = 2,08

Data sampel : 5 3 7 5 8 2
X =5 (5 − 5) 2 + (3 − 5) 2 + (7 − 5) 2 + (5 − 5) 2 + (8 − 5) 2 + (2 − 5) 2
s=
6 −1
s = 2,28
Deviasi Standar
Batas Kelas x f x.f (x-)² f.(x-)²

20 – 29 24,5 4 98 864.36 3457.44


30 – 39 34,5 7 241,5 376.36 2634.52
40 – 49 44,5 8 356 88.36 706.88
50 – 59 54,5 12 654 0.36 4.32
60 – 69 64,5 9 580,5 112.36 1101.24
70 – 79 74,5 8 596 424.36 3394.88
80 - 89 84,5 2 169 936 1872.72

50 2695 13082

2695 13082
= = 53,9 = = 16,17
50 50
Ukuran Penyebaran Relative

Digunakan untuk membandingkan dua atau lebih distribusi.

• Koefisien Variasi


Untuk data populasi KV = x100%

s
Untuk data sampel KV = x100%
X
Soal Latihan

Berikut Nilai UTS Statistika Ekonomi 15 mahasiswa D3 FEUI :


• 45 78 95 65 88 70 55 65 81 90 52 73 65 55 67

Tentukan :
1.  2. 
3. Md 4. Mo
5. KV 6. Q3
7. D6
Soal Latihan

Berikut data Berat badan 50 mhs D3 FEUI


Berat Badan (kg) Frekuensi
50 – 54 5
55 – 59 9
60 – 64 15
65 – 69 11
70 – 74 6
75 - 79 4
50

Tentukan :
1.  2.  3. Md 4. Mo 5. Q3 6. D7

Anda mungkin juga menyukai