BAB 2
STATISTIKA DESKRIPTIF
Selain ribuan organisasi dan individu swasta, sejumlah besar 2.1 Menyajikan Data
pemerintah atau lembaga pemerintah (seperti Biro Sensus 2.1.1 Tabel dan Grafik
Nasional, BPS, Biro Statistik Tenaga Kerja, Statistik Dinas Frekuensi
Pertanian Nasional, Pusat Statistik Pendidikan Nasional, 2.1.2 Tabel dan Frekuensi
Pusat Statistik Kesehatan Nasional,dan Biro Statistik relatif
Kehakiman) melakukan ratusan survei setiap tahun. Dalam 2.1.3 Data Kelompok,
bentuk aslinya jika dikumpulkan dari masing-masing survei, Histogram, dan Ogive
mungkin dalam ratusan ribu halaman, mungkin. Jadi, begitu 2.1.4 Diagram Batang-Daun
besar data tersebut sehingga hampir tidak mungkin dapat dan Boxplot
dibaca seluruhnya. Statistik deskriptif adalah teknik untuk 2.2 Ukuran Letak
mengumpulkan, meringkas, dan menyajikannya dengan 3.2.1 Ukuran Letak Data
menggunakan tabel, grafik, dan ukuran-ukuran statistik. Tunggal
2.2.2 Ukuran Letak Data
Kelompok
2.3 Ukuran Gejala Pusat
hal 17
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Subjek materi dari bab ini adalah mempelajari cara atau teknik penyajian data dan meringkas
data (Summary).
2.1 MENYAJIKAN DATA
Penyajian data dari hasil pengukuran dan perhitungan sebaiknya disajikan dengan jelas,
simpel, dan informasinya dapat segera diperoleh sehingga pengguna dapat memperoleh (rasa) dari
karakteristik data yang diinginkan. Sampai saat ini penyajian data umumnya disajikan dalam cara
tabel dan grafik.
Kumpulan data yang bilangannya relatif kecil dapat disajikan dalam bentuk Tabel Frekuensi,
contoh Tabel 2.1 adalah tabel frekuensi data nilai matematika siswa.
Artinya, siswa yang nilainya 60 ada sebanyak 15 orang, yang nilainya 70 ada sebanya 8 orang,
demikian seterusnya. Jumlah total siswa sebanyak 42 orang. Tabel frekuensi (Tabel 2.1) jika
disajikan dalam bentuk grafik frekuensi, misalkan dalam bentuk diagram batang dapat dilihat pada
Grafik 2.2, diagram titik (Grafik 2.3).
hal 18
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Contoh 2.1
Diketahui data hasil pengukuran tinggi (dalam cm) 100 siswa SMA di kota A adalah : 162, 160,
160, 155, 155, 150, 150, 155, 165, 162, 162, 160, 155, 155, 160,170,170, 165, 162, 155, 160,
160, 160, 170, 155, 155, 160, 162, 162, 155, 160, 170, 155, 160, 155, 170, 162, 162, 162, 170,
170, 170, 155, 155, 170, 160, 155, 158, 158, 158, 160, 160, 170, 170, 170, 155, 155, 155, 160,
160, 170, 155, 155, 158, 158, 160, 158, 170, 155, 160,170,170, 165, 162, 155, 160, 160, 160,
160, 170, 170, 170, 155, 155, 155, 160, 160, 170, 155, 155, 158, 155, 158, 158, 160, 158, 150,
155, 155, 150.
Ringkas data di atas dengan menggunakan tabel frekuensi
Jawab: hitung jumlah data yang nilainya sama, gunakan turus untuk menentukan frekuensinya.
162, 160, 160, 155, 155, 150, 150, 155, 165, 162, 162, 160, 155, 155, 160,170,170, 165, 162,
155, 160, 160, 160, 170, 155, 155, 160, 162, 162, 155, 160, 170, 155, 160, 155, 170, 162, 162,
162, 170, 170, 170, 155, 155, 170, 160, 155, 158, 158, 158, 160, 160, 170, 170, 170, 155, 155,
155, 160, 160, 170, 155, 155, 158, 158, 160, 158, 170, 155, 160,170,170, 165, 162, 155, 160,
160, 160, 160, 170, 170, 170, 155, 155, 155, 160, 160, 170, 155, 155, 158, 155, 158, 158, 160,
158, 150, 155, 155, 150.
Tabel Frekuensi
Tinggi (cm) Turus Frekuensi
150 IIII 4
155 26
158 10
160 24
162 14
165 II 2
170 20
Jumlah 100
Contoh 2.2
Diketahui data jumlah penduduk suatu kota adalah: usia 0 – 5 tahun sebanyak 2 juta, usia 5 – 22
tahun sebanyak 17 juta, usia 22 – 60 tahun sebanyak 8 juta, dan 60 – 100 tahun 1 juta. Sajikan
data dalam bentuk yang terbaik
Jawab
Menyajikan persentase jumlah penduduk yang mudah terlihat adalah dalam bentuk diagram
lingkaran. Untuk menentukan sudut juring lingkaran pada diagram lingkaran, lakukan hal sebagai
berikut: Sudut juring untuk usia 22 – 60 tahun dan frekuensinya 8 juta, total penduduk 28 juta.
8
Maka sudut juring adalah × 3600 ≈ 1030
28
hal 19
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Jawab
Sajian yang terbaik berbentuk diagram batang daun, pada contoh tersebut angka puluhan sebagai
batang dan satuan sebagai daun. angka puluhan 4 sebanyak 6 data, angka puluhan 3 sebanyak
7, demikian seterusnya.
4 335666
3 3344788
2 11335555
1 2234444
hal 20
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Misalkan sekumpulan data berukuran 𝑛, dan 𝑓 adalah frekuensi data yang nilainya sama,
𝑓
maka frekuensi relatif data tersebut adalah . Frekuensi relatif dari data pada tabel 2.1 adalah
𝑛
Frekuensi relatif sering juga disajikan dalam diagram lingkaran, lihat grafik 2.5.
Grafik 2.5 Grafik Frekuensi Relatif
Untuk data pada pada tabel 2.1 yang ukuran relatif kecil, masih cukup baik disajikan dalam
tabel atau grafik data tunggal, tetapi untuk data pada contoh 2.1 data tersebut dapat disajikan dalam
data berkelompok, tabel 2.6
hal 21
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Untuk data dalam jumlah yang besar sebaiknya data diringkas dalam data berkelompok. Misalkan
diketahui data masa hidup dari 200 lampu pada tabel 2.7
Tabel frekuensi data berkelompok dari tabel 2.7 adalah (Tabel 2.8)
hal 22
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
DISKUSI 2.1
Data Estimasi Penderita Penyakit Jantung Koroner Pada Umur≥ 15 tahun menurut Provinsi Tahun
2013
Catatan
𝐽 = 𝑥𝑚𝑎𝑘𝑠 − 𝑥𝑚𝑖𝑛
Sebaiknya gunakan bilangan-bilangan 5, 10, 15, dst
Penentuan batas kelas dibuat sedemikian rupa sehingga
Semua data dari data asal dapat dimasukan kedalam kelas interval
Tidak ada keraguan untuk memasukan semua data kedalam kelas interval yang
sesuai.
hal 23
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Gunakan data pada contoh 2.1, hitung jangkauan data tersebut dan jumlah kelas: 𝐽 = 170 − 150 =
20
20 ; 𝑘 = 1 + 3,22 log 100 = 7,44 ≈ 7. Lebar intervalnya adalah 𝐼 = ≈ 3. Sehingga data
7
berkelompoknya adalah
HISTOGRAM
Diketahui data : 3, 3, 5, 5, 7, 7, 7, 9, 11. 11, 11, 12, 12, 15. Histogram data tersebut adalah
hal 24
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
155,5 – 158,5 10
158,5 – 161,5 24
161,5 – 164,5 14
164,5 – 167,5 2
167,5 – 170,5 20
Jumlah 100
OGIVE
Ogive adalah grafik yang mempresentasikan Frekuensi Komulatif untuk kelas dalam distribusi
frekuensi. Frekuensi Komulatif adalah jumlah frekuensi sebelum data 𝑥𝑘 dan frekuensi data 𝑥𝑘
disebut frekuensi komulatif kurang dari (𝑓𝑘 <)
hal 25
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Interpretasi grafik ogive 𝑓𝑘 < sebagai berikut: sebanyak 100% mahasiswa nilainya kurang atau sama
34
dengan 100, dan sebanyak × 100% = 81% mahasiswa nilainya kurang atau sama dengan 80.
42
Sedangkang interpretasi grafik ogive 𝑓𝑘 > sebagai berikut: sebanyak 100% mahasiswa nilainya lebih
19
atau sama dengan 60, dan sebanyak × 100% = 45,2% mahasiswa nilainya lebih atau sama
42
dengan 80.
Grafik ogive untuk data berkelompok, nilai data dari sumbu x (sumbu horisntal) adalah nilai
tengah kelas interval perhatikan tabel 2.9 dengan ditambahkan nilai tengah dan frekuensi komulatif.
Kelas Interval 𝑥𝑖 𝑓𝑖 𝑓𝑘
150 – 152 151 4 4
153 – 155 154 26 30
156 – 158 157 10 40
159 – 161 160 24 64
162 – 164 163 14 78
165 – 167 166 2 80
168 – 170 169 20 100
Ogive dengan menggunakan batas atas kelas interval dan frekuensi relatif komulatif.
hal 26
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
DISKUSI 2.1
Tabel di bawah ini adalah jumlah dari persebaran kasus Demam Berdarah Dengue (DBD) di
Indonesia Tahun 200 – 2015. Sumber data diambil dari Pusat Data dan Informasi Kementerian
Kesehatan RI.
hal 27
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
a. Buat Histogram Jumlah Propinsi yang terjangkit, ogive 𝑓𝑘 <, dan ogive frekuensi relatif
komulatif
b. Buat tabel baru dengan menghimpun tahun yang mempunyai persentase terjangkit yang
sama, misalkan tahun yang mempunyai % terjangkit 100% sebanyak 6 tahun (2001, 2010,
2012, 2013, 2014, 2015). Buat ogive 𝑓𝑘 < dan interpretasikan perbedaan ogive dengan
ogive pada soal a.
c. Ulangi soal b untuk kab/kota yang mempunyai % terjangkit yang sama.
Gambaran Diagram Batang Daun dan BoxPlot sebagai berikut. Misalkan diberikan data berikut: 23,
23, 14, 15, 17, 15, 13, 24, 26, 37, 23, 34, 35, 31, 31, 44, 45, 23, 47, 48, 47, 57, 54, 56, 55. Diagram
Batang Daun dan BoxPlot adalah
10
2 1 34
5 1 557 20
10 2 33334
11 2 6 30
(3) 3 114
C2
11 3 57 40
9 4 4
8 4 5778 50
4 5 4
3 5 567 60
Boxplot of C2
Misalkan diberikan data: 123, 254, 142, 167, 135, 212, 275, 387, 345, 323, 442, 464, 143, 216, 673,
456, 342, 564, 342, 875, 474, 687, 367, 564, 878, 934, 967, 789, 564, 674. Diagram Batang daun
dan BoxPlot
hal 28
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
100
5 1 23446
200
9 2 1157
300
15 3 244468
400
15 4 4567 500
C1
11 5 666 600
8 6 778 700
5 7 8 800
4 8 77 900
2 9 36 1000
Boxplot of C1
Misalkan diberikan data : 23, 23, 14, 15, 17, 15, 13, 24, 26, 37, 23, 34, 35, 31, 31, 44, 45, 23, 47,
48, 47, 57, 54, 56, 55, 123, 254, 142, 167, 135, 212, 275, 387, 345, 323, 442, 464, 143, 216, 673,
456, 342, 564, 342, 875, 474, 687, 367, 564, 878, 934, 967, 789, 564, 674. Diagram Batang Daun
dan BoxPlot
0
25 0 1111122222233333444445555
(5) 1 23446
200
25 2 1157
21 3 244468 400
15 4 4567
C3
11 5 666 600
8 6 778
5 7 77 800
4 8 36
1000
2 9
Boxplot of C3
DISKUSI 2.2
Dari ketiga Diagram Batang Daun dan BoxPlot di atas apa yang dapat anda jelaskan dan yang
dapat anda simpulkan.
hal 29
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Jam ke 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Data 2 3 5 1 4 7 4 5 6 6 1 12 3 4 14
Maka termasuk data deret waktu dan sebaiknya plot datanya sebagai berikut, Gambar 2.10:
14
12
10
8
C1
0
0 2 4 6 8 10 12 14
Hour
Data di atas adalah salah satu contoh dari data deret waktu, yang mempunyai model tren. Minitab
menyediakan model tren linier, kuadrat, dan eksponen. Lihat Gambar 2.11, Gambar 2.12, dan
Gambar 2.13.
Gambar 2.11 Model Tren Linier Gambar 2.12 Model Tren Eksponen
hal 30
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Informasi tentang arti dari model tren dan perhitungannya dapat dibaca pada Program Minitab
toolbar help.
(𝑦𝑖 − ⏞
𝑦 𝑖 )⁄
∑| 𝑦𝑖 |
MAPE = × 100, (𝑦𝑖 ≠ 0)
𝑛
MAD, which stands for Mean Absolute Deviation, measures the accuracy of
fitted time series values. It expresses accuracy in the same units as the data,
which helps conceptualize the amount of error.
∑𝑛𝑖=1|𝑦𝑖 − ⏞
𝑦𝑖 |
MAD =
𝑛
MSD stands for Mean Squared Deviation. MSD is always computed using the
same denominator, n, regardless of the model, so you can compare MSD values
across models. MSD is a more sensitive measure of an unusually large forecast
error than MAD.
hal 31
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
2
∑𝑛𝑖=1|𝑦𝑖 − ⏞
𝑦𝑖 |
MSD =
𝑛
Jawab
Buka Program Minitab dan tuliskan datanya, maka hasilnya sebagai berikut:
34
33
32
31
30
C2
29
28
27
26
25
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015
Year
hal 32
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Catatan: apabila data deret waktu tidak mempunyai tren dan bukan data musiman, Minitab
menyediakan Moving Average Plot, lihat gambar 2.14
Model data deret waktu dapat digunakan untuk peramalan (forecasting). Informasi ini hanya untuk
memberikan wawasan, alangkah baiknya pelajari pada materi khusus, yaitu Analisis Deret Waktu.
Umumnya ukuran letak adalah Kuartil dan Persentil, Kuartil adalah Persentil yang khusus:
Kuartil satu (𝑄1 ) sama dengan Persentil ke-25 (𝑃25 ), Kuartil dua (𝑄2 ) sama dengan Persentil ke-50
(𝑃50 ), dan Kuartil tiga (𝑄3 ).
Kuartil membagi data kedalam empat bagian setelah data tersebut diurutkan dari nilai yang
terkecil sampai nilai yang terbesar. Misalkan diketahui data: 𝑥1 < 𝑥2 < ⋯ < 𝑥𝑛 , maka kuartilnya
adalah
𝑥1 𝑥𝑛
𝑄1 𝑄2 𝑄3
Contoh 2.3
Produk Domestik Regional Bruto Tahun 2010 – 2016 atas dasar harga yang berlaku DKI
Jakarta menempati yang tertinggi, yaitu (dalam juta): 1,1 ; 1,2 ; 1,4 ; 1,5 ; 1,8 ; 2,0 ; 2,2.
Sumber: BPS Indonesia.
Tentukan 𝑄1 , 𝑄2 , dan 𝑄3
hal 33
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Jawab
𝑄1 = 1,2 ; 𝑄2 = 1,5 ; 𝑄3 = 2,0
Berdasarkan definisi 2.1, jawaban contoh 2.3 dapat dihitung dengan rumus tersebut. Diketahui 𝑛 =
7, maka 𝑄1 (𝑘 = 25 ) adalah data
25
ke- 𝑖 = (7 + 1) = 2, yaitu 1,2.
100
Contoh 2.4
Hasil nilai UNBK dan Indeks Integritas UN(IIUN) Matematika SMP pada tiap Provinsi tahun 2016-
2017 umumnya meningkat.
Hitung
a. 𝑃30 𝑑𝑎𝑛 𝑃85
b. Berapa nilai UN tertinggi dari 80%
Provinsi setelah diranking pada
Tahun 2017?
Jawab
Data setelah diurutkan
40,69 41,32 42,16 42,28
42,81 42,96 43,20 43,63
44,76 45,17 45,31 45,67
46,02 46,84 46,91 47,34
47,88 47,88 48,13 48,24
48,65 49,6 51,38 51,47
51,65 52,78 52,82 53,56
55,37 56,29 56,45 56,90
58,41 59,32
hal 34
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
30 85
a. 𝑖 = (34 + 1) = 10,5 dan 𝑖 = (34 + 1) = 29,75
100 100
Letak datanya diantara data ke-10 dan ke-11, yaitu:
45,17 + 45,31
𝑃30 = = 45,27
2
Letak datanya diantara data ke-29 dan ke-30, yaitu:
75
𝑃85 = 55,37 + × (56,29 − 55,37) = 56,06
100
80
b. 𝑖 = (34 + 1) = 28. 𝑃80 = 53,56
100
Jadi, nilai UNBK tertinggi dari 80% provinsi adalah 53,56
Contoh 2.5
Perhatikan data pada contoh 2.4, cari persentil dari data 45,17
Jawab
Diketahui 𝑥10 = 45,17 dan 𝑛 = 34, maka 𝑥 = 9 dan 𝑦 = 1 (karena 45,17 hanya ada satu).
9 + 0,5(1)
%= × 100 = 28
34
Jadi, 45,17 = 𝑃28
Outlier (Pencilan)
20
15
y
10
0
0 2 4 6 8 10 12 14 16
x
Bagaimana mengetahui suatu data berpotensi sebagai pencilan? Potensi data pencilan dapat
diketahui melalui jangkauan Interkuartil.
hal 35
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Data yang berpotensi menjadi pencilan adalah yang nilainya kurang dari (1,5)(𝐼𝑄𝑅) (data dibawah
𝑄1 ), dan yang nilainya lebih dari (1,5)(𝐼𝑄𝑅) (data di atas 𝑄3 ).
Menggunakan Minitab
Descriptive Statistics: Data
Boxplot of Data
Boxplot Data
30
25
20
C3
15
10
Dari Boxplot data, 28 berada diluar Box (Kotak), maka 28 berpotensi menjadi Outlier. Garis
horizontal didalam kotak adalah letak 𝑄2 atau Median, sisi bawah kotak adalah letak 𝑄1 dan sisi atas
kotak adalah letak 𝑄3 .
hal 36
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Min 𝑄1 Me 𝑄3 Maks
Siang 32 56 74,5 82,5 99
Malam 25,5 78 81 89 98
DISKUSI 2.3
Diketahui skor nilai ujian matematika kelas A dan kelas B sebagai berikut:
Kelas A : 78; 85; 90; 65; 56; 97; 88; 78; 67; 77; 85; 94 ; 89
Kelas B : 45; 77; 90; 56; 78; 76; 56; 97; 50; 56; 60; 63; 44; 70; 87; 89; 92; 90; 100; 67
a. Bandingkan kedua Jangkauan Interkuartil
b. Tentukan himpunan masing-masing Outlier
Menentukan ukuran letak data dengan jumlah data yang besar sangat merepotkan. Oleh
karena itu, data tersebut perlu diringkas dalam kelas interval. Akan tetapi, perlu teknik tertentu dalam
menentukannya.
hal 37
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
DISKUSI 2.4
Perhatikan data estimasi penyakit jantung pada contoh 2.7 dan hitunglah:
a. Bandingkan kedua Jangkauan Interkuartil
b. Tentukan himpunan masing-masing Outlier
c. Pada umur berapa tahun sebaran tertinggi dari penyakit Stroke
Yang termasuk ukuran letak yang gejala memusat adalah: Rata-rata, Modus, dan Median.
Ukuran letak median sama dengan nilai Kuartil kedua, sudah dibahas pada sub-bab sebelumnya.
Untuk membedakan dari ketiga ukuran tersebut perhatikan ilustrasi data berikut:
hal 38
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
X 4 5 5 5 6
Y 3 6 6 6 7
Z 3 4 4 5 5 5 6 6 7 7 7 7 8
Mean 5
3,0 StDev 0,7071 Mean 5,6 Mean 5,692
3,0 4
StDev 1,517 StDev 1,494
N 5 Mean 6
N 5 N 413 StDev 8,944
N 8
2,5
2,5
3
2,0 3
2,0
Frequency
Frequency
Frequency
Frequency
1,5
1,5 2
2
1,0
1,0
1
1
0,5
0,5
0,0 0
4 5 6 0,0 0
2 3 4 5 6 7 8 9 3 4 5 6 7 8 9 -10 0 10 20 30
X Z W
Y
hal 39
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
3 4 5 6 7
C5
DISKUSI 2.5
Diketahui dua sampel sebagai berikut:
X 0,2 0,5 0,1 0,7 0,3 0,4 0,9 0,1 0,1 0,4
Y 1 1 2 2 4 4 7 7 3 3
Tentukan Rata-rata, Median, dan Modus kedua sampel. Gambarkan grafik titik data tersebut
Hitung rata-ratanya
Jawab
0,4(4∙2+5+8)+0,6(3∙3+2∙7+2∙9)
𝑥̅ = =5
6∙(0,4)+7∙(0,6)
hal 40
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Minitab dapat membagun sampel dari beberapa distribusi, salah satunya adalah
distribusi Normal 𝑋~𝑁(0,1) dengan rata-rata 0 dan simpangan baku 1
Calc→Random Data→Normal
Hasilnya
Plotnya
Dua sampel acak dapat mempunyai rata-rata yang sama, tetapi sebaranya berbeda.
Misalkan diketahui dua sampel X dan Y sebagai berikut:
Dotplot of X
X 4 4 4 6 6 6
Y 1 2 3 7 8 9
4 5 6 2 4 6 8
hal 41
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Mean Mean
Median Median
Rata-rata sampel X dan Y sama, yaitu 5. Akan tetapi, sebaran datanya berbeda. Sampel Y
lebih menyebar dari sampel X. Untuk mengetahui sebaran sampel gunakan simpangan baku.
∑𝑛𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑆=√
𝑛−1
∑𝑁
𝑖=1 𝑓𝑖 (𝑥𝑖 − 𝜇)
2
𝜎=√
𝑁
3(4−5)2 +3(6−5)2 6
Sampel X : 𝑆𝑋 = √ = √ = 1,09
6−1 5
58
=√
5
= 3,41
Jadi, 𝑆𝑋 < 𝑆𝑌 tetapi rata-rata sampelnya sama. Artinya dua sampel yang mempunyai rata-rata yang
sama, tetapi simpangan baku sampel pertama lebih kecil dari simpangan baku sampel kedua, maka
sebaran sampel kedua lebih menyebar.
hal 42
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Catatan
Sampel Populasi
𝑛 : Ukuran Sampel 𝑁 : Ukuran Populasi
𝑆 2 : Variansi Sampel 𝜎 2 : Variansi Populasi
𝑆 : Simpangan Baku Sampel 𝜎 : Simpangan Baku Populasi
Bukti
No 𝑥𝑖 𝑥𝑖2
1 1 1
2 2 4
3 3 9
4 7 49
5 8 64
6 9 81
∑ 30 208
hal 43
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
302
208− 6 58
𝑆2 = = = 11,6 dan 𝑆 = √11,6 = 3,41
6−1 5
∑ 𝑥𝑖 2 ∑(𝑥𝑖 − 𝑥1 )2
∑(𝑥𝑖 − 𝑥̅ )2 ∑ (𝑥𝑖 − ) =
𝑛 𝑛−1
𝑆2 = =
𝑛−1 𝑛−1 𝑛(𝑥1 − 𝑥1 )2
Karena 𝑥1 = 𝑥2 = ⋯ = 𝑥𝑛 , maka ∑ 𝑥𝑖 = 𝑛𝑥1 =
𝑛−1
𝑛𝑥1 2 =0
∑ (𝑥𝑖 − )
𝑆2 = 𝑛
𝑛−1
1
𝑃𝑎𝑙𝑖𝑛𝑔 𝑠𝑒𝑑𝑖𝑘𝑖𝑡 (1 − 𝑘 2)
𝜇
| ← 𝑘𝜎 → | ← 𝑘𝜎 → |
hal 44
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
1
Tabel 2.17 Ilusterasi Nilai (1 − )
𝑘2
1
𝑘 (1 − )
𝑘2
1 1–1=0
1 3
2 1− =
4 4
1 8
3 1− =
9 9
Rumus yang lain yang sering digunakan untuk menunjukan sebaran data yang berbentuk lonceng
adalah dengan rumus empirik.
hal 45
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Sampel dengan ukuran yang besar dapat diringkas menjadi data berkelompok, perhitungan
rata-rata dan simpangan bakunya menggunakan titik tengan dari setiap kelas intervalnya.
∑𝑚
𝑖=1 𝑓𝑖 𝑥𝑖 ∑𝑛 𝑓𝑖 (𝑥𝑖 − 𝑥̅ )2
𝑥̅ = dan 𝑆 = √ 𝑖=1
𝑁 𝑁−1
hal 46
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
Jawab
Problem Set 2
Tabel dibawah adalah pertumbuhan ekonomi negara-negara ASEAN Tahun 2012 – 2016,
berdasarkan tabel tersebut kerjakan soal nomor 1 – 7
hal 47
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
3. Buat plot deret waktu pertumbuhan ekonomi Negara Indonesia dari Tahun 2012 sampai 2016,
buat estimasi dengan metode MA (gunakan Program Minitab)
5. Hitung Kuartil 𝑄1 , 𝑄2 , 𝑑𝑎𝑛 𝑄3 Pertumbuhan Ekonomi Negara ASEAN Tahun 2014. Letak
Negara Indonesia Berada diantara kuartil berapa?
6. Buat diagram Batang Daun dibulatkan sampai satu angka dibelakang koma ( 5 dibulatkan
keatas, dan < 5 dibulatkan kebawah)
7. Gambarkan Boxplot data Pertumbuhan Ekonomi Negara ASEAN Tahun 2014. Apakah titik
7,99 berpotensi outlier?
Tabel dibawah adalah statistik penyakit jantung koroner, gagal jantung, dan Stroke usia 15 tahun
2013.
10. Hitung rata-rata dan simpangan baku usia yang terkena Stroke berdasarkan %diagnosis
pergejala (D/G)
11. Berapa usia yang terbanyak penyakit Jantung Koroner, Gagal Jantung, dan Stroke
berdasarkan Estimasi Jumlah Absolut (D)
12. Gambarkan Histrogram Estimasi Jumlah Absolut (D) penyakit Jantung Koroner, Gagal
Jantung, dan Stroke
13. Gambarkan Kurva Ogive Estimasi Jumlah Absolut (D) penyakit Jantung Koroner, Gagal
Jantung, dan Stroke
14. Dari 1000 penduduk, sesorang didiagnosis dokter mempunyai penyakit Jantung Koroner.
Berapa tahun usia paling tua dari 25% yang terdiagnosis Dokter terkena Jantung Koroner?
hal 48
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
15. Dari 1000 penduduk, sesorang didiagnosis dokter mempunyai penyakit gagal jantung. Berapa
tahun usia paling tua dari 75% yang terdiagnosis Dokter terkena gagal jantung?
X 4 5 4 7 8 3 9 3 3 6 6 7 9 7 4
Y 3 3 3 7 7 7 9 9 11 11 11 5 5 5 6 6 8 8 2 2 3
18. Plot diagram titik satu dimensi masing-masing sampel, sampel manakah yang paling
menyebar? Mengapa?
20. Pada survey terhadap 40 orang, responden mendapatkan pertanyaan “Berapa kali kunjungan
ke Supermarket dalam satu bulan” disajikan dalam tabel berikut
Jumlah
frekuensi
kunjungan
1 3
2 7
3 4
4 5
5 2
Tentukan:
a. Rata-rata dan Modus
b. Gambarkan Boxplot data diatas
21. Tabel dibawah ini menunjukan persentase kompetitor dari Bimbingan Belajar (BB) di kota-
kota A, B, C, D, E yang Total penduduknya 1 juta orang
BB %peserta BB %pelajar
A 28,9% 8,6%
B 7,6% 23,2%
C 12,1% 15,0%
D 18,5% 14,3%
E 8,7% 28,8%
Buat diagram batang dan lingkaran yang menunjukkan persentase BB berdasarkan populasi
jumlah penduduk.
hal 49
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
0,06 0,08 0,35 0,4 0,81 0,9 0,75 0,35 0,4 0,19
0,79 0,03 0,24 0,85 0,89 0,52 0,49 0,29 0,86 0,43
0 0,13 0,81 0,93 0,88 0,41 0,02 0,71 0,96 0,16
0,2 0,16 0,75 0,09 0,36 0,27 0,28 0,96 0,87 0,68
Pilih satu digit dibelakang koma dengan cara membulatkan (contoh: 0,79 → 8 ; 0,52 → 5),
sedemikian sehingga diperoleh 40 data baru.
a. Hitung rata-rata dan simpangan baku
b. Gambarkan Boxplot
25. Tabel dibawah adalah data pemakaian pulsa/bulan dari 100 orang yang di survey
Pulsa(ribu) frekuensi
5–9 21
10 – 14 5
15 – 19 11
20 – 24 7
25 – 29 16
30 – 34 8
35 – 39 9
40 – 44 12
45 – 49 5
50 – 54 6
Tentukan
a. Frekuensi relatif, frekuensi komulatif, dan kurva Ogive
b. Pemakain tertinggi dari 56% yang di survey
hal 50
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
26. Incidence Rate (IR) penyakit DBD dari tahun 1968 – 2015 cenderung terus meningkat, hasil
dari laporan Kementerian Kesehatan RI bekerjasama dengan BPS tahun 2016.
27. Gambarkan grafik deret waktu dari data jumlah kelahiran dari tahun 1856 – 1875 : laki-laki,
perempuan, dan total. Gunakan Minitab untuk membuat ramalan jumlah yang lahir pada tahun
2018.
28. Dari segi jumlah kejahatan untuk level provinsi/polda, selama tahun 2015 Polda Metro Jaya
mencatat jumlah kejahatan terbanyak. Diagram di bawah menunjukan Jumlah kejahatan
(Crime Total) yang dilaporkan dan Tingkat Resiko Terkena Kejahatan (Crime Rate) Tahun
2015
hal 51
Statistika Dasar, lukman12@upi.edu
Statistika Deskriptif
30. Diskusikan Rata-rata, median, dan modus untuk setiap masalah berikut. Apakah ada pola
antara ukuran sebaran dan ukuran pusatnya?
4 69
5 367778
6 003344567778
7 0112347889
8 01358
9 0033
hal 52
Statistika Dasar, lukman12@upi.edu