02 Statistika Deskriptif

Statistika Deskriptif
PROBABILITAS DAN STATISTIKA

Statistika
Bidang statistika yang membahas cara atau
metode mengumpulkan, menyederhanakan dan
menyajikan data sehingga bisa memberikan
Statistika
informasi yang berarti
Statistika Inferensial
Bidang statistika yang membahas cara-cara atau
metode menarik kesimpulan dan mengukur
keandalan kesimpulan tentang suatu populasi
berdasarkan informasi yang bersumber dari suatu
sampel
Pendahuluan
Bidang statistika yang membahas cara atau

metode mengumpulkan, menyederhanakan
dan menyajikan data sehingga bisa
memberikan informasi yang berarti
Penyajian Data
Penggambaran / penyajian data dapat dilakukan dengan
menggunakan :
1. Grafik / diagram, tabel
2. Ukuran statistik
3. Analisis eksplorasi data (Exploratory Data

Analysis / EDA)
Grafik / Diagram
dan Tabel
Grafik / Diagram
Jenis grafik / diagram antara lain :
Diagram Batang
Diagram Garis
Diagram Pencar
Diagram Lingkaran
Grafik / Diagram
Umur Mahasiswa Universitas X
3500
3000
2500
2000
1500
1000
500
0
17 – 20 21 – 24 25 – 28 29 – 32 33 – 36
Umur Mahasiswa Universitas X Umur Mahasiswa Universitas X
3500
3000
2500 12% 3% 14% 17 – 20
2000 21 – 24
1500 25 – 28
1000 34% 29 – 32
37%
33 – 36
500
0
0 2 4 6
Penyajian Data
Penggambaran / penyajian data dapat dilakukan dengan
menggunakan :
1. Grafik / diagram, tabel
2. Ukuran statistik
3. Analisis eksplorasi data (Exploratory Data

Analysis / EDA)
Tabel
Jenis tabel / daftar antara lain :
o Tabel Kontingensi
o Tabel Distribusi Frekuensi

Tabel
Tabel Kontingensi
Jumlah Pelajar di Daerah A
Jenis SD SMP SMA Jumlah

Kelamin
Laki-laki 4758 2795 1459 9012
Perempuan 4032 2116 1256 7404
Jumlah 8790 4911 2715 16416
Sumber : fiktif
Tabel Kontingensi 2 x 3 ( b x k )
Tabel
Tabel Distribusi Frekuensi
Umur Mahasiswa di Universitas X
Umur Jumlah Mahasiswa

17 – 20 1.172
21 – 24 2.758
25 – 28 2.976
29 – 32 997
33 – 36 205
Jumlah 8.108
Sumber : fiktif
Ukuran Statistik
Ukuran-ukuran Statistik
Deskripsi Data secara

Numerik
Ukuran Pusat Lokasi Keragaman Bentuk
Arithmetic Mean Quartil Range Skewness

e
Median Decile Interquartile Range
Modus Percentile Variansi
Geometric Mean Standard Deviasi
Koefisien Variansi
Ukuran Tendensi Pusat
(Ukuran Pemusatan)
Ukuran Pemusatan
Arithmetic Mean Median Modus Geometric Mean
n
XG  ( X1  X 2    Xn )1/ n
X i
X i 1
n Nilai tengah Nilai yang
Rata-rata
Setelah data Paling sering
ukur
diurutkan muncul
Rata-rata
Hitung
(Ukuran Pemusatan)
Rata-rata Hitung (Mean)
 Arithmetic mean (seringkali hanya disebut mean) atau

rata-rata hitung adalah salah satu ukuran pusat data
 Untuk sampel ukuran n:
n
X i
X1  X 2    X n
X i 1

n n
Ukuran Sampel Nilai Observasi

(Ukuran Pemusatan)
 Seringkali dipakai sebagai ukuran untuk menentukan

ukuran pusat
 Mean = sum of values divided by the number of values
 Dipengaruhi nilai ekstrim (outliers)
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Mean = 3 Mean = 4
1  2  3  4  5 15 1  2  3  4  10 20
 3  4
5 5 5 5
(Ukuran Pemusatan)
Median
Median adalah suatu nilai data yang membagi dua sama
banyak kumpulan data yang sudah diurutkan menurut
nilainya, mulai dari nilai terkcil sampai terbesar.
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10
Median = 3 Median = 3
 Tidak dipengaruhi nilai ekstrim

(Ukuran Pemusatan)
Nilai median :

 X ( n 1) / 2 ; jika n ganjil
~ 
X  median  
 X n / 2  X ( n / 2 ) 1
 ; jika n genap
 2
(Ukuran Pemusatan)
Modus
 Salah satu ukuran pemusatan data
 Nilai yang sering muncul
 Tidak dipengaruhi nilai ekstrim
 Selain digunakan untuk data numerik juga digunakan
untuk data kategori
 Mungkin saja suatu data tidak punya modus tapi
mungkin juga punya beberapa modus
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6
Tidak ada Modus

Modus = 9
Review
 Lima rumah yang lokasinya berada di dekat pantai
$2,000 K
Harga rumah:
$2,000,000
500,000 $500 K
300,000
100,000 $300 K
100,000
Sum $3,000,000
$100 K
$100 K
Review:
Summary Statistik
House Prices:
 Mean: ($3,000,000/5)
$2,000,000 = $600,000
500,000
300,000
100,000
100,000
 Median: = $300,000
Sum $3,000,000
 Modus: = $100,000
Ukuran Statistik yang terbaik
 Mean secara umum sering digunakan, kecuali

ada nilai ekstrim(outliers)
 Median jarang digunakan,tapi jika ada nilai
ekstrim, maka Median adalah ukuran pusat
yang tepat
 Contoh: Median dari harga rumah seperti yang
sudah dicontohkan – tidak begitu sensitif
terhadap nilai yang ekstrim
Ukuran Lokasi
Lokasi Data
Quartile Decile Percentile

Ukuran Lokasi
Quartile / Kuartil
 Quartile membagi data yang sudah diurutkan
menjadi empat sama rata
25% 25% 25% 25%
Q1 Q2 Q3
 Quartile pertama, Q1= P25 merupakan nilai yang
mencakup 25 % data pertama
 Q2 sama dengan median (mencakup setangah data
pertama)
 Q3 = P75 mencakup 75% data pertama
Ukuran Lokasi
lokasi/letak kuartil :
 i( n  1 ) 
Qi  data ke   ; i  1,2 ,3
 4 
Lokasi kuartil pertama : Q1 = (n+1)/4
Lokasi kuartil kedua : Q2 = 2(n+1)/4 (letak median)
Lokasi kuartil ketiga : Q3 = 3(n+1)/4
dimana n adalah jumlah sampel

Ukuran Lokasi
Contoh: Menentukan Kuartil satu

Data Sampel yang sudah diurutkan : 11 12 13 16 16 17 18 21 22
 1( 9  1 ) 
Q1  data ke    data ke ( 2.5 )
 4 
 data ke 2  0.5  ( data ke 3  data ke 2 )
 12  0.5  ( 13  12 )  12.5
Q1 dan Q3 bukan merupakan ukuran pusat data

Q2 = median, ukuran pusat data
Ukuran Lokasi
Contoh:
Data Sampel setelah diurutkan : 11 12 13 16 16 17 18 21 22
 2(9  1) 
Q2  data ke    data ke (5)  16
 4 
 median
 3(9  1) 
Q3  data ke    data ke (7.5)
 4 
 data ke 7  0.5  (data ke 8  data ke 7)
 18  0.5  (21  18)  19.5
Ukuran Lokasi
Desil & Persentil

 Desil membagi data yang sudah diurutkan menjadi 10
bagian sama rata
 Persentil membagi data yang sudah diurutkan
menjadi 100 bagian sama rata
 i( n  1 ) 
Di  data ke   ; i  1,2 , ,9
 10 
 i( n  1 ) 
Pi  data ke   ; i  1,2 , ,99
 100 
Ukuran Keragaman Data
Keragaman
Data
Range Interquartile Variansi Standard Koeficien

Range Deviasi Variasi
Ukuran keragaman memberikan

informasi tentang penyebaran data
(penyimpangan data dari ukuran
pusatnya)
Ukuran pusat sama,

Variansi berbeda
Range
 Ukuran keragaman yang sederhana
 Selisih antara data terbesar dan data yang terkecil:
Range = Xmax – Xmin
Contoh
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Range = 14 - 1 = 13
Kerugian menggunakan Range
 Mengabaikan distribusi data
7 8 9 10 11 14 7 8 9 10 11 14
Range = 14 - 7 = 7 Range = 14 - 7 = 7
 Sensitif terhadap nilai ekstrim

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5
Range = 5 - 1 = 4
1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,150
Range = 150 - 1 = 149

Interquartile Range (jangkauan antar kuartil)
Digunakan untuk mengurangi problem data yang ekstrim
Interquartile range = Q3 – Q1
Contoh:
Median X
X Q1 Q3
(Q2) maximum
minimum
25% 25% 25% 25%
12 30 45 57 70
Interquartile range
= 57 – 30 = 27
Variansi
Rata-rata kuadrat penyimpangan data dari mean
Variansi Sampel:
n 2
n
 n

2
 i
(X  X )2
atau n X i2    X i 
 i 1 
S  i 1
S 2  i 1
n-1 n(n-1 )
Dimana : X = mean
n = ukuran sampel
Xi = Nilai data ke-i
Standard Deviasi
 Ukuran yang sering digunakan untuk menunjukkan

ukuran keragaman data
 Menunjukkan penyimpangan data dari mean
 Akar dari variansi
 Standard deviasi sampel : 2

S S
Contoh perhitungan
Data
Sampel (Xi) : 10 12 14 15 17 18 18 24
n=8 Mean = X = 16
(10  X )2  (12  X )2  (14  X )2    (24  X )2

S 
n 1
(10  16)2  (12  16)2  (14  16)2    (24  16)2


8 1
130 A measure of the “average” scatter

  4.3095 around the mean
7
Contoh perhitungan
(cara lain)
Data
Sampel (Xi) : 10 12 14 15 17 18 18 24
n8  X i  128  i  2178

X 2
2
n
 n

n X i2    X i  2
 i 1   8( 2178)  (128)
S 2  i 1  18.57143
n(n-1 ) 8(7)
S  S 2  18.57143  4.309458
Standard Deviasi kecil
Standard Deviasi besar

Membandingkan Standard Deviasi
Data A
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21
S = 3.338
Data B
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926
Data C
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21
S = 4.567
Koefisien Variasi
 Ukuran keragaman relatif

 Selalu dalam bentuk persentase (%)
 Menunjukkan variasi relatif terhadap mean
 Dapat digunakan untuk membandingkan dua atau
lebih data yang berbeda
 S 
CV     100%

 X 
Membandingkan Koefisien Variasi
 Stock A:
 Average price last year = $50
 Standard deviation = $5
 S  $5

CVA     100%   100%  10%
 $50
X  Kedua stocks
mempunyai
 Stock B:
standard
 Average price last year = $100 deviasi yang
 Standard deviation = $5 sama, tetapi
stock B
koefisien
 S  $5 variansi nya
CVB     100%   100%  5% lebih kecil
X  $100
Bentuk Distribusi Data
 Menggambarkan bagaimana bentuk distribusi data
 Ukuran Bentuk distribusi data:
Simetrik atau Miring
Left-Skewed Simetrik Right-Skewed

Mean < Median Mean = Median Median < Mean
Exploratory Data Analysis
Analisis Eksplorasi Data
 Pada dasawarsa tujuhpuluhan John Wilder Tukey

memelopori perubahan cara penanganan data, dari
sifat deskripsi saja menjadi bersifat lebih analitik
 Analisis eksplorasi data menggunakan dua alat, yaitu :

1. Diagram dahan-daun (stem-leaf diagram)
2. Tebaran Kotak Garis, disingkat TKG (boxplots)
Stem-Leaf Diagram
 Diagram dahan-daun adalah suatu cara mencatat
data secara tersusun.
 Diagram ini sangat berguna pada saat kita ingin
menyajikan data dalam bentuk gambar tentang
bentuk sebarannya tanpa kehilangan informasi nilai
numerik dari data.
 Penggunaan diagram dahan-daun memungkinkan
kita untuk mengelompokkan data sekaligus memberi
kita informasi visual; panjang tiap baris
memperlihatkan frekuensi tiap baris.
Contoh
61 77 59 33 44 51 11 28
54 40 42 70 42 40 51 46
58 47 42 54 64 54 39 66
25 67 44 17 13 69 13 12
46 63 46 46 53 64 57 48
Stem-Leaf Diagram
Stem-and -leaf of UTS N = 40

Leaf Unit = 1.0
4 1 1233
5 1 7
5 2
7 2 58
8 3 3
9 3 9
16 4 0022244
22 4 666678
28 5 113444
31 5 789
35 6 1344
38 6 679
39 7 0
40 7 7
Box Plot
 Box-and-Whisker Plot : Sebuah grafik data yang terdiri

5-informasi ringkasan data:
Minimum -- Q1 -- Median -- Q3 -- Maximum
Contoh
25% 25% 25% 25%
Minimum 1st Median 3rd Maximum

Minimum Quartile
1st Median Quartile
3rd Maximum
Quartile Quartile
Box-and-Whisker Plots
 Letak Q2 berada di tengah-tengah kotak menunjukkan

jika data berbentuk simetrik
Min Q1 Median Q3 Max
 A Box-and-Whisker dapat diplot secara vertical atau

horizontal
Bentuk Distribusi Data
(Box-and-Whisker Plot)
Left-Skewed Symmetric Right-Skewed
Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Explorasi Data Analysis
Berikut ini data beserta Box-and Whisker Plotnya:

Min Q1 Q2 Q3 Max
0 2 2 2 3 3 4 5 5 10 27
0
0 2233 55 27
27
Dari plot Box and Whisker di atas terlihat distribusi data
miring ke kanan
Boxplot
Kegunaan lain dari boxplots adalah kita dapat pula
mendeteksi ada atau tidaknya data pencilan (data
ekstrim). Data pencilan dideteksi dengan menggunakan
nialai-nilai Pagar Dalam (PD) dan Pagar Luar (PL). Nilai-
nilai pagar tersebut dihitung menggunakan rumus :
Q1 – 1.5 JAK Q1 – 3 JAK
PD PL
Q3 + 1.5 JAK Q3 + 3 JAK
Nilai data yang terletak antara PD dan PL dikategorikan
sebagai data pencilan dekat (), dan nilai data yang
terletak di luar PL dikategorikan sebagai data pencilan
jauh ().
Boxplot
Contoh :
n = 40
Q1 = 40
Q2 = 46.5
Q3 = 58.75
JAK = IQR = Q3 – Q1 =18.75

Q1 – 1.5 JAK = 11.875
PD
Q3 + 1.5 JAK = 86.875
Q1 – 3 JAK = -16.25
PL
Q3 + 3 JAK = 115
Boxplot
Q1 Q2 Q3 PD
PL PD PL
*
11
-16.25 11.875 40 46.5 58.75 86.875 115

Soal :
 Diperoleh data nilai ujian dari 80 mahasiswa sbb :

1. Bangunlah plot stem-and-leaf
2. Buatlah distribusi frekuensi relatifnya
3. Hitunglah mean, range, dan standar deviasi
sampel
4. Tentukan median dan modusnya
5. Apakah terdapat data outlier? Jelaskan!
Sekian dan Terima kasih
WASSLAMU’ALAIKUM WR.WB.

02 Statistika Deskriptif

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

02 Statistika Deskriptif

Diunggah oleh

Hak Cipta:

Format Tersedia

Statistika Deskriptif

PROBABILITAS DAN STATISTIKA

Bidang statistika yang membahas cara atau

1. Grafik / diagram, tabel

3. Analisis eksplorasi data (Exploratory Data

Jenis grafik / diagram antara lain :

Umur Mahasiswa Universitas X

Umur Mahasiswa Universitas X Umur Mahasiswa Universitas X

1. Grafik / diagram, tabel

3. Analisis eksplorasi data (Exploratory Data

Jenis tabel / daftar antara lain :

o Tabel Distribusi Frekuensi

Jumlah Pelajar di Daerah A

Jenis SD SMP SMA Jumlah

Umur Jumlah Mahasiswa

Deskripsi Data secara

Ukuran Pusat Lokasi Keragaman Bentuk

Arithmetic Mean Quartil Range Skewness

Modus Percentile Variansi

Geometric Mean Standard Deviasi

Arithmetic Mean Median Modus Geometric Mean

Rata-rata Hitung (Mean)

 Arithmetic mean (seringkali hanya disebut mean) atau

Ukuran Sampel Nilai Observasi

 Seringkali dipakai sebagai ukuran untuk menentukan

 Tidak dipengaruhi nilai ekstrim

Tidak ada Modus

 Lima rumah yang lokasinya berada di dekat pantai

 Mean secara umum sering digunakan, kecuali

Quartile Decile Percentile

25% 25% 25% 25%

Lokasi kuartil pertama : Q1 = (n+1)/4

Lokasi kuartil kedua : Q2 = 2(n+1)/4 (letak median)

Lokasi kuartil ketiga : Q3 = 3(n+1)/4

dimana n adalah jumlah sampel

Contoh: Menentukan Kuartil satu

Q1 dan Q3 bukan merupakan ukuran pusat data

Desil & Persentil

Range Interquartile Variansi Standard Koeficien

Ukuran keragaman memberikan

Ukuran pusat sama,

Range = Xmax – Xmin

 Mengabaikan distribusi data

 Sensitif terhadap nilai ekstrim

Range = 150 - 1 = 149

Interquartile Range (jangkauan antar kuartil)

Digunakan untuk mengurangi problem data yang ekstrim

 Ukuran yang sering digunakan untuk menunjukkan

 Standard deviasi sampel : 2

(10  X )2  (12  X )2  (14  X )2    (24  X )2

(10  16)2  (12  16)2  (14  16)2    (24  16)2

130 A measure of the “average” scatter

n8  X i  128  i  2178

Standard Deviasi kecil

Standard Deviasi besar

 Ukuran keragaman relatif

Left-Skewed Simetrik Right-Skewed

 Pada dasawarsa tujuhpuluhan John Wilder Tukey

 Analisis eksplorasi data menggunakan dua alat, yaitu :

Stem-and -leaf of UTS N = 40

 Box-and-Whisker Plot : Sebuah grafik data yang terdiri

Minimum -- Q1 -- Median -- Q3 -- Maximum

25% 25% 25% 25%