Anda di halaman 1dari 57

Statistika Deskriptif

PROBABILITAS DAN STATISTIKA


Statistika

Statistika Deskriptif
Bidang statistika yang membahas cara atau
metode mengumpulkan, menyederhanakan dan
menyajikan data sehingga bisa memberikan
Statistika
informasi yang berarti

Statistika Inferensial
Bidang statistika yang membahas cara-cara atau
metode menarik kesimpulan dan mengukur
keandalan kesimpulan tentang suatu populasi
berdasarkan informasi yang bersumber dari suatu
sampel
Pendahuluan

Statistika Deskriptif

Bidang statistika yang membahas cara atau


metode mengumpulkan, menyederhanakan
dan menyajikan data sehingga bisa
memberikan informasi yang berarti
Penyajian Data
Penggambaran / penyajian data dapat dilakukan dengan
menggunakan :

1. Grafik / diagram, tabel

2. Ukuran statistik

3. Analisis eksplorasi data (Exploratory Data


Analysis / EDA)
Grafik / Diagram
dan Tabel
Grafik / Diagram

Jenis grafik / diagram antara lain :

Diagram Batang
Diagram Garis
Diagram Pencar
Diagram Lingkaran
Grafik / Diagram

Umur Mahasiswa Universitas X

3500
3000
2500
2000
1500
1000
500
0
17 – 20 21 – 24 25 – 28 29 – 32 33 – 36

Umur Mahasiswa Universitas X Umur Mahasiswa Universitas X

3500
3000
2500 12% 3% 14% 17 – 20
2000 21 – 24

1500 25 – 28

1000 34% 29 – 32
37%
33 – 36
500
0
0 2 4 6
Penyajian Data
Penggambaran / penyajian data dapat dilakukan dengan
menggunakan :

1. Grafik / diagram, tabel

2. Ukuran statistik

3. Analisis eksplorasi data (Exploratory Data


Analysis / EDA)
Tabel

Jenis tabel / daftar antara lain :

o Tabel Kontingensi

o Tabel Distribusi Frekuensi


Tabel
Tabel Kontingensi

Jumlah Pelajar di Daerah A

Jenis SD SMP SMA Jumlah


Kelamin
Laki-laki 4758 2795 1459 9012
Perempuan 4032 2116 1256 7404
Jumlah 8790 4911 2715 16416
Sumber : fiktif

Tabel Kontingensi 2 x 3 ( b x k )
Tabel
Tabel Distribusi Frekuensi
Umur Mahasiswa di Universitas X

Umur Jumlah Mahasiswa


17 – 20 1.172
21 – 24 2.758
25 – 28 2.976
29 – 32 997
33 – 36 205

Jumlah 8.108
Sumber : fiktif
Ukuran Statistik
Ukuran-ukuran Statistik

Deskripsi Data secara


Numerik

Ukuran Pusat Lokasi Keragaman Bentuk

Arithmetic Mean Quartil Range Skewness


e
Median Decile Interquartile Range

Modus Percentile Variansi

Geometric Mean Standard Deviasi

Koefisien Variansi
Ukuran Tendensi Pusat
(Ukuran Pemusatan)

Ukuran Pemusatan

Arithmetic Mean Median Modus Geometric Mean

n
XG  ( X1  X 2    Xn )1/ n
X i
X i 1
n Nilai tengah Nilai yang
Rata-rata
Setelah data Paling sering
ukur
diurutkan muncul
Rata-rata
Hitung
Ukuran Tendensi Pusat
(Ukuran Pemusatan)

Rata-rata Hitung (Mean)

 Arithmetic mean (seringkali hanya disebut mean) atau


rata-rata hitung adalah salah satu ukuran pusat data
 Untuk sampel ukuran n:
n

X i
X1  X 2    X n
X i 1

n n

Ukuran Sampel Nilai Observasi


Ukuran Tendensi Pusat
(Ukuran Pemusatan)

 Seringkali dipakai sebagai ukuran untuk menentukan


ukuran pusat
 Mean = sum of values divided by the number of values
 Dipengaruhi nilai ekstrim (outliers)

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Mean = 3 Mean = 4

1  2  3  4  5 15 1  2  3  4  10 20
 3  4
5 5 5 5
Ukuran Tendensi Pusat
(Ukuran Pemusatan)

Median
Median adalah suatu nilai data yang membagi dua sama
banyak kumpulan data yang sudah diurutkan menurut
nilainya, mulai dari nilai terkcil sampai terbesar.

0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10

Median = 3 Median = 3

 Tidak dipengaruhi nilai ekstrim


Ukuran Tendensi Pusat
(Ukuran Pemusatan)

Nilai median :


 X ( n 1) / 2 ; jika n ganjil
~ 
X  median  
 X n / 2  X ( n / 2 ) 1
 ; jika n genap
 2
Ukuran Tendensi Pusat
(Ukuran Pemusatan)

Modus
 Salah satu ukuran pemusatan data
 Nilai yang sering muncul
 Tidak dipengaruhi nilai ekstrim
 Selain digunakan untuk data numerik juga digunakan
untuk data kategori
 Mungkin saja suatu data tidak punya modus tapi
mungkin juga punya beberapa modus

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6

Tidak ada Modus


Modus = 9
Review

 Lima rumah yang lokasinya berada di dekat pantai

$2,000 K
Harga rumah:

$2,000,000
500,000 $500 K
300,000
100,000 $300 K
100,000
Sum $3,000,000
$100 K

$100 K
Review:
Summary Statistik

House Prices:
 Mean: ($3,000,000/5)
$2,000,000 = $600,000
500,000
300,000
100,000
100,000
 Median: = $300,000
Sum $3,000,000
 Modus: = $100,000
Ukuran Statistik yang terbaik

 Mean secara umum sering digunakan, kecuali


ada nilai ekstrim(outliers)
 Median jarang digunakan,tapi jika ada nilai
ekstrim, maka Median adalah ukuran pusat
yang tepat
 Contoh: Median dari harga rumah seperti yang
sudah dicontohkan – tidak begitu sensitif
terhadap nilai yang ekstrim
Ukuran Lokasi

Lokasi Data

Quartile Decile Percentile


Ukuran Lokasi

Quartile / Kuartil
 Quartile membagi data yang sudah diurutkan
menjadi empat sama rata

25% 25% 25% 25%

Q1 Q2 Q3
 Quartile pertama, Q1= P25 merupakan nilai yang
mencakup 25 % data pertama
 Q2 sama dengan median (mencakup setangah data
pertama)
 Q3 = P75 mencakup 75% data pertama
Ukuran Lokasi

lokasi/letak kuartil :

 i( n  1 ) 
Qi  data ke   ; i  1,2 ,3
 4 

Lokasi kuartil pertama : Q1 = (n+1)/4

Lokasi kuartil kedua : Q2 = 2(n+1)/4 (letak median)

Lokasi kuartil ketiga : Q3 = 3(n+1)/4

dimana n adalah jumlah sampel


Ukuran Lokasi

Contoh: Menentukan Kuartil satu


Data Sampel yang sudah diurutkan : 11 12 13 16 16 17 18 21 22

 1( 9  1 ) 
Q1  data ke    data ke ( 2.5 )
 4 
 data ke 2  0.5  ( data ke 3  data ke 2 )
 12  0.5  ( 13  12 )  12.5

Q1 dan Q3 bukan merupakan ukuran pusat data


Q2 = median, ukuran pusat data
Ukuran Lokasi

Contoh:
Data Sampel setelah diurutkan : 11 12 13 16 16 17 18 21 22

 2(9  1) 
Q2  data ke    data ke (5)  16
 4 
 median

 3(9  1) 
Q3  data ke    data ke (7.5)
 4 
 data ke 7  0.5  (data ke 8  data ke 7)
 18  0.5  (21  18)  19.5
Ukuran Lokasi

Desil & Persentil


 Desil membagi data yang sudah diurutkan menjadi 10
bagian sama rata
 Persentil membagi data yang sudah diurutkan
menjadi 100 bagian sama rata
 i( n  1 ) 
Di  data ke   ; i  1,2 , ,9
 10 

 i( n  1 ) 
Pi  data ke   ; i  1,2 , ,99
 100 
Ukuran Keragaman Data
Keragaman
Data

Range Interquartile Variansi Standard Koeficien


Range Deviasi Variasi

Ukuran keragaman memberikan


informasi tentang penyebaran data
(penyimpangan data dari ukuran
pusatnya)

Ukuran pusat sama,


Variansi berbeda
Ukuran Keragaman Data

Range
 Ukuran keragaman yang sederhana
 Selisih antara data terbesar dan data yang terkecil:

Range = Xmax – Xmin

Contoh

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14

Range = 14 - 1 = 13
Kerugian menggunakan Range

 Mengabaikan distribusi data

7 8 9 10 11 14 7 8 9 10 11 14
Range = 14 - 7 = 7 Range = 14 - 7 = 7

 Sensitif terhadap nilai ekstrim


1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5

Range = 5 - 1 = 4

1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,150

Range = 150 - 1 = 149


Ukuran Keragaman Data

Interquartile Range (jangkauan antar kuartil)

Digunakan untuk mengurangi problem data yang ekstrim

Interquartile range = Q3 – Q1
Ukuran Keragaman Data

Contoh:

Median X
X Q1 Q3
(Q2) maximum
minimum
25% 25% 25% 25%

12 30 45 57 70

Interquartile range
= 57 – 30 = 27
Ukuran Keragaman Data

Variansi
Rata-rata kuadrat penyimpangan data dari mean
Variansi Sampel:
n 2
n
 n

2
 i
(X  X )2
atau n X i2    X i 
 i 1 
S  i 1
S 2  i 1
n-1 n(n-1 )

Dimana : X = mean
n = ukuran sampel
Xi = Nilai data ke-i
Ukuran Keragaman Data

Standard Deviasi

 Ukuran yang sering digunakan untuk menunjukkan


ukuran keragaman data
 Menunjukkan penyimpangan data dari mean
 Akar dari variansi

 Standard deviasi sampel : 2


S S
Contoh perhitungan

Data
Sampel (Xi) : 10 12 14 15 17 18 18 24

n=8 Mean = X = 16

(10  X )2  (12  X )2  (14  X )2    (24  X )2


S 
n 1

(10  16)2  (12  16)2  (14  16)2    (24  16)2



8 1

130 A measure of the “average” scatter


  4.3095 around the mean
7
Contoh perhitungan
(cara lain)

Data
Sampel (Xi) : 10 12 14 15 17 18 18 24

n8  X i  128  i  2178


X 2

2
n
 n

n X i2    X i  2
 i 1   8( 2178)  (128)
S 2  i 1  18.57143
n(n-1 ) 8(7)

S  S 2  18.57143  4.309458
Ukuran Keragaman Data

Standard Deviasi kecil

Standard Deviasi besar


Membandingkan Standard Deviasi

Data A
Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21
S = 3.338

Data B
Mean = 15.5
11 12 13 14 15 16 17 18 19 20 21 S = 0.926

Data C
Mean = 15.5

11 12 13 14 15 16 17 18 19 20 21
S = 4.567
Koefisien Variasi

 Ukuran keragaman relatif


 Selalu dalam bentuk persentase (%)
 Menunjukkan variasi relatif terhadap mean
 Dapat digunakan untuk membandingkan dua atau
lebih data yang berbeda

 S 
CV     100%

 X 
Membandingkan Koefisien Variasi

 Stock A:
 Average price last year = $50
 Standard deviation = $5
 S  $5

CVA     100%   100%  10%
 $50
X  Kedua stocks
mempunyai
 Stock B:
standard
 Average price last year = $100 deviasi yang
 Standard deviation = $5 sama, tetapi
stock B
koefisien
 S  $5 variansi nya
CVB     100%   100%  5% lebih kecil
X  $100
Bentuk Distribusi Data
 Menggambarkan bagaimana bentuk distribusi data
 Ukuran Bentuk distribusi data:
Simetrik atau Miring

Left-Skewed Simetrik Right-Skewed


Mean < Median Mean = Median Median < Mean
Exploratory Data Analysis
Analisis Eksplorasi Data

 Pada dasawarsa tujuhpuluhan John Wilder Tukey


memelopori perubahan cara penanganan data, dari
sifat deskripsi saja menjadi bersifat lebih analitik

 Analisis eksplorasi data menggunakan dua alat, yaitu :


1. Diagram dahan-daun (stem-leaf diagram)
2. Tebaran Kotak Garis, disingkat TKG (boxplots)
Stem-Leaf Diagram
 Diagram dahan-daun adalah suatu cara mencatat
data secara tersusun.
 Diagram ini sangat berguna pada saat kita ingin
menyajikan data dalam bentuk gambar tentang
bentuk sebarannya tanpa kehilangan informasi nilai
numerik dari data.
 Penggunaan diagram dahan-daun memungkinkan
kita untuk mengelompokkan data sekaligus memberi
kita informasi visual; panjang tiap baris
memperlihatkan frekuensi tiap baris.
Contoh

61 77 59 33 44 51 11 28

54 40 42 70 42 40 51 46

58 47 42 54 64 54 39 66

25 67 44 17 13 69 13 12

46 63 46 46 53 64 57 48
Stem-Leaf Diagram

Stem-and -leaf of UTS N = 40


Leaf Unit = 1.0

4 1 1233
5 1 7
5 2
7 2 58
8 3 3
9 3 9
16 4 0022244
22 4 666678
28 5 113444
31 5 789
35 6 1344
38 6 679
39 7 0
40 7 7
Box Plot

 Box-and-Whisker Plot : Sebuah grafik data yang terdiri


5-informasi ringkasan data:

Minimum -- Q1 -- Median -- Q3 -- Maximum

Contoh

25% 25% 25% 25%

Minimum 1st Median 3rd Maximum


Minimum Quartile
1st Median Quartile
3rd Maximum
Quartile Quartile
Box-and-Whisker Plots

 Letak Q2 berada di tengah-tengah kotak menunjukkan


jika data berbentuk simetrik

Min Q1 Median Q3 Max

 A Box-and-Whisker dapat diplot secara vertical atau


horizontal
Bentuk Distribusi Data
(Box-and-Whisker Plot)

Left-Skewed Symmetric Right-Skewed

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Explorasi Data Analysis

Berikut ini data beserta Box-and Whisker Plotnya:


Min Q1 Q2 Q3 Max

0 2 2 2 3 3 4 5 5 10 27

0
0 2233 55 27
27
Dari plot Box and Whisker di atas terlihat distribusi data
miring ke kanan
Boxplot
Kegunaan lain dari boxplots adalah kita dapat pula
mendeteksi ada atau tidaknya data pencilan (data
ekstrim). Data pencilan dideteksi dengan menggunakan
nialai-nilai Pagar Dalam (PD) dan Pagar Luar (PL). Nilai-
nilai pagar tersebut dihitung menggunakan rumus :
Q1 – 1.5 JAK Q1 – 3 JAK
PD PL
Q3 + 1.5 JAK Q3 + 3 JAK
Nilai data yang terletak antara PD dan PL dikategorikan
sebagai data pencilan dekat (), dan nilai data yang
terletak di luar PL dikategorikan sebagai data pencilan
jauh ().
Boxplot

Contoh :
n = 40
Q1 = 40
Q2 = 46.5
Q3 = 58.75

JAK = IQR = Q3 – Q1 =18.75


Q1 – 1.5 JAK = 11.875
PD
Q3 + 1.5 JAK = 86.875
Q1 – 3 JAK = -16.25

PL

Q3 + 3 JAK = 115
Boxplot

Q1 Q2 Q3 PD
PL PD PL

*
11

-16.25 11.875 40 46.5 58.75 86.875 115


Soal :

 Diperoleh data nilai ujian dari 80 mahasiswa sbb :


1. Bangunlah plot stem-and-leaf
2. Buatlah distribusi frekuensi relatifnya
3. Hitunglah mean, range, dan standar deviasi
sampel
4. Tentukan median dan modusnya
5. Apakah terdapat data outlier? Jelaskan!
Sekian dan Terima kasih
WASSLAMU’ALAIKUM WR.WB.

Anda mungkin juga menyukai