Anda di halaman 1dari 57

SIMPUL

DATA

TERY N TIM
OUTLINE
 Ukuran tengah (mean,median, mode)
 Ukuran sebaran, variasi (range, mean dev, varian, SD, COV)
 Ukuran posisi (median, quartile, percentile, dan decile)
 Hubungan mean, median, dan mode (skewness & kurtosis)
 Proporsi / persentase
 Data yang sudah terkumpul dari
lapangan  selain diolah dan
dianalisis  perlu
diinterpretasikan

 Untuk dapat menganalisis data


angka  perlu disusun secara
sistematik

 Jika data banyak observasi 


untuk memudahkan: data
disusun dalam distribusi
frekuensi / tabel frekuensi
DISTRIBUSI FREKUENSI
Susunan data angka menurut besarnya (kuantitas)
atau menurut kategorinya (kualitas)

Distribusi frekuensi kuantitatif


 Susunan data angka menurut besarnya
 Contoh: data BB, TB, Hb, kadar kolesterol

Distribusi frekuensi kualitatif


 Susunan data menurut kategorinya
 Contoh: data jenis pekerjaan, jenis kelamin,
pendidikan, status perkawinan
PENGUKURAN
STATISTIK
Ukuran Sentral:
a. Mean atau Arithmetic Mean
b. Median
c. Modus

Ukuran Variasi:
d. Range (min-max)
e. Mean Deviasi
f. Varian
g. Standar deviasi
h. Coefisien Variasi

Ukuran Posisi:
i. Median
j. Kuartil, Desil, Persentil
UKURAN TENGAH
 Nama lain: nilai pusat / nilai tengah / central tendensi / tendensi
sentral
 Pada umumnya, data kita akan menunjukkan kecenderungan
(tendensi) sentral pada nilai tertentu
 Dalam statistik, tendensi sentral digunakan untuk menggambarkan
karakteristik umum dari data
 Nilai yang biasanya digunakan untuk mewakili data

 Ukuran yang umum digunakan:


 Rata-rata / Rerata
 Median
 Modus
KONSEP UMUM

 Jika kita ditanya:


“Bagaimana hasil ujian
mahasiswa ?”

 Kita tidak akan menjelaskan


satu persatu nilai
mahasiswa  terlalu ruwet

 Pada umumnya kita akan


menjawab: “Lumayan, rata-
ratanya 60”
KONSEP UMUM
 Pada percakapan sehari-hari, kita memahami arti
“rata-rata 60”  sebagian besar mahasiswa
memperoleh nilai sekitar 60

 SEBAGIAN BESAR BUKAN SEMUA


 Nilai rata-rata digunakan untuk menggambarkan
nilai sebagian besar/umumnya dari mahasiswa
 Ada mahasiswa yg memperoleh nilai di bawah dan di atas
rata-rata
 Rata-rata hitung / arithmatic mean / mean
 Ukuran pemusatan data yang paling sering digunakan
 Pembagian mean lainnya: Jarang dipakai
Harmonic mean di biostatistika
1.

 Geometric mean

RAT  Arithmetic mean

A-  Sangat mudah untuk dihitung  jumlahkan semua nilai


RAT kemudian dibagi dengan jumlah subyek
A
x1 + x2 + x3 +...+ xn
n

(ME x= x
i 1
i
x=
AN) n n
Contoh:
 Lama rawat 10 pasien (hari)

 Data: 2, 3, 4, 2, 3, 5, 3, 6, 3, 4
 Nilai Mean=(2+3+4+2+3+5+3+6+3+4)/10 = 3,5 hari
1.
RAT  Lama rawat 10 pasien (hari)
Data: 2, 3, 4, 2, 3, 5, 3, 31 , 3, 4
A-

 Nilai Mean=(2+3+4+2+3+5+3+31+3+4)/10 = 6,0 hari


RAT
A Sifat nilai Mean
Merupakan wakil dari keseluruhan nilai
(ME


 Proses perhitungannya melibatkan semua data/pengamatan
AN) 
 Sangat sensitif terhadap nilai ekstrim (kecil atau besar)
 Bila terhadap seluruh data ditambah dengan konstanta c
yaitu yi=xi+c, i=1,2…..n maka mean y=mean x + c
 Contoh: Lama rawat 10 pasien (hari)
 Data: 2, 3, 4, 2, 3, 5, 3, 6, 3, 4 dan Mean 3.5 hari
1.  Masing-masing ditambah dengan angka 2
 Data: 4, 5, 6, 4, 5, 7, 5, 8, 5, 6 dan Mean 5.3 atau (3.5+2) hari
RAT
A-
RAT  Bila terhadap seluruh data dikalikan dengan konstanta c
A yaitu yi=cxi i=1,2…..n maka mean y=(mean x)(c)
 Data: 2, 3, 4, 2, 3, 5, 3, 6, 3, 4 dan Mean 3.5 hari
(ME  Masing-masing dikali dengan angka 2
AN)  Data: 4, 6, 8, 4, 6, 10, 6, 12, 6, 8 dan Mean 7 atau (3.5x2) hari
 Nilai tengah / nilai letak
 Nilai yang terletak pada observasi yang ditengah, kalau datanya
telah disusun (array)

2.  Nilai membagi dua data yang telah diurutkan menjadi jumlah yang
sama (dua bagian), yaitu 50% data berada di bawah nilai median
ME dan 50% data berada di atas nilai median
DIA
N Proses perhitungannya
(ME 1. Mengurutkan data dari terkecil ke terbesar
D) 2. Nilai Median adalah nilai pada posisi median
3. Menentukan posisi median yaitu (n+1)/2
2. MEDIAN (MED)
CONTOH

 Urutkan ke 11 subyek tsb, mulai dari umur terkecil ke umur terbesar


2. MEDIAN (MED)
PERHITUNGAN MEDIAN
2. MEDIAN (MED) MEDIAN JIKA JUMLAH SUBYEK
GENAP
 Median adalah rata-rata dari 2 nilai tengah pada data yg
telah diurutkan
16

2. MEDIAN (MED)

Contoh: Lama rawat 10 pasien (hari)

Data: 2, 3, 4, 2, 3, 5, 3, 6, 3, 4 Tidak terpengauh
 Di urutkan menjadi: 2,2,3,3,3, 3,4,4,5,6 oleh nilai ekstrim
 Posisi median (10+1)/2=5.5 (kecil atau besar)
 Nilai median adalah (3+3)/2= 3 hari


Contoh: Lama rawat 10 pasien (hari)

Data: 2, 3, 4, 2, 3, 5, 3, 31 , 3, 4
 Diurut: 2 2 3 3 3 3 4 4 5 31

 Posisi Median: di urutan 5,5 Posisi median


 Nilai Median: (3+3)/2 = 3 hari
3. MODUS (MODE)
 Nilai yang paling sering muncul
 Pada 1 data dapat memiliki 1 atau lebih modus
 Juga mungkin tidak ada modus pada satu data
 Secara kuantitatif nilai yang paling banyak muncul atau
frekuensi paling besar atau nilai pada posisi puncak suatu
kurva/grafik histogram

Proses perhitungannya
 Mengurutkan data dari terkecil ke terbesar (mempermudah)
 Satu modus (unimodal), dua modus (bimodal), lebih dari tiga
modus (multimodal)
 Tidak ada modus
3. MODUS (MODE) CONTOH

Modus = 18
 Contoh:
 Data: 2, 3, 4, 2, 3, 5, 3, 6, 3, 4, Mod=3
 Data: 2, 3, 4, 2, 3, 5, 3, 2, 3, 2, Mod=2 dan 3
 Data: 2, 3, 4, 5, 6, 7, 8, 9, Tidak ada Modus
HUBUNGAN EMPIRIS MEAN, MEDIAN DAN
MODUS

Simetris ‘Skewness’ positif

Miring ke kanan

Mean=Med=Mod Mod Md Mean

‘Skewness’ negatif

• Mean=Median=Modus simetris
• Modus<Median<Mean ‘Skewness’ Positif
• Mean<Median<Modus ‘Skewness’ Negatif

•Modus>Median>Mean ….miring ke kiri


Mean Med Mod
19
HUBUNGAN EMPIRIS MEAN, MEDIAN DAN MODUS

 Pada distribusi simetris, ketiga nilai ini sama besarnya


 Nilai Median selalu berada di tengah antara nilai mean dan modus pada
distribusi menceng
 Apabila nilai mean lebih besar dari nilai median dan modus, maka
dikatakan distribusi menceng kanan
 Apabila nilai mean lebih kecil dari nilai median dan modus, maka dikatakan
distribusi menceng kiri
KELEBIHAN DAN KEKURANGAN MEAN, MEDIAN DAN MODUS

Kelebihan Kekurangan
Mean
Mempertimbangkan semua nilai Sensitif /peka terhadap nilai ekstrim
Dapat menggambarkan mean populasi Kurang baik untuk data heterogen
Cocok untuk data homogen

Median
Tidak sensitif /peka terhadap nilai ekstrim Tidak mempertimbangkan semua nilai
Cocok untuk data heterogen /homogen Kurang dapat menggambarkan mean
pop

Modus
Tidak sensitif /peka terhadap nilai ekstrim Tidak mempertimbangkan semua nilai
Cocok untuk data homogen/heterogen Kurang menggambarkan mean populasi
Modus bisa lebih dari satu atau tidak ada
UKURAN LETAK / POSISI DATA

Median (membagi 2)
Kuartil (membagi 4)
 Desil (membagi 10)
 Persentil (membagi 100)

Pembagian pengamatan dari data yang kita susun mulai dari data terkecil hingga
terbesar
1. MEDIAN Pembagian pengamatan menjadi dua, nilai median merupakan nilai
pengamatan pada posisi paling tengah kalau data itu disusun (array)

Median

K1 K2 K3

D1 D9
P10 P25 P75 P90
1. KUARTIL 

Kuartil membagi data menjadi 4 (empat) bagian yang sama
K1 (25%), K2 (50%) dan K3 (75%)
 Kuartil 1 disimbol K1 merupakan 25% data ada di bawah atau sama dengan nilai K1.


Posisi kuartil  Ki= i (n+1)/4
i=1,2,3 n= jml pengamatan

Nilai kuartil (berada pd 1 titik)  Nilai pada posisi tsb


 Contoh
 Data: 3 2 4 5 6 6 5 7 8 8 6 10 11 9 12
 Urutkan: 2 3 4 5 5 6 6 6 7 8 8 9 10 11 12

 Posisi K1 adalah 1x (15+1)/4= 4 ada di posisi ke-4


 Nilai K1=5

 Posisi K2 adalah 2x (15+1)/4=8 ada di posisi ke-8


 Nilai K2=6

 Posisi K3 adalah 3x (15+1)/4=12 ada di posisi ke-12


 Nilai K3=9
1. KUARTIL Nilai kuartil (posisi median berada antara 2 titik)

 Contoh
 Data: 3 2 4 5 6 6 5 7 8 8 6 10 11 9
 Urutkan: 2 3 4 5 5 6 6 6 7 8 8 9 10 11

 Posisi K1 adalah 1x (14+1)/4=3.75 ada diantara posisi 3 dan 4


 Nilai K1 = (4 + 5) / 2 =4. 5

 Posisi K2 adalah 2x (14+1)/4=7.5 ada diantara posisi 7 dan 8


 Nilai K2 = (6 + 6) / 2 = 6

 Posisi K3 adalah 3x (14+1)/4=11.25 ada diantara posisi 11 dan


12
 Nilai K3 = (8 + 9) / 2 = 8.5
26

2. DESIL  Desil membagi data menjadi 10 (sepuluh) bagian yang sama


 D1, D2, ……. , D9

Posisi  Di= i (n+1)/10, i=1,2,3,4,5,6,7,8,9
 Nilai desil (jika posisi desil berada antara 2 titik)
 Di= x1 + [ posisi,?? (x2-x1) ]?? = desimal

 Contoh
 Data: 3 2 4 5 6 6 5 7 8 8 6 10 11 9
 Urutkan: 2 3 4 5 5 6 6 6 7 8 8 9 10 11

 Posisi D1 adalah 1 x (14+1)/10=1.5 ada diantara posisi 1 dan 2


 Nilai D1=2 + 0.5 (3-2)=2.5

 Posisi D5 adalah 5 x (14+1)/10=7.5 ada diantara posisi 7 dan 8


 Nilai D2=6 + 0.5 (6-6)=6

 Posisi D7 adalah 7 x (14+1)/10=10.5 ada diantara posisi 10 dan 11


 Nilai D7=8 + 0.5 (8-8)=8
27

2. DESIL Contoh
 Data: 3 2 4 5 6 6 5 7 8 8 6 10 11 9 12
 Urutkan: 2 3 4 5 5 6 6 6 7 8 8 9 10 11 12

 Posisi D1 adalah 1 x (15+1)/10=1.6 ada diantara posisi 1 dan 2


 Nilai D1=2 + 0.6 (3-2)=2.6

 Posisi D5 adalah 5 x (15+1)/10=8 ada di posisi 8


 Nilai D5=6

 Posisi D7 adalah 7 x (15+1)/10=11.2 ada diantara posisi 11 dan 12


 Nilai D7=8 + 0.2 (9-8)=8.2
28

3. PERSENTIL  Persentil membagi data menjadi 100 (seratus) bagian yang


sama
 P1, P2, ……. , P99
 Pi= i (n+1)/100, i=1,2, ………, 99

Contoh
 Data: 3 2 4 5 6 6 5 7 8 8 6 10 11 9
 Urutkan: 2 3 4 5 5 6 6 6 7 8 8 9 10 11

 Posisi P50 adalah 50 x (14+1)/100=7.5 ada diantara posisi 7 dan


8
 Nilai P50=6 + 0.5 (6-6)=6

 Posisi P75 adalah 75 x (14+1)/100=11.25 ada diantara posisi 11


dan 12
 Nilai P75=8 + 0.25 (9-8)=8.25
UKURAN VARIASI DATA
 Nama lain: deviasi

 Nilai yang menunjukkan bagaimana


bervariasinya data di dalam
 Ukuran Variasi Mutlak kelompok data itu terhadap rata-
Range (min-max) ratanya
Mean Deviasi
 Semakin besar nilai variasi 
Varian
semakin bervariasi pula datanya
Standar Deviasi
 Selain tendensi sentral, kita juga
 Ukuran Variasi Relatif perlu mengukur variasi pada data
Koefisien variasi (CoV)
 Data dengan rata-rata & median yg
sama tidak menjamin datanya
sama  variasinya mungkin
berbeda  perlu pengukuran
variasi
UKURAN VARIASI DATA
 Contoh: Lama rawat 10 pasien (hari) di Dua RS
 RS A: 2,2,3,3,3,3,4,4,5,6 maka nilai Mean=3.5 hari, median 3 hari
 RS B: 1,1,2,3,3,3,4,5,5,8 maka nilai Mean=3.5 hari , median 3 hari

 RS A dan RS B mempunyai nilai Mean yang sama tetapi mempunyai


variasi data yang berbeda
 Range RS-A = 2 sd 6 hari dan RS-B = 1 sd 8 hari
 SD RS A= 1.27 hari dan SD RS B=2.12 hari

 Bila hanya menampilkan informasi ukuran pemusatan data (misalnya


Mean) ternyata ada informasi yang hilang tanpa mengikutsertakan
ukuran variasi data
1. RANGE (KISARAN)
 Ukuran variasi data yang paling sederhana dibandingkan dengan
Mean Deviasi dan Standar Deviasi

 Proses perhitungannya:
 Urutkan data dari terkecil ke terbesar
 Nilai Range adalah selisih dari data terbesar terhadap data
terkecil

 Contoh: Lama rawat 10 pasien (hari) di Dua RS


 RS A: 2,2,3,3,3,3,4,4,5,6 maka nilai Range=4 hari
 RS B: 1,1,2,3,3,3,4,5,5,8 maka nilai Range=7 hari

 Nilai range juga sensitif terhadap nilai-nilai ekstrim besar atau kecil
32

2. MEAN DEVIASI
 Rata-rata Penyimpangan (Mean Deviasi) dalam harga mutlak dari
masing-masing pengamatan terhadap nilai Mean-nya

x i x 
Md 
N
 Contoh: Lama rawat 10 pasien (hari) di Dua RS
 RS A: 2,2,3,3,3,3,4,4,5,6 dengan nilai mean=3.5 hari
 RS A: (|2-3.5|+|2-3.5|+|3-3.5|+|3-3.5|+|3-3.5|+|3-3.5|+|4-3.5|+|4-3.5|
+|5-3.5|+|6-3.5|)/10 = 1 hari
 RS A: (1,5+1,5+0.5+0.5+0.5+0.5+0.5+0.5+1.5+2.5)/10 = 1 hr

 RS B: 1,1,2,3,3,3,4,5,5,8 dengan nilai mean=3.5 hari


 RS B: (|1-3.5|+|1-3.5|+|2-3.5|+|3-3.5|+|3-3.5|+|3-3.5|+|4-3.5|+|5-3.5|
+|5-3.5|+|8-3.5|)/10 =1.6 hari

 Mean deviasi juga sensitif terhadap nilai-nilai ekstrim besar


atau kecil
3. VARIANS
(Standar Deviasi)2 = Varians
 Rata-rata perbedaan antara mean dengan nilai
masing-masing observasi
 Rata-rata kuadrat Penyimpangan dari masing-masing
pengamatan terhadap nilai Mean-nya

 Rumus Varians

  x  x
2
i

V
n 1

33
4. STANDAR DEVIASI
 Akar dari varian
 Ukuran variasi data yang paling sering digunakan

 Disebut “simpangan baku” karena sebagai patokan luas area di

bawah kurva normal


 Lebih menggambarkan variasi data yang sesungguhnya

dibandingkan Range & mean deviasi

 Rumus Standar Deviasi Sampel


 Rumus Standar Deviasi Populasi

  x  x
n

x 
n 2
2
i x i
i 1
SD = i 1
SD =
n 1 N

34
4. STANDAR DEVIASI
(Standar Deviasi)2 = Varians
 Contoh: Lama rawat 10 pasien (hari) di RS-A
 Lama rawat: 2,2,3,3,3,3,4,4,5,6 dengan nilai mean=3.5 hari
 Varians: (2-3.5)2+(2-3.5)2+(3-3.5)2+(3-3.5)2+(3-3.5)2+(3-3.5)2+(4-
3.5)2+(4-3.5)2+(5-3.5)2+(6-3.5)2/10-1 = (1,5876)
 SD: (1,52+1,52+0.52+0.52+0.52+0.52+0.52+0.52+1.52+2.52)/9 = 1,269 hari
 RS B: 1,1,2,3,3,3,4,5,5,8 = SD = 2,121 hari

35
CONTOH
 Perhitungan rata-rata:

Rata-rata=55
CONTOH
 Coba perhatikan nilai para mahasiswa
 Tidak semua mahasiswa memiliki nilai yang sama
dengan rata-ratanya
 Hitunglah perbedaan nilai tiap mahasiswa dg nilai rata-
ratanya
CONTOH

 Sebagai contoh mahasiswa no. 1, simpangan nilainya terhadap


nilai rata-rata adalah 46-55 = -11
CONTOH

 Jika
kita jumlahkan semua simpangan, hasilnya adalah
NOL dan selalu NOL
CONTOH
 Jika tiap simpangan dikuadratkan & dijumlahkan  jumlah
simpangan kuadrat
CONTOH

 Jumlah simpanga kuadrat dibagi jumlah mahasiswa  rata-rata simpangan kuadrat


(VARIANS)
 354/10 = 35.4  Varians nilai mahasiswa
CONTOH
 Hitung akar dari varians
 Dari rata-rata simpangan kuadrat  diakarkan  rata-
rata simpangan (SIMPANG BAKU)
 Pada contoh √35.4 =5.95
VARIANS & SIMPANG BAKU
 Varians mengukur rata-rata simpangan kuadrat dari nilai tiap
subyek terhadap nilai rata-ratanya

 Pada perhitungan, kita menggunakan pembagi n-1 bukan n


karena:
 Dlm penelitian kita selalu menggunakan sampel  penggunaan n-1
mencegah bias (underestimate bias) perhitungan varians

 Simpang baku adalah rata-rata simpangan dari nilai tiap subyek


terhadap nilai rata-ratanya
VARIANS & SIMPANG BAKU

 x  x 
2
i
Variance( 2 )  i 1
n 1
n

 x  x 
2
i
S tan dard deviation( )  Variance  i 1

n 1
5. COEFISIEN OF VARIANS (COV)  Coefisien Variasi (COV)
 Koefisien variasi adalah rasio perbandingan antara standar deviasi
dengan mean, yang dinyatakan dalam persen
 Kegunaan: perbandingan variasi antara 2 pengamatan atau lebih
 Membandingkan variasi dua kelompok data yang mempunyai unit
atau satuan pengukuran atau gradasi yang berbeda
 Nilai yang lebih besar  menunjukkan adanya variasi pengamatan
yang lebih besar

 Rumus
SD
COV = x100%
x
 Contoh:
 Mean BB=40.5 kg, SD=5 kg maka COV=(5/40.5)x100% =12.3%
 Mean TB=167 cm, SD=12 cm maka COV=(12/167) x 100%=7.2%

45
KEMIRINGAN DISTRIBUSI DATA
(SKEWNESS)

Simetris ‘Skewness’ 0 ‘Skewness’ positif

Mean=Med=Mod Mod Md Mean

‘Skewness’ negatif
Pearson

x  Mod 3( x  Med )
= atau
SD SD
Mean Med Mod
46
DIFFERENT SHAPES OF
DISTRIBUTION

Source: http://faculty.vassar.edu/lowry/f0204.gif
SKEWNESS OF DISTRIBUTIONS

Source: http://www.polity.org.za/html/govdocs/reports/aids/images/image022.gif
Distribution of posting frequency on Usenet
HISTOGRAM
 Moderately Skewed Left
 A longertail to the left
 Example: exam scores

.35
.30
Relative Frequency

.25
.20
.15
.10
.05
0
HISTOGRAM
 Moderately Right Skewed
 A Longertail to the right
 Example: housing values

.35
.30
Relative Frequency

.25
.20
.15
.10
.05
0
HISTOGRAM
 Highly Skewed Right
 A very
long tail to the right
 Example: executive salaries

.35
.30
Relative Frequency

.25
.20
.15
.10
.05
0
KERUNCINGAN DISTRIBUSI DATA
(KURTOSIS)


y 4
( x  x)
4  i
4
nSD
Mesokurtis = 4 = 3
Leptokurtis= 4 >3

Platykurtis = 4 < 3

53
TERIMA KASIH

Anda mungkin juga menyukai