Data Dikotomi
Murni: Hidup – mati, surga – neraka,
laki – laki – wanita, dll.
Buatan: lulus – gagal, hitam – putih,
dll.
Data interval: data yang memiliki
rentang atau jarak yang sama
Data rasio: Data yang dinyatakan
dalam perbandingan
TENDENSI SENTRAL
• Nilai rata – rata (Mean): • Nilai Tengah (Median):
Rumus:
Rumus:
Biasa
Biasa
Dengan Frekuensi
Dengan Frekuensi
Keterangan:
Keterangan:
(jumlah data ke 1
sampai data ke-n ) Me = median
Lo = Batas bawah kelas
C = lebar kelas
(jumlah perkalian frekuensi dengan data) n = banyaknya data
n = banyaknya data F = jumlah frekuensi sebelum kelas
= jumlah frekuensi f = jumlah frekuensi kelas
• Modus = Nilai yang paling • Contoh Kasus:
1. Data hasil ujian akhir semester 4 untuk mata
sering muncul kuliah statistika adalah sebagai berikut: 40, 65,
Biasa 90, 65, 70, 55, 85, 65, 70, 35
Tentukanlah:
Mo = nilai yang paling sering a. Rata – rata nilai UAS
muncul b. Modus nilai UAS
Data berfrekuensi c. Median Nilai UAS
2. Data nilai UAS mahasiswa semester 4, untuk
mata kuliah STATISTIKA adalah sebagai berikut:
b1 4
Mod L0 c 138,5 9
b1 b2 47
i (n 1)
Qi Nilaiyangke i 1, 2,3
4
• Untuk data berkelompok
i, n Dimana:
4 F Lo= Batas bawah kelas kuartil
Qi L0 c , i 1, 2,3 c = Lebar kelas
f F = Jumlah frekuensi semua kelas
sebelum kelas kuartil Qi
f = Frekuensi kelas kuartil Qi
• DESIL
Jika sekelompok data dibagi menjadi 10 bagian yang
sama banyak, maka akan terdapat 9 pembagi,
masing – masing disebut nilai Desil (D), yaitu D1, D2,
…, D9
• Untuk data tidak berkelompok
i (n 1)
Di nilaiyangke , i 1, 2,3,...,9
10
• Untuk data berkelompok
i.n
10 F
Di L0 c , i 1, 2,3,...,9
f
Dimana: Lo = Batas bawah kelas desil Di
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas desil Di
f = Frekuensi kelas desil Di
• PERSENTIL
Jika sekelompok data dibagi menjadi 100 bagian
sama banyak, maka akan terdapat 99 pembagi, yang
masing – masing disebut persentil (P), yaitu P1,P2,P3,
…,P99. Nilai persentil ke-I, yaitu Pi dihitung dengan
rumus berikut.
i.n
100 F
Pi L0 c , i 1, 2,3,...,99
f
Dimana: Lo = Batas bawah kelas persentil Pi
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi
f = Frekuensi kelas persentil Pi
Contoh soal data tidak berkelompok
• Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
Maka:
i (n 1)
Qi nilaike , n 13
4
1(13 ke-
Q1=nilai ke- nilai 1) 1
3
4
= antara nilai ke 3 dan ke 4 2
= nilai ke 3 + ½ (nilai ke 4 – nilai ke 3)
= 40 + ½ (45-40)
= 40 + 2,5= 42,5
• Tentukan desil D3 dan D7 dari data gaji bulanan 13 karyawan
(dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
i (n 1)
Di nilaiyangke
Maka:
10
D3= nilai yang ke- 3(13 1)
= nilai ke – 1 10
4
5 (nilai ke 5 – nilai ke 4)
= nilai ke 4 + 1/5
= 45 + 1/5 (50-45)
= 45 + 1= 46
Contoh soal data berkelompok
• Misalkan modal (dalam jutaan rupiah) dari 40
perusahaan pada tabel distribusi frekuensi
berikut: Modal Frekuensi Tentukan:
a.Tentukan nilai kuartil
112 - 120 4 Q1, Q2 dan Q3
121 - 129 5 b. Tentukan desil D3 dan D8
c. Tentukan persentil P20
130 - 138 8 dan P 80
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
= 40
Penyelesaian Soal
• Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
Q1 terletak pada nilai ke 1(40 1)
10, 25
4
Nilai ke 10, 25 terletak pada interval kelas 130 – 138
Q2 terletak pada nilai ke 2(40 1)
20,5
Nilai ke 20, 5 terletak pada interval
4 kelas 139 – 147
Q3 terletak pada nilai ke 3(40 1)
30, 75
Nilai ke 30,75 terletak pada interval
4 kelas 148 – 156
Setelah diketahui interval kelas dari tiap – tiap kuartil yang dicari,
maka nilai kuartil dapat dicari dengan rumus.
i, n
4 F
Qi L0 c
f
i.n
10 F
Di L0 c
f
Untuk D3 terletak pada interval kelas 130 – 138, maka:
Lo = 129,5 F = 4+5= 9 f=8 c=9
Sehingga:
3(40)
10 9 12 9
D3 129,5 9 129,5 9 132,875
8 8
PENGUKURAN DISPERSI, KEMIRINGAN,
DAN KERUNCINGAN DATA
• DISPERSI DATA
Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu
kelompok data terhadap pusat data.
• Ukuran Dispersi yang akan dipelajari:
Jangkauan (Range)
Simpangan rata – rata (mean deviation)
Variansi (variance) Dispersi multak
Standar Deviasi (Standard Deviation)
Simpangan Kuartil (quartile deviation)
Koefisien variasi (coeficient of variation) Dispersi relatif
RANGE/ JANGKAUAN DATA (r)
• Range: Selisih nilai maksimum dan nilai minimum
Rumus:
Range (r) = Nilai max – nilai min
• Range untuk kelompok data dalam bentuk distribusi
frekuensi diambil dari selisih antara nilai tengah kelas
maksimun – nilai tengah kelas minimum
Simpangan Rata2/ Mean Deviation
(SR)
• Simpangan rata – rata: jumlah nilai mutlak dari
selisih semua nilai dengan nilai rata – rata, dibagi
banyaknya data.
• Rumus
• Untuk data tidak berkelompok
X X Dimana:
X = nilai data
SR
X = rata – rata hitung
n = Σf = jumlah frekuensi
n
2
VARIANSI/ VARIANCE ( s )
• Variansi adalah rata – rata kuadrat selisih atau
kuadrat simpangan dari semua nilai data terhadap
rata – rata hitung.
2
s = simbol untuk sample
2
= simbol untuk populasi
• Rumus untuk data tidak berkelompok
X X
2
S
2
n 1
f X X
2
S
2
n 1
STANDAR DEVIASI/ STANDARD
DEVIATION (S)
• Standar deviasi: akar pangkat dua dari variansi
• Rumus:
X X
Untuk data tidak berkelompok 2
S
2
n 1
Untuk data berkelompok
f X X
2
S
2
n 1
Contoh Soal
• Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
a. Range (r)
b. Simpangan Rata – rata (SR)
c. Variansi
d. Standar Deviasai
• Jawab:
a. Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60
b. Simpangan Rata – rata (SR):
X X
SR
n
20 50 30 70 80
X 50
5
n=5
20 50 50 50 30 50 70 50 80 50
SR
5
30 0 20 20 30 100
SR 20
5 5
2
• Variansi ( s )
X X
2
S
2
n 1
(20 50) 2
(50 50) 2
(30 50) 2
(70 50) 2
(80 50) 2
S2
5 1
900 0 400 400 900 2600
S2 650
4 4
S S 2
S
2
n 1
• Standar Deviasi
f X X
2
S
2
n 1
• Untuk memudahkan mencari jawaban, maka dibuat tabel
sesuai dengan keperluan jawaban
Nilai
Modal f Tengah X X f X X ( X X )2 f ( X X )2
(X)
112 - 120 4 116 24,525 98,100 601,476 2405,902
121 - 129 5 125 15,525 77,625 241,026 1205,128
130 - 138 8 134 6,525 52,200 42,576 340,605
139 - 147 12 143 2,475 29,700 6,126 73,507
148 -156 5 152 11,475 57,375 131,676 658,378
157 -165 4 161 20,475 81,900 419,226 1676,902
166 - 174 2 170 29,475 58,950 868,776 1737,551
Jumlah 40 455,850 8097,974
Maka dapat dijawab:
• Range (r) = 170 – 116 = 54
• Simpangan rata – rata
455,850
SR 11,396
40
• Variansi
8097,974 8097,974
S
2
207, 64
40 1 39
• Standar Deviasi
S 207, 64 14, 41
JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
• Jangkauan kuartil disebut juga simpangan kuartil, rentang
semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90
disebut juga rentang persentil 10-90
• Jangkauan kuartil dan jangkauan persentil lebih baik daripada
jangkauan (range) yang memakai selisih antara nilai
maksimum dan nilai minimun suatu kelompok data
• Rumus:
Jangkauan Kuartil:
1 Ket:
JK (Q3 Q1 ) JK: jangkauan kuartil
2 Q1: kuartil bawah/ pertama
Q3: kuartil atas/ ketiga
• Rumus Jangkauan Persentil
Rumus:
Ket:
S KV: Koefisien variasi
KV *100% S : Standar deviasi
X X : Rata – rata hitung
KOEFISIEN VARIASI KUARTIL
• Alternatif lain untuk dispersi relatif yang bisa digunakan jika
suatu kelompok data tidak diketahui nilai rata – rata
hitungnya dan nilai standar deviasinya.
• Rumus:
Q3 Q1 (Q3 Q1 ) / 2
KVQ atau KVQ
Q3 Q1 Med
NILAI BAKU
• Nilai baku atau skor baku adalah hasil transformasi antara
nilai rata – rata hitung dengan standar deviasi
• Rumus:
X1 X Nilai i = 1, 2, 3, …, n
Zi
S
Contoh Soal untuk Koefisien Variasi dan
Simpangan Baku
• Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata – rata
mampu menyala selama 1500 jam dengan simpangan baku
(standar deviasi) S1 = 275 jam, sedangkan lampu jenis B
secara rata – rata dapat menyala selama 1.750 jam dengan
simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya
paling baik?
Jawab: S1 275
KV *100% *100% 18,3%
Lampu jenis A: 1 X 1 1500
X X
Z
S
dengan nilai X adalah nilai UAS yang diperoleh Desi
• Untuk Mata Kuliah Statistika
X = 86 S = 10
Maka: X 78
86 78
Z 0,8
10
• Untuk Mata Kuliah Bahasa Inggris
X = 92 S = 18
Maka: X 84
92 84
Z
Karena nilai baku18 0,mata
(Z) untuk 4 kuliah Statistika lebih
besar dari B. Inggris, maka posisi Desi lebih baik pada mata
kuliah Statistika dari pada B. Inggris
KEMIRINGAN DATA
• Kemiringan: derajat/ ukuran dari
ketidaksimetrian (asimetri) suatu distribusi
data
• 3 pola kemiringan distribusi data, sbb:
– Distribusi simetri (kemiringan 0)
– Distribusi miring ke kiri (kemiringan negatif)
– Distribusi miring ke kanan (kemiringan positif)
• Beberapa metoda yang bisa dipakai untuk
menghitung kemiringan data, yaitu:
– Rumus Pearson
– Rumus Momen
– Rumus Bowley
• Rumus Pearson (α)
X Mod 3( X Med )
atau
S S
• Rumus tersebut dipakai untuk data tidak
berkelompok maupun data berkelompok.
– Bila α = 0 atau mendekati nol, maka dikatakan
distribusi data simetri.
– Bila α bertanda negatif, maka dikatakan distribusi
data miring ke kiri.
– Bila α bertanda positif, maka dikatakan distribusi
data miring ke kanan.
– Semakin besar α, maka distribusi data akan
semakin miring atau tidak simetri
RUMUS MOMEN ( 3 )
• Cara lain yang dipakai untuk menghitung
derajat kemiringan adalah rumus momen
derajat tiga, yaitu
• Untuk data tidak berkelompok:
3
(X X ) 3
3
nS
• Untuk data berkelompok
3 ( f ( X X ) 3
)
f S3
• Khusus untuk data berkelompok dalam bentuk
tabel distribusi frekuensi , derajat kemiringan
α3 dapat dihitung dengan cara transformasi
sebabai berikut:
c
fU fU
3
3
fU 3
fU 2
3 3 3
2
S n n n n
2
n fU ( fU )
2
S c
n(n 1)
4
(X X ) 4
4
nS
• Data Berkelompok
4
( f (X X ) ) 4
f *S 4
• Khusus untuk transformasi
4
c fU
4
fU fU fU fU fU
3 2 2 4
4 4 4
6
3
S n n n n n n
• Keterangan
– α4 = 3, distribusi data mesokurtis
– α4 > 3, distribusi data leptokurtis
– α4 < 3, distribusi data platikurtis
• Selain cara di atas, untuk mencari keruncingan
data, dapat dicari dengan menggunakan
rumus:
1 K= Koefisien Kurtorsis Persentil
(Q3 Q1 )
JK
K 2
P90 P10 P90 P10
• Keterangan
– K = 0,263 maka keruncingan distribusi data mesokurtis
– K > 0,263 maka keruncingan distribusi data leptokurtis
– K < 0,263 maka keruncingan distribusi data platikurtis
REGRESI DAN KORELASI
• Pada bab ini akan membahas dua bagian yang
saling berhubungan, khususnya dua kejadian
yang dapat diukur secara matematis.
• Dalam hal dua kejadian yang saling
berhubungan, ada dua hal yang perlu diukur
dan dianalisis, yaitu:
– Bagaimana hubungan fungsional (persamaan matematis)
antara dua kejadian tersebut -> analisis regresi
– Bagaimana kekuatan (keeratan) hubungan dua kejadian itu
-> analisis korelasi
REGRESI LINEAR SEDERHANA
• Garis regresi/ regresi: garis lurus/ garis linear
yang merupakan garis taksiran atau perkiraan
untuk mewakili pola hubungan antara variabel
X dan variabel Y.
• Cara untuk mencari persamaan garis regresi:
Dimana
^
Y a bX
Y = variabel terikat
X = variabel bebas
a = intersep (pintasan) bilamana X=0
b = koefisien arah (slope) dari garis regresi
• Koefisien regresi a dan b dapat dicari dengan
rumus:
a
Y . X X . XY
2
n. X ( X )
2 2
n. XY X . Y
b
n. X ( X )
2 2
Rumus lain untuk menghitung koefisien a dan b
adalah:
n. XY X . Y
b
n. X ( X )
2 2
a
Y X
b
n n
• Kita dapat membuat garis regresi lebih dari
satu dari suatu data. Lalu garis regresi
manakah yang paling baik??
• Garis regresi yang paling baik adalah garis
regresi yang mempunyai total kuadrat
kesalahan/ total kuadrat selisih/ total kuadrat
eror yang paling minimum.
• Total kuadrat eror dapat dihitung dengan:
^
e 2
(Y Y ) 2
n n
Selanjutnya bila diambil akarnya,
maka diperoleh:
^ Bentuk terakhir ini disebut
S^
(Y Y ) 2 Kesalahan baku dari penafsiran
Atau disebut juga
Standard error of estimate
yx n
S^
Y 2
a. Y b. XY
yx n
Nih….. Contoh Soal Regresi……
Berat 2 3 4 5 6 7 8
Badan
Tinggi 4 5 2 3 9 6 7
Badan
Y . X X . XY
2
n. XY X . Y
a b
n. X ( X )
2 2
n. X 2 ( X ) 2
Untuk mempermudah mencari nilai – nilai yang
diperlukan, maka akan digunakan tabel.
Berat 2 3 4 5 6 7 8 ∑X = 35
Badan (∑X) = 1225
(X)
Tinggi 4 5 2 3 9 6 7 ∑Y = 36
Badan
(Y)
X 4 9 16 25 36 49 64 ∑X = 203
XY 8 15 8 15 54 42 56 ∑XY = 198
Y 1,93 0, 64 X
hubungan dari variabel
X dan Y tadi…. Ngerti
kan????
b. Mencari nilai kesalahan baku dari penafsiran.
S^
(Y Y ) 2
yx n
Masukan nilai X ke dalam persamaan regresi untuk
mencari nilai Y regresi
Berat 2 3 4 5 6 7 8
Badan
(X)
Tinggi 4 5 2 3 9 6 7
Badan
(Y)
^ 3.21 3,85 4,49 5,13 5,77 6,41 7,05
Y
^ 0,79 1,15 -2,49 -2,13 3,33 -0,41 -0,05
Y Y
^
(Y Y )2
^ 0,6241 1,3225 6,2001 4,5369 11,0889 0,1681 0,0025
(Y Y ) 2
23,9431
^
X 4 = 5 -> Y4 1, 93 0, 64*5 1,93 3, 2 5,13
^
X 5 = 6 -> Y5 1,93 0, 64* 6 1,93 3,84 5, 77
^
Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan
linear, yaitu:
1.Parabola kuadrat
2.Parabola kubik Sekedar buat
3.Eksponen pengetahuan aja,,, ga
4.Geometrik dipelajari di bab ini…..
5.Logistik Tapi kalo mau,,
6.Hiperbola otodidak aja ya…
7.Gompertz
KOEFISIEN KORELASI
• Perumusan koefisien korelasi dilakukan
dengan memakai perbandingan antara variasi
yang dijelaskan dengan variasi total.
• Variasi total dari Y terhadap Y dirumuskan
oleh 2
(Y Y )
^ ^
•
(Y Y ) (Y Y ) (Y Y ) 2
2 2
r
(Y Y ) 2 pertama
(Y Y ) 2
Keterangan:
1. Nilai r = -1 disebut korelasi linear negatif
(berlawanan arah); artinya terdapat hubungan
negatif yang sempurna antara variabel X dan Y
2. Nilai r = 1 disebut korelasi linear positif (searah);
artinya terdapat hubungan positif yang sempurna
antara variable X dengan variabel Y
3. Nilai r = 0 disebut tidak berkorelasi secara linear,
artinya tidak ada hubungan antara variabel X dan Y
Koefisien korelasi dapat juga dicari dengan
rumus berikut:
Dimana:
2
S^ S ^2 = kuadrat dari kesalahan baku
y.x
r 1
y.x
Rumus r
S 2 kedua
S 2 (Y Y ) 2
y y = variansi Y
n
xy xX X
Dimana:
r
( x )( y 2 2
) y Y Y
Disebut juga koefisien korelasi
produk momen
Dari rumus terakhir, yaitu koefisien korelasi
produk momen (product momen formula)
Apabila kita ambil:
S xy
xy Merupakan kovarians dari X dan Y
n
Sx
x 2
Merupakan simpangan baku dari X
n
Sy
y 2
Merupakan simpangan baku dari Y
n
2
S y Merupakan variansi dari Y
Sx S y Ga usah khawatir…
sesuaikan aja sama data
yang diketahui….. OK?!!
n. XY X . Y
r
n. X 2
(
X ) 2
n. Y 2
(
Y ) 2
• Arti dari koefisien korelasi r adalah:
1.Bila 0,90 < r < 1,00 atau -1,00 < r < -0,90: artinya
hubungan yang sangat kuat
2.Bila 0,70 < r < 0,90 atau -0,90 < r < -0,70: artinya
hubungan yang kuat
3.Bila 0,50 < r < 0,70 atau -0,70 < r < -0,50: artinya
hubungan yang moderat
4.Bila 0,30 < r < 0,50 atau -0,50 < r < -0,30: artinya
hubungan yang lemah
5.Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0: artinya
hubungan yang sangat lemah
Contoh soalnya nih….
Biar lebih ngerti…….
Soalnya sama aja dengan yang regresi ya….
Berat 2 3 4 5 6 7 8
Badan
Tinggi 4 5 2 3 9 6 7
Badan
Tentukanlah:
1.Koefisien korelasi (r) dan artinya
2.Koefisien determinasi dan artinya
Jawab:
Berat 2 3 4 5 6 7 8 ∑X = 35
Badan (∑X) = 1225
(X)
Tinggi 4 5 2 3 9 6 7 ∑Y = 36
Badan (∑Y) = 1296
(Y)
X 4 9 16 25 36 49 64 ∑X = 203
XY 8 15 8 15 54 42 56 ∑XY = 198
Y 16 25 4 9 81 36 49 ∑Y = 220
7 *198 35*36
r
7 * 203 1225 7 * 220 1296
Truz….
1368 1260
r
1421 1225 1540 1296
108
r
196* 244
108
r
47824
108 108
r 0, 49
47824 218, 69
Kesimpulannya….????
Oleh karena, nilai r = 0,49 terletak antara 0,30
dan 0,50 maka terdapat hubungan positif yang
lemah antara tinggi badan dan berat badan.
Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X)
Mahasiswa oleh persamaan regresi ^ adalah
Y 1, 93 0, 64 X
Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.
TUGAS 2
• Data pada suatu pabrik kertas menunjukkan
bahwa banyaknya mesin yang rusak ada
hubungannya dengan kecepatan beroperasi
mesin cetak. Tergambar pada tabel di bawah
ini.
Kecepatan mesin 8 9 10 11 12 13 15 16
permenit
Jumlah kerusakan 6 7 8 5 7 10 12 9
kertas (lembar)
• Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika
kecepatan mesin permenit adalah 18?
3. Tentukan kesalahan baku yang diberikan oleh
persamaan regresi!
4. Tentukanlah koefisien korelasi dan koefisien
determinasi data tersebut serta berikan artinya
masing – masing!
Deadline…
Next week…
Don’t be late
OK!!!!
STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009
Kecepatan mesin 7 8 9 10 11 12 14 15
permenit
Jumlah kerusakan 5 6 7 4 6 9 11 8
• kertas (lembar)
Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin
permenit adalah 20?