Anda di halaman 1dari 83

STATISTIKA

PENGERTIAN
Statistika

Ilmu tentang pengumpulan data


Klasifikasi Data
Penyajian Data
Pengolahan Data
Penarikan Kesimpulan
Pengambilan keputusan

Populasi: Himpunan
keseluruhan dari objek
pengamatan
Sample: Bagian dari populasi
Data: Informasi atau fakta yang
tertuang dalam angka atau
bukan angka

Deskriptif: Metode untuk


mendeskripsikan,
menggambarkan, menjabarkan,
atau menguraikan data
Inferensia: Penarikan
kesimpulan dari sample untuk
menjelaskan isi dari populasi

JENIS JENIS DATA

Data
Data
Data
Data

mentah
primer
sekunder
Kuantitatif

Data Diskrit
Data Kontinyu

Data Diskrit:

Civitas UMMI

o Data Nominal
o Daata Ordinal
o Data Dikotomi

Mahas
iswa

o Data Kualitatif
o Parameter: Kualitas
Pengukuran sample

Pega
wai

CONTOH CONTOH

Populasi dan Sample


Civitas akademik Universitas
Muhammadiyah Sukabumi terdiri dari
dosen, mahasiswa dan staff pekerja
lainnya yang berjumlah 1200 orang

sample

Populasi

Deskriptif
Nilai UAS mahasiswa Teknik
Informatika semester 4 untuk mata
kuliah Statistika adalah dengan nilai
rata rata 65

Dose
n

Data Nominal
Jumlah lulusan mahasiswa Universitas
Muhammadiyah Sukabumi tahun 2008

Program
Studi

Jumlah

Teknik
Informatik

25 orang

Kimia

5 orang

SDPK

4 orang

Data Ordinal
Kategori hasil nilai akhir Mata Kuliah
Statistika
Kategori
Nilai

Jumlah

Istimewa

10 orang

Baik

12 orang

Cukup

20 orang

Kurang

7 orang

Kurang sekali

3 orang

Data Dikotomi
Murni: Hidup mati, surga
neraka, laki laki wanita, dll.
Buatan: lulus gagal, hitam
putih, dll.

Data interval: data yang


memiliki rentang atau jarak
yang sama
Data rasio: Data yang
dinyatakan dalam perbandingan

TENDENSI SENTRAL
Nilai rata rata (Mean):
Rumus:
Biasa

Dengan Frekuensi

Nilai Tengah (Median):


Rumus:
Biasa

Dengan Frekuensi

Keterangan:

(jumlah data
ke 1 sampai data ke-n )

(jumlah perkalian frekuensi dengan


data)
n = banyaknya data

= jumlah frekuensi

Keterangan:
Me = median
Lo = Batas bawah kelas
C = lebar kelas
n = banyaknya data
F = jumlah frekuensi sebelum
kelas
f = jumlah frekuensi kelas

Modus = Nilai yang


paling sering muncul
Biasa
Mo = nilai yang paling
sering muncul
Data berfrekuensi

Keterangan:
Mo = modus
Lo = Batas bawah kelas
modus
C = lebar kelas
b1 = selisih frekuensi
sebelum kelas modus
b2 = selisih frekuensi tepat
satu data setelahnya

Contoh Kasus:
1. Data hasil ujian akhir semester 4
untuk mata kuliah statistika adalah
sebagai berikut: 40, 65, 90, 65, 70, 55,
85, 65, 70, 35
Tentukanlah:
a. Rata rata nilai UAS
b. Modus nilai UAS
c. Median Nilai UAS
2. Data nilai UAS mahasiswa semester 4,
untuk mata kuliah STATISTIKA adalah
Nilai
Jml Mhs
sebagai berikut:
45

50

65

14

70

16

75

80

Tentukanlah nilai :
a. Rata2
b. Modus
c. Median

Contoh soal data distribusi


berfrekuensi
Misalkan modal (dalam jutaan
rupiah) dari 40 perusahaan pada
tabel distribusi
frekuensi
berikut:
Modal
Frekuensi
112 - 120

121 - 129

130 - 138

139 - 147

12

148 -156

157 -165

166 - 174

2
= 40

Tentukan:
a.Mean/ Rata rata
b.Median
c.Modus

Kata Kunci
Data Distribusi Frekuensi
Kelas = selang/ interval
Frekuensi = banyaknya
nilai yang termasuk ke
dalam kelas
Limit kelas/ tepi kelas:
Nilai terkecil dan
terbesar pada setiap
kelas, terbagi menjadi
2, yaitu limit bawah
kelas dan limit atas
kelas

Batas bawah kelas


dan batas atas kelas
Lebar kelas= selisih
batas atas kelas dan
batas bawah kelas
Nilai tengah kelas =
(batas bawah kelas
+ batas atas kelas)/
2

Dari contoh di atas, maka


didapat:

Kelas = 112 120


Limit kelas/ tepi kelas:
pada kelas 112 120,
Nilai 112 disebut limit
bawah kelas dan nilai
120 disebut limit atas
kelas
Pada kelas 112 120,
nilai 111,5 disebut
batas bawah kelas dan
nilai 120,5 disebut
batas atas kelas

Lebar kelas= 120,5


111,5 = 9 nilai
lebar kelas pada
masing masing
kelas adalah sama
Nilai tengah kelas
= (111,5 +
120,5)/2 = 116

Penyelesaian Soal
Mean/ Rata - rata
Modal

Nilai
Tengah
(X)

Frekuensi
(f)

fX

112 - 120

116

464

121 - 129

125

625

130 - 138

134

1.072

139 - 147

143

12

1.716

148 -156

152

760

157 -165

161

644

166 - 174

170

340

= 40

= 5.621

5.621
140,525
40

MEDIAN
n

F
2

Med L0 c

Untuk mencari median, tentukan dulu pada kelas


interval mana mediannya terletak.
Karena frekuensinya bernilai genap, maka median
terletak pada nilai ke
n 1 40 1

20,5
2
2
Data ke 20,5 terletak pada kelas interval 139 147.
Maka diperoleh:
Lo = 138,5
f = 12
F = 4 + 5 + 8 = 17
c = 147,5 138,5 = 9

Jadi mediannya adalah


40

17
2

Med 138, 5 9

12

20 17
140, 75
12

Med 138,5 9

MODUS

Untuk mencari modus, tentukan dulu kelas interval


yang mengandung modus, yaitu kelas interval yang
memiliki frekuensi terbesar. Maka dapat diketahui
bahwa modus terletak pada kelas interval 139 147

Dengan demikian:
Lo = 138, 5
b2 = 12-5=7

c=9

b1 = 12-8=4

Jadi modusnya adalah:

b1
4

Mod L0 c
138,5 9

b1 b2
4 7
= 138,5 + 3,27 = 141,77

KUARTIL, DESIL, DAN


PERSENTIL
KUARTIL (Perluasan Median)
Kuartil terbagi menjadi 3, yaitu:
Kuartil pertama/ Kuartil bawah (Q1)
Kuartil kedua/ Kuartil tengah (Q2)
Kuartil ketiga/ Kuartil atas (Q3)
Rumus Untuk data tidak berkelompok:

i (n 1)
Qi Nilaiyangke
i 1, 2,3
4

Untuk data berkelompok


i, n

4 F
Qi L0 c
, i 1, 2,3
f

Dimana:
Lo= Batas bawah kelas kuartil
c = Lebar kelas
F = Jumlah frekuensi semua kelas
sebelum kelas kuartil Qi
f = Frekuensi kelas kuartil Qi

DESIL
Jika sekelompok data dibagi menjadi 10
bagian yang sama banyak, maka akan
terdapat 9 pembagi, masing masing
disebut nilai Desil (D), yaitu D1, D2, , D9

Untuk data tidak berkelompok


i (n 1)
Di nilaiyangke
, i 1, 2,3,...,9
10
Untuk data berkelompok

i.n

10 F
Di L0 c
, i 1, 2,3,...,9
f

Dimana: Lo = Batas bawah kelas desil Di


c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas desil Di
f = Frekuensi kelas desil Di

PERSENTIL
Jika sekelompok data dibagi menjadi 100
bagian sama banyak, maka akan terdapat
99 pembagi, yang masing masing
disebut persentil (P), yaitu P1,P2,P3,
,P99. Nilai persentil ke-I, yaitu Pi dihitung
dengan rumus berikut.
Untuk data tidak berkelompok:

i (n 1)
Pi nilaike
, i 1, 2,3,...,99
100

Untuk data berkelompok

i.n

100 F
Pi L0 c
, i 1, 2, 3,...,99
f

Dimana: Lo = Batas bawah kelas persentil Pi


c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi
f = Frekuensi kelas persentil Pi

Contoh soal data tidak


berkelompok

Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13


karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85,
95, 100.
i (n 1)
Maka:

Qi nilaike
1(13 1)

, n 13

Q1=nilai kenilai
ke- 3 1
4
2
= antara nilai ke 3 dan ke 4
= nilai ke 3 + (nilai ke 4 nilai ke 3)
= 40 + (45-40)
= 40 + 2,5= 42,5

Tentukan desil D3 dan D7 dari data gaji bulanan 13


karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85,
95, 100.

i (n 1)
Di nilaiyangke
10

Maka:
3(13 1)
D3= nilai yang ke10
= nilai ke 41
= nilai ke 45 + 1/5 (nilai ke 5 nilai ke 4)
= 45 + 1/5 (50-45)
= 45 + 1= 46

Contoh soal data


berkelompok

Misalkan modal (dalam jutaan


rupiah) dari 40 perusahaan pada
tabel distribusi
frekuensi
berikut:
Tentukan:
Modal
Frekuensi
112 - 120

121 - 129

130 - 138

139 - 147

12

148 -156

157 -165

166 - 174

2
= 40

a.Tentukan nilai kuartil


Q1, Q2 dan Q3
b. Tentukan desil D3 dan D8
c. Tentukan persentil P20
dan P 80

Penyelesaian Soal
Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
Q1 terletak pada nilai ke
1(40 1)
10, 25
Nilai ke 10, 25 terletak pada
4 interval kelas 130 138
Q2 terletak pada nilai ke
2(40 interval
1)
Nilai ke 20, 5 terletak pada
kelas 139 147
20,5
4
Q3 terletak pada nilai ke
Nilai ke 30,75 terletak pada
3(40 1)interval kelas 148 156
4

30, 75

Setelah diketahui interval kelas dari tiap tiap kuartil


yang dicari, maka nilai kuartil dapat dicari dengan
rumus.

i, n

4 F
Qi L0 c

Untuk Q1, terletak pada interval kelas 130 137,


maka:
Lo = 129,5
F = 4+5 = 9
f=8 c=
9
40
9
sehingga:
10 9
4
Q1 129,5 9
129,5 9
130, 625
8
8

Mencari D3 dan D8
Jawab:
Tentukan kelas interval dimana desil berada
Karena n = 40, maka kelas interval D3 dan D8
3(40 1)
berada pada:
12,3
10
D3 terletak pada nilai ke
1)
Nilai ke 12,3 terletak8(40
pada
interval kelas 130 138
32,8
10
D8 terletak pada nilai ke
Nilai ke 32,8 terletak pada interval kelas 139 147
Maka nilai D3 dan D8 adalah:

i.n

F
10

Di L0 c

Untuk D3 terletak pada interval kelas 130 138,


maka:
Lo = 129,5 F = 4+5= 9f = 8
c=9
Sehingga:

3(40)
10 9
12 9
D3 129,5 9
129,5 9
132,875
8
8

PENGUKURAN DISPERSI,
KEMIRINGAN, DAN KERUNCINGAN
DATA

DISPERSI DATA

Dispersi/ variasi/ keragaman data: ukuran penyebaran


suatu kelompok data terhadap pusat data.

Ukuran Dispersi yang akan dipelajari:


Jangkauan (Range)
Simpangan rata rata (mean deviation)
Variansi (variance)
Dispersi multak
Standar Deviasi (Standard Deviation)
Simpangan Kuartil (quartile deviation)
Koefisien variasi (coeficient of variation)
Dispersi relatif

RANGE/ JANGKAUAN DATA (r)


Range: Selisih nilai maksimum dan nilai
minimum
Rumus: Range (r) = Nilai max nilai min
Range untuk kelompok data dalam bentuk
distribusi frekuensi diambil dari selisih
antara nilai tengah kelas maksimun nilai
tengah kelas minimum

Simpangan Rata2/ Mean


Deviation (SR)
Simpangan rata rata: jumlah nilai mutlak
dari selisih semua nilai dengan nilai rata
rata, dibagi banyaknya data.
Rumus
Untuk data tidak berkelompok

SR

X X
n

Dimana:
X = nilai data
X = rata rata hitung
n = banyaknya data

Untuk data berkelompok

SR

( f X X )
n

Dimana:
X = nilai data
X = rata rata hitung
n = f = jumlah frekuensi

(s )
VARIANSI/ VARIANCE
Variansi adalah rata rata kuadrat selisih
atau kuadrat simpangan dari semua nilai
data terhadap rata rata hitung.
2

s
2

= simbol untuk sample


= simbol untuk populasi

Rumus untuk data tidak berkelompok

S
2

X X

n 1

Untuk data berkelompok


S
2

f X X
n 1

STANDAR DEVIASI/ STANDARD


DEVIATION (S)
Standar deviasi: akar pangkat dua dari
variansi
Rumus:

X
2
Untuk data tidak berkelompok
S

f X X

n 1

Untuk data berkelompok

S
2

n 1

Contoh Soal
Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
a. Range (r)
b. Simpangan Rata rata (SR)
c. Variansi
d. Standar Deviasai

Jawab:
a. Range (r) = nilai terbesar nilai terkecil = 80
20 = 60
b. Simpangan
X X Rata rata (SR):
SR
n
X

20 50 30 70 80
50
5

n = 20
5 50 50 50 30 50 70 50 80 50
SR

5
30 0 20 20 30 100
SR

20
5
5

2
(
s
Variansi )

S
2

X X

n 1

2
2
2
2
2
(20

50)

(50

50)

(30

50)

(70

50)

(80

50)
S2
5 1

S2

900 0 400 400 900 2600

650
4
4

Standar Deviasi (S)

S S

S 650 25, 495

Contoh Soal
Data Berkelompok
Diketahui data pada tabel dibawah ini:
Modal

Frekuensi

112 - 120

121 - 129

130 - 138

139 - 147

12

148 -156

157 -165

166 - 174

2
40

Tentukan:
a.Range (r)
b.Simpangan rata rata (SR)
c.Variansi
d.Standar Deviasi

JAWAB
Range (r)= (nilai tengah tertinggi nilai tengah
terendah)/2
Simpangan
( f Xrata
X)rata

SR

n
n = jml frekuensi

f X X

Variansi

S
2

n 1

Standar Deviasi S 2

f X X
n 1

Untuk memudahkan mencari jawaban, maka


dibuat tabel sesuai dengan keperluan jawaban
Modal

Nilai
Tenga
h (X)

112 - 120

116

121 - 129

125

130 - 138

139 - 147

f X X

( X X )2

f ( X X )2

24,525

98,100

601,476

2405,90
2

15,525

77,625

241,026

1205,12
8

134

6,525

52,200

42,576

340,605

12

143

2,475

29,700

6,126

73,507

148 -156

152

11,475

57,375

131,676

658,378

157 -165

161

20,475

81,900

419,226

1676,90
2

166 - 174

170

29,475

58,950

868,776

1737,55
1

Jumlah

40

XX

455,8
50

8097,9
74

Maka dapat dijawab:


Range (r) = 170 116 = 54
Simpangan rata rata

455,850
SR
11,396
40
Variansi
8097,974 8097,974
S

207, 64
40 1
39
2

Standar Deviasi

S 207, 64 14, 41

JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
Jangkauan kuartil disebut juga simpangan kuartil,
rentang semi antar kuartil, deviasi kuartil.
Jangkauan persentil 10-90 disebut juga rentang
persentil 10-90
Jangkauan kuartil dan jangkauan persentil lebih
baik daripada jangkauan (range) yang memakai
selisih antara nilai maksimum dan nilai minimun
suatu kelompok data
Rumus:
Ket:
1
Jangkauan
JK (Q3 QKuartil:
1)
2

JK: jangkauan kuartil


Q1: kuartil bawah/ pertama
Q3: kuartil atas/ ketiga

Rumus Jangkauan Persentil

JP1090 P90 P10


KOEFISIEN VARIASI/ DISPERSI
RELATIF
Untuk mengatasi dispersi data yang sifatnya mutlak, seperti
simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll
Untuk membandingkan variasi antara nilai nilai bersar
dengan nilai nilai kecil.
Untuk mengatasi jangkauan data yang lebih dari 2 kelompok
data.

Rumus:

S
KV *100%
X

Ket:
KV: Koefisien variasi
S : Standar deviasi
X : Rata rata hitung

KOEFISIEN VARIASI KUARTIL


Alternatif lain untuk dispersi relatif yang bisa
digunakan jika suatu kelompok data tidak
diketahui nilai rata rata hitungnya dan nilai
standar deviasinya.
Rumus:

Q3 Q1
KVQ
Q3 Q1

atau

(Q3 Q1 ) / 2
KVQ
Med

NILAI BAKU
Nilai baku atau skor baku adalah hasil
transformasi antara nilai rata rata hitung
dengan standar deviasi
Rumus:

X1 X
Zi
S

Nilai i = 1, 2, 3, , n

Contoh Soal untuk Koefisien


Variasi dan Simpangan Baku
Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata
rata mampu menyala selama 1500 jam dengan
simpangan baku (standar deviasi) S1 = 275 jam,
sedangkan lampu jenis B secara rata rata dapat
menyala selama 1.750 jam dengan simpangan baku
S2 = 300 jam. Lampu mana yang kualitasnya paling
baik?
Jawab:
S1
275
KV1
*100%
*100% 18,3%
Lampu jenis A:
X1
1500

S
300
Lampu jenis B:
KV2 2 *100%
*100% 17,1%
X2
1750

Nilai rata rata ujian akhir semester mata kuliah


Statistika dengan 45 mahasiswa adalah 78 dan
simpangan baku/standar deviasi (S) = 10. Sedangkan
untuk mata kuliah Bahasa Inggris di Kelas
itu
mempunyai nilai rata rata 84 dan simpangan bakunya
(S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk
kalkulus adalah 86 dan untuk bahasa Inggris adalah 92,
bagaimana posisi/ prestasi Desi di kelas itu?
Jawab
Untuk mengetahui posisi/ prestasi Desi, maka harus
dicari nilai baku (Z) dari kedua mata kuliah tersebut.

X X
Z
S
dengan nilai X adalah nilai UAS yang diperoleh Desi

Untuk Mata Kuliah Statistika


X = 86 S = 10
X 78
Maka:

86 78
Z
0,8
10

Untuk Mata Kuliah Bahasa Inggris


X = 92 S = 18
Maka:
X 84

92 84
Karena nilai
baku
(Z)untuk
Z
0, 4 mata kuliah Statistika
lebih besar dari18
B. Inggris, maka posisi Desi lebih
baik pada mata kuliah Statistika dari pada B.
Inggris

KEMIRINGAN DATA
Kemiringan: derajat/ ukuran dari
ketidaksimetrian
(asimetri)
suatu
distribusi data
3 pola kemiringan distribusi data, sbb:
Distribusi simetri (kemiringan 0)
Distribusi miring ke kiri (kemiringan
negatif)
Distribusi miring ke kanan (kemiringan
positif)

Beberapa metoda yang bisa dipakai


untuk menghitung kemiringan data,
yaitu:
Rumus Pearson
Rumus Momen
Rumus Bowley

Rumus Pearson ()
3( X Med )
X Mod
atau

S
S

Rumus tersebut dipakai untuk data


tidak
berkelompok
maupun
data
berkelompok.
Bila = 0 atau mendekati nol, maka
dikatakan distribusi data simetri.
Bila bertanda negatif, maka dikatakan
distribusi data miring ke kiri.
Bila bertanda positif, maka dikatakan
distribusi data miring ke kanan.
Semakin besar , maka distribusi data
akan semakin miring atau tidak simetri

RUMUS MOMEN ( 3 )
Cara lain yang dipakai untuk
menghitung
derajat
kemiringan
adalah rumus momen derajat tiga,
yaitu
3
Untuk data
tidak
berkelompok:
(
X

X
)

3
3
nS
3
(
f
(
X

X
)
)

3
3
Untuk data berkelompok
f
S

Khusus untuk data berkelompok dalam


bentuk tabel distribusi frekuensi , derajat
kemiringan 3 dapat dihitung dengan
cara transformasi sebabai berikut:
c
3 3
S

fU

fU fU

fU

2

Jika 3 = 0, maka distribusi data simetri


Jika 3 < 0, maka distribusi data miring ke kiri
Jika 3 > 0, maka distribusi data miring ke
kanan

Untuk mencari nilai Standar deviasi (S)


menggunakan variabel U:
2

n fU ( fU )
2
S c

n(n 1)

Variabel U = 0, 1, 2, 3, dst.

RUMUS BOWLEY

Q3 Q1 Q2

Q3 Q1

KERUNCINGAN DISTRIBUSI
DATA
Keruncingan distribusi data adalah
derajat atau ukuran tinggi rendahnya
puncak suatu distribusi data terhadap
distribusi normalnya.
Keruncingan
data
disebut
juga
kurtosis, ada 3 jenis yaitu:
Leptokurtis
Mesokurtis
Platikurtis

KERUNCINGAN DISTRIBUSI
DATA

Keruncingan distribusi
dihitung dengan rumus:
Data tidak berkelompok

(X X )

nS

Data Berkelompok

( f (X X ) )

f *S
4

data

(4)

Khusus untuk transformasi


c
4 4
S

fU

fU fU fU

fU 3 fU
n n

Keterangan
4 = 3, distribusi data mesokurtis
4 > 3, distribusi data leptokurtis
4 < 3, distribusi data platikurtis

Selain cara di atas, untuk mencari


keruncingan data, dapat dicari dengan
menggunakan rumus:
1
(Q3 Q1 )
JK
K
2
P90 P10
P90 P10

K= Koefisien Kurtorsis Persentil

Keterangan

K = 0,263 maka keruncingan distribusi data


mesokurtis
K > 0,263 maka keruncingan distribusi data
leptokurtis
K < 0,263 maka keruncingan distribusi data platikurtis

REGRESI DAN KORELASI


Pada bab ini akan membahas dua bagian
yang saling berhubungan, khususnya dua
kejadian
yang
dapat
diukur
secara
matematis.
Dalam hal dua kejadian yang saling
berhubungan, ada dua hal yang perlu diukur
dan dianalisis, yaitu:
Bagaimana hubungan fungsional (persamaan matematis)
antara dua kejadian tersebut -> analisis regresi
Bagaimana kekuatan (keeratan) hubungan dua kejadian
itu -> analisis korelasi

REGRESI LINEAR
SEDERHANA
Garis regresi/ regresi: garis lurus/ garis
linear yang merupakan garis taksiran
atau perkiraan untuk mewakili pola
hubungan antara variabel X
dan
variabel Y.
Cara untuk mencari persamaan garis
Dimana
regresi:
^
Y = variabel terikat

Y a bX

X = variabel bebas
a = intersep (pintasan) bilamana X=0
b = koefisien arah (slope) dari garis regresi

Koefisien regresi a dan b dapat dicari


dengan rumus:

Y . X X . XY

a
n. X ( X )
2

n. XY X . Y
n. X ( X )
2

Rumus
lain
untuk
koefisien a dan b adalah:

menghitung

n. XY X . Y
n. X ( X )
2

X
Y

a
b

Kita dapat membuat garis regresi


lebih dari satu dari suatu data. Lalu
garis regresi manakah yang paling
baik??
Garis regresi yang paling baik adalah
garis regresi yang mempunyai total
kuadrat kesalahan/ total kuadrat
selisih/ total kuadrat eror yang paling
minimum.
^
2
2eror
Total
kuadrat
dapat
dihitung
e
(
Y

Y
)

dengan:

Selanjutnya bila diambil


akarnya, maka diperoleh:
^

S^
yx

(Y Y )

Bentuk terakhir ini disebut


Kesalahan baku dari penafsiran
Atau disebut juga
Standard error of estimate

Rumus di atas dapat di jabarkan menjadi:

S^
yx

a. Y b. XY
n

Nih.. Contoh Soal


Regresi
Berat
Badan

Tinggi
Badan

Tentukanlah persamaan regresi dan kesalahan baku penafsirannya!

Jawab:

Persamaan regresi adalah:

Y a bX

Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b.


Cara mencari nilai a dan b adalah:

Y . X X . XY

a
n. X ( X )
2

n. XY X . Y
n. X 2 ( X ) 2

Untuk mempermudah mencari nilai


nilai yang diperlukan, maka akan
digunakan tabel.
Berat
Badan
(X)

Tinggi
Badan
(Y)

Y = 36

16

25

36

49

64

X =
203

XY

15

15

54

42

56

XY =
198

Masukan nilai nilai yang telah diketahui,


ke dalam rumus untuk mencari nilai a dan b:

X =
35

(X) = 1225

36* 203 35*198 7308 6930 378


a

1,93
7 * 203 1225
1421 1225 196

7 *198 35*36 1386 1260 126


b

0, 64
7 * 203 1225
1421 1225 196
Setelah diketahui, nilai a dan b, maka masukan nilai a dan b
ke dalam persamaan regresi. Hasilnya adalah:
^

Y 1, 93 0, 64 X
b. Mencari nilai kesalahan baku dari penafsiran.
^

S^
yx

2
(
Y

Y
)

Ini persamaan
regresi / hubungan
dari variabel X dan
Y tadi. Ngerti
kan????

Masukan nilai X ke dalam persamaan regresi


untuk mencari nilai Y regresi
Berat
Badan
(X)

Tinggi
Badan
(Y)

3.21

3,85

4,49

5,13

5,77

6,41

7,05

0,79

1,15

-2,49

-2,13

3,33

-0,41

-0,05

0,6241

1,322
5

6,2001

4,5369

11,088
9

0,1681

0,0025

Y Y
^

(Y Y ) 2

(Y Y )2

23,9431

Cara mencari nilai Y regresi, masukan nilai masing masing X ke dalam


persamaan regresi. ^

Y 1, 93 0, 64 X

Y1 1,93 0, 64* 2 1,93 1, 28 3, 21


X 1 = 2 ->
^
X 2 = 3 ->
Y2 1, 93 0, 64*3 1,93 1, 92 3,85
^
X 3 = 4 Y->
3 1,93 0, 64 * 4 1, 93 2, 56 4, 49
^

Y4 1,93 0, 64 *5 1,93 3, 2 5,13


X 4 = 5 ->
^
X 5 = 6 Y->
5 1,93 0, 64* 6 1,93 3,84 5, 77
^

Y6 1,93 0, 64 *7 1, 93 4, 48 6, 41
X 6 = 7 ->
^
X 7 = 8 ->
Y7 1,93 0, 64*8 1,93 5,12 7, 05

Maka nilai kesalahan


taksiran regresi adalah:
^

S^
yx

2
(
Y

Y
)

23,9431

1,85
7

baku

dari

Akhirnya.
Terjawab
semuanya
.
Mudah kan?
^^

Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan
linear, yaitu:
1.Parabola kuadrat
Sekedar buat
2.Parabola kubik
pengetahuan
3.Eksponen
aja,,, ga dipelajari
4.Geometrik
di bab ini..
5.Logistik
Tapi kalo mau,,
6.Hiperbola
otodidak aja ya
7.Gompertz

KOEFISIEN KORELASI
Perumusan
koefisien
korelasi
dilakukan
dengan
memakai
perbandingan antara variasi yang
dijelaskan dengan variasi
Y total.
2
(
Y

Y
)
total dari Y terhadap
Variasi
^
dirumuskan
oleh ^ 2
2
2
(
Y

Y
)

(
Y

Y
)

(
Y

Y
)

Variasi yang
tidak
dijelaskan

Variasi yang
dijelaskan

Perbandingan antara variasi yang


dijelaskan dengan variasi total, yaitu:
^

r2

(Y Y )

adalah koefisien determinasi

2
(
Y

Y
)

Koefisien korelasi (r) adalah akar dari


koefisien determinasi
^

(Y Y )
(Y Y )

2
2

Rumus r
pertama

Keterangan:
1. Nilai r = -1 disebut korelasi linear negatif
(berlawanan arah); artinya terdapat hubungan
negatif yang sempurna antara variabel X dan
Y
2. Nilai r = 1 disebut korelasi linear positif
(searah); artinya terdapat hubungan positif
yang sempurna antara variable X dengan
variabel Y
3. Nilai r = 0 disebut tidak berkorelasi secara
linear, artinya tidak ada hubungan antara
variabel X dan Y

Koefisien korelasi dapat juga dicari


dengan rumus berikut:
Dimana:

r 1

S^

y.x
2
y

S ^2
Rumus r
kedua

= kuadrat dari kesalahan baku

y .x

2
y = variansi Y

(Y Y )

Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur


kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan
antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah
menjadi:

xy
( x )( y
2

Dimana:
2

xX X

y Y Y
Disebut juga koefisien
korelasi produk momen

Dari rumus terakhir, yaitu koefisien


korelasi produk momen (product
momen formula)
Apabila kita ambil:
S xy

xy

Sx

Sy

Merupakan kovarians dari X dan Y

2
x

Merupakan simpangan baku dari X

2
y

Merupakan simpangan baku dari Y

2
y

Merupakan variansi dari Y

S x2

Merupakan variansi dari X

Dengan demikian, maka rumus


koefisien korelasi dapat juga
ditulis:
Gmana???

S xy
Sx S y

Bingung rumus mana


yang harus
digunakan???
Ga usah khawatir
sesuaikan aja sama
data yang
diketahui.. OK?!!

n. XY X . Y

2
2
2
2
n
.
X

(
X
)
n
.
Y

(
Y
)


Arti dari koefisien korelasi r adalah:


1.Bila 0,90 < r < 1,00 atau -1,00 < r <
-0,90: artinya hubungan yang sangat kuat
2.Bila 0,70 < r < 0,90 atau -0,90 < r <
-0,70: artinya hubungan yang kuat
3.Bila 0,50 < r < 0,70 atau -0,70 < r <
-0,50: artinya hubungan yang moderat
4.Bila 0,30 < r < 0,50 atau -0,50 < r <
-0,30: artinya hubungan yang lemah
5.Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0:
artinya hubungan yang sangat lemah

Contoh soalnya nih.


Biar lebih ngerti.
Soalnya sama aja dengan yang regresi
Berat
3
4
5
6
7
8
ya. 2
Badan
Tinggi
Badan

Tentukanlah:
1.Koefisien korelasi (r) dan artinya
2.Koefisien determinasi dan artinya
Jawab:

Berat
Badan
(X)

X = 35

Tinggi
Badan
(Y)

16

25

36

49

64

X =
203

XY

15

15

54

42

56

XY =
198

16

25

81

36

49

Y =
220

(X) =
1225
5

Y = 36
(Y) =
1296

Koefisien korelasi adalah:


r

n. X

n. XY X . Y

( X ) 2 n. Y 2 ( Y ) 2

7 *198 35*36

7 * 203 1225 7 * 220 1296

Truz.
r

1368 1260

1421 1225 1540 1296

108
r
196* 244
108
r
47824
108
108
r

0, 49
47824 218, 69

Kesimpulannya.????
Oleh karena, nilai r = 0,49 terletak
antara 0,30 dan 0,50 maka terdapat
hubungan positif yang lemah antara
tinggi badan dan berat badan.
2
2
Koefisien
determinasi,
yaitu
r (0, 49) 0, 2401
Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X)
Mahasiswa oleh persamaan regresi ^
adalah

Y 1, 93 0, 64 X

Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.

TUGAS 2
Data pada suatu pabrik kertas
menunjukkan
bahwa
banyaknya
mesin yang rusak ada hubungannya
dengan kecepatan beroperasi mesin
cetak. Tergambar pada tabel di
bawah
ini. 8 9 10 11 12 13 15 16
Kecepatan
mesin
permenit
Jumlah kerusakan
kertas (lembar)

10

12

Tentukanlah:
1.Persamaan regresi linear
2.Berapa perkiraan jumlah kertas yang
rusak, jika kecepatan mesin permenit
adalah 18?
3.Tentukan kesalahan baku yang diberikan
oleh persamaan regresi!
4.Tentukanlah
koefisien
korelasi
dan
koefisien determinasi
data tersebut serta
Deadline
berikan artinya masingNext
masing!
week
Dont be
late OK!!!!

STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009
Data pada suatu pabrik kertas menunjukkan bahwa
banyaknya mesin yang rusak ada hubungannya dengan
kecepatan beroperasi mesin cetak. Tergambar pada tabel
di bawah ini.
Kecepatan mesin
permenit

10

11

12

14

15

Jumlah kerusakan
kertas (lembar)

11

Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan
mesin permenit adalah 20?

Anda mungkin juga menyukai