Anda di halaman 1dari 83

STATISTIKA

• PENGERTIAN  Deskriptif: Metode untuk


mendeskripsikan, menggambarkan,
 Statistika
menjabarkan, atau menguraikan data
 Ilmu tentang pengumpulan data
 Inferensia: Penarikan kesimpulan dari
 Klasifikasi Data
sample untuk menjelaskan isi dari
 Penyajian Data
populasi
 Pengolahan Data
 Penarikan Kesimpulan
 Pengambilan keputusan • JENIS – JENIS DATA
 Populasi: Himpunan keseluruhan dari  Data mentah
objek pengamatan  Data primer
 Sample: Bagian dari populasi  Data sekunder
 Data: Informasi atau fakta yang  Data Kuantitatif
tertuang dalam angka atau bukan  Data Diskrit
angka  Data Kontinyu
 Data Diskrit:
o Data Nominal Civitas UMMI
o Daata Ordinal Dosen
o Data Dikotomi Mahasis
o Data Kualitatif wa
Pega
o Parameter: Kualitas Pengukuran wai
sample

• CONTOH – CONTOH Populasi


sample
 Deskriptif
“Nilai UAS mahasiswa Teknik Informatika  Data Nominal
semester 4 untuk mata kuliah Statistika adalah Jumlah lulusan mahasiswa Universitas
dengan nilai rata – rata 65” Muhammadiyah Sukabumi tahun 2008
 Populasi dan Sample Program Studi Jumlah
“Civitas akademik Universitas Muhammadiyah l Teknik Informatik 25 orang
Sukabumi terdiri dari dosen, mahasiswa dan
Kimia 5 orang
staff pekerja lainnya yang berjumlah 1200
orang” SDPK 4 orang
 Data Ordinal
Kategori hasil nilai akhir Mata Kuliah
Statistika
Kategori Nilai Jumlah
Istimewa 10 orang
Baik 12 orang
Cukup 20 orang
Kurang 7 orang
Kurang sekali 3 orang

 Data Dikotomi
 Murni: Hidup – mati, surga – neraka,
laki – laki – wanita, dll.
 Buatan: lulus – gagal, hitam – putih,
dll.
 Data interval: data yang memiliki
rentang atau jarak yang sama
 Data rasio: Data yang dinyatakan
dalam perbandingan
TENDENSI SENTRAL
• Nilai rata – rata (Mean): • Nilai Tengah (Median):
Rumus:
Rumus:
 Biasa
 Biasa

 Dengan Frekuensi
 Dengan Frekuensi

 Keterangan:
 Keterangan:
 (jumlah data ke 1
sampai data ke-n )  Me = median
 Lo = Batas bawah kelas
  C = lebar kelas
(jumlah perkalian frekuensi dengan data)  n = banyaknya data
 n = banyaknya data  F = jumlah frekuensi sebelum kelas
 = jumlah frekuensi  f = jumlah frekuensi kelas
• Modus = Nilai yang paling • Contoh Kasus:
1. Data hasil ujian akhir semester 4 untuk mata
sering muncul kuliah statistika adalah sebagai berikut: 40, 65,
 Biasa 90, 65, 70, 55, 85, 65, 70, 35
Tentukanlah:
Mo = nilai yang paling sering a. Rata – rata nilai UAS
muncul b. Modus nilai UAS
 Data berfrekuensi c. Median Nilai UAS
2. Data nilai UAS mahasiswa semester 4, untuk
mata kuliah STATISTIKA adalah sebagai berikut:

Nilai Jml Mhs


45 6
 Keterangan: 50 8
 Mo = modus
65 14
 Lo = Batas bawah kelas modus
70 16
 C = lebar kelas
75 9
 b1 = selisih frekuensi sebelum kelas
modus 80 4
 b2 = selisih frekuensi tepat satu data
setelahnya Tentukanlah nilai :
a. Rata2
b. Modus
c. Median
Contoh soal data distribusi
berfrekuensi
• Misalkan modal (dalam jutaan rupiah) dari 40
perusahaan pada tabel distribusi frekuensi
berikut: Modal Frekuensi

112 - 120 4 Tentukan:


a.Mean/ Rata – rata
121 - 129 5
b.Median
130 - 138 8 c.Modus
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
= 40
Kata Kunci
Data Distribusi Frekuensi
• Kelas = selang/ interval • Batas bawah kelas dan
• Frekuensi = banyaknya batas atas kelas
nilai yang termasuk ke • Lebar kelas= selisih
dalam kelas batas atas kelas dan
• Limit kelas/ tepi kelas: batas bawah kelas
Nilai terkecil dan • Nilai tengah kelas =
terbesar pada setiap (batas bawah kelas +
kelas, terbagi menjadi 2, batas atas kelas)/ 2
yaitu limit bawah kelas
dan limit atas kelas
Dari contoh di atas, maka didapat:
• Kelas = 112 – 120
• Lebar kelas= 120,5 –
• Limit kelas/ tepi kelas: 111,5 = 9 nilai lebar
pada kelas 112 – 120,
kelas pada masing –
Nilai 112 disebut limit
bawah kelas dan nilai 120
masing kelas adalah
disebut limit atas kelas sama
• Pada kelas 112 – 120, nilai • Nilai tengah kelas =
111,5 disebut batas bawah (111,5 + 120,5)/2 = 116
kelas dan nilai 120,5
disebut batas atas kelas
Penyelesaian Soal
• Mean/ Rata - rata
Nilai Tengah Frekuensi
Modal fX
(X) (f)
112 - 120 116 4 464
121 - 129 125 5 625
130 - 138 134 8 1.072
5.621
139 - 147 143 12 1.716 X  140,525
40
148 -156 152 5 760
157 -165 161 4 644
166 - 174 170 2 340
= 40 = 5.621
• MEDIAN
 n 
 2F 
Med  L0  c  
 f 
 
Untuk mencari median, tentukan dulu pada kelas interval mana
mediannya terletak.
Karena frekuensinya bernilai genap, maka median terletak pada
nilai ke
n  1 40  1
  20,5
2 2
Data ke 20,5 terletak pada kelas interval 139 – 147. Maka
diperoleh:
Lo = 138,5 f = 12 F = 4 + 5 + 8 = 17
c = 147,5 – 138,5 = 9
• Jadi mediannya adalah
 40 
 2  17 
Med  138, 5  9  
 12 
 
 20  17 
Med  138,5  9    140, 75
 12 
• MODUS
Untuk mencari modus, tentukan dulu kelas interval yang
mengandung modus, yaitu kelas interval yang memiliki frekuensi
terbesar. Maka dapat diketahui bahwa modus terletak pada kelas
interval 139 – 147
• Dengan demikian:
Lo = 138, 5 c=9 b1 = 12-8=4
b2 = 12-5=7

Jadi modusnya adalah:

 b1   4 
Mod  L0  c    138,5  9  
 b1  b2   47

= 138,5 + 3,27 = 141,77


KUARTIL, DESIL, DAN PERSENTIL
• KUARTIL (Perluasan Median)
Kuartil terbagi menjadi 3, yaitu:
 Kuartil pertama/ Kuartil bawah (Q1)
 Kuartil kedua/ Kuartil tengah (Q2)
 Kuartil ketiga/ Kuartil atas (Q3)

Rumus Untuk data tidak berkelompok:

i (n  1)
Qi  Nilaiyangke  i  1, 2,3
4
• Untuk data berkelompok
 i, n  Dimana:
 4 F  Lo= Batas bawah kelas kuartil
Qi  L0  c   , i  1, 2,3 c = Lebar kelas
 f  F = Jumlah frekuensi semua kelas
sebelum kelas kuartil Qi
  f = Frekuensi kelas kuartil Qi

• DESIL
Jika sekelompok data dibagi menjadi 10 bagian yang
sama banyak, maka akan terdapat 9 pembagi,
masing – masing disebut nilai Desil (D), yaitu D1, D2,
…, D9
• Untuk data tidak berkelompok
i (n  1)
Di  nilaiyangke  , i  1, 2,3,...,9
10
• Untuk data berkelompok
 i.n 
 10  F 
Di  L0  c   , i  1, 2,3,...,9
 f 
 
Dimana: Lo = Batas bawah kelas desil Di
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas desil Di
f = Frekuensi kelas desil Di
• PERSENTIL
Jika sekelompok data dibagi menjadi 100 bagian
sama banyak, maka akan terdapat 99 pembagi, yang
masing – masing disebut persentil (P), yaitu P1,P2,P3,
…,P99. Nilai persentil ke-I, yaitu Pi dihitung dengan
rumus berikut.

Untuk data tidak berkelompok:


i (n  1)
Pi  nilaike  , i  1, 2,3,...,99
100
• Untuk data berkelompok

 i.n 
 100  F 
Pi  L0  c   , i  1, 2,3,...,99
 f 
 
Dimana: Lo = Batas bawah kelas persentil Pi
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi
f = Frekuensi kelas persentil Pi
Contoh soal data tidak berkelompok
• Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
Maka:
i (n  1)
Qi  nilaike  , n  13
4
1(13 ke-
Q1=nilai ke- nilai 1) 1
 3
4
= antara nilai ke 3 dan ke 4 2
= nilai ke 3 + ½ (nilai ke 4 – nilai ke 3)
= 40 + ½ (45-40)
= 40 + 2,5= 42,5
• Tentukan desil D3 dan D7 dari data gaji bulanan 13 karyawan
(dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
• Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.

i (n  1)
Di  nilaiyangke 
Maka:
10
D3= nilai yang ke- 3(13  1)
= nilai ke – 1 10
4
5 (nilai ke 5 – nilai ke 4)
= nilai ke 4 + 1/5
= 45 + 1/5 (50-45)
= 45 + 1= 46
Contoh soal data berkelompok
• Misalkan modal (dalam jutaan rupiah) dari 40
perusahaan pada tabel distribusi frekuensi
berikut: Modal Frekuensi Tentukan:
a.Tentukan nilai kuartil
112 - 120 4 Q1, Q2 dan Q3
121 - 129 5 b. Tentukan desil D3 dan D8
c. Tentukan persentil P20
130 - 138 8 dan P 80
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
= 40
Penyelesaian Soal
• Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
 Q1 terletak pada nilai ke 1(40  1)
 10, 25
4
 Nilai ke 10, 25 terletak pada interval kelas 130 – 138
 Q2 terletak pada nilai ke 2(40  1)
 20,5
 Nilai ke 20, 5 terletak pada interval
4 kelas 139 – 147
 Q3 terletak pada nilai ke 3(40  1)
 30, 75
 Nilai ke 30,75 terletak pada interval
4 kelas 148 – 156
Setelah diketahui interval kelas dari tiap – tiap kuartil yang dicari,
maka nilai kuartil dapat dicari dengan rumus.
 i, n 
 4 F 
Qi  L0  c  
 f 
 

Untuk Q1, terletak pada interval kelas 130 – 137, maka:


Lo = 129,5 F = 4+5 = 9 f=8 c=9
sehingga:
 40 
 4  9   10  9 
Q1  129,5  9    129,5  9    130, 625
 8   8 
 
• Mencari D3 dan D8
Jawab:
Tentukan kelas interval dimana desil berada
Karena n = 40, maka kelas interval D3 dan D8 berada pada:
 D3 terletak pada nilai ke 3(40  1)  12,3
10
 Nilai ke 12,3 terletak pada interval kelas 130 – 138
 D8 terletak pada nilai ke 8(40  1)  32,8
10
 Nilai ke 32,8 terletak pada interval kelas 139 – 147
 Maka nilai D3 dan D8 adalah:

 i.n 
 10  F 
Di  L0  c  
 f 
 
Untuk D3 terletak pada interval kelas 130 – 138, maka:
Lo = 129,5 F = 4+5= 9 f=8 c=9
Sehingga:

 3(40) 
 10  9   12  9 
D3  129,5  9    129,5  9    132,875
 8   8 
 
PENGUKURAN DISPERSI, KEMIRINGAN,
DAN KERUNCINGAN DATA
• DISPERSI DATA
Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu
kelompok data terhadap pusat data.
• Ukuran Dispersi yang akan dipelajari:
 Jangkauan (Range)
 Simpangan rata – rata (mean deviation)
 Variansi (variance) Dispersi multak
 Standar Deviasi (Standard Deviation)
 Simpangan Kuartil (quartile deviation)
 Koefisien variasi (coeficient of variation) Dispersi relatif
RANGE/ JANGKAUAN DATA (r)
• Range: Selisih nilai maksimum dan nilai minimum
Rumus:
Range (r) = Nilai max – nilai min
• Range untuk kelompok data dalam bentuk distribusi
frekuensi diambil dari selisih antara nilai tengah kelas
maksimun – nilai tengah kelas minimum
Simpangan Rata2/ Mean Deviation
(SR)
• Simpangan rata – rata: jumlah nilai mutlak dari
selisih semua nilai dengan nilai rata – rata, dibagi
banyaknya data.
• Rumus
• Untuk data tidak berkelompok

 X X Dimana:
X = nilai data

SR  X = rata – rata hitung


n = banyaknya data
n
• Untuk data berkelompok
Dimana:
( f X  X ) X = nilai data

SR 
X = rata – rata hitung
n = Σf = jumlah frekuensi

n
2
VARIANSI/ VARIANCE ( s )
• Variansi adalah rata – rata kuadrat selisih atau
kuadrat simpangan dari semua nilai data terhadap
rata – rata hitung.
2
s = simbol untuk sample

 2
= simbol untuk populasi
• Rumus untuk data tidak berkelompok

 X  X 
2

S 
2

n 1

• Untuk data berkelompok

 f X X
2

S 
2

n 1
STANDAR DEVIASI/ STANDARD
DEVIATION (S)
• Standar deviasi: akar pangkat dua dari variansi
• Rumus:

 X  X 
Untuk data tidak berkelompok 2

S 
2

n 1
Untuk data berkelompok
 f  X X
2

S 
2

n 1
Contoh Soal
• Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
a. Range (r)
b. Simpangan Rata – rata (SR)
c. Variansi
d. Standar Deviasai
• Jawab:
a. Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60
b. Simpangan Rata – rata (SR):
 X X
SR 
n
20  50  30  70  80
X  50
5

n=5
20  50  50  50  30  50  70  50  80  50
SR 
5
30  0  20  20  30 100
SR    20
5 5
2
• Variansi ( s )
 X  X 
2

S 
2

n 1

(20  50) 2
 (50  50) 2
 (30  50) 2
 (70  50) 2
 (80  50) 2
S2 
5 1
900  0  400  400  900 2600
S2    650
4 4

• Standar Deviasi (S)

S S 2

S  650  25, 495


Contoh Soal
• Data Berkelompok
Diketahui data pada tabel dibawah ini:

Modal Frekuensi Tentukan:


a.Range (r)
112 - 120 4 b.Simpangan rata – rata (SR)
121 - 129 5 c.Variansi
d.Standar Deviasi
130 - 138 8
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
40
JAWAB
• Range (r)= (nilai tengah tertinggi – nilai tengah terendah)/2
• Simpangan rata – rata
( f X  X )
SR 
n
n = jml frekuensi
• Variansi
 f  X X
2

S 
2

n 1

• Standar Deviasi
 f X X
2

S 
2

n 1
• Untuk memudahkan mencari jawaban, maka dibuat tabel
sesuai dengan keperluan jawaban
Nilai
Modal f Tengah X X f X X ( X  X )2 f ( X  X )2
(X)
112 - 120 4 116 24,525 98,100 601,476 2405,902
121 - 129 5 125 15,525 77,625 241,026 1205,128
130 - 138 8 134 6,525 52,200 42,576 340,605
139 - 147 12 143 2,475 29,700 6,126 73,507
148 -156 5 152 11,475 57,375 131,676 658,378
157 -165 4 161 20,475 81,900 419,226 1676,902
166 - 174 2 170 29,475 58,950 868,776 1737,551
Jumlah 40 455,850 8097,974
Maka dapat dijawab:
• Range (r) = 170 – 116 = 54
• Simpangan rata – rata
455,850
SR   11,396
40
• Variansi
8097,974 8097,974
S 
2
  207, 64
40  1 39
• Standar Deviasi
S  207, 64  14, 41
JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
• Jangkauan kuartil disebut juga simpangan kuartil, rentang
semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90
disebut juga rentang persentil 10-90
• Jangkauan kuartil dan jangkauan persentil lebih baik daripada
jangkauan (range) yang memakai selisih antara nilai
maksimum dan nilai minimun suatu kelompok data
• Rumus:
Jangkauan Kuartil:
1 Ket:
JK  (Q3  Q1 ) JK: jangkauan kuartil
2 Q1: kuartil bawah/ pertama
Q3: kuartil atas/ ketiga
• Rumus Jangkauan Persentil

JP1090  P90  P10


• KOEFISIEN VARIASI/ DISPERSI RELATIF
 Untuk mengatasi dispersi data yang sifatnya mutlak, seperti
simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll
 Untuk membandingkan variasi antara nilai – nilai bersar dengan nilai
– nilai kecil.
 Untuk mengatasi jangkauan data yang lebih dari 2 kelompok data.

Rumus:
Ket:
S KV: Koefisien variasi
KV  *100% S : Standar deviasi
X X : Rata – rata hitung
KOEFISIEN VARIASI KUARTIL
• Alternatif lain untuk dispersi relatif yang bisa digunakan jika
suatu kelompok data tidak diketahui nilai rata – rata
hitungnya dan nilai standar deviasinya.
• Rumus:

Q3  Q1 (Q3  Q1 ) / 2
KVQ  atau KVQ 
Q3  Q1 Med
NILAI BAKU
• Nilai baku atau skor baku adalah hasil transformasi antara
nilai rata – rata hitung dengan standar deviasi
• Rumus:

X1  X Nilai i = 1, 2, 3, …, n
Zi 
S
Contoh Soal untuk Koefisien Variasi dan
Simpangan Baku
• Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata – rata
mampu menyala selama 1500 jam dengan simpangan baku
(standar deviasi) S1 = 275 jam, sedangkan lampu jenis B
secara rata – rata dapat menyala selama 1.750 jam dengan
simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya
paling baik?
Jawab: S1 275
KV  *100%  *100%  18,3%
Lampu jenis A: 1 X 1 1500

Lampu jenis B: KV2  S2 *100%  300 *100%  17,1%


X2 1750
• Nilai rata – rata ujian akhir semester mata kuliah Statistika
dengan 45 mahasiswa adalah 78 dan simpangan baku/standar
deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris
di Kelas itu mempunyai nilai rata – rata 84 dan simpangan
bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS
untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92,
bagaimana posisi/ prestasi Desi di kelas itu?
• Jawab
• Untuk mengetahui posisi/ prestasi Desi, maka harus dicari nilai
baku (Z) dari kedua mata kuliah tersebut.

X X
Z
S
dengan nilai X adalah nilai UAS yang diperoleh Desi
• Untuk Mata Kuliah Statistika
X = 86 S = 10
Maka: X  78
86  78
Z  0,8
10
• Untuk Mata Kuliah Bahasa Inggris
X = 92 S = 18
Maka: X  84

92  84
Z
Karena nilai baku18  0,mata
(Z) untuk 4 kuliah Statistika lebih
besar dari B. Inggris, maka posisi Desi lebih baik pada mata
kuliah Statistika dari pada B. Inggris
KEMIRINGAN DATA
• Kemiringan: derajat/ ukuran dari
ketidaksimetrian (asimetri) suatu distribusi
data
• 3 pola kemiringan distribusi data, sbb:
– Distribusi simetri (kemiringan 0)
– Distribusi miring ke kiri (kemiringan negatif)
– Distribusi miring ke kanan (kemiringan positif)
• Beberapa metoda yang bisa dipakai untuk
menghitung kemiringan data, yaitu:
– Rumus Pearson
– Rumus Momen
– Rumus Bowley
• Rumus Pearson (α)
X  Mod 3( X  Med )
 atau 
S S
• Rumus tersebut dipakai untuk data tidak
berkelompok maupun data berkelompok.
– Bila α = 0 atau mendekati nol, maka dikatakan
distribusi data simetri.
– Bila α bertanda negatif, maka dikatakan distribusi
data miring ke kiri.
– Bila α bertanda positif, maka dikatakan distribusi
data miring ke kanan.
– Semakin besar α, maka distribusi data akan
semakin miring atau tidak simetri
RUMUS MOMEN ( 3 )
• Cara lain yang dipakai untuk menghitung
derajat kemiringan adalah rumus momen
derajat tiga, yaitu
• Untuk data tidak berkelompok:

3 
 (X  X ) 3

3
nS
• Untuk data berkelompok
3   ( f ( X  X ) 3
)
 f S3
• Khusus untuk data berkelompok dalam bentuk
tabel distribusi frekuensi , derajat kemiringan
α3 dapat dihitung dengan cara transformasi
sebabai berikut:

c  
    fU    fU
3
3
fU 3
 fU 2

3  3   3
     2   
S  n  n  n   n  

– Jika α3 = 0, maka distribusi data simetri


– Jika α3 < 0, maka distribusi data miring ke kiri
– Jika α3 > 0, maka distribusi data miring ke kanan
– Untuk mencari nilai Standar deviasi (S)
menggunakan variabel U:

2  
 n fU  ( fU ) 
2

S c  
 n(n  1) 

– Variabel U = 0, ±1, ±2, ±3, dst.


• RUMUS BOWLEY
Q3  Q1  Q2

Q3  Q1
KERUNCINGAN DISTRIBUSI DATA
• Keruncingan distribusi data adalah derajat
atau ukuran tinggi rendahnya puncak suatu
distribusi data terhadap distribusi normalnya.
• Keruncingan data disebut juga kurtosis, ada 3
jenis yaitu:
– Leptokurtis
– Mesokurtis
– Platikurtis
KERUNCINGAN DISTRIBUSI DATA
• Keruncingan distribusi data (α4) dihitung
dengan rumus:
• Data tidak berkelompok

4 
 (X  X ) 4

4
nS
• Data Berkelompok

4 
 ( f (X  X ) ) 4

 f *S 4
• Khusus untuk transformasi
4 
c   fU
4
  fU    fU    fU    fU    fU  
3 2 2 4

4  4   4
 
 
 
  6 
 
 
 
  3   
S  n  n  n   n  n   n  
 

• Keterangan
– α4 = 3, distribusi data mesokurtis
– α4 > 3, distribusi data leptokurtis
– α4 < 3, distribusi data platikurtis
• Selain cara di atas, untuk mencari keruncingan
data, dapat dicari dengan menggunakan
rumus:
1 K= Koefisien Kurtorsis Persentil
(Q3  Q1 )
JK
K 2
P90  P10 P90  P10

• Keterangan
– K = 0,263 maka keruncingan distribusi data mesokurtis
– K > 0,263 maka keruncingan distribusi data leptokurtis
– K < 0,263 maka keruncingan distribusi data platikurtis
REGRESI DAN KORELASI
• Pada bab ini akan membahas dua bagian yang
saling berhubungan, khususnya dua kejadian
yang dapat diukur secara matematis.
• Dalam hal dua kejadian yang saling
berhubungan, ada dua hal yang perlu diukur
dan dianalisis, yaitu:
– Bagaimana hubungan fungsional (persamaan matematis)
antara dua kejadian tersebut -> analisis regresi
– Bagaimana kekuatan (keeratan) hubungan dua kejadian itu
-> analisis korelasi
REGRESI LINEAR SEDERHANA
• Garis regresi/ regresi: garis lurus/ garis linear
yang merupakan garis taksiran atau perkiraan
untuk mewakili pola hubungan antara variabel
X dan variabel Y.
• Cara untuk mencari persamaan garis regresi:
Dimana
^
Y  a  bX
Y = variabel terikat
X = variabel bebas
a = intersep (pintasan) bilamana X=0
b = koefisien arah (slope) dari garis regresi
• Koefisien regresi a dan b dapat dicari dengan
rumus:

a
 Y . X   X . XY
2

n. X  ( X )
2 2

n. XY   X . Y
b
n. X  ( X )
2 2
Rumus lain untuk menghitung koefisien a dan b
adalah:
n. XY   X . Y
b
n. X  ( X )
2 2

a
 Y X 
 b 
n  n 
 
• Kita dapat membuat garis regresi lebih dari
satu dari suatu data. Lalu garis regresi
manakah yang paling baik??
• Garis regresi yang paling baik adalah garis
regresi yang mempunyai total kuadrat
kesalahan/ total kuadrat selisih/ total kuadrat
eror yang paling minimum.
• Total kuadrat eror dapat dihitung dengan:
^
e 2


 (Y  Y ) 2

n n
Selanjutnya bila diambil akarnya,
maka diperoleh:
^ Bentuk terakhir ini disebut

S^ 
 (Y  Y ) 2 Kesalahan baku dari penafsiran
Atau disebut juga
Standard error of estimate
yx n

Rumus di atas dapat di jabarkan menjadi:

S^ 
Y 2
 a. Y  b. XY
yx n
Nih….. Contoh Soal Regresi……
Berat 2 3 4 5 6 7 8
Badan
Tinggi 4 5 2 3 9 6 7
Badan

Tentukanlah persamaan regresi dan kesalahan baku penafsirannya!


Jawab: ^
Persamaan regresi adalah: Y  a  bX
Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b.
Cara mencari nilai a dan b adalah:

 Y . X   X . XY
2
n. XY   X . Y
a b
n. X  ( X )
2 2
n. X 2  ( X ) 2
Untuk mempermudah mencari nilai – nilai yang
diperlukan, maka akan digunakan tabel.
Berat 2 3 4 5 6 7 8 ∑X = 35
Badan (∑X) = 1225
(X)
Tinggi 4 5 2 3 9 6 7 ∑Y = 36
Badan
(Y)
X 4 9 16 25 36 49 64 ∑X = 203
XY 8 15 8 15 54 42 56 ∑XY = 198

Masukan nilai – nilai yang telah diketahui,


ke dalam rumus untuk mencari nilai a dan b:

36* 203  35*198 7308  6930 378


a    1,93
7 * 203  1225 1421  1225 196
7 *198  35*36 1386  1260 126
b    0, 64
7 * 203  1225 1421  1225 196
Setelah diketahui, nilai a dan b, maka masukan nilai a dan b
ke dalam persamaan regresi. Hasilnya adalah:
^ Ini persamaan regresi /

Y  1,93  0, 64 X
hubungan dari variabel
X dan Y tadi…. Ngerti
kan????
b. Mencari nilai kesalahan baku dari penafsiran.

S^ 
 (Y  Y ) 2

yx n
Masukan nilai X ke dalam persamaan regresi untuk
mencari nilai Y regresi
Berat 2 3 4 5 6 7 8
Badan
(X)
Tinggi 4 5 2 3 9 6 7
Badan
(Y)
^ 3.21 3,85 4,49 5,13 5,77 6,41 7,05
Y
^ 0,79 1,15 -2,49 -2,13 3,33 -0,41 -0,05
Y Y
^
 (Y  Y )2
^ 0,6241 1,3225 6,2001 4,5369 11,0889 0,1681 0,0025
(Y  Y ) 2
23,9431

Cara mencari nilai Y regresi, masukan nilai masing – masing X ke dalam


persamaan regresi. ^
Y  1, 93  0, 64 X
^
X 1 = 2 -> Y1  1,93  0, 64* 2  1, 93  1, 28  3, 21
^
X 2 = 3 -> Y2  1, 93  0, 64*3  1,93  1,92  3,85
^
X 3 = 4 -> Y3  1,93  0, 64* 4  1,93  2, 56  4, 49

^
X 4 = 5 -> Y4  1, 93  0, 64*5  1,93  3, 2  5,13
^
X 5 = 6 -> Y5  1,93  0, 64* 6  1,93  3,84  5, 77
^

X 6 = 7 -> Y6  1, 93  0, 64*7  1,93  4, 48  6, 41


^
X 7 = 8 -> Y7  1,93  0, 64*8  1, 93  5,12  7, 05
Maka nilai kesalahan baku dari taksiran regresi
adalah:
Akhirnya….
Terjawab
^

semuanya….
(Y  Y ) 2
23,9431 Mudah kan? ^^
S^    1,85
yx n 7

Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan
linear, yaitu:
1.Parabola kuadrat
2.Parabola kubik Sekedar buat
3.Eksponen pengetahuan aja,,, ga
4.Geometrik dipelajari di bab ini…..
5.Logistik Tapi kalo mau,,
6.Hiperbola otodidak aja ya…
7.Gompertz
KOEFISIEN KORELASI
• Perumusan koefisien korelasi dilakukan
dengan memakai perbandingan antara variasi
yang dijelaskan dengan variasi total.
• Variasi total dari Y terhadap Y dirumuskan
oleh   2
(Y Y )
^ ^

  
(Y  Y )  (Y  Y )  (Y  Y ) 2
2 2

Variasi yang Variasi yang


tidak dijelaskan dijelaskan
• Perbandingan antara variasi yang dijelaskan
dengan variasi total, yaitu:
^ 2
 (Y  Y ) 2 r adalah koefisien determinasi
r2 
 (Y  Y ) 2

• Koefisien korelasi (r) adalah akar dari koefisien


determinasi
^ Rumus r

r
 (Y  Y ) 2 pertama

 (Y  Y ) 2
Keterangan:
1. Nilai r = -1 disebut korelasi linear negatif
(berlawanan arah); artinya terdapat hubungan
negatif yang sempurna antara variabel X dan Y
2. Nilai r = 1 disebut korelasi linear positif (searah);
artinya terdapat hubungan positif yang sempurna
antara variable X dengan variabel Y
3. Nilai r = 0 disebut tidak berkorelasi secara linear,
artinya tidak ada hubungan antara variabel X dan Y
Koefisien korelasi dapat juga dicari dengan
rumus berikut:
Dimana:
2
S^ S ^2 = kuadrat dari kesalahan baku
y.x
r  1
y.x
Rumus r
S 2 kedua
S 2  (Y  Y ) 2

y y = variansi Y 
n

Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur


kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan
antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah
menjadi:

 xy xX X
Dimana:

r
( x )( y 2 2
) y  Y Y
Disebut juga koefisien korelasi
produk momen
Dari rumus terakhir, yaitu koefisien korelasi
produk momen (product momen formula)
Apabila kita ambil:
S xy 
 xy Merupakan kovarians dari X dan Y
n

Sx 
 x 2
Merupakan simpangan baku dari X
n

Sy 
 y 2
Merupakan simpangan baku dari Y
n
2
S y Merupakan variansi dari Y

S x2 Merupakan variansi dari X


Dengan demikian, maka rumus koefisien
korelasi dapat juga ditulis:
S xy
Gmana???
Bingung rumus mana yang
r harus digunakan???

Sx S y Ga usah khawatir…
sesuaikan aja sama data
yang diketahui….. OK?!!

n. XY   X . Y
r
 
n. X 2
 (   
X ) 2
n. Y 2
 (  
Y ) 2
• Arti dari koefisien korelasi r adalah:
1.Bila 0,90 < r < 1,00 atau -1,00 < r < -0,90: artinya
hubungan yang sangat kuat
2.Bila 0,70 < r < 0,90 atau -0,90 < r < -0,70: artinya
hubungan yang kuat
3.Bila 0,50 < r < 0,70 atau -0,70 < r < -0,50: artinya
hubungan yang moderat
4.Bila 0,30 < r < 0,50 atau -0,50 < r < -0,30: artinya
hubungan yang lemah
5.Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0: artinya
hubungan yang sangat lemah
Contoh soalnya nih….
Biar lebih ngerti…….
Soalnya sama aja dengan yang regresi ya….
Berat 2 3 4 5 6 7 8
Badan
Tinggi 4 5 2 3 9 6 7
Badan

Tentukanlah:
1.Koefisien korelasi (r) dan artinya
2.Koefisien determinasi dan artinya
Jawab:
Berat 2 3 4 5 6 7 8 ∑X = 35
Badan (∑X) = 1225
(X)
Tinggi 4 5 2 3 9 6 7 ∑Y = 36
Badan (∑Y) = 1296
(Y)
X 4 9 16 25 36 49 64 ∑X = 203

XY 8 15 8 15 54 42 56 ∑XY = 198

Y 16 25 4 9 81 36 49 ∑Y = 220

Koefisien korelasi adalah:


n. XY   X . Y
r
 n. X 2
 ( X ) 2   n. Y 2  ( Y ) 2 

7 *198  35*36
r
 7 * 203  1225  7 * 220  1296
Truz….
1368  1260
r
 1421  1225  1540  1296
108
r
196* 244
108
r
47824

108 108
r   0, 49
47824 218, 69
Kesimpulannya….????
Oleh karena, nilai r = 0,49 terletak antara 0,30
dan 0,50 maka terdapat hubungan positif yang
lemah antara tinggi badan dan berat badan.

Koefisien determinasi, yaitu


r  (0, 49)  0, 2401
2 2

Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X)
Mahasiswa oleh persamaan regresi ^ adalah
Y  1, 93  0, 64 X
Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.
TUGAS 2
• Data pada suatu pabrik kertas menunjukkan
bahwa banyaknya mesin yang rusak ada
hubungannya dengan kecepatan beroperasi
mesin cetak. Tergambar pada tabel di bawah
ini.
Kecepatan mesin 8 9 10 11 12 13 15 16
permenit
Jumlah kerusakan 6 7 8 5 7 10 12 9
kertas (lembar)
• Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika
kecepatan mesin permenit adalah 18?
3. Tentukan kesalahan baku yang diberikan oleh
persamaan regresi!
4. Tentukanlah koefisien korelasi dan koefisien
determinasi data tersebut serta berikan artinya
masing – masing!
Deadline…
Next week…
Don’t be late
OK!!!!
STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009

• Data pada suatu pabrik kertas menunjukkan bahwa banyaknya


mesin yang rusak ada hubungannya dengan kecepatan beroperasi
mesin cetak. Tergambar pada tabel di bawah ini.

Kecepatan mesin 7 8 9 10 11 12 14 15
permenit
Jumlah kerusakan 5 6 7 4 6 9 11 8
• kertas (lembar)
Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin
permenit adalah 20?

Anda mungkin juga menyukai