Anda di halaman 1dari 35

13 - 1

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 2
Chapter Thirteen
Linear Regression and Correlation

Tujuan
1. Menggambar diagram pencar (scatter diagram).
2. Memahami dan menjelaskan istilah Variabel Terikat (dependent
variable) dan Variabel Bebas (independent variable).
3. Menghitung dan menafsirkan koefisien korelasi, koefisien
determinasi, dan kesalahan standar estimasi (standard error of
estimate).
4. Melalukukan Uji hypothesis untuk menentukan apakah koefisien
korelasi populasi tidak sama dengan nol.
5. Menghitung garis regresi dan menafsrikan arti nilai kemiringan
(slope) dan perpotongan (intersep).
6. Menyusun dan menafsirkan interval kepercayaan (confidence
interval) dan interval prediksi (prediction interval) untuk variabel
bebas.

l The McGraw-Hill Companies, Inc. All rights reserved.


Copyright © 2004 by
13 - 3

Terminology
Analisis Korelasi
…adalah sekumpulan teknik statistik yang digunakan untuk
mengukur kekuatan hubungan antara dua variabel.
Diagram Pencar (scatter)
…adalah diagram yang menggambarkan hubungan antara
dua variabel.
Variabel Terikat (Dependent Variable)
…adalah variabel yang diprediksi atau diperkirakan.

Variabel Bebas (Independent Variable)


…adalah variabel yang menjadi dasar untuk membuat
perkiraan. Juga disebut sebagai variabel prediktor.

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 4
The Coefficient of Correlation…r

… dilambangkan dengan r.
… menunjukkan arah dan kekuatan hubungan antara dua
variabel berskala interval atau rasio.
… Nilainya berkisar antara -1.00 sampai 1.00
…Nilai -1.00 atau 1.00 menunjukkan korelasi sempurna dan kuat.
…Nilai mendekati 0.0 menunjukkan korelasi yang lemah.

…Nilai Negative menunjukkan hubungan yang berlawanan


(inverse relationship) dan nilai Positif menunjukkan
Hubungan searah (Direct relationship)

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 5
Perfect Negative Correlation

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 6
Perfect Positive Correlation

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 7
Zero Correlation

10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 8
Strong Positive Correlation
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Example
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 9

Chart 13-6

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 10

Chart 13.4

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


How Income and Well-Being of 13 - 11

Canadians are Related (1971-97)

Estimate r r = 0.7415

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 12
Formula for
Correlation Coefficient
_
r= S (x - x )(y - y )
(n – 1) sX SY
= nS xy – ( Sx)( S y)
nS x 2 – (S x)2 nS y 2 – (S y)2

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 13
Coefficient of Determination

… dilambangkan dengan r2
… adalah perbandingan total variasi pada
variabel terikat (Y) yang dapat dijelaskan oleh
variation pada variabel independent (X).

… merupakan kuadrat dari koefisien korelasi.


… berkisar antara 0 sampai 1
… koefisien determinasi tidak menunjukkan
arah hubungan antar variabel. Hanya menunjukkan
ada/tidaknya hubungan.

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 14
Correlation Coefficient

Pak Budi, seorang pengajar, sedang memikirkan


tentang harga buku teks yang dipakai mahasiswa.
Dia memperkirakan bahwa ada hubungan antara
jumlah halaman dalam buku teks dan
harga jual buku!
Untuk memastikannya, Pak Budi mengambil sampel 8
buku teks di toko buku.
Gambarkan scatter diagram.
Hitung koefisien korelasinya.

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 15
Correlation Coefficient

Buku # Halaman Harga($)


Sejarah 500 84
Matematika 700 75
Psikologi 800 99

Data Sosiologi 600 72


Manajemen 400 69
Biologi 500 81
Musik 600 63
Keperawatan 800 93

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 16
Scatter Diagram
Diagram Pencar Jumlah halaman dan Harga Buku Teks
100

90
Harga ($)
80

70

60
400 500 600 700 800
Halaman

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 17
Scatter Diagram
Excel Printout

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 18
Correlation Coefficient
n S xy - (S x)( S y)
r=
n S x 2 - (S x ) 2 n S y 2 - (S y ) 2
x y xy x2 y2
Buku # Halaman Harga($)
Sejarah 500 84 42 000 250 000 7 056
Matematika 700 75 52 500 490 000 5 625
Psikologi 800 99 79 200 640 000 9 801
Sosiologi 600 72 43,200 360 000 5 184
Manajemen 400 69 27 600 160 000 4 761
Biologi 500 81 4 050 250 000 6 561
Musik 600 63
37 800 360 000 3 969
Keperawatan 800 93
74 400 640 000 8 649

Total 4900 636 397 200 3150 000 51 606


Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 19
Correlation Coefficient
n S xy - (S x)( S y)
r=
n S x - (S x ) 2 n S y 2 - (S y ) 2
2

Sx Sy S xy S x2 S y2
4 900 636 397 200 3 150 000 51 606

8 ( 397 200 ) - ( 4 900 )( 636 )


=
8 ( 315 000 - ( 4 900) 2
8 ( 51 , 606 ) - ( 636 ) 2
r = 0.614
Koefisien Korelasi sebesar 61.4%.
Hal ini menunjukkan hubungan moderat antara kedua
variabel tersebut.
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 20
Uji hipothesis bahwa tidak ada korelasi
dalam populasi.
Menggunakan tingkat signifikansi 0.02.
Step 1 Nyatakan hipotesis Nol (H0) dan H0: r = 0
hipotesis alternatif (H1) H1: r  0
Step 2 Pilih tingkat signifikasi  = 0.02
r n-2
Step 3 Tentukan uji stastistik t=
1- r 2
Step 4 Tentukan aturan keputusan

H0 ditolak jika t>3.143 atau jika t<-3.143.


lihat tabel t, df=6, diperoleh dari n – 1 = 8 – 2 = 6.

Step 5 Hitung Uji statistik dan tentukan


keputusannnya
...Step 5
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 21
Uji hipothesis bahwa tidak ada korelasi
dalam populasi.
Menggunakan tingkat signifikansi 0.02.
continued…

Step 5 Hitung Uji statistik dan


tentukan keputusannnya

r n-2 .614 8 - 2
t= = = 1.905
1- r 2
1 - (.614) 2

H0 tidak ditolak.
Kita tidak dapat memolak hipotesis
bahwa tidak ada korelasi pada populasi

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 22
Regression Analysis
Metode menggunakan variabel bebas
(independent variable) (X) untuk
memperkirakan variabel terikat (Y)
… hubungan antar variabel adalah linier
dan kedua variabel skalanya minimal
interval.
… Kriteria kuadrat terkecil dipergunakan
untuk menentukan persamaan regresinya,
yakni S (y – ^
y)2 harus paling kecil.

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 23
Regression Equation
y = a + bx + e
…y adalah nilai rata-rata variabel y yang
diperkirakan dari nilai x.
…a adalah titik potong sumbu y. Ini adalah nilai y
yang diperkirakan ketika x=0.
…b adalah kemiringan garis (slope), atau
perubahan rata-rata y untuk setiap perubahan satu
unit x.
…Prinsip kuadrat terkecil dipergunakan untuk
memperoleh nilai a dan b.
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 24
Regression Equation
y = a + bx + e

n( Sxy ) - ( Sx )( Sy )
b=
n( S x ) - (S x)
2 2

Sy Sx
a = n -b n

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 25

Pak Budi, seorang pengajar, sedang memikirkan


tentang harga buku teks yang dipakai mahasiswa.
Dia memperkirakan bahwa ada hubungan antara
jumlah halaman dalam buku teks dan
harga jual buku!
Untuk memastikannya, Pak Budi mengambil sampel 8
buku teks di toko buku.
Buatlah persamaan regresi yang dapat digunakan
untuk membuat estimasi/ perkiraan harga
buku berdasarkan jumlah halamannya!

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


Sx Sy S xy S x2 S y2 13 - 26

4 900 636 397 200 3 150 000 51 606

n( S xy ) - ( S x )( S y )
b= 2
-
n( S x ) ( S x )
2

8(397 200) – (4 900)(636)


= = .05143
8(3 150 000) – (4 900)2

Sy Sx
a = n -b n
= 636 - 0.05143 4 900 = 48.0
8 8
y = a + bx = 48.0 + 0.05x
Hasilnya menunjukkan…setiap tambahan satu halaman, harga
buku bertambah $0.05;
Perpotongan sumbu-y menunjukkan bahwa satu buku dengan 0
halaman berharga $48.
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 27

…continued

Tentukan perkiraan harga buku


dengan 800 halaman.
y = 48 + 0.05x
Substisi 800 pada x,
y = 48 + 0.05(800)
= 89.14
Perkiraan harga buku setebal 800
halaman adalah $89.14
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 28
Kesalahan Standar Estimasi
(The Standard Error of Estimate)

…merupakan sebaran atau dispersi data observasi


disekitar garis regresi.

Rumus yang dipakai menghitung Kesalahan


Standar:
-
S (y y )
2
Se =
n-2
Sy 2 - aS y - b S xy
=
n -2
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 29

Kesalahan Standar Estimasi


Tentukan Kesalahan Standar Estimasi untuk soal jumlah
halaman dan harga jual buku.
Sx Sy S xy S x2 S y2
Previously:
4 900 636 397 200 3 150 000 51 606

Sy 2 - aS y - b S xy
Se =
n -2
51,606 -48(636) -0.05143(397,200)
=
8 -2
= 10.408
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 30
Asumsi yang mendasari
Regresi Linier
 Untuk setiap nilai x, ada sekelompok nilai y, dan
nilai y tersebut memiliki distribusi normal
 Rata-rata dari distribusi normal nilai y terletak pada garis
lurus regresi
 Standar deviasi dari distribusi normal adalah sama.
 Nilai y independen secara statistik.
Hal ini berarti bahwa dalam pemilihan sampel nilai y yang
dipilih untuk suatu nilai x tertentu tidak tergantung pada
nilai y, untuk semua nilai x yang lain.

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 31
Confidence Interval
Sx Sy S xy S x2 S y2
Previously:
4 900 636 397 200 3 150 000 51 606
Interval Kepercayaan untuk nilai rata-rata y untuk suatu nilai
x tertentu adalah sbb:

1 (
x
)-2 x
y0 tα/2(n-2) Se n
+ 0
S
2
( x )
Sx -
2
n

1 ( 800 - 612 . 5 ) 2
89 . 14  2 . 447 ( 10 . 408 ) + 2
8 ( 4 900 )
3 150 000 -
8
89 . 14  15 . 31

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 32

Prediction Interval
Sx Sy S xy S x2 S y2
Previously:
4 900 636 397 200 3 150 000 51 606
Interval prediksi satu nilai y untuk nilai x adalah
sbb:
1 (
x - )
x2
y0 tα/2(n-2) Se n
+ 0
S
2
( x )
Sx -2
n
1 ( 800 - 612 . 5 ) 2
89 . 14  2 . 447 ( 10 . 408 ) 1+ + 2
8 ( 4 900 )
3 150 000 -
8
89 . 14  29 . 72

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 33
Summarizing the Results
 Estimasi harga jual buku dengan 800 halaman
adalah $89.14
 Standard Kesalahan Estimasi adalah $10.41
 Interval Kepercayaan 95 persen untuk
semua buku dengan 800 halaman: $89.14 + $15.31
Hal ini berarti, batasnya adalah antara
$73.83 dan $104.45
 Interval Prediksi 95 persen untuk suatu buku
dengan 800 halaman adalah $89.14 + $29.72. Hal ini
berarti, batasnya adalah antara $59.42 dan $118.86

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 34
Regression Analysis: Price versus Pages
The regression equation is
Price = 48.0 + 0.0514 Pages

Predictor Coef SE Coef T P


Constant 48.00 16.94 2.83 0.030
Pages 0.05143 0.02700 1.90 0.105

S = 10.41 R-Sq = 37.7% R-Sq(adj) = 27.3%

Analysis of Variance

Source DF SS MS F P
Regression 1 393.4 393.4 3.63 0.105
Residual Error 6 650.6 108.4
Total 7 1044.0

Predicted Values for New Observations

New Obs Fit SE Fit 95.0% CI 95.0% PI


1 89.14 6.26 (73.82,104.46) (59.41,118.88)

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.


13 - 35
Test your learning…

www.mcgrawhill.ca/college/lind

Online Learning Centre


for quizzes
extra content
data sets
searchable glossary
access to Statistics Canada’s E-Stat data
…and much more!

Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.

Anda mungkin juga menyukai