Tujuan
1. Menggambar diagram pencar (scatter diagram).
2. Memahami dan menjelaskan istilah Variabel Terikat (dependent
variable) dan Variabel Bebas (independent variable).
3. Menghitung dan menafsirkan koefisien korelasi, koefisien
determinasi, dan kesalahan standar estimasi (standard error of
estimate).
4. Melalukukan Uji hypothesis untuk menentukan apakah koefisien
korelasi populasi tidak sama dengan nol.
5. Menghitung garis regresi dan menafsrikan arti nilai kemiringan
(slope) dan perpotongan (intersep).
6. Menyusun dan menafsirkan interval kepercayaan (confidence
interval) dan interval prediksi (prediction interval) untuk variabel
bebas.
Terminology
Analisis Korelasi
…adalah sekumpulan teknik statistik yang digunakan untuk
mengukur kekuatan hubungan antara dua variabel.
Diagram Pencar (scatter)
…adalah diagram yang menggambarkan hubungan antara
dua variabel.
Variabel Terikat (Dependent Variable)
…adalah variabel yang diprediksi atau diperkirakan.
… dilambangkan dengan r.
… menunjukkan arah dan kekuatan hubungan antara dua
variabel berskala interval atau rasio.
… Nilainya berkisar antara -1.00 sampai 1.00
…Nilai -1.00 atau 1.00 menunjukkan korelasi sempurna dan kuat.
…Nilai mendekati 0.0 menunjukkan korelasi yang lemah.
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 6
Perfect Positive Correlation
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 7
Zero Correlation
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 8
Strong Positive Correlation
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Example
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 9
Chart 13-6
Chart 13.4
Estimate r r = 0.7415
… dilambangkan dengan r2
… adalah perbandingan total variasi pada
variabel terikat (Y) yang dapat dijelaskan oleh
variation pada variabel independent (X).
90
Harga ($)
80
70
60
400 500 600 700 800
Halaman
Sx Sy S xy S x2 S y2
4 900 636 397 200 3 150 000 51 606
r n-2 .614 8 - 2
t= = = 1.905
1- r 2
1 - (.614) 2
H0 tidak ditolak.
Kita tidak dapat memolak hipotesis
bahwa tidak ada korelasi pada populasi
n( Sxy ) - ( Sx )( Sy )
b=
n( S x ) - (S x)
2 2
Sy Sx
a = n -b n
n( S xy ) - ( S x )( S y )
b= 2
-
n( S x ) ( S x )
2
Sy Sx
a = n -b n
= 636 - 0.05143 4 900 = 48.0
8 8
y = a + bx = 48.0 + 0.05x
Hasilnya menunjukkan…setiap tambahan satu halaman, harga
buku bertambah $0.05;
Perpotongan sumbu-y menunjukkan bahwa satu buku dengan 0
halaman berharga $48.
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 27
…continued
Sy 2 - aS y - b S xy
Se =
n -2
51,606 -48(636) -0.05143(397,200)
=
8 -2
= 10.408
Copyright © 2004 by The McGraw-Hill Companies, Inc. All rights reserved.
13 - 30
Asumsi yang mendasari
Regresi Linier
Untuk setiap nilai x, ada sekelompok nilai y, dan
nilai y tersebut memiliki distribusi normal
Rata-rata dari distribusi normal nilai y terletak pada garis
lurus regresi
Standar deviasi dari distribusi normal adalah sama.
Nilai y independen secara statistik.
Hal ini berarti bahwa dalam pemilihan sampel nilai y yang
dipilih untuk suatu nilai x tertentu tidak tergantung pada
nilai y, untuk semua nilai x yang lain.
1 (
x
)-2 x
y0 tα/2(n-2) Se n
+ 0
S
2
( x )
Sx -
2
n
1 ( 800 - 612 . 5 ) 2
89 . 14 2 . 447 ( 10 . 408 ) + 2
8 ( 4 900 )
3 150 000 -
8
89 . 14 15 . 31
Prediction Interval
Sx Sy S xy S x2 S y2
Previously:
4 900 636 397 200 3 150 000 51 606
Interval prediksi satu nilai y untuk nilai x adalah
sbb:
1 (
x - )
x2
y0 tα/2(n-2) Se n
+ 0
S
2
( x )
Sx -2
n
1 ( 800 - 612 . 5 ) 2
89 . 14 2 . 447 ( 10 . 408 ) 1+ + 2
8 ( 4 900 )
3 150 000 -
8
89 . 14 29 . 72
Analysis of Variance
Source DF SS MS F P
Regression 1 393.4 393.4 3.63 0.105
Residual Error 6 650.6 108.4
Total 7 1044.0
www.mcgrawhill.ca/college/lind