Anda di halaman 1dari 54

Regressi Mudah dan

Analisis Korelasi

1
Objektif Pembelajaran
Mengira persamaan garisan regressi mudah dari data
sampel, dan mentafsir kecerunan dan pintasan
persamaan tersebut.
Memahami kegunaan analisis residual didalam
menguji andaian disebalik analisis regressi dan
didalam menguji kepadanan garisan regressi terhadap
data.
Mengira ralat piawai penganggar dan mentafsir
maknanya.
Mengira pangkali keofisien dan tafsirannya.
Ujian hipotesis berkaitan kecerunan model regressi
dan mentafsir keputusannya.
Menganggar nilai Y mnggunakan model regressi.
Mengira keofisien korelasi dan mentafsirkannya.
2
Korelasi dan Regressi

Korelasi adalah ukuran darjah


hubungkait diantara dua angkubah.

Analisis Regressi ialah proses


membentuk model matematik atau
fungsi yang boleh digunakan untuk
meramal atau menentukan satu
angkubah melalui angkubah lain.

3
Analisis Regressi Mudah

Regressi linear bivariate (dua


angkubah) -- model regressi yang asas
Angkubah sandar, abgkubah yang
hendak diramal, biasanya dipanggil Y
Angkubah bebas, angkubah peramal
atau penerang, biasanya ditandakan
sebagai X
4
Bilangan Bilangan
Katil Pekerja
23 69
Data Hubungan 29 95
29 102
Bilangan 35 118
Pekerja dan 42 126
46 125
Bilangan Katil 50 138
Hospital 54 178
64 156
66 184
76 176
78 225
5
Lakaran Scatter Data

250
Bilangan Pekerja

200

150

100

50

0
0 20 40 60 80 100
Bilangan Katil

6
Model Regressi
Model Regressi Berketentuan (Deterministic)
Y = 0 + 1X

Model Regressi Berkebarangkalian (Probabilistic)


Y = 0 + 1X +

0 dan 1 adalah parameter populasi

0 dan 1 adalah dianggarkan oleh sampel statistik b0 dan b1


7
Rersamaan Garisan Regressi Mudah

Y b0 b1 X

dimana :
b0 = pintasan sampel
b1 = kecerunan sampel
Y = nilai ramalan bagi Y

8
Analisis Kuasadua Terkecil

X Y
X X Y Y XY nXY XY n
b1
X X X n X
2 2 2 2

X X
2

Y X
b Yb X n b n
0 1 1

9
Analisis Kuasadua Terkecil

X Y
SSXY X X Y Y XY n

X X
2
X
X
2
SSXX
2

n
SSXY
b1 SSXX

Y X
b Y b X n b n
0 1 1

10
Bilangan Bilangan 2
X XY
Katil (X) Pekerja (Y)
23 69 529 1587
29 95 841 2755
29 102 841 2958
35 118 1225 4130
42 126 1764 5292
46 125 2116 5750
50 138 2500 6900
54 178 2916 9612
64 156 4096 9984
66 184 4356 12144
76 176 5776 13376
78 225 6084 17550
X= 592 Y= 1692 X = 3304 XY= 92038
2
11
X Y (592)(1692 )
SSXY XY - 92038 - 8566.00
n 12

X 2 (592) 2
SS XX X2 - 33044 - 3838.67
n 12

SS XY 8566.00
b1 2.232
SS XX 3838.67

b0
Y - b X 1692 - (2.232) 592 30.888
1 12
n n 12

Y 30.888 2.232X
12
Graf Garisan Regressi

Y 30.888 2.232X

30.888

13
Analisis Residual

14
Analisis Residual
Bilangan Bilangan Nilai Ramalan Residuals
Katil (X) Pekerja (Y) ( Y ) (Y Y)
23 69 82.24 -13.24
29 95 95.63 -0.63
29 102 95.63 6.37
35 118 109.02 8.98
42 126 124.64 1.36
46 125 133.56 -8.56
50 138 142.49 -4.49
54 178 151.41 26.59
64 156 173.73 -17.73
66 184 178.19 5.81
76 176 200.51 -24.51
78 225 204.97 20.03
15
(Y Y) 0.00
Geraf Excel Residual Contoh
Kakitangan Hospital
30
20
Residuals

10
0
-10 0 20 40 60 80 100

-20
-30
Bilangan Katil (X) 16
Plot Residual Tidak Linear

0 X

17
Ralat Varian Tidak Konstant

0 X

0 X

18
Ralat Tidak Bebas

0 X 0 X

19
Plot Residual yang Baik

0 X

20
Ralat Piawai Penganggaran

21
Ralat Piawai Penganggaran

Jumlah Kuasadua


Ralat 2

SSE Y Y
Y b0 Y b1 XY
2

SSE
Se n2

Ralat Piawai
Penganggaran

22
Menentukan SSE
Bilangan Bilangan Residual
(Y Y)
(Y Y ) 2
Katil (X) Pekerja (Y)
23 69 -13.24 175.22
29 95 -0.63 0.39
29 102 6.37 40.63
35 118 8.98 80.73
42 126 1.36 1.86
46 125 -8.56 73.30
50 138 -4.49 20.14
54 178 26.59 706.83
64 156 -17.73 314.31
66 184 5.81 33.74
76 176 -24.51 600.58
78 225 20.03 401.21
Jumlah Ralat Kuasadua SSE (Y Y) 2 2448.94 23
Jumlah Ralat Kuasadua Ralat Piawai Penganggar

YY
SSE
SSE
2
Se n 2
2448.94 2448.94

10
15.694

24
Pengkali Penentuan

25
Pengkali Penentuan
Y
2

SSYY Y Y Y
2

2

n
SSYY exp lained var iation un exp lained var iation
SSYY SSR SSE
SSR SSE
1
SSYY SSYY
2 SSR

r SSYY
SSE
1
SSYY
SSE
1
0 r 1
2
2
Y
Y n
2

26
SSE = 2448.6

Y 2
1692 2
SS YY Y 2 - 260136 - 25164
n 12

SSE 88.6% daripada


r 1-
2

SSYY variabiliti bilangan pekerja


dihospital boleh diramalkan
2448.6 oleh bilangan katil yang
1- terdapat dihospital tersebut
21564
0.886

27
Ujian Hipotesis untuk Kecerunan
Model Regressi

28
Ujian Hipotesis untuk Kecerunan
Model Regressi

H 0: 1 0 t
b 1 1

S
H 1: 1 0
b

dimana : S S
b
e

SS XX

H 0: 1 0
SSE
S e
n2
H 1: 1 0 X
2

SSXX X
2

H 0: 1 0
n
1 kecerunan yang dihipotesi skan
df n 2
H 1: 1 0

29
Contoh

Langkah 1: Hipotesis Langkah 3: Ujian Statistik

Ho: 1 = 0 b
t
1 1
Ha: 1 0 S b

dimana : S S
b
e

SS XX
SSE
Se n2
Langkah 2: Nilai
SSXX X
2 X
2

n
1 kecerunan yang dihipotesi skan
= 0.01 df n 2

30
Langkah 4: Peraturan Keputusan

Tolak Ho jika nilai t > 2.228 atau t < -2.228

31
Langkah 5: Data

Y 30.888 2.232X
Kecerunan sampel ialah b1 = 2.232
Se = 15.65
X = 592
X2 = 33044
n = 12.

32
Langkah 5: Nilai Ujian Statistik

X
2

SSXX X 2
-
n2
33044 -
592 3838.667 Langkah 6: Kesimpulan
12

SSE 2448.86
Se 15.65
n-2 10 Nilai t yang dikira dari kecerunan
sampel adalah lebih besar dari tc =
2.228, maka hipotesis nul dimana
Se 15.65 kecerunan populasi sifar adalah
Sb 0.2526
SS XX 3838.667 ditolak. Model regressi linear ini
menambah signifikan lebih
maklumat ramalan kepada model
b1 - 1 2.232 - 0
t 8.8361 Y (bukan regressi).
Sb 0.2526

33
Ujian Hipotesis untuk
Menguji Keseluruhan Model

34
Keoffisien regressi adalah kecerunan garisan regressi, ujian
F bagi signifikan keseluruhan adalah menguji perkara yang
sama sebagaimana ujian t di dalam regressi mudah.

Nilai F adalah dikira secara langsung sebagai

SSreg dimana
dfreg = k
reg MSreg
df
F dferr = n k 1, dan
SSerr MSerr k = bilangan angkubah bebas
df
err
35
Contoh

Langkah 1: Hipotesis Langkah 3: Ujian Statistik

Ho: 1 = 0
Ha: 1 0
SSreg

df reg MS reg
F
SSerr MSerr
Langkah 2: Nilai df
err

= 0.05

36
Langkah 4: Peraturan Keputusan

F0.025,1,10 6.94

1
F0.975,10,1
F0.025,1,10
0.025
2
1

6.94
0.144
F0.975,9,1 0.144 F0.025,1,9 = 6.94

Tolak Ho jika F < 6.94 atau F > 0.144


37
Langkah 5: Data

ANOVA
df SS MS F Significance F
Regression 1 19115.06 19115.06 78.05 0.00

Residual 10 2448.94 244.89

38
Langkah 5: Nilai Ujian Statistik

SSreg

df reg MS reg 19115.06
F 78.05
SSerr MSerr 244.89
df
err

Langkah 6: Kesimpulan

Oleh kerana nilai F > Fc maka kita boleh menolak Ho

39
Penganggaran

40
Penganggaran Titik
Anggaran peramalan titik boleh dibuat dengan mengambil nilai X yang
tertentu, menggantikan nilai X ke dalam persamaan regressi, dan
menyelesaikan untuk X. Sebagai contoh, jika bilangan katil yang
adalah ialah 100 unit, apakah bilangan kakitangan yang diperlukan?
Persamaan regressi bagi contoh ini ialah,

Y 30.888 2.232X
untuk X 100, maka

Y 30.888 2.232(100) 254.088


41
Selangan Keyakinan untuk
Menganggarkan Min Bersyarat Y: Y|X

1 X 0 - X
2

Y t /2,n -2 Se
n SS XX

dimana :
X o nilai X tertentu

SSXX

X - X X -
2 2
X 2


n

42
Untuk X0 = 100, maka nilai ialah Y = 254.088. Selang
keyakinan yang dikira untuk nilai purata Y, E(Y100), ialah

1 (100 49.33) 2
254.088 (2.228)(15 .65) 254.088 30.240
12 3838.667
223.85 E(Y100 ) 284.33

Oleh itu, kenyataan boleh dibuat dengan kenyakinan 95%


bahawa nilai purata Y untuk X = 100 ialah di antara
223.85 hingga 284.33.
43
Selang Peramalan untuk Menganggar Nilai Y
untuk nilai X yang Diberi

Y t ,n 2 Se
1
1
X0X 2

2 n SSXX
dimana : X0 nilai X tertentu

SSXX = X
2

X
2

n
44
Contoh
Selang keyakinan 95% boleh dikira untuk menganggar nilai tunggal
Y untuk X = 100.

t 0.025,10 2.228 SSXX 3838.667

X 49.33 Se 15.65

1 X 0 - X
2

Y t /2,n -2 Se 1
n SS XX

1 (100 49.33) 2
254.088 (2.228)(15.65) 1 254.088 46.154
12 3838.667

207.934 Y 300.242
45
Ukuran Persatuan

46
Pengkali Korelasi

SSXY
r
SSX SSY


X X Y Y
X X Y Y
2 2

XY
X Y 1 r 1
n

2

X
2

Y 2
Y
2

X n n

47
Lima Darjah Korelasi

Korelasi negatif yang kuat Korelasi negatif yang Korelasi positif yang
(r=-0.933) sederhana (r=-0.674) sederhana (r=0.518)

Korelasi positif yang Tiada korelasi


kuat (r=0.909) (r=0)

48
Contoh Pengiraan r
Futures
Interest Index
Day X Y X2 Y2 XY
1 7.43 221 55.205 48,841 1,642.03
2 7.48 222 55.950 49,284 1,660.56
3 8.00 226 64.000 51,076 1,808.00
4 7.75 225 60.063 50,625 1,743.75
5 7.60 224 57.760 50,176 1,702.40
6 7.63 223 58.217 49,729 1,701.49
7 7.68 223 58.982 49,729 1,712.64
8 7.67 226 58.829 51,076 1,733.42
9 7.59 226 57.608 51,076 1,715.34
10 8.07 235 65.125 55,225 1,896.45
11 8.03 233 64.481 54,289 1,870.99
12 8.00 241 64.000 58,081 1,928.00
Summations 92.93 2,725 720.220 619,207 21,115.07

49
Formula Pengiraan r

X Y
XY
n
r


X
2

Y
2

X n Y n
2 2



92.93 2725
21,115.07
12

720.22

92 .93 2

619,207 2725
2

12 12

.815

50
Plot Scatter dan Matrik Korelasi

245
240
Futures Index

235
230
225
220
7.40 7.60 7.80 8.00 8.20
Interest

Interest Futures Index


Interest 1
Futures Index 0.815254 1

51
Kovarian
X Y

2

X Y
XY
N
X Y
XY
N

N
SSXY

N
52
Matrik Kovarian dan Statistik
Perihalan
Interest Futures Index
Interest 0.050408
Futures Index 1.11053 36.81060606

Interest Futures Index

Mean 7.74416667 Mean 227.08


Standard Error 0.06481276 Standard Error 1.7514
Median 7.675 Median 225.5
Mode 8 Mode 226
Standard Deviation 0.224518 Standard Deviation 6.0672
Sample Variance 0.05040833 Sample Variance 36.811
Kurtosis -1.4077097 Kurtosis 1.2427
Skewness 0.3197374 Skewness 1.3988
Range 0.64 Range 20
Minimum 7.43 Minimum 221
Maximum 8.07 Maximum 241
Sum 92.93 Sum 2725
Count 12 Count 12
Confidence Level(95.0%) 0.14265201 Confidence Level(95.0%) 3.8549
53
54

Anda mungkin juga menyukai