Anda di halaman 1dari 46

JTW 125

Statistik Perniagaan
Webex 6
BAB 14: Pengenalan kepada regresi
berganda
Bab 16: Peramalan siri masa

13 April 2019; 4pm-5pm


Objektif pelajaran

Mempelajari cara-cara membentuk model regresi


berganda dan mentafsirkan pekali regresi.

Meramal Y apabila nilai X diberikan.


Model regresi berganda
Mengkaji hubungan linear antara
1 pemboleh ubah bersandar (Y) & 2 atau lebih
pemboleh ubah tak bersandar (Xi)

Multiple Regression Model with k Independent Variables:

Y-intercept Population slopes Random Error

Yi = β 0 + β 1 X 1i + β 2 X 2i +    + β k X ki + ε i
Persamaan regresi berganda

Pekali model regresi berganda dianggar menggunakan


data sampel

Persamaan regresi berganda dengan k pemboleh ubah tak bersandar:


Nilai Y yang Anggaran
dianggarkan/ Anggaran pekali kecerunan
diramalkan pintasan

ˆ = b + b X + b X +  + b X
Yi 0 1 1i 2 2i k ki
Contoh:
2 pemboleh ubah tak bersandar
◼ Seorang pengedar pai pencuci mulut beku
ingin menilai faktor yang mempengaruhi
permintaan

◼ Pemboleh ubah bersandar: jualan pai (unit per


minggu)
◼ Pemboleh ubah tak bersandar: harga (RM)
iklan (RM100’s)

◼ Data dikumpul untuk 15 minggu


Contoh jualan pai
Pie Price Advertising
Week Sales ($) ($100s) Persamaan regresi berganda:
1 350 5.50 3.3
2 460 7.50 3.3
3 350 8.00 3.0 Jualan = b0 + b1 (Harga)
4 430 8.00 4.5
+ b2 (Pengiklanan)
5 350 6.80 3.0
6 380 7.50 4.0
7 430 4.50 3.0
8 470 6.40 3.7
9 450 7.00 3.5
10 490 5.00 4.0
11 340 7.20 3.5
12 300 7.90 3.2
13 440 5.90 4.0
14 450 5.00 3.5
15 300 7.00 2.7
Output Excel
Regression Statistics
Multiple R 0.72213

R Square 0.52148
Adjusted R Square 0.44172
Standard Error 47.46341 Sales = 306.526 - 24.975(Pri ce) + 74.131(Adv ertising)
Observations 15

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
Persamaan regresi berganda

Sales = 306.526 - 24.975(Pri ce) + 74.131(Adv ertising)

b1 = -24.975: secara b2 = 74.131: secara


purata, jualan akan purata, jualan akan
menurun sebanyak meningkat sebanyak
24.975 pai seminggu 74.131 pai seminggu
untuk setiap untuk setiap
peningkatan peningkatan
sebanyak RM1 dalam sebanyak RM100
harga jualan dalam pengiklanan
Menggunakan persamaan untuk
membuat ramalan
Ramalkan jualan dalam seminggu untuk harga
jualan RM5.50 dan pengiklanan RM350:

Sales = 306.526 - 24.975(Pri ce) + 74.131(Adv ertising)


= 306.526 - 24.975 (5.50) + 74.131 (3.5)
= 428.62

Pengiklanan adalah
Ramalan jualan dalam RM100’s, maka
RM350 bermakna X2 =
adalah 428.62 3.5
pai
Pekali penentuan berganda (coefficient of
multiple determination)

◼ Melaporkan perkadaran jumlah variasi dalam Y


yang dijelaskan oleh semua pemboleh ubah X

SSR regression sum of squares


r =
2
=
SST total sum of squares
Pekali penentuan berganda
dalam Excel
Regression Statistics
SSR 29460.0
Multiple R 0.72213
r =
2
= = .52148
R Square 0.52148 SST 56493.3
Adjusted R Square 0.44172
52.1% daripada variasi dalam
Standard Error 47.46341
jualan pai dijelaskan oleh variasi
Observations 15
dalam harga dan pengiklanan
ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
R2 terlaras
◼ Menunjukkan perkadaran variasi dalam Y yang
dijelaskan oleh semua pemboleh ubah X,
diselaraskan untuk bilangan pemboleh ubah X
yang digunakan
 2  n − 1 
r 2
= 1 − (1 − r ) 
 n − k − 1 
adj

(where n = sample size, k = number of independent variables)

◼ Menghukum penggunaan berlebihan pemboleh ubah


tak bersandar yang tidak penting
◼ Nilai lebih kecil dari r2
◼ Berguna dalam perbandingan antara model
R2 terlaras dalam Excel
Regression Statistics
Multiple R 0.72213
2
radj = .44172
R Square 0.52148
Adjusted R Square 0.44172
44.2% daripada variasi dalam jualan pai dijelaskan
oleh variasi dalam harga dan pengiklanan, setelah
Standard Error 47.46341
mengambil kira saiz sampel dan bilangan pemboleh
Observations 15 ubah tak bersandar

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
Adakah model signifikan?
◼ Ujian F untuk signifikan keseluruhan model
◼ Menunjukkan sama ada terdapat hubungan
linear antara semua pemboleh ubah X dan Y
◼ Hipotesis:
H0: β1 = β2 = … = βk = 0 (tiada hubungan linear)
H1: at least one βi ≠ 0 (sekurang-kurangnya satu
pemboleh ubah tak bersandar mempengaruhi Y)
Ujian F dalam Excel
Regression Statistics
Multiple R 0.72213
MSR 14730.0
R Square 0.52148
FSTAT = = = 6.5386
Adjusted R Square 0.44172 MSE 2252.8
Standard Error 47.46341
With 2 and 12 degrees P-value for
Observations 15 of freedom the F Test

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
Ujian F untuk signifikan keseluruhan

H0: β1 = β2 = 0 Test Statistic:


H1: β1 and β2 not both zero MSR
FSTAT = = 6.5386
 = .05 MSE
df1= 2 df2 = 12
Decision:
Critical Since FSTAT test statistic is
Value:
in the rejection region (p-
F0.05 = 3.885 value < .05), reject H0
 = .05
Conclusion:
0 F There is evidence that at least one
Do not Reject H0
reject H0 independent variable affects Y
F0.05 = 3.885
Adakah pemboleh ubah individu
signifikan?
◼ Lakukan ujian t ke atas kecerunan pemboleh
ubah individu
◼ Menunjukkan sama ada terdapat hubungan
linear antara pemboleh ubah Xj dan Y dengan
anggapan bahawa kesan pemboleh ubah X yang
lain adalah malar
◼ Hipotesis:
◼ H0: βj = 0 (tiada hubungan linear)
◼ H1: βj ≠ 0 (hubungan linear wujud antara Xj
dan Y)
Output Excel
Regression Statistics
t Stat for Price is tSTAT = -2.306, with
Multiple R 0.72213
R Square 0.52148
p-value .0398
Adjusted R Square 0.44172
Standard Error 47.46341 t Stat for Advertising is tSTAT = 2.855,
Observations 15 with p-value .0145

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
Inferences about the Slope:
t Test Example
From the Excel output:
H0: βj = 0
H1: βj  0 For Price tSTAT = -2.306, with p-value .0398

For Advertising tSTAT = 2.855, with p-value .0145


d.f. = 15-2-1 = 12
 = .05 The test statistic for each variable falls
t/2 = 2.1788 in the rejection region (p-values < .05)
Decision:
/2=.025 /2=.025 Reject H0 for each variable
Conclusion:
There is evidence that both
Reject H0 Do not reject H0 Reject H0
-tα/2 tα/2 Price and Advertising affect
0
-2.1788 2.1788 pie sales at  = .05
Pemboleh ubah dummy

◼ Pemboleh ubah dummy adalah pemboleh ubah


bebas kategori dengan dua peringkat :
◼ yes or no, on or off, male or female
◼ coded as 0 or 1
Contoh

Ŷ = b 0 + b 1 X 1 + b 2 X 2

Let:
Y = pie sales
X1 = price
X2 = holiday (X2 = 1 if a holiday occurred during the week)
(X2 = 0 if there was no holiday that week)
Contoh
Ŷ = b 0 + b 1 X 1 + b 2 (1) = (b 0 + b 2 ) + b 1 X 1 Holiday

Ŷ = b 0 + b 1 X 1 + b 2 (0) = b0 + b 1 X1 No Holiday

Y (sales) Different Same


intercept slope

b0 + b2 If H0: β2 = 0 is
rejected, then
b0
“Holiday” has a
significant effect
on pie sales

X1 (Price)
Mentafsirkan pekali pemboleh ubah
dummy
Example: Sales = 300 - 30(Price) + 15(Holiday )

Sales: number of pies sold per week


Price: pie price in $
1 If a holiday occurred during the week
Holiday:
0 If no holiday occurred

b2 = 15: on average, sales were 15 pies greater in


weeks with a holiday than in weeks without a
holiday, given the same price
Contoh soalan regresi berganda
◼ Bagaimanakah kuasa kuda dan berat menjejaskan
perbatuan sebuah kereta sedan keluarga? Data dari
satu sampel yang terdiri daripada 20 buah kereta sedan
keluarga dikumpul. Model regresi dibangunkan untuk
meramalkan perbatuan (seperti yang diukur oleh
perbatuan per gelen) berdasarkan kuasa kuda enjin
kereta dan berat kereta (dalam paun). Jawab soalan-
soalan yang berikut berpandukan jadual yang diberikan.
Contoh soalan regresi berganda

Pekali Ralat piawai Statistik t Nilai p

Pintasan 41.58945494 6.308929728 6.592156949 4.57099E‐06

Kuasa kuda ‐0.022214661 0.010450404 ‐2.125722584 0.048479487

Berat ‐0.004082292 0.00203358 ‐2.007441263 0.060870643

◼ Nyatakan persamaan regresi berganda.Jawapan


◼ Berikan maksud kecerunan b1 dan b2 dalam soalan
ini.Jawapan
◼ Ramalkan perbatuan per gelen untuk kereta yang
mempunyai 190 kuasa kuda dan berat 3,500 paun.
Jawapan
Jawapan
◼ (i) Yˆ = 41 .5895 − 0.0222 X − 0 .0041 X
1 2
◼ Contoh soalan
◼ Untuk berat kereta yang diberikan, setiap peningkatan
satu unit dalam kuasa kuda dianggarkan akan
menyebabkan pengurangan sebanyak 0.0222 unit
dalam perbatuan per gelen.
◼ Untuk kuasa kuda yang diberikan, setiap peningkatan
satu unit dalam berat dianggarkan akan menyebabkan
penurunan sebanyak 0.0041 unit dalam perbatuan per
gelen. Contoh soalan
Jawapan

Yˆ = 41 .5895 − 0 .0222 (190 ) − 0 .0041 (3500 ) = 23 .0215


Bab 16

Peramalan siri masa

Chap 16-28
Objektif pelajaran

◼ Membincangkan kepentingan peramalan

◼ Meramal menggunakan model arah aliran linear

Chap 16-29
Kepentingan peramalan
(forecasting)

◼ Kerajaan meramal kadar pengangguran, kadar


faedah, dan hasil dijangka dari cukai pendapatan
untuk tujuan pembentukan dasar
◼ Eksekutif pemasaran meramal permintaan, jualan,
pilihan pengguna untuk perancangan strategik
◼ Pentadbir kolej meramal jumlah kemasukan untuk
perancangan kemudahan dan pengambilan staf
◼ Gedung runcit meramal permintaan untuk
mengawal paras inventori, mengambil pekerja, dan
memberi latihan.

Chap 16-30
Pendekatan biasa peramalan

Pendekatan biasa
peramalan

Kaedah peramalan Kaedah peramalan


kualitatif kuantitatif
◼ Digunakan apabila data
sejarah tak tersedia Siri masa Bersebab
◼ Dianggap sangat subjektif (causal)
dan judgmental
◼ Menggunakan data yang
lepas untuk meramal nilai
masa depan
Chap 16-31
Data siri masa

◼ Data berangka yang diperoleh pada selang


masa tetap
◼ Selang masa boleh jadi tahunan, suku tahunan,
bulanan, mingguan, harian, setiap jam, dsbnya.
Contoh:
Tahun: 2006 2007 2008 2009 2010
Jualan: 75.3 74.2 78.5 79.7 80.2

Chap 16-32
Plot siri masa
Satu plot siri masa adalah plot data siri
masa dua dimensi

◼ Paksi menegak U.S. Inflation Rate


16.00
mengukur 14.00
pembolehubah 12.00
berkepentingan 10.00
8.00
6.00
◼ Paksi mendatar 4.00
menunjukkan tempoh 2.00
0.00
masa

2001
1983
1985
1987
1989
1991
1993
1995
1997
1999

2003
2005
2007
2009
Chap 16-33
Komponen siri masa

Siri masa

Komponen Komponen Komponen Komponen


arah aliran bermusim kitaran tak nalar
(trend) (seasonal) (cyclical) (irregular)
Secara keseluruhan Kerap turun naik Mengulangi Turun naik tak
(overall), berterusan secara berkala, perubahan atau menentu
(persistent), biasanya dalam pergerakan lebih
pergerakan jangka tempoh 12 bulan daripada satu
panjang tahun

Chap 16-34
Komponen arah aliran

◼ Kenaikan atau penurunan jangka panjang


dari masa ke masa
◼ Data diambil dalam tempoh masa yang
panjang
Sales

Time Chap 16-35


Komponen arah aliran

◼ Arah aliran boleh ke atas (upward) atau ke


bawah (downward)
◼ Arah aliran boleh linear atau tak linear
Sales Sales

Time Time
Downward linear trend Upward nonlinear trend

Chap 16-36
Komponen bermusim
◼ Corak tetap seperti gelombang berjangka pendek
◼ Pemerhatian dalam setahun
◼ Biasanya bulanan atau suku tahunan

Sales
Summer
Winter
Summer
Winter Spring Fall

Spring Fall

Time (Quarterly)
Chap 16-37
Komponen kitaran
◼ Corak seperti gelombang berjangka panjang
◼ Kerap berlaku tetapi mungkin berbeza dalam
tempoh masa
◼ Selalunya diukur dari puncak ke puncak atau dari
dasar ke dasar 1 Cycle
Sales

Year
Chap 16-38
Komponen tak nalar

◼ Tidak dapat diduga, rawak


◼ Kerana variasi rawak yang disebabkan oleh
◼ Perkara semula jadi
◼ Kemalangan atau peristiwa luar biasa
◼ Dikenali sebagai gangguan atau noise dalam
siri masa

Chap 16-39
Tiga kaedah popular dalam peramalan
arah aliran

◼ Peramalan arah aliran linear

◼ Peramalan arah aliran tak linear

◼ Peramalan arah aliran eksponen

Chap 16-40
Peramalan arah aliran linear
Menganggar garis arah aliran menggunakan
analisis regresi
Time ◼ Use time (X) as the
Sales independent variable:
Year Period (Y)
(X)
2004 0 20
2005 1 40 Ŷ = b 0 + b1X
2006 2 30 In least squares linear, non-linear, and
2007 3 50 exponential modeling, time periods are
numbered starting with 0 and increasing
2008 4 70 by 1 for each time period.
2009 5 65

Chap 16-41
Peramalan arah aliran linear
Persamaan peramalan arah aliran linear adalah:
Time
Year Period Sales Ŷi = 21.905 + 9.5714 X i
(X) (Y)
Sales trend
2004 0 20
80
2005 1 40 70
60
2006 2 30 50
sales

40
2007 3 50 30
20
2008 4 70 10
0
2009 5 65
0 1 2 3 4 5 6

Year
Chap 16-42
Peramalan arah aliran linear

◼ Kirakan nilai anggaran arah aliran untuk:


◼ tahun ketiga

◼ tahun terkini

Chap 16-43
Peramalan arah aliran linear

◼ Kirakan nilai anggaran arah aliran untuk:


◼ tahun ketiga
◼ tahun adalah 2006, X = 2, maka

Yˆ2006 = 21 .905 + 9.5714 (2) = 41 .0478


◼ tahun terkini
◼ tahun adalah 2009, X = 5, maka

Yˆ2009 = 21 .905 + 9.5714 (5) = 69 .7620

Chap 16-44
Peperiksaan akhir

◼ Objektif – 50 soalan (60 markah)

◼ Esei – 2 soalan (40 markah)


Sekian, terima kasih.

Anda mungkin juga menyukai