Kelas : 2ST1
NIM : 211911248
Matkul : Analisis Regresi
Pertemuan 2
Data_CopierMaintenance
The Tri-City Office Equipment Corporation sells an imported copier on a franchise basis and
performs preventive maintenance and repair service on this copier. The data below have been
collected from 45 recent calls on users to perform routine preventive maintenance service; for
each call, X is the number of copiers serviced and Y is the total number of minutes spent by the
service person. Assume that first-order regression model (1.1) is appropriate.
b0 = ̅ ̅ = -0,580
̂ = -0,580 + 15,035Xi
b. Plot the estimated regression function and the data. How well does the estimated
regression function fit the data?
Garis regresi Waktu dan Mesin
180
160 y = 15,035x - 0,5802
140 R² = 0,9575
120
waktu
100
80
60
40
20
0
0 2 4 6 8 10 12
mesin
Dari scatter plot yang di tampilkan terlihat bahwa titik-titik tersebut membentuk garis yang lurus
dengan arah yang positif sehingga dapat disimpulkan bahwa adanya hubungan yang kuat antara
variasi waktu dengan variasi mesin. Oleh karena itu, dapat dikatakan bahwa persamaan fungsi
RLS yang didapat sangat cocok dengan data yang dimiliki.
d. Obtain a point estimate of the mean service time when X = 5 copiers are serviced.
Jawab :
Jika X= 5 maka ̂ ?
̂ -0,580 + 15,035(5)
̂ 74,5961
Maka ketika mesin sama dengan 5 maka waktu yang dihabiskan petugas sebesar 74,59 menit
Data_GPA
No Y (GPA) X (ACT Score) XY X^2
1 3,897 21 81,837 441
2 3,885 14 54,39 196
3 3,778 28 105,784 784
4 2,540 22 55,88 484
5 3,028 21 63,588 441
6 3,865 31 119,815 961
7 2,962 32 94,784 1024
8 3,961 27 106,947 729
9 0,500 29 14,5 841
10 3,178 26 82,628 676
11 3,310 24 79,44 576
12 3,538 30 106,14 900
13 3,083 24 73,992 576
14 3,013 24 72,312 576
15 3,245 33 107,085 1089
16 2,963 27 80,001 729
17 3,522 25 88,05 625
18 3,013 31 93,403 961
19 2,947 25 73,675 625
20 2,118 20 42,36 400
21 2,563 24 61,512 576
22 3,357 21 70,497 441
23 3,731 28 104,468 784
24 3,925 27 105,975 729
25 3,556 28 99,568 784
26 3,101 26 80,626 676
27 2,420 28 67,76 784
28 2,579 22 56,738 484
29 3,871 26 100,646 676
30 3,060 21 64,26 441
31 3,927 25 98,175 625
32 2,375 16 38 256
33 2,929 28 82,012 784
34 3,375 26 87,75 676
35 2,857 22 62,854 484
36 3,072 24 73,728 576
37 3,381 21 71,001 441
38 3,290 30 98,7 900
39 3,549 27 95,823 729
40 3,646 26 94,796 676
41 2,978 26 77,428 676
42 2,654 30 79,62 900
43 2,540 24 60,96 576
44 2,250 26 58,5 676
45 2,069 29 60,001 841
46 2,617 24 62,808 576
47 2,183 31 67,673 961
48 2,000 15 30 225
49 2,952 19 56,088 361
50 3,806 18 68,508 324
51 2,871 27 77,517 729
52 3,352 16 53,632 256
53 3,305 27 89,235 729
54 2,952 26 76,752 676
55 3,547 24 85,128 576
56 3,691 30 110,73 900
57 3,160 21 66,36 441
58 2,194 20 43,88 400
59 3,323 30 99,69 900
60 3,936 29 114,144 841
61 2,922 25 73,05 625
62 2,716 23 62,468 529
63 3,370 25 84,25 625
64 3,606 23 82,938 529
65 2,642 30 79,26 900
66 2,452 21 51,492 441
67 2,655 24 63,72 576
68 3,714 32 118,848 1024
69 1,806 18 32,508 324
70 3,516 23 80,868 529
71 3,039 20 60,78 400
72 2,966 23 68,218 529
73 2,482 18 44,676 324
74 2,700 18 48,6 324
75 3,920 29 113,68 841
76 2,834 20 56,68 400
77 3,222 23 74,106 529
78 3,084 26 80,184 676
79 4,000 28 112 784
80 3,511 34 119,374 1156
81 3,323 20 66,46 400
82 3,072 20 61,44 400
83 2,079 26 54,054 676
84 3,875 32 124 1024
85 3,208 25 80,2 625
86 2,920 27 78,84 729
87 3,345 27 90,315 729
88 3,956 29 114,724 841
89 3,808 19 72,352 361
90 2,506 21 52,626 441
91 3,886 24 93,264 576
92 2,183 27 58,941 729
93 3,429 25 85,725 625
94 3,024 18 54,432 324
95 3,750 29 108,75 841
96 3,833 24 91,992 576
97 3,113 27 84,051 729
98 2,875 21 60,375 441
99 2,747 19 52,193 361
100 2,311 18 41,598 324
101 1,841 25 46,025 625
102 1,583 18 28,494 324
103 2,879 20 57,58 400
104 3,591 32 114,912 1024
105 2,914 24 69,936 576
106 3,716 35 130,06 1225
107 2,800 25 70 625
108 3,621 28 101,388 784
109 3,792 28 106,176 784
110 2,867 25 71,675 625
111 3,419 22 75,218 484
112 3,600 30 108 900
113 2,394 20 47,88 400
114 2,286 20 45,72 400
115 1,486 31 46,066 961
116 3,885 20 77,7 400
117 3,800 29 110,2 841
118 3,914 28 109,592 784
119 1,860 16 29,76 256
120 2,948 28 82,544 784
The director of admissions of a small college selected 120 students at random from the new
freshman class in a study to determine whether a student’s grade point average (GPA) at the end
of the freshman year (Y) can be predicted from the ACT test score (X). The results of the study
follow. Assume that first-order regression model (1.1) is appropriate.
a. Obtain the least squares estimates of β_0 and β_1, and state the estimated regression
function
Jawab :
Nilai yang didapat
X bar 24,725
Y bar 3,074
X bar ^2 611,326
total xy 9213,112
total x^2 75739
∑ ̅̅
Sehingga, b1 = = 0,0388
∑ ̅
b0 = ̅ ̅ = 2,1140
̂ = 2,1140+ 0,0388Xi
Interpretasi
nilai b1 = 0,0388 menyatakan bahwa setiap penambahan 1 ACT score akan menambah IPK
sebesar 0,0388
nilai b0 = 2,114 menyatakan nilai IPK akan bertambah konstan sebesar 2,114
b. Plot the estimated regression function and the data. Does the estimated regression
function appear to fit the data well?
Garis Regresi GPA dan ACT Score
4,500
4,000
3,500 y = 0,0388x + 2,114
R² = 0,0726
3,000
2,500
GPA
2,000
1,500
1,000
0,500
0,000
0 5 10 15 20 25 30 35 40
ACT
Dari scatter plot yang di tampilkan terlihat bahwa titik-titik tersebut menyebar acak dan tidak
membentuk garis linear yang sempurna dengan arah yang sulit diperkirakan sehingga dapat
disimpulkan bahwa adanya hubungan yang lemah antara variasi GPA dengan variasi ACT score.
Oleh karena itu, dapat disimpulkan bahwa akan terdapat masalah dalam memberikan prediksi
yang akurat jika model tersebut tetap digunakan karena terdapat banyak varians dalam data.
c. Obtain a point estimate of the mean freshman GPA for students with ACT test score
X=30
Jawab :
Jika X= 30 maka ̂ ?
̂ 2,1140+ 0,0388(30)
̂ 3,2789
Maka ketika ACT score sama dengan 30 maka GPA yang dihasilkan adalah sebesar 3,27
d. What is the point estimate of the change in the mean response when the entrance test
score increases by one point?
Jawab :
Jika X meningkat satu point atau satu ACT score maka akan meningkatkan Y(GPA) sebesar
0,0388 kali
Pertemuan 3
Data_CopierMaintenance
a. Estimate the change in the mean service time when the number of copiers serviced
increases by one. Use a 90 percent confidence interval. Interpret your confidence
interval.
Jawab :
∑ ̅̅
Sehingga, b1 = = 15,035
∑ ̅
b0 = ̅ ̅ = -0,580
mencari s(bi) !
MSE = = = 79,45063
s(b1) = √ =√ = 0,483087
∑ ̅
b1 – t(1-α/2;n-2)s(b1) ≤ β1 ≤ b1 + t(1-α/2;n-2)s(b1)
14,22313013 ≤ β1 ≤ 15,84736596
Intepretasi
Dengan tingkat keperayaan 90% , setiap penambahan sebuah mesin fotokopi akan meningkatkan
waktu pengolahan (rata-rata) antara 14,2231 sampai dengan 15,8473.
b. Conduct at test to determine whether or not there is a linear association between X and
Y here; control the a risk at .10. State the alternatives, decision rule, and conclusion.
What is the P-value of your test?
Jawab :
Uji hipotesis T
H0 : β1 = 0
H1 : β1 ≠ 0
α = 0,1
Statistik Uji
thitung = = = 31,1232
ttabel = t(1-α/2;n-2) = t(0,90;43) = 1,6811
Keputusan
karena t hitung > t tabel maka keputusan tolak H0
Interpretasi
Dengan tingkat siginifikansi 10% cukup bukti untuk menyatakan bahwa ketika
penambahan satu mesin fotokopi berpengaruh signifikan terhadap waktunya. Sehingga
terdapat hubungan linear antara banyak mesin fotokopi yang diservis dengan total waktu
yang dihabiskan oleh seorang petugas
P-value = 0,01
d. The manufacturer has suggested that the mean required time should not increase by
more than 14 minutes for each additional copier that is serviced on a service call.
Conduct a test to decide whether this standard is being satisfied by Tri-City. Control
the risk of a Type I error at .05. State the alternatives, decision rule, and conclusion.
What is the P-value of the test?
Jawab :
Uji hipotesis T
H0 : β1 ≥ 14
H1 : β1 < 14
α = 0,05
Statistik Uji
thitung = = = 2,142983736
e. Does bo give any relevant information here about the "start-up" time on calls-i. About
the time required before service work is begun on the copiers at a customer location?
Jawab :
Nilai b0 = -0,5802 tidak memberikan makna yang relevan karena waktu pemeliharaan atau
perbaikan tidak mungkin bernilai negatif.
f. Set up the basic ANOVA table in the format of Table 2.2. Which elements of your
table are additive? Also set up the ANOVA table in the format of Table 2.3. How do
the two tables differ?
Jawab :
Elemen yang merupakan aditif adalah correction for mean karena elemen tersebut merupakan
hasil penjumlahan sum of squares (SSTO) dan total uncorrected (SSTOU). Perbedaan dari kedua
tabel yaitu, Tabel 2.2 merupakan tabel dasar yang biasa digunakan oleh berbagai buku-buku
referensi statistik sedangkan Tabel 2.3 merupakan modifikasi dari Tabel 2.2 dimana ada
pemisahan komponen di dalamnya.
Jawab :
Uji hipotesis F
H0 : β1 = 0
H1 : β1 ≠ 0
α = 0,1
Statistik Uji
SSR = ∑ ̅ = 76960,42298
SST = ∑ ̅ = 3416,377023
SSE = SST – SSR = 80376,8
MSR = 76960,42298/1 = 76960,42298
MSE = 3416,377023/43 = 79,45062845
Maka ,
F= = = 968,6572
F-tabel = F(1-alfa;1;n-2) = F(0,90;1;43) = 2.83
Keputusan
karena F-hitung > F-tabel maka keputusan tolak H0
Interpretasi
Dengan tingkat siginifikansi 10%, cukup bukti untuk menyatakan bahwa ketika
penambahan satu mesin fotokopi berpengaruh signifikan terhadap waktunya. Sehingga
terdapat hubungan linear antara banyak mesin fotokopi yang diservis dengan total waktu
yang dihabiskan oleh seorang petugas
h. By how much, relatively, is the total variation in number of minutes spent on a call
reduced when the number of copiers serviced is introduced into the analysis? Is this a
relatively small or large reduction? What is the name of this measure?
Jawab :
R2 = = 0,9574
Ukuran relatif total variasi jumlah menit yang dihabiskan petugas servis yang dapat direduksi
oleh jumlah mesin fotokopi dapat dihitung dengan mencari R2. Hasil yang didapat dari
pembagian tersebut yaitu 0.9575 atau sebesar 95,75%. Karena angka tersebut mendekati
1 0,9575 maka dapat dikatakan bahwa angka tersebut tergolong sangat besar dan menunjukkan
bahwa model yang digunakan sangat baik dalam menjelaskan variabel Y.
Jawab :
R2 = = = 0,9574
Karena nilainya mendekati 1 berarti model regresi yang digunakan sangat baik/tepat. Sehingga
95,74% variasi waktu dapat dijelaskan oleh variasi mesin
∑ ∑ ∑
r= = 0,9785
√ ∑ ∑ ∑ ∑
Berdasarkan hasil yang diperoleh, diketahui bahwa nilai bersifat positif yang artinya kedua
variabel memiliki arah hubungan yang positif dimana ketika ada penambahan jumlah mesin
fotokopi yang dilayani akan meningkatkan total waktu yang diperlukan petugas servis untuk
memperbaikinya.
Jawab :
Dimana r hanya menjelaskan keeratan hubungan antara variasi waktu dan mesin dimana dengan
r = 0,97 menunjukkan adanya hubungan sempurna dan arah yang positif/negatif antara variasi
waktu dan mesin. Sedangkan R2 menunjukkan seberapa besar variasi Y dapat menjelaskan
variasi X, dimana dalam perhitungan R2=0,9574 yang artinya 95,74% variasi waktu dapat
dijelaskan oleh variasi mesin.
Dari kedua perhitungan ini yang lebih menjelaskan adalah yang R2 karena dengan koefisien
determination kita bisa mengetahui seberapa besar variasi Y dijelaskan oleh variasi X. Selain itu,
R2 memiliki interpretasi operasional yang lebih jelas daripada r karena R2 mampu menjelaskan
proporsi keragaman yang dapat dijelaskan oleh model dan R2 juga dapat menilai apakah model
yang diajukan sudah tepat atau belum.
k. Obtain a 90 percent confidence interval for the mean service time on calls in which six
copiers are serviced. Interpret your confidence interval.
Jawab :
Untuk Xh = 6 maka
Sehingga,
̅
S2 ( ̂ ) = + ̅
= + = 1,9499632
∑
S( ̂ ) = 1,3964108
t(1-α/2;n-2) = t(0,90;43) = 1,6811
Dengan tingkat keperayaan 90% , diketahui bahwa waktu servis rata-rata yang dihabiskan oleh
petugas ketika enam mesin fotokopi dilayani berada diantara 87,2838 sampai dengan 91,9787.
l. Obtain a 90 percent prediction interval for the service time on the next call in which six
copiers are serviced. Is your prediction interval wider than the corresponding
confidence interval in part (a)? Should it be?
Jawab :
Untuk Xh = 6 maka
Sehingga,
̅
S2 ( ̂ )= + + ̅
= + = 81,4005
∑
S( ̂ ) = 9,022
Dengan tingkat keperayaan 90% , dapat diketahui bahwa waktu servis rata-rata yang dihabiskan
oleh seorang petugas pada panggilan selanjutnya jika 6 mesin fotokopi diservis adalah berada
antara 74,464 sampai dengan 104,7985.
Selang kepercayaan yang baru lebih lebar dari point k itu disebabkan karena rumus estimasi
standard eror yang baru lebih besar dibandingkan dengan sebelumnya dimana standard eror yang
baru ditambah s2. Akibatnya, margin of error pada selang tersebut bertambah besar.
m. Management wishes to estimate the expected service time per copier on calls in
whích six copiers are serviced. Obtain an appropriate 90 percent confidence
interval by converting the interval obtained in part (a). Interpret the converted
confidence interval
Jawab :
Berdasarkan dari hasil selang kepercayaan dari soal k didapat dengan tingkat keperayaan 90% ,
diketahui bahwa waktu servis rata-rata yang dihabiskan oleh petugas ketika enam mesin fotokopi
dilayani berada diantara 87,2838 sampai dengan 91,9787
Dengan tingkat signifikansi 10% yang baru, maka dapat diketahui ketika jumlah mesin fotokopi
yang diservis berjumlah 6 akan meningkatkan waktu servis rata-rata antara 14.5476 sampai
15.3298 menit per mesin fotokopi.
Pertemuan 4
Data_CopierMaintenance
a. Lakukan diagnosa ada/tidaknya penyimpangan asumsi (homokedastisitas dan normalitas)
melalui perilaku residual. Lakukan penilaian berdasarkan pemahaman saudara.
Jawab :
0
-5 0 20 40 60 80 100 120 140 160
-10
-15
-20
-25
Residual terhadap Xi
20
15
10
5
Residual
0
-5
-10
-15
-20
-25
0 2 4 6 8 10 12
Xi
Berdasarkan diagram pencar antara ̂ dengan residual dan Xi dengan residual yang terbentuk
terlihat bahwa titik-titik yang terbentuk itu menyebar dan tidak berbentuk pola khusus, sehingga
menunjukkan bahwa adanya homoskedastisitas atau asumi varians residual model konstan
terpenuhi.
QQ Plot
3,0
2,0
1,0
Axis Title
0,0
-25 -20 -15 -10 -5 0 5 10 15 20
-1,0
-2,0
-3,0
Axis Title
Berdasarkan normal probability plot dari residual yang terbentuk terlihat bahwa titik-titik
cenderung mengikuti garis lurus sehingga dapat disimpulkan bahwa residual memenuhi asumsi
normalitas. Namun penilaian terhadap plot ini memberikan pandangan yang subjektif
Jadi, dapat disimpulkan tidak adanya penyimpangan asumsi (homokedastisitas dan normalitas)
melalui perilaku residual. Sehingga dapat diketahui bahwa varian error konstan dan residual
memenehi asumsi normalitas
Jawab :
Uji hipotesis F
Tabel ANOVA
Source of variation df SS MS F hitung F tabel
Regression 1 76959,9312 76959,9312 0,9683 2,2167
Error 43 3416,8688 79,462066
Lack of fit 8 619,2105 77,401313
Pure error 35 2797,6583 79,933095
Total 44 80376,8 1826,7455
Keputusan
Kesimpulan
Dengan tingkat signifikansi 5% dapat disimpulkan bahwa belum cukup bukti model RLS tidak
cocok untuk menjelaskan hubungan X(mesin) dan Y(waktu). Maka model yang cocok untuk
menjelaskan hubungan antara waktu dan mesin adalah model RLS.