Anda di halaman 1dari 24

11-8 KORELASI 1

Artinya, distribusi bersyarat dari Y yang diberikan X = x normal dengan


mean
(11-40)
E1kamu0 x2 = β0 + β1x

dan varians 2 0 Y. Jadi,


x mean dari distribusi bersyarat dari Y yang diberikan X = x adalah a
model regresi linier sederhana. Selanjutnya terdapat hubungan antara koefisien korelasi p
dengan kemiringan 1. Dari Persamaan 11-38 kita melihat bahwa jika p = 0, maka 1 = 0,
yang menyiratkan bahwa tidak ada regresi Y pada X. Artinya, pengetahuan tentang X tidak
membantu kita dalam memprediksi Y.
Metode kemungkinan maksimum dapat digunakan untuk memperkirakan parameter 0
dan 1. Dapat ditunjukkan bahwa penduga kemungkinan maksimum dari parameter tersebut
adalah

βˆ 0 = kamu— β ˆ (11-41)
dan 1x

A kamuSaya 1Xi—
n

x2

Saya=1 XY (11-42)
βˆ 1 = n =
SXX
A1Xi— x2
2
Sa
ya
=1

Kami mencatat bahwa penduga intersep dan kemiringan dalam Persamaan 11-41 dan
11-42 identik dengan yang diberikan oleh metode kuadrat terkecil dalam kasus di mana X
diasumsikan sebagai variabel matematis. Artinya, model regresi dengan Y dan X yang
secara bersama-sama terdistribusi normal adalah ekuivalen dengan model dengan X yang
dianggap sebagai variabel matematis. Ini mengikuti karena variabel acak Y yang diberikan
X = x secara independen dan terdistribusi normal dengan
mean 0 + 1x dan varians konstan 2 0 . Hasil
Y x ini juga akan berlaku untuk setiap distribusi bersama.
tion dari Y dan X sedemikian rupa sehingga distribusi bersyarat dari Y yang diberikan X adalah normal.
Hal ini dimungkinkan untuk menarik kesimpulan tentang koefisien korelasi p dalam
model ini. Penaksir p adalah koefisien korelasi sampel
n
A kamuSaya 1xSaya — x2 S
Saya= XY
R= n 1 n 1/2= SXX 2
(11-43)
1
CA A 1kamuSaya
Sa 1Xi— x22 Sa
SST1/2
ya
=1
ya
=1
— kamu2 2D
Perhatikan bahwa
SST 1/2
1ˆ = se B R (11-44)
XX
ba
So lerengˆ 1 hanyalah koefisien korelasi sampel R dikalikan dengan faktor skala yang
merupakan akar kuadrat dari "penyebaran" nilai Y dibagi dengan "penyebaran" nilai X.
Jadi,ˆ 1 dan R terkait erat, meskipun mereka memberikan informasi yang agak berbeda.
Koefisien korelasi sampel R mengukur hubungan linier antara Y dan X, sedangkan ˆ 1
mengukur perubahan yang diprediksi dalam rata-rata Y untuk perubahan satuan di X. Dalam
2 BAB 11 REGRESI LINIER SEDERHANA DAN KORELASI
kasus matematika
variabel matematis x, R tidak memiliki arti karena besarnya R tergantung pada pilihan jarak
dari x. Kami juga dapat menulis, dari Persamaan 11-44,
Sx x
R2 = β ˆ 2 = ˆ
1 β SSR
SST =
1Sx ka SS T
mu
SST
yang hanya merupakan koefisien determinasi. Artinya, koefisien determinasi R2 hanyalah
kuadrat dari koefisien korelasi antara Y dan X.
Hal ini sering berguna untuk menguji hipotesis

H0: p= 0
H1: pG 0 (11-45)
Statistik uji yang tepat untuk hipotesis ini adalah

Statistik Uji
untuk
Korelasi T=R1n— 2
0 (11-46)
Nol 21— R2

yang memiliki distribusi t dengan n — 2 derajat kebebasan jika H0: p= 0 benar. Oleh karena
itu, kita akan menolak hipotesis nol jika |t0| > tα/2,n—2. Pengujian ini ekuivalen dengan
pengujian hipotesis H0: 1 = 0 yang diberikan pada Bagian 11-5.1. Kesetaraan ini mengikuti
langsung dari Persamaan 11-46.
Prosedur pengujian hipotesis

H0: p= p0
H1: pG p0 (11-47)

di mana p0 0 agak lebih rumit. Untuk sampel yang cukup besar (katakanlah, n 25), statistik

Z= arctanh R = 1 ln 1 + R
(11-48)
2 1-R

kira-kira terdistribusi normal dengan mean dan varians

= arctanh p= 1ln 1 + p 1
dan 2=
Z
2 1 -P Z
n—3

masing-masing. Oleh karena itu, untuk menguji hipotesis H0: p= p0, kita dapat menggunakan statistik
uji

Z0 = 1arctanh R — arctanh p02 1n — 321/2 (11-49)

dan tolak H0: p= p0 jika nilai statistik uji pada Persamaan 11-49 sedemikian rupa sehingga |z0| > zα/2.
Dimungkinkan juga untuk membuat perkiraan interval kepercayaan 100(1 — )% untuk p,
menggunakan
transformasi dalam Persamaan 11-48. Perkiraan interval kepercayaan 100(1 — )% adalah
Interval

tanh aarctanh r — zα/2 b p≤ tanh aarctanh r + zα/2 B


1n— 3 1n— 3 (11-50)

Keyakinan
untuk dimana tanh u = (eu — e—u )/(eu + e—u ).
Koefisien
Korelasi
70

60

50

Kekuatan 40

30

20

Gambar 11-13Menyebarkan10
plot ikatan kawat
00
kekuatan versus kawat
5 10 15 20
panjang, Contoh 11-8.
Panjang kabel

CONTOH 11-8Kekuatan Tarik Ikatan Kawat


Dalam Bab 1 (Bagian 1-3) aplikasi regresianalisis dijelaskan
di mana seorang insinyur di pabrik perakitan semikonduktor
sedang menyelidiki hubungan antara kekuatan tarikan a Sekarang Sxx = 698,56 danseksi= 2027,7132, dan
koefisien korelasi sampel adalah
ikatan kawat dan dua faktor: panjang kawat dan tinggi mati. Di S 2027.7132
3 S xy
bekas ini
cukup, kami hanya akan mempertimbangkan salah satu faktor, R= = = 0,9818
SS xx4 1/2 T 3 1 698.560216105.9241/2
panjang kawat. Sampel acak 25 unit dipilih dan diuji, dan
kabelnyakekuatan tarik ikatan dan panjang kawat diamati
untuk setiap unit. Data ditunjukkan pada Tabel 1-2. Kami Perhatikan bahwa r2 = (0,9818)2 = 0,9640 (yang dilaporkan
berasumsi bahwa kekuatan tarik dan panjang kawat secara dalam keluaran Minitab), atau sekitar 96,40% dari
bersama-sama terdistribusi secara normal. variabilitas dalam kekuatan tarik dijelaskan oleh hubungan
Gambar 11-13 menunjukkan diagram pencar kekuatan linier dengan panjang kawat.
ikatan kawat versus panjang kawat. Kami telah Sekarang anggaplah kita ingin menguji hipotesis
menggunakan opsi Minitab untuk menampilkan plot kotak
H0: p = 0
dari setiap variabel individu pada diagram pencar. Ada bukti
hubungan linier antara kedua variabel. H1: p G 0
Output Minitab untuk menyesuaikan model regresi
linier sederhana dengan data ditunjukkan di bawah ini.

Analisis Regresi: Kekuatan versus Panjang


Persamaan regresinya adalah
Kekuatan = 5,11 + 2,90
Panjang
Prediktor koefisi Koef SE T P
en
Konstan 5.115 1.146 4.46 0,000
Panjang 2.9027 0.1170 24.80 0,000
S = 3.093 R-Sq = 96,4% R-Sq(adj) = 96,2%
TEKAN = 272.144 R-Sq (sebelumnya) = 95,54%
Analisis Varians
Sumber DF SS NO F P
NA
Regresi 1 5885.9 5885.9 615.08 0,000
Kesalahan sisa 23 220.1 9.6
Total 24 6105.9
dengan = 0,05. Kita dapat menghitung t-statistik dari
Akhirnya, kita dapat membuat perkiraan interval
Persamaan 11-46 sebagai
kepercayaan 95% pada p dari Persamaan 11-50. Karena
arctanh r = arctanh 0.9818 = 2.3452, Persamaan 11-50
menjadi
T = R1n— 2 = 0,9818123 = 24,8
0
21— r 11— 0,9640 tanh a2,3452 — 1,96 b p tanh a2,3452 + 1,96 b
2

Statistik ini juga dilaporkan dalam keluaran Minitab sebagai 122 122
uji H0: 1 = 0. Karena t0.025,23 = 2.069, kami menolak H0 yang
dan menyimpulkan bahwa koefisien korelasi p G 0. mengurangi
menjadi 0,9585 p 0,9921

DAS Sungai Ular di Wyoming selama 1919 hingga 1935. (Data


LATIHAN UNTUK BAGIAN 1-8 diambil dari artikel di Catatan Penelitian , Vol.61, 1950, Stasiun
Percobaan Rentang Hutan Pacific Northwest, Oregon.)
11-66.Misalkan data diperoleh dari 20 pasang (x,y) dan
koefisien korelasi sampel adalah 0,8.
(a) Uji hipotesis bahwa H0 : p = 0 terhadap H1 : p G 0
dengan
= 0,05. Menghitungnilai-P.
(b) Uji hipotesis bahwa H1: p = 0,5 terhadap H1: p G 0,5
dengan = 0,05. Hitung nilai-P.
(c) Buatlah interval kepercayaan dua sisi 95% untuk
koefisien korelasi. Jelaskan bagaimana pertanyaan di
bagian
(a) dan (b) dapat dijawab dengan selang
kepercayaan.11-67.Misalkan data diperolehdari 20 pasang
(x,y) dan koefisien korelasi sampel adalah 0,75.
(a) Uji hipotesis bahwa H0: p = 0 terhadap H1: p > 0 dengan
= 0,05. Menghitungnilai-P.
(b) Uji hipotesis bahwa H1: p = 0,5 terhadap H1: p > 0,5
dengan = 0,05. Hitung nilai-P.
(c) Buatlah interval kepercayaan satu sisi 95% untuk
koefisien korelasi. Jelaskan bagaimana pertanyaan pada
bagian (a) dan (b) dapat dijawab dengan selang
kepercayaan.
11-68.Sebuah sampel acak dari n = 25 pengamatan
dilakukan pada waktu untuk kegagalan komponen elektronik
dan suhu di lingkungan aplikasi di mana komponen tersebut
digunakan.
(a) Mengingat r = 0,83, uji hipotesis bahwa p = 0,
menggunakan
= 0,05. Berapa nilai P untuk tes ini?
(b) Carilah selang kepercayaan 95% pada hal.
(c) Uji hipotesis H0: p = 0,8 versus H1: p 0,8, menggunakan
= 0,05. Temukan nilai-P untuk tes ini.
11-69.Sebuah sampel acak dari 50 pengamatan dilakukan
pada diameter las titik dan kekuatan geser las yang sesuai.
(a) Mengingat r = 0,62, uji hipotesis bahwa p = 0,
menggunakan
= 0,01. Berapa nilai P untuk tes ini?
(b) Carilah selang kepercayaan 99% untuk p.
(c) Berdasarkan selang kepercayaan pada bagian (b),
dapatkah Anda menyimpulkan bahwa p = 0,5 pada
tingkat signifikansi 0,01?
11-70.Data berikut memberikan X = kadar air salju pada 1
April dan Y = hasil dari April hingga Juli (dalam inci) di
x kamu x kamu
23.1 10.5 37.9 22.8
32.8 16.7 30.5 14.1
31.8 18.2 25.1 12.9
32.0 17.0 12.4 8.8
30.4 16.3 35.1 17.4
24.0 10.5 31.5 14.9
39.5 23.1 21.1 10.5
24.2 12.4 27.6 16.1
52.5 24.9

(a) Perkirakan korelasi antara Y dan X.


(b) Uji hipotesis bahwa p = 0, dengan menggunakan = 0,05.
(c) Sesuaikan model regresi linier sederhana dan uji
signifikansi regresi menggunakan = 0,05.
Kesimpulan apa yang dapat Anda tarik? Bagaimana
uji signifikansi regresi terkait dengan uji p pada
bagian (b)?
(d) Analisis residu dan komentari kecukupan model.11-
71.Tes akhir dan rata-rata ujian untuk 20 siswa yang
dipilih secara acak yang mengambil kursus statistik
teknik dan a
kursus dalam riset operasi ikuti. Asumsikan bahwa final
rata-ratabersama-sama terdistribusi normal.
(a) Temukan garis regresi yang berhubunganrata-rata
akhir statistik ke OR rata-rata akhir. Grafik datanya.
(b) Uji signifikansi regresi menggunakan = 0,05.
(c) Perkirakan koefisien korelasi.
(d) Uji hipotesis bahwa p = 0, dengan menggunakan = 0,05.
(e) Uji hipotesis bahwa p = 0,5, dengan menggunakan = 0,05.
(f) ) Buatlah selang kepercayaan 95% untuk koefisien
korelasi.

Statistik ATA Statistik ATA Statistik ATA


U U U
86 80 86 81 83 81
75 81 71 76 75 70
69 75 65 72 71 73
75 81 84 85 76 72
90 92 71 72 84 80
94 95 62 65 97 98
83 80 90 93
11-72.Berat badan dan tekanan darah sistolik dari 26 laki-
(a) Grafik data dan sesuaikan garis regresi untuk
laki yang dipilih secara acak dalam kelompok usia 25 sampai
memprediksi arus tanpa elektronik untuk mensuplai
30 ditunjukkan pada tabel berikut. Asumsikan bahwa berat
tegangan. Apakah terdapat regresi yang signifikan
dan tekanan darah
pada = 0,05? Berapa nilai P?
bersama-sama terdistribusi normal. (b) Perkirakan koefisien korelasi.
(c) Uji hipotesis bahwa p = 0 terhadap alternatif
sistolik sistolik p G 0 dengan = 0,05. Berapa nilai P?
Subjek Berat BP Subjek Berat BP (d) Hitung interval kepercayaan 95% untuk koefisien
1 165 130 14 172 153 korelasi.
2 167 133 15 159 128 11-74.Perkiraan absolut bulanan indeks suhu global
3 180 150 (darat dan laut) (derajat C) pada tahun 2000 dan 2001
16 168 132
adalah (sumber:http://www.ncdc.noaa.gov/ oa/iklim/):
4 155 128 17 174 149
5 212 151 18 183 158 2000: 12.28, 12.63, 13.22, 14.21, 15.13, 15.82, 16.05,
6 175 146 19 215 150 16.02, 15.29, 14.29, 13.16, 12.47
7 190 150 20 195 163 2001: 12.44, 12.55, 13.35, 14.22, 15.28, 15.99, 16.23,
8 210 140 16.17, 15.44, 14.52, 13.52, 12.61
21 180 156
9 200 148 22 143 124 (a) Buat grafik data dan sesuaikan garis regresi untuk
10 149 125 23 240 170 memprediksi suhu tahun 2001 dari suhu tahun 2000.
11 158 133 Apakah ada regresi yang signifikan pada = 0,05?
24 235 165
Berapa nilai P?
12 169 135 25 192 160 (b) Perkirakan koefisien korelasi.
13 170 150 26 187 159 (c) Uji hipotesis bahwa p = 0,9 terhadap alternatif
p G 0,9 dengan = 0,05. Berapa nilai P?
(d) Hitung interval kepercayaan 95% untuk koefisien
(a) Temukan garis regresi yang menghubungkan tekanan
korelasi.
darah sistolik dengan berat badan.
(b) Uji signifikansi regresi menggunakan = 0,05. 11-75Lihat data peringkat quarterback NFL di Latihan
(c) Perkirakan koefisien korelasi. 11-3.
(d) Uji hipotesis bahwa p = 0, dengan menggunakan = 0,05. (a) Perkirakan koefisien korelasi antara peringkat dan
(e) Uji hipotesis bahwa p = 0,6 dengan menggunakan = 0,05. yard rata-rata per percobaan.
(f) Buatlah selang kepercayaan 95% untuk koefisien (b) Uji hipotesis H0: p = 0 versus H1: p G 0 menggunakan
korelasi. = 0,05. Berapa nilai P untuk tes ini?
(c) Buatlah selang kepercayaan 95% untuk p.
11-73.Dalam sebuah artikel di IEEE Transactions on
(d) Uji hipotesis H0: p = 0,7 versus H1: p G 0,7
Instrumentation dan Pengukuran (2001, Vol. 50, pp. 986-
menggunakan = 0,05. Temukan nilai-P untuk tes ini.
990), para peneliti mempelajari efek pengurangan penarikan
arus dalam inti magnetik dengan cara elektronik. Mereka 11-76.Perhatikan data (x,y) berikut. Hitung koefisien
mengukur arus dalam belitan magnet dengan dan tanpa korelasi. Grafik data dan komentari hubungan antara x
elektronik dalam eksperimen berpasangan. Data untuk kasing dan y. Jelaskan mengapa koefisien korelasi tidak
tanpa elektronik disediakan dalam tabel berikut. mendeteksi hubungan antara x dan y.

Saat ini hout


Tegangan Kecerdasan (mA)
1.32
Pasokan 12.22
Elektronik x kamu x kamu
1.98
0,66 16.34
7.32 —4 0 0 —4
2.64 23.66 —3 —2.65 1 3.87
3.3 28.06 —3 2.65 1 —3.87
3.96 33.39 —2 —3.46 2 3.46
4.62 34.12 —2 3.46 2 —3.46
3.28 39.21 —1 —3.87 3 2.65
5,94 44.21 —1 3.87 3 —2.65
6.6 47.48 0 4 4 0
11-9 REGRESI PADA VARIABEL YANG DITRANSFORMASI 437

11-9 REGRESI PADA VARIABEL YANG DITRANSFORMASI

Kami kadang-kadang menemukan bahwa model regresi garis lurus Y = 0 + 1x + tidak tepat
karena fungsi regresi yang sebenarnya adalah nonlinier. Terkadang nonlinier secara visual
ditentukan dari diagram pencar, dan terkadang, karena pengalaman sebelumnya atau teori
yang mendasari, kita tahu sebelumnya bahwa modelnya nonlinier. Kadang-kadang, diagram
pencar akan menunjukkan hubungan nonlinier yang jelas antara Y dan x. Dalam beberapa
situasi ini, fungsi nonlinier dapat dinyatakan sebagai garis lurus dengan menggunakan
transformasi yang sesuai. Model nonlinier seperti itu disebut linier intrinsik.
Sebagai contoh model nonlinier yang linear secara intrinsik, perhatikan fungsi
eksponensial
kamu= 0eβ1xε
Fungsi ini secara intrinsik linier, karena dapat diubah menjadi garis lurus dengan
logaritmatransformasi
ln Y = ln 0 + 1 x + ln
Transformasi ini mensyaratkan bahwa istilah kesalahan yang ditransformasi ln terdistribusi
secara normal dan independen dengan rata-rata 0 dan varians 2.
Fungsi linear intrinsik lainnya adalah

kamu= +a 1 b+
0 1 x

Dengan menggunakan transformasi resiprokal z = 1/x, model dilinearisasi menjadi


kamu= 0 + 1z +
Kadang-kadang beberapa transformasi dapat digunakan bersama-sama untuk linierisasi
suatu fungsi. Sebagai contoh, perhatikan fungsi
1
ka
mu exp 1β0 +1 x+ ε2
Membiarkan Y* = 1/Y, kita memiliki bentuk linier
ln Y * = 0 + 1x +
Untuk contoh pemasangan model ini, lihat Montgomery, Peck, dan Vining (2006) atau
Myers (1990).
Transformasi bisa sangat berguna dalam banyak situasi di mana hubungan sebenarnya
antara respon Y dan regressor x tidak didekati dengan baik oleh garis lurus. Kegunaan
transformasi diilustrasikan dalam contoh berikut.

CONTOH 11-9 Tenaga Kincir Angin


Seorang insinyur riset sedang menyelidiki penggunaan kincir
data. Regresi modelnya adalah
angin untuk menghasilkan listrik dan telah mengumpulkan data
tentang keluaran DC dari kincir angin ini dan kecepatan angin
kamuˆ = 0,1309 + 0,2411 x
yang sesuai. Data diplot pada Gambar 11-14 dan tercantum
dalam Tabel 11-5 (hal.439). Pemeriksaan diagram pencar
Statistik ringkasan untuk model ini adalah R2 = 0,8745,
menunjukkan bahwa hubungan antara keluaran DC Y dan
NONAE = σˆ 2 = 0,0557, dan F0 = 160,26 (nilai P adalah
kecepatan angin (x) mungkin nonlinier. Namun, kami awalnya
<0,0001).
menyesuaikan model garis lurus dengan
438 BAB 11 REGRESI LINIER SEDERHANA DAN KORELASI

3.0
0.4

2.0 0.2
keluaran DC,kamu

0,0
1.0 eSaya

–0.2

0,0
0 2 –0.4
4 6 8 10
Kecepatan angin,x
Gambar 11-14Plot keluaran DC y versus kecepatan –0.6
angin x
untuk data kincir angin. 0.4 0.8 1.2 1.6 2.0 2.4
kamu

Gambar 11-15Plot residu ei versus pasvalues yˆi


untuk data kincir angin.

Plot dari residual versus yˆi ditunjukkan pada Gambar Gambar 11-16 adalah diagram pencar denganvariabel yang
11-15. Plot residual ini menunjukkan ketidakcukupan model ditransformasi x¿ = 1/x. Plot ini tampak linier, menunjukkan
bahwa transformasi timbal balik sesuai. Model regresi pas
dan menyiratkan bahwa hubungan linier belum menangkap
adalah
semua informasi dalam variabel kecepatan angin. Perhatikan
bahwa kelengkungan yang tampak pada diagram pencar pada kamuˆ = 2.9789 — 6.9345 x¿
Gambar 11-14 sangat diperkuat dalam plot residual. Jelas
Ringkasan statistik untuk model ini adalah R2 = 0,9800,
beberapa bentuk model lain harus dipertimbangkan.
MSE= σˆ 2 = 0,0089, dan F0 = 1128,43 (nilai P adalah
Kami awalnya mungkin mempertimbangkan untuk
menggunakan model kuadrat seperti: <0,0001).
Plot residual dari model yang ditransformasikan versus
kamu= 0 + 1 x + 2 x2 + yˆ ditunjukkan pada Gambar 11-17. Plot ini tidak
mengungkapkan masalah serius dengan ketidaksetaraan
untuk memperhitungkan kelengkungan yang tampak.
varians. Plot probabilitas normal, ditunjukkan pada Gambar
Namun, diagram pencar pada Gambar 11-14 menunjukkan
11-18, memberikan indikasi ringan bahwa kesalahan berasal
bahwa saat kecepatan angin meningkat, keluaran DC
dari distribusi dengan ekor yang lebih berat dari normal
mendekati batas atas sekitar 2,5. Hal ini juga sesuai dengan
(perhatikan kurva sedikit ke atas dan ke bawah di ekstrem).
teori operasi kincir angin. Karena model kuadrat pada
Plot probabilitas normal ini memiliki nilai z-score yang
akhirnya akan menekuk ke bawah saat kecepatan angin
diplot pada sumbu horizontal. Karena tidak ada sinyal kuat
meningkat, model ini tidak sesuai untuk data ini. Model yang
dari ketidakcukupan model, kami menyimpulkan bahwa
lebih masuk akal untuk data kincir angin yang
model yang ditransformasikan memuaskan.
menggabungkan asimtot atas adalah
kamu= +a 1 b+
0 1 x
0.4
3.0

0.2

2.0
0
keluaran DC,kamu

eSaya
–0.2
1.0

–0.4

–0.6
0,0 1 2 3
0,10 0,20 0,30 0,40 0,50 0
1 kamuSaya
x' =x data kincir angin.
gambare 11-16 Plot keluaran DC versus x¿ = 1/ xFOr
Gambar 11-17 Plot residu
versus nilai pas yˆi untuk model
transformasi untuk data kincir
angin.
11-9 REGRESI PADA VARIABEL YANG DITRANSFORMASI 439

0.4
Nomor Kecepatan Keluaran
Pengamata angin(mph) DC,
0.2 n, i , xi yi
4 2.70 0,500
0 5 10.00 2.236
eSaya 6 9.70 2.386
–0.2 7 9.55 2.294
8 3.05 0,558
–0.4 9 8.15 2.166
10 6.20 1,866
–0.6 11 2.90 0,653
– 12 6.35 1.930
2 -1 0 1 2
zSaya 13 4.60 1.562
Gambar 11-18 Plot probabilitas normal 14 5.80 1.737
dari residu untuk model yang 15 7.40 2.088
ditransformasikan untuk data kincir angin. 16 3.60 1.137
Meja11-5Nilai yang Diamatikamudan Variabel Regresorx 17 7.85 2.179
Saya Saya
Misalnya11-9 18 8.80 2.112
19 7,00 1.800
Pengamatan Kecepatan Keluaran
Nomor, angin(mph) DC, 20 5,45 1.501
saya , xi yi 21 9.10 2.303
1 5.00 1,582 22 10.20 2.310
2 6.00 1,822 23 4.10 1.194
3 3.40 1.057 24 3.95 1.144
25 2.45 0,123
lanjutan

LATIHAN UNTUK BAGIAN 1-9


11-77.Tentukan apakah model-model berikut linear secara
intrinsik. Jika ya, tentukan transformasi yang tepat untuk (b) Pasangkan model regresi linier sederhana untuk data ini.
menghasilkan model linier. (c) Uji signifikansi regresi menggunakan = 0,05.
Kesimpulan apa yang dapat Anda tarik?
(a) kamu= (d) Plotkan residual dari model regresi linier sederhana
(b) kamu= 3 + 5x +
0xβ1ε x x versus yˆi. Apa yang Anda simpulkan tentang kecukupan model?
(d) kamu= (e) Hubungan Clausis–Clapeyron menyatakan bahwa ln1 Pv2 — 1T ,
(c) Y = xϵ
01
0x + 1 + xϵ dimana Pv adalah tekanan uap air. Ulangi bagian
11-78. Tekanan uap air pada berbagai suhu berikut: (a)–(d). menggunakan transformasi yang sesuai.
11-79.Sebuah utilitas listrik tertarik untuk mengembangkan
Pengamatan Tekanan uap modelmenghubungkan permintaan jam puncak (y dalam
Nomor, Suhu (K) (mmHg)
kilowatt) dengan total bulananpenggunaan energi selama
saya
sebulan (x, dalam kilowatt jam). Data untuk 50 pelanggan
1 273 4.6 residensial disajikan pada tabel berikut.
2 283 9.2
3 293 17.5
4 303 31.8
5 313 55.3
6 323 92,5
7 333 149,4
8 343 233.7
9 353 355.1
10 363 525.8
11 373 760.0

(a) Gambarkan diagram pencar dari data tersebut. Jenis


hubungan apa yang cocok untuk menghubungkan y ke x?
Pelangga x kamu Pelangga x kamu
n n
1 679 0,79 26 1434 0.31
2 292 0,44 27 837 4.20
3 1012 0,56 28 1748 4.88
4 493 0,79 29 1381 3.48
5 582 2.70 30 1428 7.58
6 1156 3.64 31 1255 2.63
7 997 4.73 32 1777 4.99
8 2189 9.50 33 370 0,59
9 1097 5.34 34 2316 8.19
10 2078 6.85 35 1130 4.79
lanjutan
440 BAB 11 REGRESI LINIER SEDERHANA DAN KORELASI

(a) Gambarlah diagram pencar dari y versus x.


Pelangga x kamu Pelangga x kamu
(b) Sesuai dengan model regresi linier sederhana.
n n
(c) Uji signifikansi regresi menggunakan = 0,05.
11 1818 5.84 36 463 0,51 (d) Plot residu versus yˆSaya dan mengomentari asumsi
12 1700 5.21 37 770 1.74 regresi yang mendasarinya. Secara khusus, apakah
13 747 3.25 38 724 4.10 tampaknya asumsi kesetaraan varians terpenuhi?
14 2030 4.43 39 808 3.94 (e) Temukan model regresi linier sederhana dengan
15 1643 3.16 40 790 0,96 menggunakan 1y sebagai responsnya. Apakah
16 414 0,50 41 783 3.29 transformasi pada y ini menstabilkan masalah
17 354 0.17 42 406 0,44 ketidaksetaraan varians yang disebutkan pada bagian (d)
18 1276 1.88 43 1242 3.24 di atas?
19 745 0,77 44 658 2.14
20 795 3.70 45 1746 5.71
21 540 0,56 46 895 4.12
22 874 1.56 47 1114 1.90
23 1543 5.28 48 413 0,51
24 1029 0,64 49 1787 8.33
25 710 4.00 50 3560 14.94

11-10 LOGISTIK REGRESI

Regresi linier sering kali bekerja dengan sangat baik ketika variabel responnya
adalahkuantitatif.Kami sekarang mempertimbangkan situasi di mana variabel respons
hanya mengambil dua nilai yang mungkin, 0 dan
1. Ini bisa menjadi tugas sewenang-wenang yang dihasilkan dari mengamati
akualitatiftanggapan. Misalnya, respons dapat berupa hasil uji kelistrikan fungsional pada
perangkat semi konduktor yang hasilnya "berhasil", yang berarti perangkat berfungsi dengan
baik, atau "kegagalan", yang dapat disebabkan oleh pendek, terbuka, atau masalah
fungsional lainnya.
Misalkan model memiliki bentuk

Yi= 0+ 1 xi + i (11-51)

dan variabel respon Yi mengambil nilai 0 atau1. Kita asumsikan variabel respon Yi adalah
variabel acak Bernoulli dengan distribusi probabilitas sebagai berikut:

Yi Kemungkinan
1P1kamuSaya = 12 = πSaya
0 P 1 kamuSaya = 0 2 = 1 — i

Tidakw karena E 1ϵi2 = 0, nilai yang diharapkan dari variabel respon adalah

E1Yi2 = 1 1πi2 + 0 11 — i2
=i
Ini menyiratkan
bahwa
E1Yi2 = β0 + β1xi= i
Ini berarti bahwa respon yang diharapkan yang diberikan oleh fungsi respon E(Yi) = 0 + 1xi
hanyalah probabilitas bahwa variabel respon mengambil nilai 1.
Ada beberapa masalah substantif dengan model regresi pada Persamaan 11-51. Pertama,
perhatikan bahwa jika responsnya biner, suku kesalahan i hanya dapat mengambil dua nilai,
yaitu,

i = 1 — 1β0 + 1 xi2 kapann Yi = 1


εSaya = —1β0 + β1 xi2 kapann Yi = 0

Akibatnya, kesalahan dalam model ini tidak mungkin normal. Kedua, varians kesalahan
tidak konstan, karena
2
2Y= E5Y —
S E1Y 26
S
i a a
= 11 — i22i + 10 — i22 11 — i2
= i11 — i2

Perhatikan bahwa ekspresi terakhir ini adil


σ2y = E1Y S231 — E1Y
S
24
i a a
sejake E1Yi2 = 0 + 1xi = i. Hal ini menunjukkan bahwa varians pengamatan (yang sama
dengan varians kesalahan karena i = Yi — i, dan i adalah konstanta) adalah fungsi dari
mean. Akhirnya, ada kendala pada fungsi respon, karena

0 E 1Yi2 = i 1
Pembatasan ini dapat menyebabkan masalah serius dengan pilihan fungsi respons linier,
seperti yang telah kita asumsikan pada Persamaan 11-51. Akan dimungkinkan untuk
menyesuaikan model dengan data yang nilai prediksi dari responsnya berada di luar interval
0, 1.
Umumnya, ketika variabel respon adalah biner, ada banyak bukti empiris yang
menunjukkan bahwa bentuk fungsi respon harus nonlinier. Fungsi berbentuk S yang naik
(atau menurun) secara monoton (atau bentuk S terbalik), seperti yang ditunjukkan pada
Gambar 11-19, biasanya digunakan. Fungsi ini disebutfungsi respons logit,dan memiliki
bentuk

exp 1β + x2
0
E1 1 + exp 1β0 + 1 x2 (11-52)
1
kamu2=
1.2 1.2

1 1

0.8
0.8
E(kamu)
0,6 E(kamu) 0,6

0.4 0.4

0.2
0.2
0
0 2 4 6 8 10 12 0
14 0 2 4 6 8 10 12 14
x x
(A) (B)

gambare 11-19 Contoh fungsi respons logistik. (a) E1Y 2 = 1/ 11 + e—6.0—1.0x2, (b) E1Y 2 = 1/ 11 + e—6.0+1.0x2.
atau setara,

1 1 + exp 3
E1kam (11-53)
—1β0 + 1x24
u2 =
Di dalamregresi logistikkita asumsikan bahwa E(Y ) berhubungan dengan x dengan
logitfungsi. Sangat mudah untuk menunjukkan bahwa

1 kamu
1E— 2 2= exp1β0 + 1x2
E1Y (11-54)

Besaran exp( 0 + 1x) pada ruas kanan Persamaan 11-54 disebutrasio peluang.Ini memiliki
interpretasi langsung: Jika rasio odds adalah 2 untuk nilai x tertentu, itu berarti bahwa
keberhasilan dua kali lebih mungkin daripada kegagalan pada nilai regressor x tersebut.
Perhatikan bahwa logaritma natural dari odds ratio adalah fungsi linier dari variabel
regressor. Oleh karena itu kemiringan 1 adalah perubahan dalam log odds yang dihasilkan
dari peningkatan satu unit di x. Ini berarti bahwa odds ratio berubah sebesar eβ1 ketika x
bertambah satu unit.
Parameter dalam model regresi logistik ini biasanya diestimasi dengan metode
kemungkinan maksimum. Untuk detail prosedur, lihat Montgomery, Peck, dan Vining
(2006). Minitab akan sesuai dengan model regresi logistik dan memberikan informasi yang
berguna tentang kualitas kecocokan.
Kami akan menggambarkan logistikregresi menggunakan data suhu peluncuran dan
kegagalan cincin-O untuk 24 peluncuran pesawat ulang-alik sebelum bencana Challenger
pada Januari 1986. Ada enam cincin-O yang digunakan untuk menyegel sambungan medan
pada rakitan motor roket. Tabel di bawah ini menyajikan suhu peluncuran. Angka 1 di
kolom “Kegagalan Cincin-O” menunjukkan bahwa setidaknya satu kegagalan cincin-O
telah terjadi pada peluncuran tersebut.

Cincin- Cincin- Cincin-


Suhu OKega Suhu OKega Suhu OKega
galan galan galan
53 1 68 0 75 0
56 1 69 0 75 1
57 1 70 0 76 0
63 0 70 1 76 0
66 0 70 1 78 0
67 0 70 1 79 0
67 0 72 0 80 0
67 0 73 0 81 0

Gambar 11-20 adalah diagram pencar dari data. Perhatikan bahwa kegagalan cenderung
terjadi pada suhu yang lebih rendah. Model regresi logistik yang sesuai dengan data dari
Minitab ini ditunjukkan pada tampilan kotak berikut.
Model regresi logistik yang cocok adalah

1
kam
1 + exp 3 —110.875 — 0.17132 x24
Logistik Biner Regresi: Kegagalan O-Ring versus Suhu
Fungsi Tautan:

LogitInformasi Tanggapan
Variabel Nilai Menghitung
O-Ring F 1 7 (Peristiwa)
0 17
Total 24
Tabel Regresi Logistik
Kemu 95% CI
ngkin
an
Prediktor koefisien Koef SE Z P Perba Lebih Atas
nding rendah
an
Konstan 10.875 5.703 1.91 0,057
sedang —0.17132 0,08344 —2,05 0,040 0,84 0.72 0,99
Log-Kemungkinan = —11.515
Uji bahwa semua kemiringan adalah nol: G = 5,944, DF = 1, P-Value = 0,015

NSe kesalahan standar kemiringan 1 adalah se(βˆ1) = 0,08344. Untuk sampel yang besar, 1
memiliki perkiraan distribusi normal, sehingga 1/se(βˆ1) dapat dibandingkan dengan
distribusi normal standar untuk menguji H0: 1 = 0. Minitab melakukan pengujian ini. Nilai
P adalah 0,04, menunjukkan bahwa
suhu memiliki pengaruh yang signifikan terhadap kemungkinan cincin-Okegagalan. Rasio
odds adalah 0,84, jadi setiap kenaikan satu derajat suhu mengurangi kemungkinan
kegagalan sebesar 0,84. Gambar 11-21 menunjukkan model regresi logistik yang sesuai.
Peningkatan tajam dalam kemungkinan kegagalan cincin-O sangat jelas terlihat pada grafik
ini. Suhu sebenarnya pada peluncuran Challenger adalah 31°F. Ini jauh di luar kisaran suhu
peluncuran lainnya, jadi model regresi logistik kami kemungkinan tidak akan memberikan
prediksi yang sangat akurat pada suhu tersebut, tetapi jelas bahwa peluncuran pada suhu
31°F hampir pasti akan mengakibatkan kegagalan cincin-O .
Sangat menarik untuk dicatat bahwa semua data ini tersedia sebelum diluncurkan.
Namun, para insinyur tidak dapat menganalisis data secara efektif dan menggunakannya
untuk memberikan argumen yang meyakinkan terhadap peluncuran Challenger kepada
manajer NASA. Namun analisis regresi sederhana

1.0
1.0
Kegagalan cincin-O

P(Kegagalan cincin-O)

0,5
0,5

0,0 6 S hu
50 0 u
70 80 0 hu
0,0 S
50 6 u 70 80
Gambar 11-20Plot sebaran kegagalan Gambar 11-21 Probabilitas kegagalan O-ring versus
cincin-O versus suhu peluncuran untuk 24 suhu peluncuran (berdasarkan model regresi logistik).
penerbangan pesawat ulang-alik.
data akan memberikan dasar kuantitatif yang kuat untuk argumen ini. Ini adalah salah satu
contoh dramatis yang menunjukkan mengapa insinyur dan ilmuwan membutuhkan latar
belakang yang kuat dalam teknik statistik dasar.

LATIHAN UNTUK BAGIAN 11–10


11-80Sebuah penelitian dilakukan untuk mencoba menghubungkan
Beban, x Ukuran n Nomor Gagal, R
kepemilikan rumah dengan pendapatan keluarga. Dua puluh rumah
(psi) sampel,
tangga dipilih dan pendapatan keluarga diperkirakan, bersama
dengan informasi tentang kepemilikan rumah (y = 1 menunjukkan ya 2500 50 10
2700 70 17
dan y = 0 menunjukkan tidak). Datanya ditunjukkan di bawah ini.
2900 100 30
3100 60 21
3300 40 18
3500 85 43
Status 3700 90 54
Kepemilik 3900 50 33
Rumah Penghasilan an Rumah 4100 80 60
tangga 4300 65 51
1 38.000 0
2 51.200 1
3 39.600 0 (a) Sesuaikan model regresi logistik dengan data. Gunakan
model regresi linier sederhana sebagai struktur untuk
4 43.400 1
prediktor linier.
5 47.700 0
(b) Apakah model regresi logistik pada bagian (a) memadai?
6 53.000 0
11-82Departemen riset pasar dari produsen minuman ringan
7 41.500 1
sedang menyelidiki keefektifan kupon diskon harga pada
8 40.800 0
pembelian produk minuman dua liter. Sampel dari 5.500
9 45.400 1 pelanggan diberi kupon untuk berbagai diskon harga antara 5
10 52.400 1
dan 25 sen. Variabel respon adalah jumlah kupon pada
11 38.700 1 masing-masing kategori diskon harga yang ditinjau kembali
12 40.100 0 setelah satu bulan. Datanya ditunjukkan di bawah ini.
13 49.500 1
14 38.000 0
Nomor
15 42.000 1
Diskon, x Ukuran n Ditebus, R
16 54,000 1 sampel,
17 51.700 1
75 500 100
122
18 39.400 0
9 500 147
19 40.900 0
11 500 176
20 52.800 1
13 500 211
15 500 244
17 500 277
(a) Sesuaikan model regresi logistik dengan variabel respon 19 500 310
y. Gunakan model regresi linier sederhana sebagai 21 500 343
struktur untuk prediktor linier. 23 500 372
(b) Apakah model regresi logistik pada bagian (a) memadai? 25 500 391
(c) Berikan interpretasidari parameter 1 dalam model ini.11-
81 Kekuatan tekan dari pengikat paduan yang digunakan
(a) Sesuaikan model regresi logistik untukdata. Gunakan
dalam konstruksi pesawat sedang dipelajari. Sepuluh muatan
model regresi linier sederhana sebagai struktur untuk
dise- prediktor linier.
dipilih pada rentang 2500– 4300 psi dan sejumlah pengikat (b) Apakah model regresi logistik pada bagian (a) memadai?
er adalahdiuji pada beban tersebut. Jumlah pengencang yang (c) Gambarkan grafik data dan model regresi logistik yang
gagal pada setiap beban dicatat. Data uji lengkap menyusul. sesuai.
(d) Perluas prediktor linier untuk memasukkan suku kuadrat.
Apakah ada bukti bahwa suku kuadrat ini diperlukan kamu x kamu x
dalam model? 0,734 1.1 1.50 1.6
(e) Gambarlah grafik model baru ini pada plot yang sama yang 0.886 1.2 1.66 1.7
Anda buat di bagian (c). Apakah model yang diperluas 1.04 1.3 1.81 1.8
secara visual memberikan kecocokan yang lebih baik
1.19 1.4 1.97 1.9
dengan data daripada model asli dari bagian (a)?
1.351.52.122.0
11-83Sebuah studi dilakukan untuk menyelidiki pembelian
mobil baru. Sebuah sampel dari 20 keluarga dipilih. Setiap
keluarga disurvei untuk menentukan usia kendaraan tertua (a) Gambarkan diagram pencar dari data tersebut. Apakah
mereka dan total pendapatan keluarga mereka. Survei hubungan garis lurus tampak masuk akal?
lanjutan dilakukan enam bulan kemudian untuk menentukan (b) Pasangkan model regresi linier sederhana untuk data ini.
apakah mereka benar-benar membeli kendaraan baru selama (c) Uji signifikansi regresi menggunakan = 0,05. Berapa
periode waktu tersebut (y = 1 menunjukkan ya dan y = 0 nilai P untuk tes ini?
menunjukkan tidak). Data dari penelitian ini disajikan dalam (d) Temukan perkiraan interval kepercayaan 95% pada lereng.
tabel berikut. (e) Uji hipotesis H0: 0 = 0 versus H1: 0 0 menggunakan
= 0,05. Kesimpulan apa yang dapat Anda tarik?
Penghasil x1 Usia x2 kam Pendapata Usia, x2 ka 11-86.Kekuatan kertas yang digunakan dalam pembuatan
an, , u n, x1 mu kartu-kotak papan ( y) berhubungan dengan persentase
45.000 2 0 37.000 5 1 konsentrasi kayu keras dalam pulp asli (x). Dalam kondisi
40.000 4 0 31.000 7 1 terkendali, pabrik percontohan memproduksi 16 sampel,
60.000 3 1 40.000 4 1 masing-masing dari batch pulp yang berbeda, dan mengukur
50.000 2 1 75.000 2 0 kekuatan tarikkekuatan. Data tersebut disajikan dalam tabel
55.000 2 0 43.000 9 1 berikut ini:
50.000 5 1 49.000 2 0
35.000 7 1 37.500 4 1 kam 101.4 117.4 117.1 106.2
65.000 2 1 71.000 1 0 u
53.000 2 0 34,000 5 0 x 1.0 1.5 1.5 1.5
48,000 1 0 27.000 6 0
kam 131.9 146.9 146.8 133.9
u
(a) Sesuaikan model regresi logistik dengan data.
x 2.0 2.0 2.2 2.4
(b) Apakah model regresi logistik pada bagian (a) memadai?
(c) Interpretasikan koefisien model 1 dan 2. kam 111.0 123.0 125.1 145.2
(d) Berapa perkiraan probabilitas bahwa sebuah keluarga u
dengan pendapatan $45.000 dan sebuah mobil berumur
x 2.5 2.5 2.8 2.8
lima tahun akan membeli sebuah kendaraan baru dalam
enam bulan ke depan? kam 134.3 144.5 143.7 146.9
(e) Perluas prediktor linier untuk menyertakan istilah u
interaksi. Apakah ada bukti bahwa istilah ini diperlukan x 3.0 3.0 3.2 3.3
dalam model?

(a) Sesuaikan model regresi linier sederhana dengan data.


Latihan Tambahan (b) Uji signifikansi regresi menggunakan = 0,05.
(c) Buatlah selang kepercayaan 90% pada lereng 1.
11-84. Tunjukkan bahwa, untuk model regresi linier
sederhana, pernyataan berikut ini benar:
(A) n n
(d) Buatlah selang kepercayaan 90% pada intersep 0.
1kamuSaya — (B 1kamuSaya —
A
kamu ˆSaya = ) A
kamu ˆSaya xi=
(e) Buatlah selang kepercayaan 95% pada kekuatan rata-rata
0 0 pada x = 2,5.
Saya=1 Saya=1
1n (f ) Menganalisis residual dan mengomentari modelkecukupan.
(C) A kamuˆSaya = kamu
n penggunaan model regresi linier sederhana untuk
Saya=1
mengekspresikan saluran arus y (dalam miliampere) sebagai
11-85. Sebuah artikel di IEEE Transactions on Instrumenta- fungsi dari tegangan ground-to-source x (dalam volt). Datanya
tion dan Pengukuran [“Pengukuran Langsung, Cepat, dan adalah sebagai berikut:
Akurat VT dan K Transistor MOS Menggunakan Sirkuit VT-
Sift” (1991, Vol. 40, hlm. 951–955)] menjelaskan
11-87.Perhatikan data berikut. Misalkan hubungan
antara Y dan x dihipotesiskan menjadi Y = (β0 + 1x
+ )—1. Sesuaikan model yang sesuai dengan data.
Apakah bentuk model yang diasumsikan tampak
masuk akal?

x 10 15 18 12 9 8 11 6

ka 0.1 0.13 0,09 0,15 0,20 0.21 0.18 0.24


m
u
11-88.Data berikut ini, diadaptasi dari Montgomery, Peck,
rasio asam sebacic pada viskositas intrinsik kopoliester.
dan Vining (2006), menyajikan jumlah cacat mental Berikut datanya:
bersertifikat per 10.000 populasi yang diperkirakan di Inggris
( y) dan jumlah lisensi penerima radio yang dikeluarkan
(x) oleh BBC (dalam jutaan) untuk tahun 1924 sampai 1937. Rasio mol
Pasang model regresi yang berhubungan y dan x. Komentari x 1.0 0.9 0.8 0,7 0.6 0,5 0.4 0,3
modelnya. Secara khusus, apakah keberadaan korelasi yang
Viskositas
kuat menyiratkan hubungan sebab-akibat?
kamu 0,45 0,20 0.34 0,58 0,70 0,57 0,55 0,44

Tahun kamu x Tahun kam x (a) Buatlah diagram pencar dari data tersebut.
u (b) Pasang model represi linier sederhana.
1924 8 1.350 1931 16 4.620 (c) Uji signifikansi regresi. Hitung R2 untuk model tersebut.
1925 8 1.960 1932 18 5.497 (d) Analisis residu dan komentari kecukupan model.11-
1926 9 2.270 1933 19 6.260 92.Dua metode berbeda dapat digunakan untuk mengukur
suhu larutan dalam sel Hall yang digunakan dalam
1927 10 2.483 1934 20 7.012
aluminium
1928 11 2,730 1935 21 7.618
peleburan, termokopel ditanamkan dalam sel dan tidak langsung
1929 11 3.091 1936 22 8.131 pengukuran yang dihasilkan dari perangkat IR. Metode tidak
1930 12 3.674 1937 23 8.593 langsung lebih disukai karena termokopel akhirnya
dihancurkan oleh larutan. Perhatikan 10 pengukuran berikut:

11-89.Pertimbangkan data berat badan dan tekanan darah Termokopel 921 935 916 920 940
pada Latihan 11-72. Pasangkan model tanpa-intersep pada
data, dan bandingkan dengan model yang diperoleh pada IR 918 934 924 921 945
Latihan 11-70. Model mana yang lebih unggul? Termokopel 936 925 940 933 927
11-90.Sebuah artikel di Air and Waste ["Update on Ozone
Trends in California's South Coast Air Basin" (Vol. 43, IR 930 919 943 932 935
1993)] mempelajari tingkat ozon di cekungan udara South
Coast California selama tahun 1976-1991. Penulis percaya (a) Buatlah diagram pencar untuk data ini, misalkan x =
bahwa jumlah hari di mana tingkat ozon melebihi 0,20 pengukuran termokopel dan y = pengukuran IR.
bagian per juta tergantung pada indeks meteorologi musiman (b) Sesuaikan model regresi linier sederhana.
(suhu musiman rata-rata 850 milibar). Berikut datanya: (c) Uji signifikansi suatu regresi dan hitung R2. Kesimpulan
apa yang dapat Anda tarik?
(d) Apakah ada bukti untuk mendukung klaim bahwa kedua
Tahun hari Indeks Tahu hari Indeks perangkat menghasilkan pengukuran suhu yang setara?
n Merumuskan dan menguji hipotesis yang tepat untuk
1976 91 16.7 1984 81 18.0 mendukung klaim ini.
1977 105 17.1 1985 65 17.2 (e) Analisis residu dan komentari kecukupan model.11-
1978 106 18.2 1986 61 16.9 93.gram zat padat yang dikeluarkan dari suatu bahan (y) adalah
1979 108 18.1 1987 48 17.1 diduga berhubungan dengan waktu pengeringan. Sepuluh
1980 88 17.2 1988 61 18.2 pengamatan
diperoleh dari studi eksperimental berikut:
1981 91 18.2 1989 43 17.3
1982 58 16.0 1990 33 17.5
kamu 4.3 1.5 1.8 4.9 4.2 4.8 5.8 6.2 7.0 7.9
1983 82 17.2 1991 36 16.6
x 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0

(a) Buatlah diagram pencar dari data tersebut. (a) Buatlah diagram pencar untuk data ini.
(b) Sesuaikan model regresi linier sederhana dengan data. (b) Sesuaikan model regresi linier sederhana.
Uji signifikansi regresi. (c) Uji signifikansi regresi.
(c) Temukan 95% CI pada lereng 1. (d) Berdasarkan data ini, berapa perkiraan Anda tentang rata-
(d) Analisis residu dan komentari kecukupan model.11- rata gram padatan yang dihilangkan pada 4,25 jam?
91.Sebuah artikel di Journal of Applied Polymer Science (Vol. Temukan kepercayaan 95% di-terval pada rata-rata.
56, hlm. 471–476, 1995) mempelajari efek mol (e) Analisis residu dan komentari kecukupan model.
11-94.Atom cesium yang didinginkan oleh sinar laser dapat
digunakan untuk membuat jam atom yang murah. Dalam Karat Harga Karat Harga
sebuah studi di IEEE Transactions on Instrumentation and 0.31 1126 0.35 1593
Measurement (2001, Vol. 50, pp. 1224-1228), jumlah atom 0.32 1468 0.35 1447
yang didinginkan oleh laser dari berbagai kekuatan dihitung. 0.32 1202 0.35 1255
0.36 1635 0,45 1572
0.36 1485 0,46 2942
Jumlah Daya 0.37 1420 0,48 2532
(mW) atom (×10E9) 0.37 1420 0,5 3501
11 0 0.4 1911 0,5 3501
12 0,02 0.4 1525 0,5 3501
18 0,08 0,41 1956 0,5 3293
21 0.13 0,43 1747 0,5 3016
22 0,15
24 0.18
28 0.31
32 0.4 (a) Grafik datanya. Apa hubungan antara karat dan harga?
37 0,49 Apakah ada outlier?
39 0,57 (b) Apa yang akan Anda katakan kepada orang yang
41 0,64 membeli berlian yang merupakan outlier?
46 0,71 (c) Pasangkan dua model regresi, satu dengan semua data
48 0,79 dan yang lainnya dengan data yang tidak biasa
50 0.82 dihilangkan. Perkirakan koefisien kemiringan dengan
interval kepercayaan 95% dalam kedua kasus. Komentari
51 0.83
perbedaan apa pun.
11-96.Tabel berikut menunjukkan populasi dan jumlah rata-
rata bangau kayu yang terlihat per periode sampel untuk
(a) Buat grafik data dan sesuaikan dengan regresigaris untuk Carolina Selatan dari tahun 1991 hingga 2004. Sesuaikan
memprediksi jumlah atom dari tenaga laser. garis regresi dengan populasi sebagai respons dan jumlah
Mengomentari kecukupan model linier. bangau kayu sebagai prediktor. Analisis semacam itu dapat
(b) Apakah ada regresi yang signifikan?pada = 0,05? digunakan untuk mengevaluasi hubungan antara bangau dan
Apakah yang bayi. Apakah regresi signifikan pada = 0,05? Apa yang Anda
P-nilai? simpulkan tentang peran analisis regresi untuk membangun
(c) Perkirakan koefisien korelasi. hubungan sebab-akibat?
(d) Uji hipotesis bahwa p = 0 terhadap alternatif
p G 0 dengan = 0,05. Berapa nilai P?
(e) Hitung interval kepercayaan 95% untuk koefisien
kemiringan.11-95.Berikut data terkait karat berlian dengan Tahu Populasi Hitungan
harga beli. Itu muncul di Business Times Singapura, n Bangau
18 Februari 2000. 1991 3.559.470 0,342
1992 3.600.576 0,291
1993 3.634.507 0,291
Karat Harga Karat Harga 1994 3.666.456 0,291
0,3 1302 0.33 1327 1995 3.699.943 0,291
0,3 1510 0.33 1098 1996 3.738.974 0,509
0,3 1510 0.34 1693 1997 3.790.066 0,294
0,3 1260 0.34 1551 1998 3.839.578 0,799
0.31 1641 0.34 1410 1999 3.885.736 0,542
0.31 1555 0.34 1269 2000 4.012.012 0,495
0.31 1427 0.34 1316 2001 4.061.209 0.859
0.31 1427 0.34 1222 2002 4.105.848 0,364
0.31 1126 0.35 1738 2003 4.148.744 0,501
2004 4.198.068 0.656

Anda mungkin juga menyukai