Anda di halaman 1dari 73

4 Modeling eksperimental

pengantar
Dalam Bab 3 kita membahas perbedaan filosofis antara kurva pas dan lation interpo-.
Ketika pas kurva, pemodel menggunakan beberapa asumsi yang memilih jenis tertentu dari
model yang menjelaskan perilaku di bawah pengamatan. Jika data yang dikumpulkan
maka tingkat corrobo- kewajaran asumsi-asumsi, tugas modeler adalah untuk memilih
parameter dari kurva yang dipilih yang paling sesuai data menurut beberapa kriteria
(seperti kuadrat). Dalam situasi ini modeler mengharapkan, dan rela menerima, beberapa
penyimpangan antara model dipasang dan data yang dikumpulkan untuk mendapatkan
model yang menjelaskan perilaku. Masalah dengan pendekatan ini adalah bahwa dalam
banyak kasus modeler tidak mampu untuk membangun sebuah model formulir penurut
yang memuaskan menjelaskan perilaku. Demikian, pemodel tidak tahu apa jenis kurva
sebenarnya menggambarkan perilaku. Jika diperlukan untuk memprediksi perilaku
demikian, pemodel dapat melakukan percobaan (atau mengumpulkan data) untuk
menyelidiki perilaku variabel dependen (s) untuk nilai-nilai variabel independen (s) dalam
beberapa rentang. Pada intinya, pemodel keinginan untuk membangun model empiris
berdasarkan data yang dikumpulkan bukan memilih model yang didasarkan pada asumsi-
asumsi tertentu. Dalam kasus seperti pemodel sangat dipengaruhi oleh data yang telah hati-
hati dikumpulkan dan dianalisis, sehingga ia berusaha kurva yang menangkap tren data
untuk memprediksi di antara titik-titik data. pemodel dapat melakukan percobaan (atau
mengumpulkan data) untuk menyelidiki IOR prilaku dari variabel dependen (s) untuk
nilai-nilai variabel independen (s) dalam beberapa rentang. Pada intinya, pemodel
keinginan untuk membangun model empiris berdasarkan data yang dikumpulkan bukan
memilih model yang didasarkan pada asumsi-asumsi tertentu. Dalam kasus seperti
pemodel sangat dipengaruhi oleh data yang telah hati-hati dikumpulkan dan dianalisis,
sehingga ia berusaha kurva yang menangkap tren data untuk memprediksi di antara titik-
titik data. pemodel dapat melakukan percobaan (atau mengumpulkan data) untuk
menyelidiki IOR prilaku dari variabel dependen (s) untuk nilai-nilai variabel independen
(s) dalam beberapa rentang. Pada intinya, pemodel keinginan untuk membangun model
empiris berdasarkan data yang dikumpulkan bukan memilih model yang didasarkan pada
asumsi-asumsi tertentu. Dalam kasus seperti pemodel sangat dipengaruhi oleh data yang
telah hati-hati dikumpulkan dan dianalisis, sehingga ia berusaha kurva yang menangkap
tren data untuk memprediksi di antara titik-titik data.
Sebagai contoh, mempertimbangkan data yang ditunjukkan pada Gambar 4.1a. Jika
asumsi modeler ini menyebabkan harapan model kuadrat, parabola akan cocok titik data,
seperti digambarkan pada Gambar 4.1b. Namun, jika pemodel tidak memiliki alasan untuk
mengharapkan jenis tertentu model, kurva mulus dapat melewati titik data sebagai
gantinya, seperti digambarkan pada Gambar 4.1c.
y y y

© Cengage Learning
x x x
x1x 2 x3 x4 x5 x1x2 x3 x4 x5 x1x2 x3 x4 x5

Sebuah b c

JGambar 4.1
Jika pemodel mengharapkan hubungan kuadrat, parabola mungkin cocok
untuk data, seperti dalam b. Jika tidak, kurva mulus dapat dilewatkan melalui
titik-titik, seperti di c.
137
138 Bab 4 Pemodelan Eksperimental

Dalam bab ini, kita membahas pembangunan model empiris. Dalam Bagian 4.1, kita
mempelajari proses seleksi untuk model satu-istilah sederhana yang menangkap tren data.
Beberapa skenario yang ditujukan untuk yang beberapa pemodel akan berusaha untuk
membangun sebuah bersifat menerangkan model yaitu, memprediksi panen kehidupan laut
di Chesapeake Bay. Dalam Bagian 4.2, kita membahas pembangunan orde yang lebih
tinggi polinomial yang melewati titik-titik data yang dikumpulkan. Dalam Bagian 4.3, kita
menyelidiki smoothing data menggunakan low-order polinomial. Akhirnya, dalam Bagian
4.4, kami menyajikan teknik spline kubik lation interpo-, di mana polinomial kubik yang
berbeda digunakan di pasang berturut-turut titik data.

Pemanenan di Chesapeake Bay


dan Model One-Term Lain
Mari kita mempertimbangkan situasi di mana modeler telah mengumpulkan beberapa data
tetapi tidak mampu untuk membangun model yg menjelaskan. Pada tahun 1992, Daily
Tekan (sebuah surat kabar di Virginia) melaporkan beberapa pengamatan (data) yang
dikumpulkan selama 50 tahun terakhir pada kehidupan laut panen di Chesapeake Bay.
Kami akan memeriksa beberapa skenario menggunakan pengamatan dari (a) bluefish
panen dan (b) panen kepiting biru oleh industri komersial dari Chesapeake Bay. Tabel 4.1
menunjukkan data yang akan kita gunakan dalam model satu-istilah kami.
Sebuah sebar dari bluefish panen terhadap waktu ditunjukkan pada Gambar 4.2, dan
sebar panen kepiting biru ditunjukkan pada Gambar 4.3. Gambar 4.2 jelas menunjukkan
kecenderungan untuk panen lebih bluefish dari waktu ke waktu, yang menunjukkan atau
menunjukkan ketersediaan bluefish. Sebuah deskripsi yang lebih tepat adalah tidak begitu
jelas. Pada Gambar 4.3, kecenderungan adalah untuk peningkatan panen kepiting biru.
Sekali lagi, model yang tepat tidak begitu jelas.
Dalam sisa bagian ini, kami menyarankan bagaimana kita mungkin mulai
memprediksi ketersediaan bluefish dari waktu ke waktu. Strategi kami akan mengubah
data Tabel 4.1 sedemikian rupa bahwa grafik yang dihasilkan mendekati garis, sehingga
mencapai sebuah model kerja. Tapi bagaimana

tabel 4.1 Pemanenan teluk, 1940-1990

Tahun Bluefish (lb) Biru kepiting


(lb)
1940 15.000 100.000
1945 150.000 850.000
1950 250.000 1.330.000
1955 275.000 2.500.000
1960 270.000 3.000.000
1965 280.000 3.700.000
1970 290.000 4.400.000
1975 650.000 4.660.000
1980 1.200.000 4.800.000
1985 1.500.000 4.420.000
1990 2.750.000 5.000.000
© Cengage
Learning
4.1 Pemanenan di Chesapeake Bay dan Model One-Term Lain 139

JGambar 4.2
300
Sebar dari bluefish
panen dibandingkan
tahun dasar (5 tahun

Bluefish (di 104


200
periode 1940-1990)

lb)

© Cengage Learning
100

tahun dasar
0 2 4 6 8 10

JGambar 4.3
Sebar kepiting biru panen 500
dibandingkan tahun dasar
Biru kepiting (di 104

(5 tahun periode 1940- 400


1990)
300

200

© Cengage Learning
lb)

100

00 tahun dasar
2 4 6 8 10

kita menentukan transformasi? Kami akan menggunakan tangga powers1 dari z variabel
Tangga untuk membantu dalam pemilihan transformasi linearizing yang sesuai.
kekuasa Angka 4.4 menunjukkan Sebuah set dari lima data poin .v; y / bersama dengan itu baris
an y D x. untuk x > 1. p

Supppose kita mengubah nilai y dari setiap titik ke y. Prosedur ini menghasilkan hubungan
baru
:
: yD xyang nilai y lebih dekat bersama-sama atas domain yang bersangkutan. Perhatikan
bahwa semua
z2 y nilai-nilai yang berkurang, tetapi nilai-nilai yang lebih besar berkurang lebih dari yang lebih
z kecil.
pz
log
Mengubah nilai y dari setiap titik untuk login y memiliki efek yang sama tetapi lebih
z jelas, dan setiap langkah tambahan menuruni tangga menghasilkan versi yang lebih kuat
p1
dari efek yang sama.
z Kami mulai pada Gambar 4.4 dengan cara-dengan sederhana fungsi linear. Namun,
1 itu hanya untuk kenyamanan. Jika kita mengambil cekung up, fungsi positif bernilai, D
z
seperti y fx /; x> 1,
1
z2
::

kemudian beberapa transformasi dalam tangga bawah y-mengubah nilai-nilai y untuk


py, atau log y, ataulebih drastis perubahan-meremas ekor kanan bawah dan meningkatkan
kemungkinan menghasilkan fungsi baru yang lebih linier daripada yang asli. Yang
tr sformasi harus digunakan adalah masalah trial and error dan pengalaman. Kemungkinan
a lain adalah untuk meregangkan ekor kanan ke kanan (coba mengubah x nilai untuk x2,
n nilai-nilai x3, dll).

1LihatPaul F. Velleman dan David C. Hoaglin, Aplikasi, Dasar, dan Komputasi dari eksplorasi Analisis Data
(Boston: Duxbury Press, 1981), p. 49.
140 Bab 4 Pemodelan Eksperimental

JGambar 4.4 y
efek relatif dari tiga transformasi 15

y=x

10

5
y nilai-nilai digantikan oleh y

© Cengage Learning
y nilai-nilai digantikan oleh log y

tabel 4.2 y nilai-nilai digantikan


Tangga oleh 1
y
mations 0 x
Transfor- 1 5 10 15

Jika kita mengambil Sebuah cekung turun, positif bernilai meningkat fungsi, y
:
: D f .x /. x > 1.
seperti
z3
z2
z (tidak ada
perubahan)
pz
kita bisa berharap untuk linearize lebih lanjut dengan peregangan ekor kanan atas (cobalah mengubah y
values untuk y2. y3 values, dll). pLain kemungkinan aku s untuk meremas itu tangan kanan ekor untuk itu
kiri
log z (Cobalah mengubah x nilai-nilai ke x. atau log x, atau dengan pilihan yang lebih drastis dari tangga).
×
p-1
Perhatikan bahwa meskipun mengganti z oleh 1 = z atau 1 = z2 dan sebagainya kadang-
z
- 1 kadang mungkin memiliki efek yang diinginkan, penggantian tersebut juga memiliki
z
diinginkan satu-fungsi yang meningkat diubah menjadi menurun satu. Akibatnya, ketika
- 1
z2
menggunakan transformasi di tangga kekuasaan di bawah log z, analis data yang umumnya
:: menggunakan tanda negatif untuk menyimpan data transformasi dalam urutan yang sama
seperti data asli. Tabel 4.2 menunjukkan tangga transformasi seperti yang umumnya
© Cengage Learning
-Tions
digunakan.
transforma- Dengan informasi ini pada tangga transformasi, mari kita kembali ke data panen
paling sering Chesapeake Bay.
digunakan.

CONTOH 1 pemanenan Bluefish

Ingat dari sebar pada Gambar 4.2 bahwa tren data yang tampaknya meningkat dan
cekung ke atas. Menggunakan tangga kekuasaan untuk memeras ekor kanan bawah,
kita dapat mengubah nilai-nilai y dengan mengganti y dengan log y atau transformasi
lainnya menuruni tangga. Pilihan lain akan menggantikan x nilai dengan x2 atau x3
nilai atau kekuatan lain atas
4.1 Pemanenan di Chesapeake Bay dan Model One-Term Lain 141

tabel 4.3 Pemanenan Teluk: Bluefish, 1940-1990

Tahun tahun Bluefish (lb)


dasar
x y
1940 0 15.000
1945 1 150.000
1950 2 250.000
1955 3 275.000
1960 4 270.000
1965 5 280.000
1970 6 290.000
1975 7 650.000
1980 8 1.200.000
1985 9 1.550.000
1990 10 2.750.000
© Cengage Learning

tangga. Kami akan menggunakan data yang ditampilkan pada Tabel 4.3, di mana 1940Dadalah
tahun dasar x 0
untuk kenyamanan numerik, dengan masing-masing tahun dasar mewakili periode 5 tahun.
Kita mulai dengan meremas ekor kanan ke kanan dengan mengubah x untuk berbagai
nilai naik tangga (x2, x3, dll). Tak satu pun dari transformasi ini menghasilkan grafik
linear.
Kita Perubahan berikutnya y untuk nilai-nilai py dan log y, turun tangga. Kedua py
dan log y
plot vs x muncul lebih linier dari transformasi ke variabel x. (Plot
ydibandingkan x2 dan x dibandingkan py identik di linearitas mereka.) Kita memilih log y vs
x model. Kami cocok dengan kuadrat model bentuk
log y D mx C b

dan memperoleh perkiraan kurva berikut:

log y D 0: 7231 C 0: 1654x

di mana x adalah tahun dasar dan log y adalah untuk basis 10 dan y diukur dalam
104 pound. (Lihat Gambar 4.5.)
D y
Menggunakan properti yang D log n jika dan hanya jika 10y
n, Kita dapat menulis ulang persamaan ini (dengan
bantuan kalkulator) sebagai

y D 5: 2857,1: 4635 / x (4.1)

JGambar 4.5
Data ditumpangkan dan 300
model y D 5: 2857,1: 4635
/x
Bluefish (di 104

200
lb)
© Cengage Learning
100

tahun dasar
0 2 4 6 8 10
142 Bab 4 Pemodelan Eksperimental

di mana y diukur dalam 104 pon bluefish dan x adalah tahun dasar. Plot model tampaknya
sesuai dengan data cukup baik. Gambar 4.5 menunjukkan grafik kurva ini ditumpangkan
pada scatterplot. Kami akan menerima beberapa kesalahan untuk memiliki model J satu-
JJ
istilah sederhana.

CONTOH 2 Pemanenan Blue Kepiting

Ingat dari sebar asli kami, Gambar 4.3, bahwa tren data semakin meningkat dan cekung ke
bawah. Dengan informasi ini, kita dapat memanfaatkan tangga transformasi. Kami akan
menggunakan data pada Tabel 4.4, dimodifikasi dengan membuatD 1940 (tahun x 0) tahun
dasar, dengan masing-masing tahun dasar mewakili periode 5 tahun.

tabel 4.4 Pemanenan Teluk: kepiting biru, 1940-1990

Tahun tahun Biru kepiting


dasar (lb)
x y
1940 0 100.000
1945 1 850.000
1950 2 1.330.000
1955 3 2.500.000
1960 4 3.000.000
1965 5 3.700.000
1970 6 4.400.000
1975 7 4.660.000
1980 8 4.800.000
1985 9 4.420.000
1990 10 5.000.000
© Cengage Learning

Seperti yang dinyatakan sebelumnya, kita bisa mencoba untuk linearize data ini dengan mengubah
nilai-nilai y untuk
y 2 atau y3 values atau untuk otherps bergerak naik itu tangga. Setelah beberapa experiments, kita memilih
untuk
menggantikan itu x vaplues dengan
menyediakan Sebuah x. Ini meremas itu tangan kanan ekor untuk itu kiri. PWe
plot y terhadap x(Gambar 4.6). Pada Gambar 4.7, kami menempatkan di sebuah kx garis y D
diproyeksikan
melalui asal (tidak ada y-intercept). Kami menggunakan kuadrat dari Bab 3 untuk menemukan k,
menghasilkan
yD 158: 344px (4.2)

di mana y diukur dalam 104 pon kepiting biru dan x adalah tahun dasar.

JGambar
4.6

Biru crapbs (di 104 lb) 500

melawan
iting (di 104

x 400
200
300

100

00
1
2
3
4
5
x

© Cengage Learning
4.1 Pemanenan di Chesapeake Bay dan Model One-Term Lain 143

JGambar 4.7
p
Garisy D 158: 344 x 500

Biru kepiting (di 104


400

300 y=kx

200

© Cengage Learning
lb)
100

00 x
1 2 3 4 5

JGambar 4.8
500
Data
ditumpangkanpdan

Croxton, Dudley J. Cowden, dan Sidney Klein, Terapan


Statistik Umum, 3rd ed. (Englewood Cliffs, NJ: Prentice-
model y D 158: 344 x

Data disimpulkan dari sebuah sebar di Frederick E.


Biru kepiting (di 104

400

300

200
lb)

100

Hall, 1967), p. 390.


00
2 4 6 8 10
tahun dasar

Gambar 4.8 menunjukkan grafik dari model sebelumnya ditumpangkan pada


scatterplot. Perhatikan bahwa kurva tampaknya masuk akal, karena sesuai data tentang
serta diharapkan untuk model satu-istilah sederhana. JJJ

Verifikasi Model
Seberapa baik adalah prediksi berdasarkan model? Sebagian dari jawabannya terletak pada
membandingkan nilai yang diamati dengan yang diprediksikan. Kita bisa menghitung
residual dan kesalahan relatif untuk setiap pasangan data. Dalam banyak kasus, pemodel
diminta untuk memprediksi atau meramalkan kemungkinan untuk masa depan. Bagaimana
model ini akan tahan dalam memprediksi jumlah panen dari teluk di tahun 2010?
berikut hasil untuk bluefish mungkin lebih besar dari yang bisa memprediksi,
sedangkan hasil untuk kepiting biru mungkin sedikit lebih rendah dari yang bisa
memprediksi.

Bluefish y D 5: 2857,1: 4635/14 D 1092: 95 0,104 lb / = 10: 9


p 4
juta lb biru kepiting y D 158: 344 14 D 592: 469 0,10 lb / = 5:92
juta lb

, Model satu-istilah sederhana ini harus digunakan untuk interpolasi dan tidak ekstrapolasi.
Kami membahas pemodelan pertumbuhan penduduk lebih teliti dalam Bab 11 dan 12.
Mari kita merangkum ide-ide dari bagian ini. Ketika kita sedang membangun model
empiris, kita selalu mulai dengan analisis yang cermat dari data yang dikumpulkan.
Apakah data menunjukkan
144 Bab 4 Pemodelan Eksperimental

keberadaan sebuah tren? Apakah ada titik data yang jelas berada di luar tren? Jika
sepertioutlier memang ada, mungkin diinginkan untuk membuang mereka atau, jika
mereka diperoleh secara eksperimental, untuk mengulang percobaan sebagai cek untuk
kesalahan pengumpulan data. Ketika jelas bahwa tren ada, kami berikutnya mencoba untuk
menemukan fungsi yang akan mengubah data menjadi garis lurus (kurang-lebih). Selain
mencoba fungsi yang terdaftar di tangga transformasi yang disajikan dalam bagian ini, kita
juga bisa mencoba transformasi
D dibahas dalam Bab 3. Dengan demikian, jika model y axb
dipilih, kami akan merencanakan ln y vs ln x untuk melihat apakah garis D lurus hasil.
Demikian juga, ketika menyelidiki kesesuaian model y aebx, kami akan merencanakan ln
y vs x untuk melihat apakah hasil garis lurus. Perlu diingat diskusi kita pada Bab 3 tentang
bagaimana penggunaan transformasi dapat menipu, terutama jika titik data diperas
bersama-sama. penilaian kami secara ketat kualitatif; idenya adalah untuk menentukan
apakah jenis model khusus muncul menjanjikan. Ketika kita puas bahwa jenis model
tertentu tampaknya untuk menangkap tren data, kita dapat memperkirakan parameter dari
model grafis atau menggunakan teknik analisis dibahas dalam Bab 3. Akhirnya, kita harus
menganalisis goodness of fit menggunakan indikator dibahas dalam Bab 3. Ingat untuk
grafik model yang diusulkan terhadap titik data asli, bukan data berubah. Jika kita tidak
puas dengan fit, kita dapat menyelidiki model satu-istilah lainnya. Karena kesederhanaan
yang melekat mereka, bagaimanapun, model satu-istilah bisa tidak cocok semua set data.
Dalam situasi seperti itu, teknik lain dapat digunakan; kita membahas metode ini di
beberapa bagian berikutnya. idenya adalah untuk menentukan apakah jenis model khusus
muncul menjanjikan. Ketika kita puas bahwa jenis model tertentu tampaknya untuk
menangkap tren data, kita dapat memperkirakan parameter dari model grafis atau
menggunakan teknik analisis dibahas dalam Bab 3. Akhirnya, kita harus menganalisis
goodness of fit menggunakan indikator dibahas dalam Bab 3. Ingat untuk grafik model
yang diusulkan terhadap titik data asli, bukan data berubah. Jika kita tidak puas dengan fit,
kita dapat menyelidiki model satu-istilah lainnya. Karena kesederhanaan yang melekat
mereka, bagaimanapun, model satu-istilah bisa tidak cocok semua set data. Dalam situasi
seperti itu, teknik lain dapat digunakan; kita membahas metode ini di beberapa bagian
berikutnya. idenya adalah untuk menentukan apakah jenis model khusus muncul
menjanjikan. Ketika kita puas bahwa jenis model tertentu tampaknya untuk menangkap
tren data, kita dapat memperkirakan parameter dari model grafis atau menggunakan teknik
analisis dibahas dalam Bab 3. Akhirnya, kita harus menganalisis goodness of fit
menggunakan indikator dibahas dalam Bab 3. Ingat untuk grafik model yang diusulkan
terhadap titik data asli, bukan data berubah. Jika kita tidak puas dengan fit, kita dapat
menyelidiki model satu-istilah lainnya. Karena kesederhanaan yang melekat mereka,
bagaimanapun, model satu-istilah bisa tidak cocok semua set data. Dalam situasi seperti
itu, teknik lain dapat digunakan; kita membahas metode ini di beberapa bagian berikutnya.
kita bisa memperkirakan parameter dari model grafis atau menggunakan teknik analisis
dibahas dalam Bab 3. Akhirnya, kita harus menganalisis goodness of fit menggunakan
indikator dibahas dalam Bab 3. Ingat untuk grafik model yang diusulkan terhadap titik data
asli, bukan Data diubah. Jika kita tidak puas dengan fit, kita dapat menyelidiki model satu-
istilah lainnya. Karena kesederhanaan yang melekat mereka, bagaimanapun, model satu-
istilah bisa tidak cocok semua set data. Dalam situasi seperti itu, teknik lain dapat
digunakan; kita membahas metode ini di beberapa bagian berikutnya. kita bisa
memperkirakan parameter dari model grafis atau menggunakan teknik analisis dibahas
dalam Bab 3. Akhirnya, kita harus menganalisis goodness of fit menggunakan indikator
dibahas dalam Bab 3. Ingat untuk grafik model yang diusulkan terhadap titik data asli,
bukan Data diubah. Jika kita tidak puas dengan fit, kita dapat menyelidiki model satu-
istilah lainnya. Karena kesederhanaan yang melekat mereka, bagaimanapun, model satu-
istilah bisa tidak cocok semua set data. Dalam situasi seperti itu, teknik lain dapat
digunakan; kita membahas metode ini di beberapa bagian berikutnya. bukan data berubah.
Jika kita tidak puas dengan fit, kita dapat menyelidiki model satu-istilah lainnya. Karena
kesederhanaan yang melekat mereka, bagaimanapun, model satu-istilah bisa tidak cocok
semua set data. Dalam situasi seperti itu, teknik lain dapat digunakan; kita membahas
metode ini di beberapa bagian berikutnya. bukan data berubah. Jika kita tidak puas dengan
fit, kita dapat menyelidiki model satu-istilah lainnya. Karena kesederhanaan yang melekat
mereka, bagaimanapun, model satu-istilah bisa tidak cocok semua set data. Dalam situasi
seperti itu, teknik lain dapat digunakan; kita membahas metode ini di beberapa bagian
berikutnya.

Pzz Soal
Pada tahun 1976, Marc dan Helen Bornstein mempelajari laju kehidupan. 2Untukmelihat
apakah hidup menjadi lebih sibuk sebagai ukuran kota menjadi lebih besar, mereka secara
sistematis mengamati rata-rata waktu yang dibutuhkan untuk pejalan kaki untuk berjalan
50 kaki di jalan-jalan utama kota dan kota-kota mereka. Pada Tabel 4.5, kami menyajikan
beberapa data yang mereka kumpulkan. Variabel P mewakili populasi kota atau kota, dan
variabel V merupakan kecepatan rata-rata pejalan kaki berjalan 50 kaki. Masalah 1-5
didasarkan pada data pada Tabel 4.5.

1. Sesuai dengan model


D V CP kepada '' laju kehidupan '' Data pada Tabel 4.5. Gunakan
transforma-Dtion log VClog P log C. Plot log V terhadap log P. Apakah hubungan
tampaknya masuk akal?
a. Membuat meja dari log P vs log V.
b. Buatlah sebuah sebar data log-log Anda.
c. Bola mata garis l ke sebar Anda.
d. Perkirakan kemiringan dan mencegat.
e. Tentukan persamaan linear yang berhubungan log V dan log P.
f. Tentukan persamaan bentuk VD CP yang mengekspresikan V dalam hal P.
2. Grafik persamaan Anda pada Soal 1f ditumpangkan pada sebar asli.

2Bornstein, Marc H., dan Helen G. Bornstein, '' The Pace of Life. '' Nature 259 (19 Februari 1976): 557-559.
4.1 Pemanenan di Chesapeake Bay dan Model One-Term Lain 145

tabel 4.5 Populasi dan rata kecepatan selama kursus 50-


kaki, untuk 15 lokasi×

Populasi kecepatan
tempat P rata-rata
V (Ft = detik)
(1) Brno, Cekoslowakia 341.948 4.81
(2) Praha, Cekoslovakia 1.092.759 5,88
(3) Corte, Corsica 5.491 3,31
(4) Bastia, Prancis 49.375 4.90
(5) Munich, Jerman 1.340.000 5.62
(6) Psychro, Crete 365 2,76
(7) Itea, Yunani 2.500 2,27
(8) Iraklion, Yunani 78.200 3,85
(9) Athena, Yunani 867.023 5.21
(10) Safed, Israel 14.000 3.70
(11) Dimona, Israel 23.700 3,27
(12) Netanya, Israel 70.700 4.31
(13) Yerusalem, Israel 304.500 4.42
(14) New Haven, Amerika 138.000 4.39
Serikat
(15) Brooklyn, Amerika Serikat 2.602.000 5.05
© Cengage Learning
-
Data Bornstein.

3. Menggunakan data, kalkulator, dan model yang Anda ditentukan untuk V (Soal 1f),
lengkap Tabel 4.6.
4. Dari data pada Tabel 4.6, menghitung mean (yaitu, rata-rata) dari kesalahan Bornstein
jVobserved - Vpredictedj. Apa hasil menunjukkan tentang kebaikan model?

tabel 4.6 rata kecepatan yang diamati selama 15 lokasi

tempat× kecepatan diamati V kecepatan


diprediksi
1 4.81
2 5,88
3 3,31
4 4.90
5 5.62
6 2,76
7 2,27
8 3,85
9 5.21
10 3.70
11 3,27
12 4.31
13 4.42
14 4.39
15 5.05
© Cengage Learning
-Untuk nama lokasi, lihat Tabel 4.5.
146 Bab 4 Pemodelan Eksperimental

tabel 4.7 Tiram di Teluk

tiram
Tahun dipanen (gantang)

1940 3.750.000
1945 3.250.000
1950 2.800.000
1955 2.550.000
1960 2.650.000
1965 1.850.000
1970 1.500.000
1975 1.000.000
1980 1.100.000
1985 750.000
1990 330.000
© Cengage
Learning

5. Memecahkan Masalah 1-4 dengan model V m.log P / b. Bandingkan kesalahan


dengan mereka dihitung pada Soal 4. Dmembandingkan
C dua model. Mana yang
lebih baik?
6. Meja4.7 dan Gambar 4.9 menyajikan data yang mewakili pemanenan komersial tiram
di Chesapeake Bay. Fit sederhana, model satu istilah untuk data. Seberapa baik yang
terbaik model satu istilah Anda menemukan cocok dengan data? Apa kesalahan
JGambar terbesar? Rata-rata error?
4.9

Tiram (jutaan 4
pon) dibandingkan tahun dasar
Tiram (di 106 lb)

1
© Cengage Learning

0
40 50 60 70 80 90
tahun dasar

7. Dalam Tabel 4.8, X adalah suhu Fahrenheit, dan Y adalah jumlah kali jangkrik celetuk
dalam 1 menit. Cocok dengan model data tersebut. Menganalisis seberapa baik cocok.
8. Fit model untuk Tabel 4.9. Apakah Anda mengenali data? Apa hubungan dapat
disimpulkan dari mereka?
9. Berikut ukuran data yang dua karakteristik dari pinus ponderosa. Variabel X adalah
diameter pohon, dalam inci, diukur setinggi dada; Y adalah ukuran dari volume jumlah
kaki papan dibagi dengan 10. Fit model untuk data. Kemudian mengungkapkan Y
dalam hal X.
4.1 Pemanenan di Chesapeake Bay dan Model One-Term Lain 147

Diameter dan volume untuk pohon-pohon pinus 20 ponderosa

jumlah jumlah
observasi X Y observasi X Y

1 36 192 11 31 141
2 28 113 12 20 32
3 28 88 13 25 86
4 41 294 14 19 21
5 19 28 15 39 231
6 32 123 16 33 187
7 22 51 17 17 22
8 38 252 18 37 205
9 25 56 19 23 57
10 17 16 20 39 265
Data yang dilaporkan dalam Croxton, Cowden, dan Klein, Terapan Statistik Umum, p. 421.

tabel 4.8 Suhu dan celetuk per menit selama 20 jangkrik

jumlah jumlah
observasi X Y observasi X Y

1 46 40 11 61 96
2 49 50 12 62 88
3 51 55 13 63 99
4 52 63 14 64 110
5 54 72 15 66 113
6 56 70 16 67 120
7 57 77 17 68 127
8 58 73 18 71 137
9 59 90 19 72 132
10 60 93 20 71 137
© Cengage Learning
Data disimpulkan dari sebuah sebar di Frederick E. Croxton, Dudley J. Cowden,
dan Sidney Klein, Terapan Statistik Umum, 3rd ed. (Englewood Cliffs, NJ:
Prentice- Hall, 1967), p. 390.

tabel 4.9

jumlah
observasi X Y

1 35.97 0,241
2 67,21 0,615
3 92,96 1.000
4 141,70 1,881
5 483,70 11,860
6 886,70 29,460
7 1783,00 84,020
8 2794,00 164,800
9 3666,00 248,400
© Cengage
Learning
148 Bab 4 Pemodelan Eksperimental

10. Data berikut mewakili panjang dan berat satu set ikan (bass). Berat Model sebagai
fungsi dari panjang ikan.

Panjang 12,5 12,625 14,125 14,5 17.25 17.75


(di).
17 16,5 23 26,5 41 49
Berat(ons)
11. Data berikut memberikan penduduk Amerika Serikat dari 1800 sampai 2000. Model
populasi (dalam ribuan) sebagai fungsi dari tahun ini. Seberapa baik model Anda
cocok? Adalah model satu-istilah yang tepat untuk data ini? Mengapa?

Tahun 1800 1820 1840 1860 1880 1900 1920

Penduduk (ribuan) 5308 9638 17.069 31.443 50.156 75.995 105.711

Tahun 1940 1960 1980 1990 2000

Penduduk (ribuan) 131.669 179.323 226.505 248.710 281.416

PROYEK
1. Bersaing persyaratan Umap 551, '' The Pace of Life, Sebuah Pengantar Model Fitting,
'' oleh Bruce King. Siapkan ringkasan singkat untuk diskusi kelas.

Bacaan lebih lanjut


Bornstein, Marc H., & Helen G. Bornstein. '' The Pace of Life. '' Nature 259 (19 Februari 1976): 557-
559.
Croxton, Fredrick E., Dudley J. Crowden, & Sidney Klein. Terapan Statistik Umum, ed 7. Engle-
kayu Cliffs, NJ: Prentice-Hall, 1985.
Neter, John, & William Wassermann. Terapan Model Linear statistik, 4th ed. Boston: McGraw-Hill,
1996.
Vellman, Paul F., & David C. Hoaglin. Aplikasi, Dasar, dan Komputasi Analisis Data eksplorasi.
Boston: Duxbury Press, 1984.
Yule,G. Udny. '' Mengapa Kita Kadang-kadang Dapatkan Nonsense-Korelasi antara Time Series?
Studi di Sampling dan Sifat Time Series '' Journal of Royal Society Statistik 89 (1926):. 1-69.

Tinggi-Order Model Polinomial


Dalam Bagian 4.1, kami menyelidiki kemungkinan menemukan model satu -istilah
sederhana, yang menangkap tren data yang dikumpulkan. Karena kesederhanaan yang
melekat mereka, model satu-istilah memfasilitasi analisis model, termasuk analisis
sensitivitas, optimasi, dan estimasi tingkat perubahan dan daerah di bawah kurva. Karena
kesederhanaan matematika mereka, bagaimanapun, model jangka satu- terbatas dalam
kemampuan mereka untuk menangkap tren setiap pengumpulan data. Dalam beberapa
kasus, model dengan lebih dari satu istilah harus diperhatikan. Sisa dari bab ini
Tinggi-Order Model Polinomial 149

menganggap satu jenis Multiterm model yaitu, polinomial. Karena polinomial mudah
untuk mengintegrasikan dan untuk membedakan, mereka sangat populer. Namun,
polinomial juga memiliki kelemahan mereka. Misalnya, jauh lebih tepat untuk mendekati
kumpulan data memiliki asimtot vertikal menggunakan hasil bagi dari polinomial px / =
qx / daripada polinomial tunggal.
Mari kita mulai dengan mempelajari polinomial yang melewati setiap titik dalam
kumpulan data yang mencakup hanya satu pengamatan untuk setiap nilai variabel
independen.

y y y
P1(X
(X'3, )
Y' )
(x2, (x2, (x2,
y ) P (X)
y ) (x3, y )

© Cengage Learning
(X,
3 3y)
y )
(x1, (x1, y1) P3(X
(x1,
y ) x x )
y )
x
Sebuah b c

J Gambar 4.10
Sebuah polinomial unik paling derajat 2 dapat ditularkan melalui tiga titik data
(Sebuah dan b), Namun jumlah tak terbatas polinomial derajat lebih besar dari 2
dapat ditularkan melalui tiga titik data (c)

Mempertimbangkan data pada Gambar 4.10a. Melalui dua poin data yang
diberikan,
D C garis y a0 a1x unik bisa lewat. Tentukan konstanta a0 dan a1 oleh kondisi
bahwa garis melewati titik .x1; y1 / dan .x2; y2 /. Demikian,

y1D a0 C a1x1

dan

y2D a0 C a1x2

Dengan cara yang sama, fungsi polinomial unik (paling) gelar 2, y D Sebuah
C 0 C
a1x
a2x2.dapat ditularkan melalui tiga titik berbeda, seperti yang ditunjukkan pada
Gambar 4.10b. Tentukan konstanta a0, a1, a2 dan dengan memecahkan sistem
persamaan linear berikut:

y1D a0 C a1x1 C1
a2x2 y2 D a0 C2
a1x2 C a2x2 y33
D a0 C a1x3 C
a2x2

Mari kita menjelaskan mengapa kualifikasi '' paling '' diperlukan dengan fungsi polinomial
ini. Perhatikan bahwa jika tiga poin pada Gambar 4.10b terjadi terletak di sepanjang garis
lurus, maka fungsi polinomial unik paling derajat 2 melewati titik-titik akan selalu menjadi
garis lurus (polinomial derajat 1) bukan fungsi kuadrat , seperti umumnya yang diharapkan.
descriptor unik juga penting. Ada jumlah tak terbatas polinomial derajat lebih besar dari 2
yang melewati tiga poin digambarkan pada Gambar 4.10b. (Yakinkan diri dari fakta ini
sebelum melanjutkan dengan menggunakan Gambar 4.10c.)
150 Bab 4 Pemodelan Eksperimental

Ada, bagaimanapun, hanya satu polinomial derajat 2 atau kurang. Meskipun fakta ini
mungkin tidak jelas, kita kemudian menyatakan teorema dalam dukungannya. Untuk saat
ini, ingat dari geometri sekolah tinggi yang lingkaran unik, yang juga diwakili oleh
persamaan aljabar derajat 2, ditentukan oleh tiga poin dalam pesawat. Berikutnya kita
menggambarkan ide-ide dalam masalah diterapkan; kita kemudian membahas keuntungan
dan kerugian dari prosedur.

CONTOH 1 Berlalu Waktu dari Tape Recorder

Kita Data dikumpulkan berkaitan counter pada tape recorder tertentu dengan waktu
bermain berlalu nya. Misalkan kita tidak dapat membangun sebuah model yang bersifat
menerangkan sistem ini, tetapi masih tertarik dalam memprediksi apa yang mungkin
terjadi. Bagaimana kita dapat mengatasi kesulitan ini? Sebagai contoh, mari kita
membangun sebuah model empiris untuk memprediksi jumlah waktu berlalu dari tape
recorder sebagai fungsi membaca counter.
Dengan demikian, biarkan ci mewakili membaca counter dan ti .sec / sesuai
dengan jumlah waktu yang telah berlalu. Pertimbangkan data berikut:

csaya 100 200 300 400 500 600 700 800

tsaya 205 430 677 945 1233 1542 1872 2224


(detik)

Salah satu model empiris adalah polinomial yang melewati setiap titik data. Karena kita
memiliki delapan poin data, polinomial unik paling derajat 7 diharapkan. Menunjukkan
polinomial simbolis oleh

P7.c /D a0 C A1C C a2c2 C a3c3 C a4c4 C a5c5 C a6c6 C a7c7

Delapan titik data mengharuskan konstanta ai memenuhi sistem berikut linear aljabar
persamaan:

205 D a0 C 1A1 C 12a2 C 13a3 C 14a4 C 15a5 C 16a6 C 17a7


430 D a0 C 2a1 C2 2 a2 3C 2 a34 C 2 a4
5
C 2 6a5 C 27 a6 C 2 a7
::
2224 D a0 C 8a1 C 82a2 C 83a3 C 84a4 C 85a5 C 86a6 C 87a7

sistem yang besar persamaan linear bisa sulit untuk memecahkan dengan besar
keputusannya pra numerik. Dalam ilustrasi sebelumnya, kami membagi setiap counter
membaca dengan 100 untuk mengurangi kesulitan numerik. Karena nilai data kontra
sedang pangkat ketujuh, mudah untuk menghasilkan angka yang berbeda dengan beberapa
kali lipat. Hal ini penting untuk memiliki sebanyak akurasi mungkin dalam koefisien ai
karena masing-masing dikalikan oleh sejumlah dinaikkan ke kekuatan setinggi 7. Sebagai
contoh, sebuah a7 kecil dapat menjadi signifikan sebagai c menjadi besar. Pengamatan ini
menunjukkan mengapa mungkin ada bahaya dalam menggunakan bahkan fungsi
polinomial baik yang menangkap tren data ketika kita berada di luar jangkauan
pengamatan. Solusi berikut untuk sistem ini diperoleh dengan bantuan genggam
4.2 Tinggi Orde Model Polinomial 151

Program
kalkulator:
a0D -13: 9.999.923 a4D -5: 354.166.491
a1D 232: 9.119.031 Sebuah5 D 0: 8013888621
a2D -29: 08.333.188 a6D -0: 0624999978
a3D 19: 78.472.156 a7D 0: 0019841269

Mari kitamelihat seberapa baik model empiris cocok dengan data. Yang
menunjukkan tions prediktif polinomial oleh P7.ci /, kita menemukan

csaya 100 200 300 400 500 600 700 800

tsaya 205 430 677 945 1233 1542 1872 2224


P7csaya 205 430 677 945 1233 1542 1872 2224
/

Pembulatan prediksi untuk P7.ci / ke empat tempat desimal memberikan


perjanjian lengkap dengan data yang diamati (seperti yang diharapkan) dan hasil nol
penyimpangan mutlak. Sekarang kita bisa melihat kebodohan menerapkan salah satu
kriteria studi kecocokan dalam Bab 3 sebagai satu-satunya hakim untuk model terbaik.
Dapatkah kita benar-benar mempertimbangkan model ini menjadi lebih baik dari
model lain kita bisa mengusulkan?
Mari kitamelihat seberapa baik model baru ini P7.ci / menangkap tren data.
Model ini digambarkan pada Gambar 4.11. JJJ
JGambar
4.11 t

Model empiris untuk


memprediksi waktu yang 2400
telah berlalu dari tape
2200
recorder
2000
1800
1600
1400
1200
1000
800
600
© Cengage Learning

400
200
0 c
0 100 200 300 400 500 600 700 800

Bentuk Lagrangian dari Polinomial yang


Dari pembahasan sebelumnya kita mungkin berharap bahwaCdiberikan (n 1 / berbeda titik
data, ada polinomial unik paling derajat n yang melewati semua titik data. Karena ada
jumlah yang sama koefisien dalam polinomial karena ada data yang poin, intu- itively kita
akan berpikir bahwa hanya satu pintu keluar polinomial tersebut. hipotesis ini memang
terjadi, meskipun kita tidak akan membuktikan fakta bahwa di sini. Sebaliknya, kami
menyajikan bentuk Lagrangian dari
152 Bab 4 Pemodelan Eksperimental

polinomial kubik diikuti dengan diskusi singkat tentang bagaimana koefisien dapat
ditemukan untuk tingkat tinggi polinomial.
Misalkan data berikut telah dikumpulkan:

x x1 x2 x3 x4
y y1 y2 y3 y4

Pertimbangkan polinomial kubik berikut:


.v- x2 / .v - x3 / .v - x4 / C .v - x1 / .v - x3 / .v - x4 / y 2
P3.x / D y 1 .x2- x1 / .x2 - x3 / .x2 - x4 /
.x1- x2 / .x1 - x3 / .x1 - x4 /

.v - x1 / .v - x2 / .v - x4 / y C .v - x1 / .v - x2 / .v - x3 / y 4
C .x3- x1 / .x3 - x2 / .x3 - x4 / 3 .x4- x1 / .x4 - x2 / .x4 - x3 /

Yakinkan diri Anda bahwa polinomial memang kubik dan setuju dengan nilai yi ketika
x xi. Perhatikan
D bahwa nilai-nilai xi semua harus berbeda untuk menghindari pembagian
dengan nol. Mengamati pola untuk membentuk pembilang dan penyebut untuk koefisien
masing-masing yi. Pola yang sama ini diikuti ketika membentuk polinomial dari setiap
tingkat yang diinginkan. Prosedur ini dibenarkan oleh hasil berikut.

teorema 1
Jika x0; x1; :::; xn adalah (n C 1) poin yang berbeda dan y0; y1; :::; yn yang sesuai
pengamatan pada titik-titik tersebut, maka terdapat polinomial Px / unik, dari
paling derajat n, dengan properti yang

ykD P.xk / untuk setiap k D 0; 1; :::; n

polinomial ini diberikan oleh

px / D y0L0.x / C · C ynLn.x / (4.3)

dimana
.v - x0 / .v - x1 / · · · .v- xk-1 / .v - xkC1 / · · · .v- xn /
k .x / D
L .vk - x /.x
0 - x
k / · .v
1- x k k-1 /.x k - x kC1 / · .V -kx / n

Karena jumlahnya banyak (4.3) melewati setiap titik data, jumlah resultan dari
penyimpangan mutlak adalah nol. Mempertimbangkan berbagai kriteria cocok disajikan
dalam Bab 3, kita tergoda untuk menggunakan high-order polinomial untuk menyesuaikan
set data yang lebih besar. Setelah semua, cocok adalah tepat. Mari kita meneliti baik
kelebihan dan kekurangan menggunakan high-order polinomial.

Keuntungan dan Kerugian dari Tinggi-Order Polinomial


Ini mungkin menarik untuk menentukan area di bawah kurva mewakili model kami atau
laju perubahan pada titik tertentu. fungsi polinomial memiliki keuntungan yang berbeda
menjadi
4.2 Tinggi Orde Model Polinomial 153

mudah diintegrasikan dan dibedakan. Jika jumlahnya banyak dapat ditemukan bahwa
cukup mewakili perilaku yang mendasari, maka akan mudah untuk mendekati integral dan
turunan dari model yang benar tidak diketahui juga. Sekarang mempertimbangkan
beberapa kelemahan dari orde yang lebih tinggi polinomial. Untuk 17 poin data yang
disajikan pada Tabel 4.10, jelas bahwa tren data yang y D 0 untuk semua x lebih interval -
8 ≤ x ≤ 8.

tabel 4.10

xsay -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8
a

ysay 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
a
© Cengage Learning

Misalkan Persamaan (4.3) digunakan untuk menentukan polinomial yang melewati


titik-titik. Karena ada 17 yang berbeda titik data, adalah mungkin untuk lulus polinomial
unik tingkat paling 16 melalui poin yang diberikan. Grafik passing polinomial melalui titik
data digambarkan pada Gambar 4.12.

JGambar y
4.12

Pas tingkat tinggi


polinomial melalui titik
data pada Tabel 4.10

x
-6 -4 2 4 6
© Cengage Learning

Perhatikan bahwa meskipun jumlahnya banyak yang tidak melewati titik data (dalam
toleransi dari komputer round-off error), ada osilasi parah polinomial dekat setiap akhir
interval. Dengan demikian, akan ada kesalahan kotor dalam memperkirakan y antara titik
Cdata -dekat 8 atau 8. Demikian juga, mempertimbangkan kesalahan dalam menggunakan
turunan dari polinom untuk memperkirakan laju perubahan data atau menggunakan area
di bawah polinomial untuk memperkirakan daerah terperangkap oleh data.
Kecenderungan ini dari high-order polinomial untuk berosilasi parah dekat
endpoints dari interval adalah kerugian serius untuk menggunakan mereka.
Berikut ini adalah contoh lain dari pas tingkat tinggi polinomial untuk data. Sebar
untuk data menunjukkan halus, meningkatkan, cekung ke atas kurva (lihat Gambar 4.13).
x 0,55 1.2 2 4 6.5 12 16

y 0,13 0.64 5.8 102 210 2030 3900


154 Bab 4 Pemodelan Eksperimental

JGambar 4.13 y
Sebar data

4000

3000

2000

1000

© Cengage Learning
0 x
2 4 6 8 10 12 14 16

D
Kami cocok dengan 6-order polinomial untuk data (di mana kami memiliki tujuh
pasang, n 7) dan kemudian plot polinomial pada Gambar 4.14.

y D -0: 0138x6C 0: 5084x5 - 6: 4279x4C 34: 8575x3 - 73: 9916x2C 64: 3128x - 18: 0951

Dengan demikian, meskipun tingkat- tinggi .n 1 / st-order polinomial memberikan cocok,


perubahannya dari peningkatan menurunnya di endpoint membuat prediksi dipertanyakan
di luar jangkauan data. Selain itu dalam rentang data, perubahan polinomial dari
peningkatan ke menurun, juga membuat interpolasi dipertanyakan.
Mari kitamenggambarkan kelemahan lain dari high-order polinomial. Pertimbangkan
tiga set data yang disajikan pada Tabel 4.11.
Mari kita membahas tiga kasus. Kasus 2 hanyalah kasus 1 dengan data yang kurang
tepat: Ada satu digit kurang signifikan untuk masing-masing titik data yang diamati. Kasus
3 adalah kasus 1 dengan kesalahan
JGambar
4.14 y

Plot 6th-order
polinomial cocok
ditumpangkan pada 4000
scatterplot

3000

2000

1000
Cengage Learning
0 x
2 4 6 8 10 12 14 16
Tinggi-Order Model Polinomial 155

tabel 4.11

xsaya 0,2 0,3 0,4 0,6 0,9

Kasus 1: ysaya 2,7536 3,2411 3,8016 5,1536 7,8671


Kasus 2: ysaya 2,754 3,241 3,802 5,154 7,867
Kasus 3: ysaya 2,7536 3,2411 3,8916 5,1536 7,8671
© Cengage Learning

diperkenalkan pada pengamatan sesuai dengan x 0:D4. Perhatikan bahwa kesalahan terjadi
di digit signifikan ketiga (3,8916 bukan 3,8016). Secara intuitif, kita akan berpikir bahwa
tiga polinomial interpolasi akan sama karena tren data semua sama. Mari kita menentukan
polinomial interpolasi dan melihat apakah yang benar-benar situasi.
Karena ada lima titik data yang berbeda dalam setiap kasus, polinomial unik paling
derajat 4 dapat melewati setiap set data. Menyatakan keempat derajat polinomial simbolis
sebagai berikut:
P4.x /D a0 C a1x C a2x2 C a3x3 C a4x4
Meja4.12 tabulates koefisien a0; a1; a2; a3; a4 (untuk empat tempat desimal)
ditentukan oleh pas titik data di masing-masing tiga kasus. Perhatikan seberapa sensitif
nilai-nilai koefisien untuk data. Namun demikian, grafik polinomial hampir sama
selama selang waktu pengamatan 0,0: 2; 0: 9 /.
tabel 4.12
Sebuah0 Sebuah1 Sebuah2 Sebuah3 Sebuah4

Kasus 1 2 3 4 -1 1
kasus 2 2,0123 2,8781 4,4159 -1: 5714 1,2698
kasus 3 3,4580 -13: 2000 64,7500 -91: 0000 46,0000
© Cengage Learning

Grafik dari tiga polinomial derajat empat yang mewakili setiap kasus disajikan pada
Gambar 4.15. Contoh ini menggambarkan sensitivitas koefisien high-order polinomial
untuk perubahan kecil dalam data. Karena kami berharap kesalahan pengukuran terjadi,
kecenderungan high-order polinomial untuk berosilasi, serta sensitivitas koefisien mereka
untuk perubahan kecil dalam data, adalah kerugian yang membatasi kegunaannya dalam
pemodelan. Dalam dua bagian berikutnya kita menganggap teknik yang mengatasi
kekurangan dicatat dalam bagian ini.

Pzz Soal
1. Untuk masalah alat perekam di bagian ini, memberikan sistem persamaan menentukan
koefisien dari polinomial yang melewati setiap titik data. Jika komputer tersedia,
menentukan dan sketsa polinomial. Apakah itu mewakili tren data?
2. Pertimbangkan '' laju kehidupan '' data dari Soal 1, Bagian 4.1. Pertimbangkan pas
urutan polinomial 14th- untuk data. Diskusikan kerugian menggunakan polinomial
untuk membuat prediksi. Jika komputer tersedia, menentukan dan grafik polinomial.
156 Bab 4 Pemodelan Eksperimental

JGambar 4.15 y
kesalahan pengukuran Kecil
dapat menyebabkan perbedaan
besar 10 kasus
dalam koefisien 3
tingkat tinggi polinomial
yang menghasilkan; Kasus 1 dan 2
(Hampir tidak bisa dibedakan)
dicatat bahwa
polinomial menyimpang 9
di luar jangkauan
pengamatan.

3 © Cengage Learning

x
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0

3. Dalam data berikut, X adalah suhu Fahrenheit dan Y adalah jumlah kali jangkrik celetuk
dalam 1 menit (lihat Soal 7, Bagian 4.1). Membuat sebar data dan membahas kesesuaian
menggunakan polinomial 18 derajat yang melewati titik data sebagai model empiris.
Jika Anda memiliki komputer yang tersedia, cocok polinomial untuk data dan plot hasil.

X 46 49 51 52 54 56 57 58 59 60

Y 40 50 55 63 72 70 77 73 90 93

X 61 62 63 64 66 67 68 71 72

Y 96 88 99 110 113 120 127 137 132


Smoothing: Rendah-Order Model Polinomial157

4. Dalam data berikut, X mewakili diameter pinus Ponderosa diukur setinggi dada, dan Y
adalah ukuran volume-jumlah kaki papan dibagi dengan 10. Membuat sebar data.
Diskusikan kelayakan menggunakan polinomial 13 derajat yang melewati titik data
sebagai model empiris. Jika Anda memiliki komputer yang tersedia, cocok polinomial
untuk data dan grafik hasil.

X 17 19 20 22 23 25 31 32 33 36 37 38 39 41

Y 19 25 32 51 57 71 141 123 187 192 205 252 248 294

Smoothing: Rendah-Order Model Polinomial


Kita mencari metode yang mempertahankan banyak kemudahan yang ditemukan di high-
order polinomial tanpa menggabungkan kelemahan mereka. Salah satu teknik yang
populer adalah memilih low-order polinomial terlepas dari jumlah titik data. Pilihan ini
biasanya menghasilkan situasi di mana jumlah titik data melebihi jumlah konstanta yang
diperlukan untuk menentukan polinomial. Karena ada sedikit konstanta untuk menentukan
daripada ada titik data, low-order polinomial umumnya tidak akan melewati semua titik
data. Misalnya, diputuskan untuk menyesuaikan kuadrat untuk satu set 10 titik data.
Karena umumnya tidak mungkin untuk memaksa kuadrat untuk melewati 10 titik data, itu
harus diputuskan yang kuadrat paling sesuai dengan data (menurut beberapa kriteria,
seperti dibahas dalam Bab 3). Proses ini, yang disebut smoothing, diilustrasikan pada
Gambar 4.16. Kombinasi menggunakan low-order polinomial dan tidak memerlukan
bahwa itu melewati setiap titik data mengurangi baik kecenderungan polinomial untuk
berosilasi dan kepekaan terhadap perubahan kecil dalam data. Fungsi kuadrat ini
menghaluskan data karena tidak diperlukan untuk melewati semua titik data.
Proses smoothing membutuhkan dua keputusan. Pertama, urutan polinomial
interpolasi harus dipilih. Kedua, koefisien dari polinomial harus ditentukan menurut
beberapa kriteria untuk polinomial terbaik pas. Masalah yang dihasilkan adalah masalah
optimalisasi bentuk dibahas dalam Bab 3. Sebagai contoh, mungkin akan memutuskan
untuk cocok dengan model kuadrat untuk 10 titik data menggunakan kuadrat-terbaik pas
kriteria. Kami akan meninjau proses pas polinomial untuk satu set titik data dengan
menggunakan kriteria paling-kotak dan kemudian kembali ke pertanyaan yang lebih sulit
dari bagaimana memilih yang terbaik urutan polinomial interpolasi.

JGambar y
4.16

Fungsi kuadrat 9-order polinomial


menghaluskan data karena
tidak diperlukan untuk
melewati semua titik data. kuadrat polinomial
© Cengage Learning

x
158 Bab 4 Pemodelan Eksperimental

CONTOH 1 Berlalu Waktu dari Tape Recorder Revisited

Pertimbangkan lagi masalah pita perekam dimodelkan pada bagian sebelumnya. Untuk
kaset dek atau tape recorder tertentu dilengkapi dengan counter, berhubungan counter
untuk jumlah waktu bermain yang telah berlalu. Jika kita tertarik dalam memprediksi
waktu yang telah berlalu tetapi tidak dapat membangun sebuah model yang bersifat
menerangkan, dimungkinkan untuk membangun model empiris sebagai gantinya. Mari
kita cocok dengan polinomial orde kedua dari formulir berikut untuk data:

P2.c /D C SM C DC2

di mana c adalah kontra membaca, P2.c / adalah waktu yang telah berlalu, dan; b, dan
d adalah konstanta yang akan ditentukan. Mempertimbangkan data yang dikumpulkan
untuk masalah alat perekam di bagian sebelumnya, ditunjukkan pada Tabel 4.13.

tabel 4.13 Data yang dikumpulkan untuk masalah rekaman recorder

csaya 100 200 300 400 500 600 700 800

tsaya 205 430 677 945 1233 1542 1872 2224


(detik)
© Cengage Learning

Masalah kita adalah untuk menentukan konstanta a, b, dan d sehingga model kuadrat
resultan terbaik sesuai dengan data. Meskipun kriteria lain dapat digunakan, kita akan
menemukan kuadrat yang meminimalkan jumlah deviasi kuadrat. Secara matematis,
masalahnya adalah
XΣ . ΣΣ
Memperkecil S D m ti - Sebuah C bciC DC2 2
s
sayaD1 a
y
a
Kondisi yang diperlukan untuk minimal ada (@ S = @ a D @ S = @Db @ S = @Dd 0 /
menghasilkan persamaan berikut:
ma C .X ci Σ b C .X c2Σ d DX ti
.X Σ s
ci Sebuah C .X c2Σs b C .X c3Σ s d DX ci ti
a
y
.X Σ a
y
a
y
c2 Sebuah
s C .Xs c3Σ b C .X
a
s c4Σ d DX
a
s c2ti
a a a a
y y y y
a a a a
Untuk data yang diberikan dalam Tabel 4.13, sistem sebelumnya persamaan menjadi

8a C 3600b C 2; 040; 000d D 9128


3600a C 2; 040; 000 M C 1; 296; 000; 000d D 5; 318; 900
2; 040; 000a C 1; 296; 000; 000 M C 8: 772 ~ 1011d D 3; 435; 390; 000

Solusi dari sistem sebelumnya menghasilkan nilai D 0: 14.286; b D 1: 94.226, dan


d D 0: 00.105, memberikan kuadrat

P2.c /D 0: 14.286 C 1: 94226c C 0: 00105c2


4.3 Smoothing: Model polinomial Low-Order 159

Kita bisa menghitung deviasi antara pengamatan dan prediksi yang dibuat oleh model
P2.c /:

csaya 100 200 300 400 500 600 700 800

tsaya 205 430 677 945 1233 1542 1872 2224


tsaya - 0,167 -0: 452 0.000 0,524 0,119 -0: 214 -0: 476 0,333
P2csaya /
Catatan bahwa itu penyimpangan adalah very kecil dibandingkan untuk itu memesan dari
besarnya dari th e ti saya s.
JJ J
Ketika kita sedang mempertimbangkan penggunaan polinomial orde rendah untuk
smoothing, dua isu datang ke pikiran:
1. Harus polinomial digunakan?
2. Jika demikian, apa urutan polinomial akan sesuai?
Konsep derivatif dapat membantu dalam menjawab dua
pertanyaan ini.
Perbedaan dibagi
Perhatikan bahwa fungsi kuadrat ditandai dengan sifat-sifat yang turunan kedua adalah
konstan dan turunan ketiga adalah nol. Artinya, diberikan

px / D C bx C CX2

kita punya

P 0.x / D b C
2cx P 00.x / D
2c P 000.x / D
0

Namun,satu-satunya informasi yang tersedia adalah satu set titik data diskrit. Bagaimana
titik-titik ini digunakan untuk memperkirakan berbagai derivatif? Lihat Gambar 4.17, dan
mengingat definisi turunan:
dy oy
D lim
dx Lembu!
0 Lembu
JGambar 4.17 y
Turunan dariy D fx / y=F
dix D x1adalah batas y2 (x)
(x2, y2)
kemiringan garis sekan.

y2 - y1
Δy

© Cengage Learning
=
y1 (x1, y1)
Δx
= 2- 1
x
x1

x2
160 Bab 4 Pemodelan Eksperimental

Karena dy = dx di xD x1 dapat diartikan secara geometris sebagai kemiringan garis


Tan- gent untuk kurva sana, kita lihat dari Gambar 4.17 bahwa kecuali Ox kecil, rasio Oy
= Ox mungkin bukan perkiraan yang baik dari dy = dx. Namun demikian, jika dy = dx
adalah menjadi nol di mana-mana, maka Oy harus pergi ke - nol.C
DDengan demikian, kita
dapat menghitung perbedaan yi 1 yi oyantara nilai-
nilai fungsi cessive SUC- di data kami diajukan untuk mendapatkan informasi tentang
apa yang turunan pertama adalah melakukan. Demikian juga, karena turunan pertama
adalah fungsi, proses dapat diulang untukmemperkirakan turunan kedua. Artinya,
perbedaan antara perkiraan berturut-turut dari turunan pertama dapat dihitung untuk
perkiraan turunan kedua. sebelum menjelaskan
seluruh proses, kita menggambarkan ide ini dengan contoh sederhana.
Kita tahu bahwa kurva y Dx2 melewati poin 0,0; 0 /, 0,2; 4 /, 0,4; 16 /, 0,6; 36 /, dan
0,8; 64 /. Misalkan data yang ditampilkan pada Tabel 4.14 telah dikumpulkan.
Menggunakan data pada Tabel 4.14, kita dapat membangun sebuah meja perbedaan,
seperti yang ditunjukkan pada Tabel 4.15.
tabel 4.14 Satu set hipotetis
data yang dikumpulkan

0 2 4 6 8

0 4 16 36 64
© Cengage Learning

tabel 4.15 Sebuah meja perbedaan untuk data Tabel 4.14

Data perbedaan
xs ysaya HAI H HAI3 HAI4
ay AI
a 2

0 0
4
2 4 8
12 0
4 16 8 0
20 0
6 36 8
28
8 64
© Cengage Learning

Perbedaan pertama, dinotasikan dengan O, dibangun dengan menghitung- yiC1 D


yiuntuk i
1; 2; 3; 4. Perbedaan kedua, dilambangkan dengan O2, dihitung dengan mencari
perbedaan antara berturut perbedaan pertama dari kolom O. Proses ini dapat dilanjutkan,
kolom dengan kolom, sampai On-1 dihitung untuk poin n data. Catatan dari Tabel 4.15
bahwa perbedaan kedua dalam contoh kita adalah konstan dan perbedaan ketiga adalah
nol. Hasil ini konsisten dengan fakta bahwa fungsi kuadrat memiliki turunan kedua
konstan dan turunan ketiga nol.
Bahkan jika data pada dasarnya kuadrat di alam, kita tidak akan mengharapkan
perbedaan untuk pergi ke nol justru karena berbagai kesalahan hadir dalam proses
pemodelan dan pengumpulan data. Kita mungkin, bagaimanapun, berharap data menjadi
kecil. penilaian kami tentang pentingnya kecil dapat ditingkatkan dengan menghitung
perbedaan dibagi. Perhatikan bahwa perbedaan dihitung pada Tabel 4.15 merupakan
perkiraan dari pembilang dari masing-masing berbagai turunan order. Perkiraan ini dapat
ditingkatkan dengan membagi pembilang dengan estimasi sesuai penyebut.
Pertimbangkan tiga poin data dan perkiraan yang sesuai dari turunan pertama dan
kedua, yang disebut perbedaan pertama dan dibagi dua, masing-masing, pada Tabel 4.16.
Perbedaan pertama dibagi berikut segera dari rasio Oy = Ox. Karena kedua
4.3 Smoothing: Model polinomial Low-Order 161

tabel 4.16 Perbedaan dibagi pertama dan kedua


memperkirakan derivatif pertama dan kedua, masing-
masing

Perbedaan Perbedaan
Data dibagi Pertama dibagi kedua

x1 y1
y2 - y 1
x2 - x1 yx3-- yx2 - x -yx2 - y1
3 2 2 1

x2 y2
x3 - x1
y3 - y 2
x3 - x2
x3 y3
© Cengage Learning

JGambar y
4.18

(x3, y3)
Perbedaan dibagi kedua Slope adalah y3
- y2
dapat diartikan sebagai
perbedaan antara lereng x3 - x2
-y
yang berdekatan Slope adalah y2 1
(perbedaan pertama x2 - x1
dibagi) dibagi dengan (x2, y2)

© Cengage Learning
panjang interval yang lebih
dari (x1, y1)
x-x

Perubahan telah terjadi. 3 1

x
x1 x2 x3

derivatif merupakan tingkat perubahan dari turunan pertama, kita dapat


memperkirakan berapa banyak perubahan turunan pertama antara x1 dan x3. Artinya,
kita dapat menghitung perbedaan antara yang berdekatan perbedaan dibagi pertama
dan dibagi dengan panjang interval
- di mana perubahan yang terjadi (x3 x1 dalam hal
ini). Lihat Gambar 4.18 untuk interpretasi geometris dari perbedaan dibagi kedua.
Dalam prakteknya mudah untuk membangun sebuah meja perbedaan dibagi. Kita
menghasilkan urutan dibagi perbedaan berikutnya-tinggi- dengan mengambil perbedaan
antara saat-order perbedaan dibagi berdekatan dan kemudian membagi mereka dengan
panjang interval di mana perubahan telah terjadi. Menggunakan Pada untuk menunjukkan
perbedaan dibagi n, meja perbedaan dibagi untuk data Tabel 4.14 ditampilkan pada Tabel
4.17.
Meja 4.17 Sebuah meja perbedaan dibagi untuk
data Tabel 4.14

Data perbedaan dibagi

4=2D2
4=4D1
12 = 2 D 6 0=6D
2 4 16 4=4D
20 = 2 D 0=6D
36 10 41 = 4 D 0
64 1
28 = 2 D
162 Bab 4 Pemodelan Eksperimental

Sangat mudah untuk mengingat apa pembilang harus di setiap perbedaan dibagi meja.
Mengingat apa penyebut harus untuk perbedaan dibagi diberikan, kita dapat membuat garis
diagonal kembali ke yi dari entri data asli dan menghitung perbedaan yang sesuai xi. Hal
ini digambarkan untuk ketiga-order perbedaan dibagi dalam Tabel 4.17. Konstruksi ini
menjadi lebih penting ketika xi yang tidak merata spasi.

CONTOH 2 Berlalu Waktu dari Tape Recorder Revisited Lagi

Kembali sekarang untuk konstruksi kami dari model empiris untuk waktu yang telah
berlalu untuk tape recorder, bagaimana mungkin urutan smoothing polinomial dipilih?
Mari kita mulai dengan membangun meja perbedaan dibagi untuk data yang diberikan dari
Tabel 4.13. Perbedaan yang dibagi ditampilkan dalam Tabel 4.18.

tabel 4.18 Sebuah meja perbedaan dibagi untuk data


pita perekam

Data perbedaan dibagi


xsay ysaya HAI HAI2 HAI3 HA
a I4
100 205
2,2500
200 430 0,0011
2,4700 0,0000
300 677 0,0011 0,0000
2,6800 0,0000
400 945 0,0010 0,0000
2,8800 0,0000
500 1233 0,0011 0,0000
3,0900 0,0000
600 1542 0,0011 0,0000
3,3000 0,0000
700 1872 0,0011
3,5200
800 2224
© Cengage Learning

Catatan dari Tabel 4,18 bahwa perbedaan dibagi kedua pada dasarnya konstan dan
bahwa perbedaan dibagi ketiga sama dengan nol sampai empat tempat desimal. Tabel
menunjukkan data pada dasarnya kuadrat, yang mendukung penggunaan kuadrat
polinomial sebagai model empiris. pemodel sekarang mungkin ingin reinvestigate asumsi
untuk menentukan apakah hubungan kuadrat tampaknya masuk akal. JJJ

Pengamatan pada Tabel Perbedaan


Beberapa pengamatan tentang tabel perbedaan dibagi dalam urutan. Pertama, xi harus tinct
dis- dan terdaftar dalam urutan yang meningkat. Hal ini penting untuk peka terhadap xi
yang dekat bersama-sama karena pembagian dengan sejumlah kecil dapat menyebabkan
kesulitan numerik. Skala yang digunakan untuk mengukur baik xi dan yi yang juga harus
diperhatikan. Misalnya, jarak membenci xi yang mewakili keadaan dan saat ini diukur
dalam mil. Jika unit berubah ke kaki, penyebut menjadi jauh lebih besar, sehingga
perbedaan terbagi yang jauh lebih kecil. Dengan demikian, penilaian tentang apa yang
kecil adalah relatif dan kualitatif. Ingat, bagaimanapun, bahwa kita mencoba untuk
memutuskan apakah low-order polinomial bernilai penyelidikan lebih lanjut. Sebelum
menerima model, kita ingin membuat grafik dan menganalisis goodness of fit.
4.3 Smoothing: Model polinomial Low-Order 163

Ketika menggunakan tabel perbedaan dibagi, kita harus peka terhadap kesalahan dan
penyimpangan yang terjadi dalam data. kesalahan pengukuran dapat menyebarkan dirinya
ke seluruh meja dan bahkan membesarkan diri. Sebagai contoh, perhatikan tabel perbedaan
berikut:

HAIn-1 HAIn HAINC1

6.01
-0: 01
6.00 0.02
00:0
6.01 1

Mari kitamisalkan kolom On-1 sebenarnya konstan kecuali untuk kehadiran


kesalahan pengukuran relatif kecil. Perhatikan bagaimana kesalahan pengukuran
menimbulkan tanda negatif di kolom On. Perhatikan juga bahwa besaran angka dalam
kolom OnC1 lebih besar daripada angka-angka dalam kolom On, meskipun kolom On-1
pada dasarnya konstan. Efek dari kesalahan ini tidak hanya hadir dalam kolom berikutnya
tetapi juga menyebar ke baris lainnya. Karena kesalahan dan penyimpangan biasanya
hadir dalam data yang dikumpulkan, penting untuk peka terhadap efek mereka dapat
menyebabkan dalam tabel perbedaan. Secara historis, tabel perbedaan dibagi digunakan
untuk menentukan berbagai bentuk polinomial polating antar yang melewati subset
yang dipilih dari titik data. Hari ini teknik interpolasi lain, seperti smoothing dan
kubik splines, yang lebih populer. theless pernah-, tabel perbedaan yang mudah
dibangun pada komputer dan, seperti derivatif yang
mereka mendekati, menyediakan sumber yang murah dari informasi yang berguna tentang data.
Contoh 3 Kendaraan Stopping Distance

Masalah berikut disajikan dalam Bagian 2.2: Memprediksi Total jarak berhenti
kendaraan sebagai fungsi dari kecepatan. Dalam bab-bab sebelumnya, model yg
menjelaskan dibangun menggambarkan perilaku kendaraan. Model-model akan ditinjau
pada bagian berikutnya. Untuk saat ini, kira tidak ada model yg menjelaskan tetapi hanya
data yang ditampilkan pada Tabel 4.19. Jika pemodel tertarik dalam membangun model
empiris dengan menghaluskan data,
tabel perbedaan dibagi dapat dibangun seperti yang ditampilkan pada Tabel 4.20.
Pemeriksaan meja mengungkapkan bahwa perbedaan dibagi ketiga kecil besarnya
dibandingkan dengan data dan tanda-tanda negatif mulai muncul. Seperti telah dibahas
sebelumnya, tanda-tanda negatif mungkin menunjukkan adanya kesalahan pengukuran
atau variasi dalam data yang tidak akan ditangkap dengan low-order polinomial. Tanda-
tanda negatif juga akan memiliki efek yang merugikan pada perbedaan dalam kolom yang
tersisa. Di sini, kita dapat memutuskan untuk menggunakan model kuadrat, dengan alasan
bahwa hal tingkat tinggi tidak akan mengurangi penyimpangan cukup untuk membenarkan
inklusi mereka, tapi penilaian kami adalah kualitatif. Istilah kubik mungkin akan
menjelaskan beberapa untuk penyimpangan tidak diperhitungkan oleh model terbaik
kuadrat (jika tidak, nilai optimal dari koefisien jangka kubik akan menjadi nol,
menyebabkan

tabel 4.19 Data yang berkaitan Total menghentikan jarak dan kecepatan
Kecepatan v 20 25 30 35 40 45 50 55 60 65 70 75 80
(mph)
Jarak d (ft) 42 56 73,5 91,5 116 142,5 173 209,5 248 292,5 343 401 464
© Cengage Learning
164 Bab 4 Pemodelan Eksperimental

tabel 4.20 Sebuah meja perbedaan dibagi untuk data yang


berhubungan Total kendaraan berhenti jarak dan kecepatan

Data perbedaan dibagi


vs dsaya HAI HAI2 HAI3 HAI
ay 4
a
20 42
2,2800
25 56 0,0700
3,5000 -0: 0040
30 73,5 0,0100 0,0006
3,6000 0,0080
35 91,5 0,1300 -0: 0007
4,9000 -0: 0060
40 116 0,0400 0,0004
5,3000 0,0027
45 142,5 0,0800 0,0000
6,1000 0,0027
50 173 0,1200 -0: 0004
7,3000 -0: 0053
55 209,5 0,0400 0,0005
7,7000 0,0053
60 248 0,1200 -0: 0003
8,9000 0,0000
65 292,5 0,1200 0,0001
10,1000 0,0020
70 343 0,1500 -0: 0003
11,6000 -0: 0033
75 401 0,1000
12,6000
80 464
© Cengage Learning

polinomial kuadrat dan kubik bertepatan), tapi penambahan istilah orde yang lebih tinggi
meningkatkan kompleksitas model, kerentanan untuk osilasi, dan sensitivitas terhadap
kesalahan data. Pertimbangan ini dipelajari dalam statistik.
Dalam model berikut, v adalah kecepatan kendaraan, Pv / adalah jarak berhenti, dan
Sebuah, B, dan c adalah konstanta yang akan ditentukan.
pv / D C bv C cv2
Masalah kita adalah untuk menentukan konstanta a, b, dan c sehingga model kuadrat
resultan terbaik sesuai dengan data. Meskipun kriteria lain dapat digunakan, kita akan
menemukan kuadrat yang meminimalkan jumlah deviasi kuadrat. Secara matematis,
masalahnya adalah
m
X . ΣΣ2
meminimalkan SD Σ di — Sebua C cv2
sayaD1
hC
BVI
s
a
y
a
Kondisi yang diperlukan untuk minimal ada (@ S = @ a D @ S = @D
b @ S = @D
c 0/
menghasilkan persamaan berikut:
ma C .X vi Σ b C .X v2Σ
s
c DX d
.X Σ a
y
vi SebuahC .X v2Σ
s b C .X av3Σ c DX vi di
s
.X Σ a
y
a
y
v2 SebuahC
s .X v3Σ
a
s b C .Xa v4Σ c DX v2di
s s
a a a a
y y y y
a a
Pergantian dari data pada Tabel 4.19 memberikan sistem a a
13a C 650b C 37; 050c D 2652: 5
650A C 37; 050b C 2; 307; 500c D 163; 970
37; 050a C 2; 307; 500b C 152; 343; 750c D 10; 804; 975
4.3 Smoothing: Model polinomial Low-Order 165

yang mengarah ke solusi D 50: 0594, bD - 1: 9701, dan CD 0: 0886 (Dibulatkan


menjadi empat desimal). Oleh karena itu, model kuadrat empiris diberikan oleh

pv / D 50: 0594 - 1: 9701v C 0: 0886v2

Akhirnya, fit dari Pv / dianalisis dalam Tabel 4.21. model empiris ini cocok lebih
baik dari model

d D 1: 104v C 0: 0542v2

ditentukan dalam Bagian 3.4, karena ada parameter tambahan (yang konstan dalam hal ini)
yang menyerap beberapa kesalahan. Namun, perlu diketahui bahwa model empiris
memprediksi jarak berhenti sekitar 50 ft ketika kecepatan adalah nol. JJJ
tabel 4.21 Smoothing penghentian jarak menggunakan polinomial kuadrat
vsaya 20 25 30 35 40 45 50

dsaya 42 56 73,5 91,5 116 142,5 173

dsaya - Pvsaya / -4: 097 -0: 182 2,804 1,859 2,985 1.680 -0: 054

vsaya 55 60 65 70 75 80

dsaya 209,5 248 292,5 343 401 464

dsaya - Pvsaya / -0: 719 -2: 813 -3: 838 -3: 292 0,323 4,509
© Cengage Learning

Contoh 4 Pertumbuhan Budaya Ragi

Dalam contoh ini kita mempertimbangkan koleksi titik data yang tabel perbedaan dibagi
dapat membantu dalam memutuskan apakah low-order polinomial akan memberikan
model empiris yang memuaskan. Data mewakili populasi sel ragi dalam budaya diukur
dari waktu ke waktu (dalam jam). Sebuah meja perbedaan dibagi untuk data populasi
diberikan oleh Tabel 4.22.
D t 8 jam, ketika
Perhatikan bahwa yang pertama dibagi perbedaan O meningkat sampai
mereka mulai menurun. Karakteristik ini tercermin dalam kolom O2 dengan munculnya
string berturut-turut tanda-tanda negatif, menunjukkan perubahan cekung. Dengan
demikian, kita tidak bisa berharap untuk menangkap tren data ini dengan fungsi kuadrat
yang hanya memiliki cekung tunggal. Pada kolom O3, tanda-tanda negatif tambahan
muncul secara sporadis, meskipun besarnya angka-angka yang relatif besar.
Sebuah sebar data yang diberikan pada Gambar 4.19. Meskipun meja perbedaan
dibagi menunjukkan bahwa fungsi kuadrat tidak akan menjadi model yang baik, untuk
ilustrasi misalkan kita mencoba untuk cocok dengan kuadrat pula. Menggunakan kriteria
paling-kotak dan persamaan yang dikembangkan sebelumnya untuk contoh tape recorder,
kita menentukan model kuadrat berikut untuk data pada Tabel 4.22:

P D -93: 82 C 65: 70t - 1: 12t 2


166 Bab 4 Pemodelan Eksperimental

tabel 4.22 Sebuah meja perbedaan dibagi untuk


pertumbuhan ragi dalam suatu budaya

Data perbedaan dibagi


tsa Ps HAI HAI2 HAI3 HA
ya ay I4
a

0 9,60
8.70
1 18.30 1.00
10.70 0.92
2 29.00 3,75 -0: 31
18.20 -0: 30
3 47,20 2,85 0.84
23.90 3.07
4 71,10 12,05 -1: 46
48.00 -2: 77
5 119,10 3,75 1,51
55.50 3.28
6 174,60 13,60 -1: 51
82,70 -2: 75
7 257,30 5.35 0.11
93,40 -2: 30
8 350,70 -1: 55 -0: 05
90,30 -2: 48
9 441.00 -9: 00 0,29
72,30 -1: 32
10 513,30 -12: 95 0,94
46.40 2,43
11 559,70 -5: 65 -0: 16
35,10 1.80
12 594,80 -0: 25 -1: 40
34.60 -3: 78
13 629,40 -11: 60 1,87
11.40 3,68
14 640,80 -0: 55 -1: 10
10.30 -0: 73
15 651,10 -2: 75 0,37
4.80 0,73
16 655,90 -0: 55 -0: 20
3.70 -0: 07
17 659,60 -0: 75
2.20
18 661,80
© Cengage Learning

JGambar 4.19
Sebuah sebar dari '' 700
pertumbuhan ragi dalam
budaya '' Data 600

500

400
Populasi

300

200
© Cengage Learning

100

Waktu
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
Smoothing: Rendah-Order Model Polinomial 167

J Gambar 4.20
Model kuadrat terbaik pas
gagal untuk menangkap
tren data; perhatikan
besarnya
penyimpanganPsaya - pt saya /.
P= -93,82 + 65.7t - 1.12t2

Populasi

Waktu
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

© Cengage
Learning
Model dan titik data diplot pada Gambar 4.20. Model ini cocok sangat buruk, seperti yang
kita harapkan, dan gagal untuk menangkap tren data. Dalam masalah membuat Anda akan
diminta untuk sesuai dengan model kubik dan periksa kewajaran nya. Pada bagian
berikutnya Anda akan diminta untuk membangun sebuah model spline kubik yangJsesuai JJ
dengan data yang jauh lebih baik.

MASALAH
Untuk set data dalam Masalah 1-4, membangun sebuah meja perbedaan dibagi.
kesimpulan apa yang dapat Anda lakukan tentang data? Apakah Anda menggunakan low-
order polinomial sebagai model empiris? Jika demikian, agar apa?

1.
y 2 8 24 56 110 192 308 464

2.
y 23 48 73 98 123 148 173 198

3.
y 7 15 33 61 99 147 205 273

4.
y 1 4,5 20 90 403 1808 8103 36.316

5. Membangun sebar untuk para '' pertumbuhan ragi dalam budaya '' data. Apakah data
tampak masuk akal? Buatlah sebuah tabel perbedaan dibagi. Coba smoothing dengan
low-order polinomial kubik menggunakan kriteria yang sesuai. Menganalisis fit dan
membandingkan model Anda untuk
168 Bab 4 Pemodelan Eksperimental

kuadrat yang kami mengembangkan di bagian ini. Grafik model Anda, titik data, dan
penyimpangan.
Dalam Masalah 6-12, membangun sebar dari data yang diberikan. Apakah ada tren di
data? Apakah salah satu outlier titik data? Buatlah sebuah tabel perbedaan dibagi.
Apakah smoothing dengan low-order yang sesuai polinomial? Jika demikian, memilih
polinomial yang tepat dan cocok menggunakan kriteria kuadrat-yang paling cocok.
Menganalisis goodness of fit dengan memeriksa indikator yang tepat dan grafik model,
titik data, dan penyimpangan.
6. Dalam data berikut, X adalah suhu Fahrenheit dan Y adalah jumlah kali jangkrik
celetuk dalam 1 menit (lihat Soal 3, Bagian 4.2).
X 46 49 51 52 54 56 57 58 59 60

Y 40 50 55 63 72 70 77 73 90 93
X 61 62 63 64 66 67 68 71 72

Y 96 88 99 110 113 120 127 137 132

7. Dalam data berikut, X mewakili diameter pinus Ponderosa diukur setinggi dada, dan
Y adalah ukuran volume-jumlah kaki papan dibagi dengan 10 (lihat Soal 4, Bagian
4.2).
X 17 19 20 22 23 25 31 32 33 36 37 38 39 41

Y 19 25 32 51 57 71 141 123 187 192 205 252 248 294

8. Itu berikut data yang mewakili populasi Amerika Serikat 1790-2000.

Tahun populasi yang diamati

1790 3.929.000
1800 5.308.000
1810 7.240.000
1820 9.638.000
1830 12.866.000
1840 17.069.000
1850 23.192.000
1860 31.443.000
1870 38.558.000
1880 50.156.000
1890 62.948.000
1900 75.995.000
1910 91.972.000
1920 105.711.000
1930 122.755.000
1940 131.669.000
1950 150.697.000
1960 179.323.000
1970 203.212.000
1980 226.505.000
1990 248.709.873
2000 281.416.000
Model Spline kubik 169

9. Data berikut diperoleh untuk pertumbuhan populasi domba diperkenalkan ke


lingkungan baru di pulau Tasmania. (Diadaptasi dari J. Davidson, '' Di Pertumbuhan
Populasi Domba di Tasmania, '' Trans Roy Soc S. Australia 62 (1938):.... 342-346)

t(tahun) 1814 1824 1834 1844 1854 1864

1650

10. Data berikut merupakan '' laju kehidupan '' data (lihat Soal 1, Bagian 4.1). P adalah
populasi dan V adalah mean kecepatan dalam kaki per detik selama kursus 50-ft.

P 365 2500 5491 14000 23700 49.375 70700


78.200

V 2,76 2,27 3,31 3.70 3,27 4.90 4.31 3,85


P 138.000 304.500 341.948 867.023 1092759 1340000 2602000

V 4.39 4.42 4.81 5.21 5,88 5.62 5.05

11. Data berikut mewakili panjang dari ikan bass dan berat.

Panjang (di). 12,5 12,625 14,125 14,5 17.25 17.75

Berat(ons) 17 16,5 23 26,5 41 49

12. Data berikut merupakan hasil angkat berat dari 1976 Olimpiade.

kelas berat badan (lb) Jumlah lift menang (lb)

Max. berat Merebut Meny Totalberat


entak
kan
Kelas terbang 114,5 231,5 303,1 534,6
bantam 123.5 259,0 319,7 578,7
Kelas bulu 132,5 275,6 352,7 628,3
ringan 149,0 297,6 380,3 677,9
menengah 165.5 319,7 418,9 738,5
Kelas berat ringan 182,0 358,3 446,4 804,7
Tengah-kelas berat 198,5 374,8 468,5 843,3
Kelas berat 242,5 385,8 496,0 881,8

Model Spline kubik


Penggunaan polinomial dalam membangun model empiris yang menangkap tren data yang
menarik, karena polinomial begitu mudah untuk mengintegrasikan dan membedakan. Agar
polinomial tinggi, bagaimanapun, cenderung berosilasi dekat titik akhir dari interval data,
dan koefisien dapat cukup sensitif terhadap perubahan kecil dalam data. Kecuali data pada
dasarnya kuadrat atau kubik di alam, smoothing dengan polinomial orde rendah dapat
menghasilkan fit relatif miskin di suatu tempat selama rentang data. Misalnya, model
kuadrat
170 Bab 4 Pemodelan Eksperimental

y y lengkungan Perancis y

batang
fleksibel
(x3, y3) (x3. y3) 3)
(x3, y
(x2, y2)

© Cengage Learning
(x2, y2) (x2, y2)
(x1, y1)
(x1, y1) (x1, y1)
x x x

Sebuah b c

J Gambar 4.21
Sebuah draftsperson mungkin mencoba untuk menggambar kurva halus
melalui titik data menggunakan kurva Perancis atau batang fleksibel tipis
yang disebutspline.

yang cocok dengan data yang dikumpulkan untuk masalah jarak pengereman kendaraan
dalam Bagian 4.3 tidak cocok dengan baik pada kecepatan tinggi.
Pada bagian ini teknik modern yang sangat populer disebut kubik spline interpolasi
diperkenalkan. Dengan menggunakan polinomial kubik yang berbeda antara pasangan
berurutan dari titik data, kita dapat menangkap tren data terlepas dari sifat hubungan yang
mendasari, sementara secara bersamaan mengurangi kecenderungan osilasi dan sensitivitas
terhadap perubahan data.
Mempertimbangkan data pada Gambar 4.21a. Apa yang akan draftsperson lakukan
jika diminta untuk menggambar kurva halus yang menghubungkan titik-titik? Salah satu
solusi akan menggunakan alat gambar yang disebut kurva Perancis (Gambar 4.21b), yang
sebenarnya mengandung banyak kurva yang berbeda. Dengan memanipulasi kurva
Perancis, kita bisa menggambar kurva yang bekerja cukup baik antara dua titik data dan
transisi lancar untuk kurva lain untuk pasangan berikutnya titik data. Alternatif lain adalah
dengan mengambil batang fleksibel yang sangat tipis (disebut spline) dan paku itu turun di
setiap titik data. Cubic spline interpolasi pada dasarnya ide yang sama, kecuali bahwa
polinomial kubik yang berbeda digunakan antara pasangan berurutan dari titik data dengan
cara yang halus.

1 5
2 8
3 25
© Cengage Learning

Meja 4.23
interpolasi
linier

xsaya
yxsa
ya/
Splines but tabel nilai (misalnya, akar kuadrat, meja trigonometri, atau meja logaritmik) tanpa
menemukan nilai yang kita cari. Kami menemukan, sebaliknya, dua nilai yang braket nilai
linier yang diinginkan, dan kami membuat penyesuaian proporsionalitas.
M Sebagai contoh, perhatikan Tabel 4.23. Misalkan perkiraan nilai y pada D x 1:67
u diinginkan. Mungkin kita akan menghitung Y.1: 67/5= 0,2C= 3 / 0,8 5 -/ 7. Artinya,
D kita secara
n implisit mengasumsikan bahwa variasi dalam y, antaraDx 1 dan x 2,Dterjadi secara linier.
g Demikian pula, Y.2: = 33/132.
3
Prosedur ini disebut interpolasi linear, dan untuk banyak
k aplikasi itu menghasilkan hasil yang wajar, terutama di mana data erat spasi.
i Gambar 4.22 adalah membantu dalam menafsirkan proses interpolasi linear
n geometris dengan cara yang meniru apa yang dilakukan dengan kubik spline
k interpolasi. Ketika x adalah di x1 selang ≤ x <x2, model yang digunakan adalah spline
it linear S1.x / melewati
a
s
e
m
u
a
p
a
d
a
s
a
t
u
w
a
k
t
u
a
t
a
u
l
a
i
n
t
e
l
a
h
d
i
s
e
4.4 Model Spline Kubik 171

JGambar 4.22 y
Sebuah model spline linier
adalah fungsi kontinu yang (x3,
S2(X) = a2 + y3)
terdiri dari segmen garis.
b2x

© Cengage Learning
(X1, y1) (x2, y2)

S1(X) = a1 + b1x
x
x1 x2 x3

titik data (x1, y1 / dan .x2; y2 /:

S1.x / D a1 C B1X untuk x di Œx1; x2/


Demikian pula, ketika x2x <x3.spline linear S2.x / melewati (x2; y2 / dan .x3; y3 /
digunakan:

S2.x / D a2 C b2x untuk x di Œx2; x3]

Perhatikan bahwa kedua segmen spline bertemu pada titik (x2; y2 /.


Mari kitamenentukan konstanta untuk splines masing-masing untuk data yang diberikan
dalam Tabel 4.23.
Spline S1.x / harus melewati poin 0,1; 5 / dan 0,2; 8 /. Secara matematis ini menyiratkan

a1C 1b1 D
5 a1 C 2b1
D8

Demikian pula, spline S2.x / harus melewati poin 0,2; 8 / dan 0,3; 25 /,
menghasilkan

a2C 2b2 D 8
a2 C 3B2 D
25

Solusi dari persamaan-persamaan linear Dmenghasilkan D D 2,


a1 - b1 3, a2 26,
D dan b2
17. Model spline linear untuk data pada Tabel 4,23 diringkas dalam Tabel 4.24.
Untuk menggambarkan bagaimana model spline linier digunakan,≤mari kita
memprediksi Y.1: 67 / dan Y.2: 33 = /. Karena 1 1:67≤<2, S1.x ≤ / dipilih untuk
menghitung S1.1: = 67 / 7:01. Demikian juga, 2 02:33 3 menimbulkan ke S2.2
prediksi: 33 / 13:61.
Meskipun metode spline linear cukup untuk banyak aplikasi, gagal untuk menangkap
tren data. Selain itu, jika kita meneliti Gambar 4.23, kita melihat bahwa spline linear

Meja 4.24 Sebuah model


spline linier untuk data Tabel
4.23
Selang spline model

1 ≤ x <2 S1.x /D 2 C 3x
2≤x≤3 S2.x / D -26 C 17x
© Cengage Learning
172 Bab 4 Pemodelan Eksperimental

JGambar 4.23 y
Linear spline tidak muncul
mulus karena turunan (x3. y3)
pertama tidak kontinyu. S2(X) memiliki
kemiringan 17

S1(X) memiliki

© Cengage Learning
kemiringan 3
(x2, y2)
(x1, y1)
x
x1 x2 x3

Model tidak muncul mulus. Artinya, dalam intervalŒ1; 2 /, S1.x / memiliki


kemiringan yang konstan 3, sedangkan di intervalŒ2;3] S2.x /memiliki D kemiringan
konstan 17. Dengan demikian, pada x 2 ada tiba-tiba perubahan di itu lereng dari itu
begitu bahwa itu pertama derivatif S10 .x / dan S20 .x / fbersakit
model dari 3 untuk 17. D
untuk setuju di x 2. Sebagai kita akan menemukan, itu proses dari kubik splines interpolasi
menggabungkan kehalusan ke dalam model empiris dengan mensyaratkan bahwa kedua
turunan pertama dan kedua dari splines berdekatan setuju pada setiap titik data.

Splines Cubic
Pertimbangkan sekarang Gambar 4.24. Dalam cara yang analog dengan splines
linear, kita mendefinisikan fungsi spline terpisah untuk interval x1 ≤ x <x2 dan x2 ≤
x <x3 sebagai berikut:

S1.x / D a1 C B1XC c1x2C D1X3 untuk x di Œx1;


x2 / S2.x / D a2 C b2xC c2x2C D2X3 untuk x
di Œx2; x3]

Karena kita akan ingin merujuk pada turunan pertama dan kedua, mari kita
mendefinisikan mereka juga:
S10 .x / D b1C 2c1xC 3d1x2 untuk x di Œx1; x2
/ S100.x / D 2c1C 6d1x untuk x di Œx1; x2
/ S2 0 .x / D b2C 2C2xC 3d2x2 untuk x di Œx2;
x3] S200 .x / D 2c2C 6d2x untuk x di Œx2;
x3]
Model ini disajikan geometris pada Gambar 4.24.

JGambar 4.24 y S1(X) = a1 + b1x + c1x2 + d1x3


Sebuah model spline kubik S2(X) = a2+ b2x + c2x2+
adalah fungsi kontinu d2x3
dengan terus menerus (x3, y3)
pertama dan kedua
turunan terdiri dari
segmen polinomial kubik.
© Cengage Learning
(x2, y2)
(x1, y1)
x
x1 x2 x3
4.4 Model Spline Kubik 173

splines kubik menawarkan kemungkinan pencocokan atas tidak hanya lereng tetapi
juga kelengkungan pada setiap titik data interior. Untuk menentukan konstanta
mendefinisikan setiap segmen spline kubik, kami menghimbau untuk persyaratan bahwa
setiap spline melewati dua titik data yang ditentukan oleh interval di mana spline
didefinisikan. Untuk model yang digambarkan dalam Gambar 4.24, persyaratan ini
menghasilkan persamaan

y1D S1.x1 / D a1 C b1x11 C c1x2


1 C d1x3
y2D S1.x2 / D a1 C b1x22 C c1x2
2 C d1x3
y2D S2.x2 / D a2 C b2x22 C c2x2
2 C d2x3
y3D S2.x3 / D a2 C b2x33 C c2x2
3 C d2x3

Perhatikan bahwa ada delapan diketahui .a1; b1; c1; d1; a2; b2; c2; d2 / dan hanya empat
persamaan dalam sistem sebelumnya. Tambahan empat persamaan independen diperlukan
untuk menentukan konstanta unik. Karena kelancaran sistem spline juga diperlukan,
berdekatan turunan pertama harus sesuai pada titik interior data (dalam hal Dini, ketika x
x2). Persyaratan ini menghasilkan persamaan

S10 .x2/D b1 C 2c1x2 C 3d1x2


2 D b2 C 2c2x22 C 3d2x2
2 D S0 .x2 /

Hal ini juga dapat diperlukan bahwa derivatif kedua yang berdekatan cocok di setiap titik interior
juga:

S100.x2 / D 2c1C 6d1x2 D 2c2C 6d2x2 D S200.x2 /

Untuk menentukan konstanta yang unik, kita masih membutuhkan dua persamaan
independen tambahan. Walaupun kondisi pada derivatif di titik data interior telah
diterapkan, tidak ada yang telah dikatakan tentang derivatif pada titik akhir eksterior (x1
dan x3 pada Gambar 4.24). Dua kondisi populer dapat ditentukan. Salah satunya adalah
untuk meminta agar tidak ada perubahan dalam turunan pertama di titik akhir eksterior.
Secara matematis, karena turunan pertama adalah konstan, turunan kedua harus nol.
Penerapan kondisi ini pada x1 dan x3 hasil

S100.x1 / D 2c1C 6d1x1 D 0


S200.x3 / D 2c2C 6d2x3 D 0

Sebuah spline kubik terbentuk dengan cara ini disebut spline alami. Jika kita berpikir lagi
dari analog kami dengan batang fleksibel tipis ditempelkan ke bawah pada titik-titik data,
spline alami memungkinkan batang untuk bebas di titik akhir untuk menganggap apa pun
arah titik data menunjukkan. Spline alami ditafsirkan secara geometris pada Gambar 4.25a.
Atau, jika nilai-nilai turunan pertama di titik akhir eksterior diketahui, turunan
pertama dari splines eksterior dapat diminta untuk mencocokkan nilai-nilai yang dikenal.
Misalkan derivatif di titik akhir eksterior diketahui dan diberikan oleh f 0.x1 / dan f 0.x3 /.
Secara matematis, persyaratan pencocokan ini menghasilkan persamaan

S 0 1.x1 / D b1C 2c1x1C 3d1x21 D f 0 .x1 /


S20 .x3 / D b2C 2c2x3C 3d2x2 0
3 D f .x3 /

Sebuah spline kubik terbentuk dengan cara ini disebut spline dijepit. Sekali lagi
mengacu analog batang fleksibel kami, situasi ini sesuai dengan menjepit batang
fleksibel dalam catok di
174 Bab 4 Pemodelan Eksperimental

y y

Derivatif
dipaksa untuk

© Cengage Learning
nilai-nilai
yang dikenal

x x
a. spline alami b. dijepit spline

JGambar 4.25
Kondisi untuk splines kubik alam dan dijepit menghasilkan turunan pertama di
dua endpoint eksterior yang konstan; yang nilai konstan untuk turunan
pertama ditentukan dalam spline dijepit, sedangkan ia bebas untuk
mengasumsikan nilai alam di spline alami.

endpoint eksterior untuk memastikan bahwa batang fleksibel memiliki sudut yang tepat.
spline kubik yang dijepit ditafsirkan secara geometris pada Gambar 4.25b. Kecuali
informasi yang tepat tentang turunan pertama di titik akhir diketahui, spline alami
umumnya digunakan.
Mari kitamenggambarkan pembangunan model spline kubik alam dengan
menggunakan data yang ditampilkan pada Tabel 4.23. Kami menggambarkan teknik
dengan contoh sederhana ini, karena prosedur ini mudah diperluas untuk masalah dengan
poin lebih banyak data.
Membutuhkan segmen spline S1.x / melewati dua endpoint 0,1; 5 / dan 0,2; 8 /
interval yang mengharuskan S1.1 / D 5 dan S1.2 / D 8, atau

a1C 1b1 C 1c1 C 1d1


2
D 5 a1 C 2b1 C 23 c1 C
2 d1 D 8

Demikian pula, S2.x / harus melewati titik ujungnya interval kedua sehingga S2.2 / D 8
dan S2.3 / D 25, atau
a2C 2b2 C 22c2 C 23d2
D 8 a2 C 3B2 C 32c2 C
33d2 D 25

Berikutnya, turunan pertama S1.x / dan S2.x / dipaksa untuk mencocokkan pada titik data yang
interior
x2 D 2: S10 0,2 / D S20 0,2 /. atau
b1C 2c1.2 / C 3d1.2 / 2 D b2 C 2c2.2 / C 3d2.2 / 2
Forcing itu kedua derivatif dari S1.x / dan S2.x / untuk pertandingan
D di x2 2 D
membutuhkan S 1000,2 / S2000,2 /. atau
2C1C 6d1.2 / D 2C2 C 6d2.2 /
Akhirnya, spline alami dibangun dengan mensyaratkan bahwa derivatif kedua di titik
akhir menjadi nol: S100.1 / D S200.3 / D 0, atau
2C1C 6d1.1 / D 0
2C2C 6d2.3 / D 0
4.4 Model Spline Kubik 175

tabel 4.25 Sebuah model spline kubik alami


untuk data Tabel 4.23

Selang Model

1 ≤ x <2 S1.x /D 2 C 10x- 10: 5x2C 3: 5x3


2≤x≤3 S2.x /D 58- 74x C 31: 5x2- 3: 5x3
© Cengage Learning

JGambar y
S (X) 2
1 = 2 + 10x - 10.5x + 3.5x
3

4.26 S2(X) = 58 - 74x + 31.5x2 - 3.5x3


25
Model spline kubik (3, 25)
alami untuk data di 20
Meja 4.23 adalah kurva halus 15

© Cengage Learning
yang mudah diintegrasikan 10
dan dibedakan. (2, 8)
5
(1, 5)
x
1 2 3

Dengan demikian, prosedur telah menghasilkan sistem aljabar linear dari delapan
persamaan dalam delapan diketahui yang dapat diselesaikan unik. Model yang dihasilkan
dirangkum dalam Tabel 4.25 dan grafiknya pada Gambar 4.26.
Mari kita menggambarkan penggunaan model dengan lagi memprediksi Y.1: 67 / dan Y.2: 33
/:

S1.1: 67 /= 5:72
S2.2: 33 /= 00:32

Bandingkan nilai-nilai ini dengan nilai-nilai yang diprediksi oleh spline linear. Di
mana nilai-nilai yang Anda miliki paling percaya diri? Mengapa?
Pembangunan splines kubik untuk data yang lebih menunjukkan hasil dengan cara
yang sama. Artinya, setiap spline dipaksa untuk melewati titik akhir dari interval di mana
itu didefinisikan, turunan pertama dan kedua dari splines yang berdekatan dipaksa untuk
mencocokkan di titik data interior, dan baik kondisi dijepit atau alami diterapkan di dua
titik data eksterior. Untuk alasan komputasi itu akan diperlukan untuk melaksanakan
prosedur pada komputer. Prosedur kita dijelaskan di sini tidak menimbulkan algoritma
komputer komputasi atau numerik efisien. Pendekatan kami dirancang untuk memfasilitasi
pemahaman kita tentang konsep-konsep dasar yang mendasari spline interpolation.3 kubik
Hal ini mengungkapkan untuk melihat bagaimana grafik dari splines kubik yang
berbeda cocok bersama untuk membentuk kurva tunggal komposit interpolasi antara titik
data. Pertimbangkan data berikut (dari Soal 4, Bagian 3.3.):

x 7 14 21 28 35 42

y 8 41 133 250 280 297

3Untuk algoritma komputasi yang efisien, lihat RL Beban dan JD Faires, Analisis Numerik, ed ke-9. (Pacific
Grove, CA: Brooks / Cole, 2010).
176 Bab 4 Pemodelan Eksperimental

Karena ada enam titik data, lima polinomial kubik yang berbeda, S1-S5, dihitung
untuk membentuk spline kubik alami komposit. Masing-masing cubics ini adalah
digambarkan dan overlay pada grafik yang sama untuk memperoleh Gambar 4.27. Antara
dua titik data berturut-turut hanya satu dari lima polinomial kubik aktif, memberikan
kelancaran spline kubik komposit yang ditunjukkan pada Gambar 4.28.
Kamuharus peduli dengan apakah prosedur yang baru saja dijelaskan hasil dalam
solusi yang unik. Juga, Anda mungkin bertanya-tanya mengapa kita melompat dari spline
linier dengan spline kubik tanpa membahas splines kuadrat. Secara intuitif, Anda akan
berpikir bahwa turunan pertama bisa disesuaikan dengan spline kuadrat. Isu-isu ini dan
terkait dibahas dalam kebanyakan teks analisis numerik (misalnya, lihat Burden dan Faires
dikutip sebelumnya).

JGambar 4.27 y
Antara dua titik data S4
berturut-turut hanya satu 300 S2
kubik spline polinomial 270
S5 S5
aktif. (Graphics oleh Jim
240
McNulty dan Bob Hatton) S1
210
S3
180
150

Grafis oleh Jim McNulty dan Bob Hatton


120 S3

90 S4
S
2
60
30 S1
0 x

0 5 10 15 20 25 30 35 40 45 50

JGambar 4.28 y
Halus komposit spline S5
kubik dari polinomial 300
S4
kubik pada Gambar 4.27 270
240
210 S3
180
150
120
S2
90
© Cengage Learning

60
S1
30
0 x
0 5 10 15 20 25 30 35 40 45
4.4 Model Spline Kubik 177

CONTOH 1 Kendaraan Stopping Distance Revisited

Perhatikan kembali masalah yang ditimbulkan dalam Bagian 2.2: Memprediksi Total
berhenti dikan dis kendaraan sebagai fungsi dari kecepatan. Dalam Bagian 2.2, kita
beralasan bahwa model harus memiliki bentuk

d D K1V C K2V2

dimana d adalah total jarak berhenti, v adalah kecepatan, dan k1 dan k2 adalah
konstanta dari proporsionalitas yang dihasilkan dari submodels untuk jarak reaksi dan
jarak pengereman mekanik, masing-masing. Kami menemukan kesepakatan yang wajar
antara data dilengkapi untuk submodels dan grafis diperkirakan k1 dan k2 untuk
mendapatkan model

d D 1: 1V C 0: 054v2

Dalam Bagian 3.4 kita diperkirakan k1 dan k2 menggunakan kriteria paling-kotak dan
diperoleh model
d D 1: 104v C 0: 0542v2
Fit dari sebelumnya dua model dianalisis dalam Tabel 3.7. Perhatikan khususnya bahwa
kedua model memecah pada kecepatan tinggi, di mana mereka semakin meremehkan jarak
berhenti. Dalam Bagian 4.3, kami membangun model empiris dengan menghaluskan data
dengan kuadrat polinomial, dan kami menganalisis cocok.
Sekarang anggaplah bahwa kita tidak puas dengan prediksi yang dibuat oleh model
analitik kami atau tidak mampu untuk membangun model analitik, tapi kami merasa perlu
untuk membuat prediksi. Jika kita cukup puas dengan data yang dikumpulkan, kita
mungkin mempertimbangkan membangun sebuah model spline kubik untuk data yang
disajikan pada Tabel 4.26.
Menggunakan kode komputer, kami memperoleh model yang spline kubik diringkas
dalam Tabel 4.27. Tiga pertama segmen spline diplot pada Gambar 4.29. Perhatikan
bagaimana setiap segmen melewati titik data di kedua ujung interval, dan perhatikan
kelancaran transisi di seluruh segmen yang berdekatan. JJJ

Ringkasan: Membangun Model Empiris


Kitamenyimpulkan bab ini dengan menghadirkan ringkasan dan menyarankan prosedur
untuk ing construct- model empiris menggunakan teknik yang disajikan. Memulai prosedur
dengan memeriksa data dalam mencari titik data tersangka yang Anda perlu memeriksa
lebih dekat dan mungkin

tabel 4.26 Data yang berkaitan Total menghentikan jarak dan kecepatan

Kecepatan, v (mph) 20 25 30 35 40 45 50

Jarak, d (ft) 42 56 73,5 91,5 116 142,5 173

Kecepatan, v (mph) 55 60 65 70 75 80
Jarak, d (ft) 209,5 248 292,5 343 401 464
© Cengage Learning
178 Bab 4 Pemodelan Eksperimental

tabel 4.27 Sebuah model spline kubik untuk jarak berhenti kendaraan

Selang Model

20 ≤ v <25 S1v / D 42 C 2: 596.v - 20 / C 0: 008.v - 20 /3


25 ≤ v <30 S2v / D 56 C 3: 208.v - 25 / C 0: 122.v - 25 /2 - 0: 013.v - 25 /3
30 ≤ v <35 S3v /D 73: 5 C 3: 472.v- 30 / - 0: 070.v - 30 /2C 0: 019.v- 30 /3
35 ≤ v <40 S4v /D 91: 5 C 4: 204.v- 35 / C 0: 216.v - 35 /2- 0: 015.v - 35 /3
40 ≤ v <45 S5v /D 116 C 5: 211.v- 40 / - 0: 015.v - 40 /2C 0: 006.v- 40 /3
45 ≤ v <50 S6v / D 142: 5 C 5: 550.v - 45 / C 0: 082.v - 45 /2 C 0: 005.v - 45 /3
50 ≤ v <55 S7v /D 173 C 6: 787.v- 50 / C 0: 165.v - 50 /2- 0: 012.v - 50 /3
55 ≤ v <60 S8v / D 209: 5 C 7: 503.v - 55 / - 0: 022.v - 55 /2 C 0: 012.v - 55 /3
60 ≤ v <65 S9v /D 248 C 8: 202.v- 60 / C 0: 161.v - 60 /2- 0: 004.v - 60 /3
65 ≤ v <70 S10v / D 292: 5 C 9: 489.v - 65 / C 0: 096.v - 65 /2 C 0: 005.v - 65 /3
70 ≤ v <75 S11v /D 343 C 10: 841.v- 70 / C 0: 174.v - 70 /2- 0: 005.v - 70 /3
75 ≤ v <80 S12v /D 401 C 12: 245.v- 75 / C 0: 106.v - 75 /2- 0: 007.v - 75 /3
© Cengage Learning

d (Ft)
100
90 S3(y)
80
70 S2(y)
60 S1(y)
50
40
30
20

© Cengage Learning
10
y (Mph)
20 25 30 35

JGambar 4.29
Sebuah plot dari model spline kubik untuk berhenti jarak kendaraan untuk 20 ≤ v ≤ 35

membuang atau mendapatkan baru. Secara bersamaan, melihat apakah tren ada dalam data.
Biasanya, pertanyaan-pertanyaan ini yang terbaik dianggap dengan membangun sebar,
mungkin dengan bantuan komputer jika banyak sekali data yang berada di bawah
pertimbangan. Jika tren tidak muncul ada, pertama menyelidiki model satu-istilah
sederhana untuk melihat apakah salah satu memadai menangkap tren data. Anda kemudian
dapat mengidentifikasi model satu-istilah menggunakan transformasi yang mengubah data
menjadi garis lurus (kurang-lebih). Anda dapat menemukan transformasi antara tangga
transformasi atau di antara transformasi dibahas dalam Bab 3. Sebuah plot grafis dari data
ditransformasikan sering berguna untuk menentukan apakah model satu-istilah linearizes
data. Jika Anda menemukan cocok memadai, model yang dipilih dapat cocok grafis atau
analitis menggunakan salah satu kriteria yang dibahas dalam Bab 3. Berikutnya,
melakukan analisis yang cermat untuk menentukan seberapa baik model sesuai dengan titik
data dengan indikator memeriksa seperti jumlah deviasi absolut, yang terbesar mutlak
deviasi, dan jumlah penyimpangan kuadrat. Sebuah plot dari penyimpangan sebagai fungsi
dari variabel independen (s) mungkin berguna untuk menentukan di mana model tidak
cocok dengan baik. Jika cocok membuktikan tidak memuaskan, pertimbangkan model
satu-istilah lainnya. Sebuah plot dari penyimpangan sebagai fungsi dari variabel
independen (s) mungkin berguna untuk menentukan di mana model tidak cocok dengan
baik. Jika cocok membuktikan tidak memuaskan, pertimbangkan model satu-istilah
lainnya. Sebuah plot dari penyimpangan sebagai fungsi dari variabel independen (s)
mungkin berguna untuk menentukan di mana model tidak cocok dengan baik. Jika cocok
membuktikan tidak memuaskan, pertimbangkan model satu-istilah lainnya.
memeriksa
data

TI IYA MEMERIKSA
KEL DA NIH
UAR KECEN outliers
DERUN (REPLACE / HAPUS)

MENCARI MODEL ONE


JANGKA
(TANGGA DARI
KEKUASAAN)

FIT DIPILIH
MODEL ONE
JANGKA
(BAGIAN 3)

COCOK IYA KEL


MEMADAI NIH UAR
?

TI
DA

IYA LAIN
NIH MODEL
ONE
JANGKA
?
TI
DA
CONSTRUCT
PERBEDAAN
TABLE

KELUAR IYA FIT RENDAH


LOW- NIH
PESANAN PESANAN
TINGKAH POLINOMIAL
TIDAK LAKU
TI
DA
© Cengage Learning

IYA CONSTRUCT TI IYA KEL


KELUAR
NIH MEMADAI? CUBIC (LINEAR) DA MEMADAI? NIH UAR
SPLINE

J Gambar 4.30
Sebuah flowchart untuk empiris model bangunan
179
180 Bab 4 Pemodelan Eksperimental

Jika Anda menentukan bahwa model satu-istilah yang tidak memadai, gunakan
polinomial. Jika ada sejumlah kecil titik
- data, mencoba (n 1 / st-order polinomial melalui
titik n data. Pastikan untuk dicatat osilasi apapun, terutama di dekat titik akhir interval.
Sebuah plot-hati dari polinomial akan membantu mengungkapkan fitur ini. Jika ada
sejumlah besar titik data, mempertimbangkan low-order polinomial untuk kelancaran data.
sebuah meja perbedaan dibagi adalah bantuan kualitatif dalam menentukan apakah low-
order polinomial yang tepat dan dalam memilih urutan polinomial yang . Setelah urutan
polinomial yang dipilih, Anda mungkin cocok dan menganalisis polinomial sesuai dengan
teknik yang dibahas dalam Bab 3. Jika smoothing dengan polinomial orde rendah
membuktikan tidak memadai, gunakan kubik (atau linear) splines. Lihat Gambar 4.30
untuk Ringkasan flowchart dari diskusi ini.

Pzz Soal
1. Untuk setiap set data sebagai berikut, menulis sebuah sistem persamaan untuk
menentukan koefisien dari splines kubik alami melewati titik-titik tertentu. Jika
program komputer tersedia, memecahkan sistem persamaan dan grafik splines.
Sebuah.
12
b.
15 35

c.
10 30

d.
10 40

UntukMasalah 2 dan 3, menemukan splines kubik alami yang melewati titik data yang
diberikan. Gunakan splines untuk menjawab kebutuhan.

2. x 3.0 3.1 3.2 3.3 3.4 3,5 3.6 3.7 3.8 3.9

y 20.08 22.20 24.53 27.12 29.96 33,11 36,60 40,45 44,70 49,40

a. Memperkirakan turunan dievaluasi pada x D 03:45. Bandingkan perkiraan


Anda dengan turunan dari mantan dievaluasi pada x D 03:45.
b. Memperkirakan daerah di bawah kurva 3,3-3,6. Dibandingkan dengan
Z 3: 6
ex dx
3: 3

3. x 0 v= v= v= 2v = 5V = 6 v
6 3 2 3
y 0.00 0,50 0,87 1.00 0,87 0,50 0.00
4.4 Model Spline Kubik 181

4. Untuk data yang dikumpulkan dalam masalah alat perekam (Bagian 4.2 dan 4.3) yang
berkaitan dengan waktu yang telah berlalu dengan membaca counter, membangun
spline alami yang melewati titik data. Bandingkan model ini dengan model
sebelumnya yang telah Anda dibangun. Model yang membuat prediksi terbaik?
5. Biaya Stamp Pos-Timbangkan data berikut. Gunakan prosedur dalam bab ini untuk
menangkap tren data jika ada. Apakah Anda menghilangkan titik data? Mengapa?
Apakah Anda bersedia untuk menggunakan model untuk memprediksi harga prangko
pada 1 Januari 2010? Apa berbagai model Anda membangun memprediksi tentang
harga pada 1 Januari 2010? Ketika harga akan mencapai $ 1? Anda mungkin
menikmati membaca artikel yang masalah ini didasarkan: Donald R. Byrkit dan Robert
E. Lee, '' Biaya Stamp Pos, atau Up, Up, and Away, '' Matematika dan Komputer
Pendidikan 17, tidak ada. 3 (Musim Panas 1983): 184-190.

Tanggal Kelas utama stempel

1885-1917 $ 0,02
1917-1919 0,03 (Kenaikan masa
perang)
1919 0.02 (Dipulihkan oleh
Kongres)
6 Juli 1932 0,03
1 Agustus 1958 0,04
7 Januari 1963 0,05
7 Januari 1968 0,06
16 Mei 1971 0,08
2 Maret 1974 0.10
31 Desember 1975 0,13 (Sementara)
18 Juli 1976 0,13
15 Mei 1978 0,15
22 Maret 1981 0,18
November 1, 1981 0,20
17 Februari 1985 0.22
April 3, 1988 0.25
3 Februari 1991 0,29
1 Januari 1995 0,32
10 Januari 1999 0.33
7 Januari 2001 0.34
30 Juni 2002 0,37
8 Januari 2006 0,39
14 Mei 2007 0,41
12 Mei 2008 0.42
May 11, 2009 0.44
22 Januari 2012 0,45