OLEH :
NIM : C20332092
PROGRAM PASCASARJANA
2021
Regresi nonlinear adalah suatu metode untuk mendapatkan model linear yang
menyatakan hubungan variable dependen (Y) dan independen(X). Asumsi kelineran tidak
selalu dapat dipenuhi dalam suatu analisis regresi. Hal ini dapat juga dilihat dari letak titik-
titik pada diagram pencar data (x,y) yang sangat menyimpang dari sebuah garis lurus.
Banyak model regresi nonlinear diantaranya Model Polinom, Model Eksponen, Model
Geometris, Model Logistik, dan Model Hiperbola. Berikut adalah penjelasan dari model-
model tersebut:
A. Model Polinom
Model Polinom dinyatakan dalam bentuk umum:
y=C 0 +C 1 X +C 2 X 2+ …+C k X k
Dimana C i , I = 0,1,2,..k (bilangan bulat positif) adalah konstanta.
1. Model polinom derajat dua
Model polinom mempunyai hanya satu peubah dasar, yaitu x, untuk k = 1 diperolah
dari model regresi linear sederhana (garis lurus)
Y =C 0 +C 1 X
Polinom derajat dua, yaitu untuk k = 2 mempunyai model kuadratik (parabola)
dengan bentuk umum
Y =C 0 +C 1 X +C 2 X 2
Dari model matematis tersebut, maka dapat ditulis model statistik parabola dalam
bentuk
μY ∨ X =β 0+ β 1 X + β 2 X 2
Atau
Y = β0 + β 1 X + β 0 X 2 + ε
Dimana:
Y dan X = Peubah statistis
β 0 + β 1+ β 2 = Parameter yang tidak diketahui (koefisien regresi)
μY ∨ X = Rerata Y pada X yang diberikan
ε = komponen kesalahan yang mewakili selisih antara respons teramati Y dan
X respons rata-rata μY ∨ X pada X.
Jika diasumsikan model parabola diatas yang tepat untuk menjelaskan hubungan X
dan Y, pertama harus menentukan sebuah taksiran parabola tertentu yang paling sesuai
dengan ditentukan menggunakan metode kuadrat terkecil.
n n n
n b0 + b 1 ∑ xi + b2 ∑ xi 2 = ∑ yi
i=1 i=1 i=1
n n n n
b 0 ∑ xi + b1 ∑ xi 2 + b 2 ∑ xi3 = ∑ xiyi
i=1 i=1 i=1 i=1
n n n n
b0 ∑ xi 2
+ b 1 ∑ xi 3
+ b2 ∑ xi 4
= ∑ xi yi 2
Perhatikan sebuah contoh hipotesis berikut untuk menunjukkan metode regresi polinom
Andaikan sebuah studi labolatorium untuk menentukan hubungan antara dosis (X)
dari jenis obat dan tambahan berat badan (Y) dari sejenis hewan. Delapan hewan jenis
kelamin, umur, dan ukuran badan yang sama dipilih secara acak dan diberikan satu diantara
delapan tingkatan dosis. Rancagan studi ini dapat dipertanyakan karena tidak mempunyai
lebih dari satu hewan yang menerima dosis yang sama, seperti juga kecilnya ukuran
sampel. Ulangan pada setiap dosis yang akan memberikan taksiaran yang andal tentang
variasi data dari hewan ke hewan. Akan tetapi, untuk beberapa studi labolatorium,
mendapatkan sejumlah hewan yang cukup tidak selalu tersedia dengan mudah, juga biaya
dan waktu sering menjadi faktor penghambat. Harus dicatat bahwa data untuk contoh ini
diupayakan untuk menyederhanakan analisis dan menunjukkan adanya hubungan yang
jelas bersifat derajat dua.
Tabel 6.1 Tambahan berat badan setelah dua minggu
sebagai fungsi dari tingkatan dosis.
Tingkatan Dosis (X) 1 2 3 4 5 6 7 8
Tambahan Berat
(Y) (dag) 1 1,2 1,8 2,5 3,6 4,7 6,6 9,1
Tambahan berat dalam dekagram (dag) diukur untuk setiap hewan setelah dua
minggu, dimana semua hewan dalam keadaan labolatorium dan gizi yang sama. Data
diberikan dalam Tabel 6.1, dan diagram pencarkan diberikan pada gambar 6.1. Dengan
mata kepala dapat melihat bahwa diagram menunjukkan sebuah kurva parabola dan
merupakan model yang lebih sesuai daripada sebuah garis lurus. Kita akan
mengkuantitatifkan hasil pengamatan mata ini.
1 2 3 4 5 6 7 8 X
Gambar 6.1 Diagram Pencar data hipotesis studi berat hewan
8 b0 + 36 b 1 + 204 b 2 = 30,5
36 b 0 + 204 b 1 + 1296 b 2 = 184,0
204 b 0 + 1296 b 1 + 8772 b 2 = 1227,0
Tabel 6.2 Nilai-nilai yang perlu untuk regresi parabola
X Y X2 X3 X4 XY X2Y
1 1 1 1 1 1 1
2 1,2 4 8 16 2,4 4,8
3 1,8 9 27 81 5,4 16,2
4 2,5 16 64 256 10 40
5 3,6 25 125 625 18 90
6 4,7 36 216 1296 28,2 169,2
7 6,6 49 343 2401 46,2 323,4
8 9,1 64 512 4096 72,8 582,4
36 30,5 204 1296 8772 184 1227
Ŷ =1,348−0,414 X+ 0,170 X 2
Terdapat tiga pertanyaan dasar yang berkaitan dengan inferensi regresi polinom derajat dua.
a. Apakah regresi kuadratik itu signifikan; yaitu lebih banyak variasi Y yang dapat
dijelaskan oleh model derajat dua daripada mengabaikan X sama sekali ( dan hanya
menggunakan Y )?
b. Apakah model derajat dua secara signifikan memberikan daya ramal yang lebih besar
daripada yang diberikan yang diberikan oleh model garis lurus?
c. Andaikan bahwa model derajat dua lebih sesuai daripada model garis lurus, apakah
sebagainya) terhadap model derajat dua?
Untuk menentukan regresi kuadratik signifikan, diperlukan uji hipotesis nol, H0:
Regresi dengan suku-suku X dan X2 tidak signifikan (yaitu β1 = β2 = 0 ). Prosedur penguji
untuk hipotesis nol ini menggunakan uji F dengan menghitung
Dimana:
RJK = Rata-rata jumlah kuadrat atau jumlah kuadrat (JK) dibagi dengan derajat
kebebasan (dk) yang bersangkutan,
RJKR = Rata-rata jumlah kuadrat kesalahan.
Untuk membandingkan nilai statistik F dengan nilai krisis yang sesuai dari
distribusi F, digunakan nilai tabel yang (dalam contoh ini) mempunyai dk pembilang 2 dan
dk penyebut 5. Jika nilai statistik F lebih besar daripada nilai F tabel, maka pengujian
signifikan dan H0 ditolak. Akan tetapi dengan perhitungan komputer, nilai tabel distribusi
F tidak diperlukan karena nilai statistika F yang diperoleh disertai dengan nilai peluang P(F
> Fhitung ) yang bisa disebut nilai p. Jika nilai p inilebih kecil daripada nilai taraf signifikansi
yang ditentukan, maka pengujian signifikan.
Tabel analisis variasi (ANAVAR) untuk model regresi parabola dapat dibuat seperti
pada model regresi garis lurus. Dengan bantuan Aplikasi SAS atau Aplikasi SPSS.
Perhitungan akan lebih mudah dan hanya memberikan perintah
Model Summary
Mode R R Adjusted R Std. Error of
l Square Square the Estimate
1 .998a .997 .995 1984
a. Predictors: (Constant), X2, Tingkatkan Dosis
ANOVAa
Model Sum of Df Mean F Sig.
Squares Square
1 Regression 56.872 2 28.436 722.73 .000b
1
Residual .197 5 .039
Total 57.069 7
a. Predictors: (Constant), X2, Tingkatan Dosis
b. Dependent Variable: Tambahan Berat
Coefficientsa
Model Unstandardized Standardized t Sig.
Coefficients Coefficients
B Std. Error Beta
1 (Constant) 1.348 .277 4.872 .005
Tingkatan -414 .141 -355 -2.932 .033
Dosis
X2 -.170 .015 1.342 11.085 .000
a. Dependent Variable: Tambahan Berat
Kesimpulan :
- Koefisien korelasinya ( R ) = 0,998
- Bentuk hubungannya atau persamaan garis regresinya sangat nyata (P<0,01),
lihat sig pada ANOVA .000
- Persamaan garis regresinya Ŷ =1,348−0,414 X+ 0,170 X 2
lihat nilai B pada table Coefisient.
Hasil dari Aplikasi SAS sama dengan Aplikasi SPSS hanya saja dengan tampilan
berbeda, dimana hasil SPSS menunjukan bahwa nilai statistik F = 722,73 dengan nilai p =
0,0001 yang berarti pengujian tersebut signifikan.
Kesimpulannya adalah bahwa model derajat satu (garis lurus) tidak sebagus model
derajat dua (parabola). Kita sekarang perlu menentukan apakah menambahkan suku-suku
derajat lebih tinggi terhadap model derajat dua dibutuhkan.
Contoh, kita dapat menambahkan suku X3 pada model derajat dua dan kemudian
menguji apakah hasil ramalan secara signifikansi ditingkatkan. Membentuk model derajat
tiga dengan kuadrat terkecil menghasilkan table ANAVAR yang diberikan pada Tabel 6.3
Tabel 6.3 ANAVAR untuk model kubik dengan data berta hewan
Sumber Variansi dk JK RJK F
Regresi X 1 52,04 52,04
X2|X 1 4,830 4.830
X3|X,X2 1 0.140 0.140 10,00
Kesalahan 4 0,056 0.014
Total 7 57,07
R2= 0.999
Untuk menguji apakah tambahan suku derajat tiga secra signifikan meningkatkan
kesesuaian model, statistic berikut di hitung:
0,140
¿ =10,00
0,014
Y =1,348−0,414+ 0,170 X 2
Akhirnya, mengetahui simpangan baku (atau kesalahan baku) dari taksiran koefisien
regresi akan bermanfaat. Sangat sulit menghitung dengan manual untuk model yang
melibatkan dua atau leih peubah peramal. Namun, semua program regresi yang umumnya
digunakan memberikan nilai-nilai numeric untuk taksiran koefisien regresi beserta taksiran
simpangan bakunya. Untuk model regresi derajat dua terdapat hasil pengolahan data dalam
hasil computer, didapatkan Sb1=0,141 (Std.Error of Estimate untuk X) dan Sb2=0.015
(Std.Error of Estimate untuk X*X). Sebagai contoh, interval kepercayaan 100(1-α)% untuk
β2 adalah:
Di mana dk untuk nilai kritis yang sesuai adalah dk yang sesuai dengan JKK dalam Tabel
6.3. Secara khusus, interval kepercayaan 95% untuk β2 dalam contoh kita adalah:
Karena b2=0,170, t0,975;5=2,57, dan Sb2=0,015. Kita bias melihat bahwa interval ini tidak
memuat nol, yang sesuai dengan kesimpulan table ANAVAR yang menyangkut pentingnya
suku X2 dalam model kuadratik. Jadi, tidak cukup alas an untuk menyatakan bahwa β 2=0
pada taraf kepercayaan 95%.
2. Model derajat lebih tinggi
Kita sudah melihat cara ide-ide dasar regresi ganda dapat diterapkan untuk
membentuk dan menguji model kuadratik dan kubik. metode yang sama digunakan untuk
semua model polinon derajat lebih tinggi..
Banyaknya data secara langsung membatasi derajat yang dapat digunakan.kita dapat
memperhatikan data tambahan berat hewan(tabel 6.1) dengan delapan nilai yang
berbeda,polinom derajat tujuh akan sesuai dengan delapan titik secara sempurna ,
memberikan nilai JKK=0 dan nilai R2=1. Namun , karna persamaan yang dibentuk akan
mempunyai delapan taksiran parameter,tidak ada penghematan yang dibuat dengan hanya
mendaftar delapan titik.umumnya ,maksimum derajat polinom yang dapat dibentuk satu
kurangnya dari banyaknya nilai X yang berbeda
3. Uji Tuna Cocok
Misalnya, data dalam table 6.4 menunjukkan hasil pengamatan terhadap banyaknya
pengunjung (X) dan banyaknya yang brbelanja (Y) pada sebuah tokoh selam 30 hari. Untuk
mempermudahkan perhitungan, data diurutkan berdasarkan besarnya X
Tabel 6.4 Data pengunjung (X) dan pembeli (Y) sebuah Tokoh
X Y X Y X Y
30 29 35 32 39 35
32 31 36 30 40 38
32 30 36 32 40 35
33 31 36 34 40 33
33 32 37 33 40 37
34 32 37 34 40 36
34 31 37 32 41 37
34 30 38 36 42 36
34 30 38 34 42 35
34 32 39 36 42 38
Kita bisa melihat adanya ulangan nilai-nilai X pada data tersebut, sehingga variasi
kesalahan pengukuran dapat diperhitungkan.
Dari hasil computer, kita peroleh nilai F=92,335 dengan nilai p=0,0001. Dengan
demikian, taksiran model Regeresi Y= 8,24 + 0,68X siginafikansi secara statis. Kita bias
memeriksa, apakah JKK masih cukup besar. Kalau JKK masih cukup besar, kita bias
meningkatakan model dengan memepertimbangakan model lain, seperti kuadratik atau
model non linier lainnya. Untuk maksud ini, uji tuna cocok dapat dilakukan. Untuk
melakukan itu JKK dipecah menjadi dua bagian, yaitu JKK karena pengukuaran, yaitu
JKK(P), dan JKK karena tuna cocok, yaitu JKK(TC). Rumus untuk menghitung JKK(P)
adalah
JKK ( P ) = ∑
x
{∑ 2
Y -
i
(∑ Y i )
ni }
Dengan tanda jumlah yang pertama ∑ diambil untuk semua nilai X yang sama, dan
ni = banyaknya nilai X yang sama tersebut untuk kelompok ke-i. JKK(TC) dapat dihitung
dengan pengurangan yaitu:
JKK ( P )= { 292−29 ¿2 ¿ ¿ 1 } +¿
JKK ( P )=36,9667.
Dengan demikian, JKK ( TC )=JKK −JKK ( P ) 46,29619−¿36,7667 = 9,3302. Banyaknya
nilai X yang berbeda k = 12, sehingga dk untuk tuna cocok adalah 12 – 2 = 10. Kemudian,
kita dapat membuat table ANAVAR seperti pada Tabel 6.4
Jika α=5%, dengan dk pembilang 10 dan dk penyebut 18, kita mendapatkan F0,05;
(10,18) = 2,41. Untuk uji tuna cocok, didapat F = 0,4543 dan ini lebih kecil dari 2,41. Jadi,
pengujian tidak signifikan, yang berarti rerata kuadrat tuna cocok tidak dapat menjadi
alasan untuk mangatakan bahwa model linier ditolak. Dengan demikian, tidak ada alas an
untuk mencari model nonlinier.
Dengan strategi seleksi maju, seseorang biasanya menguji pentingnya sebuah calon
peubah peramal(predictor) dengan membandingkan jumlah kuadrat ekstra regresi untuk
tambahan peramal itu terhadap rerata kuadrat sisaan (residual mean square). Rerata kuadrat
sisaan ini berdasarkan pada penentuan sebuah model yang memuat calon peubah(peramal)
dean peubah-peubah yang tidak ada di dalam model. Statistik F parsial yang sesuai dalam
bentuk
JK ( X i|X , X 2 , … , X i−1 )
1
F ( X i| X , X 2 ,… , X i−1 ) = ,
RJKsisaan ( X , X 2 , … , X i )
Pendekatan uji seleksi maju yang dijelaskan di atas dapat membawa pada
pelemahan (underfitting) data, yakni algoritma seleksi maju tampaknya berhenti terlalu
cepat, sehinnga memilki model dengan derjat lebih rendah daripada yang sesungguhnya
diperlukan.
Bias ini dapat dihindari dengan menggunakan strategi seleksi mundur, dimana uji F
pada setiap langkah mundur selalu melibatkan rata-rata kuadrat kesalahan untuk model
penuh (atau terbesar) yang dibentuk. Akan tetapi, ketika menggunakan pendeketan
eliminasi mundur, itu mungkin menguatkan (overfit) data, (yakni memilih sebuah model
akhir yang sedikit lebih tinggi daripada yang diperlukan). Untungnya, taksiran rata-rata
kuadrat sisa σ 2dari model penuh masih merupakan taksiran sahih (unbiased). Akibatnya,
menggunakan taksiran ini pada penyebut uji F parsial pada setiap langkah mundurakan
tetap menjadi prosedur sahih. Apa yang hilang dengan sedikit mengangkat data adalah
suatu kuasa statistis (statistical power), akan tetapi kehilangan ini biasanya diabaikan.
B. Model Eksponen
Model eksponen adalah salah satu model yang juga banyak digunakan apabila
situasi tidak memungkinkan model linear atau polinom. Taksiran model eksponen ditulis
dengan
Ŷ =a b X
Dengan a dan b konstanta, dan dapat dikembalikan kepada model linear apabila diambil
logaritmanya. Dalam bentuk logaritma persamaannya menjadi
n n
∑ log Y i ∑ Xi
i=1
log a= −(logb) i=1
n n
log b=n ¿ ¿ ¿
Untuk penggunaan model ini, kita perhatikan data dalam Tabel 6.5.
Minggu ke
1 2 3 4 5 6 7 8 9 10
Tinggi Y (cm) 6 15 23 27 30 37 38 38 39 40
8 12 23 29 33 37 36 36 38 38
9 13 20 30 32 36 36 39 42
13 25 35 35
Peubah X
1 2 3 4 5 6 7 8 9 10
Log Y 0,7782 1,1761 1,3617 1,4314 1,4771 1,5682 1,5798 1,5798 1,5911 1,6021
0,9031 1,0792 1,3617 1,4624 1,5185 1,5682 1,5563 1,5563 1,5798 1,5798
0,9542 1,1139 1,3010 1,4771 1,5051 1,5563 1,5563 1,5911 1,6232
1,1139 1,3979 1,5441 1,5441
n n
2
∑ X =1148 , ∑ X i logY i=260,2505 dan n=33
i
i=1 i=1
Ŷ =(11,25)(1,173)x
Nilai log a dan logb dapat diperoleh langsung dengan bantuan komputer. Perintah
yang diberikan pada SAS adalah
Model eksponen yang kita bangun adalah log Ÿ =log a+log bX, sehingga dari hasil
komputer kita peroleh log a=1,051 dan log b=0,0693 (cara manual memberikan hasil
0,0692). Dari hasil komputer, selain kita dapat menentukan taksiran parameter model,
signifikansi model juga diberikan. Kita perhatikan bahwa nilai F=77,792 dengan nilai
P=0,0001. Nilai R 2=0,7151menunjukkan bahwa model signifikan dengan daya ramal
sekitar 72%.
Model eksponen diatas sering pula disebut model pertumbuhan karena sering
banyak digunakan dalam menganalisis data sebagai hasil pengamatan mengenai gejala yang
sifatnya tumbuh. Dalam hal ini, modelnya diubah sedikit dan persamaannya menjadi
Ŷ =a e bX
Dengan e=¿ bilangan pokok logaritma alam atau logaritma Napier, yang nilainya hingga
empat desimal adalah 2,7183.
ln Ŷ =ln a+bX
dan ini linear dalam X sehingga ln a dan b dapat diri seperti biasa.
Jika daftar logaritma alam (kalkulator dengan fungsi ln atau bilange ¿ tidak tersedia maka
dapat digunakan daftar logaritma biasa, akan tetapi persamaan regresi menjadi
l og Ŷ =log a+ 0,4343 bX
C. Model Geometris
dan ini merupakan model linear dalam log X dan log Ŷ . Koefisien-koefisienadan b dapat
dicari dari
n n
∑ log Y i ∑ log X i
log a= i=1 −b i=1
n n
b=n ¿ ¿
Untuk melihat penggunaan rumus ini, kita perhatikan data (sudjana,1992) dalam
Tabel 6.7 yang grafiknya terdapat pada gambar 6.2.
X Y X Y
20 150 500 97
35 125 800 62
60 105 1200 58
100 100 1300 40
150 92 1500 38
300 97 1600 35
1600
1200
80
40
0
40 800 1200 1600 X
Untuk mengetahui apakah model geometris cocok atau tidak dan untuk ini
diperlukan tabel 6.8
Tabel 6.8 nilai-nilai yang diperlukan untuk menghitung a dan b model geometris
Xi Yi log Xi log Yi log Xi log Yi log2 Xi
20 150 1,30103 2,176091 2,831160001 1,692679
35 125 1,544068 2,09691 3,237771743 2,384146
60 105 1,778151 2,021189 3,593980279 3,161822
100 100 2 2 4 4
150 92 2,176091 1,963788 4,273381526 4,735373
300 97 2,477121 1,986772 4,921474491 6,13613
500 97 2,69897 1,986772 5,362237316 7,284439
800 62 2,90309 1,792392 5,203474367 8,427931
1200 58 3,079181 1,763428 5,429914407 9,481357
1300 40 3,113943 1,60206 4,98872406 9,696643
1500 38 3,176091 1,579784 5,017536872 10,08756
1600 35 3,20412 1,544068 4,947379275 10,26638
Jumlah 29,45186 22,51325 53,80703434 77,35446
Dengan menggunakan rumus diatas untuk data tabel 6.11 kita peroleh :
Nilai log a dan log b maupun hasil uji signifikansi model dapat pula diperoleh langsung
dengan bantuan komputer. Perhitungan komputer dengan model log Ŷ = log a + b log X
memberikan hasil bahwa log a = 2,5770 dan b = -0,2856 yang sama dengan hasil manual.
Informasi tambahan pada hasil komputer memberi tahukan bahwa model signifikan karena
nila F = 47,673 dengan nila F =0,0001. Selanjutnya, daya ramal model sebesar 83% (R 2 =
0,8266) diberikan juga dalam hasil komputer itu.
D. MODEL LOGISTIK
Model logistik mempunyai banyak bentuk,dan penggunaannya juga cukup luas. Bentuk
model logistik yang paling sederhana dapat ditaksir oleh
1
Ŷ=
a bx
Dengan a dan b konstanta. Untuk Ŷ yang tidak sama dengan nol,bentuk diatas dapat pula
ditulis sebagai
1
=a b X
Ŷ
n n
1
log a ∑ log ∑ Xi
Y −( log b) i=1
i=1
¿
n n
n
1
log b=n ∑ X i log ¿−¿ ¿ ¿
i=1 Yi
1
Gunakan data Tabel 6.7 untuk membuat suatu model logistik log ( ¿= log a + (log
Ŷ
b) X. Hasil komputer dapat memberikan nilai – nilai log a dan log b sebagai berikut.
Dari hasil komputer kita peroleh nilai log a = -2,0864 yang memberikan nilai a =
0,0082, dan log b = 0,000334 yang memberikan b = 1,000769 dengan demikian, logistik
yang diperoleh adalah
1
Ŷ=
( 0,0082 ) ¿ ¿
Model ini signifikan dan memilki daya ramal sekitar 93%. Hal ini ditunjukkan oleh
nilai F = 138,145 dengan nilai p = 0,0001, dan nilai R2 = 0,9325.
Model logistik ini memiliki aplikasi yang cukup penting pada regresi dengan
peubah terikatnya bernilai biner( 0 dan 1). Jika Y peubah bernilai 1 dan 0, sedangkan X
peubah dengan skala pengukuran interval, bentuk khusus model regresi logistik adalah
β 0+β
ϱ 1
X
π (x )= β0+ β
1+ ϱ X
1
Dimana π (x) = H (Y|x) adalah nilai harapan bersyarat Y untuk nilai tertentu X = x
yang diberikan. Karena Y, peubah dikontomi, nilai harapan bersyarat ini harus lebih atau
sama dengan 0 dan kurang dari atau sama dengan 1 (yakni ≤ H(Y|x)≤1).
Bentuk model logistik yang secara khusus digunakan dalam Hosmer dan Stanley
Lomeshow (1989) dengan mendefinisikan logit transformation adalah sebagai berikut
π(x)
g ( x )=ln [ β +β x
1−π (x ) 0 1 ]
Transformasi ini sangat penting karena model regresinya memilki sifat-sifat seperti sebuah
model regresi linear.
E. Model Hiperbola
Perkiraan persamaan umum sederhana untuk model hiperbola ini dapat dituliskan
dalam bentuk
1
Ŷ=
a+ bX
atau jika tidak ada Ŷ yang bernilai nol dapat ditulis menjadi
1
=a+bX
Ŷ
dengan a dan b konstanta,yang ternyata merupakan bentuk linear dalam peubah-peubah X
dan 1/Y.
Koefisien-koefisien a dan b dapat dihitung seperti pada model garis lurus dengan
rumus
n n n n
∑ Y1 ∑ X 2i − ∑ X i ∑ X i Y1
( )( ) ( )( )
i=1 i i =1 i =1 i=1 i
a=¿ n n 2
∑ (∑ ) n X 2i − Xi
i =1 i=1
n n n
n ( ∑ X i Y1 ) ( )( ) − ∑ X i ∑ Y1
i=1 i i=1 i=1 i
b=¿ n n 2
n ∑ (∑ ) X 2i − Xi
i=1 i=1
Untuk data Tabel 6.7, kita tentukan regresinya dengan mengambil model hiperbola.
Untuk ini perlu dibuat Tabel 6.9 untuk membantu proses perhitungan.
Dengan nilai-nilai
n n
n n
∑ Xᵢ ²=8957725 , ∑ Xᵢ
Yᵢ
=163,1435 dan n=12
i=1 i=1
Hasil ini memberikan taksiran regresi Ŷ = 122,262 – 0,085 X + 0,0000197 X 2. Model ini
pun signifikan dengan daya ramal 87%. Hal ini ditunjukkan oleh nilai F = 31,17 dengan
nilai p = 0,0001 dan nilai R2 = 0,8737.
1
Kita bandingkan model hiperbola = 0,0073 + 0,00012 yang mempunyai daya ramal
Ŷ
93% (R2 = 0,9265) dengan model kuadratik Ŷ = 122,262 – 0,085 X + 0,0000197 X 2 yang
mempunyai daya ramal 87% (R2 = 0,8737). Kita bisa melihat bahwa model hiperbola
sedikit lebih tinggi daya ramalnya dibandingkan dengan model kuadratik. Disamping daya
ramal, kesederhanaan model dan kemudahan interprestasi harus ikut dipertimbangkan
sebelum memilih model yang akan digunakan.