SKRIPSI
DESRI KRISTINA S
070803055
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2011
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
DESRI KRISTINA S
070803055
DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2011
Diluluskan di
Medan, Juni 2011
Komisi Pembimbing :
Pembimbing 2 Pembimbing 1
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
DESRI KRISTINA S
070803055
Segala hormat dan pujian syukur hanya kepada Tuhan Yang Maha Kuasa karena
kasihNya yang sungguh besar yang senantiasa memberi pertolongan dan kekuatan,
tuntunan bagi penulis untuk mengerjakan skripsi ini sampai waktu yang telah
ditetapkan.
Penulis juga mengucapkan terima kasih kepada kedua orang tua tercinta Bapak
M.Silalahi dan Ibu L.br.Situmorang atas semua dukungan dalam doa, motivasi, kasih
sayang, serta semua dukungan materil dan moril yang membantu penulis dalam
menyelesaikan skripsi ini. Juga kepada adik-adik yang saya kasihi Marno, Luri,
Wenny dan Mario. Penulis juga mengucapkan terima kasih kepada sahabat – sahabat
yang telah mendukung saya, terkhusus buat KTB Florence (K’Tiur, Dewi, Anita, Riris
dan Rolina) dan adik – adik tercinta KK Evangelium. Terima kasih atas semua doa
dan dukungannya. Tak lupa juga penulis mengucapkan terima kasih kepada semuanya
teman-teman di Math’07 (tidak muat jika disebutkan namanya satu per satu) atas
kebersamaan kita selama ini, atas doa dan saling mendukung diantara kita. Semangat
dan doa dari teman-teman juga sangat membantu penulis dalam menyelesaikan skripsi
ini. Terimakasih juga buat teman-teman kost 24, juga teman-teman penulis di Sibolga
serta keluarga tulang di Helvetia, keluarga Namboru di Sidikalang atas kebaikan, doa
dan kasihnya.
Akhir kata penulis mengucapkan terimakasih kepada semua pihak yang belum
disebutkan namanya yang telah membantu penulis dalam menyelesaikan skripsi ini,
biarlah kasih karunia Tuhan Yang Maha Esa yang menyertai kita semua. Semoga
tulisan ini bermanfaat bagi yang membacanya. Terima kasih.
Analisis regresi adalah salah satu teknik statistika yang digunakan untuk menentukan
model hubungan satu variabel respon (Y) dengan satu atau lebih variabel bebas (X),
yang umumnya dinyatakan dalam persamaan matematik. Dalam statistika sebuah
model regresi dapat diperoleh dengan melakukan pendugaan terhadap parameter -
parameternya dengan menggunakan metode tertentu, salah satunya dengan Metode
Kemungkinan Maksimum (Maximum Likelihood Methods). Model regresi yang
diperoleh dikatakan baik atau cocok, jika dipenuhi asumsi-asumsi ideal (klasik). Salah
satu asumsi regresi linier yang harus dipenuhi adalah homogenitas varians (varian dari
error bersifat konstan) yang disebut juga asumsi homoskedastisitas. Kebalikannya,
jika ternyata varian dari kesalahan pengganggu tidak konstan misalnya membesar
atau mengecil pada nilai X yang lebih tinggi, maka kondisi tersebut dikatakan
mengalami heteroskedastisitas atau dituliskan dengan: ar
, , , . Pada model regresi bila semua asumsi klasik dipenuhi, kecuali satu yaitu
terjadi heteroskedastisitas, maka estimator yang diperoleh masih tetap tak bias dan
konsisten, tetapi tidak efisien (varians membesar). Salah satu cara untuk mengatasi
heteroskedastisitas dalam model regresi yaitu dengan Transformasi Box Cox.
Transformasi Box Cox yaitu melakukan transformasi terhadap variabel respon Y yang
dipangkatkankan dengan parameter , sehingga menjadi dan penduga parameter
yang diperoleh berada dikisaran (-2,2).
ABSTRACT
Regression analysis is one of statistic technics that used to determine the relation
model of one respon variable (Y) with one or more independent variable (X), what is
generally expressed in equation mathematic. In statistic, a regression model is
obtained by estimate of its parameter by using certain method, one of them is with the
Maximum Likelihood Methods. Regression model that obtained to be told is good or
fit, if fulfilled by the ideal assumption (classic). One of linear regression assumption
which must be fulfilled is homogeneity varian (variant from error have the character
of constant) so called also homoscedasticity. On the contrary, in reality if varian from
error is not constant for example big or minimize higher at value X, so the condition
told to heteroscedasticity or written down by: ar , , , . In
regression model if all classic assumption were fulfilled, except one of them was the
heteroscedasticity, so estimator that obtained still unbiased and consistent, but
inefficient (big varian). One of way to overcome the heteroscedasticity in regression
model is by Box Cox Transformation. Box Cox Transformation that is do the
transformation to respon variable Y which be ranked with the parameter , so that
become and estimator of parameter that obtained residing in gyration (-2,2).
Halaman
Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak v
Abstract vi
Daftar Isi vii
Daftar Tabel ix
Daftar Gambar x
Bab 1 Pendahuluan
1.1 Latar Belakang 1
1.2 Identifikasi Masalah 3
1.3 Batasan Masalah 3
1.4 Tinjauan Pustaka 3
1.5 Tujuan Penelitian 5
1.6 Manfaat Penelitian 5
1.7 Metode Penelitian 6
Bab 3 Pembahasan 29
Daftar Pustaka 36
Lampiran 38
Halaman
Halaman
Analisis regresi adalah salah satu teknik statistika yang digunakan untuk menentukan
model hubungan satu variabel respon (Y) dengan satu atau lebih variabel bebas (X),
yang umumnya dinyatakan dalam persamaan matematik. Dalam statistika sebuah
model regresi dapat diperoleh dengan melakukan pendugaan terhadap parameter -
parameternya dengan menggunakan metode tertentu, salah satunya dengan Metode
Kemungkinan Maksimum (Maximum Likelihood Methods). Model regresi yang
diperoleh dikatakan baik atau cocok, jika dipenuhi asumsi-asumsi ideal (klasik). Salah
satu asumsi regresi linier yang harus dipenuhi adalah homogenitas varians (varian dari
error bersifat konstan) yang disebut juga asumsi homoskedastisitas. Kebalikannya,
jika ternyata varian dari kesalahan pengganggu tidak konstan misalnya membesar
atau mengecil pada nilai X yang lebih tinggi, maka kondisi tersebut dikatakan
mengalami heteroskedastisitas atau dituliskan dengan: ar
, , , . Pada model regresi bila semua asumsi klasik dipenuhi, kecuali satu yaitu
terjadi heteroskedastisitas, maka estimator yang diperoleh masih tetap tak bias dan
konsisten, tetapi tidak efisien (varians membesar). Salah satu cara untuk mengatasi
heteroskedastisitas dalam model regresi yaitu dengan Transformasi Box Cox.
Transformasi Box Cox yaitu melakukan transformasi terhadap variabel respon Y yang
dipangkatkankan dengan parameter , sehingga menjadi dan penduga parameter
yang diperoleh berada dikisaran (-2,2).
ABSTRACT
Regression analysis is one of statistic technics that used to determine the relation
model of one respon variable (Y) with one or more independent variable (X), what is
generally expressed in equation mathematic. In statistic, a regression model is
obtained by estimate of its parameter by using certain method, one of them is with the
Maximum Likelihood Methods. Regression model that obtained to be told is good or
fit, if fulfilled by the ideal assumption (classic). One of linear regression assumption
which must be fulfilled is homogeneity varian (variant from error have the character
of constant) so called also homoscedasticity. On the contrary, in reality if varian from
error is not constant for example big or minimize higher at value X, so the condition
told to heteroscedasticity or written down by: ar , , , . In
regression model if all classic assumption were fulfilled, except one of them was the
heteroscedasticity, so estimator that obtained still unbiased and consistent, but
inefficient (big varian). One of way to overcome the heteroscedasticity in regression
model is by Box Cox Transformation. Box Cox Transformation that is do the
transformation to respon variable Y which be ranked with the parameter , so that
become and estimator of parameter that obtained residing in gyration (-2,2).
PENDAHULUAN
, , , dan
dengan:
Y adalah vektor kolom berukuran (n baris dan 1 kolom)
X adalah matriks berukuran (n baris 2 kolom)
adalah vektor kolom berukuran (2 baris dan 1 kolom)
adalah vektor kolom berukuran
dan adalah parameter yang akan diduga dalam model regresi linier
sederhana. Pendugaan parameter tersebut baik dengan menggunakan Metode Kuadrat
Terkecil (Ordinary Least Square) maupun dengan Metode Kemungkinan Maksimum
(Maximum Likelihood Methods) harus memenuhi asumsi – asumsi model ideal
tertentu terhadap error . Salah satu asumsi yang penting dan harus dipenuhi adalah
asumsi homoskedastisitas atau disebut juga asumsi kehomogenan varian. Apabila
asumsi homoskedastisitas tidak dipenuhi, berarti varian dari setiap kesalahan
pengganggu untuk variabel bebas yang diketahui tidak sama, sehingga keadaan ini
disebut heteroskedastisitas (keheterogenan ragam).
Dalam model regresi linier terdapat beberapa cara dalam mengatasi masalah
heteroskedastisitas. Menurut Greene (2004) untuk mengatasi heteroskedastisitas dapat
dilakukan dengan Metode Kuadrat Terkecil Tertimbang (Weighted Least Square),
penaksirannya melalui pembobotan yang juga dapat dikatakan kuadrat terkecil yang
diberlakukan secara umum atau disebut Kuadrat Terkecil Umum (General Least
Square). Selain itu, heteroskedastisitas juga dapat diatasi dengan mentransformasikan
variabel - variabelnya, baik variabel bebas, variabel tidak bebas maupun keduanya.
Dalam tulisan ini akan diuraikan bahwa Transformasi Box Cox dapat mengatasi
Kutner, M.H, Wassamen.W dan Neter J (1990) mengatakan bahwa bentuk fungsi
dari peluang distribusi dengan adanya istilah kesalahan pengganggu (error) yang
ditetapkan serta estimator dari parameter – parameter dan yang dinotasikan
dengan dan dapat diperoleh dengan menggunakan Metode Kemungkinan
Maksimum (Maximum Likelihood Methods). Metode ini menggunakan distribusi
gabungan dari sampel pengamatannya. Ketika gabungan distribusi ditunjukkan
sebagai fungsi dari parameternya, yang diberi dengan sampel pengamatan tertentu,
Famili transformasi kontinu ini bergantung pada satu parameter yang akan diduga.
Salah satu metode pendugaan (penaksiran) yang dapat digunakan ialah dengan
menggunakan Metode Kemungkinan Maksimum. Cara penaksiran agak berbeda
dengan cara penaksiran yang biasa dilakukan, yaitu dengan menentukan nilai pada
kisaran tertentu
Tujuan dari penelitian ini adalah menggunakan prosedur Transformasi Box Cox
untuk mengatasi masalah heteroskedastisitas antara variabel – variabel bebas,
sehingga diperoleh persamaan regresi linier sederhana yang lebih baik.
Regresi adalah salah satu metode yang digunakan untuk menaksir suatu peubah tak
bebas dengan memperhatikan faktor – faktor penyebabnya. Dari penulisan ini, penulis
berharap dapat memberikan suatu solusi alternatif bagi pengguna analisis regresi linier
sederhana dalam masalah heteroskedastisitas yang terdapat pada data, sehingga model
regresi tersebut dapat diatasi dan menjadi model regresi yang benar.
Data yang digunakan untuk analisis ini adalah data simulasi. Data simulasi terdiri dari
dua variabel yaitu variabel bebas (X) dan variabel tak bebas (Y). Data simulasi yang
akan dianalisis merupakan data random yang dibangkitkan berdasarkan distribusi
yang telah ditentukan yaitu berdistribusi normal dengan menggunakan program
Minitab 16. Langkah – langkah yang digunakan untuk menganalisis data tersebut
adalah:
1. Mengitung estimator dan dan membentuk model analisis regresi sederhana
dari data tersebut.
2. Mendeteksi keberadaan heteroskedastisitas berdasarkan prosedur pada Uji
Korelasi Rank dari Spearmen yang digunakan.
3. Menduga parameter pada Transformasi Box Cox dengan menggunakan Metode
Kemungkinan Maksimum. Dalam tulisan ini digunakan Program Minitab 16
dengan menjalankan perintah atau rangkaian perintah (command) yang
membentuk suatu fungsi tertentu dalam Minitab yang disebut dengan Macro
Minitab. Dengan menjalankan command tersebut akan diperoleh penduga dan
selang kepercayaan .
4. Menentukan model transformasinya sesuai dengan pendugaan parameter yang
telah didapat.
5. Mentransformasikan data menurut model transformasinya dan membentuk model
analisis regresi.
6. Menguji signifikansi dari model regresi tersebut dan juga dilakukan pengujian
heteroskedastisitasnya.
LANDASAN TEORI
Dalam beberapa masalah terdapat dua atau lebih variabel yang hubungannya tidak
dapat dipisahkan karena perubahan nilai suatu variabel tidak selalu terjadi dengan
sendirinya, namun perubahan nilai variabel itu dapat pula disebabkan oleh berubahnya
variabel lain yang berhubungan dengan variabel tersebut. Hal tersebut biasanya
diselidiki sifat hubungannya yaitu dengan mengetahui pola nilai suatu variabel yang
disebabkan oleh variabel lain diperlukan alat analisis yang dapat membuat perkiraan
nilai variabel tersebut pada nilai tertentu variabel yang mempengaruhinya.
Teknik yang umum digunakan untuk menganalisis hubungan antara dua atau
lebih variabel dalam ilmu statistik adalah dengan analisis regresi. Analisis regresi
adalah teknik statistik yang berguna untuk memeriksa dan memodelkan hubungan
diantara variabel-variabel. Analisis regresi berguna untuk menelaah pola dan
mengukur hubungan statistika antara dua atau lebih variabel yang modelnya belum
diketahui dengan sempurna.
Galton menyatakan bahwa tinggi badan anak laki – laki dari badan yang tinggi
pada beberapa generasi kemudian cenderung “mundur” (regressed) mendekati rata –
rata populasi. Dengan kata lain, anak laki – laki dari ayahnya yang mempunyai
badannya sangat tinggi cenderung lebih pendek dari ayahnya. Sedangkan anak laki –
laki dari ayah yang mempunyai badan sangat pendek cenderung lebih tinggi dari
ayahnya. Dari hasil penelitian ini istilah regresi pada mulanya bertujuan untuk
membuat perkiraan nilai suatu variabel (tinggi badan anak) terhadap suatu variabel
lain (tinggi badan ayah).
Analisis regresi yang melibatkan hubungan antara satu variabel respon (tidak
bebas) dengan satu variabel prediktor (bebas) diistilahkan dengan regresi linier
sederhana, dengan model persamaan:
(2.1)
Dimana intercept dan slope merupakan parameter yang tidak diketahui nilainya,
sedangkan adalah error random dengan rata – rata nol dan varians .
Menurut Hasan (2002), estimator adalah suatu statistik (harga sampel) yang
digunakan untuk menduga suatu parameter. Dengan penduga, dapat diketahui
seberapa jauh suatu parameter populasi yang tidak diketahui berada di sekitar sampel
(statistik sampel). Besaran sebagai hasil penerapan penduga terhadap data dari sesuatu
contoh disebut nilai duga (estimate). Secara umum, parameter diberi lambang dan
penduganya diberi lambang .
Estimator yang tidak bias apabila dapat menghasilkan estimasi yang mengandung nilai
parameter yang diestimasikan. Misalkan, estimator dikatakan estimator yang tidak
bias jika rata – rata semua harga yang mungkin akan sama dengan , atau dapat
dituliskan .
Salah satu cara untuk mendapatkan estimator yang baik adalah dengan menggunakan
Metode Kemungkinan Maksimum (Maximum Likelihood Methods) yang
diperkenalkan oleh R. A. Fisher (1890 – 1962). Maksimum likelihood ini adalah
metode yang digunakan untuk menduga parameter – parameter dengan
memaksimumkan fungsi kemungkinannya yang dibentuk dari gabungan distribusi
pengamatan.
(2.3)
( )
( )
( )
(2.7)
Kemudian kemungkinan nilai kedua Y sama dengan persamaan (2.7), kecuali angka
satu diganti dengan dua dan seterusnya untuk semua nilai Y amatan lainnya.
( )
Dengan menyatakan hasil kali n kemungkinan bersama untuk setiap nilai i yang
( )
( 0)
( )
(2.12)
( )
( )
( )
SSE (Sum Square of Error) adalah jumlah kuadrat residual dan penduga ini bias .
( 7
2.4 Heteroskedastisitas
Salah satu asumsi penting dari model regresi linear klasik adalah varian error pada
setiap nilai – nilai variabel bebas adalah sama (konstan), asumsi ini disebut juga
sebagai asumsi homoskedastisitas atau homogenitas varian yang disimbolkan dengan:
, ,
Apabila asumsi ini tidak dipenuhi dalam analisis regresi linier, maka didapatkan
keadaan bahwa varian tidak bersifat konstan. Keadaan ini disebut mengalami
heteroskedastisitas atau disimbolkan dengan:
, , ,
Densitas
Y
...
X
Densitas
Y
...
X
Diberikan estimator
Anggaplah bahwa:
Sehingga:
dan
Sehingga diperoleh:
( )
( )
(2.20)
Dapat disimpulkan bahwa sifat ketidakbiasan tidak tergantung pada varian galat.
Jika dalam model regresi ada heteroskedastisitas, maka kita tetap memperoleh
nilai parameter yang tidak bias karena sebagai penduga tidak bias tidak
memerlukan asumsi bahwa varian galat harus konstan.
2. Varian penduga yang diperoleh akan menjadi tidak efisien, artinya penduga
tersebut tidak memiliki varian terkecil diantara penduga – penduga tidak bias
lainnya.
ar
i j
Karena , dan
Sehingga diperoleh:
var ( )
var
( )
Walaupun dikatakan adalah unbiased, tetapi tidak efisien karena varian – variannya
lebih besar daripada yang diperlukan. Untuk melihat penggunaan persamaan (2.21)
dan (2.22), diuraikan sebagai berikut:
var
Sehingga diperoleh:
Selain uji signifikan tidak dapat diterapkan, batas – batas kepercayaan juga
tidak dapat diterapkan. Artinya jika varian penaksir model tidak memenuhi asumsi
homoskedastisitas, maka inferensi dan prediksi mengenai koefisien – koefisien
populasinya akan keliru.
Dalam analisis model regresi linear apabila semua asumsi model regresi linear
klasik terpenuhi kecuali asumsi homoskedastisitas yang berarti adanya
heteroskedastisitas, maka estimator dari paramater yang diperoleh masih tetap tak bias
dan konsisten tetapi estimatornya tidak efisien, baik untuk sampel kecil maupun
sampel besar.
Sesuai dengan namanya, metode ini pertama kali diperkenalkan oleh Spearmen dan
menggunakan korelasi peringkat X dan . Koefisien Korelasi Rank dari Spearmen
dirumuskan:
( )
di mana merupakan selisih rank yang ditempatkan untuk dua karakteristik yang
berbeda dari individu ke-i atau fenomena ke-i dan n adalah banyaknya individu atau
fenomena yang diberi rank.
( )
5. Pengujian hipotesis:
: tidak ada heteroskedastisitas
: ada heteroskedastisitas
Dengan demikian, kaidah pengambilan keputusan untuk hipotesis di atas adalah
sebagai berikut:
Tolak jika . Dalam hal lain terima .
Box dan Cox (1964) telah mengembangkan suatu prosedur dalam pemilihan suatu
transformasi dari suatu transformasi kuasa (power transformation) yang dikenal
dengan Transformasi Box Cox dengan memperhatikan secara sistematis transformasi
variabelnya. Prosedur Transformasi Box Cox bertujuan untuk memeriksa
kecondongan dari distribusi bentuk galatnya atau dengan kata lain untuk menormalkan
data. Selain itu prosedur transformasi ini dapat juga digunakan untuk
menghomogenkan varian dan melinierkan model regresinya.
jika ( )
jika
Salah satu metode yang dapat digunakan dalam pendugaan parameter pada
Transformasi Box Cox adalah dengan Metode Kemungkinan Maksimum. Cara
penaksiran ini sedikit berbeda dengan penaksiran yang biasa dilakukan yaitu
menentukan nilai pada kisaran nilai tertentu.
( )
( )
dengan:
( 0)
( )
( )
Sehingga untuk nilai yang telah ditetapkan, maka fungsi maksimum likelihoodnya
adalah:
( )
, ,
, 0,7
0,7 0, 0,
0, 0, 0
0, 0,7 0,5
0,7 , 1
, , 2
perhitungan yang telah diperoleh. Sehingga garis yang terbentuk akan memotong
kurva pada dua nilai , dan ini merupakan titik – titik ujung selang kepercayaan
parameter yang terbentuk.
Model regresi yang baik diperoleh akan diperiksa setelah variabel respon Y
ditransformasikan sesuai dengan model transformasi. Pemeriksaan ini ditempuh
melalui pengujian hipotesis.
Jika pada percobaan akan dilakukan pengujian terhadap yang sama dengan
sebuah konstanta misalkan , maka pada umumnya hipotesis tersebut dirumuskan
sebagai berikut:
Dan akan diduga alternatifnya dua arah, maka satistik uji yang digunakan pada
pengujian hipotesis ini adalah:
( )
Kaidah pengambilan keputusan untuk pengujian hipotesis ini adalah sebagai berikut:
ditolak jika . Dalam hal lain terima .
Dengan cara yang sama dapat juga digunakan untuk menguji intercept , dan
hipotesisnya adalah sebagai berikut:
( )
Kaidah pengambilan keputusan untuk pengujian hipotesis ini adalah sebagai berikut:
ditolak jika . Dalam hal lain terima .
kebebasan (n-2).
( 7
Pengujian hipotesis dalam model regresi tersebut dilakukan secara parsial yang
bertujuan untuk menguji signifikansi pengaruh variabel bebas terhadap variabel
respon. Sehingga, masalah khusus dari pengujian hipotesis dalam model regresi linier
sederhana adalah:
PEMBAHASAN
( )
( )
4.1 Kesimpulan
1. Dari hasil analisis untuk semua data simulasi yang dibangkitkan dengan
mengikuti distribusi normal maka dapat disimpulkan bahwa Transformasi Box
Cox dapat mengatasi heteroskedastisitas dalam model regresi, sehingga asumsi
homoskedastisitas akan terpenuhi.
2. Pendugaan parameter dapat juga dituliskan dalam selang kepercayaan. Dan
dari hasil analisis data simulasi, penduga parameter yang diperoleh berada
dikisaran (-2,2).
4.2 Saran
Greene H William. 2000. Econometric Analysis Fourth Edition. New York: Prentice
Hall International. Inc.
Hasan, Iqbal. 2001. Pokok – Pokok Materi Statistik 2 (Statistik Inferensi). Jakarta: PT
Bumi Aksara.
Ispriyanti, Dwi. 2004. Pemodelan Statistika Dengan Transformasi Box Cox. 7(3):hal.
8-17.
Kutner, M.H, Wassamen.W dan Neter J. 1990. Applied Linear Statistical Models.
America: MC Graw-Hill/Irwin.
Weisberg, S. 1985. Applied Linier Regression Second Edition. New York: John Wiley
& Son.
Data Simulasi 1
Analysis of Variance
Source DF SS MS F P
Regression 1 0,0591 0,0591 0,20 0,658
Residual Error 18 5,2413 0,2912
Total 19 5,3004
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Estimated Lambda: 2
Approximate 95% CI for Lambda: (-0,9 , 2)
Analysis of Variance
Source DF SS MS F P
Regression 1 0,0425 0,0425 0,19 0,670
Residual Error 18 4,0643 0,2258
Total 19 4,1068
Unusual Observations
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Estimated Lambda: 2
Approximate 95% CI for Lambda: (-1,61 , 2)
Analysis of Variance
Source DF SS MS F P
Regression 1 0,4036 0,4036 2,71 0,117
Residual Error 18 2,6851 0,1492
Total 19 3,0887
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 3,407 3,407 0,35 0,560
Residual Error 18 174,272 9,682
Total 19 177,679
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 0,66 0,66 0,06 0,813
Residual Error 18 204,14 11,34
Total 19 204,79
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 6,78 6,78 0,66 0,426
Residual Error 18 184,13 10,23
Total 19 190,90
Unusual Observations
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 816,1 816,1 1,97 0,177
Residual Error 18 7444,1 413,6
Total 19 8260,2
Unusual Observations
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 0,6 0,6 0,00 0,952
Residual Error 18 2718,4 151,0
Total 19 2719,0
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 2727 2727 1,15 0,298
Residual Error 18 42813 2378
Total 19 45540
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
Analysis of Variance
Source DF SS MS F P
Regression 1 2151 2151 1,08 0,312
Residual Error 18 35800 1989
Total 19 37951
Model Information
------------------------------
Response: Y
Predictor(s): X
------------------------------
-0,9 2 6,78
14,0
6,76
13,5
6,74
13,0
6,72
Log-Likelihood
12,5
P RESS
6,70
12,0
6,68
11,5
6,66
11,0
6,64
-2 -1 0 1 2 6,62
Lambda
-1 0 1 2
E stimated Lambda: 2
Lambda
A pproximate 95% C I for Lambda: (-0,9 , 2)
-1,61 2 500
16,5
16,0 400
Log-Likelihood
15,5 300
P RESS
15,0
200
14,5
100
14,0
-2 -1 0 1 2 0
Lambda
-2 -1 0 1 2
E stimated Lambda: 2
Lambda
A pproximate 95% C I for Lambda: (-1,61 , 2)
-2 2 3,400
20,3
20,2 3,395
Log-Likelihood
20,1
3,390
P RESS
20,0
3,385
19,9
3,380
19,8
-2 -1 0 1 2
Lambda
-2 -1 0 1 2
E stimated Lambda: -0,99
Lambda
A pproximate 95% C I for Lambda: (-2 , 2)
-1,23 2
-21
252
-22
250
Log-Likelihood
-23
P RESS
248
-24
246
-25
244
-26
-2 -1 0 1 2
Lambda
-1 0 1 2
E stimated Lambda: 0,48
Lambda
A pproximate 95% C I for Lambda: (-1,23 , 2)
-22
280
-23 275
Log-Likelihood
-24 270
P RESS
265
-25
260
-26
255
-27
-2 -1 0 1 2
250
Lambda
-2 -1 0 1
E stimated Lambda: -0,17
Lambda
A pproximate 95% C I for Lambda: (-1,53 , 1,16)
-0,78 1,13
-20 255
-22 250
Log-Likelihood
-24
245
P RESS
-26
240
-28
235
-30
-2 -1 0 1 2
Lambda 230
-1,0 -0,5 0,0 0,5 1,0
E stimated Lambda: 0,17
Lambda
A pproximate 95% C I for Lambda: (-0,78 , 1,13)
11200
-58
11000
Log-Likelihood
-60 10800
P RESS
10600
-62
10400
-64
10200
-66
10000
-2 -1 0 1 2
Lambda
-1,0 -0,5 0,0 0,5 1,0
E stimated Lambda: -0,18
Lambda
A pproximate 95% C I for Lambda: (-1,21 , 0,82)
0,52 2 3260
-50 3250
3240
-55
Log-Likelihood
3230
P RESS
3220
-60
3210
-65
3200
-2 -1 0 1 2
Lambda 3190
0,5 1,0 1,5 2,0
E stimated Lambda: 1,95
Lambda
A pproximate 95% C I for Lambda: (0,52 , 2)
-80 200000
Log-Likelihood
P RESS
-85
150000
-90
100000
-95
-2 -1 0 1 2 50000
Lambda
-0,5 0,0 0,5 1,0 1,5
E stimated Lambda: 0,64
Lambda
A pproximate 95% C I for Lambda: (-0,23 , 1,59)
-0,39 1,28
52000
-75,0
-77,5
51000
Log-Likelihood
-80,0
P RESS
50000
-82,5
-85,0
49000
-87,5
-90,0 48000
-2 -1 0 1 2
Lambda
-0,5 0,0 0,5 1,0 1,5
E stimated Lambda: 0,45
Lambda
A pproximate 95% C I for Lambda: (-0,39 , 1,28)
Macro
BCtrans Y X.1-X.n;
range r1 r2;
influence;
bcstore St1 St2;
infstore St3 St4;
presstore St5 St6.
Mmatrix m1 m2 m3 m4 m5 m6 m7 m8 m9
mreset
noecho
brief
note
note Macro is running ... please wait
mtitle "Box-Cox Power Transformation Analysis"
note
notitle
brief 0
ow 130
#********************************************************************
*******
# Error checks
min Y err
IF err <= 0
brief 2
Note **Error** Response values must be positive.
Note
exit
ENDIF
#********************************************************************
*******
# Check for missing values
IF max(Oper) > 0
brief 2
#********************************************************************
*******
# Session window information
kkname ss Y
kkset tt " Response: "
kkcat tt ss tt
DO i = 1:n
IF i < n
kkname ww X.i
kkset zz ", "
kkcat ww zz ww
copy ww HH.i
ELSE
kkname ww X.i
copy ww HH.i
ENDIF
ENDDO
tset II.1
"Predictor(s): "
end
IF n > 5
kkset bg "..." #abbreviate names of predictors if n
> 5
copy bg Bug
concat II.1 HH.1 HH.2 HH.3 HH.4 Bug JJ.1
ELSE
conc II.1 HH.1-HH.n JJ.1
ENDIF
#********************************************************************
*******
# Find optimal lambda based on log-likelihood
DO i = 1:401
let c = Lambda[i]
IF c = 0
regress Y1 n XX.1-XX.n;
residuals Res;
xpxinv m1.
ELSE
let Trans = ((YY**c)-1)/c
regress Trans n XX.1-XX.n;
residuals Res;
xpxinv m1.
#********************************************************************
*******
# Compute PRESS for refined lambda range
IF range
copy r1 one
copy r2 two
ELSE
let one = round(lo,1)
let two = round(hi,1)
IF lo <= one
let one = one-0.10
ENDIF
IF hi > two
let two = two+0.10
ENDIF
ENDIF
set Mesh
one:two/.01
end
count Mesh aa
DO i = 1:aa
let c = Mesh[i]
IF c = 0
regress Y1 n XX.1-XX.n;
residuals Res;
hi Lev.
let Press[i] = ssq(YY-(expo(Y1-(Res/(1-Lev)))))
ELSE
let Trans = YY**c
regress Trans n XX.1-XX.n;
residuals Res;
hi Lev.
let Press[i] = ssq(YY-((Trans-(Res/(1-Lev)))**(1/c)))
ENDIF
ENDDO
#********************************************************************
*******
Endmacro
Data Simulasi 1
Welcome to Minitab, press F1 for help.
MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.
Analysis of Variance
Source DF SS MS F P
Regression 1 0,061157 0,061157 514245,57 0,000
Residual Error 18 0,000002 0,000000
Total 19 0,061159
Data Simulasi 2
Analysis of Variance
Source DF SS MS F P
Regression 1 0,028356 0,028356 698389,92 0,000
Residual Error 18 0,000001 0,000000
Total 19 0,028356
Analysis of Variance
Source DF SS MS F P
Regression 1 0,33498 0,33498 22901,95 0,000
Residual Error 18 0,00026 0,00001
Total 19 0,33524
Data Simulasi 4
Analysis of Variance
Source DF SS MS F P
Regression 1 1,6708 1,6708 312244,48 0,000
Residual Error 18 0,0001 0,0000
Total 19 1,6709
Analysis of Variance
Source DF SS MS F P
Regression 1 4,6264 4,6264 17481,24 0,000
Residual Error 18 0,0048 0,0003
Total 19 4,6312
Data Simulasi 6
Analysis of Variance
Source DF SS MS F P
Regression 1 1,1176 1,1176 137655,63 0,000
Residual Error 18 0,0001 0,0000
Total 19 1,1178
Analysis of Variance
Source DF SS MS F P
Regression 1 240,84 240,84 12396,45 0,000
Residual Error 18 0,35 0,02
Total 19 241,19
Data Simulasi 8
Analysis of Variance
Source DF SS MS F P
Regression 1 4,8486 4,8486 517424,54 0,000
Residual Error 18 0,0002 0,0000
Total 19 4,8488
Analysis of Variance
Source DF SS MS F P
Regression 1 1018,1 1018,1 38590,84 0,000
Residual Error 18 0,5 0,0
Total 19 1018,6
Data Simulasi 10
Analysis of Variance
Source DF SS MS F P
Regression 1 964,34 964,34 29471,27 0,000
Residual Error 18 0,59 0,03
Total 19 964,93
Sumber: http://junaidichaniago.wordpress.com
Sumber: (http://junaidichaniago.wordpress.com)