Anda di halaman 1dari 77

ANALISIS TRANSFORMASI BOX COX UNTUK MENGATASI

HETEROSKEDASTISITAS DALAM MODEL


REGRESI LINIER SEDERHANA

SKRIPSI

DESRI KRISTINA S
070803055

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2011

Universitas Sumatera Utara


ANALISIS TRANSFORMASI BOX COX UNTUK MENGATASI
HETEROSKEDASTISITAS DALAM MODEL REGRESI LINIER SEDERHANA

SKRIPSI

Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains

DESRI KRISTINA S
070803055

DEPARTEMEN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SUMATERA UTARA
MEDAN
2011

Universitas Sumatera Utara


PERSETUJUAN

Judul : ANALISIS TRANSFORMASI BOX COX UNTUK


MENGATASI HETEROSKEDASTISITAS DALAM
MODEL REGRESI LINIER SEDERHANA
Kategori : SKRIPSI
Nama : DESRI KRISTINA S
Nomor Induk Mahasiswa : 070803055
Program Studi : SARJANA (S1) MATEMATIKA
Departemen : MATEMATIKA
Fakultas : MATEMATIKA DAN ILMU PENGETAHUAN
ALAM (FMIPA) UNIVERSITAS SUMATERA
UTARA

Diluluskan di
Medan, Juni 2011

Komisi Pembimbing :

Pembimbing 2 Pembimbing 1

Drs. Rachmad Sitepu, M.Si Drs. Open Darnius, M.Sc


NIP. 19530418 198703 1 001 NIP.19641014 199103 1 004

Diketahui/ Disetujui oleh:


Departemen Matematika FMIPA USU
Ketua,

Prof. Dr. Tulus, M.Si.


NIP.196210901 198803 1 002

Universitas Sumatera Utara


PERNYATAAN

ANALISIS TRANSFORMASI BOX COX UNTUK MENGATASI


HETEROSKEDASTISITAS DALAM MODEL REGRESI LINIER SEDERHANA

SKRIPSI

Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.

Medan, Juni 2011

DESRI KRISTINA S

070803055

Universitas Sumatera Utara


PENGHARGAAN

Segala hormat dan pujian syukur hanya kepada Tuhan Yang Maha Kuasa karena
kasihNya yang sungguh besar yang senantiasa memberi pertolongan dan kekuatan,
tuntunan bagi penulis untuk mengerjakan skripsi ini sampai waktu yang telah
ditetapkan.

Dalam kesempatan ini penulis mengucapkan terimakasih kepada Drs. Open


Darnius, M.Sc dan Drs. Rachmad Sitepu, M.Si sebagai dosen pembimbing yang telah
memberikan hati dan waktunya untuk mengarahkan dan memberikan masukan kepada
penulis dalam menyelesaikan skripsi ini. Penulis juga mengucapkan terima kasih
kepada Drs. Pangarapen Bangun, M.Si dan Drs. Ujian Sinulingga, M.Si selaku Dosen
penguji yang juga membantu penulis selama pengerjaan skripsi ini. Ucapan
terimakasih juga penulis tujukan kepada Dr. Sutarman, M.Sc selaku Dekan FMIPA
USU, Ketua dan Sekretaris Departemen Matematika FMIPA USU yaitu Prof. Dr.
Tulus, M.Si dan Dra. Mardiningsih, M.Si dan kepada Bapak Ibu dosen beserta semua
Staf Administrasi di FMIPA USU.

Penulis juga mengucapkan terima kasih kepada kedua orang tua tercinta Bapak
M.Silalahi dan Ibu L.br.Situmorang atas semua dukungan dalam doa, motivasi, kasih
sayang, serta semua dukungan materil dan moril yang membantu penulis dalam
menyelesaikan skripsi ini. Juga kepada adik-adik yang saya kasihi Marno, Luri,
Wenny dan Mario. Penulis juga mengucapkan terima kasih kepada sahabat – sahabat
yang telah mendukung saya, terkhusus buat KTB Florence (K’Tiur, Dewi, Anita, Riris
dan Rolina) dan adik – adik tercinta KK Evangelium. Terima kasih atas semua doa
dan dukungannya. Tak lupa juga penulis mengucapkan terima kasih kepada semuanya
teman-teman di Math’07 (tidak muat jika disebutkan namanya satu per satu) atas
kebersamaan kita selama ini, atas doa dan saling mendukung diantara kita. Semangat
dan doa dari teman-teman juga sangat membantu penulis dalam menyelesaikan skripsi
ini. Terimakasih juga buat teman-teman kost 24, juga teman-teman penulis di Sibolga
serta keluarga tulang di Helvetia, keluarga Namboru di Sidikalang atas kebaikan, doa
dan kasihnya.

Akhir kata penulis mengucapkan terimakasih kepada semua pihak yang belum
disebutkan namanya yang telah membantu penulis dalam menyelesaikan skripsi ini,
biarlah kasih karunia Tuhan Yang Maha Esa yang menyertai kita semua. Semoga
tulisan ini bermanfaat bagi yang membacanya. Terima kasih.

Universitas Sumatera Utara


ABSTRAK

Analisis regresi adalah salah satu teknik statistika yang digunakan untuk menentukan
model hubungan satu variabel respon (Y) dengan satu atau lebih variabel bebas (X),
yang umumnya dinyatakan dalam persamaan matematik. Dalam statistika sebuah
model regresi dapat diperoleh dengan melakukan pendugaan terhadap parameter -
parameternya dengan menggunakan metode tertentu, salah satunya dengan Metode
Kemungkinan Maksimum (Maximum Likelihood Methods). Model regresi yang
diperoleh dikatakan baik atau cocok, jika dipenuhi asumsi-asumsi ideal (klasik). Salah
satu asumsi regresi linier yang harus dipenuhi adalah homogenitas varians (varian dari
error bersifat konstan) yang disebut juga asumsi homoskedastisitas. Kebalikannya,
jika ternyata varian dari kesalahan pengganggu tidak konstan misalnya membesar
atau mengecil pada nilai X yang lebih tinggi, maka kondisi tersebut dikatakan
mengalami heteroskedastisitas atau dituliskan dengan: ar
, , , . Pada model regresi bila semua asumsi klasik dipenuhi, kecuali satu yaitu
terjadi heteroskedastisitas, maka estimator yang diperoleh masih tetap tak bias dan
konsisten, tetapi tidak efisien (varians membesar). Salah satu cara untuk mengatasi
heteroskedastisitas dalam model regresi yaitu dengan Transformasi Box Cox.
Transformasi Box Cox yaitu melakukan transformasi terhadap variabel respon Y yang
dipangkatkankan dengan parameter , sehingga menjadi dan penduga parameter
yang diperoleh berada dikisaran (-2,2).

Universitas Sumatera Utara


ANALYSIS OF BOX COX TRANSFORMATION TO OVERCOME
HETEROSCEDASTICITY IN SIMPLE LINEAR REGRESSION MODEL

ABSTRACT

Regression analysis is one of statistic technics that used to determine the relation
model of one respon variable (Y) with one or more independent variable (X), what is
generally expressed in equation mathematic. In statistic, a regression model is
obtained by estimate of its parameter by using certain method, one of them is with the
Maximum Likelihood Methods. Regression model that obtained to be told is good or
fit, if fulfilled by the ideal assumption (classic). One of linear regression assumption
which must be fulfilled is homogeneity varian (variant from error have the character
of constant) so called also homoscedasticity. On the contrary, in reality if varian from
error is not constant for example big or minimize higher at value X, so the condition
told to heteroscedasticity or written down by: ar , , , . In
regression model if all classic assumption were fulfilled, except one of them was the
heteroscedasticity, so estimator that obtained still unbiased and consistent, but
inefficient (big varian). One of way to overcome the heteroscedasticity in regression
model is by Box Cox Transformation. Box Cox Transformation that is do the
transformation to respon variable Y which be ranked with the parameter , so that
become and estimator of parameter that obtained residing in gyration (-2,2).

Universitas Sumatera Utara


DAFTAR ISI

Halaman

Persetujuan ii
Pernyataan iii
Penghargaan iv
Abstrak v
Abstract vi
Daftar Isi vii
Daftar Tabel ix
Daftar Gambar x

Bab 1 Pendahuluan
1.1 Latar Belakang 1
1.2 Identifikasi Masalah 3
1.3 Batasan Masalah 3
1.4 Tinjauan Pustaka 3
1.5 Tujuan Penelitian 5
1.6 Manfaat Penelitian 5
1.7 Metode Penelitian 6

Bab 2 Landasan Teori


2.1 Regresi Linier Sederhana 7
2.2 Estimasi Parameter 9
2.2.1 Pengertian Estimasi Parameter dan Estimator 9
2.2.2 Sifat – Sifat Estimator 9
2.2.3 Jenis – Jenis Pendugaan 11
2.3 Metode Kemungkinan Maksimum 11
2.3.1 Maksimum Likelihood dalam Regresi Linier Sederhana 12
2.4 Heteroskedastisitas 15
2.4.1 Pengertian Heteroskedastisitas 15
2.4.2 Konsekuensi atau Akibat Adanya Heteroskedastisitas 17
2.4.3 Pengujian Heteroskedastisitas 21
2.5 Transformasi Box Cox 23
2.5.1 Pendugaan Parameter Transformasi Box Cox 24
2.5.2 Selang Kepercayaan Parameter Pada Transformasi Box Cox 26
2.6 Pengujian Model Regresi 27

Bab 3 Pembahasan 29

Bab 4 Kesimpulan Dan Saran 35


4.1 Kesimpulan 35
4.2 Saran 35

Universitas Sumatera Utara


Halaman

Daftar Pustaka 36

Lampiran 38

Universitas Sumatera Utara


DAFTAR TABEL

Halaman

Tabel 2.1 Nilai dan Model Transformasinya 25


Tabel 3.1 Hasil pengujian Heteroskedastisitas dan Analisis Transformasi
Box Cox Pada Model Regresi Linier Sederhana 32
Tabel 3.2 Hasil Analisis Dalam Model Penentuan Regresi Linier Sederhana
Setelah Variabel Respon Ditransformasikan Sesuai dengan Model
Transformasi Box Cox 33

Universitas Sumatera Utara


DAFTAR GAMBAR

Halaman

Gambar 2.1 Asumsi Homoskedastisitas 16


Gambar 2.2 Asumsi Heteroskedastisitas 16

Universitas Sumatera Utara


ABSTRAK

Analisis regresi adalah salah satu teknik statistika yang digunakan untuk menentukan
model hubungan satu variabel respon (Y) dengan satu atau lebih variabel bebas (X),
yang umumnya dinyatakan dalam persamaan matematik. Dalam statistika sebuah
model regresi dapat diperoleh dengan melakukan pendugaan terhadap parameter -
parameternya dengan menggunakan metode tertentu, salah satunya dengan Metode
Kemungkinan Maksimum (Maximum Likelihood Methods). Model regresi yang
diperoleh dikatakan baik atau cocok, jika dipenuhi asumsi-asumsi ideal (klasik). Salah
satu asumsi regresi linier yang harus dipenuhi adalah homogenitas varians (varian dari
error bersifat konstan) yang disebut juga asumsi homoskedastisitas. Kebalikannya,
jika ternyata varian dari kesalahan pengganggu tidak konstan misalnya membesar
atau mengecil pada nilai X yang lebih tinggi, maka kondisi tersebut dikatakan
mengalami heteroskedastisitas atau dituliskan dengan: ar
, , , . Pada model regresi bila semua asumsi klasik dipenuhi, kecuali satu yaitu
terjadi heteroskedastisitas, maka estimator yang diperoleh masih tetap tak bias dan
konsisten, tetapi tidak efisien (varians membesar). Salah satu cara untuk mengatasi
heteroskedastisitas dalam model regresi yaitu dengan Transformasi Box Cox.
Transformasi Box Cox yaitu melakukan transformasi terhadap variabel respon Y yang
dipangkatkankan dengan parameter , sehingga menjadi dan penduga parameter
yang diperoleh berada dikisaran (-2,2).

Universitas Sumatera Utara


ANALYSIS OF BOX COX TRANSFORMATION TO OVERCOME
HETEROSCEDASTICITY IN SIMPLE LINEAR REGRESSION MODEL

ABSTRACT

Regression analysis is one of statistic technics that used to determine the relation
model of one respon variable (Y) with one or more independent variable (X), what is
generally expressed in equation mathematic. In statistic, a regression model is
obtained by estimate of its parameter by using certain method, one of them is with the
Maximum Likelihood Methods. Regression model that obtained to be told is good or
fit, if fulfilled by the ideal assumption (classic). One of linear regression assumption
which must be fulfilled is homogeneity varian (variant from error have the character
of constant) so called also homoscedasticity. On the contrary, in reality if varian from
error is not constant for example big or minimize higher at value X, so the condition
told to heteroscedasticity or written down by: ar , , , . In
regression model if all classic assumption were fulfilled, except one of them was the
heteroscedasticity, so estimator that obtained still unbiased and consistent, but
inefficient (big varian). One of way to overcome the heteroscedasticity in regression
model is by Box Cox Transformation. Box Cox Transformation that is do the
transformation to respon variable Y which be ranked with the parameter , so that
become and estimator of parameter that obtained residing in gyration (-2,2).

Universitas Sumatera Utara


BAB 1

PENDAHULUAN

1.1 Latar Belakang

Analisis Regresi adalah analisis statistik yang mempelajari bagaimana memodelkan


sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan
suatu fenomena alami atas dasar fenomena lain. Analisis regresi juga merupakan salah
satu teknik statistika yang digunakan secara luas dalam ilmu pengetahuan terapan
dalam bidang sosial maupun eksakta.

Gujarati (2006) mendefenisikan analisis regresi sebagai kajian terhadap


hubungan satu variabel yang disebut sebagai variabel yang diterangkan (variabel tidak
bebas) dengan satu atau lebih variabel yang menerangkan (variabel bebas). Melalui
analisis regresi ini, model hubungan antar variabel dapat diketahui. Selain itu, analisis
regresi juga dapat dipergunakan sebagai peramalan. Model regresi linear sederhana
dapat dinyatakan sebagai berikut:
(1)
dengan:
Y adalah variabel tidak bebas;
adalah variabel bebas, dengan i = 1, 2, 3, ... , n;
dan adalah parameter – parameter yang tidak diketahui;
adalah error (kesalahan penggangu).

Universitas Sumatera Utara


Model regresi linear sederhana tersebut dapat ditulis dengan menggunakan
persamaan matriks yaitu:

, , , dan

dengan:
Y adalah vektor kolom berukuran (n baris dan 1 kolom)
X adalah matriks berukuran (n baris 2 kolom)
adalah vektor kolom berukuran (2 baris dan 1 kolom)
adalah vektor kolom berukuran

dan adalah parameter yang akan diduga dalam model regresi linier
sederhana. Pendugaan parameter tersebut baik dengan menggunakan Metode Kuadrat
Terkecil (Ordinary Least Square) maupun dengan Metode Kemungkinan Maksimum
(Maximum Likelihood Methods) harus memenuhi asumsi – asumsi model ideal
tertentu terhadap error . Salah satu asumsi yang penting dan harus dipenuhi adalah
asumsi homoskedastisitas atau disebut juga asumsi kehomogenan varian. Apabila
asumsi homoskedastisitas tidak dipenuhi, berarti varian dari setiap kesalahan
pengganggu untuk variabel bebas yang diketahui tidak sama, sehingga keadaan ini
disebut heteroskedastisitas (keheterogenan ragam).

Dalam model regresi linier terdapat beberapa cara dalam mengatasi masalah
heteroskedastisitas. Menurut Greene (2004) untuk mengatasi heteroskedastisitas dapat
dilakukan dengan Metode Kuadrat Terkecil Tertimbang (Weighted Least Square),
penaksirannya melalui pembobotan yang juga dapat dikatakan kuadrat terkecil yang
diberlakukan secara umum atau disebut Kuadrat Terkecil Umum (General Least
Square). Selain itu, heteroskedastisitas juga dapat diatasi dengan mentransformasikan
variabel - variabelnya, baik variabel bebas, variabel tidak bebas maupun keduanya.
Dalam tulisan ini akan diuraikan bahwa Transformasi Box Cox dapat mengatasi

Universitas Sumatera Utara


masalah heteroskedastisitas karena mengingat salah satu tujuan dari transformasi Box
Cox adalah menghomogenkan varian.

1.2 Identifikasi Masalah

Heteroskedastisitas merupakan salah satu faktor yang menyebabkan model regresi


linier sederhana tidak efisien dan akurat, juga mengakibatkan penggunaan metode
kemungkinan maksimum dalam mengestimasi parameter (koefisien) regresi akan
terganggu. Masalah heteroskedastisitas harus diatasi, salah satunya dengan
Transformasi Box Cox yaitu transformasi pangkat berparameter tunggal terhadap
variabel tidak bebas Y yang kisarannya pada interval (-2,2). Sehingga, dalam
penelitian ini akan menunjukkan secara simulasi bahwa parameter pada
Transformasi Box Cox berada di kisaran (-2,2).

1.3 Batasan Masalah

Agar penyelesaian masalah tidak menyimpang dari pembahasan, maka dibuat


pembatasan masalah yaitu dengan menganggap bahwa model analisis regresinya tetap
memenuhi asumsi – asumsi klasik lainnya kecuali asumsi homoskedastisitas tidak
terpenuhi.

1.4 Tinjauan Pustaka

Kutner, M.H, Wassamen.W dan Neter J (1990) mengatakan bahwa bentuk fungsi
dari peluang distribusi dengan adanya istilah kesalahan pengganggu (error) yang
ditetapkan serta estimator dari parameter – parameter dan yang dinotasikan
dengan dan dapat diperoleh dengan menggunakan Metode Kemungkinan
Maksimum (Maximum Likelihood Methods). Metode ini menggunakan distribusi
gabungan dari sampel pengamatannya. Ketika gabungan distribusi ditunjukkan
sebagai fungsi dari parameternya, yang diberi dengan sampel pengamatan tertentu,

Universitas Sumatera Utara


inilah yang disebut sebagai fungsi kemungkinannya. Dengan memaksimumkan fungsi
kemungkinannya maka akan diperoleh estimator dari parameter – parameternya.

Supranto J (2004) mengatakan bahwa heteroskesdastisitas merupakan salah satu


pelanggaran terhadap salah satu asumsi model ideal tertentu terhadap galat yang
diberlakukan dalam analisis regresi yaitu asumsi homoskedastisitas yang menyatakan
bahwa varian kesalahan pengganggu pada setiap variabel bebas adalah sama
(konstan). Heteroskedastisitas adalah keadaan bahwa varian kesalahan pengganggu
tidak bersifat konstan atau disimbolkan dengan ar
.

Gasperz, Vincent (1991) mengatakan bahwa heteroskedastisitas dapat


mengakibatkan pendugaan parameternya tidak efisien sehingga tidak mempunyai
ragam minimum. Karena pendugaan parameter dianggap efisien karena memiliki
ragam yang minimum, sehingga ragam galat bersifat konstan atau disebut juga
bahwa asumsi homoskedastisitas terpenuhi. Salah satu usaha untuk mengatasi
heteroskedastisitas ini dapat dilakukan dengan mentransformasikan variabel –
variabelnya, baik variabel bebas, variabel tidak bebas maupun keduanya agar asumsi
homoskedastisitas terpenuhi.

Box, G. E. P. Dan D. R. Cox (1964) mengatakan bahwa Transformasi Box Cox


adalah transformasi yang mempertimbangkan kelas transformasi berparameter tunggal
yaitu yang dipangkatkan pada variabel respon (variabel tidak bebas) Y yang
bertanda positif , sehingga transformasinya menjadi . Dalam analisis
regresi apabila kenormalan data, kehomogenen ragam dan linieritas tak dipenuhi,
maka dapat dilakukan transformasi terhadap variabel responnya sesuai dengan
prosedur Transformasi Box Cox. Salah satu cara untuk mengatasi ketidakhomogenan
ragam yaitu dengan Transformasi Box Cox.

Drapper, N dan Smith, H (1992) mengatakan bahwa Transformasi Box Cox


diberlakukan kepada variabel respon, Y, yang harus bertanda positif, dinyatakan
dalam transformasi kuasa dengan persamaan berikut:

Universitas Sumatera Utara


jika 0
ln jika 0

Famili transformasi kontinu ini bergantung pada satu parameter yang akan diduga.
Salah satu metode pendugaan (penaksiran) yang dapat digunakan ialah dengan
menggunakan Metode Kemungkinan Maksimum. Cara penaksiran agak berbeda
dengan cara penaksiran yang biasa dilakukan, yaitu dengan menentukan nilai pada
kisaran tertentu

1.5 Tujuan Penelitian

Tujuan dari penelitian ini adalah menggunakan prosedur Transformasi Box Cox
untuk mengatasi masalah heteroskedastisitas antara variabel – variabel bebas,
sehingga diperoleh persamaan regresi linier sederhana yang lebih baik.

1.6 Manfaat Penelitian

Regresi adalah salah satu metode yang digunakan untuk menaksir suatu peubah tak
bebas dengan memperhatikan faktor – faktor penyebabnya. Dari penulisan ini, penulis
berharap dapat memberikan suatu solusi alternatif bagi pengguna analisis regresi linier
sederhana dalam masalah heteroskedastisitas yang terdapat pada data, sehingga model
regresi tersebut dapat diatasi dan menjadi model regresi yang benar.

Universitas Sumatera Utara


1.7 Metode Penelitian

Data yang digunakan untuk analisis ini adalah data simulasi. Data simulasi terdiri dari
dua variabel yaitu variabel bebas (X) dan variabel tak bebas (Y). Data simulasi yang
akan dianalisis merupakan data random yang dibangkitkan berdasarkan distribusi
yang telah ditentukan yaitu berdistribusi normal dengan menggunakan program
Minitab 16. Langkah – langkah yang digunakan untuk menganalisis data tersebut
adalah:
1. Mengitung estimator dan dan membentuk model analisis regresi sederhana
dari data tersebut.
2. Mendeteksi keberadaan heteroskedastisitas berdasarkan prosedur pada Uji
Korelasi Rank dari Spearmen yang digunakan.
3. Menduga parameter pada Transformasi Box Cox dengan menggunakan Metode
Kemungkinan Maksimum. Dalam tulisan ini digunakan Program Minitab 16
dengan menjalankan perintah atau rangkaian perintah (command) yang
membentuk suatu fungsi tertentu dalam Minitab yang disebut dengan Macro
Minitab. Dengan menjalankan command tersebut akan diperoleh penduga dan
selang kepercayaan .
4. Menentukan model transformasinya sesuai dengan pendugaan parameter yang
telah didapat.
5. Mentransformasikan data menurut model transformasinya dan membentuk model
analisis regresi.
6. Menguji signifikansi dari model regresi tersebut dan juga dilakukan pengujian
heteroskedastisitasnya.

Universitas Sumatera Utara


BAB 2

LANDASAN TEORI

2.1 Regresi Linier Sederhana

Dalam beberapa masalah terdapat dua atau lebih variabel yang hubungannya tidak
dapat dipisahkan karena perubahan nilai suatu variabel tidak selalu terjadi dengan
sendirinya, namun perubahan nilai variabel itu dapat pula disebabkan oleh berubahnya
variabel lain yang berhubungan dengan variabel tersebut. Hal tersebut biasanya
diselidiki sifat hubungannya yaitu dengan mengetahui pola nilai suatu variabel yang
disebabkan oleh variabel lain diperlukan alat analisis yang dapat membuat perkiraan
nilai variabel tersebut pada nilai tertentu variabel yang mempengaruhinya.

Teknik yang umum digunakan untuk menganalisis hubungan antara dua atau
lebih variabel dalam ilmu statistik adalah dengan analisis regresi. Analisis regresi
adalah teknik statistik yang berguna untuk memeriksa dan memodelkan hubungan
diantara variabel-variabel. Analisis regresi berguna untuk menelaah pola dan
mengukur hubungan statistika antara dua atau lebih variabel yang modelnya belum
diketahui dengan sempurna.

Persamaan matematik yang digunakan untuk melakukan peramalan mengenai


nilai – nilai suatu variabel tak bebas dari satu atau lebih variabel bebas disebut
persamaan regresi. Istilah regresi pertama kali diperkenalkan oleh Sir Francis Galton

Universitas Sumatera Utara


(1822 – 1911) yang berasal dari hasil pengamatan yang dilakukan terhadap manusia
yaitu membandingkan tinggi badan anak laki – laki dengan tinggi badan ayahnya.

Galton menyatakan bahwa tinggi badan anak laki – laki dari badan yang tinggi
pada beberapa generasi kemudian cenderung “mundur” (regressed) mendekati rata –
rata populasi. Dengan kata lain, anak laki – laki dari ayahnya yang mempunyai
badannya sangat tinggi cenderung lebih pendek dari ayahnya. Sedangkan anak laki –
laki dari ayah yang mempunyai badan sangat pendek cenderung lebih tinggi dari
ayahnya. Dari hasil penelitian ini istilah regresi pada mulanya bertujuan untuk
membuat perkiraan nilai suatu variabel (tinggi badan anak) terhadap suatu variabel
lain (tinggi badan ayah).

Pada perkembangan selanjutnya analisis regresi dapat digunakan sebagai alat


untuk membuat perkiraan ataupun peramalan nilai suatu variabel dengan
menggunakan variabel lain yang berhubungan dengan variabel tersebut. Dalam
analisis regresi, dikenal dua jenis variabel yaitu :
1. Variabel Respon disebut juga variabel dependent yaitu variabel yang tidak bebas
yaitu keberadaannya dipengaruhi oleh variabel lainnya dan dinotasikan dengan Y.
2. Variabel Prediktor disebut juga variabel independent yaitu variabel yang bebas
(tidak dipengaruhi oleh variabel lainnya) dan dinotasikan dengan X.

Analisis regresi yang melibatkan hubungan antara satu variabel respon (tidak
bebas) dengan satu variabel prediktor (bebas) diistilahkan dengan regresi linier
sederhana, dengan model persamaan:
(2.1)

Dimana intercept dan slope merupakan parameter yang tidak diketahui nilainya,
sedangkan adalah error random dengan rata – rata nol dan varians .

Misalkan ada n pasangan observasi, katakan


dengan y merupakan variabel tidak bebasnya atau variabel respon yang berhubungan
dengan n variabel bebas diukur dengan errornya dapat diabaikan sehingga nilai
harapan y untuk masing – masing x adalah:

Universitas Sumatera Utara


(2.2)

Tujuan utama dari analisis regresi adalah mendapatkan dugaan (estimation)


dari suatu variabel dengan menggunakan variabel lain yang diketahui.

2.2 Estimasi Parameter

2.2.1 Pengertian Estimasi Parameter dan Estimator

Estimasi (pendugaan) merupakan proses yang menggunakan sampel statistik untuk


menduga atau menaksir hubungan parameter populasi yang tidak diketahui.
Pendugaan merupakan suatu pernyataan mengenai parameter populasi yang diketahui
berdasarkan informasi dari sampel, dalam hal ini sampel random, yang diambil dari
populasi yang bersangkutan. Jadi dengan pendugaan ini, keadaan parameter populasi
dapat diketahui (Hasan 2002).

Menurut Hasan (2002), estimator adalah suatu statistik (harga sampel) yang
digunakan untuk menduga suatu parameter. Dengan penduga, dapat diketahui
seberapa jauh suatu parameter populasi yang tidak diketahui berada di sekitar sampel
(statistik sampel). Besaran sebagai hasil penerapan penduga terhadap data dari sesuatu
contoh disebut nilai duga (estimate). Secara umum, parameter diberi lambang dan
penduganya diberi lambang .

2.2.2 Sifat – Sifat Estimator

Estimator yang diperoleh dalam mengestimasi parameter – parameter dikatakan


sebagai estimator yang baik apabila mempunyai sifat atau ciri – ciri sebagai berikut:

Universitas Sumatera Utara


1. Estimator yang tidak bias

Estimator yang tidak bias apabila dapat menghasilkan estimasi yang mengandung nilai
parameter yang diestimasikan. Misalkan, estimator dikatakan estimator yang tidak
bias jika rata – rata semua harga yang mungkin akan sama dengan , atau dapat
dituliskan .

2. Estimator yang efisien

Estimator dikatakan efisien bagi parameternya apabila estimator tersebut memiliki


varians minimum. Apabila terdapat lebih dari satu penduga, penduga yang efisien
adalah penduga yang memiliki varians terkecil. Dua buah penduga dapat
dibandingkan dengan efisiensi relatif. Misalkan dan adalah sebagai dua
estimator untuk , dimana varians penduga lebih kecil dibandingkan varians ,
maka relatif lebih efisien dibandingkan dengan .

3. Estimator yang konsisten

Estimator dikatakan konsisten apabila nilai penduga cenderung mendekati nilai


parameter untuk n (jumlah sampel) yang semakin besar mendekati tak hingga. Jadi,
ukuran sampel yang besar cenderung memberikan penduga titik yang lebih baik
dibandingkan ukuran sampel kecil.

Dalam analisis regresi, diperlukan suatu model yang digunakan untuk


mengetahui hubungan antara variabel tidak bebas (respon) dengan satu atau lebih
variabel bebas (prediktor) dan untuk melakukan peramalan terhadap variabel respon.
Model regresi dapat diperoleh dengan melakukan pendugaan terhadap parameter -
parameternya dengan menggunakan metode tertentu. Metode yang dapat digunakan
mengestimasi parameter model regresi, khususnya parameter model regresi linier
yaitu dengan Metode Kuadrat Terkecil (Ordinary Least Square) dan Metode
Kemungkinan Maksimum (Maximum Likelihood Methods), (Kutner et.all, 1990).

Universitas Sumatera Utara


2.3 Metode Kemungkinan Maksimum

Salah satu cara untuk mendapatkan estimator yang baik adalah dengan menggunakan
Metode Kemungkinan Maksimum (Maximum Likelihood Methods) yang
diperkenalkan oleh R. A. Fisher (1890 – 1962). Maksimum likelihood ini adalah
metode yang digunakan untuk menduga parameter – parameter dengan
memaksimumkan fungsi kemungkinannya yang dibentuk dari gabungan distribusi
pengamatan.

Misalkan X adalah variabel random berukuran n pengamatan dengan


maka fungsi kemungkinannya adalah:

(2.3)

Penduga kemungkinan dengan Metode Kemungkinan Maksimum dari


parameter tunggal adalah sebuah nilai yang memaksimumkan fungsi
kemungkinan . Apabila variabel random dari populasi yang berdistribusi
, maka fungsi kemungkinannya didefinisikan sebagai berikut:

( )

Jika fungsi kemungkinannya diturunkan terhadap , maka akan diperoleh


penyelesaian atau estimasi parameter – parameter dengan
memaksimumkan persamaan (2.4) dan menyamakan dengan nol, diperoleh:

( )

Universitas Sumatera Utara


Untuk lebih jelasnya, misalkan peubah acak X tersebut tersebar normal dengan
nilai tengah dan varians , dimana dan tidak diketahui sehingga fungsi
kemungkinannya adalah:

( )

Tujuan utama dari analisis regresi adalah mendapatkan dugaan (estimation)


dari suatu variabel dengan menggunakan variabel lain yang diketahui.

2.3.1 Maksimum Likelihood dalam Regresi Linier Sederhana

Maksimum Likelihood adalah metode yang dapat digunakan untuk mengestimasi


suatu parameter dalam regresi.

Dalam model regresi linear sederhana, berdasarkan data


diasumsikan bahwa galat dalam model regresi berdistribusi
dengan pengamatan – pengamatan dalam percobaan berdistribusi normal dan
independen, dengan mean dan variansnya . Maka fungsi kemungkinan
nilai pertama Y adalah:

(2.7)

Kemudian kemungkinan nilai kedua Y sama dengan persamaan (2.7), kecuali angka
satu diganti dengan dua dan seterusnya untuk semua nilai Y amatan lainnya.

Untuk nilai Y bebas dengan mengalikan semua kemungkinan bersama, maka


fungsi probabilitas bersamanya adalah:

( )

Dengan menyatakan hasil kali n kemungkinan bersama untuk setiap nilai i yang

Universitas Sumatera Utara


penggunaannya dikenal untuk eksponensial, sehingga persamaan (2.8) dapat
diperlihatkan dengan penjumlahan eksponensial yaitu:

( )

Mengingat yang diberikan dipertimbangkan untuk berbagai nilai dan ,


sehingga fungsi likelihoodnya yaitu:

( 0)

Estimator fungsi kemungkinan maksimum untuk parameter – parameter


dan dinotasikan dengan dan diperoleh dengan memaksimumkan L,
sehingga:

( )

ln maksimum bila minimum, ini merupakan jumlah kuadrat error

Dengan mendifferensialkan fungsi kemungkinannya terhadap setiap parameter


dan estimator harus memenuhi:

Penyelesaian dari persamaan tersebut adalah:

(2.12)

( )

Universitas Sumatera Utara


dan adalah estimator untuk intercept (titik potong) dan slope (kemiringan).
Sehingga diperoleh estimator model regresi linier sederhananya adalah:
(2.14)

Selain estimator dan , menurut Kutner, M.H (1990) estimasi juga


dibutuhkan dalam uji hipotesis dan pembentukan estimasi yang berhubungan dengan
model regresi. Dengan mendifferensialkan fungsi kemungkinannya terhadap
parameter dan estimator juga harus memenuhi:

Maka, penyelesaian dari persamaan tersebut adalah:

( )

Dengan adalah standard error regresi atau dapat juga dituliskan:

( )

SSE (Sum Square of Error) adalah jumlah kuadrat residual dan penduga ini bias .

Jumlah kuadrat residual mempunyai derajat kebebasan , karena dua


derajat kebebasan adalah gabungan dari estimasi dan yang terlibat dalam
pembentukan Sehingga estimator tak bias dari adalah :

( 7

Pendugaan (estimasi) yang dilakukan dengan Metode Kemungkinan


Maksimum untuk memperoleh estimatornya, tentu saja tidak lepas dari kesalahan
(error) baik itu sedikit maupun banyak. Namun dengan metode kemungkinan
maksimum, kesalahan penduga dijamin yang terkecil karena estimasi dengan metode
ini akan meminimumkan jumlah kudrat errornya dengan ketentuan memenuhi beberapa
asumsi. Asumsi – asumsi tersebut biasanya disebut dengan asumsi klasik regresi linier.

Universitas Sumatera Utara


Dengan demikian dalam melakukan analisis regresi diberlakukan asumsi –
asumsi model ideal tertentu terhadap galat , yaitu:
1. Nilai rata – rata kesalahan pengganggu nol, yaitu: , untuk
.
2. adalah konstan untuk semua kesalahan pengganggu
(asumsi homoskedastisitas).
3. Tidak ada korelasi serial (autocorrelation) antara pengganggu ,
berarti kovarian .
4. Peubah bebas konstan dalam sampling yang terulang dan bebas
terhadap kesalahan pengganggu .
5. Tidak ada multikolinearitas antar variabel bebas X.

2.4 Heteroskedastisitas

2.4.1 Pengertian Heteroskedastisitas

Salah satu asumsi penting dari model regresi linear klasik adalah varian error pada
setiap nilai – nilai variabel bebas adalah sama (konstan), asumsi ini disebut juga
sebagai asumsi homoskedastisitas atau homogenitas varian yang disimbolkan dengan:

, ,

Apabila asumsi ini tidak dipenuhi dalam analisis regresi linier, maka didapatkan
keadaan bahwa varian tidak bersifat konstan. Keadaan ini disebut mengalami
heteroskedastisitas atau disimbolkan dengan:

, , ,

Secara diagram dalam regresi dua variabel, homoskedastisitas dapat


ditunjukkan pada Gambar (2.1) yang menunjukkan bahwa varian setiap rerata nolnya
tidak tergantung pada pada nilai variabel bebas. Jika varian dari masih sama pada

Universitas Sumatera Utara


setiap titik atau untuk seluruh nilai X (variabel bebas) yang kecil maupun besar, maka
pola tertentu akan terbentuk bila sebaran Y diplot dengan sebaran X. Bila
digambarkan dalam tiga dimensi, polanya akan mendekati pola pada Gambar (2.1).

Densitas
Y

...
X

Gambar 2.1. Asumsi Homoskedastisitas

Sebaliknya, Gambar (2.2) menunjukkan varian kondisional dari yaitu naik


dengan naiknya X atau dikatakan bahwa varian dari pada setiap variabel bebas X
tidak sama (tidak konstan).

Densitas
Y

...
X

Gambar 2.2. Asumsi Heteroskedastisitas

Universitas Sumatera Utara


2.4.2 Konsekuensi Atau Akibat Adanya Heteroskedastisitas

Dalam kenyataannya, asumsi homoskedastisitas dari kesalahan pengganggu


mungkin tidak bisa dipenuhi, dengan kata lain varian dari kesalahan pengganggu
bersifat heteroskedastisitas, yaitu . Hal ini dapat dipahami jika
diperhitungkan faktor – faktor yang menjadi penyebab adanya kesalahan pengganggu
dalam model regresi. Faktor kesalahan pengganggu dimasukkan ke dalam model
untuk dapat memperhitungkan kesalahan – kesalahan yang mungkin terjadi dalam
pengukuran dan kesalahan karena mengabaikan variabel – variabel tertentu. Dengan
memperhatikan kedua perhitungan itu, maka terdapat alasan untuk memperkirakan
bahwa varian bervariasi secara sistematis dengan variabel bebas X.

Konsekuensi dari pelanggaran asumsi homoskedastisitas adalah sebagai


berikut:
1. Penduga (estimator) yang diperoleh tetap memenuhi persyaratan tidak bias.

Diberikan estimator

Anggaplah bahwa:

Sehingga:

Dengan diketahui bahwa:

dan

Universitas Sumatera Utara


Dengan demikian:

Sehingga diperoleh:

( )

Demikian juga untuk estimator parameter yaitu


Diberikan estimator

( )

Dengan mensubsitusikan ke dalam persamaan (2.19), maka:

Sehingga akan diperoleh:

(2.20)

Dapat disimpulkan bahwa sifat ketidakbiasan tidak tergantung pada varian galat.
Jika dalam model regresi ada heteroskedastisitas, maka kita tetap memperoleh
nilai parameter yang tidak bias karena sebagai penduga tidak bias tidak
memerlukan asumsi bahwa varian galat harus konstan.
2. Varian penduga yang diperoleh akan menjadi tidak efisien, artinya penduga
tersebut tidak memiliki varian terkecil diantara penduga – penduga tidak bias
lainnya.

Universitas Sumatera Utara


Dengan asumsi adanya homoskedastisitas, maka:

ar

i j

Karena , dan

Sehingga diperoleh:

var ( )

Apabila dengan adanya asumsi heteroskedastisitas maka:

var

( )

Walaupun dikatakan adalah unbiased, tetapi tidak efisien karena varian – variannya
lebih besar daripada yang diperlukan. Untuk melihat penggunaan persamaan (2.21)
dan (2.22), diuraikan sebagai berikut:

Universitas Sumatera Utara


Misalnya, dinyatakan bahwa varian dengan asumsi heteroskedastisitas proporsional
terhadap dan maka faktor proporsionalitasnya dinyatakan dengan persamaan:

Dengan mensubstitusikan nilai ke dalam persamaan (2.22), diperoleh:

var

Sehingga diperoleh:

var var dengan asumsi homoskedastisitas ( )

Dapat dikatakan bahwa, jika dan berkorelasi positif atau


mempunyai hubungan variabel yang positif dan jika komponen yang kedua dari
persamaan (2.23) lebih besar daripada satu atau dapat dituliskan:

Maka ar dengan asumsi heteroskedastisitas akan lebih besar daripada ar


dengan asumsi homoskedastisitas. Sebagai akibatnya, standar error dari terlalu
rendah (underestimated). Sebagaimana diketahui bahwa standart error ini memiliki peran
dalam pembentukan nilai t hitung yang berkaitan akan menjadi terlalu tinggi
(overestimated) yang mungkin selanjutnya menghasilkan kesimpulan bahwa dalam
kasus spesifik adalah kelihatannya signifikan, walaupun sebenarnya tidak

Universitas Sumatera Utara


signifikan. Oleh karena itu jika asumsi homoskedastisitas tidak dipenuhi maka hasil uji t
tidak menentu.

Selain uji signifikan tidak dapat diterapkan, batas – batas kepercayaan juga
tidak dapat diterapkan. Artinya jika varian penaksir model tidak memenuhi asumsi
homoskedastisitas, maka inferensi dan prediksi mengenai koefisien – koefisien
populasinya akan keliru.

Dalam analisis model regresi linear apabila semua asumsi model regresi linear
klasik terpenuhi kecuali asumsi homoskedastisitas yang berarti adanya
heteroskedastisitas, maka estimator dari paramater yang diperoleh masih tetap tak bias
dan konsisten tetapi estimatornya tidak efisien, baik untuk sampel kecil maupun
sampel besar.

2.4.3 Pengujian Heteroskedastisitas

Masalah heteroskedastisitas pada umumnya terjadi di dalam analisis data cross –


sectional. Data cross – sectional yaitu data yang diambil pada satu waktu saja, tetapi
dengan responden yang besar, misalnya jika melakukan survai. Data survai yang
didapatkan dari penelitian tersebut pada intinya adalah membandingkan kondisi satu
dan lain orang pada waktu yang sama. Gejala heteroskedastisitas terjadi akibat
ketidaksamaan data atau bervarisinya data yang diteliti.

Untuk mendeteksi masalah heteroskedastisitas dapat dilakukan dengan


metode formal dan informal. Metode formal dapat dilakukan dengan uji statistik
diantaranya Uji Park, Uji Glejser, Uji Korelasi Rank dari Spearmen dan Uji Goldfeld
– Quant. Sedangkan metode informal biasanya dilakukan dengan uji metode grafik
dengan memetakan terhadap dan melihat pola penyebaran yang terbentuk
sistematis atau acak. Dalam tulisan ini akan digunakan Uji Korelasi Rank dari
Spearmen dalam mendeteksi masalah heteroskedastisitas.

Universitas Sumatera Utara


Pengujian Korelasi Rank dari Spearmen

Sesuai dengan namanya, metode ini pertama kali diperkenalkan oleh Spearmen dan
menggunakan korelasi peringkat X dan . Koefisien Korelasi Rank dari Spearmen
dirumuskan:

( )

di mana merupakan selisih rank yang ditempatkan untuk dua karakteristik yang
berbeda dari individu ke-i atau fenomena ke-i dan n adalah banyaknya individu atau
fenomena yang diberi rank.

Langkah – langkah pengujian heteroskedastisitas dengan menggunakan uji


Korelasi Rank dari Spearmen adalah sebagai berikut:

1. Menentukan model regresi dengan meregresikan X dan Y dan didapatkan nilai


galat .
2. Tanpa memperhatikan tanda dari , yaitu ambil nilai mutlaknya yaitu ,
kemudian merangking kedua variabel dan sesuai dengan urutan yang
menaik ataupun menurun selanjutnya menghitung selisih rank keduanya.
3. Menghitung koefisien berdasarkan persamaan (2.24).
4. Tingkat signifikansi koefisien korelasi yang didapatkan dengan persamaan
(2.24) diuji dengan statistik uji t sebagai berikut:

( )

dengan derajat bebas .

5. Pengujian hipotesis:
: tidak ada heteroskedastisitas
: ada heteroskedastisitas
Dengan demikian, kaidah pengambilan keputusan untuk hipotesis di atas adalah
sebagai berikut:
Tolak jika . Dalam hal lain terima .

Universitas Sumatera Utara


Apabila dalam model regresi mencakup lebih dari dua variabel bebas, dapat
dihitung antara dengan setiap variabel bebas X secara terpisah dan juga dapat diuji
untuk mengetahui signifikan tidaknya dengan uji t.

2.5 Transformasi Box Cox

Box dan Cox (1964) telah mengembangkan suatu prosedur dalam pemilihan suatu
transformasi dari suatu transformasi kuasa (power transformation) yang dikenal
dengan Transformasi Box Cox dengan memperhatikan secara sistematis transformasi
variabelnya. Prosedur Transformasi Box Cox bertujuan untuk memeriksa
kecondongan dari distribusi bentuk galatnya atau dengan kata lain untuk menormalkan
data. Selain itu prosedur transformasi ini dapat juga digunakan untuk
menghomogenkan varian dan melinierkan model regresinya.

Transformasi Box Cox merupakan transformasi pangkat pada variabel respon


dan mempertimbangkan kelas transformasi berparameter tunggal, yaitu yang
dipangkatkan pada variabel respon Y. Dengan demikian, model transformasinya
menjadi dan adalah parameter yang perlu diduga.

Menurut Drapper S dan Harry S (1992) Transformasi Box Cox diberlakukan


pada variabel respon Y yang harus bertanda positif , dinyatakan dalam
transformasi kuasa dengan persamaan berikut:

jika ( )
jika

Setelah Y ditransformasikan menjadi W, maka model regresi liniernya dalam


persamaan matriks menjadi:
(2.27)

dengan . Dengan demikian, prosedur utama Box Cox adalah menduga


parameter transformasi dan dalam model regresi liniernya parameter juga perlu
diduga.

Universitas Sumatera Utara


2.5.1 Pendugaan Parameter Transformasi Box Cox

Salah satu metode yang dapat digunakan dalam pendugaan parameter pada
Transformasi Box Cox adalah dengan Metode Kemungkinan Maksimum. Cara
penaksiran ini sedikit berbeda dengan penaksiran yang biasa dilakukan yaitu
menentukan nilai pada kisaran nilai tertentu.

Dari model regresi linier diperoleh fungsi kemungkinannya,


yaitu:

( )

Dengan mengalikan transformasi Jacobian dari variabel – variabel sampai


dengan terhadap fungsi kemungkinannya maka diperoleh:

( )

dengan:

( 0)

Sehingga, fungsi kemungkinannya menjadi:

( )

Penduga parameter pada Transformasi Box Cox diperoleh dengan


memaksimumkan persamaan fungi kemungkinannya. Sehingga diperoleh:

( )

Sehingga untuk nilai yang telah ditetapkan, maka fungsi maksimum likelihoodnya
adalah:

( )

Universitas Sumatera Utara


Dengan adalah K ( umlah Kuadrat isa) setelah menduga model

regresi dengan yang ditentukan.

Penaksiran parameter yang biasa dilakukan yaitu menentukan nilai pada


kisaran nilai tertentu. Biasanya yang dipakai yaitu dari kisaran (-2,2) atau bahkan (-
1,1). Sehingga untuk setiap tingkatan nilai yang telah ditetapkan akan diperoleh nilai
– nilai maksimum likelihoodnya yaitu nilai . Penduga parameter dikatakan
sebagai penduga apabila memiliki nilai maksimum log – likelihoodnya
adalah maksimum terhadap yang telah ditetapkan dari antara nilai - nilai
yang diperoleh dari yang lainnya. Pada tabel 2.1 di bawah ini diberikan beberapa
nilai dan model transformasinya.

Tabel 2.1 Nilai dan Model Transformasinya

Interval Lambda Lamda yang Terpilih Model Transformasi

, ,

, 0,7

0,7 0, 0,

0, 0, 0

0, 0,7 0,5

0,7 , 1

, , 2

Universitas Sumatera Utara


2.5.2 Selang Kepercayaan Parameter Pada Transformasi Box Cox

Pendugaan parameter sering dinyatakan dalam pembentukan selang kepercayaan,


karena hampir tidak pernah ditemukan nilai statistik yang tepat sama dengan nilai
parameternya. Menurut Hasan (2002), pendugaannya sering dinyatakan dalam suatu
daerah atau interval yang dibatasi oleh dua nilai dan digunakan tingkat kepecayaan
(confidence) terhadap daerah nilai sebenarnya atau parameternya berada, sehingga
disebut interval kepercayaan atau selang kepercayaan.

Demikian halnya dalam pendugaan parameter pada Transformasi Box Cox


dinyatakan juga dalam selang kepercayaan terhadap , atas nilai – nilai yang
memenuhi pertidaksamaan berikut:
(2.34)

Dengan adalah titik persentase sebaran khi-kuadrat dengan satu derajat


bebas yang luas wilayah di sebelah kanannya sebesar . Sebagian nilai – nilai itu
adalah:

0,10 0,05 0,025 0,01 0,005


2,71 3,841 5,024 6,635 7,879

Untuk menggambarkan persaman (2.34) yaitu dengan menarik garis mendatar


setinggi, pada tebaran dengan pada setiap

perhitungan yang telah diperoleh. Sehingga garis yang terbentuk akan memotong
kurva pada dua nilai , dan ini merupakan titik – titik ujung selang kepercayaan
parameter yang terbentuk.

Universitas Sumatera Utara


2.6 Pengujian Hipotesis dalam Model Regresi Linier Sederhana

Model regresi yang baik diperoleh akan diperiksa setelah variabel respon Y
ditransformasikan sesuai dengan model transformasi. Pemeriksaan ini ditempuh
melalui pengujian hipotesis.

Jika pada percobaan akan dilakukan pengujian terhadap yang sama dengan
sebuah konstanta misalkan , maka pada umumnya hipotesis tersebut dirumuskan
sebagai berikut:

Dan akan diduga alternatifnya dua arah, maka satistik uji yang digunakan pada
pengujian hipotesis ini adalah:

( )

Kaidah pengambilan keputusan untuk pengujian hipotesis ini adalah sebagai berikut:
ditolak jika . Dalam hal lain terima .

Dengan cara yang sama dapat juga digunakan untuk menguji intercept , dan
hipotesisnya adalah sebagai berikut:

Statistik ujinya adalah:

( )

Kaidah pengambilan keputusan untuk pengujian hipotesis ini adalah sebagai berikut:
ditolak jika . Dalam hal lain terima .

Nilai dapat diperoleh dari tabel t dengan menggunakan dengan derajat

kebebasan (n-2).

Universitas Sumatera Utara


Dalam persamaan (2.35) dan (2.36) di atas dapat dinyatakan dengan persamaan
berikut:

( 7

Dengan adalah koreksi atau perbaikan jumlah kuadrat X.

Pengujian hipotesis dalam model regresi tersebut dilakukan secara parsial yang
bertujuan untuk menguji signifikansi pengaruh variabel bebas terhadap variabel
respon. Sehingga, masalah khusus dari pengujian hipotesis dalam model regresi linier
sederhana adalah:

Apabila hipotesis ditolak, maka variabel bebas X berpengaruh terhadap variabel


respon Y. Dengan demikian, model analisis regresi signifikan dan layak digunakan
untuk mengestimasi atau memprediksi nilai Y.

Universitas Sumatera Utara


BAB 3

PEMBAHASAN

3.1 Transformasi Box Cox Untuk Mengatasi Heteroskedastisitas

Apabila asumsi homoskedastisitas tidak terpenuhi atau terdapat heteroskedastisitas


maka tidak akan mempengaruhi ketakbiasan dan konsistensi dari penduga parameter,
tetapi penduga tersebut menjadi tidak efisien karena tidak memiliki varian yang
minimum, dengan demikian tidak lagi merupakan penduga tak bias linier terbaik atau
disebut juga Best Linear Unbiased Estimator (BLUE). Akibat tidak memiliki varian
yang minimum, maka akan mempengaruhi pengujian hipotesis terhadap parameter
baik menggunakan pendekatan uji signifikan maupun pendekatan selang kepercayaan.
Oleh karena itu tindakan perbaikan perlu dilakukan yaitu dengan mengatasi masalah
heteroskedastisitas. Salah satunya yaitu dengan Transformasi Box Cox yang
mentransformasikan variabel responnya dengan mempertimbangkan kelas
transformasi berparameter tunggal, yaitu yang dipangkatkan pada variabel respon
Y. Dengan demikian, model transformasinya menjadi .

Dengan mentransformasikan variabel responnya sesuai dengan model


transformasinya, maka akan diperoleh model regresi yang baik dengan memenuhi
asumsi homoskedastisitas yaitu masalah heteroskedastisitas akan teratasi. Model
transformasi akan terbentuk, apabila penduga parameter diperoleh dengan
menghitung nilai maksimum likelihoodnya yaitu nilai , dengan persamaan:

Universitas Sumatera Utara


( )

Persamaan (3.1) dapat juga dituliskan menjadi:

( )

Jika persamaan (3.1) direduksi terhadap konstanta, maka:

( )

Sehingga memaksimalkan nilai yang ditetapkan sama dengan meminimalkan ,


yaitu meminimalkan Jumlah Kuadrat Sesatan yang diperoleh dari pengepasan model
regresinya.

Misalnya apabila diperoleh penduga parameter pada Transformasi Box Cox


mendekati 0 (nol) atau berada pada interval -0, 0, , maka model
transformasinya adalah . Dengan mentranformasikan variabel responnya sesuai
model transformasi yang telah diperoleh maka akan memperkecil skala pengukuran
variabel – variabel yang asli. Oleh karena itu mampu mengurangi perbedaan di antara
nilai – nilai. Contohnya, apabila terdapat nilai asli 10 dan 100; dimana diketahui
bahwa 100 adalah sepuluh kali dari nilai 10 tetapi melalui transformasi logaritma
natural akan menjadi: ln 00 , 0 hanya sekitar dua kali dari ln 0 , 0 .

Untuk memperjelas prosedur Transformasi Box Cox dalam mengatasi masalah


heteroskedastisitas pada variabel – variabel bebas, maka dalam penelitian ini
digunakan data simulasi dengan membangkitkan bilangan acak dengan menggunakan
program Minitab 16. Dan data yang dibangkitkan berdasarkan distribusi yang telah
ditentukan yaitu berdistribusi normal.

Universitas Sumatera Utara


Data simulasi ini terdiri dari dua variabel yaitu variabel bebas X dan variabel
respon (Y). Dan dengan menggunakan program Minitab 16 akan dibahas setiap data
simulasi berdasarkan distribusi normal dengan parameter rata – rata dan standard
deviasi yang telah ditentukan. Kemudian dilakukan analisis regresi untuk
mendapatkan estimator dari model regresi dan dilakukan pengujian adanya
heteroskedastisitas. Dengan adanya masalah heteroskedastisitas dalam model regresi
maka akan diatasi dengan menggunakan Transformasi Box Cox yang dapat dianalisis
dengan menggunakan program Minitab 16.

Universitas Sumatera Utara


Tabel 3.1 Hasil Pengujian Heteroskedastisitas dan Analisis Transformasi Box Cox

Pada Model Regresi Linier Sederhana

Estimator Pengujian Heteroskedastisitas Analisis Transformasi Box Cox


No n Kesimpulan Interval Kepercayaan
1 20 -1,0 0,119 0,609 3,25 Tolak 2 0,
2 20 12,5 -0,115 0,683 3,969 Tolak 2 ,
3 20 -6,27 0,226 0,485 2,353 Tolak -0,99
4 20 11,4 0,00418 0,54 2,72 Tolak -0,48 ,
5 20 10,7 -0,00161 0,5323 2,622 Tolak -0,17 , ,
6 20 9,4 0,0094 0,5041 2,475 Tolak 0,17 0,7 ,
7 20 37,4 0,00793 2,692 4,066 Tolak -0,18 , 0,
8 20 51,0 -0,00016 0,505 2,483 Tolak 1,95 0,
9 20 84,8 0,0167 0,672 3,853 Tolak 0,64 0, ,
10 20 80,5 0,0115 0,647 2,742 Tolak 0,45 0, ,

Universitas Sumatera Utara


Tabel 3.2 Hasil Analisis Dalam Model Penentuan Regresi Linier Sederhana Setelah Variabel Respon

Ditransformasikan Sesuai dengan Model Transformasi Box Cox

No Model Transformasi Estimator Model Regresi Pengujian Pengujian Heteroskedastisitas


Box Cox Hipotesis Kesimpulan
1 -10,4 0,308 Tolak 0,3023 1,346 Terima
2 8,65 -0,0770 Tolak 0,1744 0,751 Terima
3 -5,29 0,206 Tolak -0,14 -0,399 Terima

4 11,3 0,00293 Tolak 0,28 1,23 Terima


5 10,6 -0,00426 Tolak -0,26 -1,142 Terima
6 9,67 0,00383 Tolak 0,155 0,6656 Terima
7 36,6 0,00431 Tolak 0,2812 1,243 Terima
8 51,5 83,0 Tolak -0,308 -1,374 Terima
9 83 0,0102 Tolak 0,226 0,984 Terima
10 77,9 0,00771 Tolak 0,0086 0,03687 Terima

Universitas Sumatera Utara


Hasil analisis Transformasi Box Cox untuk data yang berdistribusi normal
yang juga mengandung masalah heteroskedastisitas yaitu diperolehnya penduga
yang didapat pada setiap contoh data simulasinya. Penduga yang diproleh dapat juga
dituliskan dalam selang kepercayaan. Dengan diperolehnya penduga ini maka akan
terbentuk model transformasi Box Cox sesuai dengan nilai penduga seperti yang
ditunjukkan dalam tabel 3.2. Sehingga dengan mentransformasikan variabel
responnya sesuai dengan model transformasi maka akan diperoleh model regresi baru.
Dan apabila model regresi tersebut dilakukan uji signifikansi terhadap model regresi
maka diperoleh kesimpulan bahwa variabel bebas berpengaruh secara signifikan
terhadap variabel respon. Dengan demikian model regresi tersebut signifikan.

Kemudian apabila dilakukan pengujian heteroskedastisitas dengan uji Korelasi


Rank Spearmen maka hipotesis adanya heteroskedastisitas ditolak atau asumsi
homoskedastisitas terpenuhi dalam model regresi yang telah didapat.

Universitas Sumatera Utara


BAB 4

KESIMPULAN DAN SARAN

4.1 Kesimpulan

1. Dari hasil analisis untuk semua data simulasi yang dibangkitkan dengan
mengikuti distribusi normal maka dapat disimpulkan bahwa Transformasi Box
Cox dapat mengatasi heteroskedastisitas dalam model regresi, sehingga asumsi
homoskedastisitas akan terpenuhi.
2. Pendugaan parameter dapat juga dituliskan dalam selang kepercayaan. Dan
dari hasil analisis data simulasi, penduga parameter yang diperoleh berada
dikisaran (-2,2).

4.2 Saran

Heteroskedastisitas merupakan salah satu pelanggaran asumsi model ideal dalam


analisis regresi. Sehingga dengan adanya masalah heteroskedastisitas dapat
menyebabkan model yang diperoleh kurang baik karena penduga parameternya tidak
efisien. Dengan demikian disarankan untuk terlebih dahulu menghilangkan masalah
heteroskedastisitas tersebut. Salah satu caranya yaitu dengan Transformasi Box Cox.
Dan apabila kenormalan data dan linieritas tidak dipenuhi dalam analisis regresi dapat
juga diatasi dengan Transformasi Box Cox.

Universitas Sumatera Utara


DAFTAR PUSTAKA

Box, G. E. P. Dan D. R. Cox. 1964. An Analysis of Transformations. Journal of the


Royal Statistical Society. 26(2): hal.211-243

Daniel, W.W. 1989. Statistika Nonparametrik Terapan. Jakarta: Gramedia

Drapper, N dan Smith, H. 1992. Analisis Regresi Terapan. Jakarta: Gramedia

Gaspersz, Vincent. 1991. Ekonometrika Terapan 2. Bandung: Tarsito.

Gaudry, Marcel G. 1979. Heteroscedasticity and The Use of Box – Cox


Transformation. 2(3): hal. 225-229.

Greene H William. 2000. Econometric Analysis Fourth Edition. New York: Prentice
Hall International. Inc.

Gujarati, Damodar 1988. Basic Econometrics. United State of America : McGraw –


Hill, Inc.

Hasan, Iqbal. 2001. Pokok – Pokok Materi Statistik 2 (Statistik Inferensi). Jakarta: PT
Bumi Aksara.

Ispriyanti, Dwi. 2004. Pemodelan Statistika Dengan Transformasi Box Cox. 7(3):hal.
8-17.
Kutner, M.H, Wassamen.W dan Neter J. 1990. Applied Linear Statistical Models.
America: MC Graw-Hill/Irwin.

Universitas Sumatera Utara


Montgomery DC dan Elizabeth A.P. 1982. Introduction to Linear Regression Analysis
Second Edition. New York: John Wiley & Son.

Sembiring, R.K. 1995. Analisis Regresi. Bandung: ITB.

Sumodinigrat, Gunawan. 1994. Ekonometrika Pengantar . Yogyakarta: BPFE -


Yogyakarta.

Supranto, J. 2004. Ekonometrika . Jakarta: Ghalia Indonesia.

Weisberg, S. 1985. Applied Linier Regression Second Edition. New York: John Wiley
& Son.

Wonnacott, Thomas H dan Wonnacott, Ronald J. 1935. Regression: A Second Course


in Statistic. New York: John Wiley & Son.

Universitas Sumatera Utara


LAMPIRAN

Universitas Sumatera Utara


Penyelesaian Model Regresi Linier Sederhana dan Analisis Transformasi Box
Cox Pada Data Berdistribusi Normal Yang Mengandung Heteroskedastisitas

Data Simulasi 1

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 50 0,5.

MTB > Random 20 Y;


SUBC> Normal 5 0,5.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 10,3 - 0,111 X

Predictor Coef SE Coef T P


Constant 10,33 12,33 0,84 0,413
X -0,1112 0,2468 -0,45 0,658

S = 0,539615 R-Sq = 1,1% R-Sq(adj) = 0,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,0591 0,0591 0,20 0,658
Residual Error 18 5,2413 0,2912
Total 19 5,3004

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 2
Approximate 95% CI for Lambda: (-0,9 , 2)

Universitas Sumatera Utara


Data Simulasi 2

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 50 0,5.

MTB > Random 20 Y;


SUBC> Normal 5 0,5.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = - 1,0 + 0,119 X

Predictor Coef SE Coef T P


Constant -1,03 13,67 -0,08 0,941
X 0,1186 0,2734 0,43 0,670

S = 0,475180 R-Sq = 1,0% R-Sq(adj) = 0,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,0425 0,0425 0,19 0,670
Residual Error 18 4,0643 0,2258
Total 19 4,1068

Unusual Observations

Obs X Y Fit SE Fit Residual St Resid


18 50,0 3,940 4,901 0,107 -0,962 -2,08R

R denotes an observation with a large standardized residual.

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 2
Approximate 95% CI for Lambda: (-1,61 , 2)

Universitas Sumatera Utara


Data Simulasi 3

Welcome to Minitab, press F1 for help.


MTB > Random 20 X;
SUBC> Normal 50 0,5.

MTB > Random 20 Y;


SUBC> Normal 5 0,5.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = - 6,27 + 0,226 X

Predictor Coef SE Coef T P


Constant -6,267 6,891 -0,91 0,375
X 0,2263 0,1376 1,64 0,117

S = 0,386226 R-Sq = 13,1% R-Sq(adj) = 8,2%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,4036 0,4036 2,71 0,117
Residual Error 18 2,6851 0,1492
Total 19 3,0887

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: -0,99


Approximate 95% CI for Lambda: (-2 , 2)

Universitas Sumatera Utara


Data Simulasi 4

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 100 100.

MTB > Random 20 Y;


SUBC> Normal 10 4.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 11,4 + 0,00418 X

Predictor Coef SE Coef T P


Constant 11,3973 0,9211 12,37 0,000
X 0,004184 0,007054 0,59 0,560

S = 3,11156 R-Sq = 1,9% R-Sq(adj) = 0,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 3,407 3,407 0,35 0,560
Residual Error 18 174,272 9,682
Total 19 177,679

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 0,48


Approximate 95% CI for Lambda: (-1,23 , 2)

Universitas Sumatera Utara


Data Simulasi 5

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 100 100.

MTB > Random 20 Y;


SUBC> Normal 10 4.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 10,7 - 0,00161 X

Predictor Coef SE Coef T P


Constant 10,674 1,207 8,84 0,000
X -0,001613 0,006700 -0,24 0,813

S = 3,36763 R-Sq = 0,3% R-Sq(adj) = 0,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,66 0,66 0,06 0,813
Residual Error 18 204,14 11,34
Total 19 204,79

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: -0,17


Approximate 95% CI for Lambda: (-1,53 , 1,16)

Universitas Sumatera Utara


Data Simulasi 6

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 100 100.

MTB > Random 20 Y;


SUBC> Normal 10 4.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 9,40 + 0,0094 X

Predictor Coef SE Coef T P


Constant 9,398 1,516 6,20 0,000
X 0,00944 0,01160 0,81 0,426

S = 3,19832 R-Sq = 3,6% R-Sq(adj) = 0,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 6,78 6,78 0,66 0,426
Residual Error 18 184,13 10,23
Total 19 190,90

Unusual Observations

Obs X Y Fit SE Fit Residual St Resid


1 162 20,478 10,924 0,895 9,555 3,11R
19 213 4,588 11,408 1,340 -6,820 -2,35R

R denotes an observation with a large standardized residual.

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 0,17


Approximate 95% CI for Lambda: (-0,78 , 1,13)

Universitas Sumatera Utara


Data Simulasi 7

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 1000 1000.

MTB > Random 20 Y;


SUBC> Normal 50 5.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 37,4 + 0,00793 X

Predictor Coef SE Coef T P


Constant 37,395 6,622 5,65 0,000
X 0,007934 0,005648 1,40 0,177

S = 20,3362 R-Sq = 9,9% R-Sq(adj) = 4,9%

Analysis of Variance

Source DF SS MS F P
Regression 1 816,1 816,1 1,97 0,177
Residual Error 18 7444,1 413,6
Total 19 8260,2

Unusual Observations

Obs X Y Fit SE Fit Residual St Resid


16 2237 100,60 55,15 9,05 45,45 2,50R

R denotes an observation with a large standardized residual.

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: -0,18


Approximate 95% CI for Lambda: (-1,21 , 0,82)

Universitas Sumatera Utara


Data Simulasi 8

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 1000 1000.

MTB > Random 20 Y;


SUBC> Normal 50 5.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 51,0 - 0,00016 X

20 cases used, 381 cases contain missing values

Predictor Coef SE Coef T P


Constant 50,958 4,079 12,49 0,000
X -0,000159 0,002583 -0,06 0,952

S = 12,2892 R-Sq = 0,0% R-Sq(adj) = 0,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,6 0,6 0,00 0,952
Residual Error 18 2718,4 151,0
Total 19 2719,0

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 1,95


Approximate 95% CI for Lambda: (0,52 , 2)

Universitas Sumatera Utara


Data Simulasi 9

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 1000 1000.

MTB > Random 20 Y;


SUBC> Normal 100 50.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 84,8 + 0,0167 X

Predictor Coef SE Coef T P


Constant 84,79 15,39 5,51 0,000
X 0,01669 0,01559 1,07 0,298

S = 48,7699 R-Sq = 6,0% R-Sq(adj) = 0,8%

Analysis of Variance

Source DF SS MS F P
Regression 1 2727 2727 1,15 0,298
Residual Error 18 42813 2378
Total 19 45540

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 0,64


Approximate 95% CI for Lambda: (-0,23 , 1,59)

Universitas Sumatera Utara


Data Simulasi 10

Welcome to Minitab, press F1 for help.

MTB > Random 20 X;


SUBC> Normal 1000 1000.

MTB > Random 20 Y;


SUBC> Normal 100 50.

MTB > Regress 'Y' 1 'X';


SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 80,5 + 0,0115 X

Predictor Coef SE Coef T P


Constant 80,55 12,64 6,37 0,000
X 0,01151 0,01107 1,04 0,312

S = 44,5967 R-Sq = 5,7% R-Sq(adj) = 0,4%

Analysis of Variance

Source DF SS MS F P
Regression 1 2151 2151 1,08 0,312
Residual Error 18 35800 1989
Total 19 37951

MTB > %bctrans C2 C1.


Executing from file: C:\Program Files\Minitab\Minitab
16\English\Macros\bctrans.MAC

Macro is running ... please wait

Box-Cox Power Transformation Analysis

Model Information
------------------------------

Response: Y
Predictor(s): X

------------------------------

Estimated Lambda: 0,45


Approximate 95% CI for Lambda: (-0,39 , 1,28)

Universitas Sumatera Utara


Gambar Analisis Transformasi Box Cox Pada Data Berdistribusi Normal

Untuk Mengatasi Heteroskedastisitas Pada Model Regresi

Gambar Data Simulasi 1

Box-Cox Power Transformation Analysis

-0,9 2 6,78
14,0

6,76
13,5

6,74

13,0

6,72
Log-Likelihood

12,5
P RESS

6,70

12,0
6,68

11,5
6,66

11,0
6,64

-2 -1 0 1 2 6,62
Lambda
-1 0 1 2
E stimated Lambda: 2
Lambda
A pproximate 95% C I for Lambda: (-0,9 , 2)

Universitas Sumatera Utara


Gambar Data Simulasi 2

Box-Cox Power Transformation Analysis

-1,61 2 500
16,5

16,0 400
Log-Likelihood

15,5 300

P RESS
15,0
200

14,5

100

14,0

-2 -1 0 1 2 0
Lambda
-2 -1 0 1 2
E stimated Lambda: 2
Lambda
A pproximate 95% C I for Lambda: (-1,61 , 2)

Gambar Data Simulasi 3

Box-Cox Power Transformation Analysis

-2 2 3,400
20,3

20,2 3,395
Log-Likelihood

20,1
3,390
P RESS

20,0

3,385

19,9

3,380

19,8
-2 -1 0 1 2
Lambda
-2 -1 0 1 2
E stimated Lambda: -0,99
Lambda
A pproximate 95% C I for Lambda: (-2 , 2)

Universitas Sumatera Utara


Gambar Data Simulasi 4

Box-Cox Power Transformation Analysis

-1,23 2
-21
252

-22

250
Log-Likelihood

-23

P RESS
248

-24

246
-25

244
-26
-2 -1 0 1 2
Lambda
-1 0 1 2
E stimated Lambda: 0,48
Lambda
A pproximate 95% C I for Lambda: (-1,23 , 2)

Gambar Data Simulasi 5

Box-Cox Power Transformation Analysis

-1,53 1,16 285

-22
280

-23 275
Log-Likelihood

-24 270
P RESS

265
-25

260
-26

255

-27
-2 -1 0 1 2
250
Lambda
-2 -1 0 1
E stimated Lambda: -0,17
Lambda
A pproximate 95% C I for Lambda: (-1,53 , 1,16)

Universitas Sumatera Utara


Gambar Data Simulasi 6

Box-Cox Power Transformation Analysis

-0,78 1,13
-20 255

-22 250
Log-Likelihood

-24
245

P RESS
-26
240

-28

235

-30

-2 -1 0 1 2
Lambda 230
-1,0 -0,5 0,0 0,5 1,0
E stimated Lambda: 0,17
Lambda
A pproximate 95% C I for Lambda: (-0,78 , 1,13)

Gambar Data Simulasi 7

Box-Cox Power Transformation Analysis

-1,21 0,82 11400


-56

11200

-58
11000
Log-Likelihood

-60 10800
P RESS

10600
-62

10400

-64

10200

-66
10000
-2 -1 0 1 2
Lambda
-1,0 -0,5 0,0 0,5 1,0
E stimated Lambda: -0,18
Lambda
A pproximate 95% C I for Lambda: (-1,21 , 0,82)

Universitas Sumatera Utara


Gambar Data Simulasi 8

Box-Cox Power Transformation Analysis

0,52 2 3260

-50 3250

3240

-55
Log-Likelihood

3230

P RESS
3220
-60

3210

-65
3200

-2 -1 0 1 2
Lambda 3190
0,5 1,0 1,5 2,0
E stimated Lambda: 1,95
Lambda
A pproximate 95% C I for Lambda: (0,52 , 2)

Gambar Data Simulasi 9

Box-Cox Power Transformation Analysis

-0,23 1,59 250000


-75

-80 200000
Log-Likelihood

P RESS

-85
150000

-90
100000

-95

-2 -1 0 1 2 50000
Lambda
-0,5 0,0 0,5 1,0 1,5
E stimated Lambda: 0,64
Lambda
A pproximate 95% C I for Lambda: (-0,23 , 1,59)

Universitas Sumatera Utara


Gambar Data Simulasi 10

Box-Cox Power Transformation Analysis

-0,39 1,28

52000
-75,0

-77,5
51000
Log-Likelihood

-80,0

P RESS
50000
-82,5

-85,0
49000

-87,5

-90,0 48000
-2 -1 0 1 2
Lambda
-0,5 0,0 0,5 1,0 1,5
E stimated Lambda: 0,45
Lambda
A pproximate 95% C I for Lambda: (-0,39 , 1,28)

Universitas Sumatera Utara


Macro Minitab Analisis Transformasi Box Cox
(Dari File: C:\Program Files\Minitab\Minitab 16\English\Macros\bctrans.MAC)

Macro
BCtrans Y X.1-X.n;
range r1 r2;
influence;
bcstore St1 St2;
infstore St3 St4;
presstore St5 St6.

Mcolumns Y X.1-X.n Y1 Lambda Res Trans LL Temp1 Temp2 Junk


Mcolumns Conf Col Col1 Col2 Col3 Col4 Col5 Final Case Mesh
Mcolumns St1 St2 St3 St4 St5 St6 Oper YY XX.1-XX.n Lev Press
Mcolumns HH.1-HH.100 II.1 Bug JJ.1 T1 T2

Mconstants a c e f g h i j k l m t u lo hi lam err one two


Mconstants aa r1 r2 ss tt ww zz bg tlo thi tlam

Mmatrix m1 m2 m3 m4 m5 m6 m7 m8 m9

mreset
noecho
brief
note
note Macro is running ... please wait
mtitle "Box-Cox Power Transformation Analysis"
note
notitle
brief 0
ow 130
#********************************************************************
*******
# Error checks

min Y err
IF err <= 0
brief 2
Note **Error** Response values must be positive.
Note
exit
ENDIF

IF infstore and not influence


brief 2
Note **Error** Must select both influence and infstore for storage.
Note
exit
ENDIF

#********************************************************************
*******
# Check for missing values

RNmissing Y X.1-X.n Oper


copy Y X.1-X.n YY XX.1-XX.n;
omit Oper = 1:1000. #1000 was chosen as an extreme
upper limit

IF max(Oper) > 0
brief 2

Universitas Sumatera Utara


Note **Note** Rows with missing values have been deleted from the
analysis.
Note
brief 0
ENDIF

#********************************************************************
*******
# Session window information

kkname ss Y
kkset tt " Response: "
kkcat tt ss tt

DO i = 1:n
IF i < n
kkname ww X.i
kkset zz ", "
kkcat ww zz ww
copy ww HH.i
ELSE
kkname ww X.i
copy ww HH.i
ENDIF
ENDDO
tset II.1
"Predictor(s): "
end

IF n > 5
kkset bg "..." #abbreviate names of predictors if n
> 5
copy bg Bug
concat II.1 HH.1 HH.2 HH.3 HH.4 Bug JJ.1
ELSE
conc II.1 HH.1-HH.n JJ.1
ENDIF

stack tt JJ.1 JJ.1


brief
Note Model Information
Note ------------------------------
write JJ.1
#format(A80).
Note ------------------------------
brief 0

#********************************************************************
*******
# Find optimal lambda based on log-likelihood

loge YY Y1 #LOGE(Response variable)


set Lambda #Lambda Values
-2:2/0.01
end

DO i = 1:401
let c = Lambda[i]
IF c = 0
regress Y1 n XX.1-XX.n;
residuals Res;
xpxinv m1.
ELSE
let Trans = ((YY**c)-1)/c
regress Trans n XX.1-XX.n;
residuals Res;
xpxinv m1.

Universitas Sumatera Utara


ENDIF
let LL[i] = ((c-1)*sum(Y1))-
(0.5*(count(YY))*(loge((ssq(Res))/(count(YY)))))
ENDDO
sort LL Lambda Temp1 Temp2
max Temp1 e
let f = e-1.92
code (f:e)1 (-9999:f) '*' Temp1 Conf
let Conf = Conf*Temp2
let lam = Temp2[401]
min Conf lo
max Conf hi

#********************************************************************
*******
# Compute PRESS for refined lambda range

IF range
copy r1 one
copy r2 two
ELSE
let one = round(lo,1)
let two = round(hi,1)
IF lo <= one
let one = one-0.10
ENDIF

IF hi > two
let two = two+0.10
ENDIF
ENDIF

set Mesh
one:two/.01
end

count Mesh aa
DO i = 1:aa
let c = Mesh[i]
IF c = 0
regress Y1 n XX.1-XX.n;
residuals Res;
hi Lev.
let Press[i] = ssq(YY-(expo(Y1-(Res/(1-Lev)))))
ELSE
let Trans = YY**c
regress Trans n XX.1-XX.n;
residuals Res;
hi Lev.
let Press[i] = ssq(YY-((Trans-(Res/(1-Lev)))**(1/c)))
ENDIF
ENDDO

#********************************************************************
*******
Endmacro

Universitas Sumatera Utara


Penyelesaian Analisis Model Regresi Setelah Variabel Respon
Ditransformasikan Sesuai Dengan Model Transformasi Box Cox Pada Data
Berdistribusi Normal

Data Simulasi 1
Welcome to Minitab, press F1 for help.
MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = - 2,17 + 0,142 X

Predictor Coef SE Coef T P


Constant -2,16520 0,00992 -218,19 0,000
X 0,142293 0,000198 717,11 0,000

S = 0,000344855 R-Sq = 100,0% R-Sq(adj) = 100,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,061157 0,061157 514245,57 0,000
Residual Error 18 0,000002 0,000000
Total 19 0,061159

Data Simulasi 2

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 8,65 - 0,0770 X

Predictor Coef SE Coef T P


Constant 8,64664 0,00460 1878,49 0,000
X -0,0770189 0,0000922 -835,70 0,000

S = 0,000201498 R-Sq = 100,0% R-Sq(adj) = 100,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,028356 0,028356 698389,92 0,000
Residual Error 18 0,000001 0,000000
Total 19 0,028356

Universitas Sumatera Utara


Data Simulasi 3

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = - 5,29 + 0,206 X

Predictor Coef SE Coef T P


Constant -5,29399 0,06824 -77,58 0,000
X 0,206191 0,001362 151,33 0,000

S = 0,00382450 R-Sq = 99,9% R-Sq(adj) = 99,9%

Analysis of Variance

Source DF SS MS F P
Regression 1 0,33498 0,33498 22901,95 0,000
Residual Error 18 0,00026 0,00001
Total 19 0,33524

Data Simulasi 4

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 11,3 + 0,00293 X

Predictor Coef SE Coef T P


Constant 11,2893 0,0007 16487,22 0,000
X 0,00293038 0,00000524 558,79 0,000

S = 0,00231318 R-Sq = 100,0% R-Sq(adj) = 100,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 1,6708 1,6708 312244,48 0,000
Residual Error 18 0,0001 0,0000
Total 19 1,6709

Universitas Sumatera Utara


Data Simulasi 5

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 10,6 - 0,00428 X

Predictor Coef SE Coef T P


Constant 10,5884 0,0058 1816,21 0,000
X -0,00427939 0,00003237 -132,22 0,000

S = 0,0162681 R-Sq = 99,9% R-Sq(adj) = 99,9%

Analysis of Variance

Source DF SS MS F P
Regression 1 4,6264 4,6264 17481,24 0,000
Residual Error 18 0,0048 0,0003
Total 19 4,6312

Data Simulasi 6

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 9,67 + 0,00383 X

Predictor Coef SE Coef T P


Constant 9,67358 0,00135 7161,46 0,000
X 0,00383446 0,00001033 371,02 0,000

S = 0,00284936 R-Sq = 100,0% R-Sq(adj) = 100,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 1,1176 1,1176 137655,63 0,000
Residual Error 18 0,0001 0,0000
Total 19 1,1178

Universitas Sumatera Utara


Data Simulasi 7

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 36,6 + 0,00431 X

Predictor Coef SE Coef T P


Constant 36,5682 0,0454 805,63 0,000
X 0,00431044 0,00003871 111,34 0,000

S = 0,139386 R-Sq = 99,9% R-Sq(adj) = 99,8%

Analysis of Variance

Source DF SS MS F P
Regression 1 240,84 240,84 12396,45 0,000
Residual Error 18 0,35 0,02
Total 19 241,19

Data Simulasi 8

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 51,5 + 0,000463 X

Predictor Coef SE Coef T P


Constant 51,5441 0,0010 50726,15 0,000
X 0,00046286 0,00000064 719,32 0,000

S = 0,00306116 R-Sq = 100,0% R-Sq(adj) = 100,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 4,8486 4,8486 517424,54 0,000
Residual Error 18 0,0002 0,0000
Total 19 4,8488

Universitas Sumatera Utara


Data Simulasi 9

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 83,0 + 0,0102 X

Predictor Coef SE Coef T P


Constant 82,9571 0,0513 1618,21 0,000
X 0,0101984 0,0000519 196,45 0,000

S = 0,162424 R-Sq = 100,0% R-Sq(adj) = 100,0%

Analysis of Variance

Source DF SS MS F P
Regression 1 1018,1 1018,1 38590,84 0,000
Residual Error 18 0,5 0,0
Total 19 1018,6

Data Simulasi 10

Welcome to Minitab, press F1 for help.


MTB > Regress 'Y' 1 'X';
SUBC> Constant;
SUBC> Brief 2.

Regression Analysis: Y versus X

The regression equation is


Y = 77,9 + 0,00771 X

Predictor Coef SE Coef T P


Constant 77,8938 0,0513 1519,15 0,000
X 0,00770742 0,00004490 171,67 0,000

S = 0,180891 R-Sq = 99,9% R-Sq(adj) = 99,9%

Analysis of Variance

Source DF SS MS F P
Regression 1 964,34 964,34 29471,27 0,000
Residual Error 18 0,59 0,03
Total 19 964,93

Universitas Sumatera Utara


Tabel Distribusi t (df = 1-40)

df 0.25 0.10 0.05 0.025 0.01 0.005 0.001


1 1.00000 3.07768 6.31375 12.70620 31.82052 63.65674 318.30884
2 0.81650 1.88562 2.91999 4.30265 6.96456 9.92484 22.32712
3 0.76489 1.63774 2.35336 3.18245 4.54070 5.84091 10.21453
4 0.74070 1.53321 2.13185 2.77645 3.74695 4.60409 7.17318
5 0.72669 1.47588 2.01505 2.57058 3.36493 4.03214 5.89343
6 0.71756 1.43976 1.94318 2.44691 3.14267 3.70743 5.20763
7 0.71114 1.41492 1.89458 2.36462 2.99795 3.49948 4.78529
8 0.70639 1.39682 1.85955 2.30600 2.89646 3.35539 4.50079
9 0.70272 1.38303 1.83311 2.26216 2.82144 3.24984 4.29681
10 0.69981 1.37218 1.81246 2.22814 2.76377 3.16927 4.14370
11 0.69745 1.36343 1.79588 2.20099 2.71808 3.10581 4.02470
12 0.69548 1.35622 1.78229 2.17881 2.68100 3.05454 3.92963
13 0.69383 1.35017 1.77093 2.16037 2.65031 3.01228 3.85198
14 0.69242 1.34503 1.76131 2.14479 2.62449 2.97684 3.78739
15 0.69120 1.34061 1.75305 2.13145 2.60248 2.94671 3.73283
16 0.69013 1.33676 1.74588 2.11991 2.58349 2.92078 3.68615
17 0.68920 1.33338 1.73961 2.10982 2.56693 2.89823 3.64577
18 0.68836 1.33039 1.73406 2.10092 2.55238 2.87844 3.61048
19 0.68762 1.32773 1.72913 2.09302 2.53948 2.86093 3.57940
20 0.68695 1.32534 1.72472 2.08596 2.52798 2.84534 3.55181
21 0.68635 1.32319 1.72074 2.07961 2.51765 2.83136 3.52715
22 0.68581 1.32124 1.71714 2.07387 2.50832 2.81876 3.50499
23 0.68531 1.31946 1.71387 2.06866 2.49987 2.80734 3.48496
24 0.68485 1.31784 1.71088 2.06390 2.49216 2.79694 3.46678
25 0.68443 1.31635 1.70814 2.05954 2.48511 2.78744 3.45019
26 0.68404 1.31497 1.70562 2.05553 2.47863 2.77871 3.43500
27 0.68368 1.31370 1.70329 2.05183 2.47266 2.77068 3.42103
28 0.68335 1.31253 1.70113 2.04841 2.46714 2.76326 3.40816
29 0.68304 1.31143 1.69913 2.04523 2.46202 2.75639 3.39624
30 0.68276 1.31042 1.69726 2.04227 2.45726 2.75000 3.38518
31 0.68249 1.30946 1.69552 2.03951 2.45282 2.74404 3.37490
32 0.68223 1.30857 1.69389 2.03693 2.44868 2.73848 3.36531
33 0.68200 1.30774 1.69236 2.03452 2.44479 2.73328 3.35634
34 0.68177 1.30695 1.69092 2.03224 2.44115 2.72839 3.34793
35 0.68156 1.30621 1.68957 2.03011 2.43772 2.72381 3.34005
36 0.68137 1.30551 1.68830 2.02809 2.43449 2.71948 3.33262
37 0.68118 1.30485 1.68709 2.02619 2.43145 2.71541 3.32563
38 0.68100 1.30423 1.68595 2.02439 2.42857 2.71156 3.31903
39 0.68083 1.30364 1.68488 2.02269 2.42584 2.70791 3.31279
40 0.68067 1.30308 1.68385 2.02108 2.42326 2.70446 3.30688

Sumber: http://junaidichaniago.wordpress.com

Universitas Sumatera Utara


Tabel Nilai Kritis Distribusi F dengan

df untuk df untuk pembilang (N1)


penyebut
(N2)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
1 161 199 216 225 230 234 237 239 241 242 243 244 245 245 246
2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.40 19.41 19.42 19.42 19.43
3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.76 8.74 8.73 8.71 8.70
4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.94 5.91 5.89 5.87 5.86
5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.70 4.68 4.66 4.64 4.62
6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.03 4.00 3.98 3.96 3.94
7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.60 3.57 3.55 3.53 3.51
8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.31 3.28 3.26 3.24 3.22
9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.10 3.07 3.05 3.03 3.01
10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.94 2.91 2.89 2.86 2.85
11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.82 2.79 2.76 2.74 2.72
12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.72 2.69 2.66 2.64 2.62
13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.63 2.60 2.58 2.55 2.53
14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.57 2.53 2.51 2.48 2.46
15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.51 2.48 2.45 2.42 2.40
16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.46 2.42 2.40 2.37 2.35
17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.41 2.38 2.35 2.33 2.31
18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.37 2.34 2.31 2.29 2.27
19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.34 2.31 2.28 2.26 2.23
20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.31 2.28 2.25 2.22 2.20

Sumber: (http://junaidichaniago.wordpress.com)

Universitas Sumatera Utara

Anda mungkin juga menyukai