Anda di halaman 1dari 5

BAB I

PENDAHULUAN

1.1.

Latar Belakang dan Permasalahan


Analisis regresi dalam statistika adalah salah satu metode untuk

mengetahui hubungan atau pengaruh antara satu variabel dengan variabel lainnya.
Selain itu, analisis ini juga dapat melihat bentuk-bentuk hubungan antar variabel
tersebut. Variabel penyebab disebut dengan bermacam-macam istilah yaitu
variabel penjelas, variabel eksplanatorik, variabel prediktor, variabel independen,
atau secara umum kita sebut dengan istilah variabel X (karena seringkali
digambarkan dalam grafik sebagai absis). Variabel yang terkena akibat dikenal
sebagai variabel yang dipengaruhi, variabel terikat, variabel respon, variabel
dependen, atau variabel Y.
Analisis regresi adalah salah satu analisis yang paling populer dan luas
pemakaiannya. Analisis regresi dipakai secara luas tak hanya oleh seorang
statistisi, namun juga oleh para ilmuwan, ekonom, psikolog, sosiolog dan profesi
lainnya yang selalu berkepentingan dengan masalah prediksi dan ramalan. Karena
selain untuk melihat pengaruh variabel independen (X) terhadap variabel
dependen (Y), analisis ini selanjutnya dapat untuk menduga atau memprediksi
nilai variabel dependen (Y) berdasarkan variabel independennya (X).
Berdasarkan jumlah variabel independennya (X), analisis regresi linear
bisa dibedakan menjadi dua macam, yaitu analisis regresi linear sederhana dan
analisis regresi linear ganda. Analisis regresi linear sederhana hanya mempunyai
satu variabel independen saja. Sedangkan pada analisis regresi ganda, jumlah
variabel independennya lebih dari satu.
Istilah regresi ini dikemukakan pertama kali oleh Francis Galton (18221911), seorang antropolog dan ahli meteorologi Perancis dalam artikelnya Family
Likeness in Stature. Tetapi ada pula yang menyatakan istilah regresi muncul pada
pidato Francis Galton di depan Section H of The British Association di Aberdeen

1855 dan dimuat dalam makalah Regression Toward Mediocrity in Hereditary


Stature (Draper and Smith, 1922). Galton membandingkan tinggi badan anak lakilaki dengan tinggi badan ayahnya. Ia menunjukkan bahwa tinggi badan anak lakilaki dari ayah yang tinggi setelah beberapa generasi cenderung mundur
(regressed) mendekati nilai tengah populasi. Sekarang istilah regresi diterapkan
pada semua jenis peramalan, dan tidak harus berimplikasi suatu regresi mendekati
nilai tengah populasi.
Pada awal abad XIX, Carl Friederich Gauss mempopulerkan metode
kuadrat terkecil (Least Square Method) yang menjadi dasar analisis regresi klasik.
Metode kuadrat terkecil adalah salah satu metode penaksiran parameter yaitu
metode untuk menduga koefisien regresi. Pada era 1960-an, serangkaian studi
yang dikembangkan oleh para statistisi berhasil menunjukkan bahwa dalam
banyak kasus, regresi menggunakan teknik kuadrat terkecil (khususnya teknik
Ordinary Least Square/OLS) sering memberikan hasil yang kurang tepat. Oleh
sebab itu, banyak bermunculan teknik regresi modern yaitu regresi yang
digunakan pada kondisi dimana asumsi-asumsi klasik tidak terpenuhi.
Beberapa asumsi regresi yang harus dipenuhi ialah :
1. E i 0, i 1, 2,, n
2. Var i 2 , i 1, 2,, n
3. Cov i , j 0, i j
4. Tidak terjadi multikolinearitas.
Penaksiran koefisien regresi menggunakan metode kuadrat terkecil
terkadang tidak bisa dilakukan karena salah satu asumsi regresi di atas tidak
terpenuhi, yaitu multikolinearitas. Multikolinearitas terjadi jika ada hubungan
linear antar beberapa atau bahkan semua variabel independen. Multikolinearitas
dianggap sebagai suatu kelemahan (black mark) dalam analisi regresi karena
menyebabkan penduga dari parameter tidak bersifat BLUE (Best Linear Unbiased
Estimator). Oleh karena itu masalah multikolinearitas harus diatasi. Penanganan
masalah multikolinearitas ini antara lain dengan analisis komponen utama,

mengeluarkan variabel X dan dengan regresi ridge. Dalam analisis regresi ridge
ini, penduga atau estimator yang diperoleh merupakan penduga yang bias. Untuk
mendapatkan estimasi model pada analisis regresi ridge dapat ditempuh dengan
beberapa metode, salah satunya menggunakan Generalized Ridge Regression
yang akan dibahas dalam tugas akhir ini.

1.2.

Pembatasan Masalah
Dalam penelitian ini, batasan masalah sangat diperlukan untuk menjamin

keabsahan dalam kesimpulan yang diperoleh. Berdasarkan latar belakang masalah


dan kajian-kajian pendukung lain, penulis dapat memberikan rumusan dan batasan
masalah sehubungan dengan kompleksnya masalah yang akan muncul dalam
pembahasan. Dalam skripsi ini akan dibahas lebih lanjut tentang cara penanganan
penyimpanagan asumsi klasik masalah multikolinearitas. Salah satunya dengan
menggunakan analisis regresi ridge yang memusatkan metode Generalized Ridge
Regression dengan menganggap asumsi klasik yang lain terpenuhi.

1.3.

Tujuan Penulisan
Tujuan yang ingin dicapai dari penulisan tugas akhir ini adalah :

1. Mengenal penanganan untuk masalah multikolinearitas, salah satunya


yaitu dengan menggunakan regresi ridge.
2. Mempelajari metode Generalized Ridge Regression untuk mengatasi
masalah multikolinearitas.

1.4.

Manfaat Penulisan
Manfaat dari penelitian ini adalah :

1. Menambah khazanah keilmuan statistika terutama dalam analisis data


dengan menggunakan metode regresi ridge tergeneralisasi.
2. Memperoleh model persamaan yang menunjukkan adanya hubungan
antara variabel dependen dengan variabel independen yang memenuhi
salah satu asumsi klasik regresi yaitu no multikolinearitas.

1.5.

Tinjauan Pustaka
Penulisan penelitian ini berangkat dari beberapa penelitian dengan tema

serupa yang telah dilakukan. Penelitian tersebut salah satunya adalah


Perbandingan Beberapa Metode untuk Menentukan Nilai k pada Regresi Ridge
(Tarigan, 2010) yang membandingkan beberapa metode untuk memilih parameter
ridge atau bias konstan. Metode-metode tersebut antara lain metode Hoerl,
Kennard dan Baldwin, metode McDonald dan Galarneau, Mallows, serta Lawless
dan Wang. Dalam tesisnya, Anggaraati (2012) menambahkan metode lain yang
diperkenalkan oleh Dorugade dan Kashid. Metode-metode tersebut masih seputar
analisis Ordinary Ridge Regression, yang artinya nilai k yang ditambahkan ke
dalam matriks korelasi X ' X adalah sama.
M. El-Dereny dan N.I. Rashwan dalam jurnalnya Solving Multicolinearity
Problem Using Ridge Regression Models (2011) menjelaskan beberapa jenis
metode yang berbeda dari regresi ridge, antara lain dengan Generalized Ridge
Regression (GRR), Ordinary Ridge regression (ORR), dan Directed Ridge
Regression (DRR). Studi yang dilakukan menunjukkan bahwa estimator dari
regresi ridge lebih baik dibanding estimator OLS saat ditemukannya kasus
multikolinearitas.
Pada tugas akhir ini, penulis mengangkat tema Generalized Ridge
Regression yaitu metode pemilihan nilai konstanta bias k yang nantinya
ditambahkan

ke

dalam

matriks

korelasi

X 'X

sehingga

permasalahan

multikolinearitas terselesaikan. Nilai k yang ditambahkan dengan metode ini


adalah berbeda.
1.6.

Metode Penulisan
Metode penulisan dalam pengerjaan penelitian ini adalah berdasarkan

studi literatur yang didapat dari buku-buku dan jurnal-jurnal yang berhubungan
dengan tema penelitian. Selain itu terdapat bahan pendukung yaitu dari situs-situs
internet. Pengerjaan penulisan penelitian ini juga ditunjang dengan beberapa
perangkat lunak diantaranya software R, SAS, SPSS dan Microsoft Excel.

1.7.

Sistematika Penulisan
Penulisan penelitian ini dibagi menjadi lima bab, yaitu:

BAB I

PENDAHULUAN
Bab ini berisikan latar belakang dan permasalahan, pembatasan
masalah, tujuan penelitian, manfaat penelitian, tinjauan pustaka,
metode penulisan, dan sistematika penulisan.

BAB II

DASAR TEORI
Bab ini membahas beberapa teori yang berkaitan dengan
pembahasan

pokok

permasalahan

seperti

variabel

random,

ekspektasi, variansi, kovariansi, korelasi, matriks, transpose


matriks, matriks invers, matriks identitas, nilai eigen dan vektor
eigen, regresi ridge, regresi linear, estimasi kuadrat terkecil,
multikolinearitas.
BAB III

PEMBAHASAN
Bab ini berisi konsep tentang metode Generalized Ridge
Regression sebagai salah satu metode dalam regresi Ridge yang
dapat digunakan dalam mengatasi permasalahan multikolinearitas.

BAB IV

STUDI KASUS
Bab ini berisi tentang aplikasi metode Generalized Ridge
Regression dalam mengestimasi koefisien regresi yang bias pada
data.

BAB V

PENUTUP
Bab ini berisi kesimpulan yang diperoleh dari pembahasan pada
bab sebelumnya dan saran atas kekurangan yang muncul dari hasil
penelitian yang dilakukan.