Anda di halaman 1dari 6

BAB I

PENDAHULUAN

A. Latar Belakang

Analisis regresi linier merupakan teknik dalam statistika yang digunakan

untuk membentuk model hubungan antara variabel dependen dengan satu atau

lebih variabel independen. Dalam analisis regresi dibedakan dua jenis variabel

yaitu variabel dependen dan variabel independen. Regresi linier yang terdiri dari

satu variabel dependen dan satu variabel independen disebut regresi linier

sederhana, sedangkan regresi linier yang terdiri dari satu variabel dependen dan

beberapa variabel independen disebut regresi linier berganda. Hubungan antar

variabel-variabel tersebut dapat dinyatakan dalam model matematika. Bentuk

umum model regresi linier

Keterangan: = variabel dependen

= koefisien regresi

= variabel independen

= error

Salah satu tujuan dalam analisis regresi adalah untuk mengestimasi nilai

rata-rata variabel dependen berdasarkan nilai variabel independen yang diketahui.

Hasil dari analisis regresi berupa parameter untuk masing-masing variabel

independen. Pada umumnya digunakan metode kuadrat terkecil (MKT) untuk

mengestimasi koefisien regresi. Metode kuadrat terkecil adalah suatu metode yang

digunakan untuk mengestimasi koefisien parameter regresi dengan cara

1
meminimumkan jumlah kuadrat residual. Penggunaan metode ini memerlukan

beberapa asumsi klasik yang harus dipenuhi yaitu normalitas, tidak terdapat

heteroskedastisitas, tidak terdapat autokorelasi, tidak terdapat multikolinieritas,

dan linearitas. Jika asumsi-asumsi klasik dalam metode kuadrat terkecil terpenuhi

maka penduga parameter yang diperoleh bersifat Best Linier Unbiased Estimation

(BLUE).

Pada kenyataannya, asumsi ini tidak selalu terpenuhi sehingga penggunaan

metode kuadrat terkecil kurang tepat. Salah satu penyebab tidak terpenuhinya

asumsi klasik adalah adanya pencilan (outlier). Pencilan ini dapat mengganggu

dalam pemenuhan asumsi, yaitu pada asumsi autokorelasi. Akan tetapi, data

pencilan tersebut tidak boleh dibuang begitu saja karena akan mempengaruhi

model prediksi serta menghasilkan estimasi parameter yang kurang tepat.

Permasalahan yang muncul akibat adanya pencilan antara lain:

1. Sisaan yang besar dari model yan terbentuk

2. Variansi dari data akan menjadi lebih besar

3. Estimasi interval akan memiliki rentang yag lebih besar

Keberadaan pencilan pada suatu data dapat mengganggu proses analisis

data, sehingga pendeteksian pencilan merupakan hal yang sangat penting untuk

dilakukan. Rousseeuw dan Leroy (1987) menyatakan terdapat dua cara untuk

mengatasi masalah outlier:

1. Mengeluarkan outlier yang telah diidentifikasi, kemudian tetap menggunakan

metode kuadrat terkecil.

2
2. Tetap menggunakan seluruh data, tetapi dengan memberikan bobot yang

rendah untuk observasi yang terindikasi sebagai outlier, metode ini dikenal

dengan nama metode regresi robust.

Regresi robust adalah metode yang tepat untuk menganalisis data yang

mengandung pencilan tanpa harus membuangnya agar tidak mempengaruhi model

prediksi serta menghindari estimasi parameter yang kurang tepat. Untuk

menyelesaikan masalah tersebut diperlukan adanya metode yang bersifat robust

dimana nilai estimasinya tidak boleh dipengaruhi perubahan kecil dalam data.

Untuk menaksir parameter regresi robust dapat digunakan beberapa

metode antar lain: S-estimator, M-estimator, MM-estimator, Least Median Square

(LMS)-estimator dan East Trimmed Square (LTS)-estimator (Chen, 2002).

Dari kelima metode regresi robust tersebut, dilihat dari nilai

breakdownpoint, estimasi-S merupakan estimasi robust yang mempunyai nilai

breakdownpoint paling tinggi hingga 50%, yang artinya estimasi-S dapat

mengatasi setengah dari pencilan dan memberikan pengaruh yang baik bagi

pengamatan lainnya. Dalam hal ini semakin tinggi nilai presentase

breakdownpoint pada suatu estimator, maka estimator tersebut semakin robust,

karena semakin besar nilai presentase breakdownpoint, maka semakin kuat juga

suatu metode estimasi tersebut dalam menangani banyaknya outlier. Menurut

Huber (1981: 13), breakdownpoint adalah fraksi terkecil atau persentase dari

outlier yang dapat menyebabkan nilai estimator menjadi berubah-ubah.

Breakdownpoint merupakan ukuran proporsi dari outlier yang dapat ditangani

sebelum observasi tersebut memepengaruhi model prediksi. Breakdownpoint

3
digunakan untuk menjelaskan ukuran kerobustan dari tekhnik robust.

Kemungkinan tertinggi breakdownpoint untuk sebuah estimator adalah 50%. Oleh

karena itu, penulis memilih untuk menggunakan estimasi-S dalam penelitian ini.

Indeks Pembangunan Manusia (IPM) merupakan salah satu indeks yang

digunakan untuk menilai keberhasilan pembangunan suatu daerah. IPM

mengandung tiga komponen yaitu kesehatan, pendidikan dan daya beli penduduk.

Ketiga komponen tersebut diwakili oleh data harapan lama sekolah, angka

harapan hidup, pengeluaran per kapita disesuaikan dan rata-rata lama sekolah.

Ada beberapa metode regresi robust yang dapat digunakan untuk

memodelkan prediksi Indeks Pembangunan Manusia yang mengandung pencilan

antara lain: S-estimator, M-estimator, MM-estimator, Least Median Square

(LMS)-estimator dan East Trimmed Square (LTS)-estimator (Chen, 2002). Dalam

penelitian ini penulis membahas menggunakan metode estimasi-S karena metode

ini memiliki breakdown point yang tinggi hingga 50% artinya estimasi-S dapat

mengatasi setengah dari pencilan dan memberikan pengaruh yang baik bagi

pengamatan lainnya.

Semua metode tersebut secara eksplisit dan implisit bergantung pada

sejumlah asumsi. Asumsi ini bertujuan untuk menentukan apa yang menjadi

dugaan tentang analisis data atau masalah pemodelan statistik yang sedang

dihadapi. Asumsi yang sering digunakan adalah data berasal dari populasi yang

berdistribusi normal. Akan tetapi meski data berasal dari populasi yang

berdistribusi normal, sangat rawan terjadinya pencilan (outlier) pada data yang

telah diperoleh. Pencilan dapat memiliki pengaruh besar pada metode klasik

4
statistik yang optimal dengan asumsi normalitas dan linearitas, sehingga

digunakan metode alternatif untuk memperkecil nilai error karena pengaruh

keberadaan pencilan tersebut tanpa harus menghilangkannya, yaitu dengan regresi

robust.

Metode dalam regresi robust memiliki metode estimasi ragam dengan tes

terkait (uji asumsi dan uji outlier). Metode ini dapat digunakan pada sebagian

besar data, termasuk data yang tidak mengandung pencilan. Akan tetapi metode

ini memberikan model regresi dengan efisiensi atau nilai error yang sama dengan

MKT apabila data yang diolah tidak mengandung pencilan. Pada penelitian ini

akan dibahas regresi robust dengan estimasi-S untuk memodelkan data Indeks

Pembangunan Manusia di Indonesia.

B. Rumusan Masalah

Berdasarkan latar belakang di atas maka rumusan masalah yang akan

dibahas adalah sebagai berikut:

1. Bagaimana model regresi robust dengan estimasi-S?

2. Bagaimana model regresi robust degan estimasi-S untuk memprediksi Indeks

Pembangunan Manusia di Indonesia?

C. Tujuan Penelitian

Tujuan dalam penulisan penelitian ini adalah:

1. Menjelaskan alur mendapatkan model regresi robust dengan estimasi-S

2. Menggunakan model regresi robust untuk memprediksi Indeks Pembangunan

Manusia di Indonesia menggunakan estimasi-S.

5
D. Manfaat Penelitian

Manfaat yang didapat dari penelitian ini adalah:

1. Bagi Penulis

Menambah pengetahuan tentang metode regresi robust, khususnya regresi

robust estimasi-S untuk mengatasi masalah pencilan (outlier).

2. Bagi Mahasiswa

Sebagai salah satu bahan tinjauan pustaka dalam mempelajari regresi robust

untuk mengatasi masalah outlier yang berguna bagi setiap pihak yang

membutuhkan, khususnya bagi mahasiswa Program Studi Matematika.

3. Bagi Perpustakaan Universitas Negeri Yogyakarta

Penulisan tugas akhir ini juga bermanfaat dalam menambah koleksi bahan

pustaka yang bermanfaat bagi Univrsitas Negeri Yoyakarta pada umumnya

dan mahasiswa Fakultas Matematika dan Ilmu Pengetahuan Alam pada

khususnya.

Anda mungkin juga menyukai