Anda di halaman 1dari 5

PERBANDINGAN PEMBOBOT TUKEY BI SQUARE

DAN PEMBOBOT FAI R DALAM REGRESI ROBUST-M


(Studi Kasus Angka Buta Huruf di Jawa Timur Tahun 2011)
Anggono Harman
Jurusan Matematika F.MIPA Universitas Brawijaya
Email : anggonoharman@gmail.com
Abstrak. Analisis Regresi adalah analisis statistika yang bertujuan untuk membuat model dan menyelidiki ketergantungan
antara peubah respons dan peubah prediktor. Pendugaan parameter yang sering digunakan adalah MKT dengan syarat asumsi
klasik harus terpenuhi. Asumsi kenormalan seringkali tidak terpenuhi karena keberadaan pencilan yang memberikan
pengaruh besar terhadap penduga parameter model. Pencilan berpengaruh dapat memberikan informasi yang tidak diberikan
oleh pengamatan lain dan dapat mempengaruhi hasil analisis regresi. Jika terdapat pencilan maka digunakan Regresi Robust.
Salah satu metode regresi Robust adalah Robust-M. Pada Robust-M dapat digunakan beberapa fungsi pembobot. Tujuan
penelitian ini adalah menentukan daerah di Jawa Timur yang merupakan pencilan berpengaruh pada kasus Angka Buta Huruf
2011 dan membandingkan pembobot Tukey Bisquare dan pembobot Fair dalam regresi Robust-M pada kasus ABH.
Penelitian ini menunjukkan bahwa daerah yang merupakan pencilan berpengaruh adalah Kabupaten Situbondo, Tuban,
Sampang dan Sumenep. Berdasarkan indikator KTS yang lebih kecil, pembobot yang lebih baik untuk kasus ABH di Jawa
timur 2011 adalah pembobot Tukey Bisquare.
Kata kunci : Pencilan, robust-M, pembobot, tukey bisquare, fair.
1. PENDAHULUAN
Analisis Regresi adalah sebuah analisis statistika yang bertujuan untuk membuat model dan
menyelidiki ketergantungan antara peubah respons dan peubah prediktor. Jika terdapat beberapa
peubah prediktor maka disebut dengan Regresi Linier Berganda. Salah satu metode pendugaan
parameter model regresi linier adalah Metode Kuadrat Terkecil (MKT). Pendugaan parameter model
regresi dengan MKT harus memenuhi beberapa asumsi, di antaranya adalah sisaan satu dengan yang
lain saling bebas dan menyebar normal dengan nilai tengah nol dan ragam
2
yang dapat diringkas
menjadi
i
~NID (0,
2
) (Draper dan Smith, 1992). Selain itu pada regresi linier berganda terdapat
asumsi bahwa antar peubah prediktor tidak saling berkorelasi atau disebut dengan asumsi non
multikolinieritas. Namun benar kenyataan tidak jarang ditemui hal-hal yang menyebabkan asumsi
tidak terpenuhi. Asumsi kenormalan seringkali tidak terpenuhi karena keberadaan pencilan yang
memberikan pengaruh besar terhadap penduga parameter model (Montgomery dan Peck, 1992). Jika
terdapat pencilan maka metode pendugaan parameter yang digunakan adalah Regresi Robust.
Permasalahan di Indonesia adalah tingginya Angka Buta Huruf (ABH). Data dari Human
Development Index (HDI) menjelaskan angka buta huruf penduduk Indonesia sebesar 12.1%.
Meskipun Provinsi Jawa Timur tidak berada pada tiga urutan tertinggi, tetapi masih terdapat daerah di
Jawa Timur yang mempunyai angka buta huruf di atas 12.1 %. Daerah-daerah tersebut dapat dikatakan
sebagai pencilan berpengaruh. Oleh karena itu penulis ingin meneliti tentang perbandingan model
yang terbentuk pada regresi robust penduga-M dengan fungsi pembobot Tukey Bisquare dan
pembobot Fair pada kasus ABH di Provinsi Jawa Timur Tahun 2011, di mana masing-masing
pembobot memliki tunning constant (c) yang berguna untuk mengatur bobot yang diberikan pada
pencilan. Untuk pembobot Tukey Bisquare memiliki nilai c = 4.685 dan nilai tunning constant untuk
pembobot Fair akan efektif memberikan perlindungan terhadap pencilan dengan c = 4.
2. TINJAUAN TEORI
Pencilan adalah sisaan yang memiliki nilai mutlak yang jauh lebih besar daripada sisaan-sisaan
lain dan bisa jadi terletak tiga atau empat simpangan baku atau lebih jauh dari lagi dari rata-rata
sisaan.Menurut Drapper and Smith (1992), amatan berpengaruh adalah amatan yang mempunyai
pengaruh besar dalam pendugaan koefisien regresi. Amatan berpengaruh akan memberikan nilai
sisaan yang besar atau mungkin juga tidak, tergantung dari model yang digunakan. Pengamatan
berpengaruh dapat ditelusuri dengan membandingkan hasil analisis pada data lengkap dengan analisis
yang salah satu pengamatan dihapus. Jika penghapusan pengamatan menyebabkan perubahan yang
besar pada hasil analisis maka pengamatan tersebut dikatan berpengaruh. Terdapat dua metode untuk
mendeteksi pengamatan berpengaruh antara lain :
a) Menurut Montgomery dan Peck (1992), jarak Cook merupakan jarak antara penduga
parameter untuk n pengamatan dan penduga parameter tanpa pengamatan ke-i menggunakan
MKT. Ukuran jarak Cook didefinisikan sebagai :

=
(
()
)


(
()
)
()

()
(1)

b) DFITS merupakan pengaruh pengamatan atau amatan ke-i pada penduga Y yang didefinisikan
sebagai :

= (

(

)

(2)
Perhitungan penduga M menggunakan IRLS (Iteratively Reweighted Least Square) dengan
langkah sebagai berikut :
1. Menghitung penduga awal

()
dari model regresi dengan Metode Kuadrat Terkecil (MKT)
dan menghitung sisaan (

).
2. Dari sisaan awal, dihitung robust

dan pembobot awal


3. Mendapatkan penduga baru dengan IRLS :

()
(


4. Menjadikan penduga parameter pada langkah ke-3 sebagai

()
pada langkah ke-1 dan
mendapatkan sisaan baru, nilai s baru dan pembobot baru.
5. Kembali ke langkah 3.
Metode ini dilakukan berulang sampai tercapai kekonvergenan dengan kriteria selisih jumlah
mutlak sisaan pada iterasi akhir dengan jumlah mutlak sisaan iterasi sebelumnya kurang dari 0.01, atau
|

- |

< 0.01, di mana z adalah indeks iterasi.


Pembobot Tukey Bisquare disarankan oleh Tukey. Fungsi Obyektif Tukey Bisquare adalah :
(

) = {

{ [ (

} |

|

dengan fungsi pengaruh,
(

)
((

))

= {

[ (

|
|

|


dan fungsi pembobot,
w (

)
(

= {
[ (

|
|

|

Kutner (2004) menyatakan bahwa pemilihan c untuk pembobot Tukey Bisquare sebesar 4.685 efektif
dalam pendugaan parameter regresi dan memberikan perlindungan yang baik terhadap pencilan.
Pembobot Fair mempunyai fungsi obyektif sebagai berikut :
(

) = c[|

|/c log (1+|

|/c)]
dengan fungsi pengaruh,
(

)

(

)
((

))

(
|

)

dan fungsi pembobot
w (

)
(

(
|

)

penduga M-Fair akan efektif digunakan ketika c = 4
Angka Buta Huruf didefinisikan sebagai proporsi penduduk usia>15 tahun yang tidak
mempunyai kemampuan membaca, menulis huruf latin dan huruf lainnya terhadap penduduk usia >15
tahun seluruhnya.


Menurut Hamid (2009) faktor-faktor penyabab buta huruf disuatu daerah antara lain: tingginya
angka putus Sekolah Dasar (SD), beratnya kondisi geografis,munculnya penyandang buta aksara baru,
pengaruh faktor sosiologis dan sosial masyarakat, kembalinya seseorang menjadi buta aksaraakibat
putus sekolah.
3. HASIL DAN PEMBAHASAN
Data yang digunakan adalah data sekunder Laporan Eksekutif Pendidikan Jawa Timur 2011 dari
Badan Pusat Statistik, dengan peubah respons Angka Buta Huruf (Y). Peubah prediktor antara lain :
Persentase penduduk usia > 15 tahun yang tidak mengenyam pendidikan (X1), Persentase penduduk
usia >15 tahun yang tidak tamat SD (X2) dan Angka Partisipasi Murni sekolah dasar (X3).
Pada kasus Angka Buta Huruf di Jawa Timur tahun 2011, terdapat beberapa daerah yang
merupakan pencilan yang merupakan pencilan berpengaruh. Untuk mengetahui pencilan yang
merupakan amatan berpengaruh terhadap koefisien regresi dapat dideteksi dengan menggunakan Uji
Cook Distance sesuai dengan persamaan (1), sedangkan untuk mengetahui pencilan yang merupakan
amatan berpengaruh terhadap nilai duga dari peubah respons dapat dideteksi dengan menggunakan Uji
Difference In Fits Statistics (DFITS) seperti persamaan (2). Pada kasus ABH di Jawa Timur tahun
2011,tidak terdapat amatan yang berpengaruh terhadap koefisien regresi (0%), sedangkan terdapat
10.52 % amatan yang berpengaruh terhadap nilai duga dari peubah respon (nilai duga ABH) atau
dapat dikatakan terdapat 4 daerah yang merupakan pencilan berpengaruh terhadap nilai duga dari
ABH di Jawa Timur tahun 2011. Daerah tersebut antara lain : Kabupaten Situbondo, Kabupaten
Tuban, Kabupaten Sampang dan Kabupaten Sumenep.
Tabel 1. Hasil pendugaan koefisien parameter regresi
Metode


Robust M-Tukey
Bisquare
-53.9 0.778 0.257 0.535
Robust M-Fair -55.4 0.721 0.266 0.544
Pendugaan parameter dilakukan dengan menggunakan metode Robust-M. Pembobot yang
digunakan adalah pembobot Tukey Bisquare dan Fair. Penduga model yang telah konvergen untuk
M-Tukey Bisquare pada iterasi ke-13 sedangkan pada M-Fair telah konvergen pada iterasi ke-12.
Tabel 2. Pengujian parameter
Metode
Uji parsial Uji simultan
Statistik
Uji | t |

Nilai-p
Statistik
Uji F

Nilai-p
Robust M-Tukey
Bisquare


3.49
2.348
0.001
617.17 2.90 0.000


30.85 0.000


9.72 0.000


3.43 0.002
Robust M-Fair


2.66
2.345
0.012
373.83 2.87 0.000


23.20 0.000


7.34 0.000


2.63 0.013
Pada Tabel 1. disajikan penduga parameter dari setiap metode. Semua prediktor berbanding
lurus dengan respons. Tabel 2. menunjukkan secara parsial setiap prediktor memberikan pengaruh
nyata terhadap respons. Sedangkan secara simultan semua prediktor memberikan pengaruh nyata
terhadap respons, atau dapat dikatakan semua prediktor menentukan tinggi rendahnya ABH.
Tabel 3. Perbandingan nilai KTS
Metode KTS
Robust-M Tukey Bisquare 0.52
Robust-M Fair 0.91
Tabel 3. menunjukkan bahwa nilai KTS dari setiap metode. Pada Robust-M dengan pembobot
Tukey Bisquare memiliki nilai KTS yang lebih kecil daripada Robust-M dengan pembobot Fair. Jadi
model yang lebih baik untuk kasus Angka Buta Huruf pada penelitian ini adalah model dengan Robust
pembobot Tukey Bisquare.
4. KESIMPULAN
Berdasarkan penelitian yang telah dilakukan dapat disimpulkan bahwa daerah yang merupakan
pencilan berpengaruh adalah Kabupaten Situbondo, Kabupaten Tuban, Kabupaten Sampang dan
Kabupaten Sumenep. Berdasarkan nilai KTS model yang lebih baik digunakan untuk kasus Angka
Buta Huruf Jawa Timur tahun 2011 adalah Regresi Robust-M Tukey Bisquare tetapi memerlukan
iterasi yang lebih banyak untuk mencapai kekonvergenan. Model yang didapatkan dengan
menggunakan Regresi Robust-M Tukey Bisquare adalah

= -1.51 + 0.900 X1 + 0.153 X2+ 0.0853 X3


semakin betambah persentase penduduk usia > 15 tahun yang tidak mengenyam bangku pendidikan
maka maka ABH akan meningkat, semakin bertambah persentase penduduk usia >15 tahun yang tidak
tamat sekolah dasar maka ABH akan meningkat dan semakin bertambahnya persentase angka
partisipasi murni sekolah dasar maka ABH akan meningkat.
DAFTAR PUSTAKA
Draper, N.R. dan Smith, H., (1992), Analisis Regresi Terapan, Edisi Kedua, Terjemahan: Ir.
BambangSumantri, PT. Gramedia Pustaka Utama, Jakarta.
Hamid, M.,(2009), Pendidikan Masyarakat untuk Pemberdayaan, Direktorat Pendidikan Masyarakat,
Jakarta.
Kutner, M.H., Nachtsheim C.J dan Neter. J, (2004), Applied Linear Regression Models, Fourth Ed.
McGraw Hill, New York.
Montgomery, D.C. dan Peck, E.A., (1992), Introduction to Linear Regression Analysis, Second
Edition, John Willey and Sons, Inc, New York.