Anda di halaman 1dari 24

MODEL REGRESI ROBUST MENGGUNAKAN ESTIMASI GS DENGAN

PEMBOBOT TUKEY’S BIWEIGHT

(Studi Kasus Diare Balita di Indonesia)

PROPOSAL TUGAS AKHIR

MADE TIARA SASKIA PUSPITASARI

M0716041

STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS SEBELAS MARET

2020
PROPOSAL TUGAS AKHIR
MODEL REGRESI ROBUST MENGGUNAKAN ESTIMASI GS DENGAN
PEMBOBOT TUKEY’S BIWEIGHT

(Studi Kasus Bayi Gizi Buruk di Jawa Tengah)

diajukan oleh
MADE TIARA SASKIA PUSPITASARI (M0716041)

telah dipertahankan di depan Dewan Penguji


pada hari Jum’at, 14 Juni 2019
dan dinyatakan telah memenuhi syarat.

Anggota Tim Penguji Tanda Tangan


1. Dr. Hasih Pratiwi, S.Si, M.Si 1. ...........................................
NIP. 19700228 199512 2 001
2. Dra. Yuliana Susanti, M.Si. 2. ...........................................
NIP. 19611219 198703 2 001
3. Dra. RR Sri Sulistijowati H., M.Si. 3. ...........................................
NIP. 19700228 199512 2 001

Surakarta, 14 Juni 2019


Ketua Komisi TA,

.................................
NIP. 00000000000000
1. LATAR BELAKANG

Gizi adalah salah satu faktor terpenting yang kelangsungan hidup individu
atau masyarakat oleh karena itu merupakan isu fundamental dalam kesehatan
masyarakat (Emerson, 2005;Mendez, 2005). Keadaan gizi yang baik merupakan
syarat utama kesehatan dan berdampak terhadap kualitas sumber daya manusia.
Gizi buruk menurut World Health Organization (WHO) ditentukan berdasarkan
indikator antropometri berat badan menurut tinggi atau panjang badan (BB/TB)
dengan z-skor BB/TB <-3 SD dan ada atau tidaknya odema.

Menurut Krisnansari (2010) gizi buruk merupakan status kondisi seseorang


yang kekurangan nutrisi, atau nutrisinya dibawah rata-rata. Gizi kurang adalah
kekurangan bahan-bahan nutrisi seperti protein, karbohidrat, lemak, dan vitamin
yang dibutuhkan oleh tubuh.

Faktor penyebab gizi buruk dapat dikelompokkan menjadi 2 yaitu penyebab


langsung dan penyebab tidak langsung. Penyebab langsung gizi buruk meliputi
kurangnya pemberian ASI eksklusif, cakupan pemberian vitamin A dan usia
harapan hidup saat lahir, sedangkan penyebab tidak langsung gizi buruk yaitu
jumlah rumah sehat, akses sanitasi yang layak, dan pendidikan yang rendah.

Badan Pusat Statistik (BPS) mencatat bahwa pada tahun 2017 terdapat
sebanyak 1.352 kasus bayi gizi buruk di Jawa Tengah. Dalam data kasus gizi buruk
di Jawa Tengah pada tahun 2017 yang diambil dari BPS terdapat pencilan. Menurut
Makkulau et al (2010) data pencilan (outlier) adalah data yang berada jauh (ekstrim)
dari data lainnya. Data pencilan yang ada tidak boleh dibuang begitu saja karena
akan mempengaruhi model regresi serta menghasilkan sisaan yang besar. Oleh
karena itu, dibutuhkan suatu metode untuk menangani data yang mengandung
pencilan yaitu regresi robust dimana nilai estimasinya tidak banyak dipengaruhi
oleh perubahan kecil dalam data.

Menurut Chen (2002) regresi robust merupakan regresi yang digunakan


ketika distribusi dari residual tidak normal dan atau mengandung beberapa pencilan
yang berpengaruh pada model. Regresi robust pertama kali dikenalkan oleh
Andrews pada tahun 1972. Regresi robust adalah suatu metode regresi yang
digunakan ketika distribusi dari sisaan tidak normal atau dengan kata lain
ditemukannya beberapa data pencilan yang berpengaruh pada model.

Menurut Chen (2002) metode estimasi dalam regresi robust yaitu estimasi
M (Maximum Likelihood type), LTS (Least Trimmed Square), estimasi MM
(Method of Moment), dan estimasi S (Scale). Terdapat dua estimasi robust selain
yang disebutkan di atas, yaitu estimasi 𝜏 dan estimasi-GS (Generalized S-
Estimation). Kedua estimasi ini memiliki kemiripan yaitu mempunyai breakdown
point yang tinggi karena berdasarkan skala.

Estimasi-GS diperkenalkan oleh Croux et al. (1994), yang dapat dipandang


sebagai lanjutan dari estimasi-S. Estimasi-GS merupakan estimasi yang
berdasarkan skala. Skala yang digunakan adalah standar deviasi sisaan
berpasangan. Estimasi-GS adalah solusi minimisasi estimasi-M dengan sisaan skala
berpasangan sedangkan estimasi-S adalah solusi minimisasi estimasi-M sisaan
skala.

Berdasarkan penjelasan diatas, peneliti ingin mengetahui persamaan regresi


untuk estimasi kasus diare balita di Indonesia tahun 2018.

2. RUMUSAN MASALAH

Berdasarkan latar belakang masalah, maka rumusan masalahnya yaitu


bagaimana persamaan regresi untuk estimasi diare balita di Indonesia tahun 2018
menggunakan metode regresi robust estimasi-GS?

3. TUJUAN PENELITIAN

Berdasarkan rumusan masalah, tujuan penelitian ini adalah menentukan


persamaan regresi untuk estimasi diare balita di Indonesia tahun 2018
menggunakan metode regresi robust estimasi-GS

4. MANFAAT PENELITIAN

Diharapkan dari penelitian ini dapat mengembangkan dan memanfaatkan


ilmu statistika dibidang pendidikan dan kesehatan. Pada bidang pendidikan,
penelitian ini akan bermanfaat bagi peneliti yang akan menganalisis terkait diare
balita sebagai referensi atau bahan ajar. Sedangkan pada bidang kesehatan dapat
memberikan informasi mengenai kasus diare balita kepada masyarakat maupun
tenaga kesehatan dan mencegah meningkatnya kasus diare balita dengan mencegah
terjadinya variabel yang signifikan berpengaruh.

5. TINJAUAN PUSTAKA

Penulisan proposal ini merupakan pemikiran baru dengan menggunakan


penelitian-penelitian terdahulu sebagai referensi diantaranya sebagai berikut :
5.1.Penelitian Sebelumnya
Penelitian sebelumnya dilakukan oleh Wulansari (2012) mengenai
penjualan tenaga listrik dengan estimasi-GS diperoleh hasil bahwa analisis
regresi robust dengan estimasi-GS lebih baik dibandingkan dengan MKT
(Metode Kuadrat Terkecil). Menurut Setiarini (2017) dalam penelitian
mengenai indeks pembangunan manusia dengan metode estimasi-S dengan
pembobot Welsch dan Tukey Bisquare diperoleh hasil bahwa regresi robust
estimasi-S dengan pembobot Welsch memberikan hasil lebih efektif
daripada pembobot Tukey Bisquare.
Menurut Saputra (2012) mengenai gizi buruk dan gizi kurang
menggunakan analisis regresi logistik diperoleh hasil bahwa faktor
kemiskinan dan rendahnya tingkat pendidikan orang tua merupakan faktor
utama dalam risiko balita menderita gizi buruk dan gizi kurang. Menurut
Rahim (2014) mengenai resiko underweight balita menggunakan analisis
univariat dan bivariat diperoleh hasil bahwa tingkat konsumsi energi dan
protein merupakan faktor langsung yang mempengaruhi status gizi balita.
Menurut Alamsyah (2015) mengenai faktor resiko gizi kurang dan gizi
buruk pada balita menggunakan analisis bivariat diperoleh hasil bahwa
probabilitas risiko balita untuk menderita gizi kurang dan gizi buruk akan
besar apabila terhadap makanan yang buruk dan sanitasi lingkungan yang
buruk.

5.2.Analisis Regresi
Menurut Sembiring (1995: 32) model regresi adalah model yang
memberikan gambaran mengenai hubungan antara variabel bebas dengan
variabel terikat atau tak bebas. Analisis regresi merupakan salah satu
metode statistika yang digunakan untuk membangun model hubungan
antara dua variabel atau lebih. Variabel yang nilainya di tentukan oleh
variabel lain disebut variabel tak bebas (dependent variable), sementara
variabel yang nilainya dapat ditentukan atau dapat diamati disebut variabel
bebas (independent variable).
Menurut Draper & Smith (1998: 22) bentuk umum dari regresi linier
sederhana adalah sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 , 𝜀 ~ 𝑁(0, 𝜎 2 ) (5.1)
dengan,
Yi : nilai variabel dependen pada observasi ke-i
Xi : nilai variabel independen pada observasi ke-i
𝛽0 , 𝛽1 : parameter koefisien regresi
𝜀𝑖 : error yang bersifat random
Apabila variabel independen sebanyak p, maka persamaan dapat
ditulis sebagai berikut :
𝑌1 = 𝛽0 + 𝛽1 𝑥11 + 𝛽2 𝑥12 + 𝛽3 𝑥13 + ⋯ + 𝛽𝑝 𝑥1𝑝 + 𝜀1
𝑌2 = 𝛽0 + 𝛽1 𝑥21 + 𝛽2 𝑥22 + 𝛽3 𝑥23 + ⋯ + 𝛽𝑝 𝑥2𝑝 + 𝜀2
𝑌3 = 𝛽0 + 𝛽1 𝑥31 + 𝛽2 𝑥32 + 𝛽3 𝑥33 + ⋯ + 𝛽𝑝 𝑥3𝑝 + 𝜀3 (5.2)
…………………………………………………………………
𝑌𝑛 = 𝛽0 + 𝛽1 𝑥𝑛1 + 𝛽2 𝑥𝑛2 + 𝛽3 𝑥𝑛3 + ⋯ + 𝛽𝑝 𝑥𝑛𝑝 + 𝜀𝑛

Atau dapat dituliskan dalam bentuk matriks

𝑌 = 𝑋𝛽 + 𝜀, 𝜀 ~ 𝑁(0, 𝜎 2 𝐼) (5.3)

dengan

𝑌1
𝑌2 𝛽0
𝑌3 1 𝑥11 𝑥12 𝑥13 ⋯ 𝑥1𝑝 𝛽1
𝑌 = . ,𝑋 = ( ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ ) , 𝛽 = 𝛽2 ,
. 1 𝑥𝑛1 𝑥𝑛2 𝑥𝑛3 ⋯ 𝑥𝑛𝑝 ⋮
. (𝛽𝑝 )
(𝑌𝑛 )
𝜀1
𝜀2
𝜀 = 𝜀3 (5.4)

(𝜀𝑛 )

5.3.Metode Kuadrat Terkecil


Dalam model regresi parameter dan tidak diketahui, sehingga perlu
diestimasi. Estimasi parameter yang biasa digunakan adalah metode kuadrat
terkecil yaitu dengan meminimumkan jumlah kuadrat sisaan (JKS).
𝑛

𝐽𝐾𝑆 = 𝑆(𝛽𝑗 ) = 𝑚𝑖𝑛 ∑ 𝑒𝑖 2 (5.5)


𝑖=1
𝑛

= 𝑚𝑖𝑛 ∑(𝑌𝑖 − 𝛽0 + 𝛽1 𝑋𝑖 1 + 𝛽2 𝑋𝑖 2 + ⋯ + 𝛽𝑝 𝑋𝑖 𝑝)2


𝑖=1

5.4.Uji Asumsi Analisis Regresi


Pada model regresi, perlu dilakukan uji asumsi analisis regresi untuk
mengetahui apakah model memenuhi asumsi atau tidak. Uji asumsi klasik
meliputi uji normalitas, uji heteroskedastisitas, uji multikolienaritas, dan uji
autokorelasi. Model regresi yang baik adalah model regresi yang
berdistribusi normal (Ghozali 2009 : 147).

5.4.1 Asumsi Normalitas


Analisis regresi linier mengasumsikan bahwa sisaan (𝑒𝑖 )
berdistribusi normal. Menurut Gujarati (1978) pada regresi linier klasik
diasumsikan bahwa tiap 𝑒𝑖 didistribusikan secara random dengan
𝑒𝑖 ~𝑁(0, 𝜎 2 ).
Salah satu cara untuk menguji asumsi kenormalan adalah dengan uji
Kolmogorov-Smirnov. Uji ini didasarkan pada nilai D dengan
𝐷 = max|𝐹0 (𝑋𝑖 ) − 𝑆𝑛 (𝑋𝑖 )| , 𝑖 = 1,2, … , 𝑛.
Dengan 𝐹0 (𝑋𝑖 ) adalah fungsi distribusi frekuensi kumulatifrelatif
dari distribusi teoritis dibawah 𝐻0 . 𝑆𝑛 (𝑋𝑖 ) adalah distribusi frekuensi
kumulatif pengamatan sebanyak sampel. 𝐻0 adalah sisaan berdistribusi
normal. Selanjutnya nilai D ini dibandingkan dengan nilai D kritis
dengan signifikansi 𝛼 (tabel Kolmogorov-Smirnov). Apabila nilai 𝐷 >
𝐷𝑡𝑎𝑏𝑒𝑙 atau 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 𝛼, maka asumsi kenormalan tidak dipenuhi.
Berikut ringkasannya untuk uji hipotesis dari uji normalitas :

i. 𝐻0 : Error berdistribusi normal


𝐻1 : Error tidak berdistribusi normal
ii. Taraf signifikansi 𝛼 = 0,05
iii. Daerah Kritis :𝐻0 ditolak apabila 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼 = 0,05
iv. Statistik Uji :
Uji Kolmogorov-Smirnov atau Shapiro-Wilks.
v. Kesimpulan

5.4.2 Asumsi Homoskedastisitas


Salah satu asumsi penting dalam analisis regresi adalah variasi
sisaan (𝑒𝑖 ) pada setiap variabel independen adalah homoskedastisitas.
Asumsi ini dapat ditulis sebagai berikut
𝑉𝑎𝑟(𝑒𝑖 ) = 𝜎 2 𝑖 = 1,2, … , 𝑛
Salah satu cara menguji kesamaan variansi yaitu dengan melihat
pola tebaran sisaan (ei ) terhadap nilai estimasi Y. Jika tebaran sisaan
bersifat acak (tidak membentuk pola tertentu), maka dikatakan bahwa
variansi sisaan homogen (Draper dan Smith, 1998).
Untuk lebih tepatnya, menurut Gujarati (1978) salah satu cara
untuk mendeteksi heteroskedastisitas adalah dengan pengujian korelasi
rank Spearman yang didefinisikan sebagai berikut
∑ d2i (5.6)
rs = 1 − 6 [ ]
n(n2 − 1)
Dengan di = perbedaan dalam rank yang ditempatkan pada dua
karakteristik yang berbeda dari individual atau fenomena ke-i dan n
adalah banyaknya individual yang dirank. Koefisien rank korelasi
tersebut dapat digunakan untuk mendeteksi heterokedastisitas dengan
mengasumsikan Yi = Xi + ei . Adapun tahapnnya dalah sebagai berikut
1. Mencocokkan regresi terhadap data mengenai Y dan X dan
mendapatkan sisaan 𝑒𝑖 .
2. Dengan mengabaikan tanda dari 𝑒𝑖 , yaitu dengan mengambil nilai
mutlaknya |𝑒𝑖 |, meranking baik harga mutlak |𝑒𝑖 | dan 𝑋𝑖 sesuai dengan
urutan yang meningkat atau menurun dan menghitung koefisien rank
korelasi Spearman yang telah diberikan sebelumnya.
3. Dengan mengasumsikan bahwa koefisien rank korelasi populasi 𝜌𝑠
adalah nol dan𝑛 > 8, signifikan dari 𝑟𝑠 yang disampel dapat diuji
dengan pengujian t sebagai berikut :

𝑟𝑠 √𝑛 − 2 (5.7)
𝑡=
√1 − 𝑟𝑠2

Jika nilai t yang dihitung melebihi nilai t kritis maka H0 ditolak,


artinya asumsi homoskedastitas tidak dipenuhi. Jika model regresi
meliputi lebih dari satu variabel X, 𝑟𝑠 dapat dihitung antara |𝑒𝑖 | dan
tiap-tiap variabel X secara terpisah dan dapat di uji untuk tingkat
penting secara statistik dengan pengujian t yang diberikan di atas.

5.4.3 Asumsi Nonmultikolinearitas


Menurut Montgomery dan Peck (1992), kolinearitas terjadi karena
terdapat korelasi yang cukup tinggi di antara variabel independen. VIF
(Variance Inflation Factor) merupakan salah satu cara untuk mengukur
besar kolineritas dan didefinisikan sebagai berikut
1
𝑉𝐼𝐹 = (5.8)
1 − 𝑅𝑚2
2
dengan m = 1,2,...,p dan p adalah banyaknya variabel independen 𝑅𝑚
adalah koefisien determinasi yang dihasilkan dari regresi variabel
independen 𝑋𝑚 dengan variabel independen lain 𝑋𝑗 (𝑚 ≠ 𝑗). Jika VIF
lebih dari 10, multikolinearitas memberikan pengaruh yang serius pada
pendugaan metode kuadrat kecil.
5.4.4 Asumsi Nonautokorelasi

Salah satu asumsi penting dari regresi linear adalah bawa tidak
ada autokrelasi antara serangkaian pegamatan yang diurutkan menurut
waktu. Adanya kebebasan antar sisaan dapat dideteksi secara grafis dan
empiris. Pendeteksian autokorelasi secara grafis yaitu denan melihat
pola tebaran sisaan terhadap urutan waktu. Jika tebaran sisaan terhadap
urutan waktu tidak membentuk suatu pola tertentu atau bersifat acak
maka dapat disimpulkan tidak ada autokorelasi antar sisaan (Draper dan
Smith, 1998)

Pengujian secara empiris dilakukan dengan menggunakan


statistik uji Durbin-Watson. Hipotesis yang diuji adalah:

H0: Tidak terdapat autokorelasi antar sisaan

H1: Terdapat autokorelasi antar sisaan

Adapun rumusan matematis uji Durbin-Watson adalah:

∑ni=2(ei − ei−1 )2 (5.9)


d=
∑ni=1 e2i

Kaidah keputusan dalam uji Durbin-Watson adalah:

1. Jika 𝑑 < 𝑑𝐿 atau 𝑑 > 4 − 𝑑𝐿 , maka H0 ditolak berarti bahwa


terdapat autokorelasi antar sisaan.
2. Jika 𝑑𝑈 < 𝑑 < 4 − 𝑑𝑈 , maka H0 tidak ditolak yang berarti bahwa
asumsi non autokorelasi terpenuhi.
3. Jika 𝑑𝐿 ≤ 𝑑 ≤ 𝑑𝑈 atau 4 − 𝑑𝑈 ≤ 𝑑 ≤ 4 − 𝑑𝐿 maka tidak dapat
diputudkan apakah H0 diterima atau ditolak, sehingga tidak dapat
disimpulan ada atau tidak adanya autokorelasi.
4. Untuk statistik 𝑑 dari Durbin-Watson dapat dilihat pada tabel
Durbin-Watson
5.5.Analisis Uji Data Hipotesa
5.5.1 Uji Signifikansi Simultan (Uji F)

Uji statistik F pada dasarnya menunjukkan apakah semua variabel


bebas yang dimasukkan dalam model mempunyai pengaruh secara
bersama-sama terhadap variabel terikat. Langkah-langkah untuk
melakukan uji simultan (uji F) adalah sebagai berikut:

Hipotesis

i. 𝐻0 : 𝛽0 = 𝛽1 = 𝛽2 = 𝛽3 = 0
(Semua variabel berpengaruh signifikan terhadap variabel dependen)
𝐻1 : Minimal terdapat 𝛽𝑖 ≠ 0
(Terdapat satu variabel independen yang berpengaruh signifikan
terhadap variabel dependen)
ii. Taraf signifikansi 𝛼 = 0,05
iii. Daerah Kritis : 𝐻0 ditolak jika 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼 = 0,05 atau 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 >
𝐹𝑡𝑎𝑏𝑒𝑙(𝑘,(𝑛−𝑘−1),𝛼)
dimana
k : jumlah variabel bebas
n : jumlah sampel
iv. Statistik Uji
ANOVA untuk pengujian kelinieran regresi
Sumber Variasi Derajat Babas Jumlah kuadrat Rataan F hihung
kuadrat
Regresi k JKR RKR RKR/RKS
Galat (sisa) n-k-1 JKS RKS
Total n-1 JKT

𝐽𝐾𝑅 = ∑𝑛𝑖=1(𝑦̅ − 𝑦̂𝑖 )2 𝐽𝐾𝑆 = 𝐽𝐾𝑇 − 𝐽𝐾𝑅 𝐽𝐾𝑇 = ∑𝑛𝑖=1(𝑦 − 𝑦̅)2


𝑅𝐾𝑅 𝐽𝐾𝑅 𝐽𝐾𝑆
𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑅𝐾𝑅 = 𝑅𝐾𝑆 = 𝑛−𝑘−1
𝑅𝐾𝑆 𝑘

v. Kesimpulan
5.5.1 Uji Signifikansi Parameter Individual (Uji t)
Uji parsial (Uji t-student) adalah metode pengujian yang
dilakukan untuk mengetahui pengaruh variabel bebas secara individual
terhadap variabel terikat. Langkah-langkah untuk melakukan uji parsial
(uji t-student) adalah sebagai berikut :

Uji Hipotesis
i. 𝐻0 : 𝛽𝑖 = 0 (Variabel independen tidak berpengaruh signifikan terhadap
variabel dependen)
𝐻1 : 𝛽𝑖 ≠ 0 (Variabel independen berpengaruh signifikan terhadap
variabel dependen)
ii. Taraf signifikansi 𝛼 = 0,05

iii. Daerah Kritis : 𝐻0 ditolak jika 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼 = 0,05 atau 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 >
𝑡𝑡𝑎𝑏𝑒𝑙(1𝛼,𝑛−𝑘)
2

iv. Statistik uji


𝑏𝑖 − 𝛽𝑖
𝑡= (5.10)
𝑠(𝑏𝑖 )
dengan simpangan baku dari b yaitu
2
√∑ 𝑌 − 𝑎 ∑ 𝑦 − 𝑏 ∑ 𝑋𝑌 (5.11)
𝑛−2
𝑠(𝑏𝑖 ) =
2 2
√∑(𝑋 ) − ∑(𝑋)
𝑛

b merupakan parameter dan s (b) adalah simpangan baku dari b.


v. Kesimpulan

5.6.Koefisien Determinasi (𝑹𝟐 )


Koefisien determinasi merupakan ukuran bagian ragam variabel
terikat yang dapat dijelaskan secara bersamasama oleh variabel bebas yang
ada didalam model.
𝐽𝐾𝑅 𝐽𝐾𝑆
𝑅2 = = 1−
𝐽𝐾𝑇 𝐽𝐾𝑇
dimana
JKR : jumlah kuadrat regresi
JKT : jumlah kuadrat total
JKS : jumlah kuadrat sesatan

Bertambahnya nilai 𝑅 2 akan berbanding lurus dengan bertambahnya


variabel bebas yang dimasukkan ke dalam model. Variabel yang potensial
adalah variabel yang memberikan penambahan nilai yang cukup berarti
terhadap 𝑅 2 .

5.7.Pencilan
Pencilan adalah kasus atau data yang memiliki karakteristik unik
yang penyebaran datanya terlihat jauh dari observasi-observasi lainnya dan
muncul dalam bentuk nilai ekstrim, baik untuk sebuah variabel tunggal
maupun variabel kombinasi (Imam Ghozali, 2011: 40).
Data berpengaruh adalah data yang mempunyai pengaruh besar
dalam pendugaan koefisien regresi. Pengamatan berpengaruh dapat
ditelusuri dengan membandingkan hasil analisis pada data lengkap dengan
analisis yang salah satu pengamatan dihapus. Jika penghapusan pengamatan
menyebabkan perubahan yang besar pada hasil analisis maka pengamatan
tersebut dikatan berpengaruh.

Keberadaan dari pencilan akan menyebabkan kesulitan dalam proses


analisis data dan perlu untuk dihindari. Permasalahan yang uncul akibat
adanya pencilan antara lain:

1. Sisaan yang besar dari model yang terbentuk 𝐸(𝑒𝑖 ) ≠ 0


2. Variansi dari data akan menjadi lebih besar
3. Estimasi interval akan memiliki rentang yag lebih besar

Menurut Drape dan smith (1998) metode yang digunakan dalam


mengidentifikasi pencilan terhadap variabel Y adalah Studientized Deleted
Residual (TRES) yang didfinisikan sebagai:
1
𝑑𝑖 𝑛−𝑘−1 2
𝑇𝑅𝐸𝑆𝑖 = = 𝑒𝑖 [ ] (5.12)
𝑆𝑑𝑖 𝐽𝐾𝑆(1 − ℎ𝑖𝑖 ) − 𝑒𝑖2
dimana:

i = 1,2,.....,n

𝑒𝑖 =𝑌𝑖 − 𝑌̂𝑖

𝑑𝑖 =𝑌𝑖 − 𝑌̂(𝑖)

𝑆𝑑𝑖 = simpangan baku beda (𝑑𝑖 )

ℎ𝑖𝑖 =𝑥𝑖′ (𝑋 ′ 𝑋)−1 𝑥𝑖

𝑘=p+1

𝑛 = banyaknya pengamatan

Hipotesis untuk menguji adanya pencilan adalah:

H0: pengamatan ke-i bukan pencilan

H1: pengamatan ke-i merupakan pencilan

𝑇𝑅𝐸𝑆 adalah stastistik uji untuk mengetahui pencilan terhadap 𝑌

Kriteria pengujian yang melandasi keputusan adalah:


𝛼
≤ 𝑡 , 𝑛 − 𝑘 − 1 , 𝐻0 𝑡𝑖𝑑𝑎𝑘 𝑑𝑖𝑡𝑜𝑙𝑎𝑘
|𝑇𝑅𝐸𝑆𝑖 | { 2
𝛼
> 𝑡 , 𝑛 − 𝑘 − 1, 𝐻0 𝑑𝑖𝑡𝑜𝑙𝑎𝑘
2

Metode yang diunakan dalam mengidentifikasi pencilan terhadap


variabel 𝑋 adalah nlai pengaruh (Leverage Point). Nilai pengaruh (ℎ𝑖𝑖 )
dari penamatan (𝑋𝑖 , 𝑌𝑖 ) menunjukan besarnya peranan 𝑌𝑖 terhadap 𝑌̂𝑖 dan
didefinisikan sebagai:

hii =xi′ (X ′ X)−1 xi (5.13)

dimana i: 1,2,...,n, xi = [1xi2 xi3 … xip ] adalah vektor baris yang berisi
nilai-nilai dari peubah variabel independen dalam pengamatan ke-i. Nilai
hii berada diantara 0 dan 1 (0 ≤ hii ≤ 1) ∑ni=1 hii = k dengan k = p+1.
Jika hii lebih besar dari 2h̅ dengan

2 ∑ni=1 hii 2k (5.14)


2h̅ = =
n n
maka pengamatan ke-i dikatakan pencilan terhadap X.
5.8.Regresi Robust
Menurut Chen (2002) regresi robust adalah salah satu penduga
regresi yang robust atau resisten dalam menganalisis data yang
menyimpang terhadap asumsi analisis regresi. Beberapa penyimpangan
terhadap asumsi yang dimaksud misalnya galat yang tidak berdistribusi
normal atau adanya pencilan yang mempengaruhi model. Metode ini
dibutuhkan karena metode kuadrat terkecil yang dianggap penduga terbaik
dalam analisis regresi ternyata peka terhadap data yang menyimpang dari
asumsi. Prosedur robust ditujukan untuk memberikan dugaan yang lebih
tepat dan cepat terhadap data yang melanggar asumsi dengan cara
meniadakan identifikasi adanya data pencilan, serta bersifat otomatis dalam
menanggulangi data pencilan.
Menurut Chen (2002) regresi robust dapat mengatasi pencilan tanpa
menghapus data pencilan tersebut. Regresi robust berperan sebagai penurun
bobot data pencilan.
Metode-metode estimasi dalam regresi robust diantaranya adalah :
1. Estimasi M (maximum likelyhood type)
Dikenalkan oleh Huber (1973), estimasi M adalah metode yang
sederhana baik dalam penghitungan maupun secara teoritis.
Estimasi ini menganalisis data dengan mengasumsikan bahwa
sebagian besar terdeteksi pencilan pada variable independen.
2. Estimasi LTS (least trimmed squares)
Merupakan metode dengan high breakdown point yang dikenalkan
oleh Rousseeuw (1984). Breakdown point adalah ukuran proporsi
minimal dari banyaknya data yang terkontaminasi pencilan
dibandingkan seluruh data pengamatan.
3. Estimasi S (scale) juga merupakan metode dengan high breakdown
point yang dikenalkan oleh Rousseeuw and Yohai (1984). Dengan
nilai breakdown yang sama, metode ini mempunyai efisiensi yang
lebih tinggi dibanding estimasi LTS.
4. Estimasi MM (method of moment), dikenalkan oleh Yohai (1987).
Metode ini menggabungkan estimasi S (estimasi dengan high
breakdown point) dan estimasi M.

5.9.Estimasi-M
Menurut Fox (2002) metode yang paling umum untuk regresi robust
adalah estimasi-M, yang diperkenalkan oleh Huber(1964). Metode
estimasi-M sebagai generalisasi untuk estimasi maksimum likelihood dalam
konteks model lokasi. Itu hampir seefisien MKT.
Prinsip metode estimasi-M adalah meminimalkan fungsi residual.
Fungsi tujuan estimasi-M adalah :
𝑛 𝑘

𝛽̂𝑀 = min ∑ 𝜌 (𝑦𝑖 − ∑ 𝑥𝑖𝑗 ′ 𝛽𝑗 ) (5.15)


𝑖=1 𝑗=0
dimana
𝑛 𝑛 𝑛
𝑒𝑖 𝑦𝑖 − ∑𝑘𝑗=0 𝑥𝑖𝑗 ′ 𝛽𝑗
min ∑ 𝜌 (𝑢𝑖 ) = min ∑ 𝜌 ( ) = min ∑ 𝜌 ( )
𝜎̂𝑀𝐴𝐷 𝜎̂𝑀𝐴𝐷
𝑖=1 𝑖=1 𝑖=1
𝑚𝑒𝑑𝑖𝑎𝑛|𝑒𝑖 − 𝑚𝑒𝑑𝑖𝑎𝑛(𝑒𝑖 )|
𝜎̂𝑀𝐴𝐷 =
0.6745

dimana 𝜎̂ (MAD) merupakan estimasi jarak yang sering dibentuk


dari kombinasi linear dari residu, dengan c = 0,6745 membuat S menjadi
estimasi tak bias dari 𝜎 jika n besar dan berdistribusi normal. Untuk fungsi
𝜌, menggunakan tabel (M)
𝑦𝑖 − ∑𝑘𝑗=0 𝑥 ′ 𝑖𝑗 𝛽
𝜓( )
𝜎̂𝑀𝐴𝐷
𝑤𝑖 =
𝑦𝑖 − ∑𝑘𝑗=0 𝑥 ′ 𝑖𝑗 𝛽
[ ]
𝜎̂𝑀𝐴𝐷

dimana 𝜓 = 𝜌́ merupakan turunan, 𝑥𝑖𝑗 merupakan observasi ke-I


ei
pada variabel independen ke-j. Karena ui = ̂
maka persamaan di atas dapat
σ
ditulis dengan

ψ(ui ) (5.16)
wi (ui ) =
ui

ui 2 2
= {[1 − ( c ) ] , |ui | < c
0, |ui | ≥ c

Menurut Susanti (2014) adapun langkah-langkah untuk estimasi-M:


1. Estimasi koefisien regresi dengan MKT
2. Uji asumsi klasik model regresi
3. Menguji adanya pencilan
4. Menghitung estimasi parameter dengan MKT
5. Menghitung nilai residu 𝑒𝑖 = 𝑦𝑖 − 𝑦̂𝑖
6. Menghitung nilai 𝜎̂𝑖 = 0.6745 𝑀𝐴𝐷
𝑒
7. Menghitung nilai 𝑢𝑖 = 𝜎̂𝑖
𝑖
8. Menghitung nilai pembobot
u 2 2
i
|u |
w (u ) = {[1 − ( c ) ] , i < 4.685
i i
0, |ui | ≥ 4.685
9. Menghitung 𝛽̂ 𝑀 menggunakan pembobot weighted least
square (WLS) dengan pembobot wi
10. Mengulangi langkah (5) sampai (8) untuk mendapatkan nilai
𝛽̂
𝑀 yang konvergen.
11. Menentukan model yang robust dengan estimasi-M dan
menginterpretasikan

5.10. Estimasi-S

Estimasi-S pertama kali diperkenalkan oleh Rousseeuw dan Yohai


(1984) merupakan estimasi robust yang dapat mencapai breakdown point
hingga 50%. Breakdown point adalah ukuran umum proporsi dari pencilan
yang dapat ditangani sebelum pengamatan tersebut mempengaruhi model.
Karena estimasi-S dapat mencapai breakdown point hingga 50% maka
estimasi-S dapat mengatasi setengah dari pencilan dan memberikan
pengaruh yang baik bagi pengamatan lainnya.

Estimasi-S didefinisikan

β̂s = arg min σ


̂s (e1 , e2 , … , en ) (5.17)
β

dengan menentukan nilai estimator skala robust (σ


̂s ) yang minimum
dan memenuhi

nyi − ∑kj=0 xij βj


min ∑ ρ ( )
i=1 ̂s
σ

dengan

n ∑n (ei 2 ) − (∑ni=1 ei )2
̂s = √ i=1
σ
n(n − 1)

ρ merupakan fungsi pembobot Tukey’s Biweight


ui 2 ui 4 ui 6 (5.18)
− 2 − 4, |ui | < c
ρ(ui ) = 2 2c 6c
c2
, |ui | ≥ c
{ 6
Penyelesaian persamaan (5.17) adalah dengan cara menurunkannya
terhadap β sehingga diperoleh
n
yi − ∑kj=0 xij βj

∑ρ ( ) =0 j = 0,1, … , k
̂s
σ
i=1
(5.19)

n
yi − ∑kj=0 xij βj
∑ xij ψ ( )=0 j = 0,1, … , k
̂s
σ
i=1

ψ merupakan fungsi pengaruh yang merupakan turunan dari ρ.


Sehingga bias dituliskan ρ′ = ψ yaitu

2ui 3 ui 5 (5.20)
ψ(u ) = ρ′ (u ) = {ui − − 4, |ui | < c
i i c2 c
0, |ui | ≥ c

2ui 2 ui 4
u (1 − 2 − 4 ) , |ui | < c
={ i c c
0, |ui | ≥ c
2
ui 2
ui (1 − 2 ) , |ui | < c
={ c
0, |ui | ≥ c

ui 2 2
= {ui (1 − ( c ) ) , |ui | < c
0, |ui | ≥ c
e
dengan wi merupakan fungsi pembobot IRLS dimana ui = σ̂ i dan c
S
= 1,547.
ψ(ui ) (5.21)
wi (ui ) =
ui
2
u 2
ui (1 − ( ci ) )
= , |ui | < c
ui
{ 0, |ui | ≥ c

ui 2 2
= {[1 − ( c ) ] , |ui | < c
0, |ui | ≥ c

Sisaan awal yang digunakan pada estimasi-S adalah sisaan yang


diperoleh dari metode kuadrat terkecil. Persamaan (5.19) dapat diselesaikan
dengan MKT terboboti secara iterasi yang disebut Iteratively Reweighted
Least Square (IRLS) hingga mencapai konvergen.

Secara singkatnya, dapat dilihat pada tabel 5.1 untuk mengetahui


masing-masing fungsi pembobot dan fungsi objektif.

Tabel 5.1. Fungsi objektif dan fungsi pembobot untuk MKT dan
Tukey’s Biweight

Metode Fungsi objektif Fungsi pembobot Interval

1 2
MKT 𝜌(𝑢𝑖 ) = 𝑢 𝑤𝑖 (𝑢𝑖 ) = 1 |𝑢𝑖 | < ∞
2 𝑖

𝜌(𝑢𝑖 )
𝑢𝑖 2 𝑢𝑖 4 𝑢𝑖 6 𝑢𝑖 2 2
Tukey’s − 2− 4 [1 − ( ) ] |𝑢𝑖 | < 𝑏
={
Biweight = 2 2𝑏 6𝑏 𝑏 |𝑢𝑖 | ≥ 𝑏
𝑏2 0
{ 6

Adapun langkah-langkah untuk estimasi-S :

a. Menduga koefisien regresi dengan MKT (Metode Kuadrat Terkecil)


b. Menguji asumsi klasik analisis regresi linear
c. Mendeteksi adanya pencilan pada data dengan metode TRES dan hii
d. Menduga koefisien regresi dengan estimasi-S
Langkah-langkah metode estimasi-S :

a. Menghitung sisaan awal yang diperoleh dari MKT


b. Menghitung standar deviasi sisaan 𝜎̂𝑠 untuk mendapat nilai 𝑢𝑖
c. Menghitung nilai pembobot 𝑤𝑖
d. Menghitung MKT terbobot untuk mendapatkan penduga kuadrat
terkecil terbobot
𝛽̂ ∗ = (𝑋 ′ 𝑊𝑋)−1 𝑋′𝑊𝑌
e. Menjadikan sisaan langkah (c) sebagai sisaan awal langkah (b)
sehingga diperoleh nilai 𝜎̂𝑠 dan pembobot 𝑤𝑖 yang baru
f. Melakukan pengulangan iterasi sampai didapatkan kekonvergenan
𝑠 𝑠 𝑠
sehingga diperoleh 𝛽̂0 , 𝛽̂1 , … . , 𝛽̂𝑝 yang merupakan estimasi-S

5.11. Estimasi-GS
Menurut Croux et. al (1994), estimator-GS adalah penyelesaian
minimisasi estimasi-M berdasarkan selisih sisaan skala berpasangan.
Estimator-GS didefinisikan sebagai 𝛽̂𝐺𝑆 = 𝑎𝑟𝑔𝑚𝑖𝑛𝛽𝜖𝑅𝑝 𝜎̂𝐺𝑆 (∆𝑒(𝛽))
𝜎 𝐺𝑆
dengan 𝜎̂𝐺𝑆 diperoleh dari estimasi-M selisih sisaan skala berpasangan 1,1926
yang merupakan solusi
𝑛
1 ∆𝑒𝑖𝑖 ′ (𝛽)
∑ 𝜌 ( ) = 𝛿,
(𝑛2) ′ 𝜎̂𝐺𝑆
𝑖<𝑖
dengan 𝜌 adalah fungsi pembobot Tukey’s Biweight dan 𝛿 adalah nilai
breakdown point.
Menurut Croux et al., nilai 1,1926 merupakan faktor koreksi agar
estimator tak bias.
Estimator-GS juga menggunakan fungsi pembobot Tukey’s
Biweight yang ditunjukkan pada persamaan (5.13) dengan turning constant
yang disarankan oleh Croux et al. yaitu 0,9958.
Estimator-GS 𝛽̂ juga dapat dinyatakan dalam bentuk lain yaitu
𝑛
∆𝑒𝑖𝑖 ′ (𝛽)
𝛽̂𝐺𝑆 = 𝑎𝑟𝑔𝑚𝑖𝑛𝛽𝜖𝑅𝑝 ∑ 𝜌 ( ) (5.22)
𝜎̂𝐺𝑆
𝑖<𝑖 ′
Lalu persamaan diatas diturunkan terhadap β sehingga diperoleh
𝑛
∆𝑒𝑖𝑖 ′ (𝛽)
∑ 𝜌′ ( )=0
𝜎̂𝐺𝑆
𝑖<𝑖 ′
𝑛
∆𝑒𝑖𝑖 ′ (𝛽)
∑𝜓( ) = 0,

𝜎̂𝐺𝑆
𝑖<𝑖
dengan 𝜓 disebut fungsi pengaruh yang merupakan turunan dari 𝜌.
Bentuk ini dapat ditulis sama seperti estimator-S dengan
ψ(ui ) Δeii′
wi (ui ) = merupakan fungsi pembobot IRLS dimana ui = ̂ GS
dan c =
ui σ
0,9958.

Sisaan yang digunakan pada estimasi-GS adalah sisaan berpasangan


yang diperoleh dari MKT lalu dilanjutkan dengan MKT yang terboboti
secara iterasi yang disebut Iteratively Reweighted Least Square (IRLS)
hingga konvergen.

6. KERANGKA PEMIKIRAN

Berdasarkan tinjauan pustaka dapat disusun kerangka pemikiran sebagai


berikut. Langkah pertama adalah menentukan populasi yang akan digunakan dalam
penelitian. Faktor – faktor yang mempengaruhi kasus bayi gizi buruk di Jawa
Tengah pada tahun 2017 dimasukkan pada variabel independen. Faktor – faktor
tersebut yaitu persentase pemberian ASI eksklusif, persentase cakupan pemberian
vitamin A, persentase rumah sehat, persentase penduduk dengan akses sanitasi yang
layak, usia harapan hidup saat lahir dan usia perkawinan pertama dibawah 17 tahun.
Langkah kedua yaitu mengecek bahwa salah satu asumsi regresi dilanggar yaitu
asumsi normalitas karena adanya pencilan. Langkah ketiga adalah menentukan nilai
parameter regresi karena terdapat pencilan pada variabel dependen maka tidak
dapat diselesaikan menggunakan metode umum yaitu MKT.
Masalah tersebut dapat diselesaikan dengan menggunakan regresi robust.
Regresi robust yang digunakan adalah estimator-GS yang meminimumkan skala
berpasangan robust dengan fungsi pembobot Tukey’s Biweight.

7. METODE PENELITIAN

Pada penelitian ini, metode yang digunakan adalah studi kasus mengenai
kasus bayi gizi buruk di Jawa Tengah pada tahun 2017 dengan menggunakan
metode regresi robust dengan estimasi-GS. Data yang digunakan pada penelitian
merupakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) Provinsi
Jawa Tengah.

Menurut Wulansari(2012) adapun langkah – langkah yang diperlukan dalam


penelitian ini adalah :

1. Menduga koefisien regresi dengan MKT

2. Menguji asumsi klasik regresi linear


3. Mengecek tingkat determinasi koefisien (R-sq)

4. Mendeteksi adanya pencilan pada data dengan metode TRES dan ℎ𝑖𝑖

5. Menduga koefisien regresi dengan estimasi-GS

Langkah – langkah menduga koefisien regresi dengan estimasi-GS adalah

a. Menghitung sisaan awal yang diperoleh dari MKT

b. Menghitung selisih sisaan berpasangan

c. Menghitung standar deviasi selisih sisaan berpasangan σ


̂GS untuk
mendapatkan nilai 𝑢𝑖

d. Menghitung nilai pembobot 𝑤(𝑢𝑖 )

e. Menggunakan MKT terbobot untuk mendapatkan penduga kuadrat terkecil


terbobot

𝛽̂ ∗ = (𝑋 ′ 𝑊𝑋)−1 𝑋′𝑊𝑌 (7.1)

f. Menjadikan selisih sisaan berpasangan langkah (e) sebagai selisih sisaan


berpasangan awal langkah (d) sehingga diperoleh nilai σ
̂GS dan pembobot
𝑤(𝑢𝑖 ) yang baru

g. Melakukan pengulangan iterasi sampai didapatkan kekonvergenan


sehingga diperoleh 𝛽̂0𝐺𝑆 , 𝛽̂1𝐺𝑆 , … , 𝛽̂𝑝𝐺𝑆 yang merupakan estimasi-GS

h. Menentukan model yang robust dengan estimasi-GS dan


menginterpretasikan
8. JADWAL PENELITIAN
Kegiatan penyusunan laporan tugas akhir ini diatur dalam jadwal penelitian
yang tertulis pada Tabel 8.1.
Tabel 8.1. Jadwal Penelitian

Kegiatan Apr’20 Mei’20 Jun’20 Jul’20 Agus’20 Sept’20

Ujian proposal TA

Revisi proposal TA

Pembahasan dan penelitian

Penyusunan skripsi

Penyusunan artikel

Seminar hasil

Revisi artikel

Ujian skripsi

Revisi skripsi
DAFTAR PUSTAKA

Andrews, D. F. 1972. Robust Estimates of Location : Survey and Advances.


Princeton : Princeton University Press.

Arina, F. 2017. Regresi Robust untuk Mengatasi Data Pencilan. Cilegon :


Universitas Sultan Ageng Tirtayasa.

Badan Pusat Statistik (BPS) Provinsi Jawa Tengah.

Chen, Colin .2002. Robust Regression and Outlier Detection with The
ROBUSTREG Procedure. paper 265-267. Cary, NC: SAS Institute Inc.

Croux, C., Rousseeuw, P.J., Hössjer, O. 1994. Generalized S-Estimators. Journal


of the America Statistical Association. 89, 1271-1281.

Draper, N.R., Smith, H. 1998. Applied Regression Analysis Third Edition. United
States : Wiley Interscience Publication.

Emerson, E. 2005. Underweight, obesity and exercise among adults with


intellectual disabilities in supported accommodation in Northern England.
Journal of Intellectual Disability Research, 49(2): 134–143

Fox, J. 2002. Robust Regression. Appendix to An R and S-Plus Companion to


Applied Regression. January.

Ghozali, Imam. 2009. Aplikasi Analisis Multivariate dengan Program SPSS.


Semarang : UNDIP.

Ghozali, Imam. 2011. Aplikasi Analisis Multivariate dengan Program IBM SPSS
19, Edisi Kelima. Semarang : UNDIP.
Gujarati, Damodar. 1978. Ekonometrika Dasar. Jakarta : Penerbit Erlangga.

Hanum, H. 2011. Perbandingan Model Stepwise, Best Subset Regression, dan


Fraksi dalam Pemilihan Model Regresi Berganda Terbaik. Jurnal Penelitian
Sains. Vol. 14, No. 2(A).

Huber, P. J. 1973. Robust Regression: Asymptotics, conjectures and Monte Carlo”,


Ann. Stat., Vol. 1, No.5, 799-821.

Karim, M.E., Selecting of The Best Regression Equation by Sorting Out Variables.
Institute of statistical research and training: University of Dhaka
Bangladesh.
Krisnansari, D. 2010. Nutrisi dan Gizi Buruk. Journal Mandala of Health. Vol. 4
No.1 : 60-68.

Mendez, Michelle A. 2005. Overweight exceeds underweight among women in


most developing countries. The American Journal of Clinical Nutrition.
Volume 81, Issue 3, 714-721.

Montgomery, D. C. and E. A. Peck. 1991. Introduction to Linear Regression


Analysis Second Edition. New York : John Wiley Sons Inc.

Olive DJ. 2005. Applied Robust Statistics. Carbondale : Southern Illinois


University.

Rousseeuw, P. J and Yohai, V. 1984. Robust Regression by Means of S Estimator,


in Robust and Nonlinier Time Series Analysis, edited by J. Franke, W,
Hardle, and R.D. Martin, Lecture Notes in Statistics 26, Springer Verlag,
New York, 256-272.

Sanchez pedro et all. 2005. Halving Hunger: It Can Be Done. USA: Earthscan.

Sembiring, R. K. 1995. Analisis Regresi. Kota Bandung: ITB.

Setiarini, Z, Listyani, E. 2017. Analisis Regresi Robust Estimasi-S Menggunakan


Pembobot Welsch Dan Tukey Bisquare. Yogyakarta : UNY.

Setiawan, W., Debataraja, N.N., Sulistianingsih, E. 2019. Metode Estimasi-S pada


Analisis Regresi Robust dengan Pembobotan Tukey Bisquare. Volume 08,
No. 2, hal 289-296. Pontianak : Universitas Tanjungpura.

Susanti, Y., Pratiwi, H., Sulistijowati, S., dan Liana, T. 2014. M Estimation, S
Estimation, dnd MM Estimation In Robust Regression. International
Journal of Pure and Applied Mathematics. Volume 91, No. 3, hal 349-360.

World Health Organization. 2010. WHO Child Growth Standards and The
Identification of Severe Acute Malnutrition in Infants and Children.

Yohai, V. J. 1987. High Breakdown Point and High Efficiency Robust Estimates
for Regression. Annals of Statistics, Vol. 15, No. 20, 642-656.

Anda mungkin juga menyukai