M0716041
STATISTIKA
2020
PROPOSAL TUGAS AKHIR
MODEL REGRESI ROBUST MENGGUNAKAN ESTIMASI GS DENGAN
PEMBOBOT TUKEY’S BIWEIGHT
diajukan oleh
MADE TIARA SASKIA PUSPITASARI (M0716041)
.................................
NIP. 00000000000000
1. LATAR BELAKANG
Gizi adalah salah satu faktor terpenting yang kelangsungan hidup individu
atau masyarakat oleh karena itu merupakan isu fundamental dalam kesehatan
masyarakat (Emerson, 2005;Mendez, 2005). Keadaan gizi yang baik merupakan
syarat utama kesehatan dan berdampak terhadap kualitas sumber daya manusia.
Gizi buruk menurut World Health Organization (WHO) ditentukan berdasarkan
indikator antropometri berat badan menurut tinggi atau panjang badan (BB/TB)
dengan z-skor BB/TB <-3 SD dan ada atau tidaknya odema.
Badan Pusat Statistik (BPS) mencatat bahwa pada tahun 2017 terdapat
sebanyak 1.352 kasus bayi gizi buruk di Jawa Tengah. Dalam data kasus gizi buruk
di Jawa Tengah pada tahun 2017 yang diambil dari BPS terdapat pencilan. Menurut
Makkulau et al (2010) data pencilan (outlier) adalah data yang berada jauh (ekstrim)
dari data lainnya. Data pencilan yang ada tidak boleh dibuang begitu saja karena
akan mempengaruhi model regresi serta menghasilkan sisaan yang besar. Oleh
karena itu, dibutuhkan suatu metode untuk menangani data yang mengandung
pencilan yaitu regresi robust dimana nilai estimasinya tidak banyak dipengaruhi
oleh perubahan kecil dalam data.
Menurut Chen (2002) metode estimasi dalam regresi robust yaitu estimasi
M (Maximum Likelihood type), LTS (Least Trimmed Square), estimasi MM
(Method of Moment), dan estimasi S (Scale). Terdapat dua estimasi robust selain
yang disebutkan di atas, yaitu estimasi 𝜏 dan estimasi-GS (Generalized S-
Estimation). Kedua estimasi ini memiliki kemiripan yaitu mempunyai breakdown
point yang tinggi karena berdasarkan skala.
2. RUMUSAN MASALAH
3. TUJUAN PENELITIAN
4. MANFAAT PENELITIAN
5. TINJAUAN PUSTAKA
5.2.Analisis Regresi
Menurut Sembiring (1995: 32) model regresi adalah model yang
memberikan gambaran mengenai hubungan antara variabel bebas dengan
variabel terikat atau tak bebas. Analisis regresi merupakan salah satu
metode statistika yang digunakan untuk membangun model hubungan
antara dua variabel atau lebih. Variabel yang nilainya di tentukan oleh
variabel lain disebut variabel tak bebas (dependent variable), sementara
variabel yang nilainya dapat ditentukan atau dapat diamati disebut variabel
bebas (independent variable).
Menurut Draper & Smith (1998: 22) bentuk umum dari regresi linier
sederhana adalah sebagai berikut:
𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 , 𝜀 ~ 𝑁(0, 𝜎 2 ) (5.1)
dengan,
Yi : nilai variabel dependen pada observasi ke-i
Xi : nilai variabel independen pada observasi ke-i
𝛽0 , 𝛽1 : parameter koefisien regresi
𝜀𝑖 : error yang bersifat random
Apabila variabel independen sebanyak p, maka persamaan dapat
ditulis sebagai berikut :
𝑌1 = 𝛽0 + 𝛽1 𝑥11 + 𝛽2 𝑥12 + 𝛽3 𝑥13 + ⋯ + 𝛽𝑝 𝑥1𝑝 + 𝜀1
𝑌2 = 𝛽0 + 𝛽1 𝑥21 + 𝛽2 𝑥22 + 𝛽3 𝑥23 + ⋯ + 𝛽𝑝 𝑥2𝑝 + 𝜀2
𝑌3 = 𝛽0 + 𝛽1 𝑥31 + 𝛽2 𝑥32 + 𝛽3 𝑥33 + ⋯ + 𝛽𝑝 𝑥3𝑝 + 𝜀3 (5.2)
…………………………………………………………………
𝑌𝑛 = 𝛽0 + 𝛽1 𝑥𝑛1 + 𝛽2 𝑥𝑛2 + 𝛽3 𝑥𝑛3 + ⋯ + 𝛽𝑝 𝑥𝑛𝑝 + 𝜀𝑛
𝑌 = 𝑋𝛽 + 𝜀, 𝜀 ~ 𝑁(0, 𝜎 2 𝐼) (5.3)
dengan
𝑌1
𝑌2 𝛽0
𝑌3 1 𝑥11 𝑥12 𝑥13 ⋯ 𝑥1𝑝 𝛽1
𝑌 = . ,𝑋 = ( ⋮ ⋮ ⋮ ⋮ ⋱ ⋮ ) , 𝛽 = 𝛽2 ,
. 1 𝑥𝑛1 𝑥𝑛2 𝑥𝑛3 ⋯ 𝑥𝑛𝑝 ⋮
. (𝛽𝑝 )
(𝑌𝑛 )
𝜀1
𝜀2
𝜀 = 𝜀3 (5.4)
⋮
(𝜀𝑛 )
𝑟𝑠 √𝑛 − 2 (5.7)
𝑡=
√1 − 𝑟𝑠2
Salah satu asumsi penting dari regresi linear adalah bawa tidak
ada autokrelasi antara serangkaian pegamatan yang diurutkan menurut
waktu. Adanya kebebasan antar sisaan dapat dideteksi secara grafis dan
empiris. Pendeteksian autokorelasi secara grafis yaitu denan melihat
pola tebaran sisaan terhadap urutan waktu. Jika tebaran sisaan terhadap
urutan waktu tidak membentuk suatu pola tertentu atau bersifat acak
maka dapat disimpulkan tidak ada autokorelasi antar sisaan (Draper dan
Smith, 1998)
Hipotesis
i. 𝐻0 : 𝛽0 = 𝛽1 = 𝛽2 = 𝛽3 = 0
(Semua variabel berpengaruh signifikan terhadap variabel dependen)
𝐻1 : Minimal terdapat 𝛽𝑖 ≠ 0
(Terdapat satu variabel independen yang berpengaruh signifikan
terhadap variabel dependen)
ii. Taraf signifikansi 𝛼 = 0,05
iii. Daerah Kritis : 𝐻0 ditolak jika 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼 = 0,05 atau 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 >
𝐹𝑡𝑎𝑏𝑒𝑙(𝑘,(𝑛−𝑘−1),𝛼)
dimana
k : jumlah variabel bebas
n : jumlah sampel
iv. Statistik Uji
ANOVA untuk pengujian kelinieran regresi
Sumber Variasi Derajat Babas Jumlah kuadrat Rataan F hihung
kuadrat
Regresi k JKR RKR RKR/RKS
Galat (sisa) n-k-1 JKS RKS
Total n-1 JKT
v. Kesimpulan
5.5.1 Uji Signifikansi Parameter Individual (Uji t)
Uji parsial (Uji t-student) adalah metode pengujian yang
dilakukan untuk mengetahui pengaruh variabel bebas secara individual
terhadap variabel terikat. Langkah-langkah untuk melakukan uji parsial
(uji t-student) adalah sebagai berikut :
Uji Hipotesis
i. 𝐻0 : 𝛽𝑖 = 0 (Variabel independen tidak berpengaruh signifikan terhadap
variabel dependen)
𝐻1 : 𝛽𝑖 ≠ 0 (Variabel independen berpengaruh signifikan terhadap
variabel dependen)
ii. Taraf signifikansi 𝛼 = 0,05
iii. Daerah Kritis : 𝐻0 ditolak jika 𝑝𝑣𝑎𝑙𝑢𝑒 < 𝛼 = 0,05 atau 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 >
𝑡𝑡𝑎𝑏𝑒𝑙(1𝛼,𝑛−𝑘)
2
5.7.Pencilan
Pencilan adalah kasus atau data yang memiliki karakteristik unik
yang penyebaran datanya terlihat jauh dari observasi-observasi lainnya dan
muncul dalam bentuk nilai ekstrim, baik untuk sebuah variabel tunggal
maupun variabel kombinasi (Imam Ghozali, 2011: 40).
Data berpengaruh adalah data yang mempunyai pengaruh besar
dalam pendugaan koefisien regresi. Pengamatan berpengaruh dapat
ditelusuri dengan membandingkan hasil analisis pada data lengkap dengan
analisis yang salah satu pengamatan dihapus. Jika penghapusan pengamatan
menyebabkan perubahan yang besar pada hasil analisis maka pengamatan
tersebut dikatan berpengaruh.
i = 1,2,.....,n
𝑒𝑖 =𝑌𝑖 − 𝑌̂𝑖
𝑑𝑖 =𝑌𝑖 − 𝑌̂(𝑖)
𝑘=p+1
𝑛 = banyaknya pengamatan
dimana i: 1,2,...,n, xi = [1xi2 xi3 … xip ] adalah vektor baris yang berisi
nilai-nilai dari peubah variabel independen dalam pengamatan ke-i. Nilai
hii berada diantara 0 dan 1 (0 ≤ hii ≤ 1) ∑ni=1 hii = k dengan k = p+1.
Jika hii lebih besar dari 2h̅ dengan
5.9.Estimasi-M
Menurut Fox (2002) metode yang paling umum untuk regresi robust
adalah estimasi-M, yang diperkenalkan oleh Huber(1964). Metode
estimasi-M sebagai generalisasi untuk estimasi maksimum likelihood dalam
konteks model lokasi. Itu hampir seefisien MKT.
Prinsip metode estimasi-M adalah meminimalkan fungsi residual.
Fungsi tujuan estimasi-M adalah :
𝑛 𝑘
ψ(ui ) (5.16)
wi (ui ) =
ui
ui 2 2
= {[1 − ( c ) ] , |ui | < c
0, |ui | ≥ c
5.10. Estimasi-S
Estimasi-S didefinisikan
dengan
n ∑n (ei 2 ) − (∑ni=1 ei )2
̂s = √ i=1
σ
n(n − 1)
n
yi − ∑kj=0 xij βj
∑ xij ψ ( )=0 j = 0,1, … , k
̂s
σ
i=1
2ui 3 ui 5 (5.20)
ψ(u ) = ρ′ (u ) = {ui − − 4, |ui | < c
i i c2 c
0, |ui | ≥ c
2ui 2 ui 4
u (1 − 2 − 4 ) , |ui | < c
={ i c c
0, |ui | ≥ c
2
ui 2
ui (1 − 2 ) , |ui | < c
={ c
0, |ui | ≥ c
ui 2 2
= {ui (1 − ( c ) ) , |ui | < c
0, |ui | ≥ c
e
dengan wi merupakan fungsi pembobot IRLS dimana ui = σ̂ i dan c
S
= 1,547.
ψ(ui ) (5.21)
wi (ui ) =
ui
2
u 2
ui (1 − ( ci ) )
= , |ui | < c
ui
{ 0, |ui | ≥ c
ui 2 2
= {[1 − ( c ) ] , |ui | < c
0, |ui | ≥ c
Tabel 5.1. Fungsi objektif dan fungsi pembobot untuk MKT dan
Tukey’s Biweight
1 2
MKT 𝜌(𝑢𝑖 ) = 𝑢 𝑤𝑖 (𝑢𝑖 ) = 1 |𝑢𝑖 | < ∞
2 𝑖
𝜌(𝑢𝑖 )
𝑢𝑖 2 𝑢𝑖 4 𝑢𝑖 6 𝑢𝑖 2 2
Tukey’s − 2− 4 [1 − ( ) ] |𝑢𝑖 | < 𝑏
={
Biweight = 2 2𝑏 6𝑏 𝑏 |𝑢𝑖 | ≥ 𝑏
𝑏2 0
{ 6
5.11. Estimasi-GS
Menurut Croux et. al (1994), estimator-GS adalah penyelesaian
minimisasi estimasi-M berdasarkan selisih sisaan skala berpasangan.
Estimator-GS didefinisikan sebagai 𝛽̂𝐺𝑆 = 𝑎𝑟𝑔𝑚𝑖𝑛𝛽𝜖𝑅𝑝 𝜎̂𝐺𝑆 (∆𝑒(𝛽))
𝜎 𝐺𝑆
dengan 𝜎̂𝐺𝑆 diperoleh dari estimasi-M selisih sisaan skala berpasangan 1,1926
yang merupakan solusi
𝑛
1 ∆𝑒𝑖𝑖 ′ (𝛽)
∑ 𝜌 ( ) = 𝛿,
(𝑛2) ′ 𝜎̂𝐺𝑆
𝑖<𝑖
dengan 𝜌 adalah fungsi pembobot Tukey’s Biweight dan 𝛿 adalah nilai
breakdown point.
Menurut Croux et al., nilai 1,1926 merupakan faktor koreksi agar
estimator tak bias.
Estimator-GS juga menggunakan fungsi pembobot Tukey’s
Biweight yang ditunjukkan pada persamaan (5.13) dengan turning constant
yang disarankan oleh Croux et al. yaitu 0,9958.
Estimator-GS 𝛽̂ juga dapat dinyatakan dalam bentuk lain yaitu
𝑛
∆𝑒𝑖𝑖 ′ (𝛽)
𝛽̂𝐺𝑆 = 𝑎𝑟𝑔𝑚𝑖𝑛𝛽𝜖𝑅𝑝 ∑ 𝜌 ( ) (5.22)
𝜎̂𝐺𝑆
𝑖<𝑖 ′
Lalu persamaan diatas diturunkan terhadap β sehingga diperoleh
𝑛
∆𝑒𝑖𝑖 ′ (𝛽)
∑ 𝜌′ ( )=0
𝜎̂𝐺𝑆
𝑖<𝑖 ′
𝑛
∆𝑒𝑖𝑖 ′ (𝛽)
∑𝜓( ) = 0,
′
𝜎̂𝐺𝑆
𝑖<𝑖
dengan 𝜓 disebut fungsi pengaruh yang merupakan turunan dari 𝜌.
Bentuk ini dapat ditulis sama seperti estimator-S dengan
ψ(ui ) Δeii′
wi (ui ) = merupakan fungsi pembobot IRLS dimana ui = ̂ GS
dan c =
ui σ
0,9958.
6. KERANGKA PEMIKIRAN
7. METODE PENELITIAN
Pada penelitian ini, metode yang digunakan adalah studi kasus mengenai
kasus bayi gizi buruk di Jawa Tengah pada tahun 2017 dengan menggunakan
metode regresi robust dengan estimasi-GS. Data yang digunakan pada penelitian
merupakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) Provinsi
Jawa Tengah.
4. Mendeteksi adanya pencilan pada data dengan metode TRES dan ℎ𝑖𝑖
Ujian proposal TA
Revisi proposal TA
Penyusunan skripsi
Penyusunan artikel
Seminar hasil
Revisi artikel
Ujian skripsi
Revisi skripsi
DAFTAR PUSTAKA
Chen, Colin .2002. Robust Regression and Outlier Detection with The
ROBUSTREG Procedure. paper 265-267. Cary, NC: SAS Institute Inc.
Draper, N.R., Smith, H. 1998. Applied Regression Analysis Third Edition. United
States : Wiley Interscience Publication.
Ghozali, Imam. 2011. Aplikasi Analisis Multivariate dengan Program IBM SPSS
19, Edisi Kelima. Semarang : UNDIP.
Gujarati, Damodar. 1978. Ekonometrika Dasar. Jakarta : Penerbit Erlangga.
Karim, M.E., Selecting of The Best Regression Equation by Sorting Out Variables.
Institute of statistical research and training: University of Dhaka
Bangladesh.
Krisnansari, D. 2010. Nutrisi dan Gizi Buruk. Journal Mandala of Health. Vol. 4
No.1 : 60-68.
Sanchez pedro et all. 2005. Halving Hunger: It Can Be Done. USA: Earthscan.
Susanti, Y., Pratiwi, H., Sulistijowati, S., dan Liana, T. 2014. M Estimation, S
Estimation, dnd MM Estimation In Robust Regression. International
Journal of Pure and Applied Mathematics. Volume 91, No. 3, hal 349-360.
World Health Organization. 2010. WHO Child Growth Standards and The
Identification of Severe Acute Malnutrition in Infants and Children.
Yohai, V. J. 1987. High Breakdown Point and High Efficiency Robust Estimates
for Regression. Annals of Statistics, Vol. 15, No. 20, 642-656.