RINGKASAN
Identitas Peneliti
Nama Peneliti : Yustiva Drisma Kurniasari
NRP : 1307 100 034
Jurusan : Statistika
Tahap : Sarjana
Dosen Pembimbing : Ir. Sri Pingit Wulandari, M.Si
Judul Penelitian
Permodelan Multivariate Adaptive Regression Splines (MARS) pada Faktor-Faktor Resiko
Kejadian Penyakit Kaki Gajah (Filariasis) di Kabupaten Aceh Timur
1. PENDAHULUAN
1.1 Latar Belakang
Dalam rangka mencapai tujuan pembangunan kesehatan diperlukan adanya kesadaran,
kemauan dan kemampuan semua komponen bangsa untuk mewujudkan rakyat yang sehat.
Kesehatan rakyat dapat menjadi sumber kekuatan suatu bangsa. Negara kuat dari aspek
kesehatan dapat diartikan sebagai Negara Kesatuan Republik Indonesia (NKRI) yang
memiliki ketahanan bangsa yang tangguh dengan basis utamanya dalam wujud semua rakyat
sehat secara fisik, mental dan sosial serta memiliki produktivitas yang tinggi (depkes, 2007).
Di Indonesia masih terdapat banyak penyakit yang dapat merusak kesehatan
masyarakat, bahkan dapat menghilangkan nyawa. Penyakit yang merusak kesehatan
masyarakat terdiri dari penyakit yang menular dan tidak menular. Penyakit yang paling
berbahaya dan ditakuti oleh sebagian besar masyarakat adalah penyakit yang menular, karena
baik sengaja ataupun tidak sengaja masyarakat lain dapat terinfeksi dengan penyakit yang
menular. Salah satu penyakit menular berbahaya di Indonesia adalah penyakit Kaki Gajah
atau bahasa latinnya adalah Filariasis
Filariasis atau biasa disebut dengan penyakit kaki gajah adalah suatu penyakit yang
tergolong penularannya sangat cepat. Penularan penyakit ini disebabkan oleh cacing Filaria
yang ditularkan melalui berbagai jenis nyamuk. Setelah tergigit nyamuk, parasit akan
menjalar dan ketika sampai pada jaringan sistem limfa maka berkembanglah menjadi penyakit
kaki gajah. Penyakit kaki gajah bersifat menahun dan bila tidak mendapatkan pengobatan,
dapat menimbulkan cacat menetap berupa pembesaran kaki, lengan dan alat kelamin baik
perempuan maupun laki-laki. Penyakit kaki gajah bukanlah penyakit yang mematikan, namun
bagi penderita mungkin menjadi sesuatu yang memalukan bahkan dapat mengganggu aktifitas
sehari-hari (http://www.infopenyakit.com/).
Penyakit kaki gajah umumnya banyak terdapat pada wilayah tropis. Menurut info dari
WHO, urutan negara yang terdapat penderita mengalami penyakit kaki gajah adalah Asia
Selatan (India dan Bangladesh), Afrika, Pasifik dan Amerika. Tetapi banyak pula yang terjadi
di negara-negara Asia Tenggara termasuk Indonesia. Di Indonesia penyakit kaki gajah
tersebar luas hampir di seluruh propinsi. Berdasarkan laporan dari hasil survei data Riset
Kesehatan pada tahun 2000 yang lalu tercatat sebanyak 1553 desa di 647 Puskesmas tersebar
di 231 Kabupaten 26 Propinsi sebagai lokasi yang endemis, dengan jumlah kasus kronis 6233
orang. Hasil survei laboratorium terbukti bahwa Mikrofilaria rate sebesar 3,1%, yang
mempunyai pengertian bahwa sekitar enam juta orang sudah terinfeksi cacing filaria dan
sekitar 100 juta orang mempunyai resiko tinggi untuk ketularan karena nyamuk penularnya
tersebar luas (http://www.infeksi.com/).
Pada tahun 2007 Depkes melakukan sasaran pengobatan penyakit menular termasuk
kaki gajah. Sasaran pengobatan yang dilakukan mencapai 30 juta jiwa yang dilakukan di 72
kabupaten di Indonesia (Depkes, 2007). Terdapat delapan propinsi yang memiliki prevalensi
kaki gajah yang melebihi nilai prevalensi Nasional, yaitu NAD (6,4%), Papua Barat (4,5%),
Papua (2,9%), Nusa Tenggara Timur (2,6%), Kepulauan Riau (1,5%), DKI Jakarta dan
Sulawesi Tengah (1,4%), dan Gorontalo (1,2%) (Depkes, 2008). Data Riset Kesehatan tahun
2007 menunjukkan bahwa kabupaten Aceh Timur termasuk dalam kabupaten yang
menyumbangkan presentase terbesar penyakit kaki gajah di Indonesia. Sehingga Kabupaten
Aceh Timur merupakan salah satu daerah endemis yang menjadi sasaran pengobatan penyakit
kaki gajah tahun 2007. Untuk memberantas penyakit kaki gajah sampai tuntas WHO sudah
menetapkan Kesepakatan Global, yakni The Global Goal of Elimination of Lymphatic
Filariasis as a Public Health problem by The Year 2020. Program eliminasi dilaksanakan
melalui pengobatan massal yang dilakukan setahun sekali selama lima tahun di lokasi yang
endemis dan perawatan kasus klinis baik yang akut maupun kronis untuk mencegah kecacatan
dan mengurangi penderitanya.
Dari kejadian penularan penyakit kaki gajah yang semakin bertambah maka
diharapkan perlu adanya kajian teoritis terkait tentang penentuan variabel-variabel yang
berpengaruh terhadap angka kejadian penularan kaki gajah, hal ini dimaksudkan agar jumlah
penderita kaki gajah di Indonesia dapat diminimalkan. Oleh sebab itu, pada penelitian ini
diharapkan dapat diketahui model yang mewakili variabel-variabel yang mempengaruhi
angka kejadian penyakit kaki gajah di Kabupaten Aceh Utara.
Adapun penelitian sebelumnya tentang variabel-variabel yang diduga mempengaruhi
tertularnya penyakit kaki gajah adalah presentase penduduk yang tidur dalam kelambu,
presentase penduduk yang tidur dalam kelambu berinsektisida dan presentase rumah tangga
memelihara hewan peliharaan (Ika, 2008). Sedangkan Agusri (2008) menyimpulkan bahwa
tidak ada hubungan antara status sosial ekonomi, pendidikan, penyuluhan, dan informasi
dengan upaya pencegahan penyakit kaki gajah. Selain itu, Nasrin (2008) menyatakan bahwa
variabel yang terbukti sebagai faktor resiko terhadap kejadian penyakit kaki gajah di
Kabupaten Bangka Barat adalah jenis pekerjaan, tingkat penghasilan, kebiasaan tidak
menggunakan obat anti nyamuk, dan tingkat pengetahuan penyakit kaki gajah. Pada
penelitian ini digunakan pendekatan nonparametrik untuk mendapatkan model yang sesuai
dan akurat
Pemodelan data dengan menggunakan metode parametrik sesuai untuk data yang
sudah diketahui bentuk model dasarnya, selain itu asumsi terkait struktur data juga harus
dipenuhi namun seringkali pelanggaran asumsi terjadi. Sehingga, pendekatan nonparametrik
sering dijadikan alternatif oleh para peneliti. Multivariate Adaptive Regression Spline atau
MARS merupakan pendekatan untuk regresi nonparametrik multivariat yang dikembangkan
oleh Jerome H. Friedman (1991). Metode MARS sendiri merupakan pengembangan dari
Recursive Partition Regression (RPR), dimana metode RPR masih memiliki kelemahan yaitu
model yang dihasilkan tidak kontinu pada knots. MARS merupakan salah satu metode
alternatif untuk pemodelan menggunakan regresi nonparametrik bagi data berdimensi tinggi,
memiliki variabel banyak, serta ukuran sampel yang besar sehingga diperlukan suatu
perhitungan yang rumit. Oleh karena itu, penelitian ini menggunakan MARS yang
diharapakan dapat memperoleh pemodelan terbaik untuk pendekatan nonparametrik (Hidayat,
2003). Penggunaan MARS juga dilakukan oleh Maylita (2009) yang menyatakan bahwa
variabel-variabel yang memberikan kontribusi terhadap penyakit TBC adalah jenis pekerjaan,
umur, kebiasaan merokok, status sosial ekonomi, konsumsi alkohol, dan tingkat pendidikan
1.2 Permasalahan
Permasalahan yang diangkat dalam penelitian ini adalah sebagai berikut.
1. Bagaimana karakteristik dari Rumah Tangga (RT) yang terinfeksi penyakit kaki
gajah?
2. Variabel apa saja yang berpengaruh terhadap angka kejadian penyakit kaki gajah
dalam bentuk model MARS?
3. Bagaimana ketepatan klasifikasi Rumah Tangga (RT) berdasarkan terinfeksi atau
tidaknya penyakit kaki gajah dari model MARS yang telah diperoleh?
2. TINJAUAN PUSTAKA
2.1 Multivariate Adaptive Regression Splines (MARS)
MARS diperkenalkan pertama kali oleh Friedman (1991) untuk pendekatan model
nonparametrik antara variabel respon dan beberapa variabel prediktor pada piecewise regresi.
Piecewise regresi merupakan regresi yang memiliki sifat tersegmen (terpotong-potong). MARS
merupakan pengembangan dari pendekatan Recursive Partition Regression (RPR), dimana
RPR masih memiliki kelemahan yaitu model yang dihasilkan tidak kontinu pada knots.
Beberapa hal yang perlu diperhatikan dalam permodelan MARS adalah knots dan basis
function. Titik knots merupakan titik-titik perubahan pola perilaku data. Knots juga dapat
didefinisikan sebagai akhir dari sebuah subregion data dan awal dari subregion yang lain.
Sedangkan basis function adalah suatu fungsi yang digunakan untuk menjelaskan hubungan
antara variabel dependen dan variabel independen. Fungsi basis ini merupakan fungsi
parametrik yang didefinisikan pada tiap region. Penentuan knots pada MARS tergantung
(otomatis) dari data yakni dengan menggunakan algoritma forward stepwise dan backward
stepwise serta didasarkan pada nilai Generalized Cross Validation (GCV) minimum. Artinya,
titik knots yang dipilih adalah titik knots yang mempunyai nilai GCV minimum. Pemilihan
model yang paling baik adalah dengan melihat nilai GVC dari model yang terbentuk. Model
terbaik adalah model yang memiliki nilai GVC paling kecil atau minimum diantara model-
model lainnya.
Model umum MARS menurut Friedman dapat ditulis sebagai berikut.
[ ]
^ M Km
f ( x) = a0 + ∑ am ∏ sk m. (xv(k ,m) − tk m) + ε i (2.1)
m= 1 k= 1
dimana:
a0 = basis fungsi induk
am = koefisien dari basis fungsi ke-m
M = maksimum basis fungsi (nonconstant basis fungsi)
Km = derajat interaksi
Skm =±1
xv(k,m) = variabel independen
ukm = nilai knots dari variabel independen xv(k,m)
[ ]
Km
dengan, Bm ( x ) = ∏ s km .( xv ( k ,m ) − t km )
k =1
dengan,
Y = (Y1 ,..., Yn ) T , a = ( a1 ,..., a n ) T , ε = (ε1 ,..., ε n ) T
K1 KM
1
∏
k =1
s1m ( x1(1,m ) − t1m ) ... ∏s
k =1
− t Mm )
Mm ( x 1( M ,m )
K1 KM
1
∏s
k =1
1m ( x 2(1,m ) − t1m ) ... ∏
k =1
s Mm ( x 2( M ,m ) − t Mm )
B = . . ... .
. . ... .
. . ... .
K1 KM
1 s Mm ( x n ( M ,m ) − t Mm )
∏s
k =1
1m ( x n (1,m ) − t1m ) ... ∏
k =1
Fungsi dari sebuah region (basis fungsi) merupakan akhir dari algoritma forward
stepwise dengan ketentuan basis fungsi yang sudah ditentukan sebelumnya. Friedman (1991)
menyarankan jumlah maksimum basis fungsi 2-4 kali jumlah variabel prediktor. Maksimum
interaksi 1, 2 atau 3 dengan pertimbangan jika lebih dari 3 akan menghasilkan model yang
sangat kompleks. Minimum jarak antar knot atau minimum observasi antar knot sebesar 10,
20, 50 dan 100 (Hidayat, 2003).
Persamaan (2.1) dapat dijabarkan sebagai berikut:
M
fˆ ( x) = a + ∑ a [ s .( x − u )] +
0 m 1m v (1, m) 1m
m =1
M
+ ∑ a [ s .( x − u )][ s .( x − u )] + (2.3)
m 1m v (1, m) 1m 2m v (2, m) 2m
m =1
M
+ ∑ a [ s .( x − u )][ s .( x −u )][ s .( x − u )] + ...
m 1m v (1, m) 1m 2m v (2, m) 2, m 3m v (3, m) 3m
m =1
fˆ ( x) = a 0 + ∑f
K m =1
i ( xi ) + ∑f
K m =2
ij ( xi , x j ) + ∑f
K m =3
ijk ( x i , x j , x k ) +...
(2.4)
Persamaan (2.4) menunjukkan bahwa penjumlahan pertama meliputi semua basis
fungsi untuk satu variabel, penjumlahan kedua meliputi semua basis fungsi untuk interaksi
antara dua variabel, penjumlahan ketiga meliputi semua basis fungsi untuk interaksi antara
tiga variabel, dan seterusnya. Sehingga dapat diketahui bahwa basis fungsi merupakan
sekumpulan fungsi yang digunakan untuk merepresentasikan informasi yang terdiri atas satu
atau lebih variabel termasuk interaksi antar variabel. Pada dasarnya, basis fungsi
menunjukkan adanya hubungan antara variabel prediktor dengan variabel respon (Anonim,
2001). Persamaan (2.4) merupakan dekomposisi dari analisis varians untuk tabel kontingensi
model MARS. Hasil ini merepresentasikan variabel yang masuk ke dalam model, baik untuk
satu variabel maupun interaksi antar variabel. Misalkan Bj adalah himpunan dari variabel
yang dihubungkan dengan basis fungsi Bj ke-j, maka setiap penjumlahan pertama pada
Persamaan (2.4) dapat dinyatakan sebagai:
f i ( xi ) = ∑ a m Bm ( xi )
Km = 1
(2.5)
fi(xi) merupakan penjumlahan semua basis fungsi untuk satu variabel xi dan merupakan spline
dengan derajat q=1 yang merepresentasikan fungsi univariat. Setiap fungsi bivariat pada
penjumlahan kedua dari (2.5) dapat ditulis menjadi:
fi (jxi, x j ) = ∑ amBm (xi, x j )
Km = 2
(2.6)
fij(xi,xj) merupakan penjumlahan semua basis fungsi dua variabel xi dan xj. Penjumlahan ini
digunakan untuk menghubungkan kontribusi univariat, yang dituliskan sebagai berikut.
f ij* ( x i , x j ) = f i ( x i ) + f j ( x j ) + f ij ( xi , x j ) (2.7)
Untuk fungsi trivariat pada penjumlahan yang ketiga diperoleh dengan menjumlahkan semua
basis fungsi untuk tiga variabel, yang dituliskan sebagai berikut.
fi j(kxi , x j , xk ) = ∑ amBm (xi , x j , xk )
Km = 3
(2.8)
(i, j ,k )∈ V (m)
Penambahan fungsi univariate dan bivariate mempunyai kontribusi dalam bentuk:
f ijk* ( xi , x j , xk ) = f i ( xi ) + f j ( x j ) + f k ( xk ) + f ij ( xi , x j ) + f ik ( xi , xk )
+ f jk ( x j , xk ) + f ijk ( xi , x j , xk )
(2.9)
Penambahan aditif persamaan (2.5) dapat ditunjukkan dengan membuat plot antara fi(xi)
dengan xi sebagai salah satu model aditif. Kontribusi interaksi antara dua variabel dapat
*
divisualisasikan dengan membuat plot antara f ij ( xi , x j ) dengan xi dan xj menggunakan
contour plot. Model dengan interaksi yang lebih tinggi dalam visualisasi dapat dibuat dengan
menggunakan plot dalam beberapa variabel fixed dengan variabel komplemen (Budiantara et
al., 2006).
Sebagai statistik uji untuk mengetahui sejauh mana kelompok-kelompok ini dapat
dipisahkan dengan menggunakan variabel yang ada mempunyai kestabilan dalam ketepatan
klasifikasi digunakan Press’s Q, yang diformulasikan sebagai berikut :
[ N − ( nK )]
2
Pr ess ' s Q =
N ( K − 1) (2.13)
dengan :
N = jumlah total sampel
n = jumlah individu yang tepat diklasifikasikan
K = jumlah kelompok
Nilai dari Press’s Q ini membandingkan antara jumlah ketepatan klasifikasi dengan
total sampel dan jumlah kelompok. Nilainya dibandingkan dengan sebuah nilai kritis (tabel
khi kuadrat dengan derajat bebas 1). Jika nilai dari Press’s Q ini melebihi nilai kritis, maka
klasifikasi dapat dianggap sudah stabil dan konsisten secara statistik (Hair et al., 2006).
3. METODOLOGI PENELITIAN
3.1 Sumber Data
Sumber data yang digunakan adalah data sekunder dari Tim Riset Kesehatan Dasar
(Riskesdas) pada penderita penyakit kaki gajah di Kabupaten Aceh Timur tahun 2007. Data
sekunder yang diperoleh bersumber dari Puslitbang Sistem dan Kebijakan Kesehatan, Badan
Litbangkes Departemen Kesehatan Republik Indonesia.
Tidak
GCV
minimum?
Ya
Penaksiran parameter
Selesai
4. Daftar Pustaka
Agresti, A. (1990). Categorical Data Analysis. New York: John Willey and Sons.
Ahmad, S, et al. 2007. Profil Kesehatan Indonesia 2007. Departemen Kesehatan Republik
Indonesia, Jakarta.
Budiantara, I.N.; Suryadi, F.; Otok, B.W.; Guritno, S. (2006). Pemodelan B-Spline dan
MARS Pada Nilai Ujian Masuk terhadap IPK Mahasiswa Jurusan Disain Komunikasi
Visual UK. Petra Surabaya. Jurnal Teknik Industri, Vol 8 No. 1, Surabaya.
Cox, D.R. dan Snell, E.J. (1989), Analysis of Binary Data. Second Edition. London :
Chapman & Hall.
Dillon, W. R. (1978). On The Performance of Some Multinomial Classification Rules.
Journal Of American Statistical Association, 73, pp.305-313.
Eubank, R. L. (1988). Spline Smoothing and Nonparametric Regression. New York : Marcel
Deker.
Friedman, J.H. (1991). Multivariate Adaptive Regression Splines. The Annals of Statistics,
Vol. 19 No. 1.
Hair J.F, Rolph E. Anderson, Ronald L. Tatham, William C. Black. (2006). Multivariate Data
Analysis. Sixth Edition, Pearson Education Prentice Hall, Inc.
Hardle, W. (1994). Applied Nonparametric Regression. New York : Cambrige University
Press.
Hastie, T., Tibshirani, R. (1990). Generalized Additive Models. Chapman Hall.
Hidayat, S. (2008). Pemodelan Desa Tertinggal Di Jawa Barat Tahun 2005 Dengan
Pendekatan MARS. Tesis Master. (Tidak Dipubilkasikan), Institut Teknologi Sepuluh
Nopember, Surabaya.
Hidayat, U. (2003). Analisis Pengelompokan dengan Metode MARS, Studi Kasus:
Pengelompokan Desa/Kelurahan di Jatim. Tesis Master. (Tidak Dipubilkasikan),
Mahasiswa Jurusan Statistika FMIPA ITS, Surabaya.