DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
INSTITUT PERTANIAN BOGOR
BOGOR
2014
PERNYATAAN MENGENAI SKRIPSI DAN
SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA*
ABSTRACT
Hypertension is often called the silent disease because there are no signs that
a person suffering from the disease. Hypertension has been shut off 9.4 million
citizens of the world each year. In 2025, an estimated 29% of people in the world
affected by hypertension. According to WHO, 40% of developing economies
suffer from hypertension. Based on the results of analysis of binary logistic
regression, it can be seen that the four causes of hypertension. There are age, body
mass index, frequency of burned food, and frequency of fatty foods. After that,
using dominance analysis to determine the main factors causing hypertension. By
using dominance analysis, variables of age as a major risk factor of hypertension.
Skripsi
sebagai salah satu syarat untuk memperoleh gelar
Sarjana Statistika pada
Departemen Statistika
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
INSTITUT PERTANIAN BOGOR
BOGOR
2014
Judul Skripsi : Penerapan Regresi Logistik Biner dan Analisis Dominan untuk
Menganalisis Faktor-Faktor yang Berpengaruh Terhadap
Hipertensi (Studi Kasus: Kabupaten Gunung Kidul)
Nama : Meita Ariani Rubiati
NIM : G14100076
Disetujui oleh
Diketahui oleh
Tanggal Lulus:
PRAKATA
Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta’ala atas
segala karunia-Nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang
dipilih dalam penelitian ini ialah kesehatan, dengan judul Penerapan Regresi
Logistik Biner dan Analisis Dominan untuk Menganalisis Faktor-Faktor yang
Berpengaruh Terhadap Hipertensi (Studi Kasus: Kabupaten Gunung Kidul).
Terima kasih penulis ucapkan kepada Bapak Budi Susetyo dan Bapak Farit
Mochamad Afendi selaku dosen pembimbing dan Ibu Dian Kusumaningrum
selaku penguji luar yang telah menyediakan waktu untuk membimbing dan
memberi arahan kepada penulis. Di samping itu, terima kasih penulis sampaikan
kepada staff dari Badan Penelitian dan Pengembangan Kesehatan dan staff Tata
Usaha Departemen Statistika. Ungkapan terima kasih juga penulis sampaikan
kepada mama, bapak, Mba Iya, Azizah, serta seluruh sahabat atas segala doa,
kasih sayang, dukungan, serta kesabarannya. Terima kasih juga penulis sampaikan
kepada Statistika 47 atas persahabatan dan kebersamaannya.
Semoga karya ilmiah ini bermanfaat.
DAFTAR TABEL vi
DAFTAR LAMPIRAN vi
PENDAHULUAN 1
Latar Belakang 1
Tujuan Penelitian 2
METODE 2
Data 2
Prosedur Analisis Data 2
HASIL DAN PEMBAHASAN 5
Analisis Regresi Logistik Biner 6
Analisis Dominan 9
SIMPULAN DAN SARAN 10
Simpulan 10
Saran 10
DAFTAR PUSTAKA 10
LAMPIRAN 12
RIWAYAT HIDUP 18
DAFTAR TABEL
1 Sifat masing-masing R2 4
2 Peubah penjelas yang nyata terhadap peubah respon 7
3 Ketepatan klasifikasi model 8
4 Nilai rata-rata kontribusi setiap peubah 9
DAFTAR GAMBAR
1 Karakteristik berdasarkan jenis kelamin dan Indeks Massa Tubuh 5
2 Karakteristik berdasarkan tingkat pendidikan dan pekerjaan 6
DAFTAR LAMPIRAN
1 Frekuensi hipertensi berdasarkan peubah penjelas 12
2 Korelasi antar peubah penjelas 14
3 Hasil regresi logistik biner 15
4 Hasil analisis dominan 17
15
PENDAHULUAN
Latar Belakang
Tujuan Penelitian
Tujuan dari penelitian ini adalah mencari faktor-faktor atau peubah penjelas yang
berpengaruh terhadap kecenderungan menderita hipertensi dengan menggunakan analisis
regresi logistik biner dan menentukan peringkat kepentingan peubah penjelas tersebut
dengan menggunakan analisis dominan.
METODE
Data
Data yang digunakan dalam penelitian ini adalah data sekunder hasil Riskesdas
tahun 2007 dari Departemen Kesehatan. Data yang diteliti terdiri dari peubah respon
yaitu responden yang menderita hipertensi dan responden yang tidak menderita hipertensi
dengan 17 peubah penjelas. Peubah penjelas yang digunakan berdasarkan acuan berbagai
literatur mengenai hipertensi sebagaimana pada Lampiran 1. Banyaknya data yang
digunakan adalah 1637 responden.
e p( 0 1 1 p p
)
( )
1 e p( 0 1 1 p p
)
Pendugaan Parameter
Pendugaan parameter dalam model regresi logistik dilakukan dengan
menggunakan metode kemungkinan maksimum yaitu diperoleh dengan menurunkan
fungsi kepekatan peluang bersama (Hosmer and Lemeshow 1989), dengan fungsi
kepekatan peluang bersama ditunjukkan dengan persamaan sebagai berikut:
n n
(1 i)
l( ) ∏ fi ( i ) ∏ ( i ) i (1 ( i ))
i 1 i 1
Parameter i diduga dengan fungsi kepekatan peluang bersama tersebut.
Perhitungan dapat digunakan dengan pendekatan logaritma, sehingga log fungsi
kemungkinannya sebagai berikut :
n
( ) ln l( ) ln {∏ ( i ) i [1 ( i )]1 i }
i 1
Pengujian Kesesuaian Model
Pengujian kesesuaian model dilakukan untuk memeriksa peranan peubah
penjelas terhadap peubah respon dalam model. Menurut Hosmer dan Lemeshow
(1989) pengujian tersebut dilakukan secara simultan dan secara parsial. Pengujian
secara simultan dilakukan dengan menggunakan uji rasio likelihood yang merupakan
pengujian terhadap parameter i dengan hipotesis sebagai berikut:
H0: 1 2 p
0
H1: Minimal ada satu nilai i 0, dengan i 1,2, ,p.
Statistik uji yang digunakan adalah statistik uji -2 ln [ 0 ], dengan 0 adalah
M
nilai likelihood tanpa peubah penjelas dan M adalah nilai likelihood semua peubah
penjelas. Statistik uji G akan mengikuti sebaran 2 dengan derajat bebas p. Kaidah
2
keputusan yang diambil yaitu, jika p( ) maka hipotesis nol ditolak. Pengujian
parameter i secara parsial dilakukan dengan uji Wald dengan hipotesis sebagai
berikut:
H0: i 0 (peubah penjelas ke-i tidak mempengaruhi peubah respon)
H1: i 0 (peubah penjelas ke-i mempengaruhi peubah respon)
dimana i 1,2, ,p. Statistik uji Wald didefinisikan sebagai berikut (Agresti 2002):
̂
i
i
̂( ̂ )
dimana ̂ adalah penduga , ̂ ( ̂ ) adalah penduga galat baku ̂ . Kaidah
i i i i
i
keputusan yang diambil yaitu | | 2 atau nilai p < , maka hipotesis nol ditolak.
4
Interpretasi
Pada model regresi logistik, interpretasi dapat juga dilihat dari nilai rasio
oddsnya. Rasio odds merupakan ukuran untuk melihat seberapa besar kecenderungan
pengaruh peubah-peubah penjelas terhadap peubah responnya (Hosmer dan
Lemeshow 1989). Rasio odds didefinisikan sebagai berikut: (1,0) e p( i ). Rasio
odds dapat diinterpretasikan dengan peluang x 1 pada 1 sebesar kali
dibandingkan 0.
dengan:
i(k) adalah nilai kontribusi penambahan peubah penjelas ke-i ke dalam model dengan
k peubah.
2 2
. a adalah sesudah peubah penjelas masuk ke model-i.
2 2
. b adalah sebelum peubah penjelas masuk ke model-i.
Tingkat kepentingan dapat dilihat secara menyeluruh (completely dominance),
secara kondisional (conditionally dominance), atau secara umum (generally
dominance). Peubah penjelas mendominasi secara menyeluruh jika peubah tersebut
memiliki nilai kontribusi ( i(k) ) lebih besar dari pada peubah lainnya pada setiap
model. Peubah mendominasi secara kondisional jika peubah tersebut memiliki nilai
rata-rata kontribusi di setiap penambahan peubah ( ̅ i(k) ) lebih besar dari peubah
lainnya. Peubah penjelas mendominasi secara umum jika peubah tersebut memiliki
nilai rata-rata kontribusi keseluruhan ( i ) lebih besar dari peubah lainnya. Nilai rata-
∑ ̅ i(k)
rata penambahan kontribusi keseluruhan didefinisikan sebagai berikut: i .
p
Peubah penjelas yang memiliki nilai rata-rata penambahan kontribusi paling besar
akan berada pada peringkat pertama dalam peringkat kepentingan peubah penjelas.
100%
80%
60%
40%
20% Tidak
0% Ya
Perempuan
Berlebih
Kurus
Normal
Obesitas
Laki-laki
100%
Wiraswasta/pedagang
Tamat SLTP
Tamat SLTA
Buruh
Tidak tamat SD
PNS, TNI/Polri
Petani,nelayan
Pegawai BUMN,swasta
Lainnya
Tidak bekerja
Tamat Perguruan Tinggi
Ya
Pendidikan Pekerjaan
semakin menurun dan elastisitas pembuluh darah juga menurun, sehingga menyebabkan
rentannya menderita penyakit hipertensi.
Nilai rasio odds untuk m1(obesitas) pada Tabel 2 dapat dinyatakan bahwa peluang
seseorang yang m1(obesitas) menderita hipertensi 2.164 kali lebih besar dibandingkan
seseorang yang m4(kurus). Nilai rasio odds untuk m2(berat berlebih) dapat diartikan
bahwa peluang seseorang yang m2(berat berlebih) menderita hipertensi sebesar 2.323 kali
lebih besar dibandingkan seseorang yang m4(kurus). Hal tersebut sesuai menurut
Wijayakusuma (2005) bahwa berat tubuh yang meningkat dapat meningkatkan tekanan
darah.
Nilai rasio odds untuk b1(≥ 1 kali hari) dapat dinyatakan bahwa peluang seseorang
yang mengkonsumsi frekuensi makanan dibakar b1(≥ 1 kali/hari) menderita hipertensi
1.635 kali lebih besar dibandingkan seseorang yang mengkonsumsi b5(1 kali/bulan). Nilai
rasio odds untuk b2(3-6 kali/minggu) dapat dinyatakan bahwa peluang seseorang yang
mengkonsumsi b2(3-6 kali/minggu) menderita hipertensi 1.085 kali lebih besar
dibandingkan seseorang yang mengkonsumsi b5(1 kali/bulan).
Nilai rasio odds untuk l1(> 1 kali/hari) dapat dinyatakan bahwa peluang seseorang
yang mengkonsumsi l1(> 1 kali/hari) menderita hipertensi 2.869 kali lebih besar
dibandingkan seseorang yang mengkonsumsi l6(1 kali/bulan). Nilai rasio odds untuk l2(1
kali/hari) dapat dinyatakan bahwa peluang seseorang yang mengkonsumsi l2(1 kali/hari)
menderita hipertensi 3.465 kali lebih besar dibandingkan seseorang yang mengkonsumsi
l6(1 kali/bulan). Nilai rasio odds untuk l3(3-6 kali/minggu) dapat dinyatakan bahwa
peluang seseorang yang mengkonsumsi l3(3-6 kali/minggu) menderita hipertensi 3.239
kali lebih besar dibandingkan seseorang yang mengkonsumsi l6(1 kali/bulan). Menurut
Wijayakusuma (2005) makanan yang berlemak dan berkolesterol tinggi berbahaya bagi
kesehatan karena kolesterol yang berlebihan ini akan menempel pada permukaan sebelah
dalam dinding pembuluh darah dan akan terjadinya penumpukan kolesterol yang
menyebabkan tekanan darah tinggi.
Hubungan antar peubah penjelas dapat diketahui dari nilai koefisien korelasi
masing-masing peubah penjelas. Menurut Gujarati dan Porter (2010) koefisien korelasi
antar peubah penjelas yang berkisar diatas 0.80 mengindikasikan adanya multikolinieritas.
Besarnya korelasi antar peubah penjelas dapat dilihat dari koefisien korelasi Spearman
rank. Korelasi Spearman rank dapat digunakan untuk peubah numerik dan peubah
kategorik (Daniel 1990). Pada lampiran 2 dapat diketahui bahwa antara masing-masing
peubah penjelas memiliki nilai koefisien korelasi kurang dari 0.80 dan dapat diketahui
bahwa tidak ada korelasi antara masing-masing peubah penjelas tersebut.
Prediksi
Aktual Tidak %Benar
Hipertensi
hipertensi
Hipertensi 702 211 76.90
Tidak hipertensi 271 453 62.60
%keseluruhan 70.60
dapat diketahui dari banyaknya dugaan yang tepat berdasarkan contoh. Hasil ini
menunjukkan bahwa dari 913 responden yang menderita hipertensi sebanyak 702 orang
diklasifikasikan dengan benar, sedangkan dari 724 responden yang tidak hipertensi
sebanyak 453 orang diklasifikasikan dengan benar. Secara keseluruhan klasifikasi yang
benar dari 1637 responden sebesar 70.60% dan sisanya sebesar 29.40% menunjukkan
bahwa penderita hipertensi dapat dijelaskan oleh faktor-faktor yang tidak terdapat dalam
model.
Analisis Dominan
Simpulan
Saran
Berdasarkan hasil penelitian ini disarankan agar dilakukan survei yang berkala dan
berkelanjutan agar dapat mengetahui perkembangan mengenai hipertensi. Para peneliti
perlu mengkaji kembali mengenai data tersebut karena dalam survei ini masih banyak
ditemukan data yang tidak lengkap. Selain itu, perlu dilakukan pemeriksaan ketika
melakukan survei di lapangan dan pemeriksaan pada saat memasukkan data.
DAFTAR PUSTAKA
Agresti A. 1990. Categorical Data Analysis. New York (US): John Wiley and Sons. 558p.
Azen R, Traxel N. 2009. Using Dominance Analysis to Determine Predictor Importance
in Logistic Regression [jurnal]. Journal of educational and Behavioral Statistics.
34:319-347.doi: 10.3102/1076998609332754.
Daniel. 1990. Applied Nonparametric Statistics. Boston (US): PWS-KENT Publishing
Company.
[DEPKES] Departemen Kesehatan. 2007. Badan Penelitian dan Pengembangan
Kesehatan. Jakarta (ID).
Gujarati D, Porter D. 2010. Essentials of Econometrics Fourth Edition. New York (US):
The McGraw-Hill Companies,Inc.
Hosmer DW, Lemeshow S. 1989. Applied Logistic Regression, 2nd edition. New York
(US): John Wiley and Sons. 373 p.
Junianto B, Laras AP. Hipertensi Menduduki Penyebab Kematian Pertama di Indonesia
[internet]. VIVA.[diunduh 2014 Agustus 13]. Tersedia dari:
http://life.viva.co.id/news/read/486850-hipertensi-menduduki-penyebab-kematian-
pertama-di-indonesia.
11
Skala Hipertensi
No Peubah Kategori
Pengukuran %Ya %Tidak Total
1 Hipertensi (Y) Nominal 55.77% 44.23% 1637
2 Umur (X1) Rasio
3 Jenis Kelamin (X2) Nominal Laki-laki 59.05% 40.95% 757
Perempuan 52.95% 47.05% 880
4 Pendidikan (X3) Ordinal Tidak tamat SD 53.95% 46.05% 684
Tamat SD 55.37% 44.63% 475
Tamat SLTP 57.53% 42.47% 292
Tamat SLTA 61.29% 38.71% 155
Tamat Perguruan Tinggi 58.06% 41.94% 31
5 Pekerjaan (X4) Nominal Tidak bekerja 48.95% 51.05% 237
Ibu rumah Tangga 47.19% 52.81% 178
PNS, TNI/Polri 60.00% 40.00% 40
Pegawai BUMN,swasta 70.00% 30.00% 20
Wiraswasta/pedagang 55.03% 44.97% 169
Petani,nelayan 56.03% 43.97% 746
Buruh 68.25% 31.75% 211
Lainnya 55.56% 44.44% 36
6 Merokok (X5) Ordinal Ya, setiap hari 56.18% 43.82% 89
Ya, kadang-kadang 57.34% 42.66% 511
Tidak sebelumnya pernah 55.75% 44.25% 931
Tidak pernah sama sekali 48.11% 51.89% 106
7 Melakukan aktivitas Nominal Cukup 48.66% 51.34% 261
sedang (X6) Kurang 57.12% 42.88% 1376
8 Melakukan aktivitas Nominal Cukup 42.26% 57.74% 594
berat (X7) Kurang 63.47% 36.53% 1043
9 Indeks Massa Ordinal Obesitas 61.67% 38.33% 347
Tubuh (X8) Berlebih 56.32% 43.68% 1060
Normal 50.00% 50.00% 108
Kurus 39.34% 60.66% 122
10 Konsumsi buah dan Nominal Cukup 40.45% 59.55% 220
sayur (X9) Kurang 58.15% 41.85% 1417
Frekuensi makanan
11 bumbu Ordinal ≥ 1 kali/hari 56.18% 43.82% 744
penyedap (X10) 3-6 kali/minggu 55.46% 44.54% 678
1-2 kali/minggu 56.16% 43.84% 146
1 kali/bulan 53.62% 46.38% 69
12 Frekuensi minuman Ordinal ≥ 1 kali/hari 65.18% 34.82% 112
kafein (X11) 3-6 kali/minggu 64.13% 35.87% 223
1-2 kali/minggu 64.81% 35.19% 216
< 3 kali/bulan 62.61% 37.39% 115
13
RIWAYAT HIDUP
Penulis dilahirkan di Jakarta pada tanggal 24 Mei 1992 dari pasangan Bapak
Soleman Kurdi dan Ibu Rubiah. Penulis merupakan anak kedua dari tiga
bersaudara.
Penulis menyelesaikan pendidikan dasar di SD Islam Al-Mukhlisin Jakarta
pada tahun 2004. Kemudian menyelesaikan pendidikan menengah pertama pada
tahun 2007 di SMP Negeri 75 Jakarta. Pada tahun 2010 penulis menyelesaikan
pendidikan di SMA Negeri 65 Jakarta dan pada tahun yang sama masuk IPB pada
program studi mayor Statistika melalui jalur Ujian Seleksi Masuk IPB (USMI).
Selama menjadi mahasiswa aktif, penulis aktif berorganisasi di Gamma
Sigma Beta (GSB) IPB 2012/2013 sebagai staff divisi kestari. Penulis juga aktif
dalam berbagai kepanitiaan Nasional seperti Statistika Ria 2012 sebagai
bendahara umum, Pesta Sains Nasional 2011 dan 2012, MPKMB 2011.