Anda di halaman 1dari 86

JURNAL APLIKASI STATISTIKA &

KOMPUTASI STATISTIK

VOLUME 9, NOMOR 1, JUNI 2017 ISSN 2086 – 4132


AKREDITASI NOMOR: 747/Akred/P2MI-LIPI/04/2016

Analisis Regresi Tobit Spasial: Studi Kasus Penggunaan Internet di Pulau Jawa
ANDHIE SURYA MUSTARI dan ISMAINI ZAIN

Generalized Multilevel Linear Model dengan Pendekatan Bayesian untuk Pemodelan Data
Pengeluaran Perkapita Rumahtangga
AZKA UBAIDILLAH, ANANG KURNIA dan KUSMAN SADIK

Faktor-Faktor yang Memengaruhi Foreign Direct Investment (FDI) di Enam Koridor Ekonomi
Indonesia: Market Seeking atau Resource Seeking?
IRIANI TRISNA RAHAYU dan ERNAWATI PASARIBU

Determinan Perilaku Merokok pada Remaja Sekolah di Indonesia


TITIK HARSANTI dan FEBRI WICAKSONO

Persepsi Masyarakat Kelurahan Bukit Duri terhadap Program Normalisasi Kali Ciliwung di
Jakarta Tahun 2017 serta Variabel-Variabel yang Memengaruhinya
LOVERIA CANDRA PUSPITA dan ACHMAD PRASETYO

Named Entity Recognition on A Collection of Research Titles


SITI MARIYAH

UNIT PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT


SEKOLAH TINGGI ILMU STATISTIK Pengantar Redaksi | i
(UPPM-STIS)
JURNAL APLIKASI STATISTIKA &
KOMPUTASI STATISTIK
Jurnal “Aplikasi Statistika dan Komputasi Statistik” memuat karya ilmiah hasil penelitian dan kajian
teori statistik dan komputasi statistik yang diterapkan khususnya pada bidang ekonomi dan sosial
kependudukan, serta teknologi informasi yang terbit dua kali dalam setahun setiap bulan Juni dan
Desember.

Penanggung Jawab: Ketua Sekolah Tinggi Ilmu Statistik

Dewan Redaksi :
Ketua: Dr. Hardius Usman
Anggota: Dr. Nasrudin.
Dr. Ernawati Pasaribu
Mitra Bestari: Prof. Dr. Abuzar Asra
Prof. Dr. Irdam Ahmad
Prof. Nur Iriawan, Ph.D.
Dr. Hari Wijayanto
Dr. Erni Tri Astuti
Setia Pramana, Ph.D.
Pelaksana Redaksi: M. Dokhi, Ph.D.
Dr. Tiodora Hadumaon S.
Dr. I Made Arcana
Dr. M. Ari Anggorowati
Novia Budi Parwanto, Ph.D.

Alamat Redaksi:
Sekolah Tinggi Ilmu Statistik
Jl. Otto Iskandardinata 64C
Jakarta Timur 13330
Telp. 021-8191437

Redaksi menerima karya ilmiah atau artikel penelitian mengenai kajian teori statistik dan komputasi
statistik pada bidang ekonomi dan sosial kependudukan, serta teknologi informasi. Redaksi berhak
menyunting tulisan tanpa mengubah makna substansi tulisan. Isi Jurnal Aplikasi Statistika dan
Komputasi Statistik dapat dikutip dengan menyebutkan sumbernya.

ii | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


PENGANTAR REDAKSI

Puji syukur kehadirat Allah, Tuhan Yang Maha Esa, “Jurnal Aplikasi Statistika dan
Komputasi Statistik” Volume 9, Nomor 1, Juni 2017 dapat diterbitkan. Jurnal kampus STIS ini
dapat terwujud atas partisipasi semua pihak, internal maupun eksternal STIS yang telah
mengirimkan tulisannya, serta mitra bestari.
Semoga artikel dalam jurnal ini dapat menambah pengetahuan para pembaca tentang
penggunaan metode statistika serta komputasi statistik pada berbagai jenis data. Redaksi terus
menunggu artikel-artikel ilmiah selanjutnya dari Bapak/Ibu guna dapat menghasilkan publikasi
yang menjadi salah satu sarana untuk memberikan sosialisasi statistika bagi masyarakat.

Jakarta, Juni 2017


Ketua Dewan Redaksi,

Hardius Usman

Pengantar Redaksi | iii


JURNAL APLIKASI STATISTIKA &
KOMPUTASI STATISTIK
VOLUME 9, NOMOR 1, JUNI 2017
AKREDITASI NOMOR: 747/Akred/P2MI-LIPI/04/2016

DAFTAR ISI
Pengantar Redaksi………………………………………………………..……….…………iii

Daftar Isi……………………………………………………..……………………………….iv

Abstrak..……………………………………………………..…………………………..….v-x

Analisis Regresi Tobit Spasial: Studi Kasus Penggunaan Internet di Pulau Jawa
Andhie Surya Mustari dan Ismaini Zain……………………………………………..…..…1-16

Generalized Multilevel Linear Model dengan Pendekatan Bayesian untuk Pemodelan


Data Pengeluaran Perkapita Rumahtangga
Azka Ubaidillah, dkk…………………..………………………………….……………...17-28

Faktor-Faktor yang Memengaruhi Foreign Direct Investment (FDI) di Enam Koridor


Ekonomi Indonesia: Market Seeking atau Resource Seeking?
Iriani Trisna Rahayu dan Ernawati Pasaribu ……………………………………….…....29-38

Determinan Perilaku Merokok pada Remaja Sekolah di Indonesia


Titik Harsanti dan Febri Wicaksono ..……………………………………………………39-46

Persepsi Masyarakat Kelurahan Bukit Duri terhadap Program Normalisasi Kali


Ciliwung di Jakarta Tahun 2017 serta Variabel-Variabel yang Memengaruhinya
Loveria Candra Puspita dan Achmad Prasetyo …………………………….…………….47-58

Named Entity Recognition on A Collection of Research Titles


Siti Mariyah……………………………………………………………………….........…59-70

iv | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
(Journal of Statistical Application & Statistical Computing)
ISSN 2086 – 4132 Volume 9, Nomor 1, Juni 2017

Kata kunci bersumber dari artikel. Lembar abstrak ini boleh diperbanyak tanpa izin dan biaya

DDC: 315.98
Jurnal Aplikasi Statistika & Komputasi
Andhie Surya Mustari dan Ismaini Zain Statistik, Volume 9, Nomor 1, Juni 2017,
hal 17 – 28
Analisis Regresi Tobit Spasial: Studi Kasus
Penggunaan Internet di Pulau Jawa Abstrak
Data pengeluaran perkapita rumahtangga
Jurnal Aplikasi Statistika & Komputasi merupakan salah satu informasi penting
Statistik, Volume 9, Nomor 1, Juni 2017, sebagai pendekatan untuk mengukur tingkat
hal 1 – 16 kemakmuran dan kesejahteraan di suatu
daerah. Data tersebut sangat diperlukan
Abstrak oleh pemerintah baik di pusat maupun
Dibutuhkan metode khusus untuk daerah dalam merumuskan, melaksanakan
menganalisis data tersensor yang memiliki dan mengevaluasi pelaksanaan
korelasi spasial. Jika menggunakan regresi pembangunan. Penelitian ini akan
linier, akan menghasilkan estimasi menganalisis model yang tepat untuk
parameter yang tidak valid, tidak pemodelan data pengeluaran perkapita
terpenuhinya asumsi normalitas dan rumahtangga yang memperhitungkan
mengaburkan interpretasi model. Model kekhususan data BPS yang memiliki
regresi Tobit spasial digunakan untuk struktur hirarki dan pola distribusi data yang
menganalisis data penggunaan internet di memiliki karakteristik skewed kanan.
Pulau Jawa. Estimasi parameter Pemodelan dilakukan dengan
menggunakan metode MCMC Gibbs menggunakan distribusi Log-normal tiga
sampler dengan pendekatan inferensia parameter (LN3P) dan Log-logistik tiga
Bayesian. Hasilnya, penggunaan internet di parameter (LL3P) dengan struktur satu
Pulau Jawa dipengaruhi oleh persentase tingkat (unilevel) dan dua tingkat
penduduk yang tinggal di daerah perkotaan, (multilevel). Proses pendugaan parameter
persentase penduduk lulusan SMA ke atas, dilakukan dengan metode Markov Chain
rata-rata lama sekolah, persentase rumah Monte Carlo (MCMC) dan algoritma Gibbs
tangga yang memiliki telepon genggam, Sampling. Hasil penelitian menunjukkan
dan persentase desa/kelurahan yang bahwa pada model unilevel, model LL3P
mendapatkan sinyal telepon seluler. lebih baik dari model LN3P. Sedangkan
pada model multilevel, model LN3P lebih
Kata kunci: data tersensor, korelasi spasial, baik dari model LL3P. Hasil penelitian juga
Tobit spasial, MCMC, penggunaan internet menunjukkan model terbaik untuk
pemodelan data pengeluaran perkapita
DDC: 315.98 rumahtangga adalah model multilevel
LN3P dengan intercept sebagai komponen
Azka Ubaidillah, Anang Kurnia dan berhirarki dengan nilai Deviance
Kusman Sadik Information Criterion (DIC) terkecil.

Generalized Multilevel Linear Model Kata kunci : Generalized Multilevel Linear


dengan Pendekatan Bayesian untuk Model, LL3P, LN3P, MCMC, Pengeluaran
Pemodelan Data Pengeluaran Perkapita perkapita rumahtangga.
Rumahtangga
Abstrak | v
DDC: 315.98 Jurnal Aplikasi Statistika & Komputasi
Statistik, Volume 9, Nomor 1, Juni 2017,
Iriani Trisna Rahayu dan Ernawati Pasaribu hal 39 – 46

Faktor-Faktor yang Memengaruhi Foreign Abstrak


Direct Investment (FDI) di Enam Koridor Saat ini merokok telah menjadi masalah
Ekonomi Indonesia: Market Seeking atau kesehatan secara global dan menjadi beban
Resource Seeking? ekonomi yang berat. Di Indonesia, tren
merokok cenderung semakin meningkat
Jurnal Aplikasi Statistika & Komputasi dan kencenderungan ini tidak hanya terjadi
Statistik, Volume 9, Nomor 1, Juni 2017, pada orang dewasa tetapi juga pada remaja.
hal 29 – 38 Penelitian ini bertujuan mengidentifikasi
faktor-faktor yang mempengaruhi perilaku
Abstrak merokok bagi kalangan remaja yang
Pembangunan ekonomi suatu negara sangat bersekolah di Indonesia dengan
tergantung pada besarnya penanaman menggunakan model logistik multivariat
modal asing langsung atau Foreign Direct biner. Analisis dilakukan dengan
Investment (FDI), termasuk di enam menggunakan 5.986 sampel siswa dari
koridor ekonomi Indonesia. Kesenjangan Global Youth Tobacco Survey 2014
kondisi di koridor ekonomi diperkirakan (GYTS) 2014. Hasilnya menunjukkan
akan membawa perbedaan yang bahwa 25% siswa pernah merokok dan 15%
mempengaruhi arus masuk FDI ke dalam siswa saat ini merokok. Peluang siswa
koridor. Penelitian ini menggunakan regresi untuk merokok lebih tinggi di kalangan
data panel untuk menganalisis faktor-faktor anak laki-laki dibandingkan dengan anak
di balik arus masuk FDI di setiap koridor perempuan. Risiko merokok yang lebih
ekonomi dan untuk menentukan tinggi teramati di antara siswa yang
karakteristik FDI di setiap koridor ekonomi. memiliki teman dekat yang merokok
Hasil penelitian menunjukkan bahwa dibandingkan dengan siswa yang tidak
proporsi belanja modal pemerintah, jumlah memiliki teman dekat yang merokok. Siswa
angkatan kerja berpendidikan tinggi, yang salah satu atau kedua orang tuanya
keterbukaan perdagangan, dan proporsi merokok lebih cenderung merokok
ekspor minyak dan mineral hanya dibandingkan dengan siswa yang orang
mempengaruhi arus masuk FDI di beberapa tuanya tidak merokok. Siswa yang pernah
koridor ekonomi. Lebih jauh lagi dapat melihat gurunya merokok atau pernah
diindikasikan bahwa sementara “market melihat orang-orang merokok di rumah
seeking FDI” terjadi di semua koridor mereka dan tempat-tempat umum lebih
ekonomi Indonesia, “resource seeking cenderung merokok dibandingkan dengan
FDI” hanya ditemukan di koridor ekonomi mereka yang tidak pernah melihat gurunya
Sulawesi, Maluku dan Papua. merokok atau tidak pernah melihat orang
merokok di rumah mereka dan tempat
Kata kunci: FDI, Koridor Ekonomi, data umum. Temuan ini menunjukkan bahwa
panel, market seeking, resource seeking penegakan peraturan untuk mengurangi
aksesibilitas rokok diperlukan untuk
mengekang penggunaan rokok di kalangan
DDC: 315.98 siswa. Selain itu, intervensi dan kampanye
pendidikan yang menargetkan siswa
Titik Harsanti dan Febri Wicaksono sekolah menengah juga diperlukan.

Determinan Perilaku Merokok Pada Kata kunci: Tembakau, Merokok, Sekolah,


Remaja Sekolah di Indonesia Remaja, Indonesia

vi | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


DDC: 315.98 DDC: 315.98

Loveria Candra Puspita dan Achmad Siti Mariyah


Prasetyo
Named Entity Recognition on A
Persepsi Masyarakat Kelurahan Bukit Duri Collection of Research Titles
terhadap Program Normalisasi Kali
Ciliwung di Jakarta Tahun 2017 serta Jurnal Aplikasi Statistika & Komputasi
Variabel-Variabel yang Memengaruhinya Statistik, Volume 9, Nomor 1, Juni 2017,
hal 59 – 70
Jurnal Aplikasi Statistika & Komputasi
Statistik, Volume 9, Nomor 1, Juni 2017, Abstrak
hal 47 – 58 Judul dapat membantu pembaca untuk
mendapatkan sudut pandang universal dari
artikel tersebut sebagai pemahaman awal
Abstrak sebelum membaca konten secara keseluruhan.
Salah satu cara menangani masalah banjir Pada penelitian teknis, judul memuat informasi
adalah melakukan program normalisasi sungai. penting. Dalam penelitian ini, kami
Namun, tidak semua masyarakat menerima mengembangkan teknik ekstraksi informasi
program ini. Untuk itu, ingin diketahui persepsi untuk mengenali dan mengekstrak masalah,
masyarakat terhadap normalisasi Kali metode, dan domain penelitian yang terdapat
Ciliwung dan menganalisa variabel-variabel dalam judul. Kami menerapkan pendekatan
yang memengaruhinya. Data persepsi supervised learning pada 671 judul penelitian
diperoleh melalui survei dengan pendekatan dalam bidang ilmu komputer dari beragam
rumahtangga di Kelurahan Bukit Duri yang jurnal online dan prosiding seminar
kemudian dianalisis dengan regresi logistik. internasional. Kami melakukan beberapa
Hasil penelitian menunjukkan bahwa 28 persen percobaan dengan skema yang berbeda untuk
rumahtangga sekitar sungai dan 22 persen mempelajari pengaruh fitur dan kinerja
rumahtangga bukan sekitar sungai menolak algoritma. Kami menguji fitur kontekstual, fitur
normalisasi. Persepsi rumahtangga sekitar sintaksis, dan fitur bag of words menggunakan
sungai secara signifikan dipengaruhi oleh jenis Naïve Bayes dan Maximum Entropy. Classifier
kelamin, keikutsertaan organisasi, Naïve Bayes yang belajar dari kelompok set
mendapatkan sosialisasi, dan pengeluaran fitur pertama berhasil memprediksi kategori
perkapita. Sedangkan persepsi rumah tangga masing-masing token dalam dataset judul.
yang tinggal bukan di sekitar sungai Keakuratan dan nilai f1-score untuk setiap kelas
dipengaruhi status pekerjaan, keikutsertaan lebih dari 0,80 karena kelompok pertama set
organisasi, dan mendapatkan sosialisasi. fitur mempertimbangkan lokasi token dalam
sebuah kalimat, memperhatikan token sekitar
Kata kunci : persepsi, normalisasi sungai, dan tag POS dari beberapa token sebelum dan
regresi logistik sesudah. Sementara classifier Naïve Bayes yang
dipelajari dari kelompok kedua dari rangkaian
fitur lebih tepat mengklasifikasikan token frase
daripada token kata.

Kata kunci: research titles, named entity


recognition, information extraction, contextual
features, naïve bayes classifier.

Abstrak | vii
viii | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
JURNAL APLIKASI STATISTIKA & KOMPUTASI STATISTIK
(Journal of Statistical Application & Statistical Computing)
ISSN 2086 – 4132 Volume 9, Nomor 1, Juni 2017

Kata kunci bersumber dari artikel. Lembar abstrak ini boleh diperbanyak tanpa izin dan biaya

DDC: 315.98
Jurnal Aplikasi Statistika & Komputasi
Andhie Surya Mustari dan Ismaini Zain Statistik, Volume 9, Nomor 1, Juni 2017,
hal 17 – 28
Analisis Regresi Tobit Spasial: Studi Kasus
Penggunaan Internet di Pulau Jawa Abstract
Household per capita expenditure data is
Jurnal Aplikasi Statistika & Komputasi one of the important information as an
Statistik, Volume 9, Nomor 1, Juni 2017, approach to measure the level of prosperity
hal 1 – 16 in an area. Such data is needed by the
government, both at the central and
Abstract regional levels in formulating,
Special method is required for analyzing implementing and evaluating the
censored data with spatial dependence. implementation of development programs.
Using linear regression will results in This research is aimed at modeling the
invalid parameter estimations, normality household per capita expenditure data
assumption violations, and obscure the which takes into account the specificity of
model interpretation. Spatial Tobit BPS data which has a hierarchical
regression model is used to analize the data structure, and data distribution pattern
of internet usage in Java. MCMC Gibbs which has the right skewed characteristic.
sampler method with Bayesian inference The modeling is done by using the three
approach was used for parameter parameters of Log-normal distribution
estimation. As a result, internet usage in (LN3P) and the three parameters of Log-
Java Island is influenced by the percentage logistics (LL3P) with a single level
of population living in urban areas, the (unilevel) and two levels (multilevel)
percentage of population graduated from structure. The parameter estimation
senior high school, the average length of process is done by Markov Chain Monte
school, the percentage of households with Carlo (MCMC) method and Gibbs
mobile phones, and the percentage of Sampling algorithm. The results showed
villages receiving cell phone signal. that on the unilevel model, the LL3P model
is better than the LN3P model. While in
Keywords: censored data, spatial multilevel model, LN3P model is better than
dependence, spatial Tobit, MCMC, internet LL3P model. The results also show that the
usage best model for modeling household per
capita expenditure data is the LN3P
multilevel model with the smallest Deviance
DDC: 315.98 Information Criterion (DIC) value.

Azka Ubaidillah, Anang Kurnia dan Keywords: Generalized Multilevel Linear


Kusman Sadik Model, LL3P, LN3P, MCMC, Household
per capita expenditure.
Generalized Multilevel Linear Model
dengan Pendekatan Bayesian untuk
Pemodelan Data Pengeluaran Perkapita
Rumahtangga
Abstrak | ix
DDC: 315.98 DDC: 315.98

Iriani Trisna Rahayu dan Ernawati Pasaribu Titik Harsanti dan Febri Wicaksono

Faktor-Faktor yang Memengaruhi Foreign Determinan Perilaku Merokok pada


Direct Investment (FDI) di Enam Koridor Remaja Sekolah di Indonesia
Ekonomi Indonesia: Market Seeking atau
Resource Seeking? Jurnal Aplikasi Statistika & Komputasi
Statistik, Volume 9, Nomor 1, Juni 2017,
Jurnal Aplikasi Statistika & Komputasi hal 39 – 46
Statistik, Volume 9, Nomor 1, Juni 2017,
hal 29 – 38 Abstract
Smoking is a global public health concern
Abstract and it imposes a heavy economic burden.
The economic development of a country However, the trend of smoking in Indonesia
depends on the amount of foreign direct seems to be increasing and the magnitude
investment (FDI), including in the of the problem affects not only adults but
Indonesian six economic corridors. The also adolescents. This paper identifies
huge gaps of conditions in economic cigarette smoking determinants among
corridors are expected to differences school adolescents in Indonesia, using a
infactors affecting the FDI-inflow into the multivariate binary logistic model. The
corridors. This study uses a panel data analysis uses 5,986 samples of students
regression to analyze factors behind the from the 2014 Indonesia Global Youth
FDI-inflow in each economic corridor and Tobacco Survey (GYTS). The results show
to determine the FDI characteristic in each that 25% of the students have ever smoked
economic corridor. It shows that the and 15% of students are currently smoking.
proportion of government capital The students’ odds of smoking are higher
expenditure, number of highly-educated for boys compared to girls. Higher risk of
labor force, trade openness, and the smoking is observed among the students
proportion of oil and mineral export affect who have closed-peer smoking compared to
the FDI-inflow only in some economic students who don’t have closed-peer
corridors. Furthermore, it indicates that, smoking. Students whose one or both
while market seeking FDI occurred in all parents are smoking are more likely to
Indonesian economic corridors, resource smoke compared to whose parents are not
seeking FDI was only found in Sulawesi, smoking. Students who have seen their
Maluku and Papua economic corridors.. teacher smoking or have seen people
smoking in their house and public places
Key words: Foreign Direct Investment are more likely to smoke compared to who
(FDI), Indonesian economic corridors, haven’t ever seen their teacher smoking or
panel data regression, market seeking, haven’t ever seen people smoking in their
resource seeking house and public places. These findings
suggest that enforcement of legislations to
decrease accessibility of cigarettes are
necessary to curb the cigarette use among
students. Beside that the interventions and
education campaigns that target secondary
school students are also needed.

Keywords: Tobacco, Smoking, School,


Adolescent, Indonesia

x | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


DDC: 315.98 DDC: 315.98

Loveria Candra Puspita dan Achmad Siti Mariyah


Prasetyo
Named Entity Recognition on A Collection
Persepsi Masyarakat Kelurahan Bukit Duri of Research Titles
terhadap Program Normalisasi Kali
Ciliwung di Jakarta Tahun 2017 serta Jurnal Aplikasi Statistika & Komputasi
Variabel-Variabel yang Memengaruhinya Statistik, Volume 9, Nomor 1, Juni 2017,
hal 59 – 70
Jurnal Aplikasi Statistika & Komputasi
Statistik, Volume 9, Nomor 1, Juni 2017, Abstract
hal 47 – 58 The title can help the reader to get the
universal point of view of the article as the
Abstract initial understanding before reading the
River normalization program is one of the content as a whole. On technical research
ways to handle flood problems. However, papers, the title states essential
not all communities accept this program. information. In this study, we aim to
For that, we want to know the public develop information extraction techniques
perception towards normalization of to recognize and extract problem, method,
Ciliwung River and analyze the variables and domain of research contained in a title.
that influence it. Perception data was We apply supervised learning on 671
obtained through survey with household research titles in computer science from
approach in Bukit Duri Village which then various online journals and international
analyzed by logistic regression. The results conference proceedings. We conducted
show that 28 percent of households around some experiments with different schemas to
the river and 22 percent of households not discover the influence of features and the
around the river reject normalization. performance of the algorithm. We examined
Household perceptions around the river contextual, syntactic, and the bag of words
are significantly influenced by sex, feature sets using Naïve Bayes and
organizational participation, socialization, Maximum Entropy. The Naïve Bayes
and per capita expenditure. The non-rivers classifier learned from the first group of the
are influenced by employment status, feature set is successful in predicting
organizational participation, and category of each token in title dataset. The
socialization. accuracy and f1-score for each class are
more than 0.80 since the first group of
Keywords: perception, river normalization, feature sets considers the location of a
logistic regression token within a sentence, considers the token
and POS tag of some tokens before and
after and deliberates the rules of a token.
While the Naïve Bayes classifier learned
from the second group of the feature set is
more appropriate classifying a phrase
token than a word token.

Keywords: research titles, named entity


recognition, information extraction,
contextual features, naïve bayes classifier

Abstrak | xi
ANALISIS REGRESI TOBIT SPASIAL :
Studi Kasus Penggunaan Internet di Pulau Jawa

Andhie Surya Mustari1, Ismaini Zain2


1
Badan Pusat Statistik, email: andhie@bps.go.id
2
Institut Teknologi Sepuluh Nopember,
email: andhie@bps.go.id,2 ismaini_z@statistika.its.ac.id
1

Abstrak

Dibutuhkan metode khusus untuk menganalisis data tersensor yang memiliki korelasi spasial. Jika
menggunakan regresi linier, akan menghasilkan estimasi parameter yang tidak valid, tidak terpenuhinya
asumsi normalitas dan mengaburkan interpretasi model. Model regresi Tobit spasial digunakan untuk
menganalisis data penggunaan internet di Pulau Jawa. Estimasi parameter menggunakan metode
MCMC Gibbs sampler dengan pendekatan inferensia Bayesian. Hasilnya, penggunaan internet di Pulau
Jawa dipengaruhi oleh persentase penduduk yang tinggal di daerah perkotaan, persentase penduduk
lulusan SMA ke atas, rata-rata lama sekolah, persentase rumah tangga yang memiliki telepon genggam,
dan persentase desa/kelurahan yang mendapatkan sinyal telepon seluler.

Kata kunci: data tersensor, korelasi spasial, Tobit spasial, MCMC, penggunaan internet

Abstract

Special method is required for analyzing censored data with spatial dependence. Using linear
regression will results in invalid parameter estimations, normality assumption violations, and obscure
the model interpretation. Spatial Tobit regression model is used to analize the data of internet usage in
Java. MCMC Gibbs sampler method with Bayesian inference approach was used for parameter
estimation. As a result, internet usage in Java Island is influenced by the percentage of population living
in urban areas, the percentage of population graduated from senior high school, the average length of
school, the percentage of households with mobile phones, and the percentage of villages receiving cell
phone signal.

Keywords: censored data, spatial dependence, spatial Tobit, MCMC, internet usage

Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 1


PENDAHULUAN (BPS, 2011), suatu nilai yang setara dengan
jumlah akun facebook yang dibuat oleh
Menggunakan model regresi linier
penduduk Indonesia pada tahun 2011
klasik untuk analisis data tersensor yang
(Socialbaker, 2011).
memiliki korelasi spasial merupakan
Dibutuhkan metode khusus untuk
keputusan yang kurang tepat. Istilah data
melakukan analisis penggunaan internet,
tersensor digunakan untuk menjelaskan
dengan asumsi bahwa data penggunaan
sekelompok data yang memiliki sejumlah
internet di Pulau Jawa merupakan data
nilai yang tidak diketahui pada batas atas
tersensor yang memiliki korelasi spasial.
atau bawahnya. Long (1997) menjelaskan
Fischer dan Getis (2010) mengatakan bahwa
bahwa jika menggunakan model regresi
pemodelan data tersensor yang melibatkan
linier pada keseluruhan data tersensor, akan
wilayah sebaiknya menggunakan analisis
menghasilkan nilai parameter yang
spasial, metode yang paling sesuai adalah
overestimates pada slope dan
regresi Tobit spasial. Selain itu, Lee (2010)
underestimates pada intercept. Sedangkan
juga menyatakan bahwa pendekatan Tobit
jika menghilangkan atau memotong
spasial lebih disarankan untuk analisis
observasi yang nilainya tidak diketahui,
wilayah yang melibatkan data tersensor.
akan menghasilkan koefisien parameter
Analisis regresi Tobit spasial digunakan
yang underestimates pada slope dan
apabila variabel respon pada model spasial
overestimates pada intercept. Data terpotong
melibatkan data yang diyakini memiliki nilai
menyebabkan terjadinya korelasi antara
tersensor (LeSage & Pace, 2009).
variabel prediktor dengan residual, sehingga
Penelitian ini bermaksud untuk
menghasilkan estimasi yang tidak konsisten.
membentuk model regresi Tobit spasial dan
Efek korelasi spasial dapat muncul pada
mencari metode estimasi parameter dari
pembentukan model regresi linier yang
model regresi Tobit spasial. Data yang
menggunakan data kewilayahan (cross
digunakan sebagai variabel respon adalah
section data). Hal tersebut mengakibatkan
persentase penduduk umur 5 tahun ke atas
tidak terpenuhinya asumsi error yang
yang mengakses internet selama tiga bulan
independen dan identik berdistribusi normal,
terakhir di pulau Jawa pada tahun 2010.
sehingga menghasilkan estimasi parameter
Sensor diberikan kepada wilayah
yang tidak valid dan mengaburkan
kabupaten/kota dengan persentase pengguna
interpretasi model (Marsh, Mittelhammer, &
internet lebih besar dari 16 persen, yang
Huffaker, 2000). Korelasi spasial dapat
dianggap sebagai batas minimal persentase
diamati dari mengelompoknya besaran nilai
pengguna internet yang ingin dicapai oleh
tertentu pada data yang berasal dari wilayah
suatu kabupaten/kota.
yang berdekatan, misalnya data tingkat
penggunaan internet kabupaten/kota di
Pulau Jawa. METODOLOGI
Tingginya tingkat penggunaan internet a. Tinjauan Referensi
di Pulau Jawa terutama ditemukan di kota-
kota besar sebagai pusat jasa pendidikan dan Model Regresi Tobit
hiburan, seperti DKI Jakarta, Yogyakarta, Misalkan adalah suatu variabel
Bandung, dan Surabaya, kemudian diikuti respon dengan informasi yang lengkap dan
oleh wilayah kabupaten/kota lain di adalah data sampel dari , maka variabel
sekitarnya. Fenomena dependensi spasial ini respon yang tersensor dapat didefinisikan
dapat diaplikasikan untuk analisis data sebagai berikut:
tersensor yang memiliki korelasi spasial,
dimana kabupaten/kota dengan penggunaan
internet kategori tinggi dapat dianggap (1)
sebagai data yang tidak diketahui nilainya.
Sebanyak 34 dari 118 kabupaten/kota di
Pulau Jawa memiliki persentase pengguna
internet yang lebih tinggi daripada 16 persen
2 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
dimana , merupakan suatu digambarkan sebagai wilayah gelap pada
konstanta batasan, dan adalah banyaknya kurva. Jika nilai yang tidak diketahui
observasi (Tobin, 1958)1. tersebut dipotong, maka sebagian informasi
Jika nilai tidak diketahui ketika yang dapat menjelaskan populasi akan
, maka mengandung suatu hilang dimana kurva distribusi menjadi lebih
variabel latent yang tidak dapat diamati pada runcing (panel B). Panel C menggambarkan
seluruh range-nya. Panel A pada Gambar data tersensor yang mengelompok pada nilai
2.1 memperlihatkan distribusi dari sehingga tidak merubah informasi
, dengan nilai variabel latent berkaitan distribusi populasi.

Gambar 1. Ilustrasi Variabel Latent, Terpotong, dan Tersensor (Long, 1997)

Model Tobit dibentuk dengan terlebih menggunakan data cross section sebagai
dahulu mengasumsikan adanya hubungan berikut:
linier antara dengan variabel prediktor
yang dinyatakan dengan: (4)
(2) dimana , merupakan vektor
variabel respon yang memiliki korelasi
dimana , , spasial, adalah matriks variabel prediktor,
adalah dan adalah vektor parameter regresi.
vektor variabel prediktor, Adapun adalah koefisien korelasi spasial
adalah vektor lag dari variabel respon, merupakan
parameter, dan merupakan banyaknya koefisien korelasi spasial error, dan
variabel, dengan mengandung variabel merupakan matriks penimbang spasial
latent yang mewakili nilai tersensor2. Nilai dengan elemen diagonalnya bernilai nol.
tersensor tersebut bisa lebih kecil dari suatu Persamaan ini juga biasa disebut sebagai
batas bawah ( ), lebih besar dari model regresi spatial autoregresive moving
batas atas ( ), atau keduanya. average (SARMA).
Ketika tersensor pada batas atas ,
, maka model regresi Tobit ,
dinyatakan dengan persamaan sebagai ,
berikut:

(3) , dan

Model Regresi Spasial


Pada tahun 1988, Anselin
mengembangkan bentuk umum dari model
regresi spasial (general spatial model)

1 2
Model regresi Tobit pertama kali diperkenalkan oleh Sebagaimana dijelaskan oleh Long (1997) dan
James Tobin (1958), yang dijelaskan kembali oleh Greene (2008).
Long (1997), DeMaris (2004), Greene (2008), dan
Lee (2010).
Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 3
1992). LeSage (1999) menjelaskan bahwa
algoritma MCMC Gibbs sampler akan
memberi kemudahan estimasi parameter
untuk model regresi Tobit spasial daripada
Persamaan (4) di atas menjadi bentuk model harus memecahkan sejumlah persamaan
regresi spasial lag ketika , yang integral pada metode maksimum likelihood.
menjelaskan terjadinya efek korelasi spasial Metode MCMC Gibbs sampler bertujuan
antar lag variabel respon. Ketika , untuk mencari nilai estimasi dari
persamaan (4) menjadi bentuk model regresi menggunakan suatu distribusi posterior
spasial error, yang menjelaskan terjadinya bersyarat, dimana nilai lainnya
efek korelasi spasial antar lag variabel diasumsikan telah diketahui. Distribusi
respon dan antar lag variabel prediktor. posterior dari parameter ditentukan
Statistik uji Lagrange digunakan untuk melalui prinsip dari teorema Bayes yang
menentukan bentuk dari model regresi dinyatakan oleh:
spasial (Anselin, 1999).
Untuk melihat ada atau tidaknya efek
korelasi spasial lag, digunakan hipotesis (7)
lawan dengan statistik dimana merupakan fungsi likelihood
uji Lagrange Multiplier atau LM-lag Test dari , merupakan distribusi marginal
sebagai berikut: dari yang tidak melibatkan parameter, dan
merupakan distribusi prior dari yang
(5)
diperoleh dari penelitian sebelumnya
Untuk melihat adanya atau tidaknya efek maupun berdasarkan kajian teoritis atas
spasial error, digunakan hipotesis masalah yang sedang diteliti (Casella &
lawan dengan statistik uji LM-err Berger, 2002).
Test sebagai berikut: Hastings (1970) mengembangkan
metode Metropolis untuk mencari estimasi
(6)
parameter melalui suatu nilai inisiasi
dimana , , awal , yang didasari oleh distribusi
kandidat dimana nilai
diketahui. Nilai dari dibangkitkan dari
distribusi kandidat, kemudian terima
, dan . Statistik uji ini sebagai jika .
mengikuti distribusi asimtotik , Dimana dan
sehingga ditolak apabila
atau p-value lebih kecil dari nilai .
Markov Chain Monte Carlo (MCMC)
(8)
MCMC merupakan suatu teknik
metode simulasi yang membangkitkan Penelitian Sebelumnya
sejumlah sampel dari distribusi data yang Penelitian yang menggunakan model
telah diketahui (Chib & Greenberg, 1996). regresi Tobit spasial di antaranya dilakukan
Ide dasar dari teknik MCMC adalah oleh Langyintuo dan Mekuria (2008) yang
daripada menghitung suatu fungsi kepadatan menggunakan metode maksimum likelihood
peluang , lebih baik mengambil untuk membentuk model Tobit SARMA
sampel random dalam jumlah besar dari pada data petani di Mozambique. Kaliba
untuk mengetahui bentuk (2002) mengembangkan model Tobit
probabilitas tersebut secara tepat. Dengan SARMA menggunakan modul aplikasi
ukuran sampel random yang cukup besar, Maximum Likelihood 4 dari paket program
nilai rata-rata dan standar deviasinya dapat GAUSS (dikembangkan oleh Aptech
dihitung secara akurat (Casella & George, Systems, 1995) pada data pedesaan di
4 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Tanzania. Sementara LeSage dan Pace tinggal satu rumah, umur, tingkat
(2009) menggunakan data simulasi yang pendidikan, dan status pekerjaan
dibangkitkan oleh Koop untuk membentuk (Michailidis, Partalidou, Nastis,
model Tobit spasial menggunakan Klavdianou, & Charatsari, 2011).
pendekatan Bayesian MCMC (Markov Berdasarkan hasil-hasil pada
Chain Monte Carlo) dengan algoritma penelitian terdahulu, model regresi Tobit
Gibbs Sampling. Adapun penelitian yang spasial yang dibangun pada penelitian ini
menggunakan model Tobit spasial pada data akan menggunakan algoritma MCMC
teknologi informasi dan komunikasi (TIK) sebagai metode estimasi parameternya.
belum pernah ditemukan. Tingkat penggunaan internet di
Pembangunan TIK suatu negara kabupaten/kota di Pulau Jawa digunakan
memiliki hubungan yang positif dengan sebagai variabel respon dengan variabel-
pertumbuhan ekonomi. Artinya, variabel prediktor sebagai berikut;
pembangunan TIK akan memberikan efek persentase penduduk yang tinggal di daerah
berantai kepada meningkatnya pertumbuhan perkotaan, persentase penduduk usia muda,
ekonomi (Kominfo, 2010). Rao dan Pattnaik persentase penduduk lulusan SMA ke atas,
(2006) menyatakan bahwa pertumbuhan rata-rata lama sekolah, persentase rumah
TIK telah membuka kesempatan bagi tangga yang memiliki komputer, persentase
masyarakat untuk lebih memanfaatkan rumah tangga yang memiliki telepon seluler,
fasilitas pembangunan sosial ekonomi dan dan persentase desa/kelurahan yang
budaya secara lebih modern. Pembangunan mendapatkan sinyal telepon seluler.
TIK memberikan pengaruh ekonomi yang b. Metode Analisis
luas, baik secara langsung maupun tidak
langsung, meningkatkan kesejahteraan dan Sumber Data dan Variabel Penelitian
pembangunan fasilitas sosial ekonomi (ITU, Sumber data yang digunakan dalam
2010). Akses internet merupakan indikator penelitian ini adalah data olahan hasil
yang paling merepresentasikan tingkat Susenas 2010 dan Podes 2008 yang
pembangunan TIK suatu negara, selain dikumpulkan oleh Badan Pusat Statistik
pertumbuhan ekonomi sektor (BPS). Matriks penimbang spasial
telekomunikasi, kepemilikan telepon seluler disusun menggunakan metode queen
atau penguasaan komputer. contiguity, yaitu daerah kabupaten/kota
Menggunakan data dari 154 negara, yang saling berbatasan wilayah akan
Howard dan Mazaheri (2009) menemukan memiliki korelasi spasial sedangkan yang
bahwa kesenjangan penggunaan TIK saling terpisah tidak memiliki korelasi. Nilai
(telepon seluler, komputer, dan bandwidth jika daerah dan saling
internet) dipengaruhi oleh; investasi asing,
berbatasan wilayah, menjadi jika
perdagangan, jumlah penduduk, populasi
perkotaan, literacy rate, konsumsi, telepon tidak saling berbatasan. Adapun peta digital
kabel, serta sembilan variabel lain yang yang digunakan berdasarkan hasil kegiatan
menjelaskan regulasi pemerintah. Andonova updating peta Sensus Penduduk 2010.
dan Serrano (2007) menjelaskan bahwa Objek penelitian yang dijadikan
perkembangan TIK dan pertumbuhan sebagai variabel respon adalah tingkat
pemanfaatan internet lebih banyak penggunaan internet di 118 kabupaten/kota
dipengaruhi oleh faktor perhatian di Pulau Jawa, yaitu persentase penduduk
pemerintah dan regulasi yang berlaku di usia 5 tahun ke atas yang pernah mengakses
wilayah tersebut. Michailidis dkk. internet dalam tiga bulan terakhir. Sensor
mengungkapkan bahwa pengguna internet di diberikan kepada wilayah kabupaten/kota
pedesaan Yunani dipengaruhi oleh tingkat dengan persentase penduduk pengguna
pendapatan, harga dari akses internet, internet di atas 16 persen dengan
kepemilikan PC, tempat tinggal, serta menganggap nilai pada nilai
variabel sosial demografi seperti; jenis . Adapun variabel prediktor yang
kelamin, jumlah penduduk muda yang digunakan adalah sebagai berikut:

Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 5


: Persentase penduduk yang tinggal di statistik uji Breusch-Pagan (BP) dengan
daerah perkotaan. hipotesis sebagai berikut:
: Persentase penduduk usia muda (13-
24 tahun). (homoskedastisitas)
: Persentase penduduk lulusan SMA ke minimal ada satu
atas. (heteroskedastisitas)
: Rata-rata lama sekolah. Nilai dari BP-Test adalah sebagai berikut:
: Persentase rumah tangga yang (12)
memiliki komputer. dengan elemen vektor adalah
: Persentase rumah tangga yang
memiliki telepon seluler. , dimana adalah residual
: Persentase desa/kelurahan yang observasi ke- hasil
regresi linier,
mendapatkan sinyal telepon seluler. , , adalah
Model Regresi Tobit Spasial matriks dari observasi dengan
elemen kolom pertama merupakan vektor
Model regresi Tobit spasial satu, dan adalah jumlah variabel prediktor
merupakan penerapan model regresi spasial (Breusch & Pagan, 1979). ditolak apabila
pada data yang tersensor. Sehingga dengan .
menggabungkan persamaan (4) ke dalam
(1), akan diperoleh suatu model umum Melengkapi Data Tersensor
regresi Tobit spasial sebagaimana berikut. Estimasi parameter model regresi
 y* = ( I − W )−1 Xβ Tobit spasial dilakukan dengan asumsi awal
 i
yi =  + ( I − W ) ( I − W )  jika yi* < 
−1 −1
bahwa variabel respon merupakan data
 jika yi*   dengan informasi yang lengkap, tidak

tersensor, dan memiliki korelasi spasial.
(9)
Padahal sesuai persamaan (1), data yang
dimana merupakan suatu nilai konstanta
memiliki informasi lengkap adalah variabel
batasan yang diberikan kepada jika
respon yang mengikuti distribusi normal
tersensor, . Persamaan
. Nilai dari ketika
merupakan observasi yang tidak diketahui
merupakan model umum dari regresi spasial atau dianggap sebagai variabel latent.
yang menjadi spasial lag ketika dan Sehingga nilainya harus dilengkapi
menjadi spasial error ketika , dimana menggunakan suatu nilai . Variabel
dengan merupakan respon yang lengkap kemudian
pengali yang menyatakan heterogenitas dari didefinisikan sebagai berikut:
varians error. Pada kondisi (13)
homoskedastisitas, matriks menjadi
(LeSage, 2000). Melengkapi observasi tersensor
Apabila nilai dan , dilakukan dengan cara membangkitkan
persamaan (9) menjadi model regresi Tobit variabel random yang berdistribusi normal
spasial lag sebagai berikut: . Nilai merupakan elemen ke-
dari vektor yang
(10)
digunakan untuk mengganti observasi
Apabila nilai dan , menjadi
model regresi Tobit spasial error:

(11)
Pengujian heteroskedastisitas untuk
menentukan matrik menggunakan

6 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


tersensor ketika . Menurut LeSage variabel prediktor dimasukkan ke dalam
(1999), nilai rata-rata dari 3: model, digunakan statistik uji Wald dengan
(14) hipotesis sebagai berikut:
dengan nilai varians dari adalah: :
: ,
(15) Statistik uji yang digunakan adalah:
Estimasi Parameter (20)
Sesuai dengan asumsi awal bahwa dimana merupakan parameter hasil
variabel respon merupakan data dengan
estimasi, dan .
informasi yang lengkap, tidak tersensor dan
memiliki korelasi spasial, maka Keputusan untuk menolak diambil
hubungannya dengan variabel prediktor apabila nilai atau p-value lebih
diwakili oleh model regresi spasial sesuai kecil dari nilai .
dengan persamaan (4) di atas. LeSage (2000)
dan Lacombe (2008) merumuskan distribusi HASIL DAN PEMBAHASAN
posterior bersyarat dari masing-masing Penggunaan Internet di Pulau Jawa
parameter adalah sebagai berikut:
Tingkat penggunaan internet dilihat
(16) dari nilai persentase penduduk usia lima
(17) tahun ke atas yang pernah mengakses
internet dalam dalam tiga bulan terakhir.
Penggunaan internet terbesar pada tahun
(18) 2010 dapat ditemukan di kota pelajar
Yogyakarta yaitu sebanyak 36,20 persen,
(19) disusul oleh Jakarta Selatan, Kabupaten
dimana , , dan Sleman, dan kota industri Tangerang
. Selatan, masing-masing sebanyak 33,20
Estimasi parameter metode MCMC persen, 29,52 persen dan 29,29 persen. Rata-
Gibbs sampler dilakukan dengan cara rata penggunaan internet per kabupaten/kota
membangkitkan angka random yang di Pulau Jawa sebesar 12,02 persen. Wilayah
mengikuti distribusi posterior bersyarat dari dengan nilai penggunaan internet di sekitar
masing-masing parameter sebanyak jumlah rata-rata adalah Kabupaten Mojokerto,
iterasi yang diinginkan. Adapun algoritma Bandung, Madiun, dan Kota Pasuruan.
Metropolis within Gibbs digunakan pada Sementara wilayah dengan persentase
bentuk distribusi posterior yang tidak pengguna internet terkecil ada di Kabupaten
standar, yaitu untuk parameter atau Sampang dan Bangkalan, masing-masing
sebesar 2,23 persen dan 2,54 persen.
parameter (LeSage, 2000). Untuk
menentukan layak atau tidaknya suatu

3
Informasi nilai rata-rata dan varians dari variabel
random latent ini dijelaskan pula dalam LeSage
(2000) serta LeSage dan Pace (2009).
Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 7
Gambar 2. Penggunaan Internet Kabupaten/Kota di Pulau Jawa Tahun 2010

Peta tematik penggunaan internet pada nilai tingkat penggunaan internet yang tidak
Gambar 2 memperlihatkan bahwa diketahui tersebut dianggap sama dengan 16
penggunaan internet kategori tinggi banyak persen, sehingga diperoleh variabel
terdapat pada wilayah perkotaan seperti DKI persentase pengguna internet sebagai data
Jakarta dan sekitarnya, deretan Yogyakarta tersensor. Hal ini sesuai dengan konsep pada
ke arah Surakarta, serta wilayah Bandung, persamaan (1) di atas.
Semarang, Surabaya dan sekitarnya. Deskriptif data tingkat penggunaan
Tingginya penggunaan internet di kota-kota internet sebagai variabel respon yang
pusat pelajar, industri, dan bisnis tersebut tersensor dapat dilihat pada Tabel 1 di bawah
kemudian diikuti oleh wilayah lain di ini. Nilai maksimum dari persentase
sekitarnya. Wilayah yang bersinggungan pengguna internet per kabupaten/kota sama
langsung dengan kota-kota tersebut dengan 16 persen, dengan rata-rata dan
memiliki persentase pengguna internet yang standar deviasi masing-masing sebesar 9,97
sedikit lebih rendah, sementara wilayah persen dan 4,63. Variabel yang memiliki
berikutnya yang bersinggungan secara tidak variasi nilai terbesar adalah persentase
langsung memiliki nilai yang lebih rendah penduduk perkotaan dengan standar deviasi
lagi. sebesar 30,84 dan panjang range data dari
Untuk pemodelan regresi Tobit 9,27 persen hingga 100 persen. Variabel
spasial, nilai persentase pengguna internet rata-rata lama sekolah memiliki variasi
dari 34 kabupaten/kota dianggap tidak terkecil dengan standar deviasi sebesar 1,52.
diketahui. Mereka adalah wilayah dengan Hal itu karena satuan dari variabel tersebut
tingkat penggunaan internet yang lebih besar dalam ukuran tahun, sementara variabel
dari 16 persen, yaitu sebagai batas minimal lainnya dalam satuan persentase.
persentase pengguna internet yang ingin
dicapai oleh suatu kabupaten/kota. Nilai-

8 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Tabel 1. Deskriptif Variabel Penelitian
Variabel Rata- Standar
Deskripsi Minimum Maksimum
Penelitan rata Deviasi
(1) (2) (3) (4) (5) (6)

Persentase pengguna internet 2,23 16,00 9,968 4,626


Persentase penduduk perkotaan 9,27 100,00 57,991 30,837
Persentase penduduk usia muda 12,44 25,00 17,395 2,567
Persentase penduduk lulusan SMA ke atas 5,30 50,26 21,349 11,105
Rata-rata lama sekolah 4,21 11,55 8,052 1,518
Persentase rumah tangga yang memiliki
2,20 40,22 11,433 9,127
komputer
Persentase rumah tangga memiliki telepon
44,87 94,89 71,923 12,050
seluler
Persentase desa/kelurahan mendapat sinyal
50,00 100,00 88,892 10,026
telepon

Pemodelan regresi linier berganda adanya kondisi multikolinieritas antar


dengan metode ordinary least squared variabel prediktor. Meskipun menghasilkan
(OLS) dilakukan untuk menjelaskan model yang fit dengan nilai koefisien
hubunan antara variabel prediktor terhadap determinasi yang sangat tinggi, model
tingkat penggunaan internet di Pulau Jawa. regresi linier berganda yang diperoleh
Pada derajat kepercayaan 95 persen, hasil uji kurang tepat untuk digunakan sebagai dasar
parameter hanya menghasilkan dua dari analisis. Hal ini karena tidak terpenuhinya
tujuh variabel prediktor yang berpengaruh asumsi non multikolinieritas dan banyaknya
terhadap variabel respon. Nilai variance informasi dari variabel prediktor yang
inflation factor (VIF) yang sangat tinggi terbuang.
pada variabel dan mengindikasikan

Tabel 2. Model Regresi Linier Berganda dan Nilai Variance Inflation Factor (VIF)
Uji Parameter
Parameter Koefisien Statistik VIF
Statistik Uji t p-Value
(1) (2) (3) (4) (5)

-13,729 -4,158 0,000 –


0,022 1,960 0,053 5,705
-0,022 -0,298 0,766 1,701
0,107 1,585 0,116 27,368
0,797 1,936 0,055 18,952
-0,026 -0,531 0,597 9,827
0,083 2,671 0,009 6,872
0,094 4,582 0,000 2,072

Analysis of Variance (uji ) – 132,47 0,000 –


Koefisien Determinasi ( ) 0,894 – – –

Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 9


Menurut Gujarati (2004), kondisi satu persatu variabel yang tidak berpengaruh
multikolinieritas dapat ditangani dengan secara nyata (Draper & Smith, 1998).
cara melakukan pemilihan variabel, baik Hasil uji efek korelasi spasial dan
dengan menambah variabel prediktor baru heteroskedastisitas memperlihatkan bahwa
maupun dengan mengurangi yang sudah bentuk model yang akan dibentuk adalah
ada. Cara lain yang dapat dilakukan adalah regresi Tobit spasial lag dalam kondisi
dengan menggunakan model lain yang lebih homoskedastisitas. Menggunakan hipotesis
sesuai untuk menjelaskan hubungan antara , nilai statistik uji LM-lag
variabel prediktor terhadap respon. Model memperlihatkan kesimpulan untuk menolak
regresi Tobit spasial lebih tepat digunakan pada derajat kepercayaan 95 persen.
untuk menjelaskan faktor-faktor yang Sementara nilai statistik uji LM-err
mempengaruhi tinggi serta keragaman memperlihatkan bahwa gagal
rendahnya penggunaan internet antar ditolak pada nilai . Adapun hasil
kabupaten/kota di Pulau Jawa yang uji heteroskedastisitas yang menggunakan
dipengaruhi secara spasial oleh daerah- statistik uji Breusch Pagan menyimpulkan
daerah di sekitarnya. untuk tidak menolak hipotesis :
Pemodelan Regresi Tobit Spasial homoskedastisitas pada derajat kepercayaan
95 persen. Kondisi tersebut berlaku pada
Berdasarkan persamaan (9) di atas, setiap tahapan pembentukan model
model regresi Tobit spasial untuk menggunakan metode backward
penggunaan internet kabupaten/kota di elimination.
Pulau Jawa adalah sebagai berikut: Estimasi parameter dilakukan dengan
(
  w T y +  w T y + W T W
)
T
y terlebih dahulu membangkitkan sejumlah
 i i
 T
( )
i
yi = + xi β −  wi Xβ + i
T
jika yi < 16 angka random , di mana nilai
 ketika digunakan untuk mengganti
16 jika yi  16 data yang tersensor. Algoritma MCMC
(21) digunakan pada data yang telah lengkap
Pemodelan Tobit spasial dilakukan dengan untuk estimasi parameter model regresi
terlebih dahulu menguji efek korelasi spasial Tobit spasial lag, yaitu Gibbs sampler untuk
dan heteroskedastisitas, untuk menentukan estimasi dan serta Metropolis within
bentuk korelasi spasial yang ada serta Gibbs untuk estimasi . Nilai
kondisi heteroskedastisitas yang akan digunakan karena kondisi homoskedastisitas
diperhitungkan dalam algoritma MCMC. yang terpenuhi. Eliminasi variabel
Metode backward elimination dilakukan diputuskan berdasarkan p-value dari statistik
untuk menghasilkan model regresi Tobit uji Wald yang lebih besar daripada nilai
spasial terbaik dengan cara menggugurkan .

Tabel 3. Pengujian Efek Korelasi Spasial, Heteroskedastisitas, dan Hasil Estimasi Parameter
untuk Pemodelan Regresi Tobit Spasial menggunakan Metode Backward Elimination

Statistik Uji/ Tahap I (7 Variabel) Tahap II (6 Variabel) Tahap III (5 Variabel)


Parameter Nilai p-value Nilai p-value Nilai p-value
(1) (2) (3) (4) (5) (6) (7)
LM-lag 12,1942 0,0000 12,2410 0,0000 11,8122 0,0000
LM-err 1,5595 0,2117 1,5765 0,2093 1,4396 0,2302
Breusch Pagan 9,7859 0,2010 9,4602 0,1493 7,9076 0,1614
-0,1662 0,0000 -0,1693 0,0000 -0.1700 0,0000
-13,9281 0,0000 -13,8073 0,0000 -13,7268 0,0000
0,0115 0,0000 0,0122 0,0000 0,0117 0,0000
0,0107 0,2779
0,1549 0,0000 0,1529 0,0000 0,1435 0,0000

10 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


0,7565 0,0000 0,7574 0,0000 0,7548 0,0000
-0,0143 0,2102 -0,0139 0,2067
0,0918 0,0000 0,0929 0,0000 0,0931 0,0000
0,0831 0,0000 0,0828 0,0000 0,0827 0,0000
1,9561 – 1,9671 – 1.9580 –
0,8420 – 0,8403 – 0.8394 –

Variabel prediktor yang tersisih dari normal, sehingga dapat disimpulkan bahwa
model adalah (persentase penduduk usia asumsi normalitas dari error model
muda) dan (persentase rumah tangga terpenuhi secara nyata. Asumsi berikutnya
yang memiliki komputer). Pada tahap akhir terkait masalah varians error yang homogen
backward elimination diperoleh lima dianggap telah terpenuhi, mengingat hasil
variabel prediktor yang secara nyata uji Breusch Pagan sebelumnya yang
mempengaruhi keragaman penggunaan memperlihatkan tidak terpenuhinya kondisi
internet di Pulau Jawa. Berdasarkan heteroskedastisitas serta proses simulasi
persamaan (21) dan hasil estimasi parameter MCMC yang didasari oleh kondisi
yang disajikan pada tabel 3 di atas, model homoskedastisitas. Adapun asumsi tidak
regresi Tobit spasial lag yang terbentuk adanya autokorelasi dalam error juga telah
adalah: terpenuhi, karena model yang terbentuk
 n
bukanlah model regresi Tobit spasial error.
−13, 727 − 0,17

 wij y j + 0, 012 x1i
j =1, j  i
yˆi = +0,144 x + 0, 755 x +0, 093x +0, 083x ; y < 16 Interpretasi Model
 3i 4i 6i 7i i

16 ; yi  16
Persamaan (22) di atas menjelaskan

bahwa untuk kabupaten/kota dengan
(22)
persentase pengguna internet yang kurang
Model ini digunakan untuk menjelaskan
dari 16 persen, tingkat penggunaan internet
faktor-faktor dan daerah di sekitarnya yang
di wilayah tersebut dipengaruhi oleh daerah
mempengaruhi tingkat penggunaan internet
lain di sekitarnya serta variabel-variabel
di suatu kabupaten/kota, ketika nilainya
sebagai berikut:
lebih kecil dari 16 persen. Adapun untuk
• Persentase penduduk yang tinggal di
kabupaten/kota dengan tingkat penggunaan
perkotaan ( ). Apabila variabel lain
internet yang tinggi dianggap sebagai tolok
ukur pembangunan TIK yang ingin dicapai. dianggap konstan, maka setiap kenaikan
Probability Plot of Residual persentase penduduk yang tinggal di
Normal
99,9
Mean 1,207
perkotaan sebesar satu persen akan
StDev 1,392
99
N
KS
118
0,052
mengakibatkan kenaikan persentase
95
90
P-Value >0,150
pengguna internet sebesar 0,012 persen.

80
70 Persentase penduduk lulusan SMA ke
Percent

60
50
40
30
20
atas ( ). Apabila variabel lain
10
5
dianggap konstan, maka setiap kenaikan
1

0,1
persentase penduduk lulusan SMA ke
-4 -2 0
Residual
2 4 6
atas sebesar satu persen akan
mengakibatkan kenaikan persentase
Gambar 3. Grafik Plot Probabilitas Normal dari
Residual Model Regresi Tobit Spasial pengguna internet sebesar 0,144 persen.
Lag • Rata-rata lama sekolah ( ). Apabila

Grafik plot probabilitas normal dari variabel lain dianggap konstan, maka
residual digunakan untuk menguji asumsi setiap kenaikan rata-rata lama sekolah
normalitas dari error model. Plot residual selama satu tahun akan mengakibatkan
terlihat berada di sekitar garis probabilitas kenaikan penggunaan internet suatu
kabupaten/kota sebesar 0,755 persen.
Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 11
• Persentase rumah tangga yang memiliki kemudahan akses internet yang disediakan
telepon genggam ( ). Apabila variabel melalui perangkat telepon genggam dan
keluasan jaringan telepon seluler telah
lain dianggap konstan, maka setiap secara nyata mendorong peningkatan tingkat
kenaikan persentase rumah tangga yang penggunaan internet. Di sisi lain,
memiliki telepon genggam sebesar satu penggunaan internet ternyata tidak secara
persen akan mengakibatkan kenaikan nyata diakses melalui komputer atau
persentase pengguna internet sebesar didominasi oleh penduduk usia muda.
0,093 persen. Internet dapat diakses oleh siapapun dan
• Persentase desa/kelurahan yang melalui media apapun, terutama telepon
mendapat sinyal telepon seluler ( ). seluler.
Apabila variabel lain dianggap konstan, Selain dipengaruhi oleh kelima
maka setiap kenaikan persentase variabel di atas, tingkat penggunaan internet
desa/kelurahan yang mendapat sinyal kabupaten/kota di Pulau Jawa juga
telepon seluler sebesar satu persen akan dipengaruhi oleh daerah lain yang
menyebabkan kenaikan penggunaan bersinggungan wilayah. Sebagai contoh,
internet sebesar 0,083 persen. tingkat penggunaan internet di Kabupaten
Nilai koefisien determinasi Kepulauan Seribu dapat dijelaskan melalui
memperlihatkan bahwa sebesar 83,94 persen model regresi Tobit spasial lag berikut ini:
variasi penggunaan internet di Pulau Jawa (23)
dijelaskan oleh lima variabel prediktor
dalam model, sisanya oleh variabel lain. dimana
Pengaruh spasial lag dari daerah lain yang
saling bersinggungan wilayah dapat terlihat
pada model regresi Tobit spasial lag masing- adalah vektor variabel prediktor dari
masing kabupaten/kota, yaitu model Kepulauan Seribu dan
ketika . Adapun untuk
kabupaten/kota dengan kategori penggunaan
internet yang tinggi, maka nilai persentase adalah vektor parameter. Tingkat
peduduk umur 5 tahun ke atas yang pernah penggunaan internet di Kepulauan Seribu
mengakses internet dalam tiga bulan terakhir dipengaruhi pula oleh penggunaan internet
dianggap sama dengan 16 persen atau di Kota Jakarta Utara dan Kabupaten
ketika . Tangerang. Jika variabel lain dianggap
Persentase penduduk yang tinggal di konstan, maka penggunaan internet di
perkotaan mengindikasikan tingkat Kepulauan Seribu adalah sebesar -0,085 kali
kemajuan dan kelengkapan fasilitas umum dari gabungan penggunaan internet di
di daerah tersebut. Adapun presentase Tangerang ( ) dan Kota Jakarta Utara (
penduduk lulusan SMA ke atas dan rata-rata ). Secara detail, masing-masing 84
lama sekolah mencerminkan kualitas model regresi Tobit spasial lag ketika nilai
sumber daya manusia di daerah tersebut. persentase pengguna internet kurang dari 16
Dengan demikian, meningkatkan persentase persen dapat dilihat pada lampiran.
pengguna internet dapat dilakukan melalui KESIMPULAN DAN SARAN
upaya peningkatan kualitas sumber daya
manusia dari aspek pendidikan. Selain itu, Model regresi Tobit spasial
pembangunan kelengkapan fasilitas umum merupakan suatu model regresi spasial yang
di daerah pedesaan juga dapat mendorong diterapkan pada data tersensor, dengan
tingkat penggunaan internet di bentuk model umum dari regresi Tobit
kabupaten/kota. spasial adalah:
Variabel karakteristik perangkat dan
jaringan di daerah mengindikasikan
pentingnya perkembangan teknologi telepon
seluler bagi pertumbuhan internet. Berbagai
12 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
(
  w T y +  w T y + W T W
) Development of Telecommunications.
T
y
 i i

( )
+ x T β −  w T Xβ +
i
Bonn: IZA Discussion Paper.
yi =  i i i jika yi < 

Anselin, L. 1988. Spatial Econometrics:
 jika yi   Methods and Models. Dordrecht:
Kluwer Academic Publishers.
(24)
Anselin, L. 1999. Spatial Econometrics.
Metode estimasi parameter yang dapat
Dallas: University of Texas.
digunakan adalah Markov Chain Monte
BPS. 2011. Sensus Penduduk 2010. Hämtat
Carlo (MCMC) yang dilengkapi dengan
från Sensus Penduduk 2010:
algoritma Gibbs sampler dan Metropolis
http://sp2010.bps.go.id/index.php/site
within Gibbs. Metode ini lebih
/index (diakses 4 November 2011)
mengedepankan teknik simulasi komputasi
BPS. 2011. Statistik Komunikasi dan
untuk membangkitkan sejumlah besar
Teknologi Informasi Tahun 2010.
variabel random menggunakan pendekatan
Jakarta: Badan Pusat Statistik.
inferensia Bayesian.
Breusch, T., & Pagan, A. 1979. A Simple
Menggunakan penggunaan internet di Pulau
Test for Heteroscedasticity and
Jawa sebagai studi kasus, diketahui bahwa
Random Coefficient Variation.
model regresi Tobit Spasial lag
Econometrica, Vol. 47, No. 5, 1287-
menghasilkan informasi yang lebih kaya
1294.
daripada model regresi linier berganda.
Casella, G. dan Berger, R. 2002. Statistical
Faktor-faktor yang mempengaruhi
Inference. Duxbury, Thomson
penggunaan internet kabupaten/kota di
Learning.
Pulau Jawa adalah persentase penduduk
Casella, G. dan George, E. I. 1992.
yang tinggal di daerah perkotaan, persentase
Explaining the Gibbs Sampler. The
penduduk lulusan SMA ke atas, rata-rata
American Statistician, Vol. 46, No. 3,
lama sekolah, persentase rumah tangga yang
167-335.
memiliki telepon genggam, dan persentase
Chib, S. dan Greenberg, E. 1996. Markov
desa/kelurahan yang mendapatkan sinyal
Chain Monte Carlo Simulation
telepon seluler. Selain dipengaruhi oleh
Methods in Econometrics.
kelima variabel tersebut, tingkat
Econometrics Theory, Vol. 12, 409-
penggunaan internet kabupaten/kota di
431.
Pulau Jawa juga dipengaruhi oleh daerah
DeMaris, A. 2004. Regression with Social
lainnya yang bersinggungan wilayah.
Data: Modelling Continuous and
Berdasarkan hasil penelitian yang
Limited Response Variable. New
telah diperoleh, pengembangan lebih lanjut
Jersey: John Wiley and Sons, Inc.
dapat dilakukan dengan menggunakan
Draper, N. R. dan Smith, H. 1998. Applied
highest posterior density (HPD) dan Bayes
Regression Analysis. New York: John
Faktor sebagai metode pengujian parameter
Willey and Sons, Inc.
dan model. Penelitian ini masih
Fischer, M. M. dan Getis, A. 2010.
menggunakan matriks penimbang queen
Handbook of Applied Spatial
contiguity, sehingga pada penelitian
Analysis: Software Tools, Methods,
selanjutnya dapat dikembangkan
and Application. New York: Springer.
menggunakan matriks penimbang lain
Greene, W. H. 2008. Econometric Analysis,
misalnya jarak. Lebih lanjut, metode
Sixth Edition. New York: Pearson -
MCMC Gibbs sampler untuk pemodelan
Prentice Hall.
regresi Tobit spasial ini dapat digunakan
Hastings, W. 1970. Monte Carlo Sampling
untuk data dan kasus lain yang lebih
Methods using Markov Chains and
aplikatif.
Their Applications. Biometrika, Vol.
DAFTAR PUSTAKA 57, No. 1, 97-109.
Andonova, V., & Serrano, L. D. 2007. Howard, P. N. dan Mazaheri, N. 2009.
Political Institutions and the Telecommunications Reform, Internet
Use, and Mobile Phone Adoption in
Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 13
Developing World. World LeSage, J. dan Pace, R. K. 2009.
Development, Vol. 37, No. 7, 1159- Introduction to Spatial Econometrics.
1169. New York: CRC Press.
ITU. 2010. Measuring the Information Long, J. S. 1997. Regression Models for
Society. Geneva: International Categorical and Limited Dependent
Telecommunications Union. Variables. California: Sage
Kaliba, A. R. 2002. Participatory Evaluation Publications, Inc.
of Community Based Water and Marsh, T. L., Mittelhammer, R. C., &
Sanitation Programes: The Case of Huffaker, R. G. 2000. Probit with
Central Tanzania. Dissertation. Spatial Correlation by Field Plot:
Mahattan: Kansas State University. Potato Leafroll Virus Net Necrosis in
Kominfo. 2010. Buku Putih Komunikasi dan Potatoes. Journal of Agricultural,
Informatika Indonesia. Jakarta: Pusat Biological, and Environmental
Data Kementerian Komunikasi dan Statistics, Volume 5, Number 1, Pages
Informatika. 22-36.
Lacombe, D. J. (2008, Juli 24). An Michailidis, A., Partalidou, M., Nastis, S. A.,
Introduction to Bayesian Inference in Klavdianou, A. P.dan Charatsari, C.
Spatial Econometrics. Hämtat från 2011. Who Goes Online? Evidence of
http://ssrn.com/abstract=1244261. Internet Use Patterns from Rural
(diakses 13 November 2011). Greece. Telecommunications Policy,
Langyintuo, A. S. dan Mekuria, M. 2008. Vol. 35, 333-343.
Assessing the Influence of Rao, J. G. dan Pattnaik, S. 2006. Technology
Neighborhood Effects on the for Rural Development Role of
Adoption of Improved Agricultural Telecommunication Media in India.
Technologies in Developing Indian Media Studies Journal, Vol. 1,
Agriculture. AfJARE, Vol. 2, No. 2, No. 1, 85-92.
151-169. Socialbaker. (2011, Agustus 17) . Facebook
Lee, M. J. 2010. Micro-Econometrics: Statistics by Country. Hämtat från
Methods of Moments and Limited www.socialbaker.com:
Dependent Variables, Second Edition. http://www.socialbakers.com/faceboo
New York: Springer. k-statistics/?interval=last-3-
LeSage, J. P. 1999. The Theory and Practice months#chart-intervals.
of Spatial Econometrics. Ohio: Tobin, J. 1958. Estimation of Relationships
University of Toledo. for Limited Dependent Variables.
LeSage, J. P. 2000. Bayesian Estimation of Econometrica, Vol. 26, No. 1, 24-36.
Limited Dependent Variable Spatial
Autoregressive Models. Geographical
Analysis, Vol. 32, No. 1, 19-35.

LAMPIRAN
Model regresi Tobit spasial lag untuk 84 kabupaten/kota dengan nilai :
1. Kepulauan :
Seribu
2. Bogor :

3. Sukabumi :
4. Cianjur :
5. Bandung :
6. Garut :

14 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


7. Tasikmala :
ya
8. Ciamis :
9. Kuningan :
10 Cirebon :
.
11 Majalengk :
. a
12 Sumedang :
.
13 Indramayu :
.
14 Subang :
.
15 Purwakart :
. a
16 Karawang :
.
17 Bandung :
. Barat
18 Kota :
. Banjar
19 Cilacap :
.
20 Banyumas :
.
21 Purbaling :
. ga
22 Banjarneg :
. ara
23 Kebumen :
.
24 Purworejo :
.
25 Wonosobo :
.
26 Magelang :
.
27 Boyolali :
.
28 Klaten :
.
29 Wonogiri :
.
30 Karangan :
. yar
31 Sragen :
.
32 Grobogan :
.

Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 15


33 Blora :
.
34 Rembang :
.
35 Pati :
.
36 Kudus :
.
37 Jepara :
.
38 Demak :
.
39 Semarang :
.
40 Temanggu :
. ng
41 Kendal :
.
42 Batang :
.
43 Pekalonga :
. n
44 Pemalang :
.
45 Tegal :
.
46 Brebes :
.
47 Kota :
. Pekalonga
n
48 Kota :
. Tegal
49 Kulon :
. Progo
50 Gunung :
. Kidul
51 Pacitan :
.
52 Ponorogo :
.
53 Trenggale :
. k
54 Tulungagu :
. ng
55 Blitar :
.
56 Kediri :
.
57 Malang :
.

16 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


58 Lumajang :
.
59 Jember :
.
60 Banyuwan :
. gi
61 Bondowos :
. o
62 Situbondo :
.
63 Proboling :
. go
64 Pasuruan :
.
65 Sidoarjo :
.
66 Mojokerto :
.
67 Jombang :
.
68 Nganjuk :
.
69 Madiun :
.
70 Magetan :
.
71 Ngawi :
.
72 Bojonegor :
. o
73 Tuban :
.
74 Lamongan :
.
75 Gresik :
.
76 Bangkalan :
.
77 Sampang :
.
78 Pamekasa :
. n
79 Sumenep :
.
80 Kota :
. Pasuruan
81 Pandeglan :
. g
82 Lebak :
.

Analisis Regresi Tobit Spasial…./Mustari AS, Zain I | 17


83 Tangerang :
.
84 Serang :
.

18 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


GENERALIZED MULTILEVEL LINEAR MODEL DENGAN
PENDEKATAN BAYESIAN UNTUK PEMODELAN DATA
PENGELUARAN PERKAPITA RUMAHTANGGA

Azka Ubaidillah1, Anang Kurnia2, Kusman Sadik2


1
Politeknik Statistika STIS, Jakarta
2
Departemen Statistika, Institut Pertanian Bogor, Bogor
e-mail: 1azka@stis.ac.id, 2akstk29@gmail.com, 2kusmansadik@gmail.com

Abstrak

Data pengeluaran perkapita rumahtangga merupakan salah satu informasi penting sebagai pendekatan
untuk mengukur tingkat kemakmuran dan kesejahteraan di suatu daerah. Data tersebut sangat diperlukan
oleh pemerintah baik di pusat maupun daerah dalam merumuskan, melaksanakan dan mengevaluasi
pelaksanaan pembangunan. Penelitian ini akan menganalisis model yang tepat untuk pemodelan data
pengeluaran perkapita rumahtangga yang memperhitungkan kekhususan data BPS yang memiliki
struktur hirarki dan pola distribusi data yang memiliki karakteristik skewed kanan. Pemodelan dilakukan
dengan menggunakan distribusi Log-normal tiga parameter (LN3P) dan Log-logistik tiga parameter
(LL3P) dengan struktur satu tingkat (unilevel) dan dua tingkat (multilevel). Proses pendugaan parameter
dilakukan dengan metode Markov Chain Monte Carlo (MCMC) dan algoritma Gibbs Sampling. Hasil
penelitian menunjukkan bahwa pada model unilevel, model LL3P lebih baik dari model LN3P.
Sedangkan pada model multilevel, model LN3P lebih baik dari model LL3P. Hasil penelitian juga
menunjukkan model terbaik untuk pemodelan data pengeluaran perkapita rumahtangga adalah model
multilevel LN3P dengan intercept sebagai komponen berhirarki dengan nilai Deviance Information
Criterion (DIC) terkecil.

Kata kunci : Generalized Multilevel Linear Model, LL3P, LN3P, MCMC, Pengeluaran perkapita
rumahtangga.

Abstract

Household per capita expenditure data is one of the important information as an approach to measure
the level of prosperity in an area. Such data is needed by the government, both at the central and
regional levels in formulating, implementing and evaluating the implementation of development
programs. This research is aimed at modeling the household per capita expenditure data which takes
into account the specificity of BPS data which has a hierarchical structure, and data distribution pattern
which has the right skewed characteristic. The modeling is done by using the three parameters of Log-
normal distribution (LN3P) and the three parameters of Log-logistics (LL3P) with a single level
(unilevel) and two levels (multilevel) structure. The parameter estimation process is done by Markov
Chain Monte Carlo (MCMC) method and Gibbs Sampling algorithm. The results showed that on the
unilevel model, the LL3P model is better than the LN3P model. While in multilevel model, LN3P model
is better than LL3P model. The results also show that the best model for modeling household per capita
expenditure data is the LN3P multilevel model with the smallest Deviance Information Criterion (DIC)
value.

Keywords: Generalized Multilevel Linear Model, LL3P, LN3P, MCMC, Household per capita
expenditure.

Generalized Multilevel Linear Model… / Ubaidillah A, Kurnia A dan Sadik K | 19


PENDAHULUAN Teknik yang biasa digunakan adalah teknik
agregasi, disagregasi dan pemodelan regresi
Salah satu tujuan Negara Republik menurut kelompok (Goldstein, 1995;
Indonesia yang sekaligus menjadi amanat Raudenbush dan Byrk, 2002; De Leeuw dan
konstitusi sebagaimana termaktub dalam Meijer, 2008). Analisis dengan metode
Pembukaan Undang-Undang Dasar 1945 klasik hanya dilakukan pada salah satu
adalah memajukan kesejahteraan umum. tingkatan data yaitu tingkat individu dengan
Untuk mewujudkan tujuan tersebut maka menggunakan teknik disagregasi, atau di
pemerintah melakukan perumusan tingkat kelompok dengan menggunakan
perencanaan, melaksanakan pembangunan teknik agregasi. Namun demikian, teknik
dan secara berkesinambungan melakukan klasik tersebut akan sangat berpengaruh dari
evaluasi atas pelaksanaan pembangunan. sisi metodologi dan statistiknya (De Leeuw
Keberhasilan pembangunan secara umum dan Meijer, 2008).
diukur dari tingkat kemakmuran dan Menurut Goldstein (1995) dan Hox
kesejateraan rakyat. Salah satu pendekatan (1995), penggunaan model multilevel untuk
pengukuran tingkat kemakmuran dan data bestruktur hirarki memiliki beberapa
kesejahteraan rakyat adalah pengeluaran kelebihan. Model multilevel dapat
perkapita rumahtangga. digunakan untuk menganalisis informasi
Pada dasarnya faktor yang dari beberapa tingkatan yang berbeda
berpengaruh dalam masalah kemakmuran menjadi satu analisis statistik. Model
dan kesejahteraan dapat dikategorikan multilevel memperhitungkan pengaruh
dalam dua hal pokok yaitu paradigma variasi setiap tingkat data terhadap variasi
perilaku dan paradigma kebijakan (Atika respon. Hal ini memungkinkan peneliti
dan Pirmansyah, 2011). Paradigma perilaku untuk mengetahui variasi di setiap tingkatan
terkait dengan upaya masing-masing data terhadap variasi respon.
individu dan rumahtangga dalam mencapai Data pengeluaran rumahtangga
kesejahteraan. Sedangkan paradigma memiliki karakteristik khusus dengan nilai
kebijakan terkait dengan kondisi ekonomi, yang selalu positif dan memiliki frekuensi
politik dan kebijakan pemerintah. Hal ini tinggi untuk pengeluaran perkapita
menunjukkan bahwa kondisi di luar rumahtangga golongan menengah ke bawah,
rumahtangga itu sendiri juga mempengaruhi sedangkan untuk golongan rumahtangga
perbedaan tingkat kesejahteraan. Dengan menengah ke atas memiliki frekuensi yang
demikian tingkat kesejahteraan relatif rendah. Distribusi yang sesuai untuk
rumahtangga di suatu wilayah dipengaruhi pola data tersebut dan banyak digunakan
oleh faktor internal dan eksternal untuk analisis di bidang sosial ekonomi
rumahtangga tersebut. adalah distribusi Log-normal dan distribusi
Pada umumnya, data di bidang sosial Log-logistik (Johnson, Kotz dan
seperti data pengeluaran perkapita Balakrishnan, 1995b). Sesuai dengan
rumahtangga memiliki struktur data yang karakteristik pengeluaran perkapita
berhirarki dimana unit-unit di tingkat yang rumahtangga yang tidak pernah nol, maka
lebih rendah, yaitu rumahtanga tersarang digunakan distribusi Log-normal dan Log-
(nested) atau terkelompok dalam unit-unit di logistik yang diperluas dengan penambahan
tingkat yang lebih tinggi yaitu wilayah satu parameter yang selanjutnya dikenal
(desa/kelurahan/dsb). Oleh karena itu dengan distribusi Log-normal tiga parameter
pemodelan pengeluaran perkapita dan distribusi Log-logistik tiga parameter
rumahtangga hendaknya (Ismartini dkk, 2012).
mempertimbangkan kombinasi antara Beberapa penelitian yang
karakteristik rumahtangga dan karakteristik menggunakan konsep multilevel dalam
wilayahnya. analisis penelitiannya antara lain dilakukan
Keterbatasan analisis statistik klasik oleh Ha dkk (2005) yang melakukan
untuk data berstruktur hirarki adalah tidak penelitian mengenai pemodelan dengan
diperhitungkannya struktur hirarki data. menggunakan metode multilevel mixed
20 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
linear untuk data survival CGD (Chronic kompleks yaitu model multilevel. Kemudian
Granulomatous Deseas). Zimmer dkk model-model tersebut dibandingkan untuk
(2010) menggunakan model hirarki linier diperoleh model terbaik dengan
untuk memperkirakan perbedaan menggunakan kriteria Deviance Information
pedesaan/perkotaan dalam status fungsional Criterion (DIC).
transisi pada masyarakat Cina yang berumur
55 tahun ke atas selama 2 tahun dan TINJAUAN PUSTAKA
memperkirakan derajat dimana tingkat
sosial ekonomi individu dan komunitas 1. Model Multilevel Linier
merupakan penentu dalam menjelaskan Model multilevel merupakan model
perbedaan status tersebut. Sementara regresi yang mengakomodasi adanya
Anderson dan Wells (2010) menggunakan struktur data hirarki atau data bersarang.
pendekatan Bayesian hirarki regresi pada Dalam sturktur data hirarki ini, variabel
pemodelan hirarki untuk data kelompok respon diukur pada level mikro saja,
longitudinal penelitian hukum empiris. sedangkan variabel prediktor diukur baik di
Keterbatasan model hirarki sederhana level mikro maupun di level makro
seperti hirarki linier klasik dengan (Goldstein, 1995; Hox, 2010). Sesuai
pendekatan Maximum Likelihood adalah dengan konsep hirarki, maka model
apabila jumlah sampel yang kecil dan tidak multilevel menghasilkan persamaan regresi
setimbang terdapat pada model dengan bertingkat, yaitu koefisien regresi di tingkat
tingkat yang lebih tinggi, maka inferensia lebih rendah diregresikan lagi di tingkat
statistiknya ada kemungkinan menjadi tidak yang lebih tinggi. Ismartini dkk. (2012) pada
dapat dipercaya (Raudenbush dan Bryk, penelitiannya tentang pemodelan
2002). Sehingga untuk mengatasi pengeluaran per kapita rumahtangga,
permasalahan tersebut maka digunakan menjelaskan model multilevel pada level
pendekatan Bayesian pada model hirarki mikro menggambarkan hubungan antara
atau Hierarchical Bayesian (HB) dimana variabel respon (pengeluaran per kapita
menurut Raudenbush dan Bryk (2002), rumahtangga) dengan beberapa variabel
model HB memiliki keuntungan yaitu prediktor yang merupakan karakteristik
mampu mengatasi permasalahan pemodelan rumahtangga. Sedangkan model pada level
hirarki untuk jumlah data yang sedikit dan makro menjelaskan hubungan antara
tidak seimbang baik pada tingkat bawah koefisien model pada level mikro dengan
maupun pada tingkat yang lebih tinggi. karakteristik wilayah.
Pada tahun 2012, Ismartini dkk Persamaan model mikro untuk setiap
mengembangkan model linier hirarki kelompok adalah sebagai berikut:
dengan pendekatan Bayesian untuk
pemodelan data pengeluaran perkapita
rumahtangga berbasis distribusi Log-normal , (1)
tiga parameter (LN3P) dan distribusi Log- dimana = 1,2, ..., dan k = 1,2, ...,K, atau
logistik tiga parameter (LL3P). Namun jika dinyatakan dalam bentuk matriks
penelitian yang dilakukan oleh Ismartini menjadi:
belum dilakukan kajian yang lebih detail
dari sisi konsep Generalized Linear Model (2)
(GLM).
Tujuan makalah ini yaitu memodelkan dengan:
pengeluaran perkapita rumahtangga di Kota ,
Jambi dengan menggunakan model unilevel
dan multilevel berbasis pada distribusi LN3P
dan distribusi LL3P. Proses pemodelan ,
dimulai dengan membentuk model paling
sederhana, yaitu model unilevel dengan
tanpa kovariat, sampai model yang ,

Generalized Multilevel Linear Model… / Ubaidillah A, Kurnia A dan Sadik K | 21


,

Pembentukan model makro dilakukan


dengan menjadikan koefisien regresi pada
model mikro, r = 0,1,2, ..., P dalam
persamaan (2) sebagai variabel respon yang dengan adalah varians residual
dijelaskan oleh model makro. Bentuk
persamaan makro adalah sebagai berikut: model makro untuk koefisien regresi ke-
r pada kelompok ke-k.
,

atau jika dinyatakan dalam bentuk matriks


adalah c. Antar level
Residual level mikro bersifat
(3) independen terhadap residual level
dengan: makro atau .
,
Persamaan gabungan dari persamaan
(2) dan (3) adalah: (Raudenbush dan Byrk,
, 2002; De Leeuw dan Kreft, 2006; Goldstein,
1995)
(4)
,
dengan:
. adalah komponen tetap
(deterministik) dan adalah
Asumsi model hirarki dua tingkat komponen random (stokastik) dalam model
tersebut adalah: (Hox, 1995; De Leeuw dan multilevel,
Kreft, 2006)
a. Level mikro ,
i. Residual bersifat independen atau .
,
2. Generalized Linear Model
ii. berdistribusi normal
Generalized Linear Model (GLM)
iii. merupakan perluasan dari Linear Model.
Terdapat tiga komponen dalam GLM yaitu
iv.
komponen random, komponen sistematik
dengan adalah varians residual dan komponen fungsi penghubung.
Komponen random mencakup variabel yang
model mikro kelompok ke-k. mempunyai distribusi yang termasuk dalam
b. Level makro keluarga eksponensial, misalnya binomial,
i. Residual bersifat independen atau poisson, normal, gamma, dsb. Komponen
, dan sistematik adalah kombinasi linier dari
fungsi nilai harapan komponen acak dengan
kovariatnya. Sedangkan fungsi penghubung
ii. berdistribusi normal merupakan bentuk dari fungsi parameter
natural. Formula distribusi keluarga
iii.
eksponensial adalah (Dobson, 2002):
iv. , dengan:
(5)

22 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Pada penelitian ini digunakan asumsi
pola distribusi LN3P dan distribusi LL3P. 3. Pengujian Distribusi Data Respon
Jika Y adalah variabel random yang Pada penelitian ini digunakan uji
berdistribusi Log-normal 3 parameter Anderson-Darling untuk pengujian
(LN3P) yang dinotasikan distribusi data variabel respon. Salah satu
, maka fungsi alasan digunakannya uji Anderson-Darling
kepadatan peluang (pdf) dari Y dapat ditulis adalah bahwa uji Anderson-Darling lebih
sebagai berikut (Johnson dkk., 1995a dan fleksibel daripada uji Kolmogorov-Smirnov
Aitchison, 1957): (Anderson dan Darling, 1952). Hal ini
karena uji Anderson-Darling merupakan
modifikasi dari uji Kolmogorov-Smirnov
dimana dilakukan penggabungan fungsi
(6) bobot sehingga uji Anderson-Darling
dimana , , dan , menjadi lebih fleksibel.
dengan adalah parameter lokasi (location), Formula hipotesis uji Anderson-
adalah parameter skala (scale) dan Darling adalah sebagai berikut:
adalah parameter batas (threshold). H0 : Data mengikuti suatu pola fungsi
Persamaan (6) di atas selanjutnya distribusi tertentu
dapat ditulis kembali dalam bentuk H1 : Data tidak mengikuti suatu pola fungsi
persamaan: distribusi tertentu
Menurut Anderson-Darling (1954),
misal dimana n
adalah banyaknya pengamatan, maka
statistik ujinya adalah sebagai berikut:

(7)
Dari persamaan (7) tersebut terlihat
bahwa distribusi LN3P termasuk keluarga (12)
eksponensial. Dengan cara yang sama untuk
distribusi LL3P juga dapat dituliskan dimana adalah fungsi distribusi
persamaan distribusi keluarga eksponensial. kumulatif. Nilai kritis dari uji Anderson-
Selanjutnya, nilai harapan dan varians Darling dirumuskan sebagai berikut:
model dapat dinyatakan sebagai berikut:
(13)
(8)
(9)
dimana CV (Critical Value) adalah nilai
Fungsi nilai harapan model kritis. H0 ditolak jika
merupakan fungsi identitas dengan
4. Analisis Bayesian
persamaan:
Metode Bayesian mengacu nama
(10) ilmuwan Thomas Bayes (1702-1761) yang
menemukan perlakuan matematika untuk
masalah non trivial dari inferensi Bayesian.
Kemudian, untuk pemodelan GLM
Thomas Bayes menemukan suatu
dengan struktur data berhirarki, maka GLM
penyelesaian untuk kasus khusus yang
diperluas menjadi Generalized Multilevel
kemudian dikenal dengan nama Teorema
Linear Model (GMLM) dengan formula
Bayesian. Selanjutnya Teorema Bayesian
fungsi nilai harapan sebagai berikut:
dipopulerkan oleh Matematikawan asal
Prancis, Peirre-Simon Laplace dengan
(11)
istilah peluang Bayesian.
Generalized Multilevel Linear Model… / Ubaidillah A, Kurnia A dan Sadik K | 23
Berbeda dengan teori statistika klasik memungkinkan proses simulasi dengan
(frequentist), analisis bayesian mengambil sampel acak dari model
memperlakukan semua parameter yang tidak stokastik yang sangat rumit.
diketahui sebagai variabel random dan Ide dasar dari MCMC adalah
memiliki distribusi (Boldstad, 2007). membangkitkan data sampel dari distribusi
Teorema bayesian didasarkan pada posterior sesuai proses Markov Chain
distribusi posterior yang merupakan dengan menggunakan simulasi Monte Carlo
perpaduan antara distribusi prior (informasi secara iteratif sehingga diperoleh kondisi
masa lalu sebelum dilakukan observasi) dan yang konvergen terhadap posterior
data observasi yang digunakan untuk (Ntzoufras, 2009). Kondisi tersebut harus
menyusun fungsi Likelihood (Box dan Tiao, memenuhi sifat-sifat Markov Chain yang
1973). Hubungan distribusi posterior strongly ergodic (Boldstad, 2010; Tailor dan
dengan distribusi prior dan Likelihood dapat Carlin, 1998) yaitu:
ditulis sebagai berikut. a. Irreducible, artinya sampel parameter
Distribusi posterior  likelihood × yang dibangkitkan melalui proses
Distribusi prior MCMC adalah bersifat random.
Pada teorema Bayes, apabila terdapat b. Aperiodic, artinya sampel parameter yang
parameter  yang diberikan oleh data dibangkitkan tersebut tidak memiliki pola
observasi y, maka distribusi probabilitas yang periodik dalam domain nilai
untuk posterior  pada data y akan tertentu.
proporsional dengan perkalian antara c. Recurrent, artinya perubahan sampel
distribusi prior  dan fungsi Likelihood  parameter terjadi secara stabil dalam
yang diberikan oleh data y. Secara domain nilai tertentu.
matematis dapat ditulis sebagai berikut:
5. Hierarchical Bayesian (HB)
Raudenbush dan Byrk (2002)
menyatakan bahwa secara umum proses
(14) pembentukan model HB dua tingkat diawali
dengan membentuk model mikro sesuai
persamaan (2) sebagai Likelihood dari data
dimana merupakan distribusi
observasi yang memiliki parameter dan
posterior yang proporsional dengan , dengan sehingga fungsi
perkalian antara fungsi Likelihood Likelihood adalah . Selanjutnya
ditentukan prior dari parameter-parameter
dan distribusi prior . yang tidak diketahui dan dilakukan secara
bertingkat yaitu two stage prior (untuk
4.1 Markov Chain Monte Carlo model hirarki dua tingkat). Stage-1 prior
berdasarkan model makro sesuai persamaan
Untuk mendapatkan pendugaan (2) yang dinyatakan dalam notasi
parameter dari distribusi posterior melalui dengan adalah matriks koefisien regresi
proses integrasi seringkali sulit dilakukan model makro dan adalah matriks varians
apabila melibatkan persamaan integral yang kovarians dari .
sangat kompleks. Oleh karena itu Tahap selanjutnya adalah menentukan
penyelesaian perhitungan pendugaan stage-2 prior yang dinyatakan dalam notasi
parameter seringkali dilakukan secara . Dengan demikian distribusi
numerik, salah satunya adalah teknik posterior model HB adalah fungsi yang
Markov Chain Monte Carlo (MCMC). proporsional terhadap perkalian Likelihood,
Menurut Carlin (1992) pendekatan MCMC stage-1 prior dan stage-2 prior yang
sangat efektif untuk mengurangi beban dinyatakan dalam notasi sebagai berikut:
komputasi dalam menyelesaikan persamaan
integrasi yang kompleks. Scollnik (2011)
mengemukakan bahwa metode ini
24 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
tanpa kovariat di model level kedua.
Persamaan modelnya adalah:
(15)

Distribusi prior yang digunakan untuk


(19)
masing-masing elemen vektor parameter
model HB berdasarkan distribusi LN3 b.2 GLMM_X, yaitu model GLM
adalah sebagai berikut: dengan parameter intersep dan
koefisien kovariat di model level
, pertama yang bervariasi menurut
, wilayah dan tanpa kovariat di model
(16) level kedua. Persamaan modelnya
adalah:
.
(20)
Penentuan nilai parameter distribusi b.3 GMLM_Int, yaitu model GMLM
prior dilakukan dengan cara gabungan dengan struktur hirarki pada
antara conjugate prior dan informative prior parameter intersep (terdapat kovariat
(berdasarkan data). Proses penentuan nilai di model level kedua). Persamaan
parameter tersebut dilakukan secara modelnya adalah:
berulang-ulang dimana hasil (posterior)
pada setiap percobaan dijadikan informasi
untuk memperbaiki prior model sehingga
diperoleh hasil estimasi yang konvergen dan
memenuhi sifat-sifat Markov Chain yang
(21)
strongly ergodic (Boldstad, 2010; Tailor dan
Carlin, 1998), proses perbaikan prior b.4 Model GMLM_X, yaitu model
berulang tersebut dikenal dengan two-step GMLM dengan struktur hirarki pada
MCMC (Iriawan, 2012). intersep dan kovariat di model level
. pertama dan terdapat kovariat di
6. Pemodelan model level kedua. Persamaan
Pemodelan data pengeluaran perkapita modelnya adalah:
rumahtangga dengan distribusi LN3P dan (22)
distribusi LL3P dalam penelitian ini
meliputi: 7. Pemilihan Model Terbaik
a. Model unilevel, yang meliputi:
a.1 GLM_min, yaitu model GLM Strategi pemilihan model terbaik
minimal (parameter hanya berupa dalam penelitian ini menggunakan Deviance
intersep). Persamaan modelnya Information Criterion (DIC) yang
adalah: dirumuskan sebagai berikut:

(17) (23)

a.2 GLM_mod, yaitu model GLM


dengan kovariat (X1, D2, X3, D4). dimana adalah jumlah parameter efektif
Persamaan modelnya adalah: dari model. Menurut Ntzoufras (2009), DIC
merupakan kriteria seleksi model terbaik
(18) yang hampir sama dengan Akaike’s
Information Criterion (AIC).
b. Model multilevel, yang meliputi:
b.1 GLMM_Int, yaitu model GLM
dengan parameter intersep yang METODOLOGI
bervariasi menurut wilayah dan

Generalized Multilevel Linear Model… / Ubaidillah A, Kurnia A dan Sadik K | 25


1. Sumber Data dapat menjelaskan karakteristik variabel
respon (pengeluaran perkapita rumahtangga
Data yang digunakan dalam penelitian perbulan).
ini bersumber dari Badan Pusat Statistik
(BPS), yaitu: A nderson-D arling N ormality Test
A -S quared 57,47
P -V alue < 0,005
Data karakteristik individu dan rumahtangga M ean
S tDev
780519
815534

di Kota Jambi yang berasal dari Susenas V ariance


S kew ness
6,65096E +11
9,753
Kurtosis 153,988

2011 dan data karakteristik desa/kelurahan N


M inimum
575
153095
1st Q uartile 400255
di Kota Jambi yang berasal dari Podes 2011. 0 2000000 4000000
M edian
3rd Q uartile
580867
936162
M aximum 14806907
95% C onfidence Interv al for M ean
713720 847319

2. Variabel Penelitian 95% C onfidence Interv al for M edian


553069 617246
95% C onfidence Interv al for S tDev
95% Confidence Intervals
770966 865612
Mean

Variabel respon yang digunakan yaitu Median

data pengeluaran perkapita perbulan yang 550000 600000 650000 700000 750000 800000 850000

diperoleh dengan cara menghitung Gambar 1. Karakteristik data


pengeluaran rumahtangga per bulan dibagi pengeluaran perkapita
dengan jumlah anggota rumahtangganya. rumahtangga perbulan
Sedangkan variabel prediktor dapat dilihat di Kota Jambi
pada Tabel 1 dan Tabel 2 berikut ini.
Dari Gambar 1 di atas terlihat bahwa
terdapat dua ciri pola data pengeluaran
perkapita rumah tangga perbulan yaitu nilai
Tabel 1. Variabel Prediktor pada Model
datanya positif dan memiliki ekor yang
Mikro (Karakteristik rumahtangga)
menceng ke kanan. Beberapa jenis distribusi
Var Keterangan yang memiliki kedua ciri tersebut
X1 Jumlah anggota rumahtangga (ART) diantaranya adalah distribusi Log-normal 2
D2 =1, jenis lantai terluas dari parameter, Log-normal 3 Parameter, Log-
keramik/ubin/tegel/teraso logistik 3 parameter dan Weibull 3
=0, jenis lantai terluas dari lainnya parameter.
X3 Luas lantai perkapita
D4 =1, sumber energi untuk memasak dari 2. Distribusi Variabel Respon
LPG/gas
=0, sumber energi untuk memasak dari Merujuk pada penelitian yang
lainnya dilakukan oleh Ismartini dkk. (2012), maka
pada penelitian ini dilakukan pengujian data
pengeluaran perkapita rumahtangga
Tabel 2. Variabel Prediktor pada Model
perbulan di Kota Jambi dengan asumsi awal
Makro (Karakteristik wilayah
bahwa data mengikuti pola distribusi Log-
Kelurahan)
normal tiga parameter (LN3P) dan distribusi
Var Keterangan Log-logistik tiga parameter (LL3P). Dari
Z1 Rasio SLTA per 10.000 penduduk Tabel 3 terlihat bahwa distribusi data
Z2 pengeluaran perkapita rumahtangga dapat
Rasio Puskesmas per 10.000 penduduk
dimodelkan dengan distribusi LN3P dan
distribusi LL3P.
HASIL DAN PEMBAHASAN
Tabel 3. Hasil Uji Anderson Darling
1. Karakteristik Variabel Respon Banyaknya Nilai Critical
Distribusi
Karakteristik variabel respon perlu amatan AD value
diketahui untuk menentukan bentuk LN3P 575 0,44956 2,5018
distribusi likelihood yang nantinya akan LL3P 575 0,63205 2,5018
diterapkan pada pemodelan dengan
pendekatan Bayesian. Gambar 1 berikut
26 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Selanjutnya, distribusi LN3P dan umum lebih baik daripada model LL3P
distribusi LL3P dimodelkan dengan metode jika dilihat dari nilai DIC sebagaimana
Generalized Liniear Model (GLM) karena ditampilkan pada Tabel 5 berikut ini.
kedua distribusi tersebut dapat dikategorikan
sebagai keluarga eksponensial. Tabel 5. Nilai Deviance dan DIC untuk
Pemodelan Multilevel
3. Pemodelan Pengeluaran Perkapita Distribusi Model Deviance DIC
Rumahtangga LN3P GLMM_Int 15950 15975,5
Proses pendugaan parameter model GLMM_X 15940 15966,4
LN3P dan LL3P dengan pendekatan GMLM_Int *
15870 15922.5
Bayesian dilakukan dengan menggunakan
GMLM_X* 16630 16654,4
MCMC dan algoritma Gibbs Sampling
dengan iterasi sebanyak 10.000, thin 10 dan LL3P GLMM_Int 15950 15992,6
burn-in sebanyak 1000 iterasi. GLMM_X 15940 15979,9
➢ Pemodelan Unilevel GMLM_Int* 15870 15935.9
Hasil pemodelan unilevel ditampilkan GMLM_X* 16660 16694,4
pada Tabel 4 sebagai berikut:
Keterangan :
*)
Model GMLM menggunakan empat
kovariat di model level pertama (X1, D2,
X3, dan D4) dan dua kovariat di model level
Tabel 4. Hasil Pendugaan Parameter
kedua (Z1 dan Z2). Penggunaan kovariat
Model Unilevel Distribusi LN3P
tersebut didasarkan pada signifikansi
dan LL3P
Model Berdistribusi parameter dan kebaikan model
1. Model Berdistribusi LN3P
Parameter LL3P
Tabel 5 menunjukkan bahwa model
GLM_min GLM_mod
2. GLM_min
3. GLM_mod
GMLM_Int berdistribusi LN3P mempunyai
𝜆 125000 124900 124900 124900.0
(Threshold) (100.2) (100.7) (100.3) (102.1)
nilai DIC yang paling kecil di antara model
β0 13.06 12.99 13.05 12.99 multilevel lainnya. Selain itu, jika
(0.03159) (0.01987) (0.03188) (0.01989) dibandingkan dengan model unilevel terbaik
β1 - -0.09684 - 0.3091 (GLM_mod2 berdistribusi LL3P), model
(0.004649) (0.01707) GMLM_Int berdistribusi LN3P mempunyai
β2 - 0.3109 - 0.01077
nilai DIC yang lebih kecil. Dengan
(0.01699) (0.00058)
demikian, model terbaik di antara semua
β3 - 0.01075 - 0.2862
(0.000589) (0.0191)
model yang dihasilkan pada penelitian ini
β4 - 0.2879 - 0.3091 adalah model multilevel berdistribusi LN3P
(0.01987) (0.01707) dengan struktur hirarki pada parameter
DIC 16369.3 16081.0 16372.2 16061.0 intersep (GMLM_Int berdistribusi LN3P).

Dari Tabel 4 terlihat bahwa model 4. Model Terbaik


unilevel yang terbaik adalah model Uraian berikut ini menjelaskan lebih
GLM_mod berdistribusi LL3P, yaitu model detail model terbaik (GMLM_Int
dengan variabel X1, D2, X3, dan D4 sebagai berdistribusi LN3P) yang dihasilkan,
kovariat. meliputi pemilihan distribusi prior, hasil
Model GLM_mod dengan empat pendugaan parameter dan diagnosa model.
kovariat (X1, D2, X3, dan D4) selanjutnya Distribusi prior yang digunakan untuk
digunakan sebagai basis pemodelan model GMLM_Int LN3P adalah:
multilevel.
➢ Pemodelan Multilevel
Kondisi berbeda terjadi pada model
multilevel, dimana model LN3P secara

Generalized Multilevel Linear Model… / Ubaidillah A, Kurnia A dan Sadik K | 27


, berpengaruh terhadap pengeluaran perkapita
, rumahtangga sebesar sebesar
exp(0.3136)=1.368 kali, kemudian variabel
, luas lantai perkapita berpengaruh terhadap
(24) pengeluaran perkapita rumahtangga sebesar
,
exp(0.0111)=1.011 kali, dan variabel
sumber energi untuk memasak berpengaruh
,
terhadap pengeluaran perkapita
rumahtangga sebesar exp(0.279)=1.322 kali.
Adapun hasil pendugaan parameter ➢ Diagnosa Model
model terbaik ditampilkan pada Tabel 6 Diagnosa model terbaik ditampilkan
berikut ini: dalam Gambar 2. Dari Gambar 2 terlihat
bahwa sampel parameter yang dibangkitkan
Tabel 6. Hasil Pendugaan Parameter Model dari distribusi posterior untuk menduga
GMLM_Int Berdistribusi LN3P parameter sudah memenuhi persyaratan
pemodelan Bayesian. Hal ini terlihat dari
Parameter Mean sd 2.5% 97.5%4. Sample plot ACF yang menunjukkan kondisi
𝜆 121100 3008.0 115100 1.27E+5 9001
(Threshold) Irreducible (sampel parameter yang
γ00 13.13 0.07217 12.99 13.27 9001 dibangkitkan melalui proses MCMC bersifat
γ01 0.06592 7.6E-4 0.06441 0.06741 9001 random) dan Aperiodic (tidak memiliki pola
γ02 0.06593 7.599E-4 0.06445 0.0674 9001 periodik). Kemudian, dari Density plot
β1 -0.0921 0.005058 -0.1022 -0.0824 9001 terlihat bahwa sampel parameter yang
β2 - - - - - dibangkitkan melalui proses MCMC sudah
β3 0.3136 0.01699 0.281 0.3469 9001 sesuai dengan distribusi normal dan dari
β4 0.01114 6.07E-4 0.00992 0.0123 9001 Serial plot terlihat bahwa pergerakan sampel
β5 0.279 0.01974 0.2399 0.3175 9001 parameter tercapai kondisi recurrent (stabil
dalam domain nilai tertentu). Dengan
Tabel 6 menunjukkan bahwa semua terpenuhinya kondisi Irreducible, Aperiodic
parameter model dapat diduga secara dan Recurrent maka dapat disimpulkan hasil
signifikan. Hal ini terlihat dari nilai Credible pendugaan parameter model telah
Interval (antara 2.5% sampai dengan 97.5%) memenuhi sifat-sifat Markov Chain yang
yang tidak mengandung nilai nol. Secara strongly ergodic sehingga model layak
matematis dapat ditulis dalam persamaan digunakan untuk keperluan analisis statistik.
sebagai berikut:
(a) ACF Plot
a00
1.0
0.5
0.0
-0.5
Dari persamaan model terlihat bahwa -1.0
kovariat model di level kedua (proporsi
0 20 40
banyaknya SMU terhadap jumlah penduduk
lag
dan proporsi puskesmas terhadap jumlah
(b) Density Plot
penduduk) berpengaruh positif terhadap
a00 sample: 9001
pengeluaran perkapita rumah tangga
6.0
masing-masing sebesar exp(0.066)=1.068 4.0
kali. Adapun pengaruh kovariat model di 2.0
level pertama terlihat bahwa variabel jumlah 0.0
anggota rumahtangga berpengaruh negatif 12.8 13.0 13.2 13.4
terhadap pengeluaran perkapita
rumahtangga sebesar exp(-0.0921)=0.91
(c) Serial Plot
kali. Selanjutnya, variabel jenis lantai terluas
dari keramik/ keramik/ ubin/ tegel/ teraso
28 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
a00

13.6
13.4
13.2
2. Model GMLM_Int LN3P (model
13.0
12.8
multilevel berdistribusi LN3P dengan
1000 2500 5000 7500 10000 struktur hirarki pada parameter intersep)
iteration
adalah model terbaik untuk pemodelan
Gambar 2. Diagnostic plot model
data pengeluaran perkapita
GMLM_Int distribusi LN3P
rumahtangga dengan nilai DIC terkecil.
untuk parameter γ00
➢ Prediksi Model 2. Saran
Prediksi model GMLM_Int
Dari plot antara data aktual dan hasil
berdistribusi LN3P dan distribusi LL3P
prediksi model ternyata masih didapatkan
ditampilkan dalam Gambar 3 sebagai
gap yang semakin besar untuk persentil
berikut:
menengah ke bawah dan persentil menengah
17
Aktual
ke atas. Selain itu, nilai Deviance dan DIC
Pred GMLM_Int LN3P

16
Pred GMLM_Int LL3P yang diperoleh dari pemodelan GMLM
masih cukup tinggi. Oleh karena itu
15
disarankan untuk penelitian selanjutnya agar
Ln(Y-threshold)

14
menambah level model menjadi tiga level.
Harapannya dengan menambah level model
13
akan memperkecil nilai Deviance dan
12 mengurangi besarnya gap antara data aktual
dan prediksi model.
11
1 10 20 30 40 50 60 70 80 90 100
Percentile
DAFTAR PUSTAKA
Gambar 3 Plot persentil data aktual dan
hasil prediksi model GMLM Anderson, T.W. dan Darling, D.A. 1954. A
berdistribusi LN3P dan LL3P test Goodness of Fit. Journal of
Dari Gambar 4.3 terlihat bahwa hasil American Statistical Association,
prediksi antara model GMLM berdistribusi Volume 49, Issue 268, hal. 765-769.
LN3P dan model GMLM berdistribusi LL3P Anderson, T.W. dan Darling, D.A .1952.
mempunyai kemiripan dimana plot prediksi Asymptotic Theory of Certain
kedua model tersebut berhimpitan. Namun “Goodness of Fit” Criteria Based on
masih terlihat bahwa kemampuan prediksi stochastic Process. The Annals of
kedua model masih perlu ditingkatkan, Mathematical Statistics, Vol. 23, No. 2,
khususnya untuk persentil bawah dan hal. 193-212.
persentil atas yang terdapat gap antara data
aktual dengan hasil prediksi model. Anderson, W., dan Wells, M.T. 2010. A
Bayesian Hierarchical Regression
KESIMPULAN DAN SARAN Approach to Clustered and
Longitudinal Data in Empirical Legal
1. Kesimpulan Studies. Journal of Empirical Legal
Studies, Volume 7, Issue 4, hal. 634-
Dari hasil analisa yang sudah
663.
diuraikan pada bab sebelumnya, maka dapat
diperoleh kesimpulan sebagai berikut: Boldstad, W.M. 2007. Introduction to
1. Model LL3P memberikan hasil Bayesian Statistics. 2nd Edition. Wiley,
pemodelan yang lebih baik daripada New Jersey.
model LN3P untuk pemodelan unilevel.
Box, G.E.P. dan Tiao, G.C. 1973. Bayesian
Sedangkan untuk pemodelan multilevel,
Inference in Statistical Analysis. John
model LN3P memberikan hasil
Willey And Sons, Inc : New York.
pemodelan yang lebih baik dari model
LL3P.

Generalized Multilevel Linear Model… / Ubaidillah A, Kurnia A dan Sadik K | 29


BPS Kota Jambi. 2011. Kota Jambi Dalam Hierarchical Bayesian Framework for
Angka 2011. Badan Pusat Statistik Modelling the Effect of Regional
Kota Jambi, Provinsi Jambi. Diversity on Household Expenditure.
Journal of Mathematics and Statistics,
Carlin, B.P. 1992. A SimpleMonte Carlo
Vol.8, No.2, hal. 283-291.
Approach to Bayesian Graduation.
Transactions of the Society of Actuaries Kaashoek, J.F. dan Van Dijk, H.K. 2002.
XLIV, hal. 55–76. Neural Network Pruning Applied to Real
Exchange Rate Analysis. Journal of
Carlin, B. P. dan Chib, S. 1995. Bayesian
Forecasting, 21, pp. 559-577.
model choice via Markov Chain Monte
Carlo methods. Journal of the Royal McCullagh, P., dan Nelder, J.A. 1989.
Statistical Society, Ser. B. Vol.57 No.3, Generalized Linear Models, Second
hal.473–484. Edition. Chapman & Hall, London
De Leeuw, J. dan Kreft, I. 2006. Random Raudenbush, S.W. dan A.S. Bryk. 2002.
Coefficient Models for Multilevel Hierarchical Linear Models:
Analysis. Departement of Statistics Applications and Data Analysis
Paper. Departement of Statistics, Methods. 2nd edition. Sage Publications,
UCLA, Los Angeles. Thousand Oaks. ISBN-10: 076191904X,
http://preprints.stat.ucla.edu/496/dLK_j hal. 485.
es.pdf (19 Juli 2010).
Scollnik, D. P. M. 2011. An Introduction To
Dobson, A.J. 2002. An Introduction to Markov Chain Monte Carlo Methods
Generalized Linear Models, Second And Their Actuarial Applications.
Edition. Chapman & Hall, London Handbook of Markov Chain Monte
Carlo Chapter 1, hal.114-165 : Chapman
Gelman, A., dan Hill, J. 2006. Data Analysis
& Hall/CRC Handbooks of Modern
Using Regression and Multilevel /
Statistical Method.
Hierarchical Models. Cambridge
University Press. Steenbergen, M. R., dan Jones, B. S. 2002.
Modelling Multilevel Data Structure.
Goldstein, H. 1995. Multilevel Statistical
American Journal of Political Science,
Models. 2nd edition. Arnold, London.
Vol. 46, No. 1, hal. 218-237.
ISBN-10: 111995682X, hal. 382.
Tailor, H.M., dan Carlin, S. 1998. An
Ha, I.D., dan Lee. Y. 2005. Multilevel
Introduction to Stochastic Modelling 3rd
Mixed Linear Models for Survival Data.
edition. Academic Press, San Diego.
Lifetime Data Analysis, 11, hal. 131-142.
Zimmer, Z., Wen, M., dan Kaneda, T. 2010.
Hox, J.J. 1995. Applied Multilevel Analysis,
A Multi-Level Analysis of Urban/Rural
1st edition, TT-Publikaties, Amsterdam,
and Socioeconomic Differences in
hal. 119.
Functional Health Status Transition
Iriawan, N. 2012. Pemodelan dan Analisis among Older Chinese. Social Science &
Data Driven. ITS Press : Surabaya. Medicine 71, hal. 559-567.
Ismartini, P., Iriawan, N., Setiawan, dan
Ulama, B.S.S. 2012. Toward a

30 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


FAKTOR-FAKTOR YANG MEMENGARUHI FOREIGN DIRECT
INVESTMENT (FDI) DI ENAM KORIDOR EKONOMI INDONESIA:
MARKET SEEKING ATAU RESOURCE SEEKING?

Iriani Trisna Rahayu 1 dan Ernawati Pasaribu 2


1
Badan Pusat Statistik Propinsi Papua Barat, Jakarta
2
Dosen Statistika, Sekolah Tinggi Ilmu Statistik, Jakarta
e-mail: 2ernapasaribu@stis.ac.id

Abstrak

Pembangunan ekonomi suatu negara sangat tergantung pada besarnya penanaman modal asing langsung
atau Foreign Direct Investment (FDI), termasuk di enam koridor ekonomi Indonesia. Kesenjangan
kondisi di koridor ekonomi diperkirakan akan membawa perbedaan yang mempengaruhi arus masuk
FDI ke dalam koridor. Penelitian ini menggunakan regresi data panel untuk menganalisis faktor-faktor
di balik arus masuk FDI di setiap koridor ekonomi dan untuk menentukan karakteristik FDI di setiap
koridor ekonomi. Hasil penelitian menunjukkan bahwa proporsi belanja modal pemerintah, jumlah
angkatan kerja berpendidikan tinggi, keterbukaan perdagangan, dan proporsi ekspor minyak dan mineral
hanya mempengaruhi arus masuk FDI di beberapa koridor ekonomi. Lebih jauh lagi dapat diindikasikan
bahwa sementara “market seeking FDI” terjadi di semua koridor ekonomi Indonesia, “resource seeking
FDI” hanya ditemukan di koridor ekonomi Sulawesi, Maluku dan Papua.

Kata kunci: FDI, Koridor Ekonomi, data panel, market seeking, resource seeking

Abstract

The economic development of a country depends on the amount of foreign direct investment (FDI),
including in the Indonesian six economic corridors. The huge gaps of conditions in economic corridors
are expected to differences infactors affecting the FDI-inflow into the corridors. This study uses a panel
data regression to analyze factors behind the FDI-inflow in each economic corridor and to determine
the FDI characteristic in each economic corridor. It shows that the proportion of government capital
expenditure, number of highly-educated labor force, trade openness, and the proportion of oil and
mineral export affect the FDI-inflow only in some economic corridors. Furthermore, it indicates that,
while market seeking FDI occurred in all Indonesian economic corridors, resource seeking FDI was
only found in Sulawesi, Maluku and Papua economic corridors..

Keywords: Foreign Direct Investment (FDI), Indonesian economic corridors, panel data regression,
market seeking, resource seeking

Faktor – faktor yang Memengaruhi Foreign Direct Investment… / Rahayu IT dan Pasaribu E | 31
PENDAHULUAN MP3EI tersebut tentu membutuhkan sumber
daya dan dana yang tidak sedikit. Sumber
Pasca krisis tahun 1997, pemerintah
daya alam yang berlimpah serta jumlah
mulai memperbaiki diri, terutama untuk
penduduk yang sangat besar mungkin bukan
membangkitkan perekonomian yang
merupakan masalah. Namun dana yang
terpuruk. Hasil dari pembangunan yang
dapat disediakan oleh pemerintah sangatlah
terus digalakkan pemerintah, baik di pusat
terbatas. Oleh sebab itu, dibutuhkan suntikan
maupun di daerah tersebut, dapat terlihat
dana dari swasta, baik dari dalam negeri
dari perkembangan ekonomi Indonesia yang
maupun dari luar negeri.
pada umumnya mengalami pertumbuhan
Salah satu sumber dana yang besar dan
yang positif.
dapat segera digunakan adalah Investasi
Akan tetapi, mulai tahun 2007, tingkat
Asing Langsung atau Foreign Direct
pertumbuhan ekonomi Indonesia semakin
Investment (FDI). Investasi jenis ini lebih
melambat. Hal ini menunjukkan bahwa
menguntungkan dibandingkan dengan
program pembangunan ekonomi yang
investasi yang tidak langsung. Berbeda
selama ini dijalankan oleh pemerintah
dengan investasi tak langsung, seperti
kurang memberikan hasil yang maksimal
investasi porto folio yang bisa tiba-tiba
untuk percepatan pembangunan ekonomi
ditarik oleh investor, FDI lebih bersifat
Indonesia dalam jangka panjang. Oleh
komitmen jangka panjang, sehingga
karena itu, pemerintah mencoba melakukan
dianggap lebih bernilai bagi suatu negara.
transformasi ekonomi, yaitu pengalihan
Namun, realisasi FDI di Indonesia
perekonomian Indonesia yang awalnya
ternyata belum merata di semua koridor
didasari oleh konsumsi menjadi
ekonomi. Selaras dengan pembangunan
perekonomian yang didasari oleh investasi
yang berpusat di Jawa, FDI yang masuk ke
(Bappenas, 2011).
Indonesia pun sebagian besar masih berada
Di sisi lain, dalam upaya menjadikan
di koridor Jawa. Bahkan persentase (share)
Indonesia sebagai negara maju dan sejahtera
FDI di koridor Jawa dalam periode 1997-
tahun 2025, pemerintah menyusun rencana
2014 selalu lebih dari 50% dari total FDI
pembangunan yang difokuskan pada
Indonesia.
pengembangan sejumlah kegiatan ekonomi
utama masing-masing wilayah Indonesia.
Rencana tersebut tertuang dalam Masterplan
Percepatan dan Perluasan Pembangunan
Ekonomi Indonesia (MP3EI) melalui
Peraturan Presiden Nomor 32 tahun 2011.
MP3EI tersebut membagi wilayah Indonesia
menjadi koridor-koridor ekonomi
berdasarkan pada keunggulan dan potensi
sektoral masing-masing wilayah. Sistem
koridor ini mengacu pada kesuksesan sistem
Sumber: Badan Koordinasi Penanaman Modal (BKPM,
koridor ekonomi yang diterapkan negara- diolah)
negara Asia lainnya. Indonesia menetapkan Gambar 1. Persentase Realisasi FDI di
enam koridor ekonomi, yaitu Koridor Indonesia menurut Jawa dan
Sumatera, Koridor Jawa, Koridor Luar Jawa, 1997-2014
Kalimantan, Koridor Bali dan Nusa
Tenggara, Koridor Sulawesi, serta Koridor Oleh karena itu, penelitian ini
Maluku dan Papua. Dengan adanya korodor bertujuan untuk menganalisis faktor-faktor
ini, para investor akan lebih mudah dalam yang memengaruhi FDI di masing-masing
menentukan jenis investasi yang akan koridor ekonomi Indonesia. Penelitian ini
dilakukan, yaitu pada sektor ekonomi apa juga bertujuan untuk menganalisis motivasi
dan di mana. apakah yang melatarbelakangi investor
Transformasi ekonomi yang asing untuk menanamkan modalnya di
digunakan sebagai alat untuk merealisasikan
32 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Indonesia, apakah market seeking atau (Asiedu, 2002). Dengan demikian,
resource seeking. Indonesia yang merupakan salah satu negara
dengan jumlah penduduk terbanyak di dunia
KAJIAN PUSTAKA merupakan sebuah pasar besar bagi investasi
asing.
Menurut Todaro & Smith (2003), FDI Meskipun PDB per kapita Indonesia
merupakan investasi yang dilakukan oleh tidak termasuk ke dalam golongan
pihak swasta asing, yang mana dana-dana pendapatan tinggi, namun pola konsumsi
investasinya langsung digunakan untuk masyarakat Indonesia masih cenderung
menjalankan kegiatan bisnis seperti konsumtif. Hal tersebut terbukti dari
mendatangkan mesin-mesin dan membeli besarnya konsumsi masyarakat dilihat dari
bahan baku produksi. Teori elektikal unsur PDB pengeluaran, dibandingkan
Dunning (1993) menyebutkan bahwa dengan pengeluaran untuk investasi.
keunggulan yang harus dimiliki oleh suatu Rendahnya investasi dan tingginya
negara untuk menarik investasi asing adalah konsumsi inilah yang menjadi salah satu
antara lain biaya produksi rendah (termasuk penyebab mengapa pembangunan ekonomi
transportasi), tersedianya pasar yang besar di Indonesia tidak bisa berlangsung pesat.
(market size), sumber daya yang melimpah Tingginya pola konsumsi masyarakat
(meliputi SDA dan tenaga kerja berupah Indonesia dan ditambah dengan upah yang
rendah yang terampil), serta minimnya masih rendah menjadi faktor lain yang dapat
hambatan perdagangan dan tingkat menarik FDI ke Indonesia. Perusahaan
keterbukaan ekonomi. Multinasional bisa saja memberikan upah
Dunning (1993) kemudian yang sedikit lebih tinggi dibandingkan
menyimpulkan bahwa beberapa hal yang dengan upah dari perusahaan dalam negeri,
melatarbelakangi investor asing untuk ataupun perusahaan pesaing, yang mana
menanamkan modalnya di suatu negara sebenarnya jika dibandingkan dengan upah
dapat dikelompokkan ke dalam alasan di negara asalnya masih jauh lebih rendah.
market seeking dan atau resource seeking. Tenaga kerjanya pun mempunyai skill yang
Market seeking merupakan jenis investasi cukup bagus jika dibandingkan dengan
asing yang ditujukan untuk mencari pasar negara berkembang lainnya.
baru atau mempertahankan pasar lama. Selain akses terhadap SDM, akses
Sedangkan resource seeking adalah jenis terhadap Sumber Daya Alam (SDA) di
investasi yang dilakukan untuk Indonesia juga cukup mudah karena masih
mendapatkan faktor-faktor produksi yang melimpahnya SDA di Indonesia. Bagi
berbentuk sumber daya alam atau tenaga negara sedang berkembang,seperti
kerja yang lebih efisien di negara lain Indonesia, ketersediaan SDA merupakan
dibandingkan dengan di negara sendiri. daya tarik bagi investor asing, terutama yang
Penelitian terdahulu menunjukkan bergerak di industri primer (Jadhav, 2012).
adanya beberapa faktor penting yang Sebaliknya, langkanya SDA di negara-
berpengaruh terhadap masuknya FDI ke negara maju memberikan peluangbagi
suatu negara, yaitu market size, ketersediaan produk ekspor negara sedang berkembang
Sumber Daya Alam (SDA) dan Sumber yang bernilai ekonomis.(Asiedu & Lien,
Daya Manusia (SDM), infrastruktur, dan 2010). Investor asing akan lebih memilih
kebijakan perdagangan serta kondisi untuk terjun langsung sebagai pengekspor di
perekonomian negara tujuan (Jadhav, 2012; negara tujuan karena akan memberikan
Hsiao & Hsiao, 2004; Asiedu, 2006, keuntungan yang lebih besar dibandingkan
Rohmana, 2011; Sarwedi, 2002; Setiawan, dengan mengimpor di negaranya sendiri.
2002). Besarnya pasar atau market size akan Faktor lain yang menjadi penarik
memengaruhi keputusan investor untuk investor asing adalah kemudahan akses,
menanamkan modalnya ke negara tujuan, melalui ketersediaan fasilitas umum dan
khususnya bagi investor yang ingin infrastruktur. Kemudahan akses ini menjadi
mengembangkan jangkauan pasarnya faktor penting bagi investor, khususnya di
Faktor – faktor yang Memengaruhi Foreign Direct Investment… / Rahayu IT dan Pasaribu E | 33
Indonesia, tterbukti dari realisasi FDI yang : intersep
lebih dari 50% di koridor Jawa yang : koefisien regresi variabel
disebabkan karena selama ini pembangunan independen
infrastruktur yang masih berpusat di koridor FDIait : nilai realisasi FDI pada
Jawa. Kemudahan akses serta tersedianya koridor a propinsi i tahun t
fasilitas dan infrastruktur akan memudahkan (triliun rupiah)
investor, baik dalam proses produksi BMait : proporsi nilai pengeluaran
maupun dalam pendistribusian produk. belanja modal pemerintah
Akan tetapi, masuknya investasi asing, daerah dibagi dengan nilai
khususnya FDI juga sangat tergantung pada total pengeluaran belanja
kebijakan makroekonomi dan kebijakan pemerintah daerah pada
perdagangan di negara tujuan. Suatu negara koridor a propinsi i tahun t
yang menganut sistem ekonomi tertutup (persen)
tidak akan membuka peluang bagi investor ANGKERait : jumlah angkatan kerja
asing untuk menanamkan modal di negara berpendidikan tinggi pada
tersebut. Semakin terbuka sebuah negara koridor a propinsi i tahun t
dalam perdagangan internasional (ekspor (orang)
dan impor), maka akan semakin banyak FDI OPENait : tingkat keterbukaan
yang masuk ke negara tersebut (Jadhav, perdagangan pada koridor a
2012). propinsi i tahun t (persen)
XMIGASait : proporsi nilai ekspor minyak,
DATA DAN METODE gas, dan mineral terhadap
nilai total ekspor pada koridor
Data a propinsi i tahun t (persen
Data yang digunakan adalah data rupiah)
tahunan 2006-2014 di 32 propinsi di PDRBait : nilai Produk Domestik
Indonesia yang bersumber dari Badan Regional Bruto riil pada
Koordinator Penanaman Modal (BKPM), koridor a propinsi i tahun t
Badan Pusat Statistik (BPS), dan Direktorat (triliun rupiah)
Jenderal Perimbangan Keuangan : error term untuk koridor a
Kementerian Keuangan (DJPK Kemenkeu). propinsi i tahun t
Variabel dependen yang digunakan a : koridor 1,2,…,6 (1=koridor
yaitu realisasi FDI (triliyun rupiah), Sumatera, 2=koridor Jawa,
sedangkan variabel independen adalah 3=koridor Bali-Nusa
proporsi pengeluaran belanja modal Tenggara, 4=koridor
terhadap total belanja pemerintah daerah Kalimantan, 5=koridor
(dalam persen), jumlah angkatan kerja Sulawesi, 6=koridor Maluku-
berpendidikan SMA keatas (dalam Papua)
logaritma natural), tingkat keterbukaan i : Aceh,..., Papua
perdagangan (dalam persen), proporsi t : 2006,..., 2014
ekspor migas dan mineral terhadap total
ekspor (dalam persen), dan PDRB riil tahun
dasar 2000 (dalam triliun rupiah). HASIL DAN PEMBAHASAN
Total FDI yang direalisasikan di
Metode masing-masing koridor ekonomi dari tahun
Penelitian ini menggunakan metode ke tahun terus mengalami peningkatan. Pada
regresi data panel untuk masing-masing koridor Jawa, peningkatan tersebut diiringi
koridor ekonomi Indonesia. dengan share FDI yang semakin menurun.
Artinya, penanaman modal asing pada
koridor di luar Jawa semakin berkembang
dan merata.
di mana:
34 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Sumber: Badan Koordinasi Penanaman Modal (BKPM, diolah)

Gambar 2. Total FDI di Masing-Masing Koridor Ekonomi Indonesia Tahun 2006-2014

Proporsi belanja modal terbesar


berada di koridor Sumatera dan koridor Jumlah tenaga kerja yang memiliki
Jawa. Akan tetapi, pemerintah daerah pendidikan tinggi di Indonesia dari tahun
cenderung mengalokasikan belanja modal 2006-2014 terus mengalami peningkatan.
dengan proporsi yang sama setiap tahun. Dari tahun ke tahun koridor Jawa selalu
Beberapa koridor malah memiliki proporsi memiliki jumlah terbesar dibandingkan
belanja modal yang cenderung menurun. dengan koridor-koridor lain. Koridor
Hanya koridor Jawa yang selama lima tahun Sumatera juga mempunyai jumlah angkatan
terakhir memiliki proporsi belanja modal kerja berpendidikan tinggi yang cukup
yang cenderung semakin membesar. banyak. Sebaliknya, koridor Kalimantan,
Koridor Bali-Nusa Tenggara, Koridor
Sulawesi, dan Koridor Maluku-Papua
memiliki jumlah angkatan kerja
berpendidikan tinggi yang masih sedikit.

Sumber: Direktorat Jendral Perimbangan


Keuangan Kementrian Keuangn (DJPK
Kemenkeu, diolah)
Gambar 3. Proporsi Belanja Modal Sumber: BPS (diolah)
terhadap Total Belanja Gambar 4. Jumlah Angkatan Kerja
Pemerintah Daerah di Berpendidikan Tinggi di
Masing-Masing Koridor Masing-Masing Koridor
Ekonomi Indonesia Tahun Ekonomi Indonesia Tahun
2006-2014 (%) 2006-2014
Faktor – faktor yang Memengaruhi Foreign Direct Investment… / Rahayu IT dan Pasaribu E | 35
Dari tahun 2006 hingga tahun 2014 tahun 2006 sebesar Rp29,75 triliyun menjadi
jumlah nilai PDRB riil tertinggi adalah di Rp51,98 triliyun di tahun 2014. Dalam
koridor Jawa, yang pada tahun 2006 sebesar kurun waktu 9 tahun, PDRB koridor
Rp1.081,4 triliyun, meningkat hingga Maluku-Papua hanya meningkatkan share
menjadi Rp1.729,4 triliyun di tahun 2014. PDRB-nya dari sebesar 1,66% menjadi
Sebaliknya, PDRB riil terkecil berada di 1,78% dari total PDB nasional.
koridor Maluku-Papua, yang mana pada

Sumber: BPS (diolah)

Gambar 5. Nilai PDRB Atas Dasar Harga Konstan Tahun 2000 di Masing-
Masing Koridor Ekonomi Indonesia Tahun 2006-2014

Tingkat keterbukaan perdagangan Secara umum, koridor Maluku-Papua


koridor Kalimantan merupakan koridor yang adalah koridor yang memiliki proporsi
paling tinggi, yaitu mencapai 0,82 di tahun ekspor migas dan mineral tertinggi
2014, sedangkan koridor Bali-Nusa dibandingkan dengan koridor lain,
Tenggara dan koridor Sulawesi merupakan sedangkan koridor Jawa adalah koridor
koridor yang cenderung paling tertutup. dengan proporsi ekspor migas dan mineral
Koridor Sumatera, koridor Jawa, dan koridor terendah. Proporsi ekspor migas dan mineral
Maluku-Papua memiliki tingkat koridor Maluku-Papua terhadap total eskpor
keterbukaan yang hampir sama, yaitu masih koridor ini terus menurun, walaupun selalu
berfluktuatif sekitar 0,5. lebih dari 99% hingga tahun 2009. Di tahun
2014, proporsi eskpor migas dan mineral
koridor ini masih sangat besar, yaitu 0,94
(atau 94%).
Analisis inferensia dengan model
regresi data panel menunjukkan bahwa
model yang terpilih untuk koridor Sumatera
yaitu Fixed Effect Model dengan
SeeminglyUnrelated Regression (FEM-
SUR), begitu juga untuk model koridor Jawa
dan Sulawesi. Sedangkan untuk koridor
Bali-Nusa Tenggara hanya menggunakan
Fixed Effect Model. Untuk koridor
Gambar 6. Tingkat Keterbukaan Kalimantan menggunakan Fixed Effect
Perdagangan (Trade Model dengan Weighted Least Square
Openness) di Masing-Masing (FEM-WLS). Sedangkan pada koridor
Koridor Ekonomi Indonesia Maluku-Papua terpilih model Common
Tahun 2006-2014
36 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Effect Model dengan Weighted Least Square
(CEM-WLS).

Gambar 7. Proporsi Ekspor Migas dan Mineral terhadap Total Ekspor di


Masing-Masing Koridor Ekonomi Indonesia Tahun 2006-2014

Analisis inferensia dengan model Fixed Effect Model. Untuk koridor


regresi data panel menunjukkan bahwa Kalimantan menggunakan Fixed Effect
model yang terpilih untuk koridor Sumatera Model dengan Weighted Least Square
yaitu Fixed Effect Model dengan (FEM-WLS). Sedangkan pada koridor
SeeminglyUnrelated Regression (FEM- Maluku-Papua terpilih model Common
SUR), begitu juga untuk model koridor Jawa Effect Modeldengan Weighted Least Square
dan Sulawesi. Sedangkan untuk koridor (CEM-WLS).
Bali-Nusa Tenggara hanya menggunakan

Tabel 1. Hasil estimasi untuk masing-masing koridor ekonomi


Koridor Sumatera Jawa Bali-Nusa Kalimantan Sulawesi Maluku-
Variabel Tenggara Papua
R-square 0.54128 0.83090 0.83964 0.74482 0.73076 0.32286

F-statistik 0.47534 0.83410 0.83964 0.79079 0.65064 0.32329

Prob. 0.00000 0.00000 0.00000 0.00000 0.00000 0.00431

Koefisien:

• Kontanta -19.78570 -214.68580 6.59222 -35.58441 -31.86938 22.41631

• BM -0.04195* -0.53512* -0.03111 0.01272 -0.03072* -0.07743


(0,0205) (0,0143) (0,5204) (0,8501) (0,0756) (0,2800)
• LNANGKER 1.87009* 14.62105* -0.66160 0.41216 2.52456* -1.75210
(0,0039) (0,0587) (0,7486) (0,9413) (0,0130) (0,3818)
• OPEN -0.03082* 0.03064 -0.16459* 0.00598 -0.11929* -0.16917*
(0,0611) (0,8894) (0,0000) (0,2373) (0,0026) (0,0015)
• XMIGAS -0.02881* 0.10944 -0.00702 -0.06619* 0.02729* 0.06167*
(0,0463) (0,3430) (0,5924) (0,0123) (0,0105) (0,0490)
• PDRB 0.00892* 0.10077* 0.42783* 0.78313* 0.12673* 0.46480*
(0,0032) (0,0000) (0,0015) (0,0008) (0,0001) (0,0010)
*signifikan pada level 5%

Faktor – faktor yang Memengaruhi Foreign Direct Investment… / Rahayu IT dan Pasaribu E | 37
Berdasarkan hasil analisis inferensia, koridor Maluku dan Papua. Sedangkan di
proporsi belanja modal, jumlah angkatan koridor Jawa dan koridor Kalimantan,
kerja berpendidikan tinggi, dan tingkat tingkat keterbukaan perdagangan tidak
keterbukaan perdagangan mempunyai berpengaruh signifikan terhadap FDI.
pengaruh yang berbeda-beda di masing- Pengaruh tingkat keterbukaan
masing koridor ekonomi Indonesia. perdagangan terhadap FDI tergantung pada
Proporsi belanja modal pemerintah jenis FDI yang masuk ke wilayah tersebut.
daerah hanya berpengaruh signifikan Pada market seeking FDI, tingkat
terhadap FDI di koridor Sumatera, koridor keterbukaan perdagangan akan cenderung
Jawa, dan koridor Sulawesi. Sedangkan di untuk berpengaruh negatif terhadap FDI.
koridor Bali dan Nusa Tenggara, koridor Hal tersebut biasa terjadi pada negara-negara
Kalimantan, dan koridor Maluku dan Papua, maju, yang mana cenderung memiliki
proporsi belanja modal pemerintah daerah tingkat keterbukaan yang lebih kecil
tidak berpengaruh signifikan terhadap FDI. dibandingkan dengan negara-negara
Sebaliknya, jumlah angkatan kerja berkembang (Briguglio, 2016). Sebaliknya,
berpendidikan tinggi berpengaruh signifikan pada resource seeking FDI, tingkat
dan positif terhadap FDI di koridor keterbukaan perdagangan cederung
Sumatera, koridor Jawa, dan koridor berpengaruh positif terhadap FDI. Akan
Sulawesi. Hal ini kemungkinan terjadi tetapi, tingkat keterbukaan bisa berpengaruh
karena koridor Jawa dan koridor Sumatera terhadap FDI bertipe market seeking apabila
memiliki jumlah angkatan kerja pasar yang dicari oleh investor bukan hanya
berpendidikan tinggi terbanyak. Sedangkan berada di dalam wilayah tersebut, melainkan
koridor Sulawesi memiliki proporsi juga wilayah disekitarnya.
angkatan kerja berpendidikan tinggi terbesar Motivasi market seeking dan resource
dibandingkan dengan koridor-koridor lain. seeking di setiap koridor ekonomi Indonesia
Di samping itu, seperti halnya variabel disimpulkan berdasarkan signifikansi dan
proporsi belanja modal, jumlah angkatan pengaruh variabel-variabel proksi terhadap
kerja berpendidikan tinggi juga tidak FDI. Adanya motivasi market seeking dan
berpengaruh signifikan terhadap FDI di resource seeking adalah apabila variabel-
koridor Bali dan Nusa Tenggara, koridor variabel proksi untuk market size dan natural
Kalimantan, dan koridor Maluku dan Papua. resource availability, yaitu PDRB dan
Tingkat keterbukaan perdagangan proporsi ekspor migas dan mineral,
berpengaruh negatif dan signifikan terhadap berpengaruh signifikan dan positif terhadap
FDI di koridor Sumatera, koridor Bali dan FDI.
Nusa Tenggara, koridor Sulawesi, dan

Gambar 9. Nilai Slope dan Pengaruh PDRB Terhadap FDI di Seluruh Koridoe
Ekonomi Indonesia

38 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Dari hasil pengujian signifikansi masing koridor di Indonesia bersifat market
variabel untuk masing-masing koridor, seeking. Hal ini didukung dengan tidak
variabel proksi untuk market size, yaitu signifikannya variabel proksi untuk natural
PDRB, signifikan dan positif di semua resource availability, yaitu proporsi ekspor
koridor. Hasil tersebut mengindikasikan migas dan mineral di koridor Jawa dan
bahwa tipe FDI yang masuk ke masing- koridor Bali dan Nusa Tenggara.

Gambar 10. Nilai Slope dan Pengaruh Proporsi Ekspor Migas dan Mineral
Terhadap FDI di Seluruh Koridor Ekonomi Indonesia

Variabel proporsi migas dan mineral KESIMPULAN DAN SARAN


berpengaruh negatif terhadap realisasi FDI
di koridor Sumatera. Hal tersebut berarti Perkembangan realisasi FDI masih
bahwa FDI yang masuk ke koridor Sumatera didominasi oleh koridor Jawa, namun
bukanlah tipe resource seeking. Hasil serupa dikoridor lain sudah mulai tumbuh.
juga didapatkan di koridor Kalimantan, yang Pengeluaran belanja modal, jumlah
mana natural resource availability juga angkatan kerja berpendidikan tinggi, dan
menunjukkan hasil signifikan namun PDRB juga masih didominasi oleh koridor
negatif. Hasil ini berbeda dengan fungsi Jawa. Tingkat keterbukaan perdagangan
koridor Kalimantan yang merupakan sentra yang paling tertinggi berada di koridor
produksi dan pengolahan hasil tambang Kalimantan. Sedangkan proporsi ekspor
yang seharusnya merupakan faktor penarik migas dan mineral terbesar ada di koridor
utama bagi investor untuk menanamkan Maluku dan Papua.
modalnya disana. Faktor-faktor yang memengaruhi FDI
Di sisi lain, natural resource berbeda-beda untuk masing-masing koridor.
availability menunjukkan hasil yang Di koridor Sumatera, koridor Jawa, dan
signifikan dan positif di koridor Sulawesi koridor Sulawesi, belanja modal
dan koridor Maluku dan Papua. Hal ini berpengaruh negatif terhadap realisasi FDI,
menunjukkan bahwa, selain FDI yang sedangkan jumlah angkatan kerja memiliki
bertipe market seeking, ada juga FDI yang pengaruh yang positif. Faktor tingkat
masuk ke koridor Sulawesi dan koridor keterbukaan perdagangan berpengaruh
Maluku-Papua dengan tipe resource negatif di koridor Sumatera, koridor Bali dan
seeking. Hal ini sesuai dengan hipotesis Nusa Tenggara, koridor Sulawesi, dan
bahwa FDI yang masuk ke koridor Maluku- koridor Maluku dan Papua. Di koridor
Papua akan bertipe resouce seeking karena Sumatera dan koridor Kalimantan, ekspor
sumber daya alamnya yang masih migas dan mineral berpengaruh negatif
melimpah. terhadap realisasi FDI, sebaliknya ekspor
migas berpengaruh positif terhadap realisasi
FDI di koridor Sulawesi dan koridor Maluku
Faktor – faktor yang Memengaruhi Foreign Direct Investment… / Rahayu IT dan Pasaribu E | 39
dan Papua. PDRB berpengaruh positif Badan Pusat Statistik. (2006-2014).
terhadap realisasi FDI di semua koridor Keadaan Angkatan Kerja di
ekonomi. Indonesia. Jakarta: BPS
FDI yang bermotivasi market seeking Badan Pusat Statistik. (2007-2015). Statistik
ditemukan di semua koridor ekonomi Indonesia. Jakarta: BPS
Indonesia. Sementara itu, FDI dengan Briguglio, L. 2016. Small States And The
motivasi resource seeking hanya ditemukan European Union: Economic
di koridor Sulawesi dan koridor Maluku dan Perspectives New York: Routledge
Papua. Dunning, J. H. 1993. The Globalization of
Pemerintah perlu mengevaluasi Business. (diaskses 25 Juni 2016).
penggunaan pengeluaran belanja modal http://unctad.org/en/PublicationChapt
daerah agar tepat sasaran. Pemerintah juga ers/iteiitv3n1a3_en.pdf
perlu meningkatkan kebijakan tentang Jadhav, P. 2012. Determinants of Foreign
pendidikan, terutama untuk pendidikan Direct Investment in BRICS
tinggi, dan kebijakan yang dapat economies: Analysis of Economics,
meningkatkan PDRB. Selain itu, pemerintah Institutional, and Political Factor.
perlu mencari alternatif pengganti sumber Procedia – Social and Behavioral
daya alam di Maluku-Papua yang masih Science. 37, 5-14. (diakses 26 Januari
menjadi incaran para investor asing agar bisa 2016).
dimanfaatkan dengan baik dan http://www.sciencedirect.com/science
menghasilkan nilai tambah yang akan lebih /article/pii/S1877042812007495
menguntungkan wilayah setempat. Selain Kemenkeu. 2011. Klasifikasi Jenis Belanja.
itu, motivasi resource seeking yang masih (diakses 29 Juni 2016).
ditemukan di koridor Maluku-Papua juga http://www.jdih.kemenkeu.go.id/fullT
belum sesuai dengan tujuan pemerintah yang ext/2011/101~PMK.02~2011PerLam
ingin mengembangkan kegiatan ekonomi di p%20III
masing-masing wilayah Indonesia. Rohmana, Y. 2011. Analisis Faktor-Faktor
yang Mempengaruhi Investasi Asing
DAFTAR PUSTAKA Langsung di Indonesia Periode 1980-
2008. Jurnal Sains dan Terapan. 6(2).
Asiedu, E. 2002. On the Determinants of Universitas Pendidikan Indonesia
Foreign Direct Investment to (UPI) Bandung. (diakses 8 Februari
Developing Countries: Is Africa 2015).
Different?. World Development. http://jurnal.upi.edu/2022/view/1119/
30(1), 107-119. (diakses 2 Agustus analisis-faktor-faktor-yang-
2016). people.ku.edu/~asiedu/FDI-in- mempengaruhi-investasi-asing-
Africa-WD.pdf langsung-di-indonesia-periode-1980-
Asiedu, E. 2006. Foreign Direct Investment 2008.html
in Africa: The Role of Natural Sarwedi. 2002. Investasi Asing Langsung di
Resources, Market Size, Government Indonesia dan Faktor yang
Policy, Institutions and Political Mempengaruhinya. Jurnal Akuntansi
Instability. working paper. United & Keuangan. 4(1), 17–35 Jurusan
Nation University. (diakses 25 Juni Ekonomi Akuntansi, Fakultas
2016). people.ku.edu/~asiedu/world- Ekonomi - Universitas Kristen Petra.
economy.pdf Setiawan, G. 2002. The Impact of Foreign
Asiedu, E. dan Lien, D.D. 2010. Democracy, Direct Investment on Indonesian
Foreign Direct Investment and Natural Economic Growth. Tesis. Seoul: KDI
Resources. Working paper. (Korea Development Institute) School
(diakses 1 Agustus 2016). of Public Policy and Management.
http://papers.ssrn.com/sol3/papers.cf Todaro, M.P. dan Smith, S.C. 2003.
m?abstract_id=1726587 Pembangunan Ekonomi di Dunia
Ketiga: Jilid 1. Jakarta: Erlangga.
40 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
DETERMINAN PERILAKU MEROKOK
PADA REMAJA SEKOLAH DI INDONESIA

Titik Harsanti1 dan Febri Wicaksono2

Sekolah Tinggi Ilmu Statistik


e-mail :1titik@stis.ac.id, 2febri@stis.ac.id

Abstrak

Saat ini merokok telah menjadi masalah kesehatan secara global dan menjadi beban ekonomi yang berat.
Di Indonesia, tren merokok cenderung semakin meningkat dan kencenderungan ini tidak hanya terjadi
pada orang dewasa tetapi juga pada remaja. Penelitian ini bertujuan mengidentifikasi faktor-faktor yang
mempengaruhi perilaku merokok bagi kalangan remaja yang bersekolah di Indonesia dengan
menggunakan model logistik multivariat biner. Analisis dilakukan dengan menggunakan 5.986 sampel
siswa dari Global Youth Tobacco Survey 2014 (GYTS) 2014. Hasilnya menunjukkan bahwa 25% siswa
pernah merokok dan 15% siswa saat ini merokok. Peluang siswa untuk merokok lebih tinggi di kalangan
anak laki-laki dibandingkan dengan anak perempuan. Risiko merokok yang lebih tinggi teramati di
antara siswa yang memiliki teman dekat yang merokok dibandingkan dengan siswa yang tidak memiliki
teman dekat yang merokok. Siswa yang salah satu atau kedua orang tuanya merokok lebih cenderung
merokok dibandingkan dengan siswa yang orang tuanya tidak merokok. Siswa yang pernah melihat
gurunya merokok atau pernah melihat orang-orang merokok di rumah mereka dan tempat-tempat umum
lebih cenderung merokok dibandingkan dengan mereka yang tidak pernah melihat gurunya merokok
atau tidak pernah melihat orang merokok di rumah mereka dan tempat umum. Temuan ini menunjukkan
bahwa penegakan peraturan untuk mengurangi aksesibilitas rokok diperlukan untuk mengekang
penggunaan rokok di kalangan siswa. Selain itu, intervensi dan kampanye pendidikan yang menargetkan
siswa sekolah menengah juga diperlukan.

Kata kunci: Tembakau, Merokok, Sekolah, Remaja, Indonesia

Abstract

Smoking is a global public health concern and it imposes a heavy economic burden. However, the trend
of smoking in Indonesia seems to be increasing and the magnitude of the problem affects not only adults
but also adolescents. This paper identifies cigarette smoking determinants among school adolescents in
Indonesia, using a multivariate binary logistic model. The analysis uses 5,986 samples of students from
the 2014 Indonesia Global Youth Tobacco Survey (GYTS). The results show that 25% of the students
have ever smoked and 15% of students are currently smoking. The students’ odds of smoking are higher
for boys compared to girls. Higher risk of smoking is observed among the students who have closed-
peer smoking compared to students who don’t have closed-peer smoking. Students whose one or both
parents are smoking are more likely to smoke compared to whose parents are not smoking. Students
who have seen their teacher smoking or have seen people smoking in their house and public places are
more likely to smoke compared to who haven’t ever seen their teacher smoking or haven’t ever seen
people smoking in their house and public places. These findings suggest that enforcement of legislations
to decrease accessibility of cigarettes are necessary to curb the cigarette use among students. Beside
that the interventions and education campaigns that target secondary school students are also needed.

Keywords: Tobacco, Smoking, School, Adolescent, Indonesia

Determinan Perilaku Merokok… / Harsanti T dan Wicaksono F | 41


menyebutkan bahwa prevalensi merokok
PENDAHULUAN
penduduk berumur 15-19 tahun telah
Rokok merupakan salah satu meningkat dari 7,1% di tahun 1995 menjadi
kekhawatiran terbesar dunia kesehatan 20,5% di tahun 2013 (TCSC – IAKMI,
karena menyebabkan hampir 6 juta orang 2014). Oleh karena itu penanganan masalah
meninggal dalam setahun. Lebih dari 5 juta rokok perlu menjadi prioritas. Sehingga,
orang yang meninggal tersebut adalah akibat penelitian ini bertujuan untuk
menghisap rokok secara langsung dan 600 menginvestigasi faktor yang mempengaruhi
ribu orang meninggal karena terpapar asap penggunaan rokok pada remaja di Indonesia.
rokok (WHO, 2014).
Selain itu, rokok juga menyebabkan
DATA DAN METODOLOGI
beban yang sangat berat terhadap
perekonomian di seluruh dunia. Penelitian ini menggunakan data
Diperkirakan bahwa pengeluaran kesehatan Global Youth Tobacco Survey (GYTS)
yang disebabkan oleh rokok mencapai 5,7% Indonesia tahun 2014. GYTS Indonesia
dari total pengeluaran kesehatan dunia di tahun 2014 merupakan survei representatif
tahun 2012. Kemudian total biaya ekonomi nasional berbasis sekolah yang mendata
yang disebabkan oleh rokok diperkirakan siswa kelas 7, 8,dan 9 (WHO, 2015).
setara dengan 1,8% dari total Produk GYTS Indonesia tahun 2014
Domestik Bruto (PDB) dunia di tahun 2012 menggunakan desain sampel dua tahap (two-
(dihitung dari pengeluaran kesehatan dan stage sample design), dengan memilih
berkurangnya produktivitas pekerja) sekolah proporsional terhadap jumlah
(Goodchild, Nargis, & Tursan d’Espaignet, siswanya. Pada tahap pertama, dipilih 72
2017). sekolah. Kelas-kelas yang berada pada
WHO (2011) menyebutkan bahwa sekolah tersebut selanjutnya dipilih secara
dampak negatif merokok pada usia remaja acak dan semua siswa yang berada di
jauh lebih besar dibandingkan ketika dalamnya memenuhi syarat (eligible) untuk
merokok pada usia dewasa. Permulaan berpartisipasi di dalam survei. 72 sekolah,
merokok biasanya terjadi pada saat remaja, 208 kelas, dan 5.986 siswa berpartisipasi di
namun efek merokok seperti kematian dan dalam survei ini (WHO, 2015).
kecacatan yang terkait dengan merokok baru Unit analisis yang digunakan dalam
bisa terlihat secara nyata di masa tua (Elders, penelitian ini adalah siswa kelas 7, 8, dan 9.
Perry, Eriksen, & Giovino, 1994). Lebih Variabel terikat yang digunakan dalam
lanjut, merokok juga telah digambarkan penelitian ini adalah status merokok selama
sebagai “pintu gerbang” terhadap kurun waktu 30 hari sebelum pendataan
penggunaan narkotika dan obat-obat sampai dengan pendataan berlangsung.
terlarang lainnya oleh remaja (Gilliland et Status merokok terdiri dari 2 kemungkinan,
al., 2006). Oleh karena itu, selain dapat yaitu merokok (kode: 1) dan tidak merokok
menyebabkan masalah kesehatan jangka (kode: 0).
pendek seperti masalah pernafasan, Variabel bebas yang digunakan dalam
kecanduan terhadap nikotin, dan resiko penelitian ini adalah jenis kelamin, tingkat
penggunaan obat-obatan terlarang, merokok pendidikan (kelas), keterpaparan akan rokok
pada remaja juga dapat menimbulkan di rumah, keterpaparan akan rokok di dalam
masalah kesehatan jangka panjang karena ruang publik tertutup, keterpaparan akan
faktanya adalah kebanyakan orang yang rokok di ruang publik terbuka, keterpaparan
merokok sejak remaja cenderung untuk akan iklan rokok, keterpaparan akan
merokok sampai dewasa. kampanye anti rokok, guru merokok, orang
Tren kenaikan penggunaan rokok di tua merokok, teman dekat merokok, diskusi
Indonesia bukan hanya didominasi oleh mengenai bahaya rokok di dalam keluarga,
kelompok dewasa, namun juga sudah serta pengetahuan dan sikap terhadap bahaya
merambah ke kelompok remaja. merokok. Dari beberapa penelitian terkait,
Kementerian Kesehatan Republik Indonesia variabel-variabel tersebut diduga
42 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
berpengaruh secara signifikan terhadap Peraturan Pemerintah Nomor 109 Tahun
perilaku merokok pada remaja (Hou, Xu, & 2012 telah disebutkan adanya larangan
Anderson, 2015; Rachmat, Thaha, & Syafar, penjualan rokok terhadap anak di bawah usia
2013; Reda, Moges, Yazew, & Biadgilign, 18 tahun ke bawah, namun di dalam data
2012; Ribeiro Sarmento & Yehadji, 2015). GYTS Indonesia tahun 2014 masih dijumpai
Dalam penelitian ini, status merokok adanya siswa sekolah yang berusia kurang
sebagai variabel terikat merupakan variabel dari 18 tahun yang dapat membeli rokok di
dikotomi, sehingga analisis yang digunakan toko, bahkan secara eceran per batang. Hal
untuk melihat determinan dari perilaku ini menunjukkan masih lemahnya
merokok menggunakan model regresi pengawasan pemerintah terhadap penjualan
logistik biner (Kleinbaum & Klein, 2010). rokok di masyarakat.
Model regresi logistik biner yang digunakan Kemudian studi ini juga menemukan
dalam penelitian ini dapat diformulasikan bahwa perokok remaja sekolah didominasi
sebagai berikut oleh laki-laki. Dua puluh sembilan persen
diantara responden laki-laki merokok pada
saat pendataan, sedangkan diantara
dimana merupakan peluang untuk responden perempuan, hanya dijumpai 2%
merokok, merupakan konstanta, diantaranya yang merokok pada saat
merupakan parameter-parameter yang akan pendataan.
diestimasi, merupakan variabel-variabel Selain itu, ditemui juga bahwa 93%
bebas, dan i merupakan banyaknya variabel perokok mempunyai teman dekat yang
bebas. merokok. Hal ini mengindikasikan adanya
pengaruh teman sebaya yang dapat
mempengaruhi seorang remaja untuk
HASIL DAN PEMBAHASAN merokok.
Secara umum, karakteristik sampel
dalam penelitian ini tersaji dalam Tabel 1.
Rata-rata umur responden adalah 13,26
tahun dengan standar deviasi sebesar 0,014.
Dengan tidak memperhatikan periode waktu
merokoknya, 1.500 remaja atau 25% dari
total responden pernah merokok, dimana
570 remaja diantaranya (38%) mulai
merokok pada usia 12 atau 13 tahun.
Dari keseluruhan responden, terdapat
876 (15%) responden yang merokok pada Grafik 1. Persentase Siswa Berdasarkan
saat pendataan (kurun waktu 30 hari Status Merokok
sebelum pendataan sampai dengan
pendataan berlangsung) (Grafik 1.). Hasil analisis regresi logistik biner
Sebagian besar perokok (74%) merokok menunjukkan bahwa jenis kelamin, tingkat
tidak lebih dari satu batang rokok setiap hari, kelas, jumlah hari responden melihat orang
namun juga terdapat 6% perokok yang merokok di dalam rumah (7 hari terakhir),
merokok lebih dari 5 batang rokok setiap jumlah hari responden melihat orang
harinya. merokok di dalam ruang publik tertutup (7
Tingginya prevalensi merokok pada hari terakhir), jumlah hari responden melihat
siswa remaja ini salah satunya mungkin orang merokok di ruang publik terbuka (7
dikarenakan mudahnya akses dalam hari terakhir), melihat guru merokok di area
mendapatkan rokok. Studi ini menemukan sekolah, teman dekat merokok, dan orang
bahwa 49% perokok mendapatkan rokok tua merokok, serta pengetahuan dan sikap
dengan membeli di toko, dimana 65% dari terhadap bahaya rokok berpengaruh secara
seluruh perokok membeli rokok secara signifikan terhadap perilaku merokok pada
eceran per batang. Meskipun di dalam remaja yang bersekolah (lihat Tabel 2).
Determinan Perilaku Merokok… / Harsanti T dan Wicaksono F | 43
Tabel 1. Karakteristik Sampel
Status Merokok
Total
Tidak Ya
n % n % n %
Jenis Kelamin
Laki-laki 1,995 71 813 29 2,808 47
Perempuan 3,115 98 63 2 3,178 53
Kelas
7 2,149 87 315 13 2,464 41
8 1,834 86 290 14 2,124 35
9 1,127 81 271 19 1,398 23
Jumlah hari responden melihat orang merokok di
dalam rumah (7 hari terakhir)
0 2,528 94 156 6 2,684 45
>0 2,582 78 720 22 3,302 55
Jumlah hari responden melihat orang merokok di
dalam ruang publik tertutup (7 hari terakhir)
0 2,400 93 173 7 2,573 43
>0 2,710 79 703 21 3,413 57
Jumlah hari responden melihat orang merokok di
ruang publik terbuka (7 hari terakhir)
0 2,249 93 157 7 2,406 40
>0 2,861 80 719 20 3,580 60
Pernah mendengar kampanye anti tembakau (30
hari terakhir)
Tidak 1,520 87 218 13 1,738 29
Ya 3,590 85 658 15 4,248 71
Pernah melihat iklan rokok atau orang merokok di
media
Tidak 1,734 90 191 10 1,925 32
Ya 3,376 83 685 17 4,061 68
Salah satu atau kedua orang tua merokok
Tidak atau tidak tahu 1,741 90 189 10 1,930 32
Ya 3,369 83 687 17 4,056 68
Teman dekat merokok
Tidak 2,634 98 65 2 2,699 45
Ya 2,476 75 811 25 3,287 55
Diskusi keluarga mengenai bahaya merokok
Tidak 2,290 87 335 13 2,625 44
Ya 2,820 84 541 16 3,361 56
Melihat guru merokok di area sekolah
Tidak atau tidak tahu 2,111 91 202 9 2,313 39
Ya 2,999 82 674 18 3,673 61

44 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Tabel 2. Estimasi Regresi Logistik Biner: Determinan Merokok
Stand Rasio 95% C.I.untuk RK
Koefisien ard Kecenderu
Error ngan (RK) Lower Upper
Jenis kelamin
Laki-laki 2.66 0.14* 14.26 10.86 18.73
Perempuan r)
Kelas
9 0.22 0.11** 1.25 1.00 1.55
8 -0.04 0.10 0.96 0.79 1.18
7 r)
Jumlah hari responden melihat orang merokok di
dalam rumah (7 hari terakhir)
>0 0.77 0.12* 2.17 1.73 2.72
0 r)
Jumlah hari responden melihat orang merokok di
dalam ruang publik tertutup (7 hari terakhir)
>0 0.55 0.12* 1.73 1.37 2.19
0 r)
Jumlah hari responden melihat orang merokok di
ruang publik terbuka (7 hari terakhir)
>0 0.42 0.12* 1.52 1.19 1.93
0 r)
Melihat guru merokok di area sekolah
Ya 0.32 0.10* 1.37 1.13 1.67
r)
Tidak atau tidak tahu
Pernah melihat iklan rokok atau orang merokok
di media
Ya 0.04 0.11 1.04 0.84 1.28
Tidak r)
Pernah mendengar kampanye anti tembakau (30
hari terakhir)
Ya 0.02 0.10 1.02 0.84 1.23
Tidak r)
Teman dekat merokok
Ya 1.66 0.14* 5.28 4.00 6.97
Tidak r)
Salah satu atau kedua orang tua merokok
Ya 0.21 0.11** 1.24 1.00 1.52
Tidak r)
Diskusi keluarga mengenai bahaya merokok
Ya 0.09 0.09 1.09 0.92 1.31
Tidak r)
Pengetahuan dan sikap terhadap bahaya rokok -0.26 0.04* 0.77 0.72 0.83
Catatan: r) kategori referensi
* signifikan pada α=1%
** signifikan pada α=5%

Resiko remaja sekolah laki-laki untuk Tobacco Survey Collaborating Group, 2003;
merokok 14,26 kali lebih besar Reda et al., 2012; Ribeiro Sarmento &
dibandingkan dengan remaja sekolah Yehadji, 2015) juga menemukan adanya
perempuan (95%CI: 10,86 – 18,73). Studi di resiko yang lebih besar pada remaja laki-laki
Jakarta, Guangdong (Cina), Nepal, Ethiopia untuk merokok. Dalam konteks Indonesia,
Timur, dan Timor Leste (Global Youth rendahnya resiko perempuan untuk merokok

Determinan Perilaku Merokok… / Harsanti T dan Wicaksono F | 45


mungkin disebabkan karena adanya nilai yang tidak pernah melihat orang merokok di
budaya yang mengstigmakan wanita yang dalam rumah (95%CI: 1,73 – 2,72).
merokok sebagai perilaku moral yang buruk Temuan ini sejalan dengan beberapa
(Barraclough, 1999). penelitian sebelumnya (Foraker, Patten,
Remaja sekolah yang memiliki teman Lopez, Croghan, & Thomas, 2005; Reda et
dekat yang merokok mempunyai resiko 5,28 al., 2012; Ribeiro Sarmento & Yehadji,
kali lebih besar untuk merokok 2015; Rudatsikira et al., 2008;
dibandingkan dengan yang tidak memiliki Sreeramareddy, Kishore, Paudel, &
teman dekat yang merokok (95%CI: 4,00 – Menezes, 2008). Tekanan sosial dari orang
6,97). Beberapa penelitian diberbagai daerah tua, guru, dan lingkungan sekitar dapat
juga mendapati adanya hubungan positif mempengaruhi psikologis remaja sehingga
antara memiliki teman yang merokok dapat mempengaruhi resiko mereka untuk
dengan perilaku merokok remaja (Reda et mengkonsumsi rokok.
al., 2012; Ribeiro Sarmento & Yehadji,
2015; Rudatsikira, Dondog, Siziya, &
KESIMPULAN DAN SARAN
Muula, 2008). Hasil ini mengindikasikan
adanya tekanan sosial dari teman sebaya Penelitian ini menemukan adanya
yang dapat mempengaruhi resiko remaja prevalensi merokok yang cukup tinggi pada
untuk merokok. Bricker dan kawan-kawan siswa remaja di Indonesia. Selain itu,
(2006) menyebutkan bahwa merokok penelitian ini menemukan bahwa resiko
diantara teman-teman dapat mempengaruhi siswa untuk merokok lebih tinggi untuk laki-
inisiasi dan keberlanjutan penggunaan rokok laki, siswa yang pernah melihat orang
di kalangan remaja. merokok di rumah, siswa yang pernah
Penelitian ini juga menemukan bahwa melihat orang merokok di dalam ruang
remaja sekolah yang salah satu atau kedua publik tertutup, siswa yang pernah melihat
orang tuanya merokok mempunyai resiko orang merokok di ruang publik terbuka,
1,24 kali lebih besar untuk merokok siswa yang pernah melihat guru merokok di
dibandingkan dengan yang kedua orang sekolah, siswa yang teman dekatnya
tuanya tidak merokok (95%CI: 1,00 – 1,52). merokok, dan siswa yang salah satu atau
Kemudian remaja sekolah yang pernah kedua orang tuanya merokok. Selain itu,
melihat guru merokok di area sekolah semakin baik pengetahuan dan perilaku
mempunyai resiko 1,37 kali lebih besar siswa terhadap bahaya merokok, semakin
untuk merokok dibandingkan dengan yang rendah resiko siswa untuk merokok.
tidak pernah melihat guru merokok di area Penelitian ini menemukan adanya
sekolah (95%CI: 1,13 – 1,67). Selain itu, kemudahan akses remaja sekolah dalam
remaja sekolah yang pernah melihat orang mendapatkan rokok. Hal ini
merokok di dalam ruang publik tertutup mengindikasikan adanya pengawasan yang
mempunyai resiko 1,73 kali lebih besar kurang baik oleh pemerintah dalam
untuk merokok dibandingkan dengan yang mengawasi peredaran rokok di masyarakat,
tidak pernah melihat orang merokok di walaupun sudah ada peraturan pemerintah
dalam ruang publik tertutup (95%CI: 1,37 – yang dibuat untuk mengawasi hal tersebut.
2,19). Serta remaja sekolah yang pernah Sehingga dapat disarankan kepada
melihat orang merokok di ruang publik pemerintah agar pengawasan peredaran
terbuka mempunyai resiko 1,52 kali lebih rokok, khususnya penjualan rokok terhadap
besar untuk merokok dibandingkan dengan anak di bawah usia 18 tahun harus semakin
yang tidak pernah melihat orang merokok di diperketat.
ruang publik terbuka (95%CI: 1,19 – 1,93). Kemudian penelitian ini juga
Pengaruh lingkungan yang perlu menjadi mendapatkan bahwa siswa yang memiliki
perhatian adalah bahwa remaja sekolah yang teman dekat yang merokok cenderung lebih
pernah melihat orang merokok di dalam beresiko untuk merokok. Hasil ini
rumah mempunyai resiko 2,17 kali lebih mengindikasikan perlu adanya intervensi
besar untuk merokok dibandingkan dengan dan edukasi mengenai bahaya merokok pada
46 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
siswa sekolah menengah pertama. School Health, 73(6), 207–215.
Kemudian perhatian juga perlu diperluas ke https://doi.org/10.1111/j.1746-
lingkungan sekolah dan tempat tinggal para 1561.2003.tb06562.x
siswa, untuk mengatasi masalah tekanan Goodchild, M., Nargis, N., & Tursan
sosial di sekolah, rumah, dan di lingkungan d’Espaignet, E. 2017. Global economic
sekitar yang dapat memberikan dampak cost of smoking-attributable diseases.
psikologis bagi para remaja untuk Tobacco Control, tobaccocontrol-
mengkonsumsi rokok. 2016-053305.
https://doi.org/10.1136/tobaccocontrol
-2016-053305
DAFTAR PUSTAKA
Hou, X., Xu, X. dan Anderson, I. 2015.
Barraclough, S. 1999. Women and tobacco Determinants of tobacco consumption
in Indonesia. Tobacco Control, 8, 327– in Papua New Guinea : challenges in
332. https://doi.org/10.1136/tc.8.3.327 changing behaviors, 2(2), 1–23.
Bricker, J. B., Peterson, A. V., Andersen, M. https://doi.org/10.1002/app5.85
R., Rajan, K. B., Leroux, B. G. dan Kleinbaum, D. G. dan Klein, M. 2010.
Sarason, I. G. 2006. Childhood friends Logistic regression : a self-learning
who smoke: Do they influence text. Springer.
adolescents to make smoking Rachmat, Muhammad., Thaha, Ridwan
transitions?. Addictive Behaviors, Mochtar., Syafar, M. 2013. Perilaku
31(5), 889–900. Merokok Remaja Sekolah Menengah
https://doi.org/10.1016/j.addbeh.2005. Pertama. Jurnal Kesehatan Masyarakat
07.011 Nasional, 7(11), 502–508.
Elders, M. J., Perry, C. L., Eriksen, M. P. dan https://doi.org/10.21109/kesmas.v7i11.
Giovino, G. A. 1994. The report of the 363
surgeon general: Preventing tobacco Reda, A. A., Moges, A., Yazew, B. dan
use among young people. American Biadgilign, S. 2012. Determinants of
Journal of Public Health, 84(4), 543– cigarette smoking among school
547. adolescents in eastern Ethiopia: a cross-
https://doi.org/10.2105/AJPH.84.4.543 sectional study. Harm Reduction
Foraker, R. E., Patten, C. A., Lopez, K. N., Journal, 9(1), 39.
Croghan, I. T., & Thomas, J. L. 2005. https://doi.org/10.1186/1477-7517-9-
Beliefs and attitudes regarding smoking 39
among young adult Latinos: a pilot Ribeiro Sarmento, D. dan Yehadji, D. 2015.
study. Preventive Medicine, 41(1), An analysis of global youth tobacco
126–133. survey for developing a comprehensive
https://doi.org/10.1016/j.ypmed.2004.1 national smoking policy in Timor-
0.018 Leste. BMC Public Health, 16(1), 65.
Gilliland, F. D., Islam, T., Berhane, K., https://doi.org/10.1186/s12889-016-
Gauderman, W. J., McConnell, R., 2742-5
Avol, E., & Peters, J. M. 2006. Regular Rudatsikira, E., Dondog, J., Siziya, S., &
Smoking and Asthma Incidence in Muula, A. S. 2008. Prevalence and
Adolescents. American Journal of determinants of adolescent cigarette
Respiratory and Critical Care smoking in Mongolia. Singapore
Medicine, 174(10), 1094–1100. Medical Journal, 49(1), 57–62.
https://doi.org/10.1164/rccm.200605- Retrieved from
722OC http://www.ncbi.nlm.nih.gov/pubmed/
Global Youth Tobacco Survey 18204771
Collaborating Group. 2003. Sreeramareddy, C. T., Kishore, P., Paudel,
Differences in Worldwide Tobacco Use J., & Menezes, R. G. 2008. Prevalence
by Gender: Findings from the Global and correlates of tobacco use amongst
Youth Tobacco Survey. Journal of junior collegiates in twin cities of
Determinan Perilaku Merokok… / Harsanti T dan Wicaksono F | 47
western Nepal: A cross-sectional, (GYTS): Indonesia report 2014. Who-
questionnaire-based survey. BMC Searo.
Public Health, 8(1), 97. https://doi.org/http://www.searo.who.i
https://doi.org/10.1186/1471-2458-8- nt/tobacco/documents/ino_gyts_report
97 _2014.pdf
TCSC-IAKMI. 2014. Bunga Rampai : Fakta WHO | Health effects of smoking among
Tembakau dan Permasalahannya. young people. 2011. WHO. Retrieved
Kemenkes RI. Jakarta from
WHO. 2014. WHO | Research for universal http://www.who.int/tobacco/research/y
health coverage: World health report outh/health_effects/en/
2013. WHO. World Health
Organization.
WHO. 2015. Global Youth Tobacco Survey

48 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


PERSEPSI MASYARAKAT KELURAHAN BUKIT DURI TERHADAP
PROGRAM NORMALISASI KALI CILIWUNG DI JAKARTA TAHUN
2017 SERTA VARIABEL-VARIABEL YANG MEMENGARUHINYA

Loveria Candra Puspita1 dan Achmad Prasetyo2*


1
Badan Pusat Statistik, Jakarta
2
Dosen Statistika, Sekolah Tinggi Ilmu Statistik, Jakarta
*e-mail: praze@stis.ac.id

Abstrak

Salah satu cara menangani masalah banjir adalah melakukan program normalisasi sungai. Namun, tidak
semua masyarakat menerima program ini. Untuk itu, ingin diketahui persepsi masyarakat terhadap
normalisasi Kali Ciliwung dan menganalisa variabel-variabel yang memengaruhinya. Data persepsi
diperoleh melalui survei dengan pendekatan rumahtangga di Kelurahan Bukit Duri yang kemudian
dianalisis dengan regresi logistik. Hasil penelitian menunjukkan bahwa 28 persen rumahtangga sekitar
sungai dan 22 persen rumahtangga bukan sekitar sungai menolak normalisasi. Persepsi rumahtangga
sekitar sungai secara signifikan dipengaruhi oleh jenis kelamin, keikutsertaan organisasi, mendapatkan
sosialisasi, dan pengeluaran perkapita. Sedangkan persepsi rumah tangga yang tinggal bukan di sekitar
sungai dipengaruhi status pekerjaan, keikutsertaan organisasi, dan mendapatkan sosialisasi.

Kata kunci : persepsi, normalisasi sungai, regresi logistik

Abstract

River normalization program is one of the ways to handle flood problems. However, not all communities
accept this program. For that, we want to know the public perception towards normalization of Ciliwung
River and analyze the variables that influence it. Perception data was obtained through survey with
household approach in Bukit Duri Village which then analyzed by logistic regression. The results show
that 28 percent of households around the river and 22 percent of households not around the river reject
normalization. Household perceptions around the river are significantly influenced by sex,
organizational participation, socialization, and per capita expenditure. The non-rivers are influenced
by employment status, organizational participation, and socialization.

Keywords : perception, river normalization, logistic regression

Persepsi Masyarakat Kelurahan Bukit Duri… / Puspita LC dan Prasetyo A | 49


dikategorikan sebagai lokasi yang cukup
PENDAHULUAN
rawan banjir. Menurut data Badan
Salah satu sungai yang melewati Penanggulangan Bencana Daerah (BPBD),
provinsi DKI Jakarta adalah Kali Ciliwung. bahwa pada tahun 2013, 2014 dan 2015,
Selain melewati Jakarta, Kali Ciliwung juga Kelurahan Bukit Duri selalu terdampak
melewati wilayah Bogor dan Depok. Kali banjir selama tiga tahun terakhir sehingga
Ciliwung terbentang dari hulu yang terletak dikategorikan sebagai daerah rawan banjir.
di Bogor yang meliputi kawasan Gunung Oleh sebab itu, warga Kelurahan Bukit Duri
Gede, Gunung Pangrango dan Cisarua yang berada di bantaran Kali Ciliwung
hingga kawasan hilir pantai utara Jakarta menjadi target penggusuran dalam rangka
memiliki panjang 120 km dengan luas program normalisasi Kali Ciliwung.
Daerah Aliran Sungai (DAS) 387 km2. Sebanyak empat RW (RW 09, RW 10, RW
Menurut Guru Besar Fakultas Teknik UI, 11, RW 12) di kelurahan tersebut akan
Ilyas (2013), saat ini ada berbagai bangunan digusur dan direlokasi ke Rusun Rawa
yang dibangun di tepi tebing Kali Ciliwung. Bebek. Namun pada pelaksanaannya,
Padahal, sebaiknya pada jarak 10 meter dari program normalisasi Kali Ciliwung menuai
tepi lereng tidak diperbolehkan dibangun banyak respon, salah satunya adalah
bangunan karena sangat beresiko penolakan dari warga korban penggusuran.
menimbulkan longsor. Banyaknya bangunan Berdasarkan hal tersebut di atas maka
liar di sepanjang bantaran kali juga tujuan dari penelitian ini adalah mengetahui
menimbulkan tingginya sampah serta gambaran umum rumah tangga Kelurahan
limbah yang akan mengotori Kali Ciliwung. Bukit Duri berdasarkan karakteristik
Sampah serta limbah merupakan salah persepsi terhadap program normalisasi Kali
satu penyebab terjadinya banjir. Sampah Ciliwung? dan mengidentifikasi faktor-
serta limbah tersebut akan menyumbat aliran faktor apa saja yang signifikan berpengaruh
air di Kali Ciliwung sehingga menyebabkan terhadap persepsi masyarakat menerima
volume air tidak dapat ditampung dan terjadi program normalisasi Kali Ciliwung dan
banjir. Deputi Bidang Sarana dan Prasarana, kecenderungannya? Berkaitan dengan
Direktorat Pengairan dan Irigasi mengatakan tujuan tersebut, dalam penelitian ini
bahwa dari berbagai kajian yang telah memiliki keterbatasan yaitu sulitnya
dilakukan, banjir yang melanda daerah- menemukan keberadaan korban
daerah rawan, pada dasarnya disebabkan penggusuran di Kelurahan Bukit Duri
tiga hal. Pertama, kegiatan manusia yang sehingga persepsi korban penggusuran
menyebabkan terjadinya perubahan tata diperoleh dari seluruh warga Kelurahan
ruang dan berdampak pada perubahan alam. Bukit Duri.
Kedua, peristiwa alam seperti curah hujan Menurut Walgito (2003), faktor
sangat tinggi, kenaikan permukaan air laut, fisiologis akan menentukan bagaimana sikap
badai, dan sebagainya. Ketiga, degradasi seseorang. Umur merupakan salah satu
lingkungan seperti hilangnya tumbuhan faktor fisiologis. Dimana seseorang yang
penutup tanah pada catchment area, umurnya lebih muda akan cenderung untuk
pendangkalan sungai akibat sedimentasi, melakukan perbuatan radikal dibandingkan
penyempitan alur sungai dan sebagainya. seseorang yang berumur tua. Sehingga,
Berdasarkan data kejadian banjir yang kecenderungan untuk tidak setuju terhadap
dikumpulkan Dinas Tata Kota DKI Jakarta normalisasi Kali Ciliwung lebih besar pada
dan diolah oleh Badan Informasi Geografi, orang-orang yang berumur muda. Peran
banjir besar menimpa Jakarta dengan return jenis kelamin juga sangat berpengaruh
period 5 tahun, yaitu pada tahun 2002 dan terhadap pilihan seseorang dalam
2007. Dari kejadian banjir tersebut, daerah menentukan persepsi, dimana Parsons
yang tergenang banjir pada tahun 2002 dan (1955) dalam Sarwono (2002) menyatakan
2007 dikategorikan sebagai lokasi rawan bahwa kepribadian yang diharapkan ada
banjir sedangkan daerah yang hanya pada laki-laki berdasarkan norma baku
tergenang banjir pada tahun 2007 diantaranya adalah dominan, mandiri,
50 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
kompetitif, dan asertif, karena laki-laki perpustakaan dan tempat-tempat lainnya.
diharapkan menjadi pencari nafkah dan Intinya dimana suatu benda atau peristiwa
palindung untuk keluarganya. Sebaliknya, berada, disana bisa tercipta informasi yang
perempuan diharapkan baik hati, senang kemudian direkam dan disimpan melalui
mengasuh, suka bekerja sama, dan peka media cetak ataupun media elektronik.
terhadap perasaan orang lain, karena Hasil analisis yang dilakukan oleh
perempuan diharapkan menjadi istri dan ibu Puspita (2016) menunjukkan bahwa variabel
yang mengurus rumah tangga dan anak- sosialisasi berpengaruh secara langsung
anak. Sehingga, laki-laki cenderung untuk terhadap variabel kepatuhan sebesar 19,4
berperilaku agresif terhadap segala sesuatu persen, variabel sosialisasi berpengaruh
yang merugikan dirinya atau bahkan secara tidak langsung terhadap variabel
keluarga. Sebaliknya, perempuan cenderung kepatuhan melalui variabel kesadaran
menerima apapun yang terjadi pada dirinya. sebesar 38,4 persen. Sehingga dapat
Dalam penelitiannya, Kidamu (2015) disimpulkan bahwa sosialisasi akan efektif
menyimpulkan bahwa terdapat hubungan meningkatkan kepatuhan apabila sosialisasi
yang baik antara kecerdasan emosional dan tersebut efektif meningkatkan kesadaran.
pengambilan keputusan. Begitu juga dengan Sejalan dengan itu, Luali (2006), dalam
Purmaningsih (2016) berpendapat bahwa penelitiannya mengenai pengaruh faktor
tingkat pendidikan berpengaruh positif sosial ekonomi terhadap persepsi partisipasi
terhadp persepsi. Sementara itu, Robbins masyarakat dalam pengelolaan sampah
(2003) menyatakan bahwa perbedaan mendapatkan hasil bahwa semakin kecil
pekerjaan yang dimiliki seseorang jumlah anggota keluarga, semakin besar
memengaruhi mereka dalam membuat suatu pengaruhnya terhadap persepsi.
penilaian. Penilaian tersebut akan Pola pengeluaran penduduk
membentuk persepsi dari masing-masing merupakan informasi untuk melihat
individu. kesejahteraan penduduk. Besarnya nilai
Penelitan yang dilakukan oleh Rahayu nominal yang dibelanjakan baik dalam
(2011) menyatakan bahwa persepsi tidak bentuk pangan maupun non pangan, secara
hanya dibentuk melalui lingkungan tidak langsung dapat mencerminkan
keluarga, namun juga dari lingkungan sosial kemampuan ekonomi rumah tangga, untuk
masyarakat. Di dalam lingkungan mencukupi kebutuhan yang mencakup
masyarakat, seseorang akan memperoleh barang dan jasa (Aminuddin, 2006).
pengaruh dari budaya yang ada. Sehingga, Sehingga, keadaan ekonomi yang dilihat
pengaruh tersebut akan membentuk persepsi dari rata-rata pengeluaran perkapita akan
yang ada dalam masing-masing individu. memengaruhi persepsi orang tersebut.
Oleh karena itu, organisasi masyarakat Dari penjelasan diatas dapat
sebagai wadah bersosialisasi antar digambarkan bahwa persepsi masyarakat
masyarakat akan menambah peranan untuk terhadap program normalisasi Kali Ciliwung
memengaruhi sikap atau persepsi individu dipengaruhi oleh klasifikasi umur, jenis
lainnya. Menurut Hidayat (2012), sumber kelamin, pendidikan, status pekerjaan kepala
informasi berperan penting bagi seseorang rumah tangga, keikutsertaan dalam
dalam menentukan sikap atau keputusan organisasi, sumber informasi, mendapatkan
bertindak. Sumber informasi itu ada di sosialisasi tata ruang, jumlah anggota rumah
mana-mana, di pasar-pasar, sekolah, rumah, tangga, dan rata-rata pengeluaran, seperti
lembaga-lembaga suatu organisasi terlihat pada Gambar 1 dibawah ini:
komersial, buku-buku, majalah, surat kabar,

Persepsi Masyarakat Kelurahan Bukit Duri… / Puspita LC dan Prasetyo A | 51


Faktor-faktor yang
Memengaruhi Persepsi
• Klasifikasi Umur
Faktor-faktor yang Membentuk
• Jenis Kelamin Persepsi
• Pendidikan
• Status Pekerjaan
• Keikutsertaan dalam
PERSEPSI
Organisasi
Menolak/Menerima
• Jenis Sumber Informasi Program Normalisasi
Kali Ciliwung
• Mendapatkan Sosialisasi Tata Strata Sekitar Sungai &
Strata Bukan Sekitar Sungai
Ruang
• Jumlah Anggota Rumah
Tangga
• Gambar 1. Kerangka pikir
Rata-rata Pengeluaran
Perkapita Perbulan menggunakan peta wilayah Kelurahan Bukit
METODOLOGI
Duri maka populasi rumah tangga di
Data yang digunakan pada penelitian Kelurahan Bukit Duri dikategorikan ke
ini adalah data primer dan data sekunder. dalam dua strata yaitu rumah tangga sekitar
Data primer diperoleh dari survei di Kali Ciliwung dan rumah tangga yang bukan
Kelurahan Bukit Duri. Sementara itu, data sekitar Kali Ciliwung, sehingga teknik
sekunder diperoleh dari registrasi Kantor sampling yang digunakan adalah Stratified
Kelurahan Bukit Duri berupa daftar nama Two Stages Sampling seperti pada Tabel 1 di
RT dan registrasi RT berupa daftar nama bawah ini:
rumah tangga. Selanjutnya dengan

Tabel 1. Metode Penarikan Sampel


Strata Keterangan
[1] [2]
1. Tahap pertama adalah pemilihan RT sekitar Kali Ciliwung
menggunakan systematic sampling diurutkan berdasarkan
RT sekitar Kali Ciliwung nomor RW-RT.
2. Tahap kedua adalah pemilihan rumah tangga di RT terpilih
menggunakan systematic sampling.
1. Tahap pertama adalah pemilihan RT bukan sekitar Kali
Ciliwung menggunakan systematic sampling diurutkan
RT bukan sekitar Kali
berdasarkan nomor RW-RT.
Ciliwung
2. Tahap kedua adalah pemilihan rumah tangga di RT terpilih
menggunakan systematic sampling.

Menurut Asra dan Prasetyo (2015),


untuk menentukan jumlah sampel dapat
digunakan rumus sebagai berikut: (1)

52 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Keterangan:
n = ukuran sampel
= ukuran sampel dengan metode
SRS-WR
Deff = rasio antara varians penduga
= nilai tabel normal baku
P = proporsi populasi
E = margin of error
Dalam penelitian ini, digunakan E=0,1
dan α=5%. Berdasarkan rumus di atas,
didapatkan minimum sampel pada penelitian
ini sebesar 192,08. Oleh karena itu, sampel
rumah tangga yang diambil di Kelurahan Gambar 2. Jumlah rumah tangga
Bukit Duri sebanyak 200 rumah tangga. berdasarkan persepsi dan
Sampel di Kelurahan Bukit Duri dibagi stratifikasi wilayah di
menjadi dua sampel yang terdiri dari 100 Kelurahan Bukit Duri tahun
sampel rumah tangga di sekitar Kali 2017
Ciliwung dan 100 sampel rumah tangga di
bukan sekitar Kali Ciliwung. Pada Gambar 3 di bawah ini terlihat
bahwa di stratifikasi wilayah sekitar sungai
HASIL DAN PEMBAHASAN hanya terdapat 3 persen responden yang
menolak adanya normalisasi sungai dengan
Rumah tangga sekitar sungai adalah rumah
pendidikan SMA ke atas. Sedangkan di
tangga yang bertempat tinggal di wilayah
straitifikasi wilayah bukan sekitar sungai ada
RT yang berbatasan langsung dengan Kali
sebesar 31 persen yang menolak adanya
Ciliwung. Secara umum terlihat bahwa
normalisasi sungai dengan pendidikan SMA
sebagian besar persepsi rumah tangga
ke atas.
menerima adanya program normalisasi Kali
Ciliwung. Program normalisasi Kali
Ciliwung yang telah selesai dilaksanakan di
Kelurahan Bukit Duri dianggap telah
memberikan dampak positif bagi lingkungan
setempat. Sebagian besar masyarakat
menganggap bahwa program tersebut telah
mengurangi bencana banjir yang pada tahun-
tahun sebelumnya sering terjadi di
Kelurahan Bukit Duri.
Terdapat sebagian persepsi warga
yang menolak normalisasi Kali Ciliwung.
Salah satu penyebab warga menolak Gambar 3. Persentase rumah tangga yang
program normalisasi ini adalah penggusuran menolak normalisasi Kali
yang menyebabkan sebagian warga Ciliwung berdasarkan
kehilangan tempat tinggal mereka. Pada pendidikan yang ditamatkan
stratifikasi wilayah sekitar sungai, terdapat dan stratifikasi wilayah tahun
28 persen rumah tangga yang menolak 2017
adanya normalisasi Kali Ciliwung.
Sedangkan pada stratifikasi bukan sekitar Berdasarkan status pekerjaan utama,
sungai atau wilayah yang tidak berbatasan status pekerjaan dikelompokkan menjadi
langsung dengan Kali Ciliwung, persentase dua yaitu formal dan informal. Sektor formal
yang menolak adanya normalisasi sungai adalah seseorang memiliki status pekerjaan
sebesar 22 persen. sebagai buruh/karyawan/pegawai ataupun

Persepsi Masyarakat Kelurahan Bukit Duri… / Puspita LC dan Prasetyo A | 53


berusaha dibantu buruh tetap/buruh dibayar. normalisasi Kali Ciliwung. Hanya terdapat
Sedangkan, seseorang bekerja pada sektor 55 persen rumah tangga dengan persepsi
informal adalah memiliki status pekerjaan menolak normalisasi yang tidak mengikuti
berusaha sendiri, berusaha dibantu buruh organisasi sosial. Sedangkan, sejumlah 45
tidak tetap/buruh tidak dibayar, pekerja persen sisanya mengikuti organisasi sosial di
bebas di pertanian/non pertanian, ataupun lingkungannya.
pekerja keluarga/tak dibayar. Gambar 4
menunjukkan bahwa persepsi yang menolak
di wilayah sekitar sungai didominasi oleh
rumah tangga yang bekerja di sektor formal
yaitu sebesar 78 persen. Sedangkan,
sejumlah 22 persen lainnya bekerja di sektor
informal. Berbeda dengan wilayah sekitar
sungai, wilayah bukan sekitar sungai Gambar 5. Persentase rumah tangga yang
memiliki persepsi menolak yang didominasi menolak normalisasi Kali Ciliwung
berdasarkan keikutsertaan organisasi
oleh rumah tangga dengan sektor pekerjaan sosial dan stratifikasi wilayah tahun
kepala rumah tangga adalah sektor informal 2017
yaitu sebesar 64 persen. Sedangkan,
Strata Sekitar Sungai
sejumlah 36 persen rumah tangga yang
Dengan menggunakan analisis
menolak normalisasi Kali Ciliwung
regresi logistik metode backward,
merupakan rumah tangga yang bekerja di
didapatkan empat dari sembilan variabel
sektor formal.
penjelas dalam penelitian ini masuk dalam
model regresi logistik dan mempengaruhi
secara signifikan persepsi rumah tangga di
sekitar Kali Ciliwung terhadap normalisasi
Kali Ciliwung, yaitu variabel jenis kelamin,
keikutsertaan organisasi sosial,
mendapatkan sosialisasi, dan pengeluaran
perkapita. Untuk lebih jelasnya dapat dilihat
pada Tabel 2 berikut:

Tabel 2. Pendugaan parameter, statistik


Gambar 4. Persentase rumah tangga yang uji Wald dan odds ratio sekitar
menolak normalisasi Kali Ciliwung
sungai
berdasarkan status pekerjaan kepala
rumah tangga dan stratifikasi wilayah Odds
Stat. ratio
tahun 2017 Dumm
Variabel Uji P value
y [Exp(
Wald
Pada Gambar 5 dapat terlihat bahwa )]
rumah tangga dengan persepsi menolak (1) (2) (3) (4) (5) (6)
normalisasi Kali Ciliwung yang tidak
mengikuti organisasi sosial jauh lebih Jenis Kelamin X2 1,430 5,738 0,017 4,181

banyak dibandingkan yang mengikuti Keikutsertaan


Organisasi X5 2,456 8,892 0,003 11,662
organisasi sosial. Dari keseluruhan rumah Sosial
tangga yang menolak normalisasi Kali
Sosialisasi
Ciliwung, terdapat 86 persen diantaranya Normalisasi X7 -1,926 9,804 0,002 0,146
tidak mengikuti organisasi sosial dan 14 Kali Ciliwung
persen sisanya mengikuti organisasi sosial. Pengeluaran
Namun, wilayah bukan sekitar sungai X9 -2,212 5,847 0,016 0,109
Perkapita
menunjukkan perbedaan yang cukup sedikit Constant -1,204 1,769 0,184 0,300
antara komposisi mengikuti organisasi sosial
dengan tidak mengikuti organisasi sosial
pada rumah tangga yang menolak
54 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Adapun persamaan peluang regresi Strata Bukan Sekitar Sungai
logistik yang terbentuk sebagai berikut
Variabel keikutsertaan organisasi
sosial dan mendapatkan sosialisasi di strata
bukan sekitar sungai signifikan
memengaruhi persepsi sama halnya dengan
Keterangan: di strata sekitar sungai. Variabel lainnya
X2 : dummy untuk variabel jenis kelamin adalah status pekerjaan yang signifikan
X5 : dummy untuk variabel keikutsertaan memengaruhi persepsi di stata bukan sekitar
organisasi sosial sungai. Hal tersebut dapat terlihat pada
X7 : dummy untuk variabel mendapatkan Tabel 3 berikut:
sosialisasi
X9 : variabel pengeluaran perkapita Tabel 3. Pendugaan parameter, statistik
uji Wald dan odds ratio strata
Untuk mengetahui besarnya pengaruh bukan sekitar sungai
dan kecenderungan variabel penjelas yang Stat.
Odds
Dum Signifi ratio
berpengaruh terhadap kecenderungan Variabel
my
uji
cance [Exp (
Wald
persepsi, dapat dilihat dari nilai exp ( ). )]
Nilai ini disebut juga dengan odds ratio atau (1) (2) (3) (4) (5) (6)
rasio kecenderungan seperti yang terdapat Status
pada Tabel 2. Berdasarkan nilai koefisien X4 1,344 4,486 0,034 3,833
Pekerjaan
dari satu variabel penjelas yang signifikan Keikutsertaan
Organisasi X5 -1,624 5,771 0,016 0,197
memengaruhi persepsi, dengan menganggap Sosial
variabel-variabel lain konstan, nilai odds Sosialisasi
Normalisasi X7 -1,317 5,698 0,017 0,268
ratio untuk keikutsertaan jenis kelamin Kali Ciliwung
adalah 4,181. Nilai tersebut dapat diartikan
Constant 0,115 0,041 0,840 1,122
bahwa laki-laki memiliki kecenderungan
untuk menolak normalisasi Kali Ciliwung
sebesar 4,181 kali dibandingkan perempuan. Adapun persamaan peluang regresi
Variabel lain yang signifikan adalah logistik yang terbentuk sebagai berikut
keikutsertaan organisasi sosial yang
memiliki nilai odds ratio sebesar 11,662.
Artinya, kecenderungan seseorang yang
tidak mengikuti organisasi sosial adalah
11,662 kali dari seseorang yang mengikuti Keterangan:
organisasi sosial untuk menolak normalisasi X4 : dummy untuk variabel status pekerjaan
Kali Ciliwung. Pengeluaran perkapita juga X5 : dummy untuk variabel keikutsertaan
merupakan variabel yang signifikan organisasi sosial
memengaruhi persepsi. Nilai odds rasio X7 : dummy untuk variabel mendapatkan
variabel pengeluaran perkapita adalah 0,109 sosialisasi
dan bernilai negatif. Sehingga, setiap
penurunan 1 juta pengeluaran perkapita akan Nilai yang berbeda didapatkan pada
memiliki kecenderungan 9,134 kali untuk strata bukan sekitar sungai. Pada tabel 2 dan
menolak normalisasi Kali Ciliwung. Nilai tabel 3 dapat terlihat perbedaan antara kedua
odds ratio untuk sosialisasi adalah 0,146 strata. Pada strata bukan sekitar sungai,
dengan nilai negatif yang berarti bahwa variabel status pekerjaan signifikan
kecenderungan seseorang yang berpengaruh terhadap kecenderungan
mendapatkan sosialisai memilih untuk menolak normalisasi Kali Ciliwung. Nilai
menolak normalisasi Kali Ciliwung adalah odds ratio variabel status pekerjaan pada
6,862 kali dibandingkan seseorang yang penelitian ini bernilai 3,833. Hal ini
tidak mendapatkan sosialisi. menunjukkan bahwa seseorang yang bekerja
di sektor informal lebih cenderung menolak
normalisasi Kali Ciliwung sebesar 3,833 kali
Persepsi Masyarakat Kelurahan Bukit Duri… / Puspita LC dan Prasetyo A | 55
dibandingkan seseorang yang bekerja di faktor antara lain jenis kelamin,
sektor formal.Variabel lain yang signifikan keikutsertaan organisasi, mendapatkan
adalah keikutsertaan organisasi sosial yang sosialisasi, dan pengeluaran perkapita.
memiliki nilai odds ratio sebesar 0,197 Sedangkan, persepsi masyarakat Kelurahan
dengan nilai negatif. Artinya, Bukit Duri pada wilayah bukan sekitar
kecenderungan seseorang yang mengikuti sungai terhadap program normalisasi Kali
organisasi sosial untuk menolak normalisasi Ciliwung secara signifikan dipengaruhi oleh
Kali Ciliwung adalah 5,073 kali faktor-faktor antara lain status pekerjaan,
dibandingkan seseorang yang tidak keikutsertaan organisasi, dan mendapatkan
mengikuti organisasi sosial. Sementara itu sosialisasi.
untuk variabel sosialisasi nilai odds ratio- Berdasarkan kesimpulan tersebut
nya adalah 0,268 dengan nilai negatif. Hal maka pemerintah DKI Jakarta perlu
tersebut menunjukkan bahwa memberikan sosialisasi secara menyeluruh
kecenderungan seseorang yang kepada semua elemen masyarakat baik yang
mendapatkan sosialisai normalisasi Kali menjadi korban ataupun bukan agar
Ciliwung adalah 3,734 kali dari seseorang mengetahui tentang manfaat program
yang tidak mendapatkan sosialisai untuk normalisasi Kali Ciliwung. Selain itu perlu
menolak normalisasi Kali Ciliwung. memberikan kompensasi yang cukup untuk
Hubungan yang negatif antara penerimaan warga korban penggusuran di wilayah
sosialisasi dengan persepsi terhadap sekitar sungai agar tidak mempersulit
normalisasi ini sama dengan hubungan yang kehidupan selanjutnya di tempat yang baru.
terjadi pada strata sekitar sungai yang
hampir sebagian besar warga penerima DAFTAR PUSTAKA
sosialisasi merupakan korban yang merasa Aditya, Nicky. (2016, Oktober 5). Keluhan
kehilangan tempat tinggalnya dan akan dari Rusun Rawa Bebek, Warga:
cenderung menolak normalisasi Kali Banyak Begal. Kriminalitas.com.
Ciliwung. (Diakses 22 Desemer 2016).
http://kriminalitas.com/keluhan-dari-
KESIMPULAN DAN SARAN rusun-rawa-bebek-warga-banyak-
begal/
Sebagian besar persepsi rumah tangga
menerima adanya program normalisasi Kali Agresti, A. 2002. Categorical Data Analysis
Ciliwung. Namun, masih terdapat 28 persen Second Edition. New Jersey: John
rumah tangga menolak adanya normalisasi Wiley &Sons, Inc
Kali Ciliwung pada stratifikasi wilayah Ahmad, Dalili Atika, et al. 2015. Analisis
sekitar sungai. Sedangkan, persentase di Persepsi dan Faktor yang
wilayah bukan sekitar sungai yang menolak Mempengaruhi Persepsi terhadap
adanya normalisasi sungai sebesar 22 persen Penerapan Sistem Pembiayaan JKN
rumah tangga. pada Fasilitas Kesehatan Penunjang di
Selanjutnya terdapat delapan faktor D. I. Yogyakarta. Journal of
yang membentuk persepsi masyarakat Management and Pharmacy Practice,
Kelurahan Bukit Duri terhadap program 5(4), 259-266
normalisasi Kali Ciliwung antara lain
pertimbangan manfaat, kemampuan Aliyati, Ratu. 2011. Permukiman Kumuh di
beradaptasi, sarana transportasi dan Bantaran Ci-Liwung (Studi Kasus Kel.
informasi, pertimbangan risiko, keyakinan Manggarai-Srengseng Sawah dan Kel.
sikap, pengetahuan, perilaku sosial, dan Kampung Melayu-Kalisari) Tesis.
proses penerimaan. Universitas Indonesia : Depok
Pada wilayah sekitar Kali Ciliwung, Aminuddin. 2006. Pembangunan Ekonomi.
persepsi masyarakat Kelurahan Bukit Duri Ghalia Indonesia. Jakarta.
terhadap program normalisasi Kali Ciliwung
secara signifikan dipengaruhi oleh faktor-
56 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Ardiyanto, Elvinaro, dkk. 2004. Komunikasi ciliwung-kini.html (diakses 11 Januari
Massa: Suatu Pengantar. Simbiosa 2017)
Rekatama Media Johnson, R.A. dan Wichern, D.W. 2007.
Arfina, Onik. 2012. Analisis Perbedaan Applied Multivariate Statistical
Persepsi Siswa Berdasarkan Usia, Analysis. New Jersey: Pearson
Gender, Jenis Pekerjaan, dan Lama Education Inc
Kursus terhadap Komunikasi Word Of Khotimah, Husnul, dkk. 2016. Pengaruh
Mouth Skripsi. Universitas Sosialisasi dan Pengetahuan Terhadap
Diponegoro: Semarang Minat Investor Pada Efek Syariah di
Asra, Abuzar dan Prasetyo, Achmad. 2015. Pasar Modal. Account, 423-433
Pengambilan Sampel dalam Kidamu, Nella. 2015. Hubungan
Penelitian Survei. Jakarta: Raja Kecerdasan Emosional Kepala
Grafindo Persada Sekolah dengan Pengambilan
BPS. 2014. Statistik Daerah Provinsi DKI Keputusan di SD se Kecamatan Kota
Jakarta 2014. BPS: Jakarta Selatan Skripsi. Gorontalo:
Universitas Negeri Gorontalo
____. 2016. Konsep ketenagakerjaan. BPS.
Diakses pada tanggal 29 Januari 2017 Liputan 6. (2016, September 28). Video: 44
melalui Keluarga Masih Bertahan dari
http://bps.go.id/Subjek/view/id/6#subj Penggusuran Bukit Duri. Liputan 6.
ekViewTab1|accordion-daftar- Diakses pada tanggal 22 Desember
subjek1 2016 melalui
http://tv.liputan6.com/read/2613346/v
Bappenas. Kebijakan Penanggulangan
ideo-44-keluarga-masih-bertahan-
Banjir di Indonesia (Kajian).
dari-penggusuran-bukit-
Bappenas. (Diakses 14 Januari 2017)
duri?source=search
melalui
https://bebasbanjir2025.wordpress.co Luali, La Ode. 2006. Pengaruh faktor sosial
m/konsep-pemerintah/beppenas/ ekonomi terhadap persepsi, sikap, dan
partisipasi masyarakat dalam
BPBD. 2013. Data Rekapitulasi Kejadian
pengelolaan sampah : Kasus Kota
Banjir Tahun 2013. BPBD: Jakarta
Raha Kab. Muna Prov. Sulawesi
_____. 2014. Daerah Rawan Banjir DKI Tenggara. Tesis. Yogyakarta:
Jakarta. BPBD. (Diakses 25 Universitas Gadjah Mada
November 2016) melalui
Malasari, Eka. 2015. Faktor-Faktor
http://data.go.id/dataset/daerah-
Penyebab Rendahnya Partisipasi
rawan-banjir-dki-jakarta
Masyarakat Dalam Pembangunan
Dinas Tata Kota DKI Jakarta. 2007. Data Desa (Studi Desa Kembang Gading
Kejadian Banjir. Kecamatan Abung Selatan Kabupaten
Hidayat, Khairul. 2012. Perilaku Pencarian Lampung Utara). Skripsi. Lampung:
Informasi Guru dalam Memanfaatkan Universitas Lampung
Internet Untuk Memenuhi Kebutuhan Maryono, Agus. 2009. Kajian Lebar
Informasi di SMA Negeri 2 Lubuk Sempadan Sungai (Studi Kasus
Pakam [Skripsi]. Sumatera Utara: Sungai-sungai di Provinsi Daerah
Universitas Sumatera Utara Istimewa Yogyakarta). Dinamika
Hosmer, D.W. dan S. Lemeshow. 2000. Teknik Sipil, 9(1), 56-66
Applied Logistic Regression. New Mashita, Nani. (2016, September 28).
York: John Wiley & Sons, Inc Digusur, Warga Bukit Duri Gelar
Ilyas, Tommy. 2013. Sungai Ciliwung Kini. Demo Sambil Teriak Allahuakbar.
http://www.ui.ac.id/feature/sungai- Lensa Indonesia. (Diakses 22
Desember 2016) melalui
Persepsi Masyarakat Kelurahan Bukit Duri… / Puspita LC dan Prasetyo A | 57
http://www.lensaindonesia.com/2016/ duri-melanggar-
09/28/digusur-warga-bukit-duri-gelar- hukum?source=search
demo-sambil-teriak-allahu-akbar.html Purnamaningsih, Ni Ketut Ayu. 2016.
Mulyani, Sri. 2015. Analisis Pengaruh Jenis Pengaruh Gender, Usia, Tingkat
Kelamin dan Status Pekerjaan Pendidikan, dan Status Sosial
terhadap Persepsi Etis Mahasiswa Ekonomi terhadap Persepsi Etis
Akuntansi dengan Love of Money Mahasiswa Akuntansi. Skripsi.
sebagai Variabel Intervening. Majalah Universitas Udayana: Denpasar
Ilmiah Solusi, 14(3), 2-16 Puspita, Erna. 2016. Analisis jalur pengaruh
Muslim AR. (2016, Juni 7). Minta Putusan sosialisasi terhadap kepatuhan wajib
Sela, Warga Bukit Duri Kecewa di pajak bumi dan bangunan kota kediri
Sidang Perdana. Liputan 6. (Diakses dengan kesadaran sebagai variabel
22 Desember 2016) melalui intervening. Jurnal Akuntansi Dan
http://news.liputan6.com/read/252567 Ekonomi, 1, 1-8
6/minta-putusan-sela-warga-bukit- Putra, N.P. (2016, September 28). Komnas
duri-kecewa-di-sidang- HAM Sebut Pemprov DKI Langgar
perdana?source=search Hukum Bongkar Bukit Duri. Liputan
Normadewi, Berliana. 2012. Analisis 6. (Diakses 22 Desember 2016)
Pengaruh Jenis Kelamin dan Tingkat http://news.liputan6.com/read/261307
Pendidikan terhadap Persepsi Etis 1/komnas-ham-sebut-pemprov-dki-
Mahasiswa Akuntansi dengan Love of langgar-hukum-bongkar-bukit-
Money sebagai Variabel Intervening duri?source=search
[Skripsi]. Semarang: Universitas _________. (2016, September 5). Warga
Diponegoro Bukit Duri Keluhkan Tak Ada Musala
Nugroho, Y.P. (2008). Makna Sungai dan di Rusun Rawa Bebek. Liputan 6.
Praktek Pengelolaan Lingkungan (Diakses 22 Desember 2016) melalui
Melalui Pendekatan Budaya (Studi http://news.liputan6.com/read/259447
Kasus Masyarakat Sempadan Sungai 5/warga-bukit-duri-keluhkan-tak-ada-
Code, Kotamadya Yogyakarta) musala-di-rusun-rawa-
[Tesis]. Jakarta:Universitas Indonesia bebek?source=search
Poerbandono, dkk. (2014). Assessment of Rahayu, Rehasti Dya, et al. 2011. Pengaruh
the effects of climate and land cover Lingkungan Keluarga, Sekolah, dan
changes on river discharge and Masyarakat terhadap Persepsi Gender
sediment yield, and an adaptive spatial Mahasiswa Laki-laki dan Perempuan.
planning in the Jakarta region. Jurnal Transdisiplin Sosiologi,
Springer Science & Business Media Komunikasi, dan Ekologi Manusia,
B.V, 73, 507-530 5(3), 247-260. Diakses pada tanggal
30 Januari 2017 melalui
Pontiawati, Ike, dkk. (2009). Manajemen
download.portalgaruda.org
Resiko Pada Pengendalian Banjir di
Sungai Ciliwung. Jurnal Teknologi Revrisond Baswir, et al. 2003.
UNPAK, 1, 46-68 Pembangunan tanpa perasaan:
Evaluasi pemenuhan hak ekonomi,
Prastiwi, Devira. (29 September 2016).
sosial, dan budaya. Yogyakarta:
Wakil Ketua DPR: Penggusuran Bukit
Sabda Media
Duri Melanggar Hukum. Liputan 6.
Diakses pada tanggal 22 Desember Robbins, Stephen P. 2003. Perilaku
2016 melalui Organisasi. Jakarta: Erlangga
http://news.liputan6.com/read/261357 Rozaqi, Athok Moh Nur. 2009. Sosialisasi
1/wakil-ketua-dpr-penggusuran-bukit- Kebijakan Pembangunan Pemerintah
Kabupaten Bojonegoro Kepada
58 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
Masyarakat: Studi Model Komunkasi Syahputra, Ichsan. 2015. Kajian Hidrologi
Pembangunan. Skripsi. UIN Sunan dan Analisa Kapasitas Tampang
Ampel Surabaya. Sungai Krueng Langsa Berbasis HEC-
HMS dan HEC-RAS. Jurnal Teknik
Santoso, Alexander Budi. 2012 Hubungan
Sipil Universitas Abulytama
antara Tingkat Pendidikan Orang Tua
dengan Minat Siswa dalam Bermusik Tamara, Riana Monalisa. 2016. Peranan
di Smp N 5 Depok Sleman Yogyakarta Lingkungan Sosial terhadap
[Skripsi]. Yogyakarta: Universitas Pembentukan Sikap Peduli
Negeri Yogyakarta Lingkungan Peserta Didik di SMA
Negeri Kabupaten Cianjur. Jurnal
Sari, Eka Puspita. 2015. Peran Media Massa
Pendidikan Geografi, 16(1), 44-55
dan Fungsinya Sebagai Agen
Sosialisasi Gender. Jurnal Ilmu Undang-Undang No. 24 Tahun 1992
Berbagi, 3, 1-9 Universitas Indonesia. 2013. Sungai
Sarwono, S.W. 2006. Pengantar Psikologi Ciliwung Kini. Universitas Indonesia.
Umum. Jakarta: Rajawali Pers Diakses pada tanggal 19 Desember
2016
Sudyasih, Tiwi, et al. 2015. Hubungan
http://www.ui.ac.id/feature/sungai-
antara Status Sosial Ekonomi dengan
ciliwung-kini.html
Persepsi Masyarakat tentang Gantung
Diri di Kecamatan Karangmojo Walgito, Bimo. 2003. Pengantar Psikologi
Kabupaten Gunugkidul Yogyakarta. Umum. Andi Yogyakarta: Yogyakarta
Jurnal Ilmu Kebidanan dan Walpole, R.E. 1993. Pengantar Statistika.
Keperawatan, 11(2), 177-183 Jakarta: Gramedia Pustaka Utama
Sugiyono. 2005. Memahami Penelitian Wibowo. 1987. Psikologi Sosial. Jakarta
Kualitatif. Bandung: Alfabeta

Persepsi Masyarakat Kelurahan Bukit Duri… / Puspita LC dan Prasetyo A | 59


60 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
NAMED ENTITY RECOGNITION ON A COLLECTION OF
RESEARCH TITLES

Siti Mariyah

The Center of Computational Statistics Study, Institute of Statistics, Jakarta-Indonesia 13330


e-mail: sitimariyah@stis.ac.id

Abstrak

Judul dapat membantu pembaca untuk mendapatkan sudut pandang universal dari artikel tersebut
sebagai pemahaman awal sebelum membaca konten secara keseluruhan. Pada penelitian teknis, judul
memuat informasi penting. Dalam penelitian ini, kami mengembangkan teknik ekstraksi informasi
untuk mengenali dan mengekstrak masalah, metode, dan domain penelitian yang terdapat dalam judul.
Kami menerapkan pendekatan supervised learning pada 671 judul penelitian dalam bidang ilmu
komputer dari beragam jurnal online dan prosiding seminar internasional. Kami melakukan beberapa
percobaan dengan skema yang berbeda untuk mempelajari pengaruh fitur dan kinerja algoritma. Kami
menguji fitur kontekstual, fitur sintaksis, dan fitur bag of words menggunakan Naïve Bayes dan
Maximum Entropy. Classifier Naïve Bayes yang belajar dari kelompok set fitur pertama berhasil
memprediksi kategori masing-masing token dalam dataset judul. Keakuratan dan nilai f1-score untuk
setiap kelas lebih dari 0,80 karena kelompok pertama set fitur mempertimbangkan lokasi token dalam
sebuah kalimat, memperhatikan token sekitar dan tag POS dari beberapa token sebelum dan sesudah.
Sementara classifier Naïve Bayes yang dipelajari dari kelompok kedua dari rangkaian fitur lebih tepat
mengklasifikasikan token frase daripada token kata.

Kata Kunci: research titles, named entity recognition, information extraction, contextual features,
naïve bayes classifier

Abstract

The title can help the reader to get the universal point of view of the article as the initial understanding
before reading the content as a whole. On technical research papers, the title states essential
information. In this study, we aim to develop information extraction techniques to recognize and extract
problem, method, and domain of research contained in a title. We apply supervised learning on 671
research titles in computer science from various online journals and international conference
proceedings. We conducted some experiments with different schemas to discover the influence of
features and the performance of the algorithm. We examined contextual, syntactic, and the bag of words
feature sets using Naïve Bayes and Maximum Entropy. The Naïve Bayes classifier learned from the first
group of the feature set is successful in predicting category of each token in title dataset. The accuracy
and f1-score for each class are more than 0.80 since the first group of feature sets considers the location
of a token within a sentence, considers the token and POS tag of some tokens before and after and
deliberates the rules of a token. While the Naïve Bayes classifier learned from the second group of the
feature set is more appropriate classifying a phrase token than a word token.

Keywords: research titles, named entity recognition, information extraction, contextual features, naïve
bayes classifier

Named Entity Recognition on A Collection… / Siti Mariyah | 61


INTRODUCTION property of each word in the title then
classify it into some defined categories. We
Research title is a short sentence which
conducted some experiments with different
can help the reader to get the main or
schemas to learn the influence of features
universal point of view of the article as the
and the performance of the algorithm. In this
initial understanding before reading the
paper, we technically describe how we built
content as a whole. The title is also
the information extraction techniques in
commonly used as a filter in a search engine
detail and suggest some recommendations
when there is a retrieval query against a
which one is the best feature and model.
research paper in online journals or online
archives. On technical research papers such
LITERATURE REVIEW
as in computer science or engineering, the
title states essential information. That
NER was first introduced in the Sixth
information consists of the research
Message Understanding Conference (MUC-
problem, the method used or method
6) held in November 1995. Two of four
proposed, and the specific research domain.
goals are named entity recognition and
A reader or a researcher should know the
scenario templates (traditional information
problem, method, and domain of research
extraction). NER task comprises the
regarding the topic she/he is studying or
recognition of entity names of people, names
focusing.
of company or organization, place names,
On the other side, information
temporal expressions and a particular type of
extraction opens the opportunity to extract
numerical expressions.
words or phrases that are regarded as
Suakkaphong et al. (2009) built
informative words or phrases. Informative
disease named entity recognizer They used
means that the word or phrase describes the
three feature sets. The first feature set is a
information a reader want to know.
morphological-pattern feature since
Information extraction technique involves a
biomedical terms commonly have unique
collection of natural language processing
prefixes and suffixes. The remaining
(NLP) tasks. Each method may include
features are word appearance and chunking
different NLP task which depends on the
and POS tag features. Then, They combined
complexity of information, the format of the
conditional random field (CRF) with
document, and the task itself, etc. There are
bootstrapping and feature sampling. CRFs
three approaches to build information
extraction technique, i.e., rule-based with bootstrapping implemented
sequentially is more accurate than
extraction, statistical or machine learning-
supervised CRFs.
based extraction, or hybrid approach.
Biomedical named entity recognition
In this study, we aimed to develop
was also done by Saha et al. (2009) and
information extraction techniques to
Bodenreider et al. (2000). They
recognize and extract problem, method, and
hypothesized that the appropriate feature
domain of research contained in a title. We
templates affect the performance of NER
apply supervised learning as a part of
models. They conducted word clustering and
statistical or machine learning-based
selection based feature reduction approaches
approach on 671 research titles in computer
for NER using Maximum Entropy
science from ACM Digital Library, IEEE,
algorithm. The feature sets are generated
and some international conference
without involving profound biomedical
proceedings. By using some learning
knowledge such as word feature, previous
algorithms, we constructed some named
NE tags, capitalization and digit
entity recognition (NER) models. Machine
information, unique character, word
learning based extraction can handle the
normalization, prefix and suffix information,
knowledge acquisition bottleneck since, in
Part of Speech (POS) tags, and trigger
rule-based extraction, we need to construct
words. They proved that the use of
extraction rules which requires the domain
experts. The NER model identifies the
62 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
dimensionality reduction techniques could raw text (collection of titles)

increase the performance substantially.


Bodenreider, Olivier, and Pierre Preprocessing
Testing model
Zweigenbaum (2000) developed methods to dataset

collect proper names used in biomedical list of tokens (word/ classifier


phrase tokens)
terminology. The task is recognizing a word
that is the appropriate name by using Feature extraction
Entity recognition

individual criteria owned by that word and named


some combination of these different criteria feature set entities

(capitalization, invariant words, and model


Entity extraction
Learning model
patterns).
Another relevant work was done by collection of chunked
Ek et al. (2011) who conducted NER for named entities

short text messages. The characteristics of Figure 1. Extraction techniques


the short text message are similar to title
sentence which has small windows (a few of It starts from collecting dataset. We gathered
words). They constructed regular expression 671 research titles in computer science fields
and complemented with logistic regression from some online journals or online
classifier. Wu et al. (2005) used POS tag as archives. Then the dataset will be processed
feature set. Researches of McKenzie (2013), in some following tasks:
Mao, Xinnian et al. (2007) and Qin et al.
(2008) utilized the contextual feature sets to 1. Preprocessing dataset
either improve the NER results in the large- The dataset was validated to ensure
scale corpus or to reduce the noise there were no double titles. Then we
introduced into aggregated features from conducted annotation on the dataset to tag
disparate and generic training data. They the words or the phrases which explain
proved that the missed entities occur when problem, method, and domain of research.
their contextual surroundings are not Annotation was done by humans who are
identified well. NER using machine learning familiar with computer science research. We
approach are more frequent conducted than tagged <m>…</m> for words explaining
other methods. There are learning method, <p>…</p> for words explaining
algorithms applied for NER or text problem, and <d>…</d> for words
classification tasks such Naïve Bayes or explaining domain. The annotated dataset
Multinomial Naïve Bayes performed by was then validated to make sure that there
Fabrizio Sebastiani (2001) and Amarappa S, was no missed annotation or wrong
and Sathyanarayana S.V. (2015), Maximum annotation. The missed annotation means
Entropy applied by Ayan et al. (2006), that there is a token that is not annotated. The
Conditional Random Fields performed by wrong annotation means that there is a token
Mao, Xinnian et al. (2007), Qin et al. (2008), annotated by the wrong label. By using the
and Chodey et al. (2016), Support Vector regular expression, we split the annotated
Machines applied by Fabrizio Sebastiani dataset into four files. Each file contains 671
(2001), Thorsten Joachims (1998), and Rafi lines where each line contains the words in
et al. (2012). one category. It aimed to check whether
every title contains full information
METHODS (problem, method, and domain) or not.
Then, we tokenized every title
Extraction technique was developed sentence, made part-of-speech-tag (POS tag)
by involving some tasks depicted by this for each token and mapped token with the
following diagram: label it owns. We labeled m for tokens
flanked by <m>…</m> tag, p for tokens
flanked by <p>…</p> tag, d for tokens
flanked by <d>…</d> tag, and none for
Named Entity Recognition on A Collection… / Siti Mariyah | 63
tokens not flanked by any tag. Output in this Method tokens: simple algorithms, a seed-driven
bottom-up machine learning
step is collection of tokens per sentence who Problem tokens: complex relation extraction,
have its each label. We focused and used the extracting relations of various complexity
Domain tokens: biomedical ie
word tokens only rather then the phrase None tokens: for with application to, framework
tokens. for

2. Feature extraction If want to extract feature from phrase


The output from processing dataset “extracting relations of various complexity”,
stage is the input for this feature extraction the extracted feature is:
{ contain(simple): False, contain(algorithms):
step. The feature is information which False, contain(a): False, contain(seed-driven):
characterizes a token. The features used False, contain(bottom-up): False,
contain(machine): False, contain(learning):
significantly affect the accuracy of the False, contain(complex): False,
classification model. We were curious which contain(relation): False, contain(extraction):
False, contain(extracting): True,
features accurately differentiate each contain(relations): True, contain(of): True,
category. We extracted some features and contain(various): True, contain(complexity):
True, contain(biomedical): False, contain(ie):
grouped it into two groups of the feature set. False, contain(for): False, contain(with): False,
Then, these two groups would be tested with contain(application): False, contain(to): False,
contain(framework): False, contain(for): False }
some experiments to know which group is If want to extract feature from phrase “biomedical
the most relevant. ie”, the extracted feature is:
{ contain(simple): False, contain(algorithms):
The first group of feature set: False, contain(a): False, contain(seed-driven):
1. Feature word: the token itself False, contain(bottom-up): False,
contain(machine): False, contain(learning):
2. Feature POS tag False, contain(complex): False,
3. Feature prevWord: one token before contain(relation): False, contain(extraction):
4. Feature prevTag: POS tag of one token False, contain(extracting): False,
contain(relations): False, contain(of): False,
before contain(various): False, contain(complexity):
5. Feature prevBigram: two tokens before False, contain(biomedical): True,
contain(ie):True, contain(for): False,
6. Feature prevBigramTag: POS tag of contain(with): False, contain(application):
two tokens before False, contain(to): False, contain(framework):
False, contain(for): False }
7. Feature nextWord: one token after
8. Feature nextBigram: two tokens after
3. Learning and testing model
9. Feature nextTag: POS tag of one token
In this stage, we prepared training set.
after
The training set is a collection of extracted
10. Feature nextBigram: POS tag of two
feature for each token in dataset then
tokens after
mapped with the label owned by the token.
The second group of feature set was
If in title dataset consists of 1000 tokens then
the list resulted matching the existence of a
we have 1000 feature set mapped with the
token in a collection of the method, problem,
label. We applied Naïve Bayes, Maximum
and domain tokens. If a token exists in that
Entropy, and Support Vector Machines
collection, then the value is true. Otherwise,
using two groups of the feature set with
the value is false. The number of extracted shuffling parameter. The classification
features equals the number of tokens owned models were learned and tested by 10-fold
in 671 research titles. This is the example of cross-validation. We measured precision,
how to extract this feature set: recall, and f-measure for each category to
The first title:
<m>simple algorithms</m> for <p>complex relation understand the effect of shuffling parameter,
extraction</p> with applications to <d>biomedical the performance of feature set and algorithm.
ie</d>
The second title: 4. Entity recognition and extraction
<m>a seed-driven bottom-up machine learning</m>
framework for <p>extracting relations of various The best model is then used as a
complexity</p>
classifier which recognizes and classify
every token in title sentences into problem,
Therefore, The method, problem, domain method, domain or none category. If any
and none tokens are: token in sentence classified as a problem,
64 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
method, or domain category, our program parameter and machine learning algorithm
then chunked the sentence into tokens and applied.
extracted those tokens. 1. The first experiment
On the first experiment, we built
EXPERIMENTAL STUDY classification model using the first group of
feature set and Naïve Bayes algorithm. We
We conducted some experiments with applied 10-fold cross validation both on
some different conditions. The difference is shuffled and non-shuffled training data.
defined by feature set used, shuffling Shuffling the training data cause the order of
the data to be random. The results are:

Figure 2. Learning performance on first group of feature set using Naïve Bayes with
shuffle

Figure 3. Learning performance on first group of feature set using Naïve Bayes with
no shuffle
Named Entity Recognition on A Collection… / Siti Mariyah | 65
Table 1. The comparison of shuffle and no Table 2. The comparison of shuffle and no
shuffle condition on first group of shuffle condition on the second
feature set using Naïve Bayes group of feature set using Naïve
algorithm Bayes algorithm
Without With Without
The measurements The measurements With shuffle
shuffle shuffle shuffle
Classifier accuracy 0.83268 0.86919 Classifier accuracy 0.81323 0.86500
Method precision 0.63519 0.83730 Method precision 0.0 0.92843
Method recall 0.71845 0.89193 Method recall None 0.73472
Method F-Measures 0.67426 0.86376 Method F-Measures None 0.82029
Problem precision 0.70618 0.89711 Problem precision 0.0 0.90636
Problem recall 0.65238 0.85755 Problem recall None 0.77963
Problem F-Measures 0.67821 0.87688 Problem F-Measures None 0.83823
Domain precision 0.39216 0.64047 Domain precision 0.0 0.71909
Domain recall 0.74074 0.87368 Domain recall None 0.98807
Domain F-Measures 0.51282 0.71475 Domain F-Measures None 0.83234
None precision 0.85789 0.94802 None precision 1 0.98609
None recall 0.72444 0.85913 None recall 0.83146 0.95795
None F-Measures 0.78554 0.90139 None F-Measures 0.90798 0.97182

The table shows that the shuffle Table 2 tells the performance of
parameter causes the difference of classifier classifier from the second group of the
accuracy 0.03. It is aligned with the concept feature set without and with the shuffle. The
of fold cross validation which at every result of this experiment is much different
iteration, it divides the data into ten parts with the last experiment. Without shuffle,
with nine parts as training and one as a the classifier failed to detect a problem,
testing set. The repetition is done until all method, and domain tokens. It is explained
elements have been a test set. The shuffle by the values of precision, recall, and f-
can affect the sampling of those parts. Our measures for all categories. If compared with
hypothesis is shuffle will minimize the the same treatment (with shuffle), this
probability a label does not appear in classifier learned from the first group of
training set. It means that with shuffle, the feature set performs almost equal with the
distribution of the existence of each label is classifier acquired from the second group of
equal. Without shuffle, the process building the feature set.
up the members of 10 parts is done
sequentially. Therefore, the probability of Table 3. The comparison of the group of
skewed distribution of category is higher. feature set using Naïve Bayes
Overall, recall values for all categories algorithm with shuffle
are above 0.85, and the difference of recall The First The Second
for each class is not significant. The The classifier Group of Group of
precision values for the method, problem, Feature Set Feature Set
Classifier accuracy 0.86919 0.86500
and domain are 0.83730, 0.89711, and Method F-Measures 0.86376 0.82029
0.64047. The precision for domain category Problem F- 0.87688 0.83823
is lower than others because the true positive Measures
is higher and false positive. After we Domain F-Measures 0.71475 0.83234
evaluated the training set, the number of None F-Measures 0.90139 0.97182
domain examples is more inferior than
method and problem examples. Table 3 shows that the classifiers from
two groups are almost similar. The first
2. The second experiment classifier is accurate for classifying method
On the second experiment, we built and problem tokens, while the second
classification model using the second group classifier is accurate for recognizing domain
of feature set and Naïve Bayes algorithm. and none tokens. Our hypothesis is method
We applied 10-fold cross validation both on and problem tokens are good explained with
shuffled and non-shuffled training data. contextual and syntactic features. It means
66 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
that method and problem tokens may have cross validation, the accuracy acquired is
regular tokens previous and after with 0.86919. It means that 86,919% of test set
regular POS tag. will classified correctly. The following
descriptions are the explanation for every
3. The third experiment informative feature.
On this experiment, we examined
Maximum Entropy (MaxEnt) algorithm to
validate the effect of different feature set on
classifier. We trained the model with 10-fold
cross validation and shuffle.

Table 4. The comparison of the group of


feature set using maximum
entropy algorithm with shuffle
The First The Second
The classifier Group of Group of
Feature Set Feature Set
Classifier accuracy 0.83975 0.25216
Method F-Measures 0.86918 None
Problem F- 0.84124 None
Measures Figure 4. The Most Informative Features
Domain F-Measures 0.01047 0.40059 from The First Group of Feature
None F-Measures 0.88192 None Set

Table 4 tells us that accuracy classifier a. The word ‘for’ appears 243 times on
on the first group around 83.975% is better none class than problem class. It
than on the second group of the feature set. explains the word ‘for’ has high
It is aligned with the f-measures for the probability to be classified as none
method, problem, and none categories. The category and not belongs to problem,
interesting one is MaxEnt fails to classify domain, and domain classes.
domain category using the first group off; we b. PrevWord = ‘for‘ occurs 211 times on
feature set. It is caused by precision value for problem class than on method class. It
domain is 1.0, but the recall is 0.00526. It means that a word or a phrase preceded
means that coverage ability of MaxEnt by the word ‘for’ has high chance to be
classifier for domain category is low. classified as problem class.
MaxEnt also miscarries the second group of c. The third (prevBigram = ’-’), the fifth
the feature set. (prevWord = ‘-’), the twelfth
From three experiments conducted, we (prevBigramTag = ‘-’), and the
concluded that Naïve Bayes classifier is thirteenth information (prevTag = ‘-’)
robust on both the first and the second group explain that a token which does have
of feature sets. Naïve Bayes classifier with any previous token is more frequent
the first group of feature set outperforms classified as method class than domain
than others. It also delivers informative class. It indicates that a word or a phrase
features. The informative feature means that at the beginning of the title sentence has
the feature is the most significant feature in high chance to be classified as method
determining a token belongs to a category. class. It is aligned with the fact. We
The shuffle improves the performance a observed directly some title sentences
classifier than it is not shuffled. which prove this information.
The first group of feature set consists The first title: <m>simple algorithms</m> for
of a word, tag, prevWord, prevTag, <p>complex relation extraction</p> with
applications to <d>biomedical ie</d>
prevBigram, prevBigramTag, nextWord,
The second title: <m>aseed-driven bottom-
nextTag, nextBigram, nextBigramTag. up machine learning</m> framework for
Using Naïve Bayes with shuffle and 10-fold <p>extracting relations of various
complexity</p>

Named Entity Recognition on A Collection… / Siti Mariyah | 67


d. The tenth information (prevWord = The picture tells about:
‘using’) appears 40 times on the method a. If a word or a phrase is/contains a word
class than on the problem class. It ‘for’, ‘using’, ‘in’, ‘a’, or ‘an’, then the
shows that a word or a phrase preceded word or phrase has more chance to be
by the word ‘using’ has more chance to classified as none class.
be classified as method class. b. If a word or a phrase is/contains a word
e. The eleventh (prevWord = ‘from’) and ‘extraction’, ‘classification’,
the fourteenth information (prevWord = ‘information’, ‘summarization’,
‘in’) appear more than 30 times on ‘traffic’, or ‘detection’, then then the
domain class than on the method class. word or phrase has higher chance to be
It describes that a word or a phrase classified as problem class.
preceded by the word ‘from’ or ‘in’ has c. If a word or a phrase is/contains a word
a higher probability to be classified as ‘method’, ‘approach’, ‘knowledge’,
domain class. ‘models’, ‘algorithm’, or ‘fuzzy’, then
f. The fifteenth (nextBigramTag = ‘IN the word or phrase has more chance to
JJ’) occurs 30 times and the eighteenth be classified as method class.
(prevBigramTag = ‘NN NNS’) appears
26 times on class method than on class We conducted significance test to
domain. It indicates that a word or a examine two hypotheses. The first
phrase preceded by noun words will be hypothesis is the performance of Naïve
classified as method class. Bayes and MaxEnt classifier learned from
g. The seventeenth (nextTag = ‘VBG’) the first group of feature set is same. The
occurs 26 times more on domain class second hypothesis is the performance of two
than problem class. It means that a word classifiers are different, one classifier is
or a phrase followed by gerund (verb +’ better than another. This is the significance
ing’) has a higher probability to be test algorithm:
classified as domain class. 1. The data is partitioned into k disjoint test
h. The ninteenth (nextWord = ‘for’) sets T1 , T2,…, Tk with same size. The
appears 25 times more on the method minimum size is 30.
class and the twentieth information 2. For i from 1 to k, do # k = 10
(nextWord = ‘using’) occurs 20 times Use Ti for the test set and the remaining
on problem class. It indicates that a data for training set Si
word or a phrase followed by the word Si  {D0 - Ti} # Si : training set
‘for’ will be classified as method class hA  LA(Si) # LA: Naïve Bayes classifier
and followed by the word ‘using’ has hB  LB(Si) # LB: MaxEnt classifier
higher chance to be classified as δi  errorTi(hA) – errorTi(hB)
problem class. 3. Return:

The result of = -0.029512

Next step is measuring confidence interval.


We took confindence interval 90% so that
the confidence interval estimation for
: ,
Where:

Figure 5. The Most Informative Features


from The Second Group of Feature
Set
68 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132
The value is acquired
from t-table. The confidence interval is: Table 5. The post processing results of naïve
-0.029512 ± 1.833*(7,86554E-05 ) bayes classifier constructed from the
= -0.029512 ± 0.000144 first group of feature set
Predicted
The upper limit of the interval: Title Sentence Actual class
class
-0.029512+0.000144 = -0.02936582 simple algorithms ['m', 'm', ['m', 'm',
The lower limit of the interval is for complex 'None', 'p', 'None', 'p',
-0.029512-0.000144 = -0.0296542 relation extraction 'p', 'p', 'p', 'p',
with applications to 'None', 'None',
The error difference is -0.029512. It biomedical ie 'None', 'None',
'None', 'd', 'None', 'd',
means that the error of Naïve Bayes 'd'] 'd']
classifier is less than MaxEnt classifier. The a seed-driven ['m', 'm', 'd', ['m', 'm', 'm',
upper and lower limit of the interval has bottom-up machine 'm', 'm', 'm', 'm', 'm',
small range, approximately 0.000004. It learning framework 'None', 'p', 'None',
shows that with 90% of confidence, we can for extracting 'p', 'p', 'p', ‘None', 'p',
relations of various 'p'] 'p', 'p', 'p',
conclude that Naïve Bayes classifier is better complexity 'p']
than MaxEnt classifier but the accuracy of a machine learning ['None', 'm', ['None', 'm',
both classifiers is not significant different. approach for 'm', 'm', 'm', 'm',
After we got the best classifier, we efficient traffic 'None', 'p', 'None', 'p',
conduct the post processing to extract the classification 'p', 'p'] 'p', 'p']
ddos attack ['p', 'p', 'p', ['p', 'p', 'p',
word or phrase belongs to method, problem, detection at local 'p', 'p', 'p', 'p', 'p', 'p', 'p',
and domain categories on research title area networks using 'd', 'None', 'None', 'm',
dataset. The post processing includes information 'm', 'm', 'd'] 'm', 'm']
classification each token in every title theoretical metrics
sentence and token chunking. This is the
example of post processing result: Tables 5 shows that there is no wrong
prediction on the 1st and the 3rd sentences.
Title sentence: large scale learning of But on the 2nd and the 4th sentences, the
relation extraction rules with distant Naïve Bayes classifier tends to misclassify
supervision from the web the domain class.

After classification: largep scale p Table 6. The post processing results of naïve
learning p of p relation p extraction p bayes classifier constructed from the
rules p with none distant m supervision second group of feature set
m from none the none web d Predicted
Title Sentence Actual class
class
simple algorithms for ['d', 'd', 'None', ['m', 'm', 'None',
Chunking result: complex relation 'd', 'p', 'p', 'p', 'p', 'p',
Method class: distant supervision extraction with 'None', 'd', 'None', 'None',
applications to 'None', 'd', 'd'] 'None', 'd', 'd']
Problem class: large scale learning of biomedical ie
relation extraction rules a seed-driven bottom-up ['None', 'd', 'd', ['m', 'm', 'm',
Domain class: web machine learning 'd', 'm', 'm', 'm', 'm', 'None',
framework for 'None', 'd', 'p', ‘None', 'p', 'p',
extracting relations of 'p', 'd', 'd'] 'p', 'p', 'p',
To enrich analysis and answer the research various complexity 'None']
a machine learning ['None', 'd', ['None', 'm', 'm',
problem, we examined the Naïve Bayes approach for efficient 'm', 'm', 'm', 'None', 'p',
classifiers constructed from two groups of traffic classification 'None', 'd', 'd', 'p', 'p']
'p']
the feature set. We deliver the chunking ddos attack detection at ['d', 'd', 'p', 'd', ['p', 'p', 'p', 'p',
results from four titles: local area networks 'd', 'd', 'd', 'p', 'p', 'p',
using information 'None', 'p', 'd', 'None', 'm', 'm',
theoretical metrics 'd'] 'm']

Named Entity Recognition on A Collection… / Siti Mariyah | 69


Figure 6. The chunking result of the first title using Naïve Bayes classifier learned from
the first group of feature set

Figure 7. The chunking result of the second title using Naïve Bayes classifier learned from
the first group of feature set

Figure 8. The chunking result of the third title using Naïve Bayes classifier learned from
the first group of feature set

Figure 9. The chunking result of the fourth title using Naïve Bayes classifier learned from
the first group of feature set

Figure 10. The chunking result of the first title using Naïve Bayes classifier learned from
the second group of feature set

Figure 11. The chunking result of the second title using Naïve Bayes classifier learned
from the second group of feature set

70 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Figure 12. The chunking result of the third title using Naïve Bayes classifier learned from
the second group of feature set

Figure 13. The chunking result of the fourth title using Naïve Bayes classifier learned
from the second group of feature set

Table 6 tells us that Naïve Bayes classifier classifier learned from the first group of the
learned from the second group of feature set feature set is successful in predicting
also tends to misclassify the domain class. category of each token in title dataset. The
The domain class is mostly classified as the accuracy and f1-score for each class are
method class. This classifier is not more than 0.80 since the first group of
appropriate to predict class of a word instead feature set considers the contextual and
of a phrase. If we examined to classified a syntactic feature of a token. This classifier
phrase such as ‘biomedical ie’ or ‘complex determines the location of a token within a
relation extraction’ then this classifier will sentence, considers the token and POS tag of
predict ‘biomedical ie’ as domain class and some tokens before and after and deliberates
‘complex relation extraction’ as problem the rules of a token. While the Naïve Bayes
class. classifier learned from the second group of
the feature set is more appropriate
RESULTS AND CONCLUSIONS classifying a phrase token than a word token.
This classifier just considering the tokens
There are some aspects we learn from owned by a phrase instead determines the
the experimental study. The first, the characteristics of word token. The definition
labeling process should be consistent since of the token in our experimental study is a
the inconsistent label for tokens can word.
influence the modeling process and might We believe that it is a good idea to try
worse the model itself. The annotated dataset the same information extraction techniques
has to be validated before it is used for we have built on the large title dataset from
modeling to check the consistency of labels various research fields. We also encourage
and the completeness of labeled tokens. to conduct semi-supervised learning in
Shuffle on training set produces more classifier modeling because the cost for
accurate classifier than without shuffle annotation is expensive. The idea is utilizing
because shuffle lets each category/class has the limited annotated titles to construct a
equal data distribution on the dataset. classifier then applying the ensemble
Therefore, each class has its representatives methods to improve the performance of the
on both the training and testing set. classifier.
On the small size dataset, the 10-fold REFERENCES
cross validation is an appropriate method to
construct and validate/test the models Ayan, Necip Fazil, and Bonnie J. Dorr. 2006. A
instead of holdout method. The Naïve Bayes Maximum Entropy Approach to
Combining Word Alignments.
Named Entity Recognition on A Collection… / Siti Mariyah | 71
Proceedings of the Human Language with New Contextual Features. 2008
Technology Conference of the NAACL, International Conference on Natural
Main Conference (June): 96–103. Language Processing and Knowledge
Bodenreider, Olivier, and Pierre Zweigenbaum. Engineering, NLP-KE 2008: 1–6.
2000. Identifying Proper Names in Parallel Rafi, Muhammad, Sundus Hassan, and
Medical Terminologies. Studies in Health Mohammad Shahid Shaikh. 2012. Content-
Technology and Informatics 77: 443–47. Based Text Categorization Using
Chodey, Krishna Prasad, and Gongzhu Hu. Wikitology. International Journal of
2016. Clinical Text Analysis Using Computer Science Issues 9(4): 9.
Machine Learning Methods. Computer and http://arxiv.org/abs/1208.3623.
Information Science (ICIS), 2016 S, Amarappa, and Sathyanarayana S.V. 2015.
IEEE/ACIS 15th International Conference Kannada Named Entity Recognition and
on. Classification (NERC) Based on
Dimililer, Nazife, Ekrem Varoǧlu, and Hakan Multinomial Naïve Bayes (MNB)
Altinçay. 2009. Classifier Subset Selection Classifier. International Journal on
for Biomedical Named Entity Recognition. Natural Language Computing 4(4): 39–52.
Applied Intelligence 31(3): 267–82. http://www.airccse.org/journal/ijnlc/paper
Ek, Tobias, Camilla Kirkegaard, Håkan Jonsson, s/4415ijnlc04.pdf.
and Pierre Nugues. 2011. Named Entity Saha, Sujan Kumar, Sudeshna Sarkar, and
Recognition for Short Text Messages. Pabitra Mitra. 2009. Feature Selection
Procedia - Social and Behavioral Sciences Techniques for Maximum Entropy Based
27(Pacling): 178–87. Biomedical Named Entity Recognition.
Joachims, Thorsten. 1998. Text Categorization Journal of Biomedical Informatics 42(5):
with Support Vector Machines: Learning 905–11.
with Many Relevant Features. In The 10th http://dx.doi.org/10.1016/j.jbi.2008.12.012
European Conference on Machine .
Learning, , 137–42. Sebastiani, Fabrizio. 2001. Machine Learning in
Mao, Xinnian et al. 2007. Using Non-Local Automated Text Categorization. Journal
Features to Improve Named Entity ACM Computing Surveys (CSUR) 34(1):
Recognition Recall. In Proceedings of the 1–47. http://arxiv.org/abs/cs/0110053.
21st Pasific Asia Conference on Language, Suakkaphong, Nichalin, Zhu Zhang, and
Information, and Computation, 303–10. Hsinchun Chen. 2009. Disease Named
http://dspace.wul.waseda.ac.jp/dspace/bits Entity Recognition Using Semisupervised
tream/2065/29132/1/PACLIC_21_00_031 Learning and Conditional Random Fields.
_Mao.pdf. Journal of The American Society for
McKenzie, Amber. 2013. Focused Training Sets Information Science and Technology 3(2):
to Reduce Noise in NER Feature Models. 80–90.
In Proceedings of the 2013 Conference of Wu, Tianhao, William M Pottenger, and
the North American Chapter of the Computer Science. 2005. A Semi-
Association for Computational Linguistics: Supervised Active Learning Algorithm for
Human Language Technologies, , 411–15. Information Extraction from Textual Data.
http://www.aclweb.org/anthology/N13- Journal of the American Society for
1042. Information Science and Technology
Nadeau, D. 2007. A Survey of Named Entity 56(3): 258–71.
Recognition and Classification. http://doi.wiley.com/10.1002/asi.20119.
Linguisticae Investigationes (30): 3–26.
http://nlp.cs.nyu.edu/sekine/papers/li07.pd
f.
Qin, Ying, Taozheng Zhang, and Xiaojie Wang.
2008. Chinese Named Entity Recognition

72 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132


Petunjuk Penulisan
JURNAL APLIKASI STATISTIKA &
KOMPUTASI STATISTIK
Naskah dikirim dalam bentuk softcopy ke alamat email uppm@stis.ac.id disertai dengan daftar
riwayat hidup ringkas penulis. Format naskah mengacu pada Petunjuk Penulisan Naskah
berikut:
Naskah dibuat menggunakan Microsot Office Word 2010. Seluruh bagian dalam naskah diketik
dengan huruf Times New Roman, ukuran 12, spasi 1, ukuran kertas A4 dan marjin 2 cm untuk
semua sisi kecuali marjin kiri 3 cm, jumlah halaman 15-20. Untuk kepentingan penyuntingan
naskah, seluruh bagian naskah (termasuk tabel, gambar dan persamaan matematika) dibuat
dalam format yang dapat disunting oleh editor.
Gaya penulisan naskah untuk Jurnal Aplikasi Statistika dan Komputasi Statistik ditulis dalam
Bahasa Indonesia dengan gaya naratif. Pembabakan dibuat sederhana dan sedapat mungkin
menghindari pembabakan bertingkat. Tabel dan gambar harus mencantumkan sumber jika dari
data sekunder. Tabel, gambar dan persamaan matematika diberi nomor secara berurut sesuai
dengan kemunculannya. Semua kutipan dan referensi dalam naskah harus tercantum dalam
daftar pustaka, dan sebaliknya sumber bacaan yang tercantum dalam daftar pustaka harus ada
dalam naskah. Format sumber: Nama Penulis dan Tahun. Nomor dan judul tabel diletakkan di
bagian atas tabel dan dicetak tebal, sedangkan nomor dan judul gambar diletakkan di bagian
bawah gambar dan dicetak tebal.

Bagian naskah berisi:


Judul. Judul tidak melebihi 12 kata dalam Bahasa Indonesia.
Data Penulis. Berisi nama lengkap semua penulis tanpa gelar, asal institusi, dan alamat email.
Abstrak. Ditulis dalam Bahasa Inggris dan Bahasa Indonesia, maksimum 100 kata untuk
masing-masing abstrak dan berisikan tiga hal yaitu topik yang dibahas, metodologi yang
dipergunakan dan hasil yang didapatkan.
Kata Kunci. Berisi kata atau frasa (maksimum 5 subjek) yang sering dipergunakan dalam
naskah dan dianggap mewakili dan atau terkait dengan topik yang dibahas.
Pendahuluan. Memuat latar belakang, studi sebelumnya yang relevan, permasalahan ataupun
hipotesis yang akan diuji dalam penelitian, ruang lingkup penelitian, serta tujuan dari penelitian.
Metodologi terdiri atas:
a. Tinjauan Referensi. Bagian ini menguraikan landasan konseptual dari tulisan dan berisi
alasan teoritis mengapa pertanyaan penelitian dalam artikel diajukan. Di samping itu penulis
dapat mengutip studi yang relevan sebelumnya untuk melengkapi justifikasi mengenai
kerangka pikir penelitian.
b. Metode Analisis. Bagian ini berisi informasi teoritis dan teknis yang cukup memadai untuk
pembaca dapat mereproduksi penelitian dengan baik termasuk di dalamnya uraian mengenai
jenis dan sumber data serta variabel yang digunakan. Dalam hal keperluan verifikasi hasil,
editor dan mitra bestari (reviewer) berhak meminta data mentah (raw data) yang digunakan
penulis.
Hasil dan Pembahasan. Tuliskan hasil yang didapat berdasarkan metode yang digunakan
disertai analisis terhadap variabel-variabelnya . Dapat disajikan berupa tabel, gambar, hasil
pengujian hipotesis dengan disertai uraian analitis yang mengangkat poin-poin penting
berdasarkan konsepsi teoritisnya.
Petunjuk Penulisan | 73
Kesimpulan dan Saran. Bagian ini memuat kesimpulan dari hasil dan implikasinya secara
akademis, dan saran yang dapat diberikan berdasarkan temuan dari pembahasan. Bagian ini
juga memuat keterbatasan penelitian dan kemungkinan penelitian lanjutan yang dapat
dilakukan dengan penggunaan/pengembangan variabel, metode analisis ataupun cakupan
wilayah penelitian lainnya.
Daftar Pustaka. Daftar pustaka disusun berdasarkan urutan abjad dengan ketentuan sebagai
berikut:
Publikasi Buku
1. Penulis satu orang
Enders, Walter. 2010. Applied Econometric Time Series, Third Edition. New Jersey: Wiley.
2. Penulis dua orang
Pyndick, Robert. S. dan Rubinfeld, Daniel L. 2009. Microeconomics, Seventh Edition. New
Jersey: Pearson Education.
3. Penulis tiga orang
Fotheringham, A. S., Brunsdon, C, dan Charlton, M. 2002. Geographically Weighted
Regression: The Analysis of Spatially Varying Relationships. West Sussex: John Wiley &
Sons.
Artikel dalam jurnal
Romer, P. 1993. Idea Gaps and Object Gaps in Economic Development. Journal of Monetary
Economics, Vol. 32 (3), 543–573.
Artikel online
Woodward, Douglas P. 1992. Locational Determinants of Japanese Manufacturing Start-Ups
in the United States. Southern Economic Journal, Vol. 58 (3), 690-708.
http://www.jstor.org/discover/10.2307/1059836 (Diakses 1 Sepetember, 2014).
Buku yang ditulis oleh lembaga atau organisasi
BPS. 2009. Analisis dan Penghitungan Tingkat Kemiskinan 2008. Jakarta: BPS.
Kertas kerja (working papers)
Edwards, S. 1990. Capital Flows, Foreign Direct Investment, and Debt-Equity Swaps in
Developing
Countries. NBER Working Paper, 3497.
Makalah yang direpresentasikan
Zhang, Kevin H. 2006. Foreign Direct Investment and Economic Growth in China: A Panel
Data Study for 1992-2004. Conference of WTO, China, and Asian Economies. Beijing.
Karya yang tidak dipublikasikan
Hartono, Djoni. 2002. Analisis Dampak Kebijakan Harga Energi terhadap Perekonomian dan
Distribusi Pendapatan di DKI Jakarta: Aplikasi Model Komputasi Keseimabangan Umum
(Computable General Equilibrium Model). Tesis. Jakarta.
Artikel di koran, majalah, dan periodik sejenis
Reuters. (2014, September 17). Where is Inflation?. Newsweek.

74 | Jurnal Aplikasi Statistika & Komputasi Statistik V.9.1.2017, ISSN 2086-4132

Anda mungkin juga menyukai