Oleh:
Surya Prangga1
1
ABSTRAK
Jakarta merupakan salah satu daerah yang rawan banjir. Karena hampir
setiap kali musim penghujan, wilayah Jakarta selalu terendam air. Secara
geomorfologis, 40% wilayah Jakarta terdiri dari dataran rendah pantai dengan
ketinggian kurang dari 10m, bahkan di beberapa tempat berada di kurang lebih
1m di bawah muka air pasang (maksimum). Jakarta merupakan daerah aliran 13
sungai yang bermuara di Teluk Jakarta. Daerah aliran 13 sungai juga menyebar
merata di semua wilayah Jakarta. Oleh karena itu, secara alamiah daerah dengan
ketinggian rendah akan terendam. (Riena, 2013). Di sisi lain, hampir 40 persen
wilayah di Jakarta berada di bawah permukaan laut. Kondisi ini diperparah
dengan terus menurunnya permukaan tanah mencapai 18 cm/tahun (berdasarkan
penelitian Hasanuddin Z. Abidin, 2008), dan meningkatnya tinggi permukaan air
laut hingga 8 mm/tahun (berdasarkan penelitian Sutisna S., dkk, 2002) dikutip
oleh Robin Hartanto (2013) pada berita.yahoo.com.
Ada beberapa penyebab terjadinya banjir yang ada di Indonesia khususnya
daerah Jakarta diantaranya yaitu: rob, penurunan muka tanah, saluran drainase
tidak memadai, tingginya curah hujan lokal dan di hulu, sumbatan sampah,
menurunnya daya dukung lingkungan di hulu dan daerah aliran sungai (DAS),
serta penurunan tanah. Tanda-tanda terjadi penurunan tanah adalah saluran air
patah, miring, atau berubah arah, bangunan retak-retak, dan jalan menjadi lebih
tinggi dari bangunan secara signifikan (Kopertis12, 2013). Menurut Fakhrudin
(2013), banjir sangat dipengaruhi oleh curah hujan, tutupan lahan, dan sistem
drainase. Curah hujan sulit untuk dikontrol. Sistem drainase dapat dikelola jika
tutupan lahan dikelola dengan baik (HumasLIPI, 2013).
Berangkat dari maraknya berbagai media yang banyak memperbincangkan
masalah terkait bencana banjir yang ada di Jakarta dan seluruh wilayah di
Indonesia Tahun 2014 ini dan dari berbagai penelitian yang membahas masalah
banjir di Jakarta. Oleh karena itu, makalah ini akan membahas topik terkait
kepopuleran kata banjir dilihat dari sisi jejaring sosial salah satunya yaitu
twitter. Banyak hal yang menarik untuk dilihat ketika pengguna tersebut membuat
tweet dengan kata banjir. Selain itu juga akan dilihat seberapa besar hubungan
yang terbentuk antara kata-kata yang ditweet secara bersamaan dengan kata banjir.
Adapun tehnik yang digunakan yaitu tehnik data mining yang terpusat pada
analisis text mining.
Tinjauan Pustaka
Penelitian Mita Noveria (2007:116-117) peneliti LIPI Jakarta, yang
bertajuk Bencana Alam Dari Sisi Kependudukan: Penyabab dan Dampaknya
menyimpulkan bahwa, bencana alam tidak bisa terpisahkan dari konteks
masyarakat. Karena masyarakat disamping menjadi korban sekaligus menjadi
pelaku bencana dan penyebab bencana, khususnya bencana banjir dan tanah
longsor.
Menurut buku Crowd yang ditulis oleh yuswohady, engagement
merupakan salah satu hal penting di era social media. Namun, menurut penelitian
yang dilakukan oleh Amira Dewiningtyas dan Yudi Pramudiana dari Institut
Manajemen Telkom, salah satu temuannya menyebutkan bahwa engagement yang
dilakukan oleh beberapa akun official twitter yang menjadi objek penelitian masih
di bawah ekspektasi audiensnya. Penelitian tersebut dipublikasikan International
Conference on Economics Marketing and Management IPEDR Vol.28 (2012)
(2012) IACSIT Press, Singapore.
Batasan Masalah
Adapun cakupan masalah yang akan dibahas dan dianalisis pada makalah
ini yaitu terkait kata banjir yang terjadi di Indonesia yang terdapat pada jejaring
sosial twitter sedangkan untuk kata selain itu tidak termasuk dalam bahasan ini.
Tujuan Penelitian
Tujuan dari penelitian ini adalah:
Mencari hubungan (asosiasi) dari kata-kata yang paling sering muncul dengan
kata-kata banjir dan Membuat pengelompokan/klaster terhadap kata-kata yang
memiliki kemiripan satu dengan yang lainnya.
METODOLOGI PENELITIAN
Data yang digunakan pada penelitian ini adalah data tentang banjir yang
ada di Indonesia dimana data tersebut diperoleh dari jejaring sosial twitter yang
diambil langsung secara online pada tanggal 26 Januari 2014 pukul 10:43 WIB
karena pada tanggal dan waktu tersebut berbagai media massa maupun jejaring
sosial twitter masih maraknya membahas peristiwa banjir yang terjadi di
Indonesia. Adapun program bantuan dalam mengolah data tersebut dengan
menggunakan program R. Data sekunder ini terdiri dari 199 dokumen yang di
dalamnya membahas tentang banjir.
Populasi
Populasi dari penelitian ini adalah seluruh kicauan-kicauan (tweet) tentang
banjir atau yang memuat kata-kata tentang banjir.
Sampel dan Teknik Pengambilan Sampel
Sampel yang diperoleh yakni 199 tweet tentang banjir atau memuat katakata banjir serta teknik pengambilan sampel yang digunakan pada penelitian ini
adalah menggunakan teknik sampling acak sederhana.
LANDASAN TEORI
Perangkat Lunak R
R adalah suatu kesatuan software yang terintegrasi dengan beberapa
fasilitas untuk manipulasi, perhitungan dan penampilan grafik yang handal. R
berbasis pada bahasa pemrograman S, yang dikembangkan oleh AT&T Bell
Laboratories (sekarang Lucent Technologies) pada akhir tahun 70 an. R
merupakan versi gratis dari bahasa S dari software (berbayar) yang sejenis yakni
S-PLUS yang banyak digunakan para peneliti dan akademisi dalam melakukan
kegiatan ilmiahnya. (Didi, 2013)
Banjir
Menurut BNPB (2012), Banjir adalah peristiwa atau keadaan dimana terendamnya
suatu daerah atau daratan karena volume air yang meningkat.
Twitter
Twitter diciptakan oleh Jack Dorsey pada bulan juli 2006 di bawah perusahaan
Odeo Corp. Kesuksesan twitter membuat banyak situs lain meniru konsepnya,
kadang menawarkan layanan spesifik lokal suatu negara atau menggabungkan
dengan layanan lainnya. Suatu sumber bahkan menyebutkan bahwa paling tidak
ada 111 situs web yang memiliki layanan mirip dengan twitter. Menggunakan
layanan twitter pun tampaknya jauh lebih mudah daripada layanan jejaring
pertemanan lainnya. Pengguna bisa mengirimkan pesan singkat melalui beberapa
cara, bisa melalui situs twitter secara langsung, melalui SMS, atau melalui
aplikasi twitter lainnya seperti Twirl, Snitter, atau Twitterfox yang merupakan
aplikasi tambahan untuk browser Firefox.
Dalam Twitter, ada tiga hal yang penting selain menuliskan artikel dengan
batasan 140 karakternya itu, yaitu following, follower, dan update. Disinilah
sebenarnya letak keunikan dan manfaat lainnya dari Twitter. Fitur yang menarik
lagi adalah pengguna dapat share video atau foto dari fitur media stream flock
dengan hanya men-drag foto atau video tersebut. Belum lagi fitur menulis artikel
pada blog pribadi tanpa harus login pada blog tersebut (Dianita, 2010).
Sementara teori dari Evans (2008) terkait strategi blogging dijabarkan ke
dalam 4 hal berikut:
-Transparent
-Willingness to listen
-Willingness to act
- Twitter Etiqquette
Didukung oleh Claxton (2008) yang menyatakan, strategi yang tepat
dalam coorporate blogging akan mampu menghasilkan sense of community. Tak
ketinggala, untuk mengidentifikasi benefits apa saja yang terjadi di ranah social
media , teori dari kotler (2010) digunakan. Benefit yang dimaksud dalam
penelitian tersebut dijabarkan sebagai berikut:
-Information benefit
-Social Benefit
-Sharing Benefit
-Emotional Benefit
Data mining
Secara sederhana data mining adalah penambangan atau penemuan informasi
baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat
besar (Davies, 2004). Data mining juga disebut sebagai serangkaian proses
untuk menggali nilai tambah berupa pengetahuan yang selama ini tidak diketahui
secara manual dari suatu kumpulan data (Pramudiono, 2007). Data mining,
sering juga disebut sebagai knowledge discovery in database (KDD). KDD
adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk
menemukan keteraturan, pola atau hubungan dalam set data berukuran besar
(Santosa, 2007). dikutip dari Sigit Prabowo (2013).
Metode Data Mining
Association Rules (Aturan Asosiasi)
Menurut Atje Setiawan (2009), Assosiation Rule merupakan suatu proses
untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk
support (minsup) dan syarat minimum untuk confidence (minconf) pada sebuah
database. Dalam menentukan suatu Association Rule umumnya terdapat dua
ukuran kepercayaan (interestingness measure), yaitu support dan confidence.
Kedua ukuran ini akan digunakan untuk interesting association rules dengan
dibandingkan dengan batasan yang telah ditentukan. Batasan inilah yang terdiri
dari minsup dan minconf. Assosiation Rule Mining adalah suatu prosedur untuk
mencari hubungan antar item dalam suatu dataset. Dimulai dengan mencari
frequent itemset, yaitu kombinasi yang paling sering terjadi dalam suatu itemset
dan harus memenuhi minimum support.
Dalam tahap ini akan dicari kombinasi item yang memnuhi syarat
minimum dari nilai support dalam database. Untuk mendapatkan nilai support
untuk sebuah item A dapat diperoleh dari rumus berikut :
Support ( A )=
(2.1)
Sementara itu, untuk mencari nilai support dari 2-item dapat diperoleh dari rumus
berikut :
Support ( A , B ) =P ( A B )=
(2.2)
Setelah semua frequent item dan Large itemset ditemukan, dapat dicari semua
Association Rules yang memenuhi syarat minimum untuk confidence (minconf)
dengan menggunakan rumus berikut ini :
Confidence ( A B )=P ( B| A )=
(2.3)
Metode Clustering
Metode clustering mempartisi data ke dalam kelompok sehingga data yang
memiliki karakteristik yang sama dikelompokkan ke dalam satu cluster yang sama
(Refaat, 2007). Tujuan dari clustering ini adalah untuk meminimalisasi fungsi
tujuan yang ditetapkan dalam proses clustering, yang umumnya berusaha
meminimalisasi variasi dalam suatu cluster dan memaksimalisasi variasi antar
cluster. Dikutip dari Tamsir Hasudungan Sirait (2011).
K-Means
K-Means merupakan suatu metode untuk melakukan pengalokasian data ke
masing-masing cluster. Alokasi data tersebut didasarkan perbandingan jarak antara
data dengan centroid setiap cluster, dengan persamaan sebagai berikut (Yudi
Agusta, 2007):
aik =
1, d=min { D( x k , v i) }
0 lainnya
dimana:
aik
(2.4)
vi
J (U ,V ) = aik D (x k , v i )
(2.5)
k=1 i=1
dimana:
N
: Jumlah data
: Jumlah cluster
Dengan
aik
vi
aik
kelompok dan 0 bila sebaliknya. Pusat centroid dihitung dengan persamaan: (Yudi
Agusta, 2007)
ni
X kj . x kj
v ij = k=1n
1 i c ; 1 j m
X kj
(2.6)
k=1
Text Mining
Text mining memiliki definisi menambang data yang berupa teks dimana sumber
data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata
yang dapat mewakili isi dari dokumen sehingga dapat dilakukan analisa
keterhubungan antar dokumen (Raymond, 2006).
Tahapan dalam Text Mining:
1. Tokenizing: tahap pemotongan string input berdasarkan tiap kata yang
menyusunnya.
2. Filtering: tahap mengambil kata-kata penting dari hasil token. Bias
menggunakan algoritma stop list (membuang kata yang kurang penting)
atau word list (menyimpan kata penting).
3. Stemming: tahap mencari root kata (kata dasar) dari tiap kata hasil
filtering.
4. Tagging: tahap mencari bentuk awal/root dari tiap kata lampau atau kata
hasil stemming.
5. Analyzing: tahap penentuan seberapa jauh keterhubungan antar kata-kata
antar dokumen yang ada.
Wordcloud
Word Cloud adalah visualisasi dari kata-kata popular yang biasanya terkait
dengan kata kunci pada internet dan data teks. Word Cloud paling sering
digunakan untuk menyoroti istilah popular atau yang menonjol berdasarkan
frekuensi penggunaan. (PBC Information, 2013)
tampilan word cloud terdapat lebih banyak topik yang divisualisasikan, karena
pada kasus ini peneliti menetukan batas minimum frekuensi untuk sebuah topik
agar muncul di visualisasi word cloud yakni sebanyak 10 kali kicauan lebih
sedikit apabila dibandingkan pada grafik most popular terms sebelumnya. Dengan
kata lain bahwa setiap topik yang dibicarakan atau dikicaukan bersamaan dengan
topik banjir minimal sebanyak 10 kali maka akan divisualisasikan dalam word
cloud tersebut.
Apabila ingin melihat asosiasi atau hubungan antara topik utama yaitu
banjir dengan topik lainnya yang dikicaukan secara bersamaan dapat dilihat pada
table berikut.
sebesar 50% yang tersusun dalam satu kalimat. Pada tabel di atas topik yang
berasosiasi dengan kata banjir salah satunya adalah kata pln, apabila ingin melihat
lebih dalam asosiasi kata pln dengan banjir dapat dilihat pada tabel berikut.
Tabel 2. Asosiasi Topik Banjir dengan topik lainnya
26 Januari 2014
pln
rendam
0.93
akan
0.86
ganti
0.81
kwh
0.81
meter
0.78
pelanggan
0.78
beberapa
0.75
besar
0.75
titik
0.75
melanda
0.73
Dari tabel di atas dapat diketahui bahwa ketika berbicara topik banjir
kemudian berbicara terkait topik pln maka topik yang berasosiasi dengan topik
pln yakni topik-topik yang mengarah pada rendam, akan, ganti, kwh, meter,
pelanggan, beberapa, besar, titik, melanda. Topik yang lebih luas yang bias
ditangkap
pelanggan. Hal ini sesuai dengan topik yang sering dibahas oleh media-media
elektronik yang memberitahukan bahwa banjir besar melanda DKI Jakarta,
mengakibatkan beberapa titik macet. Hal ini bias dibuktikan dengan melihat tweet
atau kicauan aslinya seperti gambar berikut.
melakukan
tahapan
analisis
ditambah
dengan
Evans, Dave. (2008). Social Media Marketing: An hour a day, Canada, Wiley
Publishing, Inc.
Hartanto. Robin. (2013). Fakta-fakta Banjir Jakarta. Opini. 21 Januari 2013.
http://id.berita.yahoo.com/blogs/newsroom-blog/fakta-fakta-banjir-jakarta040106137.html [3 Februari 2014]
International Panel for Climate Change (IPCC). 2007. Climate Change 2007: The
Physical Science Basis. Cambridge University Press, Cambridge.
HumasLIPI. (2013). Banjir dan Longsor Bisa Diprediksi dan Diantisipasi.
Diskusi Publik. 27 Maret 2013.
http://www.fisika.lipi.go.id/in/?q=node/392853 [04 Februari 2014]
Kopertis12. (2013). Penurunan Tanah Jakarta Beban yang Semakin Tinggi. Opini.
28 Januari 2013.
http://www.kopertis12.or.id/2013/01/28/penurunan-tanah-jakarta-bebanyang-semakin-tinggi.html [4 Februari 2014]
Kotler, Philip and Kevin Lane Keller. (2010). Marketing Management 13th
Edition, New Jersey, USA. Prentice Hall.
Kraas, F. 2007. Megacities and global change: key priorities. Geographical
Journal, 173 (1), 79-82.
Mardiatno, D. 2007. Kajian spasio-temporal kejadian bencana alam periode
1907-2006 di indonesia. Jurnal Kebencanaan Indonesia, 1(3), 151 - 160.
Marfai, M.A. dan King, L. 2008a. Tidal inundation mapping under enhanced
land subsidence in Semarang, Central Java Indonesia. Environmental
Geology, 55, 1507-1518.
Marfai, M.A.; King, L.; Sartohadi, J.; Sudrajat, S.; Budiani, S.R. dan Yulianto, F.
2008. The impact of tidal flooding on a coastal community in Semarang,
Indonesia. Environmentalist, 28, 237-248.
Marfai, M.A. 2011. The hazard of coastal erosion in Central Java Indonesia: an
overview. GEOGRAFIA, Malaysia Journal of Society and Space, 7(3), 1
9.
Maulida, Nurul. (2012). Proposal Penelitian twiiter sebagai sosial media bagi
remaja. Opini. 23 Desember 2012.
[4
Februari 2014]
PBC Information. (2013). Word Cloud Definition. Retrieved 01 27, 2014,from
PBC
Information:http://www.peachbelt.com/information/thePBCis/wordcloud
Prabowo, Sigit. (2013). Makalah Data Mining. Jakarta: Fakultas Ilmu Komputer
UPN
Pramudiana, Yudi dan Amira Dewiningtias. (2012). The Utilization of Twitter
Social Media and Its Benefits Toward the Development of Audience
Community in Indonesias TV Industry. Singapore: 2012 International
Conference on Economics Marketing and Management IPEDR Vol.28
(2012)(2012) IACSIT Press.
Pramudiono, I., (2007), Algoritma Apriori, http://datamining.japati.net/cgibin/indodm.cgi?bacaarsip&1172210143 [4 Februari 2014].
Pramudiono,
I.
(2007). Pengantar
Data
Mining:
Menambang
Permata