Anda di halaman 1dari 16

STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN

KOMUNIKASI DAN INFORMATIKA


Dita Kusumasari dan Onny Rafizan

STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG


KEBIJAKAN KOMUNIKASI DAN INFORMATIKA

Study on Implementation of Big Data System for Supporting


Communication and Informatics Policy

Dita Kusumasari1 dan Onny Rafizan2


1,2)
Puslitbang Aptika dan IKP, Kementerian Komunikasi dan Informatika
Jl. Medan Merdeka Barat No.9, Jakarta
E-mail: dita001@kominfo.go.id1, onny002@kominfo.go.id2

Naskah diterima tanggal 16 September 2017, direvisi tanggal 27 November 2017, disetujui tanggal 15 Desember 2017

Abstract
Media Monitoring became one of the tasks and functions of the Ministry of Communications and Information
Technology, in accordance with Presidential Instruction No. 9/2015. The process should be done in short time while
maintaining or even improving the accuracy of analysis of the media. Therefore Big Data technology becoming a
promising solution, related abilities of Big Data to process variety of data in a large scale, also provide accurate
reports for stakeholders. This study adopted the Modified Waterfall method that commonly used in manufacture of
software. This method is expected to explores and creates an appropriate recommendation. Big Data Implementation
process will require time, cost, and human resources, so that stakeholders and related user is expected to prepare the
implementation process properly in order to be effective.

Keywords : Media Monitoring, Big Data, Modified Waterfall method, Implementation

Abstrak
Monitoring media menjadi salah satu tugas dan fungsi Kementerian Komunikasi dan Informatika, sesuai dengan
Instruksi Presiden No. 9 Tahun 2015. Proses dalam monitoring media tersebut harus dapat diselesaikan dalam waktu
cepat tanpa mengurangi akurasi dari analisis terhadap media tersebut. Oleh karena itu teknologi Big Data menjadi salah
satu solusi yang menjanjikan, terkait sifatnya yang mampu mengolah data dalam skala yang sangat besar dan variatif
serta menyajikan laporan yang akurat untuk digunakan oleh pemangku kebijakan. Penelitian ini mengadopsi metode
Modified Waterfall yang biasa digunakan dalam pembuatan software. Metode ini diharapkan dapat mendalami,
mengeksplorasi dan menghasilkan alternatif rekomendasi yang sesuai. Proses pengimplementasian Big Data akan
membutuhkan biaya, SDM, dan waktu yang tidak sedikit, sehingga pemangku kebijakan dan user terkait diharapkan
dapat lebih mempersiapkan dengan baik agar proses pengimplementasian dapat berjalan efektif dan maksimal.

Kata Kunci : Monitoring Media, Big Data, Metode Modified Waterfall, Implementasi

maupun area yang mampu dijangkau, terlebih


PENDAHULUAN pada distribusi informasi lintas Negara.
Masyarakat di suatu Negara tidak dapat dengan
Perkembangan dalam penggunaan mudah memperoleh dan mengakses informasi
teknologi informasi dan komunikasi telah yang berkaitan dengan Negara lain, begitu pun
merubah cara berkomunikasi, khususnya dalam sebaliknya. Berkembangnya internet di era
penyebaran informasi. Mulanya metode teknologi yang maju memungkinkan peredaran
komunikasi dan distribusi informasi hanya informasi yang semakin banyak, cepat, dan
terbatas pada media tertulis (kertas, surat) dan hampir tidak terbatas oleh ruang dan waktu.
media elektronik (radio, televisi, dan telepon) Hal ini menyebabkan informasi yang beredar
sehingga informasi yang beredar masih sangat dari hari ke hari menjadi sangat banyak,
terbatas, baik dari skala informasi yang beredar mencakup berbagai informasi dalam bidang

81
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

sosial, politik, ekonomi, teknologi, ilmu cara yang efektif untuk mengolahnya, terlebih
pengetahuan, pangan, dan lain sebagainya. jika informasi yang dihasilkan dari data
Kondisi serupa juga terjadi dalam skala tersebut dibutuhkan untuk membantu membuat
pemerintahan. Beberapa tahun terakhir telah keputusan bagi pemangku kebijakan.
muncul himbauan untuk mengalihkan Diperlukan cara yang cepat dan tepat untuk
informasi/dokumen fisik menjadi data dapat mengolah data tersebut menjadi
elektronik. Pelaksanaan himbauan tersebut informasi. Oleh karena itu prinsip Big Data
salah satunya bertujuan untuk memudahkan sangat cocok diterapkan, dimana prinsip Big
pengelolaan dan penggunaan data saat Data yaitu untuk dapat mengelola data yang
dibutuhkan. Di satu sisi hal ini dapat segera sangat banyak dan beragam, serta mengolahnya
dilaksanakan jika jenis dan format dari seluruh menjadi informasi yang dibutuhkan dalam
data yang ada seragam. Namun di sisi lain, waktu yang sangat singkat. Dengan
semakin beragam jenis dan format data, serta menemukan pilihan alternatif implementasi Big
semakin besar jumlah dan variasi data akan Data yang cocok diterapkan pada Kementerian
memakan waktu yang lama untuk mengolah Komunikasi dan Informatika, khususnya pada
data – data tersebut menjadi informasi yang bagian Media Monitoring, diharapkan dapat
terstruktur rapi dan dapat dibaca. membantu user terkait dalam membuat
Tidak dapat dipungkiri, informasi keputusan melalui implementasi Big Data.
merupakan senjata yang sangat penting saat ini.
Organisasi seperti pemerintah tentunya Metode Penelitian
memiliki data yang sangat beragam dan dengan Penelitian ini menggunakan pendekatan
jumlah yang sangat banyak. Untuk dapat secara kualitatif untuk mendalami kebutuhan
mengambil keputusan yang tepat, dalam hal ini yang ada. Dalam menemukan alternatif
pemerintah selaku pembuat kebijakan, implementasinya, penelitian ini menggunakan
memerlukan cara yang efektif untuk mengelola metode Modified Waterfall. Karena batasan
data – data tersebut menjadi informasi yang penelitian ini tidak mencakup pembuatan dan
berguna sebagai pertimbangan dalam membuat implementasi sistem, maka jika mengacu pada
keputusan. Modified Waterfall, tahap yang dilakukan
Media menjadi salah satu bagian yang hanya terbatas hingga tahap System Design.
menjadi perhatian pemerintah, salah satunya Oleh karena itu, dengan mengacu pada metode
tertuang dalam Instruksi Presiden No. 9 Tahun tersebut, serta mempertimbangkan batasan
2015 tentang Pengelolaan Komunikasi Publik penelitian yang ditetapkan, maka tahapan
terkait tugas dan fungsi Kementerian penelitian disesuaikan seperti dalam Gambar 1.
Komunikasi dan Informatika, yaitu:
1. Melakukan kajian terhadap data dan Pelatihan Tim FGD
Penelitian
informasi yang disampaikan
kementerian dan lembaga pemerintah
non kementerian;
2. Melakukan Media Monitoring dan
Perumusan Perancangan Penguatan
menganalisis konten media terkait Kebutuhan plihan
Pengumpulan
pilihan
Data
dengan kebijakan dan program Direktorat Terkait alternatif alternatif
pemerintah;
3. Menyusun narasi tunggal terkait dengan
kebijakan dan program pemerintah
kepada publik sesuai arahan Presiden. Perumusan
Rekomendasi
Pengelolaan data yang beragam dengan
jumlah yang sangat besar membutuhkan suatu Gambar 1. Pendekatan Metode Studi

82
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

Studi Literatur Pemerintah yang memiliki begitu


Pemerintahan yang baik hanya dapat banyak informasi untuk disampaikan
terjadi bila pengambilan keputusan didasarkan memerlukan cara efektif dan peran juru bicara
pada informasi yang memadai serta penilaian pemerintah untuk menyampaikan informasi-
yang independen (Sullivan dalam Subiakto, informasi tersebut kepada publik. Secara
2014: 248). Hal demikian dapat dicapai dengan teoritis humas pemerintah atau Government
adanya informasi yang faktual dan terpercaya, Public Relations (GPR) mempunyai tugas
yang hanya dapat diperoleh dari pers yang untuk menjelaskan dampak program dan
bebas, yang berfungsi sebagai watchdog kebijakan pemerintah terhadap warganya,
masyarakat atas pemerintah. Dalam Negara termasuk isu-isu kontroversial yang beredar.
yang menjamin kebebasan pers dan informasi, Pemerintahan Kabinet Kerja sedang
pemerintah harus siap terhadap keadaan merancang agar data yang melimpah dalam
tersebut. Disinilah peran lembaga informasi media konvensional maupun media baru
pemerintah, yakni sebagai pusat komunikasi tersebut dapat dimanfaatkan sebagai bentuk
dengan publik dalam menjelaskan rencana dan opini publik yang dapat membentuk citra
program pemerintah terhadap masyarakat, positif bagi pemerintah. Melalui Instruksi
sehingga masyarakat dapat memahami Presiden Nomor 9 Tahun 2015 tentang
pengaruh dan peranan kebijakan tersebut bagi Pengelolaan Komunikasi Publik, Kementerian
kehidupan mereka. Komunikasi dan Informatika telah ditugaskan
untuk melakukan monitoring media.

Gambar 2. Elemen Kehumasan


Monitoring Media Data-data yang terdapat pada Direktorat
Menurut Direktorat Jenderal Informasi Pengelolaan dan Penyediaan Informasi (PPI)
dan Komunikasi Publik (Ditjen IKP), yang bersifat tidak terstruktur dengan pertambahan
dimaksud dengan Monitoring Media adalah jumlah data yang sangat cepat. Data tersebut
kegiatan memantau konten-konten yang harus dapat diolah dalam waktu yang singkat
beredar di media, baik cetak, penyiaran untuk menjadi informasi. Dibutuhkan metode
maupun online dan media sosial. Adapun untuk statistik yang akurat dalam menampilkan
memonitor media, dengan mengacu pada informasinya, dimana hal tersebut dapat
elemen kehumasan seperti ditunjukkan pada membantu pemangku kebijakan dalam
Gambar 2.

83
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

menerima informasi yang dibutuhkan untuk disebut dengan Pamedi (Paques Media
membuat keputusan. Intelligence).
Untuk itu, Direktorat PPI pada Ditjen
IKP telah bekerjasama dengan PT. Delapan
Sebelas Indonesia pada tahun 2015 hingga
2016, dan menghasilkan aplikasi pengelolaan
Monitoring Media dengan Big Data yang

Gambar 3. Tampilan Dashboard Pamedi


Pamedi (Paques Media Intelligence)  Expert Analysis & Reporting: Pamedi juga
Pamedi sebagai alat yang digunakan memungkinkan untuk membuat suatu
untuk monitoring media di Direktorat PPI, laporan yang dapat diubah sesuai
sudah mulai diterapkan pada tahun 2015 ini kebutuhan lengkap dengan grafiknya.
(lihat Gambar 3). Kemampuan Pamedi ini
terbagi menjadi tiga1: Karakteristik Big Data
 Media Monitoring: suatu monitoring topik Suatu data dikategorikan sebagai “Big
atau isu yang ada pada media sosial Data” bukan hanya karena jumlah data yang
maupun media berita secara sistematis, besar. Ada beberapa karakteristik yang
yang memungkinkan pengguna untuk membedakan Big Data dengan sistem lainnya.
mengakses secara real-time informasi dan Sistem Big Data memiliki Volume data
alat pengukuran pada aplikasi sehingga yang sangat besar, dimana biasanya melebihi
memungkinkan pengguna untuk membuat server biasa pada umumnya dan data ini akan
keputusan yang lebih baik dan merespon bertambah terus tiap harinya. Besarnya data
suatu situasi yang penting. bisa mencapai lebih dari 100 TB dan biasanya
 Media Measurements & Analysis: disimpan di infrastruktur external (tidak di
memungkinkan user untuk memaparkan maintain sendiri).2
grafik dengan analisis yang berkualitas Selain itu Big Data juga memiliki data
berdasarkan hasil yang didapatkan pada yang bervariasi (Variety), dengan format
aplikasi/ akun pengguna. maupun jenis data yang sangat beragam

2
Diambil dari Paparan Prof. Dr. Mochamad Ashari
1
Diambil dari Paparan PT. Delapan Sebelas Indonesia tentang Big Data Industry and Academic Point of View,
tentang Pamedi tanggal 2 September 2015 dalam Konferensi Big Data Indonesia 2015.

84
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

sehingga memerlukan suatu proses khusus HASIL DAN PEMBAHASAN


untuk dapat mengolahnya. Big Data juga harus
dapat mengolah data tersebut dalam waktu Sesuai Instruksi Presiden No. 9 Tahun
yang sangat cepat (Velocity) agar data bisa 2015, tugas Pengelolaan Komunikasi Publik
bermanfaat tidak hanya karena informasi yang meliputi; Melakukan kajian terhadap data dan
dihasilkan saja tetapi juga karena kecepatan informasi yang disampaikan kementerian dan
yang dibutuhkan untuk mengolahnya menjadi lembaga pemerintah non kementerian; serta
informasi tersebut. Melakukan Media Monitoring dan
Karakteristik Big Data yang keempat menganalisis konten media terkait dengan
adalah kebenaran akan data itu sendiri kebijakan dan program pemerintah. Pada
(Veracity). Informasi yang diolah dari data pelaksanaan kedua tugas tersebut, ditemukan
tersebut agar bisa menjadi informasi yang “gap” antara kebijakan dan program
bermanfaat dan bisa dipercaya, kita juga harus pemerintah yang berjalan dengan isu
melihat sumber data yang digunakan. pemberitaan media, sehingga perlu adanya
Karenanya pada Big Data, kebenaran akan data upaya antisipasi oleh pemerintah. Oleh karena
menjadi salah satu hal yang harus diperhatikan. itu, monitoring media menjadi salah satu
bagian penting dari Kementerian Komunikasi
dan Informatika, tepatnya bagi Direktorat PPI,
Ditjen IKP. Kebutuhan ini telah dituangkan
dalam sebuah Proses Bisnis seperti ditunjukkan
dalam Gambar 4.

Gambar 4. Proses Bisnis Monitoring Media

Proses monitoring media tersebut hasil analisis, yaitu Monitoring Isu Publik
melibatkan 22 media dengan rincian: 12 Media (MIP) dan Media Content Analysis (MCA).
cetak, 5 media online, dan 5 Media TV. Media
yang dipilih sebagai sampel merupakan media 1. Monitoring Isu Publik (MIP)
yang representatif. Hal ini dikarenakan sifat MIP merupakan bagian dari proses
media yang saat ini cenderung memiliki arah monitoring media yang dilakukan melalui
yang dapat dikelompokkan berdasarkan penelusuran headline berita. Kriteria headline
pemberitaannya. Secara garis besar proses yang dipantau yaitu headline berita yang
monitoring media menghasilkan dua laporan mengandung informasi ataupun isu – isu yang

85
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

sedang marak diberitakan oleh media. Selama suatu media dengan media lainnya. Proses
ini proses penentuan isu dilakukan dengan bisnis baru dalam pengerjaan MIP dengan
melihat subjektivitas pembaca berita. Jika intervensi Sentiment Analysis dan SNA,
menerapkan Big Data dengan metode ditunjukkan dalam Gambar 5.
Sentiment Analysis dapat mempercepat proses
analisis berita dalam pengerjaan laporan MIP, 2. Media Content Analysis (MCA)
dengan menerjembahkan sudut pandang Media Content Analysis (MCA)
seseorang kedalam bahasa mesin. merupakan proses monitoring media
berdasarkan isi atau konten dari berita. Konten
berita yang dilihat merupakan konten dari
berita-berita dengan headline terbanyak. Sama
halnya dengan MIP, penerapan metode
Sentiment Analysis dan Social Network
Analysis (SNA) dapat mempercepat proses
analisis serta memperkaya hasil analisis berita.
Perbedaan dengan MIP terletak pada
objek analisis. Jika analisis MIP hanya
mengacu pada headline berita, maka MCA
dihasilkan dari analisis isi suatu berita pada
media.

Tahapan Implementasi Big Data


Karena Big Data mencakup area yang
Gambar 5. Proses Bisnis MIP sangat luas, maka implementasinya dalam
penelitian ini akan dikategorikan menjadi tiga
Selain Sentiment Analysis, penggunaan tahap, yaitu IT Management & Tata Kelola,
metode Social Network Analysis (SNA) secara SDM, dan Sistem, seperti ditunjukkan dalam
bersamaan juga mampu memperkaya hasil Gambar 6.
analisis, salah satunya dengan menyediakan
informasi tentang keterkaitan antara satu isu di

Gambar 6. Tahapan Implementasi Big Data

86
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

IT Management dan Tata Kelola Teknologi mempunyai peranan penting


a. IT Management terhadap proses kelangsungan informasi, mulai
Gartner menggambarkan dimensi Big dari sebuah informasi diciptakan sampai
Data sebagai 3V yaitu Volume, Velocity, dimusnahkan. Enterprise yang sukses
Variety (Gartner, 2009). Seiring dengan memperlakukan TI sebagai bagian yang
pekembangannya, Big Data tidak hanya signifikan dalam melaksanakan proses bisnis.
mencakup 3V namun berkembang ke 5V yaitu Proses bisnis dan TI harus berkolaborasi dan
Volume, Velocity, Value, Veracity, dan Variety. bekerjasama sehingga TI dapat masuk ke
Secara teknis, Big Data merupakan dalam tata kelola dan manajemen.
sekumpulan data yang besar baik terstruktur, COBIT 5 memiliki beberapa
semi, maupun tidak terstruktur sehingga tidak pengungkit yang diturunkan dari tujuan
bisa diolah menggunakan perangkat database organisasi yang telah didefinisikan. Pengungkit
relational biasa (Nitin Sawant, 2013). tersebut merupakan faktor yang mempengaruhi
Data-data yang muncul mempunyai governance dan management dari enterprise
peluang yang mampu memberikan sebuah TI, yaitu:
petunjuk kebijakan tanpa pernah disadari 1) Prinsip, kebijakan dan framework;
sebelumnya (Milton, 2009). Big Data 2) Proses;
merupakan tren teknologi untuk melakukan 3) Struktur organisasi;
pendekatan baru dalam memahami dunia dan 4) Budaya, etika dan perilaku;
membuat keputusan bisnis (John F. O., 2013). 5) Informasi;
Keputusan-keputusan ini dibuat berdasarkan 6) Layanan, infrastruktur dan aplikasi; dan
data dalam volume yang sangat besar 7) SDM, kemampuan dan kompetensi.
terstruktur, tidak terstruktur dan kompleks Menurut COBIT 5, informasi yang
(misalnya tweet, video, transaksi komersial). efektif adalah informasi yang mampu
Menurut Bill Schmarzo, proses memenuhi kebutuhan konsumen informasi
integrasi Big Data di dalam sebuah enterprise (stakeholder). Dalam kasus Big Data,
mempunyai mempunyai indek kematangan enterprise (organisasi) adalah stakeholder dan
bisnis yang terdiri dari beberapa fase sebagai salah satu pilar utama adalah kualitas
berikut (Bill, 2013): informasi. Big Data harvesting diharapkan bisa
1. Business Monitoring. menghasilkan kualitas informasi yang
2. Business Insights. mendukung pengambilan keputusan. Kualitas
3. Business Optimization.
informasi yang baik akan mengakibatkan hasil
4. Data Monetization. keputusan organisasi yang baik sehingga akan
5. Business Metamorphosis meningkatkan keuntungan bagi enterprise.
Big Data merupakan sebuah proses
b. Tata Kelola IT dengan framework COBIT 5 pengumpulan data untuk menemukan pola dan
COBIT (Control Objectives for korelasi yang mungkin tidak jelas pada
Information and Related Technology) adalah awalnya, tetapi berpeluang menjadi berguna
salah satu kerangka kerja (framework) yang
dalam pengambilan keputusan bisnis. Data
diciptakan oleh ISACA yang berfungsi untuk tersebut seringkali merupakan data pribadi
dijadikan panduan dalam rangka mencapai yang berguna yang dapat dikategorikan sebagai
tujuan organisasi. Organisasi yang dimaksud Volunteered data, Observed data ataupun
merupakan sebuah enterprise yakni organisasi Inferred data (Richard Chew, 2013).
yang menjalankan fungsi IT sebagai bagian
dari proses bisnisnya.
Menurut COBIT, informasi merupakan
sumber daya kunci bagi sebuah enterprise.

87
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

Sumber Daya Manusia 3) Data Transformation


Karena kompleksitas dari sistem Big Salah satu sifat dari Big Data selain
Data, dibutuhkan kemampuan teknis beragam ukuran data yang sangat besar, juga jenis data
untuk dapat mengimplementasikannya. Namun yang sangat beragam. Agar data-data tersebut
karena Big Data Engineering sendiri masih dapat dianalisis dengan baik, maka terkadang
merupakan sesuatu yang baru serta berhadapan data-data tersebut perlu diubah ke dalam
dengan teknologi dan posisi pekerjaan yang format lain sehingga memungkinkan untuk
juga baru, maka saat ini belum ada spesifikasi dianalisis. Kompetensi yang dibutuhkan
baku mengenai kompetensi SDM yang termasuk:
dibutuhkan untuk bidang ini. Berdasarkan  ETL Tools (e.g.: Informatica, DataStage,
proses kerja Big Data pada umumnya yaitu SSIS, Redpoint, dsb)
Collect, Store, Transform, dan Analysis3, maka  Scripting (e.g.: Linux/Unix commands,
ada empat hal yang harus diperhatikan terkait Python, Ruby, Perl, dsb)
dengan kompetensi SDM yang dibutuhkan
4) Data Analysis
dalam implementasi Big Data, diantaranya:
Tahapan terakhir yaitu menganalisis
1) Data Collection
data yang sudah diambil dan dikumpulkan
Data yang akan diproses dalam sistem
sebelumnya, mengolah data tersebut menjadi
Big Data biasanya diambil dari website atau
informasi, hingga menjadi hasil statistik jika
API (Application program interface), pada
diperlukan. Kompetensi yang dibutuhkan
umumnya dengan menggunakan teknik
diantaranya ialah:
crawling. Kompetensi SDM yang diperlukan
antara lain:  MapReduce, Hadoop, Cloudera, IBM Big
Insights, Hortonworks, MapR, dsb.
 Data APIs
 Data mining atau machine learning (e.g.:
 SQL dan Data Modeling
Mahout, Neural Network, dsb)
2) Data Warehouse  Statistical analysis software (e.g.: R,
Data yang telah diambil dari berbagai SPSS, SAS, Weka, MATLAB, dsb)
macam sumber akan disimpan dalam server  Programming skills (e.g.: Java, Scala,
yang sudah disiapkan untuk sistem Big Data. Ruby, C++, dsb)
Sesuai dengan namanya, Big Data
membutuhkan kapasitas penyimapanan data Sistem
yang sangat besar, karena masuknya data yang Jika Big Data diimplementasikan untuk
sangat besar dan beragam ke dalam server monitoring media, maka yang akan menjadi
setiap harinya. Salah satu alasan inilah disebut inti dalam sistem tersebut adalah cara yang
Data Warehouse karena proses penyimpanan, dipakai untuk menganalisis teksnya (Text
pengolahan, dan pengambilan data dari server Analysis). Ada banyak cara dan algoritma yang
akan sangat berbeda dengan Database biasa. dapat dipergunakan untuk menganalisa teks,
Kompetensi yang dibutuhkan diantaranya tergantung pada hasil seperti apa yang akan
ialah: kita harapkan.
 Relational Databases (e.g.: MySQL, MS Salah satu proses dalam Monitoring Isu
SQL Server, Oracle, DB2, dsb) Publik adalah menganalisis isu dalam suatu
 NoSQL (e.g.: HBase, SAP HANA, HDFS, berita. Salah satu metode yang bisa digunakan
Cassandra, MongoDB, CouchDB, dalam menganalisis isu tersebut ialah dengan
Vertica, Greenplum, Pentaho, Teradata, menggunakan kombinasi antara Social Network
dsb) Analysis untuk melihat jaringan dari isu
tersebut dan metode Sentiment Analysis, yang
3
“The Key Skills Needed by Big Data Engineers”. merupakan studi analisis opini, sentimen,
http://insights.dice.com/2014/08/21/key-skills-needed-
evaluasi, pujian, sikap, serta emosi orang
big-data-engineers/. Diakses tanggal 19 Oktober 2016.

88
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

terhadap suatu entitas atau objek yang bisa dapat terlihat aktor-aktor yang paling
berupa produk, jasa, individu, organisasi, berpengaruh, hubungan antar aktor, pihak-
kejadian, maupun sebuah topik. Penggunaan pihak lain yang ada dalam jaringan tersebut,
Social Network Analysis (SNA) lebih melihat dan sebagainya. Adapun gambaran sederhana
kepada aktor yang terlibat dalam suatu isu. implementasi Big Data (kombinasi sentiment
SNA bekerja dengan menganalisis network analysis dan SNA) dalam monitoring media
(jaringan) yang terbentuk antar aktor, sehingga ditunjukkan dalam Gambar 7 dan Gambar 8.

Gambar 7. Kombinasi Sentiment Analysis dan SNA

Gambar 8. Gambaran Sederhana kombinasi SNA dengan Sentiment Analysis

89
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

1. Social Network Analysis (SNA) Dalam hal ini karena user terkait adalah
Penggunaan Social Network Analysis Direktorat PPI pada Ditjen IKP, maka kita
dapat diterapkan untuk melihat jaringan memposisikan diri sebagai pemerintah dalam
(network) yang tercipta antar aktor yang melihat suatu berita. Suatu berita yang
terlibat dalam suatu isu, seperti terlihat dalam dipandang positif oleh pemerintah bisa jadi
ilustrasi Gambar 9. dipandang negatif oleh masyarakat. Begitupun
sebaliknya. Karena itulah subjektifitas dalam
melihat suatu berita perlu diperjelas sehingga
dapat diterjemahkan ke dalam mesin.

Gambar 9. Ilustrasi SNA

Social Network Analysis dapat Gambar 10. Subjektivitas Pembaca Berita


mempresentasikan hal-hal kompleks, seperti
berbagai peran aktor dalam jejaring sosial, Terdapat dua hal penting yang harus
konteks, komunitas, dan lain-lain. diperhatikan, yaitu:
Penerapannya dalam Monitoring Media akan 1. Sudut Pandang Kolektif
memungkinkan untuk melihat jaringan sosial Sebagai pemerintah, sudut pandang yang
yang terlibat dalam suatu isu tertentu. Melalui dikumpulkan dari beberapa individu
SNA, dua poin penting yang akan merubah membentuk sudut pandang kolektif
skala dari suatu isu dapat terlihat, diantaranya : (misalnya dengan membentuk Tim
 Jika isu yang sama dibicarakan oleh Penilai Berita). Kesulitannya adalah sudut
banyak orang dalam waktu yang singkat, pandang yang harus disepakati bersama.
maka isu tersebut berpotensi tinggi untuk Karena itu pemilihan anggota Tim yang
menjadi isu yang berskala besar. kompeten dan representatif menjadi
 Jika terdapat suatu isu yang dibicarakan sangat penting, agar sudut pandang
oleh aktor yang memiliki jaringan dengan kolektif yang terbentuk benar-benar dapat
tingkat ketebalan (density) jaringan yang mewakili sebagai pemerintah.
besar, maka kemungkinan besar isu 2. Sudut Pandang Secara Individu
tersebut akan dibicarakan oleh orang- Penggunaan sudut pandang individu akan
orang yang ternasuk dalam jaringannya jauh lebih mudah untuk diterjemahkan ke
(misalnya follower pada twitter). dalam bahasa mesin. Meskipun
subjektifitas seseorang akan berbeda
2. Sentiment Analysis dengan yang lainnya, namun subjektifitas
Salah satu hal terpenting sebelum orang yang ditentukan tetap dapat
melakukan Sentiment Analysis adalah dengan diterima dan digunakan sebagai sudut
menetapkan subjektifitas pembaca berita,
sebagai siapakah kita akan melihat suatu berita.

90
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

pandang pemerintah dalam melihat suatu Sebagai ilustrasi konsep Naïve Bayes
berita. Classification, objek yang ada dapat dilabelkan
Sentiment Analysis memungkinkan user terlebih dahulu (Dell. 2015). Untuk
untuk menganalisis suatu isu dengan memecah memudahkan, ilustrasi objek diberi label BLUE
kalimat menjadi kata per kata. Metode dan RED. Dalam Bayesian Analysis, dikenal
Sentiment Analysis yang dapat digunakan dan dengan prior probability (probabilitas awal).
sesuai dengan tugas dan fungsi Media Karena jumlah BLUE dua kali lipat dari jumlah
Monitoring Kominfo diantaranya adalah: RED, maka dipercaya bahwa objek yang baru
memiliki kemungkinan yang besar untuk
 Naïve Bayes Classifiers
memiliki label BLUE. Bisa juga dituliskan
Naïve Bayes Classifiers merupakan
seperti:
metode yang berasal dari teori Bayesian. Model
Number of BLUE
ini berdasarkan conditional independency yang Prior probability objects
dihasilkan dari prediksi kelas target. =
for BLUE Total number of
Berdasarkan teori Bayes, posterior probabilitas objects
dapat dituliskan sebagai berikut:
Number of RED
Prior probability objects
=
for RED Total number of
Secara bahasa, persamaan diatas dapat objects
disederhanakan menjadi:
Jika diterapkan dalam menganalisis
media, maka tahap pertama yang dilakukan
adalah dengan memberikan label pada teks-teks
Posterior Probability atau peluang yang dalam Corpus yang digunakan (misal: negatif
muncul setelah dilakukan pengujian, dalam atau positif). Setelah pelabelan, dilakukan
teori Bayes dihasilkan dari peluang awal Supervised Training dengan menggunakan
dikalikan dengan kemungkinannya, dan dibagi dataset yang dimiliki. Seperti halnya Machine
dengan hasil pengujian. Ini merupakan metode Learning, semakin banyak dilatih maka akan
pengelompokkan secara statistik yang semakin akurat hasilnya. Terutama pada Naïve
digunakan untuk memprediksi peluang Bayes Classification. Metode ini memiliki
keanggotaan baru yang muncul dalam suatu karakteristik yang jika digunakan pada data
kelompok. Dell juga mengeluarkan textbook yang berskala besar akan mengeluarkan hasil
tentang Naïve Bayes Classifier yang yang lebih akurat.
digambarkan secara sederhana.4
 Standford’s Sentiment Treebank
Berbeda dengan Sentiment Analysis
yang umumnya memecah kalimat dan melihat
secara kata per kata, metode ini melihat teks
dalam satu struktur kalimat yang utuh. Struktur
kata dalam sebuah kalimat tidak dihilangkan,
sehingga makna suatu kata dapat terlihat dalam
satu kalimat yang utuh.
Gambar 11. Ilustrasi pengklasifikasian objek Kumpulan words classifiers dapat
bekerja dengan baik pada kalimat yang panjang
dengan mengandalkan kata-kata yang
sederhana namun memiliki sentimen yang kuat
4
Statistics – Textbook, Naïve Bayes Classifier. Dell. seperti “hebat” atau “luar biasa”. Namun
https://documents.software.dell.com/statistics/textbook/n akurasi yang dihasilkan untuk klasifikasi satu
aive-bayes-classifier#technical notes

91
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

kalimat dalam menentukan sentimen negatif pemerintah yang memegang salah satu
atau positif tidak pernah melebihi 80%. Dalam sektor strategis, yaitu informasi, pilihan
kasus kalimat dengan tone netral untuk pesan untuk membangun sistem Big Data sendiri
pendek di twitter, akurasi yang didapat bahkan dapat menjadi pertimbangan. Keunggulan
cenderung dibawah 60% (Wang et al., 2012)5 dari opsi ini antara lain :
• Membangun sistem dapat menjadi
Investasi dalam pengelolaan informasi
publik, yang akan bertambah kompleks
seiring dengan berkembanganya media
komunikasi
• Keamanan Informasi lebih terjamin
karena sistem yang dibangun dimiliki
sendiri
• Kedaulatan data di tangan pemerintah
yang membangun sistem tersebut
• Biaya lebih terjangkau jika
dibandingkan langganan service secara
Gambar 12. Contoh hasil Standford’s Sentiment terus menerus
Treebank6 • Ketergantungan pemerintah terhadap
pihak swasta berkurang, karena dikelola
Pilihan Alternatif Implementasi Big Data secara mandiri
Metode apapun yang akan digunakan Sedangkan kelemahannya antara lain :
untuk analisis teks, corpus tetap menjadi unsur • Pembangunannya memerlukan waktu
krusial. Hal ini terkait variasi corpus dalam panjang sampai bisa digunakan
Bahasa Indonesia yang masih sangat terbatas. • Memerlukan tenaga SDM dengan
Adapun corpus yang cukup lengkap biasanya bidang keahlian tertentu
dimiliki oleh vendor tertentu dan bersifat • Membutuhkan server yang besar untuk
tertutup untuk umum. Pembuatan Corpus menyimpan dan mengolah data. Big
tersebut sangat penting, karena dapat Data memerlukan kemampuan dan
menentukan keakuratan hasil Sentiment kapasitas server yang dapat diandalkan
Analysis. agar data yang didapat bisa diolah
Tahap terakhir yang menjadi salah satu dengan cepat dan akurat
pertimbangan penting terkait bagaimana sistem • Membutuhkan kepastian dari pimpinan
Big Data tersebut akan diimplementasikan. puncak untuk dapat menjamin
Terdapat tiga opsi alternatif yang dapat diberikannya support, baik dari sisi tata
dijadikan pertimbangan, antara lain: kelola, SDM, maupun biaya
1. Membangun Sistem Sendiri • Harus ada seseorang yang mengawal
Yaitu membangun sistem Big Data secara proses pembuatan dari awal hingga
keseluruhan dari awal, meskipun dalam selesai agar hasil akhir dapat sesuai
pengerjaannya dapat dilakukan dengan • Perlu penyediaan infrastruktur yang
meng-hire pihak ketiga. Sebagai instansi memadai (Jaringan, Server, dsb)
2. Berlangganan
5
S. Richard, P. Alex, W. Y. Jean, C. Jason. Recursive Saat ini sudah ada beberapa perusahaan/
Deep Models for Semantic Compositionality Over a vendor yang menawarkan service Big Data.
Sentiment Treebank Vendor yang notable diantaranya:
6
Screenshot diambil dari hasil uji coba di website • i811
Treebank Standford. • Indonesia Indicator/ebDesk
http://nlp.stanford.edu/sentiment/treebank.html. Diakses
tanggal 15 Juni 2016 • Mediatrac

92
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

• Maverick • Dari sisi keamanan informasi, bagian


• Mediawave sistem yang penting dapat dimiliki
• Insentia sendiri (e.g.: Kedaulatan Data, Corpus,
• Awesometrics dsb)
• IMMC (Indonesia Media Monitoring • Sistem dapat dibuat sesuai kebutuhan/
Center) keinginan
• IMM (Intelligence Media Management) • Sebagai pengguna akan lebih
memahami sistem, karena mengikuti
Meskipun terdapat kekurangan pada
proses pembuatan dari awal hingga jadi
masing-masing vendor, pilihan untuk
• Tidak memerlukan banyak SDM teknis,
berlangganan tetap dapat menjadi opsi jika
karena pengerjaannya akan di-share
layanan yang diberikan dapat di custom
dengan pihak luar
sesuai dengan kebutuhan. Keunggulan opsi
Sedangkan kelemahannya antara lain:
ini antara lain :
• Harus ada seseorang yang mengawal
• Pengelolaan dan reliabilitas sistem
proses pembuatan dari awal hingga
dijamin oleh penyedia layanan
selesai agar hasil akhir dapat sesuai
• SDM yang diperlukan hanya sebagai
dengan harapan
pengguna, sehingga tidak diperlukan
• Membutuhkan kepastian dari pimpinan
kualifikasi SDM teknis yang tinggi
puncak untuk dapat menjamin
• Sistem dapat langsung digunakan
diberikannya support, baik dari sisi tata
• Tidak membutuhkan server yang besar
kelola, SDM, maupun biaya
karena pemrosesan data di pihak
• Perlu penyediaan infrastruktur yang
penyedia layanan
memadai (Jaringan, Server, dsb)
Sedangkan kelemahannya antara lain:
• Biaya lebih tinggi (Ditentukan oleh Karena pengerjaannya merupakan
pihak penyedia, estimasi untuk layanan kerjasama antara pemerintah dengan pihak
yang pernah digunakan seperti IMM luar, maka perlu adanya suatu komitmen
sekitar 30 Juta per bulan) tertulis yang dibuat terperinci untuk
• Keberlangsungan sistem ditentukan memastikan sistem yang dibuat bersama dapat
oleh penyedia layanan, sehingga selesai dan terhindar dari masalah-masalah
menyebabkan ketergantungan terhadap yang dapat muncul kedepannya.
vendor
• Raw data, algoritma, dan corpus,
dipegang oleh penyedia layanan, karena PENUTUP
hal tersebut merupakan core yang
diperdagangkan. Simpulan
• Membutuhkan penyesuaian sistem yang Dalam sistem Big Data yang akan
terperinci agar layanan sistem Big Data diimplementasikan untuk media monitoring,
yang diberikan sesuai dengan Text Mining dengan metode Sentiment Analysis
kebutuhan. Karena akan berbeda akan menjadi core dalam sistem tersebut.
penggunaan dan kebutuhan antara Terdapat dua metode Sentiment Analysis yang
corporate dengan pemerintah. paling sesuai untuk diterapkan, yaitu Naïve
3. Membangun Sebagian Bayes Classifiers dan Standford Treebank.
Pemerintah membangun bagian dari sistem Metode Sentiment Analysis yang paling
yang memiliki nilai strategis bagi sesuai bagi media monitoring adalah Standford
pemerintah (misalnya seperti Corpus), Treebank, karena metode tersebut dapat
sedangkan sisanya dibangun pihak luar. melihat hubungan antar kata dalam tiap
Keunggulan opsi ini antara lain : kalimat, berbeda dengan metode lain yang
umumnya memaknai kalimat dengan memecah

93
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

kata-perkata. Namun karena metode tersebut alokasi dana yang besar untuk vendor tiap
masih dalam tahap pembuatan dan Corpus tahunnya.
yang digunakan dalam bahasa Inggris, maka Pembuatan Corpus sendiri dapat
Naïve Bayes dapat menjadi pilihan untuk dilakukan secara independen ataupun bekerja
diterapkan bagi monitoring media saat ini. sama dengan pihak Universitas, sehingga
Terdapat tiga alternatif terkait tahapan pemerintah dan akademisi dapat saling berbagi
implementasi sistem Big Data yang dapat dalam hal pengetahuan dan sumber daya
dilakukan, antara lain: membangun sistem (resources).
sendiri, berlangganan yang sudah ada, atau
membangun sistem sebagian. Masing-masing Ucapan Terima Kasih
alternatif tersebut memiliki keunggulan dan Penulis mengucapkan terima kasih
kelemahan yang perlu diperhatikan untuk kepada Puslitbang Aptika dan IKP, Badan
menjadi pertimbangan. Litbang SDM, Kominfo, dimana tulisan ini
merupakan bagian dari penelitian Tim yang
Saran pernah dilakukan di Puslitbang Aptika dan IKP
Metode Sentiment Analysis sebaiknya dengan judul “Studi Implementasi Sistem Big
dikombinasikan dengan Social Network Data untuk Mendukung Kebijakan
Analysis, agar output yang dihasilkan tidak Komunikasi dan Informatika” yang dibiayai
hanya berhenti pada monitoring media, tetapi dari DIPA tahun 2016 Puslitbang Aptika dan
hingga menemukan key person atau aktor yang IKP. Penulis juga mengucapkan terima kasih
terkait pada isu-isu tersebut. Akan sangat kepada tim penelitian ini yang terdiri dari
disayangkan jika resource besar yang telah peneliti di Puslitbang Aptika dan IKP dan tim
dialokasikan hanya dipergunakan untuk dari Telkom University.
monitoring media. Pemanfaatan Big Data dapat
lebih optimal jika diperluas untuk melakukan DAFTAR PUSTAKA
predictive analysis dalam memperkirakan Ashari, Mochamad, 2015. Big Data Industry
potensi suatu isu menjadi besar. Kedepannya and Academic Point of View. Konferensi
melalui sistem Big Data, Kominfo bersama Big Data Indonesia.
instansi pemerintah lain dapat mengantisipasi
dan bereaksi lebih cepat terhadap isu yang IBM Big Data & Analytics Hub, 2013. 4v’s of
diprediksikan menjadi besar, sehingga dapat Big Data.
dikendalikan. www.ibmbigdatahub.com/infographic/four
Proses dalam sistem Big Data yang -vs-big-data. Diakses tanggal 17 Februari
akan diimplementasikan secara sederhana 2016.
dapat terbagi dalam tiga kategori, yaitu Input, Instruksi Presiden No. 9 Tahun 2015 tentang
Process, dan Output. Kombinasi metode yang Pengelolaan Komunikasi Publik.
direkomendasikan ada pada tahap process.
Diharapkan rekomendasi ini dapat Krishnan, K., 2013. Data Warehousing in the
memaksimalkan fungsi Big Data tanpa Age of Big Data. USA: MK Publications.
mengubah fungsi utama dari monitoring media. Liu, Z., Ping, Y., Lixiao, Z., 2013. A Sketch of
Implementasi Big Data untuk mendukung Big Data Technologies. Seventh
monitoring media sebaiknya dilakukan dengan International Conference on Internet
membangun sistem sebagian, sehingga bagian Computing for Engineering and Science.
sistem yang penting seperti Corpus dapat School of Information Science and
dimiliki sendiri, serta sistem yang dibangun Technology, Shanghai Sanda University
dapat dirancang dan diawasi sesuai kebutuhan. Shanghai, China.
Opsi ini dapat mengurangi ketergantungan
pemerintah terhadap pihak lain, juga menekan

94
STUDI IMPLEMENTASI SISTEM BIG DATA UNTUK MENDUKUNG KEBIJAKAN
KOMUNIKASI DAN INFORMATIKA
Dita Kusumasari dan Onny Rafizan

Matsudaira, Kate, 2014. “The Key Skills Schmarzo, Bill, 2013. Understanding How
Needed by Big Data Engineers”. Data Powers Big Business. USA: John
http://insights.dice.com/2014/08/21/key- Wiley & Sons, Inc.
skills-needed-big-data-engineers/. Diakses
Schonberger, V.M., & Kenneth, N.C., 2013.Big
tanggal 19 Oktober 2016. Data: A Revolution that Will Transform
Morrisan, C. W., Andi, & H., Farid, 2010. How we Live, Work, And Think. New
Teori Komunikasi Massa-Media, Budaya York, USA: Houngthon Mifflin, Harcourt
dan Masyarakat. Jakarta: Ghalia Indonesia. Publishing.
Munassar, Nabil, M.A., & A., Govhardan, Sommerville, Ian, 2011. Software engineering
2010. A comparison Between Five Models 9th Edition. Boston: Addison-Wesley
Of Software engineering. IJCSI Publishing Company.
International Journal of Computer Science Statistics – Textbook, Naïve Bayes Classifier.
Issue, Vol.7, pp.95. Dell.
Paparan PT. Delapan Sebelas Indonesia tentang https://documents.software.dell.com/statist
Pamedi. 2 September 2015 ics/textbook/naive-bayes-
Prajapati, V., 2013. Big Data Analytics with R classifier#technical notes. Diakses tanggal
15 Juni 2016.
and Hadoop. Birmingham, UK: Packt
Publishing. Subiakto, Henry & Rachmad, I., 2014.
Komunikasi Politik, Media dan Demokrasi
Romney, Marshall, B. & Paul, J.S, 2005.
(Cetakan Kedua). Jakarta: Kencana
Accounting Information Systems (9th
Prenadamedia Group.
Edition). Jakarta: Salemba Empat.
T., Firat, & Keane, J.A., 2013. Big Data
Sagiroglu, Seref, & Duygu, S., 2013. Big Data:
Framework. IEEE International
A Review. IEEE International Congress on
Conference on Systems, Man, and
Big Data, Gazi University, Department of
Cybernetics. School of Computer Science,
Computer Engineering, Faculty of
The University of Manchester, UK. pp.
Engineering, pp. 42-47.
1494-1499.
Sawant, N., & Himanshu, S., 2013. Big Data
Application Architecture Q & A. New Undang-Undang Nomor 14 Tahun 2008
tentang Keterbukaan Informasi Publik.
York: Springer Science Business Media.
Zikopoulos, Paul, C., 2013. The Power of Big
Schell, R., 2013. Security – A Big Question for
Data : The IBM Big Data Platform. USA:
Big Data. IEEE International Conference
Mc Graw Hill.
on Big Data University of Southern
California, USA.

95
Jurnal Masyarakat Telematika dan Informasi
Volume: 8 No. 2 (Oktober - Desember 2017) Hal.: 81-96

96

Anda mungkin juga menyukai