Anda di halaman 1dari 20

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem


dan Aplikasi(2015) 4:2
DOI 10.1186/s13677-015-0026-8

RISET Akses terbuka

Menuju analitik data besar berbasis


cloud untuk kota masa depan yang
cerdas
1* 2 1 3
Zaheer Khan , Ashiq Anjum , Kamran Soomro dan Muhammad Atif Tahir

Abstrak
Sejumlah besar data penggunaan lahan, lingkungan, sosial-ekonomi, energi dan transportasi dihasilkan di kota-kota.
Perspektif terpadu dalam mengelola dan menganalisis data besar semacam itu dapat menjawab sejumlah pertanyaan sains,
kebijakan, perencanaan, tata kelola, dan bisnis, serta mendukung pengambilan keputusan dalam memungkinkan
lingkungan yang lebih cerdas. Makalah ini menyajikan perspektif teoretis dan eksperimental tentang kota pintar yang
berfokus pada manajemen dan analisis data besar dengan mengusulkan layanan analitik berbasis cloud. Sebuah prototipe
telah dirancang dan dikembangkan untuk menunjukkan efektivitas layanan analitik untuk analisis data besar. Prototipe telah
diimplementasikan menggunakan Hadoop dan Spark dan hasilnya dibandingkan. Layanan ini menganalisis data Bristol
Open dengan mengidentifikasi korelasi antara indikator lingkungan perkotaan yang dipilih. Eksperimen dilakukan
menggunakan Hadoop dan Spark dan hasilnya disajikan dalam makalah ini. Data yang berkaitan dengan kualitas hidup
terutama kejahatan dan keselamatan & ekonomi dan pekerjaan dianalisis dari katalog data untuk mengukur indikator yang
tersebar selama bertahun-tahun untuk menilai tren positif dan negatif.
Kata kunci:Data besar, Penambangan dan analitik data, Kota pintar, Komputasi awan
1 Fakultas Lingkungan dan Teknologi, Departemen Ilmu Komputer dan
Teknologi Kreatif, University of the West of England, Bristol, UK Daftar lengkap
informasi penulis tersedia di akhir artikel
pengantar
TIK menjadi semakin meresap ke lingkungan perkotaan
dan memberikan dasar yang diperlukan untuk
keberlanjutan dan ketahanan kota masa depan yang
cerdas. Dengan peningkatan pesat kehadiran Internet of
Things (IoT) dan internet masa depan[1,2]teknologi
dalam konteks kota pintar [3-5], sejumlah besar data
(alias data besar) dihasilkan, yang perlu dikelola dan
dianalisis dengan baik untuk berbagai aplikasi
menggunakan pendekatan TIK terstruktur dan
terintegrasi. Seringkali alat TIK untuk kota pintar
berurusan dengan domain aplikasi yang berbeda seperti
penggunaan lahan, transportasi dan energi, dan jarang
memberikan perspektif informasi terintegrasi untuk
menangani keberlanjutan dan pertumbuhan sosial
ekonomi kota. Kota pintar dapat mengambil manfaat dari
informasi tersebut dengan menggunakan pengumpulan,
pemrosesan, integrasi, dan berbagi data lintas-tema yang
besar, dan seringkali real-time, melalui layanan antar-
operasi yang disebarkan di lingkungan cloud. Namun,
pemanfaatan informasi tersebut memerlukan perangkat
lunak, layanan, dan teknologi yang sesuai untuk
mengumpulkan, menyimpan,
*Korespondensi: Zaheer2.Khan@uwe.ac.uk
terstruktur, atau terstruktur , dan iii) keandalan
data[6,7].Dalam hal ini, makalah ini memberikan
warga dan berbagai departemen dan lembaga di skala kota gambaran berorientasi data kota pintar dan menyediakan
untuk menghasilkan pengetahuan baru dan mendukung arsitektur layanan analitik berbasis cloud dan
pengambilan keputusan. implementasi untuk analisis data studi kasus yang dipilih.
Nilai sebenarnya dari data tersebut diperoleh dengan Kota pintar menyediakan domain aplikasi baru untuk
pengetahuan baru yang diperoleh dengan melakukan analitik data besar dan relatif tidak banyak pekerjaan yang
analisis data menggunakan berbagai penambangan data, dilaporkan dalam literatur. Tinjauan tentang keadaan seni
pembelajaran mesin, atau metode statistik. Namun, bidang memberikan wawasan yang sangat menjanjikan tentang
analitik data berbasis kota pintar cukup luas, kompleks, penerapan sumber daya komputasi awan untuk analitik
dan berkembang pesat. Kompleksitas dalam analitik data data kota pintar skala besar. Misalnya, Lu et al.[8]fokus
kota pintar terwujud karena berbagai masalah: i) pada penggunaan sumber daya komputasi untuk data
Persyaratan aplikasi lintas-tema misalnya energi, skala besar untuk iklim yang memiliki kompleks
transportasi, air, perkotaan, dll, dan ii) berbagai sumber
data yang menyediakan data tidak terstruktur, semi-
© 2015 Khan dkk.; pemegang lisensi Springer. Ini adalah artikel Akses Terbuka yang didistribusikan di bawah
ketentuan Lisensi Atribusi Creative Commons(http://creativecommons.org/licenses/by/4.0),yang mengizinkan penggunaan, distribusi, dan reproduksi tanpa
batas dalam media apa pun, asalkan karya aslinya dicantumkan dengan benar.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 2
dari 11
diusulkan dengan menerapkan prototipe berbasis
MapReduce untuk data terbuka Bristol dan
mendiskusikan hasil. Akhirnya, kami menyimpulkan
struktur dan format. Menggunakan kumpulan data multiskala diskusi kami dan menyajikan arah penelitian masa depan
untuk data iklim, mereka mendemonstrasikan integrasi data di Bagian“Kesimpulan dan masa depan arah”.
skala besar berbasis cloud dan pendekatan analitik di mana
mereka menggunakan alat seperti RapidMiner dan Hadoop
untuk memproses data di cloud hybrid. Antara lain, proyek
COS-MOS[9]menyediakan infrastruktur cloud on-demand
terdistribusi berdasarkan Hadoop untuk menganalisis Big Data
dari sumber media sosial. Infrastruktur memiliki kemampuan
untuk memproses jutaan titik data yang akan memakan waktu
lebih lama di komputer desktop. Ini memungkinkan ilmuwan
sosial untuk mengintegrasikan dan menganalisis data dari
berbagai sumber yang tidak dapat dioperasikan secara
transparan. Platform analisis Big Data seperti itu juga dapat
berguna untuk kota pintar karena memungkinkan pengambil
keputusan untuk mengumpulkan dan menganalisis data dari
banyak sumber secara tepat waktu. Ahuja dan Moore

[10] memberikan tinjauan mutakhir tentang teknologi


yang digunakan untuk penyimpanan, transfer, dan analisis
data besar. Qin dkk.[11]menghadirkan tantangan analitik
data besar dan mengakui kemampuan MapReduce dan
RDBMS untuk memecahkan tantangan ini. Kontribusi
utama dari pekerjaan mereka adalah bahwa mereka telah
menyediakan ekosistem analitik berbasis MapReduce dan
RDBMS terpadu untuk memanfaatkan keuntungan
komplementer dari kedua sistem. Baru-baru ini beberapa
penelitian telah menyelidiki kegunaan teknik data mining
untuk menggabungkan data dari berbagai sumber seperti
oleh Moraru dan Mladenic.[12].Mereka menerapkan
teknik Apriori, yaitu teknik data mining berbasis aturan,
untuk mempelajari aturan dari data. Meskipun mereka
dapat mengekstrak beberapa aturan dari skala kecil tetapi
mereka tidak dapat belajar banyak pada data skala besar
karena volume data yang tinggi dan memori yang terbatas
pada satu sistem.
Kami menggunakan pendekatan serupa yang didasarkan
pada MapRe-duce. Implementasi prototipe kami
menganalisis kumpulan data terbuka Bristol untuk
mengidentifikasi korelasi antara indikator lingkungan
perkotaan yang dipilih seperti Kualitas Hidup. Kami telah
mengembangkan dua implementasi menggunakan
Hadoop dan Spark untuk membandingkan kesesuaian
infrastruktur tersebut untuk analisis data terbuka Bristol.
Sisa dari makalah ini disusun sebagai berikut: bagian
selanjutnya memberikan latar belakang dan alasan dalam
konteks kota pintar. Bagian “Anarsitektur abstrak desain
analisis data besar berbasis cloud”menyediakan arsitektur
dan desain layanan analitik data untuk pemrosesan
analitik data besar untuk kota pintar. Setelah ini, kasus
penggunaan sederhana berdasarkan data terbuka Bristol
dengan mengidentifikasi kebutuhan pemrosesan informasi
dan generasi pengetahuan untuk pengambilan keputusan
disajikan di Bagian “Amenggunakan kasus: analitik
menggunakan data terbuka Bristol”.Di bagian“Proto-jenis
implementasi”kami menyajikan penerapan solusi yang
warga[16].Dengan berlalunya waktu, volume data yang
dihasilkan dari IoT ini pasti akan meningkat secara
eksponensial dan diklasifikasikan sebagai Big
TIK dan kota pintar data[17].Selain itu, kota telah memiliki data penggunaan
Sekitar 50% populasi dunia tinggal di daerah perkotaan, jumlah lahan, transportasi, sensus dan pemantauan lingkungan
yang diperkirakan akan meningkat menjadi hampir 60% pada yang dikumpulkan dari berbagai sumber lokal, seringkali
tahun 2030[13].Tingkat urbanisasi yang tinggi bahkan lebih tidak saling terhubung, dan digunakan oleh sistem khusus
terlihat di Eropa di mana saat ini lebih dari 70% orang Eropa aplikasi.
tinggal di daerah perkotaan, dengan proyeksi bahwa ini akan
meningkat menjadi hampir 80% pada tahun 2030.
[13,14].Peningkatan populasi perkotaan yang terus-menerus
membebani sumber daya kota yang terbatas, mempengaruhi
ketahanannya terhadap meningkatnya permintaan akan sumber
daya dan tata kelola kota menghadapi tantangan yang semakin
meningkat. Selanjutnya, pembangunan perkotaan yang
berkelanjutan, pertumbuhan ekonomi dan pengelolaan sumber
daya alam seperti energi dan air memerlukan perencanaan yang
lebih baik dan pengambilan keputusan bersama di tingkat lokal.
Dalam hal ini, inovasi dalam TIK dapat memberikan informasi
intelijen yang terintegrasi untuk pengelolaan dan tata kelola
perkotaan yang lebih baik, pertumbuhan sosial ekonomi yang
berkelanjutan dan pengembangan kebijakan dengan
menggunakan proses partisipatif.[15].

Kota pintar[4]menggunakan berbagai solusi TIK untuk


menghadapi tantangan perkotaan kehidupan nyata.
Beberapa tantangan tersebut termasuk kelestarian
lingkungan, inovasi sosial ekonomi, tata kelola
partisipatif, pelayanan publik yang lebih baik,
perencanaan dan pengambilan keputusan kolaboratif.
Selain menciptakan infrastruktur cerdas futuristik yang
berkelanjutan, mengatasi tantangan ini dapat
memberdayakan warga dalam hal memiliki kepentingan
pribadi dalam kesejahteraan dan perbaikan kehidupan
sipil mereka. Akibatnya, pemerintah kota dapat
memperoleh informasi dan pengetahuan baru yang
tersembunyi dalam data berskala besar untuk
menyediakan tata kelola dan pengelolaan kota yang lebih
baik dengan menerapkan solusi TIK ini. Dengan
demikian, solusi yang memungkinkan TIK
memungkinkan perencanaan transportasi yang efisien,
pengelolaan air yang lebih baik, pengelolaan limbah yang
lebih baik, strategi efisiensi energi baru, konstruksi baru
dan metode struktural untuk kesehatan bangunan dan
lingkungan yang efektif dan kebijakan manajemen risiko
bagi warga. Selain itu, aspek penting lain dari kehidupan
perkotaan seperti keamanan publik, kualitas dan polusi
udara, kesehatan masyarakat, urban sprawl dan hilangnya
keanekaragaman hayati juga dapat memperoleh manfaat
dari solusi TIK ini. TIK sebagai penggerak utama untuk
kota pintar mengubah data khusus aplikasi menjadi
informasi dan pengetahuan yang berguna yang dapat
membantu dalam perencanaan kota dan pengambilan
keputusan. Dari perspektif TIK, kemungkinan realisasi
kota pintar dimungkinkan oleh perangkat keras dan
perangkat lunak yang lebih cerdas misalnya IoT yaitu
RFID, ponsel pintar, jaring sensor, peralatan rumah
tangga pintar, dan kapasitas untuk mengelola dan
memproses data skala besar menggunakan komputasi
awan tanpa mengorbankan keamanan data dan privasi
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 3
dari 11

tetapi jarang digunakan sebagai sumber informasi kolektif untuk mensintesis informasi yang dibutuhkan yang dapat
(yaitu sistem sistem[18])untuk tata kelola kota dan membantu dalam meningkatkan ketahanan dan keberlanjutan
keputusan perencanaan. Banyak pemerintah daerah kota. Mengelola data untuk domain tematik ini di lingkungan
membuat data tersebut tersedia untuk penggunaan publik Cloud memberikan peluang untuk mengintegrasikan data yang
sebagai “data terbuka”[19].Mengelola sejumlah besar data diperoleh dari berbagai sumber, memproses, dan
dan menganalisis untuk berbagai aplikasi misalnya model menganalisisnya dalam kerangka waktu yang dapat diterima.
kota masa depan, visualisasi, simulasi, penyediaan Namun, tidak mudah untuk mengadopsi komputasi awan untuk
layanan publik yang berkualitas dan informasi kepada menangani aplikasi kota pintar karena sejumlah tantangan dan
warga dan pengambilan keputusan menjadi tantangan persyaratan[20].Tujuan kami di sini adalah untuk membahas
tanpa mengembangkan dan menerapkan alat dan teknik perspektif tentang bagaimana tantangan ini dapat diatasi
yang tepat. sebagian dengan menggunakan alat TIK dan layanan perangkat
Dalam konteks di atas, kemunculan Cloud com-puting baru- lunak untuk secara cerdas mengelola dan menganalisis data
baru ini menjanjikan solusi untuk tantangan tersebut dengan besar yang kompleks dari kota pintar, dengan menggabungkan
memfasilitasi penyimpanan data besar dan memberikan arsitektur Cloud yang sesuai.[4,15,21].
kapasitas untuk memproses, memvisualisasikan, dan
menganalisis data kota untuk menghasilkan informasi dan
pengetahuan. Solusi tersebut juga dapat memfasilitasi pengambil Desain arsitektur abstrak dari analisis data
keputusan dalam memenuhi persyaratan QoS dengan besar berbasis cloud
menyediakan pemrosesan informasi yang terintegrasi dan Bagian ini membahas pengembangan layanan cloud untuk
infrastruktur analitik untuk berbagai aplikasi kota pintar untuk analisis big data terkait kota pintar. Pertama, kami
mendukung pengambilan keputusan untuk tata kelola kota. menjelaskan desain dan implementasi Layanan Analytics
Angka1menggambarkan pandangan kami tentang pilar berbasis Cloud generik. Kami kemudian membahas
tematik utama kota pintar: masyarakat cerdas, ekonomi proses yang digunakan untuk mengeksploitasi layanan ini
cerdas, lingkungan cerdas, tata kelola cerdas, dan untuk menganalisis data Bristol Open. Prinsip desain
mobilitas cerdas yang berkontribusi terhadap panduan kami untuk layanan analitik berbasis Cloud
keberlanjutan sumber daya dan ketahanan terhadap adalah menggunakan kembali alat dan teknik yang sudah
peningkatan tuntutan perkotaan. Motif utama untuk ada dan telah teruji dengan baik.
mengembangkan pandangan seperti itu adalah untuk Arsitektur sistem, seperti yang ditunjukkan pada Gambar 2,
mempertimbangkan pendekatan holistik untuk kota pintar dibagi menjadi tiga tingkatan untuk memungkinkan
dengan menyediakan akuisisi data, integrasi, pemrosesan, pengembangan basis pengetahuan terpadu. Setiap lapisan
dan mekanisme analisis. mewakili potensi
Gambar 1 Manajemen dan analisis data lintas tematik untuk berbagai aplikasi kota pintar di lingkungan Cloud.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 4
dari 11

Gambar 2 Rancangan arsitektur yang diusulkan.


daya, tautan dibuat dan data dibuat relevan secara
semantik dan dapat dijelajahi. Penjelajahan data ini dapat
membantu pengguna akhir untuk memilih indikator dan
fungsionalitas yang kita butuhkan untuk memenuhi tujuan
variabel lintas tematik yang berbeda untuk melakukan
penelitian secara keseluruhan. Lapisan terendah dalam
analisis. Format metadata yang ada (seperti Model Data
arsitektur terdiri dari repositori terdistribusi dan heterogen
Eropa, Talis Aspire, the
dan berbagai sensor yang berlangganan ke sistem. Tujuan
dari lapisan ini adalah akuisisi data, pembersihan dan
klasifikasi menggunakan pendekatan standar seperti API
atau layanan web yang sesuai dengan OGC (Open
Geospatial Consortium). Alat yang ada seperti
sebuah b
TheDataTank dan CKAN untuk akses data,
transformasi dan penerbitan (misalnya XML, CSV, JSON
atau struktur biner seperti file SHP atau database
relasional) dengan cara yang RESTful dapat digunakan.
Untuk penyimpanan data Cassandra (tidak/semi-
terstruktur - tanpa SQL), PostgreSQL (data terstruktur
relasional) dan penyimpanan Virtuoso RDF dipilih.
Namun, desain detail dan tipe prototipe dari dua tingkat
terbawah tidak termasuk dalam cakupan makalah ini dan
sebagian tercakup dalam[22]dan istirahat adalah
pekerjaan yang sedang berlangsung.

Pemetaan data sumber daya dan lapisan penautan


(lapisan tengah) menemukan skenario baru dan
mendukung alur kerja untuk mengembangkan hubungan
yang tidak mungkin dilakukan di repositori data yang
terisolasi. Namun ada kemungkinan bahwa data yang
dikumpulkan akan berada dalam sejumlah format dan
semantik yang berbeda karena sumber data yang
heterogen dan karenanya dapat mengambil manfaat dari
penautan data. Misalnya, data tertaut atau data
terbuka[23,24]di mana basis data dapat dijelajahi untuk
melayani kueri dan menemukan peristiwa menarik yang
tidak mungkin dilakukan tanpa ketersediaan data yang
ditautkan. Selanjutnya, model data semantik dapat
dikembangkan sebagai lapisan di atas data yang ditautkan
untuk memahami segalanya. Setelah meta-data dari
sumber data yang heterogen telah diisi ke dalam
penyimpanan meta-data, pemetaan dibuat antara sumber
Perpustakaan Terbuka dan DBLP sebagai Data Tertaut)
adalah pilihan yang lebih baik untuk menggambarkan dan
menyimpan meta -data yang diekstraksi dari sumber yang
berbeda. Data tersebut kemudian dipetakan menggunakan
semantik deskripsi sumber daya standar, misalnya melalui
penyimpanan RDF (misalnya Virtuoso DB) yang
memiliki semua hubungan yang diperlukan antara artefak
dan sumber daya. Dalam hal layanan tertaut, layanan
tingkat tinggi dan mashup dapat disusun untuk menelusuri
dan menggunakan data ini untuk skenario yang menarik.
SPARQL, bahasa kueri RDF, kemudian dapat digunakan
untuk mengambil dan memanipulasi data yang disimpan
dalam format Kerangka Deskripsi Sumber Daya.
Mesin analitik di lapisan atas memproses data untuk
tujuan khusus aplikasi. Mesin menggunakan data yang
tersedia di lapisan data tertaut dan membantu pengguna
dalam mengirimkan kueri, algoritme khusus aplikasi, dan
alur kerja untuk menemukan informasi dari penyimpanan
data. Dalam hal ini, Big Data Mining baru-baru ini
menjadi tren baru yang digunakan untuk mengidentifikasi
kumpulan data besar karena kompleksitas, kardinalitas,
dan kontinuitas.[25,26].Teknik Big Data Mining semakin
menjadi cara yang penting dan efektif dalam berbagai
aplikasi berbasis data seperti analisis risiko lalu lintas
jaringan, analisis data bisnis, dll. Teknik ini akan sangat
berguna untuk menghasilkan hubungan dan asosiasi yang
tidak jelas dari data besar yang tersedia dari layanan
publik kota masa depan yang cerdas.
Karena fokus utama dari makalah ini adalah analitik data kota
pintar, kami terutama akan fokus pada mesin analitik dan
menjelaskan secara rinci. Untuk mesin analitik, berbagai
pemodelan statistik, pembelajaran mesin, dan teknik
penambangan data dapat diterapkan. Juga, alat yang ada seperti
RapidMiner dan R dalam kombinasi dengan Hadoop
MapReduce[8]dapat digunakan untuk menambang data kota
dalam skala besar. Dalam literatur, penambangan data besar
dianggap jauh lebih dan kompleks daripada penambangan data
tradisional yang saat ini dipraktikkan[27].Hal ini berlaku untuk
analitik data kota pintar karena sifat multi-disiplin data kota
dapat membantu dalam merumuskan berbagai kota
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 5
dari 11

skenario aplikasi. Berkaitan dengan hal tersebut, beberapa data lain yang tidak dipublikasikan sebagai data terbuka
kemungkinan komponen untuk big data mining atau sehingga data yang tersedia melalui portal data terbuka
analisis berbasis cloud dapat berupa pemrosesan/integrasi mungkin tidak memenuhi semua kriteria Big Data, yaitu
data, klasifikasi, cluster-ing, reduksi data, visualisasi, dan volume, kecepatan, variasi, dan kebenaran.[29].
menemukan aturan asosiasi seperti yang digambarkan Mempertimbangkan data terbuka Bristol sebagai contoh
pada Gambar 3. Tidak perlu menggunakan semua skenario, data mencakup skala geospasial yang berbeda seperti
komponen ini. Tergantung pada aplikasinya, subset LSOA01 (Lower Layer Super Output Area), Ward, Neighbour-
komponen mungkin diperlukan untuk analisis data. hood atau skala kota. Data dikumpulkan dari berbagai sumber
Misalnya, untuk kasus penggunaan data terbuka, termasuk lembaga lokal (misalnya kelahiran, kematian,
algoritma hanya dari dua komponen yaitu pemrosesan kecelakaan, kejahatan, konsumsi energi, kualitas udara,
data dan aturan asosiasi pencarian diperlukan. Semua kebisingan dll), Kantor Statistik Nasional (misalnya sensus
komponen ini adalah komponen terkenal dalam penduduk) dan/atau persepsi warga (misalnya survei tentang
penambangan data[28].Selain itu, komponen ini dapat kualitas kehidupan, daya tarik ruang publik), dll. Menggunakan
memanfaatkan alat canggih seperti Apache Mahout dan R dataset terbuka Bristol, skenario analitik sederhana dapat
untuk pembelajaran mesin skalabel berbasis cluster. menunjukkan korespondensi antara variabel yang berbeda
seperti kesehatan dan kesejahteraan, kematian, kualitas udara,
Kasus penggunaan: analitik menggunakan kualitas hidup, harga rumah, pendapatan rumah tangga dan
data terbuka Bristol peristiwa kejahatan untuk melakukan analisis komparatif antara
Bagian ini menjelaskan Data Terbuka Bristol dan lingkungan yang berbeda di kota untuk memprediksi dan
bagaimana data tersebut digunakan untuk menetapkan peringkat prioritas tentang daerah yang lebih layak
mengidentifikasi korelasi antara indikator perkotaan yang huni di Bristol di masa depan. Informasi tersebut dapat berguna
berbeda. Kota biasanya menyimpan data tentang bagi pemangku kepentingan lokal untuk mendapatkan kesadaran
penggunaan lahan, kualitas hidup, kesehatan dan tentang lokalitas mereka dan administrasi lokal untuk
kesejahteraan, populasi, ekonomi dan pekerjaan, merencanakan tindakan yang tepat untuk menghindari
pendidikan, infrastruktur transportasi, konsumsi energi, kesenjangan sosial ekonomi dan digital di kota.
perumahan dan bangunan, iklim atau lingkungan lokal
(infrastruktur hijau, kualitas udara dan kebisingan). ) dll.
Dengan inisiatif data terbuka, banyak data semacam itu Analisis dataset terbuka Bristol menunjukkan bahwa ada
tersedia bagi warga negara dan pemangku kepentingan banyak kemungkinan untuk pengembangan solusi cerdas.
lainnya untuk dieksploitasi. Dari perspektif perencanaan, Ketersediaan data historis berbeda-beda untuk setiap indikator
data tersebut mungkin memiliki pola informasi yang dapat tiap tahun misalnya data Sensus dan Penduduk yang ada tiap
digunakan untuk analisis prediktif untuk menentukan tahun antara 2001 sampai 2012 dibandingkan dengan Quality of
indikator pembangunan baru dan mensimulasikan
Life: kriminalitas dan keamanan antara tahun 2005 sampai 2013.
skenario masa depan untuk mendukung pengambilan
Untuk masing-masing indikator terdapat jumlah vari -ables atau
c
keputusan. Misalnya, Portal Data Terbuka Wina dan pertanyaan yaitu rata-rata kira-kira. 20 dan tidak semua variabel
d ini memiliki ketersediaan data yang konsisten untuk semua
Portal Data Terbuka Bristol adalah dua contoh yang
sesuai yang menyediakan data terbuka melalui antarmuka tahun tertentu. Sebagian besar data dalam bentuk agregat
layanan web OGC seperti WFS dan WMS (dalam format statistik untuk berbagai tingkat skala geografis. di satu
yang berbeda misalnya tabel JSON, CSV dan MS Excel).
Namun, kota juga memiliki sejumlah besar
Gambar 3 Komponen analitik data besar untuk mesin analitik.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 6
dari 11

bentuk agregat data membantu dalam menghindari masalah Arsitektur aplikasi prototipe
privasi tetapi di sisi lain mengurangi volume keseluruhan data. Untuk mendemonstrasikan penerapan dunia nyata dari
Situasi ini bervariasi dari portal data terbuka satu kota ke kota arsitektur analisis data besar yang diusulkan, aplikasi
lainnya. Namun demikian, data ini dapat dianalisis prototipe dasar (terutama mesin analitik) menggunakan
menggunakan infrastruktur pemrosesan berbasis cloud yang MapReduce
sesuai untuk menunjukkan korelasi statistik tentang berbagai [11] ditunjukkan pada Gambar4dikembangkan
indikator misalnya kesehatan, pekerjaan, dan persepsi warga menggunakan Hadoop dan Spark. Kuesioner survei yang
tentang indikator yang dipilih seperti kualitas hidup, seperti digunakan oleh Dewan Kota Bristol memberikan indikasi
yang ditunjukkan di Bagian“Implementasi prototipe”. tentang apa yang dipikirkan warga tentang berbagai
indikator. Namun, tidak ada ukuran implisit yang dapat
diukur dari berbagai indikator. Ukuran terukur semacam
Implementasi prototipe itu dapat membantu para pengambil keputusan saat
Untuk implementasi prototipe dipilih data Quality of Life (QoL)
menganalisis Kualitas Hidup di Bristol. Misalnya,
yang memiliki sejumlah indikator untuk mengukur QoL seperti perencana dapat menggunakan ukuran kuantitatif untuk
Crime and Safety, Culture and Leisure, Economy and indikator yang tersebar selama bertahun-tahun untuk
Employment dll. Setiap indikator diukur melalui kuesioner yang menilai tren atau efek positif atau negatif dari kebijakan
dirancang untuk mendapatkan warga negara ' pendapat tentang tertentu. Selain itu, mereka juga dapat menemukan
indikator yang relevan untuk wilayah mereka. Dataset yang korelasi statistik antara berbagai indikator untuk
tersedia berisi nilai agregat untuk tanggapan kuesioner selama menentukan apakah, dan sejauh mana, satu indikator
beberapa tahun seperti yang ditunjukkan pada Gambar 4. memengaruhi indikator lainnya. Namun, karena ada
Ukuran data adalah sekitar 0,7 MB. sejumlah pertanyaan untuk setiap indikator, dan setiap
indikator diukur secara terpisah untuk setiap unit
geografis, ukuran data menjadi signifikan.
Gambar 4 Prototipe arsitektur aplikasi.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 7
dari 11

Kejahatan dan Keamanan terdiri dari sekitar 20 Pengaturan dan hasil eksperimental
pertanyaan. Selain itu, setiap pertanyaan diajukan untuk Setup eksperimental ditunjukkan pada Gambar 5. Untuk
sekitar 40 distrik Bristol yang membuat total 800 tujuan data prototipe ini berkaitan dengan Kejahatan dan
pertanyaan. Karena ada tanggapan selama 8 tahun total Keselamatan dan Ekonomi dan Ketenagakerjaan dipilih
untuk 2 indikator, jumlah pertanyaan menjadi 12.800 dari katalog data Bristol Open. Untuk setiap indikator,
(800x2x8). data tersedia selama 8 tahun dari 2005 hingga 2012.
Untuk menghitung ukuran kuantitatif yang disebutkan Setiap survei sumber data dilakukan di 40 kelurahan
di atas, kami mengusulkan organisasi hierarkis dari data Bristol dan kuesioner terdiri dari hingga 20 pertanyaan.
terbuka Bristol yang tersedia. Untuk setiap indikator, Data terdiri dari jumlah orang yang menjawab ya untuk
kami mengkategorikan data berdasarkan tahun selama berbagai pertanyaan. Infrastruktur cloud yang digunakan
prapemrosesan untuk memfasilitasi paralelisasi oleh terdiri dari dua node komputasi dan data masing-masing
kerangka kerja MapReduce. Untuk setiap tahun data dengan RAM 2 GB dan prosesor single-core. Kedua node
tersedia, tanggapan kuesioner sudah dikategorikan oleh berjalan di mesin virtual yang dikelola oleh VMWare
bangsal. Dalam aplikasi berbasis MapReduce, data dibagi Workstation 10. Mesin virtual dihosting di server Dell
secara otomatis oleh kerangka Hadoop dan ditugaskan ke PowerEdge R415 dengan prosesor hexa-core AMD
unit pekerja yang disebut Pemeta dalam langkah yang Opteron 4332 HE dan RAM 64GB. Infrastruktur Hadoop
disebut Pemetaan. Pemetaan melakukan tugas terprogram terdiri dari YARN 2.3. 0 bersama dengan HDFS 2.3.0.
mereka, dan data yang dihasilkan sebagai hasilnya Untuk Spark versi 1.1.0 digunakan.
diserahkan kepada Pereduksi setelah beberapa Seperti disebutkan sebelumnya, data diparalelkan di
pengocokan dan penyortiran. Pereduksi kemudian tingkat lingkungan. Artinya, data untuk setiap lingkungan
bertanggung jawab untuk memproses lebih lanjut data ditugaskan ke pembuat peta individu untuk menghitung
menjadi informasi yang berarti. Dalam pengaturan ini, indeks keseluruhan berdasarkan tanggapan. Ini
Untuk aplikasi ini, data untuk setiap lingkungan menghasilkan total 640 pembuat peta yang dibagi antara
ditugaskan ke masing-masing Pemeta untuk diproses; dua pekerjaan MapReduce. Keluaran dari pembuat peta
menghitung nilai indikator untuk lingkungan tersebut terdiri dari indeks pengukuran untuk berbagai bangsal
untuk tahun tertentu berdasarkan tanggapan kuesioner. untuk tahun-tahun individu. Indeks pengukuran dihitung
Setelah nilai berbasis lingkungan dihitung, nilai tersebut dengan rata-rata jumlah tanggapan positif untuk setiap
diteruskan ke Reducer. Dalam langkah ini, nilai-nilai pertanyaan untuk setiap lingkungan. Pereduksi kemudian
berbasis lingkungan digabungkan menjadi satu nilai bertanggung jawab untuk menggabungkan indeks untuk
keseluruhan untuk tahun itu. Dengan cara ini, pengukuran setiap tahun ke dalam indeks tahunan. Hasil akhir terdiri
tahunan untuk berbagai indikator diperoleh. Selain itu, dari dua set yang masing-masing terdiri dari delapan nilai;
nilai sekarang dapat digunakan untuk menetapkan tren satu untuk setiap tahun untuk setiap indikator. Hasil
untuk berbagai indikator dari waktu ke waktu. Ini pada implementasi Spark dan Hadoop dibahas selanjutnya.
gilirannya memungkinkan kami untuk menghitung
korelasi di antara mereka. Seluruh fase pemetaan dan
pengurangan dapat dianggap sebagai pra-pemrosesan data Implementasi Hadoop
dalam hal arsitektur yang diusulkan sedangkan Untuk implementasi ini, total 384 mapper dan 3 reducer
perhitungan korelasi dapat dianggap sebagai komponen telah dibuat. Setiap pekerjaan membutuhkan waktu sekitar
penambangan data. 15 detik untuk dieksekusi. Percobaan dilakukan

Gambar 5 Pengaturan eksperimental.


Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 8
dari 11
Menghitun
g Eksekusi Per tugas Eksekusi total
waktu
simpul mode pelaksanaan waktu
Tabel 1 Hasil Implementasi Hadoop
1 lokal ∼0,03 detik ∼6 detik
Menghitun
g Eksekusi Per tugas Eksekusi total 3 gugus ∼0,6 detik ∼40 detik
waktu
simpul mode pelaksanaan waktu

1 lokal ∼0,01 detik ∼5 detik


1 gugus ∼15 detik ∼25 menit
3 gugus ∼15 detik ∼12 menit

menggunakan tiga konfigurasi yang berbeda. Konfigurasi


dan waktu eksekusi yang sesuai ditunjukkan pada Tabel
1.
Dalam mode lokal, pekerjaan dijalankan pada mesin
lokal tanpa menghubungi Hadoop ResourceManager.
Dalam mode cluster, pekerjaan dikirimkan ke
ResourceMan-ager yang kemudian bertanggung jawab
untuk menjadwalkannya ke node komputasi yang
tersedia. Jelas dari hasil bahwa Hadoop mengeluarkan
overhead yang signifikan ketika pekerjaan dieksekusi di
cluster melalui ResourceManager.
Implementasi percikan
Untuk implementasi ini, pengaturan serupa digunakan.
Konfigurasi yang digunakan ditunjukkan pada Tabel 2.
Dibandingkan dengan Hadoop, Spark mengeluarkan
biaya overhead yang jauh lebih sedikit saat mengirimkan
pekerjaan di cluster. Ini mungkin karena operasi akses
data yang murah. Oleh karena itu, Spark terbukti lebih
sesuai untuk kumpulan data terbuka Bristol yang dipilih.
Hasil aplikasi
Bagian ini menyajikan hasil analisis dari sudut pandang
aplikasi dan menggambarkan bagaimana mereka dapat
bermanfaat bagi perencana kota. Indeks yang diperoleh
dari percobaan diplot pada Gambar 6.
Gambar tersebut menunjukkan variasi tanggapan warga
selama bertahun-tahun untuk kedua indikator tersebut.
Hasil penelitian menunjukkan bahwa antara tahun 2005
dan 2012, persetujuan publik atas peluang ekonomi dan
pekerjaan menurun dengan peningkatan pada tahun 2012.
Di sisi lain, persetujuan publik terhadap situasi kejahatan
dan keselamatan meningkat pada tahun 2007 tetapi
menurun kembali pada tahun-tahun berikutnya. Karena
kami memiliki data seperti itu yang tersedia untuk
masing-masing lingkungan, kami juga dapat menghitung
tren tersebut untuk setiap lingkungan. Perlu dicatat bahwa
kuesioner berkembang selama bertahun-tahun sehingga
panjang dan jenis pertanyaannya bervariasi dari tahun ke
tahun. Oleh karena itu, indeks keseluruhan hanyalah nilai
rata-rata dari tanggapan positif untuk setiap pertanyaan
yang tersedia.

Tabel 2 Hasil implementasi Spark


Untuk tujuan demonstrasi set sampel kecil digunakan
untuk studi kasus ini. Umumnya, data tersebut mencakup
ratusan indikator dan dalam jumlah besar. Oleh karena
Korelasi Pearson yang dihitung antara kedua indikator itu, diskusi tentang skalabilitas pendekatan ini diperlukan.
berdasarkan data yang tersedia adalah 0,2305[30].Ini Mengingat struktur dataset yang digunakan, ada beberapa
adalah ukuran paling umum dari korelasi statistik antara kemungkinan skenario ekspansi. Kemungkinan berikut,
dua kumpulan data. Nilai ukuran ini selalu antara 1 dan - dalam urutan hierarki yang ada, ada:
1. 1 menunjukkan korelasi yang kuat, 0 menunjukkan
tidak ada korelasi, dan -1 menunjukkan korelasi negatif 1. Jumlah indikator mungkin meningkat. Juga, jumlah
yang kuat. Nilai 0,2305 menunjukkan bahwa terdapat tahun pengumpulan data mungkin meningkat.
korelasi yang lemah antara kedua indikator yang 2. Jumlah kelurahan mungkin bertambah (mis. kota-
dimaksud. Nilai positif menunjukkan bahwa peningkatan kota besar). Juga, jumlah pertanyaan yang diajukan untuk
ekonomi dan kesempatan kerja meningkatkan situasi setiap lingkungan mungkin meningkat.
kejahatan dan keamanan di kota sampai batas tertentu. 3. Jumlah sumber data mungkin bertambah.
Hubungan sebab akibat juga dapat dibangun secara Masing-masing kemungkinan ini dibahas di bawah ini:
intuitif antara dua indikator. Korelasi ini dapat diverifikasi
secara visual melalui Gambar 6. Meskipun tren secara Jika jumlah indikator atau tahun
keseluruhan mengikuti satu sama lain, masih ada contoh bertambah:kumpulan data Bristol Open terdiri dari
di mana korelasinya lemah. Misalnya, dari tahun 2005 lebih dari 10 indikator secara total. Oleh karena itu,
hingga 2006 terjadi penurunan tajam dalam kesempatan meskipun hanya 2 yang digunakan dalam
ekonomi dan lapangan kerja. Namun, situasi kejahatan eksperimen yang ditampilkan dalam makalah ini,
dan keamanan sedikit membaik. Kemudian dari tahun aplikasi dunia nyata kemungkinan akan terdiri dari
2008 hingga 2009, peluang ekonomi dan kesempatan lebih banyak. Selain itu, karena semakin banyak
kerja tidak berbeda secara signifikan. Namun, ada sedikit data yang dikumpulkan,
penurunan dalam situasi kejahatan dan keamanan.
Perbedaan kecil dalam tren ini mengarah pada korelasi
yang lemah secara keseluruhan. Namun, kehati-hatian
harus dilakukan saat menarik kesimpulan karena
kumpulan sampel terlalu kecil untuk valid secara statistik.
Karena tujuan dari prototipe ini adalah untuk
mendemonstrasikan bagaimana infrastruktur cloud dapat
digunakan untuk menganalisis kumpulan data besar,
diskusi tentang skalabilitas aplikasi menjadi relevan di
sini. Ini disajikan di bagian berikutnya. ada sedikit
penurunan dalam situasi kejahatan dan keamanan.
Perbedaan kecil dalam tren ini mengarah pada korelasi
yang lemah secara keseluruhan. Namun, kehati-hatian
harus dilakukan saat menarik kesimpulan karena
kumpulan sampel terlalu kecil untuk valid secara statistik.
Karena tujuan dari prototipe ini adalah untuk
mendemonstrasikan bagaimana infrastruktur cloud dapat
digunakan untuk menganalisis kumpulan data besar,
diskusi tentang skalabilitas aplikasi menjadi relevan di
sini. Ini disajikan di bagian berikutnya. ada sedikit
penurunan dalam situasi kejahatan dan keamanan.
Perbedaan kecil dalam tren ini mengarah pada korelasi
yang lemah secara keseluruhan. Namun, kehati-hatian
harus dilakukan saat menarik kesimpulan karena
kumpulan sampel terlalu kecil untuk valid secara statistik.
Karena tujuan dari prototipe ini adalah untuk
mendemonstrasikan bagaimana infrastruktur cloud dapat
digunakan untuk menganalisis kumpulan data besar,
diskusi tentang skalabilitas aplikasi menjadi relevan di
sini. Ini disajikan di bagian berikutnya. diskusi tentang
skalabilitas aplikasi relevan di sini. Ini disajikan di bagian
berikutnya. diskusi tentang skalabilitas aplikasi relevan di
sini. Ini disajikan di bagian berikutnya.

Menskalakan aplikasi
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 9
dari 11

Gambar 6 Persepsi warga tentang kejahatan dan keamanan vs ekonomi dan pekerjaan.
kumpulan data statistik kejahatan tersedia dari
g
Kepolisian Inggris situs web akan diperlukan yaitu
jumlah tahun itu tersedia untuk juga akan 4,51 GB.
meningkat. Jika jumlah indikator atau jumlah tahun
bertambah, satu-satunya hal yang diperlukan adalah
menciptakan lebih banyak pekerjaan MapReduce.
Aplikasi akan secara otomatis menskalakan setelah
itu. Misalnya, saat ini untuk Keselamatan dan
Kejahatan, data tersedia selama 9 tahun dari 2005
hingga 2013 dan setiap tahun kumpulan data ini
akan bertambah.
Jika jumlah lingkungan atau jumlah pertanyaan
yang diajukan untuk setiap lingkungan
meningkat:karena data untuk setiap ward ditetapkan
ke masing-masing Mapper, peningkatan jumlah
ward juga berarti peningkatan jumlah Mapper yang
dibuat. Sekali lagi, ini akan ditangani secara
otomatis oleh aplikasi. Oleh karena itu, aplikasi juga
akan diskalakan secara otomatis dan tidak
diperlukan perubahan. Hal ini dimungkinkan,
misalnya jika data untuk kota besar seperti London
sedang dianalisis, yang memiliki 624 kelurahan
dibandingkan dengan Bristol 40. Juga, untuk analisis
wilayah kota di mana data dari kelurahan di kota dan
wilayah metropolitan perlu dianalisis misalnya urban
sprawl dan transportasi (misalnya komuter harian)
untuk menentukan penilaian dampak lingkungan,
misalnya emisi CO2.
Jika jumlah sumber data bertambah:sumber data
tambahan dapat dipertimbangkan untuk menghitung
indeks untuk berbagai indikator. Sumber data
tambahan tersebut dapat berupa Kantor Statistik
e
Nasional Inggris, OpenStreetMap atau Buka Portal
f
Data . Selain itu, Portal Data Terbuka Bristol berisi
statistik tanggapan terhadap survei berbasis kuesioner
yang dilakukan oleh Dewan Kota Bristol. Statistik
inilah yang digunakan dalam percobaan ini. Namun,
orang mungkin juga ingin membandingkan persepsi
kejahatan dengan kenyataan. Untuk tujuan ini,
Kemungkinan lain dapat menambahkan informasi
semantik yang menunjukkan bobot relatif dari setiap
pertanyaan serta faktor tambahan yang berkontribusi
terhadap penghitungan indeks. Dalam kedua kasus
ini, sifat aplikasi prototipe tidak perlu diubah.
Namun, ini mungkin tidak benar untuk semua jenis
sumber data.
Bagian selanjutnya menyimpulkan makalah ini.

Kesimpulan dan arah masa depan


Kota pintar memberikan kesempatan untuk
menghubungkan orang dan tempat menggunakan
teknologi inovatif yang membantu dalam perencanaan
dan pengelolaan kota yang lebih baik. Inti dari kota pintar
adalah pengumpulan, pengelolaan, analisis, dan
visualisasi sejumlah besar data yang dihasilkan setiap
menit di lingkungan perkotaan karena peristiwa sosial
ekonomi, antropogenik atau lingkungan alami atau
aktivitas lainnya. Data kota pintar dapat dikumpulkan
langsung dari berbagai sensor, ponsel pintar, warga dan
terintegrasi (atau terhubung) dengan penyimpanan data
kota untuk melakukan penalaran analitik dan
menghasilkan informasi yang diperlukan (misalnya untuk
pengguna akhir) atau pengetahuan baru untuk
pengambilan keputusan bagi tata kota yang lebih baik.
Dalam makalah ini kami membahas analitik data besar
berbasis cloud untuk kota masa depan yang cerdas.
Beberapa pertimbangan perlu direncanakan dengan hati-
hati seperti pengumpulan data, persiapan, penautan
semantik dan penggunaan penambangan data yang sesuai,
pembelajaran mesin atau teknik analisis statistik. Selain
itu, karena sifat multidisiplin domain aplikasi kota pintar,
keterlibatan dengan pakar domain diperlukan untuk
mengidentifikasi hubungan dan ketergantungan dasar
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 10
dari 11
mencapai dari beberapa ratus Mega byte hingga 10-an
Giga byte. Misalnya, kumpulan data insiden kejahatan
saja terdiri dari 800.000+ catatan mulai dari awal 2003
antara elemen data yang berbeda. Arsitektur yang dan diperbarui setiap hari. Ukuran dataset sudah 300+
diusulkan menyediakan komponen dasar untuk MB sejak revisi makalah ini. Pendekatan yang dibahas
membangun fungsionalitas yang diperlukan untuk dalam makalah ini dapat diterapkan pada data yang lebih
layanan analitik data besar berbasis cloud untuk data kota besar dengan mengelompokkan kumpulan data tahunan.
pintar. Sebagai bukti konsep, kami telah mengembangkan
prototipe menggunakan MapReduce yang menunjukkan
bagaimana infrastruktur cloud dapat digunakan untuk
menganalisis kumpulan sampel Bristol Open Data.
Protype telah diimplementasikan menggunakan Hadoop
dan Spark dan hasilnya dibandingkan. Hasil menunjukkan
bahwa Hadoop menimbulkan overhead yang signifikan
ketika pekerjaan dikirimkan ke cluster, kemungkinan
karena operasi akses data yang mahal. Secara komparatif,
Spark jauh lebih cepat dan menimbulkan biaya overhead
yang jauh lebih sedikit. Oleh karena itu, Spark lebih
sesuai untuk dataset terbuka Bristol yang dipilih.
Secara teknis kumpulan data yang dapat diakses melalui
portal Bristol Open Data tidak sepenuhnya merupakan
Big Data karena bentuk agregatnya. Namun, bukti konsep
menunjukkan bagaimana infrastruktur komputasi tersebut
dapat diterapkan pada solusi Big Data. Berdasarkan hasil
eksperimen, kami membahas kesesuaian sifat elastis dari
sumber daya cloud untuk memenuhi permintaan
kebutuhan analitik data kota pintar. Implementasi
prototipe menunjukkan kegunaan infrastruktur berbasis
cloud untuk analitik data kota pintar.
Pada aplikasi prototipe, alasan penggunaan open data
adalah karena sebagian besar data administrasi kota tidak
tersedia dalam domain publik. Di satu sisi, beberapa kota
menggabungkan data harian ke dalam beberapa bulan
(bahkan bertahun-tahun) dan menerbitkannya, yang
sangat mengurangi ukuran/volume keseluruhan data
tersebut. Dimensi keseluruhan tinggi tetapi data agregat
tersebut kurang dalam mendapatkan koordinat
geografis/lokasi yang lebih spesifik. Hal ini menghasilkan
perlindungan privasi dan pengelolaan data semacam itu
dengan mudah, tetapi menyediakan kumpulan sampel
yang sangat kecil untuk mendapatkan wawasan yang
lebih mendetail dan mengidentifikasi korelasi yang lebih
tepat antara elemen data. Namun demikian, dari waktu ke
waktu data tersebut cenderung tumbuh tetapi mungkin
tidak sedetail dan sebesar yang terjadi di kota-kota besar
lainnya. Portal data terbuka Bristol memiliki kumpulan
data agregat yang terdiri dari beberapa ratus K byte
hingga Mega byte.
Berbeda dengan penerbitan data agregat di atas,
beberapa kota cenderung berbagi data yang lebih rinci
dengan pembaruan yang sering (yaitu kecepatan) setiap
hari. Data rinci seperti itu besar dalam ukuran maupun
dimensi (yaitu variasi). Ini dapat digunakan untuk
mendapatkan wawasan yang lebih rinci untuk
mendapatkan analisis prediktif. Misalnya, portal data
h
terbuka San Francisco memiliki kumpulan data terbuka
seperti itu dengan catatan dalam jutaan dan ukuran data
Komputer dan Teknologi Digital, Universitas Northumbria, NE1 8ST,
Newcastle upon Tyne, Inggris Raya.

Diterima: 1 September 2014 Diterima: 7 Januari 2015


Pekerjaan penelitian kami di masa depan adalah untuk
menskalakan infrastruktur teknis untuk mengidentifikasi
korelasi antara indikator lain dalam data terbuka yang
tersedia dan menyelidiki bagaimana sumber semantik
seperti penyimpanan RDF dapat digunakan dalam
kumpulan data Terbuka. Tujuan dari upaya ini adalah
untuk mengidentifikasi implikasi dan keterbatasan teknis
dan menyarankan solusi yang layak.

Catatan akhir
a Tangki Data: Dapat diakses dari URL:https://github.
com/tdt/[Terakhir Diakses: 28 Januari 2015].
b
Platform portal data sumber terbuka CKAN: URL yang
dapat diakses:http://ckan.org/[Terakhir Diakses: 28 Januari
c
2015]. Katalog Data Terbuka Wina: Dapat diakses dari
URL:https://open.wien.at/site/datenkatalog/[Terakhir
diakses:
28 Januari 2015].
d
Portal Data Terbuka Bristol: Dapat diakses dari
URL:http://profiles.bristol.gov.uk/[Terakhir Diakses: 28
Januari 2015].
e
OpenStreetMap: Dapat diakses dari
URL:http://www. openstreetmap.org/#map=5/54.910/-
3.432[Terakhir Diakses: 28 Januari 2015].
f
Portal Data Terbuka Inggris: Dapat diakses dari
URL:http:// data.gov.uk/[Terakhir Diakses: 28 Januari
2015].
g
Kejahatan dan Pemolisian Inggris, Wales dan NI,
Data Kejahatan: Dapat diakses dari
URL:http://www.police.uk[Terakhir Diakses: 28
Januari 2015].
h
Portal Data Terbuka San Francisco: Dapat diakses dari
URL:http://data.sfgov.org/[Terakhir Diakses: 28 Januari
2015].

Kepentingan yang bersaing


Para penulis menyatakan bahwa mereka tidak memiliki kepentingan
yang bersaing.

Kontribusi penulis
ZK melakukan penelitian dalam mengidentifikasi ruang lingkup penelitian
ini. ZK menyediakan konteks kota pintar, kasus penggunaan yang
dikembangkan, serta desain model dan proses pengembangan untuk
layanan analitik data besar berbasis cloud. AA mengembangkan arsitektur
yang diusulkan dan dengan bantuan MAT mengidentifikasi teknologi yang
ada untuk diterapkan di berbagai komponen arsitektur layanan analitik
data besar berbasis cloud. MAT dan KS memberikan masukan
berdasarkan penambangan data dan teknik analitik untuk layanan analitik
data besar. KS juga merancang dan mengimplementasikan aplikasi
prototipe dan juga secara kritis mendiskusikan hasil dan aspek
skalabilitasnya. Semua penulis membaca dan menyetujui naskah akhir.

ucapan terima kasih


Kami menghargai diskusi awal dan umpan balik tentang komponen arsitektur
dari Dr. Saad Liaquat dari University of the West of England, Bristol, UK.

Detail penulis
1 Fakultas Lingkungan dan Teknologi, Departemen Ilmu Komputer dan Teknologi
Kreatif, University of the West of England, Bristol, Inggris.
2
Fakultas Bisnis, Komputasi dan Hukum, Fakultas Komputasi dan
3
Matematika, Universitas Derby, Derby, Inggris. Sekolah Ilmu
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 11
dari 11

Referensi 21. Nathalie M, Symeon P, Antonio P, Kishor T (2012)


1. Bandyopadhyay D, Sen J (2011) Internet of things: Aplikasi dan Menggabungkan cloud dan sensor dalam lingkungan kota pintar.
tantangan dalam teknologi dan standardisasi. kabel. Pers. komuni. Jurnal EURASIP tentang Komunikasi dan Jaringan Nirkabel 247:1–10
58(1):49–69 22. Khan Z, Kiani SL, Soomro K (2014) Kerangka kerja untuk layanan informasi
2. Gubbi J, Buyya R, Marusic S, Palaniswami M (2013) Internet of kontekstual berbasis cloud untuk warga di kota pintar. Jurnal Aplikasi Komputasi
things (iot): Visi, elemen arsitektur, dan arah masa depan. Generasi Awan: Kemajuan, Sistem, dan Aplikasi 3(14)::1–17
masa depan. Hitung. sistem 29(7):1645-1660 23. Data Tertaut - Masalah Desain.http://www.w3.org/DesignIssues/
3. Ludlow D, Khan Z (2012) Demokrasi partisipatif dan tata kelola LinkedData.html[Terakhir diakses: 21 Januari 2015]
kota pintar. Dalam: Prosiding Kongres AESOP Tahunan ke-26, 24. Linked Open Data: The Essentials - Panduan Memulai Cepat
Ankara, Turki untuk Pengambil Keputusan.http://www.semantic-web.at/LOD-
4. Khan Z, Kiani SL (2012) Arsitektur berbasis cloud untuk layanan warga di kota TheEssentials.pdf[Terakhir diakses: 21 Januari 2015]
pintar. Dalam: Lokakarya ITAAC 2012. Konferensi Internasional IEEE Kelima tentang 25. Wu X, Zhu X, Wu GQ, Ding W (2014) Penambangan data dengan data
Utilitas dan Komputasi Awan (UCC), Chicago, IL, AS. hal 315–320. IEEE besar. Transaksi Pengetahuan dan Rekayasa Data: IEEE 26(1):97–107
5. Suciu G, Vulpe A, Halunga S, Fratu O, Todoran G, Suciu V (2013) 26. Fan W, Bifet A (2012) Menambang data besar: status saat ini dan perkiraan
Kota pintar dibangun di atas komputasi awan yang tangguh dan internet untuk
yang aman. Dalam: Konferensi Internasional ke-19 tentang Sistem Kontrol masa depan. Eksplorasi SIGKDD: ACM 14:1-5
dan Ilmu Komputer (CSCS), Bucharest, Rumania. hal 513–518 27. Lin J, Ryaboy D (2012) Menskalakan infrastruktur penambangan data
6. Ferguson M Merancang Platform Data Besar untuk Analisis. Kertas putih. besar: Twitter
Tersedia secara online:http://public.dhe.ibm.com/common/ssi/ecm/im/en/ pengalaman. Eksplorasi SIGKDD: ACM 14:6–19
iml14333usen/IML14333USEN.PDF,[Terakhir diakses: 21 Januari 2015] 28. Bishop CM (2007) Pengenalan pola dan pembelajaran mesin.
7. Hurwitz J, Nugent A, Halper F, Kaufman M (2013) Big Data untuk Peloncat.http://www.springer.com/computer/image+processing/book/978-0-387-
Dummies. edisi pertama John Wiley & Sons, Inc., Hoboken, New Jersey 31073-2
8. Lu S, Li MR, Tjhi CW, Leen KK, Wang L, Li X, Ma D (2011) Kerangka kerja 29. Siewert SB (2013) Data besar di awan: Kecepatan data, volume, variasi,
untuk analisis dan visualisasi data skala besar berbasis cloud: Studi kasus pada kebenaran. Pekerjaan Pengembang IBM. Tersedia
data iklim multiskala. Dalam: Proceedings of the 3rd IEEE International dari:http://www.ibm.com/ developerworks/library/bd-
Conference on Cloud Computing Technology and Science, 29 Nov-1 Des 2011, bigdatacloud/bd-bigdatacloud-pdf.pdf[Terakhir diakses: 21
Divani Caravel, Athena, Yunani. hal 618–622 Januari 2015]
9. Burnap P, Rana O, Williams M, Housley W, Edwards A, Morgan J, Sloan L, 30. Ahlgren P, Jarneving B, Rousseau R (2003) Persyaratan untuk
Conejero J COSMOS: Menuju Layanan Terintegrasi dan Skalabel untuk ukuran kesamaan cocitation, dengan referensi khusus untuk koefisien
Menganalisis Media Sosial Sesuai Permintaan. Jurnal Internasional Sistem korelasi pearson. Jurnal Masyarakat Amerika untuk Ilmu Pengetahuan
Paralel, Muncul dan Terdistribusi.http://orca.cf.ac.uk/59478/ dan Teknologi Informasi 54(6):550–560
10. Ahuja PS, Moore B (2013) Keadaan analisis data besar di awan.
Teknologi Jaringan dan Komunikasi 2(1):62–68
11. Qin X, Wang H, Li F, Zhou B, Cao Y, Li C, Chen H, Zhou X, Du X,
Wang S (2012) Melampaui integrasi sederhana rdbms dan pengurangan
peta - membuka jalan menuju sistem terpadu untuk data besar analytics:
Visi dan kemajuan, hal.716–725. Konferensi Internasional Kedua tentang
Cloud and Green Computing, Xiangtan, China
12. Moraru A, Mladenic D (2012) Pemrosesan peristiwa yang kompleks dan
penambangan data untuk kota pintar. Dalam: Conference on Data Mining and
Data Warehouses (SkiDD 2013), Diselenggarakan pada 15th International
Multiconference on Information Society (IS-2012), 8 Oktober 2012, Ljubljana,
Slovenia
13. Mutizwa-Mangiza ND, Arimah BC, Jensen I, Yemeru EA, Kinyanjui MK
(2011) Kota dan perubahan iklim: Laporan global tentang pemukiman
manusia. Dalam: Global Report on Human Settlements, hal.250. UN-
HABITAT
14. Badan Lingkungan Eropa (2006) Penyebaran perkotaan di Eropa -
tantangan yang diabaikan. Laporan teknis, Komisi Eropa. ISBN:
92-9167-887-2, Tersedia dari:http://www.eea.europa.eu/publications/
eea_report_2006_10/eea_report_10_2006.pdf[Terakhir
diakses: 21 Januari 2015]
15. Khan Z, Ludlow D, McClatchey R, Anjum A (2012) Sebuah arsitektur
untuk intelijen terintegrasi dalam manajemen perkotaan menggunakan
komputasi awan. J Cloud Comput Appl Adv Syst Appl 1(1):1–
14.http://www. journalofcloudcomputing.com/content/1/1/1
16. Khan Z, Pervez Z, Ghafoor A (2014) Menuju keamanan data dan
manajemen privasi kota pintar berbasis cloud. Dalam: Konferensi
Internasional IEEE/ACM ke-7 2014 tentang Komputasi Awan dan Utilitas - Kirimkan naskah Anda ke a
Lokakarya SCCTSA, 8-11 Desember, London, Inggris. hal 806–811
17. IBM, Zikopoulos P, Eaton C (2011) Memahami big data: Analytics jurnal dan manfaat dari:
untuk hadoop dan streaming data kelas perusahaan. McGraw-Hill Osborne
Media.http://freecomputerbooks.com/Understanding-Big-Data.html 7 Pengiriman online yang nyaman
18. Naphade M, Banavar G, Harrison C, Paraszczak J, Morris R (2011) Kota 7 Tinjauan sejawat yang ketat
yang lebih cerdas dan tantangan inovasinya. Komputer 44(6):32–39 7 Publikasi langsung tentang penerimaan
19. Buka Data Pemerintah.http://opengovernmentdata.org/[Terakhir 7 Akses terbuka: artikel tersedia secara online secara gratis
diakses: 21 Januari 2015]
7 Visibilitas tinggi di dalam lapangan
20. da Silva WM, Alvaro A, Tomas GHRP, Afonso RA, Dias KL, Garcia VC
(2013) Arsitektur perangkat lunak kota pintar: survei. Dalam: Proceedings of the 7 Mempertahankan hak cipta artikel Anda
28th Annual ACM Symposium on Applied Computing, New York, NY, USA,
pp.http://jwcn.eurasipjournals.com/content/2012/1/247
Kirimkan naskah Anda berikutnya di7 springeropen.com

Anda mungkin juga menyukai