Towards Cloud Based Big Data Analytics For Smart Future Citiesjournal of Cloud Computing - En.id
Towards Cloud Based Big Data Analytics For Smart Future Citiesjournal of Cloud Computing - En.id
com
Abstrak
Sejumlah besar data penggunaan lahan, lingkungan, sosial-ekonomi, energi dan transportasi dihasilkan di kota-kota.
Perspektif terpadu dalam mengelola dan menganalisis data besar semacam itu dapat menjawab sejumlah pertanyaan sains,
kebijakan, perencanaan, tata kelola, dan bisnis, serta mendukung pengambilan keputusan dalam memungkinkan
lingkungan yang lebih cerdas. Makalah ini menyajikan perspektif teoretis dan eksperimental tentang kota pintar yang
berfokus pada manajemen dan analisis data besar dengan mengusulkan layanan analitik berbasis cloud. Sebuah prototipe
telah dirancang dan dikembangkan untuk menunjukkan efektivitas layanan analitik untuk analisis data besar. Prototipe telah
diimplementasikan menggunakan Hadoop dan Spark dan hasilnya dibandingkan. Layanan ini menganalisis data Bristol
Open dengan mengidentifikasi korelasi antara indikator lingkungan perkotaan yang dipilih. Eksperimen dilakukan
menggunakan Hadoop dan Spark dan hasilnya disajikan dalam makalah ini. Data yang berkaitan dengan kualitas hidup
terutama kejahatan dan keselamatan & ekonomi dan pekerjaan dianalisis dari katalog data untuk mengukur indikator yang
tersebar selama bertahun-tahun untuk menilai tren positif dan negatif.
Kata kunci:Data besar, Penambangan dan analitik data, Kota pintar, Komputasi awan
1 Fakultas Lingkungan dan Teknologi, Departemen Ilmu Komputer dan
Teknologi Kreatif, University of the West of England, Bristol, UK Daftar lengkap
informasi penulis tersedia di akhir artikel
pengantar
TIK menjadi semakin meresap ke lingkungan perkotaan
dan memberikan dasar yang diperlukan untuk
keberlanjutan dan ketahanan kota masa depan yang
cerdas. Dengan peningkatan pesat kehadiran Internet of
Things (IoT) dan internet masa depan[1,2]teknologi
dalam konteks kota pintar [3-5], sejumlah besar data
(alias data besar) dihasilkan, yang perlu dikelola dan
dianalisis dengan baik untuk berbagai aplikasi
menggunakan pendekatan TIK terstruktur dan
terintegrasi. Seringkali alat TIK untuk kota pintar
berurusan dengan domain aplikasi yang berbeda seperti
penggunaan lahan, transportasi dan energi, dan jarang
memberikan perspektif informasi terintegrasi untuk
menangani keberlanjutan dan pertumbuhan sosial
ekonomi kota. Kota pintar dapat mengambil manfaat dari
informasi tersebut dengan menggunakan pengumpulan,
pemrosesan, integrasi, dan berbagi data lintas-tema yang
besar, dan seringkali real-time, melalui layanan antar-
operasi yang disebarkan di lingkungan cloud. Namun,
pemanfaatan informasi tersebut memerlukan perangkat
lunak, layanan, dan teknologi yang sesuai untuk
mengumpulkan, menyimpan,
*Korespondensi: Zaheer2.Khan@uwe.ac.uk
terstruktur, atau terstruktur , dan iii) keandalan
data[6,7].Dalam hal ini, makalah ini memberikan
warga dan berbagai departemen dan lembaga di skala kota gambaran berorientasi data kota pintar dan menyediakan
untuk menghasilkan pengetahuan baru dan mendukung arsitektur layanan analitik berbasis cloud dan
pengambilan keputusan. implementasi untuk analisis data studi kasus yang dipilih.
Nilai sebenarnya dari data tersebut diperoleh dengan Kota pintar menyediakan domain aplikasi baru untuk
pengetahuan baru yang diperoleh dengan melakukan analitik data besar dan relatif tidak banyak pekerjaan yang
analisis data menggunakan berbagai penambangan data, dilaporkan dalam literatur. Tinjauan tentang keadaan seni
pembelajaran mesin, atau metode statistik. Namun, bidang memberikan wawasan yang sangat menjanjikan tentang
analitik data berbasis kota pintar cukup luas, kompleks, penerapan sumber daya komputasi awan untuk analitik
dan berkembang pesat. Kompleksitas dalam analitik data data kota pintar skala besar. Misalnya, Lu et al.[8]fokus
kota pintar terwujud karena berbagai masalah: i) pada penggunaan sumber daya komputasi untuk data
Persyaratan aplikasi lintas-tema misalnya energi, skala besar untuk iklim yang memiliki kompleks
transportasi, air, perkotaan, dll, dan ii) berbagai sumber
data yang menyediakan data tidak terstruktur, semi-
© 2015 Khan dkk.; pemegang lisensi Springer. Ini adalah artikel Akses Terbuka yang didistribusikan di bawah
ketentuan Lisensi Atribusi Creative Commons(http://creativecommons.org/licenses/by/4.0),yang mengizinkan penggunaan, distribusi, dan reproduksi tanpa
batas dalam media apa pun, asalkan karya aslinya dicantumkan dengan benar.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 2
dari 11
diusulkan dengan menerapkan prototipe berbasis
MapReduce untuk data terbuka Bristol dan
mendiskusikan hasil. Akhirnya, kami menyimpulkan
struktur dan format. Menggunakan kumpulan data multiskala diskusi kami dan menyajikan arah penelitian masa depan
untuk data iklim, mereka mendemonstrasikan integrasi data di Bagian“Kesimpulan dan masa depan arah”.
skala besar berbasis cloud dan pendekatan analitik di mana
mereka menggunakan alat seperti RapidMiner dan Hadoop
untuk memproses data di cloud hybrid. Antara lain, proyek
COS-MOS[9]menyediakan infrastruktur cloud on-demand
terdistribusi berdasarkan Hadoop untuk menganalisis Big Data
dari sumber media sosial. Infrastruktur memiliki kemampuan
untuk memproses jutaan titik data yang akan memakan waktu
lebih lama di komputer desktop. Ini memungkinkan ilmuwan
sosial untuk mengintegrasikan dan menganalisis data dari
berbagai sumber yang tidak dapat dioperasikan secara
transparan. Platform analisis Big Data seperti itu juga dapat
berguna untuk kota pintar karena memungkinkan pengambil
keputusan untuk mengumpulkan dan menganalisis data dari
banyak sumber secara tepat waktu. Ahuja dan Moore
tetapi jarang digunakan sebagai sumber informasi kolektif untuk mensintesis informasi yang dibutuhkan yang dapat
(yaitu sistem sistem[18])untuk tata kelola kota dan membantu dalam meningkatkan ketahanan dan keberlanjutan
keputusan perencanaan. Banyak pemerintah daerah kota. Mengelola data untuk domain tematik ini di lingkungan
membuat data tersebut tersedia untuk penggunaan publik Cloud memberikan peluang untuk mengintegrasikan data yang
sebagai “data terbuka”[19].Mengelola sejumlah besar data diperoleh dari berbagai sumber, memproses, dan
dan menganalisis untuk berbagai aplikasi misalnya model menganalisisnya dalam kerangka waktu yang dapat diterima.
kota masa depan, visualisasi, simulasi, penyediaan Namun, tidak mudah untuk mengadopsi komputasi awan untuk
layanan publik yang berkualitas dan informasi kepada menangani aplikasi kota pintar karena sejumlah tantangan dan
warga dan pengambilan keputusan menjadi tantangan persyaratan[20].Tujuan kami di sini adalah untuk membahas
tanpa mengembangkan dan menerapkan alat dan teknik perspektif tentang bagaimana tantangan ini dapat diatasi
yang tepat. sebagian dengan menggunakan alat TIK dan layanan perangkat
Dalam konteks di atas, kemunculan Cloud com-puting baru- lunak untuk secara cerdas mengelola dan menganalisis data
baru ini menjanjikan solusi untuk tantangan tersebut dengan besar yang kompleks dari kota pintar, dengan menggabungkan
memfasilitasi penyimpanan data besar dan memberikan arsitektur Cloud yang sesuai.[4,15,21].
kapasitas untuk memproses, memvisualisasikan, dan
menganalisis data kota untuk menghasilkan informasi dan
pengetahuan. Solusi tersebut juga dapat memfasilitasi pengambil Desain arsitektur abstrak dari analisis data
keputusan dalam memenuhi persyaratan QoS dengan besar berbasis cloud
menyediakan pemrosesan informasi yang terintegrasi dan Bagian ini membahas pengembangan layanan cloud untuk
infrastruktur analitik untuk berbagai aplikasi kota pintar untuk analisis big data terkait kota pintar. Pertama, kami
mendukung pengambilan keputusan untuk tata kelola kota. menjelaskan desain dan implementasi Layanan Analytics
Angka1menggambarkan pandangan kami tentang pilar berbasis Cloud generik. Kami kemudian membahas
tematik utama kota pintar: masyarakat cerdas, ekonomi proses yang digunakan untuk mengeksploitasi layanan ini
cerdas, lingkungan cerdas, tata kelola cerdas, dan untuk menganalisis data Bristol Open. Prinsip desain
mobilitas cerdas yang berkontribusi terhadap panduan kami untuk layanan analitik berbasis Cloud
keberlanjutan sumber daya dan ketahanan terhadap adalah menggunakan kembali alat dan teknik yang sudah
peningkatan tuntutan perkotaan. Motif utama untuk ada dan telah teruji dengan baik.
mengembangkan pandangan seperti itu adalah untuk Arsitektur sistem, seperti yang ditunjukkan pada Gambar 2,
mempertimbangkan pendekatan holistik untuk kota pintar dibagi menjadi tiga tingkatan untuk memungkinkan
dengan menyediakan akuisisi data, integrasi, pemrosesan, pengembangan basis pengetahuan terpadu. Setiap lapisan
dan mekanisme analisis. mewakili potensi
Gambar 1 Manajemen dan analisis data lintas tematik untuk berbagai aplikasi kota pintar di lingkungan Cloud.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 4
dari 11
skenario aplikasi. Berkaitan dengan hal tersebut, beberapa data lain yang tidak dipublikasikan sebagai data terbuka
kemungkinan komponen untuk big data mining atau sehingga data yang tersedia melalui portal data terbuka
analisis berbasis cloud dapat berupa pemrosesan/integrasi mungkin tidak memenuhi semua kriteria Big Data, yaitu
data, klasifikasi, cluster-ing, reduksi data, visualisasi, dan volume, kecepatan, variasi, dan kebenaran.[29].
menemukan aturan asosiasi seperti yang digambarkan Mempertimbangkan data terbuka Bristol sebagai contoh
pada Gambar 3. Tidak perlu menggunakan semua skenario, data mencakup skala geospasial yang berbeda seperti
komponen ini. Tergantung pada aplikasinya, subset LSOA01 (Lower Layer Super Output Area), Ward, Neighbour-
komponen mungkin diperlukan untuk analisis data. hood atau skala kota. Data dikumpulkan dari berbagai sumber
Misalnya, untuk kasus penggunaan data terbuka, termasuk lembaga lokal (misalnya kelahiran, kematian,
algoritma hanya dari dua komponen yaitu pemrosesan kecelakaan, kejahatan, konsumsi energi, kualitas udara,
data dan aturan asosiasi pencarian diperlukan. Semua kebisingan dll), Kantor Statistik Nasional (misalnya sensus
komponen ini adalah komponen terkenal dalam penduduk) dan/atau persepsi warga (misalnya survei tentang
penambangan data[28].Selain itu, komponen ini dapat kualitas kehidupan, daya tarik ruang publik), dll. Menggunakan
memanfaatkan alat canggih seperti Apache Mahout dan R dataset terbuka Bristol, skenario analitik sederhana dapat
untuk pembelajaran mesin skalabel berbasis cluster. menunjukkan korespondensi antara variabel yang berbeda
seperti kesehatan dan kesejahteraan, kematian, kualitas udara,
Kasus penggunaan: analitik menggunakan kualitas hidup, harga rumah, pendapatan rumah tangga dan
data terbuka Bristol peristiwa kejahatan untuk melakukan analisis komparatif antara
Bagian ini menjelaskan Data Terbuka Bristol dan lingkungan yang berbeda di kota untuk memprediksi dan
bagaimana data tersebut digunakan untuk menetapkan peringkat prioritas tentang daerah yang lebih layak
mengidentifikasi korelasi antara indikator perkotaan yang huni di Bristol di masa depan. Informasi tersebut dapat berguna
berbeda. Kota biasanya menyimpan data tentang bagi pemangku kepentingan lokal untuk mendapatkan kesadaran
penggunaan lahan, kualitas hidup, kesehatan dan tentang lokalitas mereka dan administrasi lokal untuk
kesejahteraan, populasi, ekonomi dan pekerjaan, merencanakan tindakan yang tepat untuk menghindari
pendidikan, infrastruktur transportasi, konsumsi energi, kesenjangan sosial ekonomi dan digital di kota.
perumahan dan bangunan, iklim atau lingkungan lokal
(infrastruktur hijau, kualitas udara dan kebisingan). ) dll.
Dengan inisiatif data terbuka, banyak data semacam itu Analisis dataset terbuka Bristol menunjukkan bahwa ada
tersedia bagi warga negara dan pemangku kepentingan banyak kemungkinan untuk pengembangan solusi cerdas.
lainnya untuk dieksploitasi. Dari perspektif perencanaan, Ketersediaan data historis berbeda-beda untuk setiap indikator
data tersebut mungkin memiliki pola informasi yang dapat tiap tahun misalnya data Sensus dan Penduduk yang ada tiap
digunakan untuk analisis prediktif untuk menentukan tahun antara 2001 sampai 2012 dibandingkan dengan Quality of
indikator pembangunan baru dan mensimulasikan
Life: kriminalitas dan keamanan antara tahun 2005 sampai 2013.
skenario masa depan untuk mendukung pengambilan
Untuk masing-masing indikator terdapat jumlah vari -ables atau
c
keputusan. Misalnya, Portal Data Terbuka Wina dan pertanyaan yaitu rata-rata kira-kira. 20 dan tidak semua variabel
d ini memiliki ketersediaan data yang konsisten untuk semua
Portal Data Terbuka Bristol adalah dua contoh yang
sesuai yang menyediakan data terbuka melalui antarmuka tahun tertentu. Sebagian besar data dalam bentuk agregat
layanan web OGC seperti WFS dan WMS (dalam format statistik untuk berbagai tingkat skala geografis. di satu
yang berbeda misalnya tabel JSON, CSV dan MS Excel).
Namun, kota juga memiliki sejumlah besar
Gambar 3 Komponen analitik data besar untuk mesin analitik.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 6
dari 11
bentuk agregat data membantu dalam menghindari masalah Arsitektur aplikasi prototipe
privasi tetapi di sisi lain mengurangi volume keseluruhan data. Untuk mendemonstrasikan penerapan dunia nyata dari
Situasi ini bervariasi dari portal data terbuka satu kota ke kota arsitektur analisis data besar yang diusulkan, aplikasi
lainnya. Namun demikian, data ini dapat dianalisis prototipe dasar (terutama mesin analitik) menggunakan
menggunakan infrastruktur pemrosesan berbasis cloud yang MapReduce
sesuai untuk menunjukkan korelasi statistik tentang berbagai [11] ditunjukkan pada Gambar4dikembangkan
indikator misalnya kesehatan, pekerjaan, dan persepsi warga menggunakan Hadoop dan Spark. Kuesioner survei yang
tentang indikator yang dipilih seperti kualitas hidup, seperti digunakan oleh Dewan Kota Bristol memberikan indikasi
yang ditunjukkan di Bagian“Implementasi prototipe”. tentang apa yang dipikirkan warga tentang berbagai
indikator. Namun, tidak ada ukuran implisit yang dapat
diukur dari berbagai indikator. Ukuran terukur semacam
Implementasi prototipe itu dapat membantu para pengambil keputusan saat
Untuk implementasi prototipe dipilih data Quality of Life (QoL)
menganalisis Kualitas Hidup di Bristol. Misalnya,
yang memiliki sejumlah indikator untuk mengukur QoL seperti perencana dapat menggunakan ukuran kuantitatif untuk
Crime and Safety, Culture and Leisure, Economy and indikator yang tersebar selama bertahun-tahun untuk
Employment dll. Setiap indikator diukur melalui kuesioner yang menilai tren atau efek positif atau negatif dari kebijakan
dirancang untuk mendapatkan warga negara ' pendapat tentang tertentu. Selain itu, mereka juga dapat menemukan
indikator yang relevan untuk wilayah mereka. Dataset yang korelasi statistik antara berbagai indikator untuk
tersedia berisi nilai agregat untuk tanggapan kuesioner selama menentukan apakah, dan sejauh mana, satu indikator
beberapa tahun seperti yang ditunjukkan pada Gambar 4. memengaruhi indikator lainnya. Namun, karena ada
Ukuran data adalah sekitar 0,7 MB. sejumlah pertanyaan untuk setiap indikator, dan setiap
indikator diukur secara terpisah untuk setiap unit
geografis, ukuran data menjadi signifikan.
Gambar 4 Prototipe arsitektur aplikasi.
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 7
dari 11
Kejahatan dan Keamanan terdiri dari sekitar 20 Pengaturan dan hasil eksperimental
pertanyaan. Selain itu, setiap pertanyaan diajukan untuk Setup eksperimental ditunjukkan pada Gambar 5. Untuk
sekitar 40 distrik Bristol yang membuat total 800 tujuan data prototipe ini berkaitan dengan Kejahatan dan
pertanyaan. Karena ada tanggapan selama 8 tahun total Keselamatan dan Ekonomi dan Ketenagakerjaan dipilih
untuk 2 indikator, jumlah pertanyaan menjadi 12.800 dari katalog data Bristol Open. Untuk setiap indikator,
(800x2x8). data tersedia selama 8 tahun dari 2005 hingga 2012.
Untuk menghitung ukuran kuantitatif yang disebutkan Setiap survei sumber data dilakukan di 40 kelurahan
di atas, kami mengusulkan organisasi hierarkis dari data Bristol dan kuesioner terdiri dari hingga 20 pertanyaan.
terbuka Bristol yang tersedia. Untuk setiap indikator, Data terdiri dari jumlah orang yang menjawab ya untuk
kami mengkategorikan data berdasarkan tahun selama berbagai pertanyaan. Infrastruktur cloud yang digunakan
prapemrosesan untuk memfasilitasi paralelisasi oleh terdiri dari dua node komputasi dan data masing-masing
kerangka kerja MapReduce. Untuk setiap tahun data dengan RAM 2 GB dan prosesor single-core. Kedua node
tersedia, tanggapan kuesioner sudah dikategorikan oleh berjalan di mesin virtual yang dikelola oleh VMWare
bangsal. Dalam aplikasi berbasis MapReduce, data dibagi Workstation 10. Mesin virtual dihosting di server Dell
secara otomatis oleh kerangka Hadoop dan ditugaskan ke PowerEdge R415 dengan prosesor hexa-core AMD
unit pekerja yang disebut Pemeta dalam langkah yang Opteron 4332 HE dan RAM 64GB. Infrastruktur Hadoop
disebut Pemetaan. Pemetaan melakukan tugas terprogram terdiri dari YARN 2.3. 0 bersama dengan HDFS 2.3.0.
mereka, dan data yang dihasilkan sebagai hasilnya Untuk Spark versi 1.1.0 digunakan.
diserahkan kepada Pereduksi setelah beberapa Seperti disebutkan sebelumnya, data diparalelkan di
pengocokan dan penyortiran. Pereduksi kemudian tingkat lingkungan. Artinya, data untuk setiap lingkungan
bertanggung jawab untuk memproses lebih lanjut data ditugaskan ke pembuat peta individu untuk menghitung
menjadi informasi yang berarti. Dalam pengaturan ini, indeks keseluruhan berdasarkan tanggapan. Ini
Untuk aplikasi ini, data untuk setiap lingkungan menghasilkan total 640 pembuat peta yang dibagi antara
ditugaskan ke masing-masing Pemeta untuk diproses; dua pekerjaan MapReduce. Keluaran dari pembuat peta
menghitung nilai indikator untuk lingkungan tersebut terdiri dari indeks pengukuran untuk berbagai bangsal
untuk tahun tertentu berdasarkan tanggapan kuesioner. untuk tahun-tahun individu. Indeks pengukuran dihitung
Setelah nilai berbasis lingkungan dihitung, nilai tersebut dengan rata-rata jumlah tanggapan positif untuk setiap
diteruskan ke Reducer. Dalam langkah ini, nilai-nilai pertanyaan untuk setiap lingkungan. Pereduksi kemudian
berbasis lingkungan digabungkan menjadi satu nilai bertanggung jawab untuk menggabungkan indeks untuk
keseluruhan untuk tahun itu. Dengan cara ini, pengukuran setiap tahun ke dalam indeks tahunan. Hasil akhir terdiri
tahunan untuk berbagai indikator diperoleh. Selain itu, dari dua set yang masing-masing terdiri dari delapan nilai;
nilai sekarang dapat digunakan untuk menetapkan tren satu untuk setiap tahun untuk setiap indikator. Hasil
untuk berbagai indikator dari waktu ke waktu. Ini pada implementasi Spark dan Hadoop dibahas selanjutnya.
gilirannya memungkinkan kami untuk menghitung
korelasi di antara mereka. Seluruh fase pemetaan dan
pengurangan dapat dianggap sebagai pra-pemrosesan data Implementasi Hadoop
dalam hal arsitektur yang diusulkan sedangkan Untuk implementasi ini, total 384 mapper dan 3 reducer
perhitungan korelasi dapat dianggap sebagai komponen telah dibuat. Setiap pekerjaan membutuhkan waktu sekitar
penambangan data. 15 detik untuk dieksekusi. Percobaan dilakukan
Menskalakan aplikasi
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 9
dari 11
Gambar 6 Persepsi warga tentang kejahatan dan keamanan vs ekonomi dan pekerjaan.
kumpulan data statistik kejahatan tersedia dari
g
Kepolisian Inggris situs web akan diperlukan yaitu
jumlah tahun itu tersedia untuk juga akan 4,51 GB.
meningkat. Jika jumlah indikator atau jumlah tahun
bertambah, satu-satunya hal yang diperlukan adalah
menciptakan lebih banyak pekerjaan MapReduce.
Aplikasi akan secara otomatis menskalakan setelah
itu. Misalnya, saat ini untuk Keselamatan dan
Kejahatan, data tersedia selama 9 tahun dari 2005
hingga 2013 dan setiap tahun kumpulan data ini
akan bertambah.
Jika jumlah lingkungan atau jumlah pertanyaan
yang diajukan untuk setiap lingkungan
meningkat:karena data untuk setiap ward ditetapkan
ke masing-masing Mapper, peningkatan jumlah
ward juga berarti peningkatan jumlah Mapper yang
dibuat. Sekali lagi, ini akan ditangani secara
otomatis oleh aplikasi. Oleh karena itu, aplikasi juga
akan diskalakan secara otomatis dan tidak
diperlukan perubahan. Hal ini dimungkinkan,
misalnya jika data untuk kota besar seperti London
sedang dianalisis, yang memiliki 624 kelurahan
dibandingkan dengan Bristol 40. Juga, untuk analisis
wilayah kota di mana data dari kelurahan di kota dan
wilayah metropolitan perlu dianalisis misalnya urban
sprawl dan transportasi (misalnya komuter harian)
untuk menentukan penilaian dampak lingkungan,
misalnya emisi CO2.
Jika jumlah sumber data bertambah:sumber data
tambahan dapat dipertimbangkan untuk menghitung
indeks untuk berbagai indikator. Sumber data
tambahan tersebut dapat berupa Kantor Statistik
e
Nasional Inggris, OpenStreetMap atau Buka Portal
f
Data . Selain itu, Portal Data Terbuka Bristol berisi
statistik tanggapan terhadap survei berbasis kuesioner
yang dilakukan oleh Dewan Kota Bristol. Statistik
inilah yang digunakan dalam percobaan ini. Namun,
orang mungkin juga ingin membandingkan persepsi
kejahatan dengan kenyataan. Untuk tujuan ini,
Kemungkinan lain dapat menambahkan informasi
semantik yang menunjukkan bobot relatif dari setiap
pertanyaan serta faktor tambahan yang berkontribusi
terhadap penghitungan indeks. Dalam kedua kasus
ini, sifat aplikasi prototipe tidak perlu diubah.
Namun, ini mungkin tidak benar untuk semua jenis
sumber data.
Bagian selanjutnya menyimpulkan makalah ini.
Catatan akhir
a Tangki Data: Dapat diakses dari URL:https://github.
com/tdt/[Terakhir Diakses: 28 Januari 2015].
b
Platform portal data sumber terbuka CKAN: URL yang
dapat diakses:http://ckan.org/[Terakhir Diakses: 28 Januari
c
2015]. Katalog Data Terbuka Wina: Dapat diakses dari
URL:https://open.wien.at/site/datenkatalog/[Terakhir
diakses:
28 Januari 2015].
d
Portal Data Terbuka Bristol: Dapat diakses dari
URL:http://profiles.bristol.gov.uk/[Terakhir Diakses: 28
Januari 2015].
e
OpenStreetMap: Dapat diakses dari
URL:http://www. openstreetmap.org/#map=5/54.910/-
3.432[Terakhir Diakses: 28 Januari 2015].
f
Portal Data Terbuka Inggris: Dapat diakses dari
URL:http:// data.gov.uk/[Terakhir Diakses: 28 Januari
2015].
g
Kejahatan dan Pemolisian Inggris, Wales dan NI,
Data Kejahatan: Dapat diakses dari
URL:http://www.police.uk[Terakhir Diakses: 28
Januari 2015].
h
Portal Data Terbuka San Francisco: Dapat diakses dari
URL:http://data.sfgov.org/[Terakhir Diakses: 28 Januari
2015].
Kontribusi penulis
ZK melakukan penelitian dalam mengidentifikasi ruang lingkup penelitian
ini. ZK menyediakan konteks kota pintar, kasus penggunaan yang
dikembangkan, serta desain model dan proses pengembangan untuk
layanan analitik data besar berbasis cloud. AA mengembangkan arsitektur
yang diusulkan dan dengan bantuan MAT mengidentifikasi teknologi yang
ada untuk diterapkan di berbagai komponen arsitektur layanan analitik
data besar berbasis cloud. MAT dan KS memberikan masukan
berdasarkan penambangan data dan teknik analitik untuk layanan analitik
data besar. KS juga merancang dan mengimplementasikan aplikasi
prototipe dan juga secara kritis mendiskusikan hasil dan aspek
skalabilitasnya. Semua penulis membaca dan menyetujui naskah akhir.
Detail penulis
1 Fakultas Lingkungan dan Teknologi, Departemen Ilmu Komputer dan Teknologi
Kreatif, University of the West of England, Bristol, Inggris.
2
Fakultas Bisnis, Komputasi dan Hukum, Fakultas Komputasi dan
3
Matematika, Universitas Derby, Derby, Inggris. Sekolah Ilmu
Khan dkk. Jurnal Cloud Computing: Kemajuan, Sistem dan Aplikasi (2015) 4:2 Halaman 11
dari 11