Anda di halaman 1dari 28

KATA PENGANTAR

Ringkasan Eksekutif ini dibuat sebagai realisasi Perjanjian Kerja antara Satuan Kerja
Badan Pengelola Transportasi Jabodetabek/Sekretariat BPTJ Kementerian Perhubungan
dengan PT. Rekayasa Teknik Artindo, mengenai Jasa Konsultansi, Kontrak Nomor:
4/TENDER/SP.001.1/PPK-BPTJ-I/2021 tanggal 8 September 2021, tentang Pekerjaan
“Penyusunan Basic Design Pemetaan Asal-Tujuan Pergerakan Orang di Jabodetabek
Berbasis Big Data”. Ringkasan Eksekutif ini menyajikan inti informasi yang ingin disampaikan
dari Laporan Akhir Kegiatan, sehingga dapat dipahami oleh user atau pemangku
kepentingan secara cepat dan ringkas tanpa mengurangi esensi hasil kegiatan. Ringkasan
Eksekutif ini terdiri dari 5 (lima) Bab, yaitu:
Bab 1 Pendahuluan
Bab 2 Metodologi dan Pendekatan
Bab 3 Proof of Concept
Bab 4 Rekomendasi
Bab 5 Kesimpulan dan Kesimpulan

Harapan kami Ringkasan Eksekutif ini dapat memenuhi kriteria yang ditentukan oleh
Pihak Satuan Kerja Badan Pengelola Transportasi Jabodetabek/Sekretariat BPTJ untuk
pekerjaan ini dan dapat dipergunakan sebagaimana mestinya, sebagai salah satu masukan
untuk perumusan kebijakan terkait transportasi di area Jabodetabek.

Jakarta, Desember 2021

PT. Rekayasa Teknik Artindo

1
DAFTAR ISI

DAFTAR ISI 2

PENDAHULUAN 3
Latar Belakang 3
Tujuan dan Sasaran 3

METODE DAN PENDEKATAN 4


Pendekatan dan Kerangka Pemikiran 4
Metode Pelaksanaan Pekerjaan 5
Metode Pengumpulan Data 6
Metode Pengolahan Data dan Analisis Data 6

PROOF OF CONCEPT 7
Pemanfaatan Sumber Data Saat ini 7
Identifikasi Sumber Data Digital Baru 7
Metode Pengolahan Data 10
Pemrosesan Data 10
Visualisasi Data 19
Kebutuhan Sumber Daya 22
Kebutuhan Sumber Daya Manusia 23

REKOMENDASI 24
Rekomendasi Data 24
Rekomendasi Analisis Data 25

KESIMPULAN 26

2
I. PENDAHULUAN

1.1. Latar Belakang

Saat ini pola pemetaan pergerakan orang baik intra maupun antar Jabodetabek masih
mengandalkan metode-metode konvensional yang membutuhkan banyak sumber daya
sehingga tidak bisa dilakukan secara terus menerus. Hal ini menyebabkan adanya lag time
atau kesenjangan waktu antara saat data diambil dengan saat data atau hasil analisis itu
digunakan untuk pengambilan keputusan. Sementara, keputusan-keputusan yang
diperlukan berdasarkan pola pergerakan orang di Jabodetabek membutuhkan masukan
data yang jauh lebih cepat, konsisten dan akurat.

Untuk memahami keseluruhan ekosistem mobilitas yang terbilang kompleks, kegiatan ini
mengkaji penggunaan big data untuk memudahkan proses analisa melalui data processing
dan visualisasi. Selain itu, analisis pergerakan orang berbasis big data dapat digunakan
juga untuk mengevaluasi infrastruktur dan layanan transportasi yang ada, serta untuk
meninjau kembali berbagai skenario penerapan kebijakan.

Penggunaan sumber data baru ini berpotensi untuk mendukung metode-metode atau
cara-cara yang saat ini sudah berjalan. Penggunaan sumber-sumber data baru atau
pendekatan-pendekatan analisis baru ini tidak dimaksudkan untuk menggantikan
pendekatan-pendekatan eksisting. Hal ini karena tipe data atau informasi yang bisa
diperoleh dari berbagai metode ini juga berbeda-beda dan memiliki keunggulan
masing-masing. Oleh karena itu, baik metode konvensional maupun metode-metode yang
menggunakan sumber-sumber data baru perlu tetap dikembangkan dan bersifat saling
melengkapi.

1.2. Tujuan dan Sasaran

Tujuan dari kegiatan Penyusunan Desain Dasar Sistem Pemetaan Asal-Tujuan Pergerakan
Orang di Jabodetabek Berbasis Big Data adalah menentukan konfigurasi sistem secara
keseluruhan dan spesifikasi kinerja yang diperlukan serta mendefinisikan framework dari
kegiatan berikutnya, yaitu berupa implementasi penerapan big data untuk monitoring dan
analisis pergerakan di tahap selanjutnya.

3
Sementara itu, sasaran dari kegiatan Penyusunan Basic Design Sistem Pemetaan
Asal-Tujuan Pergerakan Orang di Jabodetabek Berbasis Big Data, meliputi:
● Mendapatkan informasi awal terkait sumber data baru yang dapat digunakan.
● Menyusun framework/rancangan kegiatan berikutnya.
● Menyiapkan dokumen disertai proof of concept untuk pelaksanaan kegiatan di tahap
berikutnya.

Penerima manfaat dari kegiatan ini terutama adalah BPTJ dan pemerintah daerah yang
meliputi 9 (sembilan) wilayah Jakarta, Bogor, Depok, Tangerang, dan Bekasi, serta
kementerian/lembaga terkait yang nantinya dapat memanfaatkan data pergerakan orang
sebagai salah satu dasar penyusunan rencana aksi RITJ. Selain itu, operator dan aplikator
juga dapat mendapatkan manfaat, terutama untuk mengembangkan layanan mereka.
Terakhir, masyarakat yang menjadi pengguna jasa akan dapat menikmati hasil dari
pengembangan sistem transportasi di wilayah Jakarta, Bogor, Depok, Tangerang, dan
Bekasi.

Kajian ini akan melihat potensi dari penggunaan sumber data baru untuk melengkapi
sumber data lama yang sudah ada. Selain itu, studi ini juga dimaksudkan untuk mempelajari
bagaimana bagaimana sumber data baru diperoleh, diproses dan ditampilkan untuk
keperluan pengambilan keputusan.

II. METODE DAN PENDEKATAN

2.1. Pendekatan dan Kerangka Pemikiran

Untuk mencapai maksud dan tujuan kegiatan pada pelaksanaan kegiatan Pemanfaatan
Data Digital Baru untuk Estimasi Matriks Asal-Tujuan Perjalanan di Jabodetabek maka perlu
mempertimbangkan pendekatan teknis yang akan digunakan. Pendekatan yang digunakan,
meliputi :

1. Pendekatan Studi Literatur: Pendekatan ini dilakukan melalui sumber-sumber dari


referensi atau literatur yang relevan untuk mendapatkan informasi yang dibutuhkan

4
sebagai penunjang kegiatan Pemanfaatan Data Digital Baru untuk Estimasi Matriks
Asal-Tujuan Perjalanan di Jabodetabek
2. Pendekatan Analisa dan Pengolahan Sumber Data Saat Ini: Pendekatan ini dilakukan
melalui sumber-sumber data yang sudah tersedia untuk kemudian dianalisis dan diolah
sebagai pembanding (benchmarking) dari sumber data baru yang akan digunakan untuk
kajian Pemanfaatan Data Digital Baru untuk Estimasi Matriks Asal-Tujuan Perjalanan di
Jabodetabek
3. Pendekatan Identifikasi Kebutuhan Sumber Data Baru: Pendekatan ini dilakukan untuk
mengetahui kebutuhan dari sumber-sumber data baru yang akan digunakan untuk
kajian Pemanfaatan Data Digital Baru untuk Estimasi Matriks Asal-Tujuan Perjalanan di
Jabodetabek
4. Pendekatan Analisis dan Pengolahan Sumber Data Digital Baru: Pendekatan ini
dilakukan dengan melakukan analisis dan pengolahan langsung terhadap sumber data
digital yang berpotensi untuk digunakan dalam kajian Pemanfaatan Data Digital Baru
untuk Estimasi Matriks Asal-Tujuan Perjalanan di Jabodetabek.

2.2. Metode Pelaksanaan Pekerjaan

Uraian metode dalam kegiatan Pemanfaatan Data Digital Baru untuk Estimasi Matriks
Asal-Tujuan Perjalanan di Jabodetabek dijelaskan dengan gambar berikut

5
2.3. Metode Pengumpulan Data

Pada kegiatan ini yang dibutuhkan adalah data primer dan data sekunder yang sudah
tersedia baik di instansi pemerintah maupun swasta. Data sekunder yang dibutuhkan ini
adalah data-data yang dapat dimanfaatkan untuk melakukan pemetaan mobilitas penduduk
di Jabodetabek. Berikut merupakan daftar secara rinci lingkup data yang dapat diperoleh
dalam pelaksanaan kegiatan yang dilakukan.

No Kategori Data Data Sumber Data Tahun

1. Data statistik Statistik Komuter Jabodetabek Badan Pusat 2019


Statistik

2. Data operator Data tap-in Transjakarta Instansi terkait 2019


transportasi
Data tap-in dan tap-out KRL Instansi terkait 2019

Data tap-in dan tap-out MRT Instansi terkait 2019

Data transaksi tol pada gate Instansi terkait 2019

3. Data digital baru Data lokasi perangkat seluler Data provider 2019
swasta

2.4. Metode Pengolahan Data dan Analisis Data

Data yang telah dikumpulkan, kemudian diolah melalui tahapan sebagai berikut.
● Penyuntingan / Cleansing
Semua data yang diperoleh diolah dengan melakukan reduksi data atau memilah data
yang benar-benar dibutuhkan dan mendukung kegiatan serta memisahkan data yang
sekiranya tidak mendukung sehingga mudah dalam menganalisis data tersebut.
● Klasifikasi / Classification

6
Klasifikasi yaitu proses pemilahan data sesuai analisis masing-masing tentang
kebutuhan data, maka data yang telah terkumpul akan diklasifikasikan sesuai kebutuhan
analisisnya.
● Agregasi / Aggregation
Agregasi yaitu proses penggabungan data sesuai dengan hasil yang ingin dicapai.
Dalam hal ini penentuan agregasi data (zona, daerah atau lainnya) akan ditentukan
berdasarkan hasil analisis dan klasifikasi dari data
● Tabulasi / Tabulation
Tabulasi merupakan tahap pengelompokkan data dengan memasukkan data dalam
bentuk tabel. Data yang telah diperoleh dan diolah serta diklasifikasikan berdasarkan
jenisnya, kemudian data dan hasil analisis akan disajikan dalam bentuk tabel, gambar
ataupun grafik.

III. PROOF OF CONCEPT

3.1. Pemanfaatan Sumber Data Saat ini

Pada penyusunan basic design pemetaan pergerakan orang di Jabodetabek berbasis Big
Data ini tentunya memerlukan data yang sudah ada sebagai landasan kerja. Ada dua
kategori sumber data yang perlu digunakan yakni data primer sebagai pembanding dan data
sekunder yang dapat digunakan sebagai bahan penyusunan pemetaan dan analisis. Data
primer yang digunakan sebagai pembanding adalah data statistik komuter Jabodetabek
yang dihasilkan dari survey yang dilakukan oleh Badan Pusat Statistik. Data sekunder yang
dimanfaatkan dalam penyusunan pemetaan ini adalah data transaksi dari operator
transportasi yakni data tap-in dan tap out Transjakarta, serta Data tap-in dan tap-out KRL.

3.2. Identifikasi Sumber Data Digital Baru

Ada berbagai sumber data digital baru yang mempunyai potensi untuk digunakan sebagai
data pelengkap dalam memetakan pola pergerakan orang. Masing-masing sumber data
digital tersebut mempunyai karakter masing-masing. Pada tabel berikut ini dideskripsikan
karakter masing-masing data dari tingkat granularity, keakuratan, dan aksesibilitasnya.
Granularity menunjukkan seberapa detil informasi yang bisa didapatkan dari sumber data

7
tersebut. Granularity ini terdiri dari dua aspek, yakni temporal dan spasial. Keakuratan
menunjukkan tingkat akurasi informasi yang bisa didapatkan dari data tersebut. Hal ini
berkaitan dengan bagaimana dari data mentah pada setiap jenis data tersebut dapat
menghasilkan informasi yang relevan serta akurat dalam menggambarkan pola pergerakan
orang. Aksesibilitas menunjukkan seberapa mudah data tersebut dapat diakses oleh pihak
ketiga.

Jenis data Informasi yang dapat diambil Granularity Keakuratan Aksesibilitas

Data Lokasi pengguna saat Tinggi Tinggi Sulit


operator melakukan aktivitas
telepon menggunakan telepon seluler
seluler (telepon, sms, akses internet)

Data Lokasi pengguna saat Tinggi Sedang Sulit


media melakukan aktivitas
sosial menggunakan media sosial

Data lokasi Lokasi pengguna saat Tinggi Sedang Mudah


perangkat melakukan aktivitas
seluler dari menggunakan aplikasi tertentu
aplikasi

Data Estimasi jumlah kendaraan pada Tinggi Sedang Sedang


CCTV lalu setiap ruas jalan
lintas

Data Histori perjalanan pengguna Tinggi Tinggi Sulit


aplikasi dalam menggunakan ojek online
ojek online

Data taksi Estimasi jumlah pergerakan Sedang Sedang Sulit


menggunakan taksi

Data GPS Histori lokasi dan perjalanan Tinggi Tinggi Sulit


kendaraan pengguna kendaraan pribadi
pribadi
Tabel Matriks sumber data digital baru berdasarkan karakternya

Tabel di atas menunjukkan data digital yang aksesibilitasnya relatif mudah dan sedang
adalah data lokasi perangkat seluler via aplikasi dan data CCTV lalu lintas. Oleh karena itu,
dalam waktu yang singkat ini tim memutuskan untuk menggunakan data tersebut terlebih
dahulu, dengan tidak menutup kemungkinan kedepannya sistem bisa dikembangkan
dengan menggunakan sumber data digital baru lainnya.

8
a. Data Lokasi Perangkat Seluler dari Aplikasi
Salah satu data digital baru yang telah diujicobakan pada kajian ini adalah data lokasi
perangkat seluler yang didapatkan dari https://citydata.ai/. Data ini merekam lokasi
telepon seluler pengguna pada waktu yang acak yang berasal dari berbagai sumber
aplikasi yang berpartner dengan data aggregator seperti yang dapat dilihat pada bagan
berikut:

Data RAW data yang dikumpulkan inilah yang diolah untuk mendapatkan pola
pergerakan dari masing-masing individu. Pada kajian ini, data yang didapatkan sebesar
50 GB yang merupakan rekaman lokasi pengguna selama satu pekan, dengan
kapasitas data per hari adalah kisaran 7 hingga 8 GB dengan jumlah individu yang
terangkum sebanyak 13 juta orang. Dari 13 juta orang ini, jumlah individu yang
terdeteksi melakukan pergerakan dari data lokasi telepon seluler ini adalah 1,7 juta
orang.

Data mentah rekaman lokasi telepon seluler masih mengandung data yang tidak dapat
dibaca secara langsung untuk pengambilan informasi. Data seperti ini perlu
diterjemahkan menjadi informasi yang diinginkan. Sebagai contoh, data waktu yang ada
pada data mentah ini memiliki format timestamp yang perlu ditransformasikan dalam
format hari dan waktu. Di samping itu, data mentah tersebut juga masih mengandung
data yang tidak relevan untuk digunakan dalam kajian ini.

b. Data CCTV Lalu Lintas

9
Data yang digunakan dalam perhitungan ini adalah data lalu-lintas kendaraan yang
didapatkan dari sistem IDNcounter. Data ini secara akurat merekam informasi jumlah,
klasifikasi dan kecepatan rata-rata kendaraan per menit. Data ini juga disertai informasi
pendukung terkait keadaan lingkungan. Data ini perlu diolah terlebih dahulu karena
masih mengandung informasi yang tidak relevan untuk kajian.

3.3. Metode Pengolahan Data

Big Data Analytics merupakan suatu kegiatan analisis big data yang menggunakan
serangkaian proses. Pada umumnya, terdapat beberapa tahapan proses yang meliputi:
1. Capture: Bagaimana data ditarik atau di-import untuk kemudian disimpan ke dalam
sistem. Dalam hal penentuan Matrik Asal Tujuan, data awal perlu di-capture meliputi
seluruh aktivitas pergerakan individu yang bisa didapatkan dari data transaksi operator
penyedia layanan ataupun sumber lain seperti mobile data.
2. Clean: Bagaimana data diproses, dibersihkan untuk kemudian bisa digunakan pada
tahapan selanjutnya. Tahapan ini merupakan tahapan yang paling membutuhkan
banyak sumber daya mengingat seluruh proses meliputi summary data, profiling,
standarisasi dan enrichment terhadap data dilakukan.
3. Consume: Tahapan ini adalah tahapan terakhir dimana insights dihasilkan sesuai
dengan permasalahan awal yang sudah ditetapkan.

a. Pemrosesan Data

1) Data Capture
Data yang dapat diproses untuk kajian bisa berupa data statis maupun data dinamis.
Beberapa contoh data statis adalah data yang sudah dikumpulkan dalam satuan waktu
tertentu sehingga tidak mengalami perubahan. Data ini dapat disimpan dalam bentuk file
csv, excel ataupun format lainnya. Sedangkan data dinamis adalah data yang didapat
dengan melakukan integrasi misalnya menggunakan API ataupun data yang didapatkan
secara otomatis pada interval waktu tertentu seperti web scraping. Setiap pemilik data
(operator layanan transportasi) dapat mengirimkan data mentah (raw data) maupun data
olahan untuk kemudian disimpan dan digabungkan oleh sistem yang akan
dikembangkan.

10
Pada kajian penentuan matriks asal-tujuan ini, data masih dikumpulkan secara manual,
yakni dengan mengumpulkan file .csv dari masing-masing lembaga yang terkait.

2) Data Cleansing
Pada kajian ini, yang perlu dilakukan pemrosesan cleansing adalah data digital baru
yakni data dari telepon seluler. Pertama-tama, dari data mentah yang didapatkan, diambil
variabel-variabel yang dibutuhkan saja. Data mentah yang didapatkan dari penyedia
layanan data dapat dilihat pada tabel berikut

Data mentah rekaman lokasi telepon seluler memiliki variabel sebagai berikut:

Column Value Digunakan Keterangan


Name

MAID merupakan identifier/penanda yang


51f145f7-fd80-4 digunakan untuk membedakan individu. Data
MAID 6fc-adf6-7892d Ya ini sudah terlebih dahulu dilakukan transformasi
d2b944b untuk memastikan identifier tidak bisa
dikembalikan terhadap data personal tertentu

Data ini merupakan informasi terkait operating


system yang didapat. Pada kasus penentuan
OS 0 Tidak
MAT data ini tidak dibutuhkan sehingga data ini
akan dibuang pada proses cleansing

LAT -6.21462 Data ini menunjukkan lokasi pengambil data


yang berbentuk geo-location. Ini adalah sumber
Ya
data utama yang akan digunakan pada tahapan
LON 106.814
selanjutnya

Data ini adalah waktu pengambilan data,


TIMESTAM
1577836469 Ya sehingga akan digunakan untuk keperluan
P
selanjutnya

HOR Data detail sudah tersimpan pada bagian


13 Tidak
ACCUR timestamp

V7 samsung
Data ini merupakan informasi tambahan terkait
V8 SM-G610F individu seperti device/perangkat, operator
layanan komunikasi yang digunakan, IP
id_threeindones address dan lainnya.
V9 ia_threeindones Tidak
ia Data ini tidak relevan dalam proses penentuan
Matrik Asal Tujuan sehingga bisa dihilangkan
V10 223.255.230.72
pada proses cleansing

11
V11 id

V12 266

V13 qqguwsem5q

V14 sh.whisper

V15 whisper Data ini merupakan informasi tambahan terkait


dari mana sumber data didapatkan.
V16 NaN
Tidak
Data ini tidak relevan dalam proses penentuan
V17 NaN
Matrik Asal Tujuan sehingga bisa dihilangkan
V18 a pada proses cleansing

V19 8.1

V20 PHONE

Data mentah lalu-lintas kendaraan IDNcounter memiliki variabel sebagai berikut:

Column Name Value Digunak Keterangan


an

id 78701000 Tidak Identifier record pada database, Data ini tidak


relevan sehingga bisa dihilangkan pada proses
cleansing

sensor_timestamp 11/24/2021 Tidak waktu pengambilan data -7H , data tidak


17:00 dibutuhkan karena sudah tersedia timestamp
pada local_time

local_time 11/25/2021 Ya Data ini adalah waktu pengambilan data


0:00 berdasarkan waktu lokal.

location_code idn_153 Ya Data ini menunjukkan lokasi pengambilan data.

sensor_date 24-Nov-21 Tidak Data detail sudah tersimpan pada bagian local
timestamp

mode 0 Tidak Data ini merupakan informasi tambahan terkait


kondisi lingkungan dan fisik sensor
sensor_mac 2146 Tidak
Data ini tidak relevan sehingga bisa dihilangkan
temperature 39 Tidak pada proses cleansing

gyro_pitch -2857 Tidak

12
gyro_roll 9177 Tidak

gyro_heading -13223 Tidak

co2 423 Tidak

pressure 100747 Tidak

rain 1023 Tidak

rssi -56 Tidak

count_vehicleclass 6 Tidak

count_present01 14 Tidak Jumlah total kendaraan dari masing-masing


lajur 1, 2, 3 dan 4.
count_present02 1 Tidak

count_present03 0 Tidak

count_present04 0 Tidak

count_present_sum 15 Tidak Jumlah total kendaraan di seluruh lajur

speed_average01 37 Tidak Kecepatan rata-rata kendaraan dari


masing-masing lajur 1, 2, 3 dan 4
speed_average02 32 Tidak Data seluruh lajur sudah tersimpan di
speed_vehicleclass
speed_average03 0 Tidak

speed_average04 0 Tidak

speed_average_ave 36 Tidak Kecepatan rata-rata kendaraan seluruh lajur

count_vehicleclass01_1 11 Tidak Jumlah kendaraan kelas 1, 2 dan 3 di lajur 1


Data seluruh lajur sudah tersimpan di
count_vehicleclass01_2 3 Tidak count_vehicleclass_sum

count_vehicleclass01_3 0 Tidak

count_vehicleclass02_1 1 Tidak Jumlah kendaraan kelas 1, 2 dan 3 di lajur 2


Data seluruh lajur sudah tersimpan di
count_vehicleclass02_2 0 Tidak count_vehicleclass_sum

count_vehicleclass02_3 0 Tidak

count_vehicleclass03_1 0 Tidak Jumlah kendaraan kelas 1, 2 dan 3 di lajur 3


Data seluruh lajur sudah tersimpan di
count_vehicleclass03_2 0 Tidak count_vehicleclass_sum

count_vehicleclass03_3 0 Tidak

13
count_vehicleclass04_1 0 Tidak Jumlah kendaraan kelas 1, 2 dan 3 di lajur 4
Data seluruh lajur sudah tersimpan di
count_vehicleclass04_2 0 Tidak count_vehicleclass_sum

count_vehicleclass04_3 0 Tidak

count_vehicleclass_sum_1 12 Ya Jumlah kendaraan kelas 1 dari seluruh lajur

count_vehicleclass_sum_2 3 Ya Jumlah kendaraan kelas 2 dari seluruh lajur

count_vehicleclass_sum_3 0 Ya Jumlah kendaraan kelas 3 dari seluruh lajur

speed_vehicleclass_1 38 Ya Kecepatan rata-rata kendaraan kelas 1 dari


seluruh lajur

speed_vehicleclass_2 33 Ya Kecepatan rata-rata kendaraan kelas 2 dari


seluruh lajur

speed_vehicleclass_3 0 Tidak Kecepatan rata-rata kendaraan kelas 3 dari


seluruh lajur

created_at 11/24/2021 Tidak Data detail sudah tersimpan pada bagian


17:00 timestamp

updated_at 11/24/2021 Tidak Data detail sudah tersimpan pada bagian


17:00 timestamp
Tabel Contoh Data Mentah Data CCTV Lalu Lintas

Dari informasi tersebut, beberapa data tidak relevan untuk digunakan dalam kajian ini
sehingga proses cleansing terhadap data adalah dengan mengambil informasi yang
relevan seperti dijelaskan pada tabel berikut.

Value Hasil Akhir


Column Name

51f145f7-fd80-46fc-adf6-7892dd2b944
MAID
b Dari data dapat disimpulkan bahwa
Individu
LAT -6.21462
51f145f7-fd80-46fc-adf6-7892dd2b94
4b berada pada lokasi -6.21462,
LON 106.814
106.814 pada waktu 1577836469
TIMESTAMP 1577836469
Tabel Contoh Hasil Cleansing Raw Data Lokasi Perangkat Selular

3) Transformasi Data

14
Data dari tahapan cleansing masih belum bisa digunakan secara langsung karena masih
terdapat informasi yang perlu ditransformasikan. Lokasi dalam bentuk geolocation perlu
ditransformasi ke dalam bentuk administrasi dan timestamp perlu ditransformasikan
menjadi bentuk waktu yang lebih mudah untuk dikenali, sehingga data tersebut dapat
diproses dan dibandingkan dengan data olahan yang lain. Berikut adalah tampilan data
setelah dilakukan transformasi data.

Value Nilai baru


Column Name

51f145f7-fd80-46fc-adf6-789
MAID 51f145f7-fd80-46fc-adf6-7892dd2b944b
2dd2b944b

LAT -6.21462
Bendungan Hilir, Tanah Abang, Jakarta Pusat
LON 106.814

Wednesday, January 1, 2020 6:54:29 AM


TIMESTAMP 1577836469
GMT+07:00
Tabel Hasil Cleansing Raw Data dan Transformasi Data Perangkat Seluler

Pemrosesan dilakukan oleh sistem yang dikembangkan dalam kajian ini, sehingga
secara otomatis pemrosesan akan dilakukan terhadap seluruh data yang sudah di
capture. Hasil akhir dari fase transformasi data ini adalah sistem dapat mengetahui lokasi
masing-masing individu pada waktu tertentu, seperti yang ditampilkan pada tabel berikut.

MAID timestamp NAMOBJ WADMKC WADMKK

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Cipulir Kota Jakarta Selatan
mVzNWJ1NmFk 06:42:04 Lama

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Grogol Kebayoran


Kota Jakarta Selatan
mVzNWJ1NmFk 07:01:47 Selatan Lama

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Senayan Kota Jakarta Selatan
mVzNWJ1NmFk 07:32:44 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:02:54 Baru

15
ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran
Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:12:33 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:22:57 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:42:25 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:53:09 Baru
Tabel Contoh Hasil Transformasi data untuk tiap-tiap individu

Perlu diingat bahwa kolom time-stamp pada tabel ini tidak menunjukkan waktu mobilisasi
pengguna, melainkan waktu sistem mengambil data lokasi pengguna. Ilustrasi dari
pengambilan data lokasi sehingga bisa didapatkan data seperti pada tabel adalah sebagai
berikut.

Gambar Ilustrasi proses perekaman data lokasi pengguna dan estimasi pergerakan pengguna

4) Klasifikasi Data
Dari tabel dan gambar ilustrasi di atas, sistem dapat mengetahui lokasi pengambilan data
untuk tiap-tiap individu secara historis, tetapi masih belum dapat mengetahui estimasi
perpindahan dari masing-masing individu. Oleh karena itu, proses selanjutnya (filtering)
perlu dilakukan.

Pertama-tama dilakukan normalisasi pada data. Apabila ada rekaman data lokasi
pengguna yang sama dalam kisaran waktu 30 menit, maka dapat diasumsikan pengguna

16
tidak melakukan pergerakan dari lokasi tersebut. Apabila lokasi yang sama ini terekam
beberapa kali, maka akan diambil data terakhir. Proses tersebut dapat diilustrasikan
sebagai pada Tabel-tabel berikut ini. Data pada baris berwarna biru menunjukkan lokasi
yang sama dalam setiap rekaman data yang berjarak antara satu dan lainnya masih
dalam kisaran 30 menit. Ini diasumsikan pada deretan waktu tersebut pengguna masih
berada di lokasi yang sama. Kelima data yang menunjukkan lokasi yang sama dalam
waktu yang berdekatan ini kemudian di-filter, dan hanya diambil data yang terakhir
sehingga didapatkan tabel seperti Tabel berikut.

MAID timestamp NAMOBJ WADMKC WADMKK

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Cipulir Kota Jakarta Selatan
mVzNWJ1NmFk 06:42:04 Lama

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Grogol Kebayoran


Kota Jakarta Selatan
mVzNWJ1NmFk 07:01:47 Selatan Lama

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Senayan Kota Jakarta Selatan
mVzNWJ1NmFk 07:32:44 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:02:54 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:12:33 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:22:57 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:42:25 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:53:09 Baru
Tabel Contoh Hasil transformasi data untuk salah satu individu sebelum dilakukan proses filtering

MAID timestamp NAMOBJ WADMKC WADMKK

17
ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran
Cipulir Kota Jakarta Selatan
mVzNWJ1NmFk 06:42:04 Lama

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Grogol Kebayoran


Kota Jakarta Selatan
mVzNWJ1NmFk 07:01:47 Selatan Lama

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Senayan Kota Jakarta Selatan
mVzNWJ1NmFk 07:32:44 Baru

ZG05c2pxZmlpaTRvMjozOWR2a 2019-02-17 Kebayoran


Gunung Kota Jakarta Selatan
mVzNWJ1NmFk 08:53:09 Baru
Tabel Contoh Hasil transformasi data untuk salah satu individu setelah dilakukan proses filtering

Dari tabel di atas, sistem sudah dapat mengetahui pergerakan dari individu yang
dimaksud, dalam hal ini terjadi pergerakan dari wilayah Cipulir menuju Grogol Selatan,
Grogol Selatan menuju Senayan, dan dari Senayan menuju Gunung.

5) Agregasi Data
Tahapan terakhir adalah melakukan agregasi data dimana data untuk setiap individu
digabungkan pada level wilayah tertentu untuk mendapatkan total jumlah individu yang
melakukan pergerakan dari atau ke wilayah tersebut pada kisaran waktu tertentu. Hasil
agregasi data ini menjadi bentuk yang sama dengan data yang didapatkan dari operator
transportasi seperti berikut:

Lokasi Awal Lokasi Tujuan Jumlah Individu Waktu

Grogol Selatan Gunung 12 6:00 - 7:00

Gunung Grogol Selatan 9 6:00 - 7:00

Grogol Utara Grogol Selatan 7 6:00 - 7:00

Grogol Selatan Cipulir 6 6:00 - 7:00

Senayan Grogol Selatan 6 6:00 - 7:00

18
Senayan Gunung 5 6:00 - 7:00

Gunung Grogol Utara 5 6:00 - 7:00


Tabel Contoh Hasil agregasi pergerakan individu pada level wilayah

Data ini kemudian akan digunakan pada tahapan selanjutnya Consume dengan
visualisasi data.

b. Visualisasi Data

Data yang sudah diolah ini kemudian perlu dibuat visualisasinya agar mudah dipahami.
Data yang divisualisasikan adalah data keseluruhan, yaitu total pergerakan yang
diobservasi dari data operator transportasi dan data lokasi dari telepon seluler. Data
divisualisasikan untuk menggambarkan pola pergerakan secara umum, dan pola
pergerakan pada berbagai level wilayah dan waktu. Beberapa visualisasi yang dapat
dilakukan adalah sebagai berikut:

1) Pengaturan hari dan waktu


Pengaturan hari dan waktu penting untuk dibuat mengingat pola pergerakan orang
memiliki dinamika berdasarkan waktu. Pola pergerakan pada hari kerja tentunya akan
berbeda dengan pola pergerakan pada hari libur. Dalam satu hari pun pola pergerakan
akan berbeda pada setiap jam. Pengaturan hari dan waktu ini memudahkan pengguna
sistem untuk melakukan analisis secara mendalam terkait pola pergerakan dan
dinamikanya baik dari secara temporal maupun spasial.

Gambar Rancangan pengaturan hari dan waktu untuk data yang akan ditampilkan

2) Heatmap Matriks Asal-Tujuan

19
Visualisasi heatmap menunjukkan level intensitas asal-tujuan berdasarkan data lokasi
dari telepon seluler yang telah diagregasi pada level kota/ kabupaten. Visualisasi ini
akan menunjukkan secara umum pergerakan dari kota/ kabupaten mana ke kota/
kabupaten mana yang memiliki pergerakan paling banyak. Semakin gelap warna
menunjukkan intensitas jumlah pergerakan yang lebih tinggi.

3) Chord Diagram Asal-Tujuan


Chord diagram menggambarkan perbandingan jumlah keberangkatan dari setiap kota/
kabupaten, dan proporsi tujuan dari setiap asal kota/kabupaten tersebut. Pada chord
diagram ini juga dapat dilihat alur pergerakan orang berdasarkan tujuannya. Apabila
pengguna meletakkan kursor di daerah tujuan, maka dapat dilihat proporsi pergerakan
orang dengan tujuan tersebut, dari setiap daerah asal.

Gambar Contoh visualisasi chord diagram yang menunjukkan proporsi jumlah pergerakan

4) Pemetaan Rute
Pada peta ini akan digambarkan secara interaktif rute asal-tujuan mana yang memiliki
jumlah pergerakan terpadat secara keseluruhan. Rute ini bisa dilihat pada level wilayah
kelurahan, kecamatan, maupun kabupaten. Pada pemetaan ini diharapkan dapat dilihat
pasangan lokasi mana yang paling banyak pergerakannya dan dapat digambarkan juga
lokasi serta jarak dari rute tersebut.

20
Gambar Rancangan visualisasi pemetaan rute pola pergerakan

5) Peta Spasial berdasarkan Jumlah Keberangkatan dan Kedatangan


Pada peta ini akan menggambarkan wilayah mana yang memiliki jumlah keberangkatan
dan kedatangan terbanyak, pada level kelurahan, kecamatan, dan kabupaten, dari data
rekaman lokasi dari telepon seluler. Dengan visualisasi pemetaan, diharapkan dapat
dilihat apakah ada pola spasial dari jumlah keberangkatan maupun kedatangan. Pada
visualisasi ini, semakin gelap warna wilayah tersebut menunjukkan semakin banyak
jumlah keberangkatan atau kedatangannya, semakin putih warna menunjukkan semakin
sedikit jumlah keberangkatan atau kedatangannya.

Gambar Rancangan visualisasi peta spasial berdasarkan jumlah keberangkatan/ kedatangan

21
3.4. Kebutuhan Sumber Daya

Berdasarkan data yang digunakan dan tujuan yang ingin dicapai, kajian ini membutuhkan
berbagai sumber daya (server, storage, tools dan software) dalam melakukan proses
menyeluruh sejak pengumpulan data sampai dengan penyajian hasil analisis. Kebutuhan
sumber daya bisa dilihat pada tabel berikut:

No Sumber Daya Kebutuhan

1 Network Data yang dikumpulkan oleh penyedia data ditampung ke dalam network
storage storage. Dalam kajian kali ini, team menggunakan S3 (Simple Storage
Service).

Keberadaan network storage ini menjadi penting karena nantinya seluruh


data yang dikumpulkan untuk sistem ini diharapkan bisa terkoneksi secara
online dan realtime

2 Komputasi Kebutuhan komputasi dalam pengelolaan data ini dilakukan dengan


berbagai tahap.

Tahap cleansing : membutuhkan sistem komputasi yang bisa memproses


banyak data sekaligus (CPU oriented)

Tahap klasifikasi/agregasi : membutuhkan sistem komputasi yang bisa


menampung data dan pengolahan dalam jumlah besar (memory oriented)

Tahap penampilan data: membutuhkan sistem komputasi untuk


mengoptimalkan penggunaan dan perhitungan (memory and cpu optimize)

Dalam hal ini team menggunakan beberapa server yang berbeda meliputi
● CPU dengan kapasitas 16 core + 16 GB
● CPU dengan kapasitas 16 core + 64 GB hanya pada saat proses
agregasi dilakukan

3 Tools, Bahasa Untuk melakukan kajian ini, terdapat dua bagian besar yang dilakukan yaitu
Pemrograman proses backend (persiapan data mulai dari akses data sampai dengan hasil
dan library analisis) dan frontend (visualisasi data).

22
yang
digunakan Pemroses Data (Backend)

Untuk pemrosesan data, kajian ini menggunakan bahasa pemrograman


Python yang merupakan bahasa pemrograman yang umum digunakan
dalam project pengembangan big data. Untuk library yang digunakan
sebagai berikut
● Dask = Digunakan untuk parallel computing dan high scalable
proses.
● Tqdm = Digunakan untuk paralel proses dalam melakukan data
cleansing
● Pandas and Numpy => Digunakan untuk melakukan exploratory
data analysis
● Geocoder => Digunakan untuk melakukan reverse geocoding dan
pemroses data spatial

Visualisasi Data

Kajian ini menggunakan HTML dan javascript untuk menampilkan hasil


analisis dan membantu proses explorasi data. Dalam hal ini, aplikasi
ditampilkan berbasis web sehingga kami menggunakan bahasa HTML dan
javascript. Adapun library yang digunakan adalah d3js yang merupakan
visualization library yang umum digunakan untuk membuat tampilan antar
muka yang dinamis dan interaktif.

3.5. Kebutuhan Sumber Daya Manusia

Untuk membangun sistem dashboard matrix origin destination secara lengkap, dibutuhkan
tim tenaga ahli yang meliputi:

No Tenaga Ahli Jumlah Kualifikasi Minimum

1 Ahli perencanaan wilayah kota 1 S2 Planologi atau Perencanaan


Wilayah Kota dengan pengalaman
minimal 7 tahun

2 Ahli Data science 1 S2 Informatika/Ilmu

23
Komputer/Statistika/
Matematika/Fisika dengan
pengalaman minimal 5 tahun

3 Ahli Transportasi 1 S2 Perencanaan Wilayah Kota


dengan pengalaman minimal 5
tahun

4 Ahli Computer Science / Data 2 S1 Informatika/Ilmu Komputer/


Engineering dengan pengalaman minimal 5
tahun

5 Ahli Statistic 1 S1 /Statistika/ Matematika dengan


pengalaman minimal 5 tahun

6 Ahli Pemrograman 2 S1 Informatika/Ilmu Komputer


dengan pengalaman minimal 5
tahun

7 Ahli Visualisasi dan Design 1 S1 Desain Komunikasi Visual/HCI


dengan pengalaman minimal 5
tahun

8 Ahli Pemetaan 1 S1 Planologi/Sipil/Geofisika dengan


pengalaman minimal 5 tahun

IV. REKOMENDASI

4.1. Rekomendasi Data

Data yang dipakai dalam penyusunan desain awal pemetaan pola pergerakan orang ini
belum merupakan data yang ideal. Untuk sumber data yang sudah dipakai, ada beberapa
hal yang masih diperlukan, sehingga dapat meningkatkan kualitas pemetaan yang ada.
Pada kajian ini, data dari operator transportasi yang digunakan adalah data dari transjakarta
dan KRL yang berupa data agregat total jumlah transaksi pada setiap halte/ stasiun pada
hari dan jam tertentu. Total jumlah transaksi bukanlah data yang ideal untuk memetakan
pergerakan yang sesungguhnya.

Data aktivitas transaksi pada level ID user sangat diperlukan untuk memetakan pergerakan
pengguna layanan transportasi umum secara keseluruhan. Seperti halnya yang telah
dideskripsikan pada bab pemrosesan data digital baru, dengan adanya informasi mengenai

24
ID user, tim pengkaji dapat mengelompokkan pergerakan setiap user, sehingga
mendapatkan informasi yang utuh mengenai rute pergerakan yang dilakukan. Di samping
itu, kedepannya, kajian juga bisa dikembangkan untuk memilah pergerakan mana saja yang
reguler atau mengindikasikan aktivitas komuter, serta pergerakan mana saja yang
merupakan pergerakan insidental.

Terkait dengan proses data capture, pada kajian ini proses yang dilakukan masih semi
manual. Tim pengkaji menerima file data dari setiap pihak yang memberikan data, kemudian
membersihkan data tersebut terlebih dahulu, serta menambahkan informasi yang belum
tercantum pada data seperti misalnya lokasi halte/ stasiun. Untuk mendukung sistem
pemetaan yang dapat berkelanjutan, data capture sebaiknya dapat dibuatkan sistem
pertukaran data secara otomatis menggunakan API (Application Programming Interface).
Dengan menggunakan API, operator transportasi dapat merekam data secara otomatis
setiap saat transaksi dilakukan, lalu data juga bisa langsung diakses oleh sistem pemetaan
untuk kemudian diolah dan dianalisis.

Kajian ini juga bisa dikembangkan dengan memanfaatkan data lain yang belum digunakan.
Data operator transportasi yang masih bisa dimanfaatkan juga ialah data MRT, dan
transaksi tol. Untuk sumber data digital baru yang bisa dimanfaatkan tentunya bergantung
pada ketersediaan data dan aksesibilitasnya. Sumber data digital baru yang dapat ditelusuri
terlebih dahulu ketersediaan dan prosedur pemanfaatannya dapat dilihat pada bab IV
bagian identifikasi sumber data digital baru.

4.2. Rekomendasi Analisis Data

Pemetaan pola pergerakan idealnya dapat menggambarkan pergerakan secara


keseluruhan. Kajian yang dilakukan saat ini belum dapat memenuhi hal tersebut,
dikarenakan terbatasnya informasi dalam data. Ada beberapa analisis yang dapat
dikembangkan apabila data yang lebih detail (pada level user ID) bisa didapatkan. Pertama,
tentunya pola pergerakan reguler dan insidental, serta pemetaan user reguler (dalam hal ini
bisa diidentifikasi sebagai komuter) dan non-reguler bisa dilakukan. Hal ini akan sangat
bermanfaat untuk memberikan wawasan bagi pemangku kepentingan dan penyedia layanan
untuk melakukan peningkatan layanan secara strategis sesuai kebutuhan target pengguna.

25
Kedua, apabila data pada level user ID didapatkan, dari pola pergerakan reguler yang
didapatkan, bisa dilakukan penyesuaian (matching) perjalanan dari penggunaan jasa jenis
transportasi yang satu dengan lainnya, sehingga didapatkan prediksi journey user yang
menyeluruh. Sebagai contoh, pemetaan pergerakan user yang melakukan perjalanan ke
kantor menggunakan KRL yang kemudian disambung dengan menggunakan Transjakarta.
Proses matching ini bisa dilakukan dengan cara membuat estimasi dari segi waktu
transaksi, durasi perjalanan, dan lokasi transaksi. Hal ini juga bisa divalidasi kembali dengan
adanya sumber data digital lain.

Ketiga, apabila ada sumber data digital lain, kajian bisa juga dikembangkan dengan
melakukan analisis first mile - last mile. Analisis yang ada saat ini lebih bersifat pemetaan
fragmen perjalanan, karena data yang ada masih terpisah-pisah untuk setiap sumber data.
Apabila proses matching dari setiap fragmen perjalanan ini bisa dilakukan, serta
ditambahkan pemanfaatan data digital baru yang dapat memetakan lokasi awal dan akhir
pengguna, makan pemetaan first mile - last mile ini dapat dilakukan. Pemetaan ini akan
sangat bermanfaat untuk mengetahui kebutuhan pergerakan yang sesungguhnya.

V. KESIMPULAN

Kegiatan “Penyusunan Basic Design Pemetaan Asal-Tujuan Pergerakan Orang di


Jabodetabek Berbasis Big Data” ini bertujuan untuk menentukan konfigurasi sistem secara
keseluruhan dan spesifikasi kinerja yang diperlukan serta mendefinisikan framework
implementasi penerapan big data untuk monitoring dan analisis pola pergerakan di tahap
selanjutnya. Dalam waktu yang cukup singkat, kajian awal ini telah berhasil dilakukan.

Dari hasil kegiatan yang telah dilakukan, telah dipetakan bagaimana desain sistem
pemetaan asal-tujuan pergerakan orang di Jabodetabek dapat dilakukan dengan lanskap
ketersediaan data dan sumber daya yang ada. Penggunaan sumber data baru juga telah
diujicobakan dan menghasilkan alur kerja pemanfaatan sumber data digital untuk pemetaan
orang yang dapat melengkapi metode konvensional yang sejauh ini dilakukan. Proses
pengambilan data, pengolahan data, hingga perancangan visualisasi juga telah
diujicobakan, sehingga didapatkan alur kerja sistem pemetaan yang bisa
diimplementasikan.

26
Dengan adanya keterbatasan informasi dalam data, waktu kegiatan dan ragam sumber data
yang didapatkan, tentunya masih ada ruang untuk pengembangan sistem selanjutnya.
Untuk data yang telah dimanfaatkan dalam kegiatan ini, diharapkan bisa didapatkan
informasi yang lebih detail dan utuh sehingga pola pergerakan bisa lebih tergambarkan. Di
samping itu, proses penelusuran sumber data lain yang memiliki potensi untuk
dimanfaatkan juga telah dilakukan. Harapannya, sumber data baru ini bisa didapatkan untuk
meningkatkan capaian analisis yang lebih mendalam, serta kinerja sistem yang lebih akurat.

Untuk implementasi sistem selanjutnya, pihak BPTJ perlu melakukan pengadaan sumber
daya hardware dan software yang kapasitasnya mumpuni untuk penyimpanan dan
pengolahan data dengan volume besar, serta sumber daya manusia untuk mengelola
sistem lebih lanjut. Untuk pengembangan sistem yang berkelanjutan, pihak BPTJ perlu
mendorong ketersediaan data yang lebih detail pada instansi operator penyedia jasa
layanan transportasi, serta untuk dapat terus meninjau peluang pemanfaatan sumber data
lain yang juga relevan dalam kajian ini.

27

Anda mungkin juga menyukai