OLC-1
Dosen Pengajar:
Disusun Oleh:
Nama: Fendyanto
NIM: 31190038
2020 – 2021
DAFTAR ISI
DAFTAR GAMBAR
ii
Kata Pengantar
Dengan memanjatkan puji dan syukur ke hadirat Tuhan Yang Maha Esa, yang telah
melimpahkan rahmat, hidayah, dan inayah-Nya kepada kami, sehingga saya dapat
menyelesaikan makalah dengan judul BIG DATA dan IMPLEMENTASI DALAM STARTUP
GO-JEK.
Makalah ini telah saya susun dengan maksimal dan mendapatkan bantuan dari berbagai
pihak dan sumber sehingga dapat memperlancar pembuatan makalah ini. Untuk itu saya
menyampaikan banyak terima kasih kepada semua pihak yang telah berkontribusi dalam
pembuatan makalah ini.
Terlepas dari semua itu, saya menyadari sepenuhnya bahwa masih ada kekurangan baik
dari segi susunan kalimat maupun tata bahasanya. Oleh karena itu dengan tangan terbuka saya
menerima segala saran dan kritik dari pembaca agar kami dapat memperbaiki makalah ilmiah
ini.
Akhir kata saya berharap semoga makalah ilmiah tentang limbah dan manfaatnya untuk
masyarakan ini dapat memberikan manfaat maupun inpirasi terhadap pembaca.
Penyusun
iii
Pengenalan Big Data
Sebelum kita mempelajari lebih jauh mengenai Big Data, tentunya kita perlu
memahami asal muasal dan sejarah perkembang dari Big Data, adapun dalam topik ini
saya akan memberikan urutan sejarah perkembangan Big Data secara singkat.
Arthur Miller Menulis dalam “The Assault on Privacy” menyatakan, "Terlalu banyak
informasi yang harus diukur dari seseorang, sehingga jumlah bit kapasitas informasi
1971 -
orang tersebut tidak sebanding dengan jumlah bit kapasitas tempat penyimpanan
berkas tersebut".
Peter J. Denning menerbitkan " Saving All the Bits " (PDF) dalam American
Scientist . Mengatakan Denning: "[keharusan bagi para ilmuwan] untuk menyimpan
1990 -
semua bit hasil penemuan ke dalam sebuah perangkat penyimpanan bervolume
besar untuk memprediksi pola tanpa memahami arti dari pola tersebut.
1
Penyimpanan digital menjadi tempat penyimpanan yang lebih hemat biaya untuk
1996 - menyimpan data daripada kertas menurut RJT Morris dan BJ Truskowski, dalam
" The Evolution of Storage Systems ," IBM Systems Journal
Michael Cox dan David Ellsworth menerbitkan tentang Visualisasi set data
1997 - umumnya cukup besar, membebani kapasitas memori utama, disk lokal, dan bahkan
disk jarak jauh. Dan mereka menyebutnya masalah BIG DATA.
Peter Lyman dan Hal R. Varian di UC Berkeley menerbitkan bahwa pada tahun
2000 - 1999, dunia menghasilkan sekitar 1,5 exabytes informasi unik, atau sekitar 250
megabytes untuk setiap pria, wanita dan anak di bumi
2
Amazon juga pasti mencatat buku apa saja yang Anda baca agar mereka
bisa merekomendasikan buku yang sesuai dengan apa yang Anda baca.
3
c. Velocity : Big Data memiliki kecepatan yang sangat cepat, dimana
data diterima dan mungkin langsung digunakan. Biasanya kecepatan
tertinggi aliran data langsung dialirkan langsung ke memori
dibandingkan yang ditulis ke disk. Internet menjadikan Big Data
dapat beroperasi secara nyata atau mendekati waktu nyata dan akan
membutuhkan evaluasi dan tindakan secara real time.
4
Data Minning, merupakan suatu proses menemukan
hubungan yang berarti, pola, dan kecenderungan dari
sekumpulan besar data dengan menggunakan teknik
pengenalan pola seperti statisik dan matematika.
Machine Learning
Analisis Prediksi
Analisis Statistik
NLP (Natural Language Processing)
Untuk Big Data, digunakan teknik yang dikenal sebagai Map Reduce,
memfilter data berdasarkan pada data yang spesifik pada strategi
penemuan. Setelah data yang difilter ditemukan, maka akan dianalisis
secara langsung, dimasukkan ke dalam unstructured database yang lain,
dikirimkan ke dalam perangkat mobile atau digabungkan ke dalam
lingkungan data warehouse tradisional dan berkolerasi pada data
terstruktur.
5
Namun, setelah proses Map Reduce ada kemungkinan akan terjadi
reduksi hasil dalam lingkungan data warehouse sehingga dapat
memanfaatkan pelaporan business intelligence, statistik, semantik, dan
kemampuan korelasi yang biasa.
Akan sangat ideal untuk memiliki kemampuan analitik yang
mengkombinasikan perangkat BI bersamaan dengan visualisasi big data
dan kemampuan query. Kedua, untuk memfasilitasi analisis dalam
laingkungan Hadoop, lingkungan sandbox dapat dibuat.
6
Analisa Penggunaan Big Data dalam Gojek
Berikut 16 produk jasa yang tersedia dalam aplikasi Gojek hingga saat ini :
• Go-Ride • Go-Shop
• Go-Car • Go-Mart
• Go-Bluebird • Go-Box
• Go-Food • Go-Massage
• Go-Send • Go-Clean
• Go-Points • Go-Glam
• Go-Pulsa • Go-Tix
• Go-Bills • Go-Auto
Melihat dari beragamnya produk jasa yang ditawarkan, maka tidak heran
apabila Go-jek hingga saat ini tercatat memiliki mitra pengemudi sejumlah
900.000 di 50 kota, 100.000 merchant, dan 15 juta pengguna aktif, serta
100.000 juta transaksi berhasil setiap bulannya. Tentunya semua kegiatan
yang berlangsung akan menghasilkan jutaan data mentah, sebagai contoh
data pribadi customer maupun driver, data rekam jejak perjalanan, daftar
belanjaan customer, makanan favorit customer, jadwal pijat, dan masih
banyak lagi data lainnya.
7
2.1.2 Implementasi Big Data dalam Gojek
Semua interaksi yang dilakukan pengguna dalam aplikasi merupakan data
mentah yang bisa mereka ketahui dalam Big Data. Go-Jek adalah perusahaan
yang memiliki jumlah pengguna yang besar, dimana pasti memiliki data
mentah dalam jumlah besar. Data itu kemudian diolah dan dianalisa agar
menjadi informasi yang berguna bagi berbagai divisi dan perusahaan itu
sendiri. Dalam pengaturan data Go-Jek melakukannya berdasarkan
pengelompokan jenis-jenis jasa yang disediakannya seperti Go-Food, Go-
Ride, Go-Box dan lain sebagainya. Selain itu Go-Jek juga melakukan
pengaturan data yang dikelompokan berdasarkan unit bisnis seperti
keuangan, pemasaran, operasional, dan lain sebagainya.
Go-Jek juga melakukan pengaturan data berdasarkan jenis acara seperti
pemesanan, penawaran, dan pembatalan.
Melalui Big Data Go-Jek dapat menganalisis seluruh data yang masuk dan
dikonversikan oleh tim divisi Data Science mereka yang dipimpin oleh
Crystal Widjaja. Divisi Data Science ini bertugas untuk mengamati,
memilah, mengurai, mengelompokan dan menganalisi hingga
menginterpretasikan data tersebut untuk kemudian memastikan tim divisi
produk yang bersangkutan mendapatkan informasi yang bersangkutan guna
dijadikan sebagai faktor penentu langkah strategis.
8
2.1.3 Ekosistem Big Data Dalam Go-jek
Ekosistem Big Data dalam Gojek menggunakan jenis infrastruktur yang
beragam. Berita terbaru hingga hari ini adalah Gojek menggunakan Google
BigQuery dan Google BigStorage untuk proses warehousing mereka. Hal ini
dinilai sangat sesuai dengan mereka, karena Gojek hanya perlu membayar
biaya untuk penyewaan VPS tanpa harus membangun infrastruktur milik
mereka sendiri.
Sisi Backend dari aplikasi Gojek terdiri dari beberapa jenis DBMS, yaitu
MongoDB, PostgreSQL, dan MySQL(walaupun pada kabar terbaru mereka
mulai beralih dengan menggunakan MariaDB). Seluruh DBMS ini tentunya
mempunyai fungsi yang berbeda-beda, misalkan PostgreSQL dipilih karena
mendukung open connection yang lebih besar dari MySQL. Backend Gojek
juga dibantu dengan bahasa Ruby yang menfasilitasi penggunaan database
yang beragam, sehingga mereka menggunakan Apache Kafka sebagai
aggregator data source ke ETL.
9
Python berfungsi untuk proses machine learning, karena machine learning
memiliki efisiensi tinggi dalam melakukan proses transform. Logstash
merupakan bagian dari Elastic, bersama dengan Elastic Search dan Elastic
Kibana. Kegunaan yang paling terlihat dari Logstash adalah log processing
pada server Gojek.
Tahap terakhir adalah data presentation. Di tahap ini, Gojek melakukan data
visualization untuk diarahkan menjadi informasi yang berguna bagi C-level.
Gojek menggunakan Tableau sebagai data visualization platform. Tableau
menghasilkan bagan dan grafik yang berisi informasi dari data yang diolah
Gojek. Tableau memiliki fungsionalitas yang tinggi dan dapat beroperasi
langsung dengan Google Cloud Storage.
10
Selain itu, Gojek juga dengan berdasarkan pada pola data pelanggan yang
mereka miliki, mereka dapat memprediksi pola perilaku yang dimiliki oleh
pelanggan.
Tidak hanya menggunakan Big Data mereka pada pelanggan, namun Gojek
juga menggunakan Big Data mereka terhadap para driver sebagai agen atau
garda terdepan dari produk layanan mereka. Gojek menganalisis konsep
“who gets what” yaitu driver siapa mendapatkan order apa, hal ini dilakukan
Gojek untuk memaksimal pelayanannya terhadap konsumen seperti
manajemen estimasi waktu, estimasi jarak, estimasi kepadatan lalu lintas
maupun kepadatan order kepada merchant tertentu. Sehingga pembatalan
pemesanan sangat minim terjadi. Sebagai contoh seorang driver memiliki
kebiasaan tidak mengambil order Go-Food untuk arah jalan tertentu, jam
tertentu, dan merchant tertentu. Dari data tersebut Gojek akan mengalihkan
dan memilih driver lain yang memiliki perilaku sebaliknya dari driver
sebelumnya. Sehingga pesanan terkonversi menjadi transaksi berhasil.
11
2.1.5 Tiga Tujuan utama Big Data Gojek menurut Nadiem Makariem
Tiga Tujuan Big Data Gojek.
Menurut Buckley Barlow, seorang growth advisor dan investor, NSM adalah satu faktor
yang berperan dalam kegagalan MySpace dan kesuksesan Facebook. MySpace
menggunakan jumlah sign up sebagai NSM mereka, sementara Facebook fokus pada
jumlah pengguna aktif bulanan sebagai NSM mereka. Jumlah registrasi yang mereka
dapatkan tidak menunjukkan pertumbuhan bisnis mereka karena metrics ini tidak
memberi tahu mereka apakah pengguna yang sign up menggunakan platform mereka.
12
Penggunaan platform adalah metric yang memberitahu mereka apakah customer melihat
value dari produk yang mereka tawarkan. Jika seseorang berhenti menggunakannya,
berarti mereka tidak melihat value dari produk itu. Dengan memperhatikan pengguna
aktif bulanan, Facebook bisa melihat berapa banyak orang yang melihat value dari social
media mereka. Selain itu, Facebook juga bisa melakukan optimasi feed mereka agar
orang semakin betah menggunakan Facebook.
Melalui pernyataan Buckley diatas, dapat kita simpulkan bahwa NSM merupakan suatu
faktor yang sangat penting dalam sebuah perusahaan khususnya startup. Oleh karena itu
pengelolaan Big Data yang baik tidaklah cukup untuk memastikan perusahaan akan
mempunyai strategi bisnis yang akurat dan sesuai. NSM merupakan salah satu faktor
penentu keberhasilan dari sebuah startup.
Unicorn sekelas Gojek pun pernah mengalami masalah yang sama, sebelum akhirnya
mereka menemukan apa yang disebut sebagai North Star Metric. Gojek sempat
menjadikan conversion rate (berapa banyak order yang berhasil selesai dari semua order)
sebagai metrik utama. Tapi mereka menyadari bahwa ini adalah metrik yang salah.
Conversion rate hanya menunjukkan seberapa bagus performa aplikasi. Tapi metrik
tersebut tidak menunjukkan kepuasan driver, pengalaman pengguna, dan apakah value
yang ingin diberikan Gojek tercapai atau tidak.
Dari pengalaman tersebut, Gojek kemudian belajar mengenai pentingnya North Star
Metric. Ketimbang menyimpan segala metrik tanpa tujuan yang jelas, mereka
menentukan satu metrik kunci yang merupakan pedoman keseluruhan perusahaan.
Bagi Gojek, North Star Metric merupakan metrik yang mewakili core value, yang dimana
metrik ini menentukan ke mana arah perusahaan bergerak, apakah suatu fitur dibutuhkan
atau tidak, dan menjadi arahan bagi metrik-metrik lainnya.
13
2.2.1 Core Value Go-Jek
Gojek sendiri memiliki tiga core value yaitu “Speed, Innovation, and Social
Impact”. Para praktiknya, core value ini bertujuan untuk mewujudkan dua
hal, yaitu:
14
Kesimpulan
Berdasarkan pembahasan dalam makalah kali ini, dapat disimpulkan bahwa peranan
Big Data dalam sebuah perusahaan khususnya startup sangatlah penting. Dalam era digitalisasi,
manajemen selalu berevolusi dengan dunia SI dan TI, salah satunya adalah dalam penggunaan
Big Data. Hal ini tentunya sangat memberikan perbedaan mencolok dari semula perusahaan
hanya memanajemen dan memproses data mereka secara konvensional, namun kini perusahaan
harus dapat mengevaluasi cara manajemen mereka agar selalu sesuai dengan perkembangan
jaman dimana data merupakan salah satu aset utama yang mereka miliki dan harus mereka
manage dengan baik dan benar.
Penggunaan SI dan TI dalam organisasi juga harus disertai dengan good management
agar dapat diusahakan secara maksimal dan memberikan dampak yang positif dalam organisasi
tersebut. Sehingga ketika SI dan TI masuk dalam sebuah manajemen, maka bukan hanya
budaya, pekerja, dan manajer yang perlu diperhatikan. Namun teknologi juga menjadi salah
satu faktor yang akan mempengaruhi berbagai sistem manajemen yang ada dalam sebuah
perusahaan.
Sebagai penutup saya mengucapkan terima kasih atas tugas yang diberikan, sehingga
dapat menambah wawasan saya lebih jauh lagi mengenai Big Data dan Implementasinya dalam
sebuah perusahaan. Akhir kata saya meminta maaf sebesar-besarnya apabila terdapat kesalahan
kata maupun pemahaman.
15
Daftar Pustaka
https://www.forbes.com/sites/gilpress/2013/05/09/a-very-short-history-of-big-
data/#2bf0247f65a1
https://idcloudhost.com/mengenal-apa-itu-big-data-sejarah-cara-kerja-dan-peluang-
bisnis/
https://www.dewaweb.com/blog/big-data/
https://www.academia.edu/29497325/MAKALAH_BIG_DATA?auto=download
https://id.scribd.com/document/393683951/Big-Data-Gojek-docx
https://www.coursehero.com/file/38046692/gojek-big-
datadocx/?justUnlocked=1#/doc/qa
https://www.dewaweb.com/blog/startup-metrics-north-star-metric/
http://edocs.ilkom.unsri.ac.id/1691/1/Mengintip%20Ekosistem%20Big%20Data%20d
i%20Gojek.pdf
https://www.coursehero.com/file/34859968/nort-mtrik-star-
gojekdocx/?justUnlocked=1#/doc/qa
16