Anda di halaman 1dari 21

Oleh :

ARFAH
RAMIDA PASBI RD LUBIS
SITI KHADIJAH
SILVIA NOVITA
Hasil survei (secara terbatas) ke lingkungan SLTA dan masyarakat Indonesia,
ditemukan bahwa mayoritas dari mereka belum mengenal Data Science.
Diera industri 4.0. Data Science merupakan salah satu bidang yang penting dan
dibutuhkan disemua bidang (industri, ritel, jasa, pariwisata, pendidikan dll).
Dalam laporan Global Skill Index 2020 yang diterbitkan Coursera (penyelegara kursus
daring global), untuk bidang Data Science, Indonesia berada pada posisi lagging atau
tertinggal, dari 60 negara (di benua Amerika, Eropa, Asia, Afrika, dan Australia) yang
ditelaah Indonesia berada pada di posisi 56.
Untuk mengejar ketertinggalan tersebut adalah dengan menyiapkan SDM di bidang
Data Scinece.
 Apa itu Data Science?
 Profesor Murtaza Haider dari Ryerson University di Kanada mendefinisikan
dengan memberikan ilustrisi sebagai berikut: Jika kita memiliki data, lalu kita
memiliki curiousity
 “rasa ingin tahu” tentang “kandungan” atau “isi” data yang bermanfaat), lalu
untuk menjawab rasa ingin tahu tersebut kita mempelajari data, melakukan
eksplorasi terhadap data itu, “memanipulasi”-nya, melakukan berbagai hal
untuk menganalisis data tersebut dengan memanfaatkan ilmu dan teknologi
tertentu untuk mendapatkan jawaban, itulah data science!
Setiap organisasi yang telah memiliki sistem-sistem
teknologi informasi operasional sebagai sumber data
akan memanfaatkan data tersebut dalam kegiatan
operasional untuk meningkatkan produktivitas dengan
efisien dan tepat sasaran secara umum langkah tersebut
seperti gambar dibawah ini:
 Sampai saat ini, revolusi industri sudah terjadi 4 kali, yaitu:
• Pertama, terjadinya mekanisasi peralatan industri dengan memanfaatkan tenaga air
dan uap.
• Kedua, pabrik-pabrik mampu melakukan perakitan atau produksi barang secara masal
dengan menggunakan tenaga listrik.
• Ketiga, industri mulai mengadopsi komputer-komputer dan proses otomatisasi dengan
memanfaatkan sistem cerdas, menggunakan data dan algoritma-algoritma Machine
Learning.
• Selanjutnya, Industri 4.0 dengan mengkombinasi berbagai sistem teknologi informasi
Internet of Thing (IoT) yang tersambung secara digital sehingga mampu
berkomunikasi untuk saling berbagi informasi. Dengan memanfaat jaringan dan
peralatan yang serba pintar tanpa campur tangan manusia yang berdampak pada
kegiatan industri yang efisien dan produktif.
 Untuk lingkup global, berikut ini informasi dari beberapa sumber:
McKinsey & Company, penyedia layanan konsultasi manajemen
dan strategi bisnis, melaporkan bahwa teknologi Artifical
Intelligent (AI) yang termasuk Machine Learning makin banyak
dibutuhkan karena memberikan keuntungan-keuntungan di bidang
bisnis (McKinsey, 2018).
World Economic Forum (WEC) melaporkan kebutuhan data
scientist yang meningkat pada berbagai bidang, misalnya pada
industri yang berbasis teknologi informasi, media dan hiburan,
layanan finansial dan investasi, layanan profesional, pemerintah,
dll. (WEC, 2019).
 Asia-Pacific Economic Cooperation (APEC) pada laporan tahun
2017 menuliskan: Data Science and Analytics (DSA) skills are in
high demand, but supply is critically low with employers facing
severe shortages (APEC, 2017).
 LinkedIn, organisasi yang mengelola jaringan para profesional di
Internet yang terbesar, pada laporan tahun 2020 menempatkan data
scientist di top 10 emerging jobs di berbagai negara, seperti
Amerika Serikat (Linkedin-US, 2020), Kanada (Linkedin-CA,
2020), Australia
 (Linkedin-Aus, 2020). Demikian juga di kawasan ASEAN, seperti
Singapura (Linkedin-Sing, 2020) dan Malaysia (Linkedin-Malay,
2020).
 Pada laporan yang dirilis LinkedIn tahun 2020, kebutuhan data
scientist di Indonesia menempati urutan ke empat.
 perusahaan/industri bahkan institusi pendidikan sangat
membutuhkan data science.
 untuk perusahaan ritel seperti Tokopedia, Bukalapak, Blibli dan
Lazada tidak mampu untuk mengolah data dengan baik maka
akan collapse (tidak mampu bersaing). Demikian juga
 otomotif. Industri pariwisata juga membutuhkan data science.
 Hasil survei, saat ini kebutuhan data scientist di Indonesia
diperkirakan baru terpenuhi sekitar 50%4. Hasil ini dilakukan
oleh Sharing Vision terhadap 27 perusahaan.
 Apa itu big data ?
 Big Data merupakan aset informasi yang dicirikan oleh
karakteristik 3v, yaitu: volume, velocity dan variety yang tinggi,
yang memerlukan metode dan teknologi tertentu untuk
memprosesnya menjadi pengetahuan (knowledge) yang bernilai
(value) dalam pengambilan keputusan. Atau aset yang berharga
seperti aset lain (mesin, material, orang, modal, dan metode) dan
dapat divaluasi (dinilai dalam satuan uang)
 Konsep hirarki data information knowledege wisdom (DIKW)
(Rowley, 2007) atau sering disebut sebagai wisdom hierarchy potensi
informasi yang tersedia untuk ditransformasi menjadi pengetahuan
(knowledge) sehingga dapat mengoptimalkan pengambilan keputusan
(wisdom).
 Big data memiliki karakteristik volume yang tinggi, dari terabytes ke zettabytes.
Hal ini berkonsekuensi pada kapasitas penyimpanan dan kapasitas pemrosesan
data yang tidak dapat ditangani oleh metode dan teknologi informasi
konvensional saat ini. Karakteristik velocity pada big data mengubah sudut
pandang pemrosesan data secara batch, menjadi pemrosesan data secara
dinamis. Dengan demikian data tidak lagi dilihat secara statis,
 namun secara dinamis sebagai stream. Selain sebagai data stream, big data juga
berkaitan dengan pergerakan data dalam jumlah besar (high volume movement)
seperti data spasial, citra,dan lainnya.
 umum (general purpose), seperti Hadoop, Spark, Flink, Tez
 pemroses query (big SQL), seperti: Hive, Spark SQL, Implala, HawQ,
IBM Big SQL
 pemroses big graph, seperti: pregel, graphLab, GraphX, dan
 pemroses big stream, seperti: Storm, S4, Infosphere stream, flink, dan
Spark Stream.
 teknologi big data bukanlah suatu teknologi tunggal. teknologi big data
menggambarkan komponen-komponen yang diperlukan, dan interaksi antar
komponen sehingga sistem big data secara keseluruhan dapat berjalan
 Pemroses big data (P) diperlukan pustaka teknologi (library L1
 sampai Ln) dari platform teknologi pemrosesan big data (yang
telah dibahas di bagian 2). Komponen pemroses (P) atau
mediator (M) berkomunikasi dengan media penyimpanan (big
storage - BS). Media penyimpanan digunakan untuk menyimpan
data mentah (raw data) maupun data hasil
pengolahan/pemrosesan (result). Hasil pengolahan/pemrosesan
tersebut perlu dikirim ke konsumen (consument C1 sampai Cn)
baik melalui pemroses secara langsung
 (P) maupun melalui mediator (M) secara berkala sebagai proses
propagasi atau siknronisasi.
 Teknologi Hadoop ini saling bekerjasama untuk memberikan
solusi pemrosesan big data.
 Selain teknologi open source yang tergabung pada ekosistem
Hadoop
 Pemain utama (leader) teknologi big data komersial tersebut
adalah:
 (1) Amazon Web Service(AWS),
 (2) Microsoft Azure,
 (2) Google Cloud Platform (GCP).
 Sedangkan pemain dengan kapabilitas
 menengah ke bawah (nice player) adalah IBM, Oracle dan
Alibaba Cloud.
 Penggunaan teknologi big data untuk mengantisipasi penyebaran
 berita bohong (hoax) contoh dari media sosial Twitter. Analisis hoax atau
tidak dilakukan menggunakan algoritma machine learning berupa algoritma
clustering dan klasifikasi. Hasil analisis dikirimkan ke situs www.antihoax.id
yang memiliki basis data MySQL enterprise.
 Big data merupakan aset informasi yang penting yang jika
ditangani dengan baik akan memberikan manfaat penting dalam
pengambilan keputusan organisasi dan bersifat data driven.
Karakteristik volume yang besar, kecepatan yang tinggi dan
sumber serta format yang beragam memerlukan teknologi
pemrosesan yang khusus agar tidak menimbulkan masalah data
deluge.
TERIMAKASI
H

Anda mungkin juga menyukai