Sejak era internet dan smartphone semakin mudah diakses oleh berbagai lapisan masyarakat, data
pun semakin mudah dikumpulkan, akibatnya volume data menjadi meningkat drastis. Saat ini data
tersedia dalam jumlah melimpah, dengan bentuk yang beragam, serta perlu kita olah agar tumpukan
volume data yang besar tersebut bisa disarikan dalam sebuah insight yang berguna.
Volume data terus berkembang secara signifikan. Jadi kita memerlukan Teknik dan strategi yang tepat
untuk ‘memperlakukan’ data. Dimulai dari proses pengambilan (data mining), penyimpanan (data
storage), pengolahan (data analysis), dan visualisasi data sebagai tahap penyajian (data visualization)
Data science adalah ilmu yang menggabungkan matematika, statisika dengan ilmu komputer dengan
tujuan analisa data (data analysis) dari suatu himpunan data baik skala kecil (sampel) maupun besar
(populasi) dengan mengaplikasikan algoritma tertentu untuk tujuan menggali data (data mining) dan
mendapatkan pola data serta dapat melakukan prediksi (data prediction) dengan cukup akurat yang
dapat membantu dalam pengambilan keputusan dan dapat digunakan untuk membuat sistem yang
cerdas (AI) yang dapat terus belajar dengan sendirinya (machine learning).
Menurut Chikio Hayashi dari Institut Statistika Matematika Sakuragaoka, pengertian data science
adalah ilmu pengetahuan interdisiplin tentang metode komputasi untuk mendapatkan wawasan
berharga yang dapat ditindaklanjuti dari kumpulan data yang mencakup tiga fase yaitu desain data,
mengumpulkan data, dan analisis data. Sebagai ilmu interdisiplin, data science mempunyai definisi
yang berbeda-beda dari akademisi maupun praktisi yang berkecimpung di dalamnya.
Data science atau ilmu data merupakan ilmu terapan baru yang perkembangannya dituntut oleh
meningkatnya penggunaan teknologi secara signifikan. Data science digunakan oleh perusahaan
maupun instansi tertentu untuk melakukan analisis data yang tidak bisa dilakukan dengan metode
sederhana. Misalkan marketplace Tokopedia memerlukan suatu pengetahuan yang dapat melakukan
analisis data penjual dan pembeli di platform mereka. Tentunya, data yang mereka punyai setiap
detiknya terus berubah atau bertambah. Sehingga diperlukan suatu metode komputasi untuk
mengambil data tersebut serta melakukan perhitungan yang dapat menganalisis informasi pada data
tersebut. Disinilah peran data science dalam pemenuhan kebutuhan suatu perusahaan atau instansi.
DATACADEMY 1
Kemampuan apa yang dibutuhkan ?
DATACADEMY 2
Data Science melibatkan proses berikut :
• Data Mining adalah proses pengambilan informasi dari pola data dari himpunan data yang
sebelumnya tidak diketahui, kadang disebut juga Data Discovery.
Data Mining fokus pada mengekstrak pola menggunakan metode statistik untuk dianalisa
dan dapat juga melakukan prediksi.
• Machine learning adalah bidang yang merupakan bagian dari Artificial Intelligence (AI) yang
digunakan agar sistem komputer secara otomatis dapat belajar dengan sendirinya tanpa
diberi instruksi pemrograman dan dapat meningkatkan prediksi yang akurat dan
pengunaannya biasanya sifatnya realtime.
Jadi Data Mining dan Machine Learning merupakan bagian dari Data Science
Menggali data dan memberikan informasi seakurat mungkin yang digunakan untuk :
• Deskripsi yaitu menampilkan pola data untuk dianalisa dan penemuan masalah.
• Prediksi yaitu melakukan prediksi berupa nilai, probabilitas maupun data dan kemudian
merekomendasikan hasilnya untuk digunakan sebagai alat bantu pengambil keputusan maupun
Penerapan keilmuan Data science di bidang Industri setidaknya diaplikasikan kedalam dapat 3 kategori
DATACADEMY 3
1) Business Intelligence (BI)
BI adalah bidang yang menganalisis data masa lampau untuk memahami bagaimana dan(atau)
mengapa suatu peristiwa terjadi dan memanfaatkan pengetahuan tersebut untuk menentukan
keputusan.
Misalnya menganalisis kenapa sales turun pada tahun 2018. Data digunakan untuk membuat reports
untuk menambah wawasan bisnis.
Teknik yang digunakan dengan mengekstrak info dan menampilkan dalam bentuk Metrics, KPI dan
reports. Contoh digunakan untuk mengoptimalkan harga atau management inventory.
Note: Tool Qualitative analysis seperti SWOT tidak digunakan dalam quantitative analysis, jadi
SWOT tidak termasuk dalam Business Intelligence.
2) Traditional Method
Bidang data science yang melakukan prediksi analitik. Melakukan estimasi kemungkinan yang akan
terjadi di masa depan dengan menggunakan metoda statistik tingkat lanjut. Teknik yang digunakan
adalah regression, logistic regression, clustering dan lainnya.
Sama seperti traditional method, ML melakukan prediksi analitik, namun menggunakan teknik
penggunaan Artificial Intelligence (AI) atau Kecerdasan Buatan untuk melakukan prediksi.
Teknik yang digunakan: Supervised Learning, Unsupervised Learning dan Reinforcement Learning.
DATACADEMY 4
• Bahasa yang digunakan: R, Python, MatLab, Java, Scala.
• Software yang digunakan: Microsoft Azure, rapidminer.
• Profesi: Data Scientist, ML Engineer
Bagaimana Machine Learning bekerja dan apa bedanya dengan pemrograman tradisional
pada umumnya?
Pemrograman tradisional membutuhkan Data sebagai input dan program yang sudah dibuat untuk
menghasilkan output.
Machine Learning hanya membutuhkan Data sebagai input dan contoh output yang diinginkan, dan
sistem akan mencari dengan sendirinya program perhitungannya.
DATACADEMY 5