Anda di halaman 1dari 5

INTRODUCTION TO DATA SCIENCE

Sejak era internet dan smartphone semakin mudah diakses oleh berbagai lapisan masyarakat, data
pun semakin mudah dikumpulkan, akibatnya volume data menjadi meningkat drastis. Saat ini data
tersedia dalam jumlah melimpah, dengan bentuk yang beragam, serta perlu kita olah agar tumpukan
volume data yang besar tersebut bisa disarikan dalam sebuah insight yang berguna.

Volume data terus berkembang secara signifikan. Jadi kita memerlukan Teknik dan strategi yang tepat
untuk ‘memperlakukan’ data. Dimulai dari proses pengambilan (data mining), penyimpanan (data
storage), pengolahan (data analysis), dan visualisasi data sebagai tahap penyajian (data visualization)

Apa itu Data Science ?

Data science adalah ilmu yang menggabungkan matematika, statisika dengan ilmu komputer dengan
tujuan analisa data (data analysis) dari suatu himpunan data baik skala kecil (sampel) maupun besar
(populasi) dengan mengaplikasikan algoritma tertentu untuk tujuan menggali data (data mining) dan
mendapatkan pola data serta dapat melakukan prediksi (data prediction) dengan cukup akurat yang
dapat membantu dalam pengambilan keputusan dan dapat digunakan untuk membuat sistem yang
cerdas (AI) yang dapat terus belajar dengan sendirinya (machine learning).

Menurut Chikio Hayashi dari Institut Statistika Matematika Sakuragaoka, pengertian data science
adalah ilmu pengetahuan interdisiplin tentang metode komputasi untuk mendapatkan wawasan
berharga yang dapat ditindaklanjuti dari kumpulan data yang mencakup tiga fase yaitu desain data,
mengumpulkan data, dan analisis data. Sebagai ilmu interdisiplin, data science mempunyai definisi
yang berbeda-beda dari akademisi maupun praktisi yang berkecimpung di dalamnya.

Data science atau ilmu data merupakan ilmu terapan baru yang perkembangannya dituntut oleh
meningkatnya penggunaan teknologi secara signifikan. Data science digunakan oleh perusahaan
maupun instansi tertentu untuk melakukan analisis data yang tidak bisa dilakukan dengan metode
sederhana. Misalkan marketplace Tokopedia memerlukan suatu pengetahuan yang dapat melakukan
analisis data penjual dan pembeli di platform mereka. Tentunya, data yang mereka punyai setiap
detiknya terus berubah atau bertambah. Sehingga diperlukan suatu metode komputasi untuk
mengambil data tersebut serta melakukan perhitungan yang dapat menganalisis informasi pada data
tersebut. Disinilah peran data science dalam pemenuhan kebutuhan suatu perusahaan atau instansi.

DATACADEMY 1
Kemampuan apa yang dibutuhkan ?

Kemampuan yang dibutuhkan seorang Data Scientist

• Kemampuan Matematika dan Statistika


• Kemampuan Pemrograman (R, Python, dan lainnya)
• Kemampuan Database dan Query (SQL dan lainnya) dan pengolahan data
• Kemampuan analisa data dan visualisasi data
• Kemampuan pemahaman masalah terkait bisnis atau suatu bidang lainnya

Apa beda Data Science, Data Mining & Machine Learning ?

DATACADEMY 2
Data Science melibatkan proses berikut :
• Data Mining adalah proses pengambilan informasi dari pola data dari himpunan data yang
sebelumnya tidak diketahui, kadang disebut juga Data Discovery.
Data Mining fokus pada mengekstrak pola menggunakan metode statistik untuk dianalisa
dan dapat juga melakukan prediksi.
• Machine learning adalah bidang yang merupakan bagian dari Artificial Intelligence (AI) yang
digunakan agar sistem komputer secara otomatis dapat belajar dengan sendirinya tanpa
diberi instruksi pemrograman dan dapat meningkatkan prediksi yang akurat dan
pengunaannya biasanya sifatnya realtime.

Jadi Data Mining dan Machine Learning merupakan bagian dari Data Science

Tujuan Data Science

Menggali data dan memberikan informasi seakurat mungkin yang digunakan untuk :

• Deskripsi yaitu menampilkan pola data untuk dianalisa dan penemuan masalah.

• Prediksi yaitu melakukan prediksi berupa nilai, probabilitas maupun data dan kemudian

merekomendasikan hasilnya untuk digunakan sebagai alat bantu pengambil keputusan maupun

secara langsung digunakan secara otomatis oleh sistem.

Penerapan Data Science

Penerapan keilmuan Data science di bidang Industri setidaknya diaplikasikan kedalam dapat 3 kategori

besar berikut ini:

1) Business Intelligence (BI).


2) Traditional Method (Statistik Tingkat Lanjut).
3) Machine Learning (ML).

DATACADEMY 3
1) Business Intelligence (BI)

BI adalah bidang yang menganalisis data masa lampau untuk memahami bagaimana dan(atau)
mengapa suatu peristiwa terjadi dan memanfaatkan pengetahuan tersebut untuk menentukan
keputusan.

Misalnya menganalisis kenapa sales turun pada tahun 2018. Data digunakan untuk membuat reports
untuk menambah wawasan bisnis.

Teknik yang digunakan dengan mengekstrak info dan menampilkan dalam bentuk Metrics, KPI dan
reports. Contoh digunakan untuk mengoptimalkan harga atau management inventory.

• Bahasa yang digunakan: R, Python, SQL, MatLab.


• Software yang digunakan: Ms Excel, Power BI, SAS, Tableu.
• Profesi: BI Analyst, BI Consultant, BI Developer.

Note: Tool Qualitative analysis seperti SWOT tidak digunakan dalam quantitative analysis, jadi
SWOT tidak termasuk dalam Business Intelligence.

2) Traditional Method

Bidang data science yang melakukan prediksi analitik. Melakukan estimasi kemungkinan yang akan
terjadi di masa depan dengan menggunakan metoda statistik tingkat lanjut. Teknik yang digunakan
adalah regression, logistic regression, clustering dan lainnya.

Umumnya digunakan dibidang untuk memprediksi user experience, sales forecasting.

• Bahasa yang digunakan: R, Python dan MatLab.


• Software yang digunakan: Ms Excel, IBM SPSS.
• Profesi: Data Analyst, Data Scientist.

3) Machine Learning (ML)

Sama seperti traditional method, ML melakukan prediksi analitik, namun menggunakan teknik
penggunaan Artificial Intelligence (AI) atau Kecerdasan Buatan untuk melakukan prediksi.

Teknik yang digunakan: Supervised Learning, Unsupervised Learning dan Reinforcement Learning.

Umumnya digunakan untuk deteksi fraud, client retention.

DATACADEMY 4
• Bahasa yang digunakan: R, Python, MatLab, Java, Scala.
• Software yang digunakan: Microsoft Azure, rapidminer.
• Profesi: Data Scientist, ML Engineer

Bagaimana Machine Learning bekerja dan apa bedanya dengan pemrograman tradisional
pada umumnya?

Pemrograman tradisional membutuhkan Data sebagai input dan program yang sudah dibuat untuk
menghasilkan output.

Machine Learning hanya membutuhkan Data sebagai input dan contoh output yang diinginkan, dan
sistem akan mencari dengan sendirinya program perhitungannya.

Mari kita lihat contoh berikut

Agar mesin dapat ‘belajar’, maka dibutuhkan 2 jenis data yaitu :

• Data Training berisi data fakta yang ada


• Data Tes berisi data yang ingin diprediksi

DATACADEMY 5

Anda mungkin juga menyukai