WEEK 1
Materi :
Introduction & Methodology Data Science
Introduction Data & Database
OUR TEAM
NABIILAH WAHYU
ILLAHI
(https://www.linkedin.com/in/schanabiilah05) (https://www.linkedin.com/in/wahyu-illah01)
Topics
01
Introduction &
Methodology 02 Introduction to
● Framework
methodology
01 1 Introduction & Methodology
Data Science
DATA SCIENTIST
Cabang
Keilmuan Data
Science
Sains Komputasi
(Programming)
Output Data Science
Yang dikategorikan berdasarkan tujuan dilakukannya pengolahan data
3. Recommendation 4. Classification
Algoritma yang dibangun dari eksplorasi data Mirip seperti scoring, dimana algoritmanya dibangun
dengan melihat pola-pola, hubungan antar data berdasarkan data yang sudah ada sebelumnya dan
serta informasi yang di dapat untuk dijadikan dijadikan sebagai formula untuk kategori data
rekomendasi berikutnya.
Misal : algoritma untuk customer yang akan membeli
sebuah barang adalah 1 dan tidak adalah 0, dan
algoritma ini dapat digunakan untuk melihat apakah
customer selanjutnya akan membeli barang atau
tidak
Output Data Science
Yang dikategorikan berdasarkan tujuan dilakukannya pengolahan data
5. Forecasting 6. Detection
Mengarah pada membangun algoritma untuk
Algoritma yang dibangun untuk memprediksi mendeteksi adanya aktivitas anomaly atau tidak
pola dan tren dimana ia dibangun berdasarkan ada sebelumnya dalam rangka mendeteksi dan
pola dan tren pada tiap periode waktu mengantisipasi terjadinya fraud
sebelumnya
Misal : dalam industri retail, memprediksikan
berapa jumlah produk yang harus diproduksi
atau banyak bahan baku yang harus disediakan
agar produksi produk tidak sia-sia
Skill/Keterampilan
Keterampilan Hard Skill dan Soft Skill yang dibutuhkan untuk menjadi seorang Data
Scientist sbb:
● Data Storytelling
● Komunikasi
● Berpikir kritis
● Kerja sama
Keberhasilan Data Science
Contoh keberhasilan Data Science di perusahaan-perusahaan :
Dengan Implementasi Data Science berupa A/B testing, Image Recognition &
Analysis, NLP, Predictive Modelling, Regression Analysis, Collaborative Filtering :
Dari penerapan Data Analytics pada 2008 valuasi meningkat menjadi $25.5 juta dengan
>25 juta orang dari 192 negara menggunakan layanan mereka pada tahun 2015.
Peluang Karir Data Science
Setiap perusahaan memiliki jenjang karir Data Scientist tersendiri , namun salah satu
contoh Jenjang karir data scientist pada tech startup di Indonesia kurang lebih sbb:
1. Data Scientist
2. Senior Data Scientist
3. a. Data Scientist Lead, b. Principal Data Scientist
4. a. Senior Data Science Lead, b. Senior Principal Data Scientist
5. Assistant VP of Data Science
Pengolahan Data
1. Menentukan tujuan 2. Pengumpulan data
pengolahan
Menentukan tujuan berdasarkan Mengumpulkan dan membuat
konteks dan kebutuhan yang dokumentasi data yang diperlukan
berpengaruh pada sistem pengolahan dan mendukung sesuai dengan
data, SDM, dan durasi kerja. tujuan pengolahan data.
Umumnya menggunakan
CRISP-DM (CROSS
INDUSTRY STANDART
PROCESS FOR DATA MINING)
Business Understanding
Meaning: steps:
● Menentukan tujuan, baik itu secara
data mining, project, dan sebagainya
● Mengindentifikasi dan memahami 1. General and Specific
lingkup tujuan dari pengolahan data, objectives
analisis, proses terjadinya data hingga 2. Situational Analysis
semua hal yang berkaitan dengan 3. Broad Goals of data
data yang akan diolah. Dengan tujuan Mining Process
untuk mendapatkan insight dan 4. Project Planning
algoritma prediksi untuk menghasilkan
solusi yang tepat
Analytics Approach
Pendekatan analisis dengan mendeskripsikan sebuah data, bisa dengan
penurunan/kenaikan data serta hubungan antar persamaan/perbedaan dari data
Analisis proses bisnis yang telah dilakukan atau sudah terjadi
deskriptif
Misal : Kenaikan pelanggan setiap hari
Referensi customer terhadap suatu produk
Analisis Pendekatan analisis yang mencari tahu kenapa atau penyebab kenapa sebuah
diagnostik fenomena terjadi
Misal : Penyebab customer lebih memilih produk A daripada B
Mengapa ada perbedaan jumlah customer yang melakukan transaksi di weekend
dan weekdays
Analytics Approach
Analisis Pendekatan analisis yang berfokus pada mendapatkan informasi dari
Prediktif pola atau tren yang sudah ada untuk memprediksi pola atau tren di
waktu mendatang
Misal : prediksi jumlah barang yang terjual di hari libur tertentu
Analisis Pendekatan analisis yang bertujuan untuk membuat rekomendasi dari prediksi
Preskriptif dengan mengutilas model yang sudah dibentuk dan juga melakukan semacam
eksperimen untuk mengetahui rekomendasi yang paling optimal dalam proses
bisnis
Misal : Diskon berapa % yang dipakai untuk meningkatkan jumlah pelanggan?
Data Understanding
Meaning: steps:
● Mengumpulkan data dan mengecek kualitas data
● Pendefinisian atau pemahaman data untuk 1. Indentifical of data source
mendukung atau memaksimalkan data yang (mengidentifikasikan sumber
tersedia dan merumuskannya agar mendapatkan data yang dibutuhkan)
data yang sesuai dengan kebutuhan serta 2. Initial data collection
mencapai hasil yang sesuai dengan tujuan (pengumpulan data misal :
memerlukan data query dari
pengolahan data database, mengambil sample,
dsb)
3. Exploratory data analysis
4. Data quality assessment
(melihat dan menilai kualitas
data)
Data Preparation
● Mempersiapkan data dengan memperbaiki masalah pada data
● Melakukan preprocessing terhadap data
Steps:
1. Data selection process
2. Data preprocessing
3. Data transformation and
derivation
4. Data integration or merging
5. Data formatting
6. Dataset description
(mendeskripsikan set data)
Data Preparation
Performance
Measure
Deployment
02
Data
Data merupakan sekumpulan fakta- Informasi adalah hasil atau bentuk
fakta yang diperoleh dari hasil yang lebih bermakna dari tafsiran
pengukuran atau pengamatan yang yang diperoleh melalui proses
memberikan gambaran suatu pengolahan data.
keadaan.
Pengelompokan Data
Berdasarkan jenis data: Berdasarkan sumber data:
2. Data Kuantitatif
Disajikan dalam bentuk angka yang dapat dihitung
atau dibilangkan.
Contoh: Tinggi Badan, Jumlah anak, Nilai, dll.
Basis data (Database)
Kumpulan data dalam bentuk file/tabel/arsip yang saling terhubung dan
tersimpan dalam media penyimpanan elektronik
FUNGSI DBMS
1. Data definition
2. Data updation
3. Data retrieval
4. User administration
DIFFERENCE
STRUCTURED DATABASE UNSTRUCTURED DATABASE