Anda di halaman 1dari 44

LEARNING PROGRESS REVIEW

WEEK 1

Materi :
Introduction & Methodology Data Science
Introduction Data & Database
OUR TEAM

ANDIRA CLARA DERYL


DZULKARNAIN PALUPI BAHARUDIN
(https://www.linkedin.com/in/andzlkrn) (https://www.linkedin.com/in/palupiclr/) (https://www.linkedin.com/in/derylbaharudin)

NABIILAH WAHYU
ILLAHI
(https://www.linkedin.com/in/schanabiilah05) (https://www.linkedin.com/in/wahyu-illah01)
Topics

01
Introduction &
Methodology 02 Introduction to

Data and Database


Data Science

● Apa itu data science? ● Apa itu data dan


& Output dari data database?
science
● Apa itu SQL dan
● Skills data scientist, DBMS?
Keberhasilan data
scientist & Peluang ● Tipe-tipe data
karir
● Data lifecycle
● Pengolahan data,
Insight & Prediksi

● Framework
methodology
01 1 Introduction & Methodology
Data Science

You can enter a subtitle here if you


need it
Apa itu Data Science?

Keterampilan untuk bisa mengolah data dan


menghasilkan informasi yang berupa insight dari
temuan pola dan tren data dan pada tahap
selanjutnya dapat membuat algoritma prediksi yang
didasarkan pada pola hubungan keterkaitan informasi
data

DATA SCIENTIST
Cabang
Keilmuan Data
Science

Sains Komputasi
(Programming)
Output Data Science
Yang dikategorikan berdasarkan tujuan dilakukannya pengolahan data

1. Decision Support 2. Scoring


Mendukung seseorang/sebuah divisi/ instansi Algoritma yang dibangun untuk memprediksi
dalam mengambil keputusan yang berlandaskan data berdasarkan data scoring yang sudah ada
insight dari report dan dashboard yang telah sebelumnya
dianalisis oleh seorang data scientist
Misal : algoritma scoring bank untuk melihat
Misalnya : keputusan untuk menambahkan suatu kemampuan nasabah dalam menyelesaikan
produk dalam kategori clothing dengan tujuan pinjaman
menambah revenue
Output Data Science
Yang dikategorikan berdasarkan tujuan dilakukannya pengolahan data

3. Recommendation 4. Classification
Algoritma yang dibangun dari eksplorasi data Mirip seperti scoring, dimana algoritmanya dibangun
dengan melihat pola-pola, hubungan antar data berdasarkan data yang sudah ada sebelumnya dan
serta informasi yang di dapat untuk dijadikan dijadikan sebagai formula untuk kategori data
rekomendasi berikutnya.
Misal : algoritma untuk customer yang akan membeli
sebuah barang adalah 1 dan tidak adalah 0, dan
algoritma ini dapat digunakan untuk melihat apakah
customer selanjutnya akan membeli barang atau
tidak
Output Data Science
Yang dikategorikan berdasarkan tujuan dilakukannya pengolahan data

5. Forecasting 6. Detection
Mengarah pada membangun algoritma untuk
Algoritma yang dibangun untuk memprediksi mendeteksi adanya aktivitas anomaly atau tidak
pola dan tren dimana ia dibangun berdasarkan ada sebelumnya dalam rangka mendeteksi dan
pola dan tren pada tiap periode waktu mengantisipasi terjadinya fraud
sebelumnya
Misal : dalam industri retail, memprediksikan
berapa jumlah produk yang harus diproduksi
atau banyak bahan baku yang harus disediakan
agar produksi produk tidak sia-sia
Skill/Keterampilan
Keterampilan Hard Skill dan Soft Skill yang dibutuhkan untuk menjadi seorang Data
Scientist sbb:

● SQL & Database


● Python & R
● Data Visualisasi & Business Intelligence
● Statistika
● Machine Learning

● Data Storytelling
● Komunikasi
● Berpikir kritis
● Kerja sama
Keberhasilan Data Science
Contoh keberhasilan Data Science di perusahaan-perusahaan :

Dengan Implementasi Data Science berupa Prediction & Decision Support :


ZARA berhasil meningkatkan revenue sebesar 220% sejak 2004 sampai 2015
Dan mampu menjual 11.000 jenis item per tahun dibandingkan dengan
kompetitornya yang hanya menjual 2000-4000. Serta, meningkatkan efisiensi
pergudangan barang dan proses pembuatan desain baru.

Dengan Implementasi Data Science berupa Prediction & AI for Customers:


Meningkatkan revenue tahunan sebesar $39.12 juta pada tahun 2018 dan 60%
berasal dari bisnis digital

Dengan Implementasi Data Science berupa A/B testing, Image Recognition &
Analysis, NLP, Predictive Modelling, Regression Analysis, Collaborative Filtering :
Dari penerapan Data Analytics pada 2008 valuasi meningkat menjadi $25.5 juta dengan
>25 juta orang dari 192 negara menggunakan layanan mereka pada tahun 2015.
Peluang Karir Data Science

Berdasarkan world economy forum


tahun 2020, keterampilan pada bidang
data menjadi urutan pertama dalam
kebutuhan di dunia kerja dan pada
tahun 2019 World Economy Forum juga
mengeluarkan laporan dengan judul
Data Science in the New Economy: A new
race for talent in the Fourth Industrial
Revolution
Yang menjelaskan bahwa Data Science
menjadi kebutuhan profesi tertinggi di
masa depan
Jenjang Karir Data Scientist
Peluang karir Data Scientist cukup tinggi, berdasarkan hasil pencarian postingan
lowongan data scientist di Indonesia dalam 1 bulan terakhir melalui Linkedin terdapat
817 postingan lowongan.

Setiap perusahaan memiliki jenjang karir Data Scientist tersendiri , namun salah satu
contoh Jenjang karir data scientist pada tech startup di Indonesia kurang lebih sbb:
1. Data Scientist
2. Senior Data Scientist
3. a. Data Scientist Lead, b. Principal Data Scientist
4. a. Senior Data Science Lead, b. Senior Principal Data Scientist
5. Assistant VP of Data Science
Pengolahan Data
1. Menentukan tujuan 2. Pengumpulan data
pengolahan
Menentukan tujuan berdasarkan Mengumpulkan dan membuat
konteks dan kebutuhan yang dokumentasi data yang diperlukan
berpengaruh pada sistem pengolahan dan mendukung sesuai dengan
data, SDM, dan durasi kerja. tujuan pengolahan data.

3. Penggabungan data 4. Melakukan analisis data

Membentuk hubungan keterkaitan Jawaban atas tujuan pengolahan data


antar data sehingga informasi adalah berupa insight atau algoritma
semakin jelas sebagai jawaban dari prediksi, bukan sekedar informasi.
tujuan pengolahan data.
Menemukan Insight
Insight adalah pemahaman yang 1. Analisis Deskriptif
mendalam tentang persoalan tertentu, Mendeskripsikan, menunjukan, atau menyimpulkan data
biasanya berupa pola atau tren yang untuk mendapatkan pola/tren data.
ditemukan melalui proses pengolahan
data.

Pola/tren berguna untuk pengambilan 2. Analisis Diagnostik


keputusan atau rekomendasi Memanfaatkan data untuk menemukan penyebab suatu
langkah-langkah strategis. tren atau korelasi-korelasi antar variabel.

Insight berbasis dengan data, bukan


hanya insting subjektif
3. Teknik Statistik Deskriptif dan Uji Statistik
Cara-cara data scientist menemukan Teknik Statistik untuk merangkum/memaparkan
insight yaitu: karakteristik data sehingga data lebih mudah diamati
dan dipahami.
Membangun Algoritma Prediksi
Algoritma Prediksi diperoleh berdasarkan
hubungan keterkaitan tiap informasi di dalam
data yang sebelumnya telah dikumpulkan dan
digabungkan.

Data scientist menggunakan teori dan aturan


konsep classical statistics, machine learning, atau
human-centered modelling.

Implementasi algoritma prediksi: Aplikasi berbasis website, mobile,


maupun sistem ERP.

Tujuan algoritma prediksi: memberikan keuntungan bagi proses bisnis


perusahaan.
FRAMEWORK
METHODOLOGY

Umumnya menggunakan
CRISP-DM (CROSS
INDUSTRY STANDART
PROCESS FOR DATA MINING)
Business Understanding

Meaning: steps:
● Menentukan tujuan, baik itu secara
data mining, project, dan sebagainya
● Mengindentifikasi dan memahami 1. General and Specific
lingkup tujuan dari pengolahan data, objectives
analisis, proses terjadinya data hingga 2. Situational Analysis
semua hal yang berkaitan dengan 3. Broad Goals of data
data yang akan diolah. Dengan tujuan Mining Process
untuk mendapatkan insight dan 4. Project Planning
algoritma prediksi untuk menghasilkan
solusi yang tepat
Analytics Approach
Pendekatan analisis dengan mendeskripsikan sebuah data, bisa dengan
penurunan/kenaikan data serta hubungan antar persamaan/perbedaan dari data
Analisis proses bisnis yang telah dilakukan atau sudah terjadi
deskriptif
Misal : Kenaikan pelanggan setiap hari
Referensi customer terhadap suatu produk

Analisis Pendekatan analisis yang mencari tahu kenapa atau penyebab kenapa sebuah
diagnostik fenomena terjadi
Misal : Penyebab customer lebih memilih produk A daripada B
Mengapa ada perbedaan jumlah customer yang melakukan transaksi di weekend
dan weekdays
Analytics Approach
Analisis Pendekatan analisis yang berfokus pada mendapatkan informasi dari
Prediktif pola atau tren yang sudah ada untuk memprediksi pola atau tren di
waktu mendatang
Misal : prediksi jumlah barang yang terjual di hari libur tertentu

Analisis Pendekatan analisis yang bertujuan untuk membuat rekomendasi dari prediksi
Preskriptif dengan mengutilas model yang sudah dibentuk dan juga melakukan semacam
eksperimen untuk mengetahui rekomendasi yang paling optimal dalam proses
bisnis
Misal : Diskon berapa % yang dipakai untuk meningkatkan jumlah pelanggan?
Data Understanding
Meaning: steps:
● Mengumpulkan data dan mengecek kualitas data
● Pendefinisian atau pemahaman data untuk 1. Indentifical of data source
mendukung atau memaksimalkan data yang (mengidentifikasikan sumber
tersedia dan merumuskannya agar mendapatkan data yang dibutuhkan)
data yang sesuai dengan kebutuhan serta 2. Initial data collection
mencapai hasil yang sesuai dengan tujuan (pengumpulan data misal :
memerlukan data query dari
pengolahan data database, mengambil sample,
dsb)
3. Exploratory data analysis
4. Data quality assessment
(melihat dan menilai kualitas
data)
Data Preparation
● Mempersiapkan data dengan memperbaiki masalah pada data
● Melakukan preprocessing terhadap data

Steps:
1. Data selection process
2. Data preprocessing
3. Data transformation and
derivation
4. Data integration or merging
5. Data formatting
6. Dataset description
(mendeskripsikan set data)
Data Preparation

Data Data Data


preprocessing transformation
collection

1. Articulating the 1. Formatting 1. Scaling/


problem 2. Cleaning normalizing
2. Define data 3. sampling 2. Decomposition
required 3. Aggregation
3. Gathering and
combining data
from different
sources
Modelling Data
Preparations

● Tahap paling penting Feature


● Membuat model dengan membangun algoritma
Engineering
dan mendapatkan insight untuk mendapatkan
rekomendasi yang sesuai dengan tujuan
dilakukannya pengolahan data
Data
Modelling

Performance
Measure
Deployment

● Disebut dengan rencana penggunaan model


● Perencanaan dimulai selama tahap business understanding
● Menggabungkan sistem scoring dan algoritma machine learning untuk
diaplikasikan pada sistem operasional
● Tahap ini tidak hanya menghasilkan nilai model namun mengkonversikan skor
keputusan dan menggabungkan keputusan dalam sistem operasional
Introduction to
Data and Database
2

02
Data
Data merupakan sekumpulan fakta- Informasi adalah hasil atau bentuk
fakta yang diperoleh dari hasil yang lebih bermakna dari tafsiran
pengukuran atau pengamatan yang yang diperoleh melalui proses
memberikan gambaran suatu pengolahan data.
keadaan.
Pengelompokan Data
Berdasarkan jenis data: Berdasarkan sumber data:

1. Data Kualitatif 1. Data Primer:


Disajikan dalam bentuk kata-kata yang menjelaskan Hasil observasi/pengukuran langsung melalui wawancara,
karakteristik suatu hal. Umumnya disajikan dalam eksperimen, survey, atau kuesioner.
skala pengukuran:
2. Data Sekunder: Dari data yg sudah tersedia
a. Skala Nominal (Tidak mengandung Dari data yang sudah tersedia/sudah dikumpulkan
pemeringkatan) sebelumnya
Contoh: (Pria/Wanita), (Rumah/Kost/Apartment), dll.

b. Skala Ordinal (Berdasarkan peringkat, derajat, atau


level)
Contoh: (SD/SMP/SMA/S1),(Kualitas 1/2/3)

2. Data Kuantitatif
Disajikan dalam bentuk angka yang dapat dihitung
atau dibilangkan.
Contoh: Tinggi Badan, Jumlah anak, Nilai, dll.
Basis data (Database)
Kumpulan data dalam bentuk file/tabel/arsip yang saling terhubung dan
tersimpan dalam media penyimpanan elektronik

Fungsi dan tujuan database:

1. Kecepatan dan kemudahan (Speed)


2. Efisien ruang penyimpanan (Space)
3. Keamanan (Security)
4. Kemudahan berbagi (Shareability)
5. Standarisasi (Standardization)
6. Keakuratan (Accuracy)
7. Konsistensi data (consistent)
DBMS
Database Management System atau DBMS adalah perangkat lunak yang
dirancang untuk menghubungkan basis data dengan para user, agar
pengelolaan data dapat berproses dengan baik.

FUNGSI DBMS

1. Data definition
2. Data updation
3. Data retrieval
4. User administration
DIFFERENCE
STRUCTURED DATABASE UNSTRUCTURED DATABASE

PROS CONS PROS CONS

● Mudah ● Penggunaan ● Format tetap asli ● Penggunaan


digunakan untuk yang terbatas. ● Pemrosesan yang terbatas
Machine lebih cepat.
Learning. ● Lebih hemat
● Mudah ketika disimpan
digunakan untuk di data lake.
business user.
● Digunakan oleh
banyak tools.
SQL

SQL FUNGSI SQL

SQL atau Standard Query 1. Dapat memanipulasi dan


Language, adalah bahasa mengakses database
pemrograman yang memberikan 2. Mengeksekusi query atau
perintah untuk mengakses dan perintah langsung kepada
mengolah data berbasis relasional sistem untuk mengelola system
pada sebuah sistem database. database
3. Dapat mengatur akses user
pada database
TIPE DATA
Tipe data adalah skema pengkodean
terperinci yang dikenali oleh perangkat
lunak sistem, seperti DBMS, untuk
mewakili data organisasi (Hoffer et al.
2013).

Tipe data sangat berpengaruh pada


pengolahan data karena pemrosesan
suatu tipe data tidak sama dengan
tipe data lainnya. Gambar SQL Data Type
THANK YOU

Anda mungkin juga menyukai