Anda di halaman 1dari 16

Data Analysis

with Python
Tasya Amanda Adinegara
Analogi
Apa itu Exploratory Data Analysis (EDA)?
EDA mengacu pada proses kritis dalam melakukan penyelidikan awal pada
data untuk menemukan pola, untuk menemukan anomali, untuk menguji
hipotesis dan untuk memeriksa asumsi dengan bantuan statistik ringkasan
dan representasi grafis.
Mengapa EDA penting dalam Data Science?
Dimana EDA berada pada proses Data Science?

Data scientist menghabiskan sekitar 60-70% dari waktu mereka dalam sebuah proyek yang bekerja
melalui data cleaning hingga feature engineering. Kira-kira 40–50% dari waktu itu dihabiskan di EDA.
Proses EDA
Sneak peek into the Data
Kita bisa melakukan ini di notebook Jupyter dengan
mengambil potongan data dalam format dan menggunakan
libraries seperti Plotly, Matplotlib, Seaborn untuk wawasan
awal. Kita juga bisa menggunakan Power BI atau Tableau.
Dasbor berikut memberikan gambaran umum serta
memberikan wawasan kepada pemangku kepentingan
tentang bagaimana kinerja organisasi, sejauh mana tujuan
analisis berkembang.
Data Validation
Langkah ini memeriksa untuk
melihat apakah data memiliki
anomali, nilai yang hilang, atau
pencilan. Dan memastikan tidak
ada kesalahan pada tahap
pendataan.
Univariate
Analysis
Visualisasi univariat
dari setiap bidang
dalam kumpulan data
mentah, dengan
statistik ringkasan.
Bivariate Analysis
Visualisasi bivariat dan statistik
ringkasan yang memungkinkan
Anda menilai hubungan antara
setiap variabel dalam kumpulan data
dan variabel target yang Anda lihat.
Multivariate Analysis
Ini dilakukan melalui plot
multivariate seperti plot 3D untuk
mengevaluasi hubungan antar fitur,
dan terakhir, memahami fitur yang
penting untuk latihan machine
learning apa pun.
Study Case : Hospital
Descriptive Analytics (?)

Diagnostics Analytics (?)

Predictive Analytics (?)

Prescriptive Analytics (?)


Data Visualization in EDA
Alat EDA
Terimakasih

Anda mungkin juga menyukai