Data
Visualization
BAGUS PRIAMBODO
BAGUS.P RIAMBODO@MER CUBUANA.AC.ID
BIGGE ST ROCK@ GMAIL.COM
Visualisasi
BIG DATA
MENGERTI / PAHAM
Apa itu visualisasi data
Visualisasi data adalah proses mendapatkan, menginterpretasikan
dan membandingkan data agar ide yang kompleks dapat disampaikan
kepada audience / readers
Sebagai support / memfasilitasi proses identifikasi dan analisis
makna/maksud/arti dari sebuah pattern
Manfaat nya dalam bisnis
Menginterpretasikan data yang tersedia
Mendeteksi pattern dan anomaly
Membuat keputusan
Outliers are also referred to as abnormalities, discordants,
deviants, or anomalies in the data mining and statistics literature.
(Aggarwal, Charu C. Outlier Analysis. Springer New York, 2017)
Visual yang sering digunakan
Visual yang sering digunakan
Bar Chart (Vertical dan Horizontal)
UNTUK MEMBANDINGKAN ANTARA
KATEGORI
Histogram
UNTUK MENAMPILKAN FREKWENSI
(JUMLAH KEMUNCULAN) DARI DATA
NUMERIK
Pie chart
Untuk membandingkan sebuah bagian
data dengan keseluruhan data
LINE CHART = SCATTER CHART ?
Line chart dan
Area Chart
Use a line chart or an area
chart to show changes that
are continuous over time
showing trends in data at equal intervals or
over time
Scatter chart
Scatterplots are used to
understand the relationship
or association between two
variables
Jumlah Suhu
Kicauan (Fahrenheit)
(15 detik)
18 57
20 60
21 64
23 65
27 68
30 71
34 74
39 77
Heatmap
Adalah grafik dimana warna
digunakan sebagai
representasi dari nilai. Untuk
membedakan nilai digunakan
warna
use color saturation to provide visual cues, helping our eyes and brains more quickly
target the potential points of interest
Misleading(Menyesatkan) Chart
Misleading Chart
Visualisasi dalam Riset
KLASIFIKASI
CLUSTERING
PREDIKSI REGRESI
KLASIFIKASI PECANDU NARKOBA
(CONFUSION MATRIX)
Negative(-) Positive(+)
(TN)True-Negative(-) (FP)False-Positive(+)
Negative(-)
Negative
Positive(+) (FN)False-Negative(-) (TP)True-Positive(+)
Positive
Negative or Positive ?
Deteksi suspect pecandu
narkoba (GLCM)
GLCM
Negative Positive
Negative 8 0
Positive 3 5
Negative
Positive
Mencari relationship antara ruas jalan
KORELASI
CLUSTERING SIMILAR TRAFFIC FLOW
KORELASI
PEARSON
JALAN CORRELATION
158536 1
173225 0.892837902
158355 0.844942468
158324 0.798070652
158595 0.751473869
173118 0.70923924
Clustering
CLUSTERING
No Jalan
1 158536
2 173225
3 158324
4 158386
5 158595
6 158415
Prediksi rata rata kecepatan
Library di Python
Matplotlib Seaborn ggplot Bokeh
pygal Plotly geoplotlib Gleam
missingno Leather
Library in R
ggplot2 Lattice highcharter Leaflet
RColorBrewer Plotly sunburstR RGL dygraphs
IMMERSIVE DATA VISUALIZATION
VIRTUAL REALITY
AUGMENTED REALITY
Aesthetics VS Unaesthetic
Further detail about aesthetics read Storytelling with data by Cole Nussbaumer Knaflic