Visualisasi Data (Edit 21)
Visualisasi Data (Edit 21)
Universitas Indonesia
Data Visualization
Pengantar Sains Data
Outline
Basic of visualization Tujuan visualisasi data: agar bisa
memberikan interpretasi dengan baik jika
data bisa divisualiasikan dengan baik.
Data types and visualization types
1. visualiasi model data eksplorasi
mengenai gambaran apa yang digambarkan itu benar
mengaitkan terhadap visualisasi yang lebih mengaitkan terhadap teknik-teknik
bagaimana mem fit kan suatu data tersebur lebih cocok dengan model yang mana
2. presentasi data
meyakinkan apakah yang diyakinkan itu benar
2
Two Types of Visualization
Tex
3
kaitan visualisasi data dengan
statistik: visualisasi data dalam
statistik lebih
Importance of Visualization menginterpretasikan data lebih
baik dibandingkan dalam bentuk
tabel saja
● Visualisasi berperan penting dalam bidang machine learning
dan data science. Seringkali kita perlu menyaring informasi
kunci yang ditemukan dalam sejumlah data data menjadi
bentuk yang bermakna dan mudah dicerna.
● Visualisasi yang baik dapat menceritakan sebuah cerita
tentang data Anda dengan cara yang tidak dapat dilakukan
oleh sebuah kalimat. pentingnya visualisasi data:
sebelum melakukan tau menjalaknkan suatu analisis, kita harus bisa memvisualisasi data yang kita punya
apalagi model data yang banyak
misal dalam persentase, kita bisa menggambarkan visualisasi dalam bentuk diagram, grafik, line, scatter plot
visualisasi penting dalam mengidentifikasi atau melihat trend, prediksi dari data
terurut. tidak ada rankingnya. Contoh: hewan: {anjing, kucing},
gender: {perempuan, laki-laki}
Contoh Warna (merah, Nilai huruf mahasiswa Suhu dalam Celcius, Panjang jalan, suhu
hijau, biru) (A, B, C, D, E) tanggal dalam kalender dalam Kelvin
tertentu
Nominaland
1. Gender: {male, female, other,prefer not to disclose} nominal
2. Yearly income: {<$18k, $18-40k, $40- 75k, >$75k} ordinal
7
Interval andratiovalues
Which of the following quantities would be considered ratio? (unchecked values
are interval)
interval dan rasio merupakan jenis data yang numerik
1. Length (meters) RASIO
4. IQ Score interval
8
jenis2 visualisasi data:
1. berdasar dari 1 dimensi: fokus pada jenis dan dimensi
VisualizationTypes dari letak data tersebut: bar chart, pie chart, histogram
2. 2D: scatter plot, line plot, box and
whiskerplot, heatmap
3. 3D: scatter matrix, bubble chart
•Instead, we are going to focus on the type and dimensionality of the underlying
data
Scatter Plot
● Scatter plot berfungsi baik untuk
data dengan dua komponen
numerik.
● Scatter plot dapat memberikan
informasi yang berguna terutama
mengenai pola atau pencilan.
● Pada contoh di bawah ini, kita
memiliki data yang terkait dengan Scatter plot: ingin menentukan hunungan
suatu kategori dengan kategori lain
perbedaan lemon dan lime
berdasarkan karakteristik
fisiologis.
bentuk scatter plot yang terlihat buruk: nilai per kategori dibentuk jadi bentuk garis gt
○ Berat (g)
Tex
○ Diameter (cm)
BENTUK 2 DIMENSI
Hetmap: dipakai untuk beberap jenis data yang lain
Sumber Materi:
● Cielen, D., Meysman, A., & Ali, M. (2016). Introducing data science: big
data, machine learning, and more, using Python tools. Manning
Publications Co.
● Google LLC, Google Colabs Documentation, 2020, Machine Learning- Data
Visualizations. Dalam visualisasi data, banyak me refer pada penggunaan inovasi dari
gambar dan teknologi interaktif, agarbisa mengeksplor ke tingkatan
yang lebih besar dan data set yang banyak atau yang punya densitas
Tim Penyusun Materi: yang sangat tinggi sekali
1. Devvi Sarwinda
guna visualisasi data: bisa membantu pengguna melihat pattern,
2. Ari Wibisono hubungan yang susah jika dibuat dalam list text, sangat oenting jika
dibuat dalam chart, diagram, grafik, dashboard
hampir semua bidang menggunakan data sains dan visualisasi data untuk menginterpretasi data mereka
dibandingkan dengan melihat dalam bentuk text list