Anda di halaman 1dari 8

VISUALISASI DATA TEORI

UNIVERSITAS TEKNOKRAT INDONESIA

“BAB 2 Menerjemahkan Angka Ke Gambar”

AHMAD SETIAWAN
20311440
SI 20 Ex

PROGRAM STUDI SISTEM INFORMASI


FAKULTAS TEKNIK DAN ILMU KOMPUTER
UNIVERSITAS TEKNOKRAT INDONESIA
TA 2021/2022
MENERJEMAHKAN ANGKA KE GAMBAR

Juga, pembaca harus dapat melakukannya tanpa menjulurkan leher, menggaruk-garuk


kepala, dan secara umum berjuang untuk mendapatkan gambaran itu, atau mereka mungkin
menyerah dan melanjutkan. Kebingungan hanya beberapa detik yang akan menghalangi
sebagian besar audiens Anda, karena rentang perhatian yang pendek, tuntutan lain pada
waktu mereka, dan fobia matematika. Anda memiliki sesuatu yang penting untuk ditunjukkan
kepada mereka, lanjutkan, jangan buat mereka bekerja untuk itu. Tak perlu dikatakan, mereka
juga harus sampai pada angka yang benar dan tidak disesatkan oleh visualisasi.

DAPAT DIJALANKAN: CONTOH VISUAL ENCODING

Cara terbaik untuk mengatasi dengan gagasan yang terdengar abstrak ini adalah langsung
masuk dan mencoba contoh sederhana. Turun untuk memastikan mereka bisa berhenti
dengan aman.

Cara membaca diagram garis

Bagan garis hampir selalu menelusuri garis dari kiri ke kanan, dengan ketinggian garis
menunjukkan nilai bunga utama. Poin tinggi, poin rendah, periode stabilitas dan garis yang
melintasi garis lain semuanya menarik bagi pembaca dan relatif mudah untuk dipilih. Ketika
ada terlalu banyak baris, dan masing-masing banyak bergerak ke atas dan ke bawah, itu dapat
dengan cepat menjadi terlalu berantakan untuk dibaca dengan andal . Salah satu solusi untuk
ini adalah dengan menggunakan «kelipatan kecil», yang akan kita bahas kembali di Bab 12.

Terkadang, bagan garis menggunakan satu sumbu vertikal di sebelah kiri dan sumbu lainnya
di sebelah kanan, dan nilainya terkait dengan garis yang berbeda. Ini umumnya merupakan
ide yang buruk karena mengkodekan dua variabel ke parameter yang sama – lokasi vertikal –
menyerahkannya kepada pembaca untuk membedakannya. Selalu berusaha untuk membuat
segala sesuatunya semudah mungkin bagi pembaca Anda. Cerita di balik visualisasi ini
adalah tentang membandingkan musim gugur dengan waktu lain dalam setahun, jadi kami
membutuhkan pembaca untuk dapat mengidentifikasi musim gugur.

Salah satu pendekatan akan menyorotinya, yang telah saya lakukan dalam dua cara pada
Gambar 2.3. Di sebelah kiri, satu periode setiap tahun dipilih dengan titik berwarna, dan di
sebelah kanan, bayangan berwarna digunakan untuk mengidentifikasi pertengahan September
hingga pertengahan Desember. Titik-titik memiliki keuntungan menunjukkan dengan tepat di
mana letak data musim gugur, tetapi mulai menjadi terlalu sibuk secara visual untuk dibaca
dengan mudah. Poinpoin yang mengidentifikasi musim gugur di setiap tahun mungkin
berhasil, tetapi garis-garis permen itu mengganggu dan membebani pembaca.

Pada Gambar 2.3, saya secara efektif membuat variabel baru, yang hanya mengidentifikasi
musim gugur. Ini hanyalah varian dari variabel waktu yang sudah kita miliki. Kita dapat
mengambil pendekatan lain untuk membantu pembaca membandingkan musim gugur dengan
sisa tahun, sekali lagi membuat varian pada variabel waktu dengan membaginya menjadi
tahun dan periode 4 minggu. Dalam plot sebar, kita tidak bisa lagi membedakan tahun mana
titik tertentu milik, dan dalam diagram garis, meskipun ada satu baris per tahun, mereka
berbaur begitu banyak sehingga tidak mungkin untuk melacak garis apapun di grafik.

Kami telah menggunakan posisi horizontal dan vertikal, jadi kami membutuhkan parameter
bagan lain untuk menunjukkan tahun mana setiap penanda atau garis milik. Jika kita hanya
memiliki beberapa tahun, warnanya mungkin sangat berbeda sehingga kita bisa membedakan
masing-masing. Anda harus mempertimbangkan ini jika Anda ingin pesannya jelas dan tidak
dibanjiri oleh kebisingan yang tidak relevan. Saya ingin menutup contoh ini dengan
memecahkan pengkodean vertikal horizontal penundaan dan waktu yang telah kita gunakan
selama ini.

Mungkin % penundaan/pembatalan sebenarnya tidak terlalu penting seperti hanya


mengidentifikasi periode terburuk di setiap tahun. Pada Gambar, data ditampilkan sebagai
kisi berwarna, dengan tahun dikodekan ke posisi horizontal, periode 4 minggu ke posisi
vertikal, dan % penundaan/pembatalan berwarna. Untuk menghindari kelebihan warna yang
kita lihat sebelumnya, hanya tiga periode terburuk di setiap tahun yang diwarnai. Hal ini
memiliki keuntungan bahwa cerita yang ingin kita sampaikan akan berada di depan dan di
tengah.

Jika ada efek daun musim gugur yang konsisten, itu akan menampilkan dirinya sebagai garis
horizontal warna yang jelas. % aktual di setiap periode terburuk diabaikan, dan mereka hanya
diwarnai menurut apakah itu yang terburuk, terburuk ke-2, atau terburuk ke-3 untuk setiap
tahun, dan yang lainnya dibiarkan putih. Ini sengaja membuang banyak informasi dalam data
untuk mencapai kejelasan. Bab 16 saya menempatkan bagan ini ke dalam poster bersama
dengan informasi yang lebih rinci untuk mendukungnya.

Di akhir contoh yang diperluas ini, Anda harus memahami perbedaan antara memilih format
dan menyandikan data ke parameter visual.

Inilah salah satu alasan mengapa diagram lingkaran sulit diterjemahkan kembali ke nilai
dengan tingkat akurasi yang dapat diterima. Ada desain melingkar lainnya seperti «radial
histogram» dan «sunburst diagram» yang mengalami masalah yang sama. Mereka mungkin
menarik perhatian dan memasok keenam tujuan Gelman dan Unwin, tetapi jatuh kependekan
dari komunikasi kuantitatif yang serius, dan tidak terlalu baru dan menarik seperti beberapa
contoh penutup di Bab 17. Gambar 2.7 Agar pembaca dapat menerjemahkan parameter
kembali ke angka, jaga agar yang lainnya tetap konstan.

Mungkin menggoda, dengan banyak variabel, untuk mengkodekan masing-masing ke


beberapa parameter dan menghasilkan visualisasi yang sangat detail dan kompleks.
Kita dapat membuat sebar plot di mana setiap penanda tidak hanya memiliki lokasi horizontal
dan vertikal tetapi juga bentuk, warna, dan ukuran tertentu – lima variabel dalam satu bagan –
tetapi kita tidak perlu terlalu terkejut menemukan bahwa banyak pembaca akan kecewa
dengan hal ini.

Cara membaca bagan gelembung


Bagan gelembung, seperti Gambar 13.5, hanyalah plot sebar dengan variabel kuantitatif
ketiga yang dikodekan ke ukuran penanda. Ini sangat berguna karena terkadang kami ingin
menekankan bahwa beberapa pengamatan dalam data kami mengandung lebih banyak
informasi daripada yang lain. Kedua, kita tahu bahwa area tidak dirasakan secara akurat, jadi
jika variabel ketiga sangat penting, mungkin ide yang baik untuk memilih format atau
penyandian yang berbeda. Tidak semua kombinasi mungkin, tetapi ada banyak yang akan
mengarah pada visualisasi yang tidak biasa dan mungkin inovatif.

Namun, penyandian yang sudah akrab bagi pembaca Anda memungkinkan mereka


melewatkan beberapa detik berharga di mana mereka harus mencari cara membaca
visualisasi, dan membiarkan mereka langsung memahami data. Kita dapat sepenuhnya
menjauh dari keselarasan horizontal-vertikal dan melakukan sesuatu yang lebih bermakna
dengan memanfaatkan sifat melingkar musim.

KETERBATASAN WILAYAH

Salah satu masalah yang sangat umum dalam visualisasi data adalah bahwa pengkodean
variabel numerik ke area sangat populer, tetapi pembaca tidak dapat menerjemahkannya
kembali dengan baik. Bagan gelembung, yang telah kita temui di bab ini, menderita
karenanya. Pembaca mungkin dapat melihat penanda terbesar dan terkecil, tetapi akan sulit
untuk menilai ukuran penanda lain yang tidak berdekatan. Masalah yang sama mempengaruhi
piktogram di mana variabel dikodekan ke ukuran relatif dari beberapa ikon.

Wordclouds membawa masalah ini lebih dalam ke dalam kekurangan, dengan pembaca


manusia hampir tidak mampu menilai area relatif kata-kata dengan panjang yang
berbeda, dengan karakter ukuran yang berbeda, dalam warna yang berbeda dan rotasi yang
berbeda. Ide yang lebih baik, jika Anda ingin menggunakan ikon, adalah dengan menyusun
beberapa ikon . Ada lagi jenis piktogram khusus yang tidak sering terlihat, mungkin karena
pembuatannya membutuhkan banyak usaha, di mana ikonnya adalah objek nyata dalam
sebuah foto. Biasanya meremehkan sudut kurang dari 90 derajat dan melebihlebihkan yang
lebih besar.

Meskipun sudut sebanding dengan luas , masalah orientasi yang berbeda mempengaruhi pai
dan donat .

Cara membaca diagram lingkaran atau diagram donat

Bagan pai dan donat membagi lingkaran seperti irisan pai bial, dan sangat cocok untuk data
yang mewakili bagian dari keseluruhan, mungkin persentase yang berjumlah 100%. Dalam
kedua kasus, sudut irisan proporsional dengan data, jadi irisan 90 derajat harus mewakili
pengamatan dengan dua kali nilai satu yang diwakili oleh irisan 45 derajat. Irisan 90 derajat
juga akan memiliki luas dua kali lipat, asalkan irisan memiliki jari-jari yang sama. Jumlah
irisan yang dapat ditampilkan secara akurat mungkin kurang dari sepuluh.

Ini disebut plot titik, tetapi istilah itu juga digunakan untuk bagan berbeda yang disebut plot
titik, yang akan Anda temui dari Bab 3 dan seterusnya. Ini mirip dengan diagram batang di
mana kita dapat melihat panjang deretan kotak, tetapi jika nilai dalam data kita sangat
berbeda, maka kita dapat mengatur kotak dalam dua dimensi. Ini memiliki keuntungan
menampung jumlah yang jauh lebih besar.

Cara membaca diagram batang atau plot wafel

Wafel dapat melewati beberapa baris dan kemudian areanya proporsional. Fakta bahwa
seseorang berpotensi menghitung kotak yang membuat ini lebih baik daripada pai atau donat.

ANOTASI

Tujuan kami adalah agar visualisasi kami dipahami dengan jelas, dan beberapa anotasi
dengan teks dapat membantu. Sayangnya, jika kita menumpuk terlalu banyak teks, dengan
tanda panah dan highlight yang menyertainya, itu akan dengan cepat membuat kesan
keseluruhan menjadi terlalu sibuk dan membingungkan.

PENGUJIAN PENGGUNA

Pendekatan apa pun yang diambil, visualisasi data yang efektif hanya dijamin jika berhasil
untuk pembaca yang dituju. Anda melihat dataviz orang lain, pertimbangkan apa yang Anda
suka dan tidak suka tentangnya, lalu bagaimana Anda dapat meningkatkannya. Perlihatkan
draf kepada beberapa orang yang mirip dengan audiens yang Anda tuju dan dapatkan
pendapat jujur dari mereka. Pengalaman pengguna – kemudahan
penggunaan, aksesibilitas, dan kenikmatan – sangat penting, sehingga seluruh paket
gambar, teks yang menyertai, skema warna, anotasi, dan terminologi harus bekerja sama
untuk menyampaikan pesan dan memungkinkan mereka menjelajahi data secara visual.

Meskipun format standar dan familiar sangat kuat, ada daya tarik terhadap hal-hal baru dan
beberapa pembaca dapat tertarik karena rasa ingin tahu tentang sesuatu yang baru.

Resume Video
Kesempatan untuk membuat argumen yang meyakinkan melalui visualisasi data. Kami tidak
akan meyakinkan siapa pun jika kami memilih jenis grafik yang tidak sesuai dengan data.
Seperti namanya, ini terdiri dari serangkaian batang yang menggambarkan perkembangan
variabel. Apalagi jika digunakan untuk membandingkan beberapa variabel.

Saya pribadi percaya bahwa perbandingan lebih dari dua variabel dengan diagram batang
berkerumun menjadi terlalu berantakan. Selain itu, sulit untuk mendapatkan gambaran
tentang keadaan keseluruhan pasar Penjualan Buku Fiksi, dan bagaimana hal itu berubah,
yang mungkin ingin ditunjukkan oleh orang yang membuat bagan tersebut sejak awal. Kita
harus mempertimbangkan jenis data yang ingin kita visualisasikan dan jumlah variabel yang
akan ditambahkan ke grafik. Grafik batang sangat bagus ketika kita ingin melacak
perkembangan satu atau dua variabel dari waktu ke waktu.

Misalnya, salah satu penerapan diagram batang yang paling sering dalam presentasi
perusahaan adalah untuk menunjukkan bagaimana total pendapatan perusahaan telah
berkembang selama periode tertentu. Katakanlah kita ingin membandingkan pendapatan dua
perusahaan dalam jangka waktu antara 2014 dan 2018. Kapan harus menghindari penggunaan
diagram batang Diagram batang sederhana jauh dari ideal dalam situasi ketika kita memiliki
beberapa variabel dan semuanya merupakan bagian dari keseluruhan. Semua yang
menjelaskan semua buku fiksi.

Artinya, jumlah mereka memberi kita total volume pasar penjualan buku Fiksi. Ini hanya
menunjukkan kepada kita beberapa baris dan kita harus mulai membuat perhitungan sendiri
untuk memahami bagaimana angka berkembang dari waktu ke waktu. Sejalan dengan itu,
diagram batang sederhana tidak cocok jika kita memiliki perincian periode tunggal dari suatu
variabel. Jika saya ingin menggambarkan lini bisnis utama yang berkontribusi pada
pendapatan perusahaan di tahun 2018, saya tidak akan menggunakan diagram batang.

Jika sebuah perusahaan mengoperasikan tiga divisi terpisah, pada akhir tahun manajemen
puncaknya akan tertarik untuk melihat berapa porsi total pendapatan yang dicatat oleh setiap
divisi. Dalam konteks contoh kita sebelumnya, kita tidak boleh membuat diagram lingkaran
yang mencakup pendapatan hanya dua dari tiga divisi perusahaan. Bagan donat Bagan donat
pada dasarnya adalah bagan pai dengan lubang di tengahnya. Kapan menggunakan bagan
donat Kasus penggunaan bagan pai dan bagan donat identik.

Satu-satunya perbedaan penting adalah bahwa bagan donat memungkinkan kita untuk
menunjukkan jumlah total dengan menambahkan kotak teks di tengah. Kapan harus
menghindari penggunaan diagram donat Kami telah menjelaskan kapan harus menghindari
penggunaan diagram lingkaran. Hal yang sama berlaku untuk bagan donat. Salah satu saran
ketika memilih apakah akan menyertakan pai atau bagan donat adalah memikirkan audiens
Anda.

Jika nilai totalnya juga penting, maka mungkin bagan donat akan lebih disukai. Dengan
bagan donat, ini bukan masalah besar. Bagan garis Bagan garis adalah, seperti yang dapat
dibayangkan dengan mudah, garis atau beberapa garis yang menunjukkan bagaimana satu
atau beberapa variabel berkembang dari waktu ke waktu. Ini adalah alat yang hebat karena
kita dapat dengan mudah menyoroti besarnya perubahan satu atau lebih variabel selama suatu
periode.

Nah, bagan garis sederhana akan jauh lebih baik dalam kasus itu. Bagan garis memungkinkan
kita untuk melacak perkembangan beberapa variabel secara bersamaan. Diagram area
Diagram area sangat mirip dengan diagram garis. Gagasan bagan area didasarkan pada bagan
garis.

Daerah berwarna menunjukkan kepada kita perkembangan setiap variabel dari waktu ke
waktu. Kapan menggunakan diagram area Kapan pun kita ingin menunjukkan bagaimana
bagian-bagian dari keseluruhan berubah dari waktu ke waktu, kita harus mempertimbangkan
diagram area. Jadi, misalnya, jika perusahaan memiliki tiga divisi penghasil pendapatan,
kemungkinan besar manajemen ingin melihat perkembangan masing-masing divisi ini. Ini
adalah cara yang bagus untuk menarik perhatian pada nilai total dan tetap menekankan tren
penting – katakanlah, pendapatan dari satu divisi telah berkembang pesat sementara dua
divisi lainnya tetap pada tingkat yang sama.

Bagan area bertumpuk sangat cocok dalam kasus ini. Namun, jika kita tertarik dengan porsi
pendapatan yang dihasilkan oleh masing-masing divisi dan tidak terlalu banyak dari jumlah
total pendapatan, kita cukup menggunakan bagan area tumpuk 100%. Ini akan menunjukkan
kontribusi persentase setiap divisi dari waktu ke waktu. Kapan harus menghindari diagram
area Jelas, mirip dengan diagram garis, diagram area tidak cocok untuk mewakili bagian dari
keseluruhan selama satu periode.

Dalam contoh kami, kami tidak dapat menggunakan bagan area untuk menunjukkan proporsi
pendapatan yang dihasilkan setiap divisi pada tahun 2018 saja. Jadi itu situasi di mana kita
tidak bisa menggunakan grafik area. Secara umum, saya akan menjauh dari grafik area klasik
juga. Ini bisa sangat membingungkan dan bahkan Microsoft sendiri merekomendasikan untuk
menghindarinya dan mempertimbangkan untuk menggunakan diagram garis sederhana.

Jika kita ingin menunjukkan perkembangan pendapatan yang dihasilkan oleh masing-masing
divisi perusahaan dari waktu ke waktu dengan bagan area sederhana, kita akan memiliki
sesuatu yang terlihat seperti ini. Dalam video ini kita membahas kapan harus menggunakan
diagram batang, pie, donat, garis, dan area. Bagan Treemap Salah satu jenis bagan yang tidak
digunakan sesering yang seharusnya adalah bagan Treemap. Berikut adalah tampilan
Treemap.

Kapan menggunakan diagram Treemap Perusahaan yang telah kita lihat sejauh ini memiliki
tiga divisi. Ini adalah cara yang sempurna untuk memberikan informasi tentang divisi berat
yang dimiliki sehubungan dengan pendapatan total perusahaan. Pada saat yang sama
menunjukkan seberapa besar kontribusi setiap produk terhadap pendapatan divisinya. Kapan
harus menghindari diagram Treemap Seperti yang dapat Anda bayangkan, cukup sulit untuk
menerapkan diagram treemap ke konteks yang bukan seperti yang baru saja kita jelaskan.

Bagan peta pohon tidak cocok jika data yang kami kerjakan tidak dapat dibagi ke dalam
kategori dan subkategori. Selain itu, kami tidak dapat menggunakan bagan peta pohon jika
kami ingin melacak perkembangan dari waktu ke waktu. Periode awal untuk grafik ini adalah
akhir tahun 2017 atau 2018. Periode akhir adalah akhir tahun 2018.

Dengan grafik batang sederhana, kita hanya akan melihat peningkatan sebesar 6 juta. Bagan
jembatan memberi kita informasi tambahan – bagaimana divisi yang berbeda berkontribusi
pada peningkatan ini. Bahkan, pendapatan dua divisi meningkat, sedangkan divisi lainnya
tidak. Dengan cara yang sama, diagram jembatan dapat menunjukkan kepada kita bagaimana
satu variabel dipengaruhi oleh serangkaian faktor untuk mendapatkan output tertentu.

Kami memiliki informasi yang diperlukan untuk mengetahui langkah-langkah perantara di


antaranya. Laba Operasi = Pendapatan – Harga pokok penjualan – Beban operasi – D&A.
Ada tiga langkah perantara antara pendapatan dan laba operasi. Kapan harus menghindari
diagram jembatan Saat kita berurusan dengan data yang tidak melibatkan langkah atau
segmen perantara, kita harus menggunakan jenis diagram yang berbeda.

Sederhana seperti itu. Scatter plots Scatter plot adalah jenis grafik yang sering digunakan
dalam bidang statistik dan ilmu data. Ini terdiri dari beberapa titik data yang diplot di dua
sumbu. Setiap variabel yang digambarkan dalam plot pencar akan memiliki beberapa
pengamatan.

Jika sebar plot mencakup lebih dari dua variabel, maka kita akan menggunakan warna yang
berbeda untuk menandakan itu. Saat menggunakan plot sebar Bagan plot sebar adalah
indikator bagus yang memungkinkan kita melihat apakah ada pola yang dapat ditemukan di
antara dua variabel. Sumbu x berisi informasi tentang harga rumah, sedangkan sumbu y
menunjukkan ukuran rumah. Jadi, ini bisa menjadi jenis bagan yang sangat berguna kapan
pun kita ingin melihat apakah ada hubungan antara dua kumpulan data.

Kapan harus menghindari plot pencar Kita tidak dapat menggunakan plot pencar jika kita
tidak memiliki data dua dimensi. Dalam contoh kami, kami membutuhkan informasi tentang
harga rumah dan ukuran rumah untuk membuat plot pencar. Plot sebar membutuhkan
setidaknya dua dimensi untuk data kami. Selain itu, scatter plot tidak cocok jika kita tertarik
untuk mengamati pola waktu.

Akhirnya, plot pencar digunakan dengan data numerik, atau angka. Jika kita memiliki
kategori seperti 3 divisi, 5 produk, dan seterusnya, plot pencar tidak akan banyak
mengungkapkan. Grafik histogram Jenis grafik terakhir yang akan kita bahas di sini adalah
grafik histogram. Serangkaian tempat sampah menunjukkan kepada kita frekuensi
pengamatan variabel yang diberikan.

Definisi grafik histogram singkat dan mudah. Berikut tampilan histogramnya. Kapan
menggunakan histogram Histogram sangat bagus ketika kita ingin menunjukkan distribusi
data yang sedang kita kerjakan. Ini memungkinkan kita untuk mengelompokkan data kontinu
ke dalam bin dan karenanya, memberikan representasi yang berguna tentang di mana
pengamatan terkonsentrasi.

Kapan harus menghindari histogram Berhati-hatilah saat data yang Anda kerjakan berisi
beberapa kategori atau variabel.

Anda mungkin juga menyukai