Anda di halaman 1dari 13

TUGAS BESAR 2

VISUALISASI DATASET MENGGUNAKAN BAHASA R DENGAN


LIBRARY GGPLOT2
MATA KULIAH PENGANTAR DATA SCIENCE

Aji Ramadhani Setianto 41518110150


Elisabeth Meilinda Palma Ningrum 41518120110
Yakobus Yosi 41518110162

PROGRAM STUDI TEKNIK INFORMATIKA


FAKULTAS ILMU KOMPUTER
UNIVERSITAS MERCU BUANA
2021
KATA PENGANTAR

Segala puji dan syukur kami panjatkan kepada Tuhan Yang Maha Esa, karena atas
berkat dan limpahan rahmat-Nya makan kami dapat menyelesaikan makalah dengan tepat
waktu.
Berikut ini kami mempersembahkan sebuah makalah dengan judul “Visualisasi
Dataset Menggunakan Bahasa R dengan Library GGPLOT2”, yang menurut kami dapat
memberi manfaat untuk menambah pengetahuan kita tentang bahasa pemrograman.
Kami menyadari bahwa makalah ini masih jauh dari sempurna, oleh karena itu kritik
dan saran dari semua pihak yang bersifat membangun selalu kami harapkan demi
kesempurnaan makalah ini.
Akhir kata, kami sampaikan terima kasih kepada semua pihak yang telah berperan
dalam penyusunan makalah ini dari awal sampai akhir. Kami menyadari bahwa makalah ini
masih jauh sekali dari kesempurnaan, oleh karena itu kritik dan saran yang mampu
membangkitkan jiwa kami, sangat diharapkan.

Semoga Tuhan Yang Maha Esa senantiasa meridhai segala usaha kami.
Amin.

Jakarta, 25 November 2021


BAB I
PENDAHULUAN

1.1 LATAR BELAKANG

Visualisasi data diamati oleh banyak segi pengetahuan untuk komunikasi visual
modern. Visualisasi data tidak berada di bawah segi manapun, melainkan interpretasi di
selang banyak segi (misalnya, terkadang diamati untuk cabang modern dari statistik deskriptif
oleh sebagian orang, tetapi juga untuk dasar peralatan pengembangan oleh yang lain).
Visualisasi data mengikutkan pembuatan dan kajian dari representasi visual dari data,
gunanya "informasi yang telah diabstraksikan dalam susunan skematis, termasuk atribut atau
variabel dari unit informasi".

Sasaran utama dari visualisasi data merupakan untuk mengkomunikasikan informasi


secara jelas dan efisien kepada pengguna lewat grafik informasi yang dipilih, seperti tabel
dan grafik. Visualisasi yang efektif menolong pengguna dalam menganalisa dan penalaran
tentang data dan bukti. Beliau menciptakan data yang kompleks dapat diakses, dipahami dan
bermanfaat. Pengguna dapat melaksanakan pekerjaan analisis tertentu, seperti melaksanakan
pembandingan atau memahami kausalitas, dan prinsip perancangan dari grafik (contohnya,
memperlihatkan perbandingan atau kausalitas) mengikuti pekerjaan tersebut. Tabel biasanya
dipakai ketika pengguna akan melihat ukuran tertentu dari suatu variabel, sementara grafik
dari berbagai tipe dipakai untuk melihat pola atau keterkaitan dalam data untuk satu atau
bertambah variabel.

Visualisasi data merupakan seni dan sains. Laju di mana data dikeluarkan telah
meningkat, dipicu oleh meningkatnya ekonomi berbasis informasi. Data yang diproduksi
susunan oleh keaktifan internet dan sejumlah sensor yang bertambah bertambah dalam
lingkungan, seperti satelit dan kamera perlintasan, dikata untuk "Big data". Pemrosesan,
analisa dan mengkomunikasikan data tersebut menciptakan berbagai tantangan analisis untuk
visualisasi data. Segi pengetahuan data dan pelakunya yang dikata ilmuwan data telah
muncul untuk menolong mengatasi tantangan tersebut.
1.2 TUJUAN

Data statistik telah menjadi kebutuhan publik untuk lingkup yang lebih luas.
Pengguna data statistik kini tak hanya instansi-instansi pemerintahan saja, tetapi juga
pelaku bisnis, organisasi masyarakat, para pengamat, dan masyarakat umum. Dengan
mengamati data statistik, para pengguna dapat melakukan banyak hal, mulai dari
mengeksplorasi data yang ada, mengekstraksi informasi, memahami tren yang
terjadi, hingga meramalkan suatu fenomena yang akan terjadi di masa depan. Hal tersebut
tentunya sangat penting jika dikaitkan dengan kegiatan evaluasi dan perencanaan, baik itu
oleh pemerintah maupun pihak-pihak lain yang membutuhkan, sesuai dengan Pasal 3 dan
4 UU No. 16 Tahun 1997 tentang Statistik serta pertimbangan presiden dalam
mengeluarkan PP No. 86 Tahun 2007 tentang Badan Pusat Statistik. Badan Pusat Statistik
(BPS) adalah lembaga pemerintah non-departemen yang bertugas melaksanakan tugas
pemerintahan di bidang statistik, sebagaimana tercantum dalam Pasal 2 PP No. 86 tahun
2007. Data hasil kegiatan statistik tersebut kemudian diolah dan disajikan dalam bentuk tabel
dan grafik, serta dipublikasikan melalui media cetak dan online [ CITATION Han21 \l 1057 ].

Penyajian data statistik mengalami perkembangan seiring dengan kemajuan


teknologi. Data statistik tidak hanya disajikan dalam bentuk tabel dan grafik saja, tetapi
juga divisualisasikan menggunakan peta. Bahkan saat ini juga digunakan peta interaktif
berbasis online untuk lebih memudahkan pengguna dalam mengakses dan mengeksplorasi
data yang ada. Menurut Di Biase (1990), terdapat dua tujuan utama visualisasi data,
yaitu memahami data yang ada (visual thinking) dan menyampaikan tujuan (visual
communication). Proses memahami data dapat dibentuk melalui interaksi antara
pengguna dengan data yang disajikan (Roberts, 2008). Sementara itu, Roth (2013)
menyebutkan bahwa peta adalah salah satu media yang dapat digunakan dalam visual
communication. Pembuat peta dapat mendesain suatu peta sedemikian rupa guna
menyampaikan ide, gagasan, atau pesan tertentu kepada para pengguna peta. Dengan kata
lain, proses visual thinking dan visual communication dapat dilakukan dengan menyajikan
data statistik menggunakan peta interaktif. Penyajian data statistik dengan metode seperti
ini lebih memudahkan pengguna dalam memahami data yang ada. Di samping itu,
hubungan antar data juga dapat dilihat dengan lebih jelas, terutama dalam kaitannya
dengan aspek spasial, serta mendukung untuk melakukan eksplorasi pada data tersebut.
BAB II
PEMBAHASAN

2.1 KARAKTERISTIK GRAFIK

Profesor Edward Tufte menjelaskan bahwa pengguna dari tampilan informasi


melaksanakan pekerjaan analitis tertentu seperti menciptakan perbandingan atau memilihkan
kausalitas. Prinsip perancangan dari grafik informasi mesti mendukung pekerjaan analitis,
memperlihatkan perbandingan atau kausalitas.
Dalam bukunya tahun 1983 The Visual Display of Quantitative Information, Edward
Tufte memberikan definisi 'tampilan grafik' dan prinsip-prinsip dari tampilan grafik yang
efektif untuk berikut: "Keberhasilan dalam grafik statistik terdiri atas mengkomunikasikan
ide yang kompleks dengan kejelasan, ketepatan dan efisiensi. Tampilan grafis seharusnya:
 Memperlihatkan data.
 Mendorong penglihat untuk berpikir tentang substansi bukan metodologi, rancangan
grafik, teknologi dari produksi grafik atau hal lainnya.
 Menghindari pengelabuan terhadap apa yang dipercakapkan oleh data.
 Memberikan banyak angka dalam ruang yang kecil.
 Menciptakan kelompokan data yang akbar koheren.
 Mendorong mata untuk membandingkan berbagai anggota selisih dari data.
 Membuka data pada sebagian tingkat kerincian, dari cerminan umum hingga bentuk
terakhir.
 Meladeni suatu sasaran yang jelas: deskripsi, eksplorasi, tabulasi atau dekorasi.
 Secara dekat berintegrasi dengan statistik dan deskripsi verbal dari suatu
kelompokan data.
Grafik menyingkap data. Tentu saja grafik dapat bertambah akurat dan membuka
daripada komputasi statisik konvensional." Untuk contohnya, diagram Minard
memperlihatkan kekalahan yang dialami oleh tentara Napoleon dalam periode 1812-1813.
Enam variabel dipaparkan: ukuran tentara, tempatnya dalam dua-dimensi (x dan y), masa,
arah pergerakan, dan temperatur. Tampilan multivarian tersebut dalam dua dimensi
menceritakan suatu kisah yang dapat ditangkap langsung sementara mengidentifikasi sumber
data untuk membangun suatu kredibilitas.
Dengan tidak menerapkan prinsip-prinsip tersebut dapat menghasilkan grafik
menyesatkan, yang mengganggu pesan atau mendukung kesimpulan yang salah. Menurut
Tufte, sampah-grafik mengacu pada dekorasi tambahan dari grafik yang tidak meningkatkan
pesan, atau efek tiga dimensi atau perspektif yang serampangan. Secara sia-sia memisahkan
kunci penjelasan dari gambar itu sendiri, menciptakan mata berpindah dari gambar ke
penjelasan, merupakan suatu susunan dari "puing administratif". Rasio dari "data ke tinta"
mesti dimaksimalkan, menghapus tinta-tinta yang bukan data bila memungkinkan.

Gambar 1. Diagram dari Charles Joseph Minard tahun 1861

2.2 SEJARAH BAHASA R

"R" sebenarnya bukan bahasa pemrograman yang baru. Setidaknya R telah


dikembangkan secara intensif sejak 10 tahun yang lalu, sebagai pengembangan bahasa
pemrograman "S" di Bell Laboratories. Tepatnya R adalah bahasa pemrograman yang telah
didesain ulang untuk memudahkan analisis statistika. Menurut situs R project, R adalah
bahasa dan lingkungan untuk komputasi statistik dan grafis. R adalah proyek berjenis open
source GNU. Entah apa yang dipikirkan oleh sang pembuat dengan memberi nama karyanya
hanya dengan satu huruf. Tapi apalah arti sebuah nama. Walaupun awalnya dikembangkan
untuk analisis statistik, namun saat ini telah berkembang aplikasinya hingga dapat melakukan
manipulasi data spasial serta menampilkannya secara dinamis dalam situs web. Ditambah lagi
dengan era data analysis atau akrab disebut big data, maka perkembangan R menjadi tidak
terbendung lagi. Perintah dasar dalam bahasa R telah menyediakan berbagai tool untuk
pemodelan statistik linear dan nonlinear, analisis time-series, klasifikasi, analisis klaster, dan
analisis grafis. Kemampuan ini terus berkembang dengan adanya ribuan paket tambahan yang
diunggah ke server CRAN tiap tahunnya.
2.3 PENGGUNAAN LIBRARY GGPLOT 2 PADA R

Gglpot2 merupakan Packages yang diciptakan oleh Hadley Wickham dengan


kelebihannya dalam pembuatan gambar yang elegan dan kompleks. Popularitas ggplot2 di
komunitas R tidak diragukan lagi. Ggplot2 memungkinkan kita untuk membuat grafik yang
dapat merepresentasikan data numerik dan kategori baik univariat maupun multivariat secara
simultan. Pengelompokan yang dapat diwakili oleh warna, simbol, ukuran dan ketebalan
point [ CITATION Hus18 \l 1057 ] . Ggplot2 mempunyai banyak fungsi dan pilihan untuk plot
yang akan ditampilkan. Kelebihan ggplot2 jika dibandingkan dengan tampilan grafis umum
tanpa menggunakan ggplot2 sebagai berikut :
 Ggplot2 lebih simple.
 Untuk visualisasi yang kompleks, ggplot lebih simple.
 Tidak menggunakan metode yang ribet (data harus dalam bentuk data.frame).
 Menggunakan sistem yang berbeda untuk menambahkan elemen dalam plot.

Ggplot2 merupakan paket visualisasi yang powerfull. Kita dapat menggunakannya


bersamaan dengan piping operator yang disediakan oleh paket dplyr sehingga menambah
kemudahan kita dalam melakukan analisis data [CITATION Ayu18 \l 1057 ]. Grafik ggplot2
terdiri dari sejumlah komponen kunci. Berikut adalah sejumlah komponen kunci yang
membentuk grafik ggplot2 :
 Data frame: menyimpan semua data yang akan ditampilkan di plot.
 Aesthetic mapping: menggambarkan bagaimana data dipetakan ke warna, ukuran,
bentuk, lokasi. Dalam plot diberikan pada fungsi aes()
 Geoms: objek geometris seperti titik, garis, bentuk.
 Facets: menjelaskan bagaimana plot bersyarat / panel harus dibangun.
 Stats: transformasi statistik seperti binning, quantiles, smoothing.
 Scales: skala apa yang digunakan oleh aesthetic map (contoh: pria = merah, wanita =
biru).
 Coordinate system: menggambarkan sistem di mana lokasi geom akan digambarkan.
2.4 PENERAPAN VISUALISASI DATA DENGAN R

Sebelum dapat melakukan percobaan visualisasi data menggunakan ggplot2, kita


perlu menginstall dan memuat terlebih dahulu library ggplot2 pada sintaks kita. Dibawah ini
adalah sintaks yang digunakan untuk meninstall dan memuat paket(package) ggplot2:

Gambar 2. Install library ggplot2

Pada tahap berikutnya adalah kita harus menginstall terlebih dahulu library atau
package openxlsx, karena dataset yang akan kita gunakan pada studi kasus kali ini masih
dalam bentuk format file xlsx. Berikut ini merupakan sintaks dari instalasi library xlsx :

Gambar 3. Install library openxlsx

Setelah dua package utama ini terinstall dengan benar, tahap selanjutnya yang harus kita
lakukan adalah memuat dataset. Dataset yang kita muat dapat bisa dalam bentuk csv ataupun
xlsx. Berikut sintaks memanggil dataset :

Gambar 4. Memanggil dan


memuat dataset
Pada sintaks line 5 merupakan cara memanggil variabel mahasiswa yang telah kita
deklarasikan untuk menyimpan dataset dari hasil line 2 pada Gambar4. Dan hasilnya sebagai
berikut :

Gambar 5. Isi dataset


mahasiswa

Lalu tahap berikutnya kita membuat sebuah variabel yang disitu akan meyimpan data dari
hasil penjumlahan data antara mahasiswa, fakultas, tahun angkatan. Berikut ini sintaksnya :

Gambar 6. Sintaks menghitung data

Dan ini hasil yang nantinya akan muncul pada console Rstudio :
Gambar 7. Hasil penghitungan data
Berikutnya merupakan tahapan terakhir dalam proses visualisasi data menggunakan bahasa R
pada Rstudio, variabel summarybyfakultas kita faktornya dengan tahunnya sehingga nanti
pada chartbar akan muncul data tiap fakultas dengan jumlah mahasiswa pada setiap tahun
yang ada pada dataset. Beriktu ini adalah sintaksnya :

Gambar 8. Sintaks menampilkan chartbar

Sedangkan dibawah ini merupakan tampilan dari chartbar yang telah kita buat :
Gambar 9. Tampilan chartbar

BAB III
PENUTUP

3.1 Kesimpulan
Pada era kemajuan teknologi saat ini banyak sekali industri yang telah melakukan
digitalisasi pada banyak hal di dalam perusahaannya. Banyak perusahaan ataupun instansi
perusahaan yang kini telah mulai membuat data statistik dari usaha mereka untuk menjadikan
sebuah kebutuhan untuk lingkup yang lebih luas. Dengan adanya penggunaan data statistik
ini diharapkan para pengguna dapat melakukan banyak hal, mulai dari eksplorasi data,
esktraksi informasi dan memahami tren apa saja yang sedang terjadi.
Dengan adanya kemajuan yang pesat dalam pengolahan data hal ini akan
memudahkan mereka dalam hal seperti bussiness making decision pada sebuah perusahaan
maupun pengambilan kebijakan pada instansi pemerintah. Selain itu data statistik ini juga
berguna dalam hal memantau kinerja para karyawan ataupun aparatur negara.
Namun terkadang data statistik ini tidak mudah dibaca oleh semua kalangan, bisa saja
hanya kalangan-kalangan tertentu saja yang dapat membaca dan memahami isi dari data
tersebut. Maka dari itu saat ini tren yang ada merupakan bagaimana semua orang dapat
membaca dan memahami isi dari sebuah data dengan mudah. Maka muncul lah visualisasi
data ini. Dengan adanya visualisasi data ini diharapkan akan membantu semua orang dalam
membaca. memahami dan mencermati setiap data yang muncul.

DAFTAR PUSTAKA

Hussein, Saddam. 2018. Visualisasi Data: Pengertian, Jenis, Metode, dan Contohnya.
https://geospasialis.com/visualisasi-data/.
Ilmawan, Hanif, and Purnama Budi Santosa. 2021. "Visualisasi Data Statistik Kabupaten
Banyumas Menggunakan Peta Interaktif." Journal of Geodesy and Gemoatics 150-
163.
Kesumawati, Ayundyah. 2018. Visualisasi Data menggunakan ggplot2 di R (Bagian 1).
Oktober 26. https://medium.com/@ayundyahkesumawati/visualisasi-data-
menggunakan-ggplot2-di-r-bagian-1-f4154adec33c.

Anda mungkin juga menyukai