Anda di halaman 1dari 23

TEORI 7

Creating Tables and Graphs in Rstudio

DISUSUN OLEH:

Wardatul Jannah

105361106019

Dosen Pengampu:

Dr. Rukli, M.Pd., M.Cs.


DI SAJIKAN DALAM MATA KULIAH PEMROGRAMAN KOMPUTER

KELAS MATEMATIKA 2019 C

PROGRAM STUDI PENDIDIKAN MATEMATIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS MUHAMMADIAH MAKASSAR

2021
Install dan Load Package yang dibutuhkan
Beberapa package yang harus di install diantaranya:
1. readr: untuk import data kedalam R
2. dplyr: untuk manipulasi data
3. ggplot2 dan ggpubr untuk visualisasi data
Package ggplot2 membuat mudah user pemula untuk membuat plot visualisasi.
Seluruh package yang tersebut di atas dikemas dalam satu package bernama tidyverse. Sehingga
jika melakukan installasi tidyverse sudah otomatis tersintall packages readr, dplyr, ggplot dan
lain-lain. Ketik perintah berikut untuk install:
• install.packages(“tidyverse”)
• install.packages(“ggpubr”)

Load package yang dibutuhkan


Setelah tahapan installasi, langkah pertama user harus load package untuk menggunakan fungsi
yang terdapat pada package. Perintah library() digunakan pada tahapan ini. Atau cara lain dapat
menggunakan perintah require(). Untuk contoh, load package ggplot2 dan ggpubr, ketik seperti
berikut:

library(ggplot2)
library(ggpubr)
## Loading required package: magrittr

Sekarang, user dapat menggunakan fungsi R, seperti ggscatter() [yang terdapat pada package ggpubr] untuk
membuat scatter plot.

Memasukkan data ke dalam R


data = read.csv("E://BLOG/MATERI/R DASAR UNTUK VISUALISASI DATA/Data Diabetes.csv", sep =",", hea
der = TRUE)
head(data) #Melihat data teratas
## Pregnancies Glucose BloodPressure SkinThickness Insulin BMI
## 1 6 148 72 35 0 33.6
## 2 1 85 66 29 0 26.6
## 3 8 183 64 0 0 23.3
## 4 1 89 66 23 94 28.1
## 5 0 137 40 35 168 43.1
## 6 5 116 74 0 0 25.6
## DiabetesPedigreeFunction Age keterangan
## 1 0.627 50 Tidak Diabetes
## 2 0.351 31 Tidak Diabetes
## 3 0.672 32 Diabetes
## 4 0.167 21 Tidak Diabetes
## 5 2.288 33 Tidak Diabetes
## 6 0.201 30 Tidak Diabetes
tail(data) #Melihat data terbawah
## Pregnancies Glucose BloodPressure SkinThickness Insulin BMI
## 763 9 89 62 0 0 22.5
## 764 10 101 76 48 180 32.9
## 765 2 122 70 27 0 36.8
## 766 5 121 72 23 112 26.2
## 767 1 126 60 0 0 30.1
## 768 1 93 70 31 0 30.4
## DiabetesPedigreeFunction Age keterangan
## 763 0.142 33 Tidak Diabetes
## 764 0.171 63 Tidak Diabetes
## 765 0.340 27 Tidak Diabetes
## 766 0.245 30 Tidak Diabetes
## 767 0.349 47 Tidak Diabetes
## 768 0.315 23 Tidak Diabetes

• Untuk mengunduh file simulasi dapat klik tautan berikut data.

Perintah read.csv() untuk memanggil data kedalam direktori kerja R. Pembahasan lebih rinci
dapat melihat pada materi Direktori kerja di R.

Manipulasi Data
Setelah memasukkan data ke R, user dapat dengan mudah memanipulasi data itu dengan
menggunakan package dplyr Setelah package dplyr di load, user dapat menggunakan beberapa
fungsi seperti berikut:

• filter(): memilih baris(observasi) berdasarkan nilainya.


• distinct(): Menghilangkan baris yang terduplikasi.
• arrange(): Menyusun ulang baris.
• select(): Memilih kolom (variabel) sesuai dengan namanya.
• rename(): Mengubah nama kolom.
• mutate(): Menambah/membuat variabel baru.
• summarise(): Ringkasan komputasi statistika seperti mean, sum dan lain-lain.

Basis Grafik di R
R mempunyai fungsi yang sederhana untuk membuat grafik, diantaranya:

Tabel perintah membuat grafik di R

Plot.Types R.base.function

Scatter plot plot()

Scatter plot matrix pairs()

Box plot boxplot()

Strip chart stripchart()

Histogram plot hist()

density plot density()

Bar plot barplot()

Line plot plot() dan line()

Pie charts pie()

Dot charts dotchart()

Add text to a plot text()

1. dot charts
Menggunakan fungsi R, kita akan menggunakan data untuk membuat scatter
plot dan boxplot.
plot(x = data$BloodPressure, y = data$Glucose, pch = 19, cex = 0.8, frame = FALSE, xlab = "Tekanan darah", ylab

= "Kadar Gula")

boxplot(Age ~ keterangan, data = data, ylab = "Umur", frame = FALSE, col = "lightgray")
Package lattice grafik

Package lattice menyediakan fungsi plotting untuk meningkatkan Grafik basis di R(A, 2017)

. Cara installasinya seperti berikut:

• install.packages(“lattice”) ketik perintah tersebut pada program R.

• Membuat scatter plot dasar dari y oleh x.

library(lattice)
xyplot(
Glucose ~ BloodPressure, group = keterangan, data=data, auto.key = TRUE, pch = 19, cex = 0.5
)

• Membuat plot panel oleh grup. y~x | group

xyplot( Glucose ~ BloodPressure | keterangan, layout = c(3,1), group = keterangan, data = data, type = c("p", "smoot
h"), scale = "free")

Package ggplot2 grafik


ggplot2 sangat powerful dan package yang fleksibel.

library(ggplot2)
ggplot(data, aes(x = Glucose, y = BloodPressure))+
geom_point()

ggplot(data, aes(x = Glucose, y = BloodPressure))+


geom_point(size = 1.2, color = "steelblue", shape = 21)
Catatan: sintaks diatas mendefinisikan nilai dengan bentuk titik. Jika ingin melihat bentuk lain
dapat memilih bentuk yang berbeda di R. Ketik sintaks berikut:

ggpubr::show_point_shapes()

Untuk membuat legend dengan bentuk dan warna berbeda menggunakan perintah seperti ini:

ggplot(data, aes(x = Glucose, y = BloodPressure))+

geom_point(aes(color = keterangan, shape = keterangan))

ggplot(data, aes(x = Glucose, y = BloodPressure))+


geom_point(aes(color = keterangan, shape = keterangan))+
scale_color_manual(values = c("yellow", "green"))
User juga dapat memberikan sekat pada plot menjadi beberapa panel bagian berdasarkan variabel
grup. Fungsinya seperti berikut facet_wrap(). Fitur lain yang menarik dari ggplot2 adalah
memungkinkan user untuk menggabungkan beberapa layer pada plot yang sama.

ggplot(data, aes(x = Glucose, y = BloodPressure)) + geom_point(aes(color=keterangan)) + geom


_smooth(aes(color=keterangan, fill = keterangan)) + facet_wrap(~keterangan, ncol = 2, nrow = 1
)+ scale_color_manual(values = c("brown", "blue"))+ scale_fill_manual(values = c("brown", "bl
ue"))
## `geom_smooth()` using method = 'loess'

Package ggpubr untuk membuat grafik


library(ggpubr)
ggdensity(data, x = "Glucose", add = "mean", rug = TRUE, color = "keterangan", fill = "keterangan", palette = "jco"
)

• membuat boxplot dengan membandingkan nilai p value antar grup variabel

my_comparison = list(c("Diabetes", "Tidak Diabetes"))

ggboxplot(data, x= "keterangan", y="Glucose", color = "keterangan", palette = c("#00AFBB", "#


E7B800"), add = "jitter")+ stat_compare_means(comparisons = my_comparison, method = "t.tes
t")

2. Base plot

Pada r bar graph dapat dilakukan menggunakan fungsi bawaan dari yaitu barplot().
Command yang digunakan untuk membuat bar plot adalah sebagai berikut:

Output yang dihasilkan dari command tersebut ditunjukkan oleh Gambar 1.


Gambar 1. Pengeluaran Makan
ggplot2
Pada ggplot, bar graph dapat dibuat menggunakan layer
geometry geom_bar() dan geom_col(). geom_bar() membuat plot berdasarkan jumlah observasi
tiap kategori, sedangkan geom_col() membuat plot berdasarkan nilai pada data atau observasi.
Untuk lebih memahaminya jika kita memasukkan fungsi geom_bar() maka r untuk membuat plot
pada data diatas maka output grafik akan membuat grafik frekuensi untuk ketiga kelas seragam
yaitu 1 karena jumlah observasi pada data tersebut untuk kategori tersebut masing-masing satu.
Jika menggunakan geom_col() maka kita dapat menginput kategori beserta nilai observasinya.
Jika didata kita memiliki banyak observasi dan tiap observasi memiliki nilai
maka geom_col() akan memproses tinggi bar pada plot berdasarkan nilai rata-rata tiap
kategorinya.
Command yang digunakan untuk dataset diatas adalah sebagai berikut:

Output command tersebut ditunjukkan oleh Gambar 2.


Gambar 2. Grafik pengeluaran makan menggunakan ggplot

Jika kita ingin menggunakan geom_bar() untuk membuat grafik seperti Gambar 2, kita perlu

menambahkan command stat_identity agar tinggi dari bar dapat menggunakan nilai

observasinya. Command yang digunakan adalah sebagai berikut:


Output tiap command tersebut disajikan pada Gambar 3.
Gambar 3. Grafik pengeluaran makan menggunakan ggplot fungsi Geom_bar()

Pada contoh selanjutnya akan digunakan dataset ToothGrowth yang merupakan dataset bawaan

r. Untuk memuat dataset tersebut pada r jalankan command berikut:

Pada jendela help kita dapat memperoleh informasi terkait dataset tersebut. Informasi
terkait dataset tersebut disajikan pada Gambar 3.
Gambar 3. Informasi dataset ToothGrowth

3. Pie Chart
Pie chart pada r hanya bias dibuat menggunakan pake plot bawaan r. Pada artikel ini plot hanya

dilakukan untuk melihat jumlah proporsi observasi pada data ToothGrowth. Command yang

digunakan adalah sebagai berikut:

Output command tersebut disajikan pada Gambar 8.

Gambar 8. Proporsi Observasi data ToothGrowt


Berdasarkan hasil plot dapat disimpulkan bahwa jumlah proporsi observasi pada data tersebut
seimbang.(Envirinmental data sience, 2018)

4. Histogram
Salah satu kegunaan Histogram adalah diagram yang berkaitan dengan range atau untuk
melihat distribusi, penyebaran, varian suatu produk, proses atau layanan.dengan menambahkan
syntaq
Z = hist(Zat_padat)
Z$breaks
Z$counts
Z$density
Z$mids
Z$xname
Z$equidist
Dimana untuk membuat garis distribusinya maka kita gunakan fungsi dnorm dan rentang
nilai, untuk lebih jelasnya perhatikan syntaq berikut ini.
hist(Zat_padat,
main="HISTOGRAM PENURUNAN ZAT PADAT",
xlab="PENURUNAN ZAT PADAT",
xlim=c(0,50),ylim=c(0,10),
col="darkmagenta",
freq=T)

xfit=seq(min(Zat_padat), max(Zat_padat), length=40)


yfit=dnorm(xfit,mean=mean(Zat_padat),,sd=sd(Zat_padat))
yfit=yfit*diff(Z$mids[1:2])*length(Zat_padat)
lines(xfit,yfit)

Hasil nya seperti pada gambar dibawah ini

Agar garis terlihat jelas dan memiliki warna maka dapat kita besar dengan menggunakan
syntaq lines(xfit,yfit, col=2, lwd=4), didapatkan hasil akhir output seperti
berikut
Hasil akhir Histogram adalah seperti dibawah ini(Statistika, 2016a)

5. Box Charts
Adapun materi R untuk cara membuat box plot lebih rinci bisa di baca help
(boxplot) atau ?boxplot Ok setelah membaca mari kita mulai langkah-langkah membuat
boxplot:

1. Masukan data file excell ke R seperti pada CARA MEMASUKAN DATA DARI EXCELL
.CSV KE R
2. Pilihlah salah satu variabel yang diinginkan dengan menuliskan syntaq TK =
(Data$Jumlah.Tenaga.Kerja)

3. Buatlah boxplot dengan menggunakan syntaq boxplot (TK, data = Data)

4. Agar sedikit bagus tambahkan warna box di tampilan boxplot dengan


menambahkan syntq boxplot (TK, data = Data,col =
c("lightblue"))
5. Setelah itu berikan judul dan axis agar mudah dipahami oleh pembaca boxplot
dengan menambahkan syntaq
6. boxplot (TK, data = Data,col = c("lightblue"),
cex.main=1.2, main = "BOXPLOT DISTRIBUSI TENAGA KERJA",
xlab = "TENAGA KERJA",cex.lab=1.2)

7. Hasil boxplot diatas masih belum baik, jadi mari kita rapikan dan sesuaikan dengan data
nya. Cara untuk memperbaikinya dengan menambahkan syntaq boxplot (TK, data =
Data,col = c("lightblue"), cex.main=1.2, main = "BOXPLOT DISTRIBUSI
TENAGA KERJA", xlab = "TENAGA KERJA",cex.lab=1.2, ylim =
c(0,13),outline = TRUE, horizontal = T,pars = list(boxwex = 1.5,
staplewex = 1.0))
8. Hasil akhir boxplot (Statistika, 2016b)
Daftar Pustaka

A, A. H. (2017). No Title. http://rstudio-pubs-


static.s3.amazonaws.com/331771_91c2960e003f4c42a3863e1da7ab2934.html
Envirinmental data sience. (2018). No Title.
https://environmentallearning.wordpress.com/2018/12/30/visualisasi-data-bar-
chart-dan-pie-chart-r/
Statistika, J. (2016a). No Title. http://www.jendelastatistik.com/2016/11/cara-
membuat-boxplot-dengan-r.html
Statistika, J. (2016b). No Title. http://www.jendelastatistik.com/2016/11/cara-
membuat-histogram-dengan-r.html

Anda mungkin juga menyukai