ACARA II
EKSPLORASI DATA
Dosen Pengampu:
Oleh:
Kelompok 14
Offering/Tahun : G / 2019
JURUSAN GEOGRAFI
2020
I. Tujuan
1. Nominal
Data berjenis nominal membedakan data dalam kelompok yang bersifat
kualitatif. Dalam ilmu statistika, data nominal merupakan data dengan level
pengukuran yang paling rendah.
2. Ordinal
Dalam ilmu statistika, data berjenis ordinal mempunyai level pengukuran yang
lebih tinggi daripada data nominal dan termasuk data kualitatif. Pada data
nominal semua data dianggap bersifat kualitatif dan setara, sedangkan pada data
ordinal terdapat klasifikasi data berdasarkan tingkatannya.
3. Rasio
Dalam ilmu statistika, data rasio merupakan tipe data dengan level pengukuran
yang paling tinggi dibandingkan dengan tipe data lain. Data ini termasuk dalam
kelompok data kuantitatif. Angka yang digunakan pada data ini menunjukkan
angka yang sesungguhnya, bukan hanya sebagai symbol dan memiliki nilai nol
yang sesungguhnya. Pada data ini, dapat dilakukan berbagai operasi matematik.
4. Interval
Data berjenis interval termasuk dalam kelompok data kuantitatif. Dalam ilmu
statistika, data Interval mempunyai tingkat pengukuran yang lebih tinggi
daripada data nominal maupun ordinal. Angka yang digunakan dalam data ini,
selain menunjukkan urutan juga dapat dilakukan operasi matematika. Angka nol
yang digunakan pada data interval bukan merupakan nilai nol yang nyata
A. Alat:
- Laptop
- R studio
B. Bahan:
- Hiccupsdata
- Festival Data
- Examanxiety
- Chickflick
IV. Langkah Kerja
- Menggabungkan Scatterplot
1. Aturlah “gender” sebagai fokus kajian dan lakukan proses pada
console Masukkan perintah pada kotak dialog console dengan
mengisikan scatter<- ggplot(examAnxiety, aes(Anxiety, Exam,
colour = Gender)) kemudian isikan perintah scatter + geom_point() +
geom_smooth(method = "lm", aes(fill = Gender), alpha = 0.1) +
labs(x = "Exam Anxiety", y = "Exam Performance %", colour =
"Gender") Tekan enter
- Histogram
1. Buka software R dan isikan perintah pada kotak R Console untuk
input data dengan mengisikan perintah festivalData <-
read.delim(file.choose(), header = TRUE) pada R Console dan Tekan
enter.
2. Pilih file yang akan digunakan dengan menCari file
“DownloadFestival.dat” dan tekan open.
3. Load festivalData dengan mengisikan perintah “festivalData” dan
tekan Enter.
4. Lakukan perintah sederhana untuk memilih sebagian data yang akan
digunakan dengan mengisikan perintah pada kotak console
festivalHistogram<- ggplot(festivalData,aes(day1)) dan Tekan enter.
5. Pada langkah 4 terlihat bahwa histogram masih kosong, oleh karena
itu pengguna perlu menambahkan perintah graphical layer untuk
menambahkan histogram geom dengan cara memberi perintah
festivalHistogram + geom_histogram(binwidth = 0.4) + labs(x =
"Hygiene (Day 1 of Festival)", y = "Frequency") dan tekan enter.
- Boxplots
1. Menggunakan data “festivalData” yang telah diinput pada kotak
console sebelumnya, maka lakukan plot variabel gender sebagai sumbu
x,serta hygine score (day1) sebagai sumbu y dengan memasukkan
perintah pada console dengan mengisi perintah festivalBoxplot<-
ggplot(festivalData, aes(gender, day1)) kemudian festivalBoxplot +
geom_boxplot() + labs(x = "Gender", y = "Hygiene (Day 1 of
Festival)") dan Tekan enter untuk melihat hasilnya
d. Line graphs
- Line graphs untuk satu independent variable
1. Buka software R dan isikan perintah pada kotak R Console untuk input
data dengan mengetikkan perintah hiccupsData <-
read.delim(file.choose(), header = TRUE) pada R Console dan Tekan
enter.
2. Pilih file yang akan digunakan dengan Cari file “Hiccups.dat “ dan tekan
open.
3. Load hiccupsData dengan mengisikan perintah “hiccupsData” dan Enter
4. Input data pada langkah 3 menunjukkan format yang salah untuk gglpot2,
oleh karena itu data tersebut perlu digabung kedalam satu kolom dengan
terlebih dahulu membuat dataframe dan mengisikan perintah tertentu pada
console. Dengan membuat Buatlah dataframe, dengan perintah: hiccups<-
stack(hiccupsData) kemudian names(hiccups)<-
c("Hiccups","Intervention ").
5. Buatlah variabel baru pada dataframe hiccups dengan nama
Intervention_Factor dengan mengisi perintah
hiccups$Intervention_Factor< factor (hiccups$Intervention,
levels(hiccups$Intervention) [c (1, 4, 2, 3)]) dan enter.
6. Aturlah objek yang akan di plot line dengan mengisi perintah <-
ggplot(hiccups, aes(Intervention_Factor, Hiccups)) dan enter dengan
mengisikan perintah line + stat_summary(fun.y = mean, geom = "point")
+ stat_summary(fun.data = mean_cl_boot, geom = "errorbar", width =
0.2) + labs(x = "Intervention", y = "Mean Number of Hiccups") +
stat_summary(fun.y = mean, geom = "line", aes(group=1),colour = "Red",
linetype = "dashed") dan tekan enter.
V. Hasil Praktikum
1. Grafik (Terlampir)
VI. Pembahasan
VII. Kesimpulan
DAFTAR PUSTAKA
Arifin, M. (2014). KONSEP-KONSEP DASAR STATISTIKA.