Anda di halaman 1dari 24

LAPORAN PRAKTIKUM STATISTIKA

ACARA V

EKSPLORASI DATA 2

Dosen Pengampu:

Ike Sari Astuti, S.P, M. Nat. Res.St., Ph. D

Oleh:

Kelompok 16

Nama : Andi Hazel Aftanta Ikhtiari (190722638057)

: Biffanca Allya Kenedy (180722639570)

: Desy Sihol Marito Hutasoit (180722639521)

Offering/Tahun : G / 2019

Tanggal : 3 Desember 2020

Asisten Praktikum : Imam Abdul Ghani Alfarizi

JURUSAN GEOGRAFI

FAKULTAS ILMU SOSIAL

UNIVERSITAS NEGERI MALANG

2020
Tujuan
1. Praktikum kali ini bertujuan untuk praktikan agar dapat melakukan uji normalitas
saphiro-wilk, menggunakan data numerac eye.
2. Selain itu tujuan lain dari praktikum ini ialah untuk praktikan agar dapat melakukan uji
homogenitas levene test menggunakan mean dan median.
3. Yang terakhir tujuan dari praktikum kali ini ialah untuk praktikan supaya dapat
melakukan korelasi variable baru.

Dasar Teori
Uji normalitas adalah pengujian data untuk melihat apakah nilai residual terdistribusi
normal atau tidak (Imam Ghazali, 2011:29). Data yang berdistribusi normal akan memperkecil
kemungkinan terjadinya bias. Apa bila nilai Asymp. Sig. suatu variabel lebih besar dari level of
significant 5% (> 0.050) maka variabel tersebut terdistribusi normal, sedangkan jika nilai
Asymp. Sig. suatu variabel lebih kecil dari level of significant 5% (< 0.050) maka variabel
tersebut tidak terdistribusi dengan normal. Pengujian normalitas dimaksudkan untuk mendeteksi
apakah data yang akan digunakan sebagai pangkal tolak pengujian hipotesis merupakan data
empirik yang memenuhi hakikat naturalistik. Hakikat naturalistik menganut faham bahwa
penomena (gejala) yang terjadi di alam ini berlangsung secara wajar dan dengan kecenderungan
berpola. Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji normalitas. Karena belum tentu data yang lebih dari 30 bisa dipastikan
berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30 belum tentu tidak
berdistribusi normal, untuk itu perlu suatu pembuktian. uji statistik normalitas yang dapat
digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors, Shapiro Wilk, Jarque Bera.
Tes-tes parametric untuk Uji Normalitas dibangun dari distribusi normal. Jika kita lihat satu
tabel, misalnya tabel T-tes, pembuatannya mengacu pada tabel normalitas. Kita bisa berasumsi
bahwa sampel kita benar-benar mewakili populasi sehingga hasil penelitian kita bisa
digeneralisasikan pada populasi. Dalam pandangan statistik, sifat, dan karakteristik populasi
adalah terdistribusi secara normal. Pengujian normalitas ini harus dilakukan apabila belum ada
teori yang menyatakan bahwa variabel yang diteliti adalah normal dengan kata lain, apabila ada
teori yang menyatakan bahwa suatu variabel yang sedang diteliti normal, maka tidak diperlukan
lagi pengujian normalitas data.

Sedangkan untuk Uji Homogenitas bertujuan untuk meyakinkan bahwa sekumpulan data
yang akan diukur memang berasal dari populasi yang homogen (sama). Penghitungan
homogenitas dilakukan peneliti saat ingin membandingkan sebuah sikap, intensi, atau perilaku
(varians) pada dua kelompok populasi (Widhiarso, 2011). Kelompok populasi tersebut memiliki
ciri dan karakteristik sendiri seperti usia, jenis kelamin, pendidikan, dan lain sebagianya.. Uji ini
dilakukan sebagai prasyarat dalam analisis independent sample t-Test dan Anova. Asumsi yang
mendasari dalam analisis varian (Anova) adalah bahwa varian dari populasi adalah sama.
Sebagai criteria pengujian, jika nilai signifikasi lebih dari 0,05 maka dapat dikatakan bahwa
varian dari dua atau lebih kelompok data adalah sama. Uji homogenitas yang akan dibahas dalam
tulisan ini adalah Uji Homogenitas Variansi dan Uji Bartlett. Uji homogenitas perlu dilakukan
untuk mengetahui apakah data dalam variabel X dan Y bersifat homogen atau tidak dalam suatu
populasi yang memiliki varians yang sama. Dengan demikian, data yang homogen tersebut dapat
digunakan untuk proses analisis data pada tahap selanjutnya. Uji homogenitas variansi (variance)
sangat diperlukan sebelum kita membandingkan dua kelompok atau lebih, agar perbedaan yang
ada bukan disebabkan oleh adanya perbedaan data dasar (ketidakhomogenan kelompok yang
dibandingkan) namun berdasarkan penghitungan statistik yang ada. Untuk melakukan uji
homogenitas, perlu dipertimbangkan hal berikut bahwa “we will determine if the observed
proportions in each response category are nearly the same for all populations”. Dalam artian
tersebut, data-data yang dibandingkan harus memiliki kesamaan dari keseluruhan data yang
diambil dari populasi tersebut. Ada beberapa rumus yang digunakan untuk uji homogenitas
variansi diantaranya: uji F, uji Harley, uji Cohran,uji Levene, dan uji Bartlett. Namun, pada
umumnya penghitungan yang dilakukan untuk uji homogenitas banyak digunakan dengan uji
bartlett dan uji fisher (uji –f).
Langkah Kerja Praktikum
1. Buka aplikasi R atau R Studio.
2. Instal beberapa paket dengan mengetik perintah berikut :
a. install.packages(“car”)  enter

b. install.packages(“ggplot2”)  enter

c. install.packages(“pastecs”)  enter
d. install.packages(“psych”)  enter

3. Load beberapa paket yang sudah diinstal dengan mengetik perintah berikut:
a. library(car)  enter

b. library(ggplot2)  enter
c. library(pastecs)  enter

d. library(psych)  enter

4. Kali ini akan melakukan suatu uji normalitas dengan uji Shapiro-Wilk. Lakukan dengan
mengetik perintah Rexam<-read.delim(file.choose(), header = TRUE)  enter, lalu
pilih file “RExam”  open
5. Lakukan uji normalitas pada variable exam dan numeracy, dengan mengetikkan perintah
sebagai berikut :
a. shapiro.test(Rexam$exam)  enter

b. shapiro.test(Rexam$numeracy)  enter
6. Lakukan uji shapiro-wilk pada variabel exam dan numercy di dua universitas berbeda,
yaitu Duncetown serta Sussex, dengan mengetik perintah sebagai berikut :
a. by(Rexam$exam, Rexam$uni, shapiro.test)  enter

b. by(Rexam$numeracy, Rexam$uni, shapiro.test)  enter

7. Dalam memudahkan interpretasi, bisa dibuat suatu Q-Q chart plot untuk variabel “exam”,
dengan mengetik perintah pada console qplot(sample=Rexam$exam, stat = "qq") 
enter, serta untuk variabel “numeracy” dengan mengetik perintah pada console
qplot(sample=Rexam$numeracy, stat = "qq")  enter
a. Variabel “exam”
b. Variabel “numeracy”

8. Selanjutnya ialah melakukan uji homogenitas dalam uji Levene’s dengan R Commander.
Awal mula ketikkan perintah untuk memanggil R Commander yaitu library(Rcmdr).
9. Input data yang akan diuji dengan memilih pada bar yaitu Data  Impor Data  dari
file teks, clipboard atau URL...  pilih Rexam

10. Lakukan convert variabel “uni” ke factor sebelum uji Levene’s dengan memilih pada
bar yaitu Data  Atur peubah pada dataset aktif  Konversi peubah numerik ke
faktor...
11. Lakukan uji levene’s untuk mengetahui homogenitas, pada kotak R Comander pilih
Statistik  Variansi  Uji Levene’s...

Pilih uni dan exam, klik OK.

Lakukan uji Levene’s seperti langkah di atas, kali ini memilih uni dan numeracy, klik
OK.
Hasil :

12. Selanjutnya akan dilakukan Koreksi Data. Awal mulai ketikkan perintah pada dlf<-
read.delim(file.choose(),header = TRUE)  enter, lalu pilih file “DownlaodFestival”
 open.
13. Isikan perintah dlf  enter

14. Selanjutnya membuat variabel baru bernama day1plusday2 pada dlt dataframe yang
artinya menambah dari data variabel day1 dan day2. Ketik perintah
dlf$day1PlusDay2<-dlf$day1+dlf$day2  enter, lalu cek dlf  enter

15. Untuk mengurangi, ketik perintah dlf$day2MinusDay1<-dlf$day2-dlf$day1  enter,


cek dlf  enter
16. Untuk multiply (Perkalian) ketik perintah dlf$day2Times5<-dlf$day1*5  enter, cek
dlf  enter

17. Untuk Eksponen (Perpangkatan), ketik perintah dlf$day2Squared<-dlf$day2**2 


enter, lalu cek dlf  enter.

18. Untuk kurang dari (Less Than), ketikkan perintah dlf$day1lessthanone<-dlf$day1<1 


enter, lalu cek dlf  enter.
19. Untuk kurang dari atau sama dengan (Less Than or Equal), ketikkan perintah
dlf$day1lessthanorequalone<-dlf$day1<=1  enter, lalu cek dlf  enter.

20. Untuk lebih besar dari (Greater Than), ketik perintah dlf$day1greaterthanone<-
dlf$day1>1  enter, lalu cek dlf  enter.

21. Untuk lebih besar atau sama (Greater Than or Equal), ketikkan perintah
dlf$day1greaterthanorequalone<-dlf$day1>=1  enter, lalu cek dlf  enter.
22. Untuk Double Equal, ketikkan perintah dlf$male<-dlf$gender==”male”  enter, lalu
cek dlf  enter.

23. Untuk Not Equal to, ketikkan perintah dlf$notMale<dlf$gender!="Male"  enter, lalu
cek dlf  enter.

24. Selanjutnya, melakukan transformasi log pada R dengan menggunakan data yang sama
seperti di atas, lalu ketik perintah dlf$logday1<-log(dlf$day1)  enter, cek dlf  enter.
25. Kemudian untuk transformasi kuadrat, ketikkan perintah dlf$sqrtday1<-sqrt(dlf$day1)
 enter, cek dlf  enter.

Hasil Praktikum
1. Uji Normalitas
a. Shapiro Wilk

Melalui hasil yang didapatkan berdasarkan gambar diatas, maka dapat dijelaskan
mengenai uji normalitas dengan menggunakan metode Shapiro Wilk Test. Dilihat dari
gambar diatas, pada variabel exam menunjukkan w = 0.96131 dan p-value = 0.004991,
sedangkan pada variabel numeracy menunjukkan w = 0.92439 dan p-value =
0.00002424. Dari penjelasan tersebut dapat disimpulkan bahwa p < 0.5 sehingga data
tersebut tidak terdistribusi normal.

b. Dua Universitas Berbeda (Dunstown dan Sussex)

Uji normalitas selanjutnya dilakukan dengan menggunakan cara dari 2 data univeristas
yang berbeda seperti yang diperlihatkan diatas. Dimulai dari data variabel exam, nilai w
= 0.97217 dan p-value = 0.2829, sedangkan yang satunya tetap di variabel yang sama,
nilai w = 0.98371 dan p-value = 0.7151. Kemudian dari data variabel numeracy, nilai w =
0.94082 dan p-value = 0.01452, sedangkan yang satunya nilai w = 0.93235 dan p-value =
0.006787. Dari masing-masing data diatas, nilai p < 0.5, sehingga data tersebut tidak
terdistribusi dengan normal seperti yang dijelaskan sebelumnya.
c. Q-Q Plot Chart (Exam dan Numeracy)
2. Uji Homogenitas
a. Uji Levene (dalam median)

Uji homogenitas adalah suatu uji yang dilakukan untuk mengetahui bahwa dua atau
lebih kelompok data sampel berasal dari populasi yang memiliki varians sama
(homogen). Uji homogenitas ini dapat dilakukan dengan melakukan uji Levene yang juga
melakukan pengujian secara varians. Data yang diuji ini tidak perlu berdistirbusi normal,
namun harus kontinyu atau berlanjut. Berdasarkan gambar diatas, terdapat dua data
variabel yang diuji yaitu exam dan numeracy. Uji data homogenitas ini dilakukan dengan
mengambil data mediannya saja. Dari variabel exam F value = 2.0886 dan Pr = 0.1516,
sedangkan dari variabel numeracy F value = 5.366 dan Pr = 0.02262. Dapat disimpulkan
jika kedua data variabel tersebut sama-sama memiliki nilai > 5 sehingga menghasilkan
suatu data yang homogen.
3. Koreksi Data dan Transformasi Data

Transformasi data digunakan apabila data yang seumpama tidak terdisitribusi dengan
normal atau ada yang tidak valid, sehingga ingin dilakukannya suatu transformasi
sehingga memenuhi asumsi-asumsi yang diinginkan dalam melakukan pembenahan data.
Data yang digunakan dalam transformasi data ini adalah memasukkan data yang bernama
Festival. Berdasarkan gambar diatas, bahwa dijelaskan mengenai data-data yang
dimasukkan antara lain nomer tiket, gender, hasil dari hari pertama (day1), hari kedua
(day2) dan hari ketiga (day3). Melalui data-data tersebut akan ditransformasi secara
bertahap, ada yang dari dua data dijumlah, dikurangi, dikali, data yang dikuadratkan, data
yang memiliki nilai lebih dari atau sama dengan, kurang dari sama dengan, hingga lebih
besar dari. Selain itu, transformasi juga dibuat dalam bentuk logaritma yang
menunjukkan angka < 3.0 dan dibuat dalam transformasi akar kuadrat.
Pembahasan
Pada praktikum kali ini, praktikan melakukan eksplorasi data yakni uji normalitas, uji
homogenitas, dan komputasi data menggunakan Rstudio. Uji normalitas dalam statistik sangat
diperlukan karena tidak semua sampel yang diambil adalah sampel dari populasi yang
terdistribusi secara normal. Jika hasil dari pengujian normalitas adalah data yang terdistribusi
normal, maka analisis yang digunakan adalah analisis statistik parametrik. Sedangkan jika hasil
pengujian normalitas didapatkan hasil bahwa data yang dimiliki tidak terdistribusi secara normal,
maka analisis yang digunakan adalah analisis statistik nonparametrik. Analisis nonparametrik
tidak memerlukan asumsi normalitas data karena analisis ini mengasumsikan distribusi data tidak
mengikuti suatu distribusi tertentu.

Uji normalitas yang dilakukan menggunakan Shapiro-Wilk Test. Tes Shapiro-Wilk dilakukan
dengan data dari file Rexam. Variabel pertama yang diuji adalah variabel exam dan diperoleh
hasil W sebesar 0,96131 dan p-value sebesar 0,004991 yang mengindikasikan distribusi sampel
yang tidak normal. Pada variabel kedua, didapatkan nilai W sebesar 0,92439 dan p-value sebesar
2,424e-05 mengindikasikan distribusi sampel yang tidak normal.

Kemudian tes dilanjutkan menggunakan dua variabel dengan menggunakan fungsi by(). Fungsi
ini adalah pembungkus berorientasi objek tapply yang diterapkan ke data frame. Uji ini
dilakukan dengan dua variabel x yang berbeda yakni variabel exam dan variabel numeracy
dengan variabel uni sebagai y. Pada tes variabel exam, jika nilai uni = 0 didapatkan nilai W
sebesar 0,97217 dan p-value sebesar 0,2829 yang mengindikasikan sampel terdistribusi secara
normal. Jika nilai uni = 1, didapatkan nilai W sebesar 0,98371 dan p-value sebesar 0,7151 yang
mengindikasikan sampel terdistribusi secara normal. Sedangkan pada tes dengan variabel
numeracy, jika nilai uni = 0 didapatkan W sebesar 0,94082 dan p-value sebesar 0,01452 yang
mengindikasikan sampel tidak terdistribusi normal. Jika nilai uni = 1 didapatkan W sebesar
0,93235 dan p-value sebesar 0,006787, mengindikasikan sampel tidak terdistribusi secara
normal. Setelah normalitas diuji, dilakukan visualisasi plot dari data menggunakan fungsi qplot
dari package ggplot. Dari visualisasi, terlihat jika distribusi dari exam cenderung pada kondisi
normal sedangkan distribusi dari numeracy banyak yang tidak pada garis normal.
Uji homogenitas perlu dilakukan untuk mengetahui apakah suatu populasi cocok dengan
distribusi tertentu, tetapi tidak cukup untuk menyatakan apakah dua populasi mengikuti distribusi
yang sama. Pengujian ini dapat digunakan untuk menarik kesimpulan apakah dua populasi
memiliki distribusi yang sama atau tidak. Pada pengujian homogenitas di praktikum ini
menggunakan uji Levene, pengujian ini dilakukan jika sampel k memiliki varian yang sama.
Varian yang sama di seluruh sampel disebut homogenitas varian. Beberapa uji statistik, misalnya
analisis varian, mengasumsikan bahwa varian sama di seluruh kelompok atau sampel. Uji
Levene dapat digunakan untuk memverifikasi asumsi tersebut. Pengujian ini memiliki dua
hipotesis yakni Null hypothesis (H0) varian dari kelompok sama, dan Alternative hypothesis
(HA) varian dari kelompok tidak sama. Pengujian ini menghasilkan statistik uji dan p-value yang
sesuai. Jika pvalue kurang dari tingkat signifikansi (0,05) maka null hypothesis dapat ditolak dan
dapat dikatakan varian pada kelompok tidak sama. Pada praktikum ini, uji Levene dilakukan
melalui R Commander dan R software. Untuk dapat melakukan uji Levene, variabel numerik
dari uni harus dikonversi terlebih dahulu menjadi faktor. Konversi ini dapat dilakukan melalui R
Commander dari menu data > manage variables in active data set > convert numeric variables to
factors lalu ubah variabel 0 menjadi x dan 1 menjadi y.

Variabel yang digunakan pada uji Levene ini sama dengan saat pengujian sebelumnya, yakni
exam dan numeracy untuk x dan uni untuk y. Tetapi pada tiap pengujian variabel yang berbeda
perlu dicari juga nilai median dan meannya, dengan menggunakan perintah center. Pada
pengujian Levene exam dan uni median menghasilkan p-value sebesar 0,1516 dan mean
menghasilkan p-value sebesar 0,1112 yang mengindikasikan semua varian pada kelompok sama.
Sedangkan pada pengujian Levene numerancy dan uni median menghasilkan p- value 0,02262
dan mean menghasilkan p-value sebesar 0,007846 yang mengindikasikan semua varian yang ada
pada kelompok tidak sama.
Kesimpulan
Dapat disimpulkan pemaparan diatas, bahwa:
1. Uji Normalitas dilakukan untuk memastikan data yang telah dikumpulkan berdistribusi normal
atau tidak. Pada dasarnya distribusi normal merupakan suatu distribusi yang menunjukkan
sebaran data yang seimbang yang sebagian besar data adalah mendekati nilai mean.
2. Uji homogenitas adalah suatu uji yang dilakukan untuk mengetahui bahwa dua atau lebih
kelompok data sampel berasal dari populasi yang memiliki variansi yang sama (homogen) dan
pengujian ini digunakan untuk meyakinkan bahwa kelompok data memang berasal dari sampel
yang sama.
3. Pada komputasi variabel yang meliputi perhitungan matematis penjumlahan, pengurangan,
pemangkatan, perkalian, data kurang dari atau sama dengan, data lebih dari atau sama dengan,
mencari variabel gender, transformasi log dan transformasi akar.
Daftar Pustaka
R Core Team. 2020. R: A Language and Environment for Statistical Computing.
Vienna, Austria: R Foundation for Statistical Computing.

Anda mungkin juga menyukai