STATISTIK
ACARA V
EKSPLORASI DATA 2
Disusun Oleh :
I. TUJUAN
1. Mahasiswa mampu memahami apa itu eksplorasi data;
2. Mahasiswa mampu mengaplikasikan eksplorasi data menggunakan RStudio;
3. Mahasiswa mampu melakukan uji homogenitas dengan data rexam, rexam
Numeracy, dan rexam Uni menggunakan R Commender dan R Software.
9. Lakukan uji normalitas menggunakan metode shapiro wilk untuk mengetahui exam dan
uninya
10. Lakukan uji normalitas menggunakan metode shapiro wilk untuk mengetahui numeracy
dan uni
11. Tampillkan visualisasi data dalam bentuk chart plots dengan mengetahui exam dan
numeracy
14. Selanjutnya adalah klik Data->Manage Variabel in active data set->Convert numeric
variable to factors
15. Pilih uni dan klik OK
V. HASIL PRAKTIKUM
1. Hasil uji normalitas menggunakan metode shapiro wilk
VI. PEMBAHASAN
Berdasarkan praktikum yang dilakukan yaitu eksplorasi data 2 dapat diketahui hasilnya
bedasarkan hasil praktikum di atas. Hasil praktikum eksplorasi data ini meliputi shapiro test,
levene test, shapiro wilk, median, mean, hingga charplots exam dan numeracy. Selain itu
hasil dari eksplorasi data 2 juga terdapat table excel hasil eksplorasi data yang telah menjadi
1.
Pertama adalah shapiro test. Pada shapiro test, hasil diketahui terdapat pada numeracy,
exam, uni, numeracy dan uni, serta exam dan uni. Hasil pada numeracy adalah 0,924. Kedua
adalah hasil numeracy dan uni dengan hasil 0,940. Ketiga adalah hasil dari exam dan uni
sebesar 0,983. Kedua adalah levene test. Pada levene test hasil yang di dapat adalah 2.58
pada mean dan 2.08 pada median. Selain itu hasil yang di dapat pada levene test Rexam
median adalah 5.36 dan Rexam mean adalah 7.36. Terakhir adalah hasil dari shapiro test wilk
yang pertama, hasilnya adalah 0,96.
Pada dasarnya uji normalitas sebuah data dapat diketahui dengan melihat persebaran data
(titik) pada sumbu diagonal dari grafik histogram dari residualnya, 1) Data dikatakan
berdistribusi normal, jika data menyebar di sekitar garis diagonal dan mengikuti arah garis
diagonal atau grafik histogramnya, 2) Sebaliknya data tidak terdistribusi normal, jika data
menyebar jauh dari arah garis atau tidak mengikuti diagonal atau grafik histogramnya.
Uji homogenitas dengan menggunakan Rcmndr dengan data Rexam. Sebelum
melakukan uji homogenitas perlu dilakukan konversi dari data numerik menjadi faktor
melalui Data => Manage variabel in active data set => convert numeric variable to factors.
Data yang perlu di convert adalah data Uny diberi X dan Y dengan O sebagai X dan 1
sebagai Y. Uji homogenitas yang dilakukan adalah leven’s dengan data uny dan exam dengan
uji statistik median. Lalu untuk yang kedua perhitungan berdasarkan mean.
Uji yang dilakukan ketiga adalah uji komputasi variabel baru dengan menggunakan data
festival dengan perintah read.delim. Dengan beberapa perintah, diantaranya; penjumlahan,
pengurangan, perkalian, pemangkatan, analisis nilai yang lebih kurang dari 1, lebih kecil atau
sama dengan 1, lebih besar dari 1, lebih besar atau sama, mencari data “Male” di variabel
gender, mencari data “Not Male” di variabel gender, transformasi LOG pada R software, dan
transformasi akar.
Dari hasil yang terdapat di atas dapat ketahui bahwasanya apabila dibentuk melalui
charplot hasilnya bisa diketahui pada hasil praktikum no. 11 dan 12. Pada hasil praktikum no.
11 apabila dibentuk charplots hasilnya tidak keluar dari garis serta sesuai dengan outcome
yang diharapkan. Lalu pada table yang terdapat pada di excel itu merupakan hasil uji
eksplorasi data berdasarkan penjumlahan, pembagian, kurang dari, lebih dari, pemangkatan,
dan juga perkalian. Di table excel tersebut dibagi berdasarkan gendernya yaitu male dan
female. Lalu hasilnya berupa angka dan TRUE and FALSE. Selain itu pada table tersebut
terdapat huruf N/A. N/A tersebut menjelaskan bahwa tidak ada data yang berupa angka,
dalam hal ini bisa dikatakan 0. Akhirnya solusi lain yang digunakan untuk mengganti N/A
adalah menggantinya dengan angka 0.
VII. KESIMPULAN
Dari hasil uji normalitas yang dilakukan menggunakan Shapiro Wilk menunjukkan
bahwa p-value kurang dari 0,05. Artinya distribusi data tidak normal dengan H₀ ditolak dan
H₃ diterima. Untuk menampilkan visualisasi data, harus menggunakan gplot yaitu metode
grafis alternatif untuk menilai normalitas histogram. Selain uji normalitas, juga dilakukan uji
homogenitas. Juga melakukan Levene’s test, dengan tujuan mengetahui perbedaan dari dua
kelompok data dengan varians yang berbeda.