Puji syukur kepada Allah SWT yang telah memberikan rahmat dan karunianya serta
nikmat Kesehatan sehingga bisa menyelesaikan tugas makalah pada minggu ke empat dengan
tepat pada waktunya.
Adapun tujuan dari penulisan makalah ini adalah untuk memenuhi tugas ujian tengah
semester mata kuliah analisis data eksploratif dan juga menambah wawasan bagi penulis dan
pembaca. Saya ucapkan terimakasih kepada ibu dosen yang telah memberikan tugas ini
sehingga bisa menambah wawasan khususnya bagi penulis. Saya juga berterimakasih kepada
pihak pihak yang telah membantu saya berdiskusi dalam menyelsaikan tugas makalah ini.
Dalam penulisan makalah ini saya menyadari bahwa makalah ini jauh dari kata
sempurna, sehingga saran dan kritik yang membangun sangat dibutuhkan dari dosen dan
teman teman semua.
Penulis
BAB I
PENDAHULUAN
1.3Tujuan
Tujuan dari penulisan makalah ini adalah untuk mempelajari cara menganalisa data
menggunakan diagram boxplot dan histogram. Juga untuk mengetahui ukuran pemusatan
dan penyebaran data serta untuk mengetahui apakah data tersebut normal dengan
menggunakan salah satu uji normalitas.
BAB II
PEMBAHASAN
Boxplot dapat digunakan untuk menunjukkan perbedaan antara populasi tanpa menggunakan
asumsi distirbus statistk yang mendasarinya. Karenanya, boxplot tergolong dalam statistik
non parametrik. Jarak antara bagian-bagian dari box menunjukkan derajat
dipersi(penyebaran) dan skewness (kecondongan) dalam data. Boxplot dapat disajikan secara
horizontal maupun vertikal.
1. Cenderung memperhatikan outlier, yang mungkin tidak diperlukan dalam suatu data
2. Selain itu bentuk distribusi terpengaruh pula adanya outlier
3. Cenderung menyembunyikan detail dari distribusi data
Studi kasus:
Berikut ini merupakan data suku dan tinggi badan mahasiswa(terlampir)
5. Tulis kode berikut: names(data1) pada jendela console untuk melihat daftar nama
variabel dalam data tsb.
6. Tulis kode berikut boxplot(tinggi.badan~suku) pada jendela console dan tekan enter
7.
7. Boxplot akan muncul pada jendela
2.3.1 Definisi
Ukuran pemusatan data adalah statistik ringkasan yang mewakili titik pusat atau nilai tipikal
dari berbagai kumpulan data. Pengukuran ini menunjukkan di mana sebagian besar nilai
dalam distribusi berada dan juga disebut sebagai lokasi pusat distribusi.
Ukuran pemusatan data digunakan untuk mendapatkan gambaran yang lebih jelas mengenai
sekumpulan data. Ukuran pemusatan data ini terdiri dari:
Mean, perhitungan untuk mengitung nilai rata-rata pada data berkelompok.
Median, nilai tengah atau data yang terletak di tengah-tengah pada data berkelompok.
Modus, nilai yang paling sering mncul pada distribusi data berkelompok.
Ukuran penyebaran data merupakan ukuran yang menunjukkan seberapa jauh suatu data
menyebar dari rata-ratanya. Ukuran penyebaran data yang ada dalam materi statistika
meliputi jangkaun, hamparan, dan kuartil.
Apa itu yang di maksud dengan jangkaun, hamparan, dan kuartil, berikut penjelasan nya:
Jangkauan atau rentang ialah selisih antara nilai data besar dan nilai data terkecil.
Hamparan atau Jangkauan Antar Kuartil (JAK) merupakan selisih antara kuartil atas
(Q3) dengan kuartil bawah (Q1).
Kuartil adalah pembagian sejumlah data terurut menjadi samajumlah nya untuk setiap
bagian. Setiap bagian dipisahkan oleh nilai kuartil yang meliputi kuartil bawah (Q1),
kuartil tengah (Q2), dan kuartil atas (Q1).
2.3.3 Analisis ukuran Pemusatan dan Penyebaran data dari data tinggi
badan mahasiswa dengan R studio
1) mencari mean:
2) Mencari median:
3) Mencari modus:
4) Mencari jangkauan/range:
2.4.1 Definisi
Uji Normalitas adalah sebuah uji yang dilakukan dengan tujuan untuk menilai sebaran data
pada sebuah kelompok data atau variabel, apakah sebaran data tersebut berdistribusi normal
ataukah tidak.
Berdasarkan pengalaman empiris beberapa pakar statistik, data yang banyaknya lebih dari 30
angka (n > 30), maka sudah dapat diasumsikan berdistribusi normal. Biasa dikatakan sebagai
sampel besar.
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji normalitas. Karena belum tentu data yang lebih dari 30 bisa
dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30
belum tentu tidak berdistribusi normal.
2. Liliefors
Metode Lilliefors menggunakan data dasar yang belum diolah dalam tabel distribusi
frekuensi. Data ditransformasikan dalam nilai Z untuk dapat dihitung luasan kurva normal
sebagai probabilitas komulatif normal. Probabilitas tersebut dicari bedanya dengan
probabilitas kumulatif empiris. Beda terbesar dibanding dengan tabel Lilliefors
Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
F(X) = Probabilitas komulatif normal
S(X) = Probabilitas kumulatif empiris
Persyaratan dari metode ini :
• Data berskala interval atau ratio (kuantitatif)
• Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
• Dapat untuk n besar maupun n kecil.
no Xi xi−x FT FS |F T −F S|
z=
SD
Keterangan :
Xi = Angka pada Data
Z = Transformasi dari angka ke notasi pada distribusi normal
FT = Probabilistas komulatif normal
FS = Probabilitas komulatif empiris
Persyaratan Metode ini :
• Data berskala interval atau ratio (kuantitatif)
• Data tunggal/belum dikelompokkan pada table distribusi frekuensi
• Dapat untuk n besar maupun kecil.
4. Shapiro Wilk
Metode Shapiro Wilk menggunakan data dasar yang belum diolah dalam tabel distribusi
frekuensi. Data diurut, kemudian dibagi dalam dua kelompok untuk dikonversi dalam
Shapiro Wilk. Dapat juga dilanjutkan transformasi dalam nilai Z untuk dapat dihitung luasan
kurva normal.
Rumus Uji Shapiro Wilk:
Keterangan :
Xn-i+1 = Angka ke n – i + 1 pada data
Xi = Angka ke i pada data
Keterangan :
Xi = Angka ke i pada data yang
X = Rata-rata data
Keterangan :
G = Identik dengan nilai Z distribusi normal
T3 = Berdasarkan rumus di atas bn, cn, dn = Konversi Statistik Shapiro-Wilk Pendekatan
Distribusi Normal
Signifikansi
Signifikansi dibandingkan dengan tabel Shapiro Wilk. Signifikansi uji nilai T3 dibandingkan
dengan nilai tabel Shapiro W, untuk dilihat posisi nilai probabilitasnya (p).
Jika nilai p > 5%, maka Ho diterima ; Ha ditolak.
Jika nilai p < 5%, maka Ho ditolak ; Ha diterima.
5. Jarque Bera
Uji Jarque Bera adalah salah satu uji normalitas jenis goodness of fit test yang mana
mengukur apakah skewness dan kurtosis sampel sesuai dengan distribusi normal. Uji ini
didasarkan pada kenyataan bahwa nilai skewness dan kurtosis dari distribusi normal sama
dengan nol. Oleh karena itu, nilai absolut dari parameter ini bisa menjadi ukuran
penyimpangan distribusi dari normal. Dalam aplikasinya nilai Jarque Bera (JB) dibandingkan
dengan nilai Chi-Square Tabel pada derajat kebebasan 2.
Tidak seperti halnya uji normalitas yang lain, misalkan Shapiro Wilk, Lilliefors dan
Kolmogorov Smirnov yang ada di berbagai aplikasi statistik populer, Jarque Bera tidak
terdapat pada aplikasi-aplikasi tersebut. Dalam aplikasi SPSS, STATA
maupun Minitab, tidak terdapat fitur untuk melakukan uji ini. Oleh karenanya kita perlu
mempelajari cara perhitungan manualnya
Interpretasi:
Pada pengujian Liliefors untuk uji normalitas, dengan Ho : Sampel berdistribusi normal ;
H1 : Sampel tidak berdistribusi normal
Jika L hitung < L tabel terima Ho
Jika L hitung > Ltabel tolak Ho
KESIMPULAN
Dalam statistics analysis, Box Plot merupakan metode graphic yang mudah digunakan dan
diintepretasikan untuk memperoleh informasi dari sebuah sample. Terdapat empat ukuran
sekaligus dijelaskan dalam diagram boxplot yaitu:
1. nilai observasi terkecil,
2. kuartil terendah atau kuartil pertama (Q1), yang memotong 25 % dari data terendah
3. median (Q2) atau nilai pertengahan
4. kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi
nilai observasi terbesar.
Berikut ini adalah fungus dari Histogram:
1. Memberikan informasi ukuran pemusatan dan penyebaran data secara ringkas,
meskipun ukuran contohnya sangat besar. Distribusi data pada histogram akan
membentuk kemenjuluran/kemiringan yang dapat ditentukan dari perbedaan letak
ukuran pemusatan data yaitu mean, median, dan modus. Terdapat tiga jenis
Kemenjuluran/kemiringan yaitu :
Ukuran pemusatan data digunakan untuk mendapatkan gambaran yang lebih jelas mengenai
sekumpulan data. Ukuran pemusatan data ini terdiri dari:
Mean, perhitungan untuk mengitung nilai rata-rata pada data berkelompok.
Median, nilai tengah atau data yang terletak di tengah-tengah pada data berkelompok.
Modus, nilai yang paling sering mncul pada distribusi data berkelompok.
Ukuran penyebaran data merupakan ukuran yang menunjukkan seberapa jauh suatu data
menyebar dari rata-ratanya. Ukuran penyebaran data yang ada dalam materi statistika
meliputi jangkaun, hamparan, dan kuartil.
Uji normalitas dapat mempermudah kita dalam memecahkan masalah yang berkaitan dengan
kenormalan distribusi suatu data individu ataupun kelompok.
Metode Chi-Kuadrat dan Liliefors dapat digunakan dalam menguji kenormalan suatu
distribusi data.
Pada pengujian Liliefors untuk uji normalitas, dengan Ho : Sampel berdistribusi
normal ; H1 : Sampel tidak berdistribusi normal
Jika L hitung < L tabel terima Ho
Jika L hitung > Ltabel tolak Ho
Pada pengujian Chi-Kuadrat untuk uji normalitas, dengan Ho : Sampel berdistribusi
normal ; H1 : Sampel tidak berdistribusi normal
Jika nilai X2hitung < nilai X2tabel, maka Ho diterima ; Ha ditolak.
Jika nilai X2 hitung > nilai X2 tabel, maka maka Ho ditolak ; Ha diterima.