Frizka Asri Ayuni - 1903111526 - Uts - Ade

ANALISIS DATA EKSPLORATIF
ANALASIS DATA MENGGUNAKAN R STUDIO
NAMA : FRIZKA ASRI AYUNI

NIM : 1903111526
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
PRODI S1 STATISTIKA
UNIVERSITAS RIAU
2021
Kata pengantar
Puji syukur kepada Allah SWT yang telah memberikan rahmat dan karunianya serta
nikmat Kesehatan sehingga bisa menyelesaikan tugas makalah pada minggu ke empat dengan
tepat pada waktunya.
Adapun tujuan dari penulisan makalah ini adalah untuk memenuhi tugas ujian tengah
semester mata kuliah analisis data eksploratif dan juga menambah wawasan bagi penulis dan
pembaca. Saya ucapkan terimakasih kepada ibu dosen yang telah memberikan tugas ini
sehingga bisa menambah wawasan khususnya bagi penulis. Saya juga berterimakasih kepada
pihak pihak yang telah membantu saya berdiskusi dalam menyelsaikan tugas makalah ini.
Dalam penulisan makalah ini saya menyadari bahwa makalah ini jauh dari kata
sempurna, sehingga saran dan kritik yang membangun sangat dibutuhkan dari dosen dan
teman teman semua.
Pekanbaru, 11 april 2021
Penulis
BAB I
PENDAHULUAN
1.1 Latar Belakang

Semakin berkembangnya berbagai bidang kehidupan maka semakin besar pulalah
tuntutan untuk dapat mempelajari dunia ini. Pembelajaran itu tentunya berguna untuk
memastikan bahwa bidang yang sedang dijalankan tersebut dapat berjalan dengan baik.
Salah satu bentuk pembelajaran terhadap dunia ialah dengan menyadari bahwa saat ini
data lah yang sangat diperlukan. Dengan memperhatikan data, berbagai bidang pekerjaan
akan lebih terbantu dan dapat mengarahkan bahkan mengestimasi kejadian-kejadian atau
langkah yang sedang maupun akan dilakukan. Data mentah akan dianalisis untuk
mendapatkan beberapa kesimpulan. Langkah awal dalam menganalisis data adalah
mempelajari karakteristik dari data tersebut. Untuk itu, kita perlu mengetahui misalnya
pemusatan dan penyebaran data dari nilai tengahnya, nilai ekstrim atau outliernya, dan
beberapa pengukuran lainnya. Terdapat beberapa teknik untuk mempelajari karakteristik
dan distribusi data. Diantaranya stemleaf plot, histogram, density trace, probability plot,
dan boxplot.
1.2 Rumusan Masalah

1. Bagaimana analisis data melalui diagram boxplot dan pengaplikasiannya ke R?
2. Bagaimana analisis data melalui histogram dan pengaplikasiannya ke R?
3. Bagaimana ukuran pemusatan dan penyebaran data dari data tersebut dan
pengaplikasiannya ke R?
4. Bagaimana kenormalan dari data tersebut dan pengaplikasian salah satu uji
normlaitasnya di R?
1.3Tujuan
Tujuan dari penulisan makalah ini adalah untuk mempelajari cara menganalisa data
menggunakan diagram boxplot dan histogram. Juga untuk mengetahui ukuran pemusatan
dan penyebaran data serta untuk mengetahui apakah data tersebut normal dengan
menggunakan salah satu uji normalitas.
BAB II
PEMBAHASAN
2.1 Analisis Dengan Boxplot
2.1.1 Definisi Boxplot

Dalam statistics analysis, Box Plot merupakan metode graphic yang mudah digunakan dan
diintepretasikan untuk memperoleh informasi dari sebuah sample. Box Plot pertama kali
dikenalkan oleh American Statistician, John Tukey, pada tahun 1977.
Boxplot adalah salah satu cara dalam statistik deskriptif untuk menggambarkan secara grafik
dari data numeris melalui lima ukuran sebagai berikut:
 nilai observasi terkecil,

 kuartil terendah atau kuartil pertama (Q1), yang memotong 25 % dari data terendah
 median (Q2) atau nilai pertengahan
 kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi
 nilai observasi terbesar.
Boxplot dapat digunakan untuk menunjukkan perbedaan antara populasi tanpa menggunakan
asumsi distirbus statistk yang mendasarinya. Karenanya, boxplot tergolong dalam statistik
non parametrik. Jarak antara bagian-bagian dari box menunjukkan derajat
dipersi(penyebaran) dan skewness (kecondongan) dalam data. Boxplot dapat disajikan secara
horizontal maupun vertikal.
2.1.2 Fungsi Boxplot

Box Plot disebut juga box and whisker diagram, diagram yang secara visual menunjukkan
pusat data, distribusi, dan lima ringkasan data, yaitu:
1. Rata-rata(mean)
2. Median atau Q2 merupakan data yang terletak di tengah dari keseluruhan data, membagi
data menjadi dua bagian yang sama besar (50%). Median ditunjukkan dengan garis
horizontal.
3. Q1, merepresentasikan seluruh data yang terdapat pada 25 % bagian dari keseluruhan
data, setelah data diurutkan dari yang terkecil hingga terbesar..
4. Q3, yaitu seluruh data yang terdapat pada 75 % bagian dari keseluruhan data, setelah data
diurutkan dari yang terkecil hingga terbesar.
5. Outlier, yaitu data yang terletak diluar 1.5 * jarak antar quartile.
2.1.3 Kelebihan dan Kelemahan Diagram Boxplot

Kelebihan Diagram Boxplot
1. Secara visual menggambarkan lokasi dari data
2. Menunjukkan sebaran data tersebut simetris atau tidak
3. Tidak seperti metode lain, boxplot memperlihatkan outlier
4. Dapat cepat digunakan untuk mebandingkan lebih dari satu distribusi pada satu tampilan
secara bersamaan
Kelemahan Diagram Boxplot
1. Cenderung memperhatikan outlier, yang mungkin tidak diperlukan dalam suatu data
2. Selain itu bentuk distribusi terpengaruh pula adanya outlier
3. Cenderung menyembunyikan detail dari distribusi data
2.1.4 Intepretasi Boxplot

Intepretasi dari Box Plot adalah sebagai berikut:
1. Box mengandung 50% dari data. Tepi atas dari box disebut Q3 (75% dari data) dan tepi
bawah dari box disebut Q1(25 % dari data).
2. Garis yang terdapat pada box disebut dengan median data (Q2)
3. Apabila jarak antara tepi bawah dan tepi atas ke median data tidak sama, berarti distribusi
data tersebut tidak simetris (skew).
4. Titik terakhir dari garis vertical merupakan nilai maksimum dan minimum, kecuali jika
terdapat outlier dalam data tersebut. Panjang garis vertical tersebut adalah 1.5 kali inter
quartile range (IQR = Q3 – Q1)
5. Titik yang berada di luar garis tersebut disebut dengan outlier.
6. Luas kotak menunjukkan besar kecilnya keragaman data.
7. Data yang terletak di antara dua pagar dalam merupakan data yang baik karena masih
merupakan anggota kelompok data.
8. Garis whisker, jarak antara Q1 dan statistic peringkat paling dekat dengan pagar dalam
dan jarak antara Q3 dengan statistic peringkat yang bernilai paling dekat dengan pagar
dalam.
2.1.5 cara membuat diagram boxplot dengan R studio
Studi kasus:
Berikut ini merupakan data suku dan tinggi badan mahasiswa(terlampir)
Cara menyajikan data:

1. Dengan menggunakan microsoft excel, ubah data tersebut ke format*.csv
2. Buka R studio
3. Masukkan data tersebut ke R studio
4. Apabila data berhasil dimasukkan, data tersebut akan terlihat di jendela view files and
data
5. Tulis kode berikut: names(data1) pada jendela console untuk melihat daftar nama
variabel dalam data tsb.
6. Tulis kode berikut boxplot(tinggi.badan~suku) pada jendela console dan tekan enter
7.
7. Boxplot akan muncul pada jendela
Interpretasi dari boxplot suku jawa adalah

1) Q1 terletak dibawah 155
2) Median dari boxplot tersebut adalah 160 < x < 155
3) Q3 terletak di 165 < x < 160
Interpretasi dari boxplot suku sunda adalah
1) Q1 terletak diatas 155
2) Median dari boxplot tersebut adalah 160 < x < 155 atau sekitar 156
3) Q3 terletak di 155< x < 160
Titik yang berada di 145 dan diatas 165 merupakan outlier
2.2 Analisis dengan Histogram
2.2.1 Definisi Histogram

Histogram adalah Grafik yang berisi ringkasan dari sebaran (dispersi atau variasi) suatu data.
Histogram adalah grafik batang yang menampilkan frekuensi data. Penggunaan grafik
Histogram telah diaplikasikan secara luas dalam ilmu statistik. Jumlah titik data yang terletak
dalam rentang nilai (kelas) menjadi sangat mudah diinterpretasikan dengan menggunakan
histogram.
Pada histogram, tidak ada jarak antar batang/bar dari grafik. Hal ini dikarenakan bahwa titik
data kelas bisa muncul dimana saja di daerah cakupan grafik. Sedangkan Ketinggian bar
sesuai dengan frekuensi atau frekuensi relatif jumlah data di kelas. Semakin tinggi bar,
semakin tinggi frekuensi data. Semakin rendah bar, semakin rendah frekuensi data.
2.2.2 Fungsi Histogram
Berikut ini adalah fungus dari Histogram:

1. Memberikan informasi ukuran pemusatan dan penyebaran data secara ringkas, meskipun
ukuran contohnya sangat besar. Distribusi data pada histogram akan membentuk
kemenjuluran/kemiringan yang dapat ditentukan dari perbedaan letak ukuran pemusatan
data yaitu mean, median, dan modus. Terdapat tiga jenis Kemenjuluran/kemiringan
yaitu:
 Mean = median = modus : Simteris
 Mean < median < modus : Menjulur ke kiri
 Mean > median > modus : Menjulur ke kanan
2. Mengenali pola umum sebaran

3. Mengidentifikasi data yang kurang wajar dan ekstrim
4. Memberikan informasi secara cepat banyaknya amatan yang termasuk dalam selang
minat.
2.2.3 Intepretasi Histogram

1) Batang pada histogram yang berdempetan menunjukkan tepi bawah kelas atas dan tepi
bawa kelas atas
2) Puncak batang pada histogram merupakan frekuensi dari data kelompok tersebut
2.2.4 Kelebihan Histogram

1) Bentuknya memudahkan orang memahaminya secara langsung
2) Mudah dalam membandingkan statistik
3) Ketika diperlukan, mudah juga untuk mengetahui nilai statistik pada suatu kurun
waktu
2.2.5 Kelemahan Histogram

Kelemahan pada histogram adalah histogram hanya menampilkan nilai total atau rata – rata
tidak menampilkan data umum.
2.2.6 Analasis data menggunakan histogram dengan R studio

Berikut ini merupakan data suku dan tinggi badan mahasiswa(terlampir)
1) Panggil data terlebih dahulu
2) buat lah histogramnya dengan cara “ hist(judul table$nama”)
3) Sehingga jadilah histogram dari data tinggi badan mahasiswa

2.3 Analisis Pemusatan dan Penyebaran data
2.3.1 Definisi
Ukuran pemusatan data adalah statistik ringkasan yang mewakili titik pusat atau nilai tipikal
dari berbagai kumpulan data. Pengukuran ini menunjukkan di mana sebagian besar nilai
dalam distribusi berada dan juga disebut sebagai lokasi pusat distribusi.
Ukuran pemusatan data digunakan untuk mendapatkan gambaran yang lebih jelas mengenai
sekumpulan data. Ukuran pemusatan data ini terdiri dari:
 Mean, perhitungan untuk mengitung nilai rata-rata pada data berkelompok.
 Median, nilai tengah atau data yang terletak di tengah-tengah pada data berkelompok.
 Modus, nilai yang paling sering mncul pada distribusi data berkelompok.
Ukuran penyebaran data merupakan ukuran yang menunjukkan seberapa jauh suatu data
menyebar dari rata-ratanya. Ukuran penyebaran data yang ada dalam materi statistika
meliputi jangkaun, hamparan, dan kuartil.
Apa itu yang di maksud dengan jangkaun, hamparan, dan kuartil, berikut penjelasan nya:
 Jangkauan atau rentang ialah selisih antara nilai data besar dan nilai data terkecil.
 Hamparan atau Jangkauan Antar Kuartil (JAK) merupakan selisih antara kuartil atas
(Q3) dengan kuartil bawah (Q1).
 Kuartil adalah pembagian sejumlah data terurut menjadi samajumlah nya untuk setiap
bagian. Setiap bagian dipisahkan oleh nilai kuartil yang meliputi kuartil bawah (Q1),
kuartil tengah (Q2), dan kuartil atas (Q1).
2.3.2 Fungsi ukuran Pemusatan dan Penyebaran Data

Fungsi dari ukuran pemusatan data dalah untuk membandingkan dua atau lebih populasi
karena sangat sulit membedakan masing masing anggota dari masing – masing anggota
populasi atau masing – masing anggota data.
Fungsi dari ukuran penyebaran data yang paling umum adalah digunakan sebagai ukuran
yang menunjukkan seberapa jauh data tersebar dari rata – rata.
2.3.3 Analisis ukuran Pemusatan dan Penyebaran data dari data tinggi
badan mahasiswa dengan R studio
1) mencari mean:
2) Mencari median:
3) Mencari modus:
4) Mencari jangkauan/range:
5) Mencari variansi data:
6) Mencari standar deviasi:
2.4 uji normalitas
2.4.1 Definisi
Uji Normalitas adalah sebuah uji yang dilakukan dengan tujuan untuk menilai sebaran data
pada sebuah kelompok data atau variabel, apakah sebaran data tersebut berdistribusi normal
ataukah tidak.
Berdasarkan pengalaman empiris beberapa pakar statistik, data yang banyaknya lebih dari 30
angka (n > 30), maka sudah dapat diasumsikan berdistribusi normal. Biasa dikatakan sebagai
sampel besar.
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji normalitas. Karena belum tentu data yang lebih dari 30 bisa
dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30
belum tentu tidak berdistribusi normal.
2.4.2 macam-macam uji normalitas

1. Chi Square
Metode Chi-Square atau 𝑋2 menggunakan pendekatan penjumlahan penyimpangan data
observasi tiap kelas dengan nilai yang diharapkan. Uji Chi-square seringkali digunakan oleh
para peneliti sebagai alat uji normalitas.
Persyaratan Metode ini :
• Data tersusun berkelompok atau dikelompokkan dalam table distribusi frekuensi.
• Cocok untuk data dengan banyak angka besar (n>30)
• Setiap sel harus terisi, yang kurang dari 5 digabungkan.
Rumus Uji Normalitas dengan Chi-Square : 𝑋2=Σ(𝑂𝑖−𝐸𝑖)𝐸𝑖

Ket.
X2 = Nilai 𝑋2
Oi = Nilai Obsertvasi
Ei = Nilai Expected / Harapan, luasan interval kelas berdasarkan tabel normal dikalikan N
(total frekuensi) (pi x N)
N = Banyaknya angka pada data (Total Frekuensi)
Signifikansi: Signifikansi uji, nilai X2 hitung dibandingkan dengan X2 tabel (Chi-Square).
Jika nilai X2 hitung < nilai X2 tabel, maka Ho diterima dan Ha ditolak. Jika nilai X2 hitung >
nilai X2 tabel, maka maka Ho ditolak dan Ha diterima.
2. Liliefors
Metode Lilliefors menggunakan data dasar yang belum diolah dalam tabel distribusi
frekuensi. Data ditransformasikan dalam nilai Z untuk dapat dihitung luasan kurva normal
sebagai probabilitas komulatif normal. Probabilitas tersebut dicari bedanya dengan
probabilitas kumulatif empiris. Beda terbesar dibanding dengan tabel Lilliefors
no xi xi−x F(x) S(x) If(x)-s(x)I

z=
SD
1.
2.
3.
Ds
t
Keterangan :
Xi = Angka pada data
Z = Transformasi dari angka ke notasi pada distribusi normal
F(X) = Probabilitas komulatif normal
S(X) = Probabilitas kumulatif empiris
Persyaratan dari metode ini :
• Data berskala interval atau ratio (kuantitatif)
• Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
• Dapat untuk n besar maupun n kecil.
Signifikansi Uji Lilliefors :

Signifikansi uji, nilai | F (x) – S (x) | terbesar dibandingkan dengan nilai tabel Lilliefors.
Jika nilai | F (x) – S (x) | terbesar < nilai tabel Lilliefors, maka Ho diterima ; Ha ditolak.
Jika nilai |
3. Kolmogorov Smirnov
Metode Kolmogorov-Smirnov tidak jauh beda dengan metode Lilliefors. Langkah-langkah
Penyelesaian dan penggunaan rumus sama,namun pada signifikansi yang berbeda.
Signifikansi Metode Kolmogorov-Smirnov menggunakan tabel 4
pembanding Kolmogorov-Smirnov, sedangkan Metode Lilliefors menggunakan tabel

pembanding metode Lilliefors.
no Xi xi−x FT FS |F T −F S|
z=
SD
Keterangan :
Xi = Angka pada Data
Z = Transformasi dari angka ke notasi pada distribusi normal
FT = Probabilistas komulatif normal
FS = Probabilitas komulatif empiris
Persyaratan Metode ini :
• Data tunggal/belum dikelompokkan pada table distribusi frekuensi
• Dapat untuk n besar maupun kecil.
Signifikansi Kolmogorov Smirnov

Signifikansi uji, nilai |FT – FS| terbesar dibandingkan dengan nilai tabel Kolmogorov Jika
nilai |FT – FS| terbesar <nilai tabel Kolmogorov Smirnov, maka Ho diterima ; Ha ditolak.
Jika nilai |FT – FS| terbesar > nilai tabel Kolmogorov Smirnov, maka Ho ditolak ; Ha
diterima.
4. Shapiro Wilk
Metode Shapiro Wilk menggunakan data dasar yang belum diolah dalam tabel distribusi
frekuensi. Data diurut, kemudian dibagi dalam dua kelompok untuk dikonversi dalam
Shapiro Wilk. Dapat juga dilanjutkan transformasi dalam nilai Z untuk dapat dihitung luasan
kurva normal.
Rumus Uji Shapiro Wilk:
Keterangan :
Xn-i+1 = Angka ke n – i + 1 pada data
Xi = Angka ke i pada data
Keterangan :
Xi = Angka ke i pada data yang
X = Rata-rata data
Keterangan :
G = Identik dengan nilai Z distribusi normal
T3 = Berdasarkan rumus di atas bn, cn, dn = Konversi Statistik Shapiro-Wilk Pendekatan
Distribusi Normal
Syarat Uji Shapiro Wilk :

• Data tunggal / belum dikelompokkan pada tabel distribusi frekuensi
• Data dari sampel random
Signifikansi
Signifikansi dibandingkan dengan tabel Shapiro Wilk. Signifikansi uji nilai T3 dibandingkan
dengan nilai tabel Shapiro W, untuk dilihat posisi nilai probabilitasnya (p).
Jika nilai p > 5%, maka Ho diterima ; Ha ditolak.
Jika nilai p < 5%, maka Ho ditolak ; Ha diterima.
5. Jarque Bera
Uji Jarque Bera adalah salah satu uji normalitas jenis goodness of fit test yang mana
mengukur apakah skewness dan kurtosis sampel sesuai dengan distribusi normal. Uji ini
didasarkan pada kenyataan bahwa nilai skewness dan kurtosis dari distribusi normal sama
dengan nol. Oleh karena itu, nilai absolut dari parameter ini bisa menjadi ukuran
penyimpangan distribusi dari normal. Dalam aplikasinya nilai Jarque Bera (JB) dibandingkan
dengan nilai Chi-Square Tabel pada derajat kebebasan 2.
Tidak seperti halnya uji normalitas yang lain, misalkan Shapiro Wilk, Lilliefors dan
Kolmogorov Smirnov yang ada di berbagai aplikasi statistik populer, Jarque Bera tidak
terdapat pada aplikasi-aplikasi tersebut. Dalam aplikasi SPSS, STATA
maupun Minitab, tidak terdapat fitur untuk melakukan uji ini. Oleh karenanya kita perlu
mempelajari cara perhitungan manualnya
2.4.3 Kegunaan uji normalitas

Uji normalitas berguna untuk menentukan data yang telah dikumpulkan berdistribusi normal
atau diambil dari populasi normal. Metode klasik dalam pengujian normalitas suatu data tidak
begitu rumit. Berdasarkan pengalaman empiris beberapa pakar statistik, data yang banyaknya
lebih dari 30 angka (n > 30), maka sudah dapat diasumsikan berdistribusi normal. Biasa
dikatakan sebagai sampel besar.
Namun untuk memberikan kepastian, data yang dimiliki berdistribusi normal atau tidak,
sebaiknya digunakan uji statistik normalitas. Karena belum tentu data yang lebih dari 30 bisa
dipastikan berdistribusi normal, demikian sebaliknya data yang banyaknya kurang dari 30
belum tentu tidak berdistribusi normal, untuk itu perlu suatu pembuktian. uji statistik
normalitas yang dapat digunakan diantaranya Chi-Square, Kolmogorov Smirnov, Lilliefors,
Shapiro Wilk.
2.4.4 uji normalitas menggunakan R studio
1) Berikut data tinggi badan mahasiswa berdasarkan suku (terlampir)

2) impor data ke R
3) gunakan package R commander
4) pilih data set yang akan digunakan
5) pilih statistik-summaries-test of normality
6) lalu pilih uji kenormalan yang diinginkan

7) maka didapatlah hasil sebagai berikut:
Interpretasi:
Pada pengujian Liliefors untuk uji normalitas, dengan Ho : Sampel berdistribusi normal ;
H1 : Sampel tidak berdistribusi normal
Jika L hitung < L tabel terima Ho
Jika L hitung > Ltabel tolak Ho
KESIMPULAN
Dalam statistics analysis, Box Plot merupakan metode graphic yang mudah digunakan dan
diintepretasikan untuk memperoleh informasi dari sebuah sample. Terdapat empat ukuran
sekaligus dijelaskan dalam diagram boxplot yaitu:
1. nilai observasi terkecil,
2. kuartil terendah atau kuartil pertama (Q1), yang memotong 25 % dari data terendah
3. median (Q2) atau nilai pertengahan
4. kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi
nilai observasi terbesar.
Berikut ini adalah fungus dari Histogram:
1. Memberikan informasi ukuran pemusatan dan penyebaran data secara ringkas,
meskipun ukuran contohnya sangat besar. Distribusi data pada histogram akan
membentuk kemenjuluran/kemiringan yang dapat ditentukan dari perbedaan letak
ukuran pemusatan data yaitu mean, median, dan modus. Terdapat tiga jenis
Kemenjuluran/kemiringan yaitu :
 Mean = median = modus : Simteris
 Mean < median < modus : Menjulur ke kiri
 Mean > median > modus : Menjulur ke kanan
2. Mengenali pola umum sebaran

3. Mengidentifikasi data yang kurang wajar dan ekstrim
4. Memberikan informasi secara cepat banyaknya amatan yang termasuk dalam selang
minat.
Ukuran pemusatan data digunakan untuk mendapatkan gambaran yang lebih jelas mengenai
sekumpulan data. Ukuran pemusatan data ini terdiri dari:
 Mean, perhitungan untuk mengitung nilai rata-rata pada data berkelompok.
 Median, nilai tengah atau data yang terletak di tengah-tengah pada data berkelompok.
 Modus, nilai yang paling sering mncul pada distribusi data berkelompok.
Ukuran penyebaran data merupakan ukuran yang menunjukkan seberapa jauh suatu data
menyebar dari rata-ratanya. Ukuran penyebaran data yang ada dalam materi statistika
meliputi jangkaun, hamparan, dan kuartil.
Uji normalitas dapat mempermudah kita dalam memecahkan masalah yang berkaitan dengan
kenormalan distribusi suatu data individu ataupun kelompok.
 Metode Chi-Kuadrat dan Liliefors dapat digunakan dalam menguji kenormalan suatu
distribusi data.
 Pada pengujian Liliefors untuk uji normalitas, dengan Ho : Sampel berdistribusi
normal ; H1 : Sampel tidak berdistribusi normal
Jika L hitung < L tabel terima Ho
Jika L hitung > Ltabel tolak Ho
 Pada pengujian Chi-Kuadrat untuk uji normalitas, dengan Ho : Sampel berdistribusi
normal ; H1 : Sampel tidak berdistribusi normal
Jika nilai X2hitung < nilai X2tabel, maka Ho diterima ; Ha ditolak.
Jika nilai X2 hitung > nilai X2 tabel, maka maka Ho ditolak ; Ha diterima.

Frizka Asri Ayuni - 1903111526 - Uts - Ade

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Frizka Asri Ayuni - 1903111526 - Uts - Ade

Diunggah oleh

Hak Cipta:

Format Tersedia

ANALISIS DATA EKSPLORATIF

ANALASIS DATA MENGGUNAKAN R STUDIO

NAMA : FRIZKA ASRI AYUNI

Pekanbaru, 11 april 2021

1.1 Latar Belakang

1.2 Rumusan Masalah

2.1 Analisis Dengan Boxplot

2.1.1 Definisi Boxplot

 nilai observasi terkecil,

2.1.2 Fungsi Boxplot

2.1.3 Kelebihan dan Kelemahan Diagram Boxplot

Kelemahan Diagram Boxplot

2.1.4 Intepretasi Boxplot

2.1.5 cara membuat diagram boxplot dengan R studio

Cara menyajikan data:

Interpretasi dari boxplot suku jawa adalah

2.2 Analisis dengan Histogram

2.2.1 Definisi Histogram

Berikut ini adalah fungus dari Histogram:

 Mean = median = modus : Simteris

 Mean < median < modus : Menjulur ke kiri

 Mean > median > modus : Menjulur ke kanan

2. Mengenali pola umum sebaran

2.2.3 Intepretasi Histogram

2.2.4 Kelebihan Histogram

2.2.5 Kelemahan Histogram

2.2.6 Analasis data menggunakan histogram dengan R studio

2) buat lah histogramnya dengan cara “ hist(judul table$nama”)

3) Sehingga jadilah histogram dari data tinggi badan mahasiswa

2.3.2 Fungsi ukuran Pemusatan dan Penyebaran Data

5) Mencari variansi data:

6) Mencari standar deviasi:

2.4 uji normalitas

2.4.2 macam-macam uji normalitas

Rumus Uji Normalitas dengan Chi-Square : 𝑋2=Σ(𝑂𝑖−𝐸𝑖)𝐸𝑖

no xi xi−x F(x) S(x) If(x)-s(x)I

Signifikansi Uji Lilliefors :

pembanding Kolmogorov-Smirnov, sedangkan Metode Lilliefors menggunakan tabel

Signifikansi Kolmogorov Smirnov

Syarat Uji Shapiro Wilk :

2.4.3 Kegunaan uji normalitas

1) Berikut data tinggi badan mahasiswa berdasarkan suku (terlampir)

5) pilih statistik-summaries-test of normality

6) lalu pilih uji kenormalan yang diinginkan

 Mean = median = modus : Simteris

 Mean < median < modus : Menjulur ke kiri

 Mean > median > modus : Menjulur ke kanan

2. Mengenali pola umum sebaran

Anda mungkin juga menyukai