Anda di halaman 1dari 9

Laporan 3 Praktikum Analisis Data Eksploratif

Analisis Data Eksploratif


Dengan Base R

disusun untuk memenuhi


tugas mata kuliah Analisis Data Eksploratif

oleh:

AL HARIDT MAHMUDI
2008108010004

JURUSAN STATISTIKA
FAKULTAS METEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS SYIAH KUALA
DARUSSALAM, BANDA ACEH
2022
Soal
1. Data berikut merupakan Data umur harapan hidup, harapan lama sekolah, rata-rata
lama sekolah dan pengeluaran perkapita penduduk aceh perkabupaten tahun 2021
Umur Harapan Rata-rata
Pengeluaran
Kab/Kota Harapan Lama Lama
per kapita
Hidup Sekolah Sekolah
Simeulue 65,28 13,9 9,48 7,148
Aceh Singkil 67,43 14,32 8,68 8,776
Aceh Selatan 64,4 14,6 8,88 8,180
Aceh Tenggara 68,22 14,01 9,67 8,030
Aceh Timur 68,74 13,04 8,21 8,577
Aceh Tengah 68,86 14,28 9,86 10,780
Aceh Barat 67,99 14,61 9,55 9,593
Aceh Besar 69,79 14,73 10,33 9,644
Pidie 66,95 14,47 9 9,860
Bireuen 71,26 14,84 9,29 8,867
Aceh Utara 68,81 14,71 8,64 8,201
Aceh Barat Daya 65,06 13,65 8,67 8,428
Gayo Lues 65,53 13,78 8,4 8,856
Aceh Tamiang 69,63 13,76 8,91 8,367
Nagan raya 69,24 14,14 8,69 8,292
Aceh Jaya 67,19 13,99 8,71 9,666
Bener Meriah 69,26 13,47 10 11,118
Pidie Jaya 70,18 14,97 9,34 10,290
Banda Aceh 71,52 17,8 12,83 16,891
Sabang 70,56 14,13 11,18 11,378
Langsa 69,43 15,63 11,12 12,067
Lhokseumawe 71,64 15,21 11,1 11,390
Subulussalam 64,07 14,62 8,03 7,385
Tabel 1 data 4 variabel
Sumber : Provinsi Aceh Dalam Angka 2022 ( https://aceh.bps.go.id/ )
Berdasarkan data diatas, maka tentukanlah :
a. Proses pemanggilan data pada Rstudio
b. Head data
c. Tail data
d. Struktur data
e. Summary data
2. Berikut merupakan data Nilai Ujian
45 35 35 35
87 66 66 66
65 87 84 99
55 67 56 56
24 45 34 45
53 66 66 66
76 86 76 76
68 65 67 70
43 44 44 11
76 65 65 55
Tabel 2 data 1 variabel
Sumber : https://www.statistikian.com/2012/11two-away-anova-dalam-spss.html?amp
Tentukanlah :
a. Summary data
b. Boxplot
c. Histogram
d. Stem and leaf
e. Normal Q-Q Plot

3. Data biaya promosi dan penjualan dari tahun 2010 hingga 2019 sebagai berikut :

Tahun Biaya Promosi Penjualan


2010 3.000.000 144.000.000
2011 3.240.000 158.400.000
2012 3.060.000 151.200.000
2013 2.400.000 135.600.000
2014 2.460.000 123.840.000
2015 1.980.000 118.080.000
2016 2.160.000 122.400.000
2017 1.800.000 108.000.000
2018 2.760.000 129.900.000
2019 3.000.000 132.670.000
Tabel 3 data 1 variabel x dan 1 variabel y
Sumber :
https://repo.iainbatusangkar.ac.id/xmlui/bitstream/handle/123456789/18841/160
8107358869_SKRIPSIIIIIIII.pdf?sequence=1&isAllowed=y

Tampilkanlah :
a. Summary data
b. Scatter Plot
Penyelesaian

1. Data umur harapan hidup, harapan lama sekolah, rata-rata lama sekolah DAN
Pengeluaran perkapita penduduk aceh perkabupaten tahun 2021
a. Pemanggilan data menggunakan Rstudio
Sintax:

Gambar 1. Sintax R pemanggilan data

Output :

Gambar 2. Output R data yang dipanggil


b. Head Data

Gambar 3. Output RstudioHead data


Interpretasi :
Dari head data dapat diketehui 6 data pertama dari data yang telah dipanggil
sebelumnya seperti gambar diatas.

c. Tail Data

Gambar 4. Output Rstudio Tail data


Interpretasi :
Dari tail data dapat diketehui 6 data terakhir dari data yang telah
dipanggil sebelumnya seperti gambar diatas.

d. Struktur Data

Gambar 4. Output Rstudio Struktur data


Interpreatasi :
Dapat dilihat pada sintax str() terdapat 23 observasi atau data yang
terdiri atas 5 variabel dimana variabel tersebut terdiri atas Kab/kota, Umur
harapan hidup, harapan lama sekolah, rata-rata lama sekolah dan pengeluaran
perkapita. 4 dari variabelnya merupakan variabel numerik sedangkan 1 variabel
yaitu kab/kota merupakan variabel karakter atau string

e. Summary Data

Gambar 5. Output Rstudio Summary data


Interpreatasi :
Untuk variabel umur harapan hidup, diketahui nilai minimumnya 64,07
dengan nilai maksimumnya 71,64 dengan 25 % data memiliki nilai dibawah
67,07 . 50 % data memiliki nilai dibawah 68,81 dan 75 % data memiliki nilai
dibawah 69,71 dengan nilai rata-rata 68,31.
Untuk variabel harapan lama sekolah, diketahui nilai minimumnya 13,04
dengan nilai maksimumnya 17,80 dengan 25 % data memiliki nilai dibawah
13,95 . 50 % data memiliki nilai dibawah 14,32 dan 75 % data memiliki nilai
dibawah 14,72 dengan nilai rata-rata 14,46.
Untuk variabel rata-rata lama sekolah, diketahui nilai minimumnya 8,03
dengan nilai maksimumnya 12,83 dengan 25 % data memiliki nilai dibawah
8,685 . 50 % data memiliki nilai dibawah 9,29 dan 75 % data memiliki nilai
dibawah 9,93 dengan nilai rata-rata 9,503.
Untuk variabel pengeluaran perkapita, diketahui nilai minimumnya 7,148
dengan nilai maksimumnya 16,891 dengan 25 % data memiliki nilai dibawah
8,329 . 50 % data memiliki nilai dibawah 8,867 dan 75 % data memiliki nilai
dibawah 10,535 dengan nilai rata-rata 9,643.

2. Data Nilai Ujian


a. Summary Data

Gambar 6. Output Summary data

Interpretasi :
Data Nilai Ujian, diketahui nilai minimumnya 11 dengan nilai maksimumnya
99 dengan 25 % data memiliki nilai dibawah 45. 50 % data memiliki nilai dibawah
65 dan 75 % data memiliki nilai dibawah 68,5 dengan nilai rata-rata 59,75.

b. Boxplot

Gambar 7. Output Rstudio Boxplot


Interpretasi :
Pada Boxplot tidak terlihat ada pencilan pada data. Boxplot diatas juga
tidak simetris, sehingga dapat dikatakan bahwa data tidak menyebar normal,
karena distribusi data menjulur ke kiri.
c. Histogram

Gambar 8. Output Rstudio Histogram


Interpretasi :
Berdasarkan Histogram dapat dilihat bahwa data ini tidak berdistribusi
normal secara umum, karena bentuk histogramnya tidak simetris, dan menjulr ke
kiri dengan sebagian data menumpuk dibagian kanan.

d. Stem and leaf

Gambar 9. Output Rstudio Stem and Leaf


Interpretasi :
Dari stem and leaf dapat dilihat bahwa data memiliki nilai terendah yaitu
11 dan tertinggi 99, dan dapat kita lihat modus dari data yaitu 66 yang munjul 6
kali dalam data.
e. Normal Q-Q Plot

Gambar 10. Output Rstudio Normal Q-Q Plot


Interpretasi :
Berdasarkan garis Q-Q plot, secara umum bisa disimpulkan bahwa data
bisa dikategorikan berdistribusi normal, karena titik-titik pada Q-Q plot masih
berada disekitar garis merah. Namun perlu Uji lanjut untuk membuktikannya.

3. Data biaya promosi dan penjualan dari tahun 2010 hingga 2019 sebagai berikut
a. Summary data
Gambar 11. Output Rstudio Summary data
Interpretasi :
Untuk variabel Biaya Promosi, diketahui nilai minimumnya 1.800.000
dengan nilai maksimumnya 3.240.000 dengan 25 % data memiliki nilai dibawah
2.220.000 . 50 % data memiliki nilai dibawah 2.610.000 dan 75 % data memiliki
nilai dibawah 3.000.000 dengan nilai rata-rata 2.586.000.
Untuk variabel Biaya Promosi, diketahui nilai minimumnya 108.000.000
dengan nilai maksimumnya 158.400.000 dengan 25 % data memiliki nilai
dibawah 122.760.000 . 50 % data memiliki nilai dibawah 131.285.000 dan 75 %
data memiliki nilai dibawah 141.900.000dengan nilai rata-rata 132.409.000.

b. Scatter Plot

Gambar 12. Output Rstudio Scatter Plot


Interpretasi :
Dapat dilihat pada scatter plot diatas, jika ditarik garis dari plot-plot yang
ada, maka akan mendapatkan garis yang meningkat ke kanan, jadi dapat
disimpulkan bahwa secara umum biaya promosi dan penjualan memiliki korelasi
positif, karena semakin besar biaya promosi maka penjualan juga akan semakin
besar.

Anda mungkin juga menyukai