PERTEMUAN I
ANALISIS DATA EKSPLORATIF
Oleh
NPM : F1F019023
LABORATORIUM MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BENGKULU
2022
KATA PENGANTAR
Puji dan syukur penulis panjatkan ke hadirat Allah SWT atas segala rahmat
laporan praktikum Analisis Data Eksploratif ini dengan baik dan lancar. Penulis
juga ingin mengucapkan terima kasih kepada dosen dan asisten praktikum dalam
Pada kesempatan ini Penulis juga mengucapkan terima kasih kepada yang
terhormat:
baik dari segi susunan kata, kalimat maupun tatanan bahasa. Oleh karena itu,
penulis mengharapkan kritik dan saran dari semua pihak untuk laporan ini. Akhir
kata penulis berharap agar laporan ini memberikan banyak manfaat dan
Penulis
ii
DAFTAR ISI
HALAMAN JUDUL...............................................................................................i
KATA PENGANTAR...........................................................................................ii
DAFTAR ISI.........................................................................................................iii
DAFTAR GAMBAR.............................................................................................iv
BAB I PENDAHULUAN.......................................................................................1
1.1 Latar Belakang...........................................................................................1
1.2 Rumusan Masalah.....................................................................................2
1.3 Tujuan Penelitian.......................................................................................2
1.4 Batasan Masalah........................................................................................2
1.5 Manfaat Penelitian.....................................................................................2
1.6 Sistematika Penulisan................................................................................5
BAB II TINJAUAN PUSTAKA...........................................................................7
2.1 Penyajian Data...........................................................................................7
2.2 Diagram Dahan Daun................................................................................8
2.3 Diagram Box-Cox.......................................................................................9
BAB III METODE PENELITIAN.....................................................................11
3.1 Jenis dan Sumber Data............................................................................11
3.2 Variabel Penelitian...................................................................................11
3.3 Analisis Data.............................................................................................11
3.4 Diagram Alur...........................................................................................13
BAB IV HASIL DAN PEMBAHASAN.............................................................15
4.1 Diagram Dahan Daun.............................................................................15
4.2 Diagram Box-Cox....................................................................................15
4.3 Evaluasi Diagram Dahan Daun dan Boc-Cox......................................16
BAB V KESIMPULAN DAN SARAN...............................................................20
5.1 Kesimpulan...............................................................................................20
5.2 Saran.........................................................................................................22
DAFTAR PUSTAKA...........................................................................................23
LAMPIRAN
iii
DAFTAR GAMBAR
iv
DAFTAR TABEL
v
BAB I
PENDAHULUAN
ilmu yang berkenaan dengan data. Pada era ini, statistika dapat digunakan di
keteknikan, industri, dan lain-lain. Oleh karena itu, statistika memegang peranan
Banyak sekali data dalam kehidupan yang dapat dijelaskan dengan statistika.
Informasi yang dihasilkan oleh suatu data dapat dijelaskan dengan beberapa
metode statistik, salah satunya metode grafik. Metode grafik ini dilakukan untuk
lebih mempermudah interpretasi hanya dengan melihat pola dari grafik saja.
Beberapa jenis metode grafik yang dapat digunakan sesuai dengan kebutuhan data
menggambarkan secara grafik dari data numeris. Sedangkan Stem And Leaf
adalah diagram dahan-daun disusun baris per baris secara vertikal, dan cukup
efekftif untuk menggambarkan pola sebaran data yang berukuran kecil. Pada
penelitian kali ini penulis akan membahas megenai penggunaan diagram Boxplot
dan diagram dahan daun sebagai salah satu bentuk dari penyajian visualisasi dari
1
1.2 Rumusan Masalah
menggunakan R?
sebagai berikut:
menggunakan R.
Penelitian ini dilakukan untuk membuat diagram hasil dari visualisasi data.
Dalam penelitian kali ini peneliti menggunakan diagram boxplot dan dahan daun
1. Dengan memanfaatkan dataset iris, buatlah diagram dahan daun untuk data
2
2. Menggunakan dataset iris (sepal.length) buatlah boxplot berdasarkan kategori
boxplot!
3. Carilah data yang dikumpulkan dari website instansi seperti bps, bmkg, dan
sebagainya yang dapat digunakan untuk membuat diagram dahan daun dan
boxplot!
3
BENGKULU SELATAN 4.97
REJANG LEBONG 4.96
BENGKULU UTARA 4.92
KAUR 4.98
SELUMA 4.93
MUKOMUKO 5.03
LEBONG 4.97
KEPAHIANG 4.89
BENGKULU TENGAH 4.97
BENGKULU 5.41
LAMPUNG BARAT 5.2
TANGGAMUS 5.03
LAMPUNG SELATAN 5.14
LAMPUNG TIMUR 3.85
LAMPUNG TENGAH 5.46
LAMPUNG UTARA 5.36
WAY KANAN 5.19
TULANGBAWANG 5.48
PESAWARAN 5.02
PRINGSEWU 5.06
MESUJI 5.29
TULANG BAWANG BARAT 5.38
PESISIR BARAT 5.39
BANDAR LAMPUNG 6.24
METRO 5.61
BANGKA 2.87
BELITUNG 3.33
BANGKA BARAT 7.06
BANGKA TENGAH 1.21
BANGKA SELATAN 2.53
BELITUNG TIMUR 3.26
PANGKAL PINANG 3.26
Penelitian ini diharapkan dapat menjadi tuntunan dan ilmu pengetahuan baru bagi
4
1. Bagi peneliti Penelitian ini diharapkan dapat memajukan referensi ilmu
3. Bagi masyarakat Penelitian ini dapat menjadi sumber atau bahan referensi
lima bab dan setiap bab terdiri dari beberapa subbab. Adapun isi dari bab tersebut
BAB I PENDAHULUAN
sistematika penulisan.
Bab ini merupakan bab yang memuat pengertian dan teori yang
5
Bab ini merupakan bab yang memuat hasil analisis dan
Bab ini merupakan bab yang memuat rangkuman dari hasil secara
DAFTAR PUSTAKA
6
BAB II
TINJAUAN PUSTAKA
Statistika berkaitan erat dengan data dan penyajian data , Setiap penelitian
dapat disajikan dalam berbagai bentuk. Beberapa penyajian data antara lain
penyajian data dengan tabel, grafik, diagram lingkaran dan pictogram. Penyajian
data merupakan salah satu kegiatan dalam pembuatan laporan hasil penelitian
yang telah dilakukan agar dapat dipahami dan dianalisis sesuai dengan tujuan
yang diinginkan. Data yang disajikan harus sederhana dan jelas agar mudah
dibaca. Penyajian data juga dimaksudkan agar para pengamat dapat dengan
Diagram adalah gambar yang menyajikan data secara visual yang biasanya
berasal dari tabel yang telah dibuat. Meskipun demikian, diagram masih memiliki
kelemahan, yaitu pada umumnya diagram tidak dapat memberikan gambaran yang
data diskrit (data cacahan). Diagram batang adalah bentuk penyajian data
statistik dalam bentuk batang yang dicatat dalam interval tertentu pada bidang
cartesius.
terhadap keseluruhan, suatu data lebih tepat disajikan dalam bentuk diagram
7
lingkaran. Diagram lingkaran adalah bentuk penyajian data statistika dalam
kelas.
Diagram dahan dan daun adalah teknik yang cukup efektif untuk
menggambarkan pola sebaran bagi data yang berukuran kecil. Dengan teknik ini
gambaran distribusi data akan dapat diketahui dengan mudah. Diagram dahan dan
daun membagi data menjadi digit depan (leading) dan satu digit belakang
(trailing). Sebagai contoh apabila data semuanya terdiri dari dua digit, maka digit
2019).
“Exploratory Data Analysis”. Diagram dahan daun ini membagi angka pada nilai
data menjadi dua bagian yaitu, digit paling kiri dari nilai data ditempatkan pada
bagian dahan (1, 2 dan seterusnya) dan sisanya diletakkan dibagian daun.
Menurut Agwil (2019) manfaat diagram dahan daun, yaitu mengetahui pola
membandingkan dua angkatan data dengan meletakkan diagram dahan daun dua
8
1. Tentukan angka yang akan diletakkan pada bagian dahan (pastikan angka
2. Pada bagian daun, tuliskan nilai data yang bersesuaian dengan angka pada
dahan. Misal untuk data 25, jika yang diletakkan diagian dahan adalah angka
4. Hitung jumlah digit yang terdapat pada daun (harus sama dengan jumlah
data).
menyampaikan informasi variasi dan penempatan atau lokasi pada data yang telah
x n+ x n
+1
¿ genap)
2 2
Me=
2
Me=x n 1 ¿ ganjil)
+
2 2
x i (n+1 )
Qi=
4
9
JIK = Q3 – Q1
Hitung:
Q3 + 1.5 JIK
Q1 – 1.5 JIK
d. Batas garis bawah adalah nilai minimum sebuah data jika nilai minimum
lebih besar dari Q 1−(1.5 JIK ) , jika tidak maka batas garis bawah adalah
Note: Nilai yang lebih kecil dari Q 1−( 1.5 JIK ) merupakan outlier bawah.
e. Batas garis atas adalah nilai maksimum sebuah data jika nilai maksimum
lebih kecil dari Q 3+(1.5 JIK ) , jika tidak maka batas garis bawah adalah
Q 3+(1.5 JIK ). Note: Nilai yang lebih besar dari Q 3+(1.5 JIK ) merupakan
outlier atas.
dispersi (penyebaran) dan skewness (kecondongan) dalam data. Bagian dari kotak
pertengahan dari 50 % observasi. Panjang kotak ditentukan oleh IQR ini. IQR
adalah ukuran yang terkenal untuk mengukur penyebaran data. Semakin tinggi
(jika boxplot vertikal) atau semakin lebar (jika boxplot horizontal) bidang IQR ini,
penyebaran data, boxplot juga dapat digunakan untuk menilai kesimetrisan data.
Jika data simetris, garis median akan berada di tengah kotak dan whisker pada
bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak
simetris (condong), median tidak akan berada di tengah kotak dan salah satu dari
10
BAB III
METODE PENELITIAN
Dalam penelitian ini peneliti menggunakan data jenis numerik yang mana
(Sumbagsel).
Dalam penelitian ini peneliti menggunakan data numerik yang bersumber dari
adalah sebagai jumlah nilai tambah bruto yang dihasilkan oleh unit usaha dalam
suatu wilayah domestik. Atau merupakan jumlah hasil seluruh nilai barang dan
jasa akhir yang dihasilkan oleh seluruh kegiatan ekonomi dalam suatu wilayah.
1. Tentukan angka yang akan diletakkan pada bagian dahan (pastikan angka
11
2. Pada bagian daun, tuliskan nilai data yang bersesuaian dengan angka pada
dahan. Misal untuk data 25, jika yang diletakkan dibagian dahan adalah angka
4. Hitung jumlah digit yang terdapat pada daun (harus sama dengan jumlah
data)
Xn+Xn
+1
M e=
2 2 (n genap)
2
M e =X n 1 (n ganjil)
+
2 2
Qi= X i (n+1 )
4
JIK=Q 3−Q1
Hitung:
Q3 +1.5 JIK
Q1−1.5 JIK
4. Batas garis bawah adalah minimum sebuah data jika nilai minimum lebih
besar dari Q1−(1.5 JIK ), jika tidak maka batas garis bawah adalah
Q1−(1.5 JIK ).
12
Note: Nilai yang lebih kecil dari Q1−(1.5 JIK ) merupakan outlier bawah.
5. Batas garis atas adalah nilai maksimum sebuah data jika nilai maksimum
lebih kecil dari Q3 +(1.5 JIK ), jika tidak maka batas garis atas adalah
Q3 +(1.5 JIK ).
Note: Nilai yang lebih besar dari Q3 +(1.5 JIK ) merupakan outlier atas.
a. Dahan Daun
Mulai
Selesai
13
b. Box-Cox
Mulai
Selesai
Gambar 2. Diagram alur boxcox
14
BAB IV
membandingkan dua angkatan data dengan meletakkan diagram dahan daun dua
1. Tentukan angka yang akan diletakkan pada bagian dahan (pastikan angka
2. Pada bagian daun, tuliskan nilai data yang bersesuaian dengan angka pada
dahan. Misal untuk data 25, jika yang diletakkan diagian dahan adalah angka
4. Hitung jumlah digit yang terdapat pada daun (harus sama dengan jumlah
data).
menyampaikan informasi variasi dan penempatan atau lokasi pada data yang telah
15
dan lokasi antar kelompok data yang berbeda (Darsyah, 2014). Langkah-langkah
pembuatan Boxplot:
x n+ x n
+1
¿ genap)
2 2
Me=
2
Me=x n 1 ¿ ganjil)
+
2 2
x i (n+1 )
Qi=
4
JIK = Q3 – Q1
Hitung:
Q3 + 1.5 JIK
Q1 – 1.5 JIK
4. Batas garis bawah adalah nilai minimum sebuah data jika nilai minimum
lebih besar dari Q 1−(1.5 JIK ) , jika tidak maka batas garis bawah adalah
Note: Nilai yang lebih kecil dari Q 1−( 1.5 JIK ) merupakan outlier bawah.
Batas garis atas adalah nilai maksimum sebuah data jika nilai maksimum lebih
kecil dari Q 3+(1.5 JIK ) , jika tidak maka batas garis bawah adalah Q 3+(1.5 JIK ).
Note: Nilai yang lebih besar dari Q 3+(1.5 JIK ) merupakan outlier atas.
Pada teladan 1 diminta untuk membuat diagram dahan dun pada data
16
Dengan menggunakan RStudio kita menggunakan packages base dan aplpack
untuk membuat diagram dahan daun, yang dimana kategori sepal length diberi
nama x dan kateogri petal lenght diberi nama y. Kemudian menggunakan fungsi
diagram dahan daun x (sepal length) berjumlah 150 data dengan memiliki nilai
minimum 4.3 dan nilai maksimum sebesar 7.9. Data termasuk bentuk distribusi
menceng kekiri atau Negatively Skewed dengan pemusatan data yang terdapat
nilai tengah terletak pada selang nilai 4,0 – 4,4. Pada diagram dahan daun y
dengan kategori petal lenght berjumlah 150 data, didapatkan nilai minimum yaitu
1.0, maksimum yaitu 6.9. Data tersebut cenderung berdistribusi normal dari data
3.0 – 6.9, memiliki gap/kekosongan data pada stem 1 dan 6, dan nilai tengah
Pada teladan 2 diminta untuk membuat boxplot dari data iris sepal length
boxplot() kemudian run untuk melihat hasilnya. Dilihat bahwa data sentosa
memiliki data terendah diantara yang lainnya karena memiliki nilai median yang
rendah yaitu sebesar 5 dengan batas garis bawah sekitar 4.3 dan garis atas sekitar
5.8. Kemudian untuk data versicolor memiliki data yang lebih tinggi dari data
sentosa dan memiliki data lebih rendah dari data verginica dengan nilai
mediannya 5.9, batas garis bawah 4.9, dan batas garis atas 7. Terakhir untuk data
verginica merupakan daya yang paling besar diantara yang lainnya karena
memiliki median yang tinggi yaitu 6.5 dengan batas garis bawah 5.6 dan batas
17
garis atas 7.9 dan terdapat outlier. Berikut merupakan perhitungan secara manual
X 151
Q 1= =X 12,75
4
X 25+ X 26 5+5
Me=Q2= = =5
2 2
X 154
Q 3= =X 38.25
4
X 151
Q 1= =X 12,75
4
X 25+ X 26 5.9+5.9
Me=Q2= = =5.9
2 2
X 154
Q 3= =X 38.25
4
X 51
Q 1= =X 12,75
4
X 25+ X 26 6.5+6.5
Me=Q2= = =6.5
2 2
X 154
Q 3= =X 38.25
4
18
X 38.25=6.3+ ( 38.25−38 ) ( 7.1−6.9 )=6.95
Pada teladan 3 diminta untuk membuat diagram dahan daun dan boxplot dari
data yang telah dicari, data yang digunakan adalah Laju Pertumbuhan PDRB
dahulu dari excel ke program R. Data tersebut diberi nama Pertemuan 1, dengan
berjumlah 60 data. Setelah dilakukan eksplorasi data dapat dilihat bahwa nilai
rata-rata adalah 4.874, nilai minimum yang diperoleh adalah 1.21, nilai
maksimumnya sekitar 7.06, nilai median (Q2) adalah 5.025, nilai Q1 adalah 4.492,
nilai Q3 adalah 5.395, dengan pemusatan data terdapat pada stem 5, dan tidak
terdapat kekosongan data (gap) serta data terlihat menceng kiri yang artinya data
outlier di bagian atas dan bawah boxplot dan bisa juga dilihat bahawa data tidak
menyebar normal.
19
BAB V
5.1 Kesimpulan
Diagram dahan dan daun adalah teknik yang cukup efektif untuk
menggambarkan pola sebaran bagi data yang berukuran kecil. Diagram dahan
daun ini membagi angka pada nilai data menjadi dua bagian yaitu, digit paling kiri
dari nilai data ditempatkan pada bagian dahan (1, 2 dan seterusnya) dan sisanya
diletakkan dibagian daun. Untuk membuat diagram stem leaf pada program R,
Pada diagram dahan daun dilihat dari bentuknya, jika diagram berbentuk
seperti lonceng maka data tersebut berdistribusi normal dan simetris, jika data
nilai pemusatan data dapat dilihat pada jumlah leaf terbanyak dalam diagram stem
leaf tersebut.
pusat data dan garis menggambarkan data yang lebih kecil maupun lebih besar
dari kumpulan data (bukan outlier). Untuk membuat boxplot pada program R
20
Dari hasil diagram boxplot, sepintas kita bisa menentukan beberapa ukuran
statistik, meskipun tidak peris sekali, yaitu garis paling bawah sebagai nilai
minimal data, nilai garis paling atas adalah nilai maksimumnya, kemudian
terdapat garis tengah kotak yang merupakan nilai median (Q2) dimana garis
dinamakan kuartil pertama (Q1), dan garis atas kotak dinamakan kuartil ketiga (Q3
). Jika data simetris, garis median akan berada di tengah kotak dan whisker pada
bagian atas dan bagian bawah akan memiliki panjang yang sama. Jika data tidak
simetris (condong), median tidak akan berada di tengah kotak dan salah satu dari
Dari hasil teladan 1 terlihat bahwa pada diagram dahan daun pada masing-
masing kategori memiliki penyebaran data yang berbeda. Sepal length berjumlah
150 data dengan nilai minimum 4.3 dan nilai maksimum sebesar 7.9, sedangkan
petal lenght berjumlah 150 data didapatkan nilai minimum yaitu 1.0 dan
menampilkan boxplot dari data iris sepal length yang dikategorikan dengan
menggunakan species. Dari hasil yang diperoleh dilihat bahwa pada sepal length
mengalami penaikan mulai dari jenis sentosa, versicolor dan virginica. Hal ini
dilihat dari median sepal length diantara ketiga jenis tersebut. Pada teladan 3
diperoleh diagram dahan daun dan boxplot menggunkan program R. yang mana
setelah dilakukan eksplorasi data dapat dilihat bahwa nilai rata-rata adalah 4.874,
nilai minimum yang diperoleh adalah 1.21, nilai maksimumnya sekitar 7.06, nilai
median (Q2) adalah 5.025, nilai Q 1 adalah 4.492, nilai Q3 adalah 5.395, dengan
pemusatan data terdapat pada stem 5, dan tidak terdapat kekosongan data (gap)
21
serta data terlihat menceng kiri yang artinya data banyak menyebar di angka yang
besar. Berdasarkan boxplot terlihat adanya outlier di bagian atas dan bawah
boxplot dan bisa juga dilihat bahawa data tidak menyebar normal.
5.2 Saran
berlangsung, agar bukan hanya asisten dosen saja yang aktif tapi praktikan
diharapkan lebih aktif bertanya maupun menjawab pertanyaan yang diajukan dan
22
DAFTAR PUSTAKA
23
LAMPIRAN