Anda di halaman 1dari 6

Nama : M Lugas Sujatmoko

NIM : 12019004

Tugas 2
Univariate EDA

Data pada tugas 2, diambil dari sebuah jurnal Geology yang berjudul High-resolution geophysical
data collected along the Delmarva Peninsula 2014, U.S. Geological Survey Field Activity 2014-002-
FA.
A. Maksud dan Tujuan EDA
EDA (Exploratory Data Analysis) adalah pendekatan analisis di mana karakteristik data
akan ditinjau, EDA sering digunakan pada kontak pertama dengan data sebelum model
pengolahan lanjutan apapun diterapkan pada data (Wilder, 1970).

Tujuan:
- Mengetahui apakah persebaran data mengikuti distribusi normal atau tidak
- Mendeteksi apakah ada outlier atau skewness
- Membuat ringkasan

B. Metode EDA

metode dilakukan dengan menggunakan teknik aritmatika sederhana dan teknik grafis berupa
summary statistic, histogram, box plot dan sccater plot. Data terdistribusi normal jika :
1. Kurtosis =3
2. Skewness = 0
Jika nilai deviasi tidak terlalu jauh dari nilai tersebut, maka dapat diasumsikan terdistribusi normal,
tetapi apabila data tidak terdisitribusi normal dapat dilakukan transformasi logaritmik.

C. Karakter Data
Data pada tugas ini berjumlah sebanyak 134 data diberbagai titik pengamatan. Terdapat 5
sampling hasil data analisis yang didapatkan, yaitu :

1. Sample Weight

Weight

59.3243143
Mean 1
Standard Error 3.5416793
Median 44.3530248
Mode #N/A
Standard 40.9979019
Deviation 4
Sample 1680.82796
Variance 4
Kurtosis 3.70425077
2.27298065
Skewness 6
173.922407
Range 4
Minimum 16.9755926
Nama : M Lugas Sujatmoko
NIM : 12019004

Maximum 190.898
7949.45811
Sum 8
Count 134
Gambar 1.1 Box plot data weight Tabel 1. Summary statistic data weight

WEIGHT
90
80
70
60
50
40
30
20
10
0
26 55 49 44 38 33 03 82 62 41 21 or
e
559 720 848 976 104 232 236 348 461 574 687 M
7 86 97 08 20 31 84 65 46 27 08
.9 .7 .5 .4 .2 .0 1. 7. 3. 9. 5.
16 32 48 64 80 96 11 12 14 15 17

Gambar 1.2 Histogram data weight

2. GRAVEL_PCT

GRAVEL_PCT

Mean 3.566119403
Standard Error 0.734338188
Median 0.04
Mode 0
Standard
Deviation 8.500579097
Sample Variance 72.25984498
Kurtosis 20.17354152
Skewness 3.847291358
Range 64.19
Minimum 0
Maximum 64.19
Sum 477.86
Count 134
Gambar 2.1 Box plot data gravel Tabel
2. Summary statistic data gravel
Nama : M Lugas Sujatmoko
NIM : 12019004

GRAVEL_PCT
70
60
50
40
30
20
10
0
0 45 09 64 18 73 27 82 36 91 45 e
45 09 63 18 72 27 81 36 90 45 or
5 9 3 8 2 7 1 6 0 5 M
54 70 06 41 77 12 48 83 19 54
. 83 1.6 7.5 3.3 9.1 5.0 0.8 6.6 2.5 8.3
5 1 1 2 2 3 4 4 5 5

Gambar 2.2 Histogram data gravel

3. SAND_PCT

SAND_PCT

Mean 89.31552239
Standard Error 1.541941441
Median 97.01
Mode 99.9
Standard
Deviation 17.84926264
Sample Variance 318.5961768
Kurtosis 7.667353997
Skewness -2.697094581
Range 91.11
Minimum 8.85
Maximum 99.96
Sum 11968.28
Count 134
Gambar 3.1 Box plot data sand Tabel 3.
Summary statistic data sand

SAND_PCT
100
90
80
70
60
50
40
30
20
10
0
85 27 55 82 09 36 64 91 18 45 73 or
e
8. 27 54 81 09 36 63 90 18 45 72 M
7 4 1 9 6 3 0 8 5 2
32 15 98 80 63 46 29 11 94 77
.1 .4 .6 .9 .2 .5 .8 .1 .3 .6
17 25 33 41 50 58 66 75 83 91
Nama : M Lugas Sujatmoko
NIM : 12019004

Gambar 3.2 Box plot data sand

4. SILT_PCT
SILT_PCT

Mean 4.935970149
Standard Error 1.017205019
Median 0.905
Mode 0.04
Standard
Deviation 11.77499939
Sample Variance 138.6506107
Kurtosis 14.6823136
Skewness 3.726499375
Range 70
Minimum 0.01
Maximum 70.01
Sum 661.42
Count 134

Gambar 4.1 Box plot data silt Tabel 4. Summary statistic data silt

Gambar 4.2 Box plot data silt

5. CLAY_PCT
CLAY_PCT

Mean 2.179029851
Standard Error 0.45594402
Median 0.395
Mode 0.09
Standard
Deviation 5.277933617
Sample Variance 27.85658326
Kurtosis 23.02804253
Skewness 4.347690619
Range 39.93
Minimum 0
Maximum 39.93
Sum 291.99
Count 134
Nama : M Lugas Sujatmoko
NIM : 12019004

Gambar 5.1 Box plot data clay Tabel 5. Summary statistic data clay

CLAY_PCT
120

100

80

60

40

20

0
0 3.63 7.26 10.89 14.52 18.15 21.78 25.41 29.04 32.67 36.3

Gambar 5.2 Box plot data clay

D. Metode Pengambilan Data

Delvamara Peninsula adalah semenanjung besar di East Coast di Amerika Serikat,yang secara
signifikan dipengaruhi oleh Badai Sandy. wilayahnya mencakup sebagian besar Deleware serta
bagian kecil dari Maryland dan Virginia. Panjang semenanjung ini sekitar 274 km, sedangkan
lebarnya sekitar 19 km hingga 113 km. Pelayaran Survei Geologi Amerika Serikat dilakukan pada
musim panas 2014 untuk memetakan landasan kontinen bagian dalam Delmarva Peninsula
menggunakan teknik geofisika dan pengambilan sampel untuk menentukan kerangka geologi yang
mengatur evolusi system pesisir pada peristiwa badai dan skala waktu yang lebih lama. Data geofisika
yang dikumpulkan selama pelayaran meliputi petak batimetri, sonar sidecan, profil refleksi seismik
kicauan dan boomer, pengambilan sampel dan data foto bawah.

E. Hasil dan Pembahasan

Analisis data 1 : Dari hasil analisis data, nilai skewness >0, maka dapat dilihat pada histogram, data
diatas berbentuk asimetris dengan puncak berarah ke kiri, kemudian nilai kurtosis
>3, maka data diatas termasuk pada jenis bentuk leptycutic. Melihat pada bagian
diagram box plot, maka dapat disimpulkan terdapat upper outlier dan lower outlier.

Analisis data 2 : Dari hasil analisis data, nilai skewness >0, maka dapat dilihat pada histogram, data
diatas berbentuk asimetris dengan puncak berarah ke kiri, kemudian nilai kurtosis
>3, maka data diatas termasuk pada jenis bentuk leptycutic. Melihat pada bagian
diagram box plot, maka dapat disimpulkan terdapat upper outlier.

Analisis data 3 : Dari hasil analisis data, nilai skewness <0, maka dapat dilihat pada histogram, data
diatas berbentuk asimetris dengan puncak berarah ke kanan, kemudian nilai kurtosis
>3, maka data diatas termasuk pada jenis bentuk leptycutic. Melihat pada bagian
diagram box plot, maka dapat disimpulkan terdapat lower outlier.
Nama : M Lugas Sujatmoko
NIM : 12019004

Analisis data 4 : Dari hasil analisis data, nilai skewness >0, maka dapat dilihat pada histogram, data
diatas berbentuk asimetris dengan puncak berarah ke kiri, kemudian nilai kurtosis
>3, maka data diatas termasuk pada jenis bentuk leptokurtik. Melihat pada bagian
diagram box plot, maka dapat disimpulkan terdapat upper outlier.

Analisis data 5 : Dari hasil analisis data, nilai skewness >0, maka dapat dilihat pada histogram, data
diatas berbentuk asimetris dengan puncak berarah ke kiri, kemudian nilai kurtosis
>3, maka data diatas termasuk pada jenis bentuk leptokurtik. Melihat pada bagian
diagram box plot, maka dapat disimpulkan terdapat upper outlier.

Dari kelima data yang dianalisis menunjukan bahwa seluruh data tidak terdistribusi secara
merata. Berdasarkan jurnal Cluster analysis applied to regional geochemical data: Problems
and possibilities, 2008; Exploratory Analysis of Sediment Geochemistry to Determine the
Source and Dispersion of Ba, Fe, Mn, Pb and Cu and in Chihuahua, Northern Mexico, 2012;
dan Exploratory data analysis and singularity mapping in geochemical anomaly
identification in Karamay, Xinjiang, China, 2014. Sampel data yang ada di alam sebagian
besar merupakan data yang tidak terdistribusi normal, sehingga diperlukan adanya
transformasi logaritmik atau pengolahan lanjutan agar data dapat berubah menjadi
terdistribusi normal.

F. Kesimpulan
Dari analisis yang dilakukan menggunakan EDA, data diatas menunjukan data tidak
terdistribusi secara normal. Hal ini terjadi karena nilai skewness dan kurtois tidak sesuai dengan
syarat data terdistribusi normal. Analisis menggunakan histogram, boxplot, dan scatter plot dapat
membantu melihat nilai outlier dan menganalisis persebaran data tersebut. Pengolahan data lebih
lanjut seperti transformasi logaritmik dapat dilakukan agar data dapat terdistribusi secara normal.

Anda mungkin juga menyukai