Exploratory Data Analysis (EDA) adalah analisis data yang dilakukan pada saat
investigasi awal terhadap data sehingga diharapkan dapat menemukan pola, melihat
anomali, menguji hipotesis dan memeriksa asumsi dengan bantuan summary statistic dan
representasi grafis. Exploratory Data Analysis yang digunakan dalam data ini adalah
summary statistic, histogram dan box plot.
Summary statistic memperlihatkan ringkasan dari seluruh data seperti mean,
median, modus, skewness, kurtosis, range dan lainnya. Kecondongan (skewness) suatu
kurva dapat dilihat dari perbedaan letak mean, median dan modusnya. Jika ketiga ukuran
pemusatan data tersebut berada pada titik yang sama, maka dikatakan simetris atau data
berdistribusi normal. Sedangkan jika tidak berarti data tidak simetris atau tidak berdistribusi
normal.
Ukuran kecondongan data terbagi atas tiga bagian, yaitu :
Kecondongan data ke arah kiri (condong negatif) dimana nilai modus lebih dari nilai
mean (modus > mean).
Kecondongan data simetris (distribusi normal) dimana nilai mean dan modus adalah
sama (mean = modus).
Kecondongan data ke arah kanan (condong positif) dimana nilai mean lebih dari nilai
modus (mean > modus).
Keruncingan dinilai sebagai bentuk distorsi dari kurva normal. Tingkat keruncingan
diukur dengan membandingkan bentuk keruncingan kurva distribusi data dengan kurva
normal. Terbagi atas tiga, yaitu :
Leptokurtic, yaitu bagian tengah distribusi data memiliki puncak yang lebih runcing
(nilai keruncingan lebih dari 3).
Platykurtic, yaitu bagian tengah distribusi data memiliki puncak yang lebih datar (nilai
keruncingan kurang dari 3).
Mesokurtic, yaitu bagian tengah distribusi data memiliki puncak diantara Leptokurtic
dan Platykurtic (nilai keruncingan sama dengan 3).
Analisis
Berdasarkan 70 sampel data medan magnet, dilakukan analisis summary statistic
menggunakan excel.
Tabel 1. Summary statistics Medan Magnet
Summary Statistics
Mean 430866
Standard Error 108,9929
Median 431005,5
Mode 430793
Standard Deviation 911,8997
Sample Variance 831561
Kurtosis 4,166303
Skewness 0,234778
Range 6182
Minimum 428430
Maximum 434612
Sum 30160619
Count 70
Berdasarkan Tabel 1, didapatkan nilai mean yang lebih besar dibandingkan nilai modus
yang berdasarkan pengelompokan skewness (kecondongan), distribusi data tersebut
memiliki kurva yang relative condong ke kanan. Dan didapat juga nilai kurtosis 4.166303
yang menunjukkan bahwa bagian tengah data tersebut memiliki puncak yang runcing
(leptokurtic).
Histogram
39
13
7 0
6
1 25
30 7 ,5 25 21 75 ,15 25
1e
or
84 02, 975 48, 15 93, 066 39, M
2 3
4 92 42
9 07 4 22 43
3 38
42 43 43 43
Referensi :