Anda di halaman 1dari 8

DATA MINING

ANGGOTA : Fadhila Alawiyah Zulfa (2620122017)

Sheril Lintang Cahaya (2620122007)

M Rabi F (2620122008)

Sampel Data: Data Shopping

Spending Score (1-


CustomerID Genre Age Annual Income (k$)
100)
1 Male 19 15 39
2 Male 21 15 81
3 Female 20 16 6
4 Female 23 16 77
5 Female 31 17 40
6 Female 22 17 76
7 Female 35 18 6
8 Female 23 18 94
9 Male 64 19 3
10 Female 30 19 72
...

190 Female 36 103 85


191 Female 34 103 23
192 Female 32 103 69
193 Male 33 113 8
194 Female 38 113 91
195 Female 47 120 16
196 Female 35 120 79
197 Female 45 126 28
198 Male 32 126 74
199 Male 32 137 18
200 Male 30 137 83
Annual Spending
CustomerID Genre Age Income (k$) Score (1-100)

N Valid 200 200 200 200 200

Missing 0 0 0 0 0

Pada tabel di atas kami menganalisis Data Set mengenai Data Shopping, Kami mengambil data
tersebut di KAGGLE dengan jumlah data yaitu 200 data. Dan dalam data tersebut tidak terdapat
missing data, sehingga semua data valid.

One-Sample Kolmogorov-Smirnov Test

Annual Income Spending Score


CustomerID Age (k$) (1-100)

N 200 200 200 200


a,b
Normal Parameters Mean 100.50 38.85 60.56 50.20
Std. Deviation 57.879 13.969 26.265 25.824
Most Extreme Differences Absolute .059 .101 .053 .066
Positive .059 .101 .053 .066
Negative -.059 -.068 -.041 -.066
Test Statistic .059 .101 .053 .066
c c c,d
Asymp. Sig. (2-tailed) .086 .000 .200 .032c

a. Test distribution is Normal.


b. Calculated from data.
c. Lilliefors Significance Correction.
d. This is a lower bound of the true significance.

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percent

CustomerID 200 100.0% 0 0.0% 200 100.0%


Tidak ada outliers atau data yang keluar dari diagram.

Tidak ada outliers atau data yang keluar dari diagram.

Dalam grafik di atas terdapat data yang keluar dari diagram yaitu Outliers yang membuat data
tidak normal. Untuk menormalisasikan data maka outliers harus dihapuskan, seperti hasil
pada diagram di bawah ini.
Pada data ini outlier sudah di normalisasikan, jadi tidak ada data yang keluar dari diagram.

Tidak ada outliers atau data yang keluar dari diagram.


a.

b.

Diagram Histogram yang (a.) di atas menunjukan data belum normal sedangakan yang (b.)
sudah di normalisasikan
a.

b.

Diagram normal probability yang (a.) di atas menunjukan data belum normal sedangakan
yang (b.) sudah di normalisasikan

a.
b.

Diagram scatterplot yang (a.) di atas menunjukan data belum normal sedangakan yang (b.)
sudah di normalisasikan

Anda mungkin juga menyukai