Anda di halaman 1dari 12

DATA TRANSFORMATION

Abdul Aziz Mubarak (H13116502)


Apa itu
?
Metode-Metode dalam
Data Transformation
Smoothing
Tahap ini dilakukan apa bila ada data yang mengandung noise/hilang
atau ada data yang tidak valid terhadap data yang akan di mining.
Untuk mengatasinya harus melakukan smoothing, adapun beberapa
cara yang dapat dilakukan antara lain.

i) Binning
ii) Clustering
iii) Regression
Normalization
Normalization
Maksudnya ialah memproses transformasi dimana sebuah atribut
numerik diskalakan dalam range yang lebih kecil dan spesifik seperti (0
sampai 1).

Adapun beberapa metode yang dapat di lakukan dalam me-


Normalization (menormalkan) data:
1. Min-max Normalization
2. Z-Score Normalization
3. Normalization By Decimal Scaling
Normalization : Min-Max Normalization
•Min-Max
  Normalization memetakan sebuah value dari atribut menjadi
ke dalam range berdasarkan dengan rumus:
Normalization : Z-Score Normalization
•Dapat
  disebut juga Zero-Mean Normalization, dimana value sebuah
atribut dinormalisasi berdasar nilai rata-rata dan standar deviasi dari
atribut . Sebuah value dari atribut dinormalisasi menjadi degan

rumus dimana: adalah dan

Nilai rata-rata dan standar deviasi dari atribut .


Normalization : Normalization
by Decimal Scaling
•Normalization/normalisasi
  yang diperoleh dengan melakukan
penggeseran titik decimal dari value sebuah atribut Jumlah tittit
decimal yang digeser tergantung dari nilai absolut maksimum dari
atribut Berikut rumus yang dapat digunakan:

Dimana untuk j adalah bilangan bulat terkecil.


Discretization
1. Dalam Discritezation terdapat tiga jenis atribut yaitu: Nominal,
Ordinal, Numeric.
2. Membagi rentang atribut kontinu kedalam bentuk interval
a. Label intervalnya dapat digunakan untuk mengganti nilai data
yang lebih actual.
b. Mengurangi ukuran data
c. Supervised and unsupervised
d. Diskritisasi dapat dilakukan secara rekursif dalam satu atribut.
End..

Anda mungkin juga menyukai