Anda di halaman 1dari 6

TUGAS

DATA MINING

Nama Kelompok :
I Putu Ari Ratna Pratama (1208605055)
Putu Mega Suryawan (1208605069)
Ida Bagus Surya Winantara (1208605085)

PROGRAM STUDI TEKNIK INFORMATIKA


JURUSAN ILMU KOMPUTER - FMIPA
UNIVERSITAS UDAYANA
BUKIT JIMBARAN
2015

1. Teori tentang PCA dan contoh perhitungannya


Principal Components Analysis (PCA)
Principal Components Analysis (PCA) atau analisis komponen utama
merupakan suatu teknik statistik untuk mengubah dari sebagian besar variabel
asli yang digunakan dan saling berkorelasi satu dengan yang lainnya menjadi
satu set variabel baru yang lebih kecil dan tidak berkorelasi. Setiap
pengukuran multivariat (atau observasi), komponen utama merupakan
kombinasi linier dari variabel p awal. Tujuan utama analisis komponen utama
ialah untuk mengurangi dimensi peubah-peubah yang saling berhubungan dan
cukup banyak variabelnya sehingga lebih mudah untuk menginterpretasikan
data-data tersebut (Johnson & Wichern, 2002). Metode yang digunakan yaitu
menentukan komponen utama dengan melakukan alih ragam orthogonal atau
membentuk kombinasi linier A' XY (Sumarga, 1996). Dari sini akan dipilih
beberapa komponen utama yang dapat memberikan sebagian besar
keragaman total data semula.
Komponen utama merupakan suatu kombinasi linear vektor p variabel
acak X1, . . . , Xp. Misalkan matriks X = [X1, . . . , Xp] mempunyai matriks
kovariansi . Dalam hal ini adalah matriks simetris dan positif tegas
(positive definite) dengan nilai eigen 1 2 p > 0 dan sebutlah
vektor eigen yang bersesuaian untuk setiap 1 2 p > 0 adalah
e 1 ,...,

e p yang saling orthogonal, dengan mencari kombinasi linier

yaitu
T

Y i=e i X =e 1i X 1 +e 21 X 2+ +e pi X p , i=1, 2, , p .
Dengan pemilihan ini,
Var ( Y i )=e Ti e i=i i=1, 2, , p .
Cov ( Y i ,Y k )= eTi ek =0,i k .
Proporsi total variansi komponen prinsip ke-i didefinisikan sebagai
k
, k =1, , p .
1+2 ++ p

Nilai eki menyatakan ukuran pentingnya variabel ke-k terhadap komponen


prinsip ke-i. Secara khusus, eki menyatakan korelasi antara komponenkomponen Yi dan variabel-variabel Xk. Hal ini dijelaskan dengan
menggunakan koefisien korelasi antara komponen-komponen Yi dan
variabel-variabel Xk adalah
Y , X =
i

e ki 1
i , k=1, 2, , p .
kk

dengan kk adalah simpangan baku variabel ke-k. (Johnson and Wichern,


2002)
Contoh Perhitungan :
Misalnya ada data yang dibentuk matriks kovariansi,

8.17
6.13
4.09
2.05

6.13
4.59
3.07
1.54

4.09
3.07
2.05
1.03

2.05
1.54
1.03
0.51

Dicari eigen value dan eigen vektor. Eigen value dan eigen vektor akan
digunakan untuk mencari komponen utama yang terlebih dahulu dibentuk
persamaan kombinasi liniernya. Diperoleh eigen value dan eigen vektor
adalah
1 = 15.3290

e1 = [0.73,0.55,0.37,0.18]

2 = 0.0008

e2 = [-0.26,0.54,-0.57,0.57]

3 = 0.0005

e3 = [0.60,-0.25,-0.73,-0.21]

4 = 0.0003

e4 = [0.18,-0.59,0.13,0.77]

Kombinasi linier menurut persamaan menjadi


Y1 = e1 X = 0.73 X1 + 0.55 X2 + 0.37 X3 + 0.18 X4
Y2 = e2 X = -0.26 X1 + 0.54 X2 + -0.57 X3 + 0.57 X4
Y3 = e3 X = 0.6 X1 + -0.25 X2 + -0.73 X3 + -0.21 X4
Y4 = e4 X = 0.18 X1 + -0.59 X2 + 0.13 X3 + 0.77 X4
Proporsi dari total variansi untuk komponen utama pertama Y1 adalah

1/(1 + 2 + 3 + 4) = 15.3290/(15.3290 + 0.0008 + 0.0005 + 0.0003) =


0.9998
Proporsi tersebut telah menjelaskan 99.98% dari keragaman total data. Hal itu
berarti Y1 dapat menggantikan keempat variabel asli tanpa banyak
kehilangan informasi. Jika dilihat dari korelasi antara Y1 dengan keempat
variabel yaitu X1 , X 2 , X3 dan X 4 dihitung berdasarkan persamaan,
keempatnya relatif dekat ke 1 dapat disimpulkan bahwa keempat variabel
sama pentingnya.
Y

1, X1

1, X3

e 11 1
=0.9999 ,Y
11

e 31 1
=0.9998 , Y
33

1 , X2

1, X4

e 21 1
=0.9999 ,
22

e 41 1
=0.9995 .
44

2. Z-score normalozation dan decimal scaling normalization beserta contohnya


Z-Score Normalization
Z-Score Normalization merupakan metode normalisasi yang berdasarkan
mean (nilai rata-rata) dan standard deviation (deviasi standar) dari data.
Rumus :
newdata = (data-mean)/standard deviation
Metode ini sangat berguna jika kita tidak mengetahui nilai aktual minimum
dan maksimum dari data.
Contoh :
Anggaplah bahwa mean dan standard deviation dari nilai-nilai untuk atribut
income secara berturut-turut adalah $54,000 dan $16,000. Dengan z-score
normalization, maka income sebesar $73,600 ditransformasikan menjadi
(73,600-54,000) / 16,000 = 1.225.
Decimal Scaling Normalization
Decimal Scaling Normalization merupakan metode normalisasi dengan
menggerakkan nilai desimal dari data ke arah yang diinginkan. Rumus :
newdata = data / 10i

Dimana i adalah nilai integer untuk menggerakkan nilai desimal ke arah yang
diinginkan.
Contoh :
Anggap bahwa nilai-nilai atribut A terletak dalam range -986 sampai 917.
Dengan demikian nilai absolut maksimum

A adalah 986. Untuk

menormalisasikan dengan menggunakan skala desimal, setiap nilai A dibagi


dengan 1000 (misalnya, i = 3) sehingga -986 dinormalisasi menjadi -0.986.
3. Fourier transform dan wavalet transform
Fourier Transform (Transformasi Fourier)
Dengan bantuan transformasi fourier, dapat diketahui frekuensi-frekuensi
apa saja yang terkandung dalam sinyal tersebut (Spiegel, Murray R., 1974).
Tetapi lama kelamaan, akhirnya disadarilah bahwa transformasi fourier masih
memiliki kelemahan pula. Transformasi fourier hanya baik digunakan untuk
menganalisa sinyal stasioner, tetapi sangat tidak efektif jika digunakan untuk
menganalisa sinyal non-stasioner. Hal tersebut dikarenakan transformasi
fourier menganalisa sinyal dalam keseluruhan waktu (dari awal sampling
hingga akhir sampling), alhasil muncul asumsi bahwa informasi frekuensi
sinyal yang didapatkan terjadi dalam setiap waktu pada sinyal tersebut.
Padahal belum tentu fekuensi-frekuensi tersebut terjadi dalam setiap waktu
pada sinyal tersebut. Dengan kata lain, informasi waktu kapan terjadinya
frekuensi-frekuensi tersebut tidak dapat diketahui dengan jelas dan tepat.
(Stein et al, 2002)
Seiring berkembangnya teknik-teknik analisa sinyal, muncullah sebuah
konsep baru yang dapat mengatasi kelemahan dari transformasi fourier
tersebut, teknik analisa sinyal tersebut bernama Wavelet Transform.
Wavelet Transform (Transformasi Wavelet)
Teori wavelet merupakan suatu konsep yang relatif baru dikembangkan.
Kata wavelet sendiri diberikan oleh Jean Morlet dan Alex Grossmann pada
awal tahun 1980-an, dan berasal dari bahasa Perancis, ondelette yang
berarti gelombang kecil. Kata onde yang berarti gelombang kemudian
diterjemahkan ke bahasa inggris menjadi wave, lalu digabungkan dengan

kata

aslinya

sehingga

terbentuklah

kata

baru

wavelet.

Dengan

menggunakan wavelet transform, informasi frekuensi berikut informasi waktu


kapan terjadinya frekuensi tersebut pada sinyal dapat diketahui dengan
presisi. Fungsi dari mother wavelet (fungsi window wavelet) adalah sebagai
berikut :
a , b ( t )=

1
t b

..(1)
a
a

( )

,dimana a adalah bilangan positif yang menunjukkan parameter skala (scale)


dan b adalah bilangan real yang menyatakan pergeseran waktu (shift).
Berdasarkan jenis sinyal yang diprosesnya, transformasi wavelet dapat
dibagi menjadi dua bagian besar, yaitu Continuous Wavelet Transform (CWT)
dan Discrete Wavelet Transform (DWT).
Referensi :
Teori PCA dan Contoh Perhitungannya. Diakses dari web,
https://adisetiawan26.files.wordpress.com/2012/02/adi_setiawan2011e.pdf, pada
tanggal 1 Maret 2015.
Z-score Normalozation dan Decimal Scaling Normalization. Diakses dari web,
http://entin.lecturer.pens.ac.id/Data%20Mining/Minggu%202%20Data
%20Preprocessing.pdf, pada tanggal 1 Maret 2015.
Contoh Z-score Normalozation dan Decimal Scaling Normalization. Diakses
dari

web,

http://mfile.narotama.ac.id/files/Zakki%20Falani/Konsep%20Data

%20Mining/Data%20Preprocessing%20Bagian%202.pdf, pada tanggal 1 Maret


2015.
Fourier transform dan wavalet transform. Diakses dari web,
http://library.binus.ac.id/eColls/eThesisdoc/Bab2/2009-1-00456-SK%20Bab
%202.pdf, pada tanggal 1 Maret 2015.

Anda mungkin juga menyukai