Di Susun oleh:
Kelompok :
Irfan Maulana
Nim : 2011-53-032
M. Nanang Setyawan
Nim : 2011-53-031
M. Alfan TS
Nim : 2011-53-036
A. Miftah Baidlowi
Nim : 2011-53-023
M. Taufiq
Nim : 2011-53-001
Nim : 2011-53-0
Nim : 2011-53-0
PENDAHULUAN
1.1.
Latar belakang
Seringkali data mentah perlu diproses agar data tersebut sesuai untuk analisis.
Selain meningkatkan kualitas data, data seringkali dimodifikasi agar lebih cocok
dengan teknik data mining tertentu. Sebagai contoh, atribut kontinu seperti panjang
dapat ditranformasi ke dalam kategori diskret seperti pendek, sedang atau panjang,
agar teknik tertentu dapat diaplikasikan. Selain itu, banyaknya atribut dalam data set
sering kali dikurangi karena banyak teknik bekerja lebih efektif ketika data memiliki
sejumlah atribut yang relatif lebih sedikit.
Menganalisis data dalam bentuk relasinya ; Satu pendekatan untuk analisis
data adalah menemukan hubungan antara objek-objek data dan kemudian melakukan
analisis sisanya menggunakan hubungan-hubungan ini daripada menggunakan objekobjek data itu sendiri. Sebagai contoh, kita dapat menghitung kemiripan atau jarak
antar sepasang objek dan kemudian melakukan analisis clustering, klasifikasi, atau
deteksi anomali berdasarkan pada kemiripan dan jarak tersebut.
BAB II
PEMBAHASAN
2.1.
Tipe Data
Sebuah data set dapat dipandang sebagai sebuah koleksi dari objek- objek
data. Nama lain dari sebuah objek data adalah record, titik, vektor, pola, event, case,
sample, observasi atau entitas. Objek-objek data dijelaskan oleh sejumlah atribut
yang menangkap karakteristik dasar dari sebuah objek, seperti massa dari sebuah
objek fisik atau waktu pada saat sebuah kejadian terjadi. Nama-nama lain untuk
atribut adalah variabel, karekteristik, field, fitur atau dimensi.
Contoh 2.1 (Informasi mahasiswa)
Seringkali, sebuah data set adalah sebuah file, dimana objek adalah record-record
(atau baris) dalam file dan setiap field (atau kolom) berkaitan dengan sebuah atribut.
Sebagai contoh, Tabel 2.1 menunjukkan sebuah data set yang terdiri dari informasi
mahasiswa. Setiap baris berkaitan dengan seorang siswa dan setiap
kolom adalah sebuah atribut yang menjelaskan suatu aspek dari seorang
mahasiswa seperti grade point average (GPA) atau identification number (ID).
Tabel 2.1
Data set mahasiswa
Grade Point Average (GPA)
Student ID
Year
Selain record-based,
data
1034262
Senior
1052663
data
relasional. Sophomore
1082246
Freshman
2.1.1
set
juga
3.24
3.51
3.62
fileatau
sistem basis
2.1.2
dikelompokan ke dalam 3 kelompok, yaitu data record, data berbasis graf, dan data
terurut.
Terdapat tiga karakteristik data set dan memiliki pengaruh penting pada teknik data
mining yang digunakan. Karakteristik tersebut adalah:
1. Dimensionalitas. Dimensionalitas dari data set adalah banyaknya atribut yang
dimiliki objek dalam data set. Data dengan jumlah dimensi yang kecil cenderung
berbeda secara kualitatif dibandingkan dengan data berdimensi sedang atau tinggi.
Untuk memudahkan analisis, pada data berdimensi tinggi seringkali dilakukan
reduksi dimensi yaitu pada tahap preprocessing.
2. Sparsity. Untuk beberapa data set, misal pada data set yang mengandug atribut
asimetrik, kebanyakan atribut memiliki nilai 0. Dalam kebanyakan kasus, kurang
dari 1% dari keseluruhan data yang memiliki nilai tak nol. Dalam praktik, sparsity
adalah keuntungan karena biasanya hanya nilai-nilai tak nol yang perlu disimpan dan
dimanipulasi. Hasil ini secara signifikan menghemat biaya komputasi dan tempat
penyimpanan.
3. Resolusi. Data pada tingkat resolusi yang berbeda seringkali diperoleh, dan sering
pula sifat-sifat dari data berbeda pada resolusi yang berbeda. Sebagai contoh,
permukaan bumi terlihat sangat tidak rata pada resolusi tertentu (dari beberapa
meter), tetapi terlihat halus jika terlihat dari puluhan kilo meter.
Pola data juga tergantung pada level resolusi. Jika resolusi terlalu halus, pola tertentu
dapat tidak tampak atau dapat terkubur dalam noise; jika resolusi terlalu kasar, pola
dapat hilang. Sebagai contoh, variasi dalam tekanan atmosfer pada skala jam
merefelksikan pergerakan badai dan sistem cuaca lainnya. Pada skala bulanan,
fenomena tersebut tidak akan terdeteksi. Berikut adalah tiga kategori dari data set:
Data record
Data set ini merupakan kumpulan record (objek data), masing-masing record
mengandung sekumpulan field data (atribut) (Gambar 2.2 (a)). Untuk kebanyakan
bentuk dasar dari data record, tidak ada hubungan yang eksplisit diantara record atau
field data, dan setiap record (objek) memiliki himpunan atribut yang sama. Data
record biasanya disimpan dalam flat file atau dalam basis data relasioanal. Basis data
relasional lebih dari pada koleksi data, tetapi data mining seringkali tidak
menggunakan informasi tambahan yang ada dalam basis data relasional. Beberapa
bentuk data record diilustrasikan dalam Gambar 2.2.
Pemrosesan Data
Langkah preprocessing perlu dilakukan agar data dapat sesuai untuk data
mining. Strategi atau pendekatan yang sering digunakan adalah agregasi, sampling,
reduksi dimensional, feature subset selection, pembuatan fitur, diskretisasi dan
binerisasi, dan transformasi variabel. Pendekatan-pendekatan ini dapat dikelompokan
ke dalam dua kategori, yaitu seleksi objek-objek data dan atribut-atribut untuk
analisis atau pembuatan/perubahan atribut. Tujuan dari kedua kategori tersebut
adalah untuk meningkatkan analisis data mining terhadap waktu, biaya dan kualitas
2.2.1
Agregasi
Agregasi adalah mengkombinasikan dua atau lebih objek ke dalam sebuah
objek tunggal. Sebagai contoh, data set yang berisi transaksi (objek data) yang
mencatat penjualan produk harian di berbagai lokasi toko (Tabel 2.4). Salah satu cara
untuk meng-agregasi transaksi untuk data set ini adalah mengganti semua transaksi
dari toko-toko dengan sebuah transaksi tunggal. Agregasi ini mengurangi ratusan
atau ribuan transaksi yang terjadi setiap hari pada satu toko tertentu ke transaksi
harian tunggal, dan banyaknya objek data direduksi menjadi banyaknya toko.
Rumus
maka :
Jarak antara Nilai Terbobot Setiap Alternatif terhadap Solusi Ideal negatif :
maka :
Rumus
maka :
V1 = 2 .375
= 0.74207
2.375+0.8255
V2=
1.3055
= 0.3254
1.3055+2.7058
V3 =
0.772
= 0.254
0.772+2.267
Maka solusi yang didapat : dari nilai V (jarak kedekatan setiap alternatif
terhadap solusi ideal) diperoleh nilai V1 memiliki nilai terbesar, sehingga yang
akan dipilih sebagai lokasi untuk mendirikan gudang adalah kota Ngemplak.
E1
E2
E3
C1
0.87
0.97
0.97
C2
0.87
0.87
0.87
C3
0.7
0.87
0.7
C4
0.7
0.7
0.7
C5
0.87
0.87
0.87
Sedangkan dari hasil evaluasi tim pengambil keputusan terhadap ketiga
kandidat A1, A2, dan A3 didapat data sebagai berikut :
C1
C2
C3
C4
C5
E1
E2
E3
A1
6 juta
8 juta
7 juta
A2
3 juta
4 juta
5 juta
A3
4 juta
5 juta
6 juta
A1
8.7
9.7
A2
9.7
9.7
9.7
A3
8.7
9.7
A1
8.7
8.7
A2
8.7
8.7
8.7
A3
8.7
9.7
A1
9.7
8.7
8.7
A2
8.7
8.7
8.7
A3
8.7
9.7
9.7
A1
A2
8.7
8.7
A3
8.7
8.7
8.7
Dari ketiga kandidat tersebut, alternatif manakah yang sebaiknya diambil untuk ditetapkan
menjadi pemateri work shop teknologi informasi di universitas tersebut?
Berikut, adalah langkah-langkah untuk menentukan jawaban atas permasalahan di atas.
Berdasarkan Tabel 1, maka dapat ditentukan bobot untuk setiap kriteria, sebagai berikut :
Tabel 3. Bobot untuk setiap kriteria :
C1
C2
C3
C4
C5
Wj
0.937
0.87
0.757
0.7
0.87
dan berdasarkan tabel 2, dapat dikontruksi matriks keputusan berupa tabel berikut :
C1
C2
C3
C4
C5
A1
7.8
7.467
9.033
A2
9.7
8.7
8.7
7.467
A3
5
8.467
8.467
9.367
Kemudian lakukan normalisasi matriks keputusan pada Tabel 4, dan didapat :
8.7
C1
C2
C3
C4
C5
A1
0.855
0.5181
0.5239
0.577
0.399
A2
0.4886
0.6443
0.6104
0.5557
0.597
A3
0.6108
0.5624
0.594
0.598
0.6956
C1
C2
C3
C4
C5
v1j
0.8011
0.4507
0.3965
0.4039
0.3471
v2j
0.4578
0.5605
0.462
0.3885
0.51939
v3j
0.5723
0.4892
0.4496
0.4186
Berdasarkan matriks keputusan bobot normal, maka didapatkan :
0.6051
= 0.448
0 + 0 + 0 + 0.00023 + 0 = 0.01516
0.1178 + 0.012 + 0,0042 + 0 + 0.029 = 0.4037
Bab III
KESIMPULAN
Sebagai suatu usaha untuk mendapatkan solusi terbaik atas permasalahan multiple criteria
decision making dapat digunakan Technique for Order Performance by Similarity to Ideal
Solution, yang dalam implementasinya akan memunculkan beberapa alternatif solusi
berdasarkan hasil ranking kumulatif, yang kemudian dapat dipilih satu solusi tertentu,
berdasarkan kriteria tambahan dari pemegang kebijakan (pimpinan). Kemudian, beberapa
alternatif solusi tersebut dapat dijadikan referensi tim pengambil keputusan untuk diajukan
kepada pimpinan mereka, sehingga pimpinan mereka dapat memilih satu solusi dari beberapa
alternatif solusi yang ada, dan diharapkan dapat diambil keputusan terbaik yang
menguntungkan.
DAFTAR PUSTAKA
Kusumadewi, Sri, dkk. 2006. Fuzzy Multi Attribute Decision Making. Yogyakarta:
Graha Ilmu.
http://student.eepis-its.edu/~giant/DB2/db2_6TOPSIS.pdf (diakses 11 Mei 2011, 2011
jam 6:11)
http://w4hyuwidodo.wordpress.com/2010/07/07/sistem-pendukung-keputusandengan-methode-topsis/ (diakses 11 Mei 2011, 2011 jam 6:15)
http://nzircui.wordpress.com/category/topsis/ (diakses 11 Mei 2011, 2011 jam 6:20)