Makalah DM

Pemrosesan Data Pembukuan Transaksi Penjualan Pada Toko
Ungu Komputer dengan Metode Data Mining

MAKALAH
Di Susun Guna Memenuhi Tugas
Mata Kuliah Data Mining
Kelas : B
Dosen Pengampu : Putri Kurnia Handayani M.Kom
Di Susun oleh:
Kelompok :
Irfan Maulana
Nim : 2011-53-032
M. Nanang Setyawan
Nim : 2011-53-031
M. Alfan TS
Nim : 2011-53-036
A. Miftah Baidlowi
Nim : 2011-53-023
M. Taufiq
Nim : 2011-53-001
M. Nizar Ulil Albab
Nim : 2011-53-0
Adi Surya Pambudi
Nim : 2011-53-0
Universitas Muria Kudus

Kampus Gondang Manis PO.BOX 53 Bae KUDUS
BAB I
PENDAHULUAN
1.1.
Latar belakang
Seringkali data mentah perlu diproses agar data tersebut sesuai untuk analisis.
Selain meningkatkan kualitas data, data seringkali dimodifikasi agar lebih cocok
dengan teknik data mining tertentu. Sebagai contoh, atribut kontinu seperti panjang
dapat ditranformasi ke dalam kategori diskret seperti pendek, sedang atau panjang,
agar teknik tertentu dapat diaplikasikan. Selain itu, banyaknya atribut dalam data set
sering kali dikurangi karena banyak teknik bekerja lebih efektif ketika data memiliki
sejumlah atribut yang relatif lebih sedikit.
Menganalisis data dalam bentuk relasinya ; Satu pendekatan untuk analisis
data adalah menemukan hubungan antara objek-objek data dan kemudian melakukan
analisis sisanya menggunakan hubungan-hubungan ini daripada menggunakan objekobjek data itu sendiri. Sebagai contoh, kita dapat menghitung kemiripan atau jarak
antar sepasang objek dan kemudian melakukan analisis clustering, klasifikasi, atau
deteksi anomali berdasarkan pada kemiripan dan jarak tersebut.
BAB II
PEMBAHASAN
2.1.
Tipe Data
Sebuah data set dapat dipandang sebagai sebuah koleksi dari objek- objek
data. Nama lain dari sebuah objek data adalah record, titik, vektor, pola, event, case,
sample, observasi atau entitas. Objek-objek data dijelaskan oleh sejumlah atribut
yang menangkap karakteristik dasar dari sebuah objek, seperti massa dari sebuah
objek fisik atau waktu pada saat sebuah kejadian terjadi. Nama-nama lain untuk
atribut adalah variabel, karekteristik, field, fitur atau dimensi.
Contoh 2.1 (Informasi mahasiswa)
Seringkali, sebuah data set adalah sebuah file, dimana objek adalah record-record
(atau baris) dalam file dan setiap field (atau kolom) berkaitan dengan sebuah atribut.
Sebagai contoh, Tabel 2.1 menunjukkan sebuah data set yang terdiri dari informasi
mahasiswa. Setiap baris berkaitan dengan seorang siswa dan setiap
kolom adalah sebuah atribut yang menjelaskan suatu aspek dari seorang
mahasiswa seperti grade point average (GPA) atau identification number (ID).
Tabel 2.1
Data set mahasiswa
Grade Point Average (GPA)
Student ID
Year
Selain record-based,
data
1034262
Senior
1052663
data
relasional. Sophomore
1082246
Freshman
2.1.1
set
juga
3.24
3.51
3.62
bisa dalam bentuk flat
fileatau
sistem basis
Atribut dan Pengukuran

Sebuah atribut adalah sebuah sifat atau karakteristik dari sebuah objek yang
dapat bervariasi, baik dari satu objek ke objek yang lain atau dari satu waktu ke
waktu yang lain.
Sebagai contoh, warna mata bervariasi dari satu orang ke orang lain,
sedangkan temperatur dari sebuah objek bervariasi sepanjang waktu. Perhatikan
bahwa warna mata adalah sebuah atribut simbolik dengan sejumlah kecil nilai yang
mungkin {coklat, hitam, biru, hijau, dan lain-lain), sementara temperatur adalah
atribut numerik dengan banyaknya nilai yang tak terhingga.
2.1.2
Tipe tipe Dataset

Terdapat banyak tipe dari data set. Dengan berkembangkan bidang data
mining, berbagai data set tersedia untuk analisis. Dalam bagian ini, data set akan
dikelompokan ke dalam 3 kelompok, yaitu data record, data berbasis graf, dan data
terurut.
Terdapat tiga karakteristik data set dan memiliki pengaruh penting pada teknik data
mining yang digunakan. Karakteristik tersebut adalah:
1. Dimensionalitas. Dimensionalitas dari data set adalah banyaknya atribut yang
dimiliki objek dalam data set. Data dengan jumlah dimensi yang kecil cenderung
berbeda secara kualitatif dibandingkan dengan data berdimensi sedang atau tinggi.
Untuk memudahkan analisis, pada data berdimensi tinggi seringkali dilakukan
reduksi dimensi yaitu pada tahap preprocessing.
2. Sparsity. Untuk beberapa data set, misal pada data set yang mengandug atribut
asimetrik, kebanyakan atribut memiliki nilai 0. Dalam kebanyakan kasus, kurang
dari 1% dari keseluruhan data yang memiliki nilai tak nol. Dalam praktik, sparsity
adalah keuntungan karena biasanya hanya nilai-nilai tak nol yang perlu disimpan dan
dimanipulasi. Hasil ini secara signifikan menghemat biaya komputasi dan tempat
penyimpanan.
3. Resolusi. Data pada tingkat resolusi yang berbeda seringkali diperoleh, dan sering
pula sifat-sifat dari data berbeda pada resolusi yang berbeda. Sebagai contoh,
permukaan bumi terlihat sangat tidak rata pada resolusi tertentu (dari beberapa
meter), tetapi terlihat halus jika terlihat dari puluhan kilo meter.
Pola data juga tergantung pada level resolusi. Jika resolusi terlalu halus, pola tertentu
dapat tidak tampak atau dapat terkubur dalam noise; jika resolusi terlalu kasar, pola
dapat hilang. Sebagai contoh, variasi dalam tekanan atmosfer pada skala jam
merefelksikan pergerakan badai dan sistem cuaca lainnya. Pada skala bulanan,
fenomena tersebut tidak akan terdeteksi. Berikut adalah tiga kategori dari data set:
Data record
Data set ini merupakan kumpulan record (objek data), masing-masing record
mengandung sekumpulan field data (atribut) (Gambar 2.2 (a)). Untuk kebanyakan
bentuk dasar dari data record, tidak ada hubungan yang eksplisit diantara record atau
field data, dan setiap record (objek) memiliki himpunan atribut yang sama. Data
record biasanya disimpan dalam flat file atau dalam basis data relasioanal. Basis data
relasional lebih dari pada koleksi data, tetapi data mining seringkali tidak
menggunakan informasi tambahan yang ada dalam basis data relasional. Beberapa
bentuk data record diilustrasikan dalam Gambar 2.2.
Gambar 2.2 Variasi yang berbeda dari data record

2.2.
Pemrosesan Data
Langkah preprocessing perlu dilakukan agar data dapat sesuai untuk data
mining. Strategi atau pendekatan yang sering digunakan adalah agregasi, sampling,
reduksi dimensional, feature subset selection, pembuatan fitur, diskretisasi dan
binerisasi, dan transformasi variabel. Pendekatan-pendekatan ini dapat dikelompokan
ke dalam dua kategori, yaitu seleksi objek-objek data dan atribut-atribut untuk
analisis atau pembuatan/perubahan atribut. Tujuan dari kedua kategori tersebut
adalah untuk meningkatkan analisis data mining terhadap waktu, biaya dan kualitas
2.2.1
Agregasi
Agregasi adalah mengkombinasikan dua atau lebih objek ke dalam sebuah
objek tunggal. Sebagai contoh, data set yang berisi transaksi (objek data) yang
mencatat penjualan produk harian di berbagai lokasi toko (Tabel 2.4). Salah satu cara
untuk meng-agregasi transaksi untuk data set ini adalah mengganti semua transaksi
dari toko-toko dengan sebuah transaksi tunggal. Agregasi ini mengurangi ratusan
atau ribuan transaksi yang terjadi setiap hari pada satu toko tertentu ke transaksi
harian tunggal, dan banyaknya objek data direduksi menjadi banyaknya toko.
STUDY KASUS DAN PENYELESAIAN

A. Permasalahan kasus I:
Suatu perusahaan ingin membangun gudang sebagai tempat menyimpan
sementara hasil produksinya. Ada 3 lokasi yang akan jadi alternatif yaitu
A1=Ngemplak, A2=Kalasan, A3=Kota Gede.
Ada 5 kriteria yang dijadikan acuan dalam pengambilan keputusan :
o C1= jarak dengan pasar terdekat (km)
o C2= kepadatan penduduk di sekitar lokasi (orang/km2)
o C3=jarak dari pabrik (km)
o C4= jarak dengan gudang yang sudah ada (km)
o C5= harga tanah untuk lokasi (x1000 Rp/m2)
Pembahasan :
Rangking Kecocokan
Ranking kecocokan setiap alternatif pada setiap kriteria, dinilai dengan 1
sampai 5, yaitu
o 1 = sangat buruk
o 2 = buruk
o 3 = cukup
o 4 = baik
o 5 = sangat baik
Tabel berikut menunjukkan ranking kecocokan dari setiap alternatif pada
setiap kriteria :
Bobot Preferensi dan Matriks Keputusan

Bobot preferensi untuk setiap kriteria C1, C2, C5 = (5, 3, 4, 4, 2)
Matrik keputusan yang dibentuk dari tabel ranking kecocokan :
4
Langkah hitungan TOPSIS :

1. Rangking tiap alternatif
Rumus
maka :
2. Matriks Keputusan Ternormalisasi Terbobot

Matriks keputusan ternormalisasi terbobot didapatkan dari perkalian
matriks R dengan bobot preferensi (5, 3, 4, 4, 2) didapat :
3. Solusi Ideal Positif :

y1+= max {2.8385 ; 2.1213; 3.5355}= 3.5355
y2+= max {1.8741; 1.4056; 0.8741}= 1.8741
y3+= max {2.9814; 2.3851; 1.1926}= 2.9814
y4+= max {2.9104; 1.9403; 1.9403}= 2.9104
y5+= min {1.2792; 1.2792; 0.8528}= 0.8528 (karena biaya)

A+ ={3.5355; 1.8741; 2.9814; 2.9104; 0.8528}
Solusi Ideal Negatif :
y1- = min {2.8385 ; 2.1213; 3.5355}= 2.1213
y2- = min {1.8741; 1.4056; 0.8741}= 0.8741
y3- = min {2.9814; 2.3851; 1.1926}= 1.1926
y4- = min {2.9104; 1.9403; 1.9403}= 1.9403
y5- = max {1.2792; 1.2792; 0.8528}= 1.2792 (karena biaya)
A- ={2.1213; 0.8741; 1.1926; 1.9403; 1.2792}
4. Jarak antara Nilai Terbobot Setiap Alternatif
Jarak antara Nilai Terbobot Setiap Alternatif terhadap Solusi Ideal Positif :
maka :
Jarak antara Nilai Terbobot Setiap Alternatif terhadap Solusi Ideal negatif :
maka :
5. Kedekatan setiap alternatif terhadap solusi ideal
Rumus
maka :
V1 = 2 .375
= 0.74207
2.375+0.8255
V2=
1.3055
= 0.3254
1.3055+2.7058
V3 =
0.772
= 0.254
0.772+2.267
Maka solusi yang didapat : dari nilai V (jarak kedekatan setiap alternatif
terhadap solusi ideal) diperoleh nilai V1 memiliki nilai terbesar, sehingga yang
akan dipilih sebagai lokasi untuk mendirikan gudang adalah kota Ngemplak.
B. Permasalahan kasus II:

Misalkan suatu universitas X ingin mengkontrak seorang profesor untuk
memberikan work shop tentang teknologi informasi. Sebuah komite yang
terdiri dari tiga orang pengambil keputusan (expert) masing-masing E1, E2,
E3 telah melakukan evaluasi awal, dan didapat tiga orang profesor A1, A2,
dan A3 untuk dimajukan pada tahap seleksi selanjutnya, guna dipilih satu
diantara mereka yang akan ditetapkan sebagai pemateri work shop di
universitas tersebut. Kriteria yang diajukan terhadap ketiga kandidat tersebut
adalah :
a. Honor pemateri (C1)
b. Hasil penelitian dan publikasi (C2)
c. Keahlian dan pengalaman mengajar (C3)
d. Pengalaman praktis dalam industri teknologi informasi (C4)
e. Kedisiplinan dalam mengajar (C5)
Ketiga orang pengambil keputusan menetapkan nilai standar untuk masingmasing kriteria sebagai berikut : Tabel 1. Nilai standar yang ditetapkan oleh
tiga pengambil keputusan Kriteria Pengambil Keputusan :
E1
E2
E3
C1
0.87
0.97
0.97
C2
0.87
0.87
0.87
C3
0.7
0.87
0.7
C4
0.7
0.7
0.7
C5
0.87
0.87
0.87
Sedangkan dari hasil evaluasi tim pengambil keputusan terhadap ketiga
kandidat A1, A2, dan A3 didapat data sebagai berikut :
Tabel 2. Data nilai kandidat-kandidat untuk setiap kriterianya Kriteria

Kandidat pengambil keputusan :
C1
C2
C3
C4
C5
E1
E2
E3
A1
6 juta
8 juta
7 juta
A2
3 juta
4 juta
5 juta
A3
4 juta
5 juta
6 juta
A1
8.7
9.7
A2
9.7
9.7
9.7
A3
8.7
9.7
A1
8.7
8.7
A2
8.7
8.7
8.7
A3
8.7
9.7
A1
9.7
8.7
8.7
A2
8.7
8.7
8.7
A3
8.7
9.7
9.7
A1
A2
8.7
8.7
A3
8.7
8.7
8.7
Dari ketiga kandidat tersebut, alternatif manakah yang sebaiknya diambil untuk ditetapkan
menjadi pemateri work shop teknologi informasi di universitas tersebut?
Berikut, adalah langkah-langkah untuk menentukan jawaban atas permasalahan di atas.
Berdasarkan Tabel 1, maka dapat ditentukan bobot untuk setiap kriteria, sebagai berikut :
Tabel 3. Bobot untuk setiap kriteria :
C1
C2
C3
C4
C5
Wj
0.937
0.87
0.757
0.7
0.87
dan berdasarkan tabel 2, dapat dikontruksi matriks keputusan berupa tabel berikut :
Tabel 4. Matriks Keputusan

Kandidat Kriteria :
C1
C2
C3
C4
C5
A1
7.8
7.467
9.033
A2
9.7
8.7
8.7
7.467
A3
5
8.467
8.467
9.367
Kemudian lakukan normalisasi matriks keputusan pada Tabel 4, dan didapat :
8.7
1. Rangking tiap alternatif

Kandidat Kriteria : Tabel 5. Normalisasi Matriks Keputusan
C1
C2
C3
C4
C5
A1
0.855
0.5181
0.5239
0.577
0.399
A2
0.4886
0.6443
0.6104
0.5557
0.597
A3
0.6108
0.5624
0.594
0.598
0.6956
2. Matriks Keputusan Ternormalisasi Terbobot

Tabel 6. Matriks Keputusan ternormalisasi terbobot
C1
C2
C3
C4
C5
v1j
0.8011
0.4507
0.3965
0.4039
0.3471
v2j
0.4578
0.5605
0.462
0.3885
0.51939
v3j
0.5723
0.4892
0.4496
0.4186
Berdasarkan matriks keputusan bobot normal, maka didapatkan :
3. Solusi Ideal Positif :

y1+= min {0.8011; 0.4578; 0.5723}= 0.4578 (karena biaya)
y2+= max {0.4507; 0.5605; 0.4892}= 0.5605
0.6051
y3+= max {0.3965; 0.462; 0.4496}= 0.462

y4+= max {0.4039; 0.3885; 0.4186}= 0.4186
y5+= max {0.3471; 0.51939; 0.6051}= 0.6051
A+ ={0.4578; 0.5605; 0.462; 0.4186; 0.6051}
Solusi Ideal negatif :
y1- = max {0.8011; 0.4578; 0.5723}= 0.8011 (karena biaya)
y2- = min {0.4507; 0.5605; 0.4892}= 0.4507
y3- = min {0.3965; 0.462; 0.4496}= 0.3965
y4- = min {0.4039; 0.3885; 0.4186}= 0.3885
y5- = min {0.3471; 0.51939; 0.6051}= 0.3471
A- ={0.8011; 0.4507; 0.3965; 0.3885; 0.3471}
4. Jarak antara Nilai Terbobot Setiap Alternatif

Jarak dengan solusi ideal positif (D+) adalah :
D1+ =
0.1178 + 0.012 + 0.004 + 0.00021 + 0.0665
= 0.448
D2+ = 0 + 0 + 0 + 0.0009 + 0.0073 = 0.09055

D3+ = 0.013 + 0.005 + 0.00015 + 0 + 0 = 0.134
dan jarak dengan solusi ideal negatif (D-) sebagai berikut :
D1- =
D2- =
0 + 0 + 0 + 0.00023 + 0 = 0.01516
0.1178 + 0.012 + 0,0042 + 0 + 0.029 = 0.4037
D3- = 0.0523 + 0.0014 + 0.0028 + 0.0009 + 0,066 = 0.2395

5. Kedekatan setiap alternatif terhadap solusi ideal (Vi), adalah
V1 = 0.01516
= 0.01516
0.01516 + 0.448
V2=
0.4037
= 0.8167
0.4037 + 0.09055
V3 =
0.2395
= 0.6412
0.2395 + 0.134
Sehingga didapat tingkat ranking dari ketiga alternatif adalah V2, sehingga dipilih professor
A2 sebagai kandidat terbaik.
Bab III
KESIMPULAN
Sebagai suatu usaha untuk mendapatkan solusi terbaik atas permasalahan multiple criteria
decision making dapat digunakan Technique for Order Performance by Similarity to Ideal
Solution, yang dalam implementasinya akan memunculkan beberapa alternatif solusi
berdasarkan hasil ranking kumulatif, yang kemudian dapat dipilih satu solusi tertentu,
berdasarkan kriteria tambahan dari pemegang kebijakan (pimpinan). Kemudian, beberapa
alternatif solusi tersebut dapat dijadikan referensi tim pengambil keputusan untuk diajukan
kepada pimpinan mereka, sehingga pimpinan mereka dapat memilih satu solusi dari beberapa
alternatif solusi yang ada, dan diharapkan dapat diambil keputusan terbaik yang
menguntungkan.
DAFTAR PUSTAKA
Kusumadewi, Sri, dkk. 2006. Fuzzy Multi Attribute Decision Making. Yogyakarta:
Graha Ilmu.
http://student.eepis-its.edu/~giant/DB2/db2_6TOPSIS.pdf (diakses 11 Mei 2011, 2011
jam 6:11)
http://w4hyuwidodo.wordpress.com/2010/07/07/sistem-pendukung-keputusandengan-methode-topsis/ (diakses 11 Mei 2011, 2011 jam 6:15)
http://nzircui.wordpress.com/category/topsis/ (diakses 11 Mei 2011, 2011 jam 6:20)

Makalah DM

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Makalah DM

Diunggah oleh

Hak Cipta:

Format Tersedia

Pemrosesan Data Pembukuan Transaksi Penjualan Pada Toko

Ungu Komputer dengan Metode Data Mining

M. Nizar Ulil Albab

Adi Surya Pambudi

Universitas Muria Kudus

bisa dalam bentuk flat

Atribut dan Pengukuran

Tipe tipe Dataset

Gambar 2.2 Variasi yang berbeda dari data record

STUDY KASUS DAN PENYELESAIAN

Bobot Preferensi dan Matriks Keputusan

Langkah hitungan TOPSIS :

2. Matriks Keputusan Ternormalisasi Terbobot

3. Solusi Ideal Positif :

y5+= min {1.2792; 1.2792; 0.8528}= 0.8528 (karena biaya)

5. Kedekatan setiap alternatif terhadap solusi ideal

B. Permasalahan kasus II:

Tabel 2. Data nilai kandidat-kandidat untuk setiap kriterianya Kriteria

Tabel 4. Matriks Keputusan

1. Rangking tiap alternatif

2. Matriks Keputusan Ternormalisasi Terbobot

3. Solusi Ideal Positif :

y3+= max {0.3965; 0.462; 0.4496}= 0.462

4. Jarak antara Nilai Terbobot Setiap Alternatif

0.1178 + 0.012 + 0.004 + 0.00021 + 0.0665

D2+ = 0 + 0 + 0 + 0.0009 + 0.0073 = 0.09055

D3- = 0.0523 + 0.0014 + 0.0028 + 0.0009 + 0,066 = 0.2395

Anda mungkin juga menyukai