Anda di halaman 1dari 7

LAPORAN TUGAS 2

DATA MINING

NAMA : FERIAL WILLY S


NIM

: 1008107020050

JURUSAN INFORMATIKA
FAKULTAS MIPA
UNIVERSITAS SYIAH KUALA

BREAST CANCER WISCONSIN (DIAGNOSTIC) DATASET (WDBC)


Langkah Langkah Mengubah Dataset WDBC

Pertama- tama download WEKA SOFTWARE

Kemudian buka link WDBC download data folder

Setelah itu download wdbc.data simpan dengan format .txt

Kemudian urutkan data wdbc sesuai dengan soal

Yang pertama hilangkan atribut ID sehingga tidak menjadi atribut dalam file ARFF
(dalam dataset asli berada pada kolom 1) sehingga jumlah attribute menjadi 31

Kemudian letakkan class label (M atau B) pada kolom terakhir

Susun atribut dalam file ARFF sesuai urutan atribut pada data asli, tetapi dalam file ARFF
attribut ID dihilangkan dan atribut class label berada pada kolom terakhir.

Dalam mengubah data file ke dalam arff saya langsung menggunakan terminal dengan sintak
sebagai berikut : cat wdbc.data.txt | awk -F ',' '{print $3 ", " $4 ", " $5 ", " $6 ", " $7 ", " $8 ",
" $9 ", " $10 ", " $11 ", " $12 ", " $13 ", " $14 ", " $15 ", " $16 ", " $17 ", " $18 ", " $19 ", "
$20 ", " $21 ", " $22 ", " $23 ", " $24 ", " $25 ", " $26 ", " $27 ", " $28 ", " $29 ", " $30 ", "
$31 ", " $32 ", " $2 }' > wdbc.data.arff

Setelah tersusun dan data wdbc berubah menjadi file arff masukkan header yang fungsinya
menjelaskan tipe attribute sedangkan bagian data fungsinya meliputi data yang dipisah
dengan koma.

Bagian Header dan Data

ABALONE DATASET
Langkah Langkah Mengubah Dataset Abalone

Pertama tama buka link Abalone Dataset

Kemudian download data folder

Setelah itu download abalone.data

Simpan dalam format.txt

Kemudian urutkan data abalone sesuai dengan soal

Yang pertama letakkan attribute nominal (jenis kelamin atau sex) pada kolom terakhir.

Kemudian dalam data attribute asli, disusun attribute lain dalam file arff dengan urutan :
Whole weight, Shucked weight, Viscera weight, Shell weight, Length, Diameter, Height,
Rings.

Dalam mengubah data file ke dalam arff saya langsung menggunakan terminal dengan sintak
sebagai berikut : cat abalone.data.txt | awk -F ',' '{print $5 ", " $6 ", " $7 ", " $8 ", " $2 ", "
$3 ", " $4 ", " $9 ", " $1 ", " $12 }' > abalone.data.arff

Setelah tersusun dan data abalone berubah menjadi file arff masukkan header yang fungsinya
menjelaskan tipe attribute sedangkan bagian data fungsinya meliputi data yang dipisah
dengan koma.

Bagian Header dan Data

Kesimpulannya: Pada dataset WDBC diproleh hasil diagnosis M dengan jumlah 212 sedangkan B
dengan jumlah 357, dan pada dataset Abalone yang berjenis kelamin laki laki ada 1528, yang
berjenis kelamin wanita ada 1307, sedangkan yang berjenis kelamin ganda ada 1342.

Anda mungkin juga menyukai