Siap 16
Siap 16
SIAP 16
Yuandri Trisaputra Oktarina Safar Nida
Y O G YA K A R TA , 2 7 O K T O B E R 2 0 1 5
CONTENT
1• Latar Belakang
2• Metode
3• Tujuan dan Manfaat
4• Teknik Praprosesing
5• Teknik Data Mining
6• Tools
7• Algoritme
8• Model
9
• Simpulan
SIAP 16
L ATAR
BEL AK ANG
SIAP 16
Latar Belakang
Fitur
Pelanggan
VAR_0001
VAR_0002
Klasifikasi
VAR_0003 dan
Pendugaan
VAR_0004 Peluang
.
. Respons Ya (1)
Pelanggan . Atau
. Respons Tidak (0)
VAR_1932
VAR_1933
VAR_1934
SIAP 16
METODE
SIAP 16
Metode
Praproses Data
- Split Data Klasifikasi
- Sampling - Pohon Keputusan Data Test
- Pemilihan Variabel
Data Set
Pendugaan Peluang
- Regresi Logistik
Data Train
Predicted
Model
SIAP 16
TUJUAN DAN
M A N FA AT
SIAP 16
Tujuan dan Manfaat
M
Membantu perusahan agar mudah dan cepat untuk
menentukan pelanggan yang merespon penawaran
SIAP 16
P RA P ROS ES
SIAP 16
Praproses
Split Data
• Dari 144673 baris pada Data Set dibagi menjadi beberapa bagian dengan masing-
masing 10000 baris.
• Setiap bagian file dilakukan penyesuaian format csv.
• Mengatasi missing value (NA, 9999, -1, -9999)
Sampling
• Untuk mengurangi dimensi pelanggan dilakukan simple random sampling dengan
𝑁
e = 0.05, menghasilkan 399 observasi dengan metode slovini (𝑛 = 1+(𝑁𝑒 2 )).
Pemilihan Variabel
• Untuk mengurangi dimensi fitur yang akan digunakan metode subSetEval
dengan pencarian bestFirst, menghasilkan 24 fitur. Dari 24 fitur di reduksi
kembali menjadi 20 fitur dengan melakukan observasi statistik deskriptif dari
setiap variabel.
SIAP 16
TEKNIK DATA
MINING
SIAP 16
Teknik Data Mining
KLASIFIKASI
• Klasifikasi data baru dari classifier yang dibentuk dari data latih
SIAP 16
A LG ORITME
SIAP 16
Algoritme
SIAP 16
TOOLS
SIAP 16
Tools
SIAP 16
MOD EL
SIAP 16
Model
DATA TRAIN
Data train, hasil dari pra proses data digunakan untuk membuat classifier dan model
pendugaan peluang. Data train terdiri atas 399 observasi dan 21 Fitur. Fitur tersebut, yaitu
VAR_0034, VAR_0060, VAR_0062, VAR_0212, VAR_0331, VAR_0362, VAR_0503, VAR_0542,
VAR_0624, VAR_0758, VAR_0807, VAR_0915, VAR_0947, VAR_1015, VAR_1020, VAR_1023,
VAR_1027,VAR_1032,VAR_1385,VAR_1502.
SIAP 16
Model
CLASSIFIER J48
Proses klasifikasi menggunakan algoritma pohon
keputusan J48 dan dijalankan pada software Weka.
Parameter yang digunakan pada Weka yaitu faktor
kepercayaan / confidenceFactor = 0.05 dan
minimal banyaknya objek / minNumObj = 2.
dengan melakukan test cross validation fold = 10.
SIAP 16
Model
CONFUSION MATRIKS
Dimana:
A=0
B=1
SIAP 16
Model
SIAP 16
Model
ATURAN KEPUTUSAN
• Jika VAR_1027 <= 0 dan VAR_0034 <= 1, maka diklasifikasikan sebagai kelas A
• Jika VAR_1027 <= 0 dan VAR_0034 >1 dan VAR_0758 > 4, maka diklasifikasikan sebagai kelas B
• Jika VAR_1027 <= 0 dan VAR_1015 <= 1 dan VAR_0758 <= 4, maka diklasifikasikan sebagai kelas A
• Jika VAR_1027 <= 0 dan VAR_1015 <= 1 dan VAR_0758 > 4, maka diklasifikasikan sebagai kelas B
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_1015 <= 0, A
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_1015 > 0 dan VAR_0915>11, B
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_1015 > 0 dan VAR_0915<=11 dan VAR_0947 = T, B
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_1015 > 0 dan VAR_0915<=11 dan VAR_0947 = F dan
VAR_1027>1, B
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_1015 > 0 dan VAR_0915<=11 dan VAR_0947 = F dan
VAR_1027<=1, A
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_0202>51529101604, B
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_0202<=51529101604 dan VAR_1305<=35, B
• Jika VAR_1027 > 0 dan VAR_503=F dan VAR_0202<=51529101604 dan VAR_1305>35, A
SIAP 16
Model
SIAP 16
Model
Classification Table
Predicted
target
Percentage
Observed 0 1 Correct
SIAP 16
THANK YOU
SIAP 16