Departemen Statistika
Fakultas MIPA
IPB University
2020
Pengantar Regresi
S 3.90390
Consumption
15
peubah numerik yang dapat mengambil nilai berapapun.
10
0
5 10 15 20 25
Income
NOT
DEFAULT
DEFAULT
1.0
0.8
tidak sesuai
dengan perilaku
X
0.6
Purchased
0.4 peubah respon
Respon: 0.2
- Menerima (1)
Y 0.0
- Menolak (0)
-0.2
20 30 40 50 60
Age
Profil:
Y awal
Jenis kelamin
0 1
Umur
Pendapatan X
Pendidikan Y sebagai
Domisili peluang
{P(Y = 1)} 0 1
?
Y* (-,)
-
Transformasi
o Logit() = Log(/(1- )) = X +
o Y* = X +
Umur Y* Y
60 3.29 .964 1
skor di
= P(Y=1)
sebaran
peluang membeli
logistik
● Odds
akanmeningkatsecarasebesaruntuksetiapkenaikan 1
unit X
● : odds ratio (OR)
60 3.29 .964 1
N = FN + TP + TN + FP
Overall correct classification = (TP + TN) / N
prediksi tidak membeli prediksi membeli Sensitivity = TP / (TP + FN)
Specificity = TN / (TN + FP)
library("openxlsx")
setwd("D:/FMA/2020/Online/Logistik")
Mydt <- read.xlsx("Social_Network_Ads.xlsx")
Suatu studi dilakukan untuk mengkaji keefektifan iklan lewat media sosial. Sebagai respon
adalah status pembelian produk yang diiklankan (Purchased: (1) membeli, (0) tidak membeli).
Sebagai peubah penjelas adalah beberapa profil konsumen, yaitu:
o Jenis kelamin (Gender: Male-Female)
o Umur (Umur dalam tahun)
o Pendapatan (EstimatedSalary dalam ribu rupiah)
# 2.Tabulasi Gender
table(Mydt$Gender)
table(Mydt$Gender)/nrow(Mydt)*100
# 3. Tab Purchased
table(Mydt$Purchased)
table(Mydt$Purchased)/nrow(Mydt)*100
0 1
257 143
> table(Mydt$Purchased)/nrow(Mydt)*100
0 1
64.25 35.75
60
15000
50
Estimated Salary
10000
Age
40
30
5000
20
0 1 0 1
Purchased Purchased
0 1
Female 127 77
Male 130 66
Membentuk data
training dengan
proporsi purchased
class yang seimbang
Model
Ukuran
kecocokan
model
Coefficients :
P-value
perubahan log
odds
peubah respon
untuk kenaikan
1 satuan
peubah
penjelas
plot(Tr.dt$Age,pdc.train)
plot(Tr.dt$EstimatedSalary,pdc.train)
library(caret)
confusionMatrix(klas.test, act.test,positive="Tertarik")
Reference
Prediction Tidak Tertarik
Tidak 111 2
Tertarik 18 13
Accuracy : 0.8611
95% CI : (0.7937, 0.9131)
No Information Rate : 0.8958
P-Value [Acc > NIR] : 0.9283843
Kappa : 0.4942
Mcnemar's Test P-Value : 0.0007962
Sensitivity : 0.86667
Specificity : 0.86047
Pos Pred Value : 0.41935
Neg Pred Value : 0.98230
Prevalence : 0.10417
Detection Rate : 0.09028
Detection Prevalence : 0.21528
Balanced Accuracy : 0.86357
> confusionMatrix(klas06.test,
act.test,positive="Tertarik")
Confusion Matrix and Statistics
Reference
Prediction Tidak Tertarik
Tidak 120 4
Tertarik 9 11
Accuracy : 0.9097
95% CI : (0.8506, 0.9511)
No Information Rate : 0.8958
P-Value [Acc > NIR] : 0.3526
Kappa : 0.5784
Mcnemar's Test P-Value : 0.2673
Sensitivity : 0.73333
Specificity : 0.93023
Pos Pred Value : 0.55000
Neg Pred Value : 0.96774
Prevalence : 0.10417
Detection Rate : 0.07639
Detection Prevalence : 0.13889
Balanced Accuracy : 0.83178
31