Rumus :
Penanganan missing data dengan KNN diawali dengan menentukan sejumlah tetangga
terdekat atau observasi terdekat yang disimbolkan dengan K, kemudian menghitung jarak terkecil
dari setiap observasi yang tidak mengandung missing data. Langkah-langkah imputasi missing
data dengan metode KNN adalah sebagai berikut :
s
d ( x , y )= √∑
j=1
¿¿¿
dimana:
x = vektor observasi target dengan variabel sebanyak s variabel, x=¿
y = vektor observasi yang tidak memuat nilai missing dengan variable sebanyak s
variabel, y=¿
d(x,y) = jarak antara x dan y
xj = nilai variable ke-j pada x
yi = nilai variable ke-j pada y
j = 1,2,…,s
3. Mencari k observasi yang memiliki nilai d(x,y) minimum
4. Melakukan imputasi missing data dengan menggunakan prosedur
weighted mean imputation, dengan formula:
K
x j=
^
1
W √∑ k=1
(w k y k j )
Dimana :
xj
^ = nilai imputasi
yk j = nilai variable ke-j pada observasi
Ke-k, k = 1,2…,K
1
wk = bobot observasi ke-k, W k = ( x , k )
d
K
W= √ ∑ wk
k=1
E. R K-NN
g
ARTIKEL I
Judul Artikel :
Penulis Artikel : 1. Margaretha
2.
Metode yang Digunakan : - Logistic Reggression
Data Experiment : 1.
Hasil Experiment :
Kelebihan dan Kekurangan : Kelebihan :
1. Regres
2.
Kesimpulan :
Sumber :