Anda di halaman 1dari 4

TENTANG MISSING VALUE

A. Pengertian Missing Value


Missing Value sendiri dapat diartikan sebuah kondisi terdapat nilai kosong atau nilai tidak
lengkap dalam sebuah data. Missing Value dapat menyebabkan tingkat keakuratan
suatu data menjadi berkurang dan menurunnya kualitas data pada saat dilakukan
pengolahan selanjutnya.

B. Menangani Missing Value


Missing data bisa diatasi dengan tiga teknik/cara yaitu :
1. Listwise deletion : mengatasi missing data dengan menghapus observasi yang
terdapat missing data. Penggunaan cara ini dirasa kurang efektif karena dapat
menghilangkan informasi penting dalam data yang dihilangkan.
2. Pairwise deletion : mengatasi missing data dengan menghapus nilai yang
mengandung missing data, sehingga pairwise deletion hanya melakukan analisis pada
data yang tersedia.
3. Imputasi (Imputation) : mengatasi missing data dengan mengisi nilai yang hilang
dengan nilai yang mungkin berdasarkan informasi yang didapat dari nilai-nilai yang
diketahui.

C. Jenis Imputasi Missing Value


1. Imputasi secara manual
Secara umum, metode ini memakan waktu dan hampir tidak mungkin dilakukan
apabila dataset-nya berukuran besar dengan banyak missing value.
2. Imputasi dengan konstanta global
Metode ini mengganti semua missing value dengan konstanta tertentu yang sama. Jika
menggunakan metode ini, algoritma mining akan salah menduga bahwa data-data
membentuk suatu konsep yang menarik karena memiliki nilai yang sama. Sehingga
walaupun metode ini sederhana, tetapi hasilnya tidak bagus.
3. Imputasi dengan metode konvensional
Metode ini mengganti semua missing value dengan nilai ukuran kecenderungan pusat
atribut masing-masing missing value. Yaitu nilai mean untuk tipe data atribut kontinu
dan nilai modus untuk tipe data atribut kategorikal.
4. Imputasi dengan suatu model prediksi
Metode ini menggunakan model prediksi untuk mencari nilai pengganti untuk
missing value. Contohnya adalah model regresi, induksi pohon keputusan dan
Bayesian inference

D. Menangani Missing Value dengan model prediksi K-NNI (K Nearest


Neigboar Imputation)

Keunggulan dari imputasi k-NN:


1) Dapat digunakan untuk memprediksi dua tipe data yaitu data diskret dan kontinyu.
Imputasi data diskret menggunakan nilai modus dan pada data kontinyu
menggunakan nilai mean.
2) Pada setiap item yang mengalami missing value tidak diperlukan adanya
pembentukan model prediksi.

Kelemahan dari imputasi k-NN :


1) Ketika melakukan pengamatan untuk mencari nilai yang paling sesuai terhadap
missing value, algoritma imputasi k-NN akan melakukan pencarian di semua dataset
sehingga membutuhkan waktu yang lama jika dataset-nya besar

Rumus :
Penanganan missing data dengan KNN diawali dengan menentukan sejumlah tetangga
terdekat atau observasi terdekat yang disimbolkan dengan K, kemudian menghitung jarak terkecil
dari setiap observasi yang tidak mengandung missing data. Langkah-langkah imputasi missing
data dengan metode KNN adalah sebagai berikut :

1. Menentukan nilai k, yaitu jumlah observasi terdekat yang diinginkan.


2. Menghitung jarak euclidian antara observasi target dengan observasi yang tidak
memuat nilai missing, dengan formula:

s
d ( x , y )= √∑
j=1
¿¿¿
dimana:
x = vektor observasi target dengan variabel sebanyak s variabel, x=¿
y = vektor observasi yang tidak memuat nilai missing dengan variable sebanyak s
variabel, y=¿
d(x,y) = jarak antara x dan y
xj = nilai variable ke-j pada x
yi = nilai variable ke-j pada y
j = 1,2,…,s
3. Mencari k observasi yang memiliki nilai d(x,y) minimum
4. Melakukan imputasi missing data dengan menggunakan prosedur
weighted mean imputation, dengan formula:

K
x j=
^
1
W √∑ k=1
(w k y k j )

Dimana :
xj
^ = nilai imputasi
yk j = nilai variable ke-j pada observasi
Ke-k, k = 1,2…,K
1
wk = bobot observasi ke-k, W k = ( x , k )
d

K
W= √ ∑ wk
k=1
E. R K-NN
g

ARTIKEL I

Judul Artikel :
Penulis Artikel : 1. Margaretha
2.
Metode yang Digunakan : - Logistic Reggression
Data Experiment : 1.
Hasil Experiment :
Kelebihan dan Kekurangan : Kelebihan :
1. Regres
2.
Kesimpulan :
Sumber :

Anda mungkin juga menyukai