Anda di halaman 1dari 4

Judul

Imputasi Missing data Menggunakan Algoritma Pengelompokan Data K-Harmonic Means

Penulis

Abidatul Izzah, Nur Hayatin

Sumber

Seminar Nasional Matematika dan Aplikasinya 2013

Permasalahan

Permasalahan ini disebabkan oleh tidak adanya data di lapangan atau adanya kesalahan dalam
pencacahan. Metode yang sering digunakan untuk mengatasi permasalahan ini adalah dengan
mengisi nilai dari rataan atribut yang ada atau menghilangkan instance yang mengandung
missing data. Penggunaan metode ini dirasa kurang efektif karena dapat menghilangkan
informasi penting yang mungkin terdapat pada data yang dibuang.

Tujuan

Penelitian ini bertujuan untuk mengimputasi nilai yang hilang pada suatu data menggunakan
K-Harmonic Means. Algoritma KHM digunakan untuk menentukan titik centroid yang
digunakan untuk mengestimasi nilai missing data. Data yang digunakan dalam penelitian ini
adalah lima dataset yang diperoleh dari UCI Machine Learning. Dengan menggunakan
pendekatan metode ini diharapkan hasil imputasi missing data yang diperoleh memiliki Mean
Square Error (MSE) sekecil mungkin.

Algoritma

Metode pengelompokan data dengan K-Harmonic Means (KHM)

(Gambar: Diagram Prosedur KHM)


Data

Data yang digunakan dalam uji coba ini adalah dataset iris, wine, dan glass yang diambil dai
UCI Machine Learning Repository. Dataset tersebut merupakan dataset yang lengkap yang
tidak terdapat missing value pada data.

(Gambar: Dataset)

Uji coba

Pengujian dilakukan pada beberapa metode imputasi untuk menganalisa performa dari metode
imputasi. Pada penelitian ini terdapat 4 metode yang akan diujicobakan yaitu KHM, KM,
Mean, dan Median.

(Gambar: Bagan Penelitian)


Hasil uji coba

Hasil Uji statistik


Jika diambil nilai α = 0.05, maka hal ini menunjukkan bahwa metode imputasi KHM
menunjukkan hasil yang baik secara signifikan jika dibandingkan dengan Mean dan Median,
namun tidak untuk KM karena nilai yang ditunjukkan kurang dari nilai batas α.

Kesimpulan

Jika diambil nilai α = 0.05, maka hal ini menunjukkan bahwa metode imputasi KHM
menunjukkan hasil yang baik secara signifikan jika dibandingkan dengan Mean dan Median,
namun tidak untuk KM karena nilai yang ditunjukkan kurang dari nilai batas α. Dari hasil yang
telah didapatkan, dapat disimpulkan bahwa secara ratarata KHM mampu memberikan nilai
akurasi yang lebih baik jika dibandingkan dengan metode KM namun perbedaan ini tidak
terlihat signifikan

Anda mungkin juga menyukai