NIM: 042111233054
Data examination atau pemeriksaan data adalah kegiatan mengevaluasi data yang sudah
tersedia, di mana peneliti dapat meneliti data yang hilang, mengidentifikasi outlier, dan
melakukan tes untuk asumsi yang mendasari sebagian besar teknik multivariat.
A. Missing data
Data yang hilang merupakan kesalahan yang disebabkan oleh kesalahan dalam pengumpulan
data atau dari adanya penghilangan jawaban oleh responden. Missing data mengakibatkan
pengurangan ukuran sampel yang tersedia untuk analisis. Maka, untuk mengatasi missing
data, peneliti bukan hanya memperbaiki data yang hilang, tetapi juga memahami proses data
yang hilang dan dampaknya. Peneliti juga harus melakukan proses four-step, yakni:
- Step one: Menentukan jenis data yang hilang, apakah data yang hilang adalah bagian
dari desain penelitian dan di bawah kendali peneliti atau tidak.
- Step two: Menentukan luas data yang hilang. Dalam proses ini, peneliti dapat
menentukan apakah tingkat atau jumlah data yang hilang cukup rendah untuk tidak
mempengaruhi hasil, meskipun beroperasi dengan cara yang tidak acak.
- Step three: Diagnosa keacakan proses data yang hilang, apakah keacakan tergolong
MAR (Missing at Random) atau MCAR (Missing Completely at Random).
- Step four: Pilih metode amputasi. Amputasi adalah proses memperkirakan nilai yang
hilang berdasarkan nilai valid dari variabel lain dan/atau kasus dalam sampel.
Terdapat empat metode yang dapat dilakukan, yakni the complete case method, the
all-available information, mean substitution, dan EM approaches.
B. Outliers
Outlier merupakan data yang memiliki karakteristik yang berbeda jauh dari
observasi-observasi lainnya dan muncul dalam bentuk nilai ekstrim baik untuk variabel
tunggal atau variabel kombinasi. Outliers tidak dapat dikategorikan sebagai menguntungkan
atau bermasalah, tetapi harus dilihat dalam konteks analisis dan harus dievaluasi. Ketika
menguntungkan, outlier dapat menunjukkan karakteristik populasi. Sebaliknya, outlier yang
bermasalah tidak mewakili populasi dan dapat mendistorsi uji statistik. Outlier dikategorikan
menjadi:
1. First class, muncul dari kesalahan prosedur seperti kesalahan entri data atau kesalahan
dalam pengkodean.
2. Second class, terjadi sebagai akibat dari peristiwa luar biasa.
3. Third class, terdiri dari pengamatan luar biasa di mana peneliti tidak dimiliki
penjelasan atas kejadian luar biasa tersebut.
4. Fourth class, memiliki kombinasi nilai yang unik di seluruh variabel.