Anda di halaman 1dari 1

Cara mendeteksi outlier : Metode yang digunakan dalam mendeteksi outlier terbagi menjadi univariate, bivariate, dan multivariat.

Peneliti harus membagi berdasarkan penyimpanan atau pengeluaran dari setiap outlier, tidak hanya menduga dari karakteristik outlier, tapi juga dari tujuan analisis. Metode dalam mendeteksi outlier : Outlier dapat diidentifikasikan menjadi univariat, bivariate, dan multivariat berdasarkan jumlah variabel (karakteristik) yang ada. Peneliti sebaiknya memanfaatkan banyak kemungkinan dari pandangan ini. Mendeteksi univariate : Mendeteksi outlier univariate dengan cara melihat distribusi dari pengamatan untuk setiap variabel dalam analisis dan memilih outlier berdasarkan nilai yang keluar dari batas distribusi. Pendekatan pertama mengkonversi nilai data ke nilai standar, yaitu mean 0 dan standar deviasi 1. Karena nilai ini adalah sebuah format yang standard, perbandingan antar variabel dapat dibuat dengan mudah. Mendeteksi bivariate : Apabila terdapat pasangan variabel, digunakan scatter plot. Suatu kasus yang terdapat tanda yang keluar dari range pengamatan yang lain akan terlihat di titik-titik pada scatter plot. Range yang terdapat pada scatter plot berupa bentuk ellips yang merepresentasikan batas-batas interval distribusi normal bivariate dengan tingkat kepercayaan 90% atau 95%. Mendeteksi Multivariat : Metode dalam mendeteksi outlier multivariate tidak dapat menggunakan metode bivariate karena terdapat beberapa alasan. Mendeteksi outlier multivariat ini bisa menggunakan ukuran Mahalanobis D2, sebuah taksiran multivariat dari setiap pengamatan dari sebuah variabel. Metode ini mengukur jarak setiap pengamatan dalam multidimensi dari pusat rata-rata dari semua pengamatan, menyediakan nilai tunggal dari setiap pengamatan, bukan merupakan berapa banyak variabel yang ada. Metode ini cocok untuk memeriksa variate yang lengkap, seperti variabel independen dalam regresi atau variabel dalam analisis faktor. Nilai ambang batas untuk ukuran D2 /df harus konservatif (.005 atau .001), sehingga nilai 2,5 (sampel kecil) versus 3 atau 4 dalam sampel yang lebih besar.

Anda mungkin juga menyukai