Anda di halaman 1dari 1

Outliers adalah data yang menyimpang terlalu jauh dari data yang lainnya dalam suatu

rangkaian data. Adanya data outliers ini akan membuat analisis terhadap serangkaian data
menjadi bias, atau tidak mencerminkan fenomena yang sebenarnya. Istilah outliers juga
sering dikaitkan dengan nilai esktrem, baik ekstrem besar maupun ekstrem kecil. Sebagai
ilustrasi, jika ada empat mahasiswa, mahasiswa pertama mempunyai uang saku per bulan Rp.
500 ribu, mahasiswa kedua Rp. 600 ribu, mahasiswa ketiga Rp. 700 ribu, dan mahasiswa
keempat karena merupakan anak orang kaya, mempunyai uang saku per bulan sampai dengan
Rp. 5 juta. Secara sekilas tampak bahwa nilai 5 juta relatif jauh dibandingkan uang saku
ketiga mahasiswa yang lain.
Kalau kita rata-ratakan uang saku keempat mahasiswa tersebut, maka rata-ratanya adalah
sebesar (500 ribu + 600 ribu + 700 ribu + 5 juta)/4= 6,8 juta/4 = 1,7 juta. Tiga mahasiswa
yang lain tentunya keberatan jika dinyatakan bahwa rata-rata uang saku mereka adalah Rp.
1,7 juta per bulan karena jauh sekali dari nilai yang sebenarnya. Contoh lain misalnya kita
ingin merata-ratakan kekayaan seorang PNS usia 30 tahunan, dengan memasukkan seorang
PNS yang kebetulan mempunyai kekayaan sekitar Rp. 25 Milliarhe he he he
Penangangan Data Outliers
Harus kita apakah data outliers? Apakah harus kita keluarkan? Atau ada treatment yang lain.
Pengeluaran data outliers memang tidak disalahkan, akan tetapi harus dikaji dulu, apakah
data tersebut merupakan bagian dari populasi atau bukan? Sebagai contoh, seorang PNS
dengan kekayaan dalam contoh di atas, sebaiknya dikeluarkan dari model penelitian karena
tidak mewakili fenomena PNS yang sebenarnya (jangan-jangan memang begitu ya
fenomenanya? He he). Dalam contoh keempat mahasiswa di atas, jika tujuannya adalah untuk
melihat apakah perlu menaikkan SPP atau tidak, ya sebaiknya dikeluarkan karena tentunya 3
orang yang mempunyai uang saku di bawah 1 juga akan keberatan. Akan tetapi dalam kasus
yang lain, data tersebut boleh saja dipergunakan jika memang mewakili kondisi subjek
penelitian. Misalnya, penelitian perusahaan selama krisis di mana hampir semua perusahaan
mengalami kerugian. Akan tetapi ada satu atau beberapa perusahaan yang dengan jitu
melakukan strategi sehingga menghasilkan profit. Nah, hasil penelitian akan lebih menarik
jika data outliers tidak dikeluarkan. Dalam hal ini, peneliti bahkan dapat mengkaji strategi
apa yang digunakan sehingga dapat dijadikan rujukan bagi perusahaan yang lain.
Dalam statistik, data outliers sering menimbulkan hasil yang bias. Oleh karena itu, harus
diberikan perlakuan khusus. Pengeluaran data outliers atau penggunaan data outliers tidak
semata-mata merujuk kepada statistiknya, tetapi juga adjustment dari peneliti. Jika memang
data outliers tersebut tidak dapat dikeluarkan karena masih merupakan fenomena subjek
penelitian ya sebaiknya tetap dipergunakan. Agar efek outliers dapat direduksi, maka data
dilakukan transformasi data, misalnya dengan logaritman natural, atau akar kuadrat. Atau
juga bisa menggunakan alat statistik non parametrik, sehingga data outliers tidak akan
nampak sebagai outliers karena data dianggap berskala ordinal. Sebagai contoh, keempat
mahasiswa tadi diubah menjadi data ordinal, sehingga mahasiswa dengan uang saku Rp. 500
ribu menjadi 1, uang saku Rp. 600 ribu menjadi 2, uang saku Rp. 700 ribu menjadi 3, dan
yang paling besar menjadi 4. Ini hanya contoh saja, dan sebagai informasi data dalam bentuk
ordinal tidak dapat dirata-ratakan, akan tetapi dapat digunakan untuk mencari korelasi dengan
variabel lain.
a

Anda mungkin juga menyukai