Anda di halaman 1dari 8

Cara Mengatasi Outlier dengan SPSS

Setelah kita belajar bersama tentang outlier, maka selanjutnya dalam artikel ini kita akan
membahas bagaimana caranya mengatasi outlier dengan SPSS. Jika para pembaca sekalian
sudah mempelajari artikel kami tentang outlier, maka kami anggap anda semua sudah paham
alasan perlunya outlier ini di atasi. Bagaimana cara mengatasi outlier? Bagaimana cara
mengatasi outlier dengan SPSS? baik univariat maupun multivariat? Baiklah langsung saja kita
bahas. Pada dasarnya ada 2 tahap, yaitu tahap deteksi dan mengatasi.

Data Outlier
Data Outlier disebut juga dengan data pencilan. Pengertian dari Outlier adalah data observasi
yang muncul dengan nilai-nilai ekstrim, baik secara univariat ataupun multivariat. Yang
dimaksud dengan nilai-nilai ekstrim dalam observasi adalah nilai yang jauh atau beda sama
sekali dengan sebagian besar nilai lain dalam kelompoknya. Misalkan nilai ujian siswa dalam
satu kelas yang berjumlah 40 siswa, sebanyak 39 siswa mendapatkan nilai ujian dalam kisaran
70 sampai 80. Kemudian ada 1 siswa yang nilainya sangat melenceng dari lainnya, yaitu
mendapatkan nilai 30. Nah, tentunya 1 siswa tersebut memiliki nilai ekstrem sehingga disebut
sebagai pencilan.

Diagram Data Outlier

Gambarannya seperti gambar di bawah ini:

Contoh Data Outlier

Data pencilan dalam penelitian harus mendapatkan perlakuan khusus, karena dapat
menyebabkan terjadinya bias pada hasil penelitian. Namun semuanya masih tergantung pada
tujuan penelitian, sebab apabila nilai-nilai ekstrim yang dimaksud memang diupayakan untuk
dinilai keberadaannya atau dinilai fenomenanya, maka pencilan tersebut dibiarkan saja. Namun
apabila tujuan penelitian adalah untuk generalisasi, apalagi untuk menentukan sebuah model
prediksi seperti dalam regresi linear, maka data tersebut harus mendapatkan perlakuan khusus.
Apakah perlakuan tersebut? yaitu kita bisa melakukan transformasi data jika nilai ekstrim
masih bisa dikurangi jaraknya dengan kelompok yang lainnya. Jika terlalu jauh, maka anda
bisa mengeluarkan data yang menyimpang tersebut dari penelitian.

Studentized Residual

Sebuah contoh dalam analisis regresi linear, munculnya outlier dilihat dari nilai studentized
residual. Studentized residual adalah nilai residual yang distandarisasi berdasarkan nilai mean
dan standart deviasi. Apabila nilai absolut dari studentized residual lebih dari 3, maka
observasi yang bersangkutan adalah sebagai outlier univariat. Untuk mengetahui outlier
multivariat pada regresi linear bisa dilihat dari nilai leverage atau nilai probabilitas
mahalanobis. Jika nilai probabilitas mahalanobis kurang dari 0,001 maka observasi yang
bersangkutan menjadi outlier multivariat.

Outlier Univariat

Apa yang dimaksud dengan outlier univariat? Outlier univariat adalah outlier yang disebabkan
oleh variabel terikat atau variabel dependen. Dapat diartikan yaitu apabila variabel dependen
terdapat outlier, maka besar kemungkinan akan terjadi outlier univariat. Apabila hal ini
dibiarkan tanpa adanya perlakuan, maka dapat menyebakan masalah normalitas residual pada
regresi linear. Dan tentunya nilai R dan R Squared akan menjadi Bias. Bias dalam regresi linear
adalah nilai R Square tidak benar dalam menjelaskan variabel terikat. Bisa saja nilai R Square
tinggi, namun sesungguhnya sebaliknya.

Outlier Multivariat

Apa yang dimaksud dengan outlier multivariat? Outlier Multivariat adalah outlier yang
disebabkan oleh sekumpulan variabel bebas atau variabel independen. Apabila satu atau
beberapa variabel bebas terdapat nilai-nilai ekstrim, maka ada kemungkinan bisa terjadi outlier
multivariat.

Catatan Penting: Dalam bahasan ini, kita membahas Outlier dalam artian Outlier pada
Regresi Linear.

Deteksi Outlier

Langkah pertama adalah melakukan deteksi outlier. Dalam hal ini yang dideteksi adalah outlier
univariat dan multivariat sekaligus. Caranya kita harus melakukan uji regresi linear seperti
biasanya. Jika belum paham cara melakukan regresi linear dengan SPSS, anda bisa pelajari
pada artikel-artikel kami di website ini. Sederhananya perhatikan langkah berikut:

Buat dataset untuk regresi linear berganda seperti gambar di bawah ini.

Dataset Regres Linear Deteksi Outlier

Setelah itu lakukan regresi seperti cara berikut: Klik Analyze pada Menu -> Regression ->
Linear. Kemudian masukkan variabel yang akan dianalisis.

Langkah Regres Linear Deteksi Outlier


Klik tombol SAVE. Maka akan terbuka jendela seperti di bawah ini. Kemudian klik
Studentized dan Mahalanobis. Lalu tekan tombol Continue.

Save Regresi Linear Deteksi Outlier

Jika sudah kembali ke jendela utama, klik OK. Selanjutnya lihat Output.
Casewise Diagnostics Deteksi Outlier

Anda dapat melihat bahwa pada output terdapat tabel Casewise Diagnostics, hal itu
menunjukkan bahwa terdapat observasi atau sampel dengan nilai absolut studentized residual
lebih dari 3. Maka observasi tersebut menjadi outlier.

Langkah terakhir di atas, hanya dapat mendeteksi adanya outlier univariat saja. Untuk
mendeteksi outlier univariat, maka anda harus melakukan langkah berikut: pada menu, klik
Transform -> Compute Variable. Jika jendela baru terbuka, ketikkan target variable:
Probabilitas Mahalanobis. Dan ketikkan kode ekspresi pada Numeric Expression sebagai
berikut: CDF.CHISQ(Mah,3). Penjelasan kode: Mah: Mahalanobis Distance. 3 adalah
banyaknya jumlah variabel bebas.
Probabilitas Mahalanobis

Mengatasi Outlier

Sebenarnya cara pertama yang kita lakukan adalah melakukan transformasi data untuk
mereduksi adanya outlier tersebut. Untuk mempelajari caranya, anda bisa baca artikel kami
tentang transformasi data. Dalam hal ini kita coba untuk mengatasinya dengan cara membuang
outlier tersebut dari analisis regresi linear berganda, yaitu dengan langkah sebagai berikut: Pada
menu, klik Data -> Select Case -> Pilih if condition satisfied -> tekan tombol If.
Select Case Deteksi Outlier

Jika jendela baru terbuka, maka selanjutnya pada kolom isian ekspresi, ketikkan kode sebagai
berikut: Abs(SRE_1)<3 and Probabilitas Mahalanobis>0.001. Maksud kode: Abs: Absolut,
SRE_1: Studentized Residual.

Ekspresi Select Case Deteksi Outlier

Artinya kita akan membuang observasi yang mempunyai nilai absolut studentized residual
lebih dari 3 dan/atau probabilitas kurang dari 0.001. Kemudian tekan tombol Continue. Di
jendela utama tekan OK. Lihat pada dataset, ada tanda yang menunjukkan bahwa beberapa
observasi dikeluarkan dari analisis.
Mengatasi outlier dengan SPSS

Sampai di sini kita sudah berhasil mengeluarkan outlier. Apa yang harus kita lakukan
selanjutnya? Jawabannya mudah, yaitu ulangi regresi linear berganda seperti langkah pertama,
kemudian cek ulang apakah masih ada outlier. Jika sudah tidak ada, tentunya lihat dan nilai
apakah ada masalah asumsi klasik lainnya. Jika ada, maka pandai-pandailah untuk
mengatasinya

Anda mungkin juga menyukai