Anda di halaman 1dari 4

Berurusan dengan Outliers

Wahyu Widhiarso | Fakultas Psikologi UGM | Tahun 2001
Outliers adalah nama bagi subyek, subyek yang unik. Yang unik-unik ini kadang bisa
mengacaukan. Nilainya jauh dari rata-rata kebanyakan orang lain. Secara statistik ini bisa
dihilangkan. Ini nih contoh visual bagi yang namanya outliers.
16

80

15
14

Outliers
Yang diberi tanda bulat
ini
70
adalah yang subyek
beridentitas sebagai
outliers

14

13
12
11
10
9
8

60

6
5

Frekuensi Ngemil

7
6
5

4

5
4

3

Std. Dev = 4,14

2

Mean = 12,0

1
0

1
7,5

1

N = 36,00

10,0 12,5 15,0 17,5 20,0 22,5 25,0

50

40
0

Tingkat Kecerewetan

10

20

Tingkat Kecerewetan

Gambar A
Outliers pada Distribusi Normal

Gambar B
Outliers pada Korelasi

Cara di atas adalah cara mengidentifikasi outliers dengan cara meraba-raba saja. Ada
juga cara yang lebih praktis. Misalnya dengan melihat nilai-nilai yang ekstrim.
A. Outliers : Nilai Ekstrim
1. Tekan Menu Analyze

Descriptive

Explore

Input Variabel
Masukkan variabel yang hendak di
identifikasi pada kolom ini

Tekan
Tekan kotak Statistics, kemudian
tekan kotak Outliers

Pada display akan muncul subyek-subyek yang
Teridentifikasi sebagai outliers.
Tetapi hanya 5 subyek yang paling atas dan paling bawah saja yang ditampilkan. Yaitu mereka
yang memiliki Ekstrem value

30

Nilai Cook’s >1 adalah subyek outliers 2. Ini contohnya.. Mahal’s Distance : ukuran jarak nilai subyek dari garis yang dikehendaki.. Kalau aku sih. Sebelum menganalisis.yaitu nomor subyek. lalu pilih menu yang ada Keterangan 1. pilih insert variable. Terserah anda lha ! 3.. ada satu subyek outliers.2 B. Ukuran ini Barnet dan Lewis (1978) yang bilang lho. Pilih kotak Mahalobis. Aturan yang saya rekomendasikan adalah Mahal Distance kemudian Cook’s distance Wahyu Widhiarso 2001 SPSS Untuk Psikologi . 2 subyek yang nilainya yang paling besar dan ekstrem yang aku del. Cook’s atau Leverage tekan continue kemudian OK Dependent Masukkan Nomor di sini Independent Masukkan variabel yang dianalisis Save Tekan save. Makin jauh jarak dari pusat garis korelasi.... Pada gambar B di atas. Cook’s Distance : ukuran pengaruh subyek pada model. Tekan analyze regression masukkan nomor pada kotak dependent dan variabel yang diuji korelasinya pada kotak independent 2. nilai di atas 15 yang di del. Ouliers : Jauh Dari Garis Korelasi Outliers pada acara ini adalah mereka yang jauh dari garis korelasi. pada kotak kolom. Tekan kotak Save. Ini nih cara mengidentifikasikannya. makin jelek dia bukan? Untuk jumlah sampel 30 (N=30). nilai di atas 11 perlu dipertimbangkan untuk di del. sedangkan N=100. Klik kanan. Beri satu kolom tambahan pada data anda.bukan aku. kemudian beri nomor secara urut Petunjuk 1. Leverage Distance : nilai yang mendekati 1 saja yang di del.

011 .20 -1.239 1.41 -17. Deleted Residual Mahal.016 1.115 38 38 38 38 38 38 38 38 38 38 38 a.927 11.000 .90 .60 .212 4.701 17.96 1. Residual Deleted Residual Stud.000 . Residual Stud.091 Maximum 24.973 1.037 10.052 1.000 Std.507 Mean 19.00 .000 23.797 .608 -1.802 1.535 74. Deviation 3.03 21.322 1. Jika Ia dihapus. maka nilai korelasi kita bisa meningkat.079 1.119 16.672 .41 4.315 . Distance Cook's Distance Centered Leverage Value a Minimum 13. Predicted Value Standard Error of Predicted Value Adjusted Predicted Value Residual Std.345 25. Coba lihat ternyata ada nilai Mahal’s dan Cook’s yang sangat besar ! Nilai Mahal’s nya ada yang di atas 11 ! Kita lihat subyek berapa yang memiliki nilai itu….997 3.794 9.3 Ini adalah contoh outputnya.631 -18.68 -1.377 2. Insya Allah 80 12 11 70 36 37 38 28 14 13 60 4 9 10 3 6 82 7 Frekuensi Ngemil 5 1 16 21 20 17 15 18 19 3023 3122 32 26 25 2924 27 50 33 34 35 40 0 10 20 Tingkat Kecerewetan Wahyu Widhiarso 2001 SPSS Untuk Psikologi 30 .094 .320 38 -39.053 10.696 .19 -2. Dependent Variable: nomor Identifikasi Ternyata yang memiliki nilai Mahal’s dan Cook’s distance paling tinggi adalah subyek nomor 35.50 .000 N 1.947 .Kembalilah pada Windows SPSS yang memuat daftar nomor subyek dan nilai subyek… Residuals Statistics Predicted Value Std.04 1.

urutkan z score melalui menu Data Sort Case lalu urutkan data anda berdasarkan Z score variabel yang ingin diketahui outliernya Wahyu Widhiarso 2001 SPSS Untuk Psikologi . “Jika dataku banyak. Mana ada nilai Z di atas 3. Subyek ini pasti ngerumpinya parah sekali. Tekan OK.46802 Maximum 3. Coba tekan menu analyze descriptive 2.19792 2. Masak aku mecicili satu persatu tiap kotak kecil di SPSS untuk mencari nilai Z diatas 3. Soalnya Keluarnya nilai Z nanti pada Windows Utama.4 C.26611 -1.Menu Analyze Descriptive masukkan nilai Z ke kotak Variables Kotak Save Standard Value gak usah dihidupkan.1979..00000000 1...0000000 Std. Ini Outliers juga 1. lha gimana nilai Z nya kok melebihi 3.0000000 . lagi-lagi subyek 35 sebagai outliers. Lalu kembalilah pada Windows SPSS utama. Deviation 1.. Seperti bagan di kanan ini. Masukkan data yang hendak diidentifikasi pada kotak variables Membuat Nilai Z Tekan kotak ini agar tiap variabel ada nilai Z-nya. Z nya 3.00000000 Ini nih ternyata ada Outliers pada data kita. Descriptive Statistics Zscore: Skala Zscore: Skala NgerumpiKecemburuanValid N (listwise) N 38 38 Minimum -1.51660 Mean . Kalau pengen cari ya. Mataku Bisa Burem gara-gara Statistik!” (kata seorang teman) Ulangi cara di atas. Identifikasi Outliers Ini dia. Lalu muncul output seperti ini.