Berurusan Dengan Outliers PDF
Berurusan Dengan Outliers PDF
Berurusan Dengan Outliers PDF
Outliers adalah nama bagi subyek, subyek yang unik. Yang unik-unik ini kadang bisa
mengacaukan. Nilainya jauh dari rata-rata kebanyakan orang lain. Secara statistik ini bisa
dihilangkan. Ini nih contoh visual bagi yang namanya outliers.
16 80
15
14
14 Outliers
13
12
Yang diberi tanda bulat
70
ini
11 adalah yang subyek
10 beridentitas sebagai
9 outliers
8 60
7
6
Frekuensi Ngemil
6
5
5 5
4 50
4
3
Std. Dev = 4,14
2
Mean = 12,0
1
0 1 1 N = 36,00 40
7,5 10,0 12,5 15,0 17,5 20,0 22,5 25,0 0 10 20 30
Gambar A Gambar B
Outliers pada Distribusi Normal Outliers pada Korelasi
Cara di atas adalah cara mengidentifikasi outliers dengan cara meraba-raba saja. Ada
juga cara yang lebih praktis. Misalnya dengan melihat nilai-nilai yang ekstrim.
Input Variabel
A. Outliers : Nilai Ekstrim Masukkan variabel yang hendak di
1. Tekan Menu Analyze Descriptive Explore identifikasi pada kolom ini
Tekan
Tekan kotak Statistics, kemudian
tekan kotak Outliers
Outliers pada acara ini adalah mereka yang jauh dari garis korelasi. Pada gambar B di atas, ada
satu subyek outliers. Ini nih cara mengidentifikasikannya.
Sebelum menganalisis. Beri satu kolom tambahan pada data anda...yaitu nomor subyek. Ini
contohnya...
Dependent
Masukkan Nomor di sini
Independent
Masukkan variabel yang dianalisis
Save
Tekan save, lalu pilih
menu yang ada
Keterangan
1. Cooks Distance : ukuran pengaruh subyek pada model. Nilai Cooks >1 adalah subyek
outliers
2. Mahals Distance : ukuran jarak nilai subyek dari garis yang dikehendaki. Makin jauh jarak dari
pusat garis korelasi, makin jelek dia bukan? Untuk jumlah sampel 30 (N=30), nilai di atas 11
perlu dipertimbangkan untuk di del, sedangkan N=100, nilai di atas 15 yang di del. Ukuran ini
Barnet dan Lewis (1978) yang bilang lho...bukan aku. Kalau aku sih, 2 subyek yang nilainya
yang paling besar dan ekstrem yang aku del. Terserah anda lha !
3. Leverage Distance : nilai yang mendekati 1 saja yang di del.
Aturan yang saya rekomendasikan adalah Mahal Distance kemudian Cooks distance
Residuals Statistics a
Identifikasi
Ternyata yang memiliki nilai
Mahals dan Cooks distance
paling tinggi adalah subyek
nomor 35. Jika Ia dihapus,
maka nilai korelasi kita bisa
meningkat.
80 Insya Allah
12
11
70 36
37
38
28 14 13
60
54 9 10
1
3
6
Frekuensi Ngemil
16 82 7
21
20
17
15
50 18
19
3023
3122
3226
25
2924
27
33
34 35
40
0 10 20 30
Tingkat Kecerewetan
Membuat Nilai Z
Tekan kotak ini agar tiap variabel ada nilai Z-nya.
Tekan OK. Lalu kembalilah pada Windows SPSS
utama. Soalnya Keluarnya nilai Z nanti pada
Windows Utama. Seperti bagan di kanan ini.
Identifikasi Outliers
Ini dia, lagi-lagi subyek 35 sebagai outliers, lha
gimana nilai Z nya kok melebihi 3. Mana ada nilai Z
di atas 3. Subyek ini pasti ngerumpinya parah
sekali. Z nya 3,1979.
Jika dataku banyak.. Masak aku mecicili satu persatu tiap kotak kecil di SPSS untuk mencari nilai
Z diatas 3. Mataku Bisa Burem gara-gara Statistik! (kata seorang teman)
Descriptive Statistics
Zscore: Skala
Zscore: Skala NgerumpiKecemburuanValid N (listwise)
N 38 38
Minimum -1,26611 -1,46802
Maximum 3,19792 2,51660
Mean ,0000000 ,0000000
Std. Deviation 1,00000000 1,00000000
Ini nih ternyata ada Outliers pada data kita. Kalau pengen cari ya..urutkan z score melalui menu
Data Sort Case lalu urutkan data anda berdasarkan Z score variabel yang ingin diketahui
outliernya