2.iwa - Ipvol18 2 2009 PDF
2.iwa - Ipvol18 2 2009 PDF
ABSTRACT
This paper discusses the study of outlier and residual detection in
the linear regression, conducted by study of the requirements and the
necessary assumption that the residual regression model is reliable and
can be used. Assumption of normality is one of necessary condition that
the residuals, so if there are outlier residual will have not consequences
in normal distribution. So to do detection of outlier from the data
observations. Besides that need to normality tested of the residuals or
directly to the variable of responses (observations). Presence or
absence of observation as outlier can be characterized by the
distribution of residuals and the correlation coefficient. Outlier detection
can be followed by determining of each observation residuals is
followed by determining ist the median, and the statistic T is used to test
the existence of outlier. Quartile deviation (dQ) is simple alternative to a
detecting of outlier. The results of the study show that to normality test,
can be done on the residual or on the response variables (the
dependent variables). Study of the residual can be done by plotting the
residuals of the independent variables and the dependent variables.
Efforts to overcome the outlier can be done with the data
transpormation so the data as outlier need not disposed.
Keywords : correlation, median, normality, outlier, regression analysis,
residuals.
normal dengan rata-rata nol dan ragamnya σe2 , jadi dalam melakukan
kajian dengan menggunakan analisis regresi diperlukan untuk mencek
apakah persyaratannya sudah dipenuhi yang diantaranya syarat
menyebar normal. Bentuk yang digunakan untuk mempredisi
^ ^ ^ ^ ^
^
n ∑ X iY i − ( ∑ X iY i ) 2
β 1 = i=1 i=1
n ∑ X i
2
− (∑ X i)2
dan
_
^ ^ _
β 0 = Y − β 1 X
Untuk taraf nyata α dan derajat bebas (n-2), maka kriteria pengujiannya
adalah tolak Ho : ρ = 0 jika |thit| ≥ t0.5α (n-2) dan terima Ho jika |thit | < t0.5α (n-2).
Jika hipotesis di atas hanya memperhatikan nilai ρ > 0 atau uji arah
kanan, maka bentuk kriteria ujinya adalah tolak Ho : ρ = 0 jika thit ≥ tα (n-2)
dan terima Ho jika thit <tα (n-2).
Hitung
Hitung
Hitung T = Qsisa/Q
Bandingkan harga statistik penguji T dengan titik kritis untuk k=1 dan
tingkat keberartian 0,01 atau 0,05 atau 0,10.
Jika harga T melebihi titik kritis, maka data yang memberikan emaks
adalah bukan data pencilan.
Cara lain untuk mendeteksi adanya gejala pencilan dapat dilakukan
dengan satu metode yang lebih sederhana, yaitu dengan menggunakan
sebaran tengah dQ (deviasi kuartil) sebagai berikut :
Tentukan nilai kuartil atas (QA) kuartil bawah (QB) dan hitung
besarnya dQ = QA-QB
Tentukan batas bawah pencilan BBP = QB-(1,5)dQ.
Tentukan batas atas pencilan BAP = QA+(1,5)dQ.
Untuk mendeteksi pencilan dilakukan dengan membandingkan nilai
data : (jika data pengamatan lebih kecil dari BBP atau lebih besar dari
BAP maka pengamatan tersebut adalah pencilan)
Jadi BAP-BBP = 4dQ. Mengapa diambil 4 dQ? Hal ini dapat dijelaskan
melalui bentuk sebaran ideal, yakni normal. Dalam keadaan ideal ini,
pengambilan 4 dQ berarti bahwa tingkat keyakinan (probability)
terjadinya outliers adalah sebesar 0,007 atau 0,7% atau kira-kira 1%.
Jika cara kedua data pengamatan diganti dengan residual maka
setelah mendapatkan residual dari semua pengamatan selanjutnya
tentukan nilai kuartil atas QA dan kuartil bawah QB dari nilai mutlak
residual atau |ei| serta tentukan penyimpangannya dQ = QA-QB.
100 Penditeksian Pencilan (OutLier)
Seperti di atas tentukan BBP dan BAP dan untuk mendeteksi
pencilan gunakan residu (bukan data pengamatan). Ketentuannya
adalah : (jika nilai residu lebih kecil dari BBP atau lebih besar dari
BAP maka data pengamatan yang bersangkutan adalah pencilan)
JK ( β1 ) = β 0 ∑
i =1
( X i − X )( Y i − Y ) = 3.711,6
JKresidu = JKtotal - JK ( β1 ) - JK( β 0 ) = 248.4
Sumber
Db JK RJK Fh Ft0.05 Ft0.01
Keragaman
Regresi β 0 1 42.336 42.336 681,74 7.71 21.20
Regresi β 1 1 3.711,6 3.711,6 59.77 7.71 21.20
Residual 4 248.4 62.1
Total 6 46.296
n − 2
t hitung = r
1 − r2
6− 2
t hitung = 0 . 93
1 − ( 0 . 93 ) 2
= 5 . 06
Nilai thit = 5.06 > t 0,025 (4) = 3.747 maka Ho ditolak, artinya koefisien
korelasi ρ tidak sama dengan nol, dan menunjukkan adanya
ketergantungan antara motivasi dan kinerja.
Kajian Residual :
Dengan menggunakan persamaan Y = 29,4 + 0,95 X dapat
ditentukan nilai-nilai residual sebagai berikut : e1 = 11,6; e2 = -7,9; e3
= -6,9; e4 = -6,4; e5 = 14,6 dan e6 = -4,9.
Dari nilai mutlak residual ditentukan kuartil atas (Q3= 12.35) dan
kuartil bawah (Q1= 6.025) dan deviasinya adalah dQ = Q3 - Q1 = (12.35
- 6.025) = 6.325. Untuk mendeteksi data pencilan ditentukan batas
bawah pencilan = Q1- 1.5 dQ = 6.025 - 1.5 * 6.325 = -3.4625 dan batas
atas pencilan = Q3 + 1.5 dQ = 12.35 + 1.5 * 6.325 = 21.8375. Ternyata
semua nilai residual tidak ada yang diluar batas pencilan (tidak ada
yang lebih kecil dari batas bawah dan juga yang lebih besar dari batas
atas), jadi untuk pengamatan di atas tidak ada data yang dianggap
pencilan.
KESIMPULAN
Berdasarkan uraian dari penulisan ini, dapat disampaikan beberapa
kesimpulan dan saran sebagai berikut :
• Dalam analisis regresi residual merupakan bagian yang menentukan
layak tidaknya model tersebut digunakan, karena jika jumlah
residunya jauh dari nol dan juga jumlah kuadrat residunya besar
DAFTAR PUSTAKA
Hogg, R.V. and A.T. Craig. (1995). Introduction to Mathematical
Statistics. Prentice Hall. Singapore
Sudjana, 2002, Metode Statistika; Tarsito; Bandung
Rudiansyah (Hines William W. and Montgomery D); 1990. Probabilita
dan Statistik dalam Ilmu Rekayasa dan Manajemen. Universitas
Indonesia; Jakarta
--------------, Analisis Hubungan, Lembaga Penelitian STKIP Kuningan,
2002
http://www.math.itb.ac.id/~ma291/sas_rls.htm
http://statisticsanalyst.wordpress.com/2008/11/21/asumsi-regresi-uji-
normalitas/
Informatika Pertanian Volume 18 No. 2, 2009 105