Anda di halaman 1dari 8

TUGAS

ANALISIS DATA EKSPLORASI


Mendeteksi Outlier dan Leverage pada Regresi Linear

oleh:

RUTH AGATA PURBA


140610160069

PROGRAM STUDI STATISTIKA


FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2017
Akan diteliti pengaruh panjang hidung (nasal length) terhadap lebar hidung (nasal width)
dari 45 ekor kangguru abu-abu dalam satuan millimeter dengan data yang sudah diurutkan
menurut variable X sebagai berikut :

NO X Y 23 67.7 23.7
24 68.6 25.1
1 49.3 18.9
25 69.2 23.8
2 55.9 21.3
26 70.1 23.8
3 56.2 21.6
27 71 27.8
4 56.4 20.7
28 71 22.1
5 56.5 20.4
29 71.7 23.1
6 58 22.5
30 72.7 27.1
7 59.6 22
31 73 28.1
8 59.7 21.9
32 73.7 27.5
9 60.6 22.6
33 74 23.4
10 60.9 24.1
34 75.5 26.8
11 61.5 22.8
35 76.3 29.2
12 61.6 22
36 77.8 26.3
13 62 23.3
37 77.8 27.9
14 62.9 22.2
38 80.3 25.5
15 62.9 21.1
39 81 28.4
16 63 21.5
40 81.6 27.5
17 63.5 23.6
41 82.3 27.2
18 63.6 20.1
42 83 28.8
19 64.5 24.7
43 83.8 28.1
20 66 24
44 85.5 30.8
21 67.2 23.1
45 86.4 30.6
22 67.5 21.7

Source: Australian Journal of Zoology, vol. 28, p607-613

X : panjang hidung (mm)  variabel independen


Y : lebar hidung (mm)  variabel dependen

I. Persamaan Garis Resisten

Hubungan antara dua peubah X dan Y dapat dijelaskan melalui persamaan garis lurus:

Ŷi = a + bXi ; i=1,2,3,...,n

Dengan adanya persamaan garis, dapat dilakukan interpolasi atau dugaan terhadap nilai
Y untuk X tertentu yang tidak diamati tetapi masih berada dalam selang X yang diteliti.
Scatter plot menunjukkan pola garis lurus. Untuk memeriksa apakah pola tersebut benar
lurus atau lengkung, diperlukan paling sedikit tiga titik yang dapat mewakili seluruh titik
yang ada. Dengan menghubungkan ketiga titik tersebut dengan dua penggalan garis, dan
masing-masing menghubungkan dua titik yang berdekatan, pola garis lurus dapat
diperiksa. Jika rasio koefisien b kedua penggalan garis tersebut, sangat jauh dari nilai 1,
maka hal tersebut menunjukkan adanya pola lengkung.

Data dibagi ke dalam tiga kelompok:


no xb yb xt yt xa ya no xb yb xt yt xa ya
1 49.3 18.9 63.0 21.5 73.0 28.1 9 60.6 22.6 68.6 25.1 81.0 28.4
2 55.9 21.3 63.5 23.6 73.7 27.5 10 60.9 24.1 69.2 23.8 81.6 27.5
3 56.2 21.6 63.6 20.1 74.0 23.4 11 61.5 22.8 70.1 23.8 82.3 27.2
4 56.4 20.7 64.5 24.7 75.5 26.8 12 61.6 22.0 71.0 27.8 83.0 28.8
5 56.5 20.4 66.0 24.0 76.3 29.2 13 62.0 23.3 71.0 22.1 83.8 28.1
6 58.0 22.5 67.2 23.1 77.8 26.3 14 62.9 22.2 71.7 23.1 85.5 30.8
7 59.6 22.0 67.5 21.7 77.8 27.9 15 62.9 21.1 72.7 27.1 86.4 30.6
8 59.7 21.9 67.7 23.7 80.3 25.5
Koefisien a dan b dapat dihitung dengan rumus sebagai berikut:

𝑌𝑎 − 𝑌𝑏
𝑏=
𝑋𝑎 − 𝑋𝑏
𝑎 = (𝑌𝑎 + 𝑌𝑡 + 𝑌𝑏) − 𝑏(𝑋𝑎 + 𝑋𝑡 + 𝑋𝑏)/3
(𝑌𝑎 − 𝑌𝑡)/(𝑋𝑎 − 𝑋𝑏)
𝑟=
(𝑌𝑡 − 𝑌𝑏)/(𝑋𝑡 − 𝑋𝑏)

dimana: Ya = median Y atas Xa = median Y atas


Yb = median Y bawah Xb = median X bawah
Yt = median Y tengah Xt = median X tengah

dan diperoleh hasil sebagai berikut:


b a ratio
0.2864078 4.704369 1.568627

Berdasarkah perhitungan, diperoleh rasio koefisien b mendekati nilai 1 ( rasio = 1.57 ).


Hal tersebut tidak menunjukan indikasi cukup kuat akan adanya kelengkungan dan
persamaan garis resistennya yaitu:
̂ = 𝟒. 𝟕𝟎𝟒𝟒 + 𝟎. 𝟐𝟖𝟔 𝑿
𝒚
Artinya, terdapat hubungan positif antara panjang dengan lebar hidung kangguru.
Semakin panjang hidung seekor kangguru maka semakin lembar pula hidung kangguru.
untuk setiap 1mm penambahan panjang hidung (nasal length), lebar hidung (nasal width)
akan bertambah rata-rata 0.286 mm dengan konstanta awal 4.7044.

II. Iterasi Garis Resisten

Persamaan garis resisten yang didapat memiliki kelemahan dalam penaksiran koefisien
a dan b. Kedua nilai ini sering kali bukan taksiran yang paling cocok. Kekurangan ini
dapat diperbaiki dengan melakukan iterasi.
Proses iterasi melibatkan nilai residu, karena dalam komponen ini masih tersisa informasi
yang dapat digunakan untuk memperbaiki nilai taksiran a dan b. Residual adalah selisih
antara dugaan dengan data aktual.

 Mencari nilai residu 1

X Y Ῠ r(1)

59.6 21.6 21.75 -0.15


67.7 -0.46
23.6 24.06
80.3 -0.17
27.5 27.67

−0.17 − (−0.15)
𝑏1 𝐼 =
80.3 − 59.6
𝑏1 𝐼 = 0.00096618
𝑏2 = 𝑏 + 𝑏1 𝐼

𝒃𝟐 = 𝟎. 𝟐𝟖𝟔𝟗𝟔𝟔𝟏𝟖

b1’ sudah lebih kecil dari 1% kali nilai b awal, sehingga proses iterasi dihentikan.
Sehingga didapat model:

̂ = 𝟒. 𝟕𝟎𝟒𝟒 + 𝟎. 𝟐𝟖𝟔𝟗𝟔𝟔𝟏𝟖 𝑿
𝒚
Artinya, terdapat hubungan positif antara panjang dengan lebar hidung kangguru.
Semakin panjang hidung seekor kangguru maka semakin lembar pula hidung kangguru.
Untuk setiap 1 mm penambahan panjang hidung (nasal length), lebar hidung (nasal
width) akan bertambah rata-rata 0.28696618 mm dengan konstanta awal 4.7044.

III. Mendeteksi Outlier

Apabila dalam pengamatan terdapat pencilan atau outlier, nilai koefisien regresi atau
korelasinya akan menurun. Hal ini terjadi karena ragam yang mengukur bervariasinya
data membesar atau kisaran data menjadi lebih lebar. Dengan rendahnya nilai koefisien
regresi dan korelasi dengan sendirinya dapat menurunkan kualitas dari garis regresi yang
dihasilkan, sehingga perlu dicari model lain yang lebih cocok dengan kondisi yang
diamati atau melakukan transformasi terhadap data tersebut.

Σ|ei| = -0.15 + (-0.46) + (-0.17) = -0.78

Residu dalam regresi linier sederhana merupakan selisih dari nilai prediksi dan nilai
sebenarnya atau ei =Yi - (a + b Xi ). Jika nilai pengamatan terletak dalam garis regresi
maka nilai residunya sama dengan nol. Jadi jika total jarak atau nilai mutlak dari residu
atau Σ|ei| = 0 berarti semua nilai pengamatan terletak pada garis regresi (tidak pernah
terjadi). Makin besar total jarak maka makin jauh regresi itu dari nilai aktual, atau nilai
residunya makin besar dan garis regresi kurang tepat digunakan untuk memprediksi.
Yang diharapkan adalah sebaliknya yaitu total residu semakin kecil sehingga garis regresi
cukup handal untuk digunakan. Dari perhitungan di atas didapat Σ|ei| = -0.78 , karena
nilainya sudah cukup kecil, dapat disimpulkan bahwa garis regresi mendekati nilai
aktual.

Untuk mendeteksi pencilan (pengamatan dengan residu terlalu besar) dilakukan langkah-
langkah berikut:

(i) Menghitung kuadrat tengah residu:

∑ 𝒆𝒊 𝟐
𝒔𝟐 =
(𝒏 − 𝟐)
2 2
2
(−0.15)2 + (−0.46) + (−0.17)
𝑠 =
(3 − 2)
𝑠 2 = 0.263
𝑠 = 0.512835

(ii) Membakukan nilai ei menjadi ri


𝒆𝒊
𝒓𝒊 =
𝒔

r1 r2 r3

-0.292494 -0.896983 -0.331493


Pengamatan dikatakan pencilan jika |𝒓𝒊 > 𝟐 |. Dari tabel dapat dilihat bahwa nilai
mutlak ketiganya lebih kecil dari 2, sehingga dapat disimpulkan bahwa tidak terdapat
pencilan.
Jika pencilan (outlier) ternyata ada dalam hasil pengamatan dan pencilan itu akan
digunakan dalam analisis data maka perlu dicari cara untuk mengatasinya agar pencilan
itu tidak mengganggu dan kita mendapat hasil yang lebih baik. Salah satu cara untuk
mengatasi pencilan ditempuh dengan melalui tranformasi terhadap data hasil
pengamatan.

IV. Leverage Value

Leverage hanya menggambarkan kasus pada variabel independen. Nilai leverage


menunjukkan besar pengaruh Yi terhadap Ῠi. Suatu pengamatan dikatakan berpengaruh
jika hii > 2p/n.

2p/n = 2(2)/45 =0.0888

1 (𝑥𝑖 − 𝑥̅ )2
ℎ𝑖𝑖 = +
𝑛 ∑(𝑥𝑘 − 𝑥̅ )2

NO X Y hii 12 61.6 22 0.020331


1 49.3 18.9 0.017073 13 62 23.3 0.020437
2 55.9 21.3 0.018821 14 62.9 22.2 0.020675
3 56.2 21.6 0.0189 15 62.9 21.1 0.020675
4 56.4 20.7 0.018953 16 63 21.5 0.020702
5 56.5 20.4 0.01898 17 63.5 23.6 0.020834
6 58 22.5 0.019377 18 63.6 20.1 0.020861
7 59.6 22 0.019801 19 64.5 24.7 0.021099
8 59.7 21.9 0.019828 20 66 24 0.021496
9 60.6 22.6 0.020066 21 67.2 23.1 0.021814
10 60.9 24.1 0.020145 22 67.5 21.7 0.021894
11 61.5 22.8 0.020304 23 67.7 23.7 0.021947
24 68.6 25.1 0.022185 35 76.3 29.2 0.024225
25 69.2 23.8 0.022344 36 77.8 26.3 0.024622
26 70.1 23.8 0.022582 37 77.8 27.9 0.024622
27 71 27.8 0.022821 38 80.3 25.5 0.025284
28 71 22.1 0.022821 39 81 28.4 0.02547
29 71.7 23.1 0.023006 40 81.6 27.5 0.025629
30 72.7 27.1 0.023271 41 82.3 27.2 0.025814
31 73 28.1 0.023351 42 83 28.8 0.026
32 73.7 27.5 0.023536 43 83.8 28.1 0.026212
33 74 23.4 0.023616 44 85.5 30.8 0.026662
34 75.5 26.8 0.024013 45 86.4 30.6 0.0269

Berdasarkan perhitungan laverage value, disimpulkan bahwa tidak ada pencilan terhadap
variabel panjang hidung kangguru (X) sebab nilai hii lebih kecil dari cutoff-nya 0.0888.

Anda mungkin juga menyukai