Anda di halaman 1dari 14

ANALISIS PREDIKSI DATA KESEHATAN

Mieke Nurmalasari

Sesi 5

Diagnostik Model Regresi

www.esaunggul.ac.id
Kemampuan Akhir yang Diharapkan

1.Memahami proses diagnostik model regresi


2.Memahami tentang outlier dan influential
point
3.Memahami jenis diagnostik model regresi

www.esaunggul.ac.id
Pendahuluan
o Setelah melakukan model building, langkah selanjutnya
adalah mendiagnosa model yang didapat apakah sudah layak
atau bagus tidak untuk digunakan untuk prediksi maupun
pemodelan.

o Diagnosa yang dimaksud di sini adalah mendiagnosa


pengamatan yang mempengaruhi model regresi.

o Mengidentifikasi apakah terdapat pengamatan ekstrem


(outlier) dan pengamatan yang berpengaruh (influential
cases) terhadap model regresi.

www.esaunggul.ac.id
Diagnostik Model Regresi

1. Pengamatan tidak biasa dan pengamatan yang


berpengaruh (Unusual and influential data):
2. Normalitas:
3. Heterokedasitas ( varians tidak konstan)
4. Multikolinieritas (terdapat hubungan antar variabel
bebas atau non independence of x-variables).
5. Autokorelasi.

www.esaunggul.ac.id
Diagnostik Model Regresi

Pengamatan tidak biasa dan pengamatan yang


berpengaruh (Unusual and influential data):
1. Outlier
2. Leverage
3. Influence point

www.esaunggul.ac.id
1. Outlier
o adalah suatu observasi yang menyimpang dari
sekumpulan data yang lain atau pengamatan
yang jauh dari pusat data.

o Outlier memberikan indikasi adanya keanehan


sampel atau bisa juga indikasi dari kesalahan
entry data.

www.esaunggul.ac.id
OUTLIER

www.esaunggul.ac.id
Dampak Outlier
Keberadaan data outlier/ pencilan akan
mengganggu dalam proses analisis data dan
harus dihindari, karena dapat menyebabkan error
dari model semakin besar, varians pada data juga
menjadi besar dan estimasi interval dari koefisien
regresi juga semakin leba.r

www.esaunggul.ac.id
2. Leverage
o adalah pengamatan dengan nilai ekstrim pada
variabel bebas (prediktor).
o Leverage mengukur seberapa jauh nilai variabel
Y menyimpang dari nilai rata-ratanya.
o Leverage ini bisa mempengaruhi estimasi
koefisien regresinya.

www.esaunggul.ac.id
3. Influence point
o adalah perpaduan antara outlier dan leverage,
o jika kita menghilangkan pengamatan ini maka
estimasi koefisien regresi akan sangat berubah.

www.esaunggul.ac.id
UKURAN UNTUK MENDETEKSI OUTLIER

o Leverage: menampilkan nilai leverage (pengaruh)


terpusat.
o DFFITS atau Standardized DFFIT: menampilkan nilai
perubahan yang diprediksi jika case tertentu
dikeluarkan, yang sudah distandarkan.
o Cook’s Distance: menampilkan nilai jarak Cook
o DFBETA(s) : Menampilkan nilai perubahan koefisien
regresi hasil perubahan yang disebabkan oleh
pengeluaran case tertentu. Digunakan untuk
mendeteksi outlier pada variabel bebas.

www.esaunggul.ac.id
Ketentuan dalam Pengambilan Keputusan

1. Leverage > (2p-1)/n, artinya terdapat outlier/ pencilan


2. DFFITS > 2 *sqrt (p/n), artinya terdapat outlier/
pencilan
3. Cook’s Distance > F(0.5; p , n-p) , artinya terdapat
outlier/ pencilan
4. DFBETA(s) > 2/sqrt(n), artinya terdapat outlier/
pencilan
Dimana n = jumlah observasi (sampel) dan
p= jumlah parameter dalam model.

www.esaunggul.ac.id
CARA MENGHADAPI ADANYA OUTLIER
Cara yang biasa dilakukan adalah dengan melakukan reduksi data atau
melakukan transformasi data diantaranya:
1. Transformasi Square Root (Akar),
2. Tansformasi Logaritma,
3. Transformasi Arcsin,
4. Transformasi Square (Kuadrat),
5. Transformasi Cubic (Pangkat Tiga),
6. Transformasi Inverse (Kebalikan),
7. Transformasi Inverse Square Root (Kebalikan Akar),
8. Transformasi Inverse Square (Kebalikan Kuadrat),
9. Transformasi Inverse Cubic (Kebalikan Pangkat Tiga),
10. Transformasi Reverse Score (Balik Skor).

www.esaunggul.ac.id
Terima Kasih

www.esaunggul.ac.id

Anda mungkin juga menyukai