Anda di halaman 1dari 37

Metode Statistika

Pertemuan XII

Analisis Korelasi dan Regresi


Analisis Hubungan
Jenis/tipe hubungan
Ukuran Keterkaitan

Pemodelan
Keterkaitan
Skala pengukuran
variabel
Relationship vs Causal
Relationship
 Tidak semua hubungan (relationship)
berupa hubungan sebab-akibat
 Penentuan suatu hubungan bersifat
sebab-akibat memerlukan well-argued
position dari bidang ilmu terkait
Alat Analisis
Keterkaitan
 Ditentukan oleh:
1. Skala pengukuran data/variabel
2. Jenis hubungan antar variabel

Relationship Numerik Kategorik


Numerik Korelasi Pearson, Spearman Tabel Ringkasan

Kategorik Tabel Ringkasan Spearman (ordinal),


Chi Square

Causal relationship
X
Numerik Kategorik
Y
Numerik Regresi Linier ANOVA
Kategorik Regresi Logistik Regresi Logistik
• Apa itu analisis regresi?
• Apa bedanya dengan korelasi?

Analisis Regresi  Analisis statistika yang


memanfaatkan hubungan antara dua atau lebih
peubah kuantitatif sehingga salah satu peubah
dapat diramalkan dari peubah lainnya.

Korelasi  mengukur keeratan HUBUNGAN


LINEAR dari dua variabel
Korelasi
Korelasi

r=1 r=0

r=0 r=0
Korelasi
Koefisien Korelasi
 tidak menggambarkan hubungan sebab
akibat
 nilainya berkisar antara -1 dan 1
 tanda (+) / (-)  arah hubungan
– (+) searah;
– (-) beralawanan arah
 Pearson’s Coef of Correlation  linear
relationship
 Spearman’n Coef of Correlation (rank
correlation)  trend relationship
Koefisien Korelasi Pearson (r)
S xy
rxy 
SxS y

S xy 
 ( x  x )( y
i i  y)

1 
 xi yi 
 xi  yi 

n 1 n 1  n 

Sx 
 i
( x  x ) 2

dan S y 
 i
( y  y ) 2

n 1 n 1
Korelasi !!!
Analisis Regresi
Definisi
 Linear : linear dalam parameter
 Sederhana : hanya satu peubah
penjelas
 Berganda : lebih dari satu peubah
penjelas
linear
Hubungan
Regresi Linear parameter

non
satu linear
Peubah
penjelas
Simple Regresi non
Linear linear
>
Regression
satu

Multiple
Linear
Regression
ANALISIS REGRESI

• Hubungan Antar Peubah:


• Fungsional (deterministik)  Y=f(X) ; misalnya: Y=10X
• Statistik (stokastik)  amatan tidak jatuh pas pada kurva
Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi

• Model regresi linear sederhana:

Yi  0  1 X i   i ; i  1,2,..., n
Regresi

Makna 0 & 1 ?

0 adalah nilai Y ketika X = 0, sedangkan 1 adalah perubahan nilai Y


untuk setiap perubahan 1 satuan X.
Regresi
Analisis Regresi
• Pendugaan terhadap koefisien regresi:
 b0 penduga bagi 0 dan b1 penduga bagi 1
(  x )(  y )
 xy  n
b1  Metode
( x)2
x  n2
Kuadrat Terkecil
b0  y  b1 x

Bagaimana Pengujian terhadap model regresi ??


• parsial (per koefisien)  uji-t
• bersama  uji-F (Anova)
Bagaimana menilai kesesuaian model ??
R2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan oleh X)
Koefisien Determinasi

JK (Re gresi)
R 
2
x100%
JK (Total )
b1S xy
 x100%
S yy
Koefisien determinasi sebesar 80% menjelaskan bahwa
sebesar 80% keragaman dari Y dapat dijelaskan oleh
Xdalam hubungan linier, sisanya oleh faktor-faktor lain
catatan
2
2  n

 n
 i Y

n  i  X
Sxx   X i2   i 1 
n
Syy   Yi 2   i 1  i 1 n
i 1 n

 n  n 
n  i  i 
X Y
Sxy   X iYi   i 1   i 1 
i 1 n

Keterangan :
Syy = Jumlah Kuadrat Terkoreksi variabel Y
Sxx = Jumlah Kuadrat Terkoreksi variabel X
Sxy = Jumlah Kuadrat Terkoreksi variabel XY
Metoda Kuadrat Terkecil
 Pendugaan parameter pada regresi didapat
dengan meminimumkan jumlah kuadrat
galat.
Keragaman yang dapat
dijelaskan dan yang tidak
dapat dijelaskan
Contoh Data
Percobaan dalam bidang lingkungan Jarak Emisi
31 553
Apakah semakin tua mobil semakin
38 590
besar juga emisi HC yang dihasilkan?
48 608
Diambil contoh 10 mobil secara acak, 52 682
kemudian dicatat jarak tempuh yang 63 752
sudah dijalani mobil (dalam ribu 67 725
kilometer) dan diukur Emisi HC-nya 75 834
(dalam ppm) 84 752
89 845
99 960

Emisi = 382 + 5.39 Jarak


Analisis Regresi
Plot antara Emisi Hc (ppm) dg
Jarak Tempuh Mobil (ribu kilometer)

950

850
Emisi

750

650

550

30 40 50 60 70 80 90 100
Jarak
Analisis Regresi
Contoh output regresi dengan Minitab (1)

Regression Analysis (Emisi Hc vs Jarak Tempuh Mobil)

The regression equation is Emisi = 382 + 5.39 Jarak

Predictor Coef StDev T P


Constant 381.95 42.40 9.01 0.000
Jarak 5.3893 0.6233 8.65 0.000

S = 42.01 R-Sq = 90.3% R-Sq(adj) = 89.1%

Analysis of Variance

Source DF SS MS F P
Regression 1 131932 131932 74.76 0.000
Error 8 14118 1765
Total 9 146051

Unusual Observations
Obs Jarak Emisi Fit StDev Fit Residual St Resid
8 84.0 752.0 834.7 18.0 -82.7 -2.18R

R denotes an observation with a large standardized residual


Analisis Regresi
Bagaimana Pengujian terhadap model regresi ??
• parsial (per koefisien)  uji-t
• bersama  uji-F (Anova)

Bagaimana menilai kesesuaian model ??


R2  Koef. Determinasi
(% keragaman Y yang mampu dijelaskan oleh X)
Uji Hipotesis (Simultan)
H0 : 1=0 vs H1: 10
ANOVA (Analysis of Variance)  Uji F
n n n

 i
( y
i 1
 y ) 2
  i
( ˆ
y  y
i 1
) 2
  i i
( y  ˆ
y )
i 1
2

JK total = JK regresi + JK galat


Keragaman total = keragaman yang dapat dijelaskan oleh model +
keragaman yang tidak dapat dijelaskan oleh model
Anova
Sumber db JK KT F
Regresi 1 JKR KTR KTR/KTE
F~F (1,n-2)
Galat n-2 JKG KTG
Total n-1 JKT
Catatan
JK (Regresi)  b1S xy
JK Total   S yy
JKG  JK Total   JK (Regresi)

JK (Regresi)
KT (Regresi) 
db(Regresi)
JKG
KTG 
db(G)
Uji Hipotesis (parsial)
H0 : 1≤0 vs H1: 1>0 atau
Satu arah
H0 : 1≥0 vs H1: 1<0 atau
H0 : 1=0 vs H1: 1≠0
dua arah
Uji Parsial
Statistik uji: T  b1
Sb 1
s KTG
Sb1  
 ( xi  x ) 2
S xx

s  KTG 
 i i
( y  ˆ
y ) 2


S yy  b1S xy
n2 n2
Uji Parsial (lanjutan)
 Kriteria Penolakan dan Penerimaan H0 :
(tergantung H1)
 Tolak Hipotesis Nol (H0) jika : thitung > t(, n-2) atau
 Tolak Hipotesis Nol (H0) jika : thitung < - t(, n-2) atau
 Tolak Hipotesis Nol (H0) jika : |thitung|| > t(/2, n-2)
Diskusi (1)
 Berapa emisi HC yang dihasilkan jika
jarak tempuh sekitar 70 ribu km?
759,3 ppm
 Berapa emisi HC yang dihasilkan jika
jarak tempuh sekitar 110 ribu km?
apakah hasil dugaan ini valid?
Kenapa?  974,9 ppm
Diskusi (2)
 Berapa emisi HC yang dihasilkan jika jarak
tempuh sekitar 70 ribu km?
 Tentukan selang kepercayaan 95% bagi
emisi HC jika waktu tempuhnya sekitar 70
ribu km?  predictiction interval
 Tentukan selang kepercayaan 95% bagi
rata-rata emisi HC jika waktu tempuhnya
sekitar 70 ribu km?  confidence interval
 Lebih lebar mana selang interval antara
prediction intervaldengan confidence
interval? Kenapa?
Fitted Line Plot
Emisi = 382.0 + 5.389 Jarak
1100 Regression
95% C I
1000 95% PI

S 42.0096
R-Sq 90.3%
900
R-Sq(adj) 89.1%

800
Emisi

700

600

500

400
30 40 50 60 70 80 90 100
Jarak
Diskusi (3)
 Tentukan formula untuk prediction
interval dan confidence interval!
Keterbatasan Korelasi
dan Regresi Linear
 Korelasi dan Regresi Linear hanya
menggambarkan hubungan yang linear
 Korelasi dan metode kuadrat terkecil pada
regresi linear tidak resisten terhadap
pencilan
 Prediksi di luar selang nilai X tidak
diperkenankan karena kurang akurat
 Hubungan antara dua variabel bisa
dipengaruhi oleh variabel lain di luar model
‘All models are wrong,
but some are useful’
(G. E. P. Box)

Anda mungkin juga menyukai