Anda di halaman 1dari 49

ANALISIS KORELASI & REGRESI

MATERI 2.1
Latar Belakang
 Terdapat kejadian– kejadian , kegiatan- kegiatan, atau
masalah- masalah yang saling berhubungan satu sama lain
 Dibutuhkan analisis hubungan antara kejadian tersebut
 Perlu dibahas mengenai bentuk hubungan yang ada atau
diperkirakan ada antara kedua peubah tersebut
APA YANG DIUKUR DARI HUBUNGAN TERSEBUT

Bagaimana hubungan fungsional dua kejadian tersebut atau bagaimana


persamaan matematis yang mempresentasikan hubungan dua kejadian
tersebut ( analisis regresi)
Bagaimana kekuatan atau keeratan hubungan dua kejadian tersebut
(analisis korelasi)
Contoh:
Apakah tekanan darah memberi gambaran tentang harapan hidup?
Apakah nilai ujian masuk menggambarkan prestasi di universitas?
Apakah membaca buku statistik menjadikanmu pribadi yang lebih
baik?
Ukuran Dalam Regresi
Koefisien Regresi
 mengukur besarnya pengaruh X terhadap Y
Koefisien korelasi
 mengukur Kuat tidaknya hubungan X dan Y

Variabel X (variabel independent / variabel yang


mempengaruhi / variabel yang diketahui), dan variabel Y
(variabel dependent / variabel yang dipengaruhi/ variabel
yang tidak diketahui)
PLOT Hubungan Dua VariaBel
(Scatter plot)
Scatter plot adalah diagram dengan memakai garis
koordinat dengan axis X dan ordinat Y.
Tiap pengamatan diwakili oleh satu titik.
Scatter plot berguna untuk
 membantu dalam melihat apakah ada relasi yang berguna antar
variabel,
 membantu dalam menentukan jenis persamaan yang akan
digunakan untuk menentukan hubungan tersebut. Hubungan
antara variabel dapat berupa garis lurus (linear), garis lengkung
(kurva nonlinear) atau tdk terlihat pola tertentu.
Overview
Relationship between continuous
variables
Bentuk Hubungan Korelasi
Hubungan searah/positif
• Hubungan yang searah diartikan apabila perubahan variabel x (independent) akan
mempengaruhi variabel y (dependent) yang searah.
Hubungan tidak searah/negatif
• Dua variabel dikatakan mempunyai hubungan yang bersifat kebalikan atau negatif, apabila
perubahan variabel independent (x) akan mempengaruhi variabel dependent (Y) pada arah
yang berlawanan
• Artinya apabila variabel x bertambah, maka variabel y berkurang atau sebaliknya, jika
variabel x berkurang maka variabel y bertambah.

Tidak ada hubungan


• Dua variabel dikatakan tidak punya hubungan apabila perubahan pada variabel independent
(x) tidak mempengaruhi perubahan pada variabel dependent (y).
Koefisien Korelasi Pearson (r)

 (x i  x )( yi  y )
rxy  i 1
n n

 i
( x
i 1
 x ) 2
 i
( y
i 1
 y ) 2
Keterangan:
Hubungan positif menyatakan hubungan semakin besar nilai pada variabel
bebas, diikuti pula perubahan dengan semakin besar nilai pada variabel
terikat

Hubungan negatif menyatakan hubungan semakin besar nilai pada


variabel bebas, diikuti pula perubahan dengan semakin kecil nilai pada
variabel terikat.

Koefisien korelasi (r) = 1,00 menyatakan hubungan yang sempurna kuat;

r = 0,50 menyatakan hubungan sedang; dan

r = 0,00 menyatakan tidak ada hubungan sama sekali (dua variabel tidak
berhubungan).
Kuat dan tidaknya hubungan antara X dan Y apabila dapat dinyatakan dengan fungsi
linear(paling tidak mendekati), diukur dengan suatu nilai yang disebut koefisien
korelasi. Nilai koefisien korelasi ini dari –1 sampai +1.
Jadi jika r = koefisien korelasi, maka r dapat dinyatakan sebagai berikut :
-1 r  +1
Kuat (-) Kuat (+)

-1 +1

Lemah (-) Lemah (+)

Jika r =+1, hubungan X dan Y sempurna dan positif,


r = -1, hubungan X dan Y sempurna dan negatif,
r = 0, tidak ada hubungan (tidak ada korelasi) antara X dan Y
r mendekati +1, hubungan X dan Y sangat kuat dan positif,
r mendekati –1, hubungan X dan Y sangat kuat dan negatif,
r mendekati 0, hubungan X dan Y sangat lemah atau berkemungkinan tidak berkorelasi
https://sphweb.bumc.bu.edu
Koefisien korelasi (x dan y) mempunyai hubungan positif
16

14

12

10

0 1 2 3 4 5 6 7 8 9 10 11 12 13
Koefisien korelasi (x dan y) mempunyai hubungan negatif

16

14

12

10

0 1 2 3 4 5 6 7 8 9 10 11 12 13
Koefisien korelasi (x dan y) tidak mempunyai hubungan atau hubungan lemah sekali

Y Y

atau

0 X 0 X
Contoh 1
• Berikut ini data mengenai pengalaman kerja dan penjualan
• x=pengalaman kerja (tahun)
• y=omzet penjualan (ribuan)
x 2 3 2 5 6 1 4 1
y 5 8 8 7 11 3 10 4

• Tentukan nilai rxy


Contoh 1

Diperoleh nilai koef


korelasi (rxy) = 0,8183
artinya ada hubungan
yang sangat kuat dan
positif antara
n pengalaman kerja
 (x  x )( yi  y )
rxy  i 1
i

30
 0,8183 dan omzet penjualan
n n
( 24 )( 56 )
 (x
i 1
i  x) 2
(y
i 1
i  y)2
Uji Hipotesis koefisien Korelasi

 Pengujian signifikansi Selain menggunakan tabel r, juga dapat dihitung


dengan uji t.

Test Statistic Rejection Region

Contoh  Walpole halaman 434


Analisis Regresi
SALAH SATU metode statistika yang menjelaskan atau memprediksi variabilitas dari variabel
dependen dengan menggunakan informasi dari satu atau lebih variabel independen melalui suatu
persamaan matematis
Persamaan matematis bisa saja berupa SUATU GARIS atau KURVA yang diduga terlebih dahulu
dari suatu SCATTER PLOT
Hubungan Antar Peubah:
 Fungsional (deterministik) Y=f(X) ; contoh: Y=10X
 Statistik (stokastik) amatan tidak jatuh tepat pada kurva
Contoh: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi

Model regresi sederhana:

Yi   0  1 X i   i ; i  1,2,..., n
Macam-macam Model Regresi
Model Regresi

1 peubah penjelas > 1 peubah penjelas


Sederhana Berganda

linear Non linear linear Non linear

linear Peubah Boneka Interaksi

Polinom Akar Reciprocal Log Eksponensial


Simple Linear Regression:

influences
Y X
Dependent variable Independent variable
Variabel tergantung Variabel bebas
Variabel respon Variabel prediktor

Explained variable Explanatory variable


Manfaat SECARA UMUM

 To describe or model a set of data with one dependent variable and


one (or more) independent variables.
 To predict or estimate the values of the dependent variable based on
given value(s) of the independent variable(s).
 To control or administer standards from a useable statistical
relationship.
APA PERBEDAAN REGRESI dan KORELASI?

Correlation Regression
Is there an association How exactly does Y change
between X and Y? if X changes?

How strong? Positive or How much of the change in


negative? Y is explained?
MODEL REGRESI LINIER SEDERHANA

•Hubungan antara Y dan X adalah LINIER


• GARIS LURUS (tergantung Scatter Diagram) adalah pendekatan terbaik

Y intercept Random
Error

Yi   0   1 X i   i
Dependent
(Response) Independent
Slope (Explanatory)
Variable
Variable
Simple Linear Regression
Population Model
Y Yi  β 0  β1X i  ε i
Observed Value
of Y for Xi

εi Slope = β1
Predicted Value
of Y for Xi Random Error for
this Xi value
Intercept = β0

Xi
Satu satuan X
Model Regresi linear Sederhana
(yang hubungannya linear ordo x=1 )
 linear dalam parameter
 Sederhana = banyaknya peubah bebas/penjelas hanya satu
 Hubungan antara X dan Y dinyatakan dalam fungsi linear/ordo 1
 Perubahan Y diasumsikan karena adanya perubahan X
 Model populasi regresi linear sederhana yang hubungannya linear (selanjutnya
cukup sebut “regresi linear sederhana”) :

Y  β 0  β1x  ε
Dengan :
0 dan 1 adalah parameter regresi
 adalah galat (peubah acak)
Y adalah peubah tak bebas (peubah acak)
X adalah peubah bebas yang nilainya diketahui
Tahap-tahap dalam Analisis Regresi

1. Plot data  SCATTER DIAGRAM


identifikasi bentuk hubungan secara grafik
2. Koefisien Korelasi
identifikasi hubungan linear dengan suatu angka
n
 ( xi  x )( y i  y )
i 1
 rxy  , -1  rxy  1
n n
 ( xi  x) 2  ( yi  y) 2
i 1 i 1
3. Pendugaan (estimasi) model regresi
4. Evaluasi (diagnostic check) kesesuain model regresi
5. Prediksi (forecast) suatu nilai Y pada suatu X tertentu
Estimasi Model Regresi
• Pendugaan terhadap koefisien regresi:
 b0 penduga bagi 0 dan b1 penduga bagi 1

(  x )(  y )
 xy  n Metode
b1 
 x 2

(  x ) 2
Kuadrat Terkecil
n
b0  y  b1 x

Hubungan antara koefisien regresi b dengan koefisien korelasi r dinyatakan oleh

b1  r
sy
sx
dimana s y 
1
n i

 Yi  Y 
2
dan s x 
1
n i

 Xi  X 
2
.
Bagaimana menilai kesesuaian model regresi ??
R2 (Koef. Determinasi) = proporsi keragaman Y yang mampu dijelaskan oleh X

𝑛 2
𝑖=1 𝑦𝑖 − 𝑦𝑖
𝑅2 = 1 − 𝑛 2
𝑖=1 𝑦𝑖 − 𝑦𝑖

 Nilai R2 berada dalam


interval [0,1]
 Semakin mendekati nilai 1,
maka model regresi semakin
baik untuk memodelkan data
(error = nol)
Interpretasi dan Asumsi
Parameter Model
Asumsi Model Regresi Linear
 Bentuk hubungannya linear (Y merupakan fungsi linear dari X, plus galat yang
acak)
 galat εi adalah peubah acak yang bebas thdp nilai x
 galat merupakan peubah acak yang menyebar Normal dengan rataan 0 dan
memiliki ragam konstan, σ2
 (sifat ragam yang konstan/homogen ini disebut homoscedasticity)

E[ε i ]  0 dan E[ε i ]  σ 2 untuk (i  1, , n)


2

 galat εi, tidak berkorelasi satu dengan yang lainnya, sehingga E[ε i ε j ]  0 , i  j
atau cov[ε i , ε j ]  0 , i  j
Interpretasi Parameter Model
Regresi linear Sederhana
Model Regresi linear Sederhana (populasi) :
Peubah tak Intersep Y Koefisien Peubah bebas/
bebas/ kemiringan Peubah penjelas galat
populasi
populasi
Peubah respon

Y  β 0  β1X  ε
β 0  β1 X

Komponen linear Komponen acak


(fix)

2
Interpretasi Parameter Model
Regresi linear Sederhana
(lanjutan)

Y Y  β 0  β1X  ε
Nilai
pengamatan Y yi
untuk Xi
εi Slope = β1
Nilai E[Y | xi ] galat untuk xi
harapan/rataan
Y untuk xi
yi  β 0  β1xi  εi
Intersep = β0 yi  E[Y | xi ]   i
E[Y | x i ]  β 0  β1 xi

xi X
Model Regresi linear
Sederhana (contoh)
Dugaan bagi persamaan garis regresi :

Y ^
yˆi  b  b1 xi
Nilai
y  b 0  b1x 0

pengamatan Y yi
untuk Xi
ei Slope = b1
Nilai dugaan
 Sisaan/galat
E [Y | xi ]
bagi nilai untuk xi
harapan Y
untuk xi yi  b0  b1 xi  ei

Intersep = b0 e[y | x i ]  b 0  b1 xi ei  y i  yi

xi X
Persamaan Garis Regresi linear
Sederhana
Persamaan garis regresi linear sederhana merupakan dugaan bagi garis
regresi linear sederhana populasi
Dugaan bagi
Nilai dugaan Dugaan bagi kemiringan garis
y pada intersep β0 regresi β1
pengamatan
ke - i Nilai x pada
pengamatan

ŷ i  b 0  b1x i ke - i

Galat individu ei (residual) mempunyai rataan sebesar nol

ei  ( y i - yˆ i )  y i - (b0  b1x i )
Interpretasi koefisien
kemiringan dan intersep
 b0 adalah nilai dugaan rataan y ketika x bernilai nol (jika x = 0
dalam selang pengamatan)

 b1 adalah nilai dugaan perubahan rataan y (nilai harapan Y)


jika x berubah satu satuan
Menduga garis regresi
 Menduga garis regresi linear sederhana =
menduga parameter-parameter regresi β0 dan β1 :
 Penduga parameter yang dihasilkan harus merupakan
penduga yang baik
 Software statistik, seperti Minitab, SAS, SPSS, dll.
banyak digunakan
Contoh 1
• Berikut ini data mengenai pengalaman kerja dan penjualan
• x=pengalaman kerja (tahun)
• y=omzet penjualan (ribuan)

x 2 3 2 5 6 1 4 1
y 5 8 8 7 11 3 10 4

• Tentukan nilai b0 , b1 dan R2


• Buatkan persamaan regresinya!
• Berapa omzet penjualan dari seorang karyawan yg pengalaman
kerjanya 3,5 tahun
Contoh 1

n n

 (x i  x)(yi  y)  (x i  x )( yi  y )
30
30 rxy  i 1
  0,8183
b1  i 1
  1,25 n n
( 24 )( 56 )
n
 (x  x) 2
(y  y)2
 i
24
 2 i i
(x x ) i 1 i 1

i 1 𝑛 2
2 𝑖=1 𝑦𝑖 − 𝑦𝑖 18,5
𝑅 =1− =1− = 0,6696
b 0  y  b1x  7 - (1,25)(3)  3,25 𝑛
𝑖=1 𝑦𝑖 − 𝑦𝑖 2 56
Contoh 1
a. Diperoleh nilai b0 = 3,25 ; b1 = 1,25 ; rxy = 0,8183 ; dan R2 = 0,6696
b. Persamaan regresi linearnya adalah y = 3,25 + 1,25x
c. Nilai duga y jika x=3,5 adalah y = 3,25 + 1,25x
Y = 3,25 + 1,25(3,5)
= 7,625
Contoh 2
Diketahui suatu penelitian terhadap hubungan antara nilai biaya periklanan dengan tingkat
penjualan dari sebuah koperasi adalah sebagai berikut : (dalam ribuan rupiah)
Biaya periklanan Tingkat Penjualan
50 40
51 46
52 44
53 55
54 49

Tentukan persamaan regresinya ?


Berapa besarnya koefisien korelasi dan koefisien determinasinya ?
Contoh 2

 (x
n

i  x)(yi  y)  (x i  x )( yi  y )
27
27 rxy  i 1
  0,7582
b1  i 1
  2,7 n n
10 126,8
 (x (y
n
 x)  y)2
 (x
10 2

i  x) 2
i 1
i
i 1
i

i 1
𝑛 2
b 0  y  b1x  46,8 - (2,7)(52)  93,6 𝑅 =1−2 𝑖=1
𝑛
𝑦𝑖 − 𝑦𝑖
=1−
53,59
= 0,5749
𝑦𝑖 − 𝑦𝑖 2 126,8
𝑖=1
Contoh 2
Kesimpulan jawaban
1. Persamaan regresi linearnya adalah y = - 93,6 + 2,7x
2. Jika garis regresi ditunjukkan dengan persamaan y = - 93,6 + 2,7x maka
dapat diartikan bahwa tingkat penjualan akan bertambah sebesar 2,7 pada
setiap kenaikan biaya periklanan sebanyak 1 satuan
3. Nilai koefisien determinasi (R2) sebesar 0.5749, artinya sumbangan atau
pengaruh biaya periklanan terhadap naik turunnya tingkat penjualan
adalah sebesar 57,49%. Sisanya 42.51% disebabkan oleh faktor lain yang
tidak dimasukkan dalam model
4. Nilai koef korelasi (rxy) = 0,7582 artinya ada hubungan yang kuat dan positif
antara biaya periklanan dan tingkat penjualan
Contoh 2
Kesimpulan jawaban

Grafik pengaruh variabel x terhadap variabel y


TUGAS 4
Sebuah studi dilakukan di Virginia Tech
untuk menentukan apakah arm-strength
(kekuatan lengan) statis tertentu
memiliki pengaruh pada karakteristik
dynamic lift (pengangkatan beban secara
dinamis) pada seseorang. Sebanyak dua
puluh lima orang menjadi subjek
pengamatan untuk melakukan tes
kekuatan dan kemudian diminta untuk
melakukan tes angkat besi di mana
beban diangkat secara dinamis ke atas
kepala. Data hasil pengamatan dapat
dilihat pada tabel disamping
TUGAS 4
Dengan data tersebut tentukan
a) Bagaimanakah hubungan antara arm-
strength (kekuatan lengan) statis
tertentu dan karakteristik dynamic lift,
dengan menghitung koefisien korelasi
Pearson nya?
b) Tentukan persamaan regresinya dan
interpretasikan model regresi yang
terbentuk
c) Tentukan nilai 𝑦 jika nilai arm-strength
sebesar 30.
d) Sketsa grafik antara Galat individu
(residual) versus x (arm-strength)
TUGAS 4
Tugas dikerjakan TULIS TANGAN dan perhitungan menggunakan
EXCEL

Tugas yang ditulis dikertas / buku dengan tulis tangan dikumpulkan


berbentuk satu file pdf dan diberi nama

TUGAS 4_KELAS A_NIM

Untuk file excel juga dikumpulkan dan diberi nama

TUGAS 4 excel_KELAS A_NIM

Jumlah file yang dikumpulkan ada 2

Pengumpulan maksimal Kamis, 06 April 2023 jam 23.59 WITA.

Anda mungkin juga menyukai