Anda di halaman 1dari 38

Bab 13

ANALISIS KORELASI DAN


REGRESI

Oleh:
Dr. Ary Yunanto, S.E., M.Si
FAKULTAS EKONOMI DAN BISNIS
UNIVERSITAS JENDERAL SOEDIRMAN
Definisi
 Analisis korelasi adalah kelompok teknik
statistik untuk mengukur hubungan
diantara dua variabel
 Dependen variabel (variabel terikat)
adalah variabel yang dapat diprediksi atau
diperkirakan (diskalakan dalam sumbu-Y)
 Independen variabel (variabel bebas)
adalah variabel yg menjadi dasar dari
perkiraan atau estimasi (diskalakan dalam
sumbu-X)
PENDAHULUAN
 Analisis regresi dan korelasi menyatakan
hubungan antara dua variabel atau lebih.
 Analisis regresi : menunjukkan bentuk
hubungan antara dua variabel atau
lebih→ persamaan regresi
 Analisis korelasi : menunjukkan kekuatan
hubungan antara dua variabel atau lebih
→ koefisien korelasi
ANALISIS REGRESI
 Regresi dikelompokkan menjadi 2 :
1. Regresi linier
Regresi linier terdiri dari :
a. Regresi linier sederhana :
* 1 variabel tak bebas (dependent)
1 variabel bebas (independent).
b. Regresi linier berganda
* 1 var tak bebas dan >1 var bebas
2. Regresi non-linier
Koefisien korelasi (r) adalah pengukuran
kekuatan hubungan diantara dua variabel

Memimliki nama lain Pearson's


dan Pearson's product moment diperlukan interval atau
correlation coeficient data yang sudah diukur
Jaraknya dari-1,00 Pearson's r
sampai 1,00
Nilai tersebut
mengindikasikan korelasi
yang sempurna dan kuat
-1 0 1

nilai negatif mengindikasikan nilai terdekat ke 0,0


hubungan kebalikan dan nilai mengindiasikan
yang lemah
korelasi
positif mengindikasikan
hubungan langsung
KEKUATAN DAN ARAH DARI KOEFISIEN KORELASI

Interval Koefisien Tingkat Hubungan


0.000 – 0.199 Sangat rendah
0.200 – 0.399 Rendah
0.400 – 0.599 Sedang
0.600 – 0.799 Kuat
0.800 – 1.000 Sangat kuat
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Korelasi Negatif
Sempurna
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X

Korelasi Positif
Sempurna
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X

Korelasi Nol
Korelasi Positif Kuat
10
9
8
7
6
Y 5
4
3
2
1
0
0 1 2 3 4 5 6 7 8 9 10
X
Untuk menghitung koefisien korelasi (r) digunakan
rumus berikut:

r= S(X – X)(Y – Y)
(n-1)sxsy

Rumus
untuk r
Koefisien determinasi (r2) adalah proporsi dari
variasi total pada variabel dependen (Y) yang
dijelaskan atau dihitung oleh variasi di variabel
independen (X)

Kuadrat koefisien korelasi memiliki jarak


dari 0 sampai 1.
Hal tersebut tidak memberikan informasi
apapun untuk arahan hubungan antar
variabel.
Contoh 1
Ketua BEM Universitas Negeri Toledo tertarik
mengenai harga buku untuk mahasiswa. dia
percaya bahwa ada hubungan antara jumlah
halaman dengan harga buku. untuk mengetahui
permasalahan lebih lanjut. dia mengambil
sampel yaitu 8 buku yang sedang dijual pada
toko buku. gambarlah diagram scatter dan
hitung koefisien korelasinya?
Buku Halaman Harga($)

Pengantar Ilmu Sejarah 500 84


Aljabar Dasar 700 75
Pengantar ilmu Psikologi 800 99
Pengantar Ilmu Sosiologi 600 72
Manajemen Bisnis 400 69
Pengantar Ilmu Biologi 600 81
Dasar-dasar Jazz 600 63
Dasar-dasar Keperawatan 800 93
Diagram Scatter
Scatter Diagram of Number of Pages and Selling Price of Text

100

90
Price ($)

80

70

60
400 500 600 700 800
Page
Halaman Harga

Rata-rata 625 Rata-rata 79.50


Std error 49 Std error 4.32
Median 600 Median 78
E Modus 600 Modus #NA
X Std Deviasi 139 Std Deviasi 12.21
C Sampel Varian 19.286 Sampel Varian 149.14
E Kurtosis -0.55 Kurtosis -0.77
L Kemiringan -0.16 Kemiringan 0.40
Jarak 400 Jarak 36
Minimum 400 Minimum 63
Maksimum 800 Maksimum 99
Jumlah 5000 Jumlah 636
Nilai 8 Nilai 8
S(X – X)(Y – Y)
(a) (b) (c) (d) (c)*(d)
Page
Hal Price
Harga Page - Mean(Page)
Halaman rata-rata Price-Mean(Price)
Harga rata-rata .
500 84 -125 4.5 (562.5)
700 75 75 -4.5 (337.5)
800 99 175 19.5 3,412.5
600 72 -25 -7.5 187.5
400 69 -225 -10.5 2,362.5
600 81 -25 1.5 (37.5)
600 63 -25 -16.5 412.5
800 93 175 13.5 2,362.5
7,800.0

Rata X =625 Example 1


Rata Y =79,50
continued
r= S(X – X)(Y – Y)
(n-1)sxsy
7800
= 7(138.87)(12.21)

= .657 r2 = .6572 = .432

Korelasi antara jumlah halaman dan harga buku


adalah 0.657. hal ini mengindikasikan adanya
hubungan yang sedang antara kedua variabel.
Menguji Signifikansi dari Koefisien Korelasi

Apakah nilai hitung r berasal dari


populasi dari observasi pasangan
dengan korelasi nol?

Ho: r = 0 (korelasi dalam populasi adalah nol)


H1: r ≠ 0 (korelasi dalam populasi bukan nol)

uji t untuk
koefisien t = r √ n- 22 dengan n-2 d.f.
korelasi √1- r
Nilai hitung r = 0.657. uji hipotesis menyatakan
bahwa tidak ada korelasi dalam populasi. maka
digunakan tingkat signifikasi 0.02

Langkah 1 Langkah 2
H0: korelasi dalam Tingkat
populasi adalah nol. signifikansi
H1: korelasi dalam adalah 0.02
populasi bukan nol.
Langkah 4
H0 Ditolak jika
Langkah 3
t>3.143 atau jika t<-3.143
Uji statistik
menggunakan Atau jika p < .02. derajat
kebebasanya adalah 6
distribusi t
karena n – 2 = 8 – 2 = 6.
Langkah 5
Temukan nilai statistiknya

t = r √ n- 22 = .657 √ 8 – 2 = 2.135
√ 1- r √ 1 - .6572
p(t > 3.143) atau p < 0.02 = Ho ditolak

Hasilnya = P(2.135 < 3.143) atau p > 0.02


H0 diterima. Hipotesis tidak dapat ditolak
karena tidak ada korelasi dalam populasi.
Analisis Regresi

Pada Analisis Regresi digunakan independen variabel


(x) untuk memperkirakan variabel dependen (Y)

hubungan antar kedua variabel


variabel adalah harus memenuhi
linear skala interval

kriteria least square


digunakan untuk
menentukan persamaan.
yang mana pola S(Y – Y’)2
is terminimalisir.
Persamaan Regresiya Y’= a + bX
Dimana y' adalah nilai prediksi rata-rata dari Y
terhadap X

a adalah Y-intercept untuk memperkirakan nilai y


ketika X=0

b adalah garis landai atau perubahan rata-rata Y'


untuk setiap satu unit pada X

dasar least square digunakan untuk memperoleh


a dan b
Dasar least square yang digunakan untuk
memperoleh a dan b. rumusnya adalah sebagai
berikut:

sy
b=r
sx a = Y – bX

Titik Potong Sumbu Y


Y = nilai rata2 dari Y
Gradien garis regresi X = nilai rata2 dari X
R = koefisien korelasi
Sy = stdev Y (var terikat)
Sx = stdev X (var bebas)
Pengembangan sy
b=r
persamaan regresi untuk sx
contoh kasus buku
dapat mengunakan = (.657) 12.21
138.87
rumus berikut.
= .0578

a = Y – bX = 79.5 - .0578*625 = 43.39


Persamaan regresinya Tanda dari nilai b
adalah; dan tanda dari nilai
Y’ = 43.39 + .0578X r akan selalu sama

Garis landainya adalah


0.0578 setiap pertambahan
halaman biayannya adalah Persamaan sumbu Y
satu nickel (hitungan pada $43.39. jadi
pecahan 1 dollar) sebuah buku tanpa
halaman berharga
$43.39.
Kita dapat menggunakan
persamaan regresi untuk
memperkirakan nilai Y

Perkiraan harga jual buku


dengan 800 halaman adalah
$89.61, berasal dari:
Harga = $43.39 + .0578(Jumlah halaman)
= $43.39 + .0578(800)
= $89.61
Perkiraan standar error digunakan untuk
mengukur Scatter atau peyebaran. Nilai
observasi untuk seluruh garis regresi.

Rumus yang
digunakan
untuk
mengukur
standar error
adalah
Find the standard error of estimate for the
problem involving the number of pages in
a book and the selling price.
Harga Haraga Deviasi Kuadrat
Deviation
Sebenarnya Estimated
Estimasi Deviasi
Actual price price Deviation Squared
2
(Y) (Y') (Y-Y') (Y-Y')
84 72.28 11.72 137.41
75 83.83 -8.83 78.03
99 89.61 9.39 88.15 593.33
=
72 78.06 -6.06 36.67 8−2
69 66.50 2.50 6.25
81 78.06 2.94 8.67
63 78.06 -15.06 226.67 = 9.944
93 89.61 3.39 11.48
0.00 593.33
Asumsi tentang Regresi Linear

Untuk setiap nilai X ada satu kelompok nilai Y dan nilai


Y berdistribusi normal

Nilai Y secara statistik independen. artinya pada


pemilihan sampel nilai Y dipilih untuk X tertentu yang
tidak bergantung pada nilai Y untuk nilai X lainnya.

Rata-rata untuk distribusi


normal untuk nilai Y
bergantung pada garis Standar Deviasi untuk
regresinya. distribusi normal sama
Interval nilai kepercayaan untuk nilai rata-rata Y yang
bersinggungan dengan nilai X didapat dengan:

1 (𝑥− 𝑥)ҧ 2
Y’ = ±𝑡 𝑆𝑦. 𝑥 𝑛
+ σ(𝑥−𝑥)ҧ 2

Y' adalah nilai prediksi untuk setiap nilai X


X adalah nilai X yang dipilih
X adalah nilai rata dari jumlah X
n adalah jumlah observasi
Sy.x adalah perkiraan standar error
t adalah nilai t pada derajat kebebasan n-2
Interval
Berdasarkan data sebelumnya perkiraan
harganya adalah $89.61, interval kepercayaan
diasumsikan adalah 95%. perhitunganya sebagai
berikut..

Page - Mean(Page) (Page - Mean(Page))2


-125 15625
75 5625
175 30625
-25 625
-225 50625
-25 625
-25 625
175 30625
135000
Y’ = $89.61
X = 800 halaman
X = 625, rata-rata halaman
n =8
Sy.x = 9.944
t = 2.447

1 (𝑥− 𝑥)ҧ 2
Y’ = ±𝑡 𝑆𝑦. 𝑥 𝑛
+ σ(𝑥−𝑥)ҧ 2

1 (800− 625)2
Y’ = 89.61 ± 9.944 2.447 +
8 135,000

Y’ = 89.61 ± 14.433
Prediction Interval
Interval prediksi untuk setiap nilai Y
yang bersinggungan dengan nilai X

1 (𝑥− 𝑥)ҧ 2
Y’ = ±𝑡 𝑆𝑦. 𝑥 1+ 𝑛
+ σ(𝑥−𝑥)ҧ 2

1 (800− 625)2
Y’ = 89.61 ± 9.944 2.447 1+ + 8 135,000

Y’ = 89.61 ± 28.292
Menyimpulkan Hasil

 Nilai perkiraan untuk sebuah buku dengan


800 halaman adalah $89.61
 Perkiraan Standar Error adalah $9.94.
 95% Interval Kepercayaan untuk semua buku
dengan 800 halaman adalah $89.61 + $14.43.
hal ini berarti batasnya adalah $75.18 dan
$104.04.
 95% Interval Kepercayaan untuk beberapa
buku dengan 800 halaman adalah $89.61+
$28.29. hal ini berarti batasnya adalah $61.32
dan $117.90.
 Berdasarkan hasil minitab dan perhitungan
excel.
Regression Statistics E
Multiple R 0.657 X
R Square 0.432
C
Adjusted R Square 0.337
Standard Error 9.944
E
Observations 8
L

ANOVA
Significance
df SS MS F F

Regression 1 450.67 450.67 4.5573034 0.0767


Residual 6 593.33 98.89
Total 7 1044

Standard
Coefficients Error t Stat P-value
Intercept 43.3889 17.277 2.511 0.0458193
Page 0.0578 0.027 2.135 0.0767009
Latihan soal
Jumlah Kotak, X Penjualan (ribuan dollar)
14 24
12 14
20 28
16 30
46 80
23 30
48 90
50 85
55 120
50 110

Tentukan:
a. Persamaan regresinya
b. Penjualan yang diestimasikan jika melakukan penjualan 40 kotak
c. Tentukan interval kepercayaan 0,95 persen untuk prediksi rata-ratanya bila X= 40
d. Tentukan interval prediksi 0,95 persen untuk prediksi individunya bila X = 40

Anda mungkin juga menyukai