Anda di halaman 1dari 18

REGRESI DAN KORELASI SEDERHANA

Analisis regresi merupakan studi mengenai ketergantungan satu variable dependen


(terikat) dengan satu atau lebih variable independen (bebas), yang tujuannya untuk mengestimasi
dan memprediksi besarnya suatu pengaruh variable dependen terhadap variable independennya.
Data yang digunakan untuk analisis regresi adalah data kuantitatif yang memiliki skala
pengukuran minimal interval. Dalam analisis regresi sederhana, hubungan antara variabel
bersifat linear, dimana perubahan pada variabel independen akan diikuti pada variabel Y secara
tetap.

Analisis korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik
pengukuran hubungan (measures of association). Analisis korelasi sederhana digunakan untuk
mengetahui keeratan hubungan antara dia variabel untuk mengetahui arah hubungan yang terjadi
(positif dan negatif).

A. ANALISIS REGRESI SEDERHANA


1. Pengertian Regresi Sederhana
Persamaan regresi adalah sebuah persamaan yang menunjukkan hubungan linear
antara variabel (Lind, Marchal, & Wathen). Bentuk umum dari persamaan regresi
sederhana adalah sebagai berikut:
𝒀 = 𝒂 + 𝒃𝑿
atau
𝒀𝒊 = 𝒃𝟎 + 𝒃𝟏 𝑿𝟏
Keterangan:
X = Variabel Independen (Variabel bebas yang mempengaruhi variable dependen)
Y = Variabel Dependen (Variabel yang diprediksi)
𝑎 = Konstanta, secara grafik menunjukkan intercept
b = Koefisien regresi yang menunjukkan besarnya pengaruh X terhadap Y, secara
grafik menunjukkan slope (kemiringan)
𝑌𝑖 = Variable dependen
𝑋𝑖 = Variabel Independen
𝑏0 = Konstanta
𝑏1 = Koefisien Regresi

Tujuan analisis regresi:


1. Mengetahui besarnya pengaruh perubahan tiap unit variable dependen terhadap
perubahan variabel independennya. Pengaruh perubahan tiap unit variabel
independen ditunjukkan oleh nilai koefisien regresi.
2. Menaksir nilai variabel dependen berdasarkan variabel independen yang
nilainya diketahui. Penaksiran ini bersifat deterministik (pasti) atau non-
stokastik, yaitu penaksiran atau prediksi yang dilakukan mengabaikan faktor
ketidakpastian.
3. Mendapatkan persamaan garis yang menunjukkan persamaan hubungan antara
dua variabel. Persamaan garis yang diperoleh disebut persamaan regresi.
2. Metode Pengukuran Regresi Sederhana
a. Least Square Method (LSM)
Persamaan Normal:
𝒀 = 𝒂 + 𝒃𝑿
Rumus:

𝑋 2 𝑌 − 𝑋 𝑋𝑌 𝑛 𝑋𝑌 − 𝑋 𝑌
𝑎= 𝑏=
𝑛 𝑋 2 − ( 𝑋) 2 𝑛 𝑋 2 − ( 𝑋) 2

b. Product Moment Method


Persamaan Normal:
𝒀 = 𝒂 + 𝒃𝑿
Rumus:

𝑌 − 𝑏 𝑋 𝑥𝑦
𝑎= 𝑏=
𝑛 𝑥2

Dengan ketentuan:

“Bahwa X dengan x adalah symbol yang berbeda begitu juga dengan Y dan
y”

Rumus:

𝑿. 𝒀
𝑥𝑦 = 𝑋𝑌 −
𝒏

( 𝑋) 2
𝑥 2 = ∑𝑋 2 −
𝒏

( 𝑌) 2
𝑦2 = 𝑌2 −
𝒏

B. ANALISIS KORELASI
Analisis Korelasi adalah sekumpulan teknik untuk mengukur hubungan antara dua
variable atau lebih dan untuk mengetahui arah hubungan yang terjadi (positif atau
negative). Koefisien korelasi menunjukkan seberapa besar hubungan yang terjadi antara
dua variable.
Dalam SPSS (Aplikasi mengolah data), terdapat tiga metode korelasi,
diantaranya:
1. Pearson Correlation digunakan untuk data berskala interval dan rasio
2. Kendall’s Tau-b digunakan untuk data berskala ordinal
3. Spearman Correlation digunakan untuk data berskala ordinal

a. Koefisien Korelasi (r)


Koefisien Korelasi adalah cara mengukur kekuatan dari hubungan linear dari dua
variable.
Karateristik dari Koefisien Korelasi:
1. Dinotasikan dengan huruf r
2. Menunjukkan arah dan kekuatan dari hubungan linear variable dengan
menggunakan skala interval dan rasio,
3. Rentang koefisien korelasi berkisar dari -1 sampai 1
4. Jika nilai r mendekati 0 maka tidak terdapat hubungan antara variable
5. Jika nilai r bernilai positif maka terdapat hubungan positif antara variable
(hubungannya berbanding lurus)
6. Jika nilai r bernilai negatif maka terdapat hubungan negative antara variable
(hubungannya berbanding terbalik)

Rumus:

Pearson Coefficient Correlation

𝑛 𝑋𝑌 − 𝑋 𝑌
𝑟=
{𝑛 𝑋 2 − ( 𝑋)2 }{𝑛 𝑌 2 − ( 𝑌)2 }
Product Moment

𝑥𝑦
𝑟=
𝑥2 𝑦2
Berikut merupakan interpretasi besarnya nilai koefisien korelasi (r):

 0 – 0,2 hubungan antar variable sangat lemah


 0,21 – 0,4 hubungan antar variable lemah
 0,41 – 0,6 hubungan antar variable cukup kuat
 0,61 – 0,8 hubungan antar variable kuat
 0,81 – 1 hubungan antar variable sangat kuat
b. Koefisien Determinasi (r2)
Koefisien determinasi menunjukkan kemampuan variable independen (X)
menerangkan mampu menjelaskan variable dependen (Y). semakin besar nilai
koefisien determinasi, maka semakin baik kemampuan variable X menerangkan
atau menjelaskan variable Y. (Suharyadi, 2004:217)
Rumus:
𝑟2
Cara interpretasi:

𝑟 2 × 100%

Koefisien non-determinasi adalah perbandingan total variasi terkait Y


yang dapat dijelaskan oleh variable diluar model. Koefisien non-determinasi
merupakan kebalikan dari koefisien determinasi.
𝑘 2 = (1 − 𝑟 2 )
Cara Intepretasi:

𝑘 2 = (1 − 𝑟 2 ) × 100%
c. Kesalahan Standar Estimasi (Standard Error of Estimate)
Standard Error of Estimate adalah suatu ukuran nilai kesalahan dalam model
regresi dalam memprediksi nilai Y. Jika Standard Error of Estimate kurang dari
standar deviasi Y, maka model regresi semakin baik dalam memprediksi Y.
Rumus:

Least Square Method Product Moment Method


𝑌2 − 𝑎 𝑌 − 𝑏 𝑋𝑌 𝑦 2 − 𝑏 𝑥𝑦
𝑆𝑌𝑋 = 𝑆𝑌𝑋 =
𝑛−𝑘−1 𝑛−𝑘−1

Keterangan:
n = banyaknya pasangan variable independen (X) dan variable dependen (Y)
k = banyaknya macam variable independen (X)

d. Penaksiran tentang Interval 𝒂 dan Interval 𝜷


Menaksir Interval 𝒂 Menaksir Interval 𝜷

Ketentuan: n > 30 Ketentuan: n > 30


𝒂 − 𝒁𝟏 𝑺𝒂 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 𝑎 + 𝒁𝟏 𝑺𝒂 𝒃 − 𝒁𝟏 𝑺𝒃 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝜷 < 𝑏 + 𝒁𝟏 𝑺𝒃
𝟐 𝟐 𝟐 𝟐

Ketentuan n ≤ 30 Ketentuan n ≤ 30
𝒂 − 𝒕𝟏 𝑺𝒂 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 𝑎 + 𝒕𝟏 𝑺𝒂 𝒃 − 𝒕𝟏 𝑺𝒃 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝜷 < 𝑏 + 𝒕𝟏 𝑺𝒃
𝜶 𝜶 𝜶 𝜶
𝟐 𝟐 𝟐 𝟐

𝑿𝟐 𝟏
𝑺𝒂 = 𝑺𝒀𝑿 . 𝑺𝒃 = 𝑺𝒀𝑿 .
𝒏 𝒙𝟐 𝒙𝟐

e. Pengujian tentang Koefisien Regresi


Menguji Konstanta α Menguji kontanta β
Langkah-langkah: Langkah-langkah:
1. Tentukan H0 dan HA 1. Tentukan H0 dan HA
2. H0 : Kontanta 𝑎 = 0 (tidak 2. H0 : Kontanta 𝛽 = 0 (tidak
berpengaruh signifikan) berpengaruh signifikan)
HA : Kontanta 𝑎 ≠ 0 (berpengaruh HA : Kontanta 𝛽 ≠ 0 (berpengaruh
signifikan) signifikan)
3. Tentukan t table atau 𝑡1𝑎 dengan df 3. Tentukan t table atau 𝑡1𝑎 dengan df
2 2
=n–k–1 =n–k–1
4. Tentukan thitung dengan: 4. Tentukan thitung dengan:
𝒂 − 𝒌𝒐𝒏𝒕𝒂𝒏𝒕𝒂 𝒂 𝒃 − 𝒌𝒐𝒏𝒕𝒂𝒏𝒕𝒂 𝜷
𝒕= 𝒕=
𝑺𝒂 𝑺𝒃
5. Tentukan daerah penolakan yaitu: 5. Tentukan daerah penolakan yaitu:
𝒕𝒉𝒊𝒕𝒖𝒏𝒈 < −𝒕𝟏𝒂 𝒂𝒕𝒂𝒖 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 > 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 < −𝒕𝟏𝒂 𝒂𝒕𝒂𝒖 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 >
𝟐 𝟐
𝒕𝟏𝒂 maka H0 ditolak 𝒕𝟏𝒂 maka H0 ditolak
𝟐 𝟐
−𝒕𝟏𝒂 ≤ 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 ≤ 𝒕𝟏𝒂 maka H0 tidak −𝒕𝟏𝒂 ≤ 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 ≤ 𝒕𝟏𝒂 maka H0 tidak
𝟐 𝟐 𝟐 𝟐
dapat ditolak dapat ditolak

−𝑡1 𝑡1
𝑎 𝑎
2 2
6. Kesimpulan
“Dengan tingkat signifikasi …%, maka (H0 ditolak/HA tidak dapat ditolak) dan
(tidak berpengaruh signifikan/berpengaruh signifikan)”

f. Interval Taksiran
Interval Taksiran untuk Y individu Interval taksiran untuk rata-rata
taksiran 𝝁𝒀𝑿
𝒀 − 𝒕𝟏 𝑺 𝒀 < 𝑌 < 𝒀 + 𝒕𝟏 𝑺 𝒀 𝒀 − 𝒕𝟏 𝑺𝒀 < 𝝁𝒀𝑿 < 𝒀 + 𝒕𝟏 𝑺𝒀
𝒂 𝒂 𝒂 𝒂
𝟐 𝟐 𝟐 𝟐
Dengan rumus 𝑺𝒀 Dengan rumus 𝑺𝒀
𝟏 (𝑿𝟎 − 𝑿)𝟐 𝟏 (𝑿𝟎 − 𝑿)𝟐
𝑺𝒀 = 𝑺𝒀𝑿 𝟏 + + 𝑺𝒀 = 𝑺𝒀𝑿 +
𝒏 𝒙𝟐 𝒏 𝒙𝟐

g. Pengujian Korelasi Populasi


Menguji apakah sampel berasal dari populasi yang berkorelasi
𝐻0 : 𝜌 = 0 (tidak berasal dari populasi yang berkorelasi)
𝐻𝐴 : 𝜌 ≠ 0 (berasal dari populasi yang berkorelasi)

Dengan rumus
𝑟 𝑛−2
𝑡=
1 − 𝑟2
Dengan degree of freedom = n – k – 1

H0 ditolak jika

−𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < −𝑡1𝑎 atau 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 < 𝑡1𝑎


2 2

h. Batas-batas Koefisien Korelasi Populasi 𝝆


Jika sampel tidak berasal dari populasi yang berkorelasi tidak perlu dihitung, jika
berkorelasi maka perlu untuk dihitung.
1 (1 + 𝑟) 1 (1 + 𝜌) 1 (1 + 𝑟)
𝑙𝑛 − 𝑍1𝑎 . 𝑆𝑟 < 𝑙𝑛 < 𝑙𝑛 + 𝑍1𝑎 . 𝑆𝑟
2 (1 − 𝑟) 2 2 (1 − 𝜌) 2 (1 − 𝑟) 2
Dengan Rumus 𝑆𝑟

1
𝑆𝑟 =
𝑛−3

C. PERBEDAAN REGRESI DAN KORELASI


Regresi mempelajari bentuk hubungan antar variable melalui persamaan. Regresi
bisa berupa sebab akibat. Dan regresi mengukur seberapa besar suatu variable
mempengaruhi variable yang lain, sehingga dapat digunakan untuk melakukan
peramalan nilai suatu variable berdasarkan variable lain.
Korelasi juga mempelajari hubungan antar variable tetapi digunakan untuk
melihat seberapa erat hubungan antar dua variabl kuantitatif dilihat dari besarya angka
dan bukan dari tandanya. Dengan menggunakan korelasi dapat mengetahui arah
hubungan yang terjadi dalam dua variable. Korelasi tidak bisa menyatakan hubungan
sebab akitat meskipun angka korelasinya tinggi.
CONTOH SOAL

1. Manajer pemasaran dari perusahaan STA mengumpulkan informasi tentang jumlah


panggilan panggilan yang dilakukan dan jumlah mesin fotokopi yang terjual untuk
sebuah sampel acak 10 penjual. Ia ingin menawarkan informasi spesifik tentang
hubungan antara jumlah panggilan penjualan dengan jumlah mesin fotokopi yang
terjual sebagai bagian dari presentasinya pada rapat penjualan selanjutnya. Gunakan
metode Least Square Method untuk menentukan persamaan garis yang menunjukkan
hubungan antata dua variable.
Berikut adalah table data panggilan penjualan dan jumlah mesin fotokopi yang
terjual.
Penjual Panggilan Penjualan Mesin yang terjual
Vinny 20 30
Rafid 40 80
Trisha 20 60
Jihan 30 30
Naqiya 10 40
Esti 10 40
Cyril 20 50
Yuvi 20 30
Dinda 40 70
Tita 40 70
Hitunglah:
a. Persamaan regresi dan interpretasinya
b. Standard Error of Estimate
c. Koefisien Korelasi, Determinasi dan Non-determinasi beserta penjelasannya
d. Pada tingkat signifikansi 10%, ujilah bahwa panggilan penjualan dapat
mempengaruhi mesin yang terjual
e. Jika panggilan penjualan adalah 35, berapakah mesin yang akan terjual

Jawab:

Panggilan Penjualan Mesin yang terjual


Y2 X2 XY
(X) (Y)
20 30 900 400 600
40 80 6400 1600 3200
20 60 3600 400 1200
30 30 900 900 900
10 40 1600 100 400
10 40 1600 100 400
20 50 2500 400 1000
20 30 900 400 600
40 70 4900 1600 2800
40 70 4900 1600 2800
𝑋2 = 𝑌2 = 𝑋𝑌 =
𝑋 = 250 𝑌 = 500 28200 7500 13900
a. Persamaan Regresi dan interpretasinya
Least Square Method
𝑋2 𝑌− 𝑋 𝑋𝑌
𝑎=
𝑛 𝑋2− 𝑋 2
7.500 500 − 250 13.900
= = 22
10 7.500 −(250)2
𝑛 𝑋𝑌 – 𝑋 𝑌
𝑏=
𝑛 𝑋2 − 𝑋 2
10 13.900 − 250 500
= = 1,12
10 7.500 − (250)2

Maka persamaan regresinya adalah 𝑌 = 22 + 1,12𝑋


Interpretasi:
Dalam persamaan regresi tersebut dapat diketahui jumlah rata-rata mesin yang
terjual tanpa dipengaruhi variable apapun adalahb sebesar 22 unit. Dan jika
dipengaruhi oleh jumlah panggilan penjualan, jika kenaikan 1 satuan jumlah
panggilan penjualan, maka akan menaikkan mesin yang terjual sebesar 1 unit
(satuan mesin), ceteris paribus.
Ceteris Paribus: Faktor lain dianggap konstan.
b. Standard Error of Estimate
Least Square Method

𝑌2 − 𝑎 𝑌 − 𝑏 𝑋𝑌
𝑆𝑌𝑋 =
𝑛−𝑘−1

28.200 − 22 500 − 1,12(13.900) 1.632


= = = 204 = 14,28285686
10 − 1 − 1 8
Interpretasi:
Jadi, rata-rata variable mesin yang terjual terhadap variable panggilan penjualan
adalah sebesar 14,29.
c. Koefisien Korelasi, Determinasi dan Non-determinasi beserta penjelasannya
Koefisien Korelasi:
𝑛 𝑋𝑌 − 𝑋 𝑌
𝑟=
𝑛 𝑋 2 − ( 𝑋)2 }{𝑛 𝑌 2 − ( 𝑌)2 }
10 13.900 − 250 (500)
= = 0,7
{10 7.500 − (250)2 }{10 28.200 − (500)2}

Koefisien korelasi dari jumlah panggilan penjualan dengan mesin yang terjual
adalah sebesar 0,7. Jadi, panggilan penjualan memiliki hubungan yang positif dan
bersifat kuat dengan mesin yang terjual..
Koefisien Determinasi dan non determinasi
𝑟 2 × 100% = 0,72 × 100% = 0,49 × 100% = 49%
𝑟 2 + 𝑘 2 = 100%

k 2= 100% - 49% = 51

Maka koefisien determinasi dari jumlah panggilan penjualan dan jumlah mesin
yang terjual adalah sebesar 49%. Artinya variable jumlah panggilan penjualan
(independen) mampu menjelaskan variable mesin yang terjual (dependen) sebesar
49% dan sisanya 51% dijelaskan variable lain diluar model.

d. Pada tingkat signifikansi 10%, ujilah bahwa panggilan penjualan dapat


mempengaruhi mesin yang terjual
Langkah-langkah:
1) Tentukan H0 dan HA
H0 : Kontanta 𝛽 = 0 (tidak berpengaruh signifikan)
HA : Kontanta 𝛽 ≠ 0 (berpengaruh signifikan)
2) Tentukan t table atau 𝑡1𝑎 dengan df = n – k – 1
2
𝒂 = 𝟎, 𝟏 df = 8 𝒕𝟏𝒂 = 𝟏, 𝟖𝟔𝟎
𝟐
3) Tentukan thitung dengan:
𝒃 − 𝒌𝒐𝒏𝒕𝒂𝒏𝒕𝒂 𝜷
𝒕=
𝑺𝒃

𝑌2− 𝑎 𝑌− 𝑏 𝑋𝑌
𝑆𝑌𝑋 = 𝑛−𝑘−1

28.200 − 22 500 −1,12 13.900


= = 14,28285686
10−1−1

2
𝟏 ( 𝑋) 2 (250)
𝑆𝑏 = 𝑺𝒀𝑿 . 𝒙𝟐
= 𝑥2 = 𝑋− 𝑛
= 7500 − 10
= 1250

1
𝑆𝑏 = 14,28285686 . = 0,011426285
1250
 Statistik Uji
𝑏−𝑘𝑜𝑛𝑡𝑎𝑛𝑡𝑎 𝛽 1,12−0
𝑡= = 0,011426285 = 98,01961005
𝑆𝑏

Tentukan daerah penolakan yaitu:

𝒕𝒉𝒊𝒕𝒖𝒏𝒈 < −𝒕𝟏𝒂 𝒂𝒕𝒂𝒖 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 > 𝒕𝟏𝒂 maka H0 ditolak


𝟐 𝟐
−𝒕𝟏𝒂 ≤ 𝒕𝒉𝒊𝒕𝒖𝒏𝒈 ≤ 𝒕𝟏𝒂 maka H0 tidak dapat ditolak
𝟐 𝟐
Ternyata 98.01961005 > 1,860 maka H0 ditolak
Kesimpulan:
Jadi dengan tingkat signifikansi 10%, maka terdapat pengaruh yang
signifikan antara panggilan penjualan terhadap mesin yang terjual
e. Jika panggilan penjualan adalah 35, berapakah mesin yang akan terjual
𝑌 = 𝑎 + 𝑏𝑋
𝑌 = 22 + 1,12 35
Jadi, jika panggilan penjualan sebesar 35kali, mesin yang terjual akan menjadi
61,2 atau 62 unit.
2. An important application of regression analysis in accounting is in the estimation of
cost. By collecting data on valume and cost and using Product Moment Method to
develop an estimate regression equation relating volume and cost, an accountant can
estimate the associated with a particular manufacturing volume. Consider the
following sample production volumes and total cost data for manufacturing operation.
Production Volume (units) Total Cost ($)
500 5000
550 6000
650 6400
700 6900
800 7400
850 8000
Determine:
a. The regression equation and give the interpretation
b. How much r and r2 and give the interpretation
c. The standard error of estimate and interpretation
(Production
Volume Total Cost X2 Y2 XY
(units) ($
500 5.000 250.000 25.000.000 2.500.000
550 6.000 302.500 36.000.000 3.300.000
650 6.400 422.500 40.960.000 4.160.000
700 6.900 490.000 47.610.000 4.830.000
800 7.400 640.000 54.760.000 5.920.000
850 8.000 722.500 64.000.000 6.800.000
4.050 39.700 2.827.500 268.330.000 27.510.000
d. With confidence level 95%, estimate interval constants 𝑎

Answer:

a. The regression equation and give the interpretation


Product Moment Method:

𝑋. 𝑌 4050 (39.700)
𝑥𝑦 = 𝑋𝑌 − = 27.510.000 − = 712.500
𝑛 6

𝑋 2 4.050 2
𝑥2 = 𝑋− = 2.827.500 − = 93.750
𝑛 6

( 𝑌) 2 (39.700) 2
𝑦2 = 𝑌− = 268.330.000 − = 5.648.333
𝑛 6

𝑥𝑦
𝑌 − 𝑏 𝑋 𝑏=
𝑎= 𝑥2
𝑛

39.700 − 7,6 (4.050)


𝑎= 712.500
6 𝑏= = 7,6
= 1.486,666667 93.750

So, the regression equation is 𝑌 = 1.486,666667 + 7,6𝑋. It means that average


production if not influenced by anything variable is about 1.486,666667 units or
1.487. and if fluenced by cost, in one US$/unit increasing in cost the average the
production will b increased about 7,6 US$/unit, ceteris paribus.

a. How much r and r2 and give the interpretation


Coeffiecient of correlation(r):
𝑥𝑦 712.500
𝑟= = = 0,979127129
𝑥2 𝑦2 93.750 (5.648.333)

So, the correlation between production and cost is 0,9791271. That means, the correlation
is very strong and positive, because the value is close to +1
Coeffiecient determination(r2):
𝑟 2 × 100% = 0,9791271292 × 100% = 95,8689878%
k2+ r2= 100%
k2= 100% - 95,8689878% = 4,131012205%
So, the variation of production van explain total variation of cost about
95,8689878% and the residual about4,131012205% is explained by variable outside
the model.
b. The standard error of estimate and interpretation
𝑦 2− 𝑏 𝑥𝑦 5.648.333− 7,6 (712.500)
𝑆𝑌𝑋 = = = 115,46963
𝑛−𝑘−1 4

So, the standard error of estimate is 115,46963. It means that varians od production can
explain real production about 115,46963.
c. With confidence level 95%, estimate interval constants 𝑎
𝑿𝟐 𝟐.𝟖𝟐𝟕.𝟓𝟎𝟎
Sa = 𝑺𝒀𝑿 . = 𝟏𝟏𝟓, 𝟒𝟔𝟗𝟒𝟑 . = 𝟐𝟓𝟖. 𝟖𝟖𝟓𝟏𝟎𝟓𝟗
𝒏 𝒙𝟐 𝟔(𝟗𝟑.𝟕𝟓𝟎)

𝒂 − 𝒕𝟏 𝑺𝒂 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 𝑎 + 𝒕𝟏 𝑺𝒂


𝜶 𝜶
𝟐 𝟐

df = 6 – 1 – 1 = 4

1.486,666667 − 2,775 × 𝟐𝟓𝟖. 𝟖𝟖𝟓𝟏𝟎𝟓𝟗 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 1.486,666667 +

2,775 × 𝟐𝟓𝟖. 𝟖𝟖𝟓𝟏𝟎𝟓𝟗


= 768,2604981 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 2.205,072839

So, with confidence level 95%, the limits of th estimate 𝑎 are constants in the population
regression 768,2604981 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 2.205,072839
SOAL ANALISIS REGRESI DAN KORELASI SEDERHANA

1. In this gives the per capita income to the nearest $100 and the percentage of the economic
represented by infrastructure reported by the World Bank World Development Indicators
for 2020 for 15 Latin America countries.
Percentage of Economy in
Countries Per Capita Income ($00)
Infrastructure
Argentina 76 6
Bolivia 10 16
Brazil 44 9
Chile 47 8
Colombia 23 14
Dominican Republic 19 11
Ecuador 13 12
El Salvador 19 10
Honduras 8 18
Mexico 44 5
Nicaragua 4 26
Panama 31 8
Peru 24 8
Uruguay 59 9
Venezuela 37 5
a. Estimate the regression equation with LSM and give the interpretation?
b. Find the coefficient of correlation and give the interpretation?
c. How much percentage of economy in infrastructure can explain income per capita?
And how much percentage of income per capita is explained from variables outside
the equation.
d. Determine standard error of estimate and interpretation?
e. At confidence level 95%, can we conclude that the sample comes from population
which have correlation interpretation?
2. The National Highway Association is studying the relationship between the number of
bidders on a highway project and the winning (lowest) bid for the project. Of particular
interest is whether the number of bidders increases or decreases the amount of the
winning bid.
Project Number of Winning Project Number of Winning Bid
Bidders Bid Bidders ($ millions)
($ millions)
1 9 5,1 9 6 10,3
2 9 8,0 10 6 8,0
3 3 9,7 11 4 8,8
4 10 7,8 12 7 9,4
5 5 7,7 13 7 8,6
6 10 5,5 14 7 8,1
7 7 8,3 15 6 7,8
8 11 5,5 16 9 6,8
a. Determine the regression equation with Product Moment Method, interpret the
equation. Do more bidders tend to increase or decrease the amount of the winning
bid?
b. Estimate the amount of the winning bid if there were seven bidders
c. A new entrance is to be constructed on the Ohio Turnpike. There are seven bidders on
the project. Develop a 95% prediction interval for the winning bid
d. Determine the coefficient of determination and interpret its value

3. In this table gives data for a random sample of 12 couples on the number of children they
have and the number of children they had stated they wanted at the time of their
marriage.
Couple 1 2 3 4 5 6 7 8 9 10 11 12
The
number
of
4 3 0 2 2 3 0 4 3 1 3 1
children
they
have
The
number
of
children
they 3 3 0 2 2 3 0 3 2 1 3 2
wanted
at the
time of
marriage
Calculate:
a. Regress the data with LSM method (Least Square Method and interpret that
b. Find the coefficient of determination also coefficient of non-determination and give
the interpretation?
c. Determine standard error of estimate and interpretation?
d. At confidence level 95%, can we conclude that the sample comes from population
which have correlation interpretation?
e. At confidence level 95%, please test the hypothesis that number of the children they
have affected the number of the children then wanted to have

4. Pemerintah ingin meneliti mengenai pengaruh jumlah penduduk miskin terhadap gini
ratio provinsi Jawa Barat dengan rentang waktu 10 tahun terakhir. Pemerintah sendiri
ingin mendapatkan hasil yang positif dan menggunakan data BPS Semester 1, coba
hitunglah:
Tahun Jumlah Penduduk Miskin Gini Ratio
(ribu jiwa)
2011 4.773,72 0,422
2012 4.477,53 0,423
2013 4.297,04 0,423
2014 4.327,07 0,433
2015 4.435,70 0,431
2016 4.224,33 0,413
2017 4.168,44 0,403
2018 3.615,79 0,407
2019 3.399,16 0,400
2020 3.920,23 0,403
a. Persamaan Regresi dengan Least Square Method dan interpretasinya
b. Koefisien Korelasi, Determinasi dan Non-determinasi
c. Standard error of estimate
d. Buktikan jika hasil penelitian pemerintah berpengaruh signifikan untuk mengentas
ketimpangan.(tingkat kepercayaan 95%)
e. Jika jumlah penduduk miskinnya sebesar 5.000. Berapakah angka gini rationya?
5. Arkha dan Arsakha ingin meneliti pengaruh penggunaan aplikasi Tiktok terhadap IQ
seseorang. Mereka mengambil sampel sebanyak 20 orang mahasiswa Universitas
Padjadjaran. Berikut table penggunaan Tiktok dan IQ 20 orang mahasiswa:
Tabel Tabulasi Data Penelitian (Data Fiktif)
Penggunaan
Mahasiswa Aplikasi Tiktok (x IQ
perhari)
Trisha 3 135
Rafid 4 128
Vinny 2 143
Yuvi 5 124
Naqiya 8 129
Jihan 5 116
Esti 1 134
Cyril 4 122
Tita 6 137
Dinda 7 145
Azka 9 123
Tama 4 148
Kiya 2 152
Yudi 0 132
Egi 0 135
Abhi 5 142
Budi 6 120
Eko 5 114
Catur 3 99
Ilham 8 100
Hitunglah:
a. Persamaan Regresi dari penelitian tersebut (menggunakan product moment method)
dan interpretasinya
b. Hitunglah koefisien korelasinya!
c. Berapa persen bahwa penggunaan Tiktok mahasiswa dapat menerangkan IQ
mahasiswa dan berapa persen IQ mahasiswa dijelaskan diluar model?
d. Standard Error of Estimate, beserta interpretasinya.
e. Pada tingkat kepercayaan 90%, ujilah bahwa penggunaan aplikasi Tiktok dapat
mempengaruhi IQ mahasiswa.
f. Jika penggunaan aplikasi Tiktok adalah 15 kali perhari, berapakan IQ seorang
mahasiswa?
6. Data dibawah ini merupakan data dari berat 20 unit mobil dalan ribuan pound dan
konsumsi bahan bakar dalam mil/gallon
𝑋 = 100 𝑋 2 = 900 𝑋𝑌 = 1700
𝑌 = 275 𝑌 = 7000

Berdasarkan data diatas, hitunglah:

a. Persamaan regresi (dengan 2 mtode: LSM dan Product Moment Method) dan berikan
interpretasinya
b. Standard error of estimate
c. Dengan tingkat signifikansi 5%, hitunglah estimasi interval constanta β
d. Ujilah β apakah berpengaruh secara signifikan terhadap model regresi diatas?
e. Hitunglah koefisien korelasi, determinasi dan non determinasi dan berikan
interpretasinya.

Anda mungkin juga menyukai