Analisis korelasi merupakan teknik analisis yang termasuk dalam salah satu teknik
pengukuran hubungan (measures of association). Analisis korelasi sederhana digunakan untuk
mengetahui keeratan hubungan antara dia variabel untuk mengetahui arah hubungan yang terjadi
(positif dan negatif).
𝑋 2 𝑌 − 𝑋 𝑋𝑌 𝑛 𝑋𝑌 − 𝑋 𝑌
𝑎= 𝑏=
𝑛 𝑋 2 − ( 𝑋) 2 𝑛 𝑋 2 − ( 𝑋) 2
𝑌 − 𝑏 𝑋 𝑥𝑦
𝑎= 𝑏=
𝑛 𝑥2
Dengan ketentuan:
“Bahwa X dengan x adalah symbol yang berbeda begitu juga dengan Y dan
y”
Rumus:
𝑿. 𝒀
𝑥𝑦 = 𝑋𝑌 −
𝒏
( 𝑋) 2
𝑥 2 = ∑𝑋 2 −
𝒏
( 𝑌) 2
𝑦2 = 𝑌2 −
𝒏
B. ANALISIS KORELASI
Analisis Korelasi adalah sekumpulan teknik untuk mengukur hubungan antara dua
variable atau lebih dan untuk mengetahui arah hubungan yang terjadi (positif atau
negative). Koefisien korelasi menunjukkan seberapa besar hubungan yang terjadi antara
dua variable.
Dalam SPSS (Aplikasi mengolah data), terdapat tiga metode korelasi,
diantaranya:
1. Pearson Correlation digunakan untuk data berskala interval dan rasio
2. Kendall’s Tau-b digunakan untuk data berskala ordinal
3. Spearman Correlation digunakan untuk data berskala ordinal
Rumus:
𝑛 𝑋𝑌 − 𝑋 𝑌
𝑟=
{𝑛 𝑋 2 − ( 𝑋)2 }{𝑛 𝑌 2 − ( 𝑌)2 }
Product Moment
𝑥𝑦
𝑟=
𝑥2 𝑦2
Berikut merupakan interpretasi besarnya nilai koefisien korelasi (r):
𝑟 2 × 100%
𝑘 2 = (1 − 𝑟 2 ) × 100%
c. Kesalahan Standar Estimasi (Standard Error of Estimate)
Standard Error of Estimate adalah suatu ukuran nilai kesalahan dalam model
regresi dalam memprediksi nilai Y. Jika Standard Error of Estimate kurang dari
standar deviasi Y, maka model regresi semakin baik dalam memprediksi Y.
Rumus:
Keterangan:
n = banyaknya pasangan variable independen (X) dan variable dependen (Y)
k = banyaknya macam variable independen (X)
Ketentuan n ≤ 30 Ketentuan n ≤ 30
𝒂 − 𝒕𝟏 𝑺𝒂 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 𝑎 + 𝒕𝟏 𝑺𝒂 𝒃 − 𝒕𝟏 𝑺𝒃 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝜷 < 𝑏 + 𝒕𝟏 𝑺𝒃
𝜶 𝜶 𝜶 𝜶
𝟐 𝟐 𝟐 𝟐
𝑿𝟐 𝟏
𝑺𝒂 = 𝑺𝒀𝑿 . 𝑺𝒃 = 𝑺𝒀𝑿 .
𝒏 𝒙𝟐 𝒙𝟐
−𝑡1 𝑡1
𝑎 𝑎
2 2
6. Kesimpulan
“Dengan tingkat signifikasi …%, maka (H0 ditolak/HA tidak dapat ditolak) dan
(tidak berpengaruh signifikan/berpengaruh signifikan)”
f. Interval Taksiran
Interval Taksiran untuk Y individu Interval taksiran untuk rata-rata
taksiran 𝝁𝒀𝑿
𝒀 − 𝒕𝟏 𝑺 𝒀 < 𝑌 < 𝒀 + 𝒕𝟏 𝑺 𝒀 𝒀 − 𝒕𝟏 𝑺𝒀 < 𝝁𝒀𝑿 < 𝒀 + 𝒕𝟏 𝑺𝒀
𝒂 𝒂 𝒂 𝒂
𝟐 𝟐 𝟐 𝟐
Dengan rumus 𝑺𝒀 Dengan rumus 𝑺𝒀
𝟏 (𝑿𝟎 − 𝑿)𝟐 𝟏 (𝑿𝟎 − 𝑿)𝟐
𝑺𝒀 = 𝑺𝒀𝑿 𝟏 + + 𝑺𝒀 = 𝑺𝒀𝑿 +
𝒏 𝒙𝟐 𝒏 𝒙𝟐
Dengan rumus
𝑟 𝑛−2
𝑡=
1 − 𝑟2
Dengan degree of freedom = n – k – 1
H0 ditolak jika
1
𝑆𝑟 =
𝑛−3
Jawab:
𝑌2 − 𝑎 𝑌 − 𝑏 𝑋𝑌
𝑆𝑌𝑋 =
𝑛−𝑘−1
Koefisien korelasi dari jumlah panggilan penjualan dengan mesin yang terjual
adalah sebesar 0,7. Jadi, panggilan penjualan memiliki hubungan yang positif dan
bersifat kuat dengan mesin yang terjual..
Koefisien Determinasi dan non determinasi
𝑟 2 × 100% = 0,72 × 100% = 0,49 × 100% = 49%
𝑟 2 + 𝑘 2 = 100%
k 2= 100% - 49% = 51
Maka koefisien determinasi dari jumlah panggilan penjualan dan jumlah mesin
yang terjual adalah sebesar 49%. Artinya variable jumlah panggilan penjualan
(independen) mampu menjelaskan variable mesin yang terjual (dependen) sebesar
49% dan sisanya 51% dijelaskan variable lain diluar model.
𝑌2− 𝑎 𝑌− 𝑏 𝑋𝑌
𝑆𝑌𝑋 = 𝑛−𝑘−1
2
𝟏 ( 𝑋) 2 (250)
𝑆𝑏 = 𝑺𝒀𝑿 . 𝒙𝟐
= 𝑥2 = 𝑋− 𝑛
= 7500 − 10
= 1250
1
𝑆𝑏 = 14,28285686 . = 0,011426285
1250
Statistik Uji
𝑏−𝑘𝑜𝑛𝑡𝑎𝑛𝑡𝑎 𝛽 1,12−0
𝑡= = 0,011426285 = 98,01961005
𝑆𝑏
Answer:
𝑋. 𝑌 4050 (39.700)
𝑥𝑦 = 𝑋𝑌 − = 27.510.000 − = 712.500
𝑛 6
𝑋 2 4.050 2
𝑥2 = 𝑋− = 2.827.500 − = 93.750
𝑛 6
( 𝑌) 2 (39.700) 2
𝑦2 = 𝑌− = 268.330.000 − = 5.648.333
𝑛 6
𝑥𝑦
𝑌 − 𝑏 𝑋 𝑏=
𝑎= 𝑥2
𝑛
So, the correlation between production and cost is 0,9791271. That means, the correlation
is very strong and positive, because the value is close to +1
Coeffiecient determination(r2):
𝑟 2 × 100% = 0,9791271292 × 100% = 95,8689878%
k2+ r2= 100%
k2= 100% - 95,8689878% = 4,131012205%
So, the variation of production van explain total variation of cost about
95,8689878% and the residual about4,131012205% is explained by variable outside
the model.
b. The standard error of estimate and interpretation
𝑦 2− 𝑏 𝑥𝑦 5.648.333− 7,6 (712.500)
𝑆𝑌𝑋 = = = 115,46963
𝑛−𝑘−1 4
So, the standard error of estimate is 115,46963. It means that varians od production can
explain real production about 115,46963.
c. With confidence level 95%, estimate interval constants 𝑎
𝑿𝟐 𝟐.𝟖𝟐𝟕.𝟓𝟎𝟎
Sa = 𝑺𝒀𝑿 . = 𝟏𝟏𝟓, 𝟒𝟔𝟗𝟒𝟑 . = 𝟐𝟓𝟖. 𝟖𝟖𝟓𝟏𝟎𝟓𝟗
𝒏 𝒙𝟐 𝟔(𝟗𝟑.𝟕𝟓𝟎)
df = 6 – 1 – 1 = 4
So, with confidence level 95%, the limits of th estimate 𝑎 are constants in the population
regression 768,2604981 < 𝑘𝑜𝑛𝑠𝑡𝑎𝑛𝑡𝑎 𝑎 < 2.205,072839
SOAL ANALISIS REGRESI DAN KORELASI SEDERHANA
1. In this gives the per capita income to the nearest $100 and the percentage of the economic
represented by infrastructure reported by the World Bank World Development Indicators
for 2020 for 15 Latin America countries.
Percentage of Economy in
Countries Per Capita Income ($00)
Infrastructure
Argentina 76 6
Bolivia 10 16
Brazil 44 9
Chile 47 8
Colombia 23 14
Dominican Republic 19 11
Ecuador 13 12
El Salvador 19 10
Honduras 8 18
Mexico 44 5
Nicaragua 4 26
Panama 31 8
Peru 24 8
Uruguay 59 9
Venezuela 37 5
a. Estimate the regression equation with LSM and give the interpretation?
b. Find the coefficient of correlation and give the interpretation?
c. How much percentage of economy in infrastructure can explain income per capita?
And how much percentage of income per capita is explained from variables outside
the equation.
d. Determine standard error of estimate and interpretation?
e. At confidence level 95%, can we conclude that the sample comes from population
which have correlation interpretation?
2. The National Highway Association is studying the relationship between the number of
bidders on a highway project and the winning (lowest) bid for the project. Of particular
interest is whether the number of bidders increases or decreases the amount of the
winning bid.
Project Number of Winning Project Number of Winning Bid
Bidders Bid Bidders ($ millions)
($ millions)
1 9 5,1 9 6 10,3
2 9 8,0 10 6 8,0
3 3 9,7 11 4 8,8
4 10 7,8 12 7 9,4
5 5 7,7 13 7 8,6
6 10 5,5 14 7 8,1
7 7 8,3 15 6 7,8
8 11 5,5 16 9 6,8
a. Determine the regression equation with Product Moment Method, interpret the
equation. Do more bidders tend to increase or decrease the amount of the winning
bid?
b. Estimate the amount of the winning bid if there were seven bidders
c. A new entrance is to be constructed on the Ohio Turnpike. There are seven bidders on
the project. Develop a 95% prediction interval for the winning bid
d. Determine the coefficient of determination and interpret its value
3. In this table gives data for a random sample of 12 couples on the number of children they
have and the number of children they had stated they wanted at the time of their
marriage.
Couple 1 2 3 4 5 6 7 8 9 10 11 12
The
number
of
4 3 0 2 2 3 0 4 3 1 3 1
children
they
have
The
number
of
children
they 3 3 0 2 2 3 0 3 2 1 3 2
wanted
at the
time of
marriage
Calculate:
a. Regress the data with LSM method (Least Square Method and interpret that
b. Find the coefficient of determination also coefficient of non-determination and give
the interpretation?
c. Determine standard error of estimate and interpretation?
d. At confidence level 95%, can we conclude that the sample comes from population
which have correlation interpretation?
e. At confidence level 95%, please test the hypothesis that number of the children they
have affected the number of the children then wanted to have
4. Pemerintah ingin meneliti mengenai pengaruh jumlah penduduk miskin terhadap gini
ratio provinsi Jawa Barat dengan rentang waktu 10 tahun terakhir. Pemerintah sendiri
ingin mendapatkan hasil yang positif dan menggunakan data BPS Semester 1, coba
hitunglah:
Tahun Jumlah Penduduk Miskin Gini Ratio
(ribu jiwa)
2011 4.773,72 0,422
2012 4.477,53 0,423
2013 4.297,04 0,423
2014 4.327,07 0,433
2015 4.435,70 0,431
2016 4.224,33 0,413
2017 4.168,44 0,403
2018 3.615,79 0,407
2019 3.399,16 0,400
2020 3.920,23 0,403
a. Persamaan Regresi dengan Least Square Method dan interpretasinya
b. Koefisien Korelasi, Determinasi dan Non-determinasi
c. Standard error of estimate
d. Buktikan jika hasil penelitian pemerintah berpengaruh signifikan untuk mengentas
ketimpangan.(tingkat kepercayaan 95%)
e. Jika jumlah penduduk miskinnya sebesar 5.000. Berapakah angka gini rationya?
5. Arkha dan Arsakha ingin meneliti pengaruh penggunaan aplikasi Tiktok terhadap IQ
seseorang. Mereka mengambil sampel sebanyak 20 orang mahasiswa Universitas
Padjadjaran. Berikut table penggunaan Tiktok dan IQ 20 orang mahasiswa:
Tabel Tabulasi Data Penelitian (Data Fiktif)
Penggunaan
Mahasiswa Aplikasi Tiktok (x IQ
perhari)
Trisha 3 135
Rafid 4 128
Vinny 2 143
Yuvi 5 124
Naqiya 8 129
Jihan 5 116
Esti 1 134
Cyril 4 122
Tita 6 137
Dinda 7 145
Azka 9 123
Tama 4 148
Kiya 2 152
Yudi 0 132
Egi 0 135
Abhi 5 142
Budi 6 120
Eko 5 114
Catur 3 99
Ilham 8 100
Hitunglah:
a. Persamaan Regresi dari penelitian tersebut (menggunakan product moment method)
dan interpretasinya
b. Hitunglah koefisien korelasinya!
c. Berapa persen bahwa penggunaan Tiktok mahasiswa dapat menerangkan IQ
mahasiswa dan berapa persen IQ mahasiswa dijelaskan diluar model?
d. Standard Error of Estimate, beserta interpretasinya.
e. Pada tingkat kepercayaan 90%, ujilah bahwa penggunaan aplikasi Tiktok dapat
mempengaruhi IQ mahasiswa.
f. Jika penggunaan aplikasi Tiktok adalah 15 kali perhari, berapakan IQ seorang
mahasiswa?
6. Data dibawah ini merupakan data dari berat 20 unit mobil dalan ribuan pound dan
konsumsi bahan bakar dalam mil/gallon
𝑋 = 100 𝑋 2 = 900 𝑋𝑌 = 1700
𝑌 = 275 𝑌 = 7000
a. Persamaan regresi (dengan 2 mtode: LSM dan Product Moment Method) dan berikan
interpretasinya
b. Standard error of estimate
c. Dengan tingkat signifikansi 5%, hitunglah estimasi interval constanta β
d. Ujilah β apakah berpengaruh secara signifikan terhadap model regresi diatas?
e. Hitunglah koefisien korelasi, determinasi dan non determinasi dan berikan
interpretasinya.