Anda di halaman 1dari 36

MATERI KULIAH II

Korelasi Antar Variabel :

Contoh :
Merosotnya produksi padi mungkin karena pupuknya kurang
Naiknya tekanan darah mungkin karena peningkatan berat badan
Naiknya penjualan mungkin karena naiknya biaya advertensi
Naiknya harga bahan makanan mungkin karena naiknya harga minyak
Dll.

Uraian di atas menunjukkan adanya hubungan (korelasi) antara kejadian satu


dengan yang lainnya.

Kejadian itu dapat dinyatakan dengan perubahan nilai variabel ;


Misalnya :
X variabel harga maka naik turunnya harga dapat dinyatakan dengan adanya
perubahan nilai X
Y variabel penjualan maka naik turunnya hasil penjualan dapat dinyatakan dengan
perubahan nilai Y
Apabila dua variabel X dan Y mempunyai hubungan, maka nilai variabel X
yang sudah diketahui dapat digunakan untuk memperkirakan /menaksir Y.

Variabel Y yang nilainya akan diramalkan disebut variabel tidak bebas


(dependent variable), sedangkan variabel X yang nilainya dipergunakan
untuk meramal nilai Y disebut variabel bebas (independent variable) atau
variabel peramal (prediktor) dan seringkali disebut variabel yang
menerangkan (explanatory)

Korelasi digunakan untuk mengetahui hubungan seberapa besar kaitan


antara satu variabel dengan variabel lainnya

Hubungan dua variabel ada yang positif ada yang negatif

Koefisien korelasi akan bertanda negatif bila kaitan/hubungan antar


variabel adalah negatif atau tidak searah. Artinya semakin besar nilai-nilai
dari suatu variabel (x) semakin kecil nilai variabel lainnya (Y) demikian
sebaliknya semakin kecil nilai-nilai variabel X semakin besar nilai variabel
Y.
Koefisien korelasi akan bertanda positif bila kaitan/hubungan antar
variabel bersifat searah. Artinya semakin besar nilai-nilai dari suatu
variabel (x) semakin besar pula nilai variabel lainnya (Y) demikian
sebaliknya semakin kecil nilai-nilai variabel X semakin kecil pula nilai
variabel Y.

Contoh hubungan negatif :


X = jumlah akseptor Y = jumlah kelahiran
X = harga suatu barang Y = permintaan barang
X = pendapatan masyarakat Y = kejahatan ekonomi
Contoh hubungan positip :
X = pupuk Y = produksi
X = harga suatu barang Y = hasil penjualan
X = pendapatan masyarakat Y = kejahatan ekonomi

Nilai korelasi/koefisien korelasi p atau r akan bergerak antara -1 sampai 1


Y

X
Hubungan positif

-1 ≤ r ≤ 1

X
Hubungan negatif
Koefisien korelasi = 1, hubungan X dan Y sempurna dan positf
(menyatakan hubungan yang pasti. Artinya variabel Y secara pasti dapat
diterangkan oleh variabel X. r  mendekati 1, yaitu hubungan sangat kuat
dan positif)
Koefisien korelasi = -1, hubungan X dan Y sempurna dan negatif
(menyatakan hubungan yang pasti. Artinya variabel Y secara pasti dapat
diterangkan oleh variabel X . r  mendekati -1, yaitu hubungan sangat kuat
dan negatif)
Koefisien korelasi = 0 menyatakan tidak ada kaitan antar variabel

Disini nilai X dikatakan mempengaruhi Y, jika berubahnya nilai X akan


menyebabkan perubahan nilai Y, artinya naik turunnya X akan membuat nilai
Y juga naik turun, sehingga nilai Y akan bervariasi, baik terhadap rata-rata Y
maupun terhadap garis linier yang mewakili diagram pencar.

B erapa besar konstribusi Xterhadap naik turunnya Y ? Untuk itu dihitung


dengan suatu koefisien yaitu disebut koefisien penentuan (koefisiden
determination) yang sering dinotasi dengan KP atau R atau r2

Jika r = 0,9 maka nilai KP = R = (0,9)2 = 0,81 (= 81%) yaitu


sumbangan variabel X terhadap naik turunnya Y adalah 81%,
sedangkan 19 % disebabkan oleh faktor lainnya.
Menentukan koefisien korelasi

Apabila data variabel yang dilibatkab adalah dua-duanya (X dan Y) paling


sedikit interval, maka korelasi dihitung dengan cara seperti :

Variabel X Variabel Y
X1 Y1
X2 Y2
. .
. .
Xn Yn

Koefisien Korelasi Pearson (Pearson’s product moment coefficient) dihitung


dengan menggunakan rumus :
n n n
n ∑ XiYi - (∑ Xi) (∑ Yi)
i =1
i=1 I =1

p atau r = (1)
n n
2 2 2 2
n∑X i
- (∑Xi) n∑Y i
- ( ∑ Y i)
I =1 I =1
n
∑xiyi
i=1

r = n n (2)

∑ xi2 ∑yi2
i =1 i=1

Contoh 1 : Jika X adalah persentase kenaikan biaya iklan dan Y adalah


persentase kenaikan hasil penjualan, maka berdasarkan tabel dibawah ini
hitunglah koefisien korelasi (r )
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Penyelesaian

X Y X – X (x) Y – Y (y) x2 y2 xy
1 2 -5,25 -5,75 27.5625 33.0625 30.1875
2 4 -4,25 -3,75 18.0625 14.0625 15.9375
4 5 -2,25 -2,75 5.0625 7.5625 6.1875
5 7 -1,25 -0,75 1.5625 0.5625 0.9375
7 8 0,75 0,25 0.5625 0.0625 0.1875
9 10 2,75 2,25 7.5625 5.0625 6.1875
10 12 3,75 4,25 14.0625 18.0625 15.9375
12 14 5,75 6,25 33.0625 39.0625 35.9375
∑ x = 50 ∑Y = 62 ∑xi = 0 ∑yi = 0 107.5 117.5 111.5
X = 6,25 Y = 7,75
n
∑xyi
i=1

r = n n
2
∑x i
∑yi2
i =1 i=1

111,5
=
107,5 117,5

= 0,99

Hubungan antara X dan Y ternyata sangat kuat dan positif, artinya kenaikan
biaya iklan pada umumnya menaikkan hasil penjualan.
2
Dari nilai r, dicari KP = r = R (koefisien determinasi) = 0,9801 (=98%).
Artinya sumbangan biaya iklan terhadap variasi Y (naik turunnya hasil
penjualan) adalah 98 % sedangkan sisanya yang 2 % disebabkan oleh faktor
–faktor lainnya, seperti harga dan daya beli masyarakat.
Penyelesaian

X Y X2 Y2 XY
1 2 1 4 2
2 4 4 16 8
4 5 16 25 20
5 7 25 49 35
7 8 49 64 56
9 10 81 100 90
10 12 100 144 120
12 14 144 196 168
∑ X = 50 ∑Y = 62 ∑Xi2= 420
∑Y2 = 598 ∑XY = 499
X = 6,25 Y = 7,75
8 (499) – (50)(62)
r =
2
8(420) – (50) 8 (598)-(62)2

= 0,99

Contoh : 2
X Y X2 Y2 XY
2 15 4 225 30
4 14 16 196 56
5 12 25 144 60
6 10 36 100 60
8 9 64 81 72
10 8 100 64 80
11 6 121 36 66
13 4 169 16 52
14 3 196 9 42
15 2 225 4 30
∑ X = 88 ∑Y = 62 ∑X 2= 956
i ∑Y2 = 875 ∑XY = 548
10 (548) – (88 ) (83)
r =
2 2
10 (956) – (88) 10(875)-(83)

= -0,99
2
Kesimpulan : Hubungan X dan Y kuat dan negatif. KP = R = r = 98 %

Koefisen Korelasi untuk data yang disajikan dalam tabel distribusi frekuensi
dengan menggunakan kelas-kelas kategori.

Rumusnya adalah sbb :

n(∑uvf) – (∑ufu)(vfv)
R =
n(∑u2fu) –(ufu)2 - n (∑v2fv) – (∑vfv)2
Contoh : ada 100 orang mahasiswa Akademi Ilmu Statistik, Jakarta
mengikuti ujian statistik dan matematika. Ada suatu pendapat bahwa pada
umunya mahasiswa yang kemampuan matematikanya lemah akan
mengalami kesukaran dalam belajar statistik, yakni kalau nilai
matematikanya rendah, nilai statistiknya juga rendah dan kalau nilai
nmatematikanya tinggi statistiknya juga tinggi. Dengan perkataan lain, ada
hubungan positif antara niloai ujian matematika (X) dan nilai ujian statistik
(Y). Setelah ujian diperoleh hasil sebagai berikut :
Tabel A. Nilai Ujian Matematika dan Statistika
Matematika
Statistika Jumlah
40 - 69 50 - 59 60 - 69 70 - 79 80 - 89 90 - 99
(1) (2) (3) (4) (5) (6) (7) (8)
90 – 99 2 4 4 10
80 – 89 1 4 6 5 16
70 – 79 5 10 8 1 24
60 – 69 1 4 9 5 2 21
50 – 59 3 6 6 2 17
40 – 49 3 5 4 12
Jumlah 7 15 25 23 20 10 100
Kelas
nilai
Nilai
Tengah u f
u
Kelas
nilai
Nilai
tengah v fv
Matema (X) Statisti (Y)
tika ka
(1) (2) (3) (4) (1) (2) (3) (4)
40-49 44,5 -2 7 90-99 44,5 2 10
50-59 54,5 -1 15 80-89 54,5 1 16
60-69 64,5 0 25 70-79 64,5 0 24
70-79 74,5 1 23 60-69 74,5 -1 21
80-89 84,5 2 20 50-59 84,5 -2 17
90-99 94,5 3 10 40-49 94,5 -3 12
u -2 -1 0 1 2 3 fv
v
(1) (2) (3) (4) (5) (6) (7) (8)
2 2 4 4 10
1 1 4 6 5 16
0 5 10 8 1 24
-1 1 4 9 5 2 21
-2 3 6 6 2 17
-3 3 5 5 12

f u
7 15 25 23 20 10 100
Tabel Korelasi
(I) (II) (III) (IV) (V)
v fv vfv v2fv uvf
2 4 4 2 10 20 40 44
1 4 6 5 1 16 16 16 31
5 10 8 1 0 24 0 0 0
1 4 9 5 2 -1 21 -21 21 -3
3 6 6 2 -2 17 -34 68 20
3 5 4 -3 12 -36 108 33
(VI) u -2 -1 0 1 2 3 100 -55 253 125
(VII) fu 7 15 25 23 20 10 100
(VIII) ufu -14 -15 0 23 40 30 64
(IX) u2fu 28 15 0 23 80 90 236
(X) uvf 32 31 0 -1 24 39 125

uvf = (1)(2)(2)+(2)(4)(2)+(3)(4)(2) = 4 + 16 + 24 = 44
ufv = (-2)(3)(-3)+(-1)(5)(-3)+(0)(4)(5) = +18+15 +0 =33
Dari tabel korelasi di atas dapat dihasilkan sebagai berikut :

n = 100 ∑ufu = 64 ∑u2fu = 236

∑uvf = 125 ∑vfv = -55 ∑v2fv = 253

n(∑uvf) – (∑ufu)(vfv)
r =
n(∑u2fu) –(ufu)2 - n (∑v2fv) –
(∑vfv)2

100 (125) - (64)(-55)


r =
100 (236) – (64)2 – 100(253) – (-55)2
Kesimpulan :

Hubungan antara nilai matematikan dan statistika cukup kuat dan positif. Artinya, nilai
matematika yang diperoleh akan mempengaruhi nilai statistika. Pada umumnya
mahasiswa dengan nilai matamatika yang rendah akan memperoleh niloai ujian
statistika yang rendah dan sebaliknya jika nilai matematikanya tinggi, maka niloai
statistikanya akan tinggi juga.

Korelasi untuk data rank (peringkat)


Misalkan ada dua orang Joni dan Tono yang sama-sama pengemar rokok.
Kedua orang tersebut diminta untuk memberikan nilai terhadap 10 merk rokok. Rokok
yang paling digemari diberi nilai 1 dan seterusnya sampai rokok yang tidak disenangi
diberi nilai 10. Tono dan Joni diminta untuk memberikan rank (nilai/peringkat)
Pemberian rank bisa dibalik yakni rokok yang disenangi diberi nilai 10 dan yang paling
tidak disenangi diberi nilai 1. Hasil pemberian nilai adalah sebagari berikut :
Rank Hipotesis Nilai Rokok Joni dan Tono

Nomor Urut Merek Rokok Rank Joni Rank Tono


1 Kansas 9 8
2 Jarum 5 3
3 555 10 9
4 Bentoel 1 2
5 Mascot 8 7
6 Malboro 7 10
7 Sejati 3 4
8 A Mild 4 6
9 Gudang Garam 2 1
10 Dunhill 6 5
Untuk mencari kpefisien korelasi antara rank Jono dan Tono terhadfap 10 merk
rokok menggunakan rumus korelasi Spearman sbb :
2
6∑ dj
r rank =1 -
n (n2 – 1)

Rank Tono 8 3 9 2 7 10 4 6 1 5
Rank Joni 9 5 10 1 8 7 3 4 2 6
Selisih Rank -1 -2 -1 1 -1 3 1 2 -1 -1
(d)
d2 1 4 1 1 1 9 1 4 1 1

6 (1 + 4 + 1 + 1 + ……..+ 1 + 1
r rank =1 -
10 (102 – 1)

= 1 – 0,1455 = 0,85
Korelasi data Kualitatif

Data kualitatif berupa kategori-kategori :


Contoh : penduduk dikategorikan berpendapatan tinggi,
sedang/menengah, dan rendah.
Ingin mengetahui apakah ada hubungan antara selera
konsumen dengan letak geografis;
Antara kedudukan orang tua dengan kedudukan anak;
Antara pendidikan dan pendapatan.

Untuk mengukur hal tersebut digunakan Contyngeny


Coeffisient (Koefisien Bersyara/Cc) yang mempunyai
pengertian sama seperti koefisien korelasi.
Nilai Cc = 0  tidak ada hubungan;
Tetapi nilai batas Cc # 1 tetapi bergantung atau sebagai
fungsi banyaknya kategori (baris atau kolom
Batas tertinggi nilai Cc ialah (r-1)/r, di mana nilai r ialaah banyaknya baris atau
kolom. Kalau jumlah baris tidak sama dengan kolom, pilih nilai yang terkecil

χ2
Rumus Cc =
χ2 + n
p q q q p q

n = ∑ ∑fij = ∑ n = ∑n = ∑ ∑ n = jumlah
i. .j ij
i=1 j=1 i=1 j=1 i=1 j=1
observasi
p q
(fij – eij)2
Χ2 = ∑ ∑ eij
i=1 j=1

Dimana fij = nij = frekuensi atau banyaknya observasi baris I kolom ke j;


i = 1, 2, 3, ......... p;
j = 1, 2, 3, ......... q;
II
1 2 …. j …. q ….
I
(1) (2) (3) (4) (5) (6) (7) (8)
f11 f12 f1j f1q
1 n1.
(e11) (e12) (e1j) (e1q)
f21 f22 f2j f2q n2.
2
(e21) (e22) (e2j) (e2q)
..
..

fi1 fi2 fij fiq ni .


i
(ei1) (ei2) (eij) (eiq)

..
..
fp1 fp2 Fpj fpq
p np .
(ep1) (ep2) (epj) (epq)

n.1 n.2 n. j n.q n


Catatan :

fij = frekuensi kategori i & j Kalau nilai pembandingan Cc


dengan batas tertinggi < 0,50
eij = frekuensi harapan kategori I & j
maka hubungan lemah
eij n.i – n.j Frekuensi harapan Terletak antara 0.50 dan 0,75 maka
= = hubungan sedang/cukup
n (expected frequency) Antara 0,75 dan 0,90 maka
hubungan kuat’antara 0,90 dan 1
q p
maka hubungan sangat kuat
n.i = ∑ fij ∑ n i. = n Sama dengan 1 maka hubungan
j =1 I=1
sempurna

q q

n.j = ∑ fij ∑ n.j = n


j =1 I=1

p q

∑ ∑ nij = n
i =1 j = 1
Contoh : Untuk mengetahui apakah ada hubungan antara tingkat pendidikan ibu
rumah tangga dengan konsumsi susu dari anggota keluarga mereka, dilakukaan
penelitian yang hasilnya disajikan pada tabel berikut :

Konsumsi
Pendidikan
Kurang Cukup Sangat cukup
(1) (2) (3) (4)
Tidak tamat SLA 82 65 12
Tamat SLA 59 112 24
Pernah masuk PT 37 94 42

Hitung Contingensi Coefficient (Cc) untuk mengukur hubungan antara tingkat


pendidikan dan konsumsi susu

Untuk memudahkan kita buat tabel sbb. :


II
1 2 3 Jumlah
I
(1) (2) (3) (4) (5)
82 65 13
1 n1 =159
(53,70) (81,76) (23,53)
59 112 24
2 n2=193
(65,86) (100,28) (28,86)
37 94 42
3 n3 = 173
(58,43) (88,96) (25,61)
Jumlah n1=178 n2 =271 n3 = 78 n -527
n1 – n1 (159)(178)
e11 = = = 53,70
n 527
n1 – n2 (159)(271)
e12 = = = 81,76
n 527
e13 n1 – n3 (159)(78)
= = = 23,53
n 527
n2 – n1 (195)(178)
e21 = = = 65,86
n 527
e22 n2– n2 (195)(271)
= = = 100.28
n 527
e23 n2 – n3 (195)(78)
= = = 28.86
n 527
n3 – n1 (173)(178)
e31 = = = 58.43
n 527
e32 n3 – n2 (173)(271)
= = = 88.96
n 527
n3 – n3 (173)(78)
e33 = = = 25,61
3 3

∑ ∑ (fij –eij)2 (f11 –e11)2 (f12–e12)2 (f13–e13)2 (f21–


e21)2
χ2= = + + +
i =1 j = 1
eij e11 e12 e13 e21

(f22 –e22)2 (f23 –e23)2 (f31 –e31)2 (f32 –e32)2 (f33 –


+ + 2
+ + + e33)
e22 e23 e31 e32 e33

(28,30)2 + (-16,76)2 + (-11,53)2 + (-6,86)2 + (11,72)2 + (-4.86)2 +


=
53,70 81,76 23,53 65.86 100,28 28,86

(28,30)2 + (-16,76)2 + (-11,53)2


58.43 88,96 25,61

χ2
Cc = √ χ +n2
= √ 45,54
45,54-527
= 0,28
Karena jumlah baris dan jumlah kolom sama dengan 3, maka r sama dengan 3.

Batas atas Cc ialah √(3-1)/3 = 0,82.

Karena nilai perbandingan Cc dengan batas atas (0,28/0,82) lebih kecil dari 0,50,
maka hubungan atau korelasi antara tingkat pendidikan ibu rumah tangga dengan
tingkat konsumsi susu anggota rumah tangga tidak begitu besar, atau lemah
ANALISIS REGRESI
Analisis regresi menyatakan hubungan antara beberapa karakter
yang dinyatakan dalam bentuk variabel tak bebas (dependent
variable) sebagai fungsi dari variable bebas (independent variable)
yang mempengaruhinya.
Tujuan dari analisis regresi adalah untuk mengetahui hubungan
antara dua variabel atau lebih

ANALISIS REGRESI LINIER SEDERHANA


Analisis regresi disebut sebagai “sederhana” (simple) bila hanya
satu variable bebas yang tersangkut di dalamnya, dan disebut
sebagai ganda (multiple) bila terdapat lebih dari satu variabel bebas.
Digunakan untuk menganalisa bentuk hubungan antara dua variabel atau
lebih.

Pada analisis regresi telah diketahui variabel mana yang variasinya


dipengaruhi (dependent) oleh variabel lainnya dan mana yang
mempengaruhinya.

Variabel yang dipengaruhi disebut sebagai variabel tak bebas atau


dependent variable dan variabel yang mempengaruhi disebut variabel
bebas (independent variabel)

Analisis regresi berbeda dengan analisis varians dalam hal tujuan dari
analisis tersebut.
Dalam analisis varians kita tidak mencari hubungan antara variabel-
variabel yang dipelajari, melainkan melainkan membandingkan efek dari
variabel-variabel tersebut.
• Hubungan Linier Antara Dua Variabel
• Analisis regresi disebut linier bila hubungan antara
variabel tak bebas Y dan variabel bebas X bersifat
linier, artinya bila perubahan dari Y selalu konstan per
unit perubahan dari X.
• Apabila dua variable X dan Y mempunyai hubungan
(korelasi) maka perubahan nilai variabel yang satu
akan mempengaruhi nilai variabel lainnya.
• Hubungan variabel dapat dinyatakan dalam bentuk
fungsi Y = f (X)  contoh : Y = 2 + 1,5 X.
• Apabila bentuk fungsinya sudah diketahui, maka
dengan mengetahui nilai dari satu variabel (= X), nilai
variabel lainnya ( = Y ) dapat diprakirakan atau
diramalkan.
• Data hasil ramalan dapat menggambarkan
kemampuan untuk waktu yang akan datang, sangat
berguna untuk perencanaan. Misalnya ramalan
produksi padi dan jumlah penduduk untuk keperluan
impor beras.
• Dalam persamaan Y = 2 + 1,5 X,
• Y = variabel tidak bebas, sebab nilainya tergantung
pada nilai X.
• Kalau X = 10, Y = 2 + 1,5 (10) = 17 dan kalau X = 20, Y
= 2 + 1,5 (20) = 32.
• Untuk membuat ramalan Y dengan menggunakan
nilai X, X dan Y harus mempunyai hubungan yang
kuat. Kuat tidaknya hubungan X dan Y diukur
dengan suatu nilai yang disebut koefisien korelasi,
sedangkan besarnya pengaruh X terhadap Y diukur
dengan koefisien regresi.
• Asumsi fungsi linier mempunyai bentuk persamaan
Y = βo + β1 X
• βo dan β1 adalah konstanta atau parameter, yang
nilainya harus diestimasi.
• βo = jarak titik asal O dengan perpotongan antara
sumbu tegak Y dan garis fungsi linier atau besarnya
nilai Y kalau X = 0; disebut koefisien intersep.
• β1 = koefisien arah = koefisien regresi = besarnya
pengaruh X terhadap Y, kalau X = 1 unit. Disebut
koefisien slope.
• Pers. Y = βo + β1 X bisa ditulis Y = A + BX atau Y =
B1 + B2 X2
• Untuk Persamaan Y = 2 + 1,5 X, βo = 2, β1 = 1,5;
artinya kalau X = 0, Y = 2, kalau X bertambah 1 unit,
Y bertambah 1,5 unit.
• Secara teoritis jika X = 10 maka Y = 2 + 1,5 (10) = 17;
dalam kenyataannya tidaklah demikian karena yang
mempengaruhi Y tidak hanya X tetapi ada faktor lain
yaitu kesalahan pengganggu atau error sehingga
bentuk persamaannya menjadi Y = βo + β1X + ε

Anda mungkin juga menyukai