Anda di halaman 1dari 43

KORELASI dan KOVARIANS

RM184305 - Statistika

Ira Mutiara Anjasmara, PhD

Departemen Teknik Geomatika


Fakultas Teknik Sipil, Lingkungan, dan Kebumian
Institut Teknologi Sepuluh Nopember
Deskripsi dan Jenis-jenis Korelasi

Statistik seringkali digunakan untuk mencari hubungan antara dan


diantara kejadian. Sebagai contoh, apakah umur manusia mempunyai
hubungan dengan tekanan darah? atau apakah tingkat kecemasan
mahasiswa berhubungan dengan nilai yang didapat?

Korelasi mengukur hubungan antara dua atau lebih variabel. Korelasi


digunakan untuk menyatakan bentuk hubungan antar variabel dengan
tingkat kekuatan dan arahnya.

-IM Anjasmara, 2019-

RM184305 - Statistika 2/41 KORELASI dan KOVARIANS


Korelasi

Jika dua variabel acak, x dan y berkorelasi, maka hubungan yang


mungkin terjadi adalah:
1. x menyebabkan y, atau y menyebabkan x :
contoh, jarak perjalanan dengan penggunaan BBM;
volume air yang diminum dengan temperatur cuaca
2. Adanya variabel ketiga z , mempengaruhi kedua variabel x dan
y:
contoh, ketinggian terbang dalam foto udara mempengaruhi
skala foto dan akurasi pengeplotan
3. Tingkat hubungan antar variabel yang diamati dapat berubah.
4. Dapat merupakan kombinasi dari hal-hal yang dijelaskan
sebelumnya.
-IM Anjasmara, 2019-

RM184305 - Statistika 3/41 KORELASI dan KOVARIANS


Data Bivariat

Data bivariat adalah dua buah data yang mempunyai hubungan


tertentu. Jenis data ini seringkali diekspresikan sebagain pasangan
x ; y (contoh: lintang, bujur )

Data bivariat dapat disajikan dalam bentuk scatter plot, yaitu


plotting dari seluruh pasangan data dalam sebuah sistem sumbu
koordinat. Plot tersebut berguna untuk menggambarkan hubungan
antara kedua variabel.

Garis ‘best-fit’ yang melewati keseluruhan data disebut sebagai garis


regresi (akan dibahas kemudian).

-IM Anjasmara, 2019-

RM184305 - Statistika 4/41 KORELASI dan KOVARIANS


Contoh 1
Populasi vs area untuk State dan Teritory di Australia adalah sebagai
berikut (data 2001):
State Populasi Area (km2 )
ACT 310,200 23,000
NSW 6,411,700 802,000
NT 192,900 1,346,000
QLD 3,512,400 1,727,000
SA 1,493,100 984,000
TAS 470,300 68,000
VIC 4,712,200 228,000
WA 1,861,000 2,526,000
Totals: 18,963,800 7,704,000

-IM Anjasmara, 2019-

RM184305 - Statistika 5/41 KORELASI dan KOVARIANS


Contoh 1

Dapat dilihat dari grafik bahwa tidak terlihat adanya korelasi yang
jelas antara jumlah populasi dengan luas area.
-IM Anjasmara, 2019-

RM184305 - Statistika 6/41 KORELASI dan KOVARIANS


Korelasi

Tingkat korelasi yang terjadi antar vaiabel dapat dilihat dengan


mengamati pola dari scatter plot.

Tingkat korelasi yang mungkin terjadi adalah:


sempurna
baik
buruk
tidak ada korelasi
Selain itu dapat pula dilihat apakah korelasi yang terjadi bersifat:
positif
negatif

-IM Anjasmara, 2019-

RM184305 - Statistika 7/41 KORELASI dan KOVARIANS


Korelasi Sempurna
Semua pengamatan dari kedua variabel tempat berada pada garis
regresi. Dalam hal ini, jika diketahu nilai x maka nilai y bisa
ditentukan dengan kemungkinan absolut.

-IM Anjasmara, 2019-

RM184305 - Statistika 8/41 KORELASI dan KOVARIANS


Korelasi Baik
Hubungan antara variabel sangat kuat sehingga nilai-nilai
pengamatan terdistribusi dengan baik di sekitar garis regresi

-IM Anjasmara, 2019-

RM184305 - Statistika 9/41 KORELASI dan KOVARIANS


Korelasi Buruk
Korelasi yang buruk terjadi pada saat nilai-nilai pengamatan tersebar
jauh dari garis regresi.

-IM Anjasmara, 2019-

RM184305 - Statistika 10/41 KORELASI dan KOVARIANS


Tidak Ada Korelasi
Tidak adanya korelasi antar variable terjadi pada saat nilai
pengamatan x mempunyai asosiasi yang beragam dengan nilai y
(mulai dari kecil, menengah dan besar) dan tidak membentuk pola
regresi yang jelas.

-IM Anjasmara, 2019-

RM184305 - Statistika 11/41 KORELASI dan KOVARIANS


Korelasi Positif

Korelasi positif terjadi pada saat nilai x yang kecil berasosiasi dengan
nilai y yang juga kecil dan nilai x yang besar berasosiasi dengan nilai
y yang juga besar.
mengidikasikan korelasi langsung antar variabel
berasosiasi dengan garis regresi dengan nilai gradien/kemiringan
positif

-IM Anjasmara, 2019-

RM184305 - Statistika 12/41 KORELASI dan KOVARIANS


Korelasi Negatif

Terjadi pada saat nilai x yang kecil cenderung berasosiasi dengan


nilai y yang besar dan nilai x yang besar cenderung berasosiasi
dengan nilai y yang kecil.
mengidikasikan korelasi terbalik antar variabel
berasosiasi dengan garis regresi dengan nilai gradien/kemiringan
negatif

-IM Anjasmara, 2019-

RM184305 - Statistika 13/41 KORELASI dan KOVARIANS


Kovarians

Kovarians adalah ukuran derajat hubungan linier antara dua


variabel.
Menggambarkan seberapa besar nilai y bergantung pada nilai x ,
dan sebaliknya.
Kovarians didefinisikan sebagai jumlah dari perkalian antar
deviasi seluruh nilai x dan nilai y dari masing-masing nilai
rata-ratanya.

-IM Anjasmara, 2019-

RM184305 - Statistika 14/41 KORELASI dan KOVARIANS


Kovarians Populasi

1 X N
xy = ( xi  x ) ( yi y ) (1)
N i =1

Kovarians Sampel

X
n
sxy =n 1
1 i =1
(x i x ) ( yi y) (2)

-IM Anjasmara, 2019-

RM184305 - Statistika 15/41 KORELASI dan KOVARIANS


Contoh 2
Apakah terdapat hubungan antara jumlah iklan (x )yang ditayangkan
pada hari Jumat malam dengan besarnya penjualan pada hari Sabtu
(y) di 7 toko yang berbeda (A-G)
Toko x y xi x yi y (x i x ) ( yi y)
A 2 24 -1 -1 1
B 5 28 2 3 6
C 1 22 -2 -3 6
D 3 26 0 1 0
E 4 25 1 0 0
F 1 24 -2 -1 2
G 5 20 2 1 2
 17

sxy = 17
6
= 2; 833
-IM Anjasmara, 2019-

RM184305 - Statistika 16/41 KORELASI dan KOVARIANS


Rumus alternatif:

Rumus yang lebih akurat dan lebih cepat untuk menghitung


kovarians:
2 3
P
N P
N
6XN xi yi 7
xy =
1 6
6 x i yi =
i 1 =
i 1 7
7
4 5
N =
i 1 N

2 P
n P
n 3
6X n xi yi 7
sxy =n1 6 x i yi i 1= i 1= 7
1 4 i =1 n 5

-IM Anjasmara, 2019-

RM184305 - Statistika 17/41 KORELASI dan KOVARIANS


Contoh 3

Dari data penjualan pada Contoh 2

Toko x y xy
A 2 24 48
B 5 28 140
21  175
 
C
D
1
3
22
26
22
78
sxy = 16 542 7
E 4 25 100 = 2; 833
F 1 24 24
G 5 26 130
 21 175 542

-IM Anjasmara, 2019-

RM184305 - Statistika 18/41 KORELASI dan KOVARIANS


Latihan
Seorang petani jeruk ingin mengetahui hubungan antara ukuran jeruk
dengan banyaknya jus yang dihasilkan. Lima buah jeruk diukur
diameternya dan diperas dengana hasil sebagai berikut:

diameter jeruk, xi (inci) 3 5 4 4 5


volume jus, yi (ml) 22 30 28 21 28

a. Buat scatter diagram dari data.


b. Dari scatter diagram yang dibuat, apa yang dapat disimpulkan
mengenai hubungan antara kedua variabel?
c. Hitung nilai kovarians sampel dan jelaskan.
c. Hitung nilai koefisien korelasi sampel dan jelaskan.
-IM Anjasmara, 2019-

RM184305 - Statistika 19/41 KORELASI dan KOVARIANS


Koefisien Korelasi

Nilai koefisien korelasi menunjukan derajat/tingkat hubungan antara


distribusi frekuensi dari kedua data

Terdapat beberapa teknik penentuan nilai koefisien korelasi yang


penggunaanya bergantung dari data yang akan dianalisa.

Dalam kuliah ini yang akan dibahas adalah:


Koefisien Korelasi Pearson
Koefisien perangkingan Spearman

-IM Anjasmara, 2019-

RM184305 - Statistika 20/41 KORELASI dan KOVARIANS


Koefisien Korelasi Pearson

Koefisien korelasi Pearson merupakan rasio antara variansi gabungan


dengan variansi total dari data.
Koefisien Korelasi Populasi
xy
xy = (3)
x y
Koefisien Korelasi Sampel

rxy = ssxys (4)


x y

rxy merupakan estimasi tanpa bias dari xy


-IM Anjasmara, 2019-

RM184305 - Statistika 21/41 KORELASI dan KOVARIANS


Koefisien Korelasi Pearson

Koefisien korelasi Pearson mempunyai karakteristik:


menggambarkan ukuran dari kekuatan dan arah hubungan linier
mempunyai nilai dengan skala numerik
hanya dapat digunakan untuk data interval dan data rasio
Hal-hal yang mempengaruhi nilai korelasi Pearson:
nilai kovariansi antar data
standar deviasi dari kedua data
jumlah dari nilai yang berpasangan

-IM Anjasmara, 2019-

RM184305 - Statistika 22/41 KORELASI dan KOVARIANS


Koefisien Korelasi Pearson

Koefisien korelasi Pearson mempunyai nilai antara -1 sampai +1,


dimana:
Koefisien 0 menunjukan tidak adanya korelasi antara data
Koefisien +1 menunjukan adanya korelasi positif sempurna
Koefisien -1 menunjukan adanya korelasi negatif sempurna
Nilai korelasi tidak bergantung pada dimensi/satuan dari variabel
Contoh:
Hubungan antara tinggi dan berat anak:
rxy (SI) = 0; 442
rxy (imperial) = 0; 442

-IM Anjasmara, 2019-

RM184305 - Statistika 23/41 KORELASI dan KOVARIANS


Contoh 3
Dari data penjualan
Toko x y x2 y2 xy
A 2 24 4 76 48
B 5 28 25 784 140
C 1 22 1 484 22
D 3 26 9 676 78
E 4 25 16 625 100
F 1 24 1 576 24
G 5 26 25 676 130
 21 175 81 4397 542

-IM Anjasmara, 2019-

RM184305 - Statistika 24/41 KORELASI dan KOVARIANS


Contoh 3
Dari data penjualan
Toko x y x2 y2 xy
A 2 24 4 76 48
B 5 28 25 784 140
C 1 22 1 484 22
D 3 26 9 676 78
E 4 25 16 625 100
F 1 24 1 576 24
G 5 26 25 676 130
 21 175 81 4397 542

21 175
rxy =q 542
212
q 7
1752
= p 17p = 0; 854
81 4397 18 22
7 7
-IM Anjasmara, 2019-

RM184305 - Statistika 24/41 KORELASI dan KOVARIANS


Titik keputusan (Decision Point)

Bagaimana cara untuk menentukan bahwa suatu nilai


korelasi adalah signifikan atau tidak?

Di antara nilai korelasi 0 dan 1 terdapat sebuah nilai yang


merupakan batas untuk memutuskan apakah terjadi korelasi linier
atau tidak. Jika rxy lebih kecil dari nilai tersebut, maka dapat
dikatakan tidak terdapat korelasi yang berarti.
Nilai tersebut dinamakan sebagain titik keputusan

-IM Anjasmara, 2019-

RM184305 - Statistika 25/41 KORELASI dan KOVARIANS


Titik keputusan (Decision Point)

Nilai titik keputusan bergantung pada ukuran sampel:


Ukuran sampel Titik keputusan
5 0.878
10 0.632
20 0.444
40 0.311
100 0.196

-IM Anjasmara, 2019-

RM184305 - Statistika 26/41 KORELASI dan KOVARIANS


Contoh

Dalam contoh kasus data tinggi vs berat, dari ukuran sampel 5 anak
didapatkan nilai korelasi 0,442.

Dari tabel, diketahui bahwa titik keputusan untuk ukuran sampel 5


adalah 0,878. Maka dapat dikatakan bahwa tidak terdapat korelasi
yang signifikan antara berat anak dan tingginya.

-IM Anjasmara, 2019-

RM184305 - Statistika 27/41 KORELASI dan KOVARIANS


Kesalahan dalam interpretasi

Berikut adalah hal-hal yang perlu diperhatikan pada saat


menginterpretasikan nilai koefisien korelasi:
korelasi tidak menggambarkan hubungan sebab akibat
koefisien korelasi didapat dari data yang tidak linier
adanya pengaruh dari variabel ketiga yang menyebabkan
terjadinya kesalahan interpretasi
ukuran sampel yang digunakan kurang besar

-IM Anjasmara, 2019-

RM184305 - Statistika 28/41 KORELASI dan KOVARIANS


Kesalahan dalam interpretasi

Korelasi tidak menggambarkan hubungan sebab akibat

Koefisien korelasi mengindikasikan sebuah hubungan antara dua


variabel pengamatan, x dan y. Akan tetapi nilai tersebut tidak
menggambarkan bahwa x menyebabkan y dan sebaliknya.

-IM Anjasmara, 2019-

RM184305 - Statistika 29/41 KORELASI dan KOVARIANS


Contoh
Terdapat data yang menunjukan korelasi antara curah hujan bulanan
di gurun sahara dengan prosentasi kehadiran mahasiswa Statistika
sebagai berikut:
Bulan Curah hujan (mm) Kehadiran mahasiswa (%)
Feb 27 100
Mar 16 92
Apr 12 65
May 2 24
Jun 0 5

Dari data tersebut didapatkan nilai koefisien korelasi 0,95 yang


artinya berkorelasi tinggi.

Apakah hubungan antara kedua variabel tersebut make sense?


-IM Anjasmara, 2019-

RM184305 - Statistika 30/41 KORELASI dan KOVARIANS


Kesalahan dalam interpretasi

Koefisien korelasi didapat dari data yang tidak linier

Koefisien korelasi mengasumsikan hubungan linier antar variabel.

Jika terjadi hubungan non-linier yang sempurna, maka rxy = 0, dan


akan terjadi kesalahan dalam pengambilan kesimpulan.

-IM Anjasmara, 2019-

RM184305 - Statistika 31/41 KORELASI dan KOVARIANS


Contoh
Data pengamatan dalam gambar di bawah ini menunjukan hubungan
y = (x 4)2 + 1, akan tetapi nilai koefisien korelasinya, rxy = 0

Untuk hubungan polinomial seperti gambar di atas akan lebih tepat


jika menggunakan persamaan polinomial dari data x dan y.-IM Anjasmara, 2019-
RM184305 - Statistika 32/41 KORELASI dan KOVARIANS
Kesalahan dalam interpretasi

Adanya variabel ketiga

Seringkali terdeteksi sebuah variabel lain, z , dimana variabel x dan y


mungkin berkorelasi. Sehingga secara tidak langsung variabel x dan
y terlihat saling berkorelasi karena keduanya berkorelasi dengan z .
Contoh:
variabel waktu yang secara tidak langsung muncul dalam suatu
data
misalnya x adalah tekanan darah, y adalah denyut nadi, maka
mungkin muncul varibel z yang merupakan berat pasien.

-IM Anjasmara, 2019-

RM184305 - Statistika 33/41 KORELASI dan KOVARIANS


Contoh

Data batimetri dapat diturunkan secara langsung dari data echo


sounding atau melalui inversi data pengamatan gayaberat di laut.
Misalnya x adalah data medan gayaberat, y adalah batimetri laut
(diturunkan dari data gayaberat), dan z adalah batimetri laut
(diturunkan dari echo sounding ).

Maka korelasi antara x dan y akan menghasilkan korelasi antara x


dan x itu sendiri. Dalam kasus ini korelasi yang harus diperhitungkan
adalah antara x dan z supaya didapatkan nilai yang realistis.

-IM Anjasmara, 2019-

RM184305 - Statistika 34/41 KORELASI dan KOVARIANS


Contoh

Hubungan yang tidak realistis juga dapat muncul pada saat dilakukan
pengukuran variabel x dan y, kemudian dicoba untuk mencari
korelasi antara x dan rasio xy . Analisa korelasi yang melibatkan nilai
rasio perlu dilakukan secara hati-hati dengan memperhatikan
varibel-variabel yang terlibat.

-IM Anjasmara, 2019-

RM184305 - Statistika 35/41 KORELASI dan KOVARIANS


Kesalahan dalam interpretasi

Ukuran sampel tidak mewakili populasi

Secara statistik, sangat berbahaya mengambil kesimpulan dari sampel


yang tidak mewakili populasi. Hal ini seringkali disebut sebagai
permasalahan ekstrapolasi.

-IM Anjasmara, 2019-

RM184305 - Statistika 36/41 KORELASI dan KOVARIANS


Matriks Varians-Kovarians

Matriks varians-kovarians adalah matriks yang berisi hubungan antara


variabel-variabel dalam data set. Elemen dari dari matriks merupakan
nilai varians dan kovarians antara variabel-variabel dalam data
statistik.

-IM Anjasmara, 2019-

RM184305 - Statistika 37/41 KORELASI dan KOVARIANS


Matriks Varians-Kovarians

Matriks variansi-kovariansi dari populasi yang terdiri dari 2 variabel:


" #
xx2 xy
xy yy
2

Matriks variansi-kovariansi dari populasi yang terdiri dari 3 variabel:


2 2
3
sxx sxy sxz
6 2
4 syx syy syz 7
5
2
szx szy szz

Matriks variansi-kovariansi selalu berupa matriks simetri.

-IM Anjasmara, 2019-

RM184305 - Statistika 38/41 KORELASI dan KOVARIANS


Contoh
Dari data bivariat diketahui bahwa:

2
sxx = 3; 4
2
syy = 19; 8
sxy = 5:33

Susun matriks variansi-kovariansinya

-IM Anjasmara, 2019-

RM184305 - Statistika 39/41 KORELASI dan KOVARIANS


Contoh
Dari data bivariat diketahui bahwa:

2
sxx = 3; 4
2
syy = 19; 8
sxy = 5:33

Susun matriks variansi-kovariansinya


" #
3; 4 5; 33
5; 33 19; 8

-IM Anjasmara, 2019-

RM184305 - Statistika 39/41 KORELASI dan KOVARIANS


Latihan
Dari pengukuran sipat datar, dilakukan pencatatan nilai sudut
inklinasi pada line-of-sigt dan temperatur pada saat pengukuran.
Didapatkan data sebagai berikut:
Temperatur ( ) inklinasi (00 ) Temperatur ( ) inklinasi (00 )
25.4 - 0.3 13.4 2.1
25.3 - 0.3 14.2 1.8
25.2 - 0.3 16.6 1.2
19.4 0.9 18.2 - 1.0
15.9 1.8 19.8 - 0.7
14.8 2.4 20.8 - 1.2
14.6 2.1 21.8 - 1.8
14.2 2.4 22.4 - 2.4
13.8 1.8 22.8 - 2.0
13.8 3.0
-IM Anjasmara, 2019-

RM184305 - Statistika 40/41 KORELASI dan KOVARIANS


Latihan

Dari pengukuran sipat datar, dilakukan pencatatan nilai sudut


inklinasi pada line-of-sigt dan temperatur pada saat pengukuran.
Buat matriks varians-kovarians berdasarkan data pada tabel dan
hitung koefisien korelasi dari antara temperatur dan sudut inklinasi.
Simpulkan bagaimana hubungan antara kedua variabel tersebut.

-IM Anjasmara, 2019-

RM184305 - Statistika 41/41 KORELASI dan KOVARIANS

Anda mungkin juga menyukai