Anda di halaman 1dari 42

KOVARIANS DAN KORELASI

RM184305 - Statistika

Ira Mutiara Anjasmara, PhD

Departemen Teknik Geomatika


Fakultas Teknik Sipil, Perencanaan, dan Kebumian
Institut Teknologi Sepuluh Nopember
Capaian Pembelajaran

Minggu Sub CPMK Materi Pembelajaran Bobot

5 Mampu melakukan perhitungan Kovariansi dan Korelasi 10%


ukuran hubungan antar variabel - Deskripsi dan Jenis-jenis Korelasi
- Kovarians
- Koefisien Korelasi
- Matriks Varians-Kovarians
- Kovariansi, Kofaktor, dan Matriks
Berat

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 2/42 RM184305 - Statistika


Deskripsi dan Jenis-jenis Korelasi

Statistik seringkali digunakan untuk mencari hubungan antara dan diantara kejadian.
Sebagai contoh, apakah umur manusia mempunyai hubungan dengan tekanan darah?
atau apakah tingkat kecemasan mahasiswa berhubungan dengan nilai yang didapat?

Korelasi mengukur hubungan antara dua atau lebih variabel.

Korelasi digunakan untuk menyatakan bentuk hubungan antar variabel dengan


tingkat kekuatan dan arahnya.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 3/42 RM184305 - Statistika


Korelasi

Jika dua variabel acak, x dan y berkorelasi, maka hubungan yang mungkin terjadi
adalah:
1. x menyebabkan y, atau y menyebabkan x:
• contoh, jarak perjalanan dengan penggunaan BBM;
• volume air yang diminum dengan temperatur cuaca
2. Adanya variabel ketiga z, mempengaruhi kedua variabel x dan y:
• contoh, ketinggian terbang dalam foto udara mempengaruhi skala foto dan
akurasi pengeplotan
3. Tingkat hubungan antar variabel yang diamati dapat berubah.
4. Dapat merupakan kombinasi dari hal-hal yang dijelaskan sebelumnya.
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 4/42 RM184305 - Statistika


Data Bivariat

Data bivariat adalah dua buah data yang mempunyai hubungan tertentu. Jenis data
ini seringkali diekspresikan sebagain pasangan x, y (contoh: lintang, bujur )

Data bivariat dapat disajikan dalam bentuk scatter plot, yaitu plotting dari seluruh
pasangan data dalam sebuah sistem sumbu koordinat. Plot tersebut berguna untuk
menggambarkan hubungan antara kedua variabel.

Garis ‘best-fit’ yang melewati keseluruhan data disebut sebagai garis regresi (akan
dibahas kemudian).

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 5/42 RM184305 - Statistika


Contoh 1

Data Populasi dan luas area untuk setiap negara bagian di Australia adalah sebagai
berikut (data 2001):
State Populasi Area (km2 )
ACT 310,200 23,000
NSW 6,411,700 802,000
NT 192,900 1,346,000
QLD 3,512,400 1,727,000
SA 1,493,100 984,000
TAS 470,300 68,000
VIC 4,712,200 228,000
WA 1,861,000 2,526,000
Totals: 18,963,800 7,704,000

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 6/42 RM184305 - Statistika


Contoh 1

Dapat dilihat dari scatter plot di atas bahwa tidak terlihat adanya korelasi yang jelas
antara jumlah populasi dengan luas area. -IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 7/42 RM184305 - Statistika


Korelasi
Tingkat korelasi yang terjadi antar variabel dapat dilihat dengan mengamati pola dari
scatter plot.

Tingkat korelasi yang mungkin terjadi adalah:


• sempurna
• baik
• buruk
• tidak ada korelasi

Selain itu dapat pula dilihat apakah korelasi yang terjadi bersifat:
• positif
• negatif
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 8/42 RM184305 - Statistika


Korelasi Sempurna
Semua pengamatan dari kedua variabel tempat berada pada garis regresi. Dalam hal
ini, jika diketahu nilai x maka nilai y bisa ditentukan dengan kemungkinan absolut.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 9/42 RM184305 - Statistika


Korelasi Baik
Hubungan antara variabel sangat kuat sehingga nilai-nilai pengamatan terdistribusi
dengan baik di sekitar garis regresi.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 10/42 RM184305 - Statistika


Korelasi Buruk
Korelasi yang buruk terjadi pada saat nilai-nilai pengamatan tersebar jauh dari garis
regresi.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 11/42 RM184305 - Statistika


Tidak Ada Korelasi
Tidak adanya korelasi antar variable terjadi pada saat nilai pengamatan x mempunyai
asosiasi yang beragam dengan nilai y (mulai dari kecil, menengah dan besar) dan
tidak membentuk pola regresi yang jelas.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 12/42 RM184305 - Statistika


Korelasi Positif

Korelasi positif terjadi pada saat nilai


x yang kecil berasosiasi dengan nilai
y yang juga kecil dan nilai x yang
besar berasosiasi dengan nilai y yang
juga besar.
• mengidikasikan korelasi
langsung antar variabel
• berasosiasi dengan garis regresi
dengan nilai gradien/kemiringan
positif

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 13/42 RM184305 - Statistika


Korelasi Negatif

Terjadi pada saat nilai x yang kecil


cenderung berasosiasi dengan nilai y
yang besar dan nilai x yang besar
cenderung berasosiasi dengan nilai y
yang kecil.
• mengindikasikan korelasi
terbalik antar variabel
• berasosiasi dengan garis regresi
dengan nilai gradien/kemiringan
negatif

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 14/42 RM184305 - Statistika


Kovarians

• Kovarians adalah ukuran derajat hubungan linier antara dua variabel.

• Menggambarkan seberapa besar nilai y bergantung pada nilai x, dan sebaliknya.

• Kovarians didefinisikan sebagai jumlah dari perkalian antar deviasi seluruh nilai x
dan nilai y dari masing-masing nilai rata-ratanya.

Kovarians Populasi Kovarians Sampel

N n
1 X 1 X
σxy = (xi − µx ) (yi − µy ) sxy = (xi − x) (yi − y)
N i=1 n − 1 i=1

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 15/42 RM184305 - Statistika


Contoh 2
Apakah terdapat hubungan antara jumlah iklan (x) yang ditayangkan pada hari Jumat
malam dengan besarnya penjualan pada hari Sabtu (y) di 7 toko yang berbeda (A-G)
Toko x y xi − x yi − y (xi − x) (yi − y)
A 2 24 -1 -1 1
B 5 28 2 3 6
C 1 22 -2 -3 6
D 3 26 0 1 0
E 4 25 1 0 0
F 1 24 -2 -1 2
G 5 20 2 1 2
Σ 17

17
sxy = = 2, 833
6
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 16/42 RM184305 - Statistika


Rumus alternatif untuk Kovarians

Berikut adalah rumus yang lebih akurat dan lebih cepat untuk menghitung kovarians:

Kovarians Populasi Kovarians Sampel

 N
P N
P
  n
P n
P

N xi yi  n xi yi 
1 X i=1 i=1 1  X i=1 i=1
σxy =  xi yi −  sxy =  xi yi − 
N  i=1 N  n − 1  i=1 n 

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 17/42 RM184305 - Statistika


Contoh 3

Dari data penjualan pada Contoh 2


Toko x y xy
A 2 24 48
B 5 28 140
C 1 22 22 1

21 × 175

D 3 26 78 sxy = 542 −
6 7
E 4 25 100
= 2, 833
F 1 24 24
G 5 26 130
Σ 21 175 542

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 18/42 RM184305 - Statistika


Latihan

Seorang petani jeruk ingin mengetahui hubungan antara ukuran jeruk dengan
banyaknya jus yang dihasilkan. Lima buah jeruk diukur diameternya dan diperas
dengana hasil sebagai berikut:

diameter jeruk, xi (inci) 3 5 4 4 5


volume jus, yi (ml) 22 30 28 21 28

a. Buat scatter diagram dari data.


b. Dari scatter diagram yang dibuat, apa yang dapat disimpulkan mengenai
hubungan antara kedua variabel?
c. Hitung nilai kovarians sampel dan jelaskan.
c. Hitung nilai koefisien korelasi sampel dan jelaskan.
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 19/42 RM184305 - Statistika


Koefisien Korelasi

Nilai koefisien korelasi menunjukan derajat/tingkat hubungan antara distribusi


frekuensi dari kedua data

Terdapat beberapa teknik penentuan nilai koefisien korelasi yang penggunaanya


bergantung dari data yang akan dianalisa.

Dalam kuliah ini yang akan dibahas adalah:


• Koefisien Korelasi Pearson

• Koefisien Perangkingan Spearman

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 20/42 RM184305 - Statistika


Koefisien Korelasi Pearson

Koefisien korelasi Pearson merupakan rasio antara variansi gabungan dengan variansi
total dari data.

Koefisien Korelasi Populasi Koefisien Korelasi Sampel

σxy sxy
ρxy = rxy =
σx σy sx sy

rxy merupakan estimasi tanpa bias dari ρxy

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 21/42 RM184305 - Statistika


Koefisien Korelasi Pearson

Koefisien korelasi Pearson mempunyai karakteristik:


• menggambarkan ukuran dari kekuatan dan arah hubungan linier

• mempunyai nilai dengan skala numerik

• hanya dapat digunakan untuk data interval dan data rasio

Hal-hal yang mempengaruhi nilai korelasi Pearson:


• nilai kovariansi antar data

• standar deviasi dari kedua data

• jumlah dari nilai yang berpasangan


-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 22/42 RM184305 - Statistika


Koefisien Korelasi Pearson
Koefisien korelasi Pearson mempunyai nilai antara -1 sampai +1, dimana:
• Koefisien 0 menunjukan tidak adanya korelasi antara data

• Koefisien +1 menunjukan adanya korelasi positif sempurna

• Koefisien -1 menunjukan adanya korelasi negatif sempurna

Nilai korelasi tidak bergantung pada dimensi/satuan dari variabel


Contoh:
Hubungan antara tinggi dan berat anak:
• rxy (SI) = 0, 442

• rxy (imperial) = 0, 442


-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 23/42 RM184305 - Statistika


Contoh 4
Dari data penjualan
Toko x y x2 y2 xy
A 2 24 4 76 48
B 5 28 25 784 140
C 1 22 1 484 22
D 3 26 9 676 78
E 4 25 16 625 100
F 1 24 1 576 24
G 5 26 25 676 130
Σ 21 175 81 4397 542

542 − 21×175 17
rxy =q q 7 = √ √ = 0, 854
212
81 − 7 4397 − 1752 18 22
7
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 24/42 RM184305 - Statistika


Titik keputusan (Decision Point)

Bagaimana cara untuk menentukan bahwa suatu nilai korelasi adalah


signifikan atau tidak?

Di antara nilai korelasi 0 dan ±1 terdapat sebuah nilai yang merupakan batas untuk
memutuskan apakah terjadi korelasi linier atau tidak. Jika rxy lebih kecil dari nilai
tersebut, maka dapat dikatakan tidak terdapat korelasi yang berarti (signifikan).
Nilai tersebut dinamakan sebagain titik keputusan(decision point)

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 25/42 RM184305 - Statistika


Titik keputusan (Decision Point)

Nilai titik keputusan bergantung pada ukuran sampel:

Ukuran sampel Titik keputusan


5 ±0.878
10 ±0.632
20 ±0.444
40 ±0.311
100 ±0.196

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 26/42 RM184305 - Statistika


Contoh 5

Dalam contoh kasus data tinggi vs berat, dari ukuran sampel 5 anak didapatkan nilai
korelasi 0.442.

Dari tabel decision point, diketahui bahwa titik keputusan untuk ukuran sampel 5
adalah 0.878. Maka dapat dikatakan bahwa tidak terdapat korelasi yang signifikan
antara berat anak dan tingginya.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 27/42 RM184305 - Statistika


Kesalahan dalam interpretasi

Berikut adalah hal-hal yang perlu diperhatikan pada saat menginterpretasikan nilai
koefisien korelasi:
• korelasi tidak menggambarkan hubungan sebab akibat

• koefisien korelasi didapat dari data yang tidak linier

• adanya pengaruh dari variabel ketiga yang menyebabkan terjadinya kesalahan


interpretasi
• ukuran sampel yang digunakan kurang besar

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 28/42 RM184305 - Statistika


Kesalahan dalam interpretasi

Korelasi tidak menggambarkan hubungan sebab akibat

Koefisien korelasi mengindikasikan sebuah hubungan antara dua variabel pengamatan,


x dan y. Akan tetapi nilai tersebut tidak menggambarkan bahwa x menyebabkan y
dan sebaliknya.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 29/42 RM184305 - Statistika


Contoh 5
Terdapat data yang menunjukan korelasi antara curah hujan bulanan di gurun sahara
dengan prosentasi kehadiran mahasiswa Statistika sebagai berikut:
Bulan Curah hujan (mm) Kehadiran mahasiswa (%)
Feb 27 100
Mar 16 92
Apr 12 65
May 2 24
Jun 0 5
Dari data tersebut didapatkan nilai koefisien korelasi 0,95 yang artinya berkorelasi
tinggi.

Apakah hubungan antara kedua variabel tersebut make sense?


-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 30/42 RM184305 - Statistika


Kesalahan dalam interpretasi

Koefisien korelasi didapat dari data yang tidak linier

Koefisien korelasi mengasumsikan hubungan linier antar variabel.

Jika terjadi hubungan non-linier yang sempurna, maka rxy = 0, dan akan terjadi
kesalahan dalam pengambilan kesimpulan.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 31/42 RM184305 - Statistika


Contoh 6
Data pengamatan dalam gambar di bawah ini menunjukan hubungan
y = (x − 4)2 + 1, akan tetapi nilai koefisien korelasinya, rxy = 0

Untuk hubungan polinomial seperti gambar di atas akan lebih tepat jika menggunakan
persamaan polinomial dari data x dan y. -IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 32/42 RM184305 - Statistika


Kesalahan dalam interpretasi

Adanya variabel ketiga

Seringkali terdeteksi sebuah variabel lain, z, dimana variabel x dan y mungkin


berkorelasi. Sehingga secara tidak langsung variabel x dan y terlihat saling berkorelasi
karena keduanya berkorelasi dengan z.
Contoh:
• variabel waktu yang secara tidak langsung muncul dalam suatu data

• misalnya x adalah tekanan darah, y adalah denyut nadi, maka mungkin muncul
varibel z yang merupakan berat pasien.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 33/42 RM184305 - Statistika


Contoh 7

Data batimetri dapat diturunkan secara langsung dari data echo sounding atau
melalui inversi data pengamatan gayaberat di laut.
Misalnya x adalah data medan gayaberat, y adalah batimetri laut (diturunkan dari
data gayaberat), dan z adalah batimetri laut (diturunkan dari echo sounding ).

Maka korelasi antara x dan y akan menghasilkan korelasi antara x dan x itu sendiri.
Dalam kasus ini korelasi yang harus diperhitungkan adalah antara x dan z supaya
didapatkan nilai yang realistis.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 34/42 RM184305 - Statistika


Kesalahan dalam interpretasi

Hubungan yang tidak realistis juga dapat muncul pada saat dilakukan pengukuran
variabel x dan y, kemudian dicoba untuk mencari korelasi antara x dan rasio xy .
Analisa korelasi yang melibatkan nilai rasio perlu dilakukan secara hati-hati dengan
memperhatikan varibel-variabel yang terlibat.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 35/42 RM184305 - Statistika


Kesalahan dalam interpretasi

Ukuran sampel tidak mewakili populasi

Secara statistik, sangat berbahaya mengambil kesimpulan dari sampel yang tidak
mewakili populasi. Hal ini seringkali disebut sebagai permasalahan ekstrapolasi.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 36/42 RM184305 - Statistika


Koefisien korelasi perangkingan Spearman

Untuk data dengan skala ordinal (dapat dilakukan perangkingan), untuk melihat
hubungan antar data digunakan koefisien korelasi perangkingan Spearman dengan
rumus sebagai berikut

Pn 2
6 i=1 (xi − yi )
rs = 1 −
n (n2 − 1)

Koefisien korelasi perangkingan Spearman mempunyai nilai antara −1 dan +1


-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 37/42 RM184305 - Statistika


Contoh 8
Berikut adalah posisi rangking 10 orang mahasiswa setelah ETS dan EAS

Mahasiswa Posisi setelah ETS Posisi setelah EAS x−y (x − y)2


(x) (y)

1 2 1 1 1
2 4 3 1 1
Spearman rank
3 7 5 2 4 correlation coefficient
4 1 6 -5 25
5 6 7 -1 1 6 × 44
6 3 4 -1 1 rs = 1 −
7 10 10 0 0
10(100 − 1)
8 9 8 1 1 = 0.733
9 8 9 -1 1
10 5 2 3 9
P
44

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 38/42 RM184305 - Statistika


Matriks Varians-Kovarians

• Matriks varians-kovarians adalah matriks yang berisi hubungan


antara variabel-variabel dalam data set.
• Elemen-elemen dari dari matriks merupakan nilai varians dan
kovarians antara variabel-variabel dalam data statistik.

-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 39/42 RM184305 - Statistika


Matriks Varians-Kovarians

Matriks variansi-kovariansi dari populasi yang terdiri dari 2 variabel:


2
 
σxx σxy
2
σxy σyy

Matriks variansi-kovariansi dari populasi yang terdiri dari 3 variabel:


 2 
sxx sxy sxz
syx s2yy syz 
szx szy s2zz

Matriks variansi-kovariansi selalu berupa matriks simetri.


-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 40/42 RM184305 - Statistika


Contoh 9
Dari data bivariat diketahui bahwa:

s2xx = 3.4
s2yy = 19.8
sxy = 5.33

Susun matriks variansi-kovariansinya

 
3.4 5.33
5.33 19.8
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 41/42 RM184305 - Statistika


Latihan

Dari pengukuran sipat datar, dilakukan pencatatan nilai sudut inklinasi pada
line-of-sigt dan temperatur pada saat pengukuran. Didapatkan data sebagai berikut:
Temperatur (◦ ) inklinasi (00 ) Temperatur (◦ ) inklinasi (00 ) Temperatur (◦ ) inklinasi (00 )
25.4 - 0.3 14.2 2.4 18.2 - 1.0
25.3 - 0.3 13.8 1.8 19.8 - 0.7
25.2 - 0.3 13.8 3.0 20.8 - 1.2
19.4 0.9 13.4 2.1 21.8 - 1.8
15.9 1.8 14.2 1.8 22.4 - 2.4
14.8 2.4 16.6 1.2 22.8 - 2.0

Buat matriks varians-kovarians berdasarkan data pada tabel dan hitung koefisien
korelasi antara temperatur dan sudut inklinasi. Simpulkan bagaimana hubungan
antara kedua variabel tersebut.
-IM Anjasmara, 2021-

KOVARIANS DAN KORELASI 42/42 RM184305 - Statistika

Anda mungkin juga menyukai