RM184305 - Statistika
Statistik seringkali digunakan untuk mencari hubungan antara dan diantara kejadian.
Sebagai contoh, apakah umur manusia mempunyai hubungan dengan tekanan darah?
atau apakah tingkat kecemasan mahasiswa berhubungan dengan nilai yang didapat?
Jika dua variabel acak, x dan y berkorelasi, maka hubungan yang mungkin terjadi
adalah:
1. x menyebabkan y, atau y menyebabkan x:
• contoh, jarak perjalanan dengan penggunaan BBM;
• volume air yang diminum dengan temperatur cuaca
2. Adanya variabel ketiga z, mempengaruhi kedua variabel x dan y:
• contoh, ketinggian terbang dalam foto udara mempengaruhi skala foto dan
akurasi pengeplotan
3. Tingkat hubungan antar variabel yang diamati dapat berubah.
4. Dapat merupakan kombinasi dari hal-hal yang dijelaskan sebelumnya.
-IM Anjasmara, 2021-
Data bivariat adalah dua buah data yang mempunyai hubungan tertentu. Jenis data
ini seringkali diekspresikan sebagain pasangan x, y (contoh: lintang, bujur )
Data bivariat dapat disajikan dalam bentuk scatter plot, yaitu plotting dari seluruh
pasangan data dalam sebuah sistem sumbu koordinat. Plot tersebut berguna untuk
menggambarkan hubungan antara kedua variabel.
Garis ‘best-fit’ yang melewati keseluruhan data disebut sebagai garis regresi (akan
dibahas kemudian).
Data Populasi dan luas area untuk setiap negara bagian di Australia adalah sebagai
berikut (data 2001):
State Populasi Area (km2 )
ACT 310,200 23,000
NSW 6,411,700 802,000
NT 192,900 1,346,000
QLD 3,512,400 1,727,000
SA 1,493,100 984,000
TAS 470,300 68,000
VIC 4,712,200 228,000
WA 1,861,000 2,526,000
Totals: 18,963,800 7,704,000
Dapat dilihat dari scatter plot di atas bahwa tidak terlihat adanya korelasi yang jelas
antara jumlah populasi dengan luas area. -IM Anjasmara, 2021-
Selain itu dapat pula dilihat apakah korelasi yang terjadi bersifat:
• positif
• negatif
-IM Anjasmara, 2021-
• Kovarians didefinisikan sebagai jumlah dari perkalian antar deviasi seluruh nilai x
dan nilai y dari masing-masing nilai rata-ratanya.
N n
1 X 1 X
σxy = (xi − µx ) (yi − µy ) sxy = (xi − x) (yi − y)
N i=1 n − 1 i=1
17
sxy = = 2, 833
6
-IM Anjasmara, 2021-
Berikut adalah rumus yang lebih akurat dan lebih cepat untuk menghitung kovarians:
N
P N
P
n
P n
P
N xi yi n xi yi
1 X i=1 i=1 1 X i=1 i=1
σxy = xi yi − sxy = xi yi −
N i=1 N n − 1 i=1 n
Seorang petani jeruk ingin mengetahui hubungan antara ukuran jeruk dengan
banyaknya jus yang dihasilkan. Lima buah jeruk diukur diameternya dan diperas
dengana hasil sebagai berikut:
Koefisien korelasi Pearson merupakan rasio antara variansi gabungan dengan variansi
total dari data.
σxy sxy
ρxy = rxy =
σx σy sx sy
542 − 21×175 17
rxy =q q 7 = √ √ = 0, 854
212
81 − 7 4397 − 1752 18 22
7
-IM Anjasmara, 2021-
Di antara nilai korelasi 0 dan ±1 terdapat sebuah nilai yang merupakan batas untuk
memutuskan apakah terjadi korelasi linier atau tidak. Jika rxy lebih kecil dari nilai
tersebut, maka dapat dikatakan tidak terdapat korelasi yang berarti (signifikan).
Nilai tersebut dinamakan sebagain titik keputusan(decision point)
Dalam contoh kasus data tinggi vs berat, dari ukuran sampel 5 anak didapatkan nilai
korelasi 0.442.
Dari tabel decision point, diketahui bahwa titik keputusan untuk ukuran sampel 5
adalah 0.878. Maka dapat dikatakan bahwa tidak terdapat korelasi yang signifikan
antara berat anak dan tingginya.
Berikut adalah hal-hal yang perlu diperhatikan pada saat menginterpretasikan nilai
koefisien korelasi:
• korelasi tidak menggambarkan hubungan sebab akibat
Jika terjadi hubungan non-linier yang sempurna, maka rxy = 0, dan akan terjadi
kesalahan dalam pengambilan kesimpulan.
Untuk hubungan polinomial seperti gambar di atas akan lebih tepat jika menggunakan
persamaan polinomial dari data x dan y. -IM Anjasmara, 2021-
• misalnya x adalah tekanan darah, y adalah denyut nadi, maka mungkin muncul
varibel z yang merupakan berat pasien.
Data batimetri dapat diturunkan secara langsung dari data echo sounding atau
melalui inversi data pengamatan gayaberat di laut.
Misalnya x adalah data medan gayaberat, y adalah batimetri laut (diturunkan dari
data gayaberat), dan z adalah batimetri laut (diturunkan dari echo sounding ).
Maka korelasi antara x dan y akan menghasilkan korelasi antara x dan x itu sendiri.
Dalam kasus ini korelasi yang harus diperhitungkan adalah antara x dan z supaya
didapatkan nilai yang realistis.
Hubungan yang tidak realistis juga dapat muncul pada saat dilakukan pengukuran
variabel x dan y, kemudian dicoba untuk mencari korelasi antara x dan rasio xy .
Analisa korelasi yang melibatkan nilai rasio perlu dilakukan secara hati-hati dengan
memperhatikan varibel-variabel yang terlibat.
Secara statistik, sangat berbahaya mengambil kesimpulan dari sampel yang tidak
mewakili populasi. Hal ini seringkali disebut sebagai permasalahan ekstrapolasi.
Untuk data dengan skala ordinal (dapat dilakukan perangkingan), untuk melihat
hubungan antar data digunakan koefisien korelasi perangkingan Spearman dengan
rumus sebagai berikut
Pn 2
6 i=1 (xi − yi )
rs = 1 −
n (n2 − 1)
1 2 1 1 1
2 4 3 1 1
Spearman rank
3 7 5 2 4 correlation coefficient
4 1 6 -5 25
5 6 7 -1 1 6 × 44
6 3 4 -1 1 rs = 1 −
7 10 10 0 0
10(100 − 1)
8 9 8 1 1 = 0.733
9 8 9 -1 1
10 5 2 3 9
P
44
s2xx = 3.4
s2yy = 19.8
sxy = 5.33
3.4 5.33
5.33 19.8
-IM Anjasmara, 2021-
Dari pengukuran sipat datar, dilakukan pencatatan nilai sudut inklinasi pada
line-of-sigt dan temperatur pada saat pengukuran. Didapatkan data sebagai berikut:
Temperatur (◦ ) inklinasi (00 ) Temperatur (◦ ) inklinasi (00 ) Temperatur (◦ ) inklinasi (00 )
25.4 - 0.3 14.2 2.4 18.2 - 1.0
25.3 - 0.3 13.8 1.8 19.8 - 0.7
25.2 - 0.3 13.8 3.0 20.8 - 1.2
19.4 0.9 13.4 2.1 21.8 - 1.8
15.9 1.8 14.2 1.8 22.4 - 2.4
14.8 2.4 16.6 1.2 22.8 - 2.0
Buat matriks varians-kovarians berdasarkan data pada tabel dan hitung koefisien
korelasi antara temperatur dan sudut inklinasi. Simpulkan bagaimana hubungan
antara kedua variabel tersebut.
-IM Anjasmara, 2021-