Anda di halaman 1dari 8

ecara sepintas kita bisa melihat pola hubungan dari grafik-grafik tersebut.

Pada Grafik a, b, c terlihat bahwa


peningkatan nilai y sejalan dengan peningkatan nilai x. Apabila nilai x meningkat, maka nilai y pun meningkat,
dan sebaliknya. Dari Grafik a sampai c, sebaran titik-titik pasangan data semakin mendekati bentuk garis lurus
yang menunjukkan bahwa keeratan hubungan antara variabel x dan y semakin kuat (sinergis).

Hal yang sebaliknya terjadi pada Grafik d, e, dan f. Peningkatan nilai y tidak sejalan dengan peningkatan nilai x
(antagonis). Peningkatan salah satu nilai menyebabkan penurunan nilai pasangannya. Sekali lagi tampak
bahwa kekuatan hubungan antara kedua variabel dari d menuju f semakin kuat.

Berbeda dengan grafik sebelumnya, pada Grafik g tidak menunjukkan adanya pola hubungan linier antara
kedua variabel. Hal ini menandakan bahwa tidak ada korelasi di antara kedua variabel tersebut. Terkahir,
pada Grafik h kita bisa melihat adanya pola hubungan di antara kedua variabel tersebut, hanya saja polanya
bukan dalam bentuk hubungan linier, melainkan dalam bentuk kuadratik.

Kovarian dan Korelasi


Untuk memahami korelasi linier antara dua variabel, terdapat dua elemen yang harus kita tinjau, mengukur
hubungan diantara dua variabel (kovarian) dan proses standarisasi.

Kovarian

Salah satu ukuran kekuatan hubungan linear antara dua variabel acak kontinu adalah dengan menentukan
seberapa banyak kedua variabel tersebut co-vary, yaitu bervariasi bersama-sama. Jika salah satu variabel
meningkat (atau menurun) sebagai akibat peningkatan (atau penurunan) variabel pasangannya, maka dua
variabel tersebut dinamakan covary. Namun jika satu variabel tidak berubah dengan meningkatnya (atau
penurunan) variabel lain, maka variabel tersebut tidak covary. Statistik untuk mengukur berapa banyak kedua
variabel covary dalam sampel pengamatan adalah kovarian.

Selain mengukur besarnya kekuatan hubungan di antara dua


variabel, kovarian juga menentukan arah hubungan dari kedua variabel tersebut.

1. Apabila nilainya positif, berati bahwa apabila nilai x berada di atas nilai rata-ratanya, maka nilai y juga
berada di atas nilai rata-rata y, dan sebaliknya (Searah).
2. Nilai kovarian negatif menunjukkan bahwa apabila nilai x berada di atas nilai rata-ratanya sedangkan
nilai y berada di bawah nilai rata-ratanya (berlawanan arah).
3. Terakhir, apabila nilai kovarian mendekati nol, menandakan bahwa kedua variabel tersebut tidak saling
berhubungan.

Standarisasi

Salah satu keterbatasan kovarian sebagai ukuran kekuatan hubungan linier adalah arah/besarnya gradien yang
tergantung pada satuan dari kedua variabel tersebut. Misalnya, kovarian antara serapan N (%) dan Hasil Padi
(ton) akan jauh lebih besar apabila satuan % (1/100) kita konversi ke ppm (1/sejuta). Agar nilai kovarian tidak
tergantung kepada unit dari masing-masing variabel, maka kita harus membakukannya terlebih dahulu yaitu
dengan cara membagi nilai kovarians tersebut dengan nilai standar deviasi dari kedua variabel tersebut sehingga
nilainya akan terletak antara -1 dan +1. Ukuran statistik tersebut dikenal dengan Pearson product moment
correlation yang mengukur kekuatan hubungan linier (garis lurus) dari kedua variabel tersebut. Koefisien
korelasi linear kadang-kadang disebut sebagai koefisien korelasi pearson  untuk menghormati Karl Pearson
(1857-1936), yang pertama kali mengembangkan ukuran statistik ini.

Kovarian:

Standar Deviasi variabel X dan Y:


Korelasi:

Nilai kovarian distandarkan dengan membagi nilai kovarian tersebut dengan nilai standar deviasi kedua variabel.

atau

atau

Koefisien Korelasi

Koefisien korelasi mengukur kekuatan dan arah hubungan linier dari dua veriabel. Harus diingat bahwa nilai
koefisien korelasi yang kecil (tidak signifikan) bukan berarti kedua variabel tersebut tidak saling berhubungan .
Mungkin saja dua variabel mempunyai keeratan hubungan yang kuat namun nilai koefisien korelasinya
mendekati nol, misalnya pada kasus hubungan non linier. Dengan demikian, koefisien korelasi hanya
mengukur kekuatan hubungan linier dan tidak pada hubungan non linier.

Harus diingat pula bahwa adanya hubungan linier yang kuat di antara variabel tidak selalu berarti
ada hubungan kausalitas, sebab-akibat. Kedua pasang variabel, x dan y bisa saja nilai koefisien korelasinya
tinggi sebagai akibat adanya faktor z. Sebagai contoh, suhu (x) dengan tekanan udara (y) mungkin saja nilai
koefisien korelasinya tinggi, namun belum tentu keduanya menunjukkan adanya hubungan sebab akibat (misal,
semakin rendah suhu udara maka tekanan udara akan semakin rendah). Adanya korelasi suhu dan tekanan
udara tersebut bisa saja semata-mata sebagai akibat dari perubahan ketinggian (z) suatu tempat, semakin tinggi
tempat maka baik suhu ataupun tekanan udara akan semakin menurun. (meskipun secara teoritis memang
terdapat hubungan sebanding antara suhu dan tekanan: PV = nRT).  Dengan demikian, Korelasi hanya
menjelaskan kekuatan hubungan tanpa memperhatikan hubungan kausalitas, mana yang
dipengaruhi dan mana yang mempengaruhi. Kedua variabel masing-masing bisa berperan sebagai
Variabel X maupun Variabel Y.

Karakteristik korelasi

 Nilai r selalu terletak antara -1 dan +1


 Nilai r tidak berubah apabila seluruh data baik pada variabel x, variabel y, atau keduanya dikalikan
dengan suatu nilai konstanta (c) tertetu (asalkan c ≠ 0).
 Nilai r tidak berubah apabila seluruh data baik pada variabel x, variabel y, atau keduanya ditambahkan
dengan suatu nilai konstanta (c) tertetu.
 Nilai r tidak akan dipengaruhi oleh penentuan mana variabel x dan mana variabel y. Kedua variabel bisa
saling dipertukarkan.
 Nilai r hanya untuk mengukur kekuatan hubungan linier, dan tidak dirancang untuk mengukur
hubungan non linier

Asumsi
Asumsi untuk analisis korelasi:

1. Sampel data berpasangan (x, y) berasal dari sampel acak dan merupakan data kuantitatif.
2. Pasangan data (x, y) harus berdistribusi normal.
Harus diingat bahwa analisis korelasi sangat sensitif terhadap data pencilan (outliers)!

Asumsi bisa dicek secara visual dengan menggunakan:

 Boxplots, histograms & univariate scatterplots untuk masing-masing variabel


 Bivariate scatterplots
Apabila tidak memenuhi asumsi misalnya data tidak berdistribusi normal (atau ada nilai data pencilan), kita bisa
menggunakan korelasi Spearman (Spearman rank correlation), korelasi untuk analisis non-parametrik.

Koefisien Determinasi
Koefisien korelasi, r, hanya menyediakan ukuran kekuatan dan arah hubungan linier antara dua variabel. Akan
tetapi tidak memberikan informasi mengenai berapa proporsi keragaman (variasi) variabel dependen (Y) yang
dapat diterangkan atau diakibatkan oleh hubungan linier dengan nilai variabel independen (X). Nilai r tidak bisa
dibandingkan secara langsung, misalnya kita tidak bisa mengatakan bahwa nilai r = 0.8 merupakan dua kali lipat
dari nilai r =0.4.

Untungnya, nilai kuadrat dari r bisa mengukur secara tepat rasio/proposi tersebut, dan nilai statistik ini
dinamakan dengan Koefisien Determinasi, r2. Dengan demikian, Koefisien Determinasi bisa didefinisikan sebagai
nilai yang menyatakan proporsi keragaman Y yang dapat diterangkan/dijelaskan oleh hubungan linier antara
variabel X dan Y.

Misalnya, apabila nilai korelasi (r) antara Serapan N dengan hasil = 0.8, maka r2 = 0.8 x 0.8 = 0.64=64%. Hal ini
berarti bahwa 64% keragaman Hasil padi bisa diterangkan/dijelaskan oleh tinggi rendahnya Serapan N. Sisanya,
sebesar 36% mungkin disebabkan oleh faktor lain dan atau error (galat) dari percobaan.

Pengujian Koefisien Korelasi


Terdapat dua metode yang biasa digunakan untuk menguji kebermaknaan koefisien korelasi. Metode pertama
dengan menggunakan Uji-t dan Metode kedua dengan menggunakan tabel r.

Bagan Alir untuk pengujian hipotesis:


Catatan:

Nilai tabel kritis r bisa di lihat pada tabel di bawah ini. Nilai kritis r selengkapnya bisa di lihat pada link
berikut critical-values-of-the-pearson-correlation-coeffiecient-r:

Faktor yang akan mempengaruhi nilai uji korelasi:


Ukuran koefisien korelasi dan ukuran/banyaknya sampel.

Contoh Terapan
Berikut adalah data usia, berat, dan tekanan darah.

Individua Age Weight Systolic Pressure


l
A 34 45 108
B 43 44 129
C 49 56 126
D 58 57 149
E 64 65 168
F 73 63 161
G 78 55 174
Untuk kasus ini, kita ingin melihat apakah terdapat hubungan linier antara usia dengan tekanan darah sistolik?
Taraf nyata yang digunakan adalah 5%.

Hipotesis:

H0: ρ = 0 vs H1: ρ ≠ 0

Eksplorasi Data

Berdasarkan diagram pencar (scatterplot), tampak bahwa sebaran titik-titik mengikuti pola linier dengan
kemiringan positif, yang berarti terdapat hubungan yang sejalan antara usia dengan tekanan darah sistolik.
Dengan demikian, kita bisa menggunakan koefisien korelasi untuk menentukan apakah hubungan linier kedua
variabel tersebut bermakna atau tidak. Apabila pola hubungannya tidak linier, kita tidak tepat menggunakan
koefisien korelasi karena nilai r hanya untuk mengukur kekuatan dan arah hubungan linier antara kedua varibel
kuantitatif.

Asumsi:

Kedua data berasal dari data kuantitatif. Selanjutnya apakah sebaran kedua variabel berdistribusi normal?

Uji Formal:

H0: data berdistribusi normal

H1: data tidak berdistribusi normal


Interpretasi:

Apabila nilai sig (p-value) ≤ 0.05, maka Tolak H0 yang berarti data tidak berdistribusi normal

Apabila nilai sig (p-value) > 0.05, maka Terima H0 yang berarti data berdistribusi normal

Pada kasus di atas, nilai p-value untuk kedua variabel > 0.05, sehingga kita bisa menyimpulkan bahwa data
berdistribusi normal.

Tampak bahwa uji normalitas untuk kedua variabel tersebut memenuhi persyaratan, sebarannya mengikuti
distribusi normal, baik dengan menggunakan Uji Kolmogorov-Smirnov ataupun Shapiro-Wilk.

Grafis:

Secara grafis juga tampak bahwa kedua variabel tersebut berdistribusi normal. Penggunaan box plot untuk
melihat apakah sebaran data berdistribusi normal ataukah tidak, diuraikan pada topik: Mengenal Box Plot
Perhitungan nilai koefisien korelasi (r)

No Age (X) Systolic Pressure (Y) X2 Y2 XY


1 34 108 1156 11664 3672
2 43 129 1849 16641 5547
3 49 126 2401 15876 6174
4 58 149 3364 22201 8642
5 64 168 4096 28224 10752
6 73 161 5329 25921 11753
7 78 174 6084 30276 13572
Jumlah 399 1015 24279 15080 60112
3
Rata- 57 145
rata

Pengujian Hipotesis

Metode 1:

Tentukan nilai t-tabel dengan taraf nyata (α)= 5% dan db = n-2.

Dari tabel distribusi t, kita peroleh: t(0.05/2, 5)= 2.57

Bandingkan t-hitung dengan t-tabel:

Dari hasil perhitungan, kita peroleh nilai t-hitung = 7.30 dan t-tabel = 2.57. Jelas bahwa nilai |t-hitung| > t-tabel
sehingga Tolak H0 dan Terima H1. Dengan demikian, kita bisa menyatakan bahwa terdapat hubungan linier
antara usia dengan tekanan darah sistolik.

Metode 2:

Bandingkan nilai |r| dengan nilai tabel kritis r untuk n = 7. Nilai r pada tabel kritis = 0.754.

Dari hasil perhitungan, diperoleh nilai r = 0.956. Jelas bahwa |r|> 0.754 sehingga kita bisa menyimpulkan bahwa
terdapat hubungan linier antara usia dengan tekanan darah sistolik.

Output Analisis dengan menggunakan SPSS

Kita bisa menyatakan seperti ini:

Korelasi antara usia dengan tekanan darah sistolik: r(7) = 0.956; p < 0.01
Koefisien Determinasi

Nilai koefisien determinasi diatas menyatakan proporsi keragaman Tekanan darah sistolik yang dapat
diterangkan/dijelaskan oleh hubungan linier antara variabel usia dan tekanan darah sistolik. Berdasarkan hasil
analisis, kita yakin 95% bahwa sekitar 91% variasi tinggi rendahnya tekanan darah sistolik ditentukan oleh usia
seseorang.

Anda mungkin juga menyukai