Anda di halaman 1dari 16

Penelitian Korelasi

Kakek saya, seorang petani selama lebih dari 50 tahun, memberi tahu saya pada beberapa kesempatan
bahwa warna dan ketebalan mantel ulat bulu berkaitan dengan parahnya musim dingin yang akan
datang. Ketika "cacing wol" memiliki mantel berbulu gelap, tebal, dia mengatakan bahwa kita bisa
mengharapkan musim dingin yang luar biasa keras.

Apakah kearifan orang asing ini benar, saya tidak tahu. Tapi seperti kakek saya, kita semua memiliki
banyak kepercayaan tentang hubungan antar peristiwa di dunia. Banyak orang percaya, misalnya,
bahwa warna rambut terkait dengan kepribadian bahwa orang-orang dengan rambut merah memiliki
emosi yang berapi-api dan pirang yang memiliki kecerdasan kurang dari rata-rata. Yang lain berpikir
bahwa para genius cenderung menderita gangguan mental atau orang-orang yang tinggal di kota-kota
besar bersikap apatis dan tidak peduli. Mereka yang meyakini astrologi mengklaim bahwa tanggal
kelahiran seseorang dikaitkan dengan kepribadian seseorang di kemudian hari. Pelaut memanfaatkan
hubungan antara penampilan langit dan badai yang mendekat, seperti ditunjukkan oleh pepatah lama:
Langit merah di malam hari, kesenangan pelaut; langit merah di pagi hari, pelaut menerima peringatan.
Anda mungkin memiliki banyak keyakinan tentang fenomena yang cenderung berjalan seiring.

Seperti kita semua, peneliti perilaku juga tertarik pada apakah variabel-variabel tertentu saling terkait.
Apakah suhu luar terkait dengan insiden kekerasan perkotaan? Sejauh mana skor IQ anak-anak terkait
dengan IQ orang tua mereka? Apakah rasa malu dikaitkan dengan harga diri yang rendah? Apa
hubungan antara tingkat dimana siswa mengalami kecemasan tes dan kinerja mereka pada ujian?
Apakah skor SAT terkait dengan nilai perguruan tinggi? Setiap pertanyaan ini menanyakan apakah dua
variabel (seperti skor dan nilai SAT) terkait dan, jika demikian, seberapa kuat mereka terkait.

Kami menentukan apakah satu variabel terkait dengan yang lain dengan melihat apakah skor pada dua
variabel kovary-apakah mereka berbeda bersama. Jika harga diri terkait dengan rasa malu, misalnya, kita
harus menemukan bahwa skor pada ukuran harga diri dan rasa malu bervariasi bersama. Skor harga diri
yang lebih tinggi harus dikaitkan dengan skor rasa malu yang lebih rendah, dan skor harga diri yang lebih
rendah harus dikaitkan dengan rasa malu yang lebih besar. Pola seperti itu akan menunjukkan bahwa
skor pada kedua ukuran itu berbeda-beda, atau naik dan turun, secara bersamaan. Di sisi lain, jika nilai
harga diri dan rasa malu tidak memiliki hubungan yang konsisten satu sama lain - jika kita menemukan
bahwa nilai harga diri yang tinggi cenderung terkait dengan nilai rasa malu yang tinggi seperti halnya
dengan skor rasa malu yang rendah - skor tidak bervariasi bersama, dan kami akan menyimpulkan
bahwa tidak ada hubungan antara harga diri dan rasa malu.

Ketika peneliti tertarik pada pertanyaan mengenai apakah variabel terkait satu sama lain, mereka sering
melakukan penelitian korelasional. Penelitian korelasional digunakan untuk menggambarkan hubungan
antara dua atau lebih variabel yang muncul secara alami.

Sebelum mempelajari detail tentang penelitian korelasional, mari kita lihat contoh studi korelasional
yang akan kita bahas di sepanjang bab ini. Sejak masa-masa awal psikologi, para peneliti telah
memperdebatkan kepentingan relatif pengaruh genetik versus lingkungan terhadap perilaku-sering
disebut sebagai kontroversi naturenurture. Para ilmuwan telah tidak setuju tentang apakah perilaku
orang lebih dipengaruhi oleh susunan biologis bawaan mereka atau oleh pengalaman mereka dalam
hidup. Kebanyakan psikolog sekarang setuju bahwa perdebatan itu kompleks; perilaku dan kemampuan
mental adalah produk dari faktor lahir dan faktor lingkungan. Jadi daripada membahas apakah perilaku
tertentu harus diklasifikasikan sebagai bawaan atau diperoleh, para peneliti telah mengalihkan
perhatian mereka untuk mempelajari efek interaktif dari alam dan memelihara perilaku, dan untuk
mengidentifikasi aspek-aspek perilaku yang lebih dipengaruhi oleh alam daripada memelihara, dan
sebaliknya. .

Bagian dari pekerjaan ini berfokus pada hubungan antara kepribadian anak-anak dan orang tua mereka.
Pengamatan umum mengungkapkan bahwa anak-anak menunjukkan banyak karakteristik psikologis
orang tua mereka. Tetapi apakah kesamaan ini karena faktor genetik atau karena cara orang tua
membesarkan anak-anak mereka? Apakah kemiripan ini disebabkan oleh alam atau karena
pemeliharaan?

Jika kita hanya mempelajari anak-anak yang dibesarkan oleh orang tua kandungnya, kita tidak dapat
menjawab pertanyaan ini; baik pengaruh genetik dan lingkungan dapat menjelaskan mengapa kesamaan
dengan orang tua kandung ditemukan pada anak-anak yang dibesarkan oleh orang tua kandung yang
sama. Karena alasan ini, banyak peneliti mengalihkan perhatian mereka kepada anak-anak yang diadopsi
pada masa bayi. Karena kemiripan antara anak-anak dan orang tua angkat mereka tidak mungkin
disebabkan oleh faktor genetik, itu harus karena variabel lingkungan.

Dalam satu penelitian semacam itu, Sandra Scarr dan koleganya memberikan beberapa ukuran
kepribadian kepada 120 remaja dan orang tua kandung mereka dan kepada 115 remaja dan orang tua
angkat mereka (Scarr, Webber, Weinberg, & Wittig, 1981). Skala ini mengukur sejumlah sifat
kepribadian, termasuk introversi - extraversion (kecenderungan untuk dihambat versus keluar) dan
neuroticism (kecenderungan untuk cemas dan tidak aman). Para peneliti ingin mengetahui apakah
kepribadian anak-anak terkait lebih dekat dengan kepribadian orang tua kandung mereka atau dengan
kepribadian orang tua angkat mereka.

Studi ini menghasilkan banyak data, sebagian kecil ditunjukkan pada Tabel 6.1. Tabel ini menunjukkan
koefisien korelasi yang mengungkapkan sifat hubungan antara kepribadian anak-anak dan orang tua.
Koefisien korelasi ini menunjukkan kekuatan dan arah hubungan antara skor orang tua dan anak-anak
pada dua ukuran kepribadian. Satu kolom mencantumkan korelasi antara anak-anak dan orang tua
kandung mereka, dan kolom lainnya mencantumkan korelasi antara anak-anak dan orang tua angkat
mereka. Tabel ini dapat memberi tahu kita banyak tentang hubungan antara kepribadian anak-anak dan
orang tua, tetapi pertama-tama kita harus belajar bagaimana menafsirkan koefisien korelasi.

Koefisien Korelasi

Koefisien korelasi adalah statistik yang menunjukkan sejauh mana dua variabel terkait satu sama lain
secara linear. Dalam studi yang baru saja dijelaskan, para peneliti tertarik pada hubungan antara
kepribadian anak-anak dan orang tua mereka. Dua variabel apa pun dapat dikorelasikan: harga diri dan
rasa malu, jumlah waktu orang mendengarkan musik rock dan kerusakan pendengaran, penggunaan
ganja dan skor pada tes memori, dan sebagainya. Kami bahkan bisa melakukan studi tentang korelasi
antara ketebalan mantel ulat dan suhu musim dingin. Satu-satunya persyaratan untuk studi korelasional
adalah kami memperoleh skor dua variabel untuk setiap peserta dalam sampel kami.

Koefisien korelasi Pearson, yang ditunjuk oleh huruf r, adalah ukuran korelasi yang paling umum
digunakan. Nilai numerik dari koefisien korelasi selalu berkisar antara -1,00 dan +1,00. Ketika
menafsirkan koefisien korelasi, seorang peneliti mempertimbangkan dua aspek dari koefisien: tandanya
dan besarnya.

Tanda koefisien korelasi (+ atau -) menunjukkan arah hubungan antara kedua variabel. Variabel dapat
berkorelasi positif atau negatif. Korelasi positif menunjukkan hubungan langsung dan positif antara
kedua variabel. Jika korelasinya positif, skor pada satu variabel cenderung meningkat karena skor pada
variabel lainnya meningkat. Misalnya, korelasi antara nilai SAT dan nilai perguruan tinggi adalah positif;
orang dengan skor SAT lebih tinggi cenderung memiliki nilai lebih tinggi, sedangkan orang dengan skor
SAT lebih rendah cenderung memiliki nilai lebih rendah. Demikian pula, korelasi antara pencapaian
pendidikan dan pendapatan adalah positif; orang yang berpendidikan lebih baik cenderung
menghasilkan lebih banyak uang. Dalam Bab 2, kami melihat bahwa optimisme dan kesehatan
berkorelasi positif; orang yang lebih optimis cenderung lebih sehat.

Korelasi negatif menunjukkan hubungan terbalik dan negatif antara dua variabel. Saat nilai satu variabel
meningkat, nilai variabel lainnya menurun. Misalnya, korelasi antara harga diri dan rasa malu adalah
negatif. Orang-orang dengan harga diri yang lebih tinggi cenderung kurang pemalu, sedangkan orang-
orang dengan harga diri yang lebih rendah cenderung lebih pemalu. Korelasi antara konsumsi alkohol
dan nilai perguruan tinggi juga negatif. Rata-rata, semakin banyak alkohol yang dikonsumsi siswa dalam
seminggu, semakin rendah nilainya. Demikian juga, tingkat di mana orang memiliki rasa kendali atas
hidup mereka berkorelasi negatif dengan depresi; kontrol yang dirasakan lebih rendah dikaitkan dengan
depresi yang lebih besar, sedangkan kontrol persepsi yang lebih besar dikaitkan dengan depresi yang
lebih rendah.

Besarnya korelasi-nilai numeriknya, mengabaikan signexpresses kekuatan hubungan antara variabel.


Ketika koefisien korelasi nol (r = 0,00), kita tahu bahwa variabel tidak terkait linear. Sebagai nilai numerik
dari koefisien meningkat, demikian juga kekuatan hubungan linier. Dengan demikian, korelasi +.78
menunjukkan bahwa variabel lebih kuat terkait daripada korelasi +30. Ingatlah bahwa tanda koefisien
korelasi hanya menunjukkan arah hubungan dan tidak memberi tahu kita tentang kekuatannya. Dengan
demikian, korelasi-0,78 menunjukkan korelasi yang lebih besar (dan hubungan yang lebih kuat) daripada
korelasi +,40, tetapi hubungan pertama adalah negatif, sedangkan yang kedua adalah positif.

REPRESENTASI GRAFIK KORELASI

Hubungan antara dua variabel dapat digambarkan secara grafis pada sumbu x dan y. Untuk setiap
peserta, kita dapat memplot poin yang mewakili kombinasi skornya pada dua variabel (yang dapat kita
tentukan x dan y). Ketika skor untuk seluruh sampel diplot, representasi grafis yang dihasilkan dari data
disebut plot pencar. Plot sebaran hubungan antara depresi dan kecemasan ditunjukkan pada Gambar
6.1.

Gambar 6.2 menunjukkan beberapa plot sebaran hubungan antara dua variabel. Korelasi positif dapat
dikenali oleh kemiringan ke atas ke kanan, yang menunjukkan bahwa peserta dengan nilai tinggi pada
satu variabel (x) juga cenderung memiliki nilai tinggi pada variabel lain (y), sedangkan nilai rendah pada
satu variabel dikaitkan dengan rendah nilai di sisi lain. Korelasi negatif miring ke bawah ke kanan,
menunjukkan bahwa peserta yang mendapat skor tinggi pada satu variabel cenderung skor rendah pada
variabel lain, dan sebaliknya.
Semakin kuat korelasinya, semakin erat data terkelompok di sekitar garis imajiner yang melintasinya.
Ketika kita memiliki korelasi sempurna (-1.00 atau +1.00), semua data jatuh dalam garis lurus, seperti
pada Gambar 6.2 (e). Pada ekstrem yang lain, korelasi nol muncul sebagai array acak dari titik-titik
karena kedua variabel tidak memiliki hubungan satu sama lain (lihat Gambar 6.2 [f]).

Sebagaimana dicatat, korelasi nol menunjukkan bahwa variabel tidak berhubungan linear. Namun, ada
kemungkinan bahwa mereka terkait secara melengkung. Lihat, misalnya, pada Gambar 6.3. Plot sebar ini
menunjukkan hubungan antara gairah fisiologis dan kinerja; orang berkinerja lebih baik ketika mereka
cukup terangsang daripada ketika gairah sangat rendah atau sangat tinggi. Jika kita menghitung
koefisien korelasi untuk data ini, rwill hampir nol. Bisakah kita menyimpulkan bahwa gairah dan kinerja
tidak terkait? Tidak, seperti yang ditunjukkan Gambar 6.3, mereka terkait erat. Tetapi hubungan itu
curvilinear, dan korelasi hanya memberi tahu kita tentang hubungan linear. Banyak peneliti secara
teratur memeriksa sebar sebaran data mereka untuk memastikan bahwa variabel-variabel tersebut
tidak saling terkait. Statistik ada untuk mengukur tingkat hubungan curvilinear antara dua variabel,
tetapi statistik itu tidak menjadi perhatian kita di sini. Cukup ingat bahwa koefisien korelasi hanya
memberi tahu kita tentang hubungan linear antar variabel.

Anda sekarang harus bisa masuk akal dari koefisien korelasi pada Tabel 6.1. Pertama, kita melihat bahwa
korelasi antara skor introversi-ekstraversi anak-anak dan orang tua kandung mereka adalah +19. Ini
adalah korelasi positif, yang berarti bahwa anak-anak yang mendapat skor tinggi dalam introversi-
extraversion cenderung menjadi mereka yang orang tua kandungnya juga memiliki skor introversi-
extraversion yang tinggi. Sebaliknya, anak-anak dengan skor lebih rendah cenderung menjadi mereka
yang orang tua kandungnya juga mendapat skor rendah. Namun korelasinya hanya 0,19, yang
mengindikasikan hubungan yang relatif lemah antara skor anak-anak dan orang tua kandung mereka.

Korelasi antara skor introversi-ekstraversi anak-anak dan orang tua angkat mereka adalah 0,00; tidak
ada hubungan. Mempertimbangkan dua korelasi ini secara bersama-sama menunjukkan bahwa tingkat
introversi seorang anak lebih erat kaitannya dengan tingkat orang tua kandungnya daripada tingkat
orang tua angkatnya. Hal yang sama juga berlaku untuk neurotisme. Korelasi untuk anak-anak dan orang
tua kandung mereka adalah +.25, sedangkan korelasi untuk anak-anak dan orang tua angkat hanya +.05.
Sekali lagi, korelasi positif ini kecil, tetapi mereka lebih kuat secara alami daripada untuk orang tua
angkat.

KORELASI DETERMINASI

Kita telah melihat bahwa koefisien korelasi, r, menyatakan arah dan kekuatan & hubungan antara dua
variabel. Tapi apa, tepatnya, yang ditunjukkan oleh nilai r? Jika skor neurotisme anak-anak berkorelasi
+25 dengan skor orang tua mereka, kita tahu ada hubungan positif, tetapi apa yang angka itu katakan
kepada kita?

Untuk menafsirkan koefisien korelasi sepenuhnya, pertama-tama kita harus membuatnya. Ini karena
statistik, r, tidak pada skala rasio. Akibatnya, kami tidak dapat menambahkan, mengurangi, mengalikan,
atau membagi koefisien korelasi, juga tidak dapat membandingkannya secara langsung. Berlawanan
dengan tampilannya, korelasi 0,80 tidak dua kali lebih besar dari korelasi 0,4O! Untuk membuat r lebih
mudah ditafsirkan, kami kuadratkan untuk mendapatkan koefisien determinasi, yang berada pada skala
rasio pengukuran dan mudah ditafsirkan. Apa yang ditunjukkannya? Untuk menjawab pertanyaan ini,
mari kita kembali sejenak ke konsep varians.
Kami belajar di Bab 2 bahwa varians menunjukkan jumlah variabilitas dalam satu set data. Kami belajar
juga bahwa varians total dalam satu set data dapat dipartisi menjadi varians sistematis dan varians
kesalahan. Varians sistematis adalah bagian dari total variabilitas dalam respons partisipan yang terkait
dengan variabel yang diselidiki peneliti. Varians kesalahan adalah bagian dari total varians yang tidak
terkait dengan variabel yang diteliti dalam penelitian. Kami juga belajar bahwa para peneliti dapat
menilai kekuatan hubungan yang mereka pelajari dengan menentukan proporsi total varians dalam
tanggapan partisipan yang merupakan varians sistematis terkait dengan variabel lain yang diteliti.
(Proporsi ini sama dengan kuantitas, varians sistematis / total varians.) Semakin tinggi proporsi total
varians dalam satu variabel yaitu varians sistematis terkait dengan variabel lain, semakin kuat akan
hubungan di antara mereka.

Koefisien korelasi kuadrat (atau koefisien determinasi) memberi tahu kita proporsi varians dalam salah
satu variabel kita yang diperhitungkan oleh variabel lain. Dilihat dengan cara lain, koefisien determinasi
menunjukkan proporsi total varians dalam satu variabel yaitu varian sistematis yang dibagi dengan
variabel lainnya. Sebagai contoh, jika kita kuadratkan korelasi antara skor neurotisme anak-anak dan
orang tua biologis mereka (0,25 x 0,25), kita memperoleh koefisien determinasi 0,0625. Ini memberitahu
kita bahwa 6,25% dari varians dalam skor neurotisme anak-anak dapat dipertanggungjawabkan oleh
skor orang tua mereka, atau, dengan kata lain, 6,25% dari total. varians dalam skor anak-anak adalah
varians sistematis, yang merupakan varians terkait dengan skor orang tua.

Ketika dua variabel tidak berkorelasi-ketika r adalah .OO-mereka benar-benar independen, dan kami
tidak dapat menjelaskan salah satu varians dalam satu variabel dengan variabel lainnya. Untuk
mengatakannya secara berbeda, tidak ada varians sistematis dalam data. Namun, sejauh dua variabel
berkorelasi satu sama lain, skor pada satu variabel terkait dengan skor pada variabel lainnya, dan varians
sistematis hadir. Adanya korelasi (dan, dengan demikian, varians sistematis) berarti bahwa kita dapat
menjelaskan, atau menjelaskan, beberapa varians dalam satu variabel oleh variabel lainnya.

Jika kita tahu semua yang perlu diketahui tentang neurotisme, kita akan tahu semua faktor yang
menjelaskan perbedaan dalam skor neurotisme anak-anak, seperti faktor genetik, tidak adanya
kehidupan rumah yang aman, orangtua neurotik yang menyediakan model perilaku neurotik, harga diri
rendah, dan sebagainya. Jika kita tahu segalanya tentang neuroticism, kita dapat menjelaskan 100% dari
varian skor neuroticism anak-anak.

Tapi kita tidak semua tahu. Yang terbaik yang bisa kita lakukan adalah melakukan penelitian yang
melihat hubungan antara neuroticism dan beberapa variabel lainnya. Dalam kasus penelitian yang
dilakukan oleh Scarr dan rekan-rekannya (1981) yang dijelaskan sebelumnya, kita dapat menjelaskan
hanya sebagian kecil dari varians dalam skor neurotisme anak-anak - bagian yang berhubungan dengan
neurotisme dari orang tua kandung mereka. Mengingat begitu banyak faktor yang memengaruhi
neuroticism, sungguh tidak mengejutkan bahwa satu faktor tertentu, seperti neuroticism parental,
hanya terkait lemah dengan neuroticism anak-anak.

Singkatnya, kuadrat dari koefisien korelasi-koefisien determinasi-menunjukkan proporsi varians dalam


satu variabel yang dapat diperhitungkan oleh variabel lain. Jika r adalah nol, kami tidak
memperhitungkan variansnya. Jika r sama dengan - 1.00 atau +1.00, kami dapat dengan sempurna
menghitung 100% dari varians. Dan jika r ada di antara keduanya, semakin banyak perbedaan yang kita
perhitungkan, semakin kuat hubungannya.
KONTRIBUTOR UNTUK PENELITIAN PERILAKU

Penemuan Korelasi

Pengembangan korelasi sebagai prosedur statistik dimulai dengan karya Sir Francis Galton. Penasaran
dengan ide-ide sepupunya, Charles Darwin, mengenai evolusi, Galton mulai menyelidiki keturunan
manusia. Salah satu aspek karyanya tentang pewarisan meliputi mengukur berbagai bagian tubuh pada
ratusan orang dan orang tua mereka. Pada tahun 1888, Galton memperkenalkan "indeks korelasi"
sebagai metode untuk menggambarkan sejauh mana dua pengukuran tersebut terkait. Alih-alih menjadi
formula matematis yang ketat, prosedur asli Galton untuk mengestimasi hubungan bersama (yang ia
nyatakan dengan huruf r untuk pembalikan) melibatkan memeriksa data yang telah digambarkan pada
sumbu x dan y (Cowles, 1989; Stigler, 1986) .

Karya mani Galton memicu kegembiraan yang intens di antara tiga ilmuwan Inggris yang selanjutnya
mengembangkan teori dan matematika korelasi. Walter Weldon, ahli zoologi Cambridge, mulai
menggunakan ide-ide Galton mengenai korelasi dalam penelitiannya tentang udang dan kepiting. Dalam
konteks karyanya meneliti korelasi antara berbagai bagian tubuh krustasea, Weldon pertama kali
memperkenalkan konsep korelasi negatif. (Weldon mencoba untuk menamai r setelah Galton, tetapi
istilah fungsi Galton tidak pernah dipakai; Cowles, 1989.)

Pada tahun 1892 Francis Edgeworth menerbitkan rumus matematika pertama untuk menghitung
koefisien korelasi secara langsung. Sayangnya, Edgeworth awalnya tidak mengakui pentingnya karyanya,
yang dimakamkan secara lebih umum, "sangat sulit untuk mengikuti kertas" pada statistik (Cowles,
1989, p.139).

Jadi, ketika siswa Galton, Karl Pearson, memperoleh formula untuk menghitung r pada tahun 1895, ia
tidak tahu bahwa Edgeworth telah memperoleh formula yang pada dasarnya setara beberapa tahun
sebelumnya. Edgeworth sendiri memberi tahu Pearson tentang fakta ini pada tahun 1896, dan Pearson
kemudian mengakui bahwa ia tidak hati-hati memeriksa karya orang lain sebelumnya. Meski begitu,
Pearson mengakui pentingnya penemuan ini dan terus memanfaatkannya, menerapkan formula untuk
masalah penelitian baik dalam biologi dan psikologi (Pearson & Kendall, 1970; Stigler, 1986). Karena
Pearson adalah orang yang mempopulerkan rumus untuk menghitung r, koefisien tersebut dikenal
sebagai koefisien korelasi Pearson, atau Pearson r.

SIGNIFIKANSI R

Ketika menghitung korelasi antara dua variabel, peneliti tertarik tidak hanya pada nilai koefisien korelasi,
tetapi juga pada apakah nilai r yang mereka peroleh signifikan secara statistik. Signifikansi statistik ada
ketika koefisien korelasi yang dihitung pada sampel memiliki probabilitas sangat rendah untuk menjadi
nol dalam populasi.

Untuk memahami apa artinya ini, mari kita bayangkan sejenak bahwa kita semua adalah makhluk yang
mengetahui, dan bahwa, sebagai makhluk yang mengetahui segalanya, kita tahu dengan pasti bahwa
jika kita menguji setiap manusia di muka bumi, kita akan menemukan bahwa korelasinya antara dua
variabel tertentu, x dan y, benar-benar nol (yaitu, r = 0,00). Sekarang, bayangkan seorang peneliti
perilaku fana ingin menghitung korelasi antara dua variabel ini. Tentu saja, sebagai manusia, peneliti ini
tidak dapat mengumpulkan data pada jutaan orang di seluruh dunia, jadi dia mendapatkan sampel 200
responden, ukuran x dan y untuk setiap responden, dan menghitung r. Apakah nilai r yang ia peroleh
adalah 0,00? Saya menduga Anda dapat menebak bahwa jawabannya mungkin tidak. Karena kesalahan
pengambilan sampel, kesalahan pengukuran, dan sumber varians kesalahan lainnya, ia kemungkinan
akan mendapatkan koefisien korelasi bukan nol meskipun korelasi sebenarnya dalam populasi adalah
nol.

Tentu saja, perbedaan ini menciptakan masalah. Ketika kita menghitung koefisien korelasi, bagaimana
kita tahu apakah kita tidak dapat mempercayai nilai yang kita peroleh atau apakah nilai sebenarnya dari
r dalam populasi mungkin, pada kenyataannya, adalah nol? Ternyata, kita tidak dapat mengetahui
secara pasti, tetapi kita dapat memperkirakan probabilitas bahwa nilai yang kita peroleh dalam
penelitian kita akan benar-benar nol jika kita telah menguji seluruh populasi dari mana sampel kita
diambil. Dan, jika probabilitas bahwa korelasi kami benar-benar nol dalam populasi cukup rendah
(biasanya kurang dari 0,05), kami menyebutnya signifikan secara statistik.

Signifikansi statistik dari koefisien korelasi dipengaruhi oleh tiga faktor. Pertama adalah ukuran sampel
kami. Anggaplah, tanpa sepengetahuan satu sama lain, Anda dan saya secara independen menghitung
korelasi antara rasa malu dan harga diri dan bahwa kami berdua memperoleh korelasi -50. Namun,
perhitungan Anda didasarkan pada data dari 300 peserta, sedangkan perhitungan saya didasarkan pada
data dari 30 peserta. Siapakah di antara kita yang harus merasa lebih yakin bahwa korelasi sejati antara
rasa malu dan harga diri dalam populasi bukanlah .OO? Anda mungkin bisa menebak bahwa sampel 300
Anda harus memberi Anda lebih percaya diri pada nilai r yang Anda peroleh dari sampel saya 30. Jadi,
semua hal lain dianggap sama, kami lebih cenderung menyimpulkan bahwa korelasi tertentu secara
statistik signifikan, semakin besar sampel kami adalah.

Kedua, signifikansi statistik dari koefisien korelasi tergantung pada besarnya korelasi. Untuk ukuran
sampel yang diberikan, semakin besar nilai r yang kita peroleh, semakin kecil kemungkinannya menjadi
0,00 dalam populasi. Bayangkan Anda dan saya sama-sama menghitung koefisien korelasi berdasarkan
data dari 300 peserta; nilai Anda yang dihitung dari r adalah 0,75, sedangkan nilai r saya adalah 0,20.
Anda akan lebih yakin bahwa korelasi Anda tidak benar-benar 0,00 dalam populasi daripada saya.

Ketiga, signifikansi statistik tergantung pada seberapa hati-hati kita ingin tidak menarik kesimpulan yang
salah tentang apakah korelasi yang kita peroleh bisa nol dalam populasi. Semakin kita ingin berhati-hati,
semakin besar korelasinya harus dinyatakan "signifikan." Biasanya, para peneliti memutuskan bahwa
mereka akan menganggap korelasi berbeda secara signifikan dari nol jika ada kurang dari 5% peluang
(yaitu, kurang dari 5 peluang dari 100) bahwa korelasi sebesar yang mereka peroleh bisa saja berasal
dari populasi dengan korelasi benar nol.

Rumus dan tabel untuk menguji signifikansi statistik dari koefisien korelasi dapat ditemukan di banyak
buku statistik (lihat, misalnya, Minium, 1978). Tabel 6.3 menunjukkan bagian dari satu tabel tersebut.
Tabel ini menunjukkan nilai minimum r yang akan dianggap signifikan secara statistik jika kita
menetapkan peluang untuk membuat keputusan yang salah pada 5%. Misalnya, bayangkan Anda
memperoleh nilai r = 0,32 berdasarkan sampel 100 peserta. Melihat ke bawah kolom sebelah kiri,
temukan jumlah peserta (100). Melihat kolom lainnya, kita melihat bahwa nilai minimum r yang
signifikan dengan 100 peserta adalah 0,16. Karena koefisien korelasi kami (0,32) melebihi 0,16, kami
menyimpulkan bahwa korelasi populasi sangat tidak mungkin menjadi nol (pada kenyataannya, ada
kemungkinan kurang dari 5% bahwa korelasi populasi adalah nol).
Namun, jika koefisien korelasi yang kami hitung kurang dari 0,16, kami akan menyimpulkan bahwa itu
bisa dengan mudah berasal dari populasi di mana korelasi antara variabel-variabel kami adalah nol.
Dengan demikian, dianggap tidak signifikan secara statistik, dan kita harus memperlakukannya seolah-
olah nol.

Perlu diingat bahwa, dengan sampel besar, bahkan korelasi yang sangat kecil secara statistik signifikan.
Dengan demikian, menemukan bahwa r tertentu signifikan hanya memberitahu kita bahwa itu sangat
tidak mungkin menjadi 0,00 dalam populasi; itu tidak memberi tahu kita apakah hubungan antara kedua
variabel itu kuat atau penting. Kekuatan suatu korelasi dinilai hanya dari besarnya, bukan apakah itu
signifikan secara statistik. Meskipun hanya aturan praktis, peneliti perilaku cenderung menganggap
korelasi pada atau di bawah sekitar 0,10 sebagai lemah dalam besarnya (mereka hanya menyumbang
1% dari varians), korelasi sekitar 0,30 sebagai sedang dalam besarnya, dan korelasi lebih dari 0,50
sebagai kuat dalam besarnya (Cohen, 1977).

Faktor-Faktor Yang Mendistorsi Koefisien Korelasi

Koefisien korelasi tidak selalu seperti apa tampaknya. Banyak faktor yang dapat menghasilkan koefisien
yang meremehkan atau menaksir terlalu tinggi tingkat hubungan antara dua variabel. Oleh karena itu,
ketika menginterpretasikan koefisien korelasi, seseorang harus waspada terhadap tiga faktor yang
secara artifisial mengembang atau mengempiskan besarnya korelasi.

Rentang Terbatas

Lihatlah sejenak pada Gambar 6.4 (a). Dari sebaran plot ini, menurut Anda apakah skor SAT dan nilai
rata-rata titik terkait? Ada tren linear positif yang jelas pada data, yang mencerminkan korelasi positif
sedang. Sekarang lihat Gambar 6.4 (b). Dalam kumpulan data ini, apakah skor SAT dan IPK berkorelasi?
Dalam hal ini, polanya, jika memang ada, jauh lebih jelas. Sulit dikatakan apakah ada hubungan atau
tidak.

Jika sekarang Anda akan melihat Gambar 6.4 (c), Anda akan melihat bahwa Gambar 6.4 (b) sebenarnya
diambil dari bagian kecil Gambar 6.4 (a). Namun, alih-alih mewakili kisaran penuh skor SAT yang
mungkin dan rata-rata titik kelas, data yang ditunjukkan pada Gambar 6.4 (b) mewakili kisaran yang
sangat sempit atau terbatas. Alih-alih berkisar antara 200 hingga 1.600, nilai SAT hanya turun di kisaran
1.000 hingga 1.150.

Angka-angka ini menunjukkan secara grafis apa yang terjadi pada korelasi ketika rentang data dibatasi.
Korelasi yang diperoleh pada kelompok partisipan yang relatif homogen yang nilainya jatuh dalam
kisaran sempit lebih kecil daripada yang diperoleh dari sampel heterogen dengan rentang skor yang
lebih luas. Jika rentang skor dibatasi, seorang peneliti dapat disesatkan untuk menyimpulkan bahwa
kedua variabel hanya berkorelasi lemah, jika sama sekali. Namun, seandainya rentang skor yang lebih
luas diambil, hubungan yang kuat akan muncul. Pelajaran di sini adalah untuk memeriksa data mentah
seseorang untuk memastikan kisaran skor tidak secara artifisial dibatasi.

Masalahnya mungkin bahkan lebih serius jika dua variabel terkait pertama kali dan kisaran skor dibatasi.
Lihat, misalnya, pada Gambar 6.5. Grafik ini menunjukkan hubungan antara kecemasan dan kinerja pada
tugas yang kami periksa sebelumnya, dan, hubungan itu jelas melengkung. Sekarang bayangkan Anda
memilih sampel 200 responden dari pusat perawatan fobia dan memeriksa hubungan antara kecemasan
dan kinerja untuk 200 peserta ini. Karena sampel Anda memiliki rentang skor terbatas (menjadi fobia,
subjek ini lebih tinggi daripada rata-rata dalam kecemasan), Anda mungkin akan mendeteksi hubungan
linear negatif antara kecemasan dan kinerja, bukan hubungan lengkung. Anda dapat melihat ini secara
grafik pada Gambar 6.5 jika Anda hanya melihat data untuk peserta yang mendapat skor di atas rata-
rata dalam kecemasan. Untuk individu-individu ini, ada hubungan negatif yang kuat antara skor
kecemasan mereka dan skor mereka pada ukuran kinerja.

Outlier

Pencilan adalah skor yang sangat jelas menyimpang dari sisa data sehingga orang dapat
mempertanyakan apakah mereka termasuk dalam kumpulan data. Banyak peneliti menganggap skor
sebagai outlier jika lebih jauh dari 3 standar deviasi dari rata-rata data. Anda mungkin ingat dari Bab 5
bahwa, dengan asumsi kita memiliki distribusi normal, skor yang jatuh lebih dari 3 standar deviasi di
bawah rata-rata lebih kecil dari lebih dari 99% skor; skor yang jatuh lebih dari 3 standar deviasi di atas
rata-rata lebih besar dari lebih dari 99% skor. Jelas, skor yang menyimpang dari rata-rata oleh lebih dari
± 3 standar deviasi sangat tidak biasa.

Gambar 6.6 menunjukkan dua jenis outlier. Gambar 6.6 (a) menunjukkan dua outlier online. Skor dua
peserta, meskipun jatuh dalam pola yang sama dengan sisa data, sangat ekstrim pada kedua variabel.
Pencilan online cenderung meningkatkan koefisien korelasi secara artifisial, menjadikannya lebih besar
dari yang dibenarkan oleh data lainnya. Gambar 6.6 (b) menunjukkan dua outlier offline. Outlier offline
cenderung mengempiskan nilai r secara artifisial. Kehadiran bahkan beberapa outlier offline akan
menyebabkan r menjadi lebih kecil dari yang ditunjukkan oleh sebagian besar data.

Karena outlier dapat mengarah pada kesimpulan yang salah tentang kekuatan korelasi antar variabel,
peneliti harus memeriksa plot pencar data mereka untuk mencari outlier. Beberapa peneliti
mengecualikan pencilan dari analisis mereka, dengan alasan bahwa skor ekstrem seperti itu adalah
cacing yang tidak benar-benar termasuk dalam data. Peneliti lain mengubah skor outlier dengan nilai
variabel yaitu 3 standar deviasi dari rata-rata. Dengan membuat outlier tidak terlalu ekstrem, peneliti
dapat memasukkan data partisipan dalam analisis sambil meminimalkan tingkat distorsi koefisien
korelasinya. Anda perlu menyadari bahwa, sementara banyak peneliti secara teratur menghilangkan
atau mencetak ulang outlier yang mereka temukan dalam data mereka, peneliti lain mengecilkan
memodifikasi data dengan cara ini. Namun, karena hanya satu atau dua pencilan ekstrem yang dapat
secara buruk mendistorsi koefisien korelasi dan mengarah pada kesimpulan yang salah, biasanya para
peneliti harus mengambil beberapa tindakan untuk menangani pencilan.

Keandalan Tindakan

Langkah-langkah yang tidak dapat diandalkan menipiskan besarnya koefisien korelasi. Semua hal lain
dianggap sama, semakin tidak dapat diandalkan ukuran kita, semakin rendah koefisien korelasi yang
akan kita dapatkan. (Anda mungkin ingin meninjau bagian keandalan pada Bab 3.)

Untuk memahami mengapa demikian, mari kita bayangkan lagi bahwa kita maha tahu. Dalam
kebijaksanaan kita yang tak terbatas, kita tahu bahwa korelasi nyata antara neuroticism anak dan
neuroticism orang tuanya adalah, katakanlah, +,45. Namun, mari kita asumsikan juga bahwa seorang
peneliti yang kurang terlatih dan salah menggunakan ukuran neurotisme yang sama sekali tidak dapat
diandalkan. Artinya, sama sekali tidak memiliki tes-retest atau reliabilitas sementara. Jika ukuran peneliti
sama sekali tidak dapat diandalkan, berapa nilai r yang akan ia peroleh antara skor orang tua dan anak-
anak? Bukan +.45 (korelasi sebenarnya), melainkan 0,00. Tentu saja, para peneliti jarang menggunakan
langkah-langkah yang sama sekali tidak dapat diandalkan. Meski begitu, semakin tidak dapat diandalkan
ukurannya, semakin rendah korelasinya.

Korelasi dan Kausalitas

Mungkin pertimbangan yang paling penting dalam menafsirkan koefisien korelasi adalah bahwa korelasi
tidak menyiratkan hubungan sebab akibat. Seringkali orang akan menyimpulkan bahwa karena dua
fenomena terkait, mereka harus saling berhubungan secara kausal. Ini belum tentu demikian; satu
variabel dapat sangat terkait dengan yang lain namun tidak menyebabkannya. Ketebalan mantel ulat
mungkin berkorelasi tinggi dengan tingkat keparahan cuaca musim dingin, tetapi kita tidak dapat
menyimpulkan bahwa ulat menyebabkan badai salju, badai es, dan suhu beku. Bahkan jika dua variabel
berkorelasi sempurna (r = -1,00 atau +1,00), kita tidak dapat menyimpulkan bahwa salah satu variabel
menyebabkan yang lain. Poin ini sangat penting, jadi saya akan mengulanginya: Korelasi tidak pernah
dapat digunakan untuk menyimpulkan bahwa salah satu variabel menyebabkan atau mempengaruhi
yang lain. Sederhananya, korelasi tidak menyiratkan hubungan sebab akibat.

Bagi kita untuk menyimpulkan bahwa satu variabel menyebabkan atau mempengaruhi variabel lain, tiga
kriteria harus dipenuhi: kovariation, directionality, dan eliminasi variabel asing. Namun, sebagian besar
penelitian korelasional hanya memuaskan yang pertama dari kriteria ini.

Pertama, untuk menyimpulkan bahwa dua variabel terkait secara kausal, mereka pertama-tama harus
ditemukan kovari, atau berkorelasi. Jika satu variabel menyebabkan yang lain, maka perubahan nilai dari
satu variabel harus dikaitkan dengan perubahan nilai dari variabel lainnya. Tentu saja, ini adalah apa arti
korelasi menurut definisi, jadi jika dua variabel ditemukan berkorelasi, kriteria pertama untuk
menyimpulkan kausalitas terpenuhi.

Kedua, untuk menyimpulkan bahwa dua variabel terkait secara kausal, kita harus menunjukkan bahwa
dugaan penyebab mendahului waktu efek yang diperkirakan. Namun, dalam sebagian besar penelitian
korelasional, kedua variabel diukur pada saat yang sama. Misalnya, jika seorang peneliti
mengkorelasikan skor peserta pada dua ukuran kepribadian yang dikumpulkan pada saat yang sama,
tidak ada cara untuk menentukan arah kausalitas. Apakah variabel x menyebabkan variabel y, atau
apakah variabel y menyebabkan variabel x (atau, mungkin, tidak satu pun)?

Kriteria ketiga untuk menyimpulkan kausalitas adalah bahwa semua faktor asing yang mungkin
mempengaruhi hubungan antara dua variabel dikontrol atau dihilangkan. Penelitian korelasional tidak
pernah memenuhi persyaratan ini sepenuhnya. Dua variabel dapat dikorelasikan bukan karena
keduanya terkait satu sama lain, tetapi karena keduanya terkait dengan variabel ketiga. Sebagai contoh,
Levin dan Stokes (1986) tertarik pada korelasi kesendirian. Di antara hal-hal lain, mereka menemukan
bahwa kesepian berkorelasi +60 dengan depresi. Apakah ini berarti kesepian membuat orang depresi
atau depresi membuat orang merasa kesepian? Mungkin juga tidak. Pilihan lain adalah kesepian dan
depresi disebabkan oleh variabel ketiga, seperti kualitas jejaring sosial seseorang. Memiliki banyak
teman dan kenalan, misalnya, dapat mengurangi kesepian dan depresi.

Ketidakmampuan untuk menarik kesimpulan tentang kausalitas dari data korelasional adalah dasar dari
desakan industri tembakau bahwa tidak ada penelitian yang menghasilkan bukti hubungan sebab akibat
antara merokok dan kanker paru-paru pada manusia. Banyak penelitian menunjukkan bahwa merokok
dan kejadian kanker berkorelasi pada manusia; lebih banyak merokok dikaitkan dengan kemungkinan
lebih besar terkena kanker paru-paru. Tetapi karena datanya korelasional, kami tidak dapat
menyimpulkan hubungan sebab akibat antara merokok dan kesehatan. Penelitian telah menetapkan
bahwa merokok menyebabkan kanker pada hewan laboratorium, karena penelitian hewan dapat
menggunakan desain eksperimental yang memungkinkan kita untuk menyimpulkan hubungan sebab-
akibat. Namun, melakukan penelitian eksperimental pada manusia akan membutuhkan secara acak
menugaskan orang untuk merokok berat. Tidak hanya studi seperti itu tidak etis, tetapi apakah Anda
akan secara sukarela berpartisipasi dalam studi yang mungkin memberi Anda kanker? Karena kita
terbatas hanya melakukan penelitian korelasional tentang merokok pada manusia, kita tidak dapat
menyimpulkan hubungan sebab akibat dari hasil kita.

Korelasi parsial

Meskipun kita tidak pernah dapat menyimpulkan bahwa dua variabel berkorelasi menyebabkan satu
sama lain, para peneliti memiliki strategi penelitian yang memungkinkan mereka untuk membuat
perkiraan tentang apakah variabel berkorelasi mungkin terkait secara kausal. Strategi-strategi ini tidak
dapat memberikan kesimpulan sebab akibat yang pasti, tetapi mereka dapat memberi kita bukti bahwa
baik atau tidak mendukung penjelasan sebab akibat tertentu dari hubungan antara dua variabel yang
berkorelasi. Meskipun peneliti tidak pernah dapat menyimpulkan bahwa satu variabel berkorelasi benar-
benar menyebabkan yang lain, mereka mungkin dapat menyimpulkan bahwa penjelasan kausal tertentu
tentang hubungan antara variabel lebih cenderung benar daripada penjelasan kausal lainnya.

Jika kami menemukan bahwa dua variabel, x dan y, berkorelasi, ada tiga penjelasan kausal umum
tentang hubungan mereka: x dapat menyebabkan y, y dapat menyebabkan x, atau beberapa variabel
atau variabel lain (z) dapat menyebabkan x dan y. Bayangkan bahwa kita menemukan korelasi negatif
antara konsumsi alkohol dan nilai perguruan tinggi - semakin banyak siswa minum alkohol per minggu,
semakin rendah nilainya. Korelasi seperti itu dapat dijelaskan dalam tiga cara. Di satu sisi, penggunaan
alkohol yang berlebihan dapat menyebabkan nilai siswa turun (karena mereka minum daripada belajar,
tidak masuk kelas karena mabuk, atau apa pun). Atau, mendapatkan nilai yang buruk dapat
menyebabkan siswa minum (untuk menghilangkan stres karena gagal, misalnya).

Kemungkinan ketiga adalah bahwa korelasi antara konsumsi alkohol dan kadar disebabkan oleh
beberapa variabel ketiga. Mungkin depresi adalah penyebabnya: Siswa yang sangat depresi tidak
berhasil dengan baik di kelas, dan mereka mungkin mencoba untuk meredakan depresi mereka dengan
minum. Dengan demikian, penggunaan dan kadar alkohol dapat dikorelasikan hanya secara tidak
langsung-berdasarkan hubungan mereka dengan depresi. Atau, hubungan antara alkohol dan nilai dapat
disebabkan oleh nilai yang siswa tempatkan pada hubungan sosial versus prestasi akademik. Siswa yang
sangat mementingkan kehidupan sosial mereka dapat belajar lebih sedikit dan berpesta lebih banyak.
Akibatnya, mereka secara kebetulan menerima kadar yang lebih rendah dan minum lebih banyak
alkohol, tetapi kadar dan minuman tersebut tidak berhubungan langsung. (Dapatkah Anda memikirkan
variabel ketiga selain depresi dan kemampuan bersosialisasi yang mungkin memediasi hubungan antara
konsumsi alkohol dan kadar?)

Peneliti dapat menguji hipotesis tentang efek yang mungkin dari variabel ketiga pada korelasi yang
mereka peroleh dengan menggunakan prosedur statistik yang disebut korelasi parsial. Korelasi parsial
memungkinkan peneliti untuk menguji pengaruh variabel ketiga terhadap korelasi antara dua variabel
lainnya. Secara khusus, korelasi parsial adalah korelasi antara dua variabel dengan pengaruh satu atau
lebih variabel lain yang dihapus secara statistik.

Bayangkan kita memperoleh korelasi antara x dan y, dan kita ingin tahu apakah hubungan antara x dan y
disebabkan oleh fakta bahwa x dan yare keduanya disebabkan oleh beberapa variabel ketiga, z. Kami
dapat secara statistik menghapus variabilitas dalam x dan y yang terkait dengan z dan melihat apakah x
dan yare masih berkorelasi. Jika x dan y masih berkorelasi setelah kita menghilangkan pengaruh z, kita
dapat menyimpulkan bahwa hubungan antara x dan y tidak mungkin disebabkan oleh z. Dinyatakan
secara berbeda, jika x dan y berkorelasi bahkan ketika varians sistematis karena z dihilangkan, z tidak
mungkin menyebabkan hubungan antara x dan y.

Namun, jika x dan yare tidak lagi berkorelasi setelah pengaruh z dihapus secara statistik, kami memiliki
bukti bahwa korelasi antara x dan y adalah karena z atau beberapa variabel lain yang terkait dengan z.
Artinya, varians sistematis yang terkait dengan z harus bertanggung jawab atas hubungan antara x dan
y.

Mari kita kembali ke contoh kita yang melibatkan konsumsi alkohol dan nilai perguruan tinggi. Jika kita
ingin tahu apakah variabel ketiga, seperti depresi, bertanggung jawab untuk korelasi antara alkohol dan
kadar, kita dapat menghitung korelasi parsial antara penggunaan alkohol dan rata-rata titik kadar
sementara secara statistik menghapus (memilah-milah) variabilitas yang terkait dengan skor depresi .
Jika korelasi antara penggunaan alkohol dan kadar tetap tidak berubah ketika depresi dihilangkan, kita
akan memiliki alasan yang baik untuk menyimpulkan bahwa hubungan antara penggunaan alkohol dan
kadar bukan karena depresi. Namun, jika depresi dihilangkan dari korelasi dan korelasi parsial antara
alkohol dan kadar secara substansial lebih rendah dari korelasi mereka yang sebenarnya, kita akan
menyimpulkan bahwa depresi - atau sesuatu yang terkait dengan depresi - memediasi hubungan.

Rumus yang digunakan untuk menghitung korelasi parsial tidak menjadi perhatian kita di sini. Yang
penting adalah untuk mengakui bahwa, meskipun kita tidak pernah dapat menyimpulkan kausalitas dari
korelasi, kita dapat menguji hipotesis kausal dengan menggunakan korelasi parsial serta teknik lain yang
akan kita bahas dalam Bab 7.

STUDI KASUS PERILAKU PERILAKU

Korelasi Parsial: Depresi, Kesepian, dan Dukungan Sosial

Sebelumnya saya menyebutkan sebuah studi oleh Levin and Stokes (1986) yang menemukan korelasi
0,60 antara kesepian dan depresi. Para peneliti ini berhipotesis bahwa satu alasan mengapa orang yang
kesepian cenderung lebih tertekan adalah karena mereka memiliki jaringan dukungan sosial yang lebih
kecil; orang yang memiliki lebih sedikit teman lebih cenderung merasa kesepian dan lebih cenderung
mengalami depresi (karena mereka tidak memiliki dukungan sosial dan emosional). Dengan demikian,
hubungan antara kesepian dan depresi mungkin disebabkan oleh variabel ketiga, kurangnya dukungan
sosial.

Untuk menguji kemungkinan ini, Levin dan Stokes menghitung korelasi parsial antara kesepian dan
depresi, menghilangkan pengaruh jejaring sosial peserta. Ketika mereka menghapus variabilitas karena
jejaring sosial, korelasi parsial adalah 0,39, agak lebih rendah daripada korelasi antara kesepian dan
depresi tanpa variabilitas karena jejaring sosial berpisah. Pola hasil ini menunjukkan bahwa beberapa
hubungan antara kesepian dan depresi dapat dimediasi oleh variabel jaringan sosial. Namun, bahkan
dengan faktor jaringan sosial dihilangkan, kesendirian dan depresi masih berkorelasi, yang menunjukkan
bahwa faktor-faktor selain jaringan sosial juga berkontribusi pada hubungan di antara mereka.
Koefisien Korelasi Lainnya

Kami fokus dalam bab ini pada koefisien korelasi Pearson karena ini adalah indeks korelasi yang paling
umum digunakan. Korelasi Pearson sesuai ketika kedua variabel, x dan y, berada pada skala interval atau
rasio pengukuran (karena sebagian besar variabel yang dipelajari oleh peneliti perilaku). Ingatlah dari
Bab 3 bahwa untuk skala interval dan rasio, perbedaan yang sama antara jumlah yang diberikan pada
respons partisipan mencerminkan perbedaan yang sama antara partisipan dalam karakteristik yang
diukur. (Skala interval dan rasio berbeda dalam skala rasio yang memiliki titik nol sejati, sedangkan skala
interval tidak.)

Ketika satu atau kedua variabel diukur pada skala ordinal-di mana angka-angka mencerminkan urutan
peringkat peserta pada beberapa atribut-koefisien korelasi urutan-peringkat Spearman digunakan.
Sebagai contoh, anggaplah kita ingin mengetahui seberapa baik guru dapat menilai kecerdasan siswa
mereka. Kami meminta seorang guru untuk memberi peringkat 30 siswa di kelas dari 1 hingga 30 dalam
hal kecerdasan umum mereka. Kemudian kami memperoleh nilai IQ siswa pada tes kecerdasan standar.
Karena penilaian guru berada pada skala pengukuran ordinal, kami menghitung koefisien korelasi
peringkat-urutan Spearman untuk memeriksa korelasi antara peringkat guru dan nilai IQ nyata siswa.

Jenis-jenis lain dari koefisien korelasi digunakan ketika satu atau kedua variabel dikotomis, seperti jenis
kelamin (pria vs wanita), kidal (kiri vs kanan), atau apakah seorang siswa telah lulus kursus (ya vs tidak) .
(Variabel dikotomus diukur pada skala nominal tetapi hanya memiliki dua level.) Ketika korelasi dihitung
pada variabel dikotomis, variabel-variabel tersebut diberi angka acak, seperti laki-laki = 1 dan
perempuan = 2. Ketika kedua variabel yang dikorelasikan dikotomis, digunakan koefisien koefisien phi;
jika hanya satu variabel yang dikotomis (dan yang lainnya pada interval atau skala rasio), korelasi titik
biserial digunakan. Jadi, jika kita melihat hubungan antara jenis kelamin dan keperawanan, koefisien phi
sesuai karena kedua variabel dikotomi. Namun, jika kita mengkorelasikan gender (variabel dikotomis)
dengan tinggi (yang diukur pada skala rasio), korelasi titik biserial akan dihitung. Setelah dihitung,
koefisien Spearman, phi, dan titik biserial ditafsirkan secara tepat seperti koefisien Pearson.

Ringkasan

1. Penelitian korelasional digunakan untuk menggambarkan hubungan antara dua variabel.

2. Koefisien korelasi (r) menunjukkan arah dan besarnya hubungan.

3. Jika skor pada dua variabel cenderung meningkat dan menurun bersama-sama, variabel tersebut
berkorelasi positif. Jika skor bervariasi secara terbalik, variabel-variabel tersebut berkorelasi negatif.

4. Besarnya koefisien korelasi menunjukkan kekuatan hubungan antara variabel. Korelasi nol
menunjukkan bahwa variabel tidak terkait; korelasi ± 1,00 menunjukkan bahwa mereka terkait
sempurna.

5. Kuadrat koefisien korelasi, koefisien determinasi (r2), mencerminkan proporsi total varians dalam satu
variabel yang dapat diperhitungkan oleh variabel lainnya.

6. Para peneliti menguji signifikansi statistik dari koefisien korelasi untuk mengukur kemungkinan bahwa
korelasi yang mereka peroleh dalam penelitian mereka mungkin berasal dari populasi di mana korelasi
sebenarnya adalah nol. Suatu korelasi biasanya dianggap signifikan secara statistik jika ada peluang
kurang dari 5% bahwa korelasi populasi yang sebenarnya adalah nol. Signifikansi dipengaruhi oleh
ukuran sampel, besarnya korelasi, dan tingkat kepercayaan yang peneliti inginkan.

7. Ketika menafsirkan korelasi, peneliti mencari faktor-faktor yang dapat secara buatan mengembang
dan mengempiskan besarnya rentang koefisien yang dibatasi, outlier, dan keandalan yang rendah.

8. Penelitian korelasional jarang jika pernah memenuhi ketiga kriteria yang diperlukan untuk
menyimpulkan hubungan sebab-akibat, directionality, dan penghapusan variabel asing. Dengan
demikian, adanya korelasi tidak menyiratkan bahwa variabel-variabel tersebut saling terkait satu sama
lain.

9. Korelasi parsial adalah korelasi antara dua variabel dengan pengaruh satu atau lebih variabel lain yang
dihapus secara statistik. Korelasi parsial digunakan untuk menguji apakah korelasi antara dua variabel
mungkin disebabkan oleh variabel lain tertentu.

10. Koefisien korelasi Pearson paling umum digunakan, tetapi koefisien Spearman, phi, dan point biserial
digunakan dalam keadaan khusus.

Anda mungkin juga menyukai