Anda di halaman 1dari 10

Korelasi

Korelasi adalah salah satu statistik paling umum dan paling berguna. Korelasi adalah angka tunggal yang menggambarkan derajat hubungan antara dua variabel. Mari kita bekerja melalui sebuah contoh untuk menunjukkan Anda bagaimana statistik ini dihitung.

Korelasi Contoh
Mari kita asumsikan bahwa kita ingin melihat hubungan antara dua variabel, tinggi (dalam inci) dan harga diri. Mungkin kita punya hipotesis bahwa seberapa tinggi Anda efek Anda harga diri (kebetulan, saya rasa kita tidak perlu khawatir tentang arah kausalitas di sini - itu tidak mungkin bahwa harga diri menyebabkan tinggi badan Anda). Katakanlah kita mengumpulkan beberapa informasi tentang dua puluh orang (semua laki-laki - kita tahu bahwa tinggi rata-rata berbeda untuk pria dan wanita sehingga, untuk menjaga ini contoh sederhana, kami hanya akan menggunakan laki-laki). Tinggi diukur dalam inci. Harga diri diukur berdasarkan rata-rata 10 1ke-5 item rating (di mana skor yang lebih tinggi berarti harga diri lebih tinggi). Berikut data untuk 20 kasus (jangan mengambil terlalu serius - saya membuat ini data hingga menggambarkan apa korelasi adalah): Orang 1 2 3 4 5 6 7 8 9 Tinggi 68 71 62 75 58 60 67 68 71 Cukup Esteem 4.1 4.6 3.8 4.4 3.2 3.1 3.8 4.1 4.3

10 11 12 13 14 15 16 17 18 19 20

69 68 67 63 62 60 63 65 67 63 61

3.7 3.5 3.2 3.7 3.3 3.4 4.0 4.1 3.8 3.4 3.6

Sekarang, mari kita cepat melihat histogram untuk setiap variabel:

Dan, di sini adalah statistik deskriptif: Variabel Berarti Tinggi Cukup Esteem 65.4 3.755 STDEV 4.40574 Perbedaan Jumlah 19.4105 1308 75.1 Minimum Maksimum Jarak 58 3.1 75 4.6 17 1.5

0.426090 0.181553

Akhirnya, kita akan melihat bivariat sederhana (yaitu, dua variabel) plot:

Anda harus segera lihat di plot bivariat bahwa hubungan antara variabel adalah satu positif (jika Anda tidak dapat melihat bahwa, meninjau bagian tentang jenis hubungan ) karena jika Anda adalah untuk cocok satu garis lurus melalui titik-titik itu akan memiliki kemiringan positif atau naik dari kiri ke kanan. Sejak korelasi tidak lebih dari perkiraan kuantitatif dari hubungan, kita akan mengharapkan hubungan yang positif. Apa hubungan "positif" dalam konteks ini? Artinya, secara umum, skor lebih tinggi pada satu variabel cenderung untuk dipasangkan dengan skor lebih tinggi pada yang lain dan bahwa skor rendah pada satu variabel cenderung untuk dipasangkan dengan nilai lebih rendah di sisi lain. Anda harus mengkonfirmasi secara visual bahwa ini umumnya benar dalam plot di atas.

Menghitung korelasi yang


Sekarang kita siap untuk menghitung nilai korelasi. Rumus untuk korelasi adalah:

Kami menggunakan r simbol untuk berdiri untuk korelasi. Melalui keajaiban matematika ternyata bahwa r selalu akan berada di antara -1.0 dan +1.0. jika korelasi negatif, kami memiliki hubungan yang negatif, jika itu positif, hubungan yang positif. Anda tidak perlu tahu bagaimana kami datang dengan formula ini kecuali Anda ingin menjadi ahli statistik. Tapi Anda mungkin perlu tahu bagaimana formula berhubungan dengan data yang nyata - bagaimana Anda dapat menggunakan rumus untuk menghitung korelasi. Mari kita lihat data yang kita butuhkan untuk formula. Berikut adalah data asli dengan kolom lain yang diperlukan: Cukup Esteem (y) 4.1 4.6 3.8 4.4 3.2 3.1 3.8 4.1 4.3 3.7

Orang 1 2 3 4 5 6 7 8 9 10

Tinggi (x) 68 71 62 75 58 60 67 68 71 69

x*y 278.8 326.6 235.6 330 185.6 186 254.6 278.8 305.3 255.3

x*x 4624 5041 3844 5625 3364 3600 4489 4624 5041 4761

y*y 16.81 21.16 14.44 19.36 10.24 9.61 14.44 16.81 18.49 13.69

11 12 13 14 15 16 17 18 19 20 Sum =

68 67 63 62 60 63 65 67 63 61 1308

3.5 3.2 3.7 3.3 3.4 4 4.1 3.8 3.4 3.6 75.1

238 214.4 233.1 204.6 204 252 266.5 254.6 214.2 219.6 4937.6

4624 4489 3969 3844 3600 3969 4225 4489 3969 3721 85912

12.25 10.24 13.69 10.89 11.56 16 16.81 14.44 11.56 12.96 285.45

Tiga kolom pertama adalah sama seperti pada tabel di atas. Tiga berikutnya kolom adalah perhitungan sederhana berdasarkan ketinggian dan data harga diri. Baris bawah terdiri dari jumlah setiap kolom. Ini semua informasi yang kita butuhkan untuk menghitung korelasi. Berikut adalah nilai-nilai dari baris bawah meja (di mana N adalah 20 orang) karena mereka terkait dengan simbol dalam rumus:

Sekarang, ketika kita pasang nilai-nilai ini ke rumus yang diberikan di atas, kita mendapatkan berikut (saya menunjukkan di sini secara perlahan, satu langkah pada satu waktu):

Jadi, korelasi kami selama dua puluh kasus adalah 0,73, yang merupakan hubungan positif yang cukup kuat. Saya kira ada hubungan antara tinggi dan harga diri, setidaknya dalam ini membuat up data!

Pengujian Signifikansi Korelasi sebuah


Setelah dihitung korelasi, Anda dapat menentukan probabilitas bahwa korelasi yang diamati terjadi secara kebetulan. Artinya, Anda dapat melakukan tes signifikansi. Paling sering Anda tertarik dalam menentukan probabilitas bahwa korelasi adalah satu nyata dan bukan kejadian kebetulan. Dalam hal ini, Anda sedang menguji saling eksklusif hipotesis : Null Hipotesis: Alternatif Hipotesis: r=0 r <> 0

Cara termudah untuk menguji hipotesis ini adalah untuk menemukan sebuah buku statistik yang memiliki tabel nilai kritis r. Kebanyakan pengantar statistik teks akan memiliki tabel seperti ini. Seperti pada semua pengujian hipotesis, Anda harus terlebih dahulu menentukan tingkat signifikansi . Di sini, saya akan menggunakan tingkat signifikansi umum alpha = .05. Ini berarti bahwa saya melakukan tes di mana kemungkinan bahwa korelasi adalah kejadian kebetulan adalah tidak lebih dari 5 dari 100. Sebelum saya melihat nilai kritis dalam tabel saya juga harus menghitung derajat kebebasan atau df. Df hanyalah sama dengan N-2 atau, dalam contoh ini, adalah 20-2 = 18. Akhirnya, saya harus memutuskan apakah saya melakukan satu sisi atau dua sisi uji. Dalam contoh ini, karena saya tidak punya teori sebelum kuat yang menunjukkan apakah hubungan antara tinggi dan harga diri akan positif atau negatif, saya akan memilih untuk uji dua sisi. Dengan tiga informasi - tingkat signifikansi (alfa = .05)), derajat kebebasan (df = 18), dan jenis uji (dua sisi) - sekarang saya bisa menguji signifikansi korelasi saya menemukan . Ketika saya mencari nilai ini dalam tabel berguna sedikit di bagian belakang buku statistik saya, saya menemukan bahwa nilai kritis adalah 0,4438. Ini berarti bahwa jika korelasi saya lebih besar dari 0,4438 atau kurang dari - 0,4438 (ingat, ini adalah uji dua-ekor) saya dapat menyimpulkan bahwa kemungkinan besar kurang dari 5 dari 100 bahwa ini merupakan kejadian kebetulan. Karena hubungan saya 0f .73 sebenarnya cukup sedikit lebih tinggi, saya menyimpulkan bahwa itu bukan kesempatan menemukan dan bahwa korelasi yang "signifikan secara statistik" (diberi parameter dari tes). Saya dapat menolak hipotesis nol dan menerima alternatif.

Matriks Korelasi
Semua yang telah saya tunjukkan Anda sejauh ini adalah bagaimana untuk menghitung korelasi antara dua variabel. Dalam kebanyakan studi kami memiliki jauh lebih dari dua variabel. Katakanlah kita memiliki studi dengan 10 interval-tingkat variabel dan kami ingin memperkirakan hubungan antara semua dari mereka (yakni antara semua pasangan yang mungkin dari variabel). Dalam hal ini, kami memiliki 45 korelasi yang unik untuk memperkirakan (lagi nanti tentang bagaimana saya tahu itu!). Kita bisa melakukan perhitungan di atas 45 kali untuk mendapatkan korelasi. Atau kita bisa menggunakan hampir semua program statistik untuk secara otomatis menghitung semua 45 dengan mudah klik mouse.

Saya menggunakan program statistik sederhana untuk menghasilkan data acak untuk 10 variabel dengan 20 kasus (yaitu, orang) untuk setiap variabel. Lalu, saya mengatakan kepada program untuk menghitung korelasi antara variabel-variabel ini. Berikut adalah hasilnya:
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C1 1.000 C2 0,274 1.000 C3 -0,134 -0,269 1,000 C4 0,201 -0,153 0,075 1,000 C5 -0,129 -0,166 0,278 -0,011 1,000 C6 -0,095 0,280 -0,348 -0,378 -0,009 1,000 C7 0,171 -0,122 0,288 0,086 0,193 0,002 1,000 C8 0,219 0,242 -0,380 -0,227 -0,551 0,324 -0,082 1,000 C9 0,518 0,238 0,002 0,082 -0,015 0,304 0,347 -0,013 1,000 C10 0,299 0,568 0,165 -0,122 -0,106 -0,169 0,243 0,014 0,352 1,000

Jenis tabel disebut matriks korelasi. Ini daftar nama-nama variabel (C1-C10) ke bawah kolom pertama dan di baris pertama. Diagonal dari matriks korelasi (yaitu, jumlah yang keluar dari sudut kiri atas ke kanan bawah) selalu terdiri dari orang-orang. Itu karena ini adalah korelasi antara setiap variabel dan dirinya sendiri (dan variabel selalu berkorelasi sempurna dengan dirinya sendiri). Program statistik hanya menunjukkan segitiga bawah matriks korelasi. Dalam setiap matriks korelasi ada dua segitiga yang merupakan nilai-nilai di bawah ini dan di sebelah kiri diagonal (segitiga bawah) dan di atas dan di kanan (segitiga atas) diagonal. Tidak ada alasan untuk mencetak kedua segitiga karena dua segitiga dari matriks korelasi selalu bayangan cermin satu sama lain (korelasi variabel x dengan variabel y selalu sama dengan korelasi dari variabel y dengan variabel x). Ketika matriks memiliki kualitas cermin-gambar di atas dan di bawah diagonal kita sebut sebagai matriks simetris. Matriks korelasi selalu merupakan matriks simetris. Untuk menemukan korelasi untuk setiap pasang variabel, menemukan nilai dalam tabel untuk baris dan kolom persimpangan bagi mereka dua variabel. Sebagai contoh, untuk menemukan korelasi antara variabel C5 dan C2, saya mencari di mana baris C2 dan kolom C5 (dalam hal ini itu kosong karena jatuh di daerah segitiga atas) dan di mana baris C5 dan kolom C2 adalah dan, dalam kasus kedua, saya menemukan bahwa korelasi adalah - 0,166.

OK, jadi bagaimana aku tahu bahwa ada 45 korelasi unik ketika kita memiliki 10 variabel? Ada rumus sederhana yang berguna sedikit menceritakan bagaimana banyak pasangan (misalnya, korelasi) ada untuk sejumlah variabel:

dimana N adalah jumlah variabel. Dalam contoh, saya memiliki 10 variabel, jadi saya tahu saya harus (10 * 9) / 2 = 90/2 = 45 pasang.

Lain Korelasi
Jenis spesifik korelasi Saya sudah digambarkan di sini dikenal sebagai Korelasi Product Moment Pearson. Hal ini sesuai ketika kedua variabel diukur pada tingkat selang . Namun ada berbagai jenis lain dari korelasi untuk keadaan lain. misalnya, jika Anda memiliki dua variabel ordinal, Anda bisa menggunakan rank Spearman Korelasi Order (rho) atau peringkat Kendall Korelasi rangka (tau). Ketika salah satu ukuran adalah satu interval terus menerus tingkat dan yang lainnya adalah dikotomis (yaitu, dua kategori), Anda dapat menggunakan Korelasi Point-biserial. Untuk situasi lainnya, konsultasi program berbasis web statistik