Chapter 14 B.indo

Machine Translated by Google
Bab Korelasi
14 14.1 Perkenalan
Alat yang Akan Anda Butuhkan
Item berikut dianggap sebagai materi 14.2 Korelasi Pearson
latar belakang yang penting untuk bab 14.3 Menggunakan dan Menafsirkan
ini. Jika Anda meragukan pengetahuan
Anda tentang salah satu item ini,
Korelasi Pearson
Anda harus meninjau bab atau 14.4 Uji Hipotesis dengan
bagian yang sesuai sebelum melanjutkan.
Korelasi Pearson
• Jumlah kuadrat (SS) (Bab 4) •
14.5 Alternatif untuk Pearson
Rumus perhitungan •
Rumus definisi Korelasi
• z-scores (Bab 5) •Uji 14.6 Pengantar Persamaan Linier dan
hipotesis (Bab 8) •Analisis Varians Ringkasan
(Bab 12) • Nilai MS dan rasio-F
Regresi
Fokus Pemecahan Masalah
Demonstrasi 14.1
Masalah
Applia untuk Essentials of Statistics for the Behavioral Sciences

Setelah membaca, buka “Sumber Daya” di akhir bab ini untuk pengenalan
tentang cara menggunakan pekerjaan rumah dan pembelajaran Applia
sumber daya.
Hak Cipta 2012 Cengage Learning. Seluruh hak cipta. Tidak boleh disalin, dipindai, atau digandakan, seluruhnya atau sebagian. Karena hak elektronik, beberapa konten pihak ketiga mungkin disembunyikan dari eBuku dan/atau eBab. Peninjauan editorial telah menganggap
bahwa setiap konten yang ditekan tidak secara material mempengaruhi pengalaman belajar secara keseluruhan. Cengage Learning berhak menghapus konten tambahan kapan saja jika pembatasan hak selanjutnya mengharuskannya.
450 BAB 14 korelasi
14.1 Perkenalan
Korelasi adalah teknik statistik yang digunakan untuk mengukur dan menggambarkan
hubungan antara dua variabel. Biasanya kedua variabel hanya diamati karena mereka ada
secara alami di lingkungan — tidak ada upaya untuk mengontrol atau memanipulasi variabel.
Misalnya, seorang peneliti dapat memeriksa catatan sekolah menengah atas (dengan izin)
untuk mendapatkan ukuran kinerja akademik setiap siswa, dan kemudian mensurvei setiap
keluarga untuk mendapatkan ukuran pendapatan. Data yang dihasilkan dapat digunakan
untuk menentukan apakah ada hubungan antara nilai SMA dan pendapatan keluarga.
Perhatikan bahwa peneliti tidak memanipulasi nilai siswa atau pendapatan keluarga mana
pun, tetapi hanya mengamati apa yang terjadi secara alami. Anda juga harus memperhatikan
bahwa korelasi memerlukan dua skor untuk setiap individu (satu skor dari masing-masing
dua variabel). Skor ini biasanya diidentifikasi sebagai X dan Y. Pasangan skor dapat
dicantumkan dalam tabel, atau disajikan secara grafis dalam plot pencar (Gambar 14.1).
Pada scatter plot, nilai variabel X dicantumkan pada sumbu horizontal dan nilai Y dicantumkan pada sumbu ver
Setiap individu kemudian diwakili oleh satu titik dalam grafik sehingga posisi horizontal
sesuai dengan nilai X individu dan posisi vertikal sesuai dengan nilai Y. Nilai dari sebar plot
adalah memungkinkan Anda untuk melihat pola atau tren apa pun yang ada dalam data.
Skor pada Gambar 14.1, misalnya, menunjukkan hubungan yang jelas antara pendapatan
keluarga dan nilai siswa; saat pendapatan meningkat, nilai juga meningkat.
Karakteristik Hubungan Korelasi adalah nilai numerik yang menggambarkan dan mengukur tiga karakteristik
hubungan antara X dan Y. Ketiga karakteristik tersebut adalah sebagai berikut:
1. Arah Hubungan. Tanda korelasi, positif atau

negatif, menggambarkan arah hubungan.
100
Orang Keluarga Siswa
Pendapatan Rata-rata 95
(dalam $1000) Nilai
90
A 31 72
B 38 86 siswa
rata-
Nilai
rata
85
C 42 81
D 44 78 80
e 49 85
F 56 80 75
G 58 91
H 65 89 70
SAYA
70 94
J 90 83
30 55 70 90 110 130 150 170 190
K 92 90
L 106 97 Penghasilan keluarga (dalam $1000)
M 135 89
N 174 95
Gambar 14.1
Data korelasi menunjukkan hubungan antara pendapatan keluarga (X) dan nilai siswa (Y) untuk sampel n 5 14 siswa SMA. Skor
terdaftar dalam urutan dari pendapatan keluarga terendah hingga tertinggi dan ditampilkan dalam sebar plot.
BAGIAN 14.1 / Pendahuluan 451
Definisi
Dalam korelasi positif, kedua variabel cenderung berubah ke arah yang sama:
Ketika nilai variabel X meningkat dari satu orang ke orang lain, variabel Y juga
cenderung meningkat; ketika variabel X menurun, variabel Y juga menurun.
Dalam korelasi negatif, kedua variabel cenderung berlawanan arah. Ketika
variabel X meningkat, variabel Y menurun. Artinya, itu adalah hubungan terbalik.
Contoh berikut menggambarkan hubungan positif dan negatif.
Contoh 14.1 Misalkan Anda menjalankan konsesi minuman di stadion sepak bola. Setelah beberapa
musim, Anda mulai memperhatikan hubungan antara suhu saat permainan dan minuman
yang Anda jual. Secara khusus, Anda telah mencatat bahwa ketika suhu rendah, Anda
menjual bir yang relatif sedikit. Namun, saat suhu naik, penjualan bir juga naik (Gambar
14.2). Ini adalah contoh korelasi positif. Anda juga telah mencatat hubungan antara suhu
dan penjualan kopi: Pada hari yang dingin, Anda menjual banyak kopi, tetapi penjualan
kopi turun saat suhu naik. Ini adalah contoh hubungan negatif.
2. Bentuk Hubungan. Dalam contoh kopi dan bir sebelumnya, hubungan tersebut
cenderung berbentuk linier; yaitu, titik-titik dalam plot pencar cenderung
mengelompok di sekitar garis lurus. Kami telah menggambar garis melalui tengah
titik data di setiap gambar untuk membantu menunjukkan hubungan. Penggunaan
korelasi yang paling umum adalah untuk mengukur hubungan garis lurus. Namun bentuk lain
Hubungan antara penjualan bir dan Hubungan antara penjualan kopi dan
suhu suhu
60 60
50 50
40 40
30 30
Jumlah
terjual
yang
bir
Jumlah
terjual
yang
kopi
20 20
10 10
20 30 40 50 60 80 70 20 30 40 50 60 80 70
Suhu (dalam derajat F) (a) Suhu (dalam derajat F) (b)
Gambar 14.2
Contoh hubungan positif dan negatif. (a) Penjualan bir berhubungan positif dengan suhu. (b) Penjualan kopi
berhubungan negatif dengan suhu.
452 BAB 14 korelasi
hubungan memang ada dan ada korelasi khusus yang digunakan untuk mengukurnya.
(Kami memeriksa alternatif di Bagian 14.5.)
3. Kekuatan atau Konsistensi Hubungan. Terakhir, korelasi mengukur konsistensi

hubungan. Untuk hubungan linier, misalnya, titik data dapat pas dengan sempurna
pada garis lurus. Setiap kali X bertambah satu poin, nilai Y juga berubah dengan
jumlah yang konsisten dan dapat diprediksi. Gambar 14.3(a) menunjukkan contoh
hubungan linier yang sempurna. Namun, hubungan biasanya tidak sempurna.
Meskipun mungkin ada kecenderungan nilai Y meningkat setiap kali X meningkat,
jumlah perubahan Y tidak selalu sama, dan kadang-kadang, Y menurun ketika X
meningkat. Dalam situasi ini, titik data tidak jatuh dengan sempurna pada garis lurus.
Konsistensi hubungan diukur dengan nilai numerik korelasi. Korelasi sempurna selalu
diidentifikasi dengan korelasi 1,00 dan menunjukkan hubungan yang konsisten
sempurna.
Untuk korelasi 1,00 (atau –1,00), setiap perubahan dalam X disertai dengan
perubahan Y yang dapat diprediksi secara sempurna . Di sisi lain, korelasi 0
menunjukkan tidak ada konsistensi sama sekali. Untuk korelasi 0, titik data tersebar
secara acak tanpa tren yang jelas [lihat Gambar 14.3(b)]. Nilai tengah antara 0 dan 1
menunjukkan tingkat konsistensi.
Contoh nilai yang berbeda untuk korelasi linier ditunjukkan pada Gambar 14.3. Dalam setiap
contoh kami telah membuat sketsa garis di sekitar titik data. Baris ini, disebut amplop karena
membungkus data, sering kali membantu Anda melihat tren keseluruhan dalam data. Sebagai
aturan praktis, ketika amplop berbentuk kira-kira seperti bola, korelasinya sekitar 0,7. Amplop
yang lebih tebal dari sepak bola menunjukkan korelasi mendekati 0, dan bentuk yang lebih
sempit menunjukkan korelasi mendekati 1,00.
Anda juga harus mencatat bahwa tanda (1 atau 2) dan kekuatan korelasi bersifat independen.
Misalnya, korelasi sebesar 1,00 menunjukkan hubungan yang benar-benar konsisten apakah
itu positif (11,00) atau negatif (21,00). Demikian pula, korelasi 10,80 dan 20,80 adalah hubungan
yang sama-sama konsisten. Terakhir, Anda harus memperhatikan bahwa korelasi tidak boleh
lebih besar dari 11.00 atau kurang dari 21.00.
Gambar 14.3 Y
Y
Contoh nilai yang
berbeda untuk korelasi linier
tions: (a) korelasi negatif
sempurna, -1,00; (b)
tidak ada tren linier, 0,00;
(c) hubungan positif
yang kuat, kira-kira X X
(A) (B)
10,90; (d) korelasi
negatif yang relatif lemah,
kira-kira –0,40.
Y Y
X X
(C) (D)
BAGIAN 14.2 / Korelasi Pearson 453
Belajar C hec k 1. Untuk setiap hal berikut, tunjukkan apakah Anda mengharapkan positif atau negatif
korelasi positif.
A. Model tahun dan harga untuk Honda bekas
B. IQ dan nilai rata-rata poin untuk siswa sekolah menengah
C. Suhu tinggi harian dan konsumsi energi harian selama 30 hari musim dingin di New York
City
2. Titik-titik data akan dikelompokkan lebih dekat di sekitar garis lurus untuk korelasi -0,80
daripada korelasi 10,05. (Benar atau salah?)
3. Jika titik-titik data terkelompok dekat dengan garis yang miring dari kiri ke kanan, maka
perkiraan korelasi yang baik adalah 10,90. (Benar atau salah?)
4. Jika scatter plot menunjukkan sekumpulan titik data yang membentuk pola melingkar, korelasinya
tion harus mendekati nol. (Benar atau salah?)
Jawaban 1.a. Positif: Model tahun yang lebih tinggi cenderung memiliki harga yang lebih tinggi.
B. Positif: Siswa yang lebih cerdas cenderung mendapatkan nilai yang lebih tinggi.
C. Negatif: Suhu yang lebih tinggi cenderung menurunkan kebutuhan akan pemanasan.
2. Benar. Nilai numerik menunjukkan kekuatan hubungan. Tanda itu hanya menunjukkan
arah.
3. Benar.
4. Benar.
14.2 Korelasi Pearson

Sejauh ini korelasi yang paling umum adalah korelasi Pearson (atau korelasi produk momen Pearson)
yang mengukur tingkat hubungan garis lurus.
Definisi
Korelasi Pearson mengukur derajat dan arah hubungan linier antara dua variabel.
Korelasi Pearson diidentifikasi dengan huruf r. Secara konseptual, korelasi ini dihitung dengan
5
derajat yang danX Y
sama
bervariasi bersama-
R
XY
derajat yang kovari
kemampuan danterpisah
bervariasi
dan X secara
Variabilitas Y
Y secara
dari dan X
terpisah
Ketika ada hubungan linier yang sempurna, setiap perubahan dalam variabel X disertai dengan
perubahan yang sesuai dalam variabel Y. Pada Gambar 14.3(a), misalnya, setiap kali nilai X meningkat,
ada penurunan nilai Y yang dapat diprediksi dengan sempurna. Hasilnya adalah hubungan linier yang
sempurna, dengan X dan Y selalu bervariasi bersama.
Dalam hal ini, kovariabilitas (X dan Y bersama-sama) identik dengan variabilitas X dan Y secara
terpisah, dan rumus tersebut menghasilkan korelasi dengan besaran 1,00 atau –1,00.
Di sisi lain, ketika tidak ada hubungan linier, terjadi perubahan pada variabel X
454 BAB 14 korelasi
tidak sesuai dengan perubahan yang dapat diprediksi dalam variabel Y. Dalam hal ini, tidak ada
kovariabilitas, dan korelasi yang dihasilkan adalah nol.
Jumlah dari Untuk menghitung korelasi Pearson, satu konsep baru perlu diperkenalkan: jumlah produk
Produk dari penyimpangan, atau SP. Nilai baru ini mirip dengan SS (jumlah simpangan kuadrat), yang digunakan
Penyimpangan untuk mengukur variabilitas untuk satu variabel. Sekarang, kami menggunakan SP untuk mengukur
jumlah kovariabilitas antara dua variabel. Nilai SP dapat dihitung dengan rumus definisi atau rumus
komputasi.
Rumus definisi untuk jumlah produk adalah
SP 5 o(X 2 MX)(Y 2 MY ) (14.1)
di mana MX adalah rata-rata untuk skor X dan MY adalah rata-rata untuk Ys.
Rumus definisi menginstruksikan Anda untuk melakukan urutan operasi berikut:
1. Temukan simpangan X dan simpangan Y untuk setiap individu.
2. Temukan produk dari penyimpangan untuk setiap individu.
3. Tambahkan produk.
Perhatikan bahwa proses ini "mendefinisikan" nilai yang dihitung: jumlah produk
dari penyimpangan.
Rumus komputasi untuk jumlah produk penyimpangan adalah
ooYX
SP XY 2 o
5
(14.2)
N
Perhatian: N dalam hal ini Karena rumus komputasi menggunakan skor asli (nilai X dan Y ), biasanya menghasilkan
rumus mengacu pada nomor perhitungan yang lebih mudah daripada yang diperlukan dengan rumus definisi, terutama jika MX
dari pasangan skor. atau MY bukan bilangan bulat. Namun, kedua rumus tersebut selalu menghasilkan nilai SP yang
sama.
Anda mungkin telah mencatat bahwa rumus untuk SP serupa dengan rumus yang telah Anda
pelajari untuk SS (jumlah kuadrat). Hubungan antara kedua rangkaian rumus tersebut dijelaskan
dalam Kotak 14.1. Contoh berikut menunjukkan perhitungan SP dengan kedua rumus tersebut.
Contoh 14.2 Set yang sama dari n 5 4 pasang skor digunakan untuk menghitung SP, pertama menggunakan
rumus definisi dan kemudian menggunakan rumus komputasi.
Untuk rumus definisi, Anda memerlukan skor deviasi untuk setiap nilai X dan setiap nilai Y.
Perhatikan bahwa rata-rata Xs adalah MX 5 3 dan rata-rata Ys adalah MY 5 5. Penyimpangan dan
perkalian penyimpangan ditunjukkan pada tabel berikut:
Skor Penyimpangan Produk
X Y X 2 MX Y 2 SAYA (X 2 MX)(Y 2 SAYA)
1 3 22 22 14
2 6 21 11 21
4 4 11 21 21
5 7 12 12 14
16 5 SP
Perhatian: Tanda (1 dan 2) Untuk skor-skor ini, penjumlahan produk dari penyimpangan adalah SP 5 16.
sangat penting dalam Untuk rumus komputasi, Anda memerlukan nilai X , nilai Y , dan produk XY untuk setiap individu.
menentukan jumlah produk, SP. Kemudian Anda menemukan jumlah Xs , jumlah Ys , dan jumlah produk XY . Nilai-nilai ini adalah
sebagai berikut:
XY XY
1 3 3
2 6 12
4 4 16
5 7 35
12 20 66 Total
Mengganti total dalam rumus memberi
ooYX2 o
SP 5 XY
N
5 2 66 1220
()
4
566–60
56
Kedua rumus menghasilkan hasil yang sama, SP 5 6.
Membandingkan Rumus SP dan SS

KOTAK 14.1
Ini akan membantu Anda mempelajari rumus untuk SP jika hubungan ada untuk rumus komputasi.
Anda mencatat kesamaan antara dua rumus SP dan rumus Untuk SS, rumus komputasinya adalah
yang sesuai untuk SS yang disajikan di Bab 4. Rumus definisi
X )2
untuk SS adalah SS oX 5 2 2 (o
N
2
SS 5 o(X – M)
Seperti sebelumnya, setiap nilai kuadrat dapat ditulis ulang
bahwa rumus menjadi
Dalam rumus ini, Anda harus mengkuadratkan setiap
penyimpangan, yang setara dengan mengalikannya dengan
dirinya sendiri. Dengan pemikiran ini, rumus dapat ditulis ulang sebagai ooXX
SP XX 2 o
5
SS 5 o(X – M)(X – M)
Sekali lagi, perhatikan kesamaan struktur antara SS
Kemiripan antara rumus SS dan rumus SP harus jelas rumus dan rumus SP . Jika Anda ingat bahwa SS
— rumus SS menggunakan kuadrat dan rumus SP menggunakan kuadrat dan SP menggunakan hasil kali, kedua
menggunakan hasil kali. Ini sama rumus baru untuk penjumlahan kali ini seharusnya mudah dipelajari.
456 BAB 14 korelasi
Perhitungan dari Seperti disebutkan sebelumnya, korelasi Pearson terdiri dari rasio yang membandingkan
Pearson kovariabilitas X dan Y (pembilang) dengan variabilitas X dan Y secara terpisah (penyebut).
Korelasi Dalam rumus Pearson r, kami menggunakan SP untuk mengukur kovariabilitas X dan Y. Variabilitas
X diukur dengan menghitung SS untuk skor X dan variabilitas Y diukur dengan SS untuk skor Y.
Dengan definisi tersebut, rumus korelasi Pearson menjadi
SP
R 5
SSXYSS (14.3)
Perhatikan bahwa Anda
mengalikan SS untuk X dengan SS
Contoh berikut menunjukkan penggunaan rumus ini dengan serangkaian skor sederhana.
untuk Y dalam penyebut rumus Pearson.
Contoh 14.3 Korelasi Pearson dihitung untuk set berikut dari n 5 5 pasang skor.
X Y
0 2
10 6
4 2
8 4
8 6
Sebelum memulai perhitungan apa pun, sebaiknya letakkan data di sebar plot dan buat
perkiraan awal korelasinya. Data ini telah digambarkan dalam Gambar 14.4.
Melihat plot pencar, tampaknya ada korelasi positif yang sangat baik (tetapi tidak sempurna). Anda
harus mengharapkan nilai perkiraan r 5 10,8 atau 10,9. Untuk mencari korelasi Pearson, kita
membutuhkan SP, SS untuk X, dan SS untuk Y. Perhitungan untuk masing-masing nilai ini, dengan
menggunakan rumus definisi, disajikan pada Tabel 14.1. (Perhatikan bahwa rata-rata nilai X adalah
MX 5 6 dan rata-rata nilai Y adalah MY 5 4.)
Dengan menggunakan nilai dari Tabel 14.1, korelasi Pearson adalah
SP 28 28
R 5 = = =+ 0,8 75
( SSSS
X( ) ) Y ( )( ) 64 16 32
Gambar 14.4
Y 6
Plot sebar data dari
Contoh 14.3.
X
0123456789 10
Tabel 14.1
Skor Penyimpangan Deviasi Kuadrat Produk
Perhitungan SSX, SSY, dan
SP untuk sampel n 5 5 XYX – MX Y 2 SAYA (X 2 MX)2 (Y 2 SAYA)2 (X 2 MX)(Y 2 SAYA)
pasang skor. 0 2 36 4
26 22 112
10 6 14 12 16 4 18
4 2 22 22 4 4 14
8 4 12 0 4 0 0
8 6 12 12 4 4 14
SSX 5 64 SSY 5 16 SP5 128
Korelasi dan pola titik-titik data Perhatikan bahwa nilai yang kita peroleh untuk korelasi pada
Contoh 14.3 sangat konsisten dengan pola yang dibentuk oleh titik-titik data pada Gambar 14.4.
Tanda positif untuk korelasi menunjukkan bahwa titik-titik tersebut mengelompok di sekitar garis
yang miring ke kanan. Kedua, nilai korelasi yang tinggi (mendekati 1,00) menunjukkan bahwa titik-
titik tersebut terkelompok sangat rapat di dekat garis.
Dengan demikian, nilai korelasi menggambarkan hubungan yang ada pada data.
Karena korelasi Pearson menggambarkan pola yang dibentuk oleh titik-titik data, faktor apa pun
yang tidak mengubah pola juga tidak mengubah korelasi. Misalnya, jika 5 titik ditambahkan ke
masing-masing nilai X pada Gambar 14.4, maka setiap titik data akan berpindah ke kanan. Namun,
karena semua titik data bergeser ke kanan, pola keseluruhan tidak berubah, hanya dipindahkan ke
lokasi baru. Demikian pula, jika 5 poin dikurangi dari setiap nilai X , polanya akan bergeser ke kiri.
Dalam kedua kasus tersebut, pola keseluruhan tetap sama dan korelasinya tidak berubah. Dengan
cara yang sama, menambahkan konstanta ke (atau mengurangkan konstanta dari) setiap nilai Y
hanya menggeser pola ke atas (atau ke bawah) tetapi tidak mengubah pola dan, oleh karena itu,
tidak mengubah korelasinya. Mengalikan setiap nilai X dan/atau Y dengan konstanta juga tidak
mengubah pola yang dibentuk oleh titik data. Misalnya, jika masing-masing nilai X pada Gambar
14.4 dikalikan dengan 2, maka plot pencar yang sama dapat digunakan untuk menampilkan skor
asli atau skor baru. Angka saat ini menunjukkan skor asli, tetapi jika nilai pada sumbu X (0, 1, 2, 3,
dan seterusnya) digandakan (0, 2, 4, 6, dan seterusnya), maka angka yang sama akan menunjukkan
pola yang dibentuk oleh skor baru. Singkatnya, menambahkan konstanta ke (atau mengurangkan
konstanta dari) setiap nilai X dan/atau Y tidak mengubah pola titik data dan tidak mengubah
korelasinya. Juga, mengalikan (atau membagi) setiap nilai X dan/atau Y dengan konstanta tidak
mengubah pola dan tidak mengubah nilai korelasi.
Pearson Korelasi Pearson mengukur hubungan antara lokasi individu dalam distribusi X dan lokasinya
Korelasi dan dalam distribusi Y. Misalnya, korelasi positif berarti individu yang memiliki skor X tinggi juga
z-Skor cenderung memiliki skor Y tinggi . Demikian pula, korelasi negatif menunjukkan bahwa individu
dengan skor X tinggi cenderung memiliki skor Y rendah .
Ingat dari Bab 5 bahwa skor-z mengidentifikasi lokasi yang tepat dari setiap skor individu dalam
suatu distribusi. Dengan mengingat hal ini, setiap nilai X dapat diubah menjadi skor-z, zX, dengan
menggunakan rata-rata dan deviasi standar untuk himpunan Xs. Demikian pula, setiap skor Y
dapat diubah menjadi Jika
zY . nilai X dan Y dipandang sebagai sampel, maka transformasi diselesaikan
menggunakan rumus sampel untuk z (Persamaan 5.3). Jika nilai X dan Y membentuk populasi
yang lengkap, maka z-score dihitung menggunakan Persamaan 5.1. Setelah transformasi, rumus
untuk korelasi Pearson dapat dinyatakan seluruhnya dalam z-skor.
Hai zz
Xy
Untuk sampel, R 5
N 2
1) (14.4)
(
458 BAB 14 korelasi
onsX zy
Untuk populasi, r 5 (14.5)
N
Perhatikan bahwa nilai populasi diidentifikasi dengan huruf Yunani, dalam hal ini huruf
rho (r), yang merupakan bahasa Yunani yang setara dengan huruf r.
Belajar C hec k 1. Bisakah SP memiliki nilai kurang dari nol?
2. Hitung jumlah produk simpangan (SP) untuk rangkaian skor berikut.

Gunakan rumus definisi dan kemudian rumus komputasi. Verifikasi bahwa Anda
mendapatkan jawaban yang sama dengan kedua rumus.
XY
0 1
4 3
5 3
2 2
4 1
3. Untuk data berikut:
A. Buat sketsa sebaran plot dan buat perkiraan korelasi Pearson.
B. Hitung korelasi Pearson.
XY
2 6
1 5
3 3
0 7
4 4
Jawaban 1. Ya. SP bisa positif, negatif, atau nol tergantung pada hubungan antara X dan Y.
2.SP5 5 _
8 3. b. r 5 2 10 5 20.80
14.3 Menggunakan dan Menafsirkan Korelasi Pearson
Dimana dan Mengapa Meskipun korelasi memiliki sejumlah penerapan yang berbeda, beberapa contoh khusus disajikan
Korelasi Apakah di samping untuk memberikan indikasi nilai ukuran statistik ini.
Digunakan
1. Prediksi. Jika dua variabel diketahui terkait secara sistematis, maka dimungkinkan
untuk menggunakan salah satu variabel untuk membuat prediksi tentang yang lain.
Misalnya, ketika Anda melamar masuk ke perguruan tinggi, Anda diminta untuk
menyerahkan banyak informasi pribadi, termasuk nilai Anda pada Tes Prestasi Skolastik
(SAT). Pejabat perguruan tinggi menginginkan informasi ini karena membantu
memprediksi peluang keberhasilan Anda di perguruan tinggi. Telah dibuktikan selama
beberapa tahun bahwa skor SAT dan rata-rata nilai perguruan tinggi berkorelasi. Siswa
BAGIAN 14.3 / Menggunakan dan Menafsirkan Korelasi Pearson 459
yang berprestasi di SAT cenderung berhasil di perguruan tinggi; siswa yang mengalami
kesulitan dengan SAT cenderung mengalami kesulitan di perguruan tinggi. Berdasarkan hubungan
ini, petugas penerimaan perguruan tinggi dapat memprediksi potensi keberhasilan setiap pelamar.
Anda harus mencatat bahwa prediksi ini tidak sepenuhnya akurat. Tidak semua orang yang
berprestasi buruk di SAT mengalami kesulitan di perguruan tinggi. Itu sebabnya Anda juga
mengirimkan surat rekomendasi, nilai sekolah menengah, dan informasi lainnya dengan aplikasi Anda.
2. Validitas. Misalkan seorang psikolog mengembangkan tes baru untuk mengukur kecerdasan.
Bagaimana Anda bisa menunjukkan bahwa tes ini benar-benar mengukur apa yang
diklaimnya; yaitu, bagaimana Anda bisa menunjukkan validitas tes? Salah satu teknik umum
untuk menunjukkan validitas adalah dengan menggunakan korelasi. Jika tes tersebut benar-
benar mengukur inteligensi, maka skor pada tes tersebut harus terkait dengan ukuran
inteligensi lainnya—misalnya, tes IQ standar, kinerja dalam tugas belajar, kemampuan
memecahkan masalah, dan sebagainya. Psikolog dapat mengukur korelasi antara tes baru
dan masing-masing ukuran kecerdasan lainnya untuk menunjukkan bahwa tes baru itu valid.
3. Keandalan. Selain mengevaluasi validitas prosedur pengukuran, korelasi digunakan untuk

menentukan reliabilitas. Suatu prosedur pengukuran dianggap andal jika menghasilkan
pengukuran yang stabil dan konsisten.
Artinya, prosedur pengukuran yang andal menghasilkan skor yang sama (atau hampir
sama) ketika individu yang sama diukur dua kali dalam kondisi yang sama. Misalnya, jika
IQ Anda diukur sebagai 113 minggu lalu, Anda akan berharap mendapatkan skor yang hampir
sama jika IQ Anda diukur lagi minggu ini. Salah satu cara untuk mengevaluasi reliabilitas
adalah dengan menggunakan korelasi untuk menentukan hubungan antara dua set
pengukuran. Ketika reliabilitas tinggi, korelasi antara dua pengukuran harus kuat dan positif.
4. Verifikasi Teori. Banyak teori psikologi membuat prediksi spesifik

tentang hubungan antara dua variabel. Misalnya, sebuah teori dapat memprediksi hubungan
antara ukuran otak dan kemampuan belajar; teori perkembangan dapat memprediksi
hubungan antara IQ orang tua dan IQ anak; seorang psikolog sosial mungkin memiliki teori
yang memprediksi hubungan antara tipe kepribadian dan perilaku dalam situasi sosial. Dalam
setiap kasus, prediksi teori dapat diuji dengan menentukan korelasi antara kedua variabel.
Menafsirkan Saat Anda menemukan korelasi, ada empat pertimbangan tambahan yang harus Anda ingat:
Korelasi
1. Korelasi hanya menggambarkan hubungan antara dua variabel. Itu tidak menjelaskan mengapa
kedua variabel tersebut terkait. Secara khusus, korelasi tidak boleh dan tidak dapat ditafsirkan
sebagai bukti hubungan sebab-akibat antara dua variabel.
2. Nilai korelasi dapat sangat dipengaruhi oleh kisaran skor yang terwakili dalam data.
3. Satu atau dua titik data ekstrem, yang sering disebut outlier, dapat menimbulkan efek yang dramatis
pada nilai korelasi.
4. Saat menilai seberapa "baik" suatu hubungan, tergoda untuk fokus pada numeri
nilai kal korelasi. Misalnya, korelasi 10,5 berada di tengah-tengah antara 0 dan 1,00 dan, oleh
karena itu, tampaknya mewakili tingkat hubungan yang sedang.
Namun, korelasi tidak harus diartikan sebagai proporsi. Meskipun korelasi 1,00 berarti ada
hubungan yang 100% dapat diprediksi dengan sempurna
460 BAB 14 korelasi
antara X dan Y, korelasi 0,5 tidak berarti Anda dapat membuat prediksi dengan akurasi 50%. Untuk
menjelaskan seberapa akurat satu variabel memprediksi yang lain, Anda harus mengkuadratkan
korelasinya. Jadi, korelasi r 5 0,5 berarti bahwa satu variabel sebagian memprediksi yang lain, tetapi
bagian yang dapat diprediksi hanya r 2 5 0,52 5 0,25 (atau 25%) dari total variabilitas.
Kami sekarang membahas masing-masing dari empat poin ini secara rinci.
Korelasi dan Salah satu kesalahan yang paling umum dalam menginterpretasikan korelasi adalah menganggap bahwa
Hal menyebabkan hubungan korelasi harus menyiratkan hubungan sebab-akibat antara dua variabel.
(Bahkan Pearson membuat kesalahan dengan menegaskan sebab-akibat dari data korelasional [Blum, 1978].)
Kami terus-menerus dibombardir dengan laporan tentang hubungan: Merokok berhubungan dengan penyakit
jantung; konsumsi alkohol berhubungan dengan cacat lahir; konsumsi wortel berhubungan dengan penglihatan
yang baik. Apakah hubungan ini berarti rokok menyebabkan penyakit jantung atau wortel menyebabkan
penglihatan yang baik? Jawabannya tidak. Meskipun mungkin ada hubungan sebab akibat, keberadaan
korelasi yang sederhana tidak membuktikannya. Sebelumnya, misalnya, kita membahas sebuah penelitian
yang menunjukkan hubungan antara nilai sekolah menengah atas dan pendapatan keluarga. Namun, hasil ini
tidak berarti bahwa memiliki pendapatan keluarga yang lebih tinggi menyebabkan siswa mendapatkan nilai
yang lebih baik. Misalnya, jika ibu mendapat bonus tak terduga di tempat kerja, kecil kemungkinan nilai
anaknya juga akan meningkat secara tiba-tiba. Untuk membangun hubungan sebab-akibat, perlu dilakukan
percobaan yang benar (lihat halaman 13) di mana satu variabel dimanipulasi oleh seorang peneliti dan variabel
lainnya dikontrol dengan ketat. Fakta bahwa korelasi tidak membentuk sebab-akibat ditunjukkan dalam
contoh berikut.
Contoh 14.4 Misalkan kita memilih berbagai kota besar dan kecil di seluruh Amerika Serikat dan mengukur jumlah gereja
(variabel X ) dan jumlah kejahatan berat (variabel Y ) untuk masing-masingnya. Plot pencar yang menunjukkan
data hipotetis untuk penelitian ini disajikan pada Gambar 14.5. Perhatikan bahwa scatter plot ini menunjukkan
cor positif yang kuat
hubungan antara gereja dan kejahatan. Anda juga harus mencatat bahwa ini realistis
data. Masuk akal bahwa kota-kota kecil akan memiliki lebih sedikit kejahatan dan lebih sedikit gereja
dan bahwa kota-kota besar akan memiliki nilai yang besar untuk kedua variabel tersebut. Apakah hubungan
ini berarti bahwa gereja menyebabkan kejahatan? Apakah itu berarti bahwa kejahatan menyebabkan gereja?
Harus jelas bahwa kedua jawaban itu adalah tidak. Meskipun ada korelasi yang kuat antara jumlah gereja dan
kejahatan, penyebab sebenarnya dari hubungan tersebut adalah ukuran populasi.
Korelasi dan Setiap kali korelasi dihitung dari skor yang tidak mewakili rentang nilai penuh yang mungkin, Anda harus
Rentang Terbatas berhati-hati dalam menginterpretasikan korelasi. Misalnya, Anda tertarik pada hubungan antara IQ dan
kreativitas. Jika Anda memilih sampel sesama mahasiswa, data Anda mungkin hanya mewakili kisaran skor
IQ yang terbatas (kemungkinan besar dari 110 hingga 130). Korelasi dalam kisaran terbatas ini bisa sangat
berbeda dari korelasi yang akan diperoleh dari berbagai skor IQ. Misalnya, Gambar 14.6 menunjukkan
hubungan positif yang kuat antara X dan Y ketika seluruh rentang skor dipertimbangkan. Namun, hubungan
ini dikaburkan ketika data dibatasi pada rentang terbatas.
Agar aman, Anda tidak boleh menggeneralisasi korelasi apa pun di luar rentang data yang diwakili dalam
sampel. Agar korelasi memberikan deskripsi yang akurat untuk populasi umum, harus ada rentang nilai X dan
Y yang luas dalam data.
Gambar 14.5
Data hipotetis menunjukkan 60

hubungan logis antara
jumlah
gereja dan jumlahnya 50
kejahatan berat untuk a
contoh kota AS.
40
kejahatan
Jumlah
berat
30
20
10
0 10 20 30 40 50 60 70
Jumlah gereja
Gambar 14.6
Dalam contoh ini,

rentang penuh nilai X
nilai
Y
dan Y menunjukkan
korelasi positif yang kuat,
tetapi rentang skor yang
terbatas
menghasilkan korelasi mendekati nol. X nilai terbatas
pada rentang terbatas
X nilai-nilai
Penyimpangan Outlier adalah individu dengan nilai X dan/atau Y yang secara substansial berbeda (lebih besar
atau lebih kecil) dari nilai yang diperoleh untuk individu lain dalam kumpulan data. Titik data
dari outlier tunggal dapat memiliki pengaruh dramatis pada nilai korelasi yang diperoleh. Efek
ini diilustrasikan pada Gambar 14.7. Gambar 14.7(a) menunjukkan kumpulan n 5 5 titik data
yang korelasi antara variabel X dan Y hampir nol (sebenarnya r 5 –0,08). Pada Gambar 14.7(b),
satu titik data ekstrem (14, 12) telah ditambahkan ke kumpulan data asli. Ketika outlier ini
dimasukkan dalam analisis, korelasi positif yang kuat muncul (sekarang r 5 1 0,85).
Perhatikan bahwa outlier tunggal secara drastis mengubah nilai korelasi dan, dengan demikian,
dapat mempengaruhi interpretasi seseorang dari hubungan antara variabel X dan Y. Tanpa
outlier, orang akan menyimpulkan tidak ada hubungan antara dua variabel. Dengan titik data
ekstrim, r 5 10,85, yang menyiratkan hubungan yang kuat dengan peningkatan Y secara
konsisten seiring dengan peningkatan X. Masalah outlier adalah alasan yang baik untuk melihat
sebar plot, bukan hanya mendasarkan interpretasi Anda pada nilai numerik dari korelasi. Jika Anda hanya
462 BAB 14 korelasi
12 12
10 10
R= –0,08 R= 0,85
8 8
nilai
Y nilai
Y
6 6
4 4
2 2
2468 10 12 14 2468 10 12 14
X nilai-nilai X nilai-nilai
Data Asli Data dengan Outlier Termasuk
Subjek X Y Subjek X Y
A 3 A 3
B 1 5 B 1 5
C 3 4 C 3 4
D 6 D 6
e 45 12 e 4 1
F 5 14 2 12
(A)
(B)
Gambar 14.7
Demonstrasi tentang bagaimana satu titik data ekstrim (outlier) dapat memengaruhi nilai korelasi.
"ikuti angkanya", Anda mungkin mengabaikan fakta bahwa satu titik data ekstrem meningkatkan
ukuran korelasi.
Korelasi dan Kekuatan Korelasi mengukur tingkat hubungan antara dua variabel pada skala dari 0 hingga 1,00.
dari Meskipun angka ini memberikan ukuran derajat hubungan, banyak peneliti lebih suka
Hubungan mengkuadratkan korelasi dan menggunakan nilai yang dihasilkan untuk mengukur kekuatan
hubungan.
Salah satu penggunaan umum dari korelasi adalah untuk prediksi. Jika dua variabel
berkorelasi, Anda dapat menggunakan nilai satu variabel untuk memprediksi yang lain.
Misalnya, petugas penerimaan perguruan tinggi tidak hanya menebak-nebak pelamar mana
yang kemungkinan berhasil; mereka menggunakan variabel lain (skor SAT, nilai SMA, dan
seterusnya) untuk memprediksi siswa mana yang kemungkinan besar akan berhasil. Prediksi
ini didasarkan pada korelasi. Dengan menggunakan hubungan korelasi, petugas penerimaan
berharap dapat membuat prediksi yang lebih akurat daripada yang diperoleh secara
kebetulan. Secara umum, korelasi kuadrat (r2 ) mengukur peningkatan akurasi yang diperoleh
dari penggunaan korelasi untuk prediksi. Korelasi kuadrat mengukur proporsi variabilitas
dalam data yang dijelaskan oleh hubungan antara X dan Y. Kadang-kadang disebut koefisien determinasi.
Definisi Nilai r2 disebut koefisien determinasi karena mengukur proporsi variabilitas dalam
satu variabel yang dapat ditentukan dari hubungan dengan variabel lain. Korelasi r 5
0,80 (atau –0,80), misalnya, berarti bahwa r 2 5 0,64 (atau 64%) variabilitas skor Y
dapat diprediksi dari hubungannya dengan X.
Dalam bab-bab sebelumnya (lihat hal. 262, 291, dan 322), kami memperkenalkan r2 sebagai
metode untuk mengukur ukuran efek untuk studi penelitian di mana perbedaan rata-rata digunakan
untuk membandingkan perlakuan. Secara khusus, kami mengukur berapa banyak varian skor yang
diperhitungkan oleh perbedaan antara perlakuan. Dalam terminologi eksperimental, r2 mengukur
berapa banyak varian dalam variabel dependen yang diperhitungkan oleh variabel independen.
Sekarang kita melakukan hal yang sama, kecuali bahwa tidak ada variabel independen atau
dependen. Sebagai gantinya, kami hanya memiliki dua variabel, X dan Y, dan kami menggunakan r2
untuk mengukur berapa banyak varian dalam satu variabel dapat ditentukan dari hubungannya
dengan variabel lain. Contoh berikut menunjukkan konsep ini.
Contoh 14.5 Gambar 14.8 menunjukkan tiga set data yang mewakili berbagai derajat hubungan linier. Kumpulan
data pertama [Gambar 14.8(a)] menunjukkan hubungan antara IQ dan ukuran sepatu. Dalam hal ini,
korelasinya adalah r 5 0 (dan r2 5 0), dan Anda tidak memiliki kemampuan untuk memprediksi IQ
seseorang berdasarkan ukuran sepatunya. Mengetahui ukuran sepatu seseorang tidak memberikan
informasi (0%) tentang IQ orang tersebut. Dalam hal ini, ukuran sepatu tidak membantu menjelaskan
mengapa orang yang berbeda memiliki IQ yang berbeda.
Sekarang perhatikan data pada Gambar 14.8(b). Data ini menunjukkan korelasi yang sedang
dan positif, r = 10,60, antara skor IQ dan rata-rata indeks prestasi perguruan tinggi (IPK).
Siswa dengan IQ tinggi cenderung memiliki nilai lebih tinggi daripada siswa dengan IQ rendah. Dari
hubungan ini, dimungkinkan untuk memprediksi IPK siswa berdasarkan IQ-nya. Namun, Anda harus
menyadari bahwa prediksi tersebut tidak sempurna. Meskipun siswa dengan IQ tinggi cenderung
memiliki IPK tinggi, hal ini tidak selalu benar. Dengan demikian, mengetahui IQ siswa memberikan
beberapa informasi tentang nilai siswa, atau mengetahui nilai siswa memberikan beberapa informasi
tentang IQ siswa. Dalam hal ini, skor IQ membantu menjelaskan fakta bahwa siswa yang berbeda
memiliki IPK yang berbeda. Secara khusus, Anda dapat mengatakan bahwa sebagian dari perbedaan
IPK disebabkan oleh IQ. Dengan korelasi r 5 10,60, diperoleh r 2 5 0,36, yang berarti bahwa 36%
varian IPK dapat dijelaskan oleh IQ.
Terakhir, pertimbangkan data pada Gambar 14.8(c). Kali ini kami menunjukkan hubungan linier
yang sempurna (r 5 11.00) antara gaji bulanan dan gaji tahunan untuk sekelompok pegawai
perguruan tinggi. Dengan r 5 1,00 dan r2 5 1,00, ada 100% prediktabilitas. Jika Anda mengetahui
gaji bulanan seseorang, Anda dapat memprediksi dengan sempurna gaji tahunan orang tersebut.
Jika dua orang memiliki gaji tahunan yang berbeda, perbedaannya dapat dijelaskan secara lengkap
(100%) oleh perbedaan gaji bulanan mereka.
(A) (B) (C)
IQ
perguruan
tinggi
IPK
bulanan
Gaji
Ukuran sepatu IQ Gaji tahunan
Gambar 14.8
Tiga set data menunjukkan tiga derajat hubungan linier yang berbeda.
464 BAB 14 korelasi
Sama seperti r2 yang digunakan untuk mengevaluasi ukuran efek untuk perbedaan rata-rata
pada Bab 9, 10, dan 11, r2 sekarang dapat digunakan untuk mengevaluasi ukuran atau kekuatan
korelasi. Standar yang sama yang diperkenalkan pada Tabel 9.3 (p. 264) berlaku untuk kedua
penggunaan ukuran r2 . Secara khusus, nilai r2 0,01 menunjukkan efek kecil atau korelasi kecil,
nilai r2 0,09 menunjukkan korelasi sedang, dan r2 0,25 atau lebih besar menunjukkan korelasi
besar.
Informasi lebih lanjut tentang koefisien determinasi (r2 ) disajikan pada Bagian 14.5. Untuk saat
ini, Anda harus menyadari bahwa setiap kali dua variabel terkait secara konsisten, satu variabel
dapat digunakan untuk memprediksi nilai variabel kedua.
Belajar C hec k 1. Seorang peneliti menemukan korelasi r 5 20,71 antara waktu yang dihabiskan bermain video
game setiap minggu dan nilai rata-rata untuk sekelompok anak laki-laki SMA. Artinya,
bermain video game menyebabkan siswa mendapatkan nilai yang rendah. (Benar atau salah?)
2. Seorang peneliti menemukan korelasi r 5 0,60 antara gaji dan jumlah

tahun pendidikan untuk sekelompok pria berusia 40 tahun. Berapa banyak perbedaan gaji
yang dijelaskan oleh tahun pendidikan?
Jawaban 1. Salah. Anda tidak dapat menyimpulkan bahwa ada hubungan sebab akibat berdasarkan korelasi.
2. r2 5 0,36, atau 36%
14.4 Uji Hipotesis dengan Korelasi Pearson
Korelasi Pearson umumnya dihitung untuk data sampel. Namun, seperti kebanyakan statistik
sampel, korelasi sampel sering digunakan untuk menjawab pertanyaan tentang korelasi populasi
yang sesuai. Misalnya, seorang psikolog ingin mengetahui apakah ada hubungan antara IQ dan
kreativitas. Ini adalah pertanyaan umum tentang populasi. Untuk menjawab pertanyaan tersebut,
sampel akan dipilih, dan data sampel akan digunakan untuk menghitung nilai korelasi.
Anda harus mengenali proses ini sebagai contoh statistik inferensial: menggunakan sampel untuk
menarik kesimpulan tentang populasi. Di masa lalu, kami terutama memperhatikan penggunaan
sarana sampel sebagai dasar untuk menjawab pertanyaan tentang sarana populasi. Pada bagian
ini, kami mempelajari prosedur untuk menggunakan korelasi sampel sebagai dasar untuk menguji
hipotesis tentang korelasi populasi yang sesuai.
Hipotesis Pertanyaan dasar untuk uji hipotesis ini adalah apakah ada korelasi dalam populasi. Hipotesis
nolnya adalah “Tidak. Tidak ada korelasi dalam populasi”, atau “Korelasi populasi adalah nol”.
Hipotesis alternatifnya adalah “Ya. Ada korelasi yang nyata dan bukan nol dalam populasi.” Karena
korelasi populasi secara tradisional diwakili oleh r (huruf Yunani rho), hipotesis ini akan dinyatakan
dalam simbol sebagai
H0 : r 5 0 (Tidak ada korelasi populasi.)
H1 : r ÿ 0 (Ada korelasi nyata.)
BAGIAN 14.4 / Uji Hipotesis dengan Korelasi Pearson 465
Ketika ada prediksi spesifik tentang arah korelasi, dimungkinkan untuk melakukan uji
arah, atau uji satu sisi. Misalnya, jika seorang peneliti memprediksi hubungan positif,
hipotesisnya akan seperti itu
H0 : r ÿ 0 (Korelasi populasi tidak positif.)
H1 : r . 0 (Korelasi populasi positif.)
Korelasi dari data sampel digunakan untuk mengevaluasi hipotesis. Untuk reguler, tes
nondirectional, korelasi sampel mendekati nol memberikan dukungan untuk H0 dan nilai
sampel yang jauh dari nol cenderung menolak H0 Untuk
. uji terarah, nilai positif untuk korelasi
sampel akan cenderung menolak hipotesis nol yang menyatakan bahwa korelasi populasi
tidak positif.
Meskipun korelasi sampel digunakan untuk menguji hipotesis tentang korelasi populasi,
Anda harus ingat bahwa sampel tidak diharapkan identik dengan populasi asalnya; ada
beberapa perbedaan (kesalahan pengambilan sampel) antara statistik sampel dan
parameter populasi yang sesuai.
Secara khusus, Anda harus selalu mengharapkan beberapa kesalahan antara korelasi
sampel dan korelasi populasi yang diwakilinya. Salah satu implikasi dari fakta ini adalah
bahwa, meskipun tidak ada korelasi dalam populasi (r 5 0), Anda masih mungkin
memperoleh nilai bukan nol untuk korelasi sampel. Hal ini terutama berlaku untuk sampel
kecil. Gambar 14.9 mengilustrasikan bagaimana sampel kecil dari populasi dengan korelasi
mendekati nol dapat menghasilkan korelasi yang menyimpang dari nol. Titik berwarna
pada gambar mewakili seluruh populasi dan tiga titik yang dilingkari mewakili sampel acak.
Perhatikan bahwa ketiga titik sampel menunjukkan korelasi yang relatif baik dan positif
meskipun tidak ada tren linier (r 5 0) untuk populasi.
Gambar 14.9
Plot pencar dari populasi

nilai X dan Y dengan
korelasi mendekati nol.
Namun, sampel kecil n 5
3 titik data dari populasi
ini menunjukkan korelasi
positif yang relatif kuat. nilai
Y
Titik data dalam sampel

dilingkari.
X nilai-nilai
466 BAB 14 korelasi
Ketika Anda mendapatkan korelasi bukan nol untuk sampel, tujuan uji hipotesis adalah
untuk memutuskan antara dua interpretasi berikut:
1. Tidak ada korelasi dalam populasi (r 5 0), dan nilai sampelnya adalah
hasil dari kesalahan sampling. Ingat, sampel tidak diharapkan identik dengan populasi.
Selalu ada beberapa kesalahan antara statistik sampel dan parameter populasi yang
sesuai. Ini adalah situasi yang ditentukan oleh H0 .
2. Korelasi sampel bukan nol secara akurat mewakili korelasi nyata bukan nol dalam
populasi. Ini adalah alternatif yang dinyatakan dalam H1 .
Korelasi dari sampel membantu menentukan mana dari dua interpretasi ini yang lebih
mungkin. Korelasi sampel mendekati nol mendukung kesimpulan bahwa korelasi populasi juga
nol. Korelasi sampel yang secara substansial berbeda dari nol mendukung kesimpulan bahwa
ada korelasi nyata bukan nol dalam populasi.
Uji Hipotesis Uji hipotesis yang menilai signifikansi suatu korelasi dapat dilakukan dengan menggunakan
statistik t atau rasio-F. Rasio -F akan dibahas kemudian (hlm. 493–496), dan kami fokus pada
statistik t di sini. Statistik t untuk korelasi memiliki struktur umum yang sama dengan statistik t
yang diperkenalkan di Bab 9, 10, dan 11.
sampel statistik 2 parameter populasi

t5
kesalahan standar
Dalam hal ini, statistik sampel adalah korelasi sampel (r) dan parameter yang sesuai adalah
korelasi populasi (r). Hipotesis nol menetapkan bahwa korelasi populasi adalah r 5 0. Bagian
terakhir dari persamaan adalah kesalahan standar, yang ditentukan oleh
2
1r 2
kesalahan standar untuk sd 5 5 R

N 2 (14.6)
2
Jadi, statistik t lengkapnya adalah
5
R 2r
T
2 1r 2
)
)2 (14.7)
(( N
2
Statistik t memiliki derajat kebebasan yang ditentukan oleh df 5 n – 2. Penjelasan intuitif

untuk nilai ini adalah bahwa sampel dengan hanya n 5 2 titik data tidak memiliki derajat kebebasan.
Khususnya, jika hanya ada dua titik, keduanya akan pas pada garis lurus, dan sampel
menghasilkan korelasi sempurna r 5 11,00 atau r 5 –1,00. Karena dua titik pertama selalu
menghasilkan korelasi yang sempurna, korelasi sampel bebas untuk bervariasi hanya jika
kumpulan data berisi lebih dari dua titik. Jadi, df 5 n – 2.
Contoh berikut menunjukkan uji hipotesis.
Contoh 14.6 Seorang peneliti menggunakan uji dua sisi reguler dengan 5 0,05 untuk menentukan apakah
ada korelasi bukan nol dalam populasi. Didapatkan sampel sebanyak n 5 30 individu dan
menghasilkan korelasi r 5 0,35. Hipotesis nol menyatakan bahwa tidak ada korelasi dalam
populasi.
H0 : r 5 0
Untuk contoh ini, df = 28 dan nilai kritisnya adalah t = ±2,048. Dengan r2 5 0,352
5 0,1225, data menghasilkan
0,35 0 2
0,35
T 5 = = 1 ,97
(1
2
0,1225 )2/ 8 0,177
Nilai t tidak berada di wilayah kritis sehingga kita gagal menolak hipotesis nol. Itu
korelasi sampel tidak cukup besar untuk menolak hipotesis nol.
Contoh 14.7 Dengan sampel n 5 30 dan korelasi r 5 0,35, kali ini kami menggunakan uji satu sisi terarah untuk
menentukan apakah ada korelasi positif dalam populasi.
H0 : r # 0 (Tidak ada korelasi positif.)
H1 : r . 0 (Ada korelasi positif.)
Korelasi sampel positif, seperti yang diperkirakan, jadi kita hanya perlu menentukan apakah cukup
besar untuk menjadi signifikan. Untuk uji satu sisi dengan df 5 28 dan 5 0,05, nilai kritisnya adalah t 5
1,701. Pada contoh sebelumnya, kami menemukan bahwa sampel ini menghasilkan t = 1,97, yang
berada di luar batas kritis. Untuk uji satu sisi, kami menolak hipotesis nol dan menyimpulkan bahwa
terdapat korelasi positif yang signifikan dalam populasi.
Seperti kebanyakan pengujian hipotesis, jika faktor lain dianggap konstan, kemungkinan untuk
menemukan korelasi yang signifikan akan meningkat seiring dengan peningkatan ukuran sampel.
Misalnya, korelasi sampel r 5 0,50 menghasilkan t(8) 5 1,63 yang tidak signifikan untuk sampel n 5
10, tetapi korelasi yang sama menghasilkan t(18) 5 2,45 signifikan jika ukuran sampel ditingkatkan
menjadi n 5 20 .
Di dalam literatur
Korelasi Pelaporan
Korelasi biasanya dilaporkan menggunakan format APA. Pernyataan tersebut harus mencakup
ukuran sampel, nilai korelasi yang dihitung, apakah itu hubungan yang signifikan secara statistik,
tingkat probabilitas, dan jenis tes yang digunakan (satu atau dua sisi).
Misalnya, korelasi dapat dilaporkan sebagai berikut:
Sebuah korelasi untuk data mengungkapkan hubungan yang signifikan antara jumlah
pendidikan dan pendapatan tahunan, r 5 10,65, n 5 30, p , 0,01, dua ekor.
Terkadang sebuah studi mungkin melihat beberapa variabel, dan korelasi antara semua pasangan
variabel yang mungkin dihitung. Misalkan, misalnya, sebuah penelitian mengukur pendapatan
tahunan orang, tingkat pendidikan, usia, dan kecerdasan. Dengan empat variabel, ada enam
kemungkinan pasangan yang menghasilkan enam korelasi berbeda. Hasil dari beberapa hubungan
korelasi paling mudah dilaporkan dalam tabel yang disebut matriks korelasi, menggunakan catatan
kaki untuk menunjukkan korelasi mana yang signifikan. Misalnya, laporan tersebut mungkin menyatakan:
468 BAB 14 korelasi
Analisis menguji hubungan antara pendapatan, jumlah pendidikan, usia, dan kecerdasan untuk
n 5 30 peserta. Korelasi antara pasangan variabel dilaporkan dalam Tabel 1. Korelasi yang
signifikan dicatat dalam tabel.
Tabel 1
Matriks korelasi pendapatan, jumlah pendidikan, umur, dan kecerdasan

Pendidikan Usia IQ
Penghasilan 1,65* 1,41** 1.27
Pendidikan 1.11 1,38**
Usia 2.02
n 5 30
*p , .01, dua ekor
**p , .05, dua ekor
Belajar C hec k 1. Seorang peneliti memperoleh korelasi r 5 20,39 untuk sampel n 5 25 orang.
Apakah sampel ini memberikan bukti yang cukup untuk menyimpulkan bahwa terdapat korelasi
bukan nol yang signifikan dalam populasi? Asumsikan uji dua sisi dengan 5 0,05.
2. Semakin kecil ukuran sampel, apa yang terjadi dengan besarnya korelasi
diperlukan untuk signifikansi? Jelaskan mengapa hal ini terjadi.
Jawaban 1. Tidak. Korelasi sampel menghasilkan t 5 22,03. Dengan df 5 23 dan 5 .05, kritis
nilainya adalah 2,069. Nilai sampel tidak berada di wilayah kritis.
2. Karena ukuran sampel semakin kecil, besarnya korelasi diperlukan untuk signifikansi
semakin besar. Dengan sampel yang kecil, mudah untuk mendapatkan korelasi yang relatif besar secara kebetulan.
Oleh karena itu, sampel kecil membutuhkan korelasi yang sangat besar sebelum Anda yakin bahwa
terdapat hubungan nyata (bukan nol) dalam populasi.
Sebagian Kadang-kadang seorang peneliti mungkin menduga bahwa hubungan antara dua variabel sedang
Korelasi terdistorsi oleh pengaruh variabel ketiga. Sebelumnya di bab ini, misalnya, kami menemukan hubungan
positif yang kuat antara jumlah gereja dan jumlah kejahatan berat untuk sampel kota-kota yang berbeda
(lihat Contoh 14.4, hal 460). Namun, tidak mungkin ada hubungan langsung antara gereja dan kejahatan.
Sebaliknya, kedua variabel tersebut dipengaruhi oleh populasi: Kota-kota besar memiliki banyak gereja
dan tingkat kejahatan yang tinggi dibandingkan dengan kota-kota kecil, yang memiliki lebih sedikit gereja
dan lebih sedikit kejahatan. Jika populasi dikendalikan, mungkin tidak akan ada korelasi nyata antara
gereja dan kejahatan.
Untungnya, ada teknik statistik, yang dikenal sebagai korelasi parsial, yang memungkinkan seorang
peneliti mengukur hubungan antara dua variabel sambil mengendalikan atau mempertahankan pengaruh
variabel ketiga secara konstan. Dengan demikian, seorang peneliti dapat menggunakan korelasi parsial
untuk menguji hubungan antara gereja dan kejahatan tanpa risiko hubungan tersebut terdistorsi oleh
ukuran populasi.
Definisi
Korelasi parsial mengukur hubungan antara dua variabel sambil mengontrol pengaruh
variabel ketiga dengan mempertahankannya konstan.
Dalam situasi dengan tiga variabel, X, Y, dan Z, dimungkinkan untuk menghitung tiga individu
Korelasi Pearson:
1. rXY, mengukur korelasi antara X dan Y 2. rXZ,
mengukur korelasi antara X dan Z 3. rYZ, mengukur
korelasi antara Y dan Z
Ketiga korelasi individu ini kemudian dapat digunakan untuk menghitung korelasi parsial.
Misalnya, korelasi parsial antara X dan Y, dengan mempertahankan konstanta Z , ditentukan
oleh rumus
R 5
R
XY
2
( rrXZ YZ )
XYZ
ÿ
2 2
(1 2
R
XZ
) 1(
2
R
YZ ) (14.8)
Contoh berikut menunjukkan perhitungan dan interpretasi korelasi parsial.
Contoh 14.8 Kita mulai dengan data hipotetis yang ditunjukkan pada Tabel 14.2. Skor ini telah dibangun
untuk mensimulasikan situasi gereja/kejahatan/penduduk untuk sampel n 5 15 kota.
Variabel X mewakili jumlah gereja, Y mewakili jumlah kejahatan, dan Z mewakili populasi setiap
kota. Perhatikan bahwa ada tiga kategori ukuran populasi (tiga nilai untuk Z) yang sesuai dengan
kota kecil, sedang, dan besar. Untuk skor ini, korelasi Pearson individu semuanya besar dan
positif:
A. Korelasi antara gereja dan kejahatan adalah rXY 5 0,923. B.
Korelasi antara gereja dan populasi adalah rXZ 5 0,961. C. Korelasi antara
kejahatan dan populasi adalah rYZ 5 0,961.
Tabel 14.2
Jumlah Gereja (X) Jumlah Kejahatan (Y) Populasi (Z)
Data hipotetis menunjukkan
1 4 1
hubungan antara jumlah
gereja, jumlah kejahatan, dan 2 3 1
jumlah penduduk n 5 15 kota. 3 1 1
4 2 1
5 5 1
7 8 2
8 11 2
9 9 2
10 7 2
11 10 2
13 15 3
14 14 3
15 16 3
16 17 3
17 13 3
470 BAB 14 korelasi
Titik data untuk 15 kota ditunjukkan pada scatter plot pada Gambar 14.10. Perhatikan bahwa
variabel populasi, Z, memisahkan skor menjadi tiga kelompok berbeda: Ketika Z 5 1, populasinya
rendah dan gereja serta kejahatan (X dan Y) juga rendah; ketika Z 5 2, populasinya sedang dan
gereja serta kejahatan (X dan Y) juga sedang; dan ketika Z 5 3, populasinya besar dan gereja
serta kejahatan sama-sama tinggi. Dengan demikian, seiring bertambahnya populasi dari satu
kota ke kota lain, jumlah gereja dan kejahatan juga meningkat, dan hasilnya adalah korelasi
positif yang kuat antara gereja dan kejahatan.
Namun, di dalam masing-masing dari ketiga kategori populasi tersebut, tidak ada hubungan
linier antara gereja dan kejahatan. Secara khusus, dalam setiap kelompok, variabel populasi
adalah konstan dan kelima titik data untuk X dan Y membentuk pola melingkar, menunjukkan
tidak ada hubungan linier yang konsisten. Korelasi parsial memungkinkan kita untuk menahan populasi
17
16 Z=3
Kota besar
15
14
13
12
11
10
9
Kejahatan
Jumlah
Z=2
Kota Menengah
8
3 Z=1
Kota Kecil
2
1 2 3 456 7 8 9 10 11 12 13 14 15 16 17
Jumlah Gereja
Gambar 14.10
Data hipotesis menunjukkan hubungan antara jumlah gereja dan jumlah kejahatan di tiga kelompok kota. Yang
berpenduduk kecil (Z 5 1), yang berpenduduk sedang (Z 5 2), dan yang berpenduduk besar (Z 5 3).
konstan di seluruh sampel dan mengukur hubungan mendasar antara gereja dan
kejahatan tanpa pengaruh apa pun dari populasi. Untuk data ini, korelasi parsialnya
adalah
5
( .
0 .923 0 961. 0 961
2
)
rXY ÿZ
2 2
(1 0 961
2
. 1 0 )(
961 2
. )
0
5
0 076.
50
Jadi, ketika perbedaan populasi dihilangkan, tidak ada korelasi yang tersisa
antara gereja dan kejahatan (r 5 0).
Dalam Contoh 14.8, perbedaan populasi, yang sesuai dengan perbedaan nilai
variabel Z , dihilangkan secara matematis dalam perhitungan korelasi parsial. Namun,
dimungkinkan untuk memvisualisasikan bagaimana perbedaan ini dihilangkan dalam
data aktual. Perhatikan Gambar 14.10, fokuskan pada lima titik di pojok kiri bawah. Ini
adalah lima kota dengan populasi kecil, sedikit gereja, dan sedikit kejahatan.
Lima titik di pojok kanan atas melambangkan lima kota dengan populasi besar, banyak
gereja, dan banyak kejahatan. Korelasi parsial mengontrol ukuran populasi dengan
menyamakan populasi secara matematis untuk semua 15 kota. Populasi meningkat
untuk lima kota kecil. Namun, peningkatan populasi juga meningkatkan gereja dan
kejahatan. Demikian pula, populasi berkurang untuk lima kota besar, yang juga
mengurangi jumlah gereja dan kejahatan. Pada Gambar 14.10, bayangkan lima titik di
kiri bawah bergerak ke atas dan ke kanan sehingga tumpang tindih dengan titik di
tengah. Pada saat yang sama, lima titik di kanan atas bergerak ke bawah dan ke kiri
sehingga juga tumpang tindih dengan titik di tengah. Saat populasi disamakan, semua
15 titik data dikelompokkan di tengah gambar tanpa tren positif atau negatif yang jelas.
Dengan kata lain, sisa korelasi antara gereja dan kejahatan adalah r 5 0.
Dalam Contoh 14.8 kami menggunakan korelasi parsial untuk menunjukkan bahwa
hubungan yang nyata antara gereja dan kejahatan sebenarnya disebabkan oleh
pengaruh variabel ketiga, populasi. Dimungkinkan juga untuk menggunakan korelasi
parsial untuk menunjukkan bahwa suatu hubungan tidak disebabkan oleh pengaruh
variabel ketiga. Sebagai contoh, pertimbangkan penelitian yang meneliti hubungan
antara paparan konten seksual di televisi dan perilaku seksual di kalangan remaja (Collins et al.,
Studi tersebut terdiri dari survei terhadap 1.792 remaja, berusia 12 hingga 17 tahun,
yang melaporkan kebiasaan menonton televisi dan perilaku seksual mereka. Hasilnya
menunjukkan hubungan yang jelas antara menonton televisi dan perilaku. Secara
khusus, semakin banyak konten seksual yang ditonton remaja di televisi, semakin
besar kemungkinan mereka terlibat dalam perilaku seksual. Salah satu perhatian para
peneliti adalah bahwa hubungan yang diamati dapat dipengaruhi oleh usia peserta.
Misalnya, remaja yang lebih tua (usia 17) mungkin menonton lebih banyak program
dengan konten seksual dan terlibat dalam lebih banyak perilaku seksual daripada
remaja yang lebih muda (usia 12). Meskipun tayangan konten seksual di televisi dan
perilaku seksual partisipan meningkat secara bersamaan, hubungan yang diamati
mungkin hanya merupakan hasil dari perbedaan usia. Untuk mengatasi masalah ini,
peneliti menggunakan teknik korelasi parsial untuk mengontrol atau menjaga konstanta
variabel usia. Hasilnya jelas menunjukkan bahwa masih ada hubungan antara konten
seksual televisi dan perilaku seksual bahkan setelah pengaruh usia peserta diperhitungkan.
472 BAB 14 korelasi
Belajar C hec k 1. Angka penjualan menunjukkan hubungan positif antara suhu dan konsumsi es krim;
dengan meningkatnya suhu, konsumsi es krim juga meningkat.
Penelitian lain menunjukkan hubungan positif antara suhu dan tingkat kejahatan (Cohn
& Rotton, 2000). Saat suhu meningkat, konsumsi es krim dan tingkat kejahatan
cenderung meningkat. Akibatnya, ada korelasi positif antara konsumsi es krim dan
tingkat kejahatan. Namun, menurut Anda apa sebenarnya hubungan antara konsumsi es
krim dan tingkat kriminalitas? Khususnya, berapakah nilai yang akan Anda perkirakan
untuk korelasi parsial antara dua variabel jika suhu dipertahankan konstan?
Menjawab 1. Tidak boleh ada hubungan sistematis antara konsumsi es krim dan tingkat kriminalitas.
Korelasi parsial harus mendekati nol.
14.5 Alternatif untuk Korelasi Pearson

Korelasi Pearson mengukur tingkat hubungan linier antara dua variabel ketika data (nilai X dan
Y ) terdiri dari skor numerik dari skala pengukuran interval atau rasio. Namun, korelasi lain telah
dikembangkan untuk hubungan nonlinier dan untuk jenis data lainnya. Pada bagian ini, kami
menguji tiga korelasi tambahan: korelasi Spearman, korelasi titik-biserial, dan koefisien phi.
Seperti yang akan Anda lihat, ketiganya dapat dilihat sebagai aplikasi khusus dari korelasi
Pearson.
Spearman Ketika rumus korelasi Pearson digunakan dengan data dari skala ordinal (peringkat), hasilnya
Korelasi disebut korelasi Spearman. Korelasi Spearman digunakan dalam dua situasi.
Pertama, korelasi Spearman digunakan untuk mengukur hubungan antara X dan Y ketika
kedua variabel diukur dalam skala ordinal. Ingat dari Bab 1 bahwa skala ordinal biasanya
melibatkan individu peringkat daripada memperoleh skor numerik. Data urutan peringkat cukup
umum karena seringkali lebih mudah diperoleh daripada data skala interval atau rasio. Misalnya,
seorang guru mungkin merasa percaya diri tentang kemampuan kepemimpinan siswa yang
mengurutkan peringkat tetapi akan merasa sulit untuk mengukur kepemimpinan pada skala lain.
Selain mengukur hubungan untuk data ordinal, korelasi Spearman dapat digunakan sebagai
alternatif berharga untuk korelasi Pearson, bahkan ketika skor mentah asli berada pada interval
atau skala rasio. Seperti yang telah kita catat, korelasi Pearson mengukur tingkat hubungan
linier antara dua variabel—yaitu, seberapa cocok titik data pada garis lurus. Namun, seorang
peneliti sering berharap data menunjukkan hubungan satu arah yang konsisten tetapi tidak
harus kapal hubungan linier. Misalnya, Gambar 14.11 menunjukkan hubungan khas antara
praktik dan kinerja. Untuk hampir semua keterampilan, peningkatan jumlah latihan cenderung
dikaitkan dengan peningkatan kinerja (semakin banyak Anda berlatih, semakin baik yang Anda
dapatkan).
Namun, itu bukan hubungan garis lurus. Saat Anda pertama kali mempelajari keterampilan
baru, latihan menghasilkan peningkatan kinerja yang besar. Namun, setelah Anda melakukan
suatu keterampilan selama beberapa tahun, latihan tambahan hanya menghasilkan perubahan
kecil dalam kinerja. Meskipun ada hubungan yang konsisten antara jumlah latihan dan kualitas
kinerja, jelas tidak linier. Jika korelasi Pearson dihitung untuk data ini, itu tidak akan menghasilkan
korelasi 1,00 karena data tidak sesuai dengan garis lurus. Dalam situasi seperti ini, korelasi
Spearman dapat digunakan untuk mengukur konsistensi hubungan, terlepas dari bentuknya.
BAGIAN 14.5 / Alternatif Korelasi Pearson 473
Gambar 14.11
Data hipotetis
menunjukkan
hubungan antara praktek dan kinerja.
Meskipun hubungan ini
tidak linier, ada
hubungan positif yang
Tingkat
kinerja
(Y)
konsisten. Peningkatan
kinerja cenderung
mengiringi peningkatan dalam praktik.
Jumlah latihan ( ) X
Alasan korelasi Spearman mengukur konsistensi, bukan bentuk, berasal dari

pengamatan sederhana: Ketika dua variabel terkait secara konsisten, peringkat
mereka terkait secara linier. Misalnya, hubungan positif yang konsisten sempurna
berarti setiap kali variabel X meningkat, variabel Y juga meningkat. Jadi, nilai X terkecil
dipasangkan dengan nilai Y terkecil , nilai X terkecil kedua dipasangkan dengan nilai
Y terkecil kedua, dan seterusnya. Setiap kali peringkat X naik 1 poin, peringkat Y juga
naik 1 poin. Alhasil, barisannya sangat pas di garis lurus. Fenomena ini ditunjukkan
dalam contoh berikut.
Contoh 14.9 Tabel 14.3 menyajikan skor X dan Y untuk sampel n 5 4 orang. Perhatikan bahwa data
menunjukkan hubungan yang sangat konsisten. Setiap kenaikan X disertai dengan
kenaikan Y. Namun, hubungan tersebut tidak linier, seperti terlihat pada grafik data
pada Gambar 14.12(a).
Selanjutnya, kami mengonversi skor menjadi peringkat. X terendah diberi peringkat 1, terendah berikutnya
peringkat 2, dan seterusnya. Skor Y kemudian diberi peringkat dengan cara yang sama. Peringkat tersebut
tercantum pada Tabel 14.3 dan ditunjukkan pada Gambar 14.12(b). Perhatikan bahwa konsistensi yang
sempurna untuk skor menghasilkan hubungan linier yang sempurna untuk peringkat.
Contoh sebelumnya menunjukkan bahwa hubungan yang konsisten di antara skor

menghasilkan hubungan linier ketika skor diubah menjadi peringkat. Jadi, jika Anda
ingin mengukur konsistensi hubungan untuk sekumpulan skor, Anda cukup
mengonversi skor menjadi peringkat lalu menggunakan rumus korelasi Pearson untuk
mengukur hubungan linier untuk data peringkat. Tingkat hubungan linier untuk
peringkat memberikan ukuran tingkat konsistensi untuk skor asli.
Tabel 14.3 Orang XY Peringkat-X Peringkat-Y

Skor dan peringkat
4 3 3
untuk Contoh 14.9.
B 922 1 1
C 10 10 4 4
D3 8 2 2
474 BAB 14 korelasi
Peringkat
Skor
C 4 C
10
A
9
8 D
3 A
7
skor
Y
6 peringkat
Y
5 2 D
4
3
2 B 1 B
1
13579 0 2468 10 1234

X skor X
(A) peringkat (b)
Gambar 14.12
Plot pencar menunjukkan (a) skor dan (b) peringkat untuk data pada Contoh 14.9. Perhatikan bahwa ada hubungan yang
konsisten dan positif antara skor X dan Y , meskipun itu bukan hubungan yang linier. Perhatikan juga bahwa sebar plot dari
peringkat menunjukkan hubungan linier yang sempurna.
Singkatnya, korelasi Spearman mengukur hubungan antara dua variabel ketika keduanya
diukur pada skala ordinal (peringkat). Ada dua situasi umum di mana korelasi Spearman
digunakan:
1. Spearman digunakan saat data asli berbentuk ordinal. Dalam hal ini, Anda memberi
peringkat skor ordinal dan menerapkan rumus korelasi Pearson ke kumpulan peringkat.
2. Spearman digunakan ketika skor asli adalah nilai numerik dari sebuah
skala interval atau rasio dan tujuannya adalah untuk mengukur konsistensi hubungan
antara X dan Y, terlepas dari bentuk khusus dari hubungan tersebut. Dalam hal ini,
skor asli pertama kali diubah menjadi peringkat, dan kemudian rumus korelasi
Pearson digunakan dengan peringkat. Karena rumus Pearson mengukur tingkat
kecocokan peringkat pada garis lurus, rumus ini juga mengukur tingkat konsistensi
dalam hubungan untuk skor awal. Kebetulan, ketika ada hubungan satu arah yang
konsisten antara dua variabel, hubungan tersebut dikatakan monoton. Dengan demikian,
Kata monoton menjelaskan korelasi Spearman mengukur tingkat hubungan monoton antara dua variabel.
urutan yang secara konsisten
meningkat (atau menurun).
Seperti kata monoton, artinya
konstan dan tidak berubah. Dalam kedua kasus tersebut, korelasi Spearman diidentifikasi dengan simbol rS untuk
membedakannya dari korelasi Pearson. Proses lengkap penghitungan korelasi Spearman,
termasuk skor pemeringkatan, diperlihatkan dalam Contoh 14.10.
Contoh 14.10 Data berikut menunjukkan hubungan monotonik yang hampir sempurna antara X dan Y.
Saat X naik, Y cenderung turun, dan hanya ada satu pembalikan dalam tren umum ini. Untuk
menghitung korelasi Spearman, pertama-tama kita mengurutkan nilai X dan Y , dan kemudian
menghitung korelasi Pearson untuk peringkat tersebut.
Kami telah mencantumkan nilai

Data Asli Peringkat
X agar tren lebih mudah
X Y X Y XY
dikenali.
3 12 1 5 5
4 10 2 3 6
10 11 3 4 12
11 9 4 2 8
12 2 5 1 5
36 5 OKSI
Untuk menghitung korelasinya, kita membutuhkan SS untuk X, SS untuk Y, dan SP. Ingatlah bahwa semua
nilai ini dihitung dengan peringkat, bukan skor aslinya. Peringkat X hanyalah bilangan bulat 1, 2, 3, 4, dan 5.
Nilai-nilai ini memiliki oX 5 15 dan oX2 5 55. SS untuk peringkat X adalah
2
2
2
ÿ X) ( ) 15
SSXX( 5 ÿ 2 52
55 5
10
N 5
Perhatikan bahwa peringkat untuk Y identik dengan peringkat untuk X; yaitu, mereka adalah bilangan bulat
1, 2, 3, 4, dan 5. Oleh karena itu, SS untuk Y identik dengan SS untuk X:
SSY 5 10
Untuk menghitung nilai SP , kita membutuhkan oX, oY, dan oXY untuk rank tersebut. Nilai XY tercantum
dalam tabel dengan peringkat, dan kami telah menemukan bahwa Xs dan Ys memiliki jumlah 15. Dengan
menggunakan nilai ini, kami memperoleh
ÿ )ÿ X ( Y ) ( )( ) 15 15
SP (XY
5ÿ2 5
36 ÿ
52
9
N 5
Terakhir, korelasi Spearman hanya menggunakan rumus Pearson untuk peringkat.
SP 2
9
r
s
5 5 52
0 9.
(SSXSS
)( Y ) 10(10
)
Korelasi Spearman menunjukkan bahwa data menunjukkan tren negatif yang konsisten (hampir sempurna).
Peringkat Skor Terikat Saat Anda mengonversi skor menjadi peringkat untuk korelasi Spearman, Anda mungkin menemukan dua (atau
lebih) skor identik. Setiap kali dua skor memiliki nilai yang persis sama, peringkat mereka juga harus sama. Ini
dicapai dengan prosedur berikut:
1. Urutkan skor dari yang terkecil ke yang terbesar. Sertakan nilai terikat dalam daftar.
2. Tetapkan peringkat (pertama, kedua, dst.) untuk setiap posisi dalam daftar yang diurutkan.
3. Ketika dua (atau lebih) skor seri, hitung rata-rata posisi peringkat mereka, dan tetapkan nilai rata-rata ini
sebagai peringkat akhir untuk setiap skor.
476 BAB 14 korelasi
Proses menemukan peringkat untuk skor seri ditunjukkan di sini. Skor ini telah terdaftar dalam urutan
dari yang terkecil hingga yang terbesar.
Skor Posisi Peringkat Peringkat Akhir
3 1 1.5 Rata-rata 1 dan 2

3 2 1.5
5 3 3
6 4 5 Rata-rata 4, 5, dan 6
6 5 5
6 6 5
12 7 7
Perhatikan bahwa contoh ini memiliki tujuh skor dan menggunakan ketujuh peringkat. Untuk X 5 12
skor terbesar, peringkat yang sesuai adalah 7. Tidak dapat diberikan peringkat 6 karena peringkat tersebut
telah digunakan untuk skor seri.
Jika skor asli adalah nilai ordinal, maka skor tersebut diberi peringkat menggunakan proses yang
persis sama untuk skor seri peringkat. Misalnya, seorang peneliti memiliki nilai huruf berikut untuk sampel
n 5 7 siswa: A, A, B, C, C, D, dan F. Nilai tersebut akan menerima peringkat berikut: 1,5, 1,5, 3, 4,5 , 4.5,
6, dan 7.
Formula Khusus untuk Setelah nilai X asli dan nilai Y diurutkan, perhitungan yang diperlukan untuk SS dan SP dapat sangat
Spearman disederhanakan. Pertama, Anda harus mencatat bahwa peringkat X dan peringkat Y sebenarnya hanya
Korelasi sekumpulan bilangan bulat: 1, 2, 3, 4, … , n. Untuk menghitung rata-rata bilangan bulat ini, Anda dapat
menentukan titik tengah deret dengan M 5 (n 1 1)/2. Demikian pula, SS untuk rangkaian bilangan bulat ini
dapat dihitung dengan
nn( 22 1 )
SS 5 ( Cobalah.
)
12
Juga, karena pangkat X dan pangkat Y memiliki nilai yang sama, SS untuk X identik dengan SS untuk
Y.
Karena perhitungan dengan peringkat dapat disederhanakan dan karena korelasi Spearman
menggunakan data peringkat, penyederhanaan ini dapat dimasukkan ke dalam perhitungan akhir korelasi
Spearman. Alih-alih menggunakan rumus Pearson setelah memeringkat data, Anda dapat memasukkan
peringkat langsung ke dalam rumus yang disederhanakan:
2 6 oD
rs
52
1
2nn
(
2
1) (14.9)
Perhatian: Dalam rumus ini, di mana D adalah selisih antara peringkat X dan peringkat Y untuk setiap individu.
Anda menghitung nilai pecahan Rumus ini menghasilkan hasil yang sama dengan yang diperoleh dari rumus Pearson. Namun, perhatikan
lalu mengurangkannya bahwa rumus khusus ini hanya dapat digunakan setelah skor diubah menjadi peringkat dan hanya jika
dari 1. 1 bukan bagian dari tidak ada ikatan di antara peringkat. Jika peringkat seri relatif sedikit, rumus masih dapat digunakan, tetapi
pecahan.
kehilangan akurasi karena jumlah seri meningkat. Penerapan rumus ini ditunjukkan dalam contoh berikut.
Contoh 14.11 Untuk mendemonstrasikan rumus khusus untuk korelasi Spearman, kami menggunakan data yang sama yang
disajikan dalam Contoh 14.10. Peringkat untuk data ini ditampilkan lagi di sini:
Peringkat Perbedaan
X Y D D2
1 5 4 16
2 3 1 1
3 4 1 1
4 2 22 4
5 1 24 16
38 5 oD 2
Dengan menggunakan rumus khusus untuk korelasi Spearman, kami memperoleh
2
6oD 638
() 228
rs
52
1 52
1 52 52
1 1 1 9. 0 0 52 .90
2nn
2
1) ( 5 25 1 )
2
120
(
Ini adalah jawaban yang persis sama dengan yang kami peroleh pada Contoh 14.10, dengan menggunakan
Formula Pearson di jajaran.
Belajar C hec k 1. Jelaskan apa yang diukur dengan korelasi Spearman, dan jelaskan bagaimana korelasi ini berbeda dengan
korelasi Pearson.
2. Jika skor berikut ini diubah menjadi peringkat, peringkat apa yang diberikan kepada individu yang memiliki
skor X 5 7?
Skor: 1, 1, 1, 3, 6, 7, 7, 8, 10
3. Beri peringkat skor berikut dan hitung korelasi Spearman:
XY
2 7
12 3
9 16
14 5
Jawaban 1. Korelasi Spearman mengukur konsistensi arah hubungan antara dua variabel. Korelasi Spearman tidak
bergantung pada bentuk hubungan, sedangkan korelasi Pearson mengukur seberapa cocok data
dengan bentuk linier.
2. Kedua skor mendapatkan peringkat 6,5 (rata-rata 6 dan 7).
3.rs 5 20.60
Point-Biserial Dalam Bab 9, 10, dan 11, kami memperkenalkan r2 sebagai ukuran besaran efek yang sering menyertai uji
Korelasi dan hipotesis menggunakan statistik t . R2 yang digunakan untuk mengukur ukuran efek dan r yang digunakan
Efek Pengukuran untuk mengukur korelasi berhubungan langsung, dan sekarang kita memiliki kesempatan untuk menunjukkan
Ukuran dengan r 2 hubungannya. Secara khusus, kami membandingkan uji t pengukuran independen (Bab 10) dan versi khusus
dari korelasi Pearson yang dikenal sebagai korelasi titik-biserial.
478 BAB 14 korelasi
Korelasi point-biserial digunakan untuk mengukur hubungan antara dua variabel dalam situasi di mana
satu variabel terdiri dari skor numerik reguler, tetapi variabel kedua hanya memiliki dua nilai. Variabel
dengan hanya dua nilai disebut variabel dichot omous atau variabel binomial. Beberapa contoh variabel
dikotomi adalah
1. Laki-laki versus perempuan
2. Lulusan perguruan tinggi versus bukan lulusan perguruan tinggi
3. Anak sulung versus anak yang lahir belakangan
4. Sukses versus kegagalan pada tugas tertentu
5. Lebih tua dari 30 tahun versus lebih muda dari 30 tahun
Biasanya menggunakan nilai Untuk menghitung korelasi titik-biserial, variabel dikotomi pertama-tama diubah menjadi nilai numerik
numerik 0 dan 1, tetapi dua angka dengan menetapkan nilai nol (0) untuk satu kategori dan nilai satu (1) untuk kategori lainnya. Kemudian,
yang berbeda akan bekerja rumus korelasi Pearson biasa digunakan dengan data yang dikonversi.
sama baiknya dan tidak akan
memengaruhi nilai korelasi.
Untuk mendemonstrasikan korelasi point-biserial dan hubungannya dengan ukuran efek r2 , kami
menggunakan data dari Contoh 10.1 (hal. 289). Contoh asli membandingkan nilai sekolah menengah
untuk dua kelompok siswa: satu kelompok yang secara teratur menonton Sesame Street sebagai anak
berusia 5 tahun dan satu lagi yang tidak menonton program tersebut. Data dari studi pengukuran
independen disajikan di sisi kiri Tabel 14.4.
Perhatikan bahwa data terdiri dari dua sampel terpisah dan pengukuran bebas t digunakan untuk
menentukan apakah ada perbedaan rata-rata yang signifikan antara dua populasi yang diwakili oleh sampel.
Tabel 14.4
Data untuk uji t pengukuran independen . Data untuk korelasi point-biserial. Dua skor, X dan Y,
Data yang sama disusun dalam
Dua sampel terpisah, masing-masing untuk masing-masing n 5 20 peserta.
dua format berbeda.
dengan skor n 5 10.
Di sisi kiri, data muncul Peserta Kelas X Grup Y
sebagai dua sampel terpisah Nilai SMA Rata-rata
A 86 1
yang sesuai untuk uji hipotesis Menonton Tidak Menonton
jalan Sesama jalan Sesama B 87 1
t pengukuran independen .
Di sisi kanan, data yang sama C 91
ditampilkan sebagai sampel 86 99 90 79 D 97 11
tunggal, dengan masing- 87 97 89 83 e 98 1

masing dua skor 91 94 82 86 F 99
individu: nilai sekolah menengah 97 89 83 81 G 97 11
atas asli dan skor dikotomi (Y) 98 92 85 92 H 94 1
yang mengidentifikasi kelompok
n 5 10 n 5 10 89 1
tempat peserta berada
SAYA
M5 93 M5 85 J 92 1
(Sesame
Street 5 1 dan No-Sesame SS5 200 SS5 160
K 90 0
Jalan 5 0). Data di sebelah L 89 0
kanan sesuai untuk korelasi M 82 0
titik-biserial.
N 83 0
HAI 85 0
P 79 0
Q 83 0
R 86 0
S 81 0
T 92 0
Di sisi kanan Tabel 14.4 kami telah mengatur ulang data menjadi bentuk yang sesuai untuk
korelasi titik-biserial. Khususnya, kami menggunakan nilai SMA setiap siswa sebagai nilai X dan
kami telah membuat variabel baru, Y, untuk mewakili grup, atau kondisi, untuk setiap siswa.
Dalam hal ini, kami menggunakan Y 5 1 untuk siswa yang menonton Sesame Street dan Y 5 0
untuk siswa yang tidak menonton program tersebut.
Ketika data pada Tabel 14.4 disajikan pada Bab 10, kami melakukan uji hipotesis t pengukuran
independen dan memperoleh t 5 4,00 dengan df 5 18. Kami mengukur ukuran efek perlakuan
dengan menghitung r2 persentase varian yang diperhitungkan, dan, diperoleh r25 0,47.
Menghitung korelasi point-biserial untuk data ini juga menghasilkan nilai r.

Secara khusus, skor X menghasilkan SS 5 680; nilai Y menghasilkan SS 5 5,00, dan penjumlahan
produk simpangan X dan Y menghasilkan SP 5 40. Korelasi point-biserial adalah
SP 40 40
R 5 5 5 5
0 .686
(SSXSS
)( Y ) ( 680(5) ) 58 .31
Perhatikan bahwa mengkuadratkan nilai korelasi point-biserial menghasilkan r2 5 (0,686)2

5 0,47, yang merupakan nilai r2 yang kami peroleh dengan mengukur ukuran efek.
Dalam beberapa hal, korelasi poin-biserial dan uji hipotesis ukuran-independen mengevaluasi
hal yang sama. Secara khusus, keduanya meneliti hubungan antara kebiasaan menonton TV
anak-anak berusia 5 tahun dan prestasi akademik masa depan mereka di sekolah menengah.
1. Korelasi mengukur kekuatan hubungan antara dua variabel. Korelasi yang besar
(mendekati 1,00 atau 21,00) akan menunjukkan bahwa ada hubungan yang konsisten
dan dapat diprediksi antara nilai sekolah menengah dan menonton Sesame Street
sebagai anak berusia 5 tahun. Secara khusus, nilai r2 mengukur berapa banyak
variabilitas nilai yang dapat diprediksi dengan mengetahui apakah peserta menonton
Sesame Street.
2. Uji t mengevaluasi signifikansi hubungan. Uji hipotesis menentukan apakah perbedaan

rata-rata nilai antara kedua kelompok lebih besar daripada yang dapat dijelaskan
secara masuk akal secara kebetulan saja.
Seperti yang kami catat di Bab 10 (hal. 291–295), hasil uji hipotesis dan nilai r2 sering
dilaporkan bersamaan. Nilai t mengukur signifikansi statistik dan r2 mengukur ukuran efek.
Juga, seperti yang kita catat di Bab 10, nilai t dan r2 berhubungan langsung. Faktanya, keduanya
dapat dihitung dari yang lain dengan persamaan
2t 2r
2r 5
2
Dan 2t
5
2
t df1 1 2
r df) /
(
di mana df adalah derajat kebebasan untuk statistik t .

Namun, Anda harus mencatat bahwa r2 ditentukan sepenuhnya oleh ukuran korelasi,
sedangkan t dipengaruhi oleh ukuran korelasi dan ukuran sampel.
Misalnya, korelasi r 5 0,30 menghasilkan r 2 5 0,09 (9%) tidak peduli seberapa besar sampelnya.
Di sisi lain, korelasi point-biserial r 5 0,30 untuk sampel total 10 orang (n 5 5 dalam setiap
kelompok) menghasilkan nilai t 5 0,889 yang tidak signifikan. Jika sampel ditambah menjadi 50
orang (n 5 25 pada setiap kelompok), korelasi yang sama menghasilkan nilai t signifikan t 5 2,18.
Meskipun t dan r terkait, mereka mengukur hal yang berbeda.
480 BAB 14 korelasi
Koefisien Phi Ketika kedua variabel (X dan Y) yang diukur untuk setiap individu bersifat dikotomis, hubungan
korelasi antara kedua variabel tersebut disebut koefisien phi. Untuk menghitung phi (ÿ), Anda
mengikuti prosedur dua langkah:
1. Ubah setiap variabel dikotomi menjadi nilai numerik dengan memberikan 0 untuk satu kategori
dan 1 untuk kategori lainnya untuk masing-masing variabel.
2. Gunakan rumus Pearson biasa dengan skor yang dikonversi.
Proses ini ditunjukkan dalam contoh berikut.
Contoh 14.12 Seorang peneliti tertarik untuk meneliti hubungan antara posisi urutan kelahiran dan kepribadian bagi
individu yang memiliki setidaknya satu saudara kandung. Sebuah sampel acak n 5 8 peserta
diperoleh, dan masing-masing individu diklasifikasikan berdasarkan posisi urutan kelahiran sebagai
anak sulung versus anak belakangan. Kemudian, kepribadian masing-masing individu diklasifikasikan
sebagai introvert atau ekstrovert.
Pengukuran asli kemudian dikonversi ke nilai numerik dengan tugas berikut:
Urutan Kelahiran Kepribadian
Anak sulung 5 0 Introvert 5 0

Anak yang lahir kemudian 5 1 Ekstrovert 5 1
Data asli dan skor yang dikonversi adalah sebagai berikut:
Data Asli Skor yang Dikonversi
Urutan Kelahiran Kepribadian Urutan Kelahiran Kepribadian

(X) (Y) (X) (Y)
1st Tertutup 0 0
3 Ekstrovert 1 1
1st Ekstrovert 0 1
2 Ekstrovert 1 1
4 Ekstrovert 1 1
2 Tertutup 1 0
1st Tertutup 0 0
3 Ekstrovert 1 1
Rumus korelasi Pearson kemudian digunakan dengan data yang dikonversi untuk menghitung
koefisien phi.
Karena penugasan nilai numerik bersifat arbitrer (salah satu kategori dapat ditetapkan 0 atau 1),
tanda korelasi yang dihasilkan tidak ada artinya.
Seperti kebanyakan korelasi, kekuatan hubungan paling baik digambarkan dengan nilai r2
, koefisien determinasi, yang mengukur seberapa besar variabilitas dalam satu variabel
diprediksi atau ditentukan oleh keterkaitannya dengan variabel kedua.
Kita juga harus mencatat bahwa meskipun koefisien phi dapat digunakan untuk menilai hubungan
antara dua variabel dikotomis, prosedur statistik yang lebih umum adalah statistik chi-kuadrat, yang
dibahas di Bab 15.
BAGIAN 14.6 / Pengantar Persamaan Linear dan Regresi 481
Belajar C hec k 1. Data berikut mewakili skor stres terkait pekerjaan untuk sampel n 5 8
individu. Orang-orang ini juga diklasifikasikan berdasarkan tingkat gaji.
A. Ubah data menjadi bentuk yang sesuai untuk korelasi titik-biserial.
B. Hitung korelasi titik-biserial untuk data ini.
Gaji Lebih Gaji Kurang

dari $40,000 dari $40,000
8 4
6 2
5 1
3 3
2. Seorang peneliti ingin mengetahui apakah ada hubungan antara gender dan
ketangkasan manual untuk anak usia 3 tahun. Sebuah sampel n 5 10 laki-laki dan n 5 10
perempuan diperoleh dan setiap anak diberi tes ketangkasan manual. Lima anak perempuan gagal
dalam ujian dan hanya dua anak laki-laki yang gagal. Jelaskan bagaimana data ini dapat
dikodekan ke dalam bentuk yang cocok untuk menghitung koefisien phi untuk mengukur kekuatan hubungan.
Jawaban 1.a. Tingkat gaji adalah variabel dikotomis dan dapat dikodekan sebagai Y 5 1 untuk individu dengan gaji
lebih dari $40.000 dan Y 5 0 untuk gaji kurang dari $40.000. Skor stres menghasilkan SSX 5 36,
kode gaji menghasilkan SSY 5 2, dan SP 5 6.
B. Korelasi titik-biserial adalah 0,71.
2. Jenis kelamin dapat dikodekan dengan laki-laki 5 0 dan perempuan 5 1. Ketangkasan manual dapat
dikodekan dengan gagal 5 0 dan sukses 5 1. Delapan anak laki-laki akan mendapat skor 0 dan 1 dan
dua akan memiliki skor 0 dan 0. Lima anak perempuan akan memiliki skor 1 dan 1 dan lima akan memiliki skor 1 dan 0.
14.6 Pengantar Persamaan Linear dan Regresi
Sebelumnya di bab ini, kami memperkenalkan korelasi Pearson sebagai teknik untuk menggambarkan
dan mengukur hubungan linier antara dua variabel. Gambar 14.13 menyajikan data hipotetis yang
menunjukkan hubungan antara nilai SAT dan indeks prestasi akademik (IPK) perguruan tinggi.
Perhatikan bahwa angka tersebut menunjukkan hubungan positif yang baik, tetapi tidak sempurna.
Perhatikan juga bahwa kami telah menggambar garis melalui tengah titik data. Baris ini melayani
beberapa tujuan:
1. Garis membuat hubungan antara nilai SAT dan IPK lebih mudah dilihat.
2. Garis mengidentifikasi pusat, atau tendensi sentral, dari hubungan, sama seperti rata-rata
menggambarkan tendensi sentral untuk satu set skor. Dengan demikian, garis memberikan
deskripsi hubungan yang disederhanakan. Misalnya, jika poin data dihilangkan, garis lurus
masih akan memberikan gambaran umum tentang hubungan antara nilai SAT dan IPK.
3. Terakhir, garis dapat digunakan untuk prediksi. Garis menetapkan tepat,

hubungan satu-ke-satu antara setiap nilai X (skor SAT) dan nilai Y (IPK) yang sesuai .
Misalnya, skor SAT 620 sesuai dengan IPK 3,25 (lihat Gambar 14.13). Dengan demikian,
petugas penerimaan perguruan tinggi dapat menggunakan hubungan garis lurus untuk
memprediksi bahwa seorang mahasiswa yang memasuki perguruan tinggi dengan skor SAT
620 harus mencapai IPK perguruan tinggi sekitar 3,25.
482 BAB 14 korelasi
Gambar 14.13
4.00
Data hipotesis menunjukkan
hubungan antara 3.50
Skor SAT dan IPK dengan
garis regresi yang ditarik 3.00
melalui titik data.
Garis regresi menentukan 2.50
rata-
Nilai
rata
hubungan satu-ke-satu yang

tepat antara setiap nilai X 2.00
(skor SAT) dan nilai Y
1,50
(IPK) yang sesuai .
1.00
0,50
420 460 500 540 620580 660 700
skor SAT
Tujuan kami di bagian ini adalah untuk mengembangkan prosedur yang mengidentifikasi dan
menentukan garis lurus yang memberikan kecocokan terbaik untuk kumpulan data tertentu. Garis lurus
ini tidak harus digambar pada grafik; dapat disajikan dalam persamaan sederhana. Dengan demikian,
tujuan kita adalah menemukan persamaan garis yang paling menggambarkan hubungan untuk himpunan
data X dan Y.
Persamaan linear Secara umum, hubungan linier antara dua variabel X dan Y dapat dinyatakan dengan persamaan
Y 5 bX 1 a (14.10)
di mana a dan b adalah konstanta tetap.

Misalnya, toko video lokal mengenakan biaya keanggotaan tahunan sebesar $5, yang memungkinkan
Anda menyewa video dan game masing-masing seharga $2. Dengan informasi tersebut, total biaya
selama 1 tahun dapat dihitung dengan menggunakan persamaan linear yang menjelaskan hubungan
antara biaya total (Y) dan jumlah video dan game yang disewa (X).
Y 5 2X 1 5
Perhatikan bahwa kemiringan Dalam persamaan linier umum, nilai b disebut kemiringan. Kemiringan menentukan seberapa besar
positif berarti Y meningkat variabel Y berubah ketika X bertambah 1 poin. Untuk contoh toko video, kemiringannya adalah b 5 2
ketika X meningkat, dan dan menunjukkan bahwa biaya total Anda meningkat sebesar $2 untuk setiap video yang Anda sewa.
kemiringan negatif menunjukkan Nilai a dalam persamaan umum disebut perpotongan Y karena menentukan nilai Y ketika X 5 0. (Pada
bahwa Y menurun ketika X meningkat
grafik, nilai a mengidentifikasi titik di mana garis memotong sumbu Y.) Untuk video menyimpan contoh,
ditingkatkan.
a 5 5; ada biaya keanggotaan $5 bahkan jika Anda tidak pernah menyewa video.
BAGIAN 14.6 / Pengantar Persamaan Linier dan Regresi 483
Gambar 14.14 menunjukkan hubungan umum antara biaya tahunan dan jumlah video
untuk contoh toko video. Perhatikan bahwa hubungan menghasilkan garis lurus. Untuk
mendapatkan grafik ini, kami mengambil dua nilai X dan kemudian menggunakan
persamaan untuk menghitung nilai yang sesuai untuk Y. Sebagai contoh,
Kapan X 5 3: Kapan X 5 8:
Y 5 bX 1 a Y 5 bX 1 a
5 $2(3) 1 $5 5 $2(8) 1 $5 5 $6 1
$5 5 $16 1 $5
5 $11 5 $21
Saat menggambar grafik Selanjutnya, kedua titik ini diplot pada grafik: satu titik di X 5 3 dan Y 5 11, titik lainnya di
persamaan linier, sebaiknya X 5 8 dan Y 5 21. Karena dua titik sepenuhnya menentukan garis lurus, kita cukup
hitung dan gambarkan
menggambar garis tersebut sehingga melewati dua titik ini.
setidaknya tiga titik untuk
memastikan bahwa Anda tidak membuat kesalahan.
Gambar 14.14
25
Hubungan antara biaya
total dan jumlah 24
video disewa setiap bulan. 23
Toko video mengenakan
22
biaya keanggotaan bulanan
$5 dan $2 untuk setiap video 21
atau game yang disewa. 20
Hubungan tersebut dijelaskan 19
dengan persamaan linear,
18
Y 5 2X 15, dimana Y
adalah total biaya dan X 17
adalah jumlah video. 16
15
Jumlah
biaya
(Y)
14
13
12
11
10
9
8
7
6
55
0 1 2 3 4 5 6789 10
Jumlah Video yang Disewa (X)
484 BAB 14 korelasi
Belajar C hec k 1. Gym lokal mengenakan biaya keanggotaan bulanan $25 ditambah $2 per jam untuk kelas aerobik. Apa
persamaan linier yang menggambarkan hubungan antara total biaya bulanan (Y) dan jumlah jam
pelajaran setiap bulan (X)?
2. Untuk persamaan linier, Y 5 23X 1 7, apa yang terjadi dengan nilai Y setiap kali X bertambah 1 poin?
3. Gunakan persamaan linier Y 5 2X 2 7 untuk menentukan nilai Y untuk setiap nilai X berikut: 1, 3, 5,
10.
4. Jika konstanta kemiringan (b) dalam persamaan linier adalah positif, maka grafik dari persamaan tersebut
adalah garis miring dari kiri bawah ke kanan atas. (Benar atau salah?)
Jawaban 1. Y 5 2X 1 25
2. Kemiringannya adalah 23, jadi Y berkurang 3 poin setiap kali X bertambah 1 poin.
3.
XY
1 –5
3 –1
5 3
10 13
4. Benar. Kemiringan positif menunjukkan bahwa Y meningkat (naik dalam grafik) ketika X meningkat
(pergi ke kanan dalam grafik).
Regresi Karena garis lurus bisa sangat berguna untuk menggambarkan hubungan antara dua variabel, teknik statistik
telah dikembangkan yang menyediakan metode standar untuk menentukan garis lurus yang paling pas untuk
kumpulan data apa pun. Prosedur statistiknya adalah regresi, dan garis lurus yang dihasilkan disebut garis
regresi.
Definisi
Teknik statistik untuk menemukan garis lurus yang paling pas untuk sekumpulan data disebut
regresi, dan garis lurus yang dihasilkan disebut garis regresi.
Tujuan regresi adalah menemukan garis lurus yang paling pas untuk sekumpulan data. Namun, untuk
mencapai tujuan ini, pertama-tama perlu untuk mendefinisikan dengan tepat apa yang dimaksud dengan
"paling cocok". Untuk kumpulan data tertentu, dimungkinkan untuk menggambar banyak garis lurus berbeda
yang semuanya tampak melewati pusat titik data. Masing-masing garis ini dapat didefinisikan dengan
persamaan linier dalam bentuk Y 5 bX 1 a di mana b dan a adalah konstanta yang masing-masing
menentukan kemiringan dan perpotongan Y dari garis tersebut. Setiap garis individu memiliki nilai uniknya
sendiri untuk b dan a. Masalahnya adalah untuk menemukan garis spesifik yang paling sesuai dengan titik
data aktual.
Kuadrat Terkecil Untuk menentukan seberapa cocok garis dengan titik data, langkah pertama adalah menentukan secara
Larutan matematis jarak antara garis dan setiap titik data. Untuk setiap nilai X dalam data, persamaan linier
menentukan nilai Y pada garis. Nilai ini adalah prediksi Y dan disebut Yˆ (“Y hat”).
Jarak antara nilai prediksi ini dan nilai Y aktual dalam data ditentukan oleh
jarak 5 Y 2 Yˆ
Perhatikan bahwa kita hanya mengukur jarak vertikal antara titik data aktual (Y) dan titik prediksi
pada garis. Jarak ini mengukur kesalahan antara garis dan data aktual (Gambar 14.15).
Karena beberapa jarak ini positif dan beberapa negatif, langkah selanjutnya adalah
mengkuadratkan setiap jarak untuk mendapatkan ukuran kesalahan positif yang seragam. Terakhir,
untuk menentukan kesalahan total antara garis dan data, kami menambahkan kesalahan kuadrat
untuk semua titik data. Hasilnya adalah ukuran kesalahan kuadrat keseluruhan antara garis dan data:
kesalahan kuadrat total 5 o(Y 2 Yˆ) 2
Sekarang kita dapat mendefinisikan garis yang paling pas sebagai garis yang memiliki kesalahan
kuadrat total terkecil. Untuk alasan yang jelas, garis yang dihasilkan biasanya disebut solusi
kesalahan kuadrat terkecil. Dalam simbol, kami mencari persamaan linear dari bentuk tersebut
Yˆ 5 bX 1 a
Untuk setiap nilai X dalam data, persamaan ini menentukan titik pada garis (Yˆ) yang memberikan
prediksi terbaik untuk Y. Masalahnya adalah menemukan nilai spesifik untuk a dan b yang
menjadikannya garis yang paling pas.
Perhitungan yang diperlukan untuk menemukan persamaan ini membutuhkan kalkulus dan
beberapa aljabar yang canggih, jadi kami tidak menyajikan detail penyelesaiannya. Hasilnya,
bagaimanapun, relatif mudah, dan solusi untuk b dan a adalah sebagai berikut:
SP
B 5
(14.11)
SSX
di mana SP adalah jumlah produk dan SSX adalah jumlah kuadrat untuk skor X.
Rumus alternatif yang biasa digunakan untuk kemiringan didasarkan pada standar deviasi untuk
X dan Y. Rumus alternatifnya adalah
s
y
B 5r (14.12)
S
X
Gambar 14.15
Jarak antara
Yˆ = bX + A
titik data aktual (Y) dan
titik prediksi pada garis
(Yˆ) didefinisikan
sebagai Y 2 Yˆ. Jarak = Y – Yˆ
Tujuan regresi adalah
menemukan persamaan
garis yang meminimalkan jarak tersebut. Nilai
Y
X, Y
titik data
X Nilai
486 BAB 14 korelasi
di mana sY adalah standar deviasi untuk skor Y , sX adalah standar deviasi untuk skor X , dan
r adalah korelasi Pearson untuk X dan Y. Nilai konstanta a dalam persamaan ditentukan oleh
a 5 SAYA 2 bMX (14.13)
Perhatikan bahwa rumus ini menentukan persamaan linier yang memberikan predik terbaik
tion nilai Y. Persamaan ini disebut persamaan regresi untuk Y.
Definisi
Persamaan regresi untuk Y adalah persamaan linier.
Yˆ 5 bX 1 a (14.14)
dimana konstanta b ditentukan dengan Persamaan 14.11, atau 14.12 dan konstanta a
ditentukan dengan Persamaan 14.13. Persamaan ini menghasilkan kesalahan
kuadrat terkecil antara titik data dan garis.
Contoh 14.13 Skor pada tabel berikut digunakan untuk menunjukkan perhitungan dan penggunaan persamaan
regresi untuk memprediksi Y.
XY 2 2
X- MX Y – SAYA (X – MX) (Y – MX) (X – MX) (Y – SAYA)
5 10 1 3 1 9 3
1 4 –3 –3 9 9 9
4 5 0 –2 0 4 0
7 11 3 4 9 16 12
6 15 2 8 4 64 16
4 6 0 –1 0 1 0
3 5 –1 –2 1 4 2
2 0 –2 –7 4 49 14
SSX 5 28 SSY 5 156 SP5 56
Untuk data ini, oX 5 32, jadi MX 5 4. Juga, oY 5 56, jadi MY 5 7. Nilai ini telah digunakan
untuk menghitung skor deviasi untuk setiap nilai X dan Y. Tiga kolom terakhir menunjukkan
deviasi kuadrat untuk X dan untuk Y, dan hasil kali deviasi
skor.
Tujuan kita adalah mencari nilai b dan a dalam persamaan regresi. Menggunakan
Persamaan 14.11 dan 14.13, solusi untuk b dan a adalah
SP 56
B 555 2
SSX 28
a 5 SAYA 2 bMX 5 7 2 2(4) 5 21
Persamaan yang dihasilkan adalah
Yˆ 5 2X 2 1
Data asli dan garis regresi ditunjukkan pada Gambar 14.16.
Gambar 14.16
Y 15
Poin data X dan Y dan 14
garis regresi untuk n 5 8 Yˆ = –X12
13
pasang nilai pada Contoh
14.13. 12
11
10
9
8
M=7 7
tahun
6
5
4
3
2
1
0
12345678 X
M X =4
Garis regresi yang ditunjukkan pada Gambar 14.16 menunjukkan beberapa fakta sederhana
dan sangat dapat diprediksi tentang regresi. Pertama, perhitungan perpotongan Y (Persamaan
14.13) memastikan bahwa garis regresi melewati titik yang ditentukan oleh rata-rata untuk X dan
rata-rata untuk Y. Artinya, titik yang diidentifikasi oleh koordinat MX, MY akan selalu aktif garis.
Kami telah menyertakan dua rata-rata pada Gambar 14.16 untuk menunjukkan bahwa titik yang
mereka definisikan berada di garis regresi. Kedua, tanda korelasi (1 atau –) sama dengan tanda
kemiringan garis regresi. Khususnya, jika korelasinya positif, maka kemiringannya juga positif
dan garis regresinya miring ke kanan. Sebaliknya, jika korelasinya negatif, maka kemiringannya
negatif dan garisnya miring ke bawah ke kanan. Korelasi nol berarti kemiringannya juga nol dan
persamaan regresi menghasilkan garis horizontal yang melewati data pada tingkat yang sama
dengan rata-rata nilai Y. Perhatikan bahwa garis regresi pada Gambar 14.16 memiliki kemiringan
positif.
Salah satu akibat dari fakta ini adalah bahwa semua titik pada garis yang berada di atas rata-rata
X juga berada di atas rata-rata Y. Demikian pula, semua titik di bawah rata-rata X juga berada di
bawah rata-rata Y. Jadi, setiap individu dengan deviasi positif untuk X diprediksi memiliki deviasi
positif untuk Y, dan setiap orang dengan deviasi negatif untuk X diprediksi memiliki deviasi negatif
untuk Y.
Menggunakan Seperti yang kami catat di awal bagian ini, salah satu penggunaan persamaan regresi yang
Persamaan Regresi untuk umum adalah untuk prediksi. Untuk setiap nilai X tertentu, kita dapat menggunakan persamaan
Prediksi untuk menghitung nilai prediksi Y. Untuk persamaan dari Contoh 14.13, seorang individu dengan
skor X 5 3 akan diprediksi memiliki skor Y sebesar
Yˆ 5 2X 2 1 5 6 2 1 5 5
488 BAB 14 korelasi
Meskipun persamaan regresi dapat digunakan untuk prediksi, beberapa peringatan harus diperhatikan
dipertimbangkan setiap kali Anda menginterpretasikan nilai prediksi:
1. Nilai prediksi tidak sempurna (kecuali r 5 11.00 atau 21.00). Jika Anda memeriksa Gambar 14.16,
harus jelas bahwa titik data tidak pas di garis. Secara umum, ada beberapa kesalahan antara
nilai Y yang diprediksi (on the line) dan data sebenarnya. Meskipun jumlah kesalahan bervariasi
dari titik ke titik, rata-rata kesalahan berhubungan langsung dengan besarnya korelasi.
Dengan korelasi mendekati 1.00 (atau 21.00), titik-titik data umumnya mengelompok mendekati
garis dan kesalahannya kecil. Saat korelasi semakin mendekati nol, titik-titik menjauh dari garis
dan besarnya kesalahan meningkat.
2. Persamaan regresi tidak boleh digunakan untuk membuat prediksi nilai X yang berada di luar
rentang nilai yang dicakup oleh data asli. Untuk Contoh 14.13, nilai X berkisar dari X 5 1 sampai
X 5 7, dan persamaan regresi dihitung sebagai garis paling pas dalam rentang ini. Karena Anda
tidak memiliki informasi tentang hubungan XY di luar rentang ini, persamaan tidak boleh
digunakan untuk memprediksi Y untuk nilai X yang lebih rendah dari 1 atau lebih besar dari 7.
Formulir Standar Sejauh ini, kami telah menyajikan persamaan regresi dalam bentuk nilai asli, atau skor mentah, untuk X
dari Regresi dan Y. Kadang-kadang, bagaimanapun, para peneliti menstandarkan skor dengan mengubah nilai X dan
Persamaan Y menjadi skor-z sebelum menemukan persamaan regresi.
Persamaan yang dihasilkan sering disebut bentuk standar dari persamaan regresi dan sangat
disederhanakan dibandingkan dengan versi skor mentah. Penyederhanaan berasal dari fakta bahwa skor-
z memiliki karakteristik standar. Secara khusus, rata-rata untuk sekumpulan skor-z selalu nol dan standar
deviasi selalu 1. Akibatnya, bentuk standar persamaan regresi menjadi
^
zY 5 (beta) z X (14.15)
Perhatikan pertama bahwa kita sekarang menggunakan skor-z untuk setiap X (zX) untuk memprediksi
skor-z untuk Y (zY ) yang sesuai . Perhatikan juga bahwa konstanta kemiringan yang diidentifikasi sebagai
b dalam rumus skor mentah sekarang diidentifikasi sebagai beta. Karena kedua himpunan skor-z memiliki
rata-rata nol, konstanta a menghilang dari persamaan regresi. Terakhir, ketika satu variabel, X, digunakan
untuk memprediksi variabel kedua, Y, nilai beta sama dengan korelasi Pearson untuk X dan Y. Dengan
demikian, bentuk standar persamaan regresi juga dapat ditulis sebagai
^
zY 5 rzX
(14.16)
Karena proses mengubah semua skor asli menjadi skor-z bisa membosankan, peneliti biasanya
menghitung versi skor-mentah dari persamaan regresi (Persamaan 14.14) alih-alih bentuk standar.
Namun, sebagian besar program komputer melaporkan nilai beta sebagai bagian dari output dari regresi
linier, dan Anda harus memahami apa yang diwakili oleh nilai ini.
Belajar C hec k 1. Buatlah sketsa plot pencar untuk data berikut—yaitu, grafik yang menunjukkan data X, Y
poin:
XY
4 13 2
5 5 12
16
A. Temukan persamaan regresi untuk memprediksi Y dari X. Gambarkan garis ini pada Anda
grafik. Apakah itu terlihat seperti garis yang paling pas?
B. Gunakan persamaan regresi untuk menemukan nilai prediksi Y yang sesuai dengan setiap X
dalam data.
Jawaban 1.a. SSX 5 10, SP 5 20, b 5 2, a 5 3. Persamaannya adalah Yˆ 5 2X 1 3.
B. Nilai Y yang diprediksi adalah 11, 7, 13, dan 5.
Kesalahan Standar Dimungkinkan untuk menentukan persamaan regresi untuk kumpulan data apa pun hanya dengan
Estimasi menggunakan rumus yang sudah disajikan. Persamaan linier yang Anda peroleh kemudian digunakan
untuk menghasilkan nilai prediksi Y untuk setiap nilai X yang diketahui. Namun, harus jelas bahwa
keakuratan prediksi ini bergantung pada seberapa baik titik pada garis sesuai dengan titik data aktual—
bahwa adalah, jumlah kesalahan antara nilai prediksi, Yˆ, dan skor sebenarnya, nilai Y. Gambar 14.17
menunjukkan dua kumpulan data berbeda yang memiliki persamaan regresi yang persis sama. Dalam satu
kasus, terdapat korelasi sempurna (r 5 11) antara X dan Y, sehingga persamaan linier cocok dengan data
secara sempurna. Untuk kumpulan data kedua, nilai Y yang diprediksi pada garis hanya mendekati titik data
sebenarnya.
Persamaan regresi, dengan sendirinya, memungkinkan Anda membuat prediksi, tetapi tidak memberikan
informasi apa pun tentang keakuratan prediksi. Untuk memastikan ketepatan regresi, biasanya menghitung
kesalahan standar estimasi.
Definisi
Kesalahan standar perkiraan memberikan ukuran jarak standar antara nilai Y yang diprediksi pada
garis regresi dan nilai Y aktual dalam data.
Secara konseptual, kesalahan standar perkiraan sangat mirip dengan standar deviasi: Keduanya
memberikan ukuran jarak standar. Juga, perhitungan kesalahan standar perkiraan sangat mirip dengan
perhitungan standar deviasi.
Untuk menghitung kesalahan standar perkiraan, pertama-tama kita menemukan jumlah deviasi kuadrat
(SS). Setiap deviasi mengukur jarak antara nilai Y aktual (dari data) dan nilai Y prediksi (dari garis regresi).
Jumlah kuadrat ini biasa disebut SSresidual karena didasarkan pada sisa jarak antara skor Y aktual dan
nilai prediksi pada garis.
SSresidual 5 o(Y 2 Yˆ) 2 (14.17)
Nilai SS yang diperoleh kemudian dibagi dengan derajat kebebasannya untuk mendapatkan ukuran
varians. Prosedur ini harus sangat familiar:
SS
Varians 5 df
Derajat kebebasan untuk kesalahan standar estimasi adalah df 5 n – 2. Alasan untuk memiliki n – 2
derajat kebebasan, daripada n – 1 biasa, adalah bahwa kita sekarang mengukur penyimpangan dari garis
daripada penyimpangan dari rata-rata. Untuk menemukan persamaan garis regresi, Anda harus mengetahui
rata-rata untuk skor X dan Y.
Menentukan kedua rata-rata ini menempatkan dua batasan pada variabilitas data, dengan hasil bahwa skor
hanya memiliki n – 2 derajat kebebasan. (Catatan: df 5 n – 2 untuk SSresidual sama dengan df 5 n – 2 yang
kami temui saat menguji signifikansi korelasi Pearson di halaman 466.)
490 BAB 14 korelasi
Ingatlah bahwa varian mengukur jarak Langkah terakhir dalam perhitungan kesalahan standar estimasi adalah mengambil kuadrat
kuadrat rata-rata. akar varians untuk mendapatkan ukuran jarak standar. Persamaan terakhir adalah
^ 2
SSsisa o(YY ) n 2
2
kesalahan baku estimasi 5 5

(14.18)
2
df
Contoh berikut menunjukkan perhitungan kesalahan standar ini.
Gambar 14.17 Y 15
(a) Plot pencar yang 14
Yˆ = –X12
menunjukkan titik data yang 13
sangat sesuai dengan garis
regresi yang ditentukan oleh persamaan Yˆ 5 2X – 1.
12
Perhatikan bahwa korelasinya adalah 11
r 5 11.00. (b) Plot pencar
10
untuk data pada Contoh 14.13.
Perhatikan bahwa ada 9
kesalahan antara data sebenarnya 8
poin dan nilai Y yang diprediksi
7
pada garis regresi.
6
5
4
3
2
1
0
1 2345678 (a) X
Y 15
14
Yˆ = –X12
13
12
11
10
9
8
7
6
5
4
3
2
1
0
1 2345678 X
(B)
Contoh 14.14 Data yang sama yang digunakan dalam Contoh 14.13 digunakan di sini untuk
mendemonstrasikan perhitungan kesalahan standar estimasi. Data ini memiliki persamaan regresi
Yˆ 5 2X 2 1
Dengan menggunakan persamaan regresi ini, kami telah menghitung nilai prediksi Y ,
residual, dan kuadrat residual untuk setiap individu, dengan menggunakan data dari Contoh 14.13.
Data Nilai Y yang diprediksi Sisa Kuadrat Residu

X Y Yˆ 5 2X 2 1 Y 2 Yˆ (Y 2 Yˆ) 2
5 10 9 1 1
1 4 1 3 9
4 5 7 22 4
7 11 13 22 4
6 15 11 4 16
4 6 7 21 1
3 5 5 0 0
2 0 3 23 9
0
Residual 5 44
Perhatikan pertama bahwa jumlah residu sama dengan nol. Dengan kata lain, jumlah jarak
di atas garis sama dengan jumlah jarak di bawah garis. Ini berlaku untuk kumpulan data apa
pun dan menyediakan cara untuk memeriksa keakuratan perhitungan Anda. Residual kuadrat
terdaftar di kolom terakhir. Untuk data tersebut, jumlah kuadrat residualnya adalah SSresidual
5 244. Dengan n 5 8, data tersebut memiliki df 5 n – 2 5 6, jadi standarnya
kesalahan estimasi adalah
SSresidual 44
52 708 .
df 6
Ingat: Kesalahan standar perkiraan memberikan ukuran seberapa akurat persamaan regresi
memprediksi nilai Y. Dalam hal ini, jarak baku antara titik data aktual dan garis regresi diukur
dengan galat baku estimasi 5 2,708.
Hubungan Harus jelas dari Contoh 14.14 bahwa kesalahan standar perkiraan berhubungan langsung
Diantara dengan besarnya korelasi antara X dan Y. Jika korelasi mendekati 1,00 (atau –1,00), maka
Galat Standar dan Korelasi titik data dikelompokkan dekat dengan garis , dan kesalahan standar estimasi kecil. Ketika
korelasi semakin mendekati nol, titik-titik data menjadi lebih tersebar luas, garis memberikan
prediksi yang kurang akurat, dan kesalahan standar estimasi menjadi lebih besar.
Sebelumnya (hal. 462), kami mengamati bahwa mengkuadratkan korelasi memberikan

ukuran akurasi prediksi. Korelasi kuadrat, r2 disebut koefisien determinasi
, karena menentukan
berapa proporsi variabilitas dalam Y yang diprediksi oleh hubungan dengan X. Karena r2
mengukur bagian variabilitas yang diprediksi dalam skor Y , kita dapat menggunakan ekspresi
(1 – r2 ) untuk mengukur bagian yang tidak terduga. Dengan demikian,
492 BAB 14 korelasi
prediksi variabilitas 5 S regresi 5 r2 SSY (14.19)
variabilitas tak terduga 5 SSresidual 5 (1 – r2 )SSY (14.20)
Misalnya, jika r 5 0,80, maka variabilitas yang diprediksi adalah r 2 5 0,64 (atau 64%) dari total
variabilitas untuk skor Y dan sisanya 36% (1 – r2 ) adalah variabilitas yang tidak dapat diprediksi.
Perhatikan bahwa ketika r 5 1,00, prediksi sempurna dan tidak ada residu.
Saat korelasi mendekati nol, titik data bergerak lebih jauh dari garis dan residu tumbuh lebih besar.
Menggunakan Persamaan 14.20 untuk menghitung sisa SS, kesalahan standar estimasi dapat dihitung
sebagai
2
(1 ) r SS2Y
2
SSresidual
df N 2
(14.21)
Karena biasanya lebih mudah untuk menghitung korelasi Pearson daripada menghitung nilai individu
(Y – Yˆ)2 , Persamaan 14.20 biasanya merupakan cara termudah untuk menghitung residu SS, dan
Persamaan 14.21 biasanya merupakan cara termudah untuk menghitung kesalahan standar estimasi.
untuk persamaan regresi. Contoh berikut mendemonstrasikan formula baru ini.
Contoh 14.15 Kami menggunakan data yang sama yang digunakan dalam Contoh 14.13 dan 14.14, yang menghasilkan
SSX 5 28, SSY 5 156, dan SP 5 56. Untuk data ini, korelasi Pearson adalah
56 56
r5 5
5 0,847
28(156) 66.09
Dengan SSY 5 156 dan korelasi r 5 0,847, prediksi variabilitas dari

persamaan regresi adalah
SSregresi 5 r2 SSY 5 (0,8472 )(156) 5 0,718(156) 5 112,01
Demikian pula, variabilitas tak terduga adalah
Residual 5 (1 2 r2 )SSY 5 (1 2 0,8472 )(156) 5 0,282(156) 5 43,99
Perhatikan bahwa rumus baru untuk Residual SS menghasilkan nilai yang sama, di dalam kesalahan
pembulatan, yang kita peroleh dengan menjumlahkan residu kuadrat pada Contoh 14.14. Perhatikan
juga bahwa rumus baru ini umumnya lebih mudah digunakan karena hanya memerlukan nilai korelasi
(r) dan SS untuk Y. Poin utama dari contoh ini, bagaimanapun, adalah bahwa SSresidual dan galat
standar estimasi terkait erat dengan nilai korelasi. Dengan korelasi yang besar (mendekati 11.00 atau
21.00), titik data mendekati garis regresi, dan kesalahan baku estimasi kecil. Saat korelasi semakin
kecil (mendekati nol), titik data menjauh dari garis regresi, dan kesalahan standar estimasi semakin
besar.
Karena dimungkinkan untuk memiliki persamaan regresi yang sama untuk beberapa kumpulan data
yang berbeda, penting juga untuk mempertimbangkan r2 dan kesalahan baku estimasi. Persamaan
regresi hanya menggambarkan garis yang paling pas dan digunakan untuk membuat prediksi. Namun,
r2 dan kesalahan standar perkiraan menunjukkan seberapa akurat prediksi ini.
Belajar C hec k 1. Jelaskan apa yang diukur dengan standard error estimasi untuk persamaan regresi.
2. Ketika nilai numerik dari suatu korelasi meningkat, apa yang terjadi pada kesalahan
standar estimasi?
3. Sampel n 5 6 pasang skor X dan Y menghasilkan korelasi r 5 0,80 dan SSY 5 100.
Berapa standar kesalahan estimasi untuk persamaan regresi?
Jawaban 1. Kesalahan baku perkiraan mengukur rata-rata, atau standar, jarak antara nilai Y yang diprediksi pada
garis regresi dan nilai Y sebenarnya dalam data.
2. Korelasi yang lebih besar berarti titik-titik data mengelompok lebih dekat ke garis, yang
berarti kesalahan standar estimasi lebih kecil.
36
3. Kesalahan baku estimasi 5 5 3.
4
Analisis dari Seperti yang kita catat sebelumnya di bab ini, korelasi sampel diharapkan mewakili korelasi
Regresi: Menguji Signifikansi populasinya. Misalnya, jika korelasi populasi adalah nol, maka korelasi sampel diharapkan
Regresi mendekati nol. Perhatikan bahwa kami tidak mengharapkan korelasi sampel persis sama
dengan nol. Ini adalah konsep umum kesalahan pengambilan sampel yang diperkenalkan
Persamaan di Bab 1 (hal. 8). Prinsip kesalahan sampling adalah bahwa biasanya ada perbedaan
atau kesalahan antara nilai yang diperoleh untuk statistik sampel dan parameter populasi
yang sesuai. Jadi, ketika tidak ada hubungan apapun dalam populasi, korelasi r 5 0, Anda
masih mungkin mendapatkan nilai bukan nol untuk korelasi sampel. Namun, dalam situasi
ini, korelasi sampel disebabkan oleh kebetulan dan uji hipotesis biasanya menunjukkan
bahwa korelasi tersebut tidak signifikan.
Setiap kali Anda mendapatkan nilai bukan nol untuk korelasi sampel, Anda juga
mendapatkan nilai numerik nyata untuk persamaan regresi. Namun, jika tidak ada
hubungan nyata dalam populasi, baik korelasi sampel maupun persamaan regresi tidak
ada artinya—mereka hanyalah hasil dari kesalahan pengambilan sampel dan tidak boleh
dilihat sebagai indikasi adanya hubungan antara X dan Y. Dalam dengan cara yang sama
kita menguji signifikansi korelasi Pearson, kita dapat menguji signifikansi persamaan
regresi. Faktanya, ketika satu variabel, X, digunakan untuk memprediksi satu variabel, Y,
kedua tes tersebut setara. Dalam setiap kasus, tujuan pengujian adalah untuk menentukan
apakah korelasi sampel mewakili hubungan nyata atau hanya hasil dari kesalahan
pengambilan sampel. Untuk kedua pengujian tersebut, hipotesis nol menyatakan bahwa
tidak ada hubungan antara kedua variabel dalam populasi. Untuk korelasi,
H0 : korelasi populasi adalah r 5 0
Untuk persamaan regresi,
H0 : kemiringan persamaan regresi (b atau beta) adalah nol
Proses pengujian signifikansi persamaan regresi disebut analisis regresi dan sangat
mirip dengan analisis varians (ANOVA) yang disajikan pada Bab 12. Seperti ANOVA,
analisis regresi menggunakan rasio-F untuk menentukan apakah varians diprediksi dengan
persamaan regresi secara signifikan lebih besar dari yang diharapkan jika tidak ada
hubungan antara X dan Y. Rasio-F adalah rasio dari dua varians, atau nilai rata-rata
kuadrat (MS) , dan setiap varians diperoleh dengan membagi nilai SS dengan derajat
kebebasan yang sesuai. Pembilang rasio-F adalah MSregresi, yang merupakan varian
skor Y yang diprediksi oleh persamaan regresi. Varians ini mengukur perubahan
sistematis dalam Y yang terjadi ketika nilai X
494 BAB 14 korelasi
bertambah atau berkurang. Penyebutnya adalah MSresidual, yang merupakan varian tak terduga
dalam skor Y. Varians ini mengukur perubahan dalam Y yang tidak bergantung pada perubahan
dalam X. Dua nilai MS didefinisikan sebagai
regresi SS SS sisa
5
regresi MS dengan df 5 1 dan MS 5residu dengan df n 5 22
df regresi df resi ganda
Rasio -F adalah
Regresi MS
F 5
dengan 5 df 1, n2 2
MS (14.22)
sisa
Analisis lengkap SS dan derajat kebebasan digambarkan pada Gambar 14.18.

Analisis prosedur regresi ditunjukkan dalam contoh berikut, menggunakan data yang sama yang
kami gunakan dalam Contoh 14.13, 14.14, dan 14.15.
Contoh 14.16 Data terdiri dari n 5 8 pasang skor dengan korelasi r 5 0,847 dan SSY 5 156.
Hipotesis nol menyatakan bahwa tidak ada hubungan antara X dan Y dalam populasi, atau bahwa
persamaan regresi tidak memperhitungkan porsi signifikan dari varian skor Y. Rasio -F untuk
analisis regresi memiliki df 5 1, n 2 2.
Untuk data ini, df 5 1, 6. Dengan 5 ,05, nilai kritisnya adalah 5,99.
Seperti disebutkan pada bagian sebelumnya, SS untuk skor Y dapat dipisahkan menjadi dua
komponen: bagian yang diprediksi sesuai dengan r2 dan bagian yang tidak diprediksi, atau residual,
sesuai dengan (1 2 r2 ). Dengan r 5 0,847, kami memperoleh r 2 5 0,718 dan
prediksi variabilitas 5 SSregresi 5 0,718(156) 5 112,01
variabilitas tak terduga 5 Residual 5 (1 2 0,718)(156) 5 0,282(156) 5 43,99
Dengan menggunakan nilai SS ini dan nilai df yang sesuai , kami menghitung varians, atau MS,
untuk setiap komponen. Untuk data ini nilai MS adalah
regresi SS 112,01
5 5
5 112,01
regresi MS
df regresi 1
sisa SS 43.99
residu MS
5 5
5 7.33
df sisa 6
SSY dfY n 1
SSregresi r SSresidual dfregresi 1 dfresidual n 2

2SSY (1 r 2)SSY
Gambar 14.18
Partisi SS dan df untuk analisis regresi. Variabilitas dalam skor Y asli (baik SSY dan dfY ) dipartisi menjadi dua
komponen: (1) variabilitas yang dijelaskan oleh persamaan regresi, dan (2) variabilitas residual.
Terakhir, rasio-F untuk mengevaluasi signifikansi persamaan regresi adalah
regresi MS 112.01 5
F 5 5
15.28
residu MS 7.33
Rasio -F berada di wilayah kritis, jadi kami menolak hipotesis nol dan menyimpulkan bahwa persamaan
regresi tidak memperhitungkan porsi varians yang signifikan untuk skor Y. Analisis regresi lengkap
diringkas dalam Tabel 14.5 yang merupakan format umum untuk hasil cetak komputer analisis regresi.
Signifikansi dari Dalam situasi dengan satu variabel X dan satu variabel Y , menguji signifikansi persamaan regresi setara
Regresi dan dengan menguji signifikansi korelasi Pearson. Oleh karena itu, setiap kali korelasi antara dua variabel
Signifikansi dari signifikan, Anda dapat menyimpulkan bahwa persamaan regresi juga signifikan. Begitu pula jika suatu
Korelasi korelasi tidak signifikan, maka persamaan regresinya juga tidak signifikan. Di awal bab (hal. 466), kami
memperkenalkan uji hipotesis menggunakan statistik t berikut untuk mengevaluasi signifikansi korelasi.
r 2r
t5
2r)
2
(1
(N
2
2)
Kami sekarang menunjukkan bahwa statistik t ini setara dengan rasio-F yang digunakan untuk analisis
2
regresi. Secara khusus, kedua uji statistik tersebut dihubungkan dengan persamaan dasar F 5 t yang
diperkenalkan pada Bab 12 dan 13 (hal. 397 dan 407). Ingatlah bahwa statistik t dengan df 5 n 2 1 dapat
dikuadratkan untuk menghasilkan rasio-F yang ekuivalen dengan df 5 1, n 2 1.
Kami memulai demonstrasi kesetaraan dengan menghilangkan korelasi populasi, r, dari persamaan t .
Nilai ini selalu nol, sebagaimana ditentukan oleh hipotesis nol, dan penghapusannya tidak mempengaruhi
persamaan. Selanjutnya, kita kuadratkan statistik t untuk menghasilkan rasio-F yang sesuai.
2r
2t 55 F
2r)
2
(1
(N
2
2)
Terakhir, kalikan pembilang dan penyebutnya dengan SSY untuk menghasilkan
2
55 F ( r SS Y )
2t
2
2
(1 ( r SS
) 2) Y )
(N 2
Anda harus mengenali pembilang rasio-F yang baru sebagai regresi SS (lihat Persamaan 14.19).
Membagi dengan df 5 1, yang tidak mengubah nilai, menghasilkan MSregression. Demikian pula,
Tabel 14.5 Sumber SS df MS F

Tabel ringkasan yang
Regresi 112.01 1 112.01 15.28
menunjukkan hasil analisis
regresi pada Contoh 14.16. Sisa 43.99 6 7.33
Total 156.00 7
496 BAB 14 korelasi
penyebut rasio-F adalah SSresidual (lihat Persamaan 14.20) dibagi dengan df 5 n – 2, yaitu
MSresidual. Dengan demikian, nilai t kuadrat identik dengan rasio-F yang digunakan dalam
analisis regresi (Persamaan 14.22) untuk mengevaluasi signifikansi persamaan regresi.
Belajar C hec k 1. Seperangkat skor n 5 18 pasang menghasilkan korelasi Pearson r 5 0,60 dengan SSY 5
100. Temukan SSregresi dan SSresidual dan hitung rasio-F untuk mengevaluasi
signifikansi persamaan regresi dalam memprediksi Y.
Menjawab
1. SSregresi 5 36 dengan df 5 1. SSresidual 5 64 dengan df 5 16. F 5 9.00. Dengan df 5 1, 16, itu
Rasio-F signifikan dengan 5 ,05 atau 5 ,01.
Ringkasan
1. Korelasi mengukur hubungan antara dua variabel, X dan Y. 5. Korelasi sampel, r, dapat digunakan untuk mengevaluasi
Hubungan tersebut dijelaskan oleh tiga karakteristik: signifikansi korelasi populasi yang sesuai, r, menggunakan
statistik t dengan df 5 n 2 2.
A. Arah. Tanda korelasi (1 atau 2) menentukan arah. B.
r 2r
Membentuk. Korelasi t5
Pearson mengukur tingkat hubungan garis lurus, tetapi korelasi 2r)
2
(1
lain mengukur konsistensi atau kekuatan hubungan, (N
2
2)
terlepas dari bentuk spesifik apa pun. C. Kekuatan atau
konsistensi. Nilai numerik dari
6. Korelasi parsial mengukur hubungan linier antara dua variabel
dengan menghilangkan pengaruh variabel ketiga dengan
korelasi mengukur kekuatan atau konsistensi hubungan
mempertahankannya konstan.
dari 0 (tidak konsisten) sampai 1,00 (sempurna).
7. Korelasi Spearman (rS ) mengukur konsistensi arah dalam
2. Korelasi yang paling umum digunakan adalah korelasi
hubungan antara X dan Y—yaitu, tingkat hubungan satu arah,
Pearson, yang mengukur derajat hubungan linier. Korelasi
atau monoton. Korelasi Spearman dihitung dengan proses dua
Pearson diidentifikasi dengan huruf r dan dihitung dengan
tahap: a. Beri peringkat skor X dan skor Y secara terpisah. B.
Hitung korelasi
SP Pearson menggunakan peringkat.
5
R
SS SS
XY
8. Korelasi point-biserial digunakan untuk mengukur
Dalam rumus ini, SP adalah jumlah produk penyimpangan. kekuatan hubungan ketika salah satu dari dua variabel bersifat
dikotomis. Variabel dikotomis
dikodekan menggunakan nilai 0 dan 1, dan rumus reguler
rumus definisi: SP 5 o(X 2 MX)(Y 2 MY )
Pearson diterapkan. Mengkuadratkan korelasi biserial
titik menghasilkan nilai r2 yang sama yang diperoleh untuk
ooRumus
X
komputasi Y : SP XY 5 2 o mengukur ukuran efek untuk uji t tindakan independen .
N Ketika kedua variabel, X dan Y, bersifat dikotomis, koefisien
phi dapat digunakan untuk mengukur kekuatan hubungannya.
3. Korelasi antara dua variabel tidak boleh Kedua variabel diberi kode 0 dan 1, dan rumus Pearson
diartikan sebagai hubungan sebab akibat. Hanya karena X digunakan untuk menghitung korelasinya.
dan Y berhubungan tidak berarti bahwa X menyebabkan
Y atau Y menyebabkan X.
9. Ketika ada hubungan linier umum antara dua variabel, X
4. Untuk mengevaluasi kekuatan suatu hubungan, Anda dan Y, dimungkinkan untuk membuat persamaan linier
mengkuadratkan nilai korelasi. Nilai yang dihasilkan,, r2 disebut yang memungkinkan Anda memprediksi nilai Y yang sesuai
koefisien determinasi karena mengukur porsi variabilitas dengan nilai X yang diketahui.
dalam satu variabel yang dapat diprediksi menggunakan
hubungannya dengan variabel kedua. prediksi nilai Y 5 Yˆ 5 bX 1 a
Sumber daya 497
Teknik untuk menentukan persamaan ini disebut regresi. jarak standar (atau kesalahan) antara nilai Y yang diprediksi
Dengan menggunakan metode kuadrat-terkecil untuk pada garis dan titik data aktual. Kesalahan standar
meminimalkan kesalahan antara nilai Y yang diprediksi dan estimasi dihitung dengan
nilai Y yang sebenarnya , garis paling pas dicapai ketika
persamaan linier telah Residual
kesalahan standar estimasi 5
5 MSresidu
N
2
2
SP SY
B 55
R Dan sebuahY M bM
52
X
SSX SX Dimungkinkan juga untuk menghitung rasio-F untuk
mengevaluasi signifikansi persamaan regresi. Proses ini
10. Persamaan linier yang dihasilkan oleh regresi (disebut disebut analisis regresi dan menentukan apakah persamaan
persamaan regresi) dapat digunakan untuk menghitung tersebut memprediksi porsi varians yang signifikan untuk
nilai Y yang diprediksi untuk setiap nilai X. Namun, skor Y. Pertama, nilai varians, atau MS, dihitung untuk
prediksi tersebut tidak sempurna, sehingga untuk setiap variabilitas yang diprediksi dan variabilitas residual,
nilai Y , ada bagian yang diprediksi dan tak terduga, atau
sisa, bagian. Secara keseluruhan, bagian prediksi regresi SS SSsisa
5 5
regresi MS MSresidu
variabilitas skor Y diukur , dan bagian sisa df regresi df sisa
dengan r2 diukur dengan. 1 2 r2
di mana df regresi 5 1 dan df 5 n 22.

sisa
prediksi variabilitas 5 S regresi 5 r2 SSY
F 5
Regresi MS n 22
variabilitas tak terduga 5 SSresidual 5 (1 2 r2 )SSY dengan 5 df 1,
MS sisa
11. Variabilitas residual dapat digunakan untuk menghitung Rasio -F untuk analisis regresi setara dengan statistik t yang
kesalahan standar perkiraan, yang menyediakan ukuran mengevaluasi signifikansi korelasi.
Istilah Kunci
korelasi (450) korelasi parsial (463) regresi (484) garis

korelasi positif (451) korelasi Korelasi Spearman (472) regresi (484) solusi
negatif (451) korelasi hubungan linier (477) galat kuadrat terkecil (485) persamaan
sempurna (452) korelasi titik-biserial (478) variabel regresi untuk Y (486) galat standar
Korelasi Pearson (453) dikotomis (478) koefisien phi estimasi (489) variabilitas prediksi
jumlah produk (SP) (454) (480) persamaan linier (SSregresi) (492) variabilitas tak terduga
rentang terbatas (460) (482) kemiringan (482) (SSresidual) (492) analisis regresi (493)
koefisien determinasi (462) matriks
korelasi (467) Perpotongan Y (482)
Sumber daya
Buka CengageBrain.com untuk mengakses Psychology CourseMate, di mana Anda akan

menemukan eBuku interaktif, glosarium, kartu flash, kuis, lokakarya statistik, dan banyak lagi.
498 BAB 14 korelasi
Jika profesor Anda telah menugaskan
Applia: 1. Masuk ke akun Anda.

2. Selesaikan latihan yang sesuai seperti yang diminta oleh profesor Anda.
3. Setelah selesai, klik “Grade It Now” untuk melihat bidang mana yang sudah Anda kuasai, yang mana
area membutuhkan lebih banyak pekerjaan, dan penjelasan terperinci dari setiap jawaban.
Petunjuk umum penggunaan SPSS disajikan pada Lampiran D. Berikut adalah petunjuk terperinci
penggunaan SPSS untuk melakukan korelasi The Pearson, Spearman, point-biserial, dan
parsial. Catatan: Kami fokus pada korelasi Pearson dan kemudian menjelaskan bagaimana sedikit
modifikasi pada prosedur ini dapat dilakukan untuk menghitung korelasi Spearman, point-biserial,
dan parsial. Instruksi terpisah untuk koefisien phi disajikan di akhir bagian ini.
Entri Data
Data dimasukkan ke dalam dua kolom di editor data, satu untuk nilai X (VAR00001) dan satu untuk
nilai Y (VAR00002), dengan dua skor untuk setiap individu dalam baris yang sama.
Analisis data
1. Klik Analisis pada bilah alat, pilih Korelasi, dan klik Bivariat.
2. Satu per satu, pindahkan label untuk dua kolom data ke dalam kotak Variables .
(Sorot setiap label dan klik panah untuk memindahkannya ke dalam kotak.)
3. Kotak Pearson harus dicentang tetapi, pada titik ini, Anda dapat beralih ke
Korelasi Spearman dengan mengklik kotak yang sesuai.
4. Klik Oke.
Keluaran SPSS
Kami menggunakan SPSS untuk menghitung korelasi data pada Contoh 14.13, dan hasilnya
ditunjukkan pada Gambar 14.19. Program menghasilkan matriks korelasi yang menunjukkan
semua kemungkinan korelasi, termasuk korelasi X dengan X dan korelasi Y dengan Y (keduanya
adalah korelasi sempurna). Anda menginginkan korelasi X dan Y, yang terdapat di pojok kanan
atas (atau kiri bawah). Keluaran meliputi tingkat signifikansi ( nilai p atau tingkat alfa) untuk
korelasi.
Untuk menghitung korelasi parsial, klik Analisis pada bilah alat, pilih Korelasi, dan klik Parsial.
Pindahkan label kolom untuk dua variabel yang akan dikorelasikan ke dalam kotak Variables dan
pindahkan label kolom untuk variabel yang akan dipertahankan konstan ke dalam kotak Controlling
for dan klik OK.
Untuk menghitung korelasi Spearman , masukkan peringkat X dan Y atau skor X dan Y ke
dalam dua kolom pertama. Kemudian ikuti instruksi Analisis Data yang sama yang disajikan untuk
korelasi Pearson. Pada langkah 3 dalam instruksi, klik kotak Spearman sebelum OK terakhir.
(Catatan: Jika Anda memasukkan skor X dan Y ke dalam editor data, SPSS mengubah skor
menjadi peringkat sebelum menghitung korelasi Spearman.)
Sumber daya 499
Gambar 14.19 Korelasi

Output SPSS menunjukkan
korelasi untuk data
VAR00001 VAR00002
dalam Contoh 14.13.
VAR00001 Korelasi Pearson 1 .847
Sig. (2-ekor) .008
N 8 8
VAR00002 Korelasi Pearson .847** 1
Sig. (2-ekor) .008
N 8 8
**. Korelasi signifikan pada level 0,01 (2-tailed).
Untuk menghitung korelasi titik-biserial , masukkan skor ( nilai X) di kolom pertama dan
masukkan nilai numerik (biasanya 0 dan 1) untuk variabel dikotomis di kolom kedua. Kemudian,
ikuti instruksi Analisis Data yang sama yang disajikan untuk korelasi Pearson.
Koefisien phi juga dapat dihitung dengan memasukkan string lengkap 0 dan 1 ke dalam dua
kolom editor data SPSS, kemudian mengikuti instruksi Analisis Data yang sama yang disajikan
untuk korelasi Pearson. Namun, ini bisa membosankan, terutama dengan kumpulan skor yang
besar. Berikut ini adalah prosedur alternatif untuk menghitung koefisien phi dengan set data
yang besar.
Entri Data
1. Masukkan nilai 0, 0, 1, 1 (secara berurutan) ke dalam kolom pertama editor data SPSS.
2. Masukkan nilai 0, 1, 0, 1 (secara berurutan) ke dalam kolom kedua.
3. Hitung jumlah individu dalam sampel yang diklasifikasikan dengan X 5 0 dan Y 5 0.

Masukkan frekuensi ini di kotak paling atas di kolom ketiga editor data. Kemudian,
hitung berapa banyak yang memiliki X 5 0 dan Y 5 1 dan masukkan frekuensinya pada
kotak kedua kolom ketiga. Lanjutkan dengan angka yang memiliki X 5 1 dan Y 5 0, dan
terakhir angka yang memiliki X 5 1 dan Y 5 1. Anda harus mendapatkan 4 nilai di kolom
tiga.
4. Klik Data pada Bilah Alat di bagian atas halaman Editor Data SPSS dan pilih Kasus
Berat di bagian bawah daftar.
5. Klik lingkaran berlabel Berat kasus menurut, lalu sorot label untuk kolom yang berisi
frekuensi Anda (VAR00003) di sebelah kiri dan pindahkan ke kotak Variabel Frekuensi
dengan mengklik tanda panah.
6. Klik Oke.
500 BAB 14 korelasi
7. Klik Analisis pada bilah alat, pilih Korelasi, dan klik Bivariat.
8. Satu per satu, pindahkan label untuk dua kolom data yang berisi 0 dan 1 (mungkin
VAR00001 dan VAR00002) ke dalam kotak Variables . (Sorot setiap label dan klik
panah untuk memindahkannya ke dalam kotak.)
9. Pastikan kotak Pearson dicentang.

10. Klik Oke.
Keluaran
SPSS Program ini menghasilkan matriks korelasi yang sama dengan yang dijelaskan untuk
korelasi Pearson. Sekali lagi, Anda menginginkan korelasi antara X dan Y, yang ada di pojok
kanan atas (atau kiri bawah). Ingat, dengan koefisien phi, tanda korelasi tidak ada artinya.
Berikut ini adalah instruksi terperinci untuk menggunakan SPSS untuk melakukan Regresi Linier
yang disajikan dalam bab ini.
Entri Data
Masukkan nilai X di satu kolom dan nilai Y di kolom kedua editor data SPSS.
Analisis data
1. Klik Analisis pada bilah alat, pilih Regresi, dan klik Linear.
2. Di kotak sebelah kiri, sorot label kolom untuk nilai Y , lalu klik tanda panah untuk
memindahkan label kolom ke dalam kotak Dependent Variable .
3. Sorot label kolom untuk nilai X dan klik tanda panah untuk memindahkannya ke kotak
Independent Variable(s) .
4. Klik Oke.
Keluaran SPSS
Kami menggunakan SPSS untuk melakukan regresi data pada Contoh 14.13, 14.14, dan 14.15
dan hasilnya ditunjukkan pada Gambar 14.20. Tabel Ringkasan Model menyajikan nilai untuk
,
R, R2 dan kesalahan standar perkiraan. (Catatan: R hanyalah korelasi Pearson antara X dan
Y.) Tabel ANOVA menyajikan analisis regresi yang mengevaluasi signifikansi persamaan
regresi, termasuk rasio-F dan tingkat signifikansi ( nilai p atau tingkat alfa untuk ujian). Tabel
Koefisien merangkum koefisien yang tidak standar dan yang standar untuk persamaan regresi.
Tabel menunjukkan nilai konstanta (a) dan koefisien (b). Koefisien standar adalah nilai beta.
Sekali lagi, beta hanyalah korelasi Pearson antara X dan Y. Terakhir, tabel menggunakan
statistik t untuk mengevaluasi signifikansi variabel prediktor.
Ini identik dengan signifikansi persamaan regresi dan Anda akan menemukan bahwa t sama
dengan akar kuadrat dari rasio-F dari analisis regresi.
Fokus pada Pemecahan Masalah
1. Korelasi selalu memiliki nilai dari 11.00 hingga –1.00. Jika Anda memperoleh korelasi di
luar rentang ini, maka Anda telah membuat kesalahan perhitungan.
Fokus pada Pemecahan Masalah 501
Ringkasan Model
R yang disesuaikan St. Kesalahan

Model R R persegi
Persegi Perkiraan
1 .847a .718 .671 2.70801
ANOVAb
Jumlah dari
Model df Persegi Berarti F Sig.
Kotak
1 Regresi 112.000 1 112.000 15.273 .008a
Sisa 44.000 6 7.333
Total 156.000 7
Koefisiensa
Standar
Koefisien tidak standar Koefisien
Model B St. Kesalahan Beta T Sig.
1 (Konstan) -1.000 2.260 –.442 .674
VAR00001 2.000 .512 .847 3.908 .008
Gambar 14.20
Bagian keluaran SPSS dari analisis regresi untuk data pada Contoh 14.13, 14.14, dan 14.15.
2. Saat menginterpretasikan korelasi, tanda dan nilai numeriknya harus

dipertimbangkan secara terpisah. Ingatlah bahwa tanda menunjukkan arah
hubungan antara X dan Y. Nilai numerik mencerminkan kekuatan hubungan
tersebut. Oleh karena itu, korelasi –0,90 sama kuatnya dengan korelasi 10,90.
3. Sebelum Anda mulai menghitung korelasi, buat sketsa sebaran data dan buat
perkiraan korelasinya. (Apakah positif atau negatif? Apakah mendekati 1 atau
mendekati 0?) Setelah menghitung korelasinya, bandingkan jawaban akhir Anda
dengan perkiraan awal Anda.
4. Rasio-F untuk analisis regresi biasanya dihitung dengan menggunakan aktual

SSregresi dan SSresidual. Namun, Anda cukup menggunakan r2 sebagai pengganti SSregression dan Anda
dapat menggunakan 1 – r2 sebagai pengganti SSresidual. Catatan: Anda harus tetap menggunakan df yang benar
nilai pembilang dan penyebutnya.
502 BAB 14 korelasi
Demonstrasi 14.1
Korelasi dan Regresi
Hitung korelasi Pearson untuk data berikut:
Orang XY
A 0
4 MX 5 4 dengan SSX 5 40
B 2
1 SAYA 5 6 dengan SSY 5 54
C 8 10 SP 5 40
D 6 9
e 4 6
Langkah 1 Buat sketsa plot pencar. Kami telah membuat sebar plot untuk data (Gambar 14.21)
dan menempatkan amplop di sekitar titik data untuk membuat estimasi awal
korelasi. Perhatikan bahwa amplop itu sempit dan memanjang. Ini menunjukkan
bahwa korelasinya besar—mungkin 0,80 hingga 0,90. Selain itu, korelasinya positif
karena peningkatan X umumnya disertai dengan peningkatan Y. Kami juga telah
membuat sketsa garis lurus melalui tengah titik data, kira-kira mendekati kemiringan
dan perpotongan Y dari garis regresi.
Langkah 2 Hitung korelasi Pearson. Untuk data ini, korelasi Pearson adalah
SP 40 40 40
R 5 5 5 5 5
0,861
SSXYSS 40(54) 2160 46 48.
Pada langkah 1, estimasi awal kami untuk korelasi adalah antara 10,80 dan 10,90.
Korelasi yang dihitung konsisten dengan perkiraan ini.
Langkah 3 Hitung nilai persamaan regresi. Bentuk umum dari persamaan regresi adalah
^ SP
Y bX a51
dimana B 5 5aM dan 2bMX
SSX
Gambar 14.21 Y
Plot pencar untuk data
10
Demonstrasi
14.1. Sebuah amplop 9
ditarik di sekitar titik untuk 8
memperkirakan besarnya
7
korelasi. Sebuah garis
ditarik melalui tengah 6
amplop. 5
4
3
2
1
X
0 0 1 2 3 4 5 6 7 8 9 10
Masalah 503
40
Untuk data ini, b 5 5 1,00 dan 5 26 1(4) 2,00
A 51
40
Jadi, persamaan regresinya adalah Yˆ 5 (1)X 1 2.00 atau sederhananya, Yˆ 5 X 1 2.
Langkah 4 Mengevaluasi signifikansi korelasi dan persamaan regresi. Hipotesis nol menyatakan
bahwa, untuk populasi, tidak ada hubungan linier antara X dan Y, dan bahwa nilai yang
diperoleh untuk korelasi sampel dan persamaan regresi hanyalah hasil dari kesalahan
pengambilan sampel. Dalam hal korelasi, H0 menyatakan bahwa korelasi populasi
adalah nol (r 5 0). Dalam hal persamaan regresi, H0 mengatakan bahwa persamaan
tersebut tidak memprediksi porsi varians yang signifikan, atau bahwa nilai beta adalah
nol. Uji dapat dilakukan dengan menggunakan statistik t untuk korelasi atau rasio-F
untuk analisis regresi. Dengan menggunakan rasio-F, kami memperoleh
SSregresi 5 r2 (SSY ) 5 (0,861)2 (54) 5 40,03 dengan df 5 1
Residual 5 (1 2 r2 )(SSY ) 5 (1 2 0,8612 )(54) 5 13,97 dengan df 5 n 5 2 5 3
regresi MS 40,03/1
F 5 5
5 8,60
residu MS 13,97/3
Dengan df 5 1, 3 dan a 5 .05, nilai kritisnya adalah 10.13. Gagal menolak hipotesis nol. Korelasi
dan persamaan regresi keduanya tidak signifikan.
Masalah 4. Untuk skor berikut,
1.a. Informasi apa yang diberikan oleh tanda (1 atau 2) XY

dari korelasi Pearson?
B. Informasi apa yang disediakan oleh numerik 1 3
nilai korelasi Pearson? 3 5
2 1
2. Hitung SP (jumlah hasil kali penyimpangan) untuk skor
2 3
berikut. Catatan: Kedua rata-rata adalah bilangan bulat,
jadi rumus definisi berfungsi dengan baik.
A. Buat sketsa plot pencar dan perkirakan korelasi
XY Pearson.
0 2
1 4 5. Untuk skor berikut,
4 5
3 3 XY
7 6
1 7
4 2
3. Hitung SP (jumlah hasil kali penyimpangan) untuk skor
1 3
berikut. Catatan: Rata-rata keduanya adalah nilai desimal,
1 6
sehingga rumus komputasi bekerja dengan baik.
2 0
0 6
XY
2 3
0 2 1 5
0 1
1 0
A. Buat sketsa plot pencar dan perkirakan korelasi
2 1 Pearson. B.
1 2
Hitung korelasi Pearson.
0 3
6. Untuk skor berikut,
504 BAB 14 korelasi
XY 1 5 tertipis hingga 5 5 terberat. Angka pendapatan adalah

pendapatan tahunan (dalam ribuan), dibulatkan ke
1 6 $1.000 terdekat.
4 1 A. Hitung korelasi Pearson untuk data ini. B. Apakah
1 4 korelasinya signifikan secara statistik? Gunakan uji dua sisi
1
dengan 5 0,05.
3
3 1
Bobot (X) Pendapatan (Y)
A. Buat sketsa plot pencar dan perkirakan nilai korelasi Pearson. 1 125
2 78
4 49
7. Dengan sampel yang kecil, satu titik dapat memiliki pengaruh 3 63
yang besar terhadap besarnya korelasi. Untuk membuat data 5 35
berikut, kita mulai dengan skor dari soal 8 dan mengubah 2 84
nilai X pertama dari X 5 1 menjadi X 5 6. 5 38
3 51
1 93
XY
4 44
6 6
4 1
10. Para peneliti juga dikutip dalam masalah sebelumnya
1 4
memeriksa hubungan berat/gaji untuk laki-laki dan
1 3 menemukan hubungan yang positif, menunjukkan bahwa kita
3 1 memiliki standar yang sangat berbeda untuk laki-laki daripada
perempuan (Judge & Cable, 2010). Berikut ini adalah data
A. Buat sketsa plot pencar dan perkirakan nilai korelasi yang mirip dengan yang diperoleh untuk laki-laki yang
Pearson. B. Hitung
bekerja. Sekali lagi, berat relatif terhadap tinggi dikodekan
korelasi Pearson. dalam lima kategori dari 1 5 tertipis hingga 5 5 terberat.
8. Untuk rangkaian skor berikut,

Penghasilan dicatat sebagai ribuan yang diperoleh setiap
XY tahun. A. Hitung korelasi Pearson untuk data ini. B. Apakah

korelasinya signifikan secara statistik? Gunakan uji dua sisi dengan 5 0,05.
6 4
3 1 Bobot (X) Pendapatan (Y)
5 0
4 156
6 7
3 88
4 2
5 49
6 4
2 73
1 45
A. Hitung korelasi Pearson. B. Tambahkan
2 poin ke setiap nilai X dan hitung korelasi untuk skor yang 3 92
dimodifikasi. Bagaimana 1 53
menambahkan konstanta ke setiap skor memengaruhi 5 148
nilai korelasi?
C. Kalikan setiap nilai X asli dengan 2 dan hitung korelasi
11. Mengidentifikasi individu dengan risiko tinggi penyakit Alzheimer
untuk skor yang dimodifikasi.
biasanya melibatkan serangkaian tes kognitif yang panjang.
Bagaimana mengalikan setiap skor dengan konstanta
memengaruhi nilai korelasi? Namun, para peneliti telah mengembangkan Layar 7
Menit, yang merupakan cara cepat dan mudah untuk
9. Judge dan Cable (2010) melaporkan hasil studi yang mencapai tujuan yang sama. Pertanyaannya adalah apakah
menunjukkan hubungan negatif antara berat badan dan Layar 7 Menit seefektif rangkaian tes lengkap. Untuk
pendapatan untuk sekelompok wanita profesional. Berikut menjawab pertanyaan ini, Ijuin et al. (2008) memberikan
adalah data yang mirip dengan yang diperoleh dalam kedua tes tersebut kepada sekelompok pasien dan
penelitian ini. Untuk menyederhanakan variabel berat badan, membandingkan hasilnya. Data berikut mewakili hasil yang
wanita diklasifikasikan ke dalam lima kategori yang mengukur serupa dengan yang diperoleh dalam penelitian ini.
berat aktual relatif terhadap tinggi badan, dari
Masalah 505
skor kognitif lebih rendah daripada perenang dewasa, yang

Seri Kognitif Layar 7 Menit Pasien
tidak mengalami pukulan berulang di kepala. Uji
A 3 11 independent-measures t test menghasilkan t 5 2,11
B 8 19 dengan df 5 11 dan nilai r2 5 0,288 (28,8%). A. Konversikan
22 data dari soal ini ke dalam bentuk yang sesuai untuk korelasi
C 10
titik-biserial (gunakan 1 untuk perenang dan 0 untuk
D 8 20
pemain sepak bola), lalu hitung korelasinya. B. Kuadratkan
e 4 14 nilai korelasi point-biserial untuk
F 7 13 memverifikasi bahwa Anda mendapatkan nilai r2 yang sama
G 4 9 dengan yang dihitung di Bab 10.
H 5 20
SAYA 14 25 16. Penelitian telah menunjukkan bahwa orang dengan kecerdasan tinggi
ligence umumnya lebih cenderung menjadi sukarelawan
A. Hitung korelasi Pearson untuk diukur sebagai peserta dalam penelitian, tetapi tidak untuk penelitian
derajat hubungan antara kedua tes tersebut yang melibatkan pengalaman yang tidak biasa seperti hipnosis.
skor. Untuk menguji fenomena ini, seorang peneliti menawarkan
B. Apakah korelasinya signifikan secara statistik? Gunakan kuesioner kepada sampel mahasiswa. Survei tersebut
uji dua sisi dengan 5 0,01. C. menanyakan nilai rata-rata siswa (sebagai ukuran kecerdasan)
Berapa persentase varian skor kognitif yang diprediksi dari dan apakah siswa tersebut ingin mengambil bagian dalam
skor Layar 7 Menit? (Hitung nilai r2 .) studi di masa depan di mana peserta akan terhipnotis. Hasil
penelitian menunjukkan bahwa 7 dari 10 lebih rendah
12. Seperti yang telah kita catat di bab-bab sebelumnya, bahkan

orang intelijen bersedia untuk berpartisipasi tetapi hanya
pengaruh yang sangat kecil pun bisa menjadi signifikan jika
2 dari 10 orang dengan kecerdasan tinggi yang bersedia.
sampelnya cukup besar. Misalkan, misalnya, seorang
A. Ubah data
peneliti memperoleh korelasi r 5 0,60 untuk sampel n 5 10
menjadi bentuk yang sesuai untuk komputasi
peserta. A. Apakah
menggunakan koefisien phi. (Kodekan dua kategori
sampel ini cukup untuk menyimpulkan bahwa ada korelasi
kecerdasan sebagai 0 dan 1 untuk variabel X , dan beri
yang signifikan dalam populasi? Gunakan uji dua sisi
kode kesediaan untuk berpartisipasi sebagai 0 dan 1 untuk
dengan 5 0,05.
variabel
B. Jika sampel memiliki n 5 25 peserta, apakah korelasinya
Y. ) b. Hitung koefisien phi untuk data.
signifikan? Sekali lagi, gunakan uji dua sisi dengan 5 0,05.
17. Buat sketsa grafik yang menunjukkan garis persamaan
Y 5 –2X 1 4. Pada grafik yang sama, tunjukkan garis Y 5 X 24.
13. Seorang peneliti mengukur tiga variabel, X, Y, dan Z, untuk
setiap individu dalam sampel n 5 25. Korelasi Pearson
untuk sampel ini adalah rXY 5 0,8, rXZ 5 0,6, dan rYZ 5 0,7. 18. Persamaan regresi dimaksudkan untuk menjadi garis lurus
A. Temukan korelasi parsial yang “paling pas” untuk sekumpulan data. Apa kriteria
antara X dan Y, dengan mempertahankan Z konstan. B. untuk "paling pas"?
Temukan korelasi
parsial antara X dan Z, dengan mempertahankan Y 19. Himpunan skor n 5 20 pasang (nilai X dan Y ) memiliki SSX 5
konstan. (Petunjuk: Ganti saja label untuk variabel Y 16, SSY 5 100, dan SP 5 32. Jika rata-rata nilai X adalah MX
dan Z agar sesuai dengan label dalam persamaan.) 5 6 dan rata-rata nilai Y adalah SAYA 5 20, a. Hitung korelasi
Pearson untuk
skor. B. Temukan persamaan regresi untuk memprediksi Y
14. Soal 9 menyajikan data yang menunjukkan hubungan negatif dari nilai X.
antara berat badan dan pendapatan untuk sampel wanita
bekerja. Namun, bobot diberi kode dalam lima kategori, yang
dapat dipandang sebagai skala ordinal daripada skala 20. Himpunan n 5 25 pasang skor (nilai X dan Y ) menghasilkan
interval atau rasio. persamaan regresi Yˆ 5 3X – 2. Carilah nilai prediksi Y untuk
Jika demikian, korelasi Spearman lebih tepat daripada korelasi masing-masing skor X berikut : 0, 1, 3, –2 .
Pearson. Konversikan bobot dan pendapatan menjadi
peringkat dan hitung korelasi Spearman untuk skor di
21. Untuk kumpulan data berikut, a.
soal 9.
Temukan persamaan regresi linier untuk memprediksi Y dari
15. Soal 23 di Bab 10 menyajikan data yang menunjukkan bahwa X. b. Hitung
pemain sepak bola dewasa, yang memiliki riwayat memukul kesalahan standar estimasi untuk persamaan regresi.
bola dengan kepala, memiliki
506 BAB 14 korelasi
25. Soal 9 meneliti hubungan antara berat badan dan pendapatan

XY
untuk sampel n 5 10 wanita. Bobot diklasifikasikan dalam lima
7 6 kategori dan memiliki rata-rata M 5 3 dengan SS 5 20.
9 6 Penghasilan, diukur dalam ribuan, memiliki skor rata-rata M 5 66
6 3 dengan SS 5 7430, dan SP 5 2359. a. Temukan persamaan
regresi untuk
12 5
memprediksi pendapatan dari bobot. (Identifikasi skor
9 6
pendapatan sebagai nilai X dan skor bobot sebagai
5 4
nilai Y. ) b. Berapa persentase varians dalam
pendapatan
22. Apakah persamaan regresi dari soal 21 ac yang diperhitungkan oleh persamaan regresi?
menghitung porsi yang signifikan dari varians dalam skor Y ?
Gunakan 5 0,05 untuk mengevaluasi rasio-F. (Hitung korelasinya, r, lalu cari r2 .) c. Apakah
persamaan regresi memperhitungkan a
23. Untuk skor berikut, bagian yang signifikan dari varians dalam pendapatan?
Gunakan a5 0,05 untuk mengevaluasi rasio-F.
XY 26. Tampaknya ada beberapa bukti yang menunjukkan bahwa
3661 pensiun dini dapat menyebabkan penurunan daya ingat

(Rohwedder & Willis, 2010). Para peneliti memberikan
3433
tes memori kepada pria dan wanita berusia 60 hingga 64
51
tahun di beberapa negara yang memiliki usia pensiun berbeda.
Untuk setiap negara, para peneliti mencatat skor memori
rata-rata dan persentase individu dalam rentang usia 60
hingga 64 tahun yang telah pensiun. Perhatikan bahwa
persentase pensiun yang lebih tinggi menunjukkan usia
A. Temukan persamaan regresi untuk memprediksi Y dari X. b. pensiun yang lebih muda untuk negara tersebut. Data berikut
Hitung nilai prediksi Y untuk setiap X. mirip dengan hasil penelitian. Gunakan data tersebut
24. Meskipun Anda mungkin menduga bahwa orang yang tidak untuk menemukan persamaan regresi untuk memprediksi
puas akan menjadi individu yang paling mungkin skor ingatan dari persentase orang berusia 60 hingga 64 tahun
berpartisipasi dalam kegiatan politik dalam upaya mengubah yang pensiun.
keadaan, penelitian cenderung menunjukkan sebaliknya.
Flavin dan Keane (2011) menemukan hubungan positif antara
kepuasan hidup dan partisipasi politik, yang meliputi kegiatan Negara % Dihentikan (X) Skor Memori (Y)
seperti menghadiri aksi unjuk rasa, berkontribusi pada can
didates, dan menampilkan tanda halaman. Berikut adalah data Swedia 39 9.3
yang mirip dengan yang diperoleh dalam penelitian ini. AS 48 10.9
Inggris 59 10.7
Jerman 70 9.1
Partisipasi Politik Kepuasan Hidup 74 6.4
Spanyol
5 4 Belanda 78 9.1
8 7 Italia 81 7.2
3 2 Perancis 87 7.9
6 9 88 8.5
Belgium
3 5
Austria 91 9.0
3
1 6
42 4 27. Persamaan regresi dihitung untuk himpunan n 5 18 pasang nilai

X dan Y dengan korelasi r 5 180 dan SSY 5 100. a. Cari
kesalahan standar
A. Temukan persamaan regresi untuk memprediksi partisipasi estimasi untuk persamaan regresi. B. Berapa besar kesalahan
politik dari kepuasan hidup. B. Dengan standar jika
menggunakan 5 0,05, uji signifikansi regresi ukuran sampel adalah n 5 38?
persamaan.
Masalah 507
28.a. Satu set 20 pasang skor, nilai X dan Y , menghasilkan 29.a. Seorang peneliti menghitung persamaan regresi untuk
korelasi r 5 0,70. Jika SSY 5 150, carilah standard sampel n 5 25 pasang skor, nilai X dan Y. Jika analisis
error estimasi untuk garis regresi. B. Set kedua dari regresi digunakan untuk menguji signifikansi
20 pasang nilai persamaan, berapakah nilai df untuk rasio-F?
X dan Y
menghasilkan korelasi r 5 0,30. Jika SSY 5 150, B. Seorang peneliti yang mengevaluasi signifikansi
menemukan kesalahan standar estimasi untuk persamaan regresi memperoleh rasio-F dengan df 5 1,
Garis regresi. 18. Berapa pasang skor, nilai X dan Y , dalam sampel?

Chapter 14 B.indo

Diunggah oleh

Hak Cipta:

Format Tersedia

Anda mungkin juga menyukai

Chapter 14 B.indo

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Chapter 14 B.indo

Diunggah oleh

Hak Cipta:

Format Tersedia

Machine Translated by Google

Applia untuk Essentials of Statistics for the Behavioral Sciences

450 BAB 14 korelasi

1. Arah Hubungan. Tanda korelasi, positif atau

BAGIAN 14.1 / Pendahuluan 451

Contoh berikut menggambarkan hubungan positif dan negatif.

452 BAB 14 korelasi

3. Kekuatan atau Konsistensi Hubungan. Terakhir, korelasi mengukur konsistensi

BAGIAN 14.2 / Korelasi Pearson 453

A. Model tahun dan harga untuk Honda bekas

B. IQ dan nilai rata-rata poin untuk siswa sekolah menengah

14.2 Korelasi Pearson

454 BAB 14 korelasi

SP 5 o(X 2 MX)(Y 2 MY ) (14.1)

1. Temukan simpangan X dan simpangan Y untuk setiap individu.

2. Temukan produk dari penyimpangan untuk setiap individu.

Skor Penyimpangan Produk

X Y X 2 MX Y 2 SAYA (X 2 MX)(Y 2 SAYA)

BAGIAN 14.2 / Korelasi Pearson 455

Mengganti total dalam rumus memberi

Kedua rumus menghasilkan hasil yang sama, SP 5 6.

Membandingkan Rumus SP dan SS

456 BAB 14 korelasi

BAGIAN 14.2 / Korelasi Pearson 457

SSX 5 64 SSY 5 16 SP5 128

458 BAB 14 korelasi

Belajar C hec k 1. Bisakah SP memiliki nilai kurang dari nol?

2. Hitung jumlah produk simpangan (SP) untuk rangkaian skor berikut.

3. Untuk data berikut:

A. Buat sketsa sebaran plot dan buat perkiraan korelasi Pearson.

B. Hitung korelasi Pearson.

14.3 Menggunakan dan Menafsirkan Korelasi Pearson

BAGIAN 14.3 / Menggunakan dan Menafsirkan Korelasi Pearson 459

3. Keandalan. Selain mengevaluasi validitas prosedur pengukuran, korelasi digunakan untuk

4. Verifikasi Teori. Banyak teori psikologi membuat prediksi spesifik

460 BAB 14 korelasi

BAGIAN 14.3 / Menggunakan dan Menafsirkan Korelasi Pearson 461

Data hipotetis menunjukkan 60

Dalam contoh ini,

462 BAB 14 korelasi

Data Asli Data dengan Outlier Termasuk

BAGIAN 14.3 / Menggunakan dan Menafsirkan Korelasi Pearson 463

(A) (B) (C)

Ukuran sepatu IQ Gaji tahunan

464 BAB 14 korelasi

2. Seorang peneliti menemukan korelasi r 5 0,60 antara gaji dan jumlah

2. r2 5 0,36, atau 36%

14.4 Uji Hipotesis dengan Korelasi Pearson

H0 : r 5 0 (Tidak ada korelasi populasi.)

H1 : r ÿ 0 (Ada korelasi nyata.)

BAGIAN 14.4 / Uji Hipotesis dengan Korelasi Pearson 465

H0 : r ÿ 0 (Korelasi populasi tidak positif.)

H1 : r . 0 (Korelasi populasi positif.)

Plot pencar dari populasi

Titik data dalam sampel

466 BAB 14 korelasi

sampel statistik 2 parameter populasi

kesalahan standar untuk sd 5 5 R