Analisis korelasi digunakan untuk mengukur kekuatan hubungan/asosiasi linier diantara dua variabel
Bebas satuan
Rentang antara -1 dan 1
Semakin dekat ke -1, semakin kuat hubungan linear negatifnya
Semakin mendekati 1, semakin kuat hubungan linear positifnya
Semakin mendekati 0, semakin lemah hubungan linearnya
Interpretasi korelasi
r2 |r| Arti
0 0 Tidak ada korelasi
0 – 0.25 0 – < 0.5 Korelasi lemah
0.25 – 0.64 0.5 – < 0.8 Korelasi moderat
0.64 – 1 0.8 – < 1 Korelasi kuat
1 1 Korelasi sempurna
Source : Statistical Analysis of Data, Anderson & Scolve
Formula
atau
Contoh :
1 14.6 37.4
2 14.1 44.8
3 14.0 45.8
… … …
98 14.5 33.2
99 14.7 39.2
; ;
; ;
Menguji korelasi
OK
Memprediksi nilai dari suatu variabel dependen berdasarkan nilai dari paling tidak satu
variabel independen.
Contoh
Perhatikan kembali contoh Pembacaan Odometer dan Harga Bekas Toyota Camry. Bagaimana jika
dealer ingin menemukan garis regresinya?
Y = harga
X = odometer
Persamaan regresi:
atau
Dari data :
Persamaan regresi:
Koefisien kemiringan b1 adalah 0,0669, yang berarti bahwa untuk setiap tambahan 1.000 mil pada
odometer, harga turun rata-rata sebesar $0,0669 ribu. Sederhananya, kemiringan menunjukkan
bahwa untuk setiap mil tambahan pada odometer, harga turun rata-rata sebesar $0,0669 atau 6,69
sen.
Intersep b0 adalah 17.250. Secara teknis, intersep adalah titik di mana garis regresi dan sumbu y
berpotongan. Ini berarti bahwa ketika x = 0 (yaitu mobil tidak dikemudikan sama sekali) harga
jualnya adalah $17.250 ribu atau $17.250. Kita mungkin tergoda untuk mengartikan angka ini
sebagai harga mobil yang belum dikemudikan. Namun, dalam kasus ini, intersep mungkin tidak ada
artinya. Karena sampel kami tidak menyertakan mobil dengan odometer nol mil, kami tidak memiliki
dasar untuk menafsirkan b0. Sebagai aturan umum, kita tidak dapat menentukan nilai untuk nilai x
yang berada jauh di luar rentang nilai sampel x. Dalam contoh ini, nilai x terkecil dan terbesar
masing-masing adalah 19,1 dan 49,2. Karena x = 0 tidak berada dalam interval ini, kami tidak dapat
dengan aman menginterpretasikan nilai kapan x = 0.
Penting untuk diingat bahwa interpretasi koefisien hanya berkaitan dengan sampel yang terdiri dari
100 pengamatan. Untuk menyimpulkan informasi tentang populasi, kita membutuhkan teknik
inferensi statistik, yang dijelaskan selanjutnya.
Aplikasi SPSS
Klik Statistics…
Continue > OK
Tabel Anova
Menilai Model
MSE = 0.107
Nilai terkecil yang dapat diasumsikan s ε adalah 0, yang terjadi saat SSE = 0, yaitu saat semua titik
jatuh pada garis regresi. Jadi, ketika s ε kecil, kecocokannya sangat baik, dan model linier cenderung
menjadi alat analisis dan peramalan yang efektif. Jika s ε besar, modelnya buruk, dan praktisi statistik
harus memperbaikinya atau membuangnya.
Kita menilai nilai sε dengan membandingkannya dengan nilai variabel dependen y atau lebih khusus
lagi dengan rata-rata sampel . Dalam contoh ini, karena sε = 0,3265 dan , tampaknya
kesalahan standar dugaan adalah kecil. Namun, karena tidak ada batas atas yang ditentukan
sebelumnya pada sε, seringkali sulit untuk menilai model dengan cara ini. Secara umum, kesalahan
standar dugaan tidak dapat digunakan sebagai ukuran absolut dari utilitas model.
Meskipun demikian, sε berguna dalam membandingkan model. Jika praktisi statistik memiliki
beberapa model untuk dipilih, model dengan nilai s ε terkecil umumnya harus digunakan. Seperti
yang akan Anda lihat, sε juga merupakan statistik penting dalam prosedur lain yang terkait dengan
analisis regresi.
Uji untuk menentukan apakah terdapat cukup bukti untuk menyimpulkan bahwa terdapat hubungan
linier antara harga lelang dan pembacaan odometer untuk semua Toyota Camrys yang berumur 3
tahun. Gunakan tingkat signifikansi 5%.
Jika hipotesis nol benar, maka tidak ada hubungan linier. Jika hipotesis alternatif benar, ada
beberapa hubungan linier.
Nilai statistik uji adalah t = 13,44, dengan nilai p-value = 0.000 < 0.05. Sehingga dapat dikatakan
bahwa terdapat cukup bukti untuk menyimpulkan bahwa ada hubungan linier. Artinya, pembacaan
odometer dapat mempengaruhi harga jual lelang mobil tersebut.
Kita juga dapat memperoleh informasi tentang hubungan ini dengan menduga interval koefisien
slope. Dalam contoh ini, dugaan interval kepercayaan 95% adalah
Kami menduga bahwa koefisien slope/kemiringan berada di antara -0,0768 dan -0,0570.
Uji slope β1 hanya membahas pertanyaan apakah ada cukup bukti untuk menyimpulkan bahwa ada
hubungan linier. Namun, dalam banyak kasus, juga diperlukan hal untuk mengukur kekuatan
hubungan linier tersebut, khususnya ketika kita ingin membandingkan beberapa model yang
berbeda. Statistik yang menjalankan fungsi ini adalah koefisien determinasi, yang dilambangkan
dengan R2 (R-square (di SPSS ada di output Model Summary).
Kita mendapatkan bahwa R2 sama dengan 0,6483. Statistik ini memberi tahu kita bahwa 64,83%
variasi harga jual lelang dijelaskan oleh variasi pembacaan odometer. Sisanya 35,17% tidak dapat
dijelaskan. Berbeda dengan nilai statistik uji, koefisien determinasi tidak memiliki nilai kritis yang
memungkinkan kita menarik kesimpulan. Secara umum, semakin tinggi nilai R2, semakin cocok
model dengan data. Dari uji-t 1 kita sudah tahu bahwa ada bukti hubungan linier. Koefisien
determinasi hanya memberi kita ukuran kekuatan hubungan itu.
Dengan menggunakan hasil dari penilaian model, kita dapat menilai seberapa cocok model linier
dengan data. Jika model cocok dengan memuaskan, kita dapat menggunakannya untuk meramalkan
dan mengestimasi nilai variabel dependen.
Sebagai ilustrasi, misalkan dealer mobil bekas ingin memprediksi harga jual Toyota Camry berusia 3
tahun dengan odometer 40 (ribu) mil. Menggunakan persamaan regresi, dengan x = 40, kita
dapatkan
Kami menyebut nilai ini sebagai prediksi titik, dan merupakan estimasi titik atau nilai prediksi
untuk y ketika x = 40. Jadi, dealer akan memprediksi bahwa mobil tersebut akan dijual seharga
$14.574.
Namun, dengan sendirinya, prediksi titik tidak memberikan informasi apa pun tentang seberapa
dekat nilainya dengan harga jual yang sebenarnya. Untuk menemukan informasi itu, kita harus
menggunakan interval. Faktanya, kita dapat menggunakan salah satu dari dua interval:
interval prediksi dari nilai y tertentu atau penduga interval kepercayaan dari nilai ekspektasi y.
a. Dealer mobil bekas akan menawar Toyota Camry berusia 3 tahun yang dilengkapi dengan
semua fitur standar dan dengan odometer 40.000 (xg = 40) mil. Untuk membantunya
memutuskan berapa banyak penawarannya, maka dia perlu memprediksi harga jual.
b. Dealer mobil bekas yang disebutkan pada bagian (a) memiliki kesempatan untuk menawar
banyak mobil yang ditawarkan oleh perusahaan rental. Perusahaan rental memiliki 250 Toyota
Camry yang semuanya dilengkapi dengan fitur standar. Semua mobil di lot ini memiliki
odometer sekitar 40.000 (xg = 40) mil. Dealer menginginkan perkiraan harga jual semua mobil
di lot ini.
Solusi :
a. Dealer ingin memprediksi harga jual sebuah mobil. Jadi, dia harus menggunakan interval
prediksi
Batas bawah dan atas interval prediksi masing-masing adalah $13.922 dan $15.226.
Kami memperkirakan bahwa satu mobil akan dijual antara $13.925 dan $15.226.
b. Dealer ingin menentukan harga rata-rata dari banyak mobil, jadi dia perlu menghitung
penduga interval kepercayaan dari suatu nilai harapan:
Batas bawah dan atas perkiraan interval kepercayaan dari nilai yang diharapkan masing-masing
adalah $14.498 dan 14.650.
Harga jual rata-rata populasi Toyota Camrys yang berusia 3 tahun diperkirakan berkisar antara
$14.498 dan $14.650.
Karena memprediksi harga jual satu mobil lebih sulit daripada memperkirakan harga jual rata-rata
semua mobil sejenis, interval prediksi lebih lebar daripada estimasi interval nilai ekspektasi.