Korelasi adalah istilah statistik yang menyatakan derajat hubungan linier (searah bukan
timbal balik) antara dua variabel atau lebih. Korelasi product moment pearson digunakan untuk
menyatakan ada atau tidaknya hubungan antara variabel X dengan variabel Y dan Untuk
menyatakan besarnya sumbangan variabel satu terhadap yang lainnya yang dinyatakan dalam
persen.
Macam-macam Teknik Korelasi
Product Moment Pearson : Kedua variabelnya berskala interval
Rank Spearman : Kedua variabelnya berskala ordinal
Point Serial : Satu berskala nominal sebenarnya dan satu berskala
interval
Biserial : Satu berskala nominal buatan dan satu berskala interval
Koefisien kontingensi : Kedua varibelnya berskala nominal
Asumsi
Data berdistribusi Normal
Variabel yang dihubungkan mempunyai data linear.
Variabel yang dihubungkan mempunyai data yang dipilih secara acak.
Variabel yang dihubungkan mempunyai pasangan yang sama dari subyek yang sama pula
(variasi skor variabel yang dihubungkan harus sama).
Variabel yang dihubungkan mempunyai data interval atau rasio.
Nilai r
Nilai r terbesar adalah +1 dan r terkecil adalah –1. r = +1 menunjukkan hubungan positip
sempurna, sedangkan r = -1 menunjukkan hubungan negatip sempurna. r tidak mempunyai
satuan atau dimensi. Tanda + atau - hanya menunjukkan arah hubungan. Intrepretasi nilai r
adalah sebagai berikut:
R Intepretasi
0 Tidak berkorelasi
0,01-0,20 Korelasi Sangat rendah
0,21-0,40 Rendah
0,41-0,60 Agak rendah
0,61-0,80 Cukup
0,81-0,99 Tinggi
1 Sangat tinggi
4. Cari r hitung.
5. Tentukan taraf signifikansinya (α)
6. Cari r tabel dengan dk = n-2
7. Tentukan kriteria pengujian
Jika -rtabel≤rhitung≤+rtabel, maka Ho diterima
8. Bandingkan thitung dengan ttabel
9. Buatlah kesimpulan.
y 0 1x
y = dependent variable
x = independent variable
b0 = y-intercept
b1 = kemiringan garis
e = variable eror
Memperkirakan Koefisien
Estimasi tersebut ditentukan oleh
Menggambar sampel dari populasi yang menarik,
Menghitung statistik sampel.
Menghasilkan garis lurus yang memotong data.
Least Squares (Regression) Line
Baris yang bagus adalah yang meminimalkan jumlah perbedaan kuadrat antara
poin dan garis.
Memperkirakan Koefisien
Untuk menghitung taksiran kemiringan dan memotong garis kuadrat terkecil, gunakan
rumus:
SS xy
b1
SS xx
b0 y b1 x
SS xy xi yi
x y
i i
n
x
2
SS xx xi2
i
( n 1) sx2
n
Persamaan regresi yang memperkirakan persamaan model linear orde pertama adalah:
ŷ b0 b1 x
Variabel Eror: Kondisi yang Diperlukan
Eror ε adalah bagian penting dari model regresi.
Empat persyaratan yang melibatkan distribusi e harus dipenuhi.
- Distribusi probabilitas e adalah normal.
- Mean dari e adalah nol: E (e) = 0.
- Simpangan baku e adalah se untuk semua nilai x.
- Himpunan kesalahan yang terkait dengan nilai y yang berbeda semuanya independent
Metode kuadrat terkecil akan menghasilkan garis regresi apakah ada hubungan linier
antara x dan y. Akibatnya, penting untuk menilai seberapa baik model linier cocok dengan data.
Beberapa metode digunakan untuk menilai model. Semua didasarkan pada jumlah kuadrat untuk
kesalahan, SSE.
Jumlah Kuadrat untuk Error
Ini adalah jumlah perbedaan antara titik dan garis regresi. Ini bisa berfungsi sebagai
ukuran seberapa baik garis cocok dengan data. SSE didefinisikan oleh:
n
SSE (y ŷ ) .
i 1
i i
2
R
2
sx2 s y2
SSE
or R 2 1
( yi y )2
(y y)
i
2
(y y)
i
2
(y y)
i
2
Diagnostik Regresi – I
Tiga kondisi yang diperlukan untuk validitas analisis regresi adalah:
- variabel kesalahan terdistribusi secara normal.
- varians kesalahan adalah konstan untuk semua nilai x.
- Kesalahan tidak tergantung satu sama lain.
Analisis Residual
Memeriksa residu (atau residu terstandarisasi), membantu mendeteksi pelanggaran kondisi yang
diperlukan.
Contoh - lanjutan:
- Ketidaknormalan.
Gunakan Excel untuk mendapatkan histogram residual standar. Periksa histogram dan
cari yang berbentuk lonceng. Diagram dengan rata-rata mendekati nol.
Heteroscedasticity
Ketika persyaratan varian konstan dilanggar, kami memiliki kondisi heteroskedastisitas.
Diagnosis heteroskedastisitas dengan memplot residu terhadap prediksi y.
Homoscedasticity
Ketika persyaratan varian konstan tidak dilanggar, kami memiliki kondisi homoseksualitas.
Contoh – lanjutan
Outliers
Pencilan adalah pengamatan yang luar biasa kecil atau besar. Beberapa kemungkinan
perlu diselidiki ketika pencilan diamati:
- Terjadi kesalahan dalam mencatat nilai.
- Intinya bukan milik sampel.
- Pengamatan itu valid.
Identifikasi pencilan dari diagram pencar. Sudah menjadi kebiasaan untuk mencurigai bahwa
pengamatan adalah pencilan jika | standar residual | > 2
Prosedur untuk Diagnosis Regresi
Kembangkan model yang memiliki landasan teori.
Kumpulkan data untuk dua variabel dalam model.
Gambarlah diagram sebar untuk menentukan apakah model linier tampaknya sesuai.
Tentukan persamaan regresi.
Periksa kondisi yang diperlukan untuk kesalahan.
Periksa keberadaan outlier dan pengamatan berpengaruh
Nilai kesesuaian model.
Jika model cocok dengan data, gunakan persamaan regresi.