Anda di halaman 1dari 11

KORELASI

Universitas Islam Jakarta

Analisis korelasi digunakan untuk mengukur kekuatan hubungan/asosiasi linier diantara dua variabel

 Hanya mengenai kekuatan suatu hubungan

 Tidak ada unsur sebab akibat

Koefisien korelasi populasi disimbolkan dengan ρ

Koefisien korelasi sampel disimbolkan dengan r

Properti dari ρ dan r

 Bebas satuan
 Rentang antara -1 dan 1
 Semakin dekat ke -1, semakin kuat hubungan linear negatifnya
 Semakin mendekati 1, semakin kuat hubungan linear positifnya
 Semakin mendekati 0, semakin lemah hubungan linearnya

Interpretasi korelasi

r2 |r| Arti
0 0 Tidak ada korelasi
0 – 0.25 0 – < 0.5 Korelasi lemah
0.25 – 0.64 0.5 – < 0.8 Korelasi moderat
0.64 – 1 0.8 – < 1 Korelasi kuat
1 1 Korelasi sempurna
Source : Statistical Analysis of Data, Anderson & Scolve

Formula

atau

Contoh :

Pembacaan Odometer dan Harga Bekas Toyota Camry


Dealer mobil di seluruh Amerika Utara menggunakan apa yang disebut Buku Biru untuk membantu
mereka menentukan nilai mobil bekas yang di tukar tambah kan oleh pelanggan mereka saat
membeli mobil baru. Buku yang diterbitkan setiap bulan ini mencantumkan nilai tukar tambah untuk
semua model dasar mobil. Ini memberikan nilai alternatif untuk setiap model mobil sesuai dengan
kondisi dan fitur opsionalnya. Nilai tersebut ditentukan berdasarkan rata-rata yang dibayarkan pada
lelang mobil bekas baru-baru ini yang adalah sumber pasokan bagi banyak dealer mobil bekas.
Namun, Buku Biru tidak menunjukkan nilai yang ditentukan oleh pembacaan odometer, meskipun
faktor penting bagi pembeli mobil bekas adalah seberapa jauh mobil tersebut telah dikendarai.
Untuk mengkaji masalah ini, sebuah dealer mobil bekas secara acak memilih 100 Toyota Camry
berusia 3 tahun yang dilelang selama sebulan terakhir. Setiap mobil berada dalam kondisi prima dan
dilengkapi dengan semua fitur yang menjadi standar mobil ini. Dealer mencatat harga ($1000) dan
jumlah mil (ribuan) pada odometer. Beberapa dari data ini tercantum di sini. Dealer ingin
mengetahui apakah pembacaan odometer dan harga Toyota Camry bekas berhubungan linear?

Car Price ($1,000) Odometer (1,000 mi)

1 14.6 37.4

2 14.1 44.8

3 14.0 45.8

… … …

98 14.5 33.2

99 14.7 39.2

100 14.3 36.4

Dari data diperoleh

; ;

; ;

Menguji korelasi

• H0 : ρ = 0 (Tidak ada korelasi linier)

• H1 : ρ  0 (Ada korelasi linier)


Statistic uji (t-hitung):

Nilai t-hitung ini dibandingkan dengan t-tabel (tersedia di buku-buku statistika)

Atau pake p-value jika menggunakan software seperti SPSS

Aplikasi korelasi pada SPSS

Masukkan variabel yang akan dihitung


korelasinya

OK

p-value = 0.000 < α = 0.05  tolak H0

Terdapat bukti hubungan linier antara harga dan odometer.


REGRESI LINIER SEDERHANA

Universitas Islam Jakarta

Analisis Regresi digunakan untuk:

 Memprediksi nilai dari suatu variabel dependen berdasarkan nilai dari paling tidak satu
variabel independen.

 Menjelaskan pengaruh dari perubahan pada variabel independen terhadap variabel


dependen.

Variabel dependen : variabel yang ingin diprediksi atau dijelaskan

Variabel Independen : variabel yang digunakan untuk menjelaskan variabel dependen

Dalam regresi linier sederhana:

 Hanya satu variabel bebas, X


 Hubungan antara X dan Y digambarkan dengan fungsi linier
 Perubahan Y diasumsikan disebabkan oleh perubahan X
 Persamaan regresi linier sederhana memberikan suatu estimasi populasi dari suatu garis
regresi

Contoh

Perhatikan kembali contoh Pembacaan Odometer dan Harga Bekas Toyota Camry. Bagaimana jika
dealer ingin menemukan garis regresinya?

Y = harga

X = odometer

Persamaan regresi:

Mendapatkan b1 secara manual

atau
Dari data :

Mendapatkan b0 secara manual

Persamaan regresi:

Koefisien kemiringan b1 adalah 0,0669, yang berarti bahwa untuk setiap tambahan 1.000 mil pada
odometer, harga turun rata-rata sebesar $0,0669 ribu. Sederhananya, kemiringan menunjukkan
bahwa untuk setiap mil tambahan pada odometer, harga turun rata-rata sebesar $0,0669 atau 6,69
sen.

Intersep b0 adalah 17.250. Secara teknis, intersep adalah titik di mana garis regresi dan sumbu y
berpotongan. Ini berarti bahwa ketika x = 0 (yaitu mobil tidak dikemudikan sama sekali) harga
jualnya adalah $17.250 ribu atau $17.250. Kita mungkin tergoda untuk mengartikan angka ini
sebagai harga mobil yang belum dikemudikan. Namun, dalam kasus ini, intersep mungkin tidak ada
artinya. Karena sampel kami tidak menyertakan mobil dengan odometer nol mil, kami tidak memiliki
dasar untuk menafsirkan b0. Sebagai aturan umum, kita tidak dapat menentukan nilai untuk nilai x
yang berada jauh di luar rentang nilai sampel x. Dalam contoh ini, nilai x terkecil dan terbesar
masing-masing adalah 19,1 dan 49,2. Karena x = 0 tidak berada dalam interval ini, kami tidak dapat
dengan aman menginterpretasikan nilai kapan x = 0.

Penting untuk diingat bahwa interpretasi koefisien hanya berkaitan dengan sampel yang terdiri dari
100 pengamatan. Untuk menyimpulkan informasi tentang populasi, kita membutuhkan teknik
inferensi statistik, yang dijelaskan selanjutnya.
Aplikasi SPSS

Masukkan variable dependen dan independent


ke kotak yang sesuai

Klik Statistics…

Continue > OK
Tabel Anova

Sumber variasi Sum of squares Derajat bebas Mean Squares F-hitung


Regresi SSR k MSR = SSR / k MSR/MSE
Eror SSE n-k-1 MSE = SSE / n-k-1
Total SST
k = jumlah variable independen

Persamaan regresi diperoleh dari output Coefficients

Menilai Model

Menilai model : dugaan kesalahan standar

Dari output diperoleh

MSE = 0.107 

Nilai terkecil yang dapat diasumsikan s ε adalah 0, yang terjadi saat SSE = 0, yaitu saat semua titik
jatuh pada garis regresi. Jadi, ketika s ε kecil, kecocokannya sangat baik, dan model linier cenderung
menjadi alat analisis dan peramalan yang efektif. Jika s ε besar, modelnya buruk, dan praktisi statistik
harus memperbaikinya atau membuangnya.

Kita menilai nilai sε dengan membandingkannya dengan nilai variabel dependen y atau lebih khusus
lagi dengan rata-rata sampel . Dalam contoh ini, karena sε = 0,3265 dan , tampaknya
kesalahan standar dugaan adalah kecil. Namun, karena tidak ada batas atas yang ditentukan
sebelumnya pada sε, seringkali sulit untuk menilai model dengan cara ini. Secara umum, kesalahan
standar dugaan tidak dapat digunakan sebagai ukuran absolut dari utilitas model.

Meskipun demikian, sε berguna dalam membandingkan model. Jika praktisi statistik memiliki
beberapa model untuk dipilih, model dengan nilai s ε terkecil umumnya harus digunakan. Seperti
yang akan Anda lihat, sε juga merupakan statistik penting dalam prosedur lain yang terkait dengan
analisis regresi.

Menilai model : Menguji slope (beta1)

Apakah Pembacaan Odometer dan Harga Toyota Camry Bekas Berhubungan?

Uji untuk menentukan apakah terdapat cukup bukti untuk menyimpulkan bahwa terdapat hubungan
linier antara harga lelang dan pembacaan odometer untuk semua Toyota Camrys yang berumur 3
tahun. Gunakan tingkat signifikansi 5%.

Kita menguji hipotesis:

H0: β1 = 0 melawan H1: β1 ≠ 0

Jika hipotesis nol benar, maka tidak ada hubungan linier. Jika hipotesis alternatif benar, ada
beberapa hubungan linier.

Nilai statistik uji adalah t = 13,44, dengan nilai p-value = 0.000 < 0.05. Sehingga dapat dikatakan
bahwa terdapat cukup bukti untuk menyimpulkan bahwa ada hubungan linier. Artinya, pembacaan
odometer dapat mempengaruhi harga jual lelang mobil tersebut.

Kita juga dapat memperoleh informasi tentang hubungan ini dengan menduga interval koefisien
slope. Dalam contoh ini, dugaan interval kepercayaan 95% adalah

(Gunakan formula ini di excel untuk mendapatkan ”=T.INV.2T(0.05,100)”  1.984)

Kami menduga bahwa koefisien slope/kemiringan berada di antara -0,0768 dan -0,0570.

Menilai Model : Koefisien Determinasi

Uji slope β1 hanya membahas pertanyaan apakah ada cukup bukti untuk menyimpulkan bahwa ada
hubungan linier. Namun, dalam banyak kasus, juga diperlukan hal untuk mengukur kekuatan
hubungan linier tersebut, khususnya ketika kita ingin membandingkan beberapa model yang
berbeda. Statistik yang menjalankan fungsi ini adalah koefisien determinasi, yang dilambangkan
dengan R2 (R-square (di SPSS ada di output Model Summary).
Kita mendapatkan bahwa R2 sama dengan 0,6483. Statistik ini memberi tahu kita bahwa 64,83%
variasi harga jual lelang dijelaskan oleh variasi pembacaan odometer. Sisanya 35,17% tidak dapat
dijelaskan. Berbeda dengan nilai statistik uji, koefisien determinasi tidak memiliki nilai kritis yang
memungkinkan kita menarik kesimpulan. Secara umum, semakin tinggi nilai R2, semakin cocok
model dengan data. Dari uji-t 1 kita sudah tahu bahwa ada bukti hubungan linier. Koefisien
determinasi hanya memberi kita ukuran kekuatan hubungan itu.

Memanfaatkan Persamaan Regresi

Dengan menggunakan hasil dari penilaian model, kita dapat menilai seberapa cocok model linier
dengan data. Jika model cocok dengan memuaskan, kita dapat menggunakannya untuk meramalkan
dan mengestimasi nilai variabel dependen.

Sebagai ilustrasi, misalkan dealer mobil bekas ingin memprediksi harga jual Toyota Camry berusia 3
tahun dengan odometer 40 (ribu) mil. Menggunakan persamaan regresi, dengan x = 40, kita
dapatkan

Kami menyebut nilai ini sebagai prediksi titik, dan merupakan estimasi titik atau nilai prediksi
untuk y ketika x = 40. Jadi, dealer akan memprediksi bahwa mobil tersebut akan dijual seharga
$14.574.

Namun, dengan sendirinya, prediksi titik tidak memberikan informasi apa pun tentang seberapa
dekat nilainya dengan harga jual yang sebenarnya. Untuk menemukan informasi itu, kita harus
menggunakan interval. Faktanya, kita dapat menggunakan salah satu dari dua interval:

interval prediksi dari nilai y tertentu atau penduga interval kepercayaan dari nilai ekspektasi y.

Kembali ke contoh odometer

a. Dealer mobil bekas akan menawar Toyota Camry berusia 3 tahun yang dilengkapi dengan
semua fitur standar dan dengan odometer 40.000 (xg = 40) mil. Untuk membantunya
memutuskan berapa banyak penawarannya, maka dia perlu memprediksi harga jual.
b. Dealer mobil bekas yang disebutkan pada bagian (a) memiliki kesempatan untuk menawar
banyak mobil yang ditawarkan oleh perusahaan rental. Perusahaan rental memiliki 250 Toyota
Camry yang semuanya dilengkapi dengan fitur standar. Semua mobil di lot ini memiliki
odometer sekitar 40.000 (xg = 40) mil. Dealer menginginkan perkiraan harga jual semua mobil
di lot ini.

Dari perhitungan sebelumnya diperoleh:


 angka 6.59613 ada di output Descriptive Statistics

Solusi :

a. Dealer ingin memprediksi harga jual sebuah mobil. Jadi, dia harus menggunakan interval
prediksi

Interval prediksi 95% adalah

Batas bawah dan atas interval prediksi masing-masing adalah $13.922 dan $15.226.

Kami memperkirakan bahwa satu mobil akan dijual antara $13.925 dan $15.226.

b. Dealer ingin menentukan harga rata-rata dari banyak mobil, jadi dia perlu menghitung
penduga interval kepercayaan dari suatu nilai harapan:

Estimator interval kepercayaan 95% dari harga rata-rata adalah

Batas bawah dan atas perkiraan interval kepercayaan dari nilai yang diharapkan masing-masing
adalah $14.498 dan 14.650.
Harga jual rata-rata populasi Toyota Camrys yang berusia 3 tahun diperkirakan berkisar antara
$14.498 dan $14.650.

Karena memprediksi harga jual satu mobil lebih sulit daripada memperkirakan harga jual rata-rata
semua mobil sejenis, interval prediksi lebih lebar daripada estimasi interval nilai ekspektasi.

Anda mungkin juga menyukai