UIJ Korelasi Dan Regresi Linier Sederhana

KORELASI
Universitas Islam Jakarta
Analisis korelasi digunakan untuk mengukur kekuatan hubungan/asosiasi linier diantara dua variabel
 Hanya mengenai kekuatan suatu hubungan
 Tidak ada unsur sebab akibat
Koefisien korelasi populasi disimbolkan dengan ρ
Koefisien korelasi sampel disimbolkan dengan r
Properti dari ρ dan r
 Bebas satuan
 Rentang antara -1 dan 1
 Semakin dekat ke -1, semakin kuat hubungan linear negatifnya
 Semakin mendekati 1, semakin kuat hubungan linear positifnya
 Semakin mendekati 0, semakin lemah hubungan linearnya
Interpretasi korelasi
r2 |r| Arti
0 0 Tidak ada korelasi
0 – 0.25 0 – < 0.5 Korelasi lemah
0.25 – 0.64 0.5 – < 0.8 Korelasi moderat
0.64 – 1 0.8 – < 1 Korelasi kuat
1 1 Korelasi sempurna
Source : Statistical Analysis of Data, Anderson & Scolve
Formula
atau
Contoh :
Pembacaan Odometer dan Harga Bekas Toyota Camry

Dealer mobil di seluruh Amerika Utara menggunakan apa yang disebut Buku Biru untuk membantu
mereka menentukan nilai mobil bekas yang di tukar tambah kan oleh pelanggan mereka saat
membeli mobil baru. Buku yang diterbitkan setiap bulan ini mencantumkan nilai tukar tambah untuk
semua model dasar mobil. Ini memberikan nilai alternatif untuk setiap model mobil sesuai dengan
kondisi dan fitur opsionalnya. Nilai tersebut ditentukan berdasarkan rata-rata yang dibayarkan pada
lelang mobil bekas baru-baru ini yang adalah sumber pasokan bagi banyak dealer mobil bekas.
Namun, Buku Biru tidak menunjukkan nilai yang ditentukan oleh pembacaan odometer, meskipun
faktor penting bagi pembeli mobil bekas adalah seberapa jauh mobil tersebut telah dikendarai.
Untuk mengkaji masalah ini, sebuah dealer mobil bekas secara acak memilih 100 Toyota Camry
berusia 3 tahun yang dilelang selama sebulan terakhir. Setiap mobil berada dalam kondisi prima dan
dilengkapi dengan semua fitur yang menjadi standar mobil ini. Dealer mencatat harga ($1000) dan
jumlah mil (ribuan) pada odometer. Beberapa dari data ini tercantum di sini. Dealer ingin
mengetahui apakah pembacaan odometer dan harga Toyota Camry bekas berhubungan linear?
Car Price ($1,000) Odometer (1,000 mi)
1 14.6 37.4
2 14.1 44.8
3 14.0 45.8
… … …
98 14.5 33.2
99 14.7 39.2
100 14.3 36.4
Dari data diperoleh
; ;
; ;
Menguji korelasi
• H0 : ρ = 0 (Tidak ada korelasi linier)
• H1 : ρ  0 (Ada korelasi linier)

Statistic uji (t-hitung):
Nilai t-hitung ini dibandingkan dengan t-tabel (tersedia di buku-buku statistika)
Atau pake p-value jika menggunakan software seperti SPSS
Aplikasi korelasi pada SPSS
Masukkan variabel yang akan dihitung

korelasinya
OK
p-value = 0.000 < α = 0.05  tolak H0
Terdapat bukti hubungan linier antara harga dan odometer.

REGRESI LINIER SEDERHANA
Universitas Islam Jakarta
Analisis Regresi digunakan untuk:
 Memprediksi nilai dari suatu variabel dependen berdasarkan nilai dari paling tidak satu
variabel independen.
 Menjelaskan pengaruh dari perubahan pada variabel independen terhadap variabel

dependen.
Variabel dependen : variabel yang ingin diprediksi atau dijelaskan
Variabel Independen : variabel yang digunakan untuk menjelaskan variabel dependen
Dalam regresi linier sederhana:
 Hanya satu variabel bebas, X

 Hubungan antara X dan Y digambarkan dengan fungsi linier
 Perubahan Y diasumsikan disebabkan oleh perubahan X
 Persamaan regresi linier sederhana memberikan suatu estimasi populasi dari suatu garis
regresi
Contoh
Perhatikan kembali contoh Pembacaan Odometer dan Harga Bekas Toyota Camry. Bagaimana jika
dealer ingin menemukan garis regresinya?
Y = harga
X = odometer
Persamaan regresi:
Mendapatkan b1 secara manual
atau
Dari data :
Mendapatkan b0 secara manual
Persamaan regresi:
Koefisien kemiringan b1 adalah 0,0669, yang berarti bahwa untuk setiap tambahan 1.000 mil pada
odometer, harga turun rata-rata sebesar $0,0669 ribu. Sederhananya, kemiringan menunjukkan
bahwa untuk setiap mil tambahan pada odometer, harga turun rata-rata sebesar $0,0669 atau 6,69
sen.
Intersep b0 adalah 17.250. Secara teknis, intersep adalah titik di mana garis regresi dan sumbu y
berpotongan. Ini berarti bahwa ketika x = 0 (yaitu mobil tidak dikemudikan sama sekali) harga
jualnya adalah $17.250 ribu atau $17.250. Kita mungkin tergoda untuk mengartikan angka ini
sebagai harga mobil yang belum dikemudikan. Namun, dalam kasus ini, intersep mungkin tidak ada
artinya. Karena sampel kami tidak menyertakan mobil dengan odometer nol mil, kami tidak memiliki
dasar untuk menafsirkan b0. Sebagai aturan umum, kita tidak dapat menentukan nilai untuk nilai x
yang berada jauh di luar rentang nilai sampel x. Dalam contoh ini, nilai x terkecil dan terbesar
masing-masing adalah 19,1 dan 49,2. Karena x = 0 tidak berada dalam interval ini, kami tidak dapat
dengan aman menginterpretasikan nilai kapan x = 0.
Penting untuk diingat bahwa interpretasi koefisien hanya berkaitan dengan sampel yang terdiri dari
100 pengamatan. Untuk menyimpulkan informasi tentang populasi, kita membutuhkan teknik
inferensi statistik, yang dijelaskan selanjutnya.
Aplikasi SPSS
Masukkan variable dependen dan independent

ke kotak yang sesuai
Klik Statistics…
Continue > OK
Tabel Anova
Sumber variasi Sum of squares Derajat bebas Mean Squares F-hitung

Regresi SSR k MSR = SSR / k MSR/MSE
Eror SSE n-k-1 MSE = SSE / n-k-1
Total SST
k = jumlah variable independen
Persamaan regresi diperoleh dari output Coefficients
Menilai Model
Menilai model : dugaan kesalahan standar
Dari output diperoleh
MSE = 0.107 
Nilai terkecil yang dapat diasumsikan s ε adalah 0, yang terjadi saat SSE = 0, yaitu saat semua titik
jatuh pada garis regresi. Jadi, ketika s ε kecil, kecocokannya sangat baik, dan model linier cenderung
menjadi alat analisis dan peramalan yang efektif. Jika s ε besar, modelnya buruk, dan praktisi statistik
harus memperbaikinya atau membuangnya.
Kita menilai nilai sε dengan membandingkannya dengan nilai variabel dependen y atau lebih khusus
lagi dengan rata-rata sampel . Dalam contoh ini, karena sε = 0,3265 dan , tampaknya
kesalahan standar dugaan adalah kecil. Namun, karena tidak ada batas atas yang ditentukan
sebelumnya pada sε, seringkali sulit untuk menilai model dengan cara ini. Secara umum, kesalahan
standar dugaan tidak dapat digunakan sebagai ukuran absolut dari utilitas model.
Meskipun demikian, sε berguna dalam membandingkan model. Jika praktisi statistik memiliki
beberapa model untuk dipilih, model dengan nilai s ε terkecil umumnya harus digunakan. Seperti
yang akan Anda lihat, sε juga merupakan statistik penting dalam prosedur lain yang terkait dengan
analisis regresi.
Menilai model : Menguji slope (beta1)
Apakah Pembacaan Odometer dan Harga Toyota Camry Bekas Berhubungan?
Uji untuk menentukan apakah terdapat cukup bukti untuk menyimpulkan bahwa terdapat hubungan
linier antara harga lelang dan pembacaan odometer untuk semua Toyota Camrys yang berumur 3
tahun. Gunakan tingkat signifikansi 5%.
Kita menguji hipotesis:
H0: β1 = 0 melawan H1: β1 ≠ 0
Jika hipotesis nol benar, maka tidak ada hubungan linier. Jika hipotesis alternatif benar, ada
beberapa hubungan linier.
Nilai statistik uji adalah t = 13,44, dengan nilai p-value = 0.000 < 0.05. Sehingga dapat dikatakan
bahwa terdapat cukup bukti untuk menyimpulkan bahwa ada hubungan linier. Artinya, pembacaan
odometer dapat mempengaruhi harga jual lelang mobil tersebut.
Kita juga dapat memperoleh informasi tentang hubungan ini dengan menduga interval koefisien
slope. Dalam contoh ini, dugaan interval kepercayaan 95% adalah
(Gunakan formula ini di excel untuk mendapatkan ”=T.INV.2T(0.05,100)”  1.984)
Kami menduga bahwa koefisien slope/kemiringan berada di antara -0,0768 dan -0,0570.
Menilai Model : Koefisien Determinasi
Uji slope β1 hanya membahas pertanyaan apakah ada cukup bukti untuk menyimpulkan bahwa ada
hubungan linier. Namun, dalam banyak kasus, juga diperlukan hal untuk mengukur kekuatan
hubungan linier tersebut, khususnya ketika kita ingin membandingkan beberapa model yang
berbeda. Statistik yang menjalankan fungsi ini adalah koefisien determinasi, yang dilambangkan
dengan R2 (R-square (di SPSS ada di output Model Summary).
Kita mendapatkan bahwa R2 sama dengan 0,6483. Statistik ini memberi tahu kita bahwa 64,83%
variasi harga jual lelang dijelaskan oleh variasi pembacaan odometer. Sisanya 35,17% tidak dapat
dijelaskan. Berbeda dengan nilai statistik uji, koefisien determinasi tidak memiliki nilai kritis yang
memungkinkan kita menarik kesimpulan. Secara umum, semakin tinggi nilai R2, semakin cocok
model dengan data. Dari uji-t 1 kita sudah tahu bahwa ada bukti hubungan linier. Koefisien
determinasi hanya memberi kita ukuran kekuatan hubungan itu.
Memanfaatkan Persamaan Regresi
Dengan menggunakan hasil dari penilaian model, kita dapat menilai seberapa cocok model linier
dengan data. Jika model cocok dengan memuaskan, kita dapat menggunakannya untuk meramalkan
dan mengestimasi nilai variabel dependen.
Sebagai ilustrasi, misalkan dealer mobil bekas ingin memprediksi harga jual Toyota Camry berusia 3
tahun dengan odometer 40 (ribu) mil. Menggunakan persamaan regresi, dengan x = 40, kita
dapatkan
Kami menyebut nilai ini sebagai prediksi titik, dan merupakan estimasi titik atau nilai prediksi
untuk y ketika x = 40. Jadi, dealer akan memprediksi bahwa mobil tersebut akan dijual seharga
$14.574.
Namun, dengan sendirinya, prediksi titik tidak memberikan informasi apa pun tentang seberapa
dekat nilainya dengan harga jual yang sebenarnya. Untuk menemukan informasi itu, kita harus
menggunakan interval. Faktanya, kita dapat menggunakan salah satu dari dua interval:
interval prediksi dari nilai y tertentu atau penduga interval kepercayaan dari nilai ekspektasi y.
Kembali ke contoh odometer
a. Dealer mobil bekas akan menawar Toyota Camry berusia 3 tahun yang dilengkapi dengan
semua fitur standar dan dengan odometer 40.000 (xg = 40) mil. Untuk membantunya
memutuskan berapa banyak penawarannya, maka dia perlu memprediksi harga jual.
b. Dealer mobil bekas yang disebutkan pada bagian (a) memiliki kesempatan untuk menawar
banyak mobil yang ditawarkan oleh perusahaan rental. Perusahaan rental memiliki 250 Toyota
Camry yang semuanya dilengkapi dengan fitur standar. Semua mobil di lot ini memiliki
odometer sekitar 40.000 (xg = 40) mil. Dealer menginginkan perkiraan harga jual semua mobil
di lot ini.
Dari perhitungan sebelumnya diperoleh:

 angka 6.59613 ada di output Descriptive Statistics
Solusi :
a. Dealer ingin memprediksi harga jual sebuah mobil. Jadi, dia harus menggunakan interval
prediksi
Interval prediksi 95% adalah
Batas bawah dan atas interval prediksi masing-masing adalah $13.922 dan $15.226.
Kami memperkirakan bahwa satu mobil akan dijual antara $13.925 dan $15.226.
b. Dealer ingin menentukan harga rata-rata dari banyak mobil, jadi dia perlu menghitung
penduga interval kepercayaan dari suatu nilai harapan:
Estimator interval kepercayaan 95% dari harga rata-rata adalah
Batas bawah dan atas perkiraan interval kepercayaan dari nilai yang diharapkan masing-masing
adalah $14.498 dan 14.650.
Harga jual rata-rata populasi Toyota Camrys yang berusia 3 tahun diperkirakan berkisar antara
$14.498 dan $14.650.
Karena memprediksi harga jual satu mobil lebih sulit daripada memperkirakan harga jual rata-rata
semua mobil sejenis, interval prediksi lebih lebar daripada estimasi interval nilai ekspektasi.

UIJ Korelasi Dan Regresi Linier Sederhana

Diunggah oleh

Informasi Dokumen

Judul Asli

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

UIJ Korelasi Dan Regresi Linier Sederhana

Diunggah oleh

Hak Cipta:

Format Tersedia

KORELASI

Universitas Islam Jakarta

 Hanya mengenai kekuatan suatu hubungan

 Tidak ada unsur sebab akibat

Koefisien korelasi populasi disimbolkan dengan ρ

Koefisien korelasi sampel disimbolkan dengan r

Properti dari ρ dan r

Pembacaan Odometer dan Harga Bekas Toyota Camry

Car Price ($1,000) Odometer (1,000 mi)

100 14.3 36.4

Dari data diperoleh

• H0 : ρ = 0 (Tidak ada korelasi linier)

• H1 : ρ  0 (Ada korelasi linier)

Nilai t-hitung ini dibandingkan dengan t-tabel (tersedia di buku-buku statistika)

Atau pake p-value jika menggunakan software seperti SPSS

Aplikasi korelasi pada SPSS

Masukkan variabel yang akan dihitung

p-value = 0.000 < α = 0.05  tolak H0

Terdapat bukti hubungan linier antara harga dan odometer.

Universitas Islam Jakarta

Analisis Regresi digunakan untuk:

 Menjelaskan pengaruh dari perubahan pada variabel independen terhadap variabel

Variabel dependen : variabel yang ingin diprediksi atau dijelaskan

Variabel Independen : variabel yang digunakan untuk menjelaskan variabel dependen

Dalam regresi linier sederhana:

 Hanya satu variabel bebas, X

Mendapatkan b1 secara manual

Mendapatkan b0 secara manual

Masukkan variable dependen dan independent

Sumber variasi Sum of squares Derajat bebas Mean Squares F-hitung

Persamaan regresi diperoleh dari output Coefficients

Menilai model : dugaan kesalahan standar

Dari output diperoleh

Menilai model : Menguji slope (beta1)

Apakah Pembacaan Odometer dan Harga Toyota Camry Bekas Berhubungan?

Kita menguji hipotesis:

H0: β1 = 0 melawan H1: β1 ≠ 0

(Gunakan formula ini di excel untuk mendapatkan ”=T.INV.2T(0.05,100)”  1.984)

Menilai Model : Koefisien Determinasi

Memanfaatkan Persamaan Regresi

Kembali ke contoh odometer

Dari perhitungan sebelumnya diperoleh:

Interval prediksi 95% adalah

Estimator interval kepercayaan 95% dari harga rata-rata adalah

Anda mungkin juga menyukai