Anda di halaman 1dari 31

ANALISIS KORELASI DAN

REGRESI LINIER SEDERHANA

Pertemuan ke 12 – 13
ANALISIS KORELASI
ALAT ANALISIS KETERKAITAN
• Ditentukan oleh:
1. Skala pengukuran data/variabel
2. Jenis hubungan antar variabel
Relationship Numerik Kategorik
Numerik Korelasi Pearson, Spearman Tabel Ringkasan

Kategorik Tabel Ringkasan Spearman (ordinal),


Chi Square

Causal relationship
X
Numerik Kategorik
Y
Numerik Regresi Linier ANOVA
Kategorik Regresi Logistik Regresi Logistik
ANALISIS KORELASI
Digunakan untuk mengukur atau menganalisis keeratan hubungan
linier antar dua peubah metrik.
Tidak menggambarkan hubungan sebab akibat.
Notasi koefisien korelasi untuk data populasi yaitu , sedangkan
dugaan koefisien korelasi yang dihitung dari data contoh dinotasikan
dengan r.
Nilai koefisien korelasi berkisar antara -1 sampai 1 (-1 ≤ r ≤ 1)
ANALISIS KORELASI (CONT.)
Nilai r yang mendekati -1 atau 1, menunjukkan semakin erat hubungan linier
antara kedua peubah tersebut.
tanda (+) / (-)  arah hubungan
- (+) searah  artinya jika nilai dari peubah x naik, maka nilai dari peubah y juga akan naik;
- (-) beralawanan arah  artinya jika nilai dari peubah x naik, maka nilai dari peubah y akan turun.
Nilai r yang mendekati 0, menggambarkan hubungan kedua peubah tersebut
tidak linier.
Pearson’s Coef of Correlation  linear relationship
Spearman’n Coef of Correlation (rank correlation)  trend relationship
KORELASI

r=1 r=0

r=0 r=0
CORRELATION
KOEFISIEN KORELASI PEARSON ()

; dengan
UJI KORELASI
H0 : H1 :
Statistik hitung:

Statistik uji:
Kriteria penolakan: Tolak H0 jika atau
𝑡 h𝑖𝑡 >𝑡 𝛼 / 2( n −2) 𝑡 h𝑖𝑡 <−𝑡 𝛼/ 2 ( n −2)
UJI KORELASI
H0 : H1 :
Statistik uji:
Kriteria penolakan: Tolak H0 jika 𝑡 h𝑖𝑡 <−𝑡 𝛼 (n −2)

H0 : H1 :
Statistik uji:
𝑡 h𝑖𝑡 >𝑡 𝛼 ( n −2)
Kriteria penolakan: Tolak H0 jika
LATIHAN SOAL
Hitung korelasi antara waktu belajar (X; menit) dengan nilai kuis (Y;). Data
sebanyak 9 mahasiswa diambil secara acak dari populasi suatu kelas. Ujilah
apakah korelasi tersebut nyata secara statistika. Apakah dapat disimpulkan
bahwa jika waktu belajarnya lebih lama maka nilai kuisnya lebih tinggi?
Jelaskan jawaban saudara.
X 15 42 55 70 90 110 30 120 140
Y 10 40 50 65 80 85 30 90 100
MENGGAMBAR SCATTERPLOT DAN
MENGHITUNG NILAI KORELASI
MENGGUNAKAN MS. EXCEL
Video : https://youtu.be/oeTobrN5C8w
Hasil :
120

100 Diperoleh r = 0,982

80
Nilai Kuis

60

40 Nilai r mendekati 1, menunjukkan bahwa antara peubah


Waktu belajar dengan nilai kuis memiliki hubungan linier
20
positif kuat. Artinya, disimpulkan bahwa jika waktu
0 belajarnya lebih lama maka Nilai Kuisnya lebih tinggi
0 20 40 60 80 100 120 140 160
Waktu Belajar
UJI SIGNIFIKANSI NILAI
KORELASI MENGGUNAKAN
SPSS
Video : https://youtu.be/vaWvy_1PjBI
Hasil :
Diperoleh nilai r = 0,982 dan nilai sig. sebesar 0,000. Jika
kita gunakan
H0 : 𝜌=0 H1 : 𝜌≠0
dengan taraf nyata α = 5%, maka nilai sig. yang diperoleh <
5%, sehingga keputusannya adalah Tolak H0. Hal ini
menunjukkan bahwa pada tarf nyata sebesar 5%, cukup bukti
untuk menyatakan bahwa antara peubah waktu belajar dan
nilai kuis memiliki hubungan (korelasi) yang nyata.
ANALISIS REGRESI
LINIER SEDERHANA
DEFINISI
Linear : linear dalam parameter
Sederhana : hanya satu peubah penjelas
Berganda : lebih dari satu peubah penjelas
Analisis regresi merupakan studi ketergantungan satu atau lebih peubah
bebas (penjelas) terhadap peubah tidak bebas.
MODEL REGRESI LINIER
SEDERHANA:
Yi   0  1 X i   i ; i  1,2,..., n
Keterangan:
 Yi : nilai Peubah bergantung pengamatan ke-i
 β0 : intersep, yaitu menunjukkan besarnya nilai Y, ketika X = 0
 β1 : slope, yaitu menunjukkan perubahan nilai Y untuk setiap perubahan 1 satuan X
 Xi : nilai Peubah bebas pengamatan ke-i
 : galat pengamatan ke-i
Nilai b0 menunjukkan nilai rata-rata dugaan Y ketika X = 0, sedangkan nilai
b1 menunjukkan perubahan nilai rata-rata dugaan Y untuk setiap
perubahan 1 satuan X.
CONTOH PENERAPAN
ANALISIS REGRESI
1. Analisis Regresi antara tinggi orang tua terhadap tinggi anaknya
(Gultom).
2. Analisis Regresi antara pendapatan terhadap konsumsi rumah
tangga.
3. Analisis Regresi antara harga terhadap penjualan barang.
4. Analisis Regresi antara tingkat upah terhadap tingkat pengangguran.
5. Analisis Regresi antara tingkat suku bunga bank terhadap harga
saham
6. Analisis Regresi antara biaya periklanan terhadap volume penjualan
perusahaan.
PERBEDAAN MENDASAR
ANTARA KORELASI DAN
REGRESI ?
Korelasi Regresi
Korelasi hanya menunjukkan sekedar Regresi menunjukkan hubungan
hubungan. pengaruh.
Dalam korelasi variabel tidak ada istilah Dalam regresi terdapat istilah tergantung
tergantung dan variabel bebas. dan variabel bebas.
ISTILAH DAN NOTASI
VARIABEL DALAM REGRESI
Y X
Variabel tergantung (Dependent Variabel bebas (Independent Variable)
Variable)
Variabel yang menjelaskan
Variabel yang dijelaskan (Explained (Explanatory Variable)
Variable)
Variabel peramal (Predictor)
Variabel yang diramalkan
(Predictand) Variabel yang meregresi (Regressor)
Variabel yang diregresi (Regressand) Variabel perangsang atau kendali
(Stimulus or control variable)
Variabel Tanggapan (Response)
PERSAMAAN GARIS REGRESI
UNTUK DATA CONTOH

𝑆 𝑥𝑦
1= 2
(𝑆 𝑥 )
(∑ 𝑥 )(∑ 𝑦 )

2

𝑆 𝑥𝑦 =( ∑ 𝑥𝑦 ) −
(∑ 𝑥 )
𝑛 𝑆 𝑥= ( ∑ 𝑥2 ) − 𝑛

Video cara penghitungan dapat dilihat di


https://youtu.be/aJGdvEyThQM
PENGUJIAN HIPOTESIS
Uji F / uji simultan / uji keseluruhan ( disebut juga sebagai Analisis ragam /
ANOVA): uji ketepatan model, apakah nilai dugaan mampu menggambarkan
kondisi sesungguhnya.
Hipotesis:
H0 : ; (Model yang dibentuk tidak mampu menggambarkan kondisi
sesungguhnya)
H1 : ≠ 0
Interpretasi H0 ditolak yaitu model yang dibentuk sudah tepat, nilai dugaan
mampu menggambarkan kondisi sesungguhnya.
TABEL ANOVA (ANALYSIS OF
VARIANCE)
Sumber Derajat bebas Jumlah Kuadrat Kuadrat Tengah Fhit Ftabel
Keragaman (SK) (db) / df (JK) / SS (KT) / MS
Regresi 1 JKR = KTR=JKR/dbR KTR/KTG F(0.05;(1,n-2))
Galat n-2 JKG=JKT-JKR KTG=JKG/(n-2)
Total n-1 JKT=

𝑛
2
𝑛 (∑ 𝑦 𝑖 )
𝑆 𝑆 𝑦 =∑ 𝑦 𝑖 −
2 𝑖 =1

𝑖 =1 𝑛

Tolak H0 jika Fhit ≥ Ftabel


PENGUJIAN HIPOTESIS
Uji t (uji parsial) : Digunakan untuk mengatahui pengaruh peubah bebas
terhadap peubah tak bebas.
1) Hipotesis:
H0 : vs H1 :
Statistik hitung:
dimana
Ho ditolak jika |thitung| ≥ t(0.025;n-2)
2) H0 : vs H1 : 3) H0 : vs H1 :
Statistik hitung: Statistik hitung:
dimana dimana
Ho ditolak jika thitung ≥ t(0.05;n-2) Ho ditolak jika thitung t(0.05;n-2)
CONTOH KASUS:
Seorang guru BK akan meneliti apakah terdapat pengaruh
modalitas belajar terhadap tingkat konsentasi (%) pada
siswa kelas VI. Pada penelitian ini diambil contoh sebanyak
8 siswa/i.

Tingkat konsentrasi (Y) 64 61 84 70 88 92 72 77

Modalitas belajar (X) 2 1,6 3,4 2,3 2,7 3,2 1,8 2,2
REGRESI LINIER SEDERHANA
MENGGUNAKAN MS. EXCEL
Berdasarkan Tabel Coefficients ini maka diperoleh persamaan
Video : https://youtu.be/1JYt6ujY7LE regresi linier sederhana sebagai berikut:
Tingkat Konsentrasi = 40,082 + 14,966 Modalitas Belajar + ε
Hasil :
Coefficients Standard Error t Stat P-value
Intercept 40,08163265 8,889550951 4,508847846 0,004065471
Modalitas belajar (X) 14,96598639 3,591188184 4,167419145 0,005895457

ANOVA
df SS MS F Berdasarkan Tabel Anova, diperoleh nilai F-
hitung sebesar 17,367. Selanjutnya cari nilai
Regression 1 658,5034014 658,5034014 17,36738233
F-tabel utk α 5% dengan v1=1, v2=6 
Residual 6 227,4965986 37,91609977 5,987. Karena Fhit > Ftabel maka
Total 7 886 keputasanya Tolak H0. Artinya, dapat
disimpulkan bahwa pada taraf yata 5%,
Modalitas Belajar berpengaruh terhadap
Konsentrasi belajar.
KOEFISIEN DETERMINASI
Koefesien determinasi:
JKR
R2 
JKT

Regression Statistics
Interpretasi:
Multiple R 0,862108943
R Square 0,74323183 nilai R2 = 74,3% menunjukkan bahwa
Adjusted R Square 0,700437135 keragaman “Tingkat Konsentrasi” yang mampu dijelaskan oleh
Standard Error 6,157605036 “Modalitas belajar” adalah sebesar 74,3%, sedangkan sisanya
Observations 8 sebesar 26,7% dijelaskan oleh faktor lain yang tidak
dimasukkan ke dalam model.
SOAL
Data mengenai IQ sebanyak 9 siswa diambil secara acak dari populasi siswa SMA Jakarta.
Selanjutnya diteliti berapa menit waktu yang dibutuhkan oleh setiap siswa dalam mengerjakan
1 soal yang diberikan. Berikut ini datanya:
Nilai IQ 80 102 115 125 105 85 90 110 120
Waktu pengerjaan 30 20 15 10 17 25 22 16 11

a. Tentukanlah mana peubah X dan peubah Y-nya?


b. Buatlah scatterplot antara IQ dengan Waktu Pengerjaan? Berdasarkan scatterplot yang
diperoleh, bagaimanakah hubungan antara IQ dan Waktu Pengerjaan?
c. Dugalah persamaan garis regresi antara IQ dan Waktu Pengerjaan.
d. Ujilah apakah model regresi tersebut sudah fit (mampu menduga Waktu Pengerjaan dengan
baik).  gunakan uji F (ANOVA)
e. Apakah dapat disimpulkan bahwa semakin tinggi IQ seseorang, semakin cepat dalam
mengerjakan soal?

Anda mungkin juga menyukai