STATISTIKA INFERENSIAL
Part 4, Korelasi & Regresi Linier
Tingkat pendapatan 42 48 50 59 65 72
keluarga (x)
Biaya asuransi kesehatan (y) 9 10 8 5 6 3
Penyelesaian
n=6 x y xy x2 y2
Ʃx = 336
42 9 378 1764 61
Ʃy = 41
48 10 480 2304 100
Ʃxy = 2159
Ʃx2 = 19458 50 8 400 2500 64
Ʃy2 = 315 59 5 295 3481 25
65 6 390 4225 36
72 3 216 5184 9
Ʃx = 336 Ʃy = 41 Ʃxy = 2159 Ʃx2 = 19458 Ʃy2 = 315
Artinya, karena r dekat -1, tampak hubungan linier negatif diantara tingkat pendapatan dan
persen biaya untuk asuransi
Pengujian hipotesis koefisien korelasi
Statistik uji:
(rho)
r
Langkah pengujian:
1. Nyatakan hipotesis H0 dan Ha
2. Tentukan tingkat kemaknaan dan df α; n-2
3. Tentukan titik kritis tabel distribusi t
4. Hitung statistik uji
5. Buat daerah keputusan
6. Interpretasikan hasilnya
Contoh Soal
Dengan menggunakan contoh soal sebelumnya →
Dilakukan penelitian untuk menentukan apakah ada hubungan
antara tingkat pendapatan keluarga (dalam ratusan ribu) dengan
persen pendapatan yang dialokasikan untuk biaya asuransi
kesehatan (lihat data sebelumnya).
▪ Kesimpulan:
І thit І > ttabel
H0 ditolak pada tingkat kemaknaan 0,05.
Kesimpulan: terdapat hubungan antara tingkat pendapatan dan persen biaya untuk
asuransi.
Regresi linier sederhana
❑ Suatu teknik yang digunakan untuk membangun suatu persamaan garis
lurus dan menentukan nilai perkiraannya.
❑ Hanya ada 1 variabel X dan 1 variabel Y.
❑ Suatu persamaan garis lurus yang menyatakan hubungan antara
variabel bebas X dan variabel tidak bebas Y, dan digunakan untuk
memperkirakan nilai Y berdasarkan nilai X disebut sebagai PERSAMAAN
REGRESI.
Persamaan regresi
dimana,
a: intersep (nilai dari y untuk x = 0)
b: slope (perubahan dalam y dimana perubahan dari satu unit dalam x)
▪ Prinsip pemilihan garis regresi ini adalah “pilih garis lurus yang terbaik dimana
jumlah kuadrat penyimpangan nilai y yang teramati dari nilai y yang teramal
adalah minimum”.
▪ Misalnya adalah garis yang terbaik, cocok untuk data yang berisi n pasang nilai
(x1, y1), (x2, y2), …, (xn, yn) ini disebut persamaan peramalan.
▪ Bila ei menyatakan simpangan vertikal dari titik ke-i ke garis regresi, maka kuadrat terkecil
menghasilkan rumus untuk menghitung a dan b sehingga jumlah kuadrat simpangan itu
minimum.
▪ Jumlah kuadrat semua simpangan ini disebut jumlah kuadrat galat/error/residual sekitar
garis regresi.
Nilai x dan y yang teramati dan nilai y yang teramal dan
residual
X Nilai y Residual/galat/error
Yang teramati Yang teramal
X1 y1
X2 y2
. . . .
. . . .
. . . .
Xi yi
. . . .
. . . .
. . . .
Xn yn
Prinsip metode kuadrat terkecil
▪ Dari semua kemungkinan garis lurus yang dapat ditarik dari diagram pencar, pilih
garis lurus yang terbaik dimana jumlah kuadrat penyimpangan nilai y yang
teramati dari nilai y yang teramal adalah minimum.
▪ Garis lurus yang diperoleh dengan menggunakan kriteria ini disebut garis regresi
kuadrat terkecil. Nilai a dan b yang menentukan terbaik dapat diperoleh dengan
rumus.
▪ Slope →
▪ Intersep →
Langkah-langkah membuat garis regresi terbaik
Contoh soal
Suatu penelitian dilakukan untuk melihat jumlah jam belajar (menit)
dan nilai mata pelajaran matematika. Data ditampilkan pada tabel
berikut. Buatlah persamaan regresinya.
Penyelesaian 50
40
1. Plot/gambar diagram pencar 30
20
10
0
0 20 40 60 80 100
Perubahan yang
dihasilkan per
peningkatan jam belajar
6. Dari persamaan regresi yang diperoleh, kita perlu dua titik yang ditarik pada garis
lurus. Misalnya x=50 dan x=60; maka nilai yang berhubungan
7. Garis regresi
Latihan soal
Suatu larutan baku yang berfluoresensi ditetapkan kadarnya secara
spektrofluorometri dan didapatkan data sbb:
X = kadar (pg/ml) 0 2 4 6 8 10 12
y = kekuatan 2,1 5,0 9,0 12,6 17,3 21,0 24,7
fluoresensi
Hitunglah slope, intersep, dan koefisien korelasi serta berapakah kadar sampel
yang mempunyai kekuatan fluoresensi 2,9 dan 13,5?