Anda di halaman 1dari 25

11.01.

6008 Metodologi Penelitian & Biostatistika

STATISTIKA INFERENSIAL
Part 4, Korelasi & Regresi Linier

Kartini, M.Si., Apt., Ph.D. kartini@staff.ubaya.ac.id


Area (AU)
- Apakah ada hubungan antara 2
variabel?
- Jika ada, seberapa kuat hubungan
antara 2 variabel tersebut? Kadar (ng/spot)
Regresi
▪ Peneliti sukar membedakan antara regresi san korelasi.
▪ Regresi: teknik statistika yang digunakan untuk mempelajari hubungan fungsional
dari satu atau beberapa variabel bebas terhadap satu variabel tergantung.
▪ Berdasarkan derajat (pangkat) tiap variabel bebas:
a. Regresi linier (pangkatnya 1)
b. Regresi non-linier (pangkatnya bukan 1)
▪ Berdasarkan banyaknya variabel bebas:
a. Regresi sederhana (1 variabel bebas) atau univariat
b. Regresi berganda (> 1 variabel bebas) atau multivariat
Korelasi
Korelasi:
ukuran kekuatan hubungan 2
variabel (tidak harus memiliki
hubungan sebab akibat).
Jenis koefisien korelasi
Skala data Jenis koefisien korelasi
Nominal Koefisien kontingensi
Ordinal Spearman Rank
Kendall Tau
Interval Product Moment = Korelasi Pearson
Ratio Korelasi Parsial
Korelasi Ganda
Koefisien Korelasi Product Moment
− Ukuran kekuatan dan arah dari hubungan linier di antara dua variabel.
− Jika (x1, y1), (x2, y2), …, (xn, yn) adalah n pasangan data, maka koefisien korelasi linier:

− Nilai koefisien korelasi antara -1 sampai +1


◦ Linier positif kuat: r dekat 1
◦ Linier negatif kuat: r dekat -1
◦ Tidak ada hubungan linier atau hubungan linier lemah: r dekat 0
Nilai r Kekuatan hubungan
0,81-1,00 Sangat kuat
0,61-0,80 Kuat
0,41-0,60 Sedang
0,21-0,40 Lemah
0,00-0,20 Sangat lemah
Langkah menghitung koefisien korelasi
1. Gunakan tabel sebagai penolong
2. Hitung jumlah pasangan data n
3. Hitung jumlah nilai x Ʃxi
4. Hitung jumlah nilai y Ʃyi
5. Kalikan setiap nilai x dengan nilai y yang
berhubungan dan kemudian jumlahkan Ʃxiyi
6. Kuadrat setiap nilai x dan jumlahkan Ʃx2
7. Kuadrat setiap nilai y dan jumlahkan Ʃy2
8. Hitung koefisien korelasi
Contoh soal
Dilakukan penelitian untuk menentukan apakah ada hubungan antara
tingkat pendapatan keluarga (dalam ratusan ribu) dengan persen
pendapatan yang dialokasikan untuk biaya asuransi kesehatan. Data
ditampilkan di bawah ini. Hitung koefisien korelasi dan apa yang dapat
anda simpulkan?

Tingkat pendapatan 42 48 50 59 65 72
keluarga (x)
Biaya asuransi kesehatan (y) 9 10 8 5 6 3
Penyelesaian
n=6 x y xy x2 y2
Ʃx = 336
42 9 378 1764 61
Ʃy = 41
48 10 480 2304 100
Ʃxy = 2159
Ʃx2 = 19458 50 8 400 2500 64
Ʃy2 = 315 59 5 295 3481 25
65 6 390 4225 36
72 3 216 5184 9
Ʃx = 336 Ʃy = 41 Ʃxy = 2159 Ʃx2 = 19458 Ʃy2 = 315

Artinya, karena r dekat -1, tampak hubungan linier negatif diantara tingkat pendapatan dan
persen biaya untuk asuransi
Pengujian hipotesis koefisien korelasi
Statistik uji:
 (rho)
r

Langkah pengujian:
1. Nyatakan hipotesis H0 dan Ha
2. Tentukan tingkat kemaknaan dan df α; n-2
3. Tentukan titik kritis tabel distribusi t
4. Hitung statistik uji
5. Buat daerah keputusan
6. Interpretasikan hasilnya
Contoh Soal
Dengan menggunakan contoh soal sebelumnya →
Dilakukan penelitian untuk menentukan apakah ada hubungan
antara tingkat pendapatan keluarga (dalam ratusan ribu) dengan
persen pendapatan yang dialokasikan untuk biaya asuransi
kesehatan (lihat data sebelumnya).

Pertanyaan: apakah terdapat hubungan antara tingkat


pendapatan keluarga dengan pendapatan yang dialokasikan
untuk biaya asuransi kesehatan (α=5%)?
Penyelesaian
Diketahui r = -0,916 dan n = 6
▪ Hipotesis:
H0:  = 0
H1:   0
▪ Tingkat kemaknaan, α = 0,05, df = 6-2 = 4
▪ Titik kritis (two tails): t(0,05; 4) = 2,776
▪ Uji statistik:

▪ Kesimpulan:
І thit І > ttabel
H0 ditolak pada tingkat kemaknaan 0,05.
Kesimpulan: terdapat hubungan antara tingkat pendapatan dan persen biaya untuk
asuransi.
Regresi linier sederhana
❑ Suatu teknik yang digunakan untuk membangun suatu persamaan garis
lurus dan menentukan nilai perkiraannya.
❑ Hanya ada 1 variabel X dan 1 variabel Y.
❑ Suatu persamaan garis lurus yang menyatakan hubungan antara
variabel bebas X dan variabel tidak bebas Y, dan digunakan untuk
memperkirakan nilai Y berdasarkan nilai X disebut sebagai PERSAMAAN
REGRESI.
Persamaan regresi
dimana,
a: intersep (nilai dari y untuk x = 0)
b: slope (perubahan dalam y dimana perubahan dari satu unit dalam x)

Bagaimana menemukan persamaan garis yang dapat METODE


memberikan kesesuaian terbaik pada data, yang
diharapkan selanjutnya akan menghasilkan
KUADRAT
kemungkinan peramalan yang terbaik y dari x? TERKECIL
Metode kuadrat terkecil
▪ Digunakan untuk menentukan persamaan linier estimasi, berarti memilih satu
garis linier dari beberapa kemungkinan garis linier yang dapat dibuat dari data
yang ada yang mempunyai kesalahan (error) paling kecil dari data aktual dengan
data estimasinya.

▪ Prinsip pemilihan garis regresi ini adalah “pilih garis lurus yang terbaik dimana
jumlah kuadrat penyimpangan nilai y yang teramati dari nilai y yang teramal
adalah minimum”.
▪ Misalnya adalah garis yang terbaik, cocok untuk data yang berisi n pasang nilai
(x1, y1), (x2, y2), …, (xn, yn) ini disebut persamaan peramalan.
▪ Bila ei menyatakan simpangan vertikal dari titik ke-i ke garis regresi, maka kuadrat terkecil
menghasilkan rumus untuk menghitung a dan b sehingga jumlah kuadrat simpangan itu
minimum.
▪ Jumlah kuadrat semua simpangan ini disebut jumlah kuadrat galat/error/residual sekitar
garis regresi.
Nilai x dan y yang teramati dan nilai y yang teramal dan
residual
X Nilai y Residual/galat/error
Yang teramati Yang teramal
X1 y1
X2 y2
. . . .
. . . .
. . . .
Xi yi
. . . .
. . . .
. . . .
Xn yn
Prinsip metode kuadrat terkecil
▪ Dari semua kemungkinan garis lurus yang dapat ditarik dari diagram pencar, pilih
garis lurus yang terbaik dimana jumlah kuadrat penyimpangan nilai y yang
teramati dari nilai y yang teramal adalah minimum.
▪ Garis lurus yang diperoleh dengan menggunakan kriteria ini disebut garis regresi
kuadrat terkecil. Nilai a dan b yang menentukan terbaik dapat diperoleh dengan
rumus.
▪ Slope →

▪ Intersep →
Langkah-langkah membuat garis regresi terbaik
Contoh soal
Suatu penelitian dilakukan untuk melihat jumlah jam belajar (menit)
dan nilai mata pelajaran matematika. Data ditampilkan pada tabel
berikut. Buatlah persamaan regresinya.

JUMLAH JAM BELAJAR (MENIT) NILAI MATEMATIKA


x y
30 43
40 45
50 54
60 53
70 56
80 63
70
60

Penyelesaian 50
40
1. Plot/gambar diagram pencar 30
20
10
0
0 20 40 60 80 100

2. Tabel nilai x & y yang teramati dan hasil perhitungan ;


JAM BELAJAR (MENIT) NILAI MATEMATIKA x2 xy
x y
30 43 900 1290
40 45 1600 1800
50 54 2500 2700
60 53 3600 3180
70 56 4900 3920
80 63 6400 5040
Ʃ = 330 Ʃ = 314 Ʃ = 19900 Ʃ = 17930
3. Hitung beberapa nilai:

4. Hitung nilai b dan a

5. Persamaan peramalan adalah

Hasil yang teramal Hasil yang fixed Jam belajar

Perubahan yang
dihasilkan per
peningkatan jam belajar
6. Dari persamaan regresi yang diperoleh, kita perlu dua titik yang ditarik pada garis
lurus. Misalnya x=50 dan x=60; maka nilai yang berhubungan

Untuk x = 50, = 31,593 + 0,377 (50) = 50,443


x = 60, = 31,593 + 0,377 (60) = 54,213
dua titik (50; 50,443) dan (60; 54,213)

7. Garis regresi
Latihan soal
Suatu larutan baku yang berfluoresensi ditetapkan kadarnya secara
spektrofluorometri dan didapatkan data sbb:

X = kadar (pg/ml) 0 2 4 6 8 10 12
y = kekuatan 2,1 5,0 9,0 12,6 17,3 21,0 24,7
fluoresensi

Hitunglah slope, intersep, dan koefisien korelasi serta berapakah kadar sampel
yang mempunyai kekuatan fluoresensi 2,9 dan 13,5?

Anda mungkin juga menyukai