Anda di halaman 1dari 16

MODUL ANALISIS PREDIKSI DATA KESEHATAN

(HIM 616)

MODUL SESI 3
ANALISIS KORELASI DAN REGRESI LINIER BERGANDA

DISUSUN OLEH
MIEKE NURMALASARI, M.Si, M.Sc

UNIVERSITAS ESA UNGGUL


2020

Universitas Esa Unggul


http://esaunggul.ac.id 0 / 16
ANALISIS KORELASI DAN REGRESI LINIER BERGANDA

A. Kemampuan Akhir Yang Diharapkan

Setelah mempelajari modul ini, diharapkan mahasiswa mampu :


1. Memahami konsep analisis korelasi dan regresi berganda
2. Membuat persamaan regresi
3. Mengintepretasikan koefisien korelasi dan regresi

B. Uraian dan Contoh

1. Pendahuluan

Pada mata kuliah sebelumnya telah dijelaskan mengenai hubungan


antara dua variabel serta mengetahui pengaruh suatu variabel terhadap
variabel lain. Hubungan dan pengaruh dari dua variabel tersebut bermanfaat
untuk mengetahui kondisi atau dampak yang terjadi akibat adanya perubahan
suatu variabel terhadap variabel lain, sehingga dapat disusun suatu rencana
dalam menghadapi dampak tersebut.
Pada kehidupan nyata, banyak kasus yang memerlukan pengetahuan
tentang hubungan tersebut tidak hanya dipengaruhi oleh satu faktor saja
melainkan lebih. Oleh sebab itu pada modul ini akan dipelajari tentang analisis
korelasi berganda dan analisis regresi berganda untuk mengetahui hubungan
dan pengaruh dari beberapa variabel bebas (independent variable) terhadap
variabel terikat (dependent variable).
Pada materi ini akan dipelajari konsep dasar analisa korelasi dana
analisa regresi berganda sebagai landasan dalam membuat model untuk
keperluan prediksi atau peramalan. Selain itu, akan diajarkan perhitungan
secara manual dan menggunakan perangkat pengolah data untuk menghitung
koefisien korelasi ganda dan parsial, koefisien regresi inier ganda dan koefisien
determinasi. Materi juga mencakup pengujian hipotesis koefisien korelasi dan
regresi ganda serta dapat menganalisa hasil peramalan dan kemudian
menginterpretasikannya.

Universitas Esa Unggul


http://esaunggul.ac.id 1 / 16
2. Konsep Dasar Analisis Regresi

Sebelumnya akan diulas kembali tentang analisis regresi sederhana


dengan rumus umum:

Persamaan ini mempunyai satu variabel bebas (X) dan satu variabel
tidak bebas (Y). Pada kenyataannya dalam kehidupan sehari-hari seringkali
nilai Y tidak hanya dipengaruhi oleh satu variabel bebas saja. Jika kita
memperhatikan pengaruh dari dua atau lebih faktor (variabel bebas) lainnya
maka kita gunakan analisis regresi berganda. Sehingga bentuk umum
persamaan regresi dengan k-variabel bebas dapat dimodelkan sebagai berikut:

Estimasi Koefisien Regresi


Ada beberapa cara pendekatan dalam menghitung koefisien regresi
berganda, diantaranya melalui pemecahan persamaan normal dan pendekatan
matriks. Pada modul ini akan dibahas satu pendekatan saja yaitu melalui
penyelesaian persamaan normal dan untuk model regresi dengan dua variabel
bebas. Persamaan model regresi berganda dengan dua variabel bebas adalah
sebagai berikut:

Maka estimasi keofisien regresinya adalah sebagai berikut:

Dengan:

Universitas Esa Unggul


http://esaunggul.ac.id 2 / 16
3. Pengujian Hipotesis terhadap Koefisien Regresi
Pengujian hipotesis koefisien regresi dilakukan untuk melihat pengaruh
dari setiap variabel bebas terhadap variabel tidak bebasnya apakah
berpengaruh secara signifikan atau tidak. Berikut ini langkah-langkah dalam
melakukan pengujian hipotesis koefisien regresi berganda:

Langkah 1. Rumuskan Hipotesis


H0 : k = 0 ; dimana k = 0, 1, 2,…, k
H1 : k  0 ( Bisa juga H1 > 0 atau H1 < 0 , tergantung kasusnya)

Langkah 2: Menghitung statistik uji

Dimana: k = 0, 1, 2, …, k

Langkah 3: Menentukan nilai kritis dari tabel sesuai dengan tingkat nyata ()

Langkah 4. Menarik kesimpulan


Jika thitung > ttabel, maka keputusannya adalah TOLAK H0
Jika thitung < ttabel, maka keputusannya adalah TERIMA H0

Pengujian Hipotesis terhadap Persamaan Model Regresi


Pengujian terhadap model regresi ini merupakan uji koefisien regresi
secara simultan atau bersama-sama. Tujuan dari melakukan pengujian model
regresi adalah untuk mengetahui kelayakan dari model regresi yang kita buat.
Dalam perhitungannya kita membutuhkan analisis varians atau Analysis of
Variance (ANOVA).

Universitas Esa Unggul


http://esaunggul.ac.id 3 / 16
Langkah 1. Rumuskan hipotesis
H0 : 0 = 1 = 2 =…= k = 0 ; dimana k = 0, 1, 2,…, k
H1 : k  0 (paling tidak ada satu nilai k yang tidak sama dengan 0)
Dengan kata lain bisa juga hipotesanya sebagai berikut:
H0 : 0 = 1 = 2 =…= k = 0
(tidak ada pengaruh yang signifikan Xk terhadap Y)
H1 : k  0 (paling sedikit ada satu variabel X yang mempengaruhi secara
signifikan variabel Y)
Langkah 2: Menghitung statistik uji
Tabel ANOVA
Sumber df Jumlah Kuadrat Mean Fhitung
Variasi Square
Regresi k- 1

Residual n-k JKT - JKregresi

Total n-1

Atau bisa dijabarkan sebagai berikut:

Langkah 3: Menentukan nilai kritis dari tabel sesuai dengan tingkat nyata ()

Langkah 4. Mengambil Keputusan dan Menarik kesimpulan


Jika thitung > ttabel, maka keputusannya adalah TOLAK H0
Jika thitung < ttabel, maka keputusannya adalah TERIMA H0

Universitas Esa Unggul


http://esaunggul.ac.id 4 / 16
4. Koefisien Determinasi dan Korelasi Berganda
Koefisien Determinasi Berganda
Koefisien determinasi (R2) adalah menjelaskan seberapa besar pengaruh
variabel bebas (X) terhadap variabel tidak bebas (Y). Jika dalam persamaan
regresi linier berganda, misalkan ada dua variabel bebas X1 dan X2, maka jika
ingin diketahui berapa proporsi (prosentase) sumbangan X1 dan X2 terhadap
variasi atau naik turunnya variabel Y secara bersama-sama, maka inilah yang
disebut koefisien determinasi berganda.

Atau

Koefisien Korelasi Berganda

Koefisien Korelasi Parsial


a. Korelasi antara variabel Y dengan variabel X1 ( X2 dianggap konstan).
b. Korelasi antara variabel Y dengan variabel X2 (X1 dianggap konstan).
c. Korelasi antara variabel X1 dengan variabel X2 (Y dianggap konstan).

5. Contoh Soal
Survey kepuasan pasien ( patient satisfaction survey). Seorang pegawai
administrasi sebuah rumah sakit ingin melakukan studi tentang hubungan
antara kepuasan pasien dilihat dari usia pasien dan tingkat keparahan
penyakitnya (severity of illness). Pegawai administrasi tersebut memilih secara
acak 6 orang pasien untuk dijadikan data sampel.

Universitas Esa Unggul


http://esaunggul.ac.id 5 / 16
Patient Satisfaction Age Severity Illness
48 50 51
57 36 46
66 40 48
70 41 44
89 28 43
36 49 54
46 42 50
54 45 48
26 52 62
77 29 50

Berdasarkan data di atas:


a. Tentukan variabel bebas dan variabel tidak bebasnya!
b. Lakukan eksplorasi data!
c. Tentukan persamaan regresi linier berganda!
d. Tentukan koefisien korelasi dan koefisien determinasi dan jelaskan
artinya!
e. Jika seorang pasien baru masuk rumah sakit dengan umur 35 tahun dan
tingkat keparahan penyakitnya 45, hitunglah prediksi tingkat kepuasan
pasien baru tersebut!

Universitas Esa Unggul


http://esaunggul.ac.id 6 / 16
Jawab:
a. Variabel Tidak Bebas (Y) = Kepuasan pasien (Patient Satisfaction)
Variabel Bebas: X1 = Age, X2= severity illness
b. Eksplorasi Data
Langkah di SPSS
Masukkan data dalam spss, bagian data view terlihat sebagai berikut:

Bagian Variable view sebagai berikut, karena semua variabel adalah kontinyu maka pada
bagian “measure” pilih scale.

Lakukan Eksplorasi Data


Univariate
Variable Patient Satisfaction, Age dan Severity Illness adalah variable numerik
atau kontinyu. Karena ketiga variable numerik, maka statistik yang perlu
ditampilkan adalah nilai mean, standar deviasi, minimum dan maximum.

Universitas Esa Unggul


http://esaunggul.ac.id 7 / 16
Cara:
Analyze -> Descriptive Statistics -> Descriptive (Masukkan variabel yang
bertanda penggaris artinya variable numerik) -> klik option, pilih : mean,
std. deviasi, minimum, maximum

Output

Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
Patient Satisfaction 10 26 89 56.90 19.110
Age 10 28 52 41.20 8.311
Severity Illness 10 43 62 49.60 5.461
Valid N (listwise) 10

Universitas Esa Unggul


http://esaunggul.ac.id 8 / 16
Bivariate
Melihat pola hubungan antar variabel dari scatter plot (diagram pencar)
Misal ingin melihat pola hubungan antara umur (age) dengan kepuasana
pasien, caranya:
Cara:
Graph -> chart builder -> scatter/dot -> drag(pilih gambar scatter plot dan
Tarik ke kotak bagian pojok kanan atas) -> masukkan x-axis utk variable
“Age”, dan y-axis untuk “Patient Satisfaction” -> OK

Maka akan diperoleh scatter plot di bawah ini:

Terlihat ada kecenderungan semakin naik usia pasien, skore tingkat kepuasan pasien semakin
turun. Lakukan hal yang sama untuk melihat pola hubungan antara severity illness dengan
skore kepuasan pasien.

Universitas Esa Unggul


http://esaunggul.ac.id 9 / 16
c. Tentukan persamaan regresi linier berganda!
Untuk membentuk model persamaan regresi maka kita melakukan analisis
regresi linier berganda.

Cara:
Analyze -> Regression -> Linier->Masukkan variabel X dan Y nya -> klik
Staistics (pilih estimates dan Mode Fit) -> Klik Save (Pilih Unstandardized di
Predicted value dan residuals)-> Continue -> OK

Universitas Esa Unggul


http://esaunggul.ac.id 10 /
16
Output SPSS sebagai berikut:

Diperoleh Persamaan regresi sebagai berikut: (Lihat tabel “coefficient” yang diberi
tanda lingkaran)

Y = bo + b1X1 + b2X2
Patient satisfaction = 186.367 - 1,41Age - 1,439 Severity Illness

d. koefisien korelasi dan koefisien determinasi dan jelaskan artinya!

Koefisien korelasi = , artinya hubungan antara kepuasan pasien ,


usia dan severity illness adalah kuat dan positif (ini adalah nilai koefisien
korelasi ganda).
Koefisien determinasi = 88,9, artinya sebesar 88,9% dari variabel total
kepuasan pasien dapat dijelaskan oleh variabel usia dan severity illness,
sedangkan sisanya sebesar 2,6% dari variabel total kepuasan pasien dapat
dijelaskan oleh variabel lainnya dengan tingkat keyakinan 95%.
e. Jika seorang pasien baru masuk rumah sakit dengan umur 35 tahun dan
tingkat keparahan penyakitnya 45, hitunglah prediksi tingkat kepuasan pasien
baru tersebut!

Universitas Esa Unggul


http://esaunggul.ac.id 11 /
16
Patient satisfaction = 186.367 -1,41 (Age) -1,439 (Severity Illness)
= 186.367 -1,41 (35) -1,439 (45)
= 72.262

C. Latihan

a. Soal 1
Sebuah perusahaan farmasi di Jakarta sedang melakukan penelitian
tentang biaya promosi, biaya distribusi dan total penjualan obat pereda
rasa sakit yang baru. Menurut tim pemasaran besarnya total penjualan
dipengaruhi oleh biaya promosi dan biaya distribusi. Data yang berhasil
dikumpulkan dalam 5 bulan terakhir adalah sebagai berikut:
Biaya Biaya Total
Bulan Promosi(X1) Distribusi(X2) Penjualan(Y)
1 625 450 1400
2 600 425 1300
3 525 400 1250
4 425 350 980
5 500 300 1000

Berdasarkan data di atas:


a. Tentukan persamaan regresi linier berganda!
b. Tentukan koefisien korelasi ganda dan koefisien determinasi ganda
dan jelaskan artinya!

Universitas Esa Unggul


http://esaunggul.ac.id 12 /
16
b. Soal 2
Sebuah penelitian mengenai tekanan darah (hypertension). Ingin diketahui
bagaimana hubungan antara tekanan darah diastolik (blood pressure level)
dari bayi yang baru lahir dan bayi usia kurang dari 1 tahun (infant) apakah
berhubungan dengan tekanan darahnya. Dilihat pengaruhnya dari
birthweight and day of life.

No Sex Birthweight Age Blood


Pressure
oz (days) (mm Hg)
1 Male 135 3 89
2 Female 120 4 90
3 Female 100 3 83
4 Female 105 2 77
5 Male 130 4 92
6 Male 125 5 98
7 Female 125 2 82
8 Female 105 3 85
9 Male 120 5 96
10 Female 90 4 95
11 Male 120 2 80
12 Female 95 3 79
13 Male 120 3 86
14 Male 150 4 97
15 Male 160 3 92
16 Female 125 3 88

Berdasarkan data di atas:


a. Tentukan variabel bebas dan variabel tidak bebasnya!
b. Lakukan eksplorasi data!
c. Tentukan persamaan regresi linier berganda!
d. Tentukan koefisien korelasi dan koefisien determinasi dan
jelaskan artinya!
e. Jika seorang bayi lahir dengan Berat lahir 100 oz, dan usianya
adalah 5 hari, maka prediksikan tekanan darah diastolik bayi
tersebut!

Universitas Esa Unggul


http://esaunggul.ac.id 13 /
16
D. Kunci Jawaban

Soal 1
a.
b. , artinya hubungan antara total penjualan , biaya promosi
dan biaya distribusi adalah kuat dan positif (ini adalah nilai koefisien
korelasi ganda).
, artinya sebesar 97,4%
dari variabel total penjualan dapat dijelaskan oleh variabel biaya
promosi dan biaya distribusi, sedangkan sisanya sebesar 2,6% dari
variabel total penjualan dapat dijelaskan oleh variabel lainnya dengan
tingkat keyakinan 95%.

Soal 2
a. Variabel bebas :
X1 = Birthweight (Berat Lahir),
X2 = Age (Usia) Variabel
Tidak bebas:
Y = Blood Pressure (Tekanan Darah)
b. Poin b sampai dengan e lanjutkan sebagai latihan mandiri!

Universitas Esa Unggul


http://esaunggul.ac.id 14 /
16
E. Daftar Pustaka

1. Kurtner, MH, Nachtsheim CJ, Neter J, Li W. Applied Linear Statistical


Models. Fifth Edition. McGraw-Hill. 2005.
2. Rosner, B. Fundamentals of Biostatistics. Brooks Cole. 2015.
3. Carol, E. Statistical Applications for Health Information Management. Aspen
Publishers. 2000.
4. Oscan, Y A. Quantitative Methods in Health Care Management: Techniques
and Applications. John Wiley & Sons. 2005.
5. https://jurnal.lldikti4.or.id/index.php/jurnalsoshum/article/view/223/114

Universitas Esa Unggul


http://esaunggul.ac.id 15 /
16

Anda mungkin juga menyukai