Anda di halaman 1dari 18

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Nama : Fadliana Hidayatu R.U.H


Minat : KMPK
NIM : 23/513725/PKU/21227

TUTORIAL 5

Korelasi, Regresi Linier Sederhana dan Berganda

1. TUJUAN BELAJAR

Setelah menyelesaikan kursus ini, siswa akan dapat

a. Mendemonstrasikan proses estimasi dan inferensi untuk linear sederhana dan berganda
model regresi
b. Evaluasi asumsi regresi
c. Tunjukkan cara menggunakan metode korelasi dari data kesehatan
d. Menganalisis penggunaan regresi linier berganda untuk analisis data dalam penelitian kesehatan
masyarakat.

2.PANDUAN TUTORIAL

Silakan selesaikan STUDI KASUS 1 latihan sebelum sesi kelas dan unggah di Elok
sebelum masuk sesi praktik kelas. Jika siswa menyerahkan lebih atau sama dengan sesi,
maka mereka akan mendapat “-20”. Pada sesi tutorial kali ini kita akan menggunakan
Tutorial 5.omv. Silakan unduh datanya dari Elok.

3. STUDI KASUS 1 (Regresi dan Korelasi Linier Sederhana)


a. Sebelum kita dapat melakukan analisis regresi linier sederhana, diperlukan
beberapa asumsi untuk dipenuhi. Tolong sebutkan asumsi apa yang diperlukan
untuk regresi linier sederhana?
Jawab :
1. Data interval atau rasio
Analisis regresi linier sederhana didasarkan pada perhitungan statistik yang hanya dapat
dilakukan pada data interval atau rasio. Data nominal dan ordinal tidak dapat digunakan
dalam analisis regresi linier sederhana.
2. Linearitas
analisis regresi linier sederhana mengasumsikan bahwa hubungan antara variabel bebas dan
variabel terikat (x dan y) adalah linier. Jika hubungan antara variabel bebas dan variabel
terikat tidak linier, maka model regresi yang dihasilkan mungkin tidak akurat.
3. Normalitas
Galat dari model regresi haruslah berdistribusi normal. Galat adalah perbedaan antara nilai
aktual dari variabel terikat dan nilai yang diprediksi oleh model regresi. Analisis regresi linier
sederhana menggunakan pengujian statistik yang didasarkan pada asumsi bahwa galat
berdistribusi normal. Jika galat tidak berdistribusi normal, maka hasil pengujian statistik
mungkin tidak akurat
4. Homoskedastisitas
Analisis regresi linier sederhana mengasumsikan bahwa varians dari galat adalah konstan.
Jika varians dari galat tidak konstan, maka model regresi yang dihasilkan mungkin tidak
akurat. Hal ini berarti bahwa variabilitas galat tidak bergantung pada nilai variabel bebas.
5. Independensi
Galat haruslah saling independen. Hal ini berarti bahwa nilai galat pada satu pengamatan
tidak dipengaruhi oleh nilai galat pada pengamatan lain.

Jika salah satu dari lima asumsi tersebut tidak terpenuhi, maka hasil analisis regresi linier
sederhana mungkin tidak akurat.

b. Uji seperti apa yang diperlukan untuk menyimpulkan apakah variabel terikat
(DV) kita normal distribusi atau tidak?
Jawab :
Menggunakan uji normalitas. Ada beberapa uji Normalitas statistik yang dapat
digunakan untuk menyimpulkan apakah variabel terikat (DV) normal distribusi atau
tidak. Uji-uji tersebut adalah:
 Uji Kolmogorov-Smirnov
Uji ini membandingkan distribusi data aktual dengan distribusi normal. Jika nilai p dari uji
Kolmogorov-Smirnov lebih kecil dari 0,05, maka dapat disimpulkan bahwa data tidak
berdistribusi normal.
 Uji Shapiro-Wilk
Uji ini juga membandingkan distribusi data aktual dengan distribusi normal. Jika nilai p dari
uji Shapiro-Wilk lebih kecil dari 0,05, maka dapat disimpulkan bahwa data tidak berdistribusi
normal
 Uji Skewneww Kurtosis Tes
 Uji Lilliefors
Uji ini juga membandingkan distribusi data aktual dengan distribusi normal. Jika nilai p dari
uji Lilliefors lebih kecil dari 0,05, maka dapat disimpulkan bahwa data tidak berdistribusi
normal.
 Uji Jarque-Bera
Uji ini membandingkan kurtosis dan skewness dari data aktual dengan kurtosis dan skewness
dari distribusi normal. Jika nilai p dari uji Jarque-Bera lebih kecil dari 0,05, maka dapat
disimpulkan bahwa data tidak berdistribusi normal.

c. Bagaimana cara menguji hubungan linier antara Dependen Variabel dan Independen
Variabel?
Jawab :
1. Uji korelasi
Uji statistik yang mengukur kekuatan hubungan linier antara dua variabel. Uji korelasi dapat
digunakan untuk menguji apakah terdapat hubungan linier antara DV dan IV, namun tidak
dapat digunakan untuk menentukan arah hubungan tersebut. Uji korelasi dapat dilakukan
dengan menggunakan koefisien korelasi Pearson, Spearman, atau Kendall.
2. Uji regresi linier sederhana
Uji statistik yang digunakan untuk memprediksi nilai variabel terikat (DV) berdasarkan nilai
variabel bebas (IV). Uji regresi linier sederhana dapat digunakan untuk menguji apakah
terdapat hubungan linier antara DV dan IV, dan juga dapat digunakan untuk menentukan arah
hubungan tersebut.
3. Scatter Plot

Kesimpulan
Uji korelasi dan uji regresi linier sederhana adalah dua uji statistik yang dapat digunakan untuk
menguji hubungan linier antara variabel terikat (DV) dan variabel bebas (IV). Pemilihan uji
statistik yang tepat tergantung pada tujuan penelitian. Jika tujuan penelitian hanya untuk
menguji apakah terdapat hubungan linier antara dua variabel, maka uji korelasi dapat
digunakan. Namun, jika tujuan penelitian juga untuk menentukan arah hubungan tersebut,
maka uji regresi linier sederhana dapat digunakan.

d. Apa yang dimaksud dengan data independen?

Jawab :
Data independen adalah data yang nilainya tidak bergantung pada nilai data lain. Data independen
sering digunakan dalam analisis regresi, di mana variabel terikat tidak dipengaruhi oleh variabel
bebas

e. Tabel 1 dibawah ini diambil dari output SPSS antara jumlah tangisan setelah lahir
dengan IQ anak 3 tahun kemudian, berapa besaran efek yang digunakan dalam regresi
linier sederhana? Berapa harganya apakah ukuran efek dari jumlah tangisan? Silakan
interpretasikan hasil di bawah ini (B = koefisien beta; Sig=p-nilai)! Apakah ada
hubungan antara jumlah tangisan dan IQ?

Tabel 1. Tabel keluaran SPSS untuk hubungan antara crycount dan IQ

Jawab :
- P value : 0,030 yang artinya terdapat hubungan yang signifikan antara jumlah tangisan bayi
dan IQ anak 3 tahun
- R2 / Koefisien determinasi/ beta koefisien : 0,358 yang artinya terdapat hubungan yang lemah
antara jumlah tangisan bayi dan IQ anak 3 tahun

f. Apa perbedaan antara regresi linier sederhana dan berganda?


Jawab :
- Regresi linier sederhana :
1. Untuk mengetahui scatter plot (bentuk/pola hubungan antara x dan y)
2. Jumlah variable 1 dependen dan 1 variabel independen
3. Menggunakan model rumus y = b0 + b1x
4. Koefisien regresi b1
5. Hasilnya dapat dianalisis menggunakan uji ANOVA untuk mengevaluasi signifikansi
model.
6. Digunakan ketika ingin memahami hubungan antara satu variabel independen dan
variabel dependen.
7. Merupakan kasus khusus dari regresi linier berganda dengan hanya satu variabel
independen.
8. Perubahan 1 unit pada x menyebabkan perubahan b1 unit pada y
9. Mudah dipahami, mudah diinterpretasikan, tidak membutuhkan banyak data
- Regresi linier berganda :
1. Untuk mengetahui variable mana yang paling memiliki pengaruh terhadap y
2. Jumlah variable independent 2 atau lebih dan variable dependen 1
3. Menggunakan model rumus y = b0 + b1x1 + b2x2 + ...
4. Koefisien regresi b1, b2, ...
5. Juga dapat dianalisis menggunakan uji ANOVA, tetapi perlu dilakukan analisis tambahan
untuk mengevaluasi kontribusi relatif dari setiap variabel independen.
6. Digunakan ketika ingin memahami hubungan antara satu variabel dependen dan dua atau
lebih variabel independen, serta mempertimbangkan kontribusi masing-masing variabel
independen dan interaksi di antara mereka.
7. Lebih umum dan memungkinkan penanganan kasus-kasus yang lebih kompleks dengan
melibatkan lebih dari satu variabel independen.
8. Perubahan 1 unit pada x1 menyebabkan perubahan b1 unit pada y, perubahan 1 unit pada
x2 menyebabkan perubahan b2 unit pada y, ...
9. Dapat menjelaskan hubungan antara variabel terikat dan variabel bebas yang lebih
kompleks, lebih akurat daripada regresi linier sederhana

g. Mengapa kita perlu melakukan analisis multivariat dengan menggunakan regresi linier
berganda?
Jawab :
- Untuk menganalisis hubungan antara variabel terikat dan variabel bebas yang kompleks.
- Untuk mengontrol pengaruh variabel-variabel bebas lainnya terhadap variabel terikat. Regresi
linier berganda dapat digunakan untuk mengontrol pengaruh variabel-variabel bebas lainnya
terhadap variabel terikat.
- Untuk meningkatkan akurasi prediksi. Regresi linier berganda dapat meningkatkan akurasi
prediksi, terutama jika hubungan antara variabel terikat dan variabel bebas bersifat kompleks.
- Untuk menyesuaikan confounding variable untuk meningkatkan result yang lebih akurat
- Mengendalikan variable confounding
- Peningkatan presisi hasil
- Model yang lebih realistis sehingga prediksi lebih baik dan relevan

h. Apakah ada kriteria variabel independen untuk dimasukkan dalam analisis multivariat?
Jawab :
 Relevansi
Variabel independen harus relevan dengan variabel terikat. Artinya, variabel independen
harus memiliki hubungan dengan variabel terikat. Hubungan ini dapat diukur dengan
menggunakan uji statistik, seperti uji korelasi.
 Independensi
Variabel independen harus independen satu sama lain. Artinya, variabel independen tidak
boleh berkorelasi satu sama lain secara signifikan. Korelasi yang signifikan antara variabel
independen akan menyebabkan masalah multikolinieritas, yang dapat menyebabkan hasil
analisis multivariat menjadi bias.
 Kekuatan hubungan
Variabel independen harus memiliki kekuatan hubungan yang signifikan dengan variabel
terikat. Artinya, hubungan antara variabel independen dan variabel terikat harus cukup kuat

untuk dapat diprediksi. Hubungan yang kuat antara variabel independen dan variabel terikat
akan menghasilkan model regresi yang lebih akurat.
 Keterandalan
Variabel independen harus dapat diandalkan. Artinya, variabel independen harus memiliki
distribusi yang normal dan tidak memiliki nilai-nilai outlier. Variabel independen yang tidak
memiliki distribusi normal dapat menyebabkan hasil analisis multivariat menjadi tidak
akurat. Nilai-nilai outlier juga dapat menyebabkan hasil analisis multivariat menjadi tidak
akurat.
 Linier
 P value < 0,25 atau 0,20
 Relevensi teoritis
 kolinearitas

i. Silakan nyatakan dua asumsi pasca regresi yang perlu diperiksa!


Jawab :
Dua asumsi pasca regresi yang perlu diperiksa adalah
1. Homoskedastisitas/ homogenitas varians antara residual dan DV
Homoskedastisitas adalah asumsi bahwa ragam dari residual (error term) adalah konstan untuk
semua nilai dari variabel independen. Jika homoskedastisitas tidak terpenuhi, maka estimasi
parameter regresi akan menjadi tidak efisien dan tidak akurat.
Ada beberapa cara untuk memeriksa asumsi homoskedastisitas, antara lain:
 Plot residual terhadap fitted value
Jika plot residual terhadap fitted value membentuk pola tertentu, seperti pola parabola atau
pola U terbalik, maka dapat disimpulkan bahwa homoskedastisitas tidak terpenuhi.
 Uji statistic
Uji statistik, seperti uji Breusch-Pagan atau uji White, dapat digunakan untuk menguji
secara formal apakah homoskedastisitas terpenuhi.
2. Normalitas residual
Normalitas residual adalah asumsi bahwa residual (error term) memiliki distribusi normal. Jika
normalitas residual tidak terpenuhi, maka uji statistik yang digunakan untuk menguji
signifikansi koefisien regresi tidak akan valid. Jika normalitas residual tidak terpenuhi, maka
uji statistik yang digunakan untuk menguji signifikansi koefisien regresi tidak akan valid. Hal
ini terjadi karena uji statistik tersebut didasarkan pada asumsi bahwa residual memiliki
distribusi normal.
Ada beberapa cara untuk memeriksa asumsi normalitas residual, antara lain:
 Plot histogram residual
Jika histogram residual berbentuk lonceng, maka dapat disimpulkan bahwa normalitas
residual terpenuhi.
 Uji statistic
Uji statistik, seperti uji Shapiro-Wilk atau uji Kolmogorov-Smirnov, dapat digunakan
untuk menguji secara formal apakah normalitas residual terpenuhi.
 Q-Q plot

j. Asumsi apa yang diperlukan sebelum kita dapat menganalisis dengan menggunakan uji
korelasi Pearson?

Jawab :
- Linearitas
Linearitas berarti bahwa hubungan antara dua variabel adalah linier. Jika hubungan antara dua
variabel tidak linier, maka uji korelasi Pearson tidak akan valid.
Untuk memeriksa asumsi linearitas, dapat dilakukan plot scatter plot antara dua variabel. Jika
plot scatter plot membentuk garis lurus, maka dapat disimpulkan bahwa linearitas terpenuhi.
- Normalitas
Normalitas berarti bahwa kedua variabel memiliki distribusi normal. Jika salah satu atau kedua
variabel tidak memiliki distribusi normal, maka uji korelasi Pearson tidak akan valid. Untuk
memeriksa asumsi normalitas, dapat dilakukan uji statistik, seperti uji Shapiro-Wilk atau uji
Kolmogorov-Smirnov.
- Homoskedastisitas
Homoskedastisitas berarti bahwa ragam dari kedua variabel adalah konstan. Jika ragam dari
kedua variabel tidak konstan, maka uji korelasi Pearson tidak akan valid. Untuk memeriksa
asumsi homoskedastisitas, dapat dilakukan plot scatter plot antara residual dan fitted values.
Jika plot scatter plot tidak membentuk pola tertentu, maka dapat disimpulkan bahwa
homoskedastisitas terpenuhi.
- Independensi
Independensi berarti bahwa nilai dari satu variabel tidak dipengaruhi oleh nilai dari variabel
lain. Jika nilai dari satu variabel dipengaruhi oleh nilai dari variabel lain, maka uji korelasi
Pearson tidak akan valid. Untuk memeriksa asumsi independensi, dapat dilakukan uji statistik,
seperti uji Durbin-Watson.

k. Silakan lihat gambar 1 di bawah ini, apa interpretasi Anda terhadap scatter plot ini?
Gambar 1. Plot sebar antara jumlah tangisan dan IQ

Jawab :

Untuk mengukur kekuatan hubungan ini dapat melihat nilai R2, yang disebut koefisien
determinasi. Nilai ini menunjukkan proporsi varians pada variabel dependen (IQ) yang dapat
dijelaskan oleh variabel independen (jumlah tangisan). Nilai R2 berkisar dari 0 hingga 1, di mana
0 berarti tidak ada hubungan dan 1 berarti hubungan sempurna.

Dari plot ini, dapat melihat bahwa nilai R2 adalah 0.157, yang berarti bahwa 15.7% varians pada
IQ dapat dijelaskan oleh jumlah tangisan. Ini menunjukkan bahwa ada hubungan yang lemah
antara jumlah tangisan dan IQ.

Ada hubungan linier positif yang lemah antara jumlah tangisan dan IQ. Namun, hubungan ini
tidak berarti sebab-akibat, karena mungkin ada faktor lain yang mempengaruhi kedua variabel.

l. Berapa ukuran efek yang digunakan dalam uji korelasi Pearson?


Jawab :
Ukuran efek yang digunakan dalam uji korelasi Pearson adalah koefisien korelasi, yang
dilambangkan dengan huruf "r/R (mengukur kekuatan dan arah linear variable)". Koefisien
korelasi memiliki nilai antara -1 dan 1. Nilai r yang mendekati 1 menunjukkan hubungan yang
kuat, sedangkan nilai r yang mendekati 0 menunjukkan hubungan yang lemah.
Untuk interpretasi nilai r, dapat digunakan skala berikut:
 r mendekati + 1 : derajat hubungan x dan y sangat kuat, korelasi positif
 r mendekati – 1 : derajat hubungan x dan y sangat kuat, korelasi negative
 r mendekati 0 : derajat hubungan x dan y sangat lemah (0 =tidak ada korelasi linier
antar 2 variabel)
m. Tolong jelaskan apa yang anda ketahui tentang koefisien determinasi (R2)!
Jawab :
Koefisien determinasi (R2) adalah ukuran efek yang digunakan dalam regresi linier. Koefisien
determinasi menunjukkan proporsi keragaman variabel terikat yang dapat dijelaskan oleh
variabel bebas. Nilai R2 berkisar antara 0 dan 1, di mana 0 berarti tidak ada hubungan antara
variabel dan 1 berarti hubungan sempurna. Nilai R2 dapat digunakan untuk menilai kualitas dan
kecocokan model regresi, serta untuk membandingkan model yang berbeda. Semakin tinggi nilai
R2, semakin baik model dapat menjelaskan variasi data. Namun, nilai R2 tidak dapat digunakan
untuk menentukan sebab-akibat atau kausalitas antara variabel.
Sejauh mana variasi DV bisa dijelakan oleh IV dalam model
R2 0 = Model tidak menjelaskan variasi apapun dalam independent variable
R2 = Model bisa menjelaskan variasi hubungan dalam DV dan IV

4. Studi Kasus II (Sesi praktik di kelas menggunakan Jamovi)

Kami akan melakukan sesi praktik menggunakan Jamovi dan data “tutorial 5.omv”.
Dalam latihan ini, kami menggunakan analisis observasional dari 20% sub-sampel acak
pasca- wanita menopause dengan penyakit jantung dan tanpa diabetes yang berpartisipasi
dalam HERS uji coba. Ada lima variabel dalam dataset ini yaitu merokok (pernah
merokok ya/tidak), minum (pernah minum alkohol ya/tidak), physact (tingkat aktivitas
fisik), bmi dan age10 (usia per 10 tahun). Harap jawab beberapa pertanyaan di bawah ini
menggunakan kumpulan data ini.

a. Variabel apa yang paling mungkin digunakan sebagai Dependen Variabel?


Jawab :
BMI

b. Silakan lakukan analisis deskriptif untuk setiap variabel dan periksa uji normalitasnya.
Jawab :
Kesimpulan :
nilai Shapiro-Wilk untuk semua variabel adalah kurang dari 0,05. Hal ini menunjukkan bahwa
probabilitas data berasal dari populasi yang berdistribusi normal sangat kecil. Oleh karena itu,
dapat disimpulkan bahwa semua variabel dalam tabel tersebut tidak berdistribusi normal.
Berikut adalah interpretasi nilai Shapiro-Wilk untuk masing-masing variabel:
 Kebiasaan merokok
Nilai Shapiro-Wilk untuk kebiasaan merokok adalah 0,001. Artinya, probabilitas data
berasal dari populasi yang berdistribusi normal sangat kecil. Hal ini menunjukkan bahwa
kebiasaan merokok di Indonesia tidak berdistribusi normal.
 Kebiasaan minum alcohol
Nilai Shapiro-Wilk untuk kebiasaan minum alkohol adalah 0,001. Artinya, probabilitas
data berasal dari populasi yang berdistribusi normal sangat kecil. Hal ini menunjukkan
bahwa kebiasaan minum alkohol di Indonesia tidak berdistribusi normal.
 Bisa lihat skewness
+ : eror distribusi terpencar di sebelah kanan
- : eror distribusi terpencar di sebelah kiri
 Aktivitas fisik
Nilai Shapiro-Wilk untuk aktivitas fisik adalah 0,001. Artinya, probabilitas data berasal
dari populasi yang berdistribusi normal sangat kecil. Hal ini menunjukkan bahwa aktivitas
fisik di Indonesia tidak berdistribusi normal.
 Indeks massa tubuh (BMI)
Nilai Shapiro-Wilk untuk BMI adalah 0,001. Artinya, probabilitas data berasal dari
populasi yang berdistribusi normal sangat kecil. Hal ini menunjukkan bahwa BMI di
Indonesia tidak berdistribusi normal.
 Usia
Nilai Shapiro-Wilk untuk usia adalah 0,001. Artinya, probabilitas data berasal dari
populasi yang berdistribusi normal sangat kecil. Hal ini menunjukkan bahwa usia di
Indonesia tidak berdistribusi normal. Lihat nilai w saphiro wilk (semakin mendekati 1 data
semakin menunjukkan distribusi normal)

Kesimpulannya, semua variabel dalam tabel tersebut tidak berdistribusi normal. Oleh karena
itu, uji statistik parametrik tidak dapat digunakan untuk menganalisis data tersebut
c. Silakan lakukan korelasi pearson antara BMI dan usia 10 tahun dan tafsirkan hasilnya.

Jawab :

Kesimpulan : terdapat hubungan negative yang linier dan lemah antara BMI dengan age 10 yang
artinya semakin tinggi usia seseorang pada tiap 10 tahun, maka semakin rendah kemungkinannya
untuk memiliki BMI yang tinggi.

d. Harap perkirakan uji t independen untuk merokok dan minum apa pun dengan BMI dan
interpretasikan hasil

Jawab :

 BMI dg minum alcohol, p value 0,798 (> 0,05) = tidak ada hubungan yang signifikan antara
BMI dengan minum alkohol

 BMI dg merokok, p value 0,017 (< 0,05) = ada hubungan yang signifikan antara BMI dengan
merokok

e. Harap perkirakan ANOVA satu arah untuk tingkat aktivitas fisik dan BMI dan interpretasikan
hasil
Jawab :

p value 0,001 (< 0,05) = ada hubungan yang signifikan antara BMI dengan aktivitas fisik

f. Berapa banyak variabel yang dapat dimasukkan dalam regresi linier berganda?

Jawab :
Secara teoritis, tidak ada batasan jumlah variabel yang dapat dimasukkan dalam regresi linier
berganda. Namun, dalam praktiknya, jumlah variabel yang dimasukkan haruslah secukupnya
untuk menjelaskan variabel terikat dengan baik, tetapi tidak terlalu banyak sehingga
menimbulkan masalah multikolinearitas.
Masalah multikolinearitas terjadi jika terdapat korelasi yang tinggi antara variabel-variabel bebas
dalam model regresi. Hal ini dapat menyebabkan koefisien regresi tidak akurat dan tidak dapat
diinterpretasi dengan baik. Untuk menghindari masalah multikolinearitas, jumlah variabel bebas
dalam model regresi biasanya dibatasi hingga 10 variabel. Namun, ada juga peneliti yang
menggunakan lebih dari 10 variabel, asalkan masalah multikolinearitas dapat dikendalikan.

Secara umum, jumlah variabel yang dapat dimasukkan dalam regresi linier berganda harus
ditentukan dengan mempertimbangkan faktor-faktor berikut:
 Jumlah data yang tersedia.
 Kekuatan hubungan antara variabel bebas dan variabel terikat.
 Kemungkinan terjadinya masalah multikolinearitas.

g. Silakan perkirakan model regresi linier berganda untuk BMI dengan variabel independen
 Terdapat hubungan yang lemah, derajat hubungan berkorelasi negative dan signifikan
antara BMI dengan merokok

 Terdapat hubungan yang lemah, derajat hubungan berkorelasi negatif dan tidak signifikan
antara BMI dengan minum alcohol

 Terdapat hubungan yang lemah, derajat hubungan berkorelasi negatif dan signifikan
antara BMI dengan minum alcohol

 terdapat hubungan yang lemah, derajat hubungan berkorelasi negatif dan signifikan antara
BMI dengan minum age 10

 Model ini hanya bisa mendeteksi pengaruh varians thd BMI sekitar 12%, 80% varians
yang lain dapat dideteksi dengan model yang lain. Hal ini berarti masih banyak model lain
yang bisa digunakan untuk meneliti BMI dengan variannya

h. Variabel apa yang paling berpengaruh dalam model? (gunakan perkiraan standar dalam
koefisien model)
Kesimpulan :
Variable yang paling berpengaruh dalam model yaitu aktivitas fisik (stand estimate/koefisien
korelasi tertinggi)
I. Tolong tafsirkan hasil aktivitas fisik! Apakah ada tren yang diamati secara fisik

variabel aktivitas?

Kesimpulan :
Tabel ini menunjukkan hasil analisis deskriptif untuk variabel physact, yang merupakan variabel
ordinal yang mengukur tingkat aktivitas fisik seseorang. Variabel ini memiliki skala 1-5, dengan
1 berarti tidak aktif sama sekali, 2 berarti kurang aktif, 3 berarti aktif, 4 berarti sangat aktif, dan
5 berarti sangat aktif.
Berdasarkan tabel, dapat disimpulkan bahwa:
 Sampel data terdiri dari 553 orang.
 Tidak ada data yang hilang untuk variabel physact.
 Nilai rata-rata (mean) untuk variabel physact adalah 3,15.
 Nilai median untuk variabel physact adalah 3.
 Nilai standar deviasi (standard deviation) untuk variabel physact adalah 1,09.
 Nilai minimum untuk variabel physact adalah 1.
 Nilai maksimum untuk variabel physact adalah 5.
 Variabel physact memiliki penyebaran yang cukup sempit. Nilai standar deviasi hanya
1,09, yang berarti bahwa nilai-nilai untuk variabel physact cenderung terkonsentrasi di
sekitar nilai rata-rata.
 Variabel physact memiliki rentang yang cukup besar. Nilai maksimum untuk variabel
physact adalah 5, yang berarti bahwa ada perbedaan yang cukup besar antara orang yang
paling aktif dan orang yang paling tidak aktif.

Secara keseluruhan, dapat disimpulkan bahwa sebagian besar orang dalam sampel data tersebut
adalah orang yang aktif secara fisik. Nilai rata-rata dan median untuk variabel physact berada di
atas 2, yang berarti bahwa sebagian besar orang dalam sampel data tersebut aktif atau sangat
aktif. Namun, masih ada beberapa orang yang tidak aktif sama sekali. Nilai minimum untuk
variabel physact adalah 1, yang berarti bahwa ada beberapa orang dalam sampel data tersebut
yang sama sekali tidak aktif secara fisik.

j. Apakah ada multikolinearitas antar variable independen? (gunakan statistik kolinearitas dalam
pemeriksaan asumsi)

Kesimpulan :
Collinearity Statistics menunjukkan bahwa tidak ada masalah multikolinearitas yang signifikan
dalam model regresi ini. Nilai VIF untuk semua variabel bebas adalah di bawah 10, yang berarti
bahwa tidak ada variabel bebas yang memiliki korelasi yang sangat tinggi dengan variabel bebas
lainnya.
k. Apakah terdapat distribusi residu yang normal dan homogenitas varian antar residu dengan data
model yang cocok? (gunakan uji normalitas, qq plot residu dan plot sisa)
jawab :
uji normalitas terpenuhi, tidak ada kecenderungan penyimpangan asumsi(Q-Q plot tersebar
secara acak)

Q-Q Plot

l. Silakan berikan kesimpulan Anda berdasarkan hasil regresi linier berganda ini

Jawab :

Secara keseluruhan, dapat disimpulkan bahwa model regresi linier berganda yang dihasilkan
dapat digunakan untuk memprediksi BMI seseorang dengan cukup baik. Variabel-variabel
bebas yang dimasukkan dalam model tersebut, yaitu minum alkohol, aktivitas fisik, usia, dan
merokok, memiliki pengaruh yang signifikan terhadap BMI seseorang.
m. Silakan buat model prediksi BMI berdasarkan hasil ini
Jawab :
Berdasarkan table jamovi diatas menunjukkan bahwa variabel-variabel bebas yang dimasukkan
dalam model tersebut, yaitu minum alkohol, aktivitas fisik, usia, dan merokok, memiliki
pengaruh yang signifikan terhadap BMI seseorang.
Orang yang minum alkohol, aktif secara fisik, dan tidak merokok cenderung memiliki BMI yang
lebih rendah daripada orang yang tidak minum alkohol, tidak aktif secara fisik, dan merokok.
 Keterbatasan model
- Model ini hanya berdasarkan pada data observasional, sehingga tidak dapat digunakan
untuk menguji hubungan sebab-akibat antara variabel-variabel bebas dan variabel terikat.
- Model ini hanya berlaku untuk wanita pasca-menopause dengan penyakit jantung dan
tanpa diabetes.
- Model ini mungkin tidak berlaku untuk populasi yang lebih luas.
 Rekomendasi untuk penelitian lebih lanjut
Untuk meningkatkan akurasi model, penelitian lebih lanjut dapat dilakukan dengan
menggunakan data eksperimental. Penelitian juga dapat dilakukan untuk memperluas
sampel penelitian sehingga dapat mencakup populasi yang lebih luas.

Anda mungkin juga menyukai