Anda di halaman 1dari 9

TUGAS PRAKTIKUM PERTEMUAN 7 ANALISIS REGRESI 

   

Dosen Pengampu:

Ir. Ekaria M.Si.

Disusun Oleh 

Kelompok 2 : 

1.    Mira Octavia                                       (212112189)

2.    Muhammad Ilzam Falahuddin           (212112216)

3.    Riski Tommi Mardoni                        (212112327)

4.    Vilanata Tesalonika Lana                   (212112412)

5.    Wimbi Uelsan Gurusinga                   (212112416)

 
 

PROGRAM STUDI DIPLOMA IV STATISTIKA

POLITEKNIK STATISTIKA STIS

JAKARTA

2022/2023
Penugasan

Berdasarkan data yang digunakan pada penugasan modul-modul sebelumnya


(Data_TugasRegresi01.sav), lakukan beberapa pekerjaan berikut menggunakan perangkat
lunak R atau SPSS:

1) Dapatkan persamaan regresi Survival Time (sebagai variabel tak bebas) terhadap
blood clotting score, prognostic index , dan Gender (sebagai variabel bebas).

Persamaan regresi yang didapatkan adalah


Y =−316,508+73,874 X 1 +9 , 184 X 2 −70,406 D 1
β 3=¿ Selisih antara survival time pasien laki-laki dengan perempuan (0 = female, 1 =
male)
2) Interpretasikan setiap koefisien regresi yang diperoleh pada poin 1).
 Jika skor blood clotting naik sebesar 1 maka survival time seseorang akan naik
sebesar 73,874.
 Jika indeks prognostic naik sebesar 1 maka survival time seseorang akan naik
sebesar 9,184.
 Seseorang yang berjenis kelamin perempuan memiliki survival time lebih
banyak dibandingkan jenis kelamin laki-laki sebesar 70,406.
3) Lakukan pengujian hipotesis untuk mengetahui apakah terdapat perbedaan Survival
Time antara pasien Laki-laki dan Perempuan. Gunakan tingkat signifikansi 5%.
Uji simultan dilakukan dengan melihat p-value pada table anova, didapatkan p-value
sebesar 0,000 yang mengartikan bahwa hipotesis nol ditolak. Sehingga terdapat
minimal satu variabel independent yang berpengaruh terhadap survival time sebagai
variabel dependennya.

Untuk mengetahui apakah terdapat perbedaan survival time antara pasien laki-laki dan
perempuan dilihat dari uji parsialnya yang menggunakan uji t dengan hipotesis
H 0 : β 3=0
H 1 : β3 ≠ 0
β 3=Selisihantara survival time pasien laki−laki dengan perempuan
Didapatkan p-value sebesar 0,226 yang lebih besar dibandingkan dengan tingkat
signifikansi yang dipakai yaitu 5%. Hal ini menyebabkan keputusan yang diambil
adalah gagal tolak hipotesis nol sehingga tidak terdapat perbedaan survival time
secara signifikan antara pasien laki-laki dengan perempuan.
4) Dapatkan persamaan regresi Survival Time (sebagai variabel tak bebas) terhadap liver
function test score, age, dan Alcohol use (sebagai variabel bebas).

Persamaan regresi yang didapatkan adalah


Y =−40,361+244,339 X 1 +0,164 X 2−13,701 D1 +245,574 D2
β 3=¿ Selisih antara survival time pasien dengan kebiasaan minum alkohol moderate
dengan pasien yang tidak memiliki kebiasaan minum alkohol.
β 4 =¿ Selisih antara survival time pasien dengan kebiasaan minum alkohol heavy
dengan pasien yang tidak memiliki kebiasaan minum alkohol.
5) Interpretasikan setiap koefisien regresi yang diperoleh pada poin 4).
 Jika skor liver function test naik sebesar satu maka survival time pasien akan
naik sebesar 244,339.
 Jika umur pasien lebih tua sebesar 1 tahun maka survival time pasien akan
naik sebesar 0,164.
 Pasien dengan kebiasaan minum alcohol sedang memiliki survival time lebih
sedikit dibandingkan pasien yang tidak memiliki kebiasaan minum alcohol
yaitu sebesar 13,701.
 Pasien dengan kebiasaan minum berat memiliki survival time lebih banyak
dibandingkan pasien yang tidak memiliki kebiasaan minum alcohol yaitu
sebesar 245,574.
6) Lakukan pengujian hipotesis untuk mengetahui apakah terdapat perbedaan Survival
Time menurut Alcohol use. Gunakan tingkat signifikansi 5%.

Pengujian simultan dilakukan untuk mengetahui setidaknya ada satu variabel


independent yang berpengaruh terhadap variabel dependen. Pada uji anova yang
dilakukan didaptkan p-value sebesar 0,000 yang lebih kecil dibandingkan tingkat
signfikansinya yaitu sebesar 5% sehingga hipotesis nol ditolak. Oleh karena itu, dapat
diambil kesimpulan bahwa terdapat setidaknya satu variabel independent yang
berpengaru terhadap variabel dependen.
Untuk mengetahui perbedaan survival time menurut alcohol use dilakukanlah uji
parsial menggunakan uji t dengan tingkat signifikansi 5%.
H 0 : β 3=0
H 1 : β3 ≠ 0
β 3=¿ Selisih antara survival time pasien dengan kebiasaan minum alkohol moderate
dengan pasien yang tidak memiliki kebiasaan minum alkohol.
H 0 : β 4=0
H 1: β4≠ 0
β 4 =¿ Selisih antara survival time pasien dengan kebiasaan minum alkohol heavy
dengan pasien yang tidak memiliki kebiasaan minum alkohol.
Didapatkan p-value pada dummy 1 sebesar 0,797 yang jika dibandingkan dengan
alpha 5% akan menghasilkan keputusan gagal tolak hipotesis nol. Sehingga tidak
terdapat perbedaan signifikan antara survival time pasien dengan kebiasaan minum
alcohol sedang dengan pasien yang tidak memiliki kebiasaan minum alcohol. Pada
dummy 2 didapatkan p-value sebesar 0,000 sehingga jika dibandingkan dengan alpha
5% akan menghasilkan keputusan tolak hipotesis nol. Sehingga terdapat perbedaan
secara signifikan antara survival time pasien dengan kebiasaan minum alcohol berat
dengan pasien yang tidak memiliki kebiasaan minum.
Praktikum 7
Kelompok 2

2023-03-24

PACKAGES
library(haven) #mengimpor file .sav
library(tibble) #melakukan view data

## Warning: package 'tibble' was built under R version 4.2.3

library(fastDummies) #membentuk dummy

## Warning: package 'fastDummies' was built under R version 4.2.3

##Analisis Survival Time (sebagai variabel tak bebas) terhadap blood clotting score,
prognostic index , dan Gender (sebagai variabel bebas)##
setwd("C:/Users/Lenovo/OneDrive/Documents/Kuliah/Semester
4/Anareg/Praktikum/Pertemuan 7")
data=read_sav("Data_TugasRegresi01.sav")
head(data)

## # A tibble: 6 × 26
## No X1 X2 X3 X4 X5 X6 X7 X8 Y
ln_Y KU
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl+lb> <dbl+l> <dbl+l> <dbl>
<dbl> <dbl>
## 1 23 6.7 26 68 2.1 30 0 [Male] 0 [Non… 1 [Hea… 599
6.40 1
## 2 35 5.4 58 70 2.64 31 1 [Fema… 1 [Mod… 0 [Non… 482
6.18 1
## 3 43 8.8 86 88 6.4 30 1 [Fema… 1 [Mod… 0 [Non… 1270
7.15 1
## 4 48 4.8 86 101 4.1 35 1 [Fema… 0 [Non… 1 [Hea… 1300
7.17 1
## 5 56 4.9 66 91 3.05 34 1 [Fema… 0 [Non… 0 [Non… 767
6.64 1
## 6 60 8 27 83 2.03 35 1 [Fema… 1 [Mod… 0 [Non… 716
6.57 1
## # … with 14 more variables: PRE_1 <dbl>, RES_1 <dbl>, ei2 <dbl>, Xiei
<dbl>,
## # Ycapiei <dbl>, PRE_2 <dbl>, RES_2 <dbl>, ei2ln <dbl>, Xieiln <dbl>,
## # Ycapieiln <dbl>, D1n_1 <dbl>, D1n_2 <dbl>, Dg_1 <dbl>, Dg_2 <dbl>

Definisi Variabel
y=data$Y
x1=data$X1
x2=data$X2
d1=data$X6

Data yang Dipakai


datapakai=cbind.data.frame(y, x1, x2,d1)
View(datapakai)
databaru=dummy_cols(datapakai, select_columns='d1')
str(databaru)

## 'data.frame': 108 obs. of 6 variables:


## $ y : num 599 482 1270 1300 767 716 189 913 676 850 ...
## ..- attr(*, "label")= chr "Survival Time"
## ..- attr(*, "format.spss")= chr "F8.1"
## $ x1 : num 6.7 5.4 8.8 4.8 4.9 8 4.4 4.3 6.2 5 ...
## ..- attr(*, "label")= chr "blood clotting score"
## ..- attr(*, "format.spss")= chr "F8.1"
## $ x2 : num 26 58 86 86 66 27 47 99 42 60 ...
## ..- attr(*, "label")= chr "prognostic index"
## ..- attr(*, "format.spss")= chr "F8.0"
## $ d1 : dbl+lbl [1:108] 0, 1, 1, 1, 1, 1, 0, 1, 0, 1, 0, 0, 1, 0, 0,
1, 0, 0, ...
## ..@ label : chr "gender"
## ..@ format.spss: chr "F8.0"
## ..@ labels : Named num 0 1
## .. ..- attr(*, "names")= chr [1:2] "Male" "Female"
## $ d1_0: int 1 0 0 0 0 0 1 0 1 0 ...
## $ d1_1: int 0 1 1 1 1 1 0 1 0 1 ...

View(databaru)

Definisi Variabel
y=databaru$y
x1=databaru$x1
x2=databaru$x2
d1=databaru$d1_0

Bentuk RLB
rlb=lm(y~x1+x2+d1)
summary(rlb)

##
## Call:
## lm(formula = y ~ x1 + x2 + d1)
##
## Residuals:
## Min 1Q Median 3Q Max
## -495.86 -168.45 -48.08 150.18 1556.72
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -316.508 170.324 -1.858 0.065959 .
## x1 73.874 20.044 3.686 0.000364 ***
## x2 9.184 1.725 5.325 5.86e-07 ***
## d1 -70.406 57.757 -1.219 0.225603
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 295 on 104 degrees of freedom
## Multiple R-squared: 0.3009, Adjusted R-squared: 0.2807
## F-statistic: 14.92 on 3 and 104 DF, p-value: 3.787e-08

##Analisis Survival Time (sebagai variabel tak bebas) terhadap liver function test score,
age, dan Alcohol use (sebagai variabel bebas)##
Definisi Variabel
y=data$Y
x1=data$X4
x2=data$X5
d1=data$X7
d2=data$X8

Data yang Dipakai


datapakai2=cbind.data.frame(y, x1, x2, d1, d2)
View(datapakai2)
databaru2=dummy_cols(datapakai2, select_columns='d1')
View(databaru2)
databaru3=dummy_cols(databaru2, select_columns = 'd2')
View(databaru3)

Definisi Variabel
y=databaru3$y
x1=databaru3$x1
x2=databaru3$x2
d1=databaru3$d1_1
d2=databaru3$d2_1

Bentuk RLB
rlb=lm(y~x1+x2+d1+d2)
summary(rlb)

##
## Call:
## lm(formula = y ~ x1 + x2 + d1 + d2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -514.70 -138.69 -4.51 120.03 1079.75
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -40.3612 129.8537 -0.311 0.756565
## x1 244.3386 23.1521 10.554 < 2e-16 ***
## x2 0.1641 2.0079 0.082 0.935042
## d1 -13.7006 53.2101 -0.257 0.797321
## d2 245.5737 67.6828 3.628 0.000446 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 239.2 on 103 degrees of freedom
## Multiple R-squared: 0.5448, Adjusted R-squared: 0.5271
## F-statistic: 30.82 on 4 and 103 DF, p-value: < 2.2e-16

Anda mungkin juga menyukai