Anda di halaman 1dari 6

TUGAS 2 STATISTIKA EKONOMI I

444838

1. Anda diminta untuk membuat beberapa estimasi sebagai berikut:


a. Berikanlah estimasi mengenai harga rata-rata AirBnB per malam di kawasan Brooklyn
di Kota New York. Yaitu 126,2795
#seleksi data
onlypricebrooklyn<- dplyr::select(sample_AB_NYC_2019, neighbourhood_group,
price)
onlypricebrooklyn<- dplyr::filter(onlypricebrooklyn, neighbourhood_group ==
"Brooklyn", price>0)
onlypricebrooklyn<-onlypricebrooklyn$price

#estimate point mean


mean(onlypricebrooklyn, na.rm = TRUE)

b. Hitunglah confidence interval dari estimasi rata-rata Anda pada soal 1(a), dengan
tingkat kepercayaan 95%. Yaitu 112,639 sampai 139,7952

n <- length(onlypricebrooklyn)
s <- sd(onlypricebrooklyn)
se <- s/sqrt(n)
error <- qnorm(.975)*se
xbar <- mean(onlypricebrooklyn)
xbar + c(-error, error)

c. Berikanlah estimasi mengenai varians dari harga AirBnB per malam di kawasan
(var:neighbourhood_group) Brooklyn di Kota New York. Yaitu 20923,43

#estimate variance
var(onlypricebrooklyn, na.rm = TRUE)

d. Hitunglah confidence interval dari estimasi varians Anda pada soal 1(c),
dengan tingkat kepercayaan 90%. Yaitu 18789,82 sampai 23466,56

df <- length(onlypricebrooklyn)-1
varbrooklyn <- var(onlypricebrooklyn, na.rm=TRUE)
lower <- varbrooklyn*df/qchisq(0.05, df, lower.tail = FALSE)
upper <- varbrooklyn*df/qchisq(1-0.05,df, lower.tail = FALSE)
c(lower=lower, variance=varbrooklyn, upper=upper)
2. Seorang konsultan merilis suatu laporan mengenai AirBnB di Kota New York. Ada
beberapa klaim yang Anda curigai kebenarannya.

a. Konsultan tersebut mengklaim bahwa harga rata-rata AirBnB per malam di kawasan
(var:neighbourhood) Washington Heights adalah minimum $85 per malam.

i. Tulislah hipotesis H0 dan H1 yang sesuai.


H0; µHarga/malam≥ $85 per malam
H1; µHarga/malam< $85 per malam

ii. [+Kode] Ujilah hipotesis tersebut pada alpha= 0.05. Bagaimana kesimpulan
Anda?
#seleksi data
pricewashingtonheights<- dplyr::select(sample_AB_NYC_2019,
neighbourhood, price)
pricewashingtonheights<-dplyr::filter(pricewashingtonheights,
neighbourhood == "Washington Heights")
pricewashingtonheights<- pricewashingtonheights$price

#t test
x= pricewashingtonheights
t.test(x, alternative = c("less"),
mu=85,paired=FALSE, var.equal = TRUE,
conf.level = 0.95)

One Sample t-test

data: x
t = -0.66369, df = 11, p-value = 0.2603
alternative hypothesis: true mean is less than 85
95 percent confidence interval:
-Inf 96.08837
sample estimates:
mean of x
78.5

Apakah Anda menolak H0 atau tidak? Laporkan p-value dari uji tersebut.

Menerima H0 karena p-value = 0,2603 > alpha=0,05 harga rata-rata AirBnB per
malam di kawasan Washington Heights lebih besar atau sama dengan $85 per
malam.
b. Konsultan tersebut juga mengklaim bahwa harga rata-rata AirBnB per malam di
kawasan (var:neighbourhood_group) Bronx adalah sama dengan harga di Queens.

i. Tulislah hipotesis H0 dan H1 yang sesuai.


H0 ; µhargaBronk = µhargaQueens
H1 ; µhargaBronk ≠ µhargaQueens

ii. Ujilah hipotesis tersebut pada alpha= 0,1. Bagaimana kesimpulan Anda?
#seleksi data
kawasan<- dplyr:: select(sample_AB_NYC_2019,neighbourhood_group, price)
kawasanbronx<- dplyr:: filter(kawasan, neighbourhood_group == "Bronx",
price >0)
hargakawasanbronx <- (kawasanbronx$price)
kawasanqueens<- dplyr::filter(kawasan, neighbourhood_group == "Queens",
price>0)
hargakawasanqueens <-(kawasanqueens$price)

#t test
x = (hargakawasanbronx)
y = (hargakawasanqueens)
t.test( x, y , alternative = c("two.sided"), mu=0, paired=FALSE,
var.equal = TRUE, conf.level = 0.90)
Two Sample t-test

data: x and y
t = -1.6836, df = 126, p-value = 0.09473
alternative hypothesis: true difference in means is not equal to 0
90 percent confidence interval:
-45.1757105 -0.3594525
sample estimates:
mean of x mean of y
76.59091 99.35849

Apakah Anda menolak H0 atau tidak? Laporkan p-value dari uji tersebut.

Menolak H0, dengan level of confident 0,1 maka harga rata rata kawasan
Bronx berbeda dengan harga rata-rata kawasan queens karena p-value =
0.09473 < alpha=0.1
c. Pada bagian akhir laporan, konsultan tersebut menyimpulkan bahwa harga rata-
rata AirBnB per malam tidak berbeda antarkawasan (var:neighbourhood_group).
Lakukan prosedur one-way ANOVA untuk menguji hipotesis ini.

i. Tulislah hipotesis H0 dan H1 yang sesuai.


H0; µ harga di semua kawasan sama
H1; setidaknya ada µ harga di satu kawasan yang berbeda

ii. Laporkan besaran MSE dan MST.


summary(anovaoneway)
MSE = 18498
MST= 236071

iii. Ujilah hipotesis tersebut pada alpha= 0,01.


#seleksi data
priceandneigbourhood <- dplyr::select(sample_AB_NYC_2019,
neighbourhood_group, price)

#one way anova test


attach(priceandneigbourhood)
names(priceandneigbourhood)
class(priceandneigbourhood)
levels(priceandneigbourhood)
boxplot (price~neighbourhood_group)
aov(price~neighbourhood_group)
anovaoneway <-aov(price~neighbourhood_group)
summary(anovaoneway)

Df Sum Sq Mean Sq F value Pr(>F)


neighbourhood_group 4 944285 236071 12.76 3.92e-10 ***
Residuals 995 18405487 18498
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Bagaimana kesimpulan Anda?Apakah Anda menolak H0 atau tidak?


Dengan alpha=0,01 H0 ditolak, sehingga menerima H1 yang artinya
setidaknya ada salah satu harga rata-rata yang berbeda di antara kawasan
karena P value = 3,92 × 10−10 < alpha = 0,01 dan terdapat hubungan yang
signifikan secara statistika antara harga dan kawasan.
d. Mungkin saja variasi harga rata-rata AirBnB per malam antarkawasan
(var:neighbourhood_group) juga dipengaruhi oleh jenis kamar. Lakukan prosedur
two-way ANOVA untuk menguji hipotesis ini, dengan menambahkan jenis kamar
(var:room_type) sebagai variable blocking.

i. Tulislah hipotesis H0 dan H1 yang sesuai.


a. Berdasarkan Kawasan
H0 : µ harga antar kawasan sama
H1 : setidaknya ada µ harga di satu kawasan yang berbeda

b. Berdasarkan Jenis kamar


H0 : µ harga antar jenis kamar sama
H1 : setidaknya ada µ harga di satu jenis kamar yang berbeda

c. Berdasarkan Kawasan dan jenis kamar


H0 : tidak terdapat interaksi antara variabel kawasan dan jenis kamar
H1 : terdapat interaksi antara variabel kawasan dan jenis kamar

ii. Laporkan besaran MST, MSE dan MSB.


summary(anovatwoway)
MST : 17556
MSE : 16135
MSB : 1351347

iii. Ujilah hipotesis tersebut pada = 0:01.


#seleksi data
price.nh.rt <- dplyr::select(sample_AB_NYC_2019,
neighbourhood_group,price, room_type)
head(price.nh.rt)
summary(price.nh.rt)
str(price.nh.rt)

#ganti karakter jadi factor


price.nh.rt$neighbourhood_group <-
as.factor(price.nh.rt$neighbourhood_group)
price.nh.rt$room_type<- as.factor(price.nh.rt$room_type)

#two way anova test


anovatwoway <- aov(price~room_type + neighbourhood_group +
neighbourhood_group:room_type, data=price.nh.rt)
Df Sum Sq Mean Sq F value Pr(>F)
room_type 2 2702694 1351347 83.754 < 2e-16 ***
neighbourhood_group 4 615394 153848 9.535 1.45e-07 ***
room_type:neighbourhood_group 7 122890 17556 1.088 0.369
Residuals 986 15908793 16135
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Apakah kesimpulan Anda berubah dibanding jawaban Anda pada soal 2(c)[iii]?
Hipotesis H0 berdasarkan kawasan dan jenis kamar tetap ditolak, yang artinya
setidaknya terdapat satu rata rata harga baik berdasarkan kawasan maupun
jenis ruangan. Karena kedua P value kawasan (1.45e-07) dan p-value jenis
kamar (< 2e-16) < alpha= 0,01 (H0 ditolak). Dan tidak terdapat interaksi antara
variabel jenis kamar dan kawasan karene p-value (0,368) > alpha = 0,01 (H0
diterima)

iv. Berdasarkan hasil uji tersebut, variabel manakah yang lebih menjelaskan
varians harga per malam, apakah kawasan atau jenis kamar? Jelaskan jawaban
Anda.

Variabel kawasan lebih dapat menjelaskan ketimbang variabel jenis kamar


karna F value jenis kamar (83.754) > F value kawasan (9.535). sehingga
variabel kawasan lebih signifikan untuk menjelaskan varians harga per malam.

Anda mungkin juga menyukai