Anda di halaman 1dari 12

Nama : Husaini indrawan

NIM : 112112095
Kelas : 3D33

PENUGASAN MINGGU 4

Keberhasilan suatu pembangunan di suatu daerah dapat dilihat dari beberapa indikator,
diantaranya adalah Indeks Pembangunan Manusia (IPM) dan laju pertumbuhan ekonomi.
Pemerintah RI menetapkan target dalam RPJMN 2020-2024 IPM sebesar 63,94 dan laju
pertumbuhan ekonomi di Provinsi Papua sebesar 4,7 persen. Tahun 2020 diperoleh data
sebagai berikut.

Apakah hasil pembangunan di Provinsi Papua pada Tahun 2020 tersebut sudah mencapai
target yang ditetapkan? Untuk menjawabnya lakukan langkah-langkah berikut ini
T.test <- function(X, mu=0){
+ X <- as.matrix(X)
+ n <- nrow(X)
+ p <- ncol(X)
+ df2 <- n - p
+ if(df2 < 1L) stop("Need nrow(X) > ncol(X).")
+ if(length(mu) != p) mu <- rep(mu[1], p)
+ xbar <- colMeans(X)
+ S <- cov(X)
+ T2 <- n * t(xbar - mu) %*% solve(S) %*% (xbar - mu)
+ Fstat <- T2 / (p * (n-1) / df2)
+ pval <- 1 - pf(Fstat, df1=p, df2=df2)
+ data.frame(T2=as.numeric(T2), Fstat=as.numeric(Fstat),
+ df1=p, df2=df2, p.value=as.numeric(pval), row.names="")
1. Tuliskan hipotesis penelitiannya, lakukan prosedur pengujian hipotesisnya dan buatlah
ellipsoid daerah penerimaan H0 pada taraf α=5%
a. Hipotesis
63,94
𝐻0 : 𝜇 = [ ]
4,7
63,94
𝐻1 : 𝜇 ≠ [ ]
4,7

b. Tingkat signifikansi
α = 5%
c. Wilayah Kritis
> n <- nrow(X)
> p <- ncol(X)
> alpha <- 0.05
>
> C2 <- (n-1)*p*qf(1-alpha,df1=p, df2=n-p)/(n-p)
> C2
[1] 6.997188

𝑇 2 > 6,997188 atau 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05


d. Statistik Uji
> mu <- c(63.94, 4.7)
> T.test(X,mu)
T2 Fstat df1 df2 p.value
26.96881 12.98498 2 26 0.0001229906
𝑇 2 = 26,96881 𝑎𝑡𝑎𝑢 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
e. Keputusan
Tolak 𝐻0 karena 𝑇 2 > 6,997188 𝑎𝑡𝑎𝑢 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05.
f. Kesimpulan
Dengan tingkat signifikansi 5 persen, terdapat cukup bukti untuk menyatakan
bahwa minimal ada satu variabel (IPM dan Laju pertumbuhan ekonomi) tidak
63,94
sama dengan [ ].
4,7
Gambar Ellipsoid:

> n <- nrow(X)


> p <- ncol(X)
> xbar <- colMeans(X)
> S <- cov(X)
> alpha<-0.05
> tconst <- sqrt((p/n)*((n-1)/(n-p)) * qf(1-alpha,p,n-p))
> id <- c(1,2)
> plot(ellipse(center=xbar[id], shape=S[id,id], radius=tconst,
+ draw=F),type="n", xlab="IPM", ylab="Laju Pertumbuh
an Ekonomi",
+ xlim = c(50,65),ylim = c(0,5))
> lines(ellipse(center=xbar[id], shape=S[id,id], radius=tconst, l
wd=3),
+ xlab="IPM", ylab="Laju Pertumbuhan Ekonomi")
> points(63.94,4.7,col="green", pch=16)
> text(63.94,4,expression(mu[0]))
> text(xbar[1]+0.5,xbar[2],expression(bar(x)))
Dengan mengacu pada gambar ellipsoid di atas, terlihat bahwa μ_0 terletak di luar
wilayah penerimaan H0, sehingga dapat disimpulkan bahwa H0 ditolak. Kesimpulan
tersebut sesuai dengan hasil dari pengujian hipotesis yang telah dilakukan
sebelumnya.
2. Buatlah simulatan confidence interval nya (CI T2 Hotelling maupun CI Bonferroni). Jika
keputusan di point (1) Tolak H0, Variabel apa yang menyebabkan hasil pembangunan di
Provinsi Papua belum mencapai target?

> rtab <- rbind(T2CI, tCI, bon)


> round(rtab, 2)
lower upper lower upper
T2CI 51.20 62.31 0.71 4.36
tCI 52.45 61.07 1.12 3.95
bon 51.77 61.74 0.90 4.18

CI IPM Laju
lower upper lower upper
T2 Hotelling 51,2 62,31 0,71 4,36
t-univariate 52,45 61,07 1,12 3,95
Bonferroni 51,77 61,74 0,9 4,18
Berdasarkan hasil perhitungan diketahui bahwa µ𝐼𝑃𝑀 dan µ𝐿𝑎𝑗𝑢 tidak berada di dalam
confidence interval baik 𝑇 2 Hotelling maupun Bonferoni. Hal tersebut menguatkan
keputusan tolak 𝐻0 . Variabel yang menyebabkan hasil pembangunan di Provinsi
Papua belum mencapai target yaitu IPM dan laju pertumbuhan ekonomi.

3. Apakah data mengandung outlier? Buatlah chi-square plot untuk mendeteksinya

> scatterplot(Q,Dist.order, grid=FALSE,regLine=FALSE,smooth=FALSE,


+ boxplot="",pch=16,xlab= expression(paste(chi[p]^2, "
+ quantile")),ylab="ordered distance")
> abline(a=0,b=1, col="black")

> x1<- X$IPM


> x2<- X$Laju
> matriks1<-cbind(x1,x2)#membuat data dalam matrik
> n<-dim(matriks1)[1] #menghitung dimensi baris
> p<-dim(matriks1)[2] #menghitung dimensi kolom
> #langkah pertama hitung vector rata-rata
> xbar<-apply(matriks1,2,mean)
> # hitung Square Generalized Distance
> d2<-mahalanobis(matriks1,xbar,cov(matriks1))
> d2
[1] 1.634455961 1.634471351 4.727649531 1.217810814 2.195984647
[6] 0.001966102 1.953377116 18.327052245 0.661638488 0.176840396
[11] 0.413013655 0.457326453 1.050402649 0.741497011 0.796267132
[16] 0.780631677 0.946188744 0.342006260 0.482743764 5.148540757
[21] 1.205942248 0.805076732 0.941813255 1.571840668 0.054583617
[26] 0.749762577 0.453255805 4.527860343

Tentu, data tersebut menunjukkan adanya pencilan pada observasi ke-8, yakni Kabupaten
Mimika. Hal ini dapat diamati dari plot chi-square di mana Kabupaten Mimika memiliki
pencilan yang jauh dari garis regresi dan observasi lainnya.
4. Lakukan uji multivariate normal dan apa yang terjadi jika data outlier dibuang?
a. Sebelum outlier dibuang
i. Hipotesis
𝐻0 : 𝑑𝑎𝑡𝑎 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡𝑒 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻1 : 𝑑𝑎𝑡𝑎 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡𝑒 𝑛𝑜𝑟𝑚𝑎𝑙
ii. Tingkat signifikansi
𝛼 = 5%
iii. Wilayah kritis
𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
iv. Statistik Uji
Uji Royston

> UjiRoy <- mvn(X, mvnTest = "royston")


> UjiRoy
$multivariateNormality
Test H p value MVN
1 Royston 11.18794 0.003715242 NO

𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,003715
Uji Mardia
> UjiMar <- mvn(X, mvnTest = "mardia")
> UjiMar
$multivariateNormality
Test Statistic p value Result
1 Mardia Skewness 36.4323865339364 2.35762724091081e-07 NO
2 Mardia Kurtosis 5.68158301497238 1.33453710304821e-08 NO
3 MVN <NA> <NA> NO

𝑝 − 𝑣𝑎𝑙𝑢𝑒(𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠) = 0,000
𝑝 − 𝑣𝑎𝑙𝑢𝑒(𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠) = 0,000
v. Keputusan
Tolak 𝐻0 karena 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05.
vi. Kesimpulan
Dengan tingkat signifikansi 5 persen, terdapat cukup bukti untuk
menyatakan bahwa data tidak berdistribusi multivariate normal.

b. Setelah outlier dibuang


i. Hipotesis
𝐻0 : 𝑑𝑎𝑡𝑎 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡𝑒 𝑛𝑜𝑟𝑚𝑎𝑙
𝐻1 : 𝑑𝑎𝑡𝑎 𝑡𝑖𝑑𝑎𝑘 𝑏𝑒𝑟𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑠𝑖 𝑚𝑢𝑙𝑡𝑖𝑣𝑎𝑟𝑖𝑎𝑡𝑒 𝑛𝑜𝑟𝑚𝑎𝑙
ii. Tingkat signifikansi
𝛼 = 5%
iii. Wilayah kritis
𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
iv. Statistik Uji
Uji Royston
> UjiRoy <- mvn(X[-8,], mvnTest = "royston")
> UjiRoy
$multivariateNormality
Test H p value MVN
1 Royston 2.393432 0.238505 YES
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,238505

Uji Mardia
> UjiMar <- mvn(X[-8,], mvnTest = "mardia")
> UjiMar
$multivariateNormality
Test Statistic p value Result
1 Mardia Skewness 2.55531237706453 0.634759392213912 YES
2 Mardia Kurtosis -0.572302614437117 0.567116978831578 YES
3 MVN <NA> <NA> YES

𝑝 − 𝑣𝑎𝑙𝑢𝑒(𝑠𝑘𝑒𝑤𝑛𝑒𝑠𝑠) = 0,63475
𝑝 − 𝑣𝑎𝑙𝑢𝑒(𝑘𝑢𝑟𝑡𝑜𝑠𝑖𝑠) = 0,56711
v. Keputusan
Gagal tolak 𝐻0 karena 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0,05
vi. Kesimpulan
Dengan tingkat signifikansi 5 persen, belum memeroleh cukup bukti untuk
menyatakan bahwa data tidak berdistribusi multivariate normal.
Setelah dilakukan pengujian hipotesis, dapat disimpulkan bahwa sebelum eliminasi
outlier, data tidak mengikuti distribusi multivariat normal. Namun, setelah outlier
dihilangkan, data menunjukkan distribusi multivariat normal.

5. Setelah permasalahan outlier ditangani, lakukan kembali prosedur pengujian hipotesisnya.


a. Hipotesis
63,94
𝐻0 : µ = [ ]
4,7
63,94
𝐻1 : µ ≠ [ ]
4,7
b. Tingkat signifikansi
𝛼 = 5%
c. Wilayah kritis
> n <- nrow(X2)
> p <- ncol(X2)
> alpha <- 0.05
>
> C2 <- (n-1)*p*qf(1-alpha,df1=p, df2=n-p)/(n-p)
> C2
[1] 7.041195

𝑇 2 > 7,041195 𝑎𝑡𝑎𝑢 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05


d. Statistik Uji
> X2 <- data4[c(-8,-29),c("IPM", "Laju")]
> xbar <- colMeans(X2)
> mu <- c(63.94, 4.7)
> T.test(X2,mu)
T2 Fstat df1 df2 p.value
105.7496 50.84114 2 25 1.549892e-09

𝑇 2 = 105,7496
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,000
e. Keputusan
Tolak 𝐻0 karena 𝑇 2 > 7,041195 𝑎𝑡𝑎𝑢 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
f. Kesimpulan
Dengan tingkat signifikansi 5 persen, terdapat cukup bukti untuk menyatakan
bahwa minimal ada satu variabel (IPM dan Laju pertumbuhan ekonomi) tidak
63,94
sama dengan [ ].
4,7
Gambar Elipsoid:

> n <- nrow(X2)


> p <- ncol(X2)
> xbar <- colMeans(X2)
> S <- cov(X2)
>
> alpha<-0.05
> tconst <- sqrt((p/n)*((n-1)/(n-p)) * qf(1-alpha,p,n-p))
> id <- c(1,2)
> plot(ellipse(center=xbar[id], shape=S[id,id], radius=tconst,
+ draw=F),type="n", xlab="IPM", ylab="Laju Pertumbuhan
Ekonomi",
+ xlim = c(50,65),ylim = c(0,5))
> lines(ellipse(center=xbar[id], shape=S[id,id], radius=tconst, lwd
=3),
+ xlab="IPM", ylab="Laju Pertumbuhan Ekonomi")
> points(63.94,4.7,col="green", pch=16)
> text(63.94,4,expression(mu[0]))
> text(xbar[1]+0.5,xbar[2],expression(bar(x)))
Dengan mengacu pada gambar ellipsoid di atas, terlihat bahwa μ_0 terletak di luar
wilayah penerimaan H0, sehingga dapat disimpulkan bahwa H0 ditolak. Kesimpulan
tersebut sesuai dengan hasil dari pengujian hipotesis yang telah dilakukan
sebelumnya.

6. Buatlah simulatan confidence interval nya (CI T2 Hotelling maupun CI Bonferroni). Jika
keputusan di point (3) Tolak H0, Variabel apa yang menyebabkan hasil Pembangunan di
Provinsi Papua belum mencapai target?

> rtab <- rbind(T2CI, tCI, bon)


> round(rtab, 2)
lower upper lower upper
T2CI 51.25 62.26 1.18 3.89
tCI 52.49 61.02 1.49 3.59
bon 51.82 61.69 1.32 3.75

CI IPM Laju Pertumnuhan ekonomi


lower upper lower upper
T2 Hoteeling 50,61 61,61 0,70 3,41
t-univariate 51,85 60,37 1,01 3,10
Bonferroni 51,18 61,04 0,84 3,27

Berdasarkan hasil perhitungan diketahui bahwa µ𝐼𝑃𝑀 dan µ𝐿𝑎𝑗𝑢 tidak berada di dalam
confidence interval baik 𝑇 2 Hotelling maupun Bonferoni. Hal tersebut menguatkan
keputusan tolak 𝐻0 . Variabel yang menyebabkan hasil pembangunan di Provinsi Papua
belum mencapai target yaitu IPM dan laju pertumbuhan ekonomi.

7. Apa kesimpulan Anda?


 Berdasarkan dari hasil perhitungan menunjukkan bahwa outlier memiliki dampak
terhadap distribusi data multivariat yang normal.
 Hal tersebut dapat dilihat pada nomor 4, di mana sebelum outlier dihilangkan,
data tidak memiliki distribusi multivariat normal. Namun, setelah outlier
dihilangkan, distribusi data menjadi multivariat normal.
 Meskipun demikian, outlier tidak memengaruhi uji rata-rata. Serta, ini dapat
diamati pada kasus nomor 1 dan 5, di mana hasilnya tetap sama baik sebelum
63,94
atau setelah outlier dihilangkan, yaitu µ ≠ [ ].
4,7
 Data outlier hanya berpengaruh terhadap distribusi data serta perubahan selang
CI.
EXERCISE

SOAL

JAWABAN

1. Observasi termasuk sampel kecil dan kovarians matriks tidak diketahui, maka digunakan
uji statistik T2
a. Hipotesis
𝐻0 : µ = [
6]
11
𝐻1 : µ ≠ [ 6 ]
11
b. Tingkat signifikansi
𝛼 = 5%
c. Wilayah kritis
𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
d. Statistik Uji
> Y <- matrix(c(3,6,5,10,10,12,14,9), ncol=2); Y
[,1] [,2]
[1,] 3 10
[2,] 6 12
[3,] 5 14
[4,] 10 9
> mu <- c(6, 11); mu
[1] 6 11
> uji <- T.test(Y, mu); uji
T2 Fstat df1 df2 p.value
0.06103286 0.02034429 2 2 0.9800613

𝑇 2 = 0,06103
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,98006
e. Keputusan
Gagal tolak 𝐻0 karena 𝑝 − 𝑣𝑎𝑙𝑢𝑒 > 0,05
f. Kesimpulan
Dengan tingkat signifikansi 5 persen, terdapat cukup bukti untuk menyatakan

bahwa rata-rata populasi dari data sama dengan µ = [ 6 ].


11

2. (A) Observasi termasuk sampel kecil dan kovarians matriks tidak diketahui, maka
digunakan uji statistik T2
a. Hipotesis
𝐻0 : µ = [30,25,40,25]
𝐻1 : µ ≠ [30,25,40,25]
b. Tingkat signifikansi
𝛼 = 5%
c. Wilayah kritis
𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
d. Statistik Uji
> Y_2 <- data.frame(y1,y2,y3,y4,y5);Y_2
y1 y2 y3 y4 y5
1 51 36 50 35 42
2 27 20 26 17 27
3 37 22 41 37 30
4 42 36 32 34 27
5 27 18 33 14 29
6 43 32 43 35 40
7 41 22 36 25 38
8 38 21 31 20 16
9 36 23 27 25 28
10 26 31 31 32 36
11 29 20 25 26 25
> mu2 <- c(30,25,40,25,30); mu2
[1] 30 25 40 25 30
> uji2 <- T.test(Y_2, mu2); uji2
T2 Fstat df1 df2 p.value
85.3327 10.23992 5 6 0.006699525

𝑇 2 = 85,3327
𝑝 − 𝑣𝑎𝑙𝑢𝑒 = 0,00669
e. Keputusan
Tolak 𝐻0 karena 𝑝 − 𝑣𝑎𝑙𝑢𝑒 < 0,05
f. Kesimpulan
Dengan tingkat signifikansi 5 persen, terdapat belum cukup bukti untuk
menyatakan bahwa rata-rata populasi dari data sama dengan µ = [30,25,40,25].
(B) Didapatkan keputusan tolak 𝐻 0, maka akan dilakukan uji parsial masing-masing
variabel menggunakan confidence interval. CI yang digunakan adalah CI Bonferroni.
> #Vektor Rata-rata
> xbar <- colMeans(Y_2); xbar
y1 y2 y3 y4 y5
36.09091 25.54545 34.09091 27.27273 30.72727
> #Matriks kovarians
> S <- cov(Y_2); S
y1 y2 y3 y4 y5
y1 65.09091 33.64545 47.59091 36.77273 25.42727
y2 33.64545 46.07273 28.94545 40.33636 28.36364
y3 47.59091 28.94545 60.69091 37.37273 41.12727
y4 36.77273 40.33636 37.37273 62.81818 31.68182
y5 25.42727 28.36364 41.12727 31.68182 58.21818
> #Hasil Perhitungan CI
> rtab <- rbind(bon)
> round(rtab, 2)
y1 y1 y2 y2 y3 y3 y4 y4 y5 y5
bon 28.38 43.8 19.06 32.03 26.65 41.54 19.7 34.85 23.44 38.02
Interpretasi:
 y1: 28,38 ≤ 𝒂 `𝝁 ≤ 43.8 = 95%
Karena nilai 𝜇 0[1] = 30 berada dalam CI, maka keputusannya gagal tolak 𝐻 0
 y2: 19.06 ≤ 𝒂 `𝝁 ≤ 32.03 = 95%
Karena nilai 𝜇 0[2] = 25 berada dalam CI, maka keputusannya gagal tolak 𝐻 0
 y3: 26.65 ≤ 𝒂 `𝝁 ≤ 41.54 = 95%
Karena nilai 𝜇 0[3] = 40 berada dalam CI, maka keputusannya gagal tolak 𝐻 0
 y4: 19.7 ≤ 𝒂 `𝝁 ≤ 34.85 = 95%
Karena nilai 𝜇 0[4] = 25 berada dalam CI, maka keputusannya gagal tolak 𝐻 0
 y5: 23.44 ≤ 𝒂 `𝝁 ≤ 38.02 = 95%
Karena nilai 𝜇 0[5] = 30 berada dalam CI, maka keputusannya gagal tolak 𝐻 0

Anda mungkin juga menyukai