1. rm(list=ls())
# Create histogram
hist(data, breaks = seq(0, 200, by = 10), main = "Histogram untuk kuis Sikom", xlab =
"Value", ylab = "Frequency")
Kode/syntax ini akan menghasilkan histogram dan bagan Pareto menggunakan fungsi
hist( ) dan barplot( ) masing-masing untuk histogram dan bagan Pareto. Fungsi table( )
dan cut( ) digunakan untuk menghitung frekuensi setiap nampan dan frekuensi kumulatif
untuk bagan Pareto. Fungsi cumsum( ) digunakan untuk menghitung frekuensi kumulatif.
Fungsi plot( ) digunakan untuk memplot persentase kumulatif dan fungsi axis( ) dan
mtext( ) digunakan untuk menambahkan label ke sumbu y kanan. Terakhir, fungsi
legend( ) digunakan untuk menambahkan legenda ke pojok kanan atas diagram Pareto.
Berikut lampirannya:
Jessica Mawar Putri 162012533084
Generate data
Jessica Mawar Putri 162012533084
Histogram
Pareto
Jessica Mawar Putri 162012533084
b. Ujilah data tersebut berdistribusi normal dengan taraf signifikansi 8%, definisikan
hipotesis nol dan hipotesis alternatif
Menggunakan Shapiro-wilk test. Karena menurut saya kalau pake Uji good-of-fit chi-
square atau K-S test memerlukan penentuan distribusi normal yang dihipotesiskan dan
menghitung frekuensi yang diharapkan untuk setiap bins. Karena datanya acak di kasus
ini dan tidak memiliki distribusi normal yang dihipotesiskan untuk dibandingkan,
menurut saya uji Shapiro-Wilk lebih tepat.
Jessica Mawar Putri 162012533084
Dari hasil diatas, p-value didapatkan kurang dari 0,08. Kesimpulannya, gagal menolak
H0 dan tidak memiliki cukup bukti untuk menunjukkan bahwa data tidak terdistribusi
secara normal pada tingkat signifikansi 8%.
c. Data dapat diuji dengan menggunakan one-sample t-test dengan taraf signifikansi 5%.
Berarti, confidence intervalnya 0,95.
Hasil yang didapat p-valuenya adalah 0,9616 melebihi taraf signifikansi 0,05. Oleh
karena itu, gagal menolak hipotesis nol dan menyimpulkan bahwa tidak ada cukup bukti
yang menyatakan bahwa rata-rata populasi tidak sama dengan 100 pada tingkat
Jessica Mawar Putri 162012533084
signifikansi 5%. Interval kepercayaan 95% untuk rata-rata data adalah (96.42353,
101.37647) dengan sampe estimatesnya rata-rata populasinya adalah 100,09.
2. A)
Syntax PDF dan CDF untuk Uniform distribution dengan 200 random data
Syntax PDF dan CDF untuk Poisson distribution dengan 200 random data dengan lambda
=2
Syntax PDF dan CDF untuk lognormal distribution dengan 200 random data
Jessica Mawar Putri 162012533084
Plot untuk PDF dan CDF Uniform, Poisson, dan Lognormal distribution:
B)
Uniform Distribution:
Jessica Mawar Putri 162012533084
Lognormal distribution:
3. A) menggunakan K-S test untuk melihat apakah kedua data random berasal dari distribusi
yang sama dengan taraf signifikansi 10%
H0: kedua sampel berasal dari distribusi yang sama
H1: kedua sampel tidak berasal dari distribusi yang sama
Jessica Mawar Putri 162012533084
Fungsi ks.test() melakukan uji KS dua sampel, yang menguji hipotesis nol bahwa kedua
sampel berasal dari distribusi kontinu yang sama.
Argumen alternatif = "dua sisi" menentukan bahwa kami ingin menguji hipotesis
alternatif dua sisi bahwa dua sampel berasal dari distribusi yang berbeda.
Argumen exact = SALAH menentukan bahwa kita ingin menggunakan perkiraan nilai p
berdasarkan distribusi asimtotik dari statistik uji, dan argumen benar = SALAH
menentukan bahwa kita tidak ingin menggunakan koreksi kontinuitas. Terakhir, argumen
sig.level = 0.1 menentukan tingkat signifikansi pengujian.
Hasilnya, karena P value kurang dari taraf signifikansi, menolak H0 bahwa kedua sampel
berasal dari distribusi yang sama.
# Generate 1000 random numbers from a negative exponential distribution with rate
parameter 0.1
neg_exp_data <- rexp(1000, rate = 0.1)
# Generate 1000 random numbers from a lognormal distribution with meanlog = 1 and
sdlog = 0.5
lognormal_data <- rlnorm(1000, meanlog = 1, sdlog = 0.5)
Jessica Mawar Putri 162012533084
# Calculate the 10% confidence intervals for the mean and variance of the negative
exponential distribution
neg_exp_mean_ci <- t.test(neg_exp_data, conf.level = 0.9)$conf.int
neg_exp_var_ci <- c((length(neg_exp_data) - 1) * neg_exp_var / qchisq(0.95,
length(neg_exp_data) - 1), (length(neg_exp_data) - 1) * neg_exp_var / qchisq(0.1,
length(neg_exp_data) - 1))
# Calculate the 10% confidence intervals for the mean and variance of the lognormal
distribution
lognormal_mean_ci <- t.test(lognormal_data, conf.level = 0.9)$conf.int
lognormal_var_ci <- c((length(lognormal_data) - 1) * lognormal_var / qchisq(0.95,
length(lognormal_data) - 1), (length(lognormal_data) - 1) * lognormal_var / qchisq(0.1,
length(lognormal_data) - 1))
cat("Lognormal Distribution:\n")
cat("Mean:", lognormal_mean, "\n")
cat("95% Confidence Interval for Mean:", lognormal_mean_ci[1], "-",
lognormal_mean_ci[2], "\n")
cat("Variance:", lognormal_var, "\n")
cat("10% Confidence Interval for Variance:", lognormal_var_ci[1], "-",
lognormal_var_ci[2], "\n")
Jessica Mawar Putri 162012533084
Jessica Mawar Putri 162012533084
Hasilnya,
Negative Exponential Distribution:
Mean: 10.02143
95% Confidence Interval for Mean: 9.636261 - 10.4066
Variance: 101.7756
10% Confidence Interval for Variance: 84.96833 - 121.1736
Lognormal Distribution:
Mean: 2.032771
95% Confidence Interval for Mean: 3.053969 - 3.23263
Variance: 2.944014