Anda di halaman 1dari 13

Jessica Mawar Putri 162012533084

1. rm(list=ls())

# Set seed for reproducibility


set.seed(123)

# Generate random data


data <- sample(seq(0, 200, by = 10), size = 1000, replace = TRUE)
Ini artinya, dengansequence dari 0-200 dan selilih 10 dengan size 1000

# Create histogram
hist(data, breaks = seq(0, 200, by = 10), main = "Histogram untuk kuis Sikom", xlab =
"Value", ylab = "Frequency")

# Create Pareto chart


counts <- table(cut(data, breaks = seq(0, 200, by = 10)))
cum_counts <- cumsum(counts)
cum_perc <- cum_counts / sum(counts) * 100

par(mar = c(5, 4, 4, 8))


barplot(cum_counts, main = "Pareto Chart untuk kuis Sikom", xlab = "Value", ylab =
"Cumulative Frequency", col = "steelblue")
par(new = TRUE)
plot(cum_perc, type = "o", pch = 20, axes = FALSE, col = "red", ylim = c(0, 100), ylab =
"", xlab = "")
axis(4, at = seq(0, 100, by = 20), labels = paste0(seq(0, 100, by = 20), "%"))
mtext("Cumulative Percentage", side = 4, line = 3)
legend("topright", c("Cumulative Frequency", "Cumulative Percentage"), fill =
c("steelblue", "red"))

Kode/syntax ini akan menghasilkan histogram dan bagan Pareto menggunakan fungsi
hist( ) dan barplot( ) masing-masing untuk histogram dan bagan Pareto. Fungsi table( )
dan cut( ) digunakan untuk menghitung frekuensi setiap nampan dan frekuensi kumulatif
untuk bagan Pareto. Fungsi cumsum( ) digunakan untuk menghitung frekuensi kumulatif.
Fungsi plot( ) digunakan untuk memplot persentase kumulatif dan fungsi axis( ) dan
mtext( ) digunakan untuk menambahkan label ke sumbu y kanan. Terakhir, fungsi
legend( ) digunakan untuk menambahkan legenda ke pojok kanan atas diagram Pareto.

Berikut lampirannya:
Jessica Mawar Putri 162012533084

Generate data
Jessica Mawar Putri 162012533084

Histogram

Pareto
Jessica Mawar Putri 162012533084

b. Ujilah data tersebut berdistribusi normal dengan taraf signifikansi 8%, definisikan
hipotesis nol dan hipotesis alternatif

H0: Data berdistribusi normal


H1: Data tidak berdistribusi dengan normal

Menggunakan Shapiro-wilk test. Karena menurut saya kalau pake Uji good-of-fit chi-
square atau K-S test memerlukan penentuan distribusi normal yang dihipotesiskan dan
menghitung frekuensi yang diharapkan untuk setiap bins. Karena datanya acak di kasus
ini dan tidak memiliki distribusi normal yang dihipotesiskan untuk dibandingkan,
menurut saya uji Shapiro-Wilk lebih tepat.
Jessica Mawar Putri 162012533084

Dari hasil diatas, p-value didapatkan kurang dari 0,08. Kesimpulannya, gagal menolak
H0 dan tidak memiliki cukup bukti untuk menunjukkan bahwa data tidak terdistribusi
secara normal pada tingkat signifikansi 8%.

c. Data dapat diuji dengan menggunakan one-sample t-test dengan taraf signifikansi 5%.
Berarti, confidence intervalnya 0,95.

H0: rata-rata populasi sama dengan 100


H1: rata-rata populasi tidak sama dengan 100

Hasil yang didapat p-valuenya adalah 0,9616 melebihi taraf signifikansi 0,05. Oleh
karena itu, gagal menolak hipotesis nol dan menyimpulkan bahwa tidak ada cukup bukti
yang menyatakan bahwa rata-rata populasi tidak sama dengan 100 pada tingkat
Jessica Mawar Putri 162012533084

signifikansi 5%. Interval kepercayaan 95% untuk rata-rata data adalah (96.42353,
101.37647) dengan sampe estimatesnya rata-rata populasinya adalah 100,09.

2. A)
Syntax PDF dan CDF untuk Uniform distribution dengan 200 random data

Syntax PDF dan CDF untuk Poisson distribution dengan 200 random data dengan lambda
=2

Syntax PDF dan CDF untuk lognormal distribution dengan 200 random data
Jessica Mawar Putri 162012533084

Plot untuk PDF dan CDF Uniform, Poisson, dan Lognormal distribution:

B)
Uniform Distribution:
Jessica Mawar Putri 162012533084

Nilai parameter: 1,80586 sampai 2,85173


Poisson distribution

Nilai parameter: 2,17882 sampai 2,62367


Jessica Mawar Putri 162012533084

Lognormal distribution:

Nilai parameter: 2,25762 sampai 3,14312

3. A) menggunakan K-S test untuk melihat apakah kedua data random berasal dari distribusi
yang sama dengan taraf signifikansi 10%
H0: kedua sampel berasal dari distribusi yang sama
H1: kedua sampel tidak berasal dari distribusi yang sama
Jessica Mawar Putri 162012533084

Fungsi ks.test() melakukan uji KS dua sampel, yang menguji hipotesis nol bahwa kedua
sampel berasal dari distribusi kontinu yang sama.
Argumen alternatif = "dua sisi" menentukan bahwa kami ingin menguji hipotesis
alternatif dua sisi bahwa dua sampel berasal dari distribusi yang berbeda.
Argumen exact = SALAH menentukan bahwa kita ingin menggunakan perkiraan nilai p
berdasarkan distribusi asimtotik dari statistik uji, dan argumen benar = SALAH
menentukan bahwa kita tidak ingin menggunakan koreksi kontinuitas. Terakhir, argumen
sig.level = 0.1 menentukan tingkat signifikansi pengujian.

Hasilnya, karena P value kurang dari taraf signifikansi, menolak H0 bahwa kedua sampel
berasal dari distribusi yang sama.

B) rata-rata dan variansi masing-masing distribusi negative exponential danlognormal:


set.seed(123) # for reproducibility

# Generate 1000 random numbers from a negative exponential distribution with rate
parameter 0.1
neg_exp_data <- rexp(1000, rate = 0.1)

# Generate 1000 random numbers from a lognormal distribution with meanlog = 1 and
sdlog = 0.5
lognormal_data <- rlnorm(1000, meanlog = 1, sdlog = 0.5)
Jessica Mawar Putri 162012533084

# Calculate the mean and variance of the negative exponential distribution


neg_exp_mean <- mean(neg_exp_data)
neg_exp_var <- var(neg_exp_data)

# Calculate the 10% confidence intervals for the mean and variance of the negative
exponential distribution
neg_exp_mean_ci <- t.test(neg_exp_data, conf.level = 0.9)$conf.int
neg_exp_var_ci <- c((length(neg_exp_data) - 1) * neg_exp_var / qchisq(0.95,
length(neg_exp_data) - 1), (length(neg_exp_data) - 1) * neg_exp_var / qchisq(0.1,
length(neg_exp_data) - 1))

# Calculate the mean and variance of the lognormal distribution


lognormal_mean <- mean(lognormal_data)
lognormal_var <- var(lognormal_data)

# Calculate the 10% confidence intervals for the mean and variance of the lognormal
distribution
lognormal_mean_ci <- t.test(lognormal_data, conf.level = 0.9)$conf.int
lognormal_var_ci <- c((length(lognormal_data) - 1) * lognormal_var / qchisq(0.95,
length(lognormal_data) - 1), (length(lognormal_data) - 1) * lognormal_var / qchisq(0.1,
length(lognormal_data) - 1))

# Print the results


cat("Negative Exponential Distribution:\n")
cat("Mean:", neg_exp_mean, "\n")
cat("95% Confidence Interval for Mean:", neg_exp_mean_ci[1], "-",
neg_exp_mean_ci[2], "\n")
cat("Variance:", neg_exp_var, "\n")
cat("10% Confidence Interval for Variance:", neg_exp_var_ci[1], "-", neg_exp_var_ci[2],
"\n\n")

cat("Lognormal Distribution:\n")
cat("Mean:", lognormal_mean, "\n")
cat("95% Confidence Interval for Mean:", lognormal_mean_ci[1], "-",
lognormal_mean_ci[2], "\n")
cat("Variance:", lognormal_var, "\n")
cat("10% Confidence Interval for Variance:", lognormal_var_ci[1], "-",
lognormal_var_ci[2], "\n")
Jessica Mawar Putri 162012533084
Jessica Mawar Putri 162012533084

Hasilnya,
Negative Exponential Distribution:
Mean: 10.02143
95% Confidence Interval for Mean: 9.636261 - 10.4066
Variance: 101.7756
10% Confidence Interval for Variance: 84.96833 - 121.1736

Lognormal Distribution:
Mean: 2.032771
95% Confidence Interval for Mean: 3.053969 - 3.23263
Variance: 2.944014

Anda mungkin juga menyukai