KUIS1 A2 Jessica Mawar Putri 162012533084

Jessica Mawar Putri 162012533084
1. rm(list=ls())
# Set seed for reproducibility

set.seed(123)
# Generate random data

data <- sample(seq(0, 200, by = 10), size = 1000, replace = TRUE)
Ini artinya, dengansequence dari 0-200 dan selilih 10 dengan size 1000
# Create histogram
hist(data, breaks = seq(0, 200, by = 10), main = "Histogram untuk kuis Sikom", xlab =
"Value", ylab = "Frequency")
# Create Pareto chart

counts <- table(cut(data, breaks = seq(0, 200, by = 10)))
cum_counts <- cumsum(counts)
cum_perc <- cum_counts / sum(counts) * 100
par(mar = c(5, 4, 4, 8))

barplot(cum_counts, main = "Pareto Chart untuk kuis Sikom", xlab = "Value", ylab =
"Cumulative Frequency", col = "steelblue")
par(new = TRUE)
plot(cum_perc, type = "o", pch = 20, axes = FALSE, col = "red", ylim = c(0, 100), ylab =
"", xlab = "")
axis(4, at = seq(0, 100, by = 20), labels = paste0(seq(0, 100, by = 20), "%"))
mtext("Cumulative Percentage", side = 4, line = 3)
legend("topright", c("Cumulative Frequency", "Cumulative Percentage"), fill =
c("steelblue", "red"))
Kode/syntax ini akan menghasilkan histogram dan bagan Pareto menggunakan fungsi
hist( ) dan barplot( ) masing-masing untuk histogram dan bagan Pareto. Fungsi table( )
dan cut( ) digunakan untuk menghitung frekuensi setiap nampan dan frekuensi kumulatif
untuk bagan Pareto. Fungsi cumsum( ) digunakan untuk menghitung frekuensi kumulatif.
Fungsi plot( ) digunakan untuk memplot persentase kumulatif dan fungsi axis( ) dan
mtext( ) digunakan untuk menambahkan label ke sumbu y kanan. Terakhir, fungsi
legend( ) digunakan untuk menambahkan legenda ke pojok kanan atas diagram Pareto.
Berikut lampirannya:
Generate data
Histogram
Pareto
b. Ujilah data tersebut berdistribusi normal dengan taraf signifikansi 8%, definisikan
hipotesis nol dan hipotesis alternatif
H0: Data berdistribusi normal

H1: Data tidak berdistribusi dengan normal
Menggunakan Shapiro-wilk test. Karena menurut saya kalau pake Uji good-of-fit chi-
square atau K-S test memerlukan penentuan distribusi normal yang dihipotesiskan dan
menghitung frekuensi yang diharapkan untuk setiap bins. Karena datanya acak di kasus
ini dan tidak memiliki distribusi normal yang dihipotesiskan untuk dibandingkan,
menurut saya uji Shapiro-Wilk lebih tepat.
Dari hasil diatas, p-value didapatkan kurang dari 0,08. Kesimpulannya, gagal menolak
H0 dan tidak memiliki cukup bukti untuk menunjukkan bahwa data tidak terdistribusi
secara normal pada tingkat signifikansi 8%.
c. Data dapat diuji dengan menggunakan one-sample t-test dengan taraf signifikansi 5%.
Berarti, confidence intervalnya 0,95.
H0: rata-rata populasi sama dengan 100

H1: rata-rata populasi tidak sama dengan 100
Hasil yang didapat p-valuenya adalah 0,9616 melebihi taraf signifikansi 0,05. Oleh
karena itu, gagal menolak hipotesis nol dan menyimpulkan bahwa tidak ada cukup bukti
yang menyatakan bahwa rata-rata populasi tidak sama dengan 100 pada tingkat
signifikansi 5%. Interval kepercayaan 95% untuk rata-rata data adalah (96.42353,
101.37647) dengan sampe estimatesnya rata-rata populasinya adalah 100,09.
2. A)
Syntax PDF dan CDF untuk Uniform distribution dengan 200 random data
Syntax PDF dan CDF untuk Poisson distribution dengan 200 random data dengan lambda
=2
Syntax PDF dan CDF untuk lognormal distribution dengan 200 random data
Plot untuk PDF dan CDF Uniform, Poisson, dan Lognormal distribution:
B)
Uniform Distribution:
Nilai parameter: 1,80586 sampai 2,85173

Poisson distribution

Lognormal distribution:
3. A) menggunakan K-S test untuk melihat apakah kedua data random berasal dari distribusi
yang sama dengan taraf signifikansi 10%
H0: kedua sampel berasal dari distribusi yang sama
H1: kedua sampel tidak berasal dari distribusi yang sama
Fungsi ks.test() melakukan uji KS dua sampel, yang menguji hipotesis nol bahwa kedua
sampel berasal dari distribusi kontinu yang sama.
Argumen alternatif = "dua sisi" menentukan bahwa kami ingin menguji hipotesis
alternatif dua sisi bahwa dua sampel berasal dari distribusi yang berbeda.
Argumen exact = SALAH menentukan bahwa kita ingin menggunakan perkiraan nilai p
berdasarkan distribusi asimtotik dari statistik uji, dan argumen benar = SALAH
menentukan bahwa kita tidak ingin menggunakan koreksi kontinuitas. Terakhir, argumen
sig.level = 0.1 menentukan tingkat signifikansi pengujian.
Hasilnya, karena P value kurang dari taraf signifikansi, menolak H0 bahwa kedua sampel
berasal dari distribusi yang sama.
B) rata-rata dan variansi masing-masing distribusi negative exponential danlognormal:

set.seed(123) # for reproducibility
# Generate 1000 random numbers from a negative exponential distribution with rate
parameter 0.1
neg_exp_data <- rexp(1000, rate = 0.1)
# Generate 1000 random numbers from a lognormal distribution with meanlog = 1 and
sdlog = 0.5
lognormal_data <- rlnorm(1000, meanlog = 1, sdlog = 0.5)
# Calculate the mean and variance of the negative exponential distribution

neg_exp_mean <- mean(neg_exp_data)
neg_exp_var <- var(neg_exp_data)
# Calculate the 10% confidence intervals for the mean and variance of the negative
exponential distribution
neg_exp_mean_ci <- t.test(neg_exp_data, conf.level = 0.9)$conf.int
neg_exp_var_ci <- c((length(neg_exp_data) - 1) * neg_exp_var / qchisq(0.95,
length(neg_exp_data) - 1), (length(neg_exp_data) - 1) * neg_exp_var / qchisq(0.1,
length(neg_exp_data) - 1))
# Calculate the mean and variance of the lognormal distribution

lognormal_mean <- mean(lognormal_data)
lognormal_var <- var(lognormal_data)
# Calculate the 10% confidence intervals for the mean and variance of the lognormal
distribution
lognormal_mean_ci <- t.test(lognormal_data, conf.level = 0.9)$conf.int
lognormal_var_ci <- c((length(lognormal_data) - 1) * lognormal_var / qchisq(0.95,
length(lognormal_data) - 1), (length(lognormal_data) - 1) * lognormal_var / qchisq(0.1,
length(lognormal_data) - 1))
# Print the results

cat("Negative Exponential Distribution:\n")
cat("Mean:", neg_exp_mean, "\n")
cat("95% Confidence Interval for Mean:", neg_exp_mean_ci[1], "-",
neg_exp_mean_ci[2], "\n")
cat("Variance:", neg_exp_var, "\n")
cat("10% Confidence Interval for Variance:", neg_exp_var_ci[1], "-", neg_exp_var_ci[2],
"\n\n")
cat("Lognormal Distribution:\n")
cat("Mean:", lognormal_mean, "\n")
cat("95% Confidence Interval for Mean:", lognormal_mean_ci[1], "-",
lognormal_mean_ci[2], "\n")
cat("Variance:", lognormal_var, "\n")
cat("10% Confidence Interval for Variance:", lognormal_var_ci[1], "-",
lognormal_var_ci[2], "\n")
Hasilnya,
Negative Exponential Distribution:
Mean: 10.02143
95% Confidence Interval for Mean: 9.636261 - 10.4066
Variance: 101.7756
10% Confidence Interval for Variance: 84.96833 - 121.1736
Lognormal Distribution:
Mean: 2.032771
95% Confidence Interval for Mean: 3.053969 - 3.23263
Variance: 2.944014

KUIS1 A2 Jessica Mawar Putri 162012533084

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

KUIS1 A2 Jessica Mawar Putri 162012533084

Diunggah oleh

Hak Cipta:

Format Tersedia

Jessica Mawar Putri 162012533084

# Set seed for reproducibility

# Generate random data

# Create Pareto chart

par(mar = c(5, 4, 4, 8))

H0: Data berdistribusi normal

H0: rata-rata populasi sama dengan 100

Nilai parameter: 1,80586 sampai 2,85173

Nilai parameter: 2,17882 sampai 2,62367

Nilai parameter: 2,25762 sampai 3,14312

B) rata-rata dan variansi masing-masing distribusi negative exponential danlognormal:

# Calculate the mean and variance of the negative exponential distribution

# Calculate the mean and variance of the lognormal distribution

# Print the results

Anda mungkin juga menyukai