ANALISIS DATA 1
OLEH :
2023
LAPORAN PRAKTIKUM
I. Pendahuluan
II. Metode
A. Membentuk Suatu Distribusi Sampling di R
Distribusi sampling adalah sebuah probabilitas distribusi yang di
dapat dari ukuran sampel. Adapun langkah kerja yang dilakukan pada
distribusi sampling dalam penyelesaian menggunakan program R studio
yaitu:
1. Mulai.
2. Masuk ke dalam Rstudio.
3. Menentukan nilai set.seed sesuai urutan absen.
4. Memasukkan nilai n.
5. Memasukkan variabel sample_means=rep(Na, n).
6. Memasuukan for (i in 1:n).
7. Memasukkan variabel sample_means[i].
8. Menampilkan 6 nilai teratas dari sintaks head(sample_means).
9. Menghitung nilai mean
10. Menghitung nilai standar deviasi
11. Menentukan peluang mean sampel lebih kecil atau lebih besar dari 6
sum(sample_means<=6/length(sample_means).
D. Interval Kepercayaan
Interval kepercayaan merupakan metode memperkirakan nilai
populasi atau parameter dengan menggunakan sampel, hal ini dikarenakan
perhitungan langsung pada seluruh populasi tidak memungkinkan untuk
dilakukan. Adapun langkah kerja yang dilakukan pada interval
kepercayaan dalam penyelesaian menggunakan program R studio yaitu:
1. Mulai.
2. Masuk kedalam Rstudio.
3. Memasukkan data(“airquality”).
4. Memasukkan variabel sample_means.
5. Mencetak string dengan sintaks print.
6. Memasukkan variabel sample.n.
7. Memasukkan variabel sample.sd.
8. Memasukkan variabel sample.se.
9. Menghitung nilai sqrt.
10. Mencetak string dengan sintaks print.
11. Memasukkan nilai alpha.
12. Menghitung degrees.freedom.
13. Menghitung t.score.
14. Mencetak string dengan sintaks print.
15. Menghitung margin.eror.
16. Memanggil variabel margin.eror.
17. Menghitung nilai lower.bound.
18. Menghitung nilai upper.bound.
19. Mencetak string dengan sintaks print.
III. Hasil
A. Program
1. Membentuk Suatu Distribusi Sampling di R
set.seed(20)
n=10000
sample_means=rep(NA, n)
for (i in 1:n) {
sample_means[i]=mean(rnorm(20,mean=5.3, sd=9))
}
head(sample_means)
hist(sample_means, main= "", xlab="samplemeans", col="skyblue")
mean(sample_means)
sd(sample_means)
sum(sample_means<=6)/length(sample_means)
set.seed(020)
data = runif(n = 500, min = 1.5, max = 8.5)
hist(data, col = 'steelblue', main = 'Histogram Lebar Tempurung Penyu')
mean(data)
sample10 = c()
n = 10
for (i in 1:n) {
sample10[i] = mean (sample(data, 10, replace = TRUE))
}
mean(sample10)
sd(sample10)
hist(sample10, col = 'steelblue', xlab = 'Turtle Shell Widht', main = 'sample
size = 10')
sample50 = c()
n = 50
for (i in 1:n) {
sample50[i] = mean (sample(data, 50, replace = TRUE))
}
mean(sample50)
sd(sample50)
hist(sample50, col = 'steelblue', xlab = 'Turtle Shell Widht', main = 'sample
size = 50')
4. Interval Kepercayaan
data("airquality")
sample.means = mean(airquality$Wind)
print(sample.means)
sample.n = length(airquality$Wind)
sample.sd = sd(airquality$Wind)
sample.se =sample.sd/sqrt(sample.n)
print(sample.se)
alpha = 0.05
degrees.freedom = sample.n - 1
t.score = qt(p= alpha/2, df = degrees.freedom, lower.tail = F)
print(t.score)
margin.eror = t.score *sample.se
margin.eror
lower.bound = sample.means - margin.eror
upper.bound = sample.means + margin.eror
print(c(lower.bound, upper.bound))
B. Output
1. Membentuk Suatu Sampling di R
2. Teorema Limit Pusat di R
IV. Pembahasan
1. Membentuk Suatu Distribusi Sampling di R
Langkah pertama memasukkan sintaks set.seet(20) yang berfungsi
mengatur data acak untuk memastikan reproduktibilitas hasil simulasi.
Dengan mengatur data acak yang sama, akan mendapatkan hasil yang
sama jika menjalankan kode yang sama. Dalam hal ini , data acak yang
digunakan yaitu 20, angka “20” merupakan angka yang ditentukan sesuai
urutan absen . Selanjutnya memasukkan sintaks n=10000 yang
merupakan variabel yang menentukan jumlah sampel rata-rata yang akan
dihasilkan. Lalu memasukkan sintaks sample_means=rep (Na, n)
berfungsi untuk membuat vector kosong dengan panjang “n” untuk
menyimpan hasil sampel rata-rata. Kemudian Memasukkan sintaks for(I
in 1:n) yaitu loop ini akan berjalan sebanyak n kali, dimana loop
merupakan kode program yang berulang.
Langkah selanjutkan memasukkan sintaks sample_means[i]=mean
(rnorm(20,mean=5.3, sd=9)) yang menghasilkan sampel acak dari
distribusi normal dengan “rata-rata 5.3” dan “standar deviasi 9”, rata-rata
dari sampel dihitung dan di simpan di vector sample_means. Kemudian
memasukkan sintaks head(sample_means) fungsi ini menampilkan 6
nilai teratas dari vector sample_means maka di outpun akan keluar 6 data
teratas dari vector sample_means yaitu, 3.610125, 3.753376, 6.671604,
4.291388, 8.394372, dan 5.432078. Selanjutnya memasukkan sintaks
hist (sample_means,main=””, xlab=”sample means”, col=”skyblue”)
yang berfungsi membuat histogram dari vector sample_means dengan
judul dan label sumbu yang sesuai. “Xlab” berfungsi memberi judul pada
grafik sumbu “x”. “Col” untuk memberi warna pada histogram, warna
yang digunakan yaitu skyblue, jika dilihat histogram yang muncul bukan
berdistribusi normal. Lalu memasukkan sintaks mean(sample_means)
untuk menghitung rata-rata dari vector sample_ means, maka nilai mean
yang keluar di output yaitu 5.283878. Setelah itu memasukkan sintaks
sd(sample_ means) yang berfungsi menghitung standar deviasi dari
vector sample_ means, maka nilai standar deviasi yang keluar di output
yaitu 1.998594. Dan langkah terakhir memasukkan sintaks
sum(sample_means <=6/length(sample_ means) yang merupakan
fungsi untuk menghitung proporsi sampel rata-rata yang kurang dari atau
sama dengan 6. Maka output yang muncul yaitu nilai dari sum 0.6389.
4. Interval Kepercayaan
Pada langkah pertama yang dilakukan untuk menghitung rata-rata
(mean) yaitu memasukkan sintaks data("airquality") berfungsi untuk
mengambil dataset "airquality" yang tersedia di R. Setelah itu
memasukkan sintaks sample.means = mean(airquality$Wind) yang
merupakan fungsi untuk menghitung rata-rata dari variabel "Wind" dalam
dataset "airquality" dan menyimpannya dalam variabel "sample.means".
Kemudian memasukkan sintaks print(sample.means) yang merupakan
fungsi untuk menampilkan nilai rata-rata yang dihitung sebelumnya.
Langkah selanjutnya untuk menghitung standar eror dari rata-rata
yaitu memasukkan sintaks sample.n = length(airquality$Wind) yang
berfungsi menghitung jumlah panjang sampel dalam variabel "Wind" dan
menyimpannya dalam variabel "sample.n". Kemudian memasukkan
sintaks sample.sd = sd(airquality$Wind) berfungsi untuk menghitung
standar deviasi dari variabel "Wind" dan menyimpannya dalam variabel
"sample.sd". Setelah itu memasukkan sintaks sample.se =
sample.sd/sqrt(sample.n) Untuk menghitung standar error dari rata-rata
sampel dan menyimpannya dalam variabel "sample.se". Lalu memasukkan
sintaks print(sample.se) yang merupakan fungsi untuk menampilkan nilai
standar error yang dihitung sebelumnya.
Pada langkah selanjutnya untuk menentukkan t-score yang dilakukan
yaitu memasukkan sintaks alpha = 0.05 yang berfungsi untuk menentukan
tingkat signifikansi alpha (dalam hal ini, 0.05) untuk interval kepercayaan.
Kemudian memasukkan sintaks degrees.freedom = sample.n – 1 yaitu
untuk Menghitung derajat kebebasan (degrees of freedom) untuk distribusi
t. Setelah itu memasukkan sintaks t.score = qt(p = alpha/2, df =
degrees.freedom, lower.tail = F) yang merupakan fungsi untuk
menghitung nilai t-score untuk interval kepercayaan dengan tingkat
signifikansi alpha/2, derajat kebebasan, dan lower.tail = FALSE. Lalu
memasukkan sintaks print(t.score) yang berfungsi untuk menampilkan
nilai t-score yang dihitung sebelumnya.
Pada langkah untuk menghitung margin eror dengan memasukkan
sintaks margin.error = t.score * sample.se yang merupakan fungsi
menghitung margin of error (kesalahan margin) dengan mengalikan nilai t-
score dengan standar error. Kemudian memanggil kembali variabel
margin.eror untuk menampilkan hasil dari nilai yang telh dihitung. Setelah
itu memasukkan sintaks lower.bound = sample.means - margin.error
yang berfungsi untuk menghitung batas bawah interval kepercayaan
dengan mengurangi margin of error dari rata-rata sampel. Lalu
memasukkan sintaks upper.bound = sample.means + margin.error yang
merupakan fungsi untuk menghitung batas atas interval kepercayaan
dengan menambahkan margin of error ke rata-rata sampel. Langkah
terakhir memasukkan sintaks print(c(lower.bound, upper.bound)) untuk
menampilkan batas bawah dan atas interval kepercayaan yang dihitung
sebelumnya.
V. Referensi
Nugraha, J. (2014). Pengantar analisis data kategorik: Metode dan aplikasi
menggunakan program R. Deepublish https://scholar.google.com
/scholar?hl=id&as_sdt=0%2C5&q=Nugraha%2C+J.+
%282014%29.+Pengantar+analisis+data+kategorik
%3A+Metode+dan+aplikasi+menggunakan+program+R.
+Deepublish+&btnG= diakses 20 Okto ber 2023
Soejoeti, Z. Sampel dan Distribusi Sampling.
https://scholar.google.com/schol ar?
hl=id&as_sdt=0%2C5&q=Soejoeti%2C+Z.
+Sampel+dan+Distribusi+Sampling&btnG= diakses 20 Oktober
2023
Sumargo, B. (2020). Teknik sampling. Unj press. https://scholar.google.com/s
cholar?hl=id&as_sdt=0%2C5&q=Sumargo%2C+B.+
%282020%29.+Teknik+sampling.+Unj+press.+&btnG= diakses 23
Oktober 2023