Anda di halaman 1dari 15

LAPORAN PRAKTIKUM 2

ANALISIS DATA 1

“SAMPEL DAN DISTRIBUSI PENGAMBILAN SAMPEL”

OLEH :

NAMA : HALIMAH TUSYA DIAH


NIM : 60600122065
KELAS : MATEMATIKA (B)
KELOMPOK : 4 (EMPAT)
ASISTEN : KURNIAWAN

PROGRAM STUDI MATEMATIKA

FAKULTAS SAINS DAN TEKNOLOGI

UNIVERSITAS ISLAM NEGERI ALAUDDIN MAKASSAR

2023
LAPORAN PRAKTIKUM

SAMPEL DAN DISTRIBUSI PENGAMBILAN SAMPEL

I. Pendahuluan

Pada laporan praktikum ini membahas tentang sampel dan distribusi


pengambilan sampel. Sampel adalah subset atau bagian yang diambil dari
populasi yang lebih besar untuk mewakili karakteristiknya. Sampel juga
merupakan sebagian data yang merupakan objek dari populasi yang diambil.
Sampel adalah bagian kecil dari populasi yang ingin diteliti.

Pengambilan sampel adalah proses mengambil sampel tersebut dari


populasi. Distribusi pengambilan sampel merujuk pada pola atau metode yang
digunakan dalam pengambilan sampel tersebut, yang dapat dipilih secara acak
atau non-acak, seperti pengambilan sampel acak sederhana, pengambilan
sampel berstrata, atau pengambilan sampel berkluster. Distribusi pengambilan
sampel ini penting untuk memastikan representativitas dan keakuratan sampel
dalam memperkirakan karakteristik populasi secara keseluruhan.

II. Metode
A. Membentuk Suatu Distribusi Sampling di R
Distribusi sampling adalah sebuah probabilitas distribusi yang di
dapat dari ukuran sampel. Adapun langkah kerja yang dilakukan pada
distribusi sampling dalam penyelesaian menggunakan program R studio
yaitu:
1. Mulai.
2. Masuk ke dalam Rstudio.
3. Menentukan nilai set.seed sesuai urutan absen.
4. Memasukkan nilai n.
5. Memasukkan variabel sample_means=rep(Na, n).
6. Memasuukan for (i in 1:n).
7. Memasukkan variabel sample_means[i].
8. Menampilkan 6 nilai teratas dari sintaks head(sample_means).
9. Menghitung nilai mean
10. Menghitung nilai standar deviasi
11. Menentukan peluang mean sampel lebih kecil atau lebih besar dari 6
sum(sample_means<=6/length(sample_means).

B. Teorema Limit Pusat di R


Teorema limit pusat menyatakan bahwa distribusi sampling dari
rata-rata sampel akan mendekati normal jika ukuran sampel cukup besar,
bahkan jika distribusi populasinya tidak normal. Adapun langkah kerja
yang dilakukan pada teorema limit pusat dalam penyelesaian mengguna
kan program R studio yaitu:
1. Mulai.
2. Masuk ke dalam Rstudio.
3. Menentukan nilai set.seet sesuai urutan absen.
4. Memasukkan data = runif(n = 500, min = 1.5, max =8.5).
5. Menampilkan histogram dari sintaks hist.

C. Teorema Limit Pusat di R diperbesar


Teorema limit pusat menyatakan bahwa distribusi sampling dari
rata-rata sampel akan mendekati normal jika ukuran sampel cukup besar,
bahkan jika distribusi populasinya tidak normal. Adapun langkah kerja
yang dilakukan pada teorema limit pusat dalam penyelesaian mengguna
kan program R studio yaitu:
1. Mulai.
2. Masuk ke dalam Rstudio.
3. Memasukkan sample10 = c().
4. Memasukkan nilai n.
5. Memasuukan for (i in 1:n).
6. Memasukkan variabel sample10[i].
7. Menghitung nilai mean.
8. Menghitung nilai standar deviasi.
9. Menampilkan histogram
10. Memasukkan sample50 = c().
11. Memasukkan nilai n.
12. Memasuukan for (i in 1:n).
13. Memasukkan variabel sample50[i].
14. Menghitung nilai mean.
15. Menghitung nilai standar deviasi.
16. Menampilkan histogram

D. Interval Kepercayaan
Interval kepercayaan merupakan metode memperkirakan nilai
populasi atau parameter dengan menggunakan sampel, hal ini dikarenakan
perhitungan langsung pada seluruh populasi tidak memungkinkan untuk
dilakukan. Adapun langkah kerja yang dilakukan pada interval
kepercayaan dalam penyelesaian menggunakan program R studio yaitu:
1. Mulai.
2. Masuk kedalam Rstudio.
3. Memasukkan data(“airquality”).
4. Memasukkan variabel sample_means.
5. Mencetak string dengan sintaks print.
6. Memasukkan variabel sample.n.
7. Memasukkan variabel sample.sd.
8. Memasukkan variabel sample.se.
9. Menghitung nilai sqrt.
10. Mencetak string dengan sintaks print.
11. Memasukkan nilai alpha.
12. Menghitung degrees.freedom.
13. Menghitung t.score.
14. Mencetak string dengan sintaks print.
15. Menghitung margin.eror.
16. Memanggil variabel margin.eror.
17. Menghitung nilai lower.bound.
18. Menghitung nilai upper.bound.
19. Mencetak string dengan sintaks print.

III. Hasil
A. Program
1. Membentuk Suatu Distribusi Sampling di R

set.seed(20)
n=10000
sample_means=rep(NA, n)
for (i in 1:n) {
sample_means[i]=mean(rnorm(20,mean=5.3, sd=9))
}
head(sample_means)
hist(sample_means, main= "", xlab="samplemeans", col="skyblue")
mean(sample_means)
sd(sample_means)
sum(sample_means<=6)/length(sample_means)

2. Teorema Limit Pusat di R

set.seed(020)
data = runif(n = 500, min = 1.5, max = 8.5)
hist(data, col = 'steelblue', main = 'Histogram Lebar Tempurung Penyu')
mean(data)

3. Teorema Limit Pusat di R diperbesar

sample10 = c()
n = 10
for (i in 1:n) {
sample10[i] = mean (sample(data, 10, replace = TRUE))
}
mean(sample10)
sd(sample10)
hist(sample10, col = 'steelblue', xlab = 'Turtle Shell Widht', main = 'sample
size = 10')
sample50 = c()
n = 50
for (i in 1:n) {
sample50[i] = mean (sample(data, 50, replace = TRUE))
}
mean(sample50)
sd(sample50)
hist(sample50, col = 'steelblue', xlab = 'Turtle Shell Widht', main = 'sample
size = 50')

4. Interval Kepercayaan

data("airquality")
sample.means = mean(airquality$Wind)
print(sample.means)
sample.n = length(airquality$Wind)
sample.sd = sd(airquality$Wind)
sample.se =sample.sd/sqrt(sample.n)
print(sample.se)
alpha = 0.05
degrees.freedom = sample.n - 1
t.score = qt(p= alpha/2, df = degrees.freedom, lower.tail = F)
print(t.score)
margin.eror = t.score *sample.se
margin.eror
lower.bound = sample.means - margin.eror
upper.bound = sample.means + margin.eror
print(c(lower.bound, upper.bound))

B. Output
1. Membentuk Suatu Sampling di R
2. Teorema Limit Pusat di R

3. Teorema Limit Pusat di R diperbesar


4. Interval Kepercayaan

IV. Pembahasan
1. Membentuk Suatu Distribusi Sampling di R
Langkah pertama memasukkan sintaks set.seet(20) yang berfungsi
mengatur data acak untuk memastikan reproduktibilitas hasil simulasi.
Dengan mengatur data acak yang sama, akan mendapatkan hasil yang
sama jika menjalankan kode yang sama. Dalam hal ini , data acak yang
digunakan yaitu 20, angka “20” merupakan angka yang ditentukan sesuai
urutan absen . Selanjutnya memasukkan sintaks n=10000 yang
merupakan variabel yang menentukan jumlah sampel rata-rata yang akan
dihasilkan. Lalu memasukkan sintaks sample_means=rep (Na, n)
berfungsi untuk membuat vector kosong dengan panjang “n” untuk
menyimpan hasil sampel rata-rata. Kemudian Memasukkan sintaks for(I
in 1:n) yaitu loop ini akan berjalan sebanyak n kali, dimana loop
merupakan kode program yang berulang.
Langkah selanjutkan memasukkan sintaks sample_means[i]=mean
(rnorm(20,mean=5.3, sd=9)) yang menghasilkan sampel acak dari
distribusi normal dengan “rata-rata 5.3” dan “standar deviasi 9”, rata-rata
dari sampel dihitung dan di simpan di vector sample_means. Kemudian
memasukkan sintaks head(sample_means) fungsi ini menampilkan 6
nilai teratas dari vector sample_means maka di outpun akan keluar 6 data
teratas dari vector sample_means yaitu, 3.610125, 3.753376, 6.671604,
4.291388, 8.394372, dan 5.432078. Selanjutnya memasukkan sintaks
hist (sample_means,main=””, xlab=”sample means”, col=”skyblue”)
yang berfungsi membuat histogram dari vector sample_means dengan
judul dan label sumbu yang sesuai. “Xlab” berfungsi memberi judul pada
grafik sumbu “x”. “Col” untuk memberi warna pada histogram, warna
yang digunakan yaitu skyblue, jika dilihat histogram yang muncul bukan
berdistribusi normal. Lalu memasukkan sintaks mean(sample_means)
untuk menghitung rata-rata dari vector sample_ means, maka nilai mean
yang keluar di output yaitu 5.283878. Setelah itu memasukkan sintaks
sd(sample_ means) yang berfungsi menghitung standar deviasi dari
vector sample_ means, maka nilai standar deviasi yang keluar di output
yaitu 1.998594. Dan langkah terakhir memasukkan sintaks
sum(sample_means <=6/length(sample_ means) yang merupakan
fungsi untuk menghitung proporsi sampel rata-rata yang kurang dari atau
sama dengan 6. Maka output yang muncul yaitu nilai dari sum 0.6389.

2. Teorema Lipit Pusat di R


Pada langkah pertama memasukkan sintaks set.seed(020) yang
berfungsi untuk yang berfungsi mengatur data acak untuk memastikan
reproduktibilitas hasil simulasi, dalam hal ini data acak yang digunakan
adalah “020”. Setelah itu, memasukkan sintaks data = runif(n = 500,
min = 1.5, max = 8.5). Fungsi runif () digunakan untuk menghasilkan
500 angka acak yang dimbil dari distribusi seragam dengan rentang
antara 1.5 dan 8.5. Data tersebut tersimpan dalam variabel data.
Kemudian pada langkah selanjutnya memasukkan sintaks hist(data, col =
'steelblue', main = 'Histogram Lebar Tempurung Penyu') berfungsi
untuk membuat histogram dari data yang dihasilkan. Histogram akan
memiliki warna kolom “steelblue” dan judul Histogram Lebar
Tempurung Penyu. Lalu langkah terakhir, memasukkan sintaks
mean(data) dimana fungsi ini menghitung rata-rata dari data yang
dihasilkan dan nilai yang muncul pada output yaitu 5.043559 .

3. Teorema Lipit Pusat di R diperbesar


Langkah pertama yang dilakukan yaitu memasukkan sintaks
sample10= c() yang berfungsi untuk membuat vektor kosong untuk
menyimpan hasil sampel rata-rata dari ukuran “sampel 10”. Kemudian
memasukkan sintaks n = 10 yang merupakan sintak untuk menentukan
jumlah iterasi atau sampel yang akan diambil. Lalu memasukkan sintaks
for (i in 1:n) fungsinya yaitu loop ini akan berjalan sebanyak n kali, yang
dimana loop merupakan kode program yang diulang. Pada langkah
selanjutnya memasukkan sintaks sample10[i] = mean (sample(data, 10,
replace = TRUE)) yang berfungsi mengambil sampel acak dengan
ukuran 10 dari data menggunakan fungsi “sample()”, kemudian
menghitung rata-rata dari sampel tersebut dan menyimpannya di vektor
“sample10”. Setelah itu memasukkan sintaks mean(sample10) untuk
menghitung rata-rata dari vektor “sample10” dan nilai yang muncul pada
output yaitu 4.78691. Kemudian memasukkan sintaks sd(sample10) yang
berfungsi menghitung standar deviasi dari vektor “sample10” maka di
output akan muncul nilai standar deviasi yaitu 0.492961. Lalu
memasukkan sintaks hist(sample10, col = 'steelblue', xlab = 'Turtle
Shell Widht', main = 'sample size = 10') yang merupakan fungsi untuk
membuat histogram dari vektor “sample10” dengan warna kolom
“steelblue”, label sumbu x “Turtle Shell Width”, dan judul “sample size =
10”.
Langkah selanjutnya yang dilakukan yaitu memasukkan sintaks
sample50= c() yang berfungsi untuk membuat vektor kosong untuk
menyimpan hasil sampel rata-rata dari ukuran “sampel 50”. Kemudian
memasukkan sintaks n = 50 yang merupakan sintak untuk menentukan
jumlah iterasi atau sampel yang akan diambil. Lalu memasukkan sintaks
for (i in 1:n) fungsinya yaitu loop ini akan berjalan sebanyak n kali, yang
dimana loop merupakan kode program yang diulang. Pada langkah
selanjutnya memasukkan sintaks sample50[i] = mean (sample(data, 50,
replace = TRUE)) yang berfungsi mengambil sampel acak dengan
ukuran 50 dari data menggunakan fungsi “sample()”, kemudian
menghitung rata-rata dari sampel tersebut dan menyimpannya di vektor
“sample50”. Setelah itu memasukkan sintaks mean(sample50) untuk
menghitung rata-rata dari vektor “sample50” dan nilai yang muncul pada
output yaitu 5.008969. Kemudian memasukkan sintaks sd(sample50)
yang berfungsi menghitung standar deviasi dari vektor “sample50” maka
di output akan muncul nilai standar deviasi yaitu 0.293664 . Lalu
memasukkan sintaks hist(sample50, col = 'steelblue', xlab = 'Turtle
Shell Widht', main = 'sample size = 50') yang merupakan fungsi untuk
membuat histogram dari vektor “sample50” dengan warna kolom
“steelblue”, label sumbu x “Turtle Shell Width”, dan judul “sample size =
50”. Dapat disimpulkan semakin besar sampel maka semakin besar hasil
dari nilai rata-rata dan semakin besar sampelnya maka semakin kecil pula
nilai dari standar deviasi.

4. Interval Kepercayaan
Pada langkah pertama yang dilakukan untuk menghitung rata-rata
(mean) yaitu memasukkan sintaks data("airquality") berfungsi untuk
mengambil dataset "airquality" yang tersedia di R. Setelah itu
memasukkan sintaks sample.means = mean(airquality$Wind) yang
merupakan fungsi untuk menghitung rata-rata dari variabel "Wind" dalam
dataset "airquality" dan menyimpannya dalam variabel "sample.means".
Kemudian memasukkan sintaks print(sample.means) yang merupakan
fungsi untuk menampilkan nilai rata-rata yang dihitung sebelumnya.
Langkah selanjutnya untuk menghitung standar eror dari rata-rata
yaitu memasukkan sintaks sample.n = length(airquality$Wind) yang
berfungsi menghitung jumlah panjang sampel dalam variabel "Wind" dan
menyimpannya dalam variabel "sample.n". Kemudian memasukkan
sintaks sample.sd = sd(airquality$Wind) berfungsi untuk menghitung
standar deviasi dari variabel "Wind" dan menyimpannya dalam variabel
"sample.sd". Setelah itu memasukkan sintaks sample.se =
sample.sd/sqrt(sample.n) Untuk menghitung standar error dari rata-rata
sampel dan menyimpannya dalam variabel "sample.se". Lalu memasukkan
sintaks print(sample.se) yang merupakan fungsi untuk menampilkan nilai
standar error yang dihitung sebelumnya.
Pada langkah selanjutnya untuk menentukkan t-score yang dilakukan
yaitu memasukkan sintaks alpha = 0.05 yang berfungsi untuk menentukan
tingkat signifikansi alpha (dalam hal ini, 0.05) untuk interval kepercayaan.
Kemudian memasukkan sintaks degrees.freedom = sample.n – 1 yaitu
untuk Menghitung derajat kebebasan (degrees of freedom) untuk distribusi
t. Setelah itu memasukkan sintaks t.score = qt(p = alpha/2, df =
degrees.freedom, lower.tail = F) yang merupakan fungsi untuk
menghitung nilai t-score untuk interval kepercayaan dengan tingkat
signifikansi alpha/2, derajat kebebasan, dan lower.tail = FALSE. Lalu
memasukkan sintaks print(t.score) yang berfungsi untuk menampilkan
nilai t-score yang dihitung sebelumnya.
Pada langkah untuk menghitung margin eror dengan memasukkan
sintaks margin.error = t.score * sample.se yang merupakan fungsi
menghitung margin of error (kesalahan margin) dengan mengalikan nilai t-
score dengan standar error. Kemudian memanggil kembali variabel
margin.eror untuk menampilkan hasil dari nilai yang telh dihitung. Setelah
itu memasukkan sintaks lower.bound = sample.means - margin.error
yang berfungsi untuk menghitung batas bawah interval kepercayaan
dengan mengurangi margin of error dari rata-rata sampel. Lalu
memasukkan sintaks upper.bound = sample.means + margin.error yang
merupakan fungsi untuk menghitung batas atas interval kepercayaan
dengan menambahkan margin of error ke rata-rata sampel. Langkah
terakhir memasukkan sintaks print(c(lower.bound, upper.bound)) untuk
menampilkan batas bawah dan atas interval kepercayaan yang dihitung
sebelumnya.

V. Referensi
Nugraha, J. (2014). Pengantar analisis data kategorik: Metode dan aplikasi
menggunakan program R. Deepublish https://scholar.google.com
/scholar?hl=id&as_sdt=0%2C5&q=Nugraha%2C+J.+
%282014%29.+Pengantar+analisis+data+kategorik
%3A+Metode+dan+aplikasi+menggunakan+program+R.
+Deepublish+&btnG= diakses 20 Okto ber 2023
Soejoeti, Z. Sampel dan Distribusi Sampling.
https://scholar.google.com/schol ar?
hl=id&as_sdt=0%2C5&q=Soejoeti%2C+Z.
+Sampel+dan+Distribusi+Sampling&btnG= diakses 20 Oktober
2023
Sumargo, B. (2020). Teknik sampling. Unj press. https://scholar.google.com/s
cholar?hl=id&as_sdt=0%2C5&q=Sumargo%2C+B.+
%282020%29.+Teknik+sampling.+Unj+press.+&btnG= diakses 23
Oktober 2023

Anda mungkin juga menyukai