JURNAL PRAKTIKUM
(LAB. ACTIVITY)
STATISTIKA
S1 TEKNIK INFORMATIKA
Materi 3:
Distribusi Frekuensi
Oleh:
NAMA : ERMA SUSANTI
NIM : 23.0504.0145
Dosen:
Emilya Ully Artha, M. Kom
S1 – TEKNIK INFORMATIKA
UNIVERSITAS MUHAMMADIYAH MAGELANG
2024
Distribusi Frekuensi
A. Tujuan
Setelah praktikum ini, praktikan diharapkan dapat:
1. Memahami istilah distribusi frekuensi dan pengelompokkan data dalam statistika
2. Dapat membuat tabel distribusi frekuensi
3. Dapat membuat visualisasi dari tabel distribusi frekuensi
B. Peralatan Praktikum
1. PC ataupun laptop yang telah terinstall program R dan RStudio
2. Telah selesai dalam pemahaman materi pada Lab Acitivity sebelumnya (ukuran sentral)
3. Memiliki pemahaman mengenai deret angka dan perhitungan nilai sentral
C. Praktikum
1. Pengantar
Distribusi frekuensi adalah salah satu teknik dalam statistika yang digunakan dalam
permulaan melakukan analisis data untuk membantu kita memahami pola dan persebaran data
dengan lebih baik. Distribusi ini menyajikan data dalam bentuk tabel atau grafik. Terdapat
beberapa jenis distribusi frekuensi.
a. Distribusi frekuensi kategorik
Digunakan untuk data kualitatif yang dapat dibagi ke dalam kelompok-kelompok
tertentu seperti hobi atau jenis kelamin
b. Distribusi frekuensi numerik
Digunakan untuk data kuantitatif yang tidak memiliki kategori tertentu. Seperti
distribusi frekuensi tunggal (setiap kelas hanya memiliki satu nilai) dan distribusi
frekuensi berkelompok (data dikelompokkan dalam interval nilai tertentu).
2. Menyusun tabel frekuensi
a. masukkan data berikut
dataDF
<-c(75,80,30,70,20,35,65,65,70,57,
55,25,58,70,40,35,36,45,40,25,
15,55,35,65,40,15,30,30,45,40)
DataDF
Output:
b. Urutkan data
Urutkan data menggunakan fungsi sort()
Output:
c. Hitung jumlah data
Gunakan fungsi length()
n = length(dataDF)
n
Output:
d. Cari data terbesar
xmax = max(dataDF)
xmax
Output:
e. Cari data terkecil
xmin = min(dataDF)
xmin
Output:
f. Hitung jumlah kelas (K)
Menggunakan rumus = 1 + 3.3 log(𝑛)
jumlahKelas = 1 + 3.3 * log10 (n)
jumlahKelas
Output:
g. Lakukan pembulatan menggunakan fungsi round()
K = round(jumlahKelas)
K
Output:
h. Hitung interval
interval = (xmax-xmin)/K
interval
p = ceiling(interval)
p
Output:
i. Hitung frekuensi
frek(dataDF,15,25)
frek(dataDF,26,36)
frek(dataDF,37,47)
frek(dataDF,48,58)
frek(dataDF,59,69)
frek(dataDF,70,80)
Ulangi sebanyak (K), sesuaikan dengan deret hitungnya
Output:
j. Masukkan hasil perhitungan frekuensi
frekuensi <-c(5,7,6,4,3,5)
k. Menggunakan data.frame()
Masukkan perintah berikut:
tabel = edit(data.frame())
tabel
Berikutnya akan muncul “R Data Editor” pada R, masukkan sesuai dengan gambar dibawah
Catatan: khusus sistem operasi Linux/Mac harus menginstall xquartz
l. Tambah kolom f untuk hasil frekuensi
tabel $ f <- frekuensi
tabel
m. Fungsi fdt()
Digunakan untuk membuat tabel distribusi frekuensi
tabelfrekuensi <- fdth::fdt(nama_npm)
tabelfrekuensi
D. Membuat Grafik
a. Tabel histogram
#membuat tabel histogram
plot(tabelfrekuensi,main="histogram")
b. Poligon
plot(tabelfrekuensi,type='fp',main="Poligon")
c. Ogive
plot(tabelfrekuensi,type='cfp',main="Ogive")
E. Tugas
Buat tabel distribusi frekuensi, info grafis (boxplot, distribusi normal, histogram) dan
kesimpulannya dari infografis tersebut
Diketahui nilai statistika dari 40 mahasiswa teknik informatika adalah sebagai berikut:
52 97 53 54 61 62 50 89 90 74
63 67 68 71 73 81 83 86 87 70
91 72 84 69 72 57 85 59 55 60
88 75 76 79 80 64 65 93 94 71
1. Tabel distribusi frekuensi
a. Pembuatan tabel distribusi frekuensi manual:
Mengolah data terlebih dahulu
Hasil perhitungan frekuensi
Kemudian masukan kedalam tabel
b. Pembuatan tabel distribusi frekuensi otomatis:
Kesimpulan/Analisa deskriptif:
▪ Kelas paling banyak, berada di kelas (71 – 77), terdapat 8 mahasiswa yang
mendapatkan nilai di rentang ini. Menunjukkan banyak mahasiswa yang berhasil di
sini.
▪ Kelas paling sedikit, berada di kelas (92 – 97), hanya terdapat 3 mahasiswa.
Menunjukkan sangat sedikit yang mendapat nilai tertinggi, kemungkinan karena soal
yang sulit atau hal yang lainnya.
▪ Sebaran nilai, banyak mahasiswa berada di rentang nilai menengah, seperti kelas (64 –
70) dan (71 – 77). Menunjukkan bahwa mayoritas mahasiswa memiliki pemahaman
yang baik.
▪ Rentang yang masih perlu perhatian, berada di kelas (57 – 63) yang memiliki 6
mahasiswa, jadi masih ada yang perlu ditingkatkan di rentang nilai ini.
▪ Kesimpulannya, tabel ini menunjukkan seberapa banyak mahasiswa yang
mendapatkan nilai dalam berbagai rentang. Dari sini, kita bisa tahu dimana mahasiswa
berhasil dan dimana yang butuh bantuan lebih banyak. Dan dapat membantu
mengembangkan metode pengajaran yang lebih baik.
2. Info Grafis (boxplot)
Infografis:
Kesimpulan/Analisa deskriptif:
▪ Visualisasi Boxplot, memberikan gambaran jelas tentang sebaran nilai mahasiswa,
menampilkan nilai minimum, maksimum, median, dan kuartil.
▪ Analisis Boxplot:
o Median, garis di tengah kotak menunjukkan nilai tengah dari semua data. Disini
nilai median berada di antara nilai (70 – 80), lebih tepatnya di 72, yang berarti
bahwa setengah dari mahasiswa memiliki nilai di bawah 72, dan setengah lainnya
di atas 72.
o Interquartile Range (IQR), rentang antara kuartil pertama (Q1) dan kuartil ketiga
(Q3) mewakili 50% nilai tengah. Dari boxplot ini, terlihat bahwa rentang tersebut
berada antara sekitar 62,75 dan 84,25. Ini menunjukkan bahwa sebagian besar nilai
berada di kisaran ini.
o Whiskers, garis yang ada di kiri dan kanan kotak. Bisa dilihat rentang nilai dari nilai
terendah di angka 50 dan tertinggi diatas 90 atau lebih tepatnya di 97. Ini
menunjukkan jangkauan nilai keseluruhan mahasiswa.
o Nilai outlier, titik-titik di luar whisker menunjukkan mahasiswa dengan nilai jauh
di atas atau di bawah rata-rata. Dari boxplot ini, tidak terdapat nilai yang terlalu jauh
dari yang lain (outlier), jadi semua nilai relatif normal.
o Sebaran nilai, secara umum distribusi nilai ini terlihat agak miring ke kanan
(positively skewed) karena whiskers di sisi kanan lebih panjang dari yang di kiri.
Ini menunjukkan bahwa ada beberapa mahasiswa yang mendapatkan nilai sangat
tinggi.
o Kesimpulannya, jadi sebagian besar mahasiswa mendapatkan nilai di kisaran (62-
85), dan beberapa ada yang mendapatkan nilai lebih tinggi sampai 97.
3. Distribusi normal
Infografis:
Kesimpulan/Analisa deskriptif:
▪ Mayoritas mahasiswa memiliki nilai di kisaran 70 hingga 80, terlihat dari puncak
histogram dan kurva di area itu.
▪ Data memiliki rata-rata (mean) yang mungkin berada di sekitar nilai 70-an atau lebih
tepatnya di 73 dan nilai-nilai tidak menyebar terlalu jauh dari rata-rata, terlihat dari
standar deviasi yang kecil.
▪ Kurva menunjukkan bahwa distribusi nilai ini mendekati distribusi normal, yang
artinya nilai-nilai mahasiswa tersebar dengan pola yang cukup teratur, tanpa banyak
nilai yang terlalu ekstrim rendah atau tinggi.
4. Histogram
Infografis:
Kesimpulan/Analisa deskriptif:
▪ Histogram ini, menunjukkan distribusi frekuensi suatu variabel numerik dalam
beberapa kelas interval (class limits). Nilai-nilai pada sumbu X mewakili batas kelas,
sedangkan sumbu Y menunjukkan frekuensi data dalam tiap interval.
▪ Puncak frekuensi, interval dengan batas antara 70.27 dan 77.20 memiliki frekuensi
tertinggi (sekitar 8). Ini menunjukkan bahwa sebagian besar data berada dalam rentang
ini.
▪ Penyebaran data, tersebar cukup merata antara rentang 49.50 hingga 97.97. Tidak ada
kecenderungan yang terlalu ekstrem, meskipun rentang nilai antara 49.50 hingga 56.42
dan 91.05 hingga 97.97 memiliki frekuensi yang lebih rendah.
▪ Histogram ini tampak sedikit mendekati simetris, dengan frekuensi yang relatif
seimbang di kedua sisi interval tengah (70.27 - 77.20).
▪ Secara umum, histogram ini menunjukkan distribusi data yang tersebar tidak terkumpul
hanya di satu tempat atau tersebar terlalu luas, melainkan memiliki variasi yang cukup
dengan sedikit kecenderungan menuju di interval tengah.
▪ Kesimpulan singkat dari histogram ini adalah data memiliki distribusi yang mendekati
simetris dengan puncak frekuensi pada interval (70.27 - 77.20). Sebagian besar data
terkonsentrasi di sekitar nilai tengah, sementara rentang nilai di ujung kiri dan kanan
memiliki frekuensi yang lebih rendah, menunjukkan sedikit data di area ekstrim.