Anda di halaman 1dari 8

HISTOGRAM DISTRIBUSI DATA

Retno Dammayatri (15116058)


Faculty of Earth Sciences and Technology, Institute of Technology, Bandung, Indonesia
dammayatri@students.itb.ac.id

1. Ringkasan Materi
Distribusi frekuensi merupakan pengelompokan data ke dalam beberapa kategoro yang menunjukkan
banyaknya data dalam setiap kategori. Distribusi frekuensi dibagi berdasakan kelas-kelas interval tertentu
dalam sebuah daftar yang dihubungkan dengan masing-masing frekuensinya sehingga memberikan keterangan
atau gambaran sederhana dan sistematis dari kumpulan suatu data.

Empat langkah menyusun tabel distribusi frekuensi:


a. Menentukan jumlah kelas. Pada umumnya, jumlah kelas dalam tabel distribusi frekuensi berkisar antara 5
sampai dengan 20 kelas, tergantung persoalan yang diteliti. Untuk menentukan banyaknya kelas, bisa
ditentukan dengan perkiraan kelas ideal, atau dengan metode empiris aitu dengan kaidah sturgess. Dengan
kaidah ini, banyaknya kelas (k) ditentukan sama dengan k = 1 + (10/3)log n; dimana n = jumlah observasi.
b. Hitung besarnya interval kelas dengan rumus I = R/K; dimana I = interval kelas; R =Range (adalah selisih
antara nilai data terbesar dikurangi nilai data terkecil); K = jumlah kelas yang ditentukan pada langkah
sebelumnya.
c. Menentukan batas kelas. Batas kelas adalah nilai-nilai yang membatasi satu kelas dengan kelas lainnya.
Dikenal batas kelas bawah dan batas kelas atas. Juga terdapat dua jenis batas kelas, yaitu batas kelas semu
dan batas kelas nyata. Pada bataskelas semu terdapat loncatan nilai antara batas atas suatu kelas denagan
batas bawah kelas berikutnya. Sedangkan pada batas kelas nyata tidak terdapat loncatan nilai karena ini
merupakan batas yang sebenarnya antara dua kelas yang berrurutan.
d. Menentukan frekuensi setiap kelas (dan menghitung frekuensi kumulatif-bila diperlukan). Setelah kolom
pertama tabel bisa ditentukan (yaitu kelas-kelas data sudah ditentukan) langkah selanjutnya adalah
menghitung jumlah item (elemen) amatan untuk masingmasing kelas. nilai ini disebut dengan frekuensi
observasi.

Kurva merupakan model populasi yang akan ikut menjelaskan ciri-ciri populasi. Dalam praktek, model
populasi ini biasanya didekati oleh atau diturunkan dari kurva frekuensi yang diperoleh dari sampel
reprenentatif yang diambil dari populasi. Beberapa jenis kurva histogram diantaranya adalah:
- Histogram model J, ini terdapat dalam dunia ekonomi, industri dan fisika. Pada J-shape right peak nilai
modusnya banyak terletak pada bagian akhir. Sedangkan pada J-shape left peak nilai modusnya banyak
terletak pada bagian awal.

J-shape right peak J-shape left peak


- Historam distribusi normal, Bentuk model normal selalu simetrik dan mempunyai sebuah puncak. Kurva
dengan sebuah puncak disebut unimodal. Bentuk normal nilai modusnya mendekati rata-rata.
- Histogram bimodal, marupakan kurva yang menunjukan gabunga dua distribusi normal, bada bimodal
terdapat duakali nilai modus.

2. Metodologi
3. Hasil
a. Dataset 1
Tabel
Minimum -1.7 Kelas Frekuensi Kumulatif Frekuensi
Maksimum 67 -1.7
Average 4.59940079 9.75 7164 7164
Median 0.2 21.2 8335 1171
Range 68.7 32.65 8672 337
Interval 11.45 44.1 8768 96
Kelas 6 55.55 8796 28
67 8845 49

Tabel distribusi frekuensi dataset 1 dengan jumlah kelas sebanyak 6


Penyajian Grafik

Bentuk histogram dengan jumlah kelas sebanyak 6

Tabel
Minimum -1.7 Kelas Frekuensi Kumulatif Frekuensi
Maksimum 67 -1.7
Average 4.5994008 3.207142857 5987 5987
Median 0.2 8.114285714 6808 821
Range 68.7 13.02142857 7889 1081
Interval 4.9071429 17.92857143 8207 318
Kelas 14 22.83571429 8413 206
27.74285714 8598 185
32.65 8672 74
37.55714286 8713 41
42.46428571 8758 45
47.37142857 8781 23
52.27857143 8791 10
57.18571429 8800 9
62.09285714 8816 16
67 8845 29
Tabel distribusi frekuensi dataset 1 dengan jumlah kelas sebanyak 14
Penyajian Grafik

Bentuk histogram dataset 1 dengan jumlah kelas 14

b. Dataset 2
Tabel
Minimum 1177 Kelas Frekuensi Kumulatif Frekuensi
Maksimum 1230 1177
Average 1220.1148 1182.8889 1 1
Median 1223 1188.7778 2 1
Range 53 1194.6667 7 5
Interval 5.8888889 1200.5556 9 2
Kelas 9 1206.4444 24 15
1212.3333 45 21
1218.2222 69 24
1224.1111 149 80
1230 244 95

Tabel distribusi frekuensi dataset 2 dengan jumlah kelas sebanyak 9.

Penyajian Grafik

Bentuk histogram Dataset 2 dengan menggunakan 9 kelas


c. Dataset 3
Minimum 50 Kelas Frekuensi Kumulatif Frekuensi
Maksimum 765 50
Average 403.481 115 84 84
Median 391.5 180 165 81
Range 715 245 260 95
Interval 65 310 362 102
Kelas 11 375 469 107
440 570 101
505 673 103
570 745 72
635 825 80
700 906 81
765 1000 94
Tabel distribusi frekuensi dataset 3 dengan jumlah kelas sebanyak 11
Penyajian Grafik

Bentuk histogram Dataset 3 dengan menggunakan 11 kelas

d. Dataset 4
Tabel
Minimum 250 Kelas Frekuensi Kumulatif Frekuensi
Maksimum 680 250
Average 467.197 289.09091 79 79
Median 474.5 328.18182 169 90
Range 430 367.27273 271 102
Interval 39.090909 406.36364 369 98
Kelas 11 445.45455 456 87
484.54545 534 78
523.63636 627 93
562.72727 724 97
601.81818 825 101
640.90909 908 83
680 1000 92
Tabel distribusi frekuensi dataset 4 dengan jumlah kelas sebanyak 11
Penyajian Grafik

Bentuk histogram Dataset 4 dengan menggunakan 11 kelas

e. Dataset 5
Tabel
Kelas Frekuensi Kumulatif Frekuensi
Minimum 1000 1000
Maksimum 2249 1208.1667 109 109
Average 1717.579 1416.3333 214 105
Median 1750.5 1624.5 361 147
Range 1249 1832.6667 587 226
Interval 208.16667 2040.8333 799 212
Kelas 6 2249 1000 201
Tabel distribusi frekuensi dataset 5 dengan jumlah kelas sebanyak 6

Penyajian Grafik

Bentuk histogram Dataset 5 dengan menggunakan 6 kelas


Kelas Frekuensi Kumulatif Frekuensi
1000
1138.7778 64 73
1277.5556 145 81
Minimum 1000 1416.3333 214 69
Maksimum 2249 1555.1111 299 85
Average 1717.579 1693.8889 435 136
Median 1750.5 1832.6667 587 152
Range 1249 1971.4444 716 129
Interval 138.77778 2110.2222 865 149
Kelas 8 2249 1000 135
Tabel distribusi frekuensi dataset 5 dengan jumlah kelas sebanyak 8

Penyajian Grafik

Bentuk histogram Dataset 5 dengan menggunakan 8 kelas

4. Analisis
a. Pengaruh jumlah kelas terhadap hasil kurva histogram
Jumlah kelas dapat memengaruhi hasil kurva pada histogram, yaitu semakin banyak kelasnya maka kurva yang
dihasilkan akan semakin merepresentasikan keadaan sebenarnya yaitu semakin terlihat pola distribusi
frekuensinya. Pada dataset satu dapat dilihat pada penggunaan kelas sejumlah 6 dan 14, pada dataset tersebut
sama-sama termasuk kedalam jenis j-shape left peak namun pada set 14 kurva yang tervisualisasikan lebih rapat
dan lebih halus sehingga lebih merepresentaikan data yang sebenarnya.

Pada dataset 5 penggunaan kelas sebanyak 6 tidak terlalu menggambarkan bahwa jenis kurva histogram yang
terbentuk adalah bimodal, dan setelah penggunaan jumlah kelas sebanyak 8 lebih terlihat bahwa tipe kurvanya
adalah bimodal, sehingga semakin banyak kelasnya maka akan semakin jelas pula tipe kurva yang terbentuk.

b. Pengaruh data terhadap kurva histogram


Pada dataset satu jenis histogram yang terbentuk adalah j-shape left peak, dimana pada bentuk j-shape left peak
nilai modus terletak pada bagian awal. Jika dilihat pada tabel distribusi frekuensi dapat dilihat bahwa distribusi
frekuensinya tinggi pada kelas-kelas awal dan mengecil sampai ke kelas terakhir, yang dimana menunjukkan
nilai modusnya terletak pada awal kelas sehingga menyebabkan data tersebut termasuk kedalam j-shape left
peak.

Pada dataset dua jenis histogram yang terbentuk adalah j-shape right peak, dimana pada bentuk j-shape left
peak nilai modus terletak pada bagian akhir. Jika dilihat pada tabel distribusi frekuensi dapat dilihat bahwa
distribusi frekuensinya tinggi pada kelas-kelas akhir sehingga grafiknya kecil pada kelas awal dan semakin
tinggi pada kelas akhir, yang dimana menunjukkan nilai modusnya terletak pada akhir kelas sehingga
menyebabkan data tersebut termasuk kedalam model j-shape right peak.

Pada dataset tiga jenis histogram yang terbentuk adalah bimodal, dimana pada tipe bimodal terdapat dua nilai
modus. Pada tabel distribusi frekuensi dapat dilihat bahwa terdapat dua nilai modus yaitu pada kelas 310-375
yaitu frekuensinya sebanyak 107 dan pada kelas 440-505 yaitu frekuensinya sebanyak 103. Karena terdatat dua
nilai modus dan dilihat juga dari grafiknya maka digolongkan kedalam histogram model bimodal.
Pada dataset empat jenis histogram yang terbentuk adalah bimodal, dimana pada tipe bimodal terdapat dua nilai
modus. Pada tabel distribusi frekuensi dapat dilihat bahwa terdapat dua nilai modus yaitu pada kelas
328.18182-367.27273 yaitu frekuensinya sebanyak 102 dan pada kelas 562.7277-60181818 yaitu frekuensinya
sebanyak 101. Karena terdatat dua nilai modus dan dilihat juga dari grafiknya maka digolongkan kedalam
histogram model bimodal.

Pada dataset lima jenis histogram yang terbentuk adalah bimodal, dimana pada tipe bimodal terdapat dua nilai
modus. Jika dilihat pada tabel distribusi frekuensi dengan menggunakan delapan kelas dapat dilihat bahwa
terdapat dua nilai modus yaitu pada kelas 1693.8889.1832.6667 yaitu frekuensinya sebanyak 152 dan pada
kelas 1971.444-2110.2222 yaitu frekuensinya sebanyak 149. Karena terdatat dua nilai modus dan dilihat juga
dari grafiknya maka digolongkan kedalam histogram model bimodal.

5. Kesimpulan
a. Jumlah kelas memengaruhi kurva historam, semakin banyak kelasnya maka tipe kurva histogramnya akan
semakin jelas.
b. Dataset satu termasuk kedalam jenis j-shape left peak, dataset dua termasuk kedalam jenis j-shape right
peak, Dataset tiga termasuk kedalam jenis bimodal, Dataset empat termasuk kedalam jenis bimodal, dan
Dataset lima termasuk kedalam jenis bimodal.

6. Referensi

----. ----. Distribution shapes. Diambil dari:


http://homepage.divms.uiowa.edu/~rdecook/stat1010/notes/Section_4.2_distribution_shapes.pdf. (6 Februari
2019)

Stephanie. 2013. Statistic How To. Diambil dari: https://www.statisticshowto.datasciencecentral.com/what-is-a-


bimodal-distribution/. (6 Februari 2019)

Sudjana. 2005. Metoda Statistika. Bandung: Tarsito.

Anda mungkin juga menyukai