BAB II
LANDASAN TEORI
Data yang telah kita kumpulkan perlu disusun secara sistematis supaya dapat
dianalisis. Susunan dari suatu data disebut distribusi data. Ada beberapa cara
(kuantitasnya).
kualitasnya (kategorinya).
4. Runtun waktu (time series), yaitu penyusunan data menurut waktu terjadinya.
Di sini hanya akan dibahas cara penyusunan distribusi frekuensi kuantitatif dan
pembuatan grafiknya.
Apabila data yang ada banyak sekali jumlahnya, maka untuk memudahkan
dalam analisa data perlu dibuat distribusi frekuensi atau tabel frekuensi. Berikut ini
1. Tentukan banyak dan lebar inteval kelas. Hal ini tergantung pada banyak dan
besamya harga-harga yang akan disusun dalam distribusi itu. Banyak interval
II-2
kelas yang efisien biasanya antara 5 dan 15. Pada tahun 1925, HA Sturges
jangkauan (yaitu selisih antara harga terbesar dan terkecil) dengan banyak
3. Data diperiksa dan dimasukkan ke dalam interval kelas yang sesuai. Banyak
data yang masuk dalam suatu interval kelas dinamakan frekuensi interval kelas
tersebut. Kata statistik juga masih mengandung pengertian lain, yakni dipakai
untuk menyatakan ukuran sebagai wakil dari kumpulan data mengenaia sesuatu
6-15 kelas. Makin banyak data, maka makin banyak pula jumlah kelas
intervalnya, tetapi jumlah yang paling banyak atau maksimal adalah 15 kelas
dengan jumlah kelas interval yang diperlukan, maka penentuan jumlah kelas
interval akan lebih cepat. Dimana dalam grafik tersebut, garis vertikal
data observasi. Misalnya, bila jumlah data yang diobservasi 200, maka
3. Ditentukan dengan rumus Sturges jumlah interval kelas interval juga dapat
K = 1 + 3,3 Log.N
Dimana :
Log = logaritma
Misalnya: Jumlah Data ada 150, maka jumlah kelas intervalnya adalah: K = 1 + 3,3.
Log 150 K = 1 + 3,3. 2,17 K = 1 + 7,161 K = 8,161 --> Dibulatkan menjadi 8 atau 9.
Tabel frekuensi adalah tabel yang menyajikan hasil percobaan dengan seluruh
dan nilai probabilitas. Yang dimana dalam menghitung tabel frekuensi menggunakan
bagian dari Kelas/ Class, Batas kelas, Panjang kelas, Frekuensi, Nilai tengah.
II-4
2.4.1 Kelas
Kelas ( Class ) Pengelompokan individu atau item dari data ( Class ) yang
kelompok yang ditentukan dengan perhitungan tertentu sehingga antar kelas memiliki
aturan dan karakter yang sama atau penggolongan data yang dibatasi dengan nilai
1. Batas Kelas/ Ujung Kelas ( State Class Limit ) yaitu bilangan - bilangan yang
a. Batas Bawah Kelas/ Ujung Bawah Kelas (Lower State Class limit/ LCL)
b. Batas Atas Kelas/ Ujung Atas Kelas (Upper State Class limit/ UCL)
2. Batas kelas sebenarnya/ Tepi kelas ( Class Boundaries ) yaitu nilai batas tiap
sesuai.
II-5
b. Batas Atas Kelas Kebenarnya/ Tepi Atas Kelas (Upper Class Boundaries/
UCB) bilangan yang diperoleh dari rata-rata ujung atas kelas yang
Panjang Kelas/ Lebar Kelas/ Ukuran Kelas (Class interval/ Class Size)
Bilangan bilangan yang menunjukkan panjang/ lebar/ ukuran dari tiaptiap kelas
yang diperoleh dengan cara mengurangkan batas bawah kelas berikutnya dengan
2.6 Frekuensi
satu kelas. Dalam ilmu statistika, frekuensi lebih diartikan sebagai banyaknya
kemunculan suatu bilangan dalam sebuah deretan angka. Contoh yang mudah untuk
tersebut, frekuensi angka 3 yang muncul adalah sebanyak 4 kali, maka frekuensi
(3)=4.
II-6
Nilai tengah/ titik tengah/ tanda kelas ( Midpoint/ Class Mark ) adalah
bilangan bilangan yang dapat mewakili kelaskelas tertentu yang diperoleh dengan
Ukuran pemusatan data adalah bilangan atau keterangan yang dapat mewakili
deretan bilangan atau deretan keterangan tertentu atau suatu nilai yang mewakili
tengahtengah dan memusat dalam suatu kelompok data yang disusun menurut besar
2.9 Hystogram
tepi kelas interval pada sumbu horizontal (X) dan frekuensi setiap kelas pada sumbu
vertikal (Y).
2.10 Polygon
titik-titik yang merupakan koordinat antara nilai tengah kelas dengan jumlah
II-7
frekuensi pada kelas tersebut. Titik tengah kelas merupakan representasi dari karakter
kelas dan nilai tengah ini menggantikan posisi interval kelas pada diagram histogram.
Pada grafik polygon, sumbu horizontal merupakan nilai tengah kelas dan sumbu
2.11 Ogive
kumulatif pada setiap tingkat atau kategori. Sumbu horizontal pada kurva ogive
kumulatif. Kurva ogive memudahkan kita untuk melihat frekuensi kumulatif baik
dalam bentuk nilai absolute maupun nilai relative pada tingkat atau interval tertentu.1
Contoh :
Di bawah ini disajikan data tinggi badan (cm) dan 50 orang dewasa 176 167 180 165
168 171 177 176 170 175 Universitas Gadjah Mada 2 169 171 171 176 166 179 181
174 167 172 170 169 175 178 171 168 178 183 174 166 181 172 177 182 167 179
183 185 185 173 179 180 184 170 174 175 176 175 182 172
= 185 -165 = 20
1
Nurkolis Abdul Majid, Distribusi Frequensi Data Numerik, Garut, tahun 2013.
II-8
20
7 maka lebar kelas = = 2,85
7
20
8 maka lebar kelas = = 2,5
8
Harga k menurut rumus H.A Sturges, k = 1 + 3,322 log n = 1+3,322* 1.699= 6.644
Dari keadaan di atas kita pilih banyak interval kelas 7 dengan lebar kelas 3.
164,5 167,5 6
167,5 170,5 7
170,5 173,5 8
173,5 176,5 11
176,5 179,5 7
179,5 182,5 6
185,5 188,5 5
Jumlah 50
Jika kita ingin mengetahui berapa banyak orang yang tinggi badannya lebih dari
harga tertentu ataupun kurang dari harga tertentu, maka distribusi frekuensi diubah
Jika kita ingin mengetahui berapa persen orang yang tinggi badannya antara
harga tertentu, lebih dari harga tertentu ataupun kurang dari harga tertentu, maka
II-10
relatif "Iebih dari" atau distribusi frekuensi realtif "kurang dari". Cara untuk
frekuensi pada setiap interval kelas dibagi jumlah total frekuensi, kemudian dikalikan
100%.
Untuk data pada contoh 2.1, distribusi relatifnya adalah sebagai berikut :
164,5 167,5 12
167,5 170,5 14
170,5 173,5 16
173,5 176,5 22
176,5 179,5 14
179,5 182,5 12
185,5 188,5 10
Jumlah 100
2
Cucu Oktaviana, Penyajian Data Distribusi Frekuensi dan Data Numerik dari 50 Jumlah Halaman
Pada Beberapa Novel, Garut, tahun 2013
II-11
samping disajikan dalam bentuk tabel distribusi frekuensi, cara yang lain adalah
Beberapa grafik yang dibahas di sini adalah histogram, poligon dan ogive.
1. Histogram
Untuk menggambar grafik ini interval kelas diletakkan pada sumbu X dan
kelas diletakkan pada sumbu X dan frekuensi relatif diletakkan pada sumbu Y,
dengan tinggi persegi panjang =
II-12
2. Polygon
3. Ogive
kumulatif:
1. Menyusun urutan (array) dari data yang di observasi Array: data yang disusun
berdasarkan urut-urutan
2. Tentukan nilai maksimum (terbesar) dan nilai minimum (terkecil) dari data
menggunakan :
=
II-13
4. Menentukan panjang/ lebar/ ukuran dari tiap tiap kelas dengan rumus
/
= =
Penyajian data dengan grafik dianggap lebih komunikatif karena dalam waktu
singkat dapat diketahui karakteristik dari data yang disajikan. Terdapat beberapa
1. Histogram ( Hystogram )
disusun secara berderet tanpa jarak yang menggambarkan tinggi frekuensi tiap
kelas.
II-14
2. Poligon ( Polygon )
Suatu bentuk grafik distribusi frekuensi yang merupakan garis patah patah
5
4
3
2
1
0
Category 1 Category 2 Category 3 Category 4
Series 2
Suatu bentuk grafik distribusi frekuensi yang merupakan garis patah patah
Series 1
Series 2
Series 3
1. Distribusi Frekuensi Distrik, yaitu distribusi frekuensi yang diantara tiap dua
mendekati 0.
4. Distribusi Frekuensi terbuka yaitu distribusi frekuensi yang tidak seluruh batas
DF terbuka atas bawah, adalah DF yang batas bawah kelas pertama dan batas
persentase yang jumlah seluruh frekuensinya selalu sama dengan 1 atau 100
%.
= dalam bentuk ratio
= 100 dalam bentuk persentase.
asalnya.
1. Perhitungan Data
UCBi = LCB(i + 1)
+ (+1)
UCB = 2
+
Xi =
2
sebagai berikut :
= 1 + 2 + 3
Dimana :
Dimana :
sebagai berikut :
Dimana :
Dimana :
: Rata-rata range
: Jumlah range
Dimana :
interval ab dimasukkan semua data yang bernilai mulai dari a sampai dengan b.
Urutan kelas interval disusun dari mulai data terkecil terus ke bawah sampai nilai data
terbesar. Berturut-turut, mulai dari atas, diberi nama kelas interval pertama, kelas
interval kedua, kelas interval terakhir. Ini semua ada dalam kolom kiri. Kolom kanan
berisikan bilanganbilangan yang menyatakan berapa buah data terdapat dalam tiap
kelas interval. jadi kolom ini berisikan frekuensi, disingkat dengan f. Misalnya, f = 2
untuk kelas interval pertama atau ada 2 orang mahasiswa yang mendapat nilai ujian
3
Nurkolis Abdul Majid, Distribusi Frequensi Data Numerik, Garut, tahun 2013.
II-20
Ujung ujung bawah kelas interval pertama, kedua, terakhir ialah 31, 41,..91
sedangkan ujung-ujung atas nya berurutan disebut panjang kelas interval. Dalam
daftar III (1), panjang kelasnya, disingkat dengan p, adalah 10, jadi p = 10 dan
semuanya sama. Dikatakan bahwa daftar itu mempunyai panjang kelas yang sama .
Selain dari ujung kelas interval ada lagi yang biasa disebut batas kelas
interval. ini bergantung pada ketelitian data yang digunakan. Jika data dicatat teliti
hingga satuan, maka batas bawah kelas sama dengan ujung bawah kurangi 0,5. Batas
atasnya didapat dari ujung atas ditambah dengan 0,5. Untuk data dicatat dengan satu
desimal, batas bawah sama dengan ujung bawah dikurangi 0,05 dan batas atas sama
dengan ujung atas ditambah 0,05. Kalau data hingga dua desimal, batas bawah sama
dengan ujung bawah dikurangi 0,005 dan batas atas sama dengan ujung atas ditambah
0,005 dan begitu seterusnya. Untuk perhitungan nanti ,dari tiap kelas interval biasa
diambil sebuah nilai sebagai wakil kelas itu, yang digunakan disini ialah tanda kelas
Contoh : kelas interval pertama adalah 3140 dengan frekuensi f = 2. Ujung bawah
kelas 3, ujung atas = 40. Adapun batas bawah kelas = 30,5 dan batas atas 40,5 tanda
4
Sudjana, hal 45, Metoda Statistika, Tahun 2002
II-21
1. Tentukan rentang, ialah data terbesar dikurangi data terkecil dalam hal ini,
karena data terbesar = 99 dan data terkecil = 35, maka rentang = 99-35=64
2. Tentukan banyak kelas interval yang diperlukan. Banyak kelas sering biasa
diambil paling sedikit 5 kelas dan paling banyak 15 kelas, dipilih menurut
Dengan n menyatakan banyak data hasil akhir dijadikan bilangan bulat. Untuk
= 1 + (3,3) (1,9031)
= 7,2802
Kita bisa membuat daftar distribusi frekuensi dengan banyak kelas 7 atau 8
buah.
aturan :
P =
II-22
Harga p diambil sesuai dengan ketelitian satuan data yang digunakan jika
data berbentuk satuan, ambil harga p teliti sampai satuan. Untuk data hingga
satu desimal p ini juga diambil hingga satu desimal dan begitu seterusnya.
4. Pilih ujung bawah kelas interval pertama. Untuk ini bisa di ambil sama
dengan data terkecil atau nilai data yang lebih kecil dari data terkecil tetapi
selisihnya harus kurang dari panjang kelas yang telah ditentukan. Selanjutnya
5. Dengan p = 10 dan memulai dengan data yang lebih kecil dari data terkecil,
diambil 31, maka kelas pertama berbentuk 31 40, kelas kedua 41 50, kelas
yang berisikan kolom tabulasi. Kolom ini merupakan kumpulan deretan garis-
garis miring atau pendek,yang banyaknya sesuai dengan banyak data terdapat
5
Sudjana, hal 46, Metoda Statistika, Tahun 2002
II-23
b. Setiap unit data hanya dimasukkan sekali saja dan hanya di satu kelas
interval saja
Tumpang tindih (overlap) anatra dua interval kelas berurutan yang bisa
tergantung pada beberapa faktor seperti jumlah data yang diamati, tujuan
3. Sebisa mungkin lebar setiap interval kelas sama (biasanya akan lebih
memudahkan jika lebar interval kelas tersebut adalah kelipatan dari angka
Di mana:
Jika jumlah data terlalu banyak maka jumlah interval kelas (k) dapat di cari
6
Harinaldi, hal 26, Prinsip-prinsip Statistik, tahun 2012
II-24
K =1+3,3 log n
Dimana:
n = jumlah data
4. Sebisa mungkin interval kelas terbuka (open class interval) dihindari. interval
kelas teerbuka mungkin diperlukan jika beberapa nilai data sangat berbeda
Tidak ada aturan umum yang selalu dapat diikuti untuk mengidentifikasi
ukuran pemusatan yang paling tepat digunakan. Setiap ukuran pemusatan (mean,
median, dan modus) mempunyai karakteristik masing-masing. Selain itu jenis data
yang ada harus di evaluasi dan di pertimbangkan. Memilih ukuran pemusatan data
yang akan digunakan pada sebuah distribusi yang simetris lebih mudah karena mean,
median, modus memiliki nilai yang sama, namun bila datanya menghasilkan
distribusi menceng (skewed distribution), nilai dari ketiga ukuran pemusatan tersebut
7
Harinaldi, hal 27, prinsip-prinsip statistik, tahun 2012
II-25
masing-masing individu yang diatur dalam bebrapa kategori dalam skala pengukuran.
Distribusi frekuensi menunjukkan berapa banyak subjek/ objek yang memiliki nilai
yang sama dan terukur dalam variabel independen. Distribusi frekuensi yang simple
disebut juga ungrouped frequency distribution. Selain itu distribusi frekuensi yang
menunjukkan sejumlah kelompok atau individu yang memiliki nilai yang sama yang
distribusi frekuensi tidak dapat diorganisir apabila skor dan tempat menunjukkan
sama individu yang memiliki skor yang sama. Misal, skor tertinggi adalah X = 10,
dipahami.
grafik
II-26
a. Histogram, Poligon dan Ogiv cocok digunakan ketika data telah disusun
b. Diagram Pareto cocok digunakan untuk data nominal yang telah disusun
c. Grafik Time series digunakan untuk menggambarkan pola dan trend data
8
Nurkolis Abdul Majid, Distribusi Frequensi Data Numerik, Garut, tahun 2013.