LANDASAN TEORI
3
2. Perhitungan statistik data dalam bentuk Distribusi Frekuensi (data
kelompok) lebih mudah dan lebih efisien jika dibandingkan dengan
data tersebut dalam bentuk individu.
3. Analisis distribusi data memerlukan data tersebut berbentuk Distribusi
Frekuensi.
Data dalam bentuk Distribusi Frekuensi adalah data yang disajikan dalam
bentuk tabel yang mengandung dua unsur, yakni kelas yang mengelompokkan
data dan frekuensi yang menghitung banyaknya data didalam kelas tersebut.
Contoh: sebuah Distribusi Frekuensi dapat dilihat pada tabel dibawah ini.
Tabel 2.1. Contoh Tabel Distribusi Frekuensi
Banyaknya
Nilai
(Orang)
11-20 2
21-30 3
31-40 3
41-50 6
51-60 8
61-70 7
71-80 5
81-90 3
91-100 3
Total 40
Sumber : Contoh Soal Statistik, 2020
2.1.2. Karakteristik
Distribusi frekuensi mempunyai ciri-ciri khusus yaitu data umumnya ≥
30 data, sehingga dapat diamati pancaran datanya, apakah terdistribusi dengan
normal atau tidak. Kegunaan distribusi frekuensi adalah untuk melihat
penyebaran data, dan untuk menyusun dan mengatur data dengan
mengelompokkan data.
4
dipahami atau dinilai. Berikut ini adalah macam-macam jenis tabel distribusi
frekuensi
a. Tabel distribusi frekuensi data tunggal, di dalamnya disajikan frekuensi dari
data angka dimana angka yang ada tidak dikelompokkan. Dibawah ini contoh
tabel distribusi frekuensi tunggal.
Tabel 2.2. Contoh Distribusi Frekuensi
Pada distribusi frekuensi kelompok, terdapat interval kelas, cara mencari interval
kelas adalah dengan cara menghitung terlebih dahulu banyak kelas dengan cara
5
K=1+ (3,3 ) log n
Setelah didapat banyak kelas, barulah menjadi kelas interval dengan rumus
berikut ini .
R
P=
K
Keterangan :
P = Kelas interval
R = Range (Data terbesar – Data terkecil)
K = Banyak kelas interval
c. Tabel distribusi frekuensi kumulatif adalah salah satu jenis tabel statistik yang
di dalamnya disajikan frekuensi yang dihitung terus meningkat atau selalu
ditambah-tambahkan baik dari bawah ke atas mauapun dari atas ke bawah.
Tabel distribusi frekuensi kumulatif ada dua yaitu tabel distribusi frekuensi
kumulatif data tunggal dan kelompok.
Tabel 2.4. Distribusi Frekuensi Kumulatif
Nilai Frekuens
Frekuensi
Nilai Tenga Frekuensi i Lebih
Kurang Dari
h Dari
10,5 0 0 40
11-20 15,5 2 2 38
21-30 25.5 3 5 35
31-40 35,5 3 8 32
41-50 45,5 6 14 26
51-60 55,5 8 22 18
61-70 65,6 7 29 11
71-80 75,5 5 34 6
81-90 85,5 3 37 3
6
91-
95,5 3 40 0
100
7
Perhatikan bahwa TKA kelas kedua = TKB kelas ketiga
8
di antara kelas yang satu dengan kelas yang lain masih ada lubang
tempat angka tertentu. Terdapat dua batas kelas untuk data yang telah
diurutkan, yakni batas kelas bawah (lower class limit) dan batas kelas
atas (upper class limit)
3. Tepi kelas atau batas nyata kelas yang tidak mempunyai lubang
untuk angka tertentu antara kelas yang satu dengan yang lainnnya.
Terdapat dua kelas yakni tepi kelas atas dan tepi kelas bawah.
4. Titik tengah kelas atau tanda kelas merupakan angka atau nilai data
yang tepat berada di tengah kelas. Titik tengah kelas merupakan nilai
yang menjawi wakil kelasnya dalam data. Untuk menetapkan titik
tengah kelas bisa dicari dengan rumus: Titik Tengah Kelas = ½
(batas atas kelas + batas bawah kelas)
5. Interval kelas merupakan selang yang menjadi pemisah kelas yang
satu dengan kelas yang lain.
6. Panjang interval kelas atau luas kelas merupakan jarak antara tepi
atas kelas dengan tepi bawah kelas
7. Frekuensi kelas merupakan banyaknya data yang termasuk ke dalam
kelas tertentu dari data acak.
9
2.3.1. Ukuran Pemusatan Dan Penyebaran Data
1. Mean (Rata-Rata)
Rata - rata adalah setiap bilangan yang bisa dipakai sebagai wakil dari
rentetan nilai rata-rata itu, wujudnya berupa satu bilangan saja namun dapat
mencerminkan gambaran secara umum mengenai kumpulan atau deretan bahan
keterangan berupa angka atau bilangan itu. Mean adalah jumlah dari keseluruhan
bilangan yang ada dibagi dengan banyaknya angka bilangan tersebut.
Jenis mean ada dua, yaitu data yang terkelompok dan data yang tidak
terkelompok. Untuk mencari mean data yang tidak kelompok, berikut ini adalah
rumusnya
x 1+ x 2+ x 3 …+ xn
X=
n
Sedangkan rumus untuk menghitung mean dengan data yang berkelompok adalah
berikut :
X =x 0+ p
( ∑ fi . ci
∑ fi )
Keterangan :
X = Rata-rata
P = Lebar kelas
ci = Nilai kelas tengah dikurangin dengan nilai keas bawah dibagi
lebar kelas
fi = Jumlah frekuensi data
Adapun yang menjadi sifat dan penggunaan rata-rata hitung adalah:
a. Nilai numerik rata-rata hitung ditentukan secara ketat oleh bilangan-
bilangan yang menyusunnya.
b. Nilai numerik rata-rata hitung adalah unik.
c. Nilai Numerik rata-rata hitung sangat dipengaruhi oleh nilai ekstrim.
d. Rata-rata hitung hanya boleh dihitung (valid sebagai ukuran gejala
pusat) untuk variabel yang memenuhi tingkat pengukuran sekurang-
kurangnya interval,
10
e. Apabila dalam rentetan data yang dihadapi terdapat bilangan ekstrim,
tidak disarankan untuk menggunakan rata-rata hitung sebagai ukuran
gejala pusat, sebab bisa memberikan kesimpukan yang keliru.
f. Tidak disarankan untuk mengambil kesimpulan yang hanya
didasarkan kepada rata-rata hitung.
2. Median
Median merupakan suatu harga yang merupakan titik tengah dari
keseluruhan harga pada suatu satuan data. Oleh karena itu terdapat 50% data yang
berada di bawah atau sama dengan nilai tersebut dan terdapat 50% lagi data yang
berada di atas atau sama dengan data tersebut.
Untuk menghitung Median dari data bergolong, dipergunakan rumus:
(( n−F )
)
1
2
Me=b+ p
f
Keterangan :
b = batas bawah, di mana median akan terletak
p = panjang kelas interval
F = jumlah semua frekuansi sebelum kelas interval
f = frekuensi kelas median
11
Apabila dalam rentetan bilangan terdapat nilai ekstrim, disarankan untuk
menggunakan median sebagai pengganti rata-rata hitung.
3. Modus
Modus didefinisikan sebagai bilangan yang paling banyak muncul atau
bilangan yang frekuensi kemunculannya paling besar dari sutau satuan data.
Modus tidak selalu dengan mudah diperoleh. Hal ini akan terjadi jika dihadapkan
pada suatu harga yang mempunyai frekuensi kemunculan yang sama dengan yang
lainnya.
Untuk menghitung modus pada data bergolong dipergunakan rumus:
Mo=b+ ( b1
)
b1 +b2
p
Keterangan :
b = Batas kelas interval dengan frekuensi terbanyak
p = Panjang kelas interval
b1 = Frekuensi pada kelas modus dikurangi frekwensi kelas terdekat
sebelumnya
b2 = Frekuensi kelas modus dikurangi frekuensi kelas interval
berikutnya.
Adapun yang menjadi sifat-sifat dan penggunaan modus adalah sebagai
berikut:
a. Nilai numerik modus tidak unik (dalam sebuah rentetan data bisa
terdapat lebih dari sebuah modus).
b. Modus digunakan sebagai ukuran gejala pusat untuk variabel dengan
tingkat pengukuran sekurang-kurangnya nominal.
Hubungan antara Mean, Median, dan Modus adalah dapat digunakan
untuk mengetahui kemiringan kurva poligon distribusi frekuensi data observasi.
1. Mean = Median = Modus => Kurvanya simetris
2. Mean < Median < Modus => Bentuk kurvanya miring ke kiri
3. Mean > Median > Modus => Bentuk kurvanya miring ke kanan
12
4. Kuartil
Jika sekumpulan data dibagi menjadi empat bagian yang sama banyak,
sesudah disusun menurut urutan nilainya, maka bilangan pembaginya disebut
dengan kuartil. Simbol kuartil adalah K. Dengan demikian, ada tiga buah kuartil,
yaitu K1, K2, dan K3. Pemberian nama dimulai dari nilai kuartil yang paling
kecil. Berikut adalah rumus untuk menghitung kuartil.
( )
i
−F
4
Ki=b+ p
f
Keterangan :
Ki = Kuartil ke-i
B = Batas bawah kelas kuartil terletak
P = Panjang kelas
N = Ukuran sampel/jumlah data
F = Jumlah Frekuensi semua kelas sebelum kelas kuartil terletak
f = Frekuensi kelas kuartil
5. Desil
Desil adalah nilai yang membagi susunan data menjadi 10 bagian yang
sama banyak. Dengan demikian nilai-nilai dari desil yaitu ke-1 (D1), desil ke-2
(D2), desil ke-3 (D3), desil ke-4 (D4), dan seterusnya.
Keterangan :
D1 = Desil ke-i
Tb = Tepi bawah kelas kuartil
P = Panjang kelas
13
n = Banyak data
F = Frekuensi kumulatif sebelum kelas kuartil
F = Frekuensi kelas kuartil
2.3.2. Ukuran Dispersi Atau Variasi
Selain ukuran gejala pusat, terdapat ukuran lain yaitu ukuran dispersi
atau ukuran vasiasi yang mengisyaratkan keseragaman data. Nilai numerik ukuran
ini tidak pernah negatif (selalu positif). Apabila nilai ukuran ini diperoleh sama
dengan nol (0), hal ini menunjukkan bahwa data yang kita miliki keadaannya
seragam sempurna (tidak ada variasi, atau semua bilangan nilai numeriknya
sama). Oleh karena itu makin jauh nilai numerik ukuran ini dari nol (0), makin
tidak seragam keadaan data tersebut. Terdapat bebeapa ukuran variasi yang biasa
digunakan, yang juga akan diuraikan di sini, adalah; rentang (range), varians
(variance), simpangan baku (standar deviation), koefisien variasi (koeficient of
variation), rentang antar kuartil (interquartiles ranges), dan indeks dispersi (index
of dispersion).
A. Varians (Variance)
Rumus yang dipergunakan untuk menghitung varians, jika data berasal
(∑ )
dari populasi adalah N 2
N
xi
i =1
∑ x 12 -
N
2 i=1
σ =
N
(∑ )
n 2
n
xi
i=1
∑ x
12
-
n
2 i=1
s =
n-1
14
B. Simpangan Baku (Standar Deviation)
Simpangan baku didefinisikan sebagai akar dari Varians. Oleh karena itu
σ =√ σ 2
rumus simpangan baku adalah:
s = √ s2
Varians dan simpangan bau hanya boleh digunakan sebagai alat
pembanding keseragaman data, apabila data yang dibandingkan keseragamannya
itu berasal dari variabel yang sama dengan satuan pengukuran (unit of
measurement) yang sama pula. Varians dan Simpangan Baku hanya valid
digunakan sebagai ukuran variasi untuk variabel yang memenuhi tingkat
pengukuran sekurang-kurangnya interval.
15
.............................Derajat keruncingan distribusi yang disebut dengan kurtosis di ukur
dengan koefisien keruncingan yang salah satu rumusnya adalah sebagai berikut :
Q Q3 –Q1
KKR = ;Q=
P90 – P10 2
Gambar 2.1.
Gambar 2.2. Keruncingan Distribusi
Sumber : Laporan Pratikum Distribusi Frekuensi, 2018
16
Gambar 2.1.
Gambar 2.2. Histogram dan Frekuensi Poligon
Sumber : Laporan Pratikum Distribusi Frekuensi, 2018
2.3.2.
2.3.3.
2.3.4.
2.3.5. Ukuran Pemusatan
Ukuran pemusatan adalah sembarang ukuran yang menunjukkan pusat
segugus data, yang telah diurutkan dari yang terkecil sampai yang terbesar atau
sebaliknya dari yang terbesar sampai yang terkecil.
Salah satu kegunaan dari ukuran pemusatan data adalah untuk
membandingkan dua (populasi) atau contoh, karena sangat sulit untuk
membandingkan masing-masing anggota dari masing-masing anggota populasi
atau masing-masing anggota data contoh.Nilai ukuran pemusatan ini dibuat
sedemikian sehingga cukup mewakili seluruh nilai pada data yang bersangkutan.
Kegunaan ukuran penyebaran antara lain sebagai berikut:
a. Ukuran penyebaran dapat digunakan untuk menentukan apakah nilai
rata-ratanya benar-benar representatif atau tidak. Apabila suatu
kelompok data mempunyai penyebaran yang tidak sama terhadap nilai
rata-ratanya, maka dikatakan bahwa nilai rata-rata tersebut tidak
representatif.
b. Ukuran penyebaran dapat digunakan untuk mengadakan perbandingan
terhadap variabilitas data.
17
c. Ukuran penyebaran dapat membantu penggunaan ukuran statistika,
misalnya dalam pengujian hipotesis, apakah dua sampel berasal dari
populasi yang sama atau tidak.
2.1.
2.2.
18