49
84
71
72
35
93
91
74
60
63
48
90
92
85
83
76
61
99
83
88
74
70
38
51
73
71
72
95
82
70
81
91
56
65
74
90
97
80
60
66
98
93
81
93
43
72
91
59
67
88
87
82
74
83
86
67
88
71
89
79
80
78
73
86
88
75
81
77
63
75
Sangatlah sulit untuk menarik suatu kesimpulan dari daftar data tersebut. Secara sepintas, kita
belum bisa menentukan berapa nilai ujian terkecil atau terbesar. Demikian pula, kita belum
bisa mengetahui dengan tepat, berapa nilai ujian yang paling banyak atau berapa banyak
mahasiswa yang mendapatkan nilai tertentu. Dengan demikian, kita harus mengolah data
tersebut terlebih dulu agar dapat memberikan gambaran atau keterangan yang lebih baik.
Bandingkan dengan tabel yang sudah disusun dalam bentuk daftar frekuensi (Tabel 2a dan
Tabel 2b). Tabel 2a merupakan daftar frekuensi dari data tunggal dan Tabel 2b merupakan
daftar frekuensi yang disusun dari data yang sudah di kelompokkan pada kelas yang sesuai
dengan selangnya. Kita bisa memperoleh beberapa informasi atau karakteristik dari data nilai
ujian mahasiswa.
Tabel 2a.
No
1
2
3
4
:
16
17
:
42
43
Nilai Ujian
xi
35
36
37
38
:
70
71
:
98
99
Total
Frekuensi
fi
1
0
0
1
:
4
3
1
1
1
80
Pada Tabel 2a, kita bisa mengetahui bahwa ada 80 mahasiswa yang mengikuti ujian, nilai
ujian terkecil adalah 35 dan tertinggi adalah 99. Nilai 70 merupakan nilai yang paling banyak
diperoleh oleh mahasiswa, yaitu ada 4 orang, atau kita juga bisa mengatakan ada 4
mahasiswa yang memperoleh nilai 70, tidak ada satu pun mahasiswa yang mendapatkan nilai
36, atau hanya satu orang mahasiswa yang mendapatkan nilai 35.
Tabel 2b.
Kelas ke1
2
3
4
5
6
7
Nilai Ujian
31 40
41 50
51 60
61 70
71 80
81 90
91 100
Jumlah
Frekuensi fi
2
3
5
13
24
21
12
80
Tabel 2b merupakan daftar frekuensi dari data yang sudah dikelompokkan. Daftar ini
merupakan daftar frekuensi yang sering digunakan. Kita sering kali mengelompokkan data
contoh ke dalam selang-selang tertentu agar memperoleh gambaran yang lebih baik mengenai
karakteristik dari data. Dari daftar tersebut, kita bisa mengetahui bahwa mahasiswa yang
mengikuti ujian ada 80, selang kelas nilai yang paling banyak diperoleh oleh mahasiswa
adalah sekitar 71 sampai 80, yaitu ada 24 orang, dan seterusnya. Hanya saja perlu diingat
bahwa dengan cara ini kita bisa kehilangan identitas dari data aslinya. Sebagai contoh, kita
bisa mengetahui bahwa ada 2 orang yang mendapatkan nilai antara 31 sampai 40. Meskipun
demikian, kita tidak akan tahu dengan persis, berapa nilai sebenarnya dari 2 orang mahasiswa
tersebut, apakah 31 apakah 32 atau 36 dst.
Ada beberapa istilah yang harus dipahami terlebih dahulu dalam menyusun daftar frekuensi.
Tabel 3.
Kelas ke1
2
3
4
5
6
7
Selang
Nilai Ujian
31 40
41 50
51 60
61 70
71 80
81 90
91 100
Jumlah
Batas Kelas
30.5 40.5
40.5 50.5
50.5 60.5
60.5 70.5
70.5 80.5
80.5 90.5
90.5 100.5
Nilai Kelas
(xi)
35.5
45.5
55.5
65.5
75.5
85.5
95.5
Frekuensi
(fi)
2
3
5
13
24
21
12
80
Range : Selisih antara nilai tertinggi dan terendah. Pada contoh ujian di atas, Range = 99 35
= 64
Batas bawah kelas: Nilai terkecil yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di
atas, batas bawah kelasnya adalah 31, 41, 51, 61, , 91)
Batas atas kelas: Nilai terbesar yang berada pada setiap kelas. (Contoh: Pada Tabel 3 di atas,
batas bawah kelasnya adalah 40, 50, 60, , 100)
Batas kelas (Class boundary): Nilai yang digunakan untuk memisahkan antar kelas, tapi
tanpa adanya jarak antara batas atas kelas dengan batas bawah kelas berikutnya. Contoh:
Pada kelas ke-1, batas kelas terkecilnya yaitu 30.5 dan terbesar 40.5. Pada kelas ke-2, batas
kelasnya yaitu 40.5 dan 50.5. Nilai pada batas atas kelas ke-1 (40.5) sama dengan dan
merupakan nilai batas bawah bagi kelas ke-2 (40.5). Batas kelas selalu dinyatakan dengan
jumlah digit satu desimal lebih banyak daripada data pengamatan asalnya. Hal ini
dilakukan untuk menjamin tidak ada nilai pengamatan yang jatuh tepat pada batas kelasnya,
sehingga menghindarkan keraguan pada kelas mana data tersebut harus ditempatkan. Contoh:
bila batas kelas di buat seperti ini:
Kelas ke-1 : 30 40
Kelas ke-2 : 40 50
:
dst.
Apabila ada nilai ujian dengan angka 40, apakah harus ditempatkan pada kelas-1 ataukah
kelas ke-2?
Panjang/lebar kelas (selang kelas): Selisih antara dua nilai batas bawah kelas yang
berurutan atau selisih antara dua nilai batas atas kelas yang berurutan atau selisih antara nilai
terbesar dan terkecil batas kelas bagi kelas yang bersangkutan. Biasanya lebar kelas tersebut
memiliki lebar yang sama. Contoh:
lebar kelas = 41 31 = 10 (selisih antara 2 batas bawah kelas yang berurutan) atau
lebar kelas = 50 40 = 10 (selisih antara 2 batas atas kelas yang berurutan) atau
lebar kelas = 40.5 30.5 = 10. (selisih antara nilai terbesar dan terkecil batas kelas pada kelas
ke-1)
Nilai tengah kelas: Nilai kelas merupakan nilai tengah dari kelas yang bersangkutan yang
diperoleh dengan formula berikut: (batas atas kelas+batas bawah kelas). Nilai ini yang
dijadikan pewakil dari selang kelas tertentu untuk perhitungan analisis statistik selanjutnya.
Contoh: Nilai kelas ke-1 adalah (31+40) = 35.5
Banyak kelas: Sudah jelas! Pada tabel ada 7 kelas.
Frekuensi kelas: Banyaknya kejadian (nilai) yang muncul pada selang kelas tertentu.
Contoh, pada kelas ke-1, frekuensinya = 2. Nilai frekuensi = 2 karena pada selang antara 30.5
40.5, hanya ada 2 angka yang muncul, yaitu nilai ujian 31 dan 38.
Banyak software (teknologi komputasi ) yang bisa digunakan untuk membuat tabel distribusi
frekuensi secara otomatis. Meskipun demikian, di sini tetap akan diuraikan mengenai
prosedur dasar dalam membuat tabel distribusi frekuensi.
Langkah-langkah dalam menyusun tabel distribusi frekuensi:
Pada saat menyusun TDF, pastikan bahwa kelas tidak tumpang tindih sehingga setiap nilainilai pengamatan harus masuk tepat ke dalam satu kelas. Pastikan juga bahwa tidak akan ada
data pengamatan yang tertinggal (tidak dapat dimasukkan ke dalam kelas tertentu). Cobalah
untuk menggunakan lebar yang sama untuk semua kelas, meskipun kadang-kadang tidak
mungkin untuk menghindari interval terbuka, seperti 91 (91 atau lebih). Mungkin juga
ada kelas tertentu dengan frekuensi nol.
Contoh:
Kita gunakan prosedur di atas untuk menyusun tabel distribusi frekuensi nilai ujian
mahasiswa (Tabel 1).
Berikut adalah nilai ujian yang sudah diurutkan:
35
61
70
73
78
82
88
91
38
63
70
74
79
82
88
92
43
63
70
74
79
83
88
92
48
63
71
74
80
83
88
93
49
65
71
74
80
83
89
93
51
66
71
75
80
84
90
93
56
67
72
75
80
85
90
95
59
67
72
76
81
86
90
97
60
68
72
76
81
86
91
98
60
70
73
77
81
87
91
99
2. Range:
[nilai tertinggi nilai terendah] = 99 35 = 64
3. Banyak Kelas:
Tentukan banyak kelas yang diinginkan.
Apabila kita lihat nilai Range = 64, mungkin banyak kelas
sekitar 6 atau 7.
Sebagai latihan, kita gunakan aturan Sturges.
banyak kelas = 1 + 3.3 x log(n)
= 1 + 3.3 x log(80)
= 7.28 7
4. Panjang Kelas:
Panjang Kelas = [range]/[banyak kelas]
= 64/7
= 9.14 10
Kelas ke-
Nilai Ujian
Batas Kelas
1
2
3
4
5
6
7
31 40
41 50
51 60
61 70
71 80
81 90
91 100
Jumlah
30.5 40.5
40.5 50.5
50.5 60.5
60.5 70.5
70.5 80.5
80.5 90.5
90.5 100.5
Frekuensi
(fi)
2
3
5
13
24
21
12
80
Kelas ke-
Nilai Ujian
1
2
3
4
5
6
31 40
41 50
51 60
61 70
71 80
81 90
Frekuensi
(fi)
2
3
5
13
24
21
91 100
Jumlah
12
80
Frekuensi relatif =
Contoh: frekuensi relatif kelas ke-1:
fi = 2; n = 80
Frekuensi relatif = 2/80 x 100% = 2.5%
Kelas ke1
2
3
4
5
6
7
Nilai Ujian
31 40
41 50
51 60
61 70
71 80
81 90
91 100
Jumlah
68
80
Variasi lain adalah Frekuensi kumulatif lebih dari. Prinsipnya hampir sama dengan prosedur
di atas.
Histogram
Histogram adalah merupakan bagian dari grafik batang di mana skala horisontal mewakili
nilai-nilai data kelas dan skala vertikal mewakili nilai frekuensinya. Tinggi batang sesuai
dengan nilai frekuensinya, dan batang satu dengan lainnya saling berdempetan, tidak ada
jarak/ gap diantara batang. Kita dapat membuat histogram setelah tabel distribusi frekuensi
data pengamatan dibuat.
Poligon Frekuensi:
Poligon Frekuensi menggunakan segmen garis yang terhubung ke titik yang terletak tepat di
atas nilai-nilai titik tengah kelas. Ketinggian dari titik-titik sesuai dengan frekuensi kelas, dan
segmen garis diperluas ke kanan dan kiri sehingga grafik dimulai dan berakhir pada sumbu
horisontal.
Ogive
Ogive adalah grafik garis yang menggambarkan frekuensi kumulatif, seperti daftar distribusi
frekuensi kumulatif. Perhatikan bahwa batas-batas kelas dihubungkan oleh segmen garis
yang dimulai dari batas bawah kelas pertama dan berakhir pada batas atas dari kelas terakhir.
Ogive berguna untuk menentukan jumlah nilai di bawah nilai tertentu. Sebagai contoh, pada
gambar berikut menunjukkan bahwa 68 mahasiswa mendapatkan nilai kurang dari 90.5.
2. Data yang telah disusun ke dalam urutan dari nilai terbesar hingga data terkecil atau
sebaliknya disebut array data.
Contoh:
Data masa kerja 40 karyawan UMY adalah sbb:
3. Beda atau selisih antara angka terbesar dengan angka terkecil disebut dengan jarak atau
range.
4. Jika array data itu dibagi atas kelompok-kelompok tertentu maka kelompok-kelompok itu
disebut dengan kelas.
5. Bilangan-bilangan yang menyatakan banyaknya data yang terdapat dalam setiap kelas
disebut frekuensi.
6. Jarak antara kelas yang satu dengan kelas yang lain disebut interval kelas.
Bentuk Umum Tabel Distribusi Frekuensi
Distribusi
Frekuensi
Numerikal,
dibagi
menjadi:
a.
Distribusi
Frekuensi
Relatif
Distribusi frekuensi relatif yaitu distribusi frekuensi yang angka-angka frekuensinya tidak
dinyatakan dalam angka-angka absolut tetapi angka-angka relatif atau persentase. Contohnya
yaitu:
b.
Distribusi
Frekuensi
Komulatif
Distribusi
frekuensi
komulatif
terdiri
dari
dua
jenis
yaitu
:
1)
Distribusi
frekuensi
kurang
dari
Distribusi frekuensi kurang dari yaitu distribusi frekuensi yang memasukkan frekuensi
kelas-kelas sebelumnya. Contohnya yaitu:
2)
Distribusi
frekuensi
atau
lebih
Distribusi frekuensi atau lebih yaitu distribusi frekuensi yang memasukkan frekuensi kelaskelas sesudahnya. Contohnya yaitu:
2.
Distribusi
frekuensi
kategoris
(Categorical
frequency
distribution)
Distribusi frekuensi kategoris yaitu distribusi yang pembagian kelasnya berdasarkan kategorikategori atau secara kualitatif. Contoh Distribusi frekuensi kategoris yaitu:
k = Banyak kelas
Range = angka terbesar angka terkecil
c. Menghitung frekuensi data
Contoh Soal
Data berikut ini merupakan nilai ujian Matakuliah Statistik I dari 25 mahasiswa:
1.
Histogram
Histogram adalah diagram batang yang lebarnya menunjukkan interval kelas, sedangkan
batas-batas tepi batang merupakan tepi bawah dan tepi atas kelas, dan tingginya
menunjukkan frekuensi pada kelas tersebut. Jika pada diagram batang, gambar batangbatangnya terpisah maka pada histogram gambar batang-batangnya berimpit. Histogram
terdiri dari 2 sumbu, sumbu vertikal sebagai skala frekuensi sedangkan sumbu horisontal
untuk skala kelas.
Contoh :
Diketahui nilai ujian 40 siswa di SMA Jaya Selalu. Tentukan histogram daftar distribusi
frekuensi dan frekuensi relatifnya.
Maka histogramnya
2.
Poligon
Frekuensi
Poligon Frekuensi yaitu penggambaran distribusi frekuensi dalam bentuk garis yang
menghubungkan titik-titik tengah kelasnya sebagai skala kelas. Jenis lain dari poligon
frekuensi adalah kurva frekuensi, yaitu penggambaran distribusi frekuensi dalam bentuk
garis, dimana luas daerah di bawah kurva kurang lebih sama dengan luas histogram
frekuensinya. Kurva frekuensi dapat digambarkan dengan memanfaatkan histogram frekuensi
dengan menggunakan angka-angka tepi kelas sebagai skala kelas, dengan menghubungkan
titik-titik tengah masing-masing balok.
Contoh :
Berikut ini upah karyawan (dalam ribuan rupiah) per minggu dari sebuah perusahaan.
Hasil akhir dari histogram dan poligon frekuensi dari tabel distribusi frekuensi di atas dapat
dilihat pada gambar berikut.
3.
Ogive
Curve
atau
Kurva
Ogive
Kurva ogive merupakan diagram garis yang menunjukkan kombinasi antara interval kelas
dengan frekuensi kumulatif. Kurva ogif menunjukkan frekuensi kumulatif pada setiap tingkat
atau kategori. Sumbu horizontal pada kurva ogif menunjukkan tepi interval kelas dan sumbu
vertical menunjukkan frekuensi kumulatif. Kurva ogif memudahkan kita untuk melihat
frekuensi kumulatif baik dalam bentuk nilai absolute maupun nilai relative pada tingkat atau
interval tertentu.
Daftar distribusi kumulatif ada dua macam, yaitu sebagai berikut :
a. Daftar distribusi kumulatif kurang dari (menggunakan tepi atas)
b. Daftar distribusi kumulatif lebih dari (menggunakan tepi bawah)
Contoh :
Data upah karyawan sebelumnya dapat digambarkan ogivenya. Akan tetapi sebelum itu, buat
terlebih dahulu tabel distribusi frekuensi kumulatifnya.
Dari tabel distribusi frekuensi kumulatif di atas, dapat digambarkan ogive seperti pada
diagram berikut.
F. Model-model Populasi
Poligon frekuensi yang merupakan garis patah-patah dapat didekati oleh sebuah lengkungan
halus yang bentuknya secocok mungkin dengan bentuk poligon tersebut. Lengkungan yang
didapat dinamakan kurva frekuensi. Jika semua data dalam populasi dapat dikumpulkan lalu
dibuat daftar distribusi frekuensinya dan akhirnya digambarkan kurva frekuensinya, maka
kurva ini dapat menjelaskan sifat-sifat karakteristik populasi. Kurva ini merupakan model
populasi yang akan ikut menjelaskan ciri-ciri populasi. Dalam praktek, model populasi ini
biasanya didekati oleh atau diturunkan dari kurva frekuensi yang diperoleh dari sampel
reprenentatif yang diambil dari populasi.
Untuk keperluan teori dan metode yang lebih lanjut, metode populasi ini dituangkan dalam
bentuk persamaan matematik. Beberapa diantaranya akan dibahas kemudian. Pada saat
sekarang hanya akan diberikan bentuk kurva untuk model populasi yang sering dikenal.
Diantaranya model normal, simetrik, positif atau miring ke kiri, negatif atau miring ke kanan,
bentuk J dan U.
1. Model normal, yang sebenarnya akan lebih tepat digambarkan berdasarkan persamaan
matematiknya. Bentuk model normal selalu simetrik dan mempunyai sebuah puncak. Kurva
dengan sebuah puncak disebut unimodal.
2. Model simetrik, di sini juga unimodal. Perhatikan bahwa model normal selalu simetrik
tetapi tidak sebaliknya.
3. Model positif menggambarkan bahwa terdapat sedikit gejala yang bernilai makin besar.
4. Model negatif terjadi sebaliknya. Soal ujian yang terlalu mudah sehingga banyak peserta
yang mendapat nilai baik menggambarkan model negatif.
5. model berbentuk J ini terdapat dalam dunia ekonomi, industri dan fisika.
Model dengan lebih dari sebuah puncak disebut multimodal. Kalau hanya ada dua puncak
disebut bimodal