Pendahuluan
Sebagaimana telah kita ketahui, salah satu fungsi statistik adalah untuk
mempermudah kita mengolah dan menganalisis data hasil penelitian. Untuk dapat
melakukan fungsi tersebut, maka data hasil penelitian yang telah diperoleh dari
lapangan harus disajikan atau ditampilkan menjadi sebuah bentuk yang sistematis
dan informatif. Perhatikan contoh berikut:
Berikut ini adalah data nilai ujian statistik sosial mahasiswa Sosiologi. Jumlah
mahasiswa yang mengikuti ujian adalah sebanyak 55 mahasiswa:
60 60 65 58 74
75 50 69 54 73
82 55 66 66 71
80 59 63 67 70
65 78 85 69 61
78 87 85 84 62
90 85 85 80 63
91 86 85 87 67
75 87 90 90 65
85 82 90 87 90
88 91 55 75 85
Sumber: data fiktif
Perhatikan data di atas! Apabila kita mengamati data tersebut, kita tidak dapat
membaca data tersebut dengan ringkas, sehingga kita tidak dapat menyimpulkan
berbagai informasi dari data tersebut. Misalnya, kita akan kesulitan untuk
mengetahui apakah hasil ujian tersebut tergolong baik atau tidak? Berapa nilai
tertinggi dan terendah? Berapakah nilai yang banyak diperoleh mahasiswa? dan
sebagainya. Untuk itu, data tersebut harus disajikan dalam bentuk yang lebih
sederhana atau sistematis.
Distribusi Frekuensi
Distribusi frekuensi merupakan proses penyusunan suatu data mulai dari yang
terkecil (terendah) sampai yang terbesar (tertinggi) atau sebaliknya, yang kemudian
data dapat dibagi banyaknya ke dalam beberapa kelas, atau dapat juga didefinisikan
sebagai teknik penyusunan bahan-bahan atas dasar nilai variabel dan frekuensi tiap-
tiap nilai variabel tersebut (Hadi, 2004: 17). Tabel distribusi frekuensi merupakan
tabel yang digunakan untuk menampilkan distribusi frekuensi. Penyusunan tabel
distribusi frekuensi bermanfaat untuk memudahkan kita dalam penyajian data
sehingga mudah dipahami dan mudah dibaca sebagai bahan informasi, pada
gilirannya bisa digunakan untuk perhitungan membuat gambar statistik dalam
berbagai bentuk penyajian data.
Ada beberapa jenis tabel distribusi frekuensi, yaitu:
1
Tabel 2.1 Distribusi frekuensi nilai ujian Statistik Sosial Jurusan Sosiologi
Nilai Frekuensi
50 1
54 1
55 2
58 1
59 1
60 2
61 1
62 1
63 2
65 3
66 2
67 2
69 2
70 1
71 1
73 1
74 1
75 3
78 2
80 2
82 2
84 1
85 7
86 1
87 4
88 1
90 5
91 2
Total 55
Sumber: Data fiktif.
Komponen data nilai ujian dalam Tabel 2.1 ditampilkan dalam bentuk data tunggal.
Pada kolom “frekuensi”, frekuensi untuk setiap nilai ditampilkan dalam bentuk angka
absolut (bilangan bulat), maka Tabel 2.1 juga dinamakan Tabel Distribusi Frekuensi
Absolut. Dengan demikian, tabel distribusi frekuensi absolut merupakan tabel
distribusi frekuensi dengan jumlah setiap data (kategori) ditunjukkan menggunakan
angka absolut (bilangan bulat).
Tabel 2.1 belumlah lengkap, karena kita tidak mendapatkan informasi “yang lebih”
dalam, karena kita hanya mengetahui “jumlah” melalui angka absolut saja. Untuk itu,
tabel tersebut perlu ditambah satu kolom lagi yang berisi persentase dari perolehan
nilai tersebut. Hasilnya adalah sebagai berikut:
2
Tabel 2.2 Distribusi frekuensi relatif nilai ujian Statistik Sosial Jurusan Sosiologi
Nilai Frekuensi Persentase
50 1 1,8
54 1 1,8
55 2 3,6
58 1 1,8
59 1 1,8
60 2 3,6
61 1 1,8
62 1 1,8
63 2 3,6
65 3 5,5
66 2 3,6
67 2 3,6
69 2 3,6
70 1 1,8
71 1 1,8
73 1 1.8
74 1 1,8
75 3 5,5
78 2 3,6
80 2 3,6
82 2 3.6
84 1 1,8
85 7 12,7
86 1 1,8
87 4 7,3
88 1 1,8
90 5 9,1
91 2 3,6
Total 55 100
Sumber: Data fiktif.
Tabel 2.2 disebut Tabel Distribusi Frekuensi Relatif, yaitu tabel distribusi frekuensi
yang nilai frekuensinya tidak dinyatakan dalam bentuk angka absolut atau angka
mutlak, akan tetapi frekuensi setiap kelasnya dinyatakan dalam bentuk angka
persentase atau angka relatif. Cara menentukan persentase adalah dengan Rumus 1.5
(Bab 1):
f
Persentase = x100 % Rumus 1.5
N
3
Tabel 2.2. menunjukkan bahwa jumlah mahasiswa paling banyak adalah memperoleh
nilai 85, yaitu sebanyak 7 mahasiswa atau 12,7%. Nilai terendah adalah 50, sebanyak
1 mahasiswa (1,8%) dan nilai tertinggi adalah 91, sebanyak 2 mahasiswa (3,6%).
Distribusi Frekuensi Data Berkelompok
Apabila kita amati, penyajian data seperti Tabel 2.1 dan 2.2 kurang praktis, karena
tabel terlalu memanjang ke bawah menyesuaikan jumlah data yang ada. Bila hal ini
dilakukan, maka akan banyak memakan tempat, terutama pada saat kita menulis
laporan hasil penelitian. Untuk itu, solusinya adalah data tersebut dibagi menjadi
beberapa kelompok data, sehingga tabelnya tidak sepanjang Tabel 1.2 dan 2.2.
Untuk menyusun tabel distribusi berkelompok, langkah-langkah yang harus
dilakukan adalah sebagai berikut:
Mengurutkan data dari yang terkecil sampai yang terbesar.
Menghitung jangkauan atau rentang (Range / R) data dengan rumus:
R = nilai terbesar – nilai terkecil
Menghitung jumlah kelas (K) dengan rumus Sturges:
K = 1 + 3,3 log n Rumus 2.1
n : jumlah data
Jumlah kelas interval, juga dapat ditentukan dengan menggunakan grafik jumlah
kelas interval sebagai berikut:
4
R
P= Rumus 2.2
K
Menentukan batas data terendah atau ujung data pertama, dilanjutkan dengan
menghitung kelas interval. Caranya dengan menjumlahkan ujung bawah kelas
ditambah panjang kelas (P) dan hasilnya dikurangi 1 sampai pada data akhir.
Membuat tabel sementara dengan cara menghitung satu per satu sesuai dengan
urutan yang sesuai dengan urutan interval kelas.
Kita juga dapat membuat tabel distribusi berkelompok berdasarkan Tabel 2.1.
Langkahnya adalah:
Mengurutkan data dari yang terkecil sampai yang terbesar, sehingga hasilnya adalah
sebagai berikut:
50 60 66 73 82 88
54 61 67 74 84 90
55 62 69 75 85 91
58 63 70 78 86
59 65 71 80 87
Menghitung jarak atau rentang (Range / R) data, dengan rumus:
R = nilai terbesar – nilai terkecil
sehingga: R = 91-50 = 41
Menghitung jumlah kelas (K) dengan rumus Sturges:
K = 1 + 3,3 log n
K = 1 + 3,3 log 55
K = 1 + 3,3 x 0,74
K = 6.742 (dibulatkan menjadi 7)
Menghitung panjang kelas interval (P) dengan rumus:
R 41
P= = = 5,85 (dibulatkan menjadi 6)
K 7
Menentukan batas data terendah atau ujung data pertama, dilanjutkan dengan
menghitung kelas interval.
(50) s.d (50 + 6) – 1 → 50 – 55 (interval 1)
(56) s.d (56 + 6) – 1 → 56 – 61 (interval 2)
(62) s.d (62 + 6) – 1 → 62 – 67 (interval 3)
(68) s.d (68 + 6) – 1 → 68 – 73 (interval 4)
(74) s.d (74 + 6) – 1 → 74 – 79 (interval 5)
(80) s.d (80 + 6) – 1 → 80 – 85 (interval 6)
(86) s.d (86 + 6) – 1 → 86 – 91 (interval 7)
5
Membuat tabel sementara dengan cara menghitung satu per satu sesuai urutan
interval kelas.
Nilai Turus Frekuensi
50-55 //// 4
56-61 //// 5
62-67 //// //// 10
68-73 //// 5
74-79 //// / 6
80-85 //// //// // 12
86-91 //// //// /// 13
Jumlah 55
6
Untuk selanjutnya, bisa dituliskan batas-kelas-nyata dan batas-kelas-semu dalam
satu tabel distribusi frekuensi sebagai berikut:
Tabel 2.4 Batas nyata dan batas semu Tabel 2.3
Batas semu Batas nyata Frekuensi
50 - 55 49,5 ≤ x < 55,5 4
56 - 61 55,5 ≤ x < 61,5 5
62 - 67 61,5 ≤ x < 67,5 10
68 - 73 67,5 ≤ x < 73,5 5
74 - 79 73,5 ≤ x < 79,5 6
80 - 85 79,5 ≤ x < 85,5 12
86 – 91 85,5 ≤ x < 91,5 13
Jumlah 55
Sumber: Data fiktif
Selanjutnya, tabel distribusi frekuensi relatif Tabel 2.3 adalah sebagai berikut:
Tabel 2.5 Distribusi Frekuensi Relatif dari Tabel 2.3
Nilai Frekuensi
50 - 55 7,3
56 - 61 9,1
62 - 67 18,2
68 - 73 9,1
74 - 79 10,9
80 - 85 21,8
86 – 91 23,6
Total 100
Sumber: Data fiktif
7
Distribusi Frekuensi Kumulatif
Distribusi frekuensi kumulatif merupakan distribusi frekuensi yang nilai frekuensinya
diperoleh dengan menjumlahkan atau mengurangkan frekuensi demi frekuensi. Tabel
ini bisa disusun berdasarkan tabel distribusi frekuensi mutlak. Akan tetapi, perlu
diingat bahwa distribusi frekuensi kumulatif tidak dapat digunakan untuk variabel
dengan skala pengukuran nominal.
Distribusi frekuensi kumulatif dibagi menjadi dua, yaitu distribusi frekuensi
kumulatif (kurang dari) dan distribusi frekuensi (lebih dari). Untuk memperjelas
perbedaan di antara keduanya, perhatikan dua contoh berikut:
Tabel 2.6 Distribusi Kumulatif (kurang dari) Tabel 2.3
Nilai Frekuensi Frekuensi Kumulatif
50 - 55 4 4
56 - 61 5 9
62 - 67 10 19
68 - 73 5 24
74 - 79 6 30
80 - 85 12 42
86 – 91 13 55
Jumlah 55
Sumber: Data fiktif
Angka-angka dalam kolom ketiga (Frekuensi Kumulatif), diperoleh dengan
menjumlahkan nilai frekuensi dengan nilai frekuensi berikutnya. Angka 9 (baris ke-2
kolom ke-3) diperoleh dari 4 + 5. Nilai-nilai dalam kolom Frekuensi Kumulatif
(kurang dari) Tabel 2.6, maknanya adalah sebagai berikut:
Tabel 2.7 Makna Distribusi Kumulatif (kurang dari) Tabel 2.3
Nilai Frekuensi Kumulatif
Kurang dari 50 0
Kurang dari 56 4
Kurang dari 62 9
Kurang dari 68 19
Kurang dari 74 24
Kurang dari 80 30
Kurang dari 86 42
Kurang dari 92 55
Sumber: Data fiktif
Mahasiswa yang memperoleh nilai kurang dari 50 berjumlah 0 mahasiswa;
mahasiswa yang memperoleh nilai kurang dari 56 berjumlah 4 mahasiswa, dan
seterusnya.
8
Tabel 2.8 Distribusi Kumulatif (lebih dari) Tabel 2.3
Nilai Frekuensi Frekunensi Kumulatif
50 - 55 4 55
56 - 61 5 51
62 - 67 10 46
68 - 73 5 36
74 - 79 6 31
80 - 85 12 25
86 – 91 13 13
Jumlah 55
Sumber: Data fiktif
Angka-angka dalam kolom ketiga (Frekuensi Kumulatif), diperoleh dengan
mengurangkan nilai frekuensi kumulatif dengan nilai frekuensi pada baris yang sama.
Angka 51 (baris ke-2 kolom ke-3) diperoleh dari 55 - 4. Nilai-nilai dalam kolom
Frekuensi Kumulatif (lebih dari) Tabel 2.8, maknanya adalah sebagai berikut:
Tabel 2.9 Distribusi Kumulatif (lebih dari) Tabel 2.3
Nilai Frekuensi Kumulatif
50 atau lebih 55
56 atau lebih 51
62 atau lebih 46
68 atau lebih 36
74 atau lebih 31
80 atau lebih 25
86 atau lebih 13
Sumber: Data fiktif
Mahasiswa yang memperoleh nilai 50 atau lebih berjumlah 55 mahasiswa;
mahasiswa yang memperoleh nilai 56 atau lebih berjumlah 51 mahasiswa, dan
seterusnya.
Distribusi Frekuensi Relatif Kumulatif
Distribusi Frekuensi Relatif Kumulatif merupakan distribusi frekuensi yang nilai
frekuensi kumulatifnya diubah menjadi nilai frekuensi relatif atau dalam bentuk
persentase (%). Distribusi frekuensi relatif kumulatif dibagi menjadi dua, yaitu
distribusi frekuensi relatif kumulatif (kurang dari) dan distribusi frekuensi relatif
kumulatif (lebih dari). Untuk memperjelas pengertian tersebut, berikut disajikan
contoh Tabel Distribusi Frekuensi Relatif Kumulatif yang diambil dari Tabel 2.7 dan
2.8.
9
Tabel 2.10 Distribusi Relatif Kumulatif (kurang dari) dari Tabel 2.7
Nilai Frekuensi Kumulatif
Kurang dari 50 0
Kurang dari 56 7,27
Kurang dari 62 16,36
Kurang dari 68 34,54
Kurang dari 74 43,67
Kurang dari 80 54,54
Kurang dari 86 76,36
Kurang dari 92 100
Sumber: Data fiktif.
Mahasiswa yang memperoleh nilai kurang dari 50 ada 0%; mahasiswa yang
memperoleh kurang dari 56 sebanyak 7,27%, dan seterusnya.
Tabel 2.11 Distribusi Relatif Kumulatif (lebih dari) dari Tabel 2.8
Nilai Frekuensi Kumulatif
50 atau lebih 100
56 atau lebih 92,73 51
x 100%
62 atau lebih 83,64 55
14
12
10
8
6
4
2
0
50-55 56-61 62-67 68-73 74-79 80-85 86-91
10
Poligon
Poligon merupkan grafik baris yang menghubungkan nilai tengah tiap sisi atas yang
berdekatan dengan nilai tengah jarak frekuensi mutlak masing-masing (Riduwan,
2003: 78). Poligon dari Tabel 2.3 adalah sebagai berikut:
14
12
10
8
6
4
2
0
50-55 56-61 62-67 68-73 74-79 80-85 86-91
60
50
40
30
20
10
0
50-55 56-61 62-67 68-73 74-79 80-85 86-91
60
50
40
30
20
10
0
50-55 56-61 62-67 68-73 74-79 80-85 86-91
11
Pie Chart
Pie chart merupakan sebuah diagram yang berbentuk lingkaran. Lingkaran tersebut
dibagi menjadi beberapa bagian atau daerah yang menunjukkan persentase dari
masing-masing kelas. Pie chart dari Tabel 2.5 adalah sebagai berikut:
50-55
86-91 56-61
62-67
80-85
68-73
74-79
Nilai
Statistik
nilai Numeric 3 0 abaikan 0 8 Center Scale
Jurusan
Sosiologi
12
Setelah semua kolom terisi, kembali ke menu ”Data View”, lalu masukkan data di atas
ke dalam SPSS secara berurutan ke bawah, sehingga akan menjadi seperti berikut:
Setelah semua data dimasukkan (total ada 70 data), jangan lupa untuk menyimpan
data yang sudah dimasukkan. Caranya:
Klik ”File” yang ada di bagian kiri atas menu utama SPSS, kemudian pilih ”Save”, atau
tekan ”Ctrl+S” langsung, lalu akan muncul kotak dialog sebagai berikut:
13
Pindahkan variabel ”Nilai Statistik Jurusan Sosiologi” dari kotak kiri ke kotak
”Variable(s)” dengan meng-klik tanda ” ”.
Klik”OK”, maka akan muncul output sebagai berikut:
Frequencies
Cumulative
Frequency Percent Valid Percent Percent
Valid 50 1 1.4 1.4 1.4
54 1 1.4 1.4 2.9
55 3 4.3 4.3 7.1
58 1 1.4 1.4 8.6
59 1 1.4 1.4 10.0
60 2 2.9 2.9 12.9
61 1 1.4 1.4 14.3
62 1 1.4 1.4 15.7
63 2 2.9 2.9 18.6
65 3 4.3 4.3 22.9
66 3 4.3 4.3 27.1
67 2 2.9 2.9 30.0
68 1 1.4 1.4 31.4
69 2 2.9 2.9 34.3
70 2 2.9 2.9 37.1
71 1 1.4 1.4 38.6
73 1 1.4 1.4 40.0
74 1 1.4 1.4 41.4
75 3 4.3 4.3 45.7
78 3 4.3 4.3 50.0
80 2 2.9 2.9 52.9
82 2 2.9 2.9 55.7
84 1 1.4 1.4 57.1
85 9 12.9 12.9 70.0
86 2 2.9 2.9 72.9
87 5 7.1 7.1 80.0
88 3 4.3 4.3 84.3
90 5 7.1 7.1 91.4
91 2 2.9 2.9 94.3
92 1 1.4 1.4 95.7
98 1 1.4 1.4 97.1
99 1 1.4 1.4 98.6
100 1 1.4 1.4 100.0
Total 70 100.0 100.0
14
Catatan: agar lebih mudah diingat, berilah nama data input dan data output dengan
nama yang sama. SPSS akan memberikan extensi yang berbeda untuk data input dan
data output. Untuk data input, ekstensinya adalah ”.sav”, sedangkan untuk data
output adalah ”.spv”.
Output yang dikeluarkan SPSS, yaitu tabel distribusi frekuensi absolut dan relatif
serta distribusi frekuensi relatif kumulatif.
Soal Latihan
1. Pak Tino, direktur PT Mudah Maju, sedang mencatat data karyawan berdasarkan
tingkat pendidikannya. Data yang dikumpulkan adalah: karyawan dengan tingkat
pendidikan SMP sebanyak 15 orang; karyawan dengan tingkat pendidikan SMA
sebanyak 45 orang; karyawan dengan tingkat pendidikan D3 sebanyak 36 orang;
dan karyawan dengan tingkat pendidikan S1 sebanyak 34 orang. Berdasarkan
data tersebut susunlah:
a. Tabel distribusi frekuensi absolut.
b. Tabel distribusi frekuensi relatif.
15
a. Tabel distribusi frekuensi data tunggal absolut.
b. Tabel distribusi frekuensi relatif.
c. Tabel distribusi frekuensi kumulatif (kurang dari dan lebih dari).
d. Tabel distribusi frekuensi relatif kumulatif (kurang dari dan lebih dari).
16