Anda di halaman 1dari 24

Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D.

STATISTIK DESKRIPTIF
1. Pengertian:
Statistik yang berfungsi untuk mendeskripsikan atau memberi gambaran seperti adanya
terhadap obyek yang diteliti menggunakan data sampel atau populasi, tanpa melakukan
analisis dan membuat suatu generalisasi.

2. Cakupan kegiatan:
• Penyajian data, dengan tabel dan/atau grafik (diagram);
• Penjelasan kelompok, melalui modus, median, mean; dan/atau
• Variasi kelompok, melalui rentang, simpangan baku dan koefisien variasi.

3. Tipe data:
Secara umum dibedakan dua tipe data yaitu data kualitatif dan data kuantitatif. Contoh
data kualitatif a.l. merah, putih, sakit, sehat, rusak, senang, gagal, sukses, yang semuanya
tidak mempunyai kuantitas. Data kualitatif juga disebut atribut atau data kategori
(categorical data).
Data kuantitatif berbentuk bilangan yang mewakili kuantitas dan harganya berubah-
ubah; dikenal dua bentuk data kuantitatif, yaitu data diskrit dan data kontinu. Data diskrit
merupakan hasil menghitung (count), yang disebut juga count data; ada juga yang
menyebutnya data nominal. Contoh jumlah mahasiswa Semester 1 = 60 orang; keluarga A
mempunyai 4 orang anak.
Data kontinu merupakan hasil pengukuran (measurement). Per definisi measurement is
the assignment of numbers to objects. Dengan definisi ini, pengukuran dapat menghasilkan
3 tipe data, yaitu ordinal, interval dan ratio. Hasil me-ranking merupakan data ordinal, di
mana jarak antara ranking 1 dan 2, antara 2 dan 3, tidak sama. Bila jaraknya sama maka
disebut data interval, misalnya antar skala derajat pada termometer; hanya saja tidak ada
titik nol sejati (true zerro). Beda dengan hasil pengukuran waktu tempuh atau berat badan,
ada titik nol sejati, dan ada makna rasio, misalnya orang yang beratnya 50 kg adalah 2 kali
orang yang beratnya 25 kg.

4. Penyajian data (Displying data)


Dapat dengan Tabel (tabel baris kolom, kontingensi atau distribusi frekuensi), dan
Grafik (atau diagram), yang dapat berbentuk garis, batang, lingkaran, piktogram, atau
diagram scatter.

4.1. Tabel baris kolom


Bentuk grafik yang paling sederhana adalah yang terdiri atas beberapa kolom dengan
data yang terdiri atas beberapa baris, seperti contoh Tabel 1.

4.2. Tabel kontingensi


Untuk data yang terdiri atas 2 faktor atau variabel, di amana faktor I terdiri atas b
kategori dan faktor II terdiri atas k kategori, maka dibuat tabel kontingensi dengan ukuran
bxk dengan b baris dan k kolom, seperti pada Tabel 2.

4.3. Tabel distribusi frekuensi


Tabel distribusi frekuensi dibuat bila jumlah data yang disajikan cukup banyak
sehingga bila disajikan dalam bentuk tabel biasa (baris kolom) menjadi tidak efisien dan
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 2

kurang komunikatif. Dengan ini, data dibagi menjadi beberapa kelas interval kemudian
ditampilkan jumlah frekuensi unit data pada tiap kelas interval, seperti pada Tabel 3.

Tabel 1. Tingkat kepuasan kerja pegawai PT Pribumi

No. Aspek Kepuasan Kerja Tingkat Kepuasan


1 Gaji 38,5
2 Insentif 58,1
3 Transportasi 67,8
4 Perumahan 45,6
5 Hubungan kerja 54,3

Tabel 2. Jumlah siswa di Kecamatan menurut tingkat sekolah dan jenis kelamin

Tingkatan sekolah
Jenis kelamin Jumlah
SD SLTP SLTA
Laki-laki 4.758 2.795 1.459 9.012
Perempuan 4.032 2.116 1.256 7.404
Jumlah 8.790 4.911 2.715 16.416

Tabel 3. Sebaran tinggi badan mahasiswa semester I

No kelas Kisaran tinggi (cm) Frekuensi


1 35 - 43 3
2 44 - 52 3
3 53 - 61 5
4 62 - 70 13
5 71 - 79 20
6 80 - 88 20
7 89 - 97 14
8 98 - 106 2
Jumlah sampel 80

Langkah-langkah membuat Distribusi Frekuensi


1. Menentukan jumlah kelas interval
2. Mengelompokkan unit data ke tiap kelas
3. Membuat tabel (bisa dalam frekuensi kelas atau frekuensi kumulatif), baik dalam
bentuk angka nominal maupun persen.
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 3

Penentuan kelas interval atau jumlah kelas interval:


1. Ditentukan berdasarkan pengalaman, biasanya jumlah kelas interval antara 6 s/d 15
kelas, tergantung banyaknya unit data.
2. Dengan membaca grafik hubungan antara jumlah kelas interval dan jumlah unit
data (Gambar 1), di mana dapat ditentukan bahwa bila banyaknya unit data
(sampel) hanya 10 maka jumlah kelas interval sekitar 4 kelas sedangkan jika ada
200 unit data, maka jumlah kelas interval sekitar 12 kelas, dst.
3. Ditentukan dengan rumus Sturges, sbb:
K = 1 + 3,3 log n
Di mana : K = Jumlah kelas interval
n = Jumlah unit data pengamatan

Gambar 1. Grafik untuk menentukan banyaknya kelas interval (Sumber: Sugiyono, 2005:
“Statistik untuk Penelitian”)

Contoh, penentuan dengan rumus Sturges, bila unit data ada 100, maka jumlah kelas
interval dapat dibitung sbb:
K = 1 + 3,3 log 100 = 1 + 3,3 x 2 = 1 + 6,6 = 7,6
dibulatkan menjadi 8 kelas interval.
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 4

CONTOH SOAL:
Dengan contoh data tinggi badan dari 100 sampel mahasiswa semester I pada suatu
fakultas, maka penetuan kelas interval sbb:
Data tinggi badan (cm) 100 mahasiswa, sbb:
155 165 155 175 156 172 156 170 165 166
160 170 148 180 175 160 173 165 164 176
160 180 172 157 196 189 163 175 155 164
165 160 170 170 158 160 170 166 169 165
170 165 180 178 175 165 162 156 167 164
173 170 175 180 185 182 155 174 168 172
168 160 165 160 160 180 160 160 174 167
160 166 160 159 155 167 159 172 163 170
162 160 162 175 180 173 160 171 170 171
160 170 180 178 182 167 167 173 169 173

Untuk menentukan batas bawah dan batas atas tiap kelas interval maka harus terlebih
dahulu dihitung rentang (range) data, yaitu dengan rumus sbb:
Range (rentang) = Max – Min = 196-148 = 48
Panjang kelas (p) menjadi = Range dibagi jumlah kelas = 48/8 = 6

Dengan demikian, kelas interval menjadi sbb:


1. 148-153
2. 154-159
3. 160-165
4. 166-171
5. 172-177
6. 178-183
7. 184-189
8. 190-196

Salah satu cara untuk mengalokasikan data masing-masing tinggi badan ke masing-masing
kelas interval, antara lain dapat dilakukan dengan menuliskan nomor kelas dalam “upper-
script” sesuai dengan nilainya, kemudian jumlah unit data tinggi badan untuk setiap nomor
kelas dihitung sehingga didapat jumlah individu (atau frekuensi) untuk masing-masing
kelas interval. Pemberian nomor kelas adalah sbb:

155 2 165 3 155 2 175 5 156 2 172 5 156 2 170 4 165 3 166 4
160 3 170 4 148 1 180 6 175 5 160 3 173 5 165 3 164 3 176 5
160 3 180 6 172 5 157 2 196 8 189 7 163 3 175 5 155 2 164 3
3 3 4 4 2 3 4 4 4
165 160 170 170 158 160 170 166 169 165 3
170 4 165 3 180 6 178 6 175 5 165 3 162 3 156 2 167 4 164 3
173 5 170 4 175 5 180 6 185 7 182 6 155 2 174 5 168 4 172 5
168 4 160 3 165 3 160 3 160 3 180 6 160 3 160 3 174 5 167 4
160 3 166 4 160 3 159 2 155 2 167 4 159 2 172 5 163 3 170 4
162 3 160 3 162 3 175 5 180 6 173 5 160 3 171 4 170 4 171 4
160 3 170 4 180 6 178 6 182 6 167 4 167 4 173 5 169 4 173 5
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 5

Dengan demikian, tabel distribusi frekuensi tinggi badan dari 100 mahasiswa semester I
tersebut menjadi seperti pada Tabel 4 berikut:

No kelas Kelas interval tinggi badan Frekuensi


1 148-153 1
2 154-159 12
3 160-165 31
4 166-171 24
5 172-177 18
6 178-183 11
7 184-189 2
8 190-196 1
Jumlah mahasiswa 100

Dari tabel distribusi frekuensi tersebut, bila dibuatkan grafiknya berupa grafik batang akan
menjadi seperti pada Gambar 2.

Gambar 2. Grafik distribusi frekuensi tinggi badan 100 orang mahasiswa semester I

Jika dilihat grafik pada Gambar 2, ada gap pada grafik batang antar kelas interval, maupun
dari nilai datanya (tinggi badan) ada gap, seperti antara nilai batas atas kelas no.1 (148-
153) dan batas bawah kelas no.2 (154-159), dan seterusnya, ada selisih 1 (154-153 = 1).

Agar tidak ada data yang tidak masuk ke salah satu kelas interval, maka ketentuan nilai gap
adalah sbb:
™ Jika datanya berupa bilangan bulat (decimal point = 0), maka gap = 1 (seperti
contoh di atas).
™ Jika datanya 1 desimal, misal 12,5 dst, maka gap = 0,1
™ Jika datanya 2 desimal, misal 12,54 dst, maka gap = 0,01
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 6

™ Jika datanya 3 desimal, misal 12,545 dst, maka gap = 0,001


™ Dan seterusnya demikian, sehingga semua unit data teralokasi ke kelas interval

Penyeimbangan batas bawah dan batas atas Tabel Distribusi Frekuensi


Dari contoh sebaran nilai dari data tinggi badan 100 mahasiswa di atas, nilai terendah =
148 dan nilai tertinggi = 196. Jika mau konsisten panjang kelas = 6, maka kelas no.8
seharusnya mempunyai interval nilai : 190-195. Namun jika digunakan interval ini, maka
salah satu unit data tidak bisa masuk ke salah satu kelas. Oleh karena itu, maka kelas
terakhir dibuat dengan interval nilai = 190-196, sehingga unit data tertinggi, yaitu 196
masuk ke kelas terakhir.

Jika dari data tinggi badan tersebut, misal tertinggi = 197, maka Range = 197-148 = 49,
sedangkan jumlah kelas tetap 8, sehingga p = 49/8 = 6,125 dan tetap dibulatkan menjadi 6.
dengan demikian, maka kelas no.8 akan mempunyai interval nilai = 190-197. Bahkan, jika
nilai tertinggi = 200, maka Range = 200-148 = 52/8, maka p = 6,5 yang secara matematik
harus dibulatkan menjadi 6. Dengan demikian maka kelas interval no.8 akan menjadi =
190-200. Lain halnya jika nilai tertinggi = 201, maka p akan dibulatkan menjadi 7.

Lebih panjangnya interval nilai kelas terakhir, yaitu kelas no.8 adalah akibat dari
pembulatan ke atas terhadap hasil perhitungan jumlah kelas dengan rumus Sturges, karena
jumlah kelas tidak mungkin pecahan. Jika tabel distribusi frekuensi dibuat dengan fungsi
”Histogram” pada ”Data Analysis” yang ada di Microsoft Excel, maka dengan data tinggi
badan di atas, Excel akan membuat kelas interval no.8 sebagai More (dengan nilai bin
menggunakan batas atas tiap kelas dari kelas no.1 s/d no.7), dan tabel distribusi frekuensi
oleh MS Excel akan menjadi sbb:

Kelas Interval Bin Frequency


1 148-153 153 1
2 154-159 159 12
3 160-165 165 31
4 166-171 171 24
5 172-177 177 18
6 178-183 183 11
7 184-189 189 2
8 190-196 More 1

Namun, dari data tinggi badan 100 mahasiswa di atas, jika seandainya nilai terendah = 148
dan nilai tertinggi = 192, maka Range = 192-148 = 44/8 = 5,5 yang secara matematik harus
dibulatkan menjadi 6, sehingga p = 6 juga. Dengan demikian, kelas no.8 riilnya menjadi
190-192, karena nilai terntinggi = 192. Jadi tabel distribusi menjadi tidak imbang. Menurut
hasil perhitungan, jika p = 6, nilai tertinggi (batas atas) tabel distribusi frekuensi = 195,
padahal riilnya nilai tertinggi data = 192. Dengan demikian ada selisih antara hasil
hitungan dan data riil = 195-192 = 3. Jika mau diseimbangkan tabel distribusi
frekuensinya, maka batas bawahnya harus diturunkan 3/2 = 1,5 yang dibulatkan menjadi =
2. Jadi batas bawah tabel distribusi frekuensi menjadi 148-2 = 146, sehingga kelas
intervalnya menjadi sbb:
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 7

Kelas Interval Bin (Excel) Frekuensi


1 146-151 151 1
2 152-157 157 9
3 158-163 163 23
4 164-169 169 23
5 170-175 175 29
6 176-181 181 10
7 192-187 187 3
8 188-193 More 2

Tugas 1: (dikumpulkan minggu depan sebelum kuliah dimulai jam 7.30, tulis tangan)
Buatlah tabel distribusi frekuensi dari data berat badan 100 mahasiswa, dengan data
berat badannya sbb:

Berat badan mhs (kg):


48.7 55.3 42.3 64.5 40.5 65 44.2 59.4 52.6 53.9
45.9 71.6 37.6 78.5 65.3 50 76 55.9 52.8 66.7
56 91.9 58.3 44.8 86.3 82.3 52.9 62.6 43 47.9
71.8 46 76.3 60 40.6 49.9 68.9 55.8 59.8 49.5
91.5 55 85 80.8 65.3 54.3 52.5 42.8 57.3 53.5
109 73 59.9 77.8 75.5 72 50 66.4 58.4 65.4
93 82.5 42.3 49.8 49.3 80 54.7 47.8 78.3 56.8
59 48.9 41.2 49 42.8 57.8 45.4 62.3 48.5 62.5
46.7 40.6 52.8 63.3 69.5 64 46.8 64.6 64.7 65
42.8 62.9 76.9 61 74 57 57 67.9 59.6 72
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 8

Frekuensi pada tabel distribusi frekuensi dapat diubah-ubah menjadi frekuensi


relatif (kalau dinyatakan dengan persen terhadap total frekuensi), dapat pula dinyatakan
dalam frekuensi kumulatif, kalau frekuensinya dikumulatifkan, apakah dari nilai atau kelas
interval yang terkecil ke terbesar atau sebaliknya; atau dapat juga dengan frekuensi
kumulatif relatif. Perhatikan contoh berikut, dengan menggunakan distribusi frekuensi
pada Tabel 4. Perhatikan Tabel 5 bahwa nilai frekuensi mutlak dan relatifnya sama karena
kebetulan jumlah sampel adalah 100, jika tidak maka frekuensi relatif dihitung dengan
membagi frekuensi dengan total kemudian dikalikan 100 (%).

Tabel 5. Distribusi frekuensi dan frekuensi relatif kisaran tinggi badan 100 mhs smt I

No kelas Kelas interval tinggi badan Frekuensi Frekuensi


relatif (%)
1 148-153 1 1,0
2 154-159 12 12,0
3 160-165 31 31,0
4 166-171 24 24,0
5 172-177 18 18,0
6 178-183 11 11,0
7 184-189 2 2,0
8 190-196 1 1,0
Jumlah mahasiswa 100 100,0

Untuk membuat tabel frekuensi kumulatif (juga kumulatif relatif), maka kelas
interval diganti dengan kurang dari atau lebih besar dari atau lebih besar sama dengan,
tergantung tujuan pembuatan tabel frekuensi kumulatif tersebut. Perhatikan Tabel 6 untuk
kriteria nilai kurang dari, beserta kumulatif relatifnya.

Tabel 6. Jumlah dan persentase mehasiswa yang memiliki kisaran tinggi badan sbb:

Tinggi badan mahasiswa Frekuensi Frekuensi


kumulatif relatif (%)
Kurang dari 154 1 1,0
Kurang dari 160 13 13,0
Kurang dari 166 44 44,0
Kurang dari 172 68 68,0
Kurang dari 178 86 86,0
Kurang dari 184 97 97,0
Kurang dari 190 99 99,0
Kurang dari 197 100 100,0
Jumlah mahasiswa 100
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 9

4.4. Grafik
Penyajian data dapat pula, dan lebih, dilakukan dengan grafik. Grafik yang baik
dapat dengan mudah dan cepat untuk mendeskripsikan data, serta dengan mudah untuk
diinterpretasi oleh pembaca.

Grafik dapat dibuat dengan berbagai bentuk antara lain ada yang berbentuk garis,
batang (column atau bar), lingkaran (pie), piktogram, diagram scatter (X-Y scatter), area,
cone, dll. Untuk tabel kontingensi, dapat pula dibuat grafik 3-dimensi (3-D). Untuk tabel
yang terdiri atas beberapa kolom dengan skala nilai yang jauh berbeda, maka dapat pula
dibuat grafik apakah kolom, garis atau campuran antara kolom dan batang, tetapi dengan
dua jenis skala aksis (sumbu Y) di kiri dan di kanan dengan pembagian skala yang berbeda
secara proporsional. Dari beberapa tabel berikut akan diberikan beberapa contoh grafik.

Tabel 7. Komposisi jenis kelamin siswa sebuah SDN dari kelas I s/d VI pada th 2008

Kelas Laki-laki Perempuan


I 15 27
II 20 22
III 24 15
IV 26 13
V 28 10
VI 30 10

Tabel 8. Nilai mata pelajaran UAN siswa SDN dari ranking 1 s/d 5 th 2007

No Nama siswa Bhs Indo Matematika IPA Total


1 Iis Suryani 9.5 9.8 9.9 29.2
2 Ika Wulandari 9.3 9.8 9.5 28.6
3 Irma Setiawati 8.9 9.4 9.6 27.9
4 Iwan Suryawan 9.6 8.3 9.5 27.4
5 Ali Mohammad 7.5 9.8 9.2 26.5

Dari Tabel 7 dapat dibuat grafik batang dua komponen, apakah berjejer ke samping
(Gambar 3) atau bersusun (Gambar 4) tergantung tujuan, ataukah dibuat grafik 3-D (tiga
dimensi) seperti pada Gambar 5. Dengan dibuat dua komponen bersusun, maka selain
jumlah masing-masing komponen data, juga sekaligus dapat dilihat total keseluruhan
komponen data.

Dari Tabel 8, tergantung tujuan, dapat dibuat grafik dengan dua jenis skala aksis,
karena nilai data jauh berbeda, di mana tiap pelajaran nilainya maksimal 10 sedangkan
nilai total, karena ada 3 pelajaran, maka nilainya maksimal 30. Jika hanya dibuat satu aksis
nilai, maka grafik akan menjadi timpang. Selain itu, dengan dua aksis nilai yang
ditempatkan di kiri dan di kanan grafik, kita juga dapat melihat posisi nilai tiap pelajaran
untuk tiap siswa terhadap nilai totalnya, sehingga dapat dilihat pelajaran mana yang dia
lemah dan mana yang dia termasuk kuat (Gambar 6).
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 10

35
Pria Wanita
30

Jumlah siswa 25

20

15

10

0
I II III IV V VI
Kelas

Gambar 3. Grafik 2 komponen berjejer

Pria Wanita
45
40
35
Jumlah siswa

30
25
20
15
10
5
0
I II III IV V VI
Kelas

Gambar 4. Grafik dua komponen bersusun

30

25
Jumlah siswa

20

15
Pria
10
Wanita
5

0
I
II
III
IV
V
Kelas VI

Gambar 5. Grafik dua komponen 3-dimensi


Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 11

10 30

9 27
Nilai tiap mata pelajaran

Total nilai 3 pelajaran


B Indo
8 24
Mat
IPA
7 21
Total

6 18

5 15
1 2 3 4 5
Ranking siswa

Gambar 6. Grafik garis dan batang dengan dua jenis skala nilai

5. Ukuran Tendensi Sentral (Gejala pusat)

Selain dengan tabel dan grafik, data juga dideskripsikan dengan teknik statistik
yang menunjukkan gejala pemusatan data, yang meliputi tiga jenis ukuran pemusatan data,
yaitu: Modus (Mo), Median (Md) dan Mean (Me), yang masing-masing menggunakan
dasar yang berbeda dalam menyatakan gejala pemusatan data.

Modus (Mode) merupakan teknik penjelasan kelompok yang didasarkan atas nilai
yang sedang populer (yang sedang menjadi mode), atau yang paling sering muncul dalam
kelompok tersebut. Contoh dari data kualitatif: pada umumnya mobil tahun 70-an
warnanya cerah sedangkan mobil tahun 80-an warnanya gelap. Contoh dengan data
kuantitatif, misalnya umur siswa kelas VI SD, datanya sbb: 12 th (7 orang), 13 th (23
orang), 14 th (10 orang), 15 th (4 orang), 16 th (1 orang), maka Modus umur siswa kelas
VI SD tersebut adalah 13 th. Contoh lain, umur pegawai sebuah PT sbb: 20 th (4 orang),
21 th (2 orang), 22 th (0 orang), 23 th (0 orang), 24 th (10 orang), 25 th (1 orang), 26 th (2
orang), 27 th (3 orang), 28 th (4 orang), 29 th (1 orang), 30 th (10 orang) dan 31 th (1
orang), maka Modus umur pegawai PT tersebut adalah 24 th dan 30 th. Dalam kasus
seperti ini, di mana ada dua modus yang posisinya berjauhan dengan nilai yang sama,
maka dikatakan bahwa distribusi frekuensinya bersifat Bimodal (dua modus). Namun, bila
modusnya berada pada nilai yang berurutan, maka Modus dihitung dari nilai tengah atau
rata-rata dari dua nilai tersebut; jadi tidak dikatakan bimodal.

Median merupakan salah satu teknik pendeskrpsian data atau kelompok yang
didasarkan atas nilai tengah dari data kelompok setelah nilai tiap anggota kelompok diurut
dari kecil ke besar atau dari besar ke kecil. Bila jumlah frekuensi merupakan bilangan
ganjil maka nilai yang berada paling tengah adalah Median kelompok tersebut. Sebagai
contoh, nilai Statistik dari 7 orang mahasiswa yang mengulang, setelah diurut sbb: 5,6; 5,6;
5,8; 6,3; 6,5; 7,0; 7,0 maka Median nilai mahasiswa tersebut adalah 6,3 (posisi paling
tengah). Dari data umur siswa kelas VI SD tersebut di atas, juga dapat dilihat bahwa nilai
Median umur siswa tersebut adalah 13 th, yang juga sama dengan Modus-nya. Namun,
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 12

jika jumlah unit data kelompok adalah genap, seperti contoh berikut mengenai tinggi badan
pegawai sebuah jurusan, setelah diurut sbb: 149, 153, 155, 159, 166, 172 cm, maka tidak
ada unit data yang merupakan median. Dalam kasus ini, maka median adalah nilai rata-rata
dari dua unit data yang paling tengah, yaitu (155+159)/2 = 157.

Dari uraian di atas, maka dapat disimpulkan selain nilai median, yang pertama-
tama harus kita ketahui adalah median location, yaitu lokasi nilai median di dalam data
setelah data tersebut diurut menurut besar nilainya. Rumus untuk mementukan lokasi
median sbb:
Lokasi Median = (N+1)/2 di mana N adalah banyaknya unit data

Mean (Me) merupakan teknik penjelasan kelompok yang didasarkan atas nilai rata-
rata dari data kelompok tersebut. Nilai rata-rata (mean) ini didapat dengan menjumlahkan
nilai atau data seluruh individu (anggota kelompok) kemudian dibagi dengan jumlah
individu yang ada pada kelompok tersebut. Jadi rumusnya adalah sbb:

Me = (∑Xi)/n di mana Xi = data tiap individu; n = jumlah individu

Dari data tinggi badan pegawai jurusan yaitu 149, 153, 155, 159, 166, 172 cm akan didapat
bahwa total data tinggi badan = 954, karena jumlah individu = 6 orang, maka nilai mean
adalah 938/6 = 159. Jadi Median = 157 sedangkan Mean = 159, sehingga tidak mesti
Median itu sama dengan Mean, walaupun terkadang sama, tergantung sebaran data. Kalau
sebaran/distribusi frekuensinya benar-benar normal maka biasanya Median = Mean.

6. Menghitung Mo, Md & Me dari Distribusi Frekuensi

Penentuan nilai modus, median dan mean dari tabel distribusi frekuensi sedikit
berbeda dari cara penentuan jika data belum diubah menjadi tabel distribusi frekuensi.
Dalam contoh penerapan rumus-rumus penhitungannya berikut ini akan digunakan data
distribusi frekuensi pada Tabel 4 atau Tabel 5.

6.1. Penentuan Modus (Mo)

Untuk menghitung atau menentukan modus data yang telah tersusun ke dalam
distribusi frekuensi/data bergolong, dapat digunakan rumus sbb:

⎛ b1 ⎞
Mo = b + p ⎜⎜ ⎟⎟
b
⎝ 1 + b 2 ⎠

Di mana:
Mo = Modus data bergolong
b = Batas bawah kelas interval dengan frekuensi terbanyak (batas kelas modus)
p = Panjang kelas interval dengan frekuensi terbanyak
b1 = Frekuensi pada kelas modus (kelas dengan frekuensi terbanyak) dikurangi
frekuensi kelas interval terdekat sebelumnya.
b2 = Frekuensi pada kelas modus (kelas dengan frekuensi terbanyak) dikurangi
frekuensi kelas interval setelahnya atau berikutnya.
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 13

Berdasarkan data distribusi frekuensi pada Tabel 5 dengan 100 unit data, maka
dengan rumus modus tersebut, dapat kita tentukan nilai modus data, sbb:

a. Kelas modus adalah yang frekuensi terbanyak, yaitu 160-165 cm (dengan frekuensi 31)
b. b = batas bawah kelas modus dikurangi 0,5 dari jarak antar kelas = 160-0,5 = 159,5
c. b1 = 31 – 12 = 19
d. b2 = 31 – 24 = 7

Jadi dari hasil perhitungan dan informasi yang didapat dari a-d di atas, maka nilai modus
data dapat dihitung dengan rumus yang ada sbb:

Modus = 159,5 + 6 (19 / (19+7)) = 159,5 + 4,38 = 163,88

6.2. Menghitung Median (Md)

Untuk menghitung atau menentukan besarnya nilai median data yang sudah disusun
menjadi distribusi frekuensi bergolong, maka selain kolom kelas interval dan frekuensinya,
tabel distribusi frekuensi harus ditambahkan satu kolom lagi yang memuat frekuensi
kumulatif, kemudian Md dihitung dengan rumus sbb:

⎛ 0,5 n - F ⎞
Md = b + p ⎜ ⎟
⎝ f ⎠

Di mana:
Md = Nilai median data bergolong
b = batas bawah kelas di mana median akan terletak
n = banyaknya data atau jumlah sampel atau unit data
F = jumlah semua frekuensi (atau frekuensi kumulatif) sebelum kelas median
f = frekuensi kelas median

Dengan menggunakan data distribusi frekuensi pada Tabel 5 dan Tabel 6, nilai median
dapat dihitung sbb:

a. Setengah dari seluruh data ( yaitu 0,5 n) adalah 100/2 = 50


b. Frekuensi kumulatif = 50% terletak pada kelas ke-4 yaitu kelas tinggi 166-171 cm,
dengan frekuensi kumulatif = 68, sedangkan yang sebelumnya <50; dengan demikian,
kelas ke-4 merupakan lokasi median.
c. Nilai b = 166-0,5 = 165,5
d. Nilai F = 1+12+31 = 44
e. Nilai n dan f masing-masing 100 dan 24

Jadi dari hasil perhitungan dan informasi dari a-e di atas, dapat dihitung nilai median (Md)
dengan rumus yang ada sbb:

Median = 165,5 + 6{(50-44)/24} = 167,0


Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 14

Catatan penting dalam membuat interval kelas:


1. Bila data adalah bilangan bulat, maka interval kelas juga harus bilangan bulat,
seperti halnya data tinggi badan mahasiswa pada Tabel 5.
2. Bila data merupakan angka desimal, maka tergantung berapa angka di belakang
tanda desimal. Bila data 1 desimal maka batas kelas juga 1 desimal, seperti halnya
data berat badan. Dengan demikian, tidak akan ada data yang tidak bisa masuk ke
suatu kelas.
3. Panjang kelas boleh bulat, terutama kalau data berupa bilangan bulat, atau 1
desimal, tetapi jika setelah disusun menjadi sejumlah kelas sesuai dengan rumus
namun batas atas kelas menjadi lebih tinggi dari data tertinggi (kalau panjang kelas
dibulatkan ke atas) atau lebih rendah dari nilai data tertinggi, sehingga data
tertinggi tidak bisa masuk ke kelas terakhir (karena panjang kelas dibulatkan ke
bawah), maka batas bawah kelas terbawah dan batas atas kelas teratas harus
disesuaikan ke bawah (untuk batas paling bawah) dan ke atas (untuk batas paling
atas) secara proporsional, sedangkan panjang kelas tidak diubah.
4. Dalam membuat kelas-kelas interval, maka jarak antar batas bawah kelas atau antar
batas atas kelas harus sama dengan panjang kelas, bukan jarak antara batas bawah
dan batas atas suatu kelas. Sebagai contoh, jika panjang kelas = 9, batas bawah
kelas terbawah misalnya 20, maka batas bawah kelas berikutnya = 20+9 = 29,
kemudian kelas interval paling bawah adalah 20-28, 29-37, 38-46, dst, sehingga
jarak antar batas bawah atau antar batas atas = 9. Demikian pula jika panjang kelas
merupakan angka desimal karena data berupa angka desimal.
5. Prosedur ini harus diikuti sebagai suatu prosedur standar.

6.3. Menghitung Mean (Me)

Tidak seperti menghitung nilai rata-rata (mean) data yang jumlah unitnya sedikit
dan belum dijadikan distribusi frekuensi (jadi data yang masih asli), untuk menghitung
atau menentukan besarnya nilai Mean pada data yang sudah disusun menjadi distribusi
frekuensi bergolong, maka selain kolom kelas interval dan frekuensinya, tabel distribusi
frekuensi harus ditambahkan satu kolom lagi yang memuat nilai tengah kelas, kemudian
Me dihitung dengan rumus sbb:

∑ (f .X )
i i

∑f
Me =
i
Di mana:
Me = Mean untuk data bergolong
fi = frekuensi masing-masing kelas interval
Xi = nilai tengah kelas interval, yaitu = 0,5 (batas bawah + batas atas)
∑fi =n
fi.Xi = nilai tengah kelas dikali frekuensinya masing-masing

Sebagai contoh, untuk menghitung Me dari distribusi frekuensi pada Tabel 4, maka tabel
tersebut harus diubah dulu menjadi seperti Tabel 9, sbb:
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 15

Tabel 9. Distribusi frekuensi tinggi badan 100 mhs, untuk menghitung nilai rata-rata (Me)

No kelas Kelas interval tinggi Frekuensi Nilai fi.Xi


badan (fi) tengah
1 148-153 1 150,5 150,5
2 154-159 12 156,5 1878
3 160-165 31 162,5 5037,5
4 166-171 24 168,5 4044
5 172-177 18 174,5 3141
6 178-183 11 180,5 1985,5
7 184-189 2 186,5 373
8 190-196 1 193,0 193
Jumlah 100 16802,5

Jadi dari Tabel 9 dapat dihitung nilai Mean = 16802,5 / 100 = 168,025

Tugas 2:
Dari data berat badan 100 mahasiswa setelah dibuat tabel distribusi frekuensi dengan 8
kelas interval, maka lengkapi tabel distribusi frekuensi dengan distribusi frekuensi
kumulatif dan nilai tengah kelas; kemudian tentukan nilai Modus, Median dan Mean.
Dikumpulkan pada kuliah tgl 1 April 2010

7. Ukuran variasi kelompok


Untuk mendeskripsikan suatu kelompok berdasarkan data yang diperoleh dari
anggota kelompok, maka selain dengan tabel, grafik dan ukuran tendensi sentral data dari
kelompok tersebut, maka dapat juga ditambahkan dengan ukuran sebaran atau variasi
kelompok. Ukuran sebaran atau variabilitas data kelompok dapat dinyatakan dengan
berbagai nilai statistik, antara lain: rentang data, varians, standar deviasi (simpangan baku),
dan koefisien variasi (coefficient of variation = cv).

7.1. Rentang data (range)


Merupakan ukuran variabilitas data yang paling sederhana dan paling mudah
ditentukan, yang dapat dihitung dengan rumus sbb:

Rentang = nilai max – nilai min

Jika perhitungan dilakukan dengan MS Excel, maka tinggal kita menggunakan


rumus fungsi MAX dan MIN; kemudian rentang = MAX-MIN, yaitu nilai tertinggi
dikurangi nilai terendah dalam data kelompok tersebut
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 16

Dari data tinggi badan 100 orang mahasiswa pada bagian 4.3 dapat ditentukan nilai Range
yang besarnya = 48, karena data tinggi badan tertinggi = 196 dan terendah = 148, sehingga
Range = 196-148 = 48.

Besar kecilnya nilai rentang ini menunjukkan tingkat variasi kelompok. Semakin besar
nilai rentang maka berarti variasi kelompok makin besar, dengan kata lain perbedaan antar
individu di dalam kelompok tersebut semakin besar.

7.2. Varians dan Standar Deviasi

Salah satu teknik statistik yang digunakan untuk menjelaskan homogenitas suatu
kelompok adalah nilai varians. Varians merupakan jumlah kuadrat semua deviasi nilai-
nilai individu terhadap nilai rata-rata kelompok. Akar varians disebut standar deviasi atau
simpangan baku.

Simbol untuk varians populasi = σ2 dan simpangan bakunya = σ, sedangkan untuk


sampel = s2 dan simpangan bakunya = s. Berikut ini diberikan contoh perhitungan varians.

Anggaplah ada 10 mahasiswa dengan nilai Quiznya sbb: 60, 70, 65, 80, 70, 50, 85,
90, 75, 95. Untuk menentukan besarnya varians maka dapat dibuat tabel bantu seperti pada
Tabel 10.

Tabel 10. Tabel bantu untuk menghitung varians dan simpangan baku (standar deviasi)
suatu kelompok

No ujian Nilai individu (X) Simpangan dari rata-rata


(X- ) (X- )2
1 60 -14 196
2 70 -4 16
3 65 -9 81
4 80 6 36
5 70 -4 16
6 50 -24 576
7 85 11 121
8 90 16 256
9 75 1 1
10 95 21 441
TOTAL 740 0 1740
Rata-rata 74 -

Catatan: Jumlah simpangan harus = 0

Dari Tabel 10 didapat bahwa : Nilai rata-rata = 74


Varians = 1740/9 = 193,3333
Simpangan baku = √193,3333 = 13,9044
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 17

Berdasarkan contoh untuk menghitung Varians dan Simpangan baku, maka rumus-rumus
yang dapat digunakan adalah sbb:

1. Untuk populasi
2
⎛ _

2
∑ ⎜

X i − X ⎟

a. Varians σ =
n

2
⎛ _

∑ ⎝ i ⎟⎠
⎜ X − X
b. Standar deviasi σ =
n

2. Untuk sampel
(∑ X ) 2
2
⎛ _

∑ ⎜ Xi − X ⎟
⎝ ⎠ ∑X 2

n n.∑ X 2 − ( ∑ X ) 2
a. Varians s2 = = =
n -1 n −1 n( n − 1)

2
⎛ _

∑ ⎝ i ⎟⎠
⎜ X − X
b. Standar deviasi s = s2 =
n -1

Di mana :
σ2 = Varians populasi
σ = Standar deviasi populasi
s2 = Varians sampel
s = Standar deviasi sampel
n = Jumlah sampel atau anggota populasi

Jika kita membandingkan dua kelompok, dapat terjadi bahwa standar deviasinya sama
tetapi rata-ratanya berbeda, atau rata-ratanya sama tetapi standar deviasinya berbeda,
antara dua kelompok tersebut. Dalam hal ini, kita perlu menghitung koefisien variasinya
(Coefficient of Variation = CV), yang dihitung dengan rumus sbb:

s
CV = _
x 100%
X

Sebagai contoh:
Data kelompok 1 = 4, 6, 8, 10, 12, 14, 16 (n = 7)
Data kelompok 2 = 104, 106, 108, 110, 112, 114, 116 (n = 7)
Maka: Rata-rata kelompok 1 = 10, standar deviasinya = 4,32
Rata-rata kelompok 2 = 110, standar deviasinya = 4,32
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 18

Jadi dalam hal ini kelompok 1 dan kelompok 1 mempunyai standar deviasi yang sama,
tetapi nilai rata-rata kelompok berbeda.
Demikian pula CV-nya, sbb:
CV kelompok 1 = 4,32/10 x 100% = 43,2%
CV kelompok 2 = 4,32/110 x 100% = 3,93%
Ini juga berarti bahwa kelompok 1 lebih bervariasi daripada kelompok 2.

7.3. Standar Error (SE)

Sering juga disebut sebagai standard error of mean. Nilai statistik ini digunakan
untuk menyatakan kisaran nilai mean suatu kelompok sampel. Dalam mempresentasikan
nilai mean beberapa perlakuan dalam bentuk grafik dan/atau membandingkan nilai mean
tersebut antar perlakuan secara statistik, umum juga digunakan nilai standard error.
Kisaran nilai mean biasanya ditampilkan sebagai berikut:
Rata-rata = MEAN ± SE
Nilai SE dapat dihitung dengan rumus sbb:

var
SE =
n
Di mana :
SE = standard error
var = varians
n = anggota kelompok atau ulangan sampel

Sebagai contoh:
Dari data hasil pengamatan 4 perlakuan pemupukan tanaman padi dengan 5 ulangan yang
disajikan pada Tabel 11 dapat ditentukan nilai rata-rata perlakuan dan SE-nya sbb.

Tabel 11. Contoh data tinggi tanaman padi sebagai respon terhadap beberapa jenis pupuk

Tinggi tanaman padi (cm) pada berbagai perlakuan jenis pupuk


Rep
NPK Pupuk kandang Kompos Kompos Bokashi Pupuk daun
1 100 122 95 135 82
2 125 130 109 140 78
3 115 127 97 142 75
4 110 126 94 155 69
5 108 128 98 143 72
Rerata 111.6 126.6 98.6 143 75.2
SE 4.13 1.33 2.69 3.30 2.27
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 19

Bila ditampilkan dalam bentuk grafik batang nilai rata-rata perlakuan pada Tabel 11 dan
kita sekali gus ingin membandingkan nilai rata-rata tersebut antar perlakuan, maka akan
sangat lebih mudah membandingkan jika nilai rata-rata tersebut ditampilkan bersama nilai
SE-nya, seperti Gambar 7.

150
Tinggi tanaman (cm)

140
130
120
110
100
90
80
70
NPK P-Kandang Kompos K-Bokashi P-Daun
Perlakuan jenis pupuk

Gambar 7. Rata-rata tinggi tanaman (± SE) antar perlakuan jenis pupuk

7.4. Menghitung standar deviasi data bergolong

Nilai standar deviasi atau simpangan baku dari data yang telah disusun menjadi
tabel distribusi frekuensi bergolong, dapat dihitung dengan rumus sbb:

S =
∑ f .( X
i i − X )2
( n − 1)
Di mana:
fi = frekuensi masing-masing kelas
Xi = nilai tengah kelas
n = jumlah sampel
= nilai mean (rata-rata)

Tugas III:
Tentukanlah besarnya standar deviasi dari data berat badan 100 mahasiswa pada Tugas I.
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 20

7.5. Menyususun kelas interval menggunakan Standar Deviasi

Pada tugas III mahasiswa ditugaskan untuk menghitung standar deviasi kelompok
yang telah disusun menjadi tabel distribusi frekuensi data bergolong dengan beberapa kelas
interval. Jadi dalam hal ini standar deviasi dihitung dari kelas interval dengan frekuensinya
masing-masing.

Dalam menyusun kelas interval, selain dengan mengunakan rumus Sturges yaitu K
= 1+3,3 log n, kelas interval sering juga, karena alasan penggunaannya, dibuat berdasarnya
nilai Mean (rata-rata) dan SD (standar deviasi), misalnya menggunakan batas kelas sbb:
1. Mean – 1,5 SD
2. Mean – 0,5 SD
3. Mean + 0,5 SD
4. Mean + 1,5 SD
Dengan demikian panjang kelas (p) adalah 1 SD dan dari ketentuan kelas interval ini akan
didapat 5 kelas. Dalam penentuan interval kelas, apakah menggunakan rumus Sturges atau
berdasarkan nilai standar deviasi, yang harus selalu dijadikan pedoman dalam menentukan
batas interval adalah format atau jumlah desimal unit data. Kalau data berupa bilangan
bulat, maka batas interval juga bilangan bulat, sedangkan kalau data merupakan angka
desimal, maka batas interval juga angka desimal tetapi tergantung berapa desimal datanya
(kalau data 1 desimal, batas interval juga 1 desimal; kalau data 2 desimal, batas interval
juga 2 desimal); demikian pula nilai SD, kalau digunakan sebagai dasar untuk menentukan
kelas interval. Dengan demikian TIDAK akan ada unit data yang tidak masuk ke dalam
suatu kelas atau hanya masuk ke dalam gap antar kelas.

Contoh, dari nilai ujian 40 mahasiswa berikut, buatlah 5 kelas interval dengan distribusi
frekuensinya menggunakan panjang kelas = 1 SD seperti ketentuan di atas; dengan nilai
ujian sbb:
30,60,70,20,65,70,80,80,70,70,70,65,85,70,90,70,75,75,90,25,60,65,70,70,70,65,80,70,70,
70,70,40,85,85,90,80,75,70,95,65

7.6. Membandingkan varians dua kelompok dengan uji F

Varians antara dua kelompok dapat dibandingkan dengan menggunakan uji F untuk
menentukan apakah varians secara statistik berbeda nyata atau tidak. Untuk menentukan
besarnya nilai F (yang biasa disebut sebagai F hitung), maka varians kedua kelompok
harus dihitung dulu, kemudian nilai F dapat dihitung dengan membagi varians yang lebih
besar dengan varians yang lebih kecil, dengan demikian akan diperoleh nilai F yang lebih
besar dari 1 (karena nilai F tabel juga lebih besar dari 1), sehingga rumusnya sbb:

Var yang lebih besar


F-hitung = sehingga F>=1
Var yang lebih kecil

Dalam menghitung Varians suatu kelompok, pembagi dari jumlah kuadrat simpangan
adalah (n-1). Dalam Statistik, nilai (n-1) ini disebut sebagai derajat bebas.

Dalam uji F, nilai derajat bebas (db) atau degree of freedom (df) digunakan untuk mencari
besarnya nilai F_tabel pada taraf nyata 5% (juga ditulis F0,05). Nilai F0,05 ini kemudian
Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 21

digunakan sebagai pembanding untuk menyatakan apakah varians kedua kelompok


berbeda nyata atau tidak, dengan ketentuan sbb:
• Tidak berbeda nyata (ns), jika F ≤ F0,05
• Berbeda nyata (*), jika F > F0,05
• Berbeda sangat nyata (**), jika F > F0,01

Besarnya nilai F_tabel, apakah 5% atau 1%, diperoleh dari Tabel Distribusi F, berdasarkan
nilai derajat bebas pembilang (var yang lebih besar) dan derajat bebas penyebut (var yang
lebih kecil).

Contoh: bila ada dua kelompok, yaitu kelompok A dengan jumlah anggota 10 dan varians
= 5,5, dan kelompok B dengan anggota 8 dan varians 7,0 maka uji F dapat dilakukan dan
disimpulkan sbb:

Dari data kelompok tersebut didapat:


Var A = 5,5; db A = 10-1 = 9
Var B = 7,0; db B = 8 – 1 = 7
Maka akan diperoleh nilai F sbb:
F = 7,0 / 5,5 = 1,27

Nilai pembanding untuk F hitung ini adalah F (0,05; 7,9 db) = 3,29

Karena F_hit < F_tab, yaitu 1,27 < 3,29 maka dikatakan varians kedua kelompok tidak
berbeda nyata atau varians kedua kelompok adalah homogen.

Berikut dilampirkan tabel Distribusi F.


Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 22

Lampiran 1. Sebaran nilai F


Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 23

Lampiran 1. Sebaran nilai F (lanjutan 1)


Kuliah STATISTIKA, Ir. Wayan Wangiyana, MSc(Hons), Ph.D. 24

Lampiran 1. Sebaran nilai F (lanjutan 2)

Anda mungkin juga menyukai