Apa yang Anda bayangkan ketika membaca judul berita di atas? Dengan
cepat fikiran kita pasti tertuju pada sekelompok orang dengan penghasilan
sangat tinggi sehingga berkewajiban membayar pajak yang besar pula. Nah
sekelompok orang dengan penghasilan sangat tinggi ini tentu memiliki
pendapatan yang jumlahnya bisa ratusan kali atau bahkan ribuan kali dari
orang kebanyakan. Jika kita ingin menghitung agregat jumlah pajak yang
dibayar oleh rakyat Indonesia, secara otomatis pembayar-pembayar pajak
yang sangat besar akan mengangkat naik nilai rupiah rata-rata pajak yang
Ukuran Variasi Data 43
dibayarkan. Apabila jumlah pajak yang mereka bayarkan dipisahkan dengan
jumlah pajak yang dibayarkan oleh masyarakat dengan pendapatan biasa,
maka secara otomatis pula nilai rupiah rata-rata pajak yang dibayarkan akan
turun kembali.
Dari ilustrasi di atas, kita dapat menyimpulkan bahwa data-data yang besar
akan menaikkan nilai rata-rata. Sebaliknya, nilai-nilai yang rendah akan
menurunkan nilai rata-rata.
Pada sebuah data, kita tentu saja dapat melihat data yang bernilai paling
kecil dan data yang bernilai paling besar. Misalnya gaji pegawai kantor pajak
golongan terendah adalah Rp5.700.000,00 dan tertinggi adalah
Rp30,000.000,00. Diantara kedua nilai tersebut tentu terdapat nilai-nilai lain
yang lebih besar dari nilai terkecil dan lebih rendah dari nilai tertinggi.
Dalam statistik, selisih nilai tertinggi dengan nilai terendah disebut sebagai
range. Hal ini berlaku baik pada data berkelompok maupun data tidak
berkelompok.
30 60 80 90 95 110
USIA JUMLAH
20-24 12
25-29 22
30-34 28
35-39 11
Pada data berkelompok, nilai terendah adalah batas bawah kelas terendah
dan nilai tertinggi adalah batas atas nilai tertinggi. Range sebagai ukuran
variasi data memiliki beberapa kelemahan, yaitu sebagai berikut.
Range interkuartil adalah cara lain yang dapat digunakan untuk mengatasi
ketidakefektifan range sebagai ukuran variasi data. Untuk mendapatkan nilai
range interkuartil, terlebih dahulu kita harus membagi data 4 bagian.
25% 25%
Nilai Nilai
Terendah Q1 Q2 Q3 Tertinggi
𝑄3−𝑄1
Deviasi kuartil =
2
simetris atau tidak. Deviasi kuartil bisa dilihat juga dari sini. Jika deviasi
kuartil = median maka data bersifat simetris, artinya (Q3-Q2) = (Q2-Q1).
Apabila nilainya berbeda, maka data menjadi tidak simetris.
Deviasi kuartil mengukur range rata-rata sebesar 25% data dari sekelompok
data.
Contoh: Tentukanlah nilai range, range interkuartil dan deviasi kuartil dari
data berikut!
5−9 20 20
10 − 14 27 47
15 − 19 34 81
20 − 24 24 105
25 − 29 19 124
ⅈ(n⁄4) − cf
Q1 = L + xh
f
Untuk menentukan kelas yang memuat nilai Q1 maka banyak data harus
dibagi 4, atau n/4. Maka didapat 124/4 = 31. Nilai tersebut berada pada
interval ( 10 – 14 ). Batas bawah atau L nya adalah 10.
1(124/4) − 20
Q1 = 10 + 𝑥5
27
Q1 = 12,03
Untuk menentukan kelas yang memuat nilai Q3, maka banyak data harus
dikalikan 3 dan kemudian dibagi 4, atau 3(n/4). Maka didapat 3 (124/4 =
93. Nilai tersebut berada pada interval ( 20 – 24 ). Batas bawahnya adalah
20. Maka nilai Q3 adalah sebagai berikut.
3(124⁄4) − 81
Q3 = 20 + 𝑥5
24
Q3 = 22,5
Range interkuartil = Q3 - Q1
𝑄3−𝑄1
Deviasi kuartil =
2
22,5−10,47
Deviasi kuartil =
2
Lama Keterlambatan
NO Frekuensi
Pelaporan Pajak
1 1−5 50
2 6 − 10 59
3 11 −15 70
4 16 − 20 89
5 21 − 25 75
6 26 − 30 60
2. Data besarnya jumlah kelebihan bayar (dalam Jutaan) pada wajib pajak
Badan di KCP Cempaka Putih
1 10 − 14 10
2 15 − 19 14
3 20 − 24 22
4 25 − 29 30
5 30 − 34 21
6 35 − 39 11
Pada sub bab di atas, kita sudah dapat menarik kesimpulan bahwa range
dan range interkuartil secara terbatas hanya bisa melihat lebar distribusi,
yang ditandai dengan jarak dari data terkecil ke data terbesar, serta
pengukuran atas 50 persen data. Akan tetapi, sebagai ukuran persebaran
data, mereka tidak bisa menunjukkan bagaimana persebaran data di sekitar
rata-rata. Oleh sebab itu, perlu dicari ukuran yang mengukur tingkat variasi
nilai di dalam sekelompok data yang berdeviasi dari rata-ratanya.
Deviasi bisa juga disebut simpangan. Misalnya, kelas A terdiri dari 35 orang
mahasiswa. Rata-rata nilai mata kuliah Pengantar Perpajakan di Kelas A
adalah 75. Salah seorang mahasiswa kelas A bernama Rani, mendapatkan
nilai 73 maka dapat dikatakan bahwa nilai Rani menyimpang dua poin di
bawah rata-rata. Sementara, jika ada mahasiswa lain yang bernama Fitri
bernilai 78, maka dapat dikatakan bahwa nilainya menyimpang 3 poin di
atas rata-rata. Jumlah simpangan dari nilai Rani, Fitri dan 33 orang teman-
temannya yang lain terhadap nilai rata-rata, apabila dibagi dengan banyak
mahasiswa yang ada di kelas A, yaitu 35 orang, kita sebut sebagai deviasi
rata-rata.
5 9 11 11 14 16 18
Jika kita jumlahkan usia ketujuh perusahaan, maka kita dapatkan umur total
perusahaan adalah 84 yang apabila kita bagi 7 adalah 12. Maka cara
menentukan deviasi rata-rata dapat dilakukan sebagai berikut.
2
∑(𝑋 − 𝑥̅ )2
𝑆 =
𝑛−1
S2 = Varians
X = Nilai
𝑥̅ = Rata-rata
n = Banyak data
Ukuran Variasi Data 51
Penggunaan (n-1) sebagai pembagi jumlah selisih data dengan rata-rata
merupakan metode matematika untuk mengakuratkan hasil perhitungan
nilai standar deviasi. Pada data-data yang kurang dari 100 atau sampel kecil,
hal ini lazim digunakan, Sedangkan pada data besar (populasi) pengurangan
n dengan 1 tidak perlu dilakukan karena tidak akan terlalu mempengaruhi
perhitungan nilai standar deviasi.
Pada data berkelompok, yang menggantikan nilai X adalah nilai tengah dari
setiap interval data. Rumusnya menjadi sebagai berikut.
2
∑(𝑀 − 𝑥 ) 2
𝑆 =
𝑁
∑(𝑀𝑖 − 𝑥̅ )2
𝜎 = √
𝑁
𝜎 = standar deviasi
Untuk data berkelompok dan jumlah data kurang dari 100 rumus standar
deviasinya adalah sebagai berikut
∑ 𝑓(𝑀 − 𝑥̅ )2
𝑆=√
𝑛−1
5 -12 (7) 49
9 – 12 (-3)2 9
11 – 12 (-1)2 1
11 – 12 (-1)2 1
14 – 12 (2)2 4
16 – 12 (4)2 16
18 -12 (6)2 36
116
Varians adalah:
2
∑(𝑥 − 𝑥̅ )2
𝑆 =
𝑛−1
116
𝑆2 =
7−1
116
𝑆2 =
6
2
S = 19,3
Berdasarkan tabel di atas, maka varians dan standar deviasi dapat dicari
dengan tabel pembantu berikut ini
Tunggakan
Jumlah F(M-X)2
No Pajak M fXM
Perusahaan
(Juta) M-𝑥̅ (M-𝑥̅ )2
405
1 10 – 14 5 12
60 -9 81
112
2 15- 19 7 17
119 -4 16
9
3 20-24 9 22
198 1 1
252
4 25-29 7 27
189 6 36
242
5 30-34 2 32
64 11 121
1020
630
(𝑓 x M)
Rata-rata adalah = 630/30 = 21
𝑁
2
∑ 𝑓(𝑀 − 𝑥̅ )2
𝑆 =
n−1
∑ (1020)
𝑆2 =
30 − 1
S2 = 35,17
Manfaat utama dari standar deviasi dan varians adalah untuk dapat melihat
variasi data. Semakin besar varians dan standar deviasi mengindikasikan
data yang besar variasinya. Besarnya variasi adalah indikasi bahwa banyak
nilai yang berjarak cukup jauh dari rata-rata. Sedangkan data yang nilai
varians dan standar deviasinya kecil menunjukkan bahwa data cenderung
homogen atau jarak tiap data dengan rata-rata tidak terlalu berjauhan.
𝞼𝑘 𝞼𝑘
2
1 – 1/k
𝜇
=X
Teori Chebysev dapat diaplikasikan dalam semua jenis distribusi frekuensi.
Jika kita mempunyai bentuk distribusi yang simetri, kita dapat menjelaskan
secara rinci tentang variasi atau persebaran data terhadap rata-ratanya.
Aturan empiriknya adalah sebagai berikut.
1. Sekitar 68% observasi akan terletak di dalam plus minus satu standar
deviasi dari rata-rata (𝜇 ± 1𝜎)
2. Sekitar 95% observasi akan terletak di dalam plus minus dua standar
deviasi dari rata-rata (𝜇 ± 2𝜎)
3. Sekitar 99.7% akan terletak di dalam plus minus tiga standar deviasi
dari rata-rata (𝜇 ± 3𝜎)
4. Apa informasi yang bisa kita dapatkan jika kita mencari nilai range
interkuartil. Jelaskan!
5− 9 5
10 − 14 7
15 − 19 9
20 − 24 8
25 − 29 4
1. Tentukanlah range dan range interkuartil dari data pada tabel di atas!
1 10 − 14 10
2 15 − 19 12
3 20 − 24 13
4 25 − 29 9
5 30 − 34 5