BAB VI
VARIAN DAN DEVIASI STANDAR
6.1. VARIAN
Varian adalah nilai tengah kuadrat simpangan dari nilai tengah atau simpangan rata-
rata kuadrat. Ada sedikit perbedaan pada persamaan untuk menghitung varian dari populasi
dan varian dari sampel. Varian populasi dilambangkan s2 untuk sampel dan σ2 untuk
populasi. Perbedaan utama varian sampel dibandingkan varian populasi selain simbol yang
digunakan, juga jumlah data yang digunakan yaitu n-1 (untuk sampel, n ≤ 30) untuk varian
sampel dan N untuk varian populasi (untuk n > 30). Secara logika maka N > n, atau jumlah
sampel selalu lebih kecil dari jumlah populasi karena populasi adalah elemen keseluruhan
dari objek yang diteliti, sedang sampel merupakan bagian dari populasi.
∑(𝑋 − 𝑋̅)2
𝜎2 =
𝑁
∑(𝑋 − 𝑋̅)2
𝑠2 =
𝑛−1
Dimana :
s2 = varian dari sampel
X = skor data
𝑋̅ = rata-rata hitung
N = jumlah dari populasi
n = jumlah dari sampel
Untuk sampel
∑ 𝑋2 ∑(𝑋)2
𝑠2 = −
𝑛 − 1 𝑛 (𝑛 − 1)
Contoh 1.
Tentukan varian dari konsumsi mie instan per minggu di daerah A dan B dengan
menggunakan metode biasa dan metode angka kasar
A B
5 6
6 7
7 7
10 8
Daerah B :
∑(𝑋 − 𝑋̅)2
𝑠2 =
𝑛−1
2 2
𝑠2 = = = 0,67
4−1 3
Perhatikan bahwa varian dari daerah B jauh lebih kecil dari daerah A atau varian B < A.
Dengan demikian terlihat bahwa data A lebih bervariasi dibandingkan dengan data B
ATAU
Data A lebih tersebar dari rata-ratanya dibandingkan dengan data B
∑ 𝑋2 ∑(𝑋)2
𝑠2 = −
𝑛 − 1 𝑛 (𝑛 − 1)
2
210 282
𝑠 = −
4 − 1 4 (4 − 1)
210 784
𝑠2 = − = 70 − 65,33 = 4,67
3 12
Daerah B :
∑ 𝑋2 ∑(𝑋)2
𝑠2 = −
𝑛 − 1 𝑛 (𝑛 − 1)
198 282
𝑠2 = −
4 − 1 4 (4 − 1)
198 784
𝑠2 = − = 66 − 65,33 = 0,67
3 12
Perhatikan bahwa varian yang diperoleh dengan metode angka kasar hasilnya sama dengan
varian yang diperoleh dengan metode biasa.
Untuk data berkelompok perhitungan sama dengan varian untuk data tunggal.
Perbedaan hanya terletak pada penempatan titik tengah kelas (midpoint) sebagai dasar
pengambilan frekuensi. Varian data berkelompok dapat ditentukan dengan menggunakan
metoda : a) metoda biasa , b) metode angka kasar, dan c) metode Coding.
a. Metode Biasa
Untuk populasi
∑(𝑋 − 𝑋̅)2
𝜎2 =
𝑁
∑ 𝑓(𝑋 − 𝑋̅)2
𝑠2 =
𝑛−1
Dimana :
s2 = varian dari sampel
X = skor data
𝑋̅ = rata-rata hitung
N = jumlah dari populasi
n = jumlah dari sampel
Untuk sampel
∑ 𝑓𝑋 2 ∑(𝑓𝑋)2
𝑠2 = −
𝑛−1 𝑛 (𝑛 − 1)
c. Metode Coding
Untuk populasi
2
2
∑ fu2 2
∑ 𝑓𝑢
σ =C . −( )
N 𝑁
Untuk sampel
2
∑ 𝑓𝑢2 ∑(𝑓𝑢)2
2
𝑠 =𝐶 −
𝑛 − 1 𝑛 (𝑛 − 1)
Dimana :
C = panjang interval kelas
𝑑 𝑋−𝑀
𝑢= =
𝐶 𝐶
u = …,-3, -2….0, 1,2, 3,… (dengan meletakkan angka nol pada frekuensi tertinggi)
Penyelesaian :
Penyelesaian dengan Metode Biasa :
Diket : n = 40
Titik
Diameter Frekuensi (𝑋 − 𝑋̅)2
Tengah fX 𝑋 − 𝑋̅ f(𝑋 − 𝑋̅)2
Pipa (mm) (f)
(X)
65 – 67 2 66 132 -7,425 55,131 110,262
68 – 70 5 69 345 -4,425 19,581 97,905
71 – 73 13 72 936 -1,425 2,031 26,403
74 – 76 14 75 1050 1,575 2,482 34,734
77 – 79 4 78 312 4,575 20,931 83,724
80 – 82 2 81 162 7,575 57,381 114,762
40 = Σf
2937 467,790
atau n
Langkah 1 : mencari titik tengah (midpoint) dari masing-masing interval (lihat kolom 3)
Langkah 2 : mencari rata-rata hitung:
2937
𝑋̅ = = 73, 425
40
Setelah semua perhitungan pada tabel selesai dilakukan (seperti apa yang diminta oleh rumus
) kemudian menghitung varian dengan rumus :
2
∑(𝑋 − 𝑋̅)2
𝜎 =
𝑁
467,790
𝜎2 = = 11,694
40
Titik
Diameter Frekuensi
Tengah fX X2 fX2
Pipa (mm) (f)
(X)
65 – 67 2 66 132 4356 8.712
68 – 70 5 69 345 4761 23.805
71 – 73 13 72 936 5184 67.392
74 – 76 14 75 1050 5625 78.750
77 – 79 4 78 312 6084 24.336
80 – 82 2 81 162 6561 13.122
40 = Σf 2937 216.117
atau n ΣfX ΣfX2
Setelah semua perhitungan selesai dilakukan seperti yang tertera pada Tabel di atas (seperti
apa yang diminta oleh rumus ) , kemudian menghitung varian dengan rumus :
2
∑ fX 2
2
∑ 𝑓𝑋
σ = −( )
N 𝑁
2
216.117 2.937 2
σ = −( )
40 40
Titik
Diameter Frekuensi
Tengah u u2 f.u f.u2
Pipa (mm) (f)
(X)
65 – 67 2 66 -3 9 -6 18
68 – 70 5 69 -2 4 -10 20
71 – 73 13 72 -1 1 -13 13
74 – 76 14 75 0 0 0 0
77 – 79 4 78 1 1 4 4
80 – 82 2 81 2 4 4 8
40 = Σf 21 63
atau n Σfu Σfu2
Pada kolom 4 yaitu kolom “u” dengan meletakkan angka nol pada frekuensi tertinggi
Setelah semua perhitungan selesai dilakukan, seperti yang tertera pada Tabel di atas (seperti
apa yang diminta oleh rumus ) , kemudian menghitung varian dengan rumus :
63 21 2
σ2 = 32 . −( )
40 40
σ2 = 9 x 1,575 − (0,525)2
Interpretasi Hasil : Hal ini berarti varian dari diameter pipa adalah 11,694 mm
Perhatikan bahwa varian yang diperoleh dengan ketiga metode di atas menghasilkan nilai
yang sama yakni 11,694. Metode coding ini digunakan apabila jumlah data banyak. Jika
data berjumlah banyak, penggunaan rumus dengan metode ini akan jauh lebih efisien dan
tidak beresiko.
Catatan : Semakin kecil varian sebuah data, semakin tidak bervariasi data tersebut
(homogen), sebaliknya semakin besar varian sebuah data, semakin bervariasi
data tersebut (heterogen).
a. Metode Biasa
Untuk Populasi
2
√∑(𝑋 − 𝑋̅)
𝜎=
𝑁
Untuk Sampel
2
∑(𝑋 − 𝑋̅)
𝜎=√
𝑛−1
2
∑ X2 ∑X
𝜎= √ −( )
N N
∑ X2 (∑ 𝑋) 2
𝑠=√ −
n − 1 𝑛(𝑛 − 1)
Contoh 3 :
Berikut adalah sampel nilai midtes statistik dari mahasiswa FE-Unbor
30 35 42 50 58 66 74 82 90 98
Penyelesaian :
Diket : n = 10
Langkah 1 : mencari rata-rata hitung (mean)
625
𝑋̅ = = 62,5
10
Langkah 2 : membuat tabel untuk perhitungan seperti yang diminta oleh rumus
X 𝑋 − 𝑋̅ (X − ̅X)2 X2
30 -32,50 1.056, 25 900
35 -27,50 756,25 1.225
42 -20,50 420,25 1.764
50 -12,25 156,25 2.500
58 -4,25 20,24 3.364
66 3,50 12,25 4.356
74 11,50 132,25 5.476
82 19,50 380,25 6.724
90 27,50 756,25 8.100
98 35,50 1.260,25 9.608
625 = ΣX 4.950,50 44.013
Σ (X − ̅
X)2 ΣX2
a. Metoda Biasa
√∑(𝑋 − 𝑋̅)2
𝑠=
n−1
√4.950,50
𝑠=
10 − 1
44.013 (625) 2
𝑠=√ −
10 − 1 10(10 − 1)
44.013 (625)2
s=√ −
9 90
𝑠 = √4.890,33 − 4.340,28
𝑠 = √550,05222
𝑠 = 23,45
a. Metoda Biasa
Untuk Populasi
2
√∑ 𝑓(𝑋 − 𝑋̅)
𝜎=
𝑁
Untuk Sampel
2
∑ 𝑓(𝑋 − 𝑋̅)
𝜎=√
𝑛−1
Untuk Sampel
∑ 𝑓𝑋 2 (∑ 𝑓𝑋) 2
𝑠=√ −
𝑛−1 𝑛(𝑛 − 1)
c. Metoda Coding
Untuk Populasi
2
∑ fu2 ∑ fu
σ = C. √ −( )
N N
Untuk Sampel
∑ fu2 (∑ 𝑓𝑢) 2
𝑠 = C. √ −
n − 1 𝑛(𝑛 − 1)
Dimana :
C = Panjang kelas
u = …,-3,-2…,0, 1, 2,….dst (dgn meletakkan angka nol pada frek terbesar)
Contoh 4 :
Tentukan deviasi standar (simpangan baku) dari distribusi frekuensi berikut ini :
Berat Badan Frekuensi (f)
40 – 44 8
45 – 49 12
50 – 54 19
55 – 59 31
60 – 64 20
65 – 69 6
70 – 74 4
Jumlah 100
Penyelesaian :
Diket : n =100
C=5
Langkah 1 : mencari rata-rata hitung (mean)
5585
𝑋̅ = = 55,85
100
5342,75
𝜎=√ = 7,31
100
2
∑ 𝑓𝑋 2 ∑ 𝑓𝑋
𝜎=√ −( )
𝑁 𝑁
317.265 5.585 2
𝜎= √ −( )
100 100
𝜎 = √53,43
𝜎 = 7,31
c. Metoda Coding
Titik
Frekuensi
Berat Badan Tengah u u2 fu Fu2
(f)
(X)
40 – 44 8 42 -3 9 -24 72
45 – 49 12 47 -2 4 -24 48
50 – 54 19 52 -1 1 -19 19
55 – 59 31 57 0 0 0 0
60 – 64 20 62 1 1 20 20
65 – 69 6 67 2 4 12 24
70 – 74 4 72 3 9 12 36
Jumlah 100 -23 219
Σfu Σfu2
2
∑ fu2 ∑ fu
σ = C. √ −( )
N N
219 −23 2
σ = 5. √ −( )
100 100
σ = 5. √2,19 − 0,0529
σ = 5. √2,1371
σ = 5 x 1,4619 = 7,31
Dengan demikian, Deviasi standar dari Berat Badan 100 mahasisa adalah 7,31 Kg
Perhatikan bahwa Deviasi standar yang diperoleh dengan ketiga metode di atas menghasilkan
nilai yang sama yakni 7,31. Metode coding ini digunakan apabila jumlah data banyak. Jika
data berjumlah banyak, penggunaan rumus dengan metode ini akan jauh lebih efisien dan
tidak beresiko.
Catatan : Semakin kecil Deviasi Standar (Simpangan Baku) sebuah data, semakin tidak
bervariasi data tersebut (Homogen), semakin besar Deviasi standar (Simpangan Baku)
sebuah data, semakin bervariasi data tersebut (data lebih tersebar dari rata-ratanya)
Keterangan : μ = rata-rata
Empirical Rules :
Jika sekelompok data yang berjumlah n mempunyai rata-rata serta deviasi standar tertentu,
maka :
Sekitar 68% dari seluruh data akan terletak di antara -1 sampai +1 deviasi standar
Sekitar 95% dari seluruh data akan terletak di antara -2 sampai +2 deviasi standar
Sekitar 99% dari seluruh data akan terletak di antara -3 sampai +3 deviasi standar
Catatan : aturan ini hanya bisa digunakan pada data yang berdistribusi normal atau mendekati
normal atau mempunyai tingkat kemencengan yang moderat. Pada distribusi data yang
asimetris (menceng ke kiri atau ke kanan) aturan ini tidak bisa digunakan dengan efektif.
Contoh 5 :
Sebuah Stasiun TV ingin mengetahui berapa lama penonton menghabiskan waktunya setiap
hari dalam mennonton acara-acara di TV. Untuk itu diambil sampel sebanyak 40 orang, dan
kepada mereka ditanyakan berapa jam mereka menonton TV setiap hari. Hasil survei seperti
yang tertera di bawah ini :
Ket :
Sampel pertama (seorang penonton) rata-rata menonton TV dalam sehari adalah 3,5 jam.
Sampel kedua rata-rata menonton TV dalam sehari adalah 3,4 jam. Demikian seterusnya
sampai sampel yang ke-40.
Penyelesaian :
n = 40
Langkah 1 : Menghitung rata-rata (mean) :
151,8
𝑋̅ = = 𝟑, 𝟕𝟗𝟓
40
√∑(𝑋 − 𝑋̅)2
𝑠=
n−1
√∑(3,5 − 3,795)2 + ⋯ .
𝑠= = 𝟎, 𝟒𝟔𝟓𝟐
40 − 1
Sampai
Hal ini berarti bahwa dari 40 sampel, 27 orang diperkirakan menonton TV rata-rata antara
3,33 jam sampai 4,26 jam
Sekitar 95% dari seluruh data akan terletak di antara -2 sampai +2 deviasi standar
Hal ini berarti 95% dari jumlah data (95% x 40 = 38 data akan terletak di antara :
̅ − 𝟐. 𝒔
𝑿
= 3,795 − (2 𝑥 0,4652)
= 𝟐, 𝟖𝟔𝟒𝟔
Sampai
̅ + 𝟐. 𝒔
𝑿
= 3,795 + (2 𝑥 0,4652)
= 𝟒, 𝟕𝟐𝟓𝟒
Hal ini berarti bahwa dari 40 sampel, 38 orang diperkirakan menonton TV rata-rata antara
2,86 jam sampai 4,72 jam
Sekitar 99% dari seluruh data akan terletak di antara -3 sampai +3 deviasi standar
Hal ini berarti 99% dari jumlah data (99% x 40 = 39,6 dibulatkan menjadi 40 data akan
terletak di antara :
𝑋̅ − 3. 𝑠
= 3,795 − (3 𝑥 0,4652)
= 𝟐, 𝟑𝟗𝟗𝟒
Sampai
𝑋̅ + 3. 𝑠
= 3,795 + (3 𝑥 0,4652)
= 𝟓, 𝟏𝟗𝟎𝟔
Hal ini berarti bahwa dari 40 sampel, semua orang diperkirakan menonton TV rata-rata
antara 2,39 jam sampai 5,19 jam
Hasil perhitungan di atas tersebut dapat ditafsirkan kurva deviasi standarnya seperti di
bawah ini :
Rata-rata