Anda di halaman 1dari 29

Nama : Maria Benga Eban

NIM : 2023755593
Kelas :IA
Tugas : Aplikasi Komputer

GM=𝒏√(𝑿𝟏)(𝑿𝟐)(𝑿𝟑) … (𝑿𝒏) =[(X1)(X2)(X3)…(Xn)]𝟏/𝒏


Syarat penggunaan rata-rata geometric ini adalah semua data bertanda positif.Rata-ratageometrik
ini selalu lebih kecil atau sama dan tidak pernah lebih besar dari rata-rata aritmatik.

Contoh 3.5 Rata-Rata Geometrik

Sebuah perusahaan ingin mengetahui pertumbuhan penjualan pertahun dari tahun 2011-2015.Data
pertumbuhan penjualan pertahun dan penjualan pertahun selama periode tersebut sebagai berikut:

Tahun Penjualan sampai akhir tahun Pertumbuhan penjualan


(Milyar) (%)

2011 110 5
2012 116,6 6
2013 121,847 4,5
2014 130,37629 7
2015 143,413919 10

Solusi 3.5

Sebelum menghitung rata-rata tertimbang terlebih dahulu dihitung dengan menggunakan rata-
rataaritmatik biasa.Pertumbuhan penjualan per tahun sebagai berikut:
5+6+4,5+7+10 32,5
𝑋= = =6,5%
5 5

Untuk mendapatkan nilai rata-rata pertumbuhan penjualan per tahun maka di cari dengan
menggunakan rata-rata geometrik.Hasilnya sebagai berikut:
1
GM=[(5)(4)(4,5)(7)(10)]5=6,2386%

Jadi pertumbuhan rata-rata penjualan pertahun dengan menggunakan rata-rata geometrik ini lebih
kecil dari pertumbuhan rata-rata aritmatik.
3.3.1.5.Rata-rata Harmoni

Dalam banyak kasus data-data di dalam bisnis dan ekonomi ditampilkan dalam bentuk
tingkat (rate) dan rasio (ratio).Data dalam bentuk tingkat dan rasio ini biasanya digunakan untuk
menjelaskan hubungan antara dua tipe pengukuran yang berbeda yang bisa dinyatakan dalam
bentuk hubungan yang berkebalikan.Rata-rata harmoni ini bisa diaplikasikan untuk data yang tidak
berkrlompok dan data yang berkelompok.

Rata-rata harmoni untuk data tidak berkelompok bisa di cari dengan menggunakan formula
sebagai berikut:
𝑛
1 1
= 𝑛 ∑𝑛𝑖=1 𝑎𝑡𝑎𝑢 𝐻𝑀=
1
∑/𝑋
𝐻𝑀

Dimana X=nilai observasi; n=jumlah observasi.Sedangkan

Sedangkan bila data berjumlah ganjil maka formulanya sebagai berikut:


𝑛
Me= 2

Dimana n=jumlah obsevasi.

Sedangakan untuk data berkelompok,rata-rata harmoni bisa dihitung dengan menggunakan


formula sebagai berikut:
𝑛
Hm = 1
∑ƒ
𝑀

Dimana ƒ=jumlah frekuensi;dan m=nilai tengah kelas

Contoh 3.6 Rata-Rata Harmoni Data TidakBerkelompok

Seorang analisis pasar keuangan ingin mengetahui rata-rata rasio keuntungansebelum


pajakterhadap total asset (EBTOTA=earming before taxes on total assets) dari 5 perusahaan yang
terdaftar di bursa efek Indonesia (listing) dalam tahun 2014.Adapun datanya sebagai berikut:

0,27 0,256 0,210 0,227 0,187

Solusi 3.6

Rata-rata rasio keuntungan sebelum pajak terhadap total asset (EBTOTA) dengan rata-rata
harmoni sebagai berikut:
𝑛 5 5
Hm = 1 = 1 1 1 1 1 = 23,267 = 0,215
∑ + + + +
𝑥 0,207 0,255 0,210 0,227 0,187
Contoh 3.7.Rata-Rata Harmoni Data Berkelompok

Seorang analisis di pasar saham ingin mengetahui rata-rata tingkat dividen (%per tahun) yang di
hasilkan oleh perusahan-perusahan gopablik yang saham-sahamnya di jual di bursa efek Indonesia
dari sebanyak 45 perusahan yang aktif transaksinya.Adapun data hipotesis tahun 2014 sebagai
berikut :

Dividen per tahun Jumlah perusahan


1-5 18
6-10 14
11-15 13
Dengan menggunakan rata-rata harmoni,berapa rata-rata dividen pada tahun 2014 tersebut?

Solusi 3.7

Perhitungan rata-rata dividen dengan rata-rata dividen dengan rata-rata harmoni bisa dilihat dalam
tabel 3.3 berikut ini

Tabel 3.3 Dividen per tahun sebanyak 45 perusahan yang go public

Kelas Nilai Tengah Jumlah 1/M F (1/M)


(deviden) (M) Perisahaan
1-5 3 18 1/3 6
6-10 8 14 1/8 1,75
11-15 13 13 1/13 1
Jumlah 45 8,75

Maka besarnya rata-rata harmoni sebagai berikut:


𝑛 45
HM = 1 = = 5,14
∑ƒ 8,75
𝑀

3.3.2. Posisi Rata-Rata

3.3.2.1 Median

Rata-rata aritmatik sebagai ukuran letak pusat data kurang mewakili seluruh data atau
bahkan bisa menyesatkan pembaca data jika data yang kita punyai memiliki satu atau dua nilai
ekstrim (autlier) baik nilai tertinggi maupun terendah misalnya kita ingin membeli rumah tipe 45
dengan luas tanah sebesar 100 Meter di kabupaten Sleman di Jogjakarta menurut iklan di Koran
mengatakan bahwa rata-rata harga rumah tipe 45 sebesar Rp 265 juta misalnya uang yang kita
punyai maksimum hanya Rp 255.Pertanyaan yang muncul apakah kita kemudian membatalkan
membeli rumah dengan uang yang kita punyai kalau kita hanya mempunyai informasi rata-tata
maka kita pasti akan membuat keputusan untuk tidak jadi membeli rumah karena anggaran kita
tidak memenuhi.Mengapa hal ini terjadi karena nilai rata-rata merupakan wakil tunggal dari
sekelompok data namun keputusan bisa berubah jika kita mempunyai informasi yang detail
tentang semua harga rumah tipe 45.Ternyata harganya berfariasi yaitu Rp 250 juta,Rp 255 juta,Rp
260 juta,Rp 265 juta dan rumah mewah tipe 45 seharga Rp 295 juta.Sekarang apa keputusan kita
mempunyai cukup informasi yang detail ini? Dengan budget maksimum Rp250 juta kita ternyata
bisa membeli rumah tipe 45,bahkan mempunyai nilai sisa uang Rp 5 juta apabila memilih harga
Rp 250 juta.

Dalama hal ini, jelas bahwa karena ada nilai ekstrim sebesar Rp 295 juta yang cukup tinggi
dibanndingkan dengan harga yang lain maka nilai ekstrim ini akan menarik keatas nilai rata-rata
aritmatik sehingga kurang mewakili data yang ada. Pada kasus lain jika kita mempunyai data
ekstrim yang rendah maka data tersebut akan menyebabkan nilai rata-rata artmatiknya rendah.
Bagaimana mengatasi hal ini? Kita bia menggunakan informasi lokasi pusat data dengan
menggunakan ukuran median.

Median secara harafiah diartikan sebagai nilai tengah (middle halue) dari sekelompok data
dimana sekelompok data tersebut sudah diurutkan baik dari nilai terendah ketertinggi atau
sebaliknya dari nilai tertinggi kenilai terendah. Median bisa dihitung baik untuk data yang belum
dikelompokan maupun data yang sudah dikelompokan.

3.3.2.1. Median Data Tidak Berkelompok.

Median sebagaimana defenisi sebelumnya merupakan nilai tengah (mid point) dari
sekumpulan data setelah kita susun dari nilai terendah ke tertinggi atau sebailiknya dari nilai
tertinggi ke terendah. Bagi data yang belum dikelompokan, karena median merupakan nilai tengah
maka cara mendapatkan median ini tergantung dari jumlah data yang kita miliki. Bila jumlah data
adalah genap maka formula untuk mendapatkan media sebagai berikut:
𝑛+1
Mi= 2

Dimana N : jumlah observasi

Sedangkan bila data berjumlah ganjil maka formulahnya sebagai berikut:


𝑛
Me=2

Dimana n =jumlah observasi

Kembali ke pembahasan masalah harga rumah tipe 45.Nilai median harga rumahtipe 45 dapat kita
cari dengan mengurutkan data sebagai berikut:
Tabel 3.4 Median Harga Murah Tipe 45

Urutan harga rumah dari Urutan harga rumah dari


terendah ke tertinggi (juta) tertinggi ke terendah (juta)

295
250 265
255 Median 260
260 260 255
265 250
295

Nilai median harga rumah tipe 45 sebesar Rp 260 juta nilai median ini akan mudah dan cepat
kita dapatkan jika datangnya ganjil seperti contoh harga rumah dimana nilai median merupakan
nilai urutan ke 3 bagaimana jika data yang kita punyai jumlahnya genap misalnnya 6.Nilai
median bisa kita cari dengan menghitung rata-rata 2 observasi yang di tengah.Nilai median di
sini merupakan rata-rata urutan data ke tiga dank e empat,lihat kembali persamaan 3.13.Misalnya
kita punya 6 data harga rumah tipe 45,lihat tabel 3.5 maka median adalah rata-rata
260+265=Rp262,5 juta

Tabel 3.5 Median Harga Rumah Tipe 45

Urutan Harga rumah dari Urutan Harga rumah dari


terendah ke tertinggi (juta) tertinggi ke terendah (juta)

250 295
255 270
260 Median 265
265 62,5 260
270 255
295 250

Apa keuntungan yang kita dapatkan dengan menggunakan median sebagai ukuran letak pusat
data kita kembali ke harga rumah 345,nilai mediannya adalah Rp260 juta lihat kembali tabel 3.1
ada 2 nilai bawa angka median yaitu RP255 juta dan 2 nilai di atas yaitu Rp250 juta dan 295
juta.Nilai median ini tidak berubah walaupun ada nilai di atas atau di bawah median
berubah,dengan kata lain,nilai median tidak akan terpengaruh dengan nilai ekstrim tinggi atau
rendah.Misalnya jika harga terendah sekarang berubah menjadi Rp 230 juta dan harga tertinggi
berubah menjadi sebesar Rp275 juta,maka nilai median tetap sebesar Rp 260 juta.Sedangkan
kalau menggunakan data nilai rata-rata nilainya pasti akan berubah,tidak lagi sebesar Rp 260
juta,tetapi menjadi RP257 juta.Nilai rata-rata ini lebih kecil dari sebelumnya Karena ada nilai
ekstrim yang rendah yaitu Rp230 juta.
Sebagai ukuran letak pusat data sebagaimana rata-rata,median ini mempunyai beberapa
karakteristik yang penting yaitu:

1. Median merupakan angka yang unik sebagaimana rata-rata dimana hanya ada satu
angka median untuk sekelompok data.
2. Median tidak terpengaruh oleh nilai ekstrim data.
3. Median dapat di gunakan untuk mengukur data dalam bentuk rasio,interval,maupun
ordinal.

3.3.2.1.2 Median Data Berkelompok

Setelah data dikelompokan ke dalam beberapa kelas,kita juga bisa mencari median data
kelompok.Median data berkelompok di cari dengan mencari interval kelas dimana median data
terletak.Interval kelas median ini didapatkan dengan mencari distribusi komulatifhingga kita
mendapatkan distribusi komulatif yang besarnya sama dengan atau lebih besar dari observasi ke
n/2.Adapun formula untuk mendapatkan media data berkelompok dapat di tulis sebagai berikut:
𝑛
−𝑐𝑓
Me=L +2 𝑓 𝑥ℎ

Dimana :L=batas kelas paling bawah dari interval kelas median;cƒ=frekuensi komulatif dari
kelas sebelum interval kelas median;ƒ= frekuensi kelas median; h =lebar interval kelas median ;
n=jumlah observasi.

Contoh 3.8. Median Data Berkelompok

Waktu yang dibutukan untuk melayani rute Penerbangan Jakarta Surabaya sebanyak 60 kali
penerbangan (flight) selama seminggu dari berbagai maskapai penerbangan domestsik sebaagai
berikut:

Waktu tempu (menit) 55-59 60-64 65-69 70-74 75-80

Jumlah flight 5 15 25 10 5

Berapa median waktu tempuh flight dari Jakarta – Surabaya?

Solusi 3.8

Perhitungan media data berkelompok data dijelaskan denganmenggunakan tabel 3.6

Tabel 3.6 Waktu Flight Jakarta Surabaya

Waktu Tempuh (menit) Jumlah Flight Frekuensi Komulatif


55-59 5 5
60-64 15 20
65-69 25 45 =Median kelas
70-74 10 55

75-80 5 60
60

Dari tabel 3.6 kita gharus mencari frekuensi komulatif,lihat kolom ketiga.Median di cari dengan
cara membagi jumlah seluruh observasi dengan 2 yaitu 60/2=30.Berarti median data terletak
pada observasi yang ke-30.Obserrvasi ke-30 ini terletak pada interval kelas 66-69 berdasarkan
frekuensi komulatif.Dengan demikian batas kelas bawah kelas media (L) sebesar 65 dan lebar
interval kelas (h) sama dengan 5.Median waktu tempuh flight Jakarta Surabaya tersebut
selanjutnya bisa cari dengan menggunakan formula (3.13),hasilnya sebagai berikut:
𝑁 60
−𝑐ƒ −20
Me=L+ 2 ƒ 𝑥ℎ =65+ 2 25 𝑥5 = 65 + 2 = 67

3.3.2.2.Modus

Selain rata-rata dan median,ukuran pusat data yang juga sering digunakan adalah
modus.Modus merupakan nilai yang sering kali muncul di dalam sebuah observasi.Dengan
demikian,modus akan sangat berguna untuk mereprentasikansekelompok data jika mempunyai
data yang sama dan berulang-ulang di dalam observasi.Perhitungan modus bisa dicari baik untuk
data tidak berkelompok dan data berkelompok.

3.3.2.2.1.Modus Data Tidak Berkelompok

Ukuran modus untuk data tidak berkelompok bisa dijelaskan dengan menggunakan contoh
berikut ini.Misalnya,ujian statistika sebanyak 65mahasiswa hasilnya sebagai berikut:

50 55 56 58 59 59 59 60 60 62 63 63 64
64 65 66 66 67 68 68 68 70 70 70 70 70
70 70 70 72 72 73 73 74 75 75 75 75 76
76 78 78 79 79 80 80 83 84 85 86 86 87
87 88 89 90 90 90 91 92 95 95 96 97 98

Dari data tersebut ada beberapa nilai statistika yanag Sama Misalnya nilai 60,66,70,72, dan
seterusnya dari nilai trsebut nilai 70 diperoleh sebanyak 8 mahasiswa dan ini merupakan nilai
dengan frekuensi terbanyak.Nilai 70 ini disebut dengan modus karena nilai yang paling banyak
muncul di dalam ujian statistika.

3.3.2.2.2.Modus Data Berkelompok


Dalam kasus data yang sudah di kelompokan,perhitungan modus dapat di lakukan dengan
menggunakan formula sebagai berikut;
ƒ𝑚−ƒ𝑚−1
Mo = L+2ƒ𝑚−ƒ𝑚−1+ƒ𝑚+1 𝑥ℎ

Dimana:L=batas kelas palin bawaah dari interval kelas modus ;ƒm-1=frekuensi kelas sebelum
interval kelas modus;ƒm+1=frekuensi kelas setelah interval kelas modus;h=lembar interval kelas
modus.

Contoh 3.9.Modus Data Berkelompok

Kembali kepada kasus waktu tempuh yang diperlukan sebuah penerbangan dari Jakarta ke
Surabaya pada contoh 3.8.Setelah diketahui mediannya,berapa modusnya?

Solusi 3.9

Perhitungan median data berkelompok dapat dijelaskan dengan menggunakan Tabel 3.7

Tabel 3.7.Waktu Flight Jakarta Surabaya

Waktu Tempuh (menit) Jumlah Flight


55-59 5
60-64 15
65-69
25⇐Modus Kerja
70-74
10
75-80
5
60

ƒ𝑚−ƒ𝑚−1 25−15
Mo=L+ 2ƒ𝑚−ƒ𝑚−1+ƒ𝑚+1 xh=65 + 2(25)−15+10 x5=65,9091

Jadi nilai modus flight dari Jakarta ke Surabaya yang sudah dikelompok ini sebesar 66 menit.

Sebagaimana Median,Modus ini merupakan ukuran letak data yang tidak terpengaruh
oleh nilai ekstrim di dalam observasi.Namun,modus mempunyai beberapa kelemahan sebagai
ukuran pusat data:

1) Pertama,jika data yang kita punyai tidak ada nilai yang sama,maka kita tidak dapat
mencari modus dalam data tersebut.Misalnya,ada 6 data tentang harga suatu barang yaitu
Rp2.000,Rp2.100,Rp2.150,Rp2.200,RP 2.250, Rp2.300,dan Rp2.400.Dari data tersebut
tidak ada nilai yang sama sehingga tidak ada modus.
2) Kedua kita juga kesulitan menentukanmodus bila sekelompok data mempunyai 2 modus
atau lebih
3) Meskipun kita mempunyai modus,namun modus yang kita punyai hanya mempunyai
jumlah frekuensi yang kecil maka modus kurang mempresentasikan data yang ada
4) Jika distribusi data tidak merata maka modus kurang mewakili pusat dari data misalnya
modus terletak pada kelas terendah atau modus terletak pada kelas tertinggi.

3.3.2.2 kuartil,desil,dan persentil

Pengukuran pusat data dengan median Pada pembahasan sebelumnya kurang detail di
dalam memberi informasi untuk mengetahui karakteristik dari sekelompok data karena hanya
membagi data menjadi 2 kelompok yang sama besarnya.Untuk mengetahui lebih jauh dari
karakteristik sekelompok data,kita bisa membagi sekelompok data dalam berbagai bagian yang
sama besar.Ukuran pusat data yang digunakan untuk membagi sekelompok data menjadi
beberapa bagian yang sama besar. Ukuran pusat data yang di gunakan untuk membagi
sekelompok data dengan 4,10 atau 100 bagian yang sama besar .Nilai penyekat tersebut masing-
masing disebut dengan kuartil(quartiles),desil(deciles) dan persentil (percentiles).Ketiga nilai
tersebut dapat dicari seperti nilai median sebelumnya tetapi hanya berbeda lokasihnya.

3.3.2.3.1 Kuartil
Kuartil adalah nilai penyekat sekelompok data jika data tersebut dibagi menjadi
empat bagian sama besar.Di dalam membagi sekelompok data ini untuk data tidak
berkelompok kita urutkan datanya mulai dari yang kecil ke yang besar atau
sebaliknya.Nilai penyekat ini kemudian di sebut dengan kuartil pertama (Q1),kuartil
kedua(Q2),dan kuartil tiga (Q3).Kuartil pertama membagi data sehingga 25% data
observasi (n/4) mempunyai nilai kurang dari Q1 dan 75% (3n/4) mempunyai nilai lebih
dari Q1.Q2 membagi data 2 bagian sama besar sehingga jumlah observasi di bawah dan
di atas kuartil kedua sama besar.Kuartil kedua ini sama dengan nilai median
sebelumnya.Sedangkan kuartil ke3 membagi data sehingga 75% dari data observasi
mempunyai nilai kurang dari Q3 dan 25% mempunyai nilai lebih dari Q3.Formula untuk
menghitung kuartil untuk data yang sudah dikelompokan adalah sebagai berikut:

𝑖 4𝑛
Qi=l+(1 + 𝑥)𝑛 = 1 + xh (3.15)
ƒ

Dimana :L =batas kelas paling bawah daari interval kelas kuartil; i=1,2,3;cƒ =frekuensi
komulatif sebelum interval kelas kuartil;ƒ=frekuensi kelas interval kelas kuartil;n =
jumlah observasi;h=lebar interval kelas kuartil.

3.3.2.3.2.Desil
Desil (D) aadalah nilai penyekat jika sekelompok data dibagi menjadi sepuluh
bagian sama besar.Karena dibagi dengan 10 bagian sama besar maka kita mempunyai
Sembilan desil Di (i=1,2,3….9).Formula untuk menghitung desil bagi data yang sudah
dikelompokan adalah sebagai berikut:

𝑖 𝑛 −𝑐𝑓
Di =L+ 10𝑓 xh
Dimana L =batas kelas paling bawah dari interval kelas desil i=1,2,3 cƒ =frekuensi
kumulatif sebelum interval kelas kuartil,ƒ= frekuensi kelas interfal,kelas kuartil,n=jumlah
observasi,h=lebar interval kelas desil.

3.3.2.3.3.Persentil
Selain dibagi dengan 4 atau 10,sekelompok data bisa di bagi menjadi 100 bagian
sama besar.Jika kita membagi sekelompok data dengan 100 bagian sama besar maka
disebut persentil.Dengan demikian kita mempunyai 99 persentil
pi(i=1,2,3…..99).Formula menghitung persentil untuk data yang sudah dikelompokan
sebagai berikut:

𝑛
𝑖 −𝑐ƒ
100
Pi = L + xh
ƒ
Dimana:L = Batas kelas paling bawah dari interval kelas persentil; i=1,2,3,,,99,cƒ
=frekuensi komulatif sebelum interval kelas persentil;ƒ=frekuensi kelas interval kelas
persentil ; n= jumlah observasi; h= lebar interval kelas persentil

Contoh 3.10 Contoh Kuartil


Kembali kepada kasus waktu tempuh yang diperlukan sebuah penerbangan dari Jakarta
ke Surabaya pada contoh 3.9.Hitunglah kuartil pertama,kedua,dan desil kesembilan?

Solusi 3.10
Perhitungan kuartil pertama,kedua,dan ketiga data dapat dijelaskan dengan menggunakan
Tabel 3.8

Tabel 3.8. Waktu flight Jakarta Surabaya


Waktu tempuh ( menit) Jumlah flight Frekuensi Komulatif
kurang dari
5 5
55-59 15 20 <= Q1
60-64 25 45 <=Q2
65-69 10 55 <=P9
70-74 5 60
75-80
60
Jumlah observasi sebanyak 60,nilai kuartil pertama akan terletak pada observasi ke 15 yaitu (1/4)
× 60.Nilai nilai kuartil ini akan terletak pada interval kelas 60-64.Dengan menggunakan formula
persamaan (3.16) kita mendapatkan nilai kuartil pertama sebesar :
𝑛 60
−𝑐ƒ −5
Q1 =L +i 4 ƒ 𝑥ℎ = 60 + 4
x5 = 60 + 0,3333 =60,3333
15

Nilai kuartil kedua atau median akan terletak pada observasi yang ke 30 yaitu (2/4) x 60.Nilai
kuartil kedua ini terletak pada interval kelas 65-69.Nilai kuartil kedua ini bisa dihitung dngan
menggunakan persamaan (3.16) dengan hasil sebagai berikut:
60
2 −20
4
Q2 = 65 + x 5 =60 + 2 = 67
25

Nilai kuartil Q2 sebesar 67 sama dengan nilai median yang kita cari pada contoh 3.8 sebelumnya
karena kuartil kedua tak lain dan tidak bukan adalah median.Nilai desil kesembilan akan terletak
pada observasi yang ke-54 yaitu (9/10) ×60.Nilai desil kesembilan ini terletak pada interval 70-
74.Dengan menggunakan formula persamaan (3.17) kita bisa mendapatkan dessil kesembilan
(D9) sebesar:
𝑛 60
𝑖 (10)−𝑐ƒ 9(10)−45
D9=L + xh = 70 + 𝑥5 = 70 + 4,5 = 74,5
ƒ 10

3.3.2.4.Hubungan Rata-rata,Median,dan Modus

Apa hubungan erat antara rata-rata,median,dan modus.Jika distribusi data adalah simetris
(symmetrical),lihat gambar 3.2,maka nilai rata-rata,median,dan modus adalah sama.Sebalikya
jika distribusi tidak simetris (non symmetrical) maka nilai rata-rata,median,dan modus adalah
tidak sama.Dengan kata lain bila nilai rata-rata,median,dan modus sama maka distribusi data
tidak simetris.Jika distribusi tidak simetris,tetapi sebagian datanya berada pada sisi sebelah
kanan atau kiri dari modus,maka di katakana distribusi yang condong atau miring(skewed)

Karl Person mengidingkasikan untuk distribusi yang simetris ada hubungan yang erat
antara nilai rata-rata,median,dan modus sebagai ukuran pusat data.Hubungan ketiganya sebagai
berikut:

Mean-modus =3 (rata-rata- Median)

Modus =3 n=median-2 rata-rata

Formula persamaan (3.18) tersebut bisa berimplikasi bahwa nilai setiap ukuran ketiga ukuran
pusat data trsebut dapat dihitung jika kita mempunyai informasi dua ukuran pusat data.Hubungan
dalam persamaan (3.18) tersebut bisa digambar melalui gambar 3.2.b dan 3.2.a
Bila sebagian data observasi di dalam distribusi terletak disebelah kanan modus
sebagaimana ditunjukan dalam Gambar 3.2.b maka dikatakan data mempunyai distribusi yang
condong atau menceng ke kanan atau condong positif (positively skewed).Sebaliknya jika
sebagian data observasi terletak di sebelah kiri modus sebagaimana di tunjukan dalam Gambar
3.2.c maka dikatakan distribusi condong atau menceng ke kiri atau condong negatif ( negatively
skewed).

Median = modus=rata-rata Modus,median,rata-rata rata-rata,median,modus

(a)simetris (b)menceng ke kanan (c)menceng ke kiri

Gambar 3.2. Perbandingan rata-rata,Median dan Modus

Pada kasus distribusi yang condong positif,nilai modus masih merupakan nilai puncak
yaitu mempunyai frekuensi yang paling besar,tetapi median dan rata-rata bergerak ke sebelah
kanan.Hubungan ketigannya tersebut dapat dinyatakan sebagai berikut:

Rata-rata > median > modus

Sebaliknya jika distribusi menceng ke kiri atau menceng negatif,modus merupakan nilai yang
mempunyai frekuensi tertinggi sementara itu median dan rata-rata bergerak ke kiri dari
modus.Hubungan ketiganya dapat dinyatakan sebagai berikut:

Rata-rata < median < modus

Pada kasus monceng positif atau negatif,perbedaan antara rata-rata dan modus adalah 3 kali
perbedaaan antara rata-rata dan median.Pada umumnya,ketika kita mempunyai distribusi yang
tidak simetris maka ukuran pusat data median lebih baik dari rata-rata untuk mengukur lokasi
karena median tidak dipengaruhi oleh frekuensi kejadian dari nilai observasi tunggal maupun
tidak dipengaruhi oleh nilai ekstrim.
SOAL-SOAL LATIHAN BAB 3

1. Pada Bab 1 kita telah membuat distribusi frekuensi dari Nilai Ujian Akhir Statistika
mahasiswa.Adapun distribuusi frekuensinya sebagai berikut:

Nilai Ujian Statistika Frekuensi

40-49 3
50-59 5
60-69 8
70-79 26
80-89 6
90-99 2

a.Hitunglah rata-rata nilai ujian statistika 50 mahasiswa tersebut!


b.Hitunglah rata-rata harmoni nilai ujian Statistika 50 mahasiswa tersebut!

2. Berikut ini merupakan distribusi frekuensi rata-rata perminggu lama waaktu yang
digunakan mahasiswa untuk membuka internet dari sampel 75 mahasiswa.

Waktu membuka internet (jam) Frekuensi

1-5 6
6-10 10
11-15 15
16-20 26
21-25 10
26-30 8

a. Hitunglah median rata-rata per minggu untuk membuka internet bagi mahasiswa!
b. Hitunglah modus rata-rata perminggu untuk membuka internet bagi mahasiswa!

3.Berikut ini merupakan distribusi frekuensi rata-rata pengeluaran per bulan rumah tangga

Sebanyak 100 rumah tangga.

Rata-rata pengeluaran perbulan Frekuensi

(Ratusan ribu rupiah)


21-30 15

31-40 17

41-50 22

51-60 13

61-70 10

71-80 8

81-90 9

91-100 6

a. Hitunglah rata-rata pengeluaran rumah tangga tersebut!


b. Hitunglah median dan modus rata-rata pengeluaran rumah tangga tersebut!
c. Hitunglah kuartil dan persentil rata-rata pengeluaran rumah tangga tersebut!
Bab 4
PENGUKURAN VARIASI DATA
4.1 Pendahuluan
Pada Bab 3 kita telah membahas masalah pengukuran pusat data.Pengukuran pusat data
dengan rata-rata berarti mencari nilai pusat rata-rata sekumpulan data.Dengan rata-rata ini maka
kita bisa mengetahui bagaimana distribusi atau di atas rata-rata.Bab ini akan membahas masalah
ukuran variasi atau bersebaran data melalui ukuran variasi atau disperse data (measures of
variation atau measures of dispersion).Ada beberapa ukuran variasi data yaitu jarak,jarak
interkuartil,varian,dan standar deviasi.

4.2. Pengukuran Variasi Data

Pengukuran pusat data seperti rata-rata atau median hanya menggambarkan pusat
data.Pengukuran pusat data ini merupakan informasi penting.Namun pusat data tidak
mencerminkan tentang persebaran atau variasi data.Kenapa persebaran data sangat penting di
dalam statistika?

Kembali ke kasus Bab 3 tentang informasi harga rumah di Sleman Yogyakarta.Iklan di


Koran mengatakan bahwa rata-rata harga rumah tipe 45 adalah Rp265 juta sehingga kalau kita
hanya mempunyai uang sebesar Rp255 juta maka kita tidak jadi membeli rumah.Apa benar kita
tidak bisa membeli rumah hanya mengetahui informasi pusat data tersebut? Ternyata jika kita
mempunyai informasi persebaran data mulai dari yang terendah sampai tertinggi,kemungkinan
kita dengan uang Rp255 juta tersebut masi bisa membeli rumah.Adapun data harga rumah tipe
45 secara menyeluruh adalah Rp 250 juta.Rp255 juta,Rp260 juta ,Rp265 juta.Setelah kita
mengetahui persebaran seluruh data harga rumah tipe tersebut maka uang Rp255 juta ternyata
cukup untuk membeli rumah tipe 45 tersebut.

Contoh lain misalnya jika dua kelompok mahasiswa masing-masing dari 3 orang
mengambil mata kuliah statistika.Hasilnya kelompok pertama rata-ratanya sebesar 80 dan
kelompok kedua rata-ratanya juga 80.Dengan informasi rata-rata ini kita bisa mengatakan
bawha kedua kelompok nilainya sama baiknya.Namun bila kita mengetahui persebaran data
maka belum tentu kedua kelompok sama baiknya.Misalnnya kelompok pertama nilai ketiga
mahasiswa tersebut 80,80,dan 80 sehungga rata-ratanya 80.Sementara itu,kelompok kedua
nilainya 80,60,dan 100.Setelah melihat persebaran data ini kita bisa mengatakan bahwa
kelompok pertama lebih baik karena persebaran data merata sedangkan kelompok kedua tidak
merata.

Pengukuran persebaran data dapat dikelompokan menjadi: (1) pengukuran absolute


(absolute measures); dan (2) pengukuran relatif ( relative measures).Pengukuran absolute
menggambarkan jumlah perbedaan atau variasi antara sekelompok data.Sedangkan pengukuran
relatif menggambarkan rasio dari variasi absolute dengan rata-ratanya yang dikenal dengan
koofisien variasi (coefficient of variation).

Selain itu pengukuran persebaran (variasi) data bisa juga dikelompokan berdasarkan;
pengukuran jarak (distance measures); dan (2) pengukuran deviasi rata-rata (average deviation
measures).Pengukuran jarak menggambarkan persebaran data dilihat dari perbedaan antara data
di dalam sekelompok data.Sedangkan pengukuran deviasi rata-rata menunjukan persebaran data
ini bisa dilihat di dalam gambar 4.1.

1 .Uji reabilitas ukuran pusat data rata-rata.Jika variasi kecil maka menunjukan bahwa
adanya kesamaan nilai di dalam sekelompok data sehingga rata-rata dapat mewakili nilai
data individual di dalam sekelompok data.Sebaliknya jika variasi data cukup besar maka
terdapat ketidaksamaan di dalam nilai sekelompok data sehingga rata-rata tidak mewakili
data individual di dalam sekelompok data
2 Mengontrol variasi data.Ukuran variasi atau persebaran data membantu membantu kita
untuk mengidentifikasikan sifat dan penyebap adanya variasi sehingga dari informasi ini
sangat berguna untuk mengontrol variasi data.
3 Membandingkan dua atau lebih sekelompok data.Dengan ukuran variasi ini kita bisa
membandingkan dua atau lebih sekelompok data dengan mempertimbangkan kesamaan
data.Misalnya membandingkan harga indeks saham gabungan (IHSG) yang merupakan
rata-rata harga saham antar waktu misalnya tahun 2011 dan 2012 maka kita memerlukan
informasi tentang variasi data.
4 Menyediakan informasi untuk analisis statistika lainnya.Ukuran variasi menyediakan
informasi yang berguna bagi analisis statistika seperti regresi,peramalan,control kualitas
dan sebagainnya.

Pengukuran Variasi Data

Aljabar (Absolut dan Relatif) Grafis (Kurva Lorens)


Ukuran jarak Ukuran deviasi rata-rata

Range Range Interkuartil Deviasi Nilai Absolute Rata-rata Standar Deviasi

Gambar 4.1.Jenis Pengukuran Variasi Data

4.3 Range

Range sebagai ukuran persebaran data merupakan ukuran yang paling sederhana.Range ini
merupakan perbedaan nilai sebesar dengan nilai terkecil di dalam sekelompok data.Dengan
demikian range ini merupakan panjang interval yang meliputi data nilai tertinggi hingga nilai
terendah.Nilai range ini bisa di cari pada data tidak berkelompok maupun data berkelompok.Data
tidak berkelompok di cari dengan mengurangi data nilai terbesar dengan data nilai
terkecil.Formula range data tidak berkelompok dapat ditulis sebagai berikut:

R = Nilai tertinggi (H) – Nilai terendah (L)

Misalnya jika nilai tetinggi nilai ujian statistika sebanyak 75 mahasiswa adalah 99 sedangkan
nilai terendahnya adalah 55.Besarnya range yaitu 99-55 = 44.

Bagi sekelompok data yang sudah dikelompokan dalam bentuk distribusi frekuensi maka
range merupakan perbedaan antara batas atas kelas terakhir dan batas bawah kelas yang
pertama.Di dalam kasus ini kemungkinan kita akan mencapai nilai range yang lebih tinggi
dibandingkan dengan data yang belum dikelompokan karena batas kelas sedikit di atas nilai
ekstrim sekelompok data.

Sebagai ukuran fariasi,nilai range ini mempunyai beberapa kelemahan

1. Nilai variasi hanya didasarkan dari dua nilai yaitu nilai terendah dan yertinggi sehingga
kurang mewakili semua data
2. Nilai range sangat dipengaruhi oleh nilai ekstrim dari sekelompok data dan tidak
tergantung dari nilai yang lain.Misalnya kita mempunyai dua kelompok data sebagai
berikut:
2, 2, 2, 24, 24
2, 6, 12, 18, 24
Kedua kelompok mempunyai nilai range atauvariasi yang sama yaitu 22.Tetapi kalau kita
lihat distribusi datanya maka kelompok kedua lebih kecil variasinya dibandingkan
dengan kelompok pertama
3. Sangat tergantung dari besarnya sampel.Jika mengambil sampel dari populasi yang sama
maka perbedaan jumlah sampel yang diambil akan menghasilkan nilai range yang
berbeda.
4. Tidak bisa diaplikasikan pada sekelompok data yang dikelompokan dalam bentuk
distribusi frekuensi jikadistribusi frekuensi mempunyai kelas yang terbuka karena tidak
ada nilai yang terendah maupun tertinggi.

Contoh 4.1 Range Data Tidak Berkelompok


Dua dealer penjualan sepeda motor Merek Honde di Kota Semarang mempunyai
informasi penjualan per bulannya dari bulan Januari- Juni tahun 2014.Hitunglah nilai
range penjualan sepeda motor pada masing-masing dealer.

Dealer Januari Februari Maret April Mei Juni


Amanah 60 65 63 68 66 62
Barokah 52 64 60 62 68 78

Solusi 4.1.
Range dealer Amanah sebesar 68 – 60 = 8 dan range dealer Barokah sebesar 78 – 52 =
16 nilai range dialer Amanah lebih kecil dari nilai range dealer Barokah sehingga kita
bisa mengatakan bahwa (1) penjualan dealer Amanah lebih kecil variasinya daripada
dealer Barokah;(2) Dengan rata-rata penjualan sebesar 64 di kedua dealer Amanah
perbulannya lebih mendekati (cluster) di sekitar rata-ratanya,bahwa rata-rata penjualan
sebesar 64 di area Amanah lebih mewakili ukuran pusat data daripada di daerah Barokah.

Contoh 4.2. Range Data Berkelompok


Berikut ini merupakan waktu tunggu nasabah yang melakukan transaksi di Bank Mandiri
Syariah dengan sampel sebanyak 50 orang. Carilah nilai range-nya!

Waktu tunggu nasabah (menit) frekuensi

1-5 8
6-10 15
11-15 12
16-20 7
21-25 6
26-30 2

Solusi 4.2.
Bagi data yang sudah dikelompokan maka kita cari nilai range dengan mencari selisih batas kelas
atas ,kelas terakhir,dan batas bawah kelas pertama.Batas atas kelas terakhir 30 (H) dan batas
bawah kelas pertama 1 (L) sehingga nilai range-nya adalah 29 menit.

4.4 Range Interkuartil


Adanya kelemahan range sebagai ukuran variasi atau persebaran data dpat diatasi jika
kita mempunyai ukuran variasi yang mampu meminimumkan pengaruh nilai ekstrim
didalam perhitungan nilai range.Karena sebagian besar data terletak pada rata-ratanya
maka kita perlu mencari nilai range interkuartil (interquartile range).Untuk mencari
bagian dimana setiap bagian terisi 25% dari data yang diobservasi.Pembagian menjadi
4 kelompok ini disebut dengan kuartil (quartile).Kuartil ini merupakan nilai tertinggi
pada setiap 4 kelompok data tersebut.Range interkuartil adalah ukuran variasi nilai
sekelompok data diantara kuartil ketiga (Q3) dan kuartil pertama (Q1).Konsep tentang
interkuartil ini dapat digambarkan dalam Gambar 4.2.

Range Interkuartil

25% 25%

Nilai terendah Kuartil 1(Q1) Kuartil 2 (Q2) Kuartil 3 (Q3) Nilai Tertinggi

Gambar 4.2. Range Interkuartil

Nilai range interkuartil dengan demikian dapat dicari dengan formula sebagai berikut:

Range interkuartil = Q3 – Q1

Sedangkan setengah dari range interkuartil ini yaitu nilai tengah antara Q1 dan Q3 disebutdengan
range semiinterkuartil ( semi interquartile range) atau deviasi kuartil ( quartile deviation =
QD).Deviasi kuartil dapat dicari dengan formula sebagai berikut:
𝑄3−𝑄2
Deviasi kuartil =
2
Deviasi kuartil ini mengukur range rata-rata sebesar 25% dari sekelompok data .Karena
itu,deviasi kuartil menunjukan persebaran seluruh data karena nilainya dihitung dengan rata-rata
setengah dari 50% dari nilai yang diobservasi.

Jika distribusi tidak simetris,maka nilai kuartil pertama (Q1) dan kedua (Q2) mempunyai
jarak yang sama dari nilai median yaitu median – Q1 = Q2 –Median.Dengan demikian nilai
median ± deviasi kuartil meliputi 50% dari nilai observasi sekelompok data.Semakin kecil nilai
deviasi kuartil maka semakin tinggi kesamaan data atau kuranag variasi di antara 50% data yang
diobservasi di sekitar nilai median.Sebaliknya semakin besar nilai deviasi kuartil maka seakin
besar variasi diantara 50% data yang diobservasi.

Solusi 4.3.

Kembali kepada contoh 4.2 tentang waktu tungguh nasabah di dalam melakukan transaksi di
Bank Mandiri Syariah.Nilai range-nya sebesar 29 menit.Beraapa range interkuartil waktu tunggu
nasabah di Bank tersebut?

Solusi 4.3.

Langkah pertama yang harus kita lakukan adalah mencari kuartil pertama (Q1) dan kuartil ketiga
(Q3).Jumlah observasi sebanyak 50,nilai kuartil pertama akan terletak pada observasi ke 12.5
yaitu (1/4) × 50.Nilai kuartil ini akan terletak pada interval kelas 6 – 10.Nilai kuartil ketiga akan
terletak pada observasi yang ke-37,5 yaitu (3/4) × 50.Nilai kuartil kedua ini terletak pada interval
kelas 16-20.Tabel 4.1.akan digunakan untuk menghitung range interkuartil.

Tabel 4.1.Waktu Tunggu Nasabah Melakukan transaksi di Bank Syariah Mandiri

Waktu Tunggu Nasabah Ftekuensi Frekuensi komulatif kurang


(menit) dari
1-5 8 8
6-10 15 23 <= Q1
11-15 12 35
16-20 7 42 <= Q3
21-25 8 48
26-30 2 50

Dengan menggunakan persamaan (3.15) pada Bab 3 maka kita akan mendapatkan nilai Q1
sebesar
𝑛 60
𝐼( 4 )− 𝑐ƒ ( 4 )− 8
Q1 = L 𝑥ℎ = 6 + 𝑥5 = 6 + 0,3 = 6,3
ƒ 15
Nilai kuartil ini bisa di hitung dengan menggunakan persamaan (3.15) dengan hsil sebagai
berikut:
50
( )− 35
4
Q3= 16 + 𝑥5 = 16 + 1,7857 = 17,7957
7

Makka besarnya range interkuartil tersebut tersebut sebagai berikut:

Range interkuartil = Q3-Q1 =17,7857 – 6,3 = 11,4857

4.5 Deviasi Rata-rata (Mean Deviation= MD)

Range dan range interkuartil sebagai ukuran persebaran data tidak menunjukan
bagaimana persebaran data di silai di dalam sekitar rata-ratanya.Oleh sebap itu perlu di cari
ukuran persebaran data yang mengukur tingkat variasi nilai di dalam sekelompok data yang
berfariasi dari rata-ratanya.Slah satunya adalah deviasi rata-rata.Namun karena jumlah deviasi
setiap data terhadap rata-ratanya adlah nol maka kita harus mengambil nilai absolut.Nilai absolut
perbedaan atau deviasi data terhadap rata-ratanya disebut dengan deviasi absolute rata-
rata.Ukuruan variasi data ini kemudian disebut dengan deviasi absolute rata-rata (mean absolute
deviation = MD).MAD atau MD ini merupakan ukuran variasi data yang membandingkan nilai
tendensi relatif di dalam distribusi yang tersebar di sekitar nilai pusat data.Formula untuk
menghitung MD populasi dengan demikian dapat ditulis sebagai berikut:
∑ ⌊×−µ⌋
MD = 𝑁

Dimana:µ = rata-rata porpulasi ;N= jumlah populasi MD untuk sampel formulanya sebagai
berikut:

∑ |𝑋−𝑋̅̇|
MD = 𝑛

Dimana 𝑋̅ = rata-rata smpel ; n=jummlah sampel MD untuk data yang sudah dikelompokan
formulanya sebagai berikut:
∑ ƒ|𝑋− 𝑋̅|
MD = ∑ƒ

Dimana : ƒ = Frekuensi

Contoh 4.4. Deviasi Rata-Rata Data Tidak berkelompok


Kembali ke kasus contoh 4.1 tentang volume penjualan sepeda motor Honda di dealer Amanah
dan Barokah di Semarang.Sekarang hitunglah deviasi rata-rata volume penjualan kedua dealer

Solusi 4.4

Deviasi rata-rata dapat dihitung dengan mencari nilai rata-rata terlebi dahulu.Kemudian mencari
nilai absolute deviasi data dari rata-ratanya.Akhirnya kita jumlakan nilai absolut ini dan dibagi
dengan jumlah observasi.Perhitungan deviasi rata-rata dapat dijelaskan dengan menggunakan
tabel 4.2.

Deviasi Rata-Rata Dealer Amanah


∑|𝑋−𝑋̅| 14
MDa = = = 2,33
𝑛 6

Deviasi rata-rata Dealer Barokah


∑|𝑋−𝑋̅| 36
MDb = = =6
𝑛 6

Deviasi rata-rata Dealer Amanah sebesar 2,33.Artinya volume penjualan sepeda motor
perbulanya di dealer Amanah rata-rata bervariasi atau berbeda sebesar 2,33 dari rata-
ratanya.Sedangkan angka 6 pada dealer Barokah berarti volume penjualan per bulanya rata-rata
bervariasi sebesar 6.

Tabel 4.2.Volume Penjualan Sepeda Motor Dealer Amanah dan Barokah

Dealer Dealer
Amanah Barokah
Bulan Penjualan ̅̅̅
(X-𝑋) Nilai Penjualan ̅̅̅
(X-𝑋) Nilai
absolut absolut
Januari 60 -4 4 52 -12 12
Februari 65 1 1 64 0 0
Maret 63 -1 1 60 -4 4
April 68 -4 4 62 -2 2
Mei 66 2 2 68 4 4
Juni 62 -2 2 78 14 14
Jumlah 384 14 384 36
Rata-rata 64 64

Contoh 4.5 Deviasi Rata-Rata Data Berkelompok

Berikut ini merupakan data keuntungan 100 perusahaan yang terdaftar (listed) di bursa efek
Indonesia paada tahun 2014.Berapa besarnya deviasi rata-rata ke 100 perusahaan tersebut?

Keuntungan (milyar Rp) Jumlah perusahaan


0-9 12
10-19 8
20-29 30
30-39 20
40-49 20
50-59 10

Solusi 4.5.

Berdasarkan persamaan (4.6),untuk menghitung deviasi data berkelompok kita harus mecari
dahulu nilai rata-ratanya.Nilai rata-rata data berkelompok di hitung dengan menggunakan
persamaan (3.5), lihat kembali Bab 3.Perhitungan rata-rata ini bisa dilihat dalam tabel 1 dan
hasilnya sebagai berikut:
∑ƒ𝑀 3030
𝑋̅ = 𝑛 = 100 = 30,30

Kemudian perhitungan deviasi rata-rata data juga menggunakan informasi yang ada di dalam
Tabel 4.3.Hasilnya sebagai berikut:
∑ ƒ |𝑋−𝑋̅| 1120
MD= ∑ƒ
= = 12,20
100

Tabel 4.3 Keuntungan Perusahaan yang Terdaftar di Bursa Efek Indonesia

Keuntungan Frekuensi (f) Nilai Tengah fM |𝑋 − 𝑋̅ | Ƒ |𝑋 − 𝑋̅|


(milyar Rp) (M)
0-9 12 4,5 54 25.8 309.6
10-19 8 14,5 116 15.8 126.4
20-29 30 24,5 735 5.8 174
30-39 20 34,5 690 4.2 84
40-49 20 44,5 890 14.2 284
50-59 10 55,5 545 24.2 242
Jumlah 3030 1220

4.6. Variasi dan Standar Deviasi

Ukuran variasi data dengan MAD sebelumnya dihitung dengan mencari nilai absolute
deviasi data terhadap rata-ratanya untuk menghindari nilai negatif.Selain itu,kita bisa
menghindari nilai negatif deviasi data terhadap tata-ratanya dengan menguadratkan devisi
tersebut.Jika jumlah nilai kuadrat deviasi data rata-ratanya ini kita jumlakan dan dibagi dengan
jumlah data maka disebut dengan varian (variance) dengan symbol ð².Varian populasi dapat
dihitung dengan menggunakan formula sebagai berikut:
∑(𝑋−µ)²
ó² = (4.7)
𝑁

Nilai range dan deviasi rata-rata sebagai ukuraan variasi data mudah diinterpretasikan.Nilai
range adalah perbedaan nilai tertinggi dan terendah dari sekelompok data sedangkan deviasi rata-
rata merupakan deviasi data terhadap nilai rata-ratanya.Namun untuk varian seringkali sulit
diinterpretasikan karena nilai asli dalam bentuk nilai kuadrat.Oleh karena itu kita perlu mencari
nilai variasi sesuai dengan data aslinya.Hal ini bisa dilakukan dengan cara mencari akar dan
varian.Akar dari varian ini disebut dengan standar deviasi (standard deviation).Dengan demikian
standar deviasi populasi yang di beri simbol ó dapat dicari dengan menggunakan formula sebagai
berikut:

∑(𝑋−µ)²
Ó=√ (4.8)
𝑁

Dalam aplikasi statistika ,data yang kita punyai sebagian besar merupakan data sampel
daripada data populasi.Oleh sebab itu varian populasi dan sekaligus standar deviasi populasi sulit
diketahui.Sebagai gantinnya,kita mencari nilai varian dan standar deviasi sampel
untukmengestimasi varian dan standar deviasi populasi.Adapun formula untuk menghitung
varian sampel yang diberi symbol S² adalah sebagai berikut:
̅̅̅̅̅²
∑(𝑋−𝑋)
S² = (4.9)
𝑛−1

Ada sedikit perbedaan antara formula varian populasi persamaan (4.7)dengan varian sampel
persamaan (4.9).Kita tidak langsung mengubah persamaan (4.7) untuk varian populasi dengan
langsung membagi jumlah kuadrat deviasi dengan jumlah sampel.Penyebut di dalam varian
sampel adalah n-1 sedangkan varian populasi hanya n.Hal ini dilakukan agar kita bisa
menghindari bia perhitungan.Pada persamaan (4.7) jika kita membagi jumlah kuadrat deviasi
rata-rata dengan jumlah sampel maka formula itu cenderung menyebapkan nilai estimasi varian
populasi lebih kecil dari nilai sebenarnya sehingga kita perlu membagi dengan n-1 untuk varian
sampel.

Seperti dalam kasus standar deviasi populasi,jika kita mencari akar varian sampel maka kita
akan mendapatkan nilai standar deviasi sampel.Dengan demikian standar deviasi sampel yang
diberi symbol dengan S dapat dihitung dengan menggunakan formula sebagai berikut:

̅̅̅̅̅
∑(𝑋−𝑋 )²
S= √ (4.10)
𝑛−1

Perhitungan varian dan standar deviasi pada persamaan (4.9) dan (4.10) digunakan data
yang belum dikelompokan dalam distribusi frekuensi.Bila kita mempunyai data yang sudah
dikelompokan maka formula untuk menghitung varian sampel sebagai berikut:
̅̅̅̅̅
∑ ƒ (𝑀−𝑋)²
S²= (4.11)
𝑛−1

Dimana M = nilai tengah

Sedangkan standar deviasi sampel dihitung dengan menggunakan formula sebagai berikut:

̅̅̅̅̅
∑ ƒ (𝑀−𝑋)²
S= √ (4.12)
𝑛−1

Standar deviasi biasanya digunakan sebagai ukuran perbandingan variasi atau persebaran
dua atau lebih sekelompok data.Jika standar deviasi sekelompok data A lebih kecil dari standar
deviasi sekelompok data B maka sekelompok data A tersebut datanya tidak banyak variasinya
karena karena datanya mengelompok di sekitar rata-ratanya.Sehingga nilai rata-rata sekelompok
data A merupakan ukuran yang lebih dipercaya daripada nilai rata-rata sekelompok data B.

Contoh 4.6 Variasi dan Standar Deviasi Data Tidak Berkelompok

Kembali ke kasus contoh 4.1.tentang volume penjualan sepeda motor dari dua dealer yang
berlokasi di Semarang.Kita telah menghitung variasi data berdasarkan range dan deviasi
standar.Sekarang berapa nilai varian dan standar deviasinya?

Solusi 4.2

Perhitungan nilai varian dan standar deviasi volume penjualan kedua deler tersebut akaan
menggunakan informasi yang tersedia di dalam tabel 4.4.

Pada contoh diatas kedua dealer mempunyai volume penjualan sepeda motor yang sama.Namun
standar deviasi penjualan kedua dealer berbeda.Dealer Amanah standar deviasinya sebesar
2,8983 sedangkan standar deviasi penjualan dealer Barokah sebesar 8,6718.Jika kita tidak
mengetahui standar deviasi kedua dealer maka kita bisa mengatakan bahwa kinerja kedua dealer
sama baik karena mempunyai rata-rata volume penjualan sama yaitu sebesar 64.Naman bila kita
lihat standar deviasinya maka kinerja Dealer Amanah lebih baik dari dealer Barokah karena
variasi volume penjualanya antar bulan relatif lebih kecil.Volume rata-rata penjualan dealer
Amanah lebih dipercaya sebagai ukuran pusat data daripada dealer Barokah.

Varian dan standar deviasi Dealer Amanah:

∑(𝑋−𝑋)² 42
S²A = = = 8,4
𝑛−1 5

SA=√8,4 = 2,8983

Varian dan standar deviasi Dealer Barokah:


∑(𝑋−𝑋)² 378
S²B = = = 75,2
𝑛−1 5

SB = √72,5 = 8,6718

Tabel 4.4 Volume Penjualan Sepeda Motor Dealer Amanah dan Barokah

Dealer Dealer
Amanah Barokah
Bulan Penjualan (X-𝑋) (X-𝑋)² Penjualan (X-𝑋) (X-𝑋)²
Januarai 60 -4 16 52 -12 144
Februari 65 1 1 64 0 0
Maret 63 -1 1 60 -4 16
April 68 -4 16 62 -2 4
Meui 66 2 4 68 4 16
Juni 62 -2 4 78 14 196
Jumlah 384 42 384 376
Rata-rata 64 64

Contoh 4.7. Varian dan Standar Deviasi Data Berkelompok

Kembali ke contoh distribusi frekuensi pekerja perusahaan garmen pada contoh 3.3 pada
tabel3.1.Setelah kita mengetahui rata-rata umur pekerja,sekarang berapa besarnya varian
danstandar deviasi umur pekerja di perusan tersebut.

Solusi 4.7.

Perhitungan varian dan standar deviasi rata-rata umur pekerja akan menggunakan informasi yang
tersedia di dalam table 4.5

Tabel 4.5 Umur Pekerja Perusahaan Garmen

Umur Frekuensi (ƒ) Nilai Tengah (M – ̅̅̅


𝑋) (M- ̅̅̅̅̅
𝑋 )² ̅̅̅̅̅
Ƒ (M-𝑋)²
(M)
20-24 150 22 -13.02 169.52 25425.05
25-29 210 27 -8.02 54.32 13507.28
30-34 320 32 -3.02 9.12 2916.53
\35-39 180 37 1.98 3.92 705.67
40-44 150 42 6.98 48.72 7308.06
45-49 125 47 11.98 143.52 17940.05
50-55 100 52 15.98 288.32 28832.04
Jumlah 1235 96639.59
Besarnya nilai varian sebagai berikut:
̅̅̅̅̅
∑ ƒ (𝑀−𝑋)² 96639,69
S² = = = 78,31
𝑛−1 1234

Sedangkan nilai standar deviasi sebesar

∑ ƒ ( 𝑀− 𝑥)²̅̅̅̅̅
S=√ = √78.31 = 8,85

4.6 Teori Chebyshev

Standar deviasi sebagai ukuran variasi atau persebaran data menyatakan bahwa jika
sekelompok data mempunyai standar deviasi yang kecil maka data tersebut akan
terkonsentrasi di sekitar rata-ratanya.Sebaliknya jika standar deviasi besar maka data tersebar
luas di sekitar rata-ratanya.Seorang ahli dari Rusia yang bernama P.L Chebyshev (1821-
1894) mengembangkan sebuah teori yang membantu kita untuk menentukan proporsi
minimum nilai yang terletak di dalam nilai tertentu dari standar deviasi dari nilai rata-
ratanya.

Teori yang dikembangkan mengatakan bahwa untuk sekelompok data observasi baik
populasi atau samprl,nilai proporsi yang terletak di dalam k standar deviasi dari nilai rata-
ratanya paling tidak sebesar 1-1/k² dimana k adalah setiap nilai konstan yang lebih besar dari
1.Teori ini menjelaskan bagaimana standar deviasi terkait erat dengan persebaran data,namun
itu hanya menjelaskan prentase minimum data yang harus terletak di dalam interval tertentu
pada setiap kelompok data.

Misalnya nilai k = 2 maka pilihan tidak sebesar 1-1/4 =3/4 atau 75% nilai dari
sekelompok data akan terletak dalam range µ ± 2ð.Sedangkan jika k=4 maka paling tidak
sebesar 1-1/16 = 15/16 atau sekitar 93,75% sekelompok data akan terletak dalam range µ ±
4ð.Teori dari Chebyshev dapat aplikiasikan kepada setiap sekelompok data tanpa
memandang bentuk distribusi
frekuensi.Teori dari Chebyshev dapat
dijelaskan menggunakan
Grafik 4.1
Gambar 4.1. Teori Chebyshev

Teori Chebyshev dapat diaplikasikan kepada semua jenis distribusi frekuensi.Namun kita
mempunyai bentuk distribusi yang simetris kita dapat menjelaskan secara rinci tentang variasi
atau persebaran data terhadap rata-ratanya.²Pada distribusi simetris ini kita mempunyai aturan
empiris (empiral rule) yaitu:

1. Sekitar 68% observasi akan terletak di dalam plus minus dua standar deviasi dari rata-rata (µ
± 1ð).
2. Sekitar 95% observasi akan terletak di dalam plus minus dua standar deviasi dari rata-rata (µ
± 2ð).
3. Sekitar 99.7% observasi akan terletak di dalam plus minus dua standar deviasi dari rata-rata
(µ ± 3ð).

Jika kita mempunyai rata-rata 50 dan standar deviasi 10 maka ketiga hubungan dalam
distribusi simetris ini bisa dijelaskan dengan menggunakan Gambar 4.2.68% observasi akan
terletak pada 50 ± 10 10,95 % observasi akan terletak pada 50 ± 20 dan 99,7% observasi
terletak pada 50 ± 30

Gambar 4.2. Distribusi Simetris

Contoh 4.8.Teori Chebyshev


Misalnya jumlah mahasiswa yang mengambil mata kuliah Statistika sebanyak 75
mahasiswa.Nilai rata-rata ujian akhir Statistika sebesar 65 dengan standar deviasi
sebesar.Jika distribusi nilai ujian akhir Statistika ini mempunyai distribusi simetris maka
tentukan:
a. 68% nilai ujiam statistika akan terletak pada interval nilai berapa?
b. 95% nilai ujian statistika akan terletak pada interval nilai berapa?
c. Semua nilai ujian statistika akan terletak pada interval nilai berapa?

Solusi 4.8
Kita akan mengaplikasikan teori Chebyshev pada distribusi yang simetris dimana
sekitar 68% observasi akan terletak di (µ ± 1ð),95% observasi akan terletak di (µ ± 2ð)
dan 99,7% observasi akan terletak di (µ ± 3ð).
a. 68% terletak antara 60 dan 70 yaitu 65 ± 5
b. 95% terletak antara 55 dan 75 yaitu 65 ± 10
c. 99,7% terletak antara 50 dan 80 yaitu 65 ± 15.

Anda mungkin juga menyukai