NIM : 2023755593
Kelas :IA
Tugas : Aplikasi Komputer
Sebuah perusahaan ingin mengetahui pertumbuhan penjualan pertahun dari tahun 2011-2015.Data
pertumbuhan penjualan pertahun dan penjualan pertahun selama periode tersebut sebagai berikut:
2011 110 5
2012 116,6 6
2013 121,847 4,5
2014 130,37629 7
2015 143,413919 10
Solusi 3.5
Sebelum menghitung rata-rata tertimbang terlebih dahulu dihitung dengan menggunakan rata-
rataaritmatik biasa.Pertumbuhan penjualan per tahun sebagai berikut:
5+6+4,5+7+10 32,5
𝑋= = =6,5%
5 5
Untuk mendapatkan nilai rata-rata pertumbuhan penjualan per tahun maka di cari dengan
menggunakan rata-rata geometrik.Hasilnya sebagai berikut:
1
GM=[(5)(4)(4,5)(7)(10)]5=6,2386%
Jadi pertumbuhan rata-rata penjualan pertahun dengan menggunakan rata-rata geometrik ini lebih
kecil dari pertumbuhan rata-rata aritmatik.
3.3.1.5.Rata-rata Harmoni
Dalam banyak kasus data-data di dalam bisnis dan ekonomi ditampilkan dalam bentuk
tingkat (rate) dan rasio (ratio).Data dalam bentuk tingkat dan rasio ini biasanya digunakan untuk
menjelaskan hubungan antara dua tipe pengukuran yang berbeda yang bisa dinyatakan dalam
bentuk hubungan yang berkebalikan.Rata-rata harmoni ini bisa diaplikasikan untuk data yang tidak
berkrlompok dan data yang berkelompok.
Rata-rata harmoni untuk data tidak berkelompok bisa di cari dengan menggunakan formula
sebagai berikut:
𝑛
1 1
= 𝑛 ∑𝑛𝑖=1 𝑎𝑡𝑎𝑢 𝐻𝑀=
1
∑/𝑋
𝐻𝑀
Solusi 3.6
Rata-rata rasio keuntungan sebelum pajak terhadap total asset (EBTOTA) dengan rata-rata
harmoni sebagai berikut:
𝑛 5 5
Hm = 1 = 1 1 1 1 1 = 23,267 = 0,215
∑ + + + +
𝑥 0,207 0,255 0,210 0,227 0,187
Contoh 3.7.Rata-Rata Harmoni Data Berkelompok
Seorang analisis di pasar saham ingin mengetahui rata-rata tingkat dividen (%per tahun) yang di
hasilkan oleh perusahan-perusahan gopablik yang saham-sahamnya di jual di bursa efek Indonesia
dari sebanyak 45 perusahan yang aktif transaksinya.Adapun data hipotesis tahun 2014 sebagai
berikut :
Solusi 3.7
Perhitungan rata-rata dividen dengan rata-rata dividen dengan rata-rata harmoni bisa dilihat dalam
tabel 3.3 berikut ini
3.3.2.1 Median
Rata-rata aritmatik sebagai ukuran letak pusat data kurang mewakili seluruh data atau
bahkan bisa menyesatkan pembaca data jika data yang kita punyai memiliki satu atau dua nilai
ekstrim (autlier) baik nilai tertinggi maupun terendah misalnya kita ingin membeli rumah tipe 45
dengan luas tanah sebesar 100 Meter di kabupaten Sleman di Jogjakarta menurut iklan di Koran
mengatakan bahwa rata-rata harga rumah tipe 45 sebesar Rp 265 juta misalnya uang yang kita
punyai maksimum hanya Rp 255.Pertanyaan yang muncul apakah kita kemudian membatalkan
membeli rumah dengan uang yang kita punyai kalau kita hanya mempunyai informasi rata-tata
maka kita pasti akan membuat keputusan untuk tidak jadi membeli rumah karena anggaran kita
tidak memenuhi.Mengapa hal ini terjadi karena nilai rata-rata merupakan wakil tunggal dari
sekelompok data namun keputusan bisa berubah jika kita mempunyai informasi yang detail
tentang semua harga rumah tipe 45.Ternyata harganya berfariasi yaitu Rp 250 juta,Rp 255 juta,Rp
260 juta,Rp 265 juta dan rumah mewah tipe 45 seharga Rp 295 juta.Sekarang apa keputusan kita
mempunyai cukup informasi yang detail ini? Dengan budget maksimum Rp250 juta kita ternyata
bisa membeli rumah tipe 45,bahkan mempunyai nilai sisa uang Rp 5 juta apabila memilih harga
Rp 250 juta.
Dalama hal ini, jelas bahwa karena ada nilai ekstrim sebesar Rp 295 juta yang cukup tinggi
dibanndingkan dengan harga yang lain maka nilai ekstrim ini akan menarik keatas nilai rata-rata
aritmatik sehingga kurang mewakili data yang ada. Pada kasus lain jika kita mempunyai data
ekstrim yang rendah maka data tersebut akan menyebabkan nilai rata-rata artmatiknya rendah.
Bagaimana mengatasi hal ini? Kita bia menggunakan informasi lokasi pusat data dengan
menggunakan ukuran median.
Median secara harafiah diartikan sebagai nilai tengah (middle halue) dari sekelompok data
dimana sekelompok data tersebut sudah diurutkan baik dari nilai terendah ketertinggi atau
sebaliknya dari nilai tertinggi kenilai terendah. Median bisa dihitung baik untuk data yang belum
dikelompokan maupun data yang sudah dikelompokan.
Median sebagaimana defenisi sebelumnya merupakan nilai tengah (mid point) dari
sekumpulan data setelah kita susun dari nilai terendah ke tertinggi atau sebailiknya dari nilai
tertinggi ke terendah. Bagi data yang belum dikelompokan, karena median merupakan nilai tengah
maka cara mendapatkan median ini tergantung dari jumlah data yang kita miliki. Bila jumlah data
adalah genap maka formula untuk mendapatkan media sebagai berikut:
𝑛+1
Mi= 2
Kembali ke pembahasan masalah harga rumah tipe 45.Nilai median harga rumahtipe 45 dapat kita
cari dengan mengurutkan data sebagai berikut:
Tabel 3.4 Median Harga Murah Tipe 45
295
250 265
255 Median 260
260 260 255
265 250
295
Nilai median harga rumah tipe 45 sebesar Rp 260 juta nilai median ini akan mudah dan cepat
kita dapatkan jika datangnya ganjil seperti contoh harga rumah dimana nilai median merupakan
nilai urutan ke 3 bagaimana jika data yang kita punyai jumlahnya genap misalnnya 6.Nilai
median bisa kita cari dengan menghitung rata-rata 2 observasi yang di tengah.Nilai median di
sini merupakan rata-rata urutan data ke tiga dank e empat,lihat kembali persamaan 3.13.Misalnya
kita punya 6 data harga rumah tipe 45,lihat tabel 3.5 maka median adalah rata-rata
260+265=Rp262,5 juta
250 295
255 270
260 Median 265
265 62,5 260
270 255
295 250
Apa keuntungan yang kita dapatkan dengan menggunakan median sebagai ukuran letak pusat
data kita kembali ke harga rumah 345,nilai mediannya adalah Rp260 juta lihat kembali tabel 3.1
ada 2 nilai bawa angka median yaitu RP255 juta dan 2 nilai di atas yaitu Rp250 juta dan 295
juta.Nilai median ini tidak berubah walaupun ada nilai di atas atau di bawah median
berubah,dengan kata lain,nilai median tidak akan terpengaruh dengan nilai ekstrim tinggi atau
rendah.Misalnya jika harga terendah sekarang berubah menjadi Rp 230 juta dan harga tertinggi
berubah menjadi sebesar Rp275 juta,maka nilai median tetap sebesar Rp 260 juta.Sedangkan
kalau menggunakan data nilai rata-rata nilainya pasti akan berubah,tidak lagi sebesar Rp 260
juta,tetapi menjadi RP257 juta.Nilai rata-rata ini lebih kecil dari sebelumnya Karena ada nilai
ekstrim yang rendah yaitu Rp230 juta.
Sebagai ukuran letak pusat data sebagaimana rata-rata,median ini mempunyai beberapa
karakteristik yang penting yaitu:
1. Median merupakan angka yang unik sebagaimana rata-rata dimana hanya ada satu
angka median untuk sekelompok data.
2. Median tidak terpengaruh oleh nilai ekstrim data.
3. Median dapat di gunakan untuk mengukur data dalam bentuk rasio,interval,maupun
ordinal.
Setelah data dikelompokan ke dalam beberapa kelas,kita juga bisa mencari median data
kelompok.Median data berkelompok di cari dengan mencari interval kelas dimana median data
terletak.Interval kelas median ini didapatkan dengan mencari distribusi komulatifhingga kita
mendapatkan distribusi komulatif yang besarnya sama dengan atau lebih besar dari observasi ke
n/2.Adapun formula untuk mendapatkan media data berkelompok dapat di tulis sebagai berikut:
𝑛
−𝑐𝑓
Me=L +2 𝑓 𝑥ℎ
Dimana :L=batas kelas paling bawah dari interval kelas median;cƒ=frekuensi komulatif dari
kelas sebelum interval kelas median;ƒ= frekuensi kelas median; h =lebar interval kelas median ;
n=jumlah observasi.
Waktu yang dibutukan untuk melayani rute Penerbangan Jakarta Surabaya sebanyak 60 kali
penerbangan (flight) selama seminggu dari berbagai maskapai penerbangan domestsik sebaagai
berikut:
Jumlah flight 5 15 25 10 5
Solusi 3.8
75-80 5 60
60
Dari tabel 3.6 kita gharus mencari frekuensi komulatif,lihat kolom ketiga.Median di cari dengan
cara membagi jumlah seluruh observasi dengan 2 yaitu 60/2=30.Berarti median data terletak
pada observasi yang ke-30.Obserrvasi ke-30 ini terletak pada interval kelas 66-69 berdasarkan
frekuensi komulatif.Dengan demikian batas kelas bawah kelas media (L) sebesar 65 dan lebar
interval kelas (h) sama dengan 5.Median waktu tempuh flight Jakarta Surabaya tersebut
selanjutnya bisa cari dengan menggunakan formula (3.13),hasilnya sebagai berikut:
𝑁 60
−𝑐ƒ −20
Me=L+ 2 ƒ 𝑥ℎ =65+ 2 25 𝑥5 = 65 + 2 = 67
3.3.2.2.Modus
Selain rata-rata dan median,ukuran pusat data yang juga sering digunakan adalah
modus.Modus merupakan nilai yang sering kali muncul di dalam sebuah observasi.Dengan
demikian,modus akan sangat berguna untuk mereprentasikansekelompok data jika mempunyai
data yang sama dan berulang-ulang di dalam observasi.Perhitungan modus bisa dicari baik untuk
data tidak berkelompok dan data berkelompok.
Ukuran modus untuk data tidak berkelompok bisa dijelaskan dengan menggunakan contoh
berikut ini.Misalnya,ujian statistika sebanyak 65mahasiswa hasilnya sebagai berikut:
50 55 56 58 59 59 59 60 60 62 63 63 64
64 65 66 66 67 68 68 68 70 70 70 70 70
70 70 70 72 72 73 73 74 75 75 75 75 76
76 78 78 79 79 80 80 83 84 85 86 86 87
87 88 89 90 90 90 91 92 95 95 96 97 98
Dari data tersebut ada beberapa nilai statistika yanag Sama Misalnya nilai 60,66,70,72, dan
seterusnya dari nilai trsebut nilai 70 diperoleh sebanyak 8 mahasiswa dan ini merupakan nilai
dengan frekuensi terbanyak.Nilai 70 ini disebut dengan modus karena nilai yang paling banyak
muncul di dalam ujian statistika.
Dimana:L=batas kelas palin bawaah dari interval kelas modus ;ƒm-1=frekuensi kelas sebelum
interval kelas modus;ƒm+1=frekuensi kelas setelah interval kelas modus;h=lembar interval kelas
modus.
Kembali kepada kasus waktu tempuh yang diperlukan sebuah penerbangan dari Jakarta ke
Surabaya pada contoh 3.8.Setelah diketahui mediannya,berapa modusnya?
Solusi 3.9
Perhitungan median data berkelompok dapat dijelaskan dengan menggunakan Tabel 3.7
ƒ𝑚−ƒ𝑚−1 25−15
Mo=L+ 2ƒ𝑚−ƒ𝑚−1+ƒ𝑚+1 xh=65 + 2(25)−15+10 x5=65,9091
Jadi nilai modus flight dari Jakarta ke Surabaya yang sudah dikelompok ini sebesar 66 menit.
Sebagaimana Median,Modus ini merupakan ukuran letak data yang tidak terpengaruh
oleh nilai ekstrim di dalam observasi.Namun,modus mempunyai beberapa kelemahan sebagai
ukuran pusat data:
1) Pertama,jika data yang kita punyai tidak ada nilai yang sama,maka kita tidak dapat
mencari modus dalam data tersebut.Misalnya,ada 6 data tentang harga suatu barang yaitu
Rp2.000,Rp2.100,Rp2.150,Rp2.200,RP 2.250, Rp2.300,dan Rp2.400.Dari data tersebut
tidak ada nilai yang sama sehingga tidak ada modus.
2) Kedua kita juga kesulitan menentukanmodus bila sekelompok data mempunyai 2 modus
atau lebih
3) Meskipun kita mempunyai modus,namun modus yang kita punyai hanya mempunyai
jumlah frekuensi yang kecil maka modus kurang mempresentasikan data yang ada
4) Jika distribusi data tidak merata maka modus kurang mewakili pusat dari data misalnya
modus terletak pada kelas terendah atau modus terletak pada kelas tertinggi.
Pengukuran pusat data dengan median Pada pembahasan sebelumnya kurang detail di
dalam memberi informasi untuk mengetahui karakteristik dari sekelompok data karena hanya
membagi data menjadi 2 kelompok yang sama besarnya.Untuk mengetahui lebih jauh dari
karakteristik sekelompok data,kita bisa membagi sekelompok data dalam berbagai bagian yang
sama besar.Ukuran pusat data yang digunakan untuk membagi sekelompok data menjadi
beberapa bagian yang sama besar. Ukuran pusat data yang di gunakan untuk membagi
sekelompok data dengan 4,10 atau 100 bagian yang sama besar .Nilai penyekat tersebut masing-
masing disebut dengan kuartil(quartiles),desil(deciles) dan persentil (percentiles).Ketiga nilai
tersebut dapat dicari seperti nilai median sebelumnya tetapi hanya berbeda lokasihnya.
3.3.2.3.1 Kuartil
Kuartil adalah nilai penyekat sekelompok data jika data tersebut dibagi menjadi
empat bagian sama besar.Di dalam membagi sekelompok data ini untuk data tidak
berkelompok kita urutkan datanya mulai dari yang kecil ke yang besar atau
sebaliknya.Nilai penyekat ini kemudian di sebut dengan kuartil pertama (Q1),kuartil
kedua(Q2),dan kuartil tiga (Q3).Kuartil pertama membagi data sehingga 25% data
observasi (n/4) mempunyai nilai kurang dari Q1 dan 75% (3n/4) mempunyai nilai lebih
dari Q1.Q2 membagi data 2 bagian sama besar sehingga jumlah observasi di bawah dan
di atas kuartil kedua sama besar.Kuartil kedua ini sama dengan nilai median
sebelumnya.Sedangkan kuartil ke3 membagi data sehingga 75% dari data observasi
mempunyai nilai kurang dari Q3 dan 25% mempunyai nilai lebih dari Q3.Formula untuk
menghitung kuartil untuk data yang sudah dikelompokan adalah sebagai berikut:
𝑖 4𝑛
Qi=l+(1 + 𝑥)𝑛 = 1 + xh (3.15)
ƒ
Dimana :L =batas kelas paling bawah daari interval kelas kuartil; i=1,2,3;cƒ =frekuensi
komulatif sebelum interval kelas kuartil;ƒ=frekuensi kelas interval kelas kuartil;n =
jumlah observasi;h=lebar interval kelas kuartil.
3.3.2.3.2.Desil
Desil (D) aadalah nilai penyekat jika sekelompok data dibagi menjadi sepuluh
bagian sama besar.Karena dibagi dengan 10 bagian sama besar maka kita mempunyai
Sembilan desil Di (i=1,2,3….9).Formula untuk menghitung desil bagi data yang sudah
dikelompokan adalah sebagai berikut:
𝑖 𝑛 −𝑐𝑓
Di =L+ 10𝑓 xh
Dimana L =batas kelas paling bawah dari interval kelas desil i=1,2,3 cƒ =frekuensi
kumulatif sebelum interval kelas kuartil,ƒ= frekuensi kelas interfal,kelas kuartil,n=jumlah
observasi,h=lebar interval kelas desil.
3.3.2.3.3.Persentil
Selain dibagi dengan 4 atau 10,sekelompok data bisa di bagi menjadi 100 bagian
sama besar.Jika kita membagi sekelompok data dengan 100 bagian sama besar maka
disebut persentil.Dengan demikian kita mempunyai 99 persentil
pi(i=1,2,3…..99).Formula menghitung persentil untuk data yang sudah dikelompokan
sebagai berikut:
𝑛
𝑖 −𝑐ƒ
100
Pi = L + xh
ƒ
Dimana:L = Batas kelas paling bawah dari interval kelas persentil; i=1,2,3,,,99,cƒ
=frekuensi komulatif sebelum interval kelas persentil;ƒ=frekuensi kelas interval kelas
persentil ; n= jumlah observasi; h= lebar interval kelas persentil
Solusi 3.10
Perhitungan kuartil pertama,kedua,dan ketiga data dapat dijelaskan dengan menggunakan
Tabel 3.8
Nilai kuartil kedua atau median akan terletak pada observasi yang ke 30 yaitu (2/4) x 60.Nilai
kuartil kedua ini terletak pada interval kelas 65-69.Nilai kuartil kedua ini bisa dihitung dngan
menggunakan persamaan (3.16) dengan hasil sebagai berikut:
60
2 −20
4
Q2 = 65 + x 5 =60 + 2 = 67
25
Nilai kuartil Q2 sebesar 67 sama dengan nilai median yang kita cari pada contoh 3.8 sebelumnya
karena kuartil kedua tak lain dan tidak bukan adalah median.Nilai desil kesembilan akan terletak
pada observasi yang ke-54 yaitu (9/10) ×60.Nilai desil kesembilan ini terletak pada interval 70-
74.Dengan menggunakan formula persamaan (3.17) kita bisa mendapatkan dessil kesembilan
(D9) sebesar:
𝑛 60
𝑖 (10)−𝑐ƒ 9(10)−45
D9=L + xh = 70 + 𝑥5 = 70 + 4,5 = 74,5
ƒ 10
Apa hubungan erat antara rata-rata,median,dan modus.Jika distribusi data adalah simetris
(symmetrical),lihat gambar 3.2,maka nilai rata-rata,median,dan modus adalah sama.Sebalikya
jika distribusi tidak simetris (non symmetrical) maka nilai rata-rata,median,dan modus adalah
tidak sama.Dengan kata lain bila nilai rata-rata,median,dan modus sama maka distribusi data
tidak simetris.Jika distribusi tidak simetris,tetapi sebagian datanya berada pada sisi sebelah
kanan atau kiri dari modus,maka di katakana distribusi yang condong atau miring(skewed)
Karl Person mengidingkasikan untuk distribusi yang simetris ada hubungan yang erat
antara nilai rata-rata,median,dan modus sebagai ukuran pusat data.Hubungan ketiganya sebagai
berikut:
Formula persamaan (3.18) tersebut bisa berimplikasi bahwa nilai setiap ukuran ketiga ukuran
pusat data trsebut dapat dihitung jika kita mempunyai informasi dua ukuran pusat data.Hubungan
dalam persamaan (3.18) tersebut bisa digambar melalui gambar 3.2.b dan 3.2.a
Bila sebagian data observasi di dalam distribusi terletak disebelah kanan modus
sebagaimana ditunjukan dalam Gambar 3.2.b maka dikatakan data mempunyai distribusi yang
condong atau menceng ke kanan atau condong positif (positively skewed).Sebaliknya jika
sebagian data observasi terletak di sebelah kiri modus sebagaimana di tunjukan dalam Gambar
3.2.c maka dikatakan distribusi condong atau menceng ke kiri atau condong negatif ( negatively
skewed).
Pada kasus distribusi yang condong positif,nilai modus masih merupakan nilai puncak
yaitu mempunyai frekuensi yang paling besar,tetapi median dan rata-rata bergerak ke sebelah
kanan.Hubungan ketigannya tersebut dapat dinyatakan sebagai berikut:
Sebaliknya jika distribusi menceng ke kiri atau menceng negatif,modus merupakan nilai yang
mempunyai frekuensi tertinggi sementara itu median dan rata-rata bergerak ke kiri dari
modus.Hubungan ketiganya dapat dinyatakan sebagai berikut:
Pada kasus monceng positif atau negatif,perbedaan antara rata-rata dan modus adalah 3 kali
perbedaaan antara rata-rata dan median.Pada umumnya,ketika kita mempunyai distribusi yang
tidak simetris maka ukuran pusat data median lebih baik dari rata-rata untuk mengukur lokasi
karena median tidak dipengaruhi oleh frekuensi kejadian dari nilai observasi tunggal maupun
tidak dipengaruhi oleh nilai ekstrim.
SOAL-SOAL LATIHAN BAB 3
1. Pada Bab 1 kita telah membuat distribusi frekuensi dari Nilai Ujian Akhir Statistika
mahasiswa.Adapun distribuusi frekuensinya sebagai berikut:
40-49 3
50-59 5
60-69 8
70-79 26
80-89 6
90-99 2
2. Berikut ini merupakan distribusi frekuensi rata-rata perminggu lama waaktu yang
digunakan mahasiswa untuk membuka internet dari sampel 75 mahasiswa.
1-5 6
6-10 10
11-15 15
16-20 26
21-25 10
26-30 8
a. Hitunglah median rata-rata per minggu untuk membuka internet bagi mahasiswa!
b. Hitunglah modus rata-rata perminggu untuk membuka internet bagi mahasiswa!
3.Berikut ini merupakan distribusi frekuensi rata-rata pengeluaran per bulan rumah tangga
31-40 17
41-50 22
51-60 13
61-70 10
71-80 8
81-90 9
91-100 6
Pengukuran pusat data seperti rata-rata atau median hanya menggambarkan pusat
data.Pengukuran pusat data ini merupakan informasi penting.Namun pusat data tidak
mencerminkan tentang persebaran atau variasi data.Kenapa persebaran data sangat penting di
dalam statistika?
Contoh lain misalnya jika dua kelompok mahasiswa masing-masing dari 3 orang
mengambil mata kuliah statistika.Hasilnya kelompok pertama rata-ratanya sebesar 80 dan
kelompok kedua rata-ratanya juga 80.Dengan informasi rata-rata ini kita bisa mengatakan
bawha kedua kelompok nilainya sama baiknya.Namun bila kita mengetahui persebaran data
maka belum tentu kedua kelompok sama baiknya.Misalnnya kelompok pertama nilai ketiga
mahasiswa tersebut 80,80,dan 80 sehungga rata-ratanya 80.Sementara itu,kelompok kedua
nilainya 80,60,dan 100.Setelah melihat persebaran data ini kita bisa mengatakan bahwa
kelompok pertama lebih baik karena persebaran data merata sedangkan kelompok kedua tidak
merata.
Selain itu pengukuran persebaran (variasi) data bisa juga dikelompokan berdasarkan;
pengukuran jarak (distance measures); dan (2) pengukuran deviasi rata-rata (average deviation
measures).Pengukuran jarak menggambarkan persebaran data dilihat dari perbedaan antara data
di dalam sekelompok data.Sedangkan pengukuran deviasi rata-rata menunjukan persebaran data
ini bisa dilihat di dalam gambar 4.1.
1 .Uji reabilitas ukuran pusat data rata-rata.Jika variasi kecil maka menunjukan bahwa
adanya kesamaan nilai di dalam sekelompok data sehingga rata-rata dapat mewakili nilai
data individual di dalam sekelompok data.Sebaliknya jika variasi data cukup besar maka
terdapat ketidaksamaan di dalam nilai sekelompok data sehingga rata-rata tidak mewakili
data individual di dalam sekelompok data
2 Mengontrol variasi data.Ukuran variasi atau persebaran data membantu membantu kita
untuk mengidentifikasikan sifat dan penyebap adanya variasi sehingga dari informasi ini
sangat berguna untuk mengontrol variasi data.
3 Membandingkan dua atau lebih sekelompok data.Dengan ukuran variasi ini kita bisa
membandingkan dua atau lebih sekelompok data dengan mempertimbangkan kesamaan
data.Misalnya membandingkan harga indeks saham gabungan (IHSG) yang merupakan
rata-rata harga saham antar waktu misalnya tahun 2011 dan 2012 maka kita memerlukan
informasi tentang variasi data.
4 Menyediakan informasi untuk analisis statistika lainnya.Ukuran variasi menyediakan
informasi yang berguna bagi analisis statistika seperti regresi,peramalan,control kualitas
dan sebagainnya.
4.3 Range
Range sebagai ukuran persebaran data merupakan ukuran yang paling sederhana.Range ini
merupakan perbedaan nilai sebesar dengan nilai terkecil di dalam sekelompok data.Dengan
demikian range ini merupakan panjang interval yang meliputi data nilai tertinggi hingga nilai
terendah.Nilai range ini bisa di cari pada data tidak berkelompok maupun data berkelompok.Data
tidak berkelompok di cari dengan mengurangi data nilai terbesar dengan data nilai
terkecil.Formula range data tidak berkelompok dapat ditulis sebagai berikut:
Misalnya jika nilai tetinggi nilai ujian statistika sebanyak 75 mahasiswa adalah 99 sedangkan
nilai terendahnya adalah 55.Besarnya range yaitu 99-55 = 44.
Bagi sekelompok data yang sudah dikelompokan dalam bentuk distribusi frekuensi maka
range merupakan perbedaan antara batas atas kelas terakhir dan batas bawah kelas yang
pertama.Di dalam kasus ini kemungkinan kita akan mencapai nilai range yang lebih tinggi
dibandingkan dengan data yang belum dikelompokan karena batas kelas sedikit di atas nilai
ekstrim sekelompok data.
1. Nilai variasi hanya didasarkan dari dua nilai yaitu nilai terendah dan yertinggi sehingga
kurang mewakili semua data
2. Nilai range sangat dipengaruhi oleh nilai ekstrim dari sekelompok data dan tidak
tergantung dari nilai yang lain.Misalnya kita mempunyai dua kelompok data sebagai
berikut:
2, 2, 2, 24, 24
2, 6, 12, 18, 24
Kedua kelompok mempunyai nilai range atauvariasi yang sama yaitu 22.Tetapi kalau kita
lihat distribusi datanya maka kelompok kedua lebih kecil variasinya dibandingkan
dengan kelompok pertama
3. Sangat tergantung dari besarnya sampel.Jika mengambil sampel dari populasi yang sama
maka perbedaan jumlah sampel yang diambil akan menghasilkan nilai range yang
berbeda.
4. Tidak bisa diaplikasikan pada sekelompok data yang dikelompokan dalam bentuk
distribusi frekuensi jikadistribusi frekuensi mempunyai kelas yang terbuka karena tidak
ada nilai yang terendah maupun tertinggi.
Solusi 4.1.
Range dealer Amanah sebesar 68 – 60 = 8 dan range dealer Barokah sebesar 78 – 52 =
16 nilai range dialer Amanah lebih kecil dari nilai range dealer Barokah sehingga kita
bisa mengatakan bahwa (1) penjualan dealer Amanah lebih kecil variasinya daripada
dealer Barokah;(2) Dengan rata-rata penjualan sebesar 64 di kedua dealer Amanah
perbulannya lebih mendekati (cluster) di sekitar rata-ratanya,bahwa rata-rata penjualan
sebesar 64 di area Amanah lebih mewakili ukuran pusat data daripada di daerah Barokah.
1-5 8
6-10 15
11-15 12
16-20 7
21-25 6
26-30 2
Solusi 4.2.
Bagi data yang sudah dikelompokan maka kita cari nilai range dengan mencari selisih batas kelas
atas ,kelas terakhir,dan batas bawah kelas pertama.Batas atas kelas terakhir 30 (H) dan batas
bawah kelas pertama 1 (L) sehingga nilai range-nya adalah 29 menit.
Range Interkuartil
25% 25%
Nilai terendah Kuartil 1(Q1) Kuartil 2 (Q2) Kuartil 3 (Q3) Nilai Tertinggi
Nilai range interkuartil dengan demikian dapat dicari dengan formula sebagai berikut:
Range interkuartil = Q3 – Q1
Sedangkan setengah dari range interkuartil ini yaitu nilai tengah antara Q1 dan Q3 disebutdengan
range semiinterkuartil ( semi interquartile range) atau deviasi kuartil ( quartile deviation =
QD).Deviasi kuartil dapat dicari dengan formula sebagai berikut:
𝑄3−𝑄2
Deviasi kuartil =
2
Deviasi kuartil ini mengukur range rata-rata sebesar 25% dari sekelompok data .Karena
itu,deviasi kuartil menunjukan persebaran seluruh data karena nilainya dihitung dengan rata-rata
setengah dari 50% dari nilai yang diobservasi.
Jika distribusi tidak simetris,maka nilai kuartil pertama (Q1) dan kedua (Q2) mempunyai
jarak yang sama dari nilai median yaitu median – Q1 = Q2 –Median.Dengan demikian nilai
median ± deviasi kuartil meliputi 50% dari nilai observasi sekelompok data.Semakin kecil nilai
deviasi kuartil maka semakin tinggi kesamaan data atau kuranag variasi di antara 50% data yang
diobservasi di sekitar nilai median.Sebaliknya semakin besar nilai deviasi kuartil maka seakin
besar variasi diantara 50% data yang diobservasi.
Solusi 4.3.
Kembali kepada contoh 4.2 tentang waktu tungguh nasabah di dalam melakukan transaksi di
Bank Mandiri Syariah.Nilai range-nya sebesar 29 menit.Beraapa range interkuartil waktu tunggu
nasabah di Bank tersebut?
Solusi 4.3.
Langkah pertama yang harus kita lakukan adalah mencari kuartil pertama (Q1) dan kuartil ketiga
(Q3).Jumlah observasi sebanyak 50,nilai kuartil pertama akan terletak pada observasi ke 12.5
yaitu (1/4) × 50.Nilai kuartil ini akan terletak pada interval kelas 6 – 10.Nilai kuartil ketiga akan
terletak pada observasi yang ke-37,5 yaitu (3/4) × 50.Nilai kuartil kedua ini terletak pada interval
kelas 16-20.Tabel 4.1.akan digunakan untuk menghitung range interkuartil.
Dengan menggunakan persamaan (3.15) pada Bab 3 maka kita akan mendapatkan nilai Q1
sebesar
𝑛 60
𝐼( 4 )− 𝑐ƒ ( 4 )− 8
Q1 = L 𝑥ℎ = 6 + 𝑥5 = 6 + 0,3 = 6,3
ƒ 15
Nilai kuartil ini bisa di hitung dengan menggunakan persamaan (3.15) dengan hsil sebagai
berikut:
50
( )− 35
4
Q3= 16 + 𝑥5 = 16 + 1,7857 = 17,7957
7
Range dan range interkuartil sebagai ukuran persebaran data tidak menunjukan
bagaimana persebaran data di silai di dalam sekitar rata-ratanya.Oleh sebap itu perlu di cari
ukuran persebaran data yang mengukur tingkat variasi nilai di dalam sekelompok data yang
berfariasi dari rata-ratanya.Slah satunya adalah deviasi rata-rata.Namun karena jumlah deviasi
setiap data terhadap rata-ratanya adlah nol maka kita harus mengambil nilai absolut.Nilai absolut
perbedaan atau deviasi data terhadap rata-ratanya disebut dengan deviasi absolute rata-
rata.Ukuruan variasi data ini kemudian disebut dengan deviasi absolute rata-rata (mean absolute
deviation = MD).MAD atau MD ini merupakan ukuran variasi data yang membandingkan nilai
tendensi relatif di dalam distribusi yang tersebar di sekitar nilai pusat data.Formula untuk
menghitung MD populasi dengan demikian dapat ditulis sebagai berikut:
∑ ⌊×−µ⌋
MD = 𝑁
Dimana:µ = rata-rata porpulasi ;N= jumlah populasi MD untuk sampel formulanya sebagai
berikut:
∑ |𝑋−𝑋̅̇|
MD = 𝑛
Dimana 𝑋̅ = rata-rata smpel ; n=jummlah sampel MD untuk data yang sudah dikelompokan
formulanya sebagai berikut:
∑ ƒ|𝑋− 𝑋̅|
MD = ∑ƒ
Dimana : ƒ = Frekuensi
Solusi 4.4
Deviasi rata-rata dapat dihitung dengan mencari nilai rata-rata terlebi dahulu.Kemudian mencari
nilai absolute deviasi data dari rata-ratanya.Akhirnya kita jumlakan nilai absolut ini dan dibagi
dengan jumlah observasi.Perhitungan deviasi rata-rata dapat dijelaskan dengan menggunakan
tabel 4.2.
Deviasi rata-rata Dealer Amanah sebesar 2,33.Artinya volume penjualan sepeda motor
perbulanya di dealer Amanah rata-rata bervariasi atau berbeda sebesar 2,33 dari rata-
ratanya.Sedangkan angka 6 pada dealer Barokah berarti volume penjualan per bulanya rata-rata
bervariasi sebesar 6.
Dealer Dealer
Amanah Barokah
Bulan Penjualan ̅̅̅
(X-𝑋) Nilai Penjualan ̅̅̅
(X-𝑋) Nilai
absolut absolut
Januari 60 -4 4 52 -12 12
Februari 65 1 1 64 0 0
Maret 63 -1 1 60 -4 4
April 68 -4 4 62 -2 2
Mei 66 2 2 68 4 4
Juni 62 -2 2 78 14 14
Jumlah 384 14 384 36
Rata-rata 64 64
Berikut ini merupakan data keuntungan 100 perusahaan yang terdaftar (listed) di bursa efek
Indonesia paada tahun 2014.Berapa besarnya deviasi rata-rata ke 100 perusahaan tersebut?
Solusi 4.5.
Berdasarkan persamaan (4.6),untuk menghitung deviasi data berkelompok kita harus mecari
dahulu nilai rata-ratanya.Nilai rata-rata data berkelompok di hitung dengan menggunakan
persamaan (3.5), lihat kembali Bab 3.Perhitungan rata-rata ini bisa dilihat dalam tabel 1 dan
hasilnya sebagai berikut:
∑ƒ𝑀 3030
𝑋̅ = 𝑛 = 100 = 30,30
Kemudian perhitungan deviasi rata-rata data juga menggunakan informasi yang ada di dalam
Tabel 4.3.Hasilnya sebagai berikut:
∑ ƒ |𝑋−𝑋̅| 1120
MD= ∑ƒ
= = 12,20
100
Ukuran variasi data dengan MAD sebelumnya dihitung dengan mencari nilai absolute
deviasi data terhadap rata-ratanya untuk menghindari nilai negatif.Selain itu,kita bisa
menghindari nilai negatif deviasi data terhadap tata-ratanya dengan menguadratkan devisi
tersebut.Jika jumlah nilai kuadrat deviasi data rata-ratanya ini kita jumlakan dan dibagi dengan
jumlah data maka disebut dengan varian (variance) dengan symbol ð².Varian populasi dapat
dihitung dengan menggunakan formula sebagai berikut:
∑(𝑋−µ)²
ó² = (4.7)
𝑁
Nilai range dan deviasi rata-rata sebagai ukuraan variasi data mudah diinterpretasikan.Nilai
range adalah perbedaan nilai tertinggi dan terendah dari sekelompok data sedangkan deviasi rata-
rata merupakan deviasi data terhadap nilai rata-ratanya.Namun untuk varian seringkali sulit
diinterpretasikan karena nilai asli dalam bentuk nilai kuadrat.Oleh karena itu kita perlu mencari
nilai variasi sesuai dengan data aslinya.Hal ini bisa dilakukan dengan cara mencari akar dan
varian.Akar dari varian ini disebut dengan standar deviasi (standard deviation).Dengan demikian
standar deviasi populasi yang di beri simbol ó dapat dicari dengan menggunakan formula sebagai
berikut:
∑(𝑋−µ)²
Ó=√ (4.8)
𝑁
Dalam aplikasi statistika ,data yang kita punyai sebagian besar merupakan data sampel
daripada data populasi.Oleh sebab itu varian populasi dan sekaligus standar deviasi populasi sulit
diketahui.Sebagai gantinnya,kita mencari nilai varian dan standar deviasi sampel
untukmengestimasi varian dan standar deviasi populasi.Adapun formula untuk menghitung
varian sampel yang diberi symbol S² adalah sebagai berikut:
̅̅̅̅̅²
∑(𝑋−𝑋)
S² = (4.9)
𝑛−1
Ada sedikit perbedaan antara formula varian populasi persamaan (4.7)dengan varian sampel
persamaan (4.9).Kita tidak langsung mengubah persamaan (4.7) untuk varian populasi dengan
langsung membagi jumlah kuadrat deviasi dengan jumlah sampel.Penyebut di dalam varian
sampel adalah n-1 sedangkan varian populasi hanya n.Hal ini dilakukan agar kita bisa
menghindari bia perhitungan.Pada persamaan (4.7) jika kita membagi jumlah kuadrat deviasi
rata-rata dengan jumlah sampel maka formula itu cenderung menyebapkan nilai estimasi varian
populasi lebih kecil dari nilai sebenarnya sehingga kita perlu membagi dengan n-1 untuk varian
sampel.
Seperti dalam kasus standar deviasi populasi,jika kita mencari akar varian sampel maka kita
akan mendapatkan nilai standar deviasi sampel.Dengan demikian standar deviasi sampel yang
diberi symbol dengan S dapat dihitung dengan menggunakan formula sebagai berikut:
̅̅̅̅̅
∑(𝑋−𝑋 )²
S= √ (4.10)
𝑛−1
Perhitungan varian dan standar deviasi pada persamaan (4.9) dan (4.10) digunakan data
yang belum dikelompokan dalam distribusi frekuensi.Bila kita mempunyai data yang sudah
dikelompokan maka formula untuk menghitung varian sampel sebagai berikut:
̅̅̅̅̅
∑ ƒ (𝑀−𝑋)²
S²= (4.11)
𝑛−1
Sedangkan standar deviasi sampel dihitung dengan menggunakan formula sebagai berikut:
̅̅̅̅̅
∑ ƒ (𝑀−𝑋)²
S= √ (4.12)
𝑛−1
Standar deviasi biasanya digunakan sebagai ukuran perbandingan variasi atau persebaran
dua atau lebih sekelompok data.Jika standar deviasi sekelompok data A lebih kecil dari standar
deviasi sekelompok data B maka sekelompok data A tersebut datanya tidak banyak variasinya
karena karena datanya mengelompok di sekitar rata-ratanya.Sehingga nilai rata-rata sekelompok
data A merupakan ukuran yang lebih dipercaya daripada nilai rata-rata sekelompok data B.
Kembali ke kasus contoh 4.1.tentang volume penjualan sepeda motor dari dua dealer yang
berlokasi di Semarang.Kita telah menghitung variasi data berdasarkan range dan deviasi
standar.Sekarang berapa nilai varian dan standar deviasinya?
Solusi 4.2
Perhitungan nilai varian dan standar deviasi volume penjualan kedua deler tersebut akaan
menggunakan informasi yang tersedia di dalam tabel 4.4.
Pada contoh diatas kedua dealer mempunyai volume penjualan sepeda motor yang sama.Namun
standar deviasi penjualan kedua dealer berbeda.Dealer Amanah standar deviasinya sebesar
2,8983 sedangkan standar deviasi penjualan dealer Barokah sebesar 8,6718.Jika kita tidak
mengetahui standar deviasi kedua dealer maka kita bisa mengatakan bahwa kinerja kedua dealer
sama baik karena mempunyai rata-rata volume penjualan sama yaitu sebesar 64.Naman bila kita
lihat standar deviasinya maka kinerja Dealer Amanah lebih baik dari dealer Barokah karena
variasi volume penjualanya antar bulan relatif lebih kecil.Volume rata-rata penjualan dealer
Amanah lebih dipercaya sebagai ukuran pusat data daripada dealer Barokah.
∑(𝑋−𝑋)² 42
S²A = = = 8,4
𝑛−1 5
SA=√8,4 = 2,8983
SB = √72,5 = 8,6718
Tabel 4.4 Volume Penjualan Sepeda Motor Dealer Amanah dan Barokah
Dealer Dealer
Amanah Barokah
Bulan Penjualan (X-𝑋) (X-𝑋)² Penjualan (X-𝑋) (X-𝑋)²
Januarai 60 -4 16 52 -12 144
Februari 65 1 1 64 0 0
Maret 63 -1 1 60 -4 16
April 68 -4 16 62 -2 4
Meui 66 2 4 68 4 16
Juni 62 -2 4 78 14 196
Jumlah 384 42 384 376
Rata-rata 64 64
Kembali ke contoh distribusi frekuensi pekerja perusahaan garmen pada contoh 3.3 pada
tabel3.1.Setelah kita mengetahui rata-rata umur pekerja,sekarang berapa besarnya varian
danstandar deviasi umur pekerja di perusan tersebut.
Solusi 4.7.
Perhitungan varian dan standar deviasi rata-rata umur pekerja akan menggunakan informasi yang
tersedia di dalam table 4.5
∑ ƒ ( 𝑀− 𝑥)²̅̅̅̅̅
S=√ = √78.31 = 8,85
Standar deviasi sebagai ukuran variasi atau persebaran data menyatakan bahwa jika
sekelompok data mempunyai standar deviasi yang kecil maka data tersebut akan
terkonsentrasi di sekitar rata-ratanya.Sebaliknya jika standar deviasi besar maka data tersebar
luas di sekitar rata-ratanya.Seorang ahli dari Rusia yang bernama P.L Chebyshev (1821-
1894) mengembangkan sebuah teori yang membantu kita untuk menentukan proporsi
minimum nilai yang terletak di dalam nilai tertentu dari standar deviasi dari nilai rata-
ratanya.
Teori yang dikembangkan mengatakan bahwa untuk sekelompok data observasi baik
populasi atau samprl,nilai proporsi yang terletak di dalam k standar deviasi dari nilai rata-
ratanya paling tidak sebesar 1-1/k² dimana k adalah setiap nilai konstan yang lebih besar dari
1.Teori ini menjelaskan bagaimana standar deviasi terkait erat dengan persebaran data,namun
itu hanya menjelaskan prentase minimum data yang harus terletak di dalam interval tertentu
pada setiap kelompok data.
Misalnya nilai k = 2 maka pilihan tidak sebesar 1-1/4 =3/4 atau 75% nilai dari
sekelompok data akan terletak dalam range µ ± 2ð.Sedangkan jika k=4 maka paling tidak
sebesar 1-1/16 = 15/16 atau sekitar 93,75% sekelompok data akan terletak dalam range µ ±
4ð.Teori dari Chebyshev dapat aplikiasikan kepada setiap sekelompok data tanpa
memandang bentuk distribusi
frekuensi.Teori dari Chebyshev dapat
dijelaskan menggunakan
Grafik 4.1
Gambar 4.1. Teori Chebyshev
Teori Chebyshev dapat diaplikasikan kepada semua jenis distribusi frekuensi.Namun kita
mempunyai bentuk distribusi yang simetris kita dapat menjelaskan secara rinci tentang variasi
atau persebaran data terhadap rata-ratanya.²Pada distribusi simetris ini kita mempunyai aturan
empiris (empiral rule) yaitu:
1. Sekitar 68% observasi akan terletak di dalam plus minus dua standar deviasi dari rata-rata (µ
± 1ð).
2. Sekitar 95% observasi akan terletak di dalam plus minus dua standar deviasi dari rata-rata (µ
± 2ð).
3. Sekitar 99.7% observasi akan terletak di dalam plus minus dua standar deviasi dari rata-rata
(µ ± 3ð).
Jika kita mempunyai rata-rata 50 dan standar deviasi 10 maka ketiga hubungan dalam
distribusi simetris ini bisa dijelaskan dengan menggunakan Gambar 4.2.68% observasi akan
terletak pada 50 ± 10 10,95 % observasi akan terletak pada 50 ± 20 dan 99,7% observasi
terletak pada 50 ± 30
Solusi 4.8
Kita akan mengaplikasikan teori Chebyshev pada distribusi yang simetris dimana
sekitar 68% observasi akan terletak di (µ ± 1ð),95% observasi akan terletak di (µ ± 2ð)
dan 99,7% observasi akan terletak di (µ ± 3ð).
a. 68% terletak antara 60 dan 70 yaitu 65 ± 5
b. 95% terletak antara 55 dan 75 yaitu 65 ± 10
c. 99,7% terletak antara 50 dan 80 yaitu 65 ± 15.