BAB 2 Ukuran Statistik Data

Ukuran
Statistik
Data
Setelah mempelajari bab ini, mahasiswa diharapkan dapat:
 menguraikan berbagai ukuran penempatan pusat dan tidak pusat

 mengkalkulasi dan menginterpretasikan masing-masing ukuran penempatan
 menguraikan penempatan pusat yang sesuai
 mengukur jenis data yang berbeda
 menguraikan berbagai ukuran dari sebaran
 mengkalkulasi dan menginterpretasikan masing-masing ukuran sebaran
Ukuran Statistik Data
2-1 Pendahuluan
Beberapa macam ukuran statistik digunakan untuk meringkaskan dan menjelaskan data.
Sebagai suatu ukuran, statistik itu mendefinisikan, dalam pengertian tertentu, pusat segugus
data dan oleh karena itu disebut ukuran lokasi pusat atau ukuran kecendrungan memusat
atau ukuran pemusatan. Yang lain mengukur keragaman antar pengamatan, dan oleh karena
itu digolongkan sebagai ukuran keragaman. Secara bersama, kedua ukuran statistik itu
sangat berguna dalam menjelaskan pengamatan yang menyusun data kita.
2-2 Parameter dan Statistik

Terminologi dan notasi yang digunakan statistikawan dalam mengolah data statistik
sepenuhnya bergantung pada apakah data tersebut merupakan populasi atau suatu sampel
yang diambil dari suatu populasi. Sebagai misal, perhatikan segugus data berikut yang
berupa banyaknya kesalahan ketik pada tiap halaman yang dilakukan sekretaris ketika
mengetik sebuah dokumen setebal 10 halaman: 1, 0, 1, 2, 3, 1, 1, 4, 0, dan 2. Pertama-tama,
marilah kita assumsikan bahwa dokumen itu memang tepat setebal 10 halaman, sehingga
datanya menyusun sebuah populasi terhingga yang kecil. Telaah sekilas terhadap populasi
ini dapat menghasilkan sejumlah kesimpulan. Misalnya, kita dapat mengatakan bahwa
banyaknya kesalahan terbesar adalah 4, atau menyatakan bahwa nilaitengah hitung (rata-
rata) 10 bilangan adalah 1,5. Bilangan 4 dan 1,5 merupakan deskripsi bagi populasi kita. Kita
menyebut nilai-nilai demikian itu parameter populasi.
DEFINISI. Parameter. Sembarang nilai yang menjelaskan ciri populasi disebut parameter
Sudah menjadi kebiasaan untuk melambangkan parameter dengan huruf Yunani. Secara
tradisi nilaitengah hitung populasi dilambangkan dengan  . Jadi, untuk populasi kesalahan
ketik kita,   1,5 . Perhatikan bahwa parameter merupakan suatu konstanta yang
menjelaskan populasi.
Sekarang misalkan bahwa data kita tersebut merupakan sebuah sampel 10 halaman yang
diambil dari sebuah naskah yang jauh lebih tebal. Jelaslah bahwa sekarang populasinya
tersusun atas data yang jauh lebih besar, dan kita hanya memiliki informasi sebagian yang
diberikan oleh sampel. Dengan demikian 4 dan 1,5 menjadi ukuran deskripsi sampel, dan
tidak lagi merupakan parameter populasi. Suatu nilai yang dihitung dari sampel disebut
statistik.
DEFINISI. Statistik. Sembarang nilai yang menjelaskan ciri suatu sampel disebut statistik
Statistik biasanya dinyatakan dalam huruf kecil biasa. Bila statistik itu berupa nilaitengah
sampel, kita akan melambangkannya dengan x . Untuk sampel acak data kesalahan ketik,
kita memperoleh x  1,5 . Karena dari populasi yang sama banyak sekali kemungkinan
sampel acak yang dapat diambil, tentunya kita dapat membayangkan bahwa statistik itu
bervariasi dari sampel satu ke sampel lainnya. Dengan kata lain, jika diambil lagi sebuah
sampel acak 10 halaman dari naskah yang sama, kemudian dihitung banyaknya kesalahan
ketik yang dibuat, maka nilai yang terbesar mungkin saja 5 dan bukan 4, nilaitengah
hitungnya tidak lagi 1,5 meskipun mungkin sangat dekat dengan itu.
Dalam inferensia statistik yang akan kita pelajari, akan digunakan nilai suatu statistik
sebagai penduga parameter populasi padanannya. Ukuran populasi diasumsikan sangat
besar atau takhingga. Untuk mengetahui seberapa teliti atau akurat statistik itu menduga
parameternya, kita pertama-tama harus menyelidiki distribusi nilai-nilai statistik itu yang
diperoleh dari banyak sekali sampel yang diambil berulang-ulang.
16
2-3 Ukuran Pemusatan

Untuk menyelidiki segugus data kuantitatif, akan sangat membantu bila kita mendefinisikan
ukuran-ukuran numerik yang menjelaskan ciri-ciri data yang penting. Salah satu cara yang
dapat ditempuh adalah penggunaan rata-rata, baik terhadap sampel maupun populasi.
Rata-rata merupakan suatu ukuran pusat data bila data itu diurutkan dari yang terkecil
sampai yang terbesar atau sebaliknya. Misalnya, bila sebuah mobil menempuh rata-rata 14,5
km per liter bensin, maka nilai ini dapat dipandang sebagai sebuah nilai yang menunjukkan
pusat dai beberapa nilai lainnya. Di luar kota, 1 liter bensin dapat menghasilkan kilometer
lebih banyak daripada di kota besar dengan lalulintasnya yang padat. Dalam pengertian
demikian, bilangan 14,5 merupakan sebuah ukuran pusat.
Sembarang ukuran yang menunjukkan pusat segugus data, yang telah diurutkan dari yang
terkecil samapai terbesar atau sebaliknya disebut ukuran lokasi pusat atau ukuran
pemusatan. Ukuran pemusatan yang paling banyak digunakan adalah nilai tengah,
median, dan modus. Yang paling penting di antara ketiganya, dan itu pulalah yang pertama-
tama akan kita bahas adalah nilai tengah.
DEFINISI. Nilaitengah Populasi. Bila segugus data x1 , x2 , ..., x N tidak harus semuanya
berbeda, menyusun sebuah populasi terhingga berukuran N, maka nilaitengah populasinya
N
x i
adalah   i 1
N
Latihan 2-1
Banyaknya pegawai di lima apotik adalah 3, 5, 6, 4, dan 6. Dengan memandang data itu
sebagai populasi, hitunglah banyaknya pegawai bagi lima apotik itu.
Jawab.
Karena datanya merupakan sebuah populasi terhingga, maka
356 46
  4,8
5
DEFINISI. Nilaitengah Sampel. Misalkan x1 , x2 , ..., x N tidak harus semuanya berbeda,

merupakan sebuah sampel terhingga berukuran n , maka nilaitengah sampelnya adalah
n
x i
x i 1
Latihan 2-2
Seorang petugas memeriksa suatu sampel acak tujuh kaleng ikan tuna merk tertentu untuk
diperiksa persentase ketidakmurniannya. Data yang diperoleh adalah: 1,8; 2,1; 1,7; 1,6; 0,9;
2,7; dan 1,8. Hitunglah nilai tengah sampelnya.
Jawab.
Karena datanya merupakan sebuah contoh, maka diperoleh
1,8  2,1  1,7  1,6  0,9  2,7  1,8
x  1,8%
7
Sering kali kita dapat menyederhanakan penghitungan nilai tengah dengan teknik yang
disebut pengkodean. Misalnya, kadang-kadang kita dapat memudahkan pekerjaan dengan
menambahkan atau mengurangkan suatu konstanta pada semua nilai pengamatan, dan baru
17
kemudian menghitung nilai tengahnya. Bagaimana hubungan antara nilai tengah yang baru
ini dengan nilai tengah pengamatan asalnya? Jika kita misalkan yi  xi  a , maka
n n
 yi  x i  a
y i 1
  x a
i 1
n n
Jadi, penambahan (atau pengurangan) suatu konstanta pada semua pengamatan mengubah
nilai tengahnya sebesar penambahan (atau pengurangan) itu. Untuk mendapatkan nilai
tengah bilangan-bilangan -5, -3, 1, 4, dan 6, misalnya kita menambahkan 5 pada semua
bilangan itu, sehingga diperoleh bilangan-bilangan baru 0, 2, 6, 9, dan 11 yang mempunyai
nilai tengah 5,6. Dengan demikian nilai tengah bilangan-bilangan semula adalah 5,6  5  0,6
Sekarang misalnya bahwa yi  axi , maka
n n
 y  ax
i i
y i 1
  ax
i 1
n n
Jadi, jika pengamatan digandakan atau dibagi dengan suatu konstanta, data yang baru itu
akan mempunyai nilai tengah yang sama dengan kelipatan konstanta dari nilai tengah
semula. Nilai tengah bilangan-bilangan 4, 6, 14 adalah 8, maka setelah dibagi dibagi 2, nilai
tengah bilangan-bilangan 2, 3, 7 haruslah 8 2  4 .
Ukuran pemusatan yang paling penting berikutnya adalah median. Untuk median populasi
kita akan melambangkan dengan u , sedangkan untuk sampel dengan x .
DEFINISI. Median. Median segugus data yang telah diurutkan dari yang terkecil sampai yang
terbesar atau terbesar sampai terkecil adalah pengamatan yang tepat di tengah-tengah bila
banyaknya pengamatan itu ganjil, atau rata-rata kedua pengamatan yang di tengah bila
banyaknya pengamatan genap
Latihan 2-3
Dari lima kali quiz sosiologi seorang mahasiswa memperoleh nilai 82, 93, 86, 92, dan 79.
Tentukan median populasi nilai ini.
Jawab.
Setelah menyusun dari yang terkecil sampai terbesar, kita memperoleh
79 82 86 92 93
Oleh karena itu   86
Latihan 2-4
Kadar nikotin yang berasal dari sebuah sampel acak enam batang rokok cap tertentu
adalah 2,3; 2,7; 2,5; 2,9; 3,1; dan 1,9 miligram. Tentukan mediannya.
Jawab.
Setelah menyusun dari yang terkecil sampai terbesar, kita memperoleh
1,9 2,3 2,5 2,7 2,9 3,1
Maka mediannya adalah rata-rata dari 2,5 dan 2,7, yaitu
2,5  2,7
x  2,6 miligram
2
Ukuran lokasi pusat yang ketiga dan terakhir yang akan kita bicarakan adalah modus.
DEFINISI. Modus. Modus segugus pengamatan adalah nilai yang terjadi paling sering atau
yang mempunyai frekuensi paling tinggi
18
Modus tidak selalu ada. Hal ini terjadi bila semua pengamatan mempunyai frekuensi terjadi
yang sama. Untuk data tertentu, mungkin saja terdapat beberapa nilai dengan frekuensi
tertinggi, dan dalam hal demikian kita mempunyai lebih satu modus.
Latihan 2-5
Sumbangan dari penduduk tercatat sebagai berikut: 9, 10, 5, 9, 9, 7, 8, 6, 10, dan 11 dollar.
Maka modusnya, yaitu nilai yang terjadi dengan frekuensi paling tinggi adalah 9 dollar.
Latihan 2-6
Dari dua belas pelajar sekolah lanjutan atas yang diambil secara acak dicatat berapa kali
mereka menonton film selama bulan lalu. Data yang diperoleh adalah: 2, 0, 3, 1, 2, 4, 2, 5,
4, 0, 1, dan 4. Dalam kasus ini terdapat dua modus, yaitu 2, Maka modusnya, yaitu nilai
yang terjadi dengan frekuensi paling tinggi adalah 2 dan 4, karena 2 dan 4 terdapat
dengan frekuensi tertinggi. Sebaran demikian dikatakan bimodus.
Latihan 2-7
Data nilai quiz sosiologi dalam Latihan 3 tidak mempunyai modus kerena semua nilai
terjadi hanya sekali.
Sebagai ringkasan, marilah kita tinjau kelebihan masing-masing ukuran lokasi tersebut.
Nilaitengah adalah ukuran lokasi yang paling umum digunakan dalam statistika. Ukuran ini
mudah dihitung dan memanfaatkan semua informasi yang dimiliki. Distribusi nilaitengah
sampel yang diperoleh melalui penarikan sampel yang berulang-ulang telah sangat
diketahui, dan itulah sebabnya metode-metode pendugaan  yang digunakan dalam
inferensia statistik didasarkan pada nilaitengah sampel. Tampaknya satu-satunya
kekurangan yang dimiliki nilaitengah ialah besaran ini sangat dipengaruhi oleh nilai ekstrim.
Dalam Latihan 2-5 nilaitengah sumbangan adalah $8,4, yang sangat dekat dengan modus dan
mediannya yang dalam hal ini nilainya sama yaitu $9. Tetapi bila misalnya salah satu
sumbangan bernilai jauh lebih besar, katakanlah $11 diganti dengan $90, maka
nilaitengahnya menjadi $16,30, cukup jauh lebih tinggi daripada nilai-nilai sumbangan
lainnya.
Kelebihan median adalah kemudahan menghitungnya bila banyaknya pengamatan relatif
kecil. Median tidak dipengaruhi oleh nilai ekstrim, sehingga memberikan rata-rata yang
lebih benar, yaitu 9, walaupun sumbangan tertinggi dalam latihan 5 adalah 90 dan bukan 11.
Bila dikaitkan dengan sampel yang diambil dari populasi, nilai tengah sampel lebih tidak
bervariasi dari sampel satu ke sampel lainnya dibandingkan median. Oleh karena itu, bila
kita ingin menduga pusat populasi berdasarkan sampel, nilai tenga lebih stabil dibandingkan
median. Dengan demikian, nilai tengah sampel cenderung lebih dekat pada nilai tengah
populasi dibandingkan median.
Modus merupakan ukuran yang paling jarang digunakan di antara ketiganya. Untuk gugus
data yang kecil manfaat modus hampir atau bahkan tidak ada sama sekali. Hanya dalam hal
data yang banyak ukuran ini dapat diterapkan. Ada dua sifat baiknya, yaitu (1) tidak
memerlukan perhitungan, dan (2) dapat digunakan bagi data kualitatif maupun kuantitatif
2-4 Ukuran Keragaman

Ketiga ukuran pemusatan yang dibahas pada bagian 2-2 belum memberikan deskripsi yang
mencukupi bagi data kita. Kita perlu mengetahui seberapa jauh pengamatan-pengamatan itu
menyebar dari rata-ratanya. Sangat mungkin kita memiliki dua kumpulan pengamatan yang
memiliki nilaitengah atau medianyang sama, tetapi sangat berbeda keragamannya.
Perhatikan hasil pengukuran berikut, dalam liter , dua sampel jus jeruk yang dibotolkan oleh
perusahaan A dan B:
19
Sampel A 0,97 1,00 0,94 1,03 1,11

Sampel B 1,06 1,01 0,88 0,91 1,14
Kedua sampel memiliki nilaitengah yang sama, 1,00 liter. Terlihat sangat jelas bahwa
perusahaan A membotolkan jus jeruk dengan isi yang lebih seragam daripada perusahaan B.
Kita katakan bahwa keragaman atau dispersi pengamatan dari rata-ratanya lebih kecil pada
sampel A daripada pada sampel B. Oleh karena itu, bila kita membeli jus jeruk, kita akan lebih
percaya bahwa isi botol yang kita pilih lebih mendekati pada yang diiklankan bila kita
membeli produk perusahaan A.
Statistik paling penting untuk mengukur keragaman data adalah wilayah dan ragam. Yang
paling sederhana menghitungnya adalah wilayah.
DEFINISI. Wilayah. Wilayah sekumpulan data adalah beda antara pengamatan terbesar dan
terkecil dalam kumpulan tersebut
Latihan 2-8
Nilai IQ lima anggota sebuah keluarga adalah 108, 112, 127, 118, dan 113. Tentukan
wilayahnya
Jawab.
Wilayah kelima nilai IQ tersebut adalah 127  108  19
Dalam kasus perusahaan pembotolan jus jeruk di atas, wilayah data sampel perusahaan A
adalah 0,17 liter dibandingkan wilayah sebesar 0,26 liter bagi data perusahaan B,
menunjukkan bahwa data perusahaan B lebih menyebar.
Wilayah bukan merupakan ukuran keragaman yang baik, terutama bila ukuran sampel atau
populasinya besar. Ukuran ini hanya memperhatikan kedua nilai ekstrim dan tidak
menyatakan apa-apa mengenai distribusi bilangan-bilangan yang terdapat di antara kedua
nilai ekstrim tersebut. Sebagai gambaran, perhatikan dua gugus data berikut ini, yang
keduanya mempunyai wilayah =12.
Gugus A 3 4 5 6 8 9 10 12 15
Gugus B 3 7 7 7 8 8 8 9 15
Dalam gugus A nilaitengah dan mediannya sama yaitu sebesar 8, tetapi bilangan-
bilangannya sangat bervariasi diseluruh selang dari 3 sampai 15. Dalam gugus B nilaitengah
dan mediannya juga 8, tetapi kebanyakan nilai terletak lebih dekat dengan nilai pusat data.
Meskipun wilayah tidak berhasil mengukur keragaman nilai-nilai diantara kedua ekstrim,
wilayah mempunyai penerapan yang sangat berguna. Dalam industri, wilayah bagi produk
yang baru dihasilkan dari assembly line, mungkin saja telah ditetapkan lebih dulu. Asalkan
semua pengukuran terhadap produk yang dihasilkan jatuh di dalam wilayah tersebut, proses
produksinya dikatakan terkendali.
Untuk mengatasi kekurangan yang dimiliki wilayah, kita akan membahsa sebuah ukuran
keseragaman yang lain, yaitu ragam, yang memperhatikan posisi relatif setiap pengamatan
terhadap nilai tengah gugus data tersebut. Dalam hal populasinya terhingga dan berukuran
N, ragamnya, yang dilambangkan dengan  2 (baca sigma dikuadratkan), dapat dihitung
langsung dari rumus penjumlahan berikut:
DEFINISI. Ragam Populasi. Ragam Populasi terhingga x1 , x2 , ..., x N didefinisikan sebagai

N
 x  
2
i
 
2 i 1
N
20
Bila kedua gugus data A dan B kita anggap populasi, maka ragam masing-masing adalah;
Untuk gugus data A
9
 x  8
2
i
2  i 1
9
 5   4  ...   4   7 
2 2 2 2
124
 
9 9
Sedangkan untuk gugus data B
9
 x  8
2
i
2  i 1
9
 5   1  ...  1  7 
2 2 2 2
78
 
9 9
Pembandingan kedua ragam itu menunjukkan bahwa gugus data A lebih beragam daripada
gugus data B.
Dengan menggunakan kuadrat simpangan untuk menghitung ragam, kita memperoleh suatu
besaran dengan satuan yang sama dengan kuadrat satuan semula. Jadi jika data asalnya
dalam satuan meter, maka ragamnya mempunyai satuan meter kuadrat. Agar diperoleh
ukuran keragaman yang mempunyai satuan sama dengan satuan asalnya, seperti halnya
pada wilayah, kita akarkan ragam tersebut. ukuran yang diperoleh disebut simpangan
baku.
Latihan 2-9
Nilai-nilai berikut diberikan oleh enam juri dalam suatu pertandingan senam; 7, 5, 9, 7, 8,
dan 6. Hitung simpangan baku bagi populasi ini
Jawab.
Pertama-tama kita hitung
75 97  8 6
 7
6
dan kemudian
6
 x  7
2
i
2  i 1
6
0   2  2  0  1   1
2 2 2 2 2 2
5
 
6 3
Dengan demikian simpangan bakunya adalah   5 3  1,29
Ragam suatu sampel, yang dilambangkan dengan s 2 , merupakan suatu statistika. Dengan
demikian, sampel-sampel acak berukuran n yang diambil dari populasi yang sama, pada
umumnya akan menghasilkan nilai-nilai s 2 yang berbeda. Dalam sebagian besar penerapan
prosedur statistik, parameter  2 tidak diketahui, oleh karena itu diduga dengan nilai s 2 .
Agar diperoleh nilai dugaan yang baik, nilai dugaan itu harus dihitung berdasarkan rumus
yang secara rata-rata menghasilkan parameter populasi  2 . Jadi, bila kita mengambil semua
kemungkinan sampel acak berukuran n dari suatu populasi dan untuk setiap sampel kita
hitung nilai s 2 -nya, maka rata-rata semua nilai s 2 itu sama dengan  2 . Statistika yang secara
rata-rata menduga parameter sebenarnya dikatakan bersifat takbias.
21
Secara intuisi, kita membayangkan bahwa rumus untuk s 2 mempunyai bentuk yang sama
dengan rumus untuk  2 , kecuali bahwa penjumlahan dilakukan untuk semua pengamatan
dalam sampel dan  diganti dengan x . Dan memang ini yang dilakukan dalam banyak buku
statistika. Tetapi nilai-nilai ragam sampel yang dihitung menurut rumus demikian secara
rata-rata cenderung lebih rendah dari  2 . Untuk mengatasi bias ini, kita mengganti n
dengan n  1 dalam penyebutnya.
DEFINISI. Ragam Sampel. Ragam Sampel untuk sebuah sampel acak x1 , x2 , ..., xn
didefinisikan sebagai
n
 x x
2
i
s2  i 1
n1
Latihan 2-10
Perbandingan harga kopi dalam bungkus 200 gram di empat toko kelontong yang dipilih
secara acak menunjukkan kenaikan dari harga bulan sebelumnya sebesar 12, 15, 17, dan
20 sen. Hitunglah ragam sampel kenaikan harga kopi ini.
Jawab.
Nilai tengah sampel kita peroleh dari perhitungan
12  15  17  20
x  16
4
dengan demikian
4
 x  16 
2
i
s2  i 1
3
12  16  15  16  17  16  20  16 
2 2 2 2

3
 4   1  1   4
2 2 2 2

3
34

3
Bila merupakan bilangan desimal yang telah dibulatkan, kita akan banyak menumpuk
kesalahan bila mengguanakan rumus ragam sampel di atas. Untuk menghindari ini, baiklah
kita turunkan sebuah rumus hitung yang banyak digunakan, seperti yang dicantumkan
dalam dalil berikut ini.
DALIL 2-1. Ragam Hitung bagi s2. Bila s 2 adalah ragam suatu sampel acak berukuran n ,
maka
2
n
 n 
n x    xi  2
i
s 2  i 1  i 1 
n  n  1
Bukti. Menurut definisi
 x 
n n
  xi  x 
2
i
2
 2xi x  x 2
s  2 i 1
 i 1
n 1 n 1
22
Dengan menerapkan Dalil 1-1 sampai 1-3, kita mendapatkan
 
n n
n xi2 2x  xi  nx 2
s2  i 1 i 1
n 1
n
xi
Selanjutnya gantilah x dengan n
i 1
dan gandakan baik pembilang maupun penyebut
dengan n untuk mendapatkan

2
 n 
n
n x    xi  2
i
s 2  i 1  i 1 
n  n  1
Simpangan baku sampel, dilambangkan dengan s , didefinisikan sebagai akar ragam
sampel.
Latihan 2-11
Carilah ragam bagi data 3, 4, 5, 6, 6, dan 7, yang merupakan banyaknya ikan trout yang
tertangkap oleh 6 nelayan yang diambil secara acak pada tanggal 19 Juli .
Jawab.
Kita susun data tersebut dalam bentuk tabel
xi x i2
3 9
4 16
5 26
6 36
6 36
7 49
31 171 6
Dengan demikian
6171  31
2
13
s 2
 
6  5 6
Seringkali kita dapat menyederhanakan prosedur penghitungan ragam segugus data dengan
mengkodekan lebih dulu. Ingat bahwa pengkodean telah digunakan pada penbahasan
perhitungan nilai tengah. Pengaruh pengkodean, yang berupa pengurangan suatu konstanta
dari setiap pengamatan atau membagi setiap pengamatan dengan suatu konstanta, terhadap
ragam sangat menarik perhatian kita. Di sini kita menyelidiki kedua pengaruh itu hanya pada
sampel acak, tetapi hasilnya dapat dibuktikan berlaku pula bagi populasi.
Bila kita misalkan yi  xi  c , maka y  x  c , sehingga ragam bagi yi adalah
n n
 y  y   x  c    x  c  
2 2
i i
s2  i 1
 i 1
 n  1  n  1
n
 x x
2
i
 i 1
 n  1
23
Jadi, bila setiap pengamatan suatu gugus data ditranspformasikan dengan cara
menambahkan atau mengurangkan suatu konstanta c, maka ragam data hasil transformasi
itu sama dengan ragam data asalnya.
Sekarang misalkan yi  cxi , maka y  cx , maka ragam semua yi tersebut adalah
n n
  yi  y    cx  cx 
2 2
i
s 
2 i 1
 i 1
 n  1  n  1
n
c 2   xi  x 
2
 i 1
 n  1
Jadi, bila segugus data ditransformasikan menjadi suatu data yang baru dengan
menggandakan (atau membagi) setiap pengamatan dengan sebuah konstanta c , maka ragam
data semula sama dengan ragam data baru dibagi (atau digandakan) dengan c 2 .
Latihan 2-12
Sebuah sampel acak yang terdiri dari lima direktur bank menunjukkan gaji tahunan
sebesar 63.000, 48.000, 52.000, 35.000, dan 41.000. Hitung ragam data ini dengan
mengkodekan datanya lebih dulu.
Jawab.
Bila semua gaji itu kita bagi dengan 1000 dan hasilnya dikurangi 50, maka kita
memperoleh bilangan baru 13, -2, 2, -15, dan -9. Untuk data ini
5 5
 xi  1 dan
i 1
x
i 1
2
i  623
sekarang, untuk data yang telah dikodekan tersebut

5623   1
2
s 2
  155,7
5 4
dan, setelah digandakan dengan 10002 kita memperoleh ragam semula yaitu:
s2  1,557 x 10008
Simpangan baku merupakan ukuran keragaman terbaik yang kita miliki,. Tetapi, sampai
yang telah kita pelajari ini, ragam hanya dapat dibandingkan untuk data yang memiliki
satuan pengukuran yang sama dan nilai tengah yang hampir sama. Itulah sebabnya, kita
dapat membandingkan ragam data yang berasal dari dua perusahaan pembotolan jus jeruk.
Nilai ragam yang lebih besar berarti bahwa produk perusahaan tersebut lebih bervariasi dan
kurang seragam isinya, asalkan botol yang digunakan sama besarnya. Tentu saja tidak ada
maknanya untuk membandingkan ragam data tinggi badan dengan data skor tes bakat.
2-5 Dalil Chebysev

Dalam bagian sebelumnya kita menerangkan sekumpulan data, baik populasi maupun
sampel, dengan apa yang disebut pusat atau rata-rata dan keragaman di sekitar rata-rata ini.
Dua nilai yang paling sering digunakan oleh statistikawan adalah nilaitengah dan simpangan
baku. Bila distribusi data hasil pengukuran mempunyai simpangan baku yang kecil, kita akan
membayangkan bahwa sebagian besar data menumpul di sekitar nilaitengahnya.
Sedangkan, nilai simpangan baku yang besar menunjukkan keragaman yang besar; dalam
hal ini pengamatan-pengamatan lebih terdistribusi jauh dari nilaitengahnya.
Ahli matematika berkebangsaan Rusia, P. L. Chebysev (1821-1894), menemukan bahwa
proporsi pengukuran yang jatuh antara dua nilai yang setangkup terhadap nilaitengahnya
24
berhubungan dengan simpangan bakunya. Dalil Chebysev memberikan dugaan yang

konservatif terhadap proporsi data yang jatuh dalam k simpangan baku dari nilaitengahnya,
untuk suatu bilangan tetap k tertentu.
DALIL 2-2. Dalil Chebysev. Sekurang-kurangnya 1  1 bagian data terletak dalam k

k2
simpangan baku dari nilaitengahnya
Untuk k  2 , dalil itu mengatakan bahwa sekurang-kurangnya 1 - ½2 = ¾ atau 75%, bagian

data pasti terletak dalam batas-batas 2 simpangan baku pada kedua sisi nilaitengahnya. Jadi
¾ atau lebih bagian bagian pengamatan suatu populasi pasti terletak dalam selang   2 .
Bila data kita merupakan sampel, maka untuk k  2 dalil itu menyatakan bahwa sekuarng-
kurangnya ¾ bagian data pasti terletak dalam selang x  2s . Begitu pula dalil itu mengatakan
bahwa sekurang-kurangnya 8/9 atau 88,9% bagian data pasti terletak dalam selang   3
untuk populasi atau x  3s untuk sampel. Untuk k  1 dalil ini tidak banyak membantu.
Latihan 2-13
Misalkan data IQ suatu sampel acak 1000 mahasiswa suatu universitas yang besar
mempunyai nilai tengah 120 dan simpangan baku 8. gunakan dalil Chebysev untuk
menentukan selang yang mengandung sekurang-kurangnya 810 IQ semua mahasiswa di
universitas tersebut. Tentukan wilayah yang kita yakin tidak lebih dari 120 IQ yang
berada di dalamnya.
Jawab.
Dengan memecahkan persamaan
1 810 3
1 2  
k 1080 4
kita memperoleh k  2 , dan
x  2s  120  2 8  120  16
Jadi selang dari 104 sampai 136 mengandung sekurang-kurangnya ¾ atau sekurang-
kurangnya 810 IQ dalam sampel kita. Dari hasil ini kita menyimpulkan bahwa sekurang-
kurangnya ¾ dari semua IQ mahasiswa di Universitas tersebut terletak dalam selang 104
sampai 136. Jika
1 960 8
1 2  
k 1080 9
maka k  3 dan sekurang-kurangnya 8/9 atau sekurang-kurangnya 960 IQ dalam contoh
terletak dalam selang 120  3 8 , atau 96 sampai 144. Jadi tidak lebih dari 120 jatuh
dibawah 96 atau di atas 144
Dalil Chebysev berlaku untuk sembarang sebaran data dan karena alasan inilah, pernyataan-
pernyataan yang dihasilkan tidak kuat. Nilai yang dihasilkan oleh dalil ini hanya merupakan
batas bawah saja. Artinya, kita mengetahui bahwa tidak kurang dari ¾ bagian data terletak
dalam batas-batas dua simpangan baku pada kedua sisi nilai tengahnya. Tetapi dengan dalil
ini kita tidak pernah mengetahui apakah terdapat jauh lebih banyak dari ¾ bagian data
dalam selang tersebut, kecuali dengan menghitung langsung selangnya dan mencacah
banyaknya pengamatan di dalamnya. Pada pembahasan selanjutnya kita akan melihat
bahwa untuk sekumpulan data yang besar, pernyataan-pernyataan yang lebih kuat dapat
diperoleh.
25
2-6 Nilai z
Ketika mengevaluasi prestasi seorang mahasiswa dalam mata kuliah kimia dan ekonomi
pada suatu semester, kita mungkin ingin membandingkan nilai yang dicapai untuk kedua
mata kuliah tersebut. Seandainya dalam kimia ia memperoleh 82 dan daklam ekonomi 89,
dapatkah kita menyimpulkan bahwa ia berprestasi lebih baik dalam mata kuliah ekonomi
daripada dalam kimia? Mungkin ada baiknya kita mempertimbangkan tampilan relatif
mahasiswa ini dibandingkan dengan mahasiswa-mahasiswa lain di kelasnya dalam kedua
mata kuliah tersebut. Tidakkah sesungguhnya mungkin bahwa ujian yang satu relatif lebih
sulit daripada ujian lainnya? Dan sesungguhnya mungkin saja mahasiswa tersebut
berprestasi lebih baik relatif terhadap teman-temannya dalam kimia daripada yang
dicapainya dalam ekonomi. Dan ternyata, misalnya, nilaitengah hasil ujian kimia adalah 68
dengan simpangan baku 8, sedangkan distribusi hasil ujian ekonomi bernilaitengah 80
dengan simpangan baku 6.
Jadi, masalah yang kita hadapi adalah bagaimana membandingkan dua pengamatan dari dua
populasi yang berbeda., sehingga kita dapat menentukan tingkatan atau rank relatifnya.
Dalam gambaran kita ini, hasil ujian kimia membentuk satu populasi, sedangkan hasil ujia
ekonomi menyusun populasi lan lagi, dan kedua nilai mahasiswa tersebut merupakan
pengamatan dari edua populasi di atas. Salah satu cara untuk menentukan tingkatan kedua
pengamatan tersebut adalah dengan mengubahnya menjadi satuan baku yang dikenal
dengan nilai z atau skor z .
DEFINISI. Nilai z. Suatu pengamatan x dari suatu populasi yang mempunyai nilaitengah 
dan simpangan baku  , mempunyai nilai z atau skor z yang didefinisikan sebagai
x
z

Nilai z mengukur berapa simpangan baku sebuah pengamatan terletak di atas atau di bawah
nilai tengahnya. Karena  tidak pernah negatif, nilai z yang positif mengukur berapa
simpangan baku letak suatu pengamatan di atas nilai tengahnya, sedangkan nilai z negatif
mengukur berapa simpangan baku letak suatu pengamatan di bawah nilai tengahnya.
Perhatikan bahwa satuan pada pembilang dan penyebut nilai z itu saling menghapuskan.
Oleh karena itu nilai z tidak mempunyai satuan, dan ini memungkinkan dilakukannya
pembandingan dua pengamatan relatif terhadap kumpulan induknya, yang diukur dalam
satuan yang sama sekali berbeda.
Baiklah sekarang kita hitung nilai z hasil ujian dua mata kuliah kimia dan ekonomi bagi
mahasiswa di atas. Untuk kimia kita memperoleh
82  68
z  1,75
8
dan untuk ekonomi
89  80
z  1,50
6
Ternyata dalam kimia mahasiswa tersebut berada 1,75 simpangan baku di atas nilai tengah
nilai ujian kimia, sedangkan dalam ekonomi ia hanya berada 1,50 simpangan baku di atas
nilai tengah ujian ekonomi. Dengan membandingkan nilai z kedua mata kuliah tersebut, kita
dapat mengatakan bahwa tampilan relatif mahasiswa tersebut dalam kimia lebih baik
daripada tampilan relatifnya dalam ekonomi.
26
Latihan 2-14
Keterampilan mengetik yang berbeda diperlukan bagi sekretaris, tergantung apakah ia
bekerja pada suatu kantor yangbergerak dalam bidang hukum, akuntansi, atau suatu
lembaga penelitian matematika di suatu universitas yang besar. Untuk mengevaluasi
calon bagi ketiga posisi tersebut, suatu lembaga tenaga kerja mengadakan tiga macam tes
yang berbeda. Untuk setiap kesalahan pengetikan dikenakan hukuman waktu. Nilai
tengah dan simpangan baku bagi masing-masing tes tersebut dicantumkan dalam Tabel
2-1 kolom 3 dan 4. Pada kolom kedua tabel tersebut dicantumkan pula skor yang dicapai
oleh seorang pelamar baru.
Tabel 2-1
Data untuk Contoh Ketikan yang Telah Dibakukan
Contoh Skor pelamar Nilai tengah Simpangan Baku
Hukum 141 detik 180 detik 30 detik
Akuntansi 7 menit 10 menit 2 menit
Ilmiah 33 menit 26 menit 5 menit
Untuk posisi apakah pelamar ini tampaknya paling cocok ditempatkan?

Jawab.
Pertama-tama kita hitung nilai z untuk masing-masing tes tersebut:
141  180
Hukum z  1,3
30
7  10
Akuntansi z  1,5
2
33  26
Ilmiah z  1,4
5
Karena kecepatan merupakan pertimbangan utama, kita mencari nilai z yang berada
paling jauh di sebelah kiri nilai tengahnya, dan bagi calon ini yaitu -1,5. Dengan demikian,
prestasi pelamar ini relatif lebih tinggi di antara pengetik-pengetik di perusahaan
akuntansi daripada di antara dua bidang lainnya, dan akibatnya ia sebaiknya ditempatkan
di perusahaan akuntansi.
2-7 SUPLEMEN
1. Banyaknya jawaban yang salah pada suatu quiz dengan soal benar-salah dari lima belas
siswa yang dipilih secara acak adalah 2, 1, 3, 0, 1, 3, 6, 0, 3, 3, 5, 2, 1, 4, dan 2. Tentukanlah
a. Median
b. Nilai tengah
c. Modus
2. Banyaknya izin mendirikan bangunan yang dikeluarkan bagi dua belas perusahaan
adalah 4, 7, 0, 7, 11, 4, 1, 15, 3, 5, 8, dan 7. Dengan memandang data itu adalah populasi,
hitunglah:
a. Nilai tengah
b. Median
c. Modus
d. Wilayah
e. Ragam
3. IQ rata-rata sepuluh mahasiswa yang mengambil kuliah statistik adalah 114. Bila
sembilan mahasiswa diantaranya memiliki IQ 101, 125, 118, 128, 106, 115, 99, 118, dan
109. Berapa IQ mahasiswa yang satu lagi?
27
4. Lama reaksi terhadap suatu rangsangan tertentu dari sembilan individu yang diambil
secara acak adalah: 2,5; 3,6; 3,1; 4,3; 2,9; 2,3; 2,6; 4,1; dan 3,4 detik. Hitunglah
a. Nilai tengah
b. Modus
c. Wilayah
d. Ragam
5. Banyaknya gol yang dibuat oleh suatu tim lacrose selama musim kompetisi yang lalu
adalah 4, 9, 0, 1, 3, 24, 12, 3, 30, 12, 7, 13, 18, 4, 5, dan 15. Dengan menganggap data itu
sebagai populasi, hitunglah simpangan bakunya.
6. Nilai mutu rata-rata 20 mahasiswa tingkat akhir yang diambil secara acak adalah
sebagai berikut:
3,2 1,9 2,7 2,4
2,8 2,9 3,8 3,0
2,5 3,3 1,8 2,5
3,7 2,8 2,0 3,2
2,3 2,1 2,5 1,9
Hitunglah simpangan bakunya
7. Periksalah bahwa ragam bagi sampel 4, 9, 3, 6, 4, dan 7 adalah 5,1 dan dengan
menggunakan hasil ini hitunglah
a. Ragam bagi sampel acak 12, 27, 9, 18, 12, dan 21
b. Ragam bagi sampel acak 9, 14, 8, 11, 9, dan 12
8. Bila distribusi IQ semua mahasiswa di Berau bernilai tengah   123 dengan simpangan
baku   9 , gunakan dalil Chebysev untuk menentukan selang yang mengandung:
(a) Sekurang-kurangnya ¾ dari seluruh IQ tersebut;
(b) Tidak lebih dari 1/9 dari seluruh IQ tersebut.
9. Sebuah mesin penyeduh kopi diatur sehingga secara rata-rata memerlukan waktu 5,8
menit untuk menyeduh segelas kopi dengan simpangan baku 0,6 menit. Menurut Dalil
Chebysev, tentukan presentase bahwa waktu yang diperlukan bagi mesin ini untuk
menyeduh segelas kopi terletak antara
a. 4,6 menit sampai 7,0 menit
b. 3,4 menit sampai 8,2 menit
c. 4,3 menit sampai 7,3 menit
10. Jane bekerja di sebuah perusahaan yang karyawannya secara rata-rata berpendapatan
$28.000 selama tahun lalu dengan simpangan baku $3000. Berapa pendapatan Jane
pada tahun lalu bila nilai z-nya sebesar -0,8
28

BAB 2 Ukuran Statistik Data

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

BAB 2 Ukuran Statistik Data

Diunggah oleh

Hak Cipta:

Format Tersedia

Ukuran

Setelah mempelajari bab ini, mahasiswa diharapkan dapat:

 menguraikan berbagai ukuran penempatan pusat dan tidak pusat

2-2 Parameter dan Statistik

2-3 Ukuran Pemusatan

DEFINISI. Nilaitengah Sampel. Misalkan x1 , x2 , ..., x N tidak harus semuanya berbeda,

2-4 Ukuran Keragaman

Sampel A 0,97 1,00 0,94 1,03 1,11

DEFINISI. Ragam Populasi. Ragam Populasi terhingga x1 , x2 , ..., x N didefinisikan sebagai

Bukti. Menurut definisi

Dengan menerapkan Dalil 1-1 sampai 1-3, kita mendapatkan

dengan n untuk mendapatkan

sekarang, untuk data yang telah dikodekan tersebut

2-5 Dalil Chebysev

berhubungan dengan simpangan bakunya. Dalil Chebysev memberikan dugaan yang

DALIL 2-2. Dalil Chebysev. Sekurang-kurangnya 1  1 bagian data terletak dalam k

Untuk k  2 , dalil itu mengatakan bahwa sekurang-kurangnya 1 - ½2 = ¾ atau 75%, bagian

Untuk posisi apakah pelamar ini tampaknya paling cocok ditempatkan?

Anda mungkin juga menyukai