Arsip Blog
▼ 2009 (16)
o ► 09/06 - 09/13 (2)
o ▼ 09/20 - 09/27 (5)
Tugas Metode Penelitian
DISTRIBUSI PROBALITA NORMAL DAN BINOMIAL
NILAI SENTRAL DAN UKURAN PENYIMPANGAN
Diskusi StatistikaEkonomi I
Tugas Teori Ekonomi Mikro
o ► 10/04 - 10/11 (4)
o ► 10/11 - 10/18 (5)
Mengenai Saya
UKURAN DATA
Data berkelompok adalah data yang sudah dikelompokkan sehingga besaran data aslinya dapat
tidak kelihatan lagi dan berubah menjadi besaran data atau mewakili kelompoknya. Data tak
berkelompok tersebut di atas, untuk kemudahan, dapat dijadikan data berkelompok seperti di
bawah ini.
Gaji bersih 120 Karyawan PT Karya Guna Abadi (x Rp 1.000)
Data tak berkelompok adalah data yang belum dikelompokkan, masih bebas atau seadanya
= rata-rata
= (sigma) = jumlah
X = nilai data masing-masing sample
n = banyaknya sampel
Contoh (1):
Data: 10 8 11 7 12 15 6 7 5 6 7 9 7 3 7
(n = 15)
Rata-rata dari data tersebut adalah:
= 10+8+11+7+12+15+6+7+5+6+7+9+7+3+7 = 8
15
Rata-rata hitung
Ternyata, rata-rata hitung dari data yang sama, baik yang tidak dikelompokkan maupun
dikelompokkan hasilnya sama yaitu Rp. 1.262.500.
Rata-rata hitung tidak selalu dapat dipakai dengan baik mewakili suatu kelompok nilai. Jadi, jika
tiga SMU mempunyai nilai rata-rata yang sama untuk ujian matematika dari murid-muridnya,
misalnya 7, itu tidak berarti mutu pengajaran matematika dari ketiga SMU tersebut sama pula.
Dari angka-angka pada tabel tersebut di atas, terlihat bahwa rata-rata 7 untuk SMU I, SMU II
dan SMU III berasal dari nilai-nilai yang derajat homogenitasnya tidak sama. Nilai-nilai yang
dimiliki SMU I betul-betul sempurna homogen (semuanya 7), sedangkan nilai-nilai yang dimiliki
SMU II sudah kurang homogen lagi, dan untuk SMU III nilai-nilainya sudah menjadi semakin
tidak homogen lagi atau heterogen. Dengan kata lain, secara kasar, nilai rata-rata SMU I dan
SMU II masih dapat dianggap mewakili seluruh nilai yang ada dalam kelompoknya, akan tetapi
nilai rata-rata yang dimiliki SMU III kelihatannya kurang atau tidak bisa mewakili nilai-nilai
dalam kelompoknya karena sifatnya heterogen (sangat bervariasi).
Di sini terlihat bahwa, sepanjang berdasarkan data tersebut di atas dan tanpa
mempertimbangkan faktor-faktor lainnya, mutu pengajaran matematika di SMU I adalah yang
paling baik, diikuti oleh SMU II dan yang paling buruk adalah SMU III.
Nilai rata-rata hitung akan dengan baik mewakili nilai-nilai yang sifatnya relatif homogen dalam
kelompoknya. Jika nilai-nilai dimaksud relatif sudah tidak homogen lagi atau heterogen,
biasanya digunakan nilai median untuk mewakili kelompoknya.
Median adalah suatu nilai yang membagi data yang diobservasi menjadi dua bagian yang sama,
setelah data tersebut disusun dari urutan yang terbesar sampai yang terkecil atau sebaliknya.
Setengah dari nilai-nilai yang ada besarnya sama atau lebih kecil dari nilai median, sedangkan
setengah lainnya besarnya sama atau lebih besar dari nilai median.
Contoh:
Data asli (belum diurutkan):
4 8 6 10 2 3 5 7 9 5 3 12 5 15 9
6
Data setelah diurutkan mulai dari yang terkecil:
2 3 3 4 5 5 5 7 8 9 9 10 12 15
7 nilai 7 nilai
6
Data setelah diurutkan mulai dari yang terbesar:
15 12 10 9 9 8 7 5 5 5 4 3 3 2
Jika jumlah datanya ganjil, Med berada tepat di tengah-tengah. Seperti dalam contoh di atas,
jumlah data ada 15, nilai Med ada pada data yang ke -8.
Bagaimana jika jumlah datanya genap?
Contoh (sudah diurut):
11
2 5 9 10 12 15 17 20 (jumlah data ada 8 = genap)
4 nilai 4 nilai
Modus ialah suatu nilai yang mempunyai frekuensi terbesar, atau nilai yang paling sering
terjadi.
Contoh: Nomor-nomor sepatu pria yang dipakai di tiga daerah yang diambil dari masing-masing
10 sampel.
Penjelasan:
Daerah 1 mempunyai Modus sebanyak 2 buah, yaitu nomor 40 dan 41.
Daerah 2 hanya mempunyai 1 Modus, yaitu nomor 42.
Daerah 3 mempunyai 3 Modus, yaitu nomor 38, 40 dan 41.
Jadi, nilai modus tidak selalu tunggal, tetapi bisa 2,3 atau lebih lagi, bahkan bisa terjadi ada
data yang tidak mempunyai modus sama sekali.
Bayangkan jika data tersebut di atas adalah hasil survey sebuah perusahaan sepatu, yang
memproduksi jumlah terbesar sepatunya berdasarkan nomor rata-ratanya. Jadi, walaupun data
sifatnya homogen, tapi dalam kasus tersebut, tidak benar jika digunakan nilai rata-rata atau
nilai mediannya.
SIMPANGAN BAKU (UKURAN PENYEBARAN DATA)
Untuk data sampel, simpangan baku disebut dengan S dan varians-nya disebut dengN S 2
(pangkat dua dari simpangan baku, merupakan statistik). Untuk data populasi, simpangan baku
disebut dengan σ (tho) dan varians-nya disebut dengan σ 2.
Simpangan baku biasa disebut deviasi standar. Pangkat dua dari simpangan baku dinamakan
variasi.
Contoh menghitung simpangan baku:
Nilai Ujian Matematika
No. Murid
SMU I SMU II SMU III
X ŝ-x (ŝ-x)2 x ŝ-x (ŝ-x)2 x ŝ-x (ŝ-x)2
1 7 0 0 7 0 0 8 +1 +1
2 7 0 0 6 -1 +1 8 +1 +1
3 7 0 0 5 -2 +4 5 -2 +4
4 7 0 0 8 +1 +1 9 +2 +4
5 7 0 0 7 0 0 10 +3 +9
6 7 0 0 9 +2 +4 6 -1 +1
7 7 0 0 7 0 0 3 -4 +16
8 7 0 0 6 -1 +1 4 -3 +9
9 7 0 0 7 0 0 8 +1 +1
10 7 0 0 8 +1 +1 9 +2 +4
Jumlah 70 0 0 70 0 +12 70 0 +50
Rata-rata 7 7 7
Simpangan baku SMU I =
Jika Mean mengukur rata-rata sekelompok data, Median mengukur titik tengah data, maka
Modus mengukur ’pusat’ data dengan mendeteksi nilai data yang paling sering muncul. Secara
logika, jika data mempunyai nilai-nilai yang sama, maka jelas Mean sama persis dengan
Median, dan Median juga sama persis dengan Modus.
Sebagai contoh, berikut nilai sekelompok data yang sama:
5 5 5 5 5 5
Dari data di atas, maka:
Mean jelas bernilai 5, karena semua nilai sama, yakni 5
Median juga bernilai 5, karena diurutkan ke manapun, nilainya juga tetap 5
Modus juga bernilai 5, karena nilai yang terbanyak muncul juga cuma satu yakni 5
Jadi untuk data yang ’ideal’ seperti di atas, atau untuk data yang berdistribusi normal
(penjelasan distribusi normal lihat modul lainnya), berlaku ketentuan :
Namun demikian, tidak semua data mempunyai nilai seperti itu, atau mesti berdistribusi normal.
Banyak data dalam praktek yang cukup bervariasi, sehingga bisa agak menceng ke kiri atau
menceng ke kanan (penjelasan kemencengan lihat modul lain di belakang).Untuk data dengan
kemencengan yang moderat, hubungan antara Mean, Median dan Modus secara umum adalah :
Dengan ketentuan:
JIKA DISTRIBUSI DATA CENDERUNG MENCENG KE KANAN (RIGHT SKEWED).
Modus Median Mean
Gambar Distribusi yang Right Skewed
Untuk data yang agak menceng ke kiri, maka nilai Mean lebih besar dari Modus.
JIKA DISTRIBUSI DATA CENDERUNG MENCENG KE KIRI (LEFT SKEWED)
Untuk data yang agak menceng ke kiri, maka nilai mean lebih kecil dari Modus. Namun
demikian, baik pada distribusi yang menceng ke kanan atau menceng ke kiri, nilai Median tetap
terletak di tengah pada kedua janis distribusi data tersebut. Maka pada distribusi data yang
menceng secara moderat, seharusnya Median adalah alat ukur central tendency yang paling
akurat (tepat) untuk menggambarkan karakteristik data. Walau demikian, dalam praktek
penilaian secara subjektif serta pertimbangan kepopuleran alat lebih menentukan manakah alat
ukur central tendency yang akan digunakan.
Kasus 1:
Sebagai contoh, data temperatur udara di sembilan kota di Pulau Jawa dalam sebulan terakhir:
Kota Temperatur (oC)
Malang 21
Surabaya 24
Yogyakarta 26
Bandung 23
Semarang 27
Jakarta 28
Magelang 23
Solo 23
Cirebon 25
Keterangan:
Temperatur Kota Malang dalam sebulan terakhir rata-rata adalah 21 oC. Demikian seterusnya
untuk pengertian data lainnya.
Mean
Rata-rata temperatur di sembilan kota tersebut adalah :
Median
Karena data tidak berkelompok, maka dilakukan proses:
Mengurutkan data tersebut, misal dari terkecil-terbesar (ascending), sehingga menjadi :
Urutan Urutan 2 Urutan 3 Urutan 4 Urutan 5
1
21 23 23 23 24
Urutan Urutan 7 Urutan 8 Urutan 9
6
25 26 27 28
Dari tabel array (urutan) di atas terlihat urutan ke 5 adalah 24. Dengan demikian, Median dari
Temperatur adalah 240C.
Modus
Untuk data tidak berkelompok, sama dengan perlakuan terhadap Median, data diurutkan
terlebih dahulu, sehingga menjadi seperti yang terlihat pada tabel di atas (lihat urutan pada
Median). Modus adalah data yang paling sering keluar, yang jika dilihat pada tabel di atas
adalah angka 23, yang berjumlah 3 buah. Dengan demikian Modus Temperatur adalah 23 0C.
Perhatikan nilai Modus dengan persamaan di atas, yang menghasilkan temperatur 23,11 0C.
Bandingkan dengan penghitungan Modus sebelumnya, (23 0C) yang hanya berselisih sedikit
dengan perhitungan menggunakan hubungan Mean, Median dan Modus.
Catatan:
Karena modus (23,11) lebih kecil dari Mean (24,44), maka distribusi data relatif menceng ke
kanan.
Kasus 2:
Kasus sama dengan kasus pada modul MODUS.
Berikut data usia 15 orang karyawan sebuah perusahaan (dalam satu tahunan)
24 24 29
26 21 30
25 24 20
24 24 26
26 25 28
Modus atau data terbanyak adalah 24 tahun, yakni sejumlah 5 buah.
Median atau titik tengah data. Karena jumlah data ganjil, maka median ada pada tengah data,
atau urutan ke 8 yakni 25 tahun.
Mean atau rata-rata hitung, yang bisa dicari dengan rumus :
Hal ini berarti distribusi data di atas tidak bisa dikatakan simetris atau normal. Namun demikian
perbedaan tersebut tidaklah besar, sehingga bisa juga dikatakan distribusi data tersebut
menceng secara moderat. Tingkat kemencengan bisa diukur dari Koefisien Pearson:
Hasil +0,4 berrati distribusi menceng ke kanan (karena tanda positif) dan secara moderat,
karena angka 0,4 masih di bawah 1.