Oleh :
Nama
: Ikin Sodikin
NIM
: 156090500111001
Tanggal
JURUSAN STATISTIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS BRAWIJAYA MALANG
2015
BAB IV
PENARIKAN CONTOH DARI SEBUAH POPULASI NORMAL
4.1 PENDAHULUAN
Penghitungan statistik-statistik yang banyak digunakan seperti
, dan s sebagai ukuran
pemusatan dan penyebaran telah dibicarakan. Bila dihitung sebagai contoh,
merupakan
nilai dugaan tak-bias bagi parameter populasi dan (salah satu sifat penduga yang mengharuskan
nilai tengah semua kemungkinan nilai dugaan dari suatu penduga sama dengan parameter yang
diduga), sedangkan s adalah nilai dugaan berbias bagi (karena pembaginya n-1, bukan n).
Simpangan baku nilai tengah dapat diduga dari pengamatan-pengamatan contoh melalui rumus
Meskipun
merupakan nilai dugaan tak bias bagi dan
, tetapi kecil sekali
kemungkinannya sama dengan parameter itu sendiri. Oleh karena itu, disarankan untuk membuat
selang kepercayaan di sekitar
dengan memanfaatkan sebaran t, sehingga memberikan
keyakinan yang cukup berarti bahwa atau
berada di dalam selang ini. Dengan cara tersebut
akan diperoleh proporsi selang yang mencakup , disebut sebagai peluang kepercayaan (confidence
probability) atau koefisien kepercayaan (confidence coefficient).
Metode empirik, sejauh ini, digunakan untuk memperoleh hasil-hasil berdasarkan teorema-teorema
dan prosedur-prosedur matematik dengan tingkat ketelitian yang memadai melalui penarikan
contoh berskala besar. Bab ini akan menjelaskan penggunaan penarikan contoh sebagai metode
untuk memeriksa sebaran sejumlah statistik dan prosedur pembuatan selang kepercayaan.
4.2 POPULASI NORMAL
# SEBARAN NORMAL
Sebaran normal merupakan salah satu bentuk sebaran yang sangat penting dalam teori maupun
penerapan statistika. Bentuk sebarannya menyerupai genta atau lonceng, dan disebut juga sebagai
kurva Gauss. Lokasi pusat kurva ini terletak pada dan gemuk kurusnya kurva bergantung pada
besarnya . Nilai
yang kecil akan menyebabkan kurvanya tinggi dan ramping, sebaliknya akan
menyebabkan kurvanya pendek dan gemuk. Sebaran normal termasuk ke dalam sebaran peubah
acak kontinu (dalam bentuk decimal dan biasanya dapat diukur, spt tinggi badan, berat badan, luas
lahan dan sejenisnya).
Berikut ini beberapa karakteristik atau ciri dari sebaran normal :
1) Karakteristik yang paling kasat mata adalah bentuk dari sebaran normal. Seperti yang
disebutkan sebelumnya bahwa sebaran Normal berbentuk lonceng (bell-shaped).
2) Simetris; simetris terhadap rata-ratanya. Rata-rata ini ditunjukkan oleh 'midpoint' di Gambar
N.1.
3) Rata-rata, modus, dan median terletak pada satu titik yang sama. Titik ini ditunjukkan oleh
'midpoint' di Gambar N.1. Note: nilai rata-rata yang dimaksud adalah rata-rata hitung atau
aritmetik; yakni rata-rata yang pada umumnya = jumlah seluruh data dibagi banyaknya data.
4) Keseluruhan luas di bawah kurva normal bernilai 1. (Hal ini dapat dipahami dari konsep
sebaran peluang: contoh sebaran peluang yang jumlah peluang muncul A dan peluang
muncul G dari pelemparan sebuah koin adalah 1 ).
5) Asimptotic: kurva normal bersifat asimtot; maksudnya adalah kurva akan mendekati sumbu
horizontal namun tidak pernah menyentuhnya (seperti diperlihatkan pada Gambar N.2).
6) Ukuran lokasi dan dispersi ditunjukkan oleh nilai rata-rata () dan standar deviasi ().
Berikut ini ditampilkan beberapa gambar terkait kurva normal (diambil dari powerpoint yang tidak
menyebutkan sumber sehingga tidak dapat mencantumkan sumbernya di sini) :
Gambar N.4. berikut ini memperjelas bahwa semakin kecil sigma, maka semakin mengerucut data ke
nilai tengah.
Pada pembahasan sebelumnya telah dijelaskan bahwa seseorang tidak dapat mengambil suatu
contoh acak jika tidak menggunakan suatu proses mekanik. Proses mekanik untuk mendapatkan
contoh acak atau memasukkan unsur keacakan dalam suatu percobaan atau survey biasanya
menggunakan suatu tabel bilangan teracak seperti Tabel A.1. Tabel ini tersusun dari angka-angka
0,1,2,3,..9 yang disusun dalam bentuk 100 baris dengan masing-masingnya 100 angka; jadi secara
keseluruhan ada 10000 angka acak. Angka-angka ini dihasilkan oleh sebuah computer sedemikian
rupa sehingga tidak ada alasan untuk mengharapkan bahwa suatu bilangan tertentu muncul lebih
sering daripada bilangan lainnya. Atau suatu sekuens bilangan muncul lebih sering daripada sekuens
lainnya, kecuali karena kebetulan.
Prosedur pengambilan contoh acak dengan menggunakan tabel A.1 demikian bersifat acak, setara
dengan mengambil sampel dari sebuah kantung yang berisi 100 gulungan kertas kecil yang
bertuliskan nilai pengamatan. Setiap kertas dikembalikan lagi setelah dicatat angkanya, untuk
kemuadian diasuk sebelum pengambilan berikutnya. Sehingga, penarikan contoh ini dikatakan
dengan pemulihan (with replacement). Setiap pengamatan mungkin terambil lebih dari sekali.
Penarikan contoh selalu berasal dari populasi yang sama dan peluang terpilihnya suatu pengamatan
secara praktis sama. Prosedur ini pada hakikatnya sama seperti mengambil contoh dari sebuah
populasi tak terhingga.
Penarikan contoh acak tidak boleh dilakukan secara subjektif, tetapi harus merupakan akibat dari
suatu metode yang objektif dan lebih disukai yang mekanik. Contohnya adalah dengan
menggunakan Tabel Acak A.1 tersebut tadi. Agar mudah, setiap individu dalam populasi diberi
nomor urut.
4.4 SEBARAN NILAI TENGAH CONTOH
Sebaran nilai tengah contoh dapat dilihat dengan cara menyusun tabel frekuensi dari penarikan
sejumlah contoh acak yang terdiri dari n pengamatan. Dengan lebar selang yang ditentukan, tabel
frekuensi yang disusun tersebut menonjolkan beberapa ciri dari penarikan contoh, yaitu :
a) Sebaran nilai-tengah mendekati normal; Teori mengatakan bahwa walaupun populasi
induknya menyimpang dari normal, sebaran nilai-tengah contoh cenderung mendekati
normal bila ukuran contohnya semakin besar. Hal ini sangat penting, karena dalam
penerapannya, bentuk sebaran populasi induk jarang sekali diketahui.
b) Rata-rata dari nilai tengah-nilai tengah contoh acak mendekati nilai (nilai tengah populasi
induknya). Ini mengilustrasikan sifat ketakbiasan. Nilai tengah contoh dikatakan tak berbias
karena nilai tengah dari semua nilai tengah contoh sama dengan nilai tengah populasi
induknya. Dalam teladan rata-rata dari ke-500 nilai-tengah contoh sebesar 39.79 lb, sangat
dekat dengan = 40 lb (nilai tengah populasi induknya).
c) Keragaman nilai tengah contoh jauh lebih kecil daripada keragaman individunya (namun
hampir sama/mendekati). Sesuai teori bahwa
contoh). Dalam teladan, untuk populasi
(untuk
,
sedangkan untuk contoh, jika rumus diatas diterapkan terhadap rata-rata dari ke-500 ragam
contoh, maka diperoleh
dan
, sedangkan
tengahnya diperoleh
dan
menjadi =
. Tidak
mengherankan bahwa lebih kecil daripada , karena s menduga lebih kecil (s penduga
yang bias bagi ). Untuk mendapatkan nilai dugaan tak bias bagi , maka rumus
sebagai
, maka akan diperoleh suatu penduga yang berbias bagi , karena ratarata dari populasi nilai-nilai ini adalah (n-1) /n. Jumlah kuadrat dapat diperoleh kembali dari
. Perbedaan antara nilai-nilai yang diperoleh dengan
persamaan (n-1)
=
menggunakan n dan n-1 jelas semakin kecil jika n semakin besar.
Dalam
teladan,
rata-rata
dari
500
ragam
contoh, adalah
),
140.4
(dimana
mendekati
nilai
(simpangan baku nilai-tengah dari suatu contoh acak berukuran n yang berasal dari suatu
populasi induk dengan simpangan baku .
Sesuai teladan dari tabel 4.1, untuk suatu contoh berukuran n=10, maka nilai dugaan bagi
simpangan baku populasi
bagi ragam dari ke-500 contoh itu, dapat dihitung melalui 3 cara sebagai berikut
a)
b)
c)
; atau
Jadi prosedur pertama lebih baik jika dibandingkan dengan prosedur lainnya, yaitu dengan
menarik akar dari rata-rata ragam 500 contoh dibagi dengan n=10. Kesesuaian yang sangat dekat
antara nilai ini membuat kita dapat mengatakan dengan lebih yakin bahwa hubungan
dengan
memang sah.
Setiap contoh acak selalu dapat menghasilkan sebuah nilai dugaan
tengah contoh .
Ragam, baik populasi maupun contoh, dari suatu nilai tengah contoh berbanding terbalik dengan
n, sedangkan simpangan baku nilai tengah contoh berbanding terbalik dengan .
4.8 SEBARAN t-STUDENT
Willian Sealy Gosset melihat bahwa penggantian dan s dalam perhitungan nilai-nilai Z tidak
dapat dipercaya untuk contoh-contoh berukuran kecil, oleh karena itu sebuah peubah yang
berhubungan erat dengan peubah
dan
digunakan sebagai penduga untuk contoh yang berasal dari suatu sebaran normal
yang dikenal dengan t-student.
t-Student adalah simpangan nilai-tengah contoh dari nilai-tengah populasi dalam satuan
simpangan baku nilai-tengah contoh (suatu ukuran yang sering digunakan untuk menilai biasa
atau tidak biasanya suatu simpangan.
Setiap nilai derajat bebas, t mempunyai sebaran tersendiri. Dari Tabel A.3 yang memuat nilainilai t, dibagian atasnya mencantumkan nilai peluang untuk nilai-nilai t lebih besar (tanda
diabaikan), peluang-peluang ini disebut sebagai peluang dua arah (two tailed probabilities).
Sedangkan, dibagian bawahnya memberikan peluang untuk nilai-nilai t yang lebih besar (tanda
tidak diabaikan), disebut juga peluang satu arah (one tailed probabilities).
Kurva untuk t bersifat setangkup, seperti yang diimplikasikan pada sebaran normal Z, namun
kurva bagi peubah acak t lebih landai (disebabkan nilai ragamnya >1, sedangkan ragam pada
sebaran Z, =1); dibagian sekitar pusat terletak dibawah kurva bagi Z, sedangkan di kedua
ekornya terletak disebelah atasnya. Bila derajat bebasnya semakin besar, dalam hal ini, n makin
besar, maka sebaran bagi t semakin mendekati normal. Oleh karena itu, pada tabel A.3 baris
terakhir db = . Salah satu ciri penting dari dari t untuk contoh yang berasal dari populasi
normal adalah bahwa komponen-komponennya, yaitu dan , tidak menunjukkan adanya
hubungan.
Meskipun
merupakan nilai dugaan tak bias bagi dan
, tetapi kecil sekali
kemungkinannya sama dengan parameter itu sendiri. Oleh karena itu, disarankan untuk
membuat selang kepercayaan di sekitar
dengan memanfaatkan sebaran t, sehingga
memberikan keyakinan yang cukup berarti bahwa atau
berada di dalam selang ini. Dengan
cara tersebut akan diperoleh proporsi selang yang mencakup , disebut sebagai peluang
kepercayaan (confidence probability) atau koefisien kepercayaan (confidence coefficient).
Dengan menggunakan
, kita ingin membuat selang sehingga dengan peluang tertentu
parameter berada di dalam atau di luar selang itu.
Pada pernyataan peluang :
,
sekarang
pernyataan
ini
menyatakan
bahwa
peluang
terletak
dalam
selang acak (
) adalah 0.95.
Pada teladan dari tabel 4.3 dan 4.7, dalam suatu populasi nilai-nilai t, 2.5 persen lebih besar dari
+2.262 dan 2.5 persen lebih kecil dari -2.262 (terlihat dari frekuensi kumulatif satu arah pada
teoritisnya), nilai ini dilambangkan dengan
. Sedangkan jika dilihat dari frekuensi kumulatif
dua arah teoritisnya, dikatakan bahwa 5 persen dari nilai-nilai t terletak disebelah kanan dari
1.833, nilai ini dilambangkan dengan
.
Dari tabel tersebut menunjukkan adanya kesesuaian yang memadai antara nilai-nilai contoh
dengan teoritiknya. Suatu perbandingan antara nilai-nilai contohdengan teoritiknya pada taraf
peluang yang lain juga menunjukkan adanya kesesuaian yang memadai.
4.9 PERNYATAAN KEPERCAYAAN
Untuk melihat apakah kepercayaan yang dinyatakan masih dapat diterima atau tidak, maka
harus dilakukan pemeriksaan terhadap pernyatan-pernyatan kepercayaan yang didasarkan pada
nilai-nilai contoh. Untuk setiap contoh acak dan sembarang taraf peluang, dibuat sebuah selang
kepercayaan disekitar nilai-tengah contohnya, yaitu dengan menyelesaikan kedua persamaan t
=
Dengan menduga dari nilai . Sesuai dengan kaidah aritmetika diperlihatkan bahwa jika
, maka 2 dapat diduga dengan 2 . Sehingga dari tabel 4.5, telah
diketahui
, jadi 2
Keduanya cukup dekat dengan 2 =2(144)=288, hasil ini mengilustrasikan bahwa ragam
beda pengamatan berpasangan yang diambil secara acak dua kali dari ragam pengamatan
dalam populasi induknya. Sehingga dapat dikatakan bahwa ragam contoh dari beda
pengamatan berpasangan merupakan penduga tak bias bagi 2 .
c) Simpangan baku beda
- Rata-rata simpangan baku 250 beda ( = 16.04, atau
-
Simpangan baku itu sedikit berbias, sedangkan ragam bersifat tak bias.
d) Simpangan baku beda nilai tengah
Diketahui bahwa
, atau
e) Nilai t
Nilai ini dihitung dengan rumus
f)
, karena
Tabel 4.12
menunjukkan sebaran yang sama dengan tabel 4.7, diantara nilai t itu, 118 positif dan 132
negatif dengan nilai tengah -0.00013.
Batas-batas kepercayaan bagi beda nilai tengah populasi, dalam hal ini
Untuk menentukan apakah ada perbedaan sesungguhnya antara respon dari dua perlakuan,
prosedur penarikan contoh menunjukan apa yang dapat diharapkan bila sesungguhnya tidak
ada perbedaan dan hasil-hasil itu hanyalah disebabkan oleh factor kebetulan belaka.
Dengan menghitung nilai statistic t dan menentukan peluang memperoleh nilai yang sama
atau lebih besar suatu penarikan contoh acak berasal dari populasi bernilai tengah nol. Oleh
karena itu, jika peluang memperoleh nilai yang lebih besar itu kecil dan tidak yakin bahwa
penarikan contoh berasal dari suatu populasi bernilai tengah nol, maka mungkin akan
diputuskan bahwa ada beda yang nyata antara respon dari kedua perlakuan.
Selang kepercayaan menunjukkan pada kesimpulan serupa, nila suatu t contoh berada diluar
taraf peluang 5 persen atau
, maka selang kepercayaan 95 persen tidak mencakup nol
(kurang yakin bahwa tidak ada perbedaan antara respon dari kedua perlakuan).
4.11 RINGKASAN
Melalui penarikan contoh dapat memperlihatkan sejumlah ciri dan teorema penting tentang
populasi yang menyebar normal, khususnya:
1. Nilai tengah contoh acak yang terdiri atas n pengamatan menyebar normal dengan nilai tengah
dan simpangan baku
atau
, dan