1. Konsep Statistika
STATISTIKA :
Kegiatan untuk :
KEGUNAAN
• mengumpulkan data
• menyajikan data
• menganalisis data dengan metode tertentu
• menginterpretasikan hasil analisis
Melalui fase
STATISTIKA DESKRIPTIF :
Berkenaan dengan pengumpulan, pengolahan, dan penyajian sebagian
atau seluruh data (pengamatan) tanpa pengambilan kesimpulan
dan fase
STATISTIKA INFERENSIAL:
Setelah data dikumpulkan, maka diterapkan berbagai metode statistika untuk
menganalisis data, kemudian dilakukan interpretasi serta diambil kesimpulan.
Statistika inferensi akan menghasilkan generalisasi (jika contoh representatif)
METODE ILMIAH :
Adalah salah satu cara mencari kebenaran yang bila ditinjau dari segi
penerapannya, risiko untuk keliru paling kecil.
5. Mengambil kesimpulan
INSTRUMEN
CONTOH
PERAN STATISTIKA
SIFAT DATA
PEUBAH
METODE ANALISIS
1
3.1 Data
DATA
NOMINAL INTERVAL
ORDINAL RASIONAL
Tujuan statistika:
Definisi: Statistika (statistics) adalah metode ilmiah atau seni menyangkut data yang meliputi
proses untuk: mengumpulkan, mengorganisasikan, menyajikan dan menganalisis data, serta
menarik kesimpulan layak berdasarkan analisis yang dilakukan
Statistika deskriptif bertujuan untuk meringkas sehingga didapatkan bentuk atau pola sebaran
data dan menyajikan informasi yang terkandung di dalam data tanpa pengambilan keputusan.
Untuk mendapatkan gambaran tentang bentuk sebaran data yang merupakan dasar pemilihan
metode analisis yang tepat (sesuai sebaran data atau asumsi).
Parameter: besaran/konstanta (yang tidak diketahui) dari suatu populasi dan memberikan ciri
(mengatur bentuk/pola) sebaran tersebut.
Statistik (statistic): adalah penduga bagi parameter dan merupakan fungsi dari nilai-nilai
pengamatan contoh.
Unsur-unsur statistika:
Tipe data
Nominal Ordinal Interval Rasional
Diperoleh melalui Dipreroleh melalui Diperoleh dengan Dipertoleh dengan
kategorisasi atau kategorisasi atau cara pengukuran, di cara pengukuran, di
klasifikasi individu ke klasifikasi, tetapi di mana jarak antara mana jarak antara
dalam sifat (kelas). antara data tersebut dua titik skala sudah dua titik skala sudah
terdapat hubungan diketahui. diketahui dan
mempunyai titik 0
absolut.
posisi data setara posisi data tidak tidak ada kategorisasi tidak ada kategorisasi
setara
tidak bisa dilakukan tidak bisa dilakukan bisa dilakukan operasi bisa dilakukan operasi
operasi matematika operasi matematika matematika matematika
(+, -, x, :) (+, -, x, :)
jenis kelamin, kepuasan kerja, temperatur yang gaji, skor ujian,
0
jurusan, golongan motivasi, kelompok diukur berdasarkan C jumlah buku, lama
darah usia 0 perjalanan
dan F, sistem
kalender
3
Penjelasan:
1.Nominal: (berasal dari kata Latin “nomen” artinya nama). Hasil pengelompokkan
individu/obyek ke dalam sifat (nama) yang tidak memiliki tingkatan.
3.Interval: dapat menjelaskan besar kecilnya karakteristik yang diukur pada suatu individu
dibandingkan hasil pengukuran pada individu lain:
Rangkuman
Cara memperoleh data Menghitung Mengukur
4
Nominal Interval
Skala pengukuran (Bentuk data)
Ordinal Rasional
Diskret Kontinu
Jenis peubah
Kualitatif Kuantitatif
STATISTIKA DESKRIPTIF
Bidang statistika ini menyangkut organisasi (penataan) data baik kualitatif maupun kuantitatif
yang diperoleh melalui penelitian (data mentah). Tujuan proses ini adalah untuk mendapatkan
gambaran kasar mengenai data.
1. Peubah diskret
Penyajian data disret sangatlah sederhana, hanya dengan menggunakan tabel untuk
memperlihatkan frekuensi dan grafik (histogram dan kue pai) untuk menunjukkan frekuensi
relatif suatu kategori.
Sebuah pengumpulan pendapat (pol) dilakukan di sebuah asrama kampus untuk mengetahui
sikap mahasiswa (penghuni) terhadap perubahan peraturan baru yang akan diterapkan di
asrama tersebut. Mereka diminta untuk menyatakan: setuju, netral atau menolak, dengan hasil
berikut:
Catatan: Frekuensi relatif menyediakan informasi mengenai pola atau bentuk sebaran suatu
data seperti terlihat pada Gambar 1.
5
200
152
150
Setuju
100 77 Series1 Netral
51 Menolak
50
0
Setuju Netral Menolak
2. Peubah Kontinu
Hasil pengukuran terhadap peubah kontinu akan menghasilkan data yang variatif dan kaya.
Dengan hanya memperhatikan data mentah, sangatlah sulit bagi kita untuk menarik
kesimpulan yang berarti. Untuk memperoleh suatu gambaran yang baik, data mentah ini perlu
diolah terlebih dahulu.
Dua cara sederhana (langkah awal) yang dapat digunakan untuk meningkatkan kegunaan data
mentah adalah dengan membuat statistik tataan dan daftar frekuensi yang dapat memberikan
gambaran yang khas tentang bagaimana keragaman data.
Sifat keragaman data sangat penting untuk diketahui karena langkah selanjutnya dalam
pengujian hipotesis akan selalu mempergunakan sifat ini. Tanpa memperhatikan sifat
keragaman data, penarikan suatu kesimpulan pada umumnya tidaklah sahih.
Pusat data (tempat di mana sebagian besar data berkumpul atau nilai pengamatan
yang dimiliki oleh sebagian besar individu)
Besarnya keragaman atau variasi yang terdapat dalam data (besarnya
penyimpangan/jarak antara setiap data ke pusat data)
Meringkas Data
Pandang data: Yi: Y1, Y2, Y3, …….., Yn (Yi adalah hasil pengamatan/pengukuran ke i, i
6
Kisaran (Range) yang merupakan salah satu indikator bagi keragaman adalah fungsi
dari kedua statistik ini :
Tabel 2. Statistik tataan dan kisaran berat buah dua jenis mangga
Berat mangga per buah Gadung Harum Manis
(gram) 250, 225, 250, 200, 375 450, 395, 300, 400, 305
Statistik Tataan 200, 225, 250, 250, 375 300, 305, 395, 400, 450
Kisaran 375 – 200 = 175 450 – 300 = 150
Interpretasi Data menyebar Data lebih mengumpul
Berdasarkan fakta ini, lebih baik anda membeli mangga Harum Manis karena berat (ukuran)
mangga jenis ini relatif sama.
Salah satu bentuk statistik tataan yang telah dikelompokkan berdasarkan dahan
Data asli masih tampak sehingga memudahkan pemeriksaan
Pusat data mudah diketahui
Penyimpangan terhadap kesetangkupan mudah dideteksi
(i) Daftarkan digit 0 – 9 dalam sebuah kolom yang disebut dahan (satuan, puluhan,
persepuluhan dll tergantung madnitude data)
(ii) Tempatkan digit kedua pada dahan yang sesuai
(iii) Untuk memudahkan penentuan ukuran pemusatan, tempatkan daun secara
berurutan (kecil-besar)
(iv) Dahan dapat diuraikan ke dalam beberapa buah sub-dahan
Misal untuk
1.5 24 1907
Dahan Daun Dahan Daun Dahan Daun
1 5 2 4 19 7
satuan sepersepuluh puluhan satuan raturan satuan
Tabel 3. Waktu yang diperlukan untuk mengolah tanah 21 petak sawah seluas 1 ha (hari)
2 1 7 8 6 3 3 5 7 8 3
1 2 3 3 5 10 13 17 4 2
7
Tabel 4. Diagram dahan-daun (urai 5 dan urai 3) yang dihasilkan adalah:
Penguraian dahan dapat dilakukan untuk membentuk sebaran sesuai keinginan. Makin banyak
penguraian terhadap dahan, akan semakin rendah pohon yang didapatkan, namun bentuk
sebenarnya dari data tidak akan berubah.
Frekuensi kumulatif menunjukkan peringkat data dan akan digunakan untuk menentukan
ukuran-ukuran pemusatan.
. . : .
---+---------+---------+---------+---------+---------+--- GADUNG
.. .. .
---+---------+---------+---------+---------+---------+--- HARUM MANIS
200 250 300 350 400 450
Diagram menunjukkan bahwa secara umum mangga Harum Manis lebih berat dibandingkan
Gadung.
8
Sedangkan data yang disajikan pada Tabel 2 menampilkan diagram titik ini:
.
. :
: : : . : . : : . . .
-------+----------+----------+----------+----------+----------+-- HARI
3.0 6.0 9.0 12.0 15.0 18.0
Diagram jenis ini sudah lama dikenal (sebelum era komputer) karena lebih mudah
dibuat
Data dikelompokkan ke dalam beberapa kelas
Frekuensi tertinggi menunjukkan pusat data
Pola sebaran data tampak jelas
15
Frequency
10
0
8,0 10,5 13,0 15,5 18,0 20,5
Diameter
A. Membuat tabel frekuensi, melalui penataan turus, di mana data dikelompokkan ke dalam
kelas-kelas.
k=
9
2. Buat sebaran frekuensi atau tabel frekuensi berdasarkan statistik tataan sengan
penataan turus. Proses ini menyangkut pengelompokkan individu ke dalam beberapa
kelas (jumlah kelas ideal bernilai ganjil, agar pusat sebaran mudah terlihat). Satu
individu masuk ke dalam satu dan hanya satu kelas saja menyebabkan terjadinya
kebebasan antar kelas.
4. Nyatakan kelas (atau rata-rata kelas) sebagai sumbu mendatar, dan frekuensi kelas
atau frekuensi relatif kelas sebagai sumbu tegak. Tinggi balok merupakan frekuensi
pada kelas tertentu.
Lebar kelas sebesar 1 menghasilkan 17 kelas (terlalu banyak), dan ada kelas tanpa anggota,
sehingga perlu diadakan pengelompokkan kelas atau peningkatan lebar kelas.
Berdasarkan Tabel 6 dapat dibuat histogram frekuensi, poligon frekuensi dan ogive. Poligon
frekuensi diperoleh dengan menghubungkan titik tengah puncak balok sehingga menyerupai
kurva patah-patah, sedangkan ogive dihasilkan dari tabel frekuensi kumulatif di mana kelas,
frekuensi dan yang bersifat kumulatif.
10
Ogive didasarkan pada selang kelas kumulatif seperti terlihat pada Tabel 7. Dua sumbu tegak
adalah frekuensi kumulatif dan persentasenya. Tetapkan titik 50% pada sumbu tegak kanan,
tarik garis mendatar sampai memotong ogive, kemudian tarik garis vertikal sampai memotong
sumbu mendatar di suatu titik. Pada umumnya ogive berbentuk sigmod (kurva berbentuk S).
Interpretasi ogive: 50% dari petak-petak sawah (10 – 11 petak) diselesaikan dalam waktu
kurang dari (paling lambat) 4 hari.
Gambar dan diagram yang disajikan sebelumnya telah menunjukkan letak (lokasi) pusat data.
Untuk itulah pusat yaitu suatu besaran (nilai) yang merupakan fungsi dari data perlu dihitung.
Pusat sebaran dijelaskan oleh besaran-besaran ini:
Rata-rata merupakan fungsi dari semua data contoh dan merupakan statistik atau penduga
bagi parameter . Oleh karena itu besaran ini sensitif karena akan berubah apabila terjadi
perubahan pada data. Rata-rata berarti sebagian besar individu memiliki nilai pengamatan
sekitar atau sebesar rata-rata.
Y
i 1
i
ya = atau y untuk data aditif (deret hitung)
n
n
Y ny
i 1
i
bY
i 1
i i
yb = n untuk data aditif, bi adalah bobot data ke i
b
i 1
i
# Rata-rata geometrik ( yg ):
yg = n
Y1 Y2 ......... Yn
Y
n 1/ n
= i
untuk data multiplikatif (deret ukur)
i 1
11
Disebut juga rata-rata logaritmik berdasarkan fakta berikut ini:
Y Y2 ......... Yn
1/ n
Log10 yg = log10 1
1
log10 Y1 Y2 ......... Yn
n
1
log10 Y1 log10 Y2 .......... log10 Yn
n
1 n
log10 Yi
n i1
Antilog rata-rata logaritmik akan menghasilkan rata-rata geometrik:
n
1
log10 Yi
n i 1
10 Log10 yg =10
# Rata-rata harmonik ( yh ) disebut juga rata-rata resiprok:
n
yh = n
untuk data multiplikatif
Y
i 1
i
1
Median adalah salah satu ukuran pemusatan yang membagi data menjadi dua bagian yang
sama besar.
# Setengah (50%) dari data memiliki nilai di bawah median dan setengah berada di atas
median
# Karena berada di tengah-tengah statistik tataan, maka median adalah statistik peringkat
( n 1)
ke atau statistik Y((n+1)/2)
2
# Jika banyaknya data berjumlah genap maka median adalah rata-rata dari 2 statistik
tataan di tengah-tengah
# Jika n=ganjil maka median adalah pengamatan yang berada di tengah
# Median merupakan fungsi dari dua peringkat di tengah atau salah satu peringkat yang
memang benar-benar terletak di tengah
# Oleh karena itu, median bersifat kekar, tidak sensitif, karena bukan merupakan fungsi
dari seluruh data, dan pada sebaran menjulur, median lebih disukai dibandingkan rata-
rata.
Lihat kembali diagram dahan-daun bagi lama mengolah satu hektar sawah
12
iii) Median bernilai 4 hari
iv) 10 – 11 petak sawah diolah dalam waktu kurang dari 4 hari dan sisanya (juga 10
– 11) petak diselesaikan lebih dari 4 hari. Hasil ini sama dengan menggunakan
ogive.
Modus adalah nilai pengamatan dengan frekuensi terbesar. Pentingnya mengetahui besaran
ini untuk mendeteksi apakah sebaran memiliki satu atau lebih puncak.
# Data dengan satu puncak disebut unimodal, dua puncak bimodal dan banyak puncak
atau multimodal
# Data yang bersifat bimodal mengindikasikan bahwa data (contoh) tidak berasal dari
populasi yang sama. Tindakan yang harus dilakukan dalam analisis adalah
memisahkan data berdasarkan dua puncak (pemotongan pada lembah) sehingga
diperoleh dua contoh yang saling bebas
Modus untuk lama mengolah sawah adalah 3 hari yang berarti bahwa lama pengerjaan
sawah terbanyak adalah 3 hari atau pada umumnya diperlukan waktu 3 hari untuk
mengolah sawah (Paling banyak petak sawah diselesaikan dalam waktu 3 hari).
Bentuk sebaran dapat diketahui melalui pembandingan antara rata-rata dan media:
Besaran-besaran yang mengukur pusat data hanya menjelaskan data kuantitatif secara
sebagian (parsial) atau tidak lengkap. Besaran ini akan sia-sia apabila tidak diiringi oleh
besaran lain yang mengukur keragaman data.
Dua sebaran di bawah ini memiliki ukuran pemusatan sama (karena setangkup), namun
gambar menunjukkan adanya perbedaan keragaman. Data 1 lebih seragam sedang Data 2
lebih terpusat. Dengan alasan ini maka ukuran penyebaranlah yang memegang peranan
penting dalam memahami suatu sebaran.
0 1 2 3 4 5 0 1 2 3 4 5
Data 1 Data 2
Indikator Keragaman
13
Ukuran yang kasar untuk n besar
Kurang sensitif
Menyesatkan bila dua data memiliki kisaran sama tetapi ragam keduanya berbeda
(seperti diilustrasikan oleh ambar di atas)
Tidak selalu dapat mendeteksi perbedaan keragaman data untuk n berukuran besar
Pandang teladan berikut, yaitu dua himpunan data yang memiliki pusat sama yakni 3. jarak
antar setiap data dengan pusat disajikan pula. Informasi apakah yang disajikan oleh jarak
ini? Apabila mereka cenderung terlalu besar (contoh 1), data akan lebih menyebar atau
mempunyai ragam besar, tetapi jika jarak bernilai kecil seperti contoh 2, data berkumpul di
sekitar rata-rata menghasilkan ragam kecil. Jadi jarak menyediakan informasi mengenai
keragaman data.
Rata-rata 1 2 3 4 5 2333 4
y = =3 y = =3
5 5
Jarak/simpangan
Yi ke y atau (Yi –
(1–3),(2–3),(3–3),(4–3),(5–3) atau (2–3),(3–3),(3–3),(3–3),(4–3)
y) 2, 1, 0, 1, 2 atau -1, 0, 0, 0, 1
.
. . . . . . : .
Diagram +-----+----+-----+-----+----+- +----+----+----+----+----+-----+
Titik Data1 Data2
Langkah selanjutnya:
Menggunakan jarak-jarak ini (Yi – y ), yang juga merupakan peubah untuk menghitung
suatu nilai yang menjelaskan ragam
Menghitung rata-rata peubah (Yi – y ) tidak membantu karena jarak negatif dan positif
saling meniadakan atau (Yi – y )= 0
Anggap jarak bernilai positif atau Yi – y
Kuadratkan mereka untuk mengeliminir tanda negatif (Yi – y )2
Peubah ini adalah landasan untuk perhitungan ragam
Jumlah dari peubah ini disebut jumlah kuadrat JKy = (Yi – y )2
2. Ragam contoh untuk suatu contoh berukuran n adalah jumlah dari kuadrat jarak ke
pusat dibagi n atau (n – 1). Dengan demikian ragam peubah Y merupakan fungsi dari 2
besaran yakni JKy dan n (atau derajat bebas, n – 1):
Ragam = fungsi(jumlah kuadrat, n). Besaran ini mengukur besarnya penyimpangan dari
setiap data ke pusat.
Rumus definisi n
(Y y )
i 1
i
2
s2 =
n 1
14
Rumus kerja (1) 2
n
n
Yi Yi 2 / n
2
i 1
s2 =
i 1 Jumlah Kuadrat
s2 =
n 1 Derajat bebas
Rumus kerja (2) n
Y
i 1
i
2
ny 2
s2 =
n 1
Ragam memiliki satuan berpangkat dua sesuai dengan proses pembentukan peubah,
misal ragam hari mengolah sawah adalah hari 2
Akar pangkat dua bertanda positif dari ragam disebut simpangan baku: s = +(s2)1/2
2 2
atau s= + s
Satuan simpangan baku sama dengan satuan data sehingga statistik ini lebih banyak
digunakan
Catatan:
Rata-rata contoh y akan digunakan untuk membuat inferensia mengenai rata-rata populasi .
Ragam contoh s2 harus didefinisikan sehingga dapat digunakan untuk membuat inferensia bagi
ragam populasi 2.
Y
i
i
= , i = 1, 2, ......, N (N=ukuran populasi)
N
μˆ y dan σˆ s
2 2
Parameter diduga dengan statistik:
Perhatikan bahwa 2 melibatkan kuadrat penyimpangan terhadap rata-rata populasi . Apabila
nilai diketahui, ragam populasi dapat dinyatakan sebagai rata-rata kuadrat penyimpangan Yi
terhadap , atau
1 n
σ2 =
N
i 1
(Yi - )2
Namun, nilai parameter hampir tidak pernah diketahui, sehingga jumlah dari kuadrat
penyimpangan terhadap statistik y harus digunakan. Tetapi Yi cenderung lebih dekat ke rata-
rata contoh y dibandingkan dengan jarak Yi ke rata-rata populasi , sehingga untuk
mengkompensasikan ini penyebut n – 1 digunakan dan bukan n.
Dengan kata lain, s2 yang diperoleh dengan penyebut n, cenderung menduga lebih rendah 2
(underestimate, menghasilkan nilai-nilai penduga yang secara rata-rata terlalu kecil),
sedangkan dengan penyebut n – 1 yang bernilai agak kecil akan mengoreksi pendugaan rendah
ini (underestimating corrections).
Ragam contoh s2 didasarkan atas derajat bebas (n – 1). Istilah ini timbul dari kenyataan bahwa
jika s2 dilandaskan pada n besaran (peubah):
Y1 – y , Y2 – y ,.........................., Yn – y
15
Jumlahnya akan bernilai 0, sehingga menentukan n – 1 buah nilai Yi – y , secara bebas, akan
menghasilkan satu nilai Yi – y sisa (manapun). Misal jika n = 4 dan Y1 – y = 8, Y3 – y = -6
dan Y4 – y = -4; maka secara otomatis Y2 – y = 2, jadi hanya 3 dari 4 nilai deviasi yang boleh
ditetapkan secara bebas (derajat bebas 3).
n n n n
Yi y Yi y Yi ny
i 1 i 1 i 1 i 1
n n n
karena Yi ny , maka
i 1
Yi Yi 0 atau ny ny 0
i 1 i 1
Rata-rata (aritmatika) adalah titik keseimbangan, karena jumlah deviasi di kiri titik rata-
rata sama dengan jumlah deviasi di kanannya (jumlah deviasi bertanda – dan + sama,
saling meniadakan).
Yi +-----+----+-----+-----x-----+------+-----+---
2 4 6 7 8 9
Yi – y -4 -2 1 2 3
y 30 6 (titik keseimbangan)
5
Karena kenyataan ini, peubah deviasi Yi y tidak digunakan, tetapi kuadrat dari peubah ini (
Yi y )2 yang apabila dijumlahkan, akan menghasilkan statistik jumlah kuadrat yang baik
karena karena bersifat minimum.
n
Jumlah Kuadrat peubah Y JK Y (Yi y ) 2
i 1
n n n n n
n n
Y i 1
i
2
2 y Yi ny 2
i 1
16
Substitusi y , menghasilkan
2
n
n
n n n Yi n Yi
i 1
Yi 2 y Yi ny Yi 2
2
i 1
2
i 1
2 i 1
n
i 1
Yi n i 1
n
2
n
2 2
n
n n
Yi n Yi i Y Yi
n n
i 1
Yi 2
2 i 1
n i 1
Yi n i 1
n
Yi 2
i 1
2 i 1
n
n i 1
n
2 2 2 2
n n n n
Yi
Y i
Yi Yi
Yi 2 i 1 i 1
n n
i 1
Yi 2
2 i 1
n
n i 1
n 2
i 1
2
n n
2 2 2 2
n n n n
i Y Yi i Y Yi
2 i 1 n i 1 2 i 1 i 1
n n
Yi 2
i 1 n n2
Y
i 1
i
2
n n
Rumus Kerja ( a )
2
n
Yi
i 1
n n
JKY (Yi y ) 2
i 1
Y
i 1
i
2
n
Substitusi Y , menghasilkan
i 1
i
n n
Yi 2 2 yny ny 2
i 1
Y
i 1
i
2
2ny 2 ny 2
Perubahan apa yang terjadi pada ragam atau simpangan baku, jika terhadap setiap data
dilakukan penambahan, pengurangan, perkalian atau pembagian dengan suatu konstanta?
17
X i Yi c
Rata rata :
n n n n n
(Y i c) Y i c Y i nc Y i
nc
x i 1
i 1 i 1
i 1
i 1
y c
n n n n n
Ragam :
n n n
(Y i c ( y c )) 2 (Y i y c m c) 2 (Y i y )2
s2
i 1
i 1
i 1
sY2
n 1 n 1 n 1
X
X i cYi
Rata rata :
n n n
cY i c Yi Y i
x i 1
i 1
c i 1
cy
n n n
Ragam :
n n n n
(cY i cy ) 2 (c(Y i y )) 2 c 2
(Yi y ) 2 c 2 (Yi y ) 2
sX2 i 1
i 1
i 1
i 1
n 1 n 1 n 1 n 1
n
(Y i y )2
c2 i 1
c 2 sY2
n 1
Membagi nilai-nilai peubah Y dengan konstanta c menggeser Yi dan y ke kiri dengan kelipatan
sebesar c-1; kisaran berubah menjadi c-1 kali kisaran semula (menyempit), sehingga ragam
juga berubah sebesar c-2 (jauh lebih kecil).
18
1
X i c 1Yi Yi
c
Rata rata :
n n n
c 1Yi c 1 Yi Y
1 i 1
i
x i 1
i 1
c c 1 y
n n n
Ragam :
n n n n
n 1 n 1 n 1 n 1
n
(Y i y )2
c 2 i 1
c 2 sY2
n 1
Catatan: sifat aditifitas data tidak berubah dengan penambahan dan pengurangan, sehingga
statistik-statistik pun tak berubah.
Data aditif berubah menjadi multiplikatif akibat pengalian (dengan c atau c-1), dengan demikian
statistik-statistik menjadi c dan c2 kali lebih besar (atau kecil c dan c-2).
D. PROPORSI
Populasi (contoh) disebut dikhotom (di=2, bi=2) jika anggota populasi digolongkan ke dalam
2 sifat/karakteristik (tidak dapat diukur), setiap individu hanya memiliki 1 sifat saja.
Setiap mahasiswa merupakan anak pertama atau bukan anak pertama, bergolongan
darah O atau lainnya, tinggal di rumah sendiri atau tidak
Sifat tidak dapat diukur atau dihitung. Jenis kelamin tidak dapat diukur atau
dihitung. Yang dihitung adalah banyaknya individu yang memiliki sifat tertentu:
banyaknya mahasiswa bergolongan darah O, banyaknya peserta workshop
perempuan.
Ingin diketahui proporsi petani padi sawah yang menggunakan pupuk kimia. Kepada setiap
petani (sebagai contoh, mewakili semua petani di suatu desa) diajukan pertanyaan tentang
penggunaan pupuk kimia.
No 1 2 3 4 5 6 7 8 9 10 11 12
Jawab Ya Tidak Tidak Ya Ya Tidak Ya Ya Ya Ya Tidak Ya
Sandi 1 0 0 1 1 0 1 1 1 1 0 1
Xi X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12
0, jika tidak memiliki sifat tertentu, tidak termasuk dalam kategori tertentu
Xi= 1, memiliki sifat itu, termasuk kelompok itu
Rata-rata contoh dikhotom disebut proporsi atau fraksi. Perhitungan rata-rata sama dengan
cara menghitung rata-rata aritmatika.
19
Ukuran Jumlah Proporsi Banyaknya Banyaknya
angka 1 angka 0
n n
Populasi N X
i 1
i Y X i
Y Y N-Y
P i 1
N N
n n
Contoh n X
i 1
i y X i
y y n-y
p i 1
n n
Y (y): adalah banyaknya jawaban 1 (Ya), banyaknya anggota populasi (contoh) yang memiliki
sifat yang ditanyakan, banyaknya anggota populasi (contoh) yang termasuk dalam
kelompok tertentu (kelompok 1)
N – Y (n-y) : banyaknya jawaban 0 (Tidak), banyaknya anggota populasi (contoh) yang tidak
memiliki sifat yang ditanyakan, banyaknya anggota populasi (contoh) yang termasuk
dalam kelompok lain (kelompok 2)
pupuk kimia dan n-y = 12-8 = 4 petani yang tidak menggunakan pupuk kimia
Ingat y + (n-y) = n, 8 + (12-8) = 8 + 4 = 12
Proporsi contoh p=y/n = 8/12 = 2/3, 2 dari 3 petani menggunakan pupuk kimia
Dari setiap 3 petani, ada 2 petani yang menggunakan pupuk kimia
Dalam persen: 2/3 x 100% = 66.67% (67 dari 100 petani menggunakan pupuk kimia)
Proporsi disebut juga fraksi atau bagian
Ilustrasi:
1. Simpangan baku dapat digunakan untuk mengukur jarak relatif setiap hasil pengamatan
ke pusat data. Tentunya terkadang ingin diketahui pula, berapa persen data yang terletak
dalam kisaran k (k=1,2,3) simpangan baku dari pusat?
Apabila penyebaran data berbentuk setangkup, diketahui bahwa semua besaran yang
mengukur pusat sebaran bernilai sama, atau berhimpit di mana berlaku hubungan Rata-
rata = Median = Modus.
Dengan kenyataan ini, pemeriksaan terhadap kesetangkupan data dapat dilakukan dengan
menggunakan simpangan baku sebagai satuan. Aturan ini dikenal sebagai Aturan Empiris
68-95-99.7, karena didasarkan pada data (contoh).
Aturan Empiris:
Apabila data memiliki sebaran setangkup (normal), maka kira-kira:
68.27% dari hasil pengukuran akan terletak dalam jarak 1 simpangan baku dari pusat
atau dalam selang y s
95.45% dari hasil pengukuran akan terletak dalam jarak 2 simpangan baku dari pusat
atau dalam selang y 2s
Hampir semua pengamatan atau 99.73% dari data akan terletak dalam jarak 3
simpangan baku dari pusat atau dalam selang y 3s
20
Telah diketahui bahwa data pada Tabel 3 bersifat menjulur ke kanan, dengan aturan empiris
kenyataan ini dapat pula diperlihatkan, dengan:
Kita periksa berapa pengamatan yang terletak dalam selang ini. Karena diagram dahan-
daun merupakan statistik tataan, maka dengan mudah dapat dilihat bahwa hanya ada 5
data yang terletak di luar selang yaitu:
1 dan 1 (di kiri) dan 10, 13 dan 17 di kanan.
Dengan demikian terdapat 21 – 5 = 16 data yang masuk ke dalam selang ini, dan dalam
persen adalah 16/21 x 100% = 76.19%.
Karena yang diharapkan adalah 68,27%, maka dikatakan bahwa data tidak menyebar
normal dan menjulur ke kanan karena median < rata-rata.
2. Median dan simpangan baku dapat digunakan untuk mendeteksi kesetangkupan data
dengan menghitung indeks Pearson berdasarkan kriteria berikut:
Apabila simpangan baku digunakan untuk mengetahui penyebaran semua data ke pusat, maka
jarak atau letak suatu nilai pengamatan relatif (dibandingkan) terhadap letak nilai pengamatan
lain disebut besaran keberadaan relatif. Dua besaran ini adalah:
Persentil ke 100p merupakan suatu nilai di mana paling tidak 100p% dari hasil
pengamatan bernilai lebih kecil atau sama dengan besaran ini dan paling sedikit 100(1-p)%
dari data berada di atas nilai ini.
# Kuartil bawah atau Q1 adalah persentil ke-25
# Kuartil tengah atau Q2 adalah persentil ke-50
# Kuartil atas atau Q3 adalah persentil ke-75
# Jarak antar kuartil atau simpangan kuartil adalah IQR = Q3 – Q1
# Kisaran ini akan mengandung 50% data
Skor baku untuk suatu nilai pengamatan adalah jarak antara nilai pengamatan ke pusat
data y sebesar simpangan baku s. Dengan demikian peubah ini yaitu Z i akan memiliki
wilayah data yang lebih sempit.
Yi y
Skor baku: Zi =
s
Retransformasi akan menghasilkan nilai Yi = y + Zi xs
21
n
n n
Y y
(Y i y)
0
i 1
Zi i
i 1 s
i 1
s
s
0
0
z 0
n
Yi y
2
n n n n
n
( Z i z 2
) Z i
2
1 2 (Yi y ) 2
(Yi y )
2
s2
i 1
s s 1
sz2 i 1 i 1 i 1
2 i 1 2 1
n 1 n 1 n 1 n 1 s n 1 s
Jika diketahui rata-rata jumlah ternak kambing 10 orang peternak di desa Dewata adalah
5 ekor dengan simpangan baku 2 ekor. Jika skor baku Pak Kurdi adalah 1.5 berapa ekor
kambing dimiliki pak Kurdi?
o Karena skor baku bertanda positif maka jumlah kambing pak Kurdi lebih banyak dari
rata-rata dengan jarak sebesar 1.5 simpangan baku
o Dengan retransformasi, pak Kurdi memiliki 5 + (1.5 x 2) = 8 ekor kambing
o Apabila skor baku bernilai 0, maka letak Yi berhimpit dengan y .
Aplikasi Persentil
1. Pemeriksaan kesetangkupan
Peubah skor baku dapat pula digunakan untuk melakukan pemeriksaan terhadap
kesetangkupan data berdasarkan interpretasi berikut:
(i) Selang (-1,1) akan mengandung sekitar 68.27% data
(ii) Selang (-2,2) akan mengandung sekitar 95.45% data
(iii) Selang (-3,3) akan mengandung hampir seluruh data (99.73%)
2. Pendeteksian pencilan
Suatu data dikatakan pencilan apabila skor baku data tersebut berada di luar selang (-
2,2). Kenyataan ini banyak digunakan dalam pemeriksaan asumsi kenormalan terhadap
sisaan (dalam regresi dan analisis ragam).
Pencilan merupakan suatu hasil pengukuran atau pengamatan (data) yang bernilai sangat
besar atau sangat kecil relatif terhadap data lain. Adanya pencilan dapat dideteksi melalui
diagram kotak garis.
Pembuatan diagram ini dilandaskan pada ringkasan lima-angka (five-number summary) yaitu:
Q1 Q2 Q3
Y(1) Y(n)
22
Pagar Pagar Pagar Pagar
luar dalam dalam luar
kiri kiri kanan kanan
Y(1) Y(21)
Q1 Q2 Q3
pencilan pencilan
3IQR 3IQR
Interpretasi diagram kotak garis:
Jika median terletak di tengah kotak dan panjang garis whisker sama, maka data
bersifat setangkup
Luas kotak menjelaskan keragaman data
Data yang terletak di antara dua pagar dalam merupakan data yang baik karena masih
merupakan anggota kelompok data
Pencilan merupakan data yang berada di luar pagar
Untuk membandingkan rata-rata dan ragam antar lebih dari 2 perlakuan
n y s Y(1) Y(21) Q1 Q2 Q3
21 5.381 4.105 1 17 2.5 4 7.5
Dihasilkan:
Garis Whisker: jarak data terdekat pagar dalam ke Q1 (kiri) dan Q3 (kanan)
* kiri: Q1 – 1 = 2.5 – 1 = 1.5
kanan: 13 – Q3 = 13 – 7.5 = 5.5
Mendeteksi pencilan
* Karena Y(21) = 17 terletak di luar pagar dalam maka data ini disebut pencilan (tanda bintang)
seperti terlihat pada Gambar 5.
Mendeteksi kesetangkupan
23
* Karena panjang garis whisker tidak sama, maka data tidak bersifat setangkup
* Karena median tidak terletak di tengah-tengah kotak, maka data tidak setangkup
* Data menjulur ke kanan karena garis whisker kanan lebih panjang dari kiri
* Data menjulur ke kanan karena median tidak terletak di tengah kotak dan bernilai lebih
dekat dengan Q1
1 2.5 4 7.5 13 15 17
5,38 (rata-rata)
80
60
40
20
Gambar menunjukkan bahwa suhu di San Diego memiliki keragaman terkecil, keragaman suhu di
kota 3 kota lain relatif sama dan keragaman terbesar terjadi di Bismark yang mengindikasikan
bahwa temperatur di kota itu sangat fluktuatif.
24
Sebaran Penarikan contoh yang berhubungan dengan sebaran Normal
Y Y
~ Normal baku (0,1) untuk inferensia bagi (1)
2
2. Sebaran penarikan contoh bagi y yang berasal dari contoh acak berukuran n yang diambil dari
populasi normal ( , σ2).
E ( y ) dan Var ( y )
2
y n y y
~ Z (0,1) untuk inferensia bagi (2)
2 /n n
Besaran ini digunakan untuk mengetahui sebaik apa statistik y sebagai penduga bagi
parameter. Statistik yang baik bersifat takbias yang dalam praktek tidak terjadi. Dengan
demikian statistik yang baik adalah yang berjarak tidak terlalu jauh dari parameter. Jarak inilah
yang diukur oleh salah baku rata-rata contoh. Semakin kecil se( y ) semakin baik statistik y
sebagai penduga bagi .
Untuk memperoleh setengah salah baku, ukuran contoh (n) haruslah meningkat 4x, sedangkan
memperkecil salah baku menjadi 1/3 membutuhkan 9x peningkatan n
25
Walaupun data asli tidak menyebar normal (sebaran) tidak diketahui, sebaran rata-rata contoh
akan kira-kira (mendekati) normal, asal n berukuran cukup besar (katakan >30). Sifat ini dikenal
sebagai Dalil Limit Pusat.
3. Sebaran penarikan contoh bagi p̂ yang berasal dari contoh acak berukuran n yang diambil dari
populasi binomial (n, p).
Y
n
2
i n
Jumlah Kuadrat
i 1
~ n atau (Yi ) 2 ~ 2 n2 atau
2
~ n2
2
i 1 2
2
Menjumlahkan n peubah acak Z i akan menghasilkan peubah 2 (dengan derajat bebas
n)
Yi i
2
2
(4)
i 1
i
Apa yang terjadi jika tidak diketahui dan diduga oleh statistik y ? Parameter sebaran
2
akan berkurang satu akibat pendugaan ini, menjadi n-1 (derajat bebas).
26
n
Yi y
2
n Y y ~
~ n21 atau i 2
i 1 i 1 2 n 1
Y y
2
1
Y y ~
n n
~ n21
i 2 2
atau nyatakan sebagai fungsi dari s2
i 1 2
2
i 1
i n 1
(n - 1) Y y
n
2
(n - 1) 1
x 2 Yi y ~ n21 atau
n i
~ n21
2 i 1
x
(n - 1) i 1 2
n-1
(n - 1)s 2
~ n21 untuk inferensia bagi
2
(5)
2
c. Peubah t, dibangkitkan dari sebaran Z dan n21 yang saling bebas berdasarkan
Z
~ tn1 substitusi Z menggunakan (2) dan 2 menggunakan (5)
2
n 1
n y / y y
n s ~ t n 1
(n 1) s 2 s
n
2
n 1
y ~ t
n 1 untuk inferensia bagi , jika σ2 tidak diketahui 6)
s n
27
d. Peubah F
Nisbah dua buah sebaran 2 yang saling bebas yang dibagi dengan derajat bebas akan
menghasilkan sebaran F
(n1 1) s12
(n 1)
12 (n1 1) 12 1
22 s12
~ Fn 1,n 1 atau 2 2 ~ Fn 1,n 1
22 (n2 1) (n2 1) s22
(n2 1) 1 2
1 2
s 1 2
2 2
22 s12 22
2 2 ~ Fn 1,n 1 untuk inferensia bagi 2
1 s2 1
1 2
(7)
1 s2
2 2
12
2 2 ~ Fn 1,n 1 untuk inferensia bagi 2
2 s1 2
2 1
28
PENDUGAN PARAMETER
A. Penduga titik merupakan suatu nilai statistik tunggal, seperti y sebagai penduga
parameter μ, p̂ penduga bagi p dan s2 sebagai penduga bagi parameter populasi σ2.
E ( y ) dan E ( s 2 ) 2
n ≥ 30 Tak ada
P(Z /2 Z Z /2 ) 1
Substitusi
Y
Y
P ( Z / 2 Z / 2 ) 1
Kalikan dengan setiap suku pertidaksamaan dengan σ
Y
P ( Z / 2 Z / 2 ) 1
P ( Z / 2 Y Z / 2 ) 1
P (Y Z / 2 Y Y Y Z / 2 ) 1
P ((Y Z / 2 ) (Y Z / 2 )) 1
29
Dengan keyakinan sebesar 95%, akan berada dalam selang, atau selang akan
mengandung 95 dari 100 nilai y (jika penarikan contoh dilakukan 100 kali).
b. Penduga selang satu arah (<) bagi dengan tingkat kepercayaan (1-α)100% :
Didasarkan pada pernyataan peluang P(Z Z ) 1 :
Y
P( Z ) 1
Y
P( Z ) 1 P(Y Z ) 1
P(Y Y Y Z ) 1 P ( (Y Z ) 1
P( Y Z ) 1
c. Penduga selang satu arah (>) bagi dengan tingkat kepercayaan (1-α)100% :
Didasarkan pada pernyataan peluang P(Z Z ) 1 :
Y
P( Z ) 1
Y
P( Z ) 1 P(Y Z ) 1
P(Y Y Y Z ) 1 P( (Y Z )) 1
P( Y Z ) 1
P( Y Z ) 1
y ~ t
Sebaran yang mengandung adalah n 1
s n
30
Didasarkan pada pernyataan peluang:
P(t /2,n1
y t ) 1
/2, n 1
s n
Kalikan dengan setiap suku pertidaksamaan dengan salah baku rata-rata: s n
y
P(t /2,n1 s n s n t /2,n1 s n) 1
s n
P(t /2,n1 s n y t /2,n1 s n) 1
P( y t /2,n1 s n y t /2,n1 s n) 1
b. Penduga selang satu arah (<) bagi dengan tingkat kepercayaan (1-α)100% :
Didasarkan pada pernyataan peluang P(tn1 t ,n1 ) 1 :
y
P( t ,n 1 ) 1
s n
y
P( s n t ,n 1 s n ) 1 P ( y t ,n 1 s n) 1
s n
P ( y y y t ,n 1 Z s n) 1
P ( ( y t ,n 1 s n) 1
P( ( y t ,n1 s n) 1
c. Penduga selang satu arah (>) bagi dengan tingkat kepercayaan (1-α) :
Didasarkan pada pernyataan peluang P(tn1 t ,n 1 ) 1 :
31
y
P( t ,n 1 ) 1
s n
y
P( s n t ,n 1 s n ) 1 P ( y t ,n 1 s n) 1
s n
P ( y y y t ,n 1 Z s n) 1
P ( ( y t ,n 1 s n) 1
P( ( y t ,n1 s n) 1
pˆ p pˆ p
Sebaran yang mengandung p adalah ~ Z atau ~Z
pq pˆ
n
ˆˆ
pq
p tidak diketahui sehingga diganti oleh penduganya p̂ , pˆ =
n
Didasarkan pada pernyataan peluang:
P ( Z / 2 Z Z / 2 ) 1
pˆ p
Substitusi , p pada penyebut diganti oleh penduganya p̂
pq
n
pˆ p
P( Z /2 Z /2 ) 1
ˆpqˆ
n
ˆˆ
pq
Kalikan dengan setiap suku pertidaksamaan dengan pˆ
n
32
ˆ ˆ pˆ p
pq ˆˆ
pq ˆˆ
pq
P ( Z / 2 Z / 2 ) 1
n ˆˆ
pq n n
n
ˆˆ
pq ˆˆ
pq
P ( Z / 2 pˆ p Z / 2 ) 1
n n
Kurangi dengan p̂ kemudian kalikan (-1), menghasilkan
ˆˆ
pq ˆˆ
pq
P( pˆ Z /2 pˆ pˆ p pˆ Z /2 ) 1
n n
ˆˆ
pq ˆˆ
pq
P(( pˆ Z /2 ) p ( pˆ Z /2 )) 1
n n
ˆˆ
pq ˆˆ
pq
P( pˆ Z /2 p pˆ Z /2 ) 1
n n
n - 1 s 2
~ n21
Sebaran yang mengandung 2
adalah
2
2
P( 2
n - 1 s 2
2/2,n1 ) 1
1 /2, n 1
2
P(
n - 1 s
12 /2,n1 2
2/2,n1
) 1
n - 1 s n - 1 s
2 2 2
n - 1 s 2
33
Pangkatkan -1, akan menghasilkan
1 1
12 /2,n1 1
1
2/2,n1
P( 2
2 2
) 1
n - 1 s n - 1 s
n - 1 s 2 n - 1 s 2
P 2 2
2
1
2,n1 1 2,n 1
1 2
Anggap kedua populasi bebas, sebaran selisih adalah:
Y1 ~ N ( 1 , 12 )
Y1 Y2 Di ~ N ( 1 2 , 12 22 )
Y2 ~ N ( 2 , 2 )
2
y1 ~ N ( 1 ,
12 )
n 12 22
y1 y2 ~ N ( 1 2 ,
1
)
y2 ~ N ( 2 ,
2
2
)
n1 n2
n2
Dua contoh: Bebas dan Berpasangan
Z / 2
34
D d
nd 2
sd2
ˆ d = d atau ˆ = d
i
ˆ d =sd
2 2 i 1
ˆ d =sd
nd 1 nd
Sebaran penarikan contoh: d ~ Normal ( , d nd ) sehingga
2
d d
karena d tidak diketahui, maka
2
~ Z ~ t n 1
d 2
ˆ d
2 d
nd nd
a. Penduga selang (2 arah) bagi parameter d atau dengan tingkat kepercayaan (1-α)100% :
d
Sebaran ~ tn 1 untuk inferensia bagi
sd2
d
nd
Didasarkan pada pernyataan peluang:
P (t / 2,n d 1
t t / 2,n 1 ) 1
d
substitusi
d
sd nd
d
P(t /2,n 1 d
t /2,n 1 ) 1
d
sd nd
Kalikan dengan setiap suku pertidaksamaan dengan salah baku rata-rata: sd nd
d
P (t / 2,n 1 sd
d
nd sd nd t / 2,n 1 sdd
nd ) 1
sd nd
P (t / 2,n 1 sd
d
nd d t / 2,n 1 sd
d
nd ) 1
P(d t /2,n 1 sd d
nd ) d t /2,n 1 sd d
nd ) 1
12 22
y1 y2 ~ N ( 1 2 , )
n1 n2
12 22 12 22 2
y1 y2 1 2 ~ Z (0,1) atau
y1 y2 1 2 ~ Z (0,1)
12 22 1 1
2
n1 n2 1 n2
n
12 22 1 1
Lambangkan y y = atau y y = 2
n1 n2 n1 n2
1 2 1 2
a. Dua arah
Didasarkan pada pernyataan peluang:
P(Z /2 Z Z /2 ) 1
substitusi
y1
y2 1 2 y 1
y2 1 2
atau
12 22 1 1
2 +
n1 n2 1 n2
n
P( Z /2
y 1
y2 1 2
Z /2 ) 1
y y
1 2
P( Z /2 y y
y1
y2 1 2
y y Z /2 y y ) 1
1 2
y y
1 2
1 2 1 2
36
P(( y1 y2 ) Z /2 y y 1 2 ( y1 y2 ) Z /2 y y ) 1
1 2 1 2
P(
y 1
y2 1 2
Z ) 1
y y 1 2
P(
y1
y2 1 2
y y Z y y ) 1
y y
1 2
1 2 1 2
P( y1 y2 1 2 Z y y ) 1 1 2
P( 1 2 ( y1 y2 Z y y )) 1 1 2
P( 1 2 y1 y2 Z y y ) 1 1 2
P(
y1
y2 1 2
y y Z y y ) 1
y y
1 2
1 2 1 2
P( y1 y2 1 2 Z y y ) 1 1 2
P( 1 2 ( y1 y2 Z y y )) 1 1 2
P( 1 2 y1 y2 Z y y ) 1 1 2
37
Ukuran contoh Asumsi tambahan
Salah satu n1 ≥ 30, n2 ≥ 30 atau Populasi normal dan ragam sama
keduanya
Y y
1 Y1j : Y11 , Y12 ,......., Y1n n1
1 n n1
Y
2
Y1j y1
1
1
1j 1j 1
j 1 n1 j 1 j 1
2
Y y
Y2j : Y21 ,Y22 ,.......,Y2n n2
1 n n2 2
Y2j Y2j y2
2
2
2j 2
j=1 n2 j=1 j=1
Y y
ni 2
Y y n 1 s ; JK db s
ij i
JK ni 2
si
2 j 1
= ; 2 2
ni 1
ij i i i i
db j 1
Y - y Y - y
n1 2 n2 2
1j 1 2j 2
s12 j=1
dan s22 = j=1
n1 - 1 n2 - 1
Karena asumsi kesamaan ragam populasi, maka kedua ragam digabung kemudian
diduga berdasarkan penggabungan ragam dua contoh:
s 2
n - 1 s
2
i
2
i
n 1
- 1 s12 n2 - 1 s22
gab
n - 1
i=1
i n1 - 1 n2 - 1
Y y
ni 2
2 ij i 2 JK i JK1 + JK 2 JK gabungan
= j 1
i=1 n - 1 i
i=1 dbi db1 + db2 dbgabungan
dbgab n - 1 n 1 2
- 1 n1 n2 2, penyebut sgab
2
38
Transformasi menghasilkan sebaran t-pasti
y 1
y2 1 2
~ tdbgab atau
y 1
y2 1 2
~ tdbgab
2 1 1 sy - y
1 2
sgab n n
1 2
1 1
Lambangkan salah baku rata-rata contoh: sy - y = s2 gab +
1 n2
n
1 2
a. Dua arah
Didasarkan pada pernyataan peluang:
P(ta / 2,dbgab
y 1
y2 1 2
ta / 2,dbgab ) 1
sy y 1 2
P(ta / 2,dbgab s y y
y 1
y2 1 2
s y y ta / 2,dbgab s y y ) 1
1 2
sy y 1 2
1 2 1 2
P(
y 1
y2 1 2
ta,dbgab ) 1
sy y 1 2
39
P(
y1
y2 1 2
s y y ta,dbgab s y y ) 1
sy y 1 2
1 2 1 2
P( y1 y2 1 2 ta,dbgab s y y ) 1 1 2
P( 1 2 y1 y2 ta,dbgab sy y ) 1 1 2
P(
y1
y2 1 2
ta,dbgab ) 1
sy y1 2
P(
y 1
y2 1 2
s y y ta,dbgab s y y ) 1
sy y 1 2
1 2 1 2
P( y1 y2 1 2 ta,dbgab s y y ) 1 1 2
P( 1 2 y1 y2 ta,dbgab sy y ) 1 1 2
pˆ 1
- pˆ 2 - p1 - p2
~Z inferensia bagi p1 - p2
p1 q1 p2 q2
+
n1 n2
p1 dan p2 tidak diketahui sehingga diganti oleh penduganya pˆ1 dan pˆ 2 ,
pˆ 1 qˆ1 pˆ 2 qˆ2
menghasilkan salah baku selisih 2 proporsi ng pˆ1 - pˆ 2 = +
n1 n2
Menggunakan pernyataan peluang: P(Z / 2 Z Z / 2 ) 1
P ( Z / 2
pˆ1
- pˆ 2 - p1 - p2
Z / 2 ) 1
pˆ 1 qˆ1 pˆ 2 qˆ2
+
n1 n2
P ( Z / 2
pˆ1
- pˆ 2 - p1 - p2
Z / 2 ) 1
pˆ - pˆ
1 2
P( Z /2 pˆ - pˆ
pˆ 1
- pˆ 2 - p1 - p2
pˆ - pˆ Z /2 pˆ - pˆ ) 1
1 2
pˆ - pˆ1 2
1 2 1 2
Kurangi dengan pˆ 1
- pˆ 2 kemudian kalikan (-1), menghasilkan
P ( pˆ 1 - pˆ 2 Z / 2 pˆ - pˆ1 2
- p1 - p2 pˆ 1 - pˆ 2 Z / 2 pˆ - pˆ ) 1 1 2
P (( pˆ 1 - pˆ 2 Z / 2 pˆ - pˆ ) - p1 - p2 ( pˆ 1 - pˆ 2 Z / 2 pˆ - pˆ )) 1
1 2 1 2
41
2 22 s12
Sebaran yang mengandung 1 adalah 2 2 ~ Fn 1,n 1
22 1 s2
1 2
F0.05(15,10) F0.05(10,15)
1
F1-a(v ,v ) Fa(v ,v
1 2 1 2 ) yakni
3.52
1
0.28 3.06
22 s12
P( FL 2 2 FU ) 1
1 s2
s12
Bagi setiap suku pertidaksamaan dengan 2
s2
s22 22 s22
P( 2 FL 2 2 FU )= 1- a
s1 1 s1
Pangkatkan -1, akan menghasilkan
42
s12 1 12 s12 1
P( 2 )= 1- a
s2 FU 22 s22 FL
s12 1 12 s12 1
P( 2 2 2 )= 1- a
s2 Fa / 2(v ,v ) 2 s2 F1-a / 2(v ,v )
1 2 1 2
1
Mengganti F1-a / 2(v ,v ) dengan menghasilkan
1 2
Fa / 2(v ,v )
2 1
2
s1 1 1 s1
2 2
P( Fa / 2(v ,v ) )= 1- a
s22 Fa / 2(v ,v ) 22 s22
1 2
2 1
s22 1 22 s22
P( 2 Fa / 2(v ,v ) )= 1- a
s1 Fa / 2(v ,v ) 12 s12
2 1
1 2
43