Anda di halaman 1dari 120

Kita sekarang hidup di era yang didominasi oleh

informasi.
Kita terus-menerus dibombardir dengan statistik dan
informasi statistik. Sebagai contoh:
Survei Pelanggan Berita Medis
Polling Politik Prediksi Ekonomi
Informasi Pemasaran Data Scanner
Pikirkan seberapa sering Anda menggunakan data
dalam kehidupan sehari-hari.
Tidak ada cara untuk menghindari penggunaan data.
Apakah Statistika itu?!

Statistik dan Statistika

Pada zaman dahulu, data dikumpulkan hanya Statistik berasal dari kata state (Yunani) yang artinya
untuk deskriptif negara

Statistik merupakan kumpulan angka atau kondisi yang


mendeskripsikan suatu permasalahan atau suatu hal
Pada masa kini metode statistik dapat dilakukan
untuk melakukan generalisasi dan peramalan Statistika adalah ilmu atau pengetahuan mengenai
proses pengumpulan data, pengolahan data, menyajikan
data, analisis data, dan mengintepretasikan data menjadi
informasi untuk mengambil keputusan yang efektif
tetapi mengandung unsur ketidakpastian.
CONTOH
Data
Statistika adalah cara untuk mendapatkan informasi dari Nama, Umur, Penghasilan, Pekerjaan, Status pernikahan,
data. Punya atau tidak Punya Mobil
Itu saja!
-Gerald Keller Informasi
-Rata-rata penghasilan menurut jenis pekerjaan.
-Persentase kepemilikan mobil menurut Jenis
pekerjaan.
-model yang menggambarkan karakteristik
responden yang memiliki atau tidak mobil

Statistika adalah cara untuk mendapatkan informasi dari


data

Metode statistik adalah prosedur-prosedur yang


digunakan dalam pengumpulan data, penyajian
data, analisis data, dan interpretasi data.

masukan atau bahan mentah bagi


hasil pengolahan data
informasi
atau kumpulan hasil
yang sudah didapat
dari komputer
Contoh

Misalkan diketahui bahwa 50 dari 200 sampel siswa SMP 11 Bekasi sudah
merokok. (analisis deskriptif)
Tujuan pengumpulan dan analisis data adalah untuk berdasarkan data di atas anda melakukan uji hipotesis proporsi dan
mendapatkan informasi. Metode statistik menyediakan menyimpulkan bahwa peluang siswa SMP 11 bekasi merorok lebih dari 20 persen
(analisis inferensia)
alat untuk mendapatkan informasi dari data. Metode ini
terbagi menjadi dua cabang
Misalkan dari 40 lulusan UI memiliki rata-rata pendapatan 5 juta dengan varians
Statistik Deskriptif Statistik Inferensia 300 ribu. (Analisis Deskriptif)

(Metstat I) Berdasarkan data di atas anda melakukan uji hipotesis rataan populasi dan
menyimpulkan bahwa rata-rata pendapatan lulusan UI kurang dari 5 juta
(Analisis Inferensia).

Ada ketidakpastian dalam analisis inferensia (adanya tingkat kesalahan)

Inferensi Statistik merupakan proses pembuatan suatu


Statistik deskriptif, adalah metode-metode yang berkaitan penyajian suatu estimasi, prediksi, atau keputusan mengenai suatu
gugus data sehingga memberikan informasi yang berguna.
populasi berdasarkan suatu sampel.

Statistik inferensia, adalah metode statistik yang berhubungan dengan


analisis sebagian data untuk kemudian sampai pada tahap peramalan atau
penarikan kesimpulan mengenai POPULASI.
Tingkat Kepercayaan dan Tingkat
Kita menggunakan statistik untuk membuat kesimpulan/ Signifikansi
inferensi tentang parameter.

Oleh karena itu, kita dapat membuat estimasi, prediksi, Tingkat kepercayaan adalah proporsi suatu prosedur
atau keputusan tentang populasi berdasarkan data akan menghasilkan estimasi yang benar.
sampel.
Tingkat signifikansi adalah proporsi suatu prosedur
Dengan demikian, kita dapat menerapkan apa yang kita akan menghasilkan estimasi yang salah
ketahui tentang sampel ke populasi yang lebih besar di
mana sampel tersebut diambil!

Secara rasional: Teknik Pengujian Statistik


populasi besar membuat penyelidikan setiap anggota tidak 1. Parametrik, yaitu pengujian yang didasarkan asumsi bahwa
praktis dan mahal. peubah acak mengikuti distribusi tertentu
Lebih mudah dan lebih murah untuk mengambil sampel
dan melakukan estimasi tentang populasi dari sampel. 2. Nonparametrik, yaitu pengujian yang tidak didasarkan asumsi
bahwa peubah acak mengikuti distribusi tertentu

Bagaimanapun:
Kesimpulan dan Estimasi tidak selalu akan menjadi benar. Pertimbangan lain:
Untuk alasan ini, kita masuk ke dalam inferensi statistik Jika skala pengukuran N-O Nonparametrik
"ukuran reliabilitas (keandalan)", yaitu tingkat Jika skala pengukuran I-R Parametrik
kepercayaan dan tingkat signifikansi.
Statistik inferensia digunakan untuk menarik Populasi berdasarkan Ukurannya
kesimpulan.
Kesimpulan bisa induksi dan deduksi. 1) Populasi Terbatas
Populasi terbatas mempunyai batas jelas secara kuantitatif
Kesimpulan statistika adalah induksi.
sehingga dapat dihitung jumlahnya.
Manakah yang induksi?
2) Populasi Tak Terbatas
Populasi tak terbatas tak dapat ditentukan batas-batasnya
sehingga relatif tidak dapat dapat dinyatakan dalam
bentuk jumlah.

Populasi
Populasi Berdasarkan Sifatnya
Kumpulan dari seluruh objek pengamatan.
a. Populasi homogen
Populasi homogen adalah Populasi yang unsurnya memiliki
Ukurannya adalah parameter. sifat atau keadaan yang sama .

Misal: jumlah mahasiswa STIS b. Populasi heterogen


Populasi heterogen adalah populasi yang unsurnya memiliki
sifat atau keadaan yang berbeda (bervariasi).
Sampel

Sebagian dari objek pengamatan

Ukurannya statistik

Sampel yang baik harus Unbiased

Teknik Sampling
Tiga puluh enam persen dari penduduk DKI dewasa
memiliki alergi. Dari sampel 1.200 orang dewasa yang
dipilih secara acak menghasilkan 33,2% memiliki alergi.

Apa yang menjadi populasi, sampel, variabel, data, cara


mendapatkan data, statistik, parameter?
Populasi orang dewasa di DKI
Sample 1200 orang dewasa yang dipilih secara acak
Variable Alergi
Data ya atau tidak
Cara mendapatkan data Mungkin dengan tanya
jawab/wawancara
Statistic 33.2% (dari sampel)
Parameter persen populasi dengan alergi

Skala Ukur Data

Data Kulitatif
Data yang tujuannya untuk mengktegorikan/ mengelompokan atau
sebagai simbol.

Data kuantitatif
Data yang berbentuk numerik dan bukan hanya untuk mengkategorikan
Tabe l 1.1 Bidang Pekerjaan berdasarkan Latar Be lakang Pe ndidikan

Count
pendidikan
SMU Akademi Sarjana Jumlah
bidang administrasi 1 8 6 15
pekerjaan personalia 1 7 8
produksi 4 3 5 12
marketing 2 14 11 27
keuangan 3 4 6 13
Jumlah 10 30 35 75

30 30

20 20

10 10

0 0
administrasi personalia produksi marketing keuangan administrasi personalia produksi marketing keuangan

bidang pekerjaan bidang pekerjaan

800000

keuangan
administrasi

700000

600000

personalia
500000

Jenis kelamin
400000
marketing
laki-laki
produksi
300000 w anita
sangat jelek jelek cukup baik baik sangat baik

prestasi kerja
xP x 18 1 4 20 1 4 22 1 4 24 1 4
1 1
18 20 22 24 84 21
4 4

2
x
2
P x 18 21
2
1 24 21
2
1 5
4 4
2, 2361
21 2.236 x
21 x
1.58

x xP x 18 116 19 216 24 116 21

2 2
x x x P x
2 1 2 2 2 1
18 21 19 21 24 21 2,5
16 16 16
2
x x 2,5 1,5811
X

N n
x
n N 1
X
N n
N 1
X
di mana:
(x
z x sample mean
population mean

n population standard deviation X


n sample size

X
8
(x 3
0.5
z x
n 36
N n
n N 1

7.8 - 8 x
- 8.2 - 8
P(7.8 8.2) P
x
3 3
36 n 36
P(-0.4 z 0.4) 0.3108

Distribusi Distribusi Distribusi Normal


Populasi Sampling Standar .1554
?? ? +.1554
? ??
?
?? ? Sample Standardize
? ?

8 x 7.8
8
8.2
x -0.4
z 0
0.4 z
x
X
X
1,9 X X
0,4 X
2 2
1 2
X1 X2

X1 X 2 1 2
Z
2 2
1 n1 2 n2
X np
Z
npq
x np
p E p E p
n n
2
2 2 x npq pq
p xn 2
n n2 n
pq
p
n

p 1 p N n
Var p
n N 1
2 p 1 p N n
p
n N 1
p1 p2
p1 p2
p1 1 p1 p2 1 p2
p1 p2
p1 p2 n1 n2

p1 p2 p1 p2
p1 p2 p1 p2
Z
p1 1 p1 p2 1 p2
2 p1 1 p1 p2 1 p2 n1 n2
p1 p2
n1 n2
2

2
2 n 1 S2 n Xi X
X 2 2
i 1

v n 1

2 n 1 s2
2

2
Y Z12 Z 22 ... Z n2 Y n

Z2 1
2

2
2 1 n
2 1 n n
S Xi X n X i2 Xi
n 1i 1 n n 1 i 1 i 1

2
5 48, 26 15
0,815
5 4
2 n 1 s2 4 0,815
2
3, 26
1

2
1

U v1
F
V v2
S12 S22

S12 2 2 2
S
F 1 2 1
S22 2
2
2 2
S
1 2

Pertemuan 3
Statistika adalah ilmu yang mempelajari cara pengumpulan, Inferensia statistik adalah proses di mana kita
pengolahan, penyajian, dan analisis data serta cara mendapatkan informasi dan menarik kesimpulan
pengambilan keputusan secara umum berdasarkan hasil
tentang populasi dari sampel
penelitian yang tidak menyeluruh.

Definisi lebih teoretis:


Statistika adalah ilmu dan seni pengembangan dan
penerapan metode yang paling efektif untuk kemungkinan
Supaya dapat
salah dalam kesimpulan dan estimasi dapat diperkirakan melakukan inferensia,
dengan menggunakan penalaran induktif berdasarkan kemampuan dan
matematika probabilitas. pengetahuan descriptive
statistics, distribusi
peluang, dan distribusi
Di dalam statistika ada Ketidakpastian dan Variasi sampling diperlukan.

Tujuan pengumpulan dan analisis data adalah


Ada dua jenis inferensi: estimasi dan uji hipotesis.
untuk mendapatkan informasi. Metode statistik
menyediakan alat untuk mendapatkan informasi estimasi diperkenalkan terlebih dahulu.
dari data. Metode ini terbagi menjadi dua cabang
Statistik Deskriptif MetStat I Tujuan dari estimasi adalah untuk menentukan
nilai pendekatan dari parameter populasi
Statistik Inferensia
berdasarkan sampel statistik.

E.g., rata-rata sampel ( X ) digunakan untuk


mengestimasi rata-rata populasi ( ).
Suatu departemen store tertarik untuk mendirikan Kenapa rata-rata sampel yang dipilih sebagai
cabang dipinggiran kota dan ingin letaknya estimator dibandingkan median sampel?
adalah di lokasi dengan rata2 pendapatan (Jawab) Karena X-bar adalah good estimator
masyarakatnya di atas rata2 nasional. bagi µ dan lebih baik dibandingkan median
Bagaimana cara pihak departemen store sampel.
mendapatkan data rata2 pendapatan tersebut? Apa itu good estimator dan apa maksudnya
ketika dikatakan x-bar adalah estimator yang
lebih baik dibandingkan median?

Estimator yang sering digunakan untuk Secara logis dapat diindikasikan bahwa good
mengestimasi populasinya adalah rata-rata estimator adalah yang dekat dengan parameter
sampel, standar deviasi sampel, dan proporsi populasi.
sampel. Jika Xbar adalah good estimator, maka Xbar
Apakah hanya ketiga statistik itu saja yang bisa adalah dekat dengan nilai sebenarnya dari µ.
digunakan sebagai estimator? Ada yang lain? TETAPI apakah dapat dikatakan bahwa Xbar
Misalnya, Daripada menggunakan rata-rata lebih dekat dengan µ dibandingkan Xmed?
sampel, kenapa tidak menggunakan median
sampel sebagai estimator untuk rata-rata
populasi?
Ingat bahwa Xbar diperoleh dari suatu sampel Karena distribusi sampling dari X lebih
tertentu. Kita tidak bisa mengatakan sesuatu itu terkonsentrasi di dekat dibandingkan
benar atau tidak dari suatu nilai individu. distribusi sampling dari Xmed ketika sejumlah
Suatu nilai individu dari Xbar akan diketahui besar sampel diambil, X lebih mungkin dekat
hanya setelah suatu sampel telah dipilih. dengan dibandingkan Xmed.
Demikian juga nilai Xmed. Dalam hal ini dapat dikatakan bahwa X adalah
Kita tidak bisa membuat pernyataan umum estimator yang lebih baik dibandingkan Xmed
bahwa Xbar atau Xmed lebih dekat ke . bagi µ.
Untuk satu sampel, Xbar bisa lebih dekat
dengan µ, dan untuk sampel yang lain, Xmed
bisa lebih dekat dengan µ.

Bagaimana kita akan mengatasi kebuntuan ini Hal berikutnya yang harus diperhatikan adalah
sehingga dapat dikatakan bahwa Xbar lebih menentukan kriteria good estimator, dalam arti
baik dari Xmed sebagai estimator bagi µ? bahwa distribusi dari estimator akan
(Jawab) Jika sejumlah sampel yang besar telah terkonsentrasi di dekat parameter yang
diambil, kita akan mempunyai distribusi sebenarnya.
sampling dari Xbar dan distribusi sampling dari Kriteria good estimator adalah:
Xmed. Unbiasedness
Ternyata distribusi sampling dari Xbar akan Consistency
lebih terkonsentrasi di dekat µ dibandingkan Efficiency
dengan distribusi sampling dari Xmed.
Sufficiency
Suatu unbiased estimator dari parameter Relative Efficiency
populasi adalah estimator yang nilai Jika ada dua estimator tidak bias dari suatu
ekspektasinya sama dengan parameternya. parameter, yang variansnya lebih kecil
dikatakan relatif efisien.
Misal, rata-rata sampel X adalah estimator Misal, median sampel dan rata-rata sampel
yang unbiased dari rata-rata populasi µ adalah estimator tidak bias dari suatu rata-rata
karena: parameter, bagaimanapun, sampel median
E X
memiliki varians lebih besar dibandingkan
sampel rata-rata, sehingga yang dipilih adalah X
karena relatif efisien jika dibandingkan dengan
median sampel.

Konsistensi berarti bahwa, seiring ukuran Nilai varians untuk sampel besar
sampel yang meningkat, distribusi sampling 2
2
V X n dan V X med
dari estimator menjadi semakin terkonsentrasi 2n
pada nilai parameter yang sebenarnya.
Ketika ukuran sampelnya sama:
Jika disimbolkan
V X 2 2
X seiring n 0, 64
V X med 3,14
Atau lebih formal
P X 1 seiring n
Sehingga: V X V X med
X adalah estimator yang konsisten bagi .
Xbar lebih disukai
2
Effisien Diketahui bahwa V X n , dan X
Bagaimana jika ditemukan estimator dengan mempunyai varians terkecil, sehingga bisa
varians yang lebih kecil daripada varians yang disimpulkan bahwa Xbar mempunyai varians
sudah ada? minimum dan karena itu merupakan estimator
Varians tersebut bisa digunakan sebagai dasar dengan varians minimum bagi µ.
untuk mengukur effisiensi. Jika digabungkan dapat disimpulkan bahwa
Estimator tersebut adalah varians paling kecil Xbar merupakan estimator yang unbiased,
adalah estimator yang efisien konsisten, varians minimum bagi µ.

Jika ada suatu batas bawah dan bisa Sifat good estimator yang dikembangkan oleh
ditunjukkan bahwa suatu nilai varians tidak bisa Sir R. A. Fisher.
lebih kecil lagi, maka nilai varians itu adalah Jika Xbar adalah estimator yang sufficient dari
yang paling kecil. rata-rata populasi µ, artinya bahwa tidak ada
Yang digunakan adalah kata minimum daripada estimator dari mu, seperti median sampel,
paling kecil minimum varians. dapat menambahkan informasi lebih lanjut
Suatu estimator yang memiliki nilai varians mengenai parameter mu.
yang minimum disebut dengan estimator Dapat dibuktikan bahwa Xbar dan proporsi
dengan varians minimum. sampel p-hat adalah statistik cukup (estimator)
Cramer-Rao dipelajari di Statmat bagi dan p.
Ada banyak metode untuk mendapatkan estimator.
Yang paling utama adalah metode least squares dan
metode maximum likelihood. Kita dapat mengestimasi Dengan statistik
parameter population Sample
(Estimasi titik)
Mean x
Proportion p p

Suatu estimator titik menarik kesimpulan tentang populasi


Estimasi titik adalah angka tunggal, dengan mengestimasi nilai parameter yang tidak diketahui
Estimasi interval (Confidence interval) dengan menggunakan suatu nilai tunggal atau titik.
memberikan informasi tambahan tentang
variabilitas Kekurangan estimator titik adalah bahwa kita tidak dapat
mengaitkan pernyataan probabilitas dengannya dan
mengatakan seberapa mungkinkah estimator titik (misal
Lower Upper xbar) akan sama dengan parameternya ( ).
Confidence Confidence
Point Estimate Limit
Limit Dari teori peluang diketahui bahwa peluang dari suatu titik
Width of pada distribusi kontinu adalah hampir nol.
confidence interval
Diharapkan juga bahwa suatu estimator titik akan Istilah CI diperkenalkan oleh Prof. J. Neyman.
semakin dekat dengan nilai parameter ketika ukuran Pendekatan CI bisa menghubungkan
sampel meningkat, tetapi estimator titik tidak
pernyataan peluang dan interval.
mencerminkan pengaruh dari ukuran sampel yang
membesar. Illustrasi CI bagi :
Misal terdapat sampel random
Alternatif dalam mengestimasi adalah dengan x1=1, x2=3, x3=5, x4=7
mengatakan bahwa berada di antara dua nilai.
Dengan rata-rata dan standar deviasi .
Oleh karena itu kita akan menggunakan estimator Ingin mengestimasi dengan menggunakan
interval untuk memperkirakan parameter populasi. keempat nilai sampel ini.

Berdasarkan CLT : X
Seberapa besar ketidakpastian yang z N 0,1
berkaitan dengan suatu estimasi titik dari X

parameter populasi? Berdasarkan luas tabel normal, nilai z=1,96


akan bersesuaian dengan peluang sebesar
Suatu estimasi interval memberikan 0,975.
informasi yang lebih tentang suatu
karakteristik populasi daripada yang berikan Sehingga bisa dituliskan
oleh estimasi titik X
P 1,96 1,96 0,95
X
Estimasi interval seperti itu dinamakan
confidence intervals
Persamaan tsb diuraikan menjadi Peluang bahwa X akan berada dalam interval
P X 1,96 X 1,96 0,95 1,96 X adalah 0,95; maksudnya, terdapat 95
n n kesempatan dari 100 bahwa X akan berada di
antara 1,96 X dan 1,96 X , adalah nilai
Bagaimana interpretasinya???
parameter yang sebenarnya.
Ingat bahwa Xbar berdistribusi normal dengan
rata-rata dan varian 2/n. Kita dapat mengharapkan bahwa 95 dari 100
interval tersebut akan memuat . Jadi,
Variabel random Xbar mempunyai nilai yang
banyak yaitu dst P X 1,96 X 1,96 0,95
n n

Perhatikan Gambar berikut TETAPI begitu kita memilih suatu sampel dan
menghitung X ,
1
X 1 3 5 7 4
4

Maka X menjadi fixed sehingga bukan lagi


variabel random.
Yang kita punya adalah
Tidak memuat

P 4 1,96 4 1,96 0,95


n n
Tetapi
P X z X
X z X
1
4 1,96 ke 4 1,96
n n X adalah rata-rata sampel, 1- adalah
adalah interval yang fixed sehingga bisa di koefisien kepercayaan, z adalah deviasi yang
dalam dan di luar interval. Jadi peluangnya bisa bersesuaian dengan (tingkat signifikansi)
0 atau 1. yang diperoleh dari tabel normal, dan X
Misalkan a dan b adalah dua batas yang adalah standar error.
dihasilkan dari suatu sampel tertentu, maka
P a b 0,95
bukan peluang yang legitimate.

J. Neyman menamakan interval tersebut Suatu interval memberikan range nilai:


dengan confidence interval, dan 0,95
Mempertimbangkan variasi pada statistik
dinamakan confidence coefficient untuk sampel dari sampel ke sampel
membedakan dengan peluang.
Berdasarkan observasi dari 1 sample
Ringkasnya, 100(1- )% CI untuk parameter
adalah Memberikan informasi tentang kedekatan
X z X X z X pada parameter populasi yang tidak diketahui

dan Dinyatakan dalam suatu level kepercayaan


Tidak pernah 100% pasti
P X z X
X z X
1
Tingkat Kepercayaan atau
I am 95% Confidence Level
confident that
is between Kepercayaan di mana interval akan
Mean 40 & 60.
(mean, , is x = 50 memuat parameter populasi yang
unknown)
tidak diketahui
Sample Suatu persentase (kurang dari 100%)

Formula umum untuk semua Misal tingkat kepercayaan = 95%


interval kepercayaan adalah: Ditulis juga (1 - ) = 0,95
Suatu interpretasi dari frekuentsi relatif:
Point Estimate (Critical Value)(Standard Error) Dalam jangka panjang, 95% dari semua selang
kepercayaan yang bisa dibuat akan memuat
parameter sebenarnya yang tidak diketahui.
Suatu interval bisa memuat atau tidak
memuat parameter yang sebenarnya
No probability involved in a specific interval
Confidence Consider a 95% confidence interval: z 1.96
Intervals
1 .95

Population Population
Mean Proportion
.025 .025
2 2

Known Unknown z units: z.025= -1.96 0 z.025= 1.96


Lower Upper
x units: Confidence Point Estimate Confidence
Limit Limit

Assumptions Commonly used confidence levels are


Population standard deviation is known 90%, 95%, and 99%
Population is normally distributed Confidence
Confidence
z value,
Coefficient,
If population is not normal, use large sample Level
1 z /2
80% .80 1.28
Confidence interval estimate 90% .90 1.645
95% .95 1.96
98% .98 2.33

x z 99% .99 2.57

n
99.8% .998 3.08
99.9% .999 3.27
Sampling Distribution of the Mean

/2 1 /2 e z /2
x
n
x

x1 Data variation, : e as
x2
x z /2 Sample size, n : e as n
n

x z Level of confidence, 1 - : e if 1 -
/2
n
Confidence Intervals

Margin of Error (e): the amount added and Sampel 11 sirkuit dari populasi normal yang
subtracted to the point estimate to form the besar memiliki rata-rata ketahanan 2,20
confidence interval ohm. Dari pengujian terakhir diketahui
bahwa standar deviasi populasi adalah 0,35
Example: Margin of error for estimating , known: ohm
Tentukan 95% confidence interval bagi
x z /2 e z /2
rata-rata yang sebenarnya dari ketahanan
n n populasi.
Sampel 11 sirkuit dari populasi normal yang
besar memiliki rata-rata ketahanan 2,20 ohm.
Interpretasi yang tidak benar adalah bahwa
Dari pengujian terakhir diketahui bahwa Terdapat 95% peluang bahwa interval ini
standar deviasi populasi adalah 0,35 ohm. memuat rata-rata populasi yang sebenarnya.
Solution: x z /2
(Interval ini bisa memuat atau tidak memuat rata-
n
rata yang sebenarnya, tidak ada peluang untuk
2.20 1.96 (.35/ 11) suatu interval tunggal)
2.20 .2068
1.9932 .......... ..... 2.4068

Kita 95% percaya bahwa rata-rata sebenarnya Confidence


dari resistance adalah di antara 1,9932 dan Intervals
2,4068 ohms
Meskipun rata-rata yang sebenarnya berada Population Population
Mean Proportion
atau tidak berada pada interval tersebut, 95% of
intervals formed in this manner will contain the
true mean
Known Unknown
Jika standar deviasi populasi tidak t merupakan keluarga distribusi.
diketahui, kita dapat mengganti dengan Nilai t tergantung pada derajat kebebasan
sampel standar deviasi s. (d.b.)
Banyaknya observasi yang bebas untuk bervariasi
Ini akan menambah ketidakpastian setelah rata-rata sampel dihitung.
karena s adalah variabel dari sampel ke
sampel. d.f. = n - 1

Sehingga yang digunakan adalah


distribusi-t bukan distribusi normal.

Assumptions Ide: banyaknya observasi yang bebas untuk bervariasi


setelah rata-rata sampel dihitung.
Population standard deviation is unknown
Population is normally distributed Example: Suppose the mean of 3 numbers is 8.0
If population is not normal, use large sample
Let x1 = 7
t Distribution If the mean of these three
Let x2 = 8
Estimasi Confidence Interval values is 8.0,
What is x3? then x3 must be 9
s (i.e., x3 is not free to vary)
x t /2 Here, n = 3, so degrees of freedom = n -1 = 3 1=2

n (2 values can be any numbers, but the third is not free to vary
for a given mean)
Note: t z as n increases With comparison to the z value

Confidence t t t z
Standard
Normal Level (10 d.f.) (20 d.f.) (30 d.f.) ____
(t with df = )
.80 1.372 1.325 1.310 1.28
t (df = 13)
t-distributions are bell- .90 1.812 1.725 1.697 1.64
shaped and symmetric, but
t (df = 5) .95 2.228 2.086 2.042 1.96
normal
.99 3.169 2.845 2.750 2.57

0 t Note: t z as n increases

A random sample of n = 25 has x = 50 and


Upper Tail Area
Let: n = 3 s = 8. Form a 95% confidence interval for
df .25 .10 .05 df = n - 1 = 2
= .10 d.f. = n 1 = 24, so t /2 , n 1 t.025,24 2.0639
1 1.000 3.078 6.314 /2 =.05
The confidence interval is
2 0.817 1.886 2.920 s 8
/2 = .05 x t /2 50 (2.0639)
3 0.765 1.638 2.353 n 25
The body of the table
contains t values, not 0 2.920 t
probabilities
Since t approaches z as the sample size If = 45, what sample size is needed to be
increases, an approximation is sometimes 90% confident of being correct within ± 5?
used when n 30:
2 2
Technically Approximation z 1.645(45)
/2
correct for large n n 219.19
e 5
s s
x t /2 x z /2
n n So the required sample size is n = 220

(Always round up)

The required sample size can be found to If unknown, can be estimated when
reach a desired margin of error (e) and
level of confidence (1 - ) using the required sample size formula
Use a value for that is expected to be
Required sample size, known: at least as large as the true

2 2 Select a pilot sample and estimate with


z 2 /2 z
n /2 the sample standard deviation, s
e2 e
Confidence Recall that the distribution of the sample
Intervals proportion is approximately normal if the
sample size is large, with standard deviation
Population Population p(1 p)
Mean Proportion p
n
We will estimate this with sample data:
Known Unknown
p(1 p)
sp
n

Upper and lower confidence limits for the


An interval estimate for the population population proportion are calculated with the
formula
proportion ( p ) can be calculated by
adding an allowance for uncertainty to p(1 p)
p z /2
the sample proportion ( p ) n
where
z is the standard normal value for the level of confidence desired
p is the sample proportion
n is the sample size
We are 95% confident that the true
Sampel acak 100 orang menunjukkan percentage of left-handers in the population
bahwa 25 diantaranya adalah kidal. is between
16.51% and 33.49%.
Bentuklah 95% interval kepercayaan
untuk proporsi sebenarnya dari orang Although this range may or may not contain
the true proportion, 95% of intervals formed
kidal. from samples of size 100 in this manner will
contain the true proportion.

A random sample of 100 people shows


that 25 are left-handed. Form a 95% Increases in the sample size reduce
confidence interval for the true proportion the width of the confidence interval.
of left-handers.
Example:
1. p 25/100 0.25 If the sample size in the above example is
doubled to 200, and if 50 are left-handed in the
2. Sp p(1 p)/n 0.25(0.75)/n 0.0433 sample, then the interval is still centered at .25,
but the width shrinks to
3. .25 1.96 (.0433)
0.1651 . . . . . 0.3349
Solution:
Define the p(1 p) For 95% confidence, use Z = 1.96
margin of error: e z /2
n e = .03
p = .12, so use this to estimate p

z2 /2 p (1 p) z 2 /2 p (1 p) (1.96)2 (.12)(1 .12)


Solve for n: n n 450.74
e2 e2 (.03)2
p can be estimated with a pilot sample, if So use n = 451
necessary (or conservatively use p = .50)

How large a sample would be necessary Estimasi interval dari varians dapat dibuat
to estimate the true proportion defective in dengan menggunakan statistik
a large population within 3%, with 95% n 1 S2
2
confidence? X 2

(Assume a pilot sample yields p = .12) Jika sampel diambil dari populasi
normal, maka X2 berdistribusi khi-
kuadrat dengan derajat bebas v=n-1
Bisa dituliskan Jika s2 adalah varians sampel acak
2 dengan ukuran n dari populasi normal,
P X2 2
1
1 2 2 maka CI 100(1- )% untuk 2 adalah
n 1 S2 n 1 S2 2 n 1 S2
2 2
P 1 2 2 2 1 2 2
2 1 2
2 2
Di mana 2 dan
1 2 masing-masing
n 1 S2 2 n 1 S2 adalah nilai khi-kuadrat dengan df v=n-1.
P 2 2
1
2 1 2

Gambar P
2
1 2 X2 2
2 1 The following are the weights, in decagrams,
of 10 packages of grass seed distributed by a
certain company: 46.4, 46.1, 45.8, 47.0, 46.1,
45.9, 45.8, 46.9, 45.2, and 46.0. Find a 95%
confidence interval for the variance of the
weights of all such packages of grass seed
distributed by this company, assuming a
normal population.
Solusi: SOAL LATIHAN
Pertama kita cari

Suatu perusahaan listrik yang membuat


bola lampu yang panjang umurnya
berdistribusi hampir normal dengan
simpangan baku 40 jam. Bila sample 30
bola lampu berumur rata-rata 780 jam,
hitunglah selang kepercayaan 96% untuk
rata-rata populasi bola lampu yang
dihasilkan perusahaan tersebut
Berapa besarkah sampel diperlukan pada Sampel acak 12 lulusan suatu sekolah
soal 1 bila diinginkan kepercayaan 96% sekretaris mengetik rata-rata 79,3 kata per
agar rata-rata sampel paling banyak menit dengan standar deviasi 7,8 kata per
meleset 10 jam dari rata-rata menit. Anggap jumlah kata yang diketik per
sesungguhnya? menit berdistribusi normal. Buatlah selang
kepercayaan 95% untuk rata-rata jumlah
kata yang diketik per menit oleh semua
lulusan sekolah tadi

Sebuah mesin menghasilkan potongan Suatu sampel acak 200 pemilih diambil dan
logam yang berbentuk silinder. Sampel ternyata 114 daripadanya mendukung
beberapa potongan diukur dan ternyata calon A. Hitunglah selang kepecayaan 96%
diameternya 1,01 ; 0,97 ; 1,03 ; 1,04 ; 0,99 ; untuk proporsi populasi pemilih yang
0,98 ; 0,99 ; 1,01 ; dan 1,03 cm. hitunglah mendukung calon A.
selang kepercayaan 99% untuk rata-rata
diameter potongan yang dihasilkan mesin
tersebut bila dimisalkan distribusinya
hampir normal
Dari suatu sampel acak 1000 rumah di
suatu kota ternyata 228 menggunakan gas
elpiji. Cari selang kepercayaan 99% untuk
proporsi rumah di kota tadi yang
menggunakan gas elpiji.

Suatu sistem peluncur roket tertentu sedang


dipertimbangkan untuk dipakai meluncurkan
sejumlah roket jarak pendek. Sistem yang
sekarang mempunyai peluang berhasil
meluncurkan sebuat roket p=0,8. Sampel 40
peluncuran percobaan dengan system yang baru
menunjukkan 34 yang berhasil.
a. Buatlah selang kepercayaan 95% untuk p.
b. Apakah kenyataannya cukup besar untuk
mendukung bahwa sistem yang baru ini lebih
baik? Jelaskan.
2 2
1 2
x1 x 2
n1 n2

2 2
x1 x2 z /2
1 2
n1 n2
2 2
s1 s2
x1 x 2 z /2
n1 n2
1 1
x1 x 2 t /2 sp
n1 n2

2 2
n1 1 s1 n2 1 s2
sp
n1 n2 2

s12 s22
x1 x 2 t /2
2 2 n1 n2
n1 1 s n2 1 s2
sp 1
n1 n2 2
2
s12 n1 s22 n2
v 2 2
s12 n1 s22 n2
n1 1 n2 1
sd
d t /2
n
n
Where t /2 has (d i d)2
n - 1 d.f. and sd is: sd i 1
n 1

n
The point estimate for di
the population mean d i 1
paired difference is d : n

n
The sample standard
(d i d) 2
deviation is i 1
sd
n 1
x1 x2 82 76 6

64 36 64 36
6 2,054 1 2 6 2, 054
75 50 75 50
atau
3, 43 1 2 8,57

p1 (1 p1 ) p2 (1 p2 )
p1 p2 z /2
n1 n2
2
1
2
2

2
s12
F 2
2
F v1 , v2 di mana v1 n1 1 dan v2 n2 1
1 s22
P f v1, v2 F f v1 , v2 1
1
2 2 2 2
1 2

s12 1 2
s12
1
f v2 , v1
s22 f v1 , v2 2
2 s22 2
2

/2 1- /2

f1- /2 f /2

P f v1 , v2 F f v1 , v2 1
1
2 2
2
s12
P f v1 , v2 2
2
f v1 , v2 1
1
2 1 s22 2

s12 1 2
s12 1
P 1
1
s22 f v1 , v2 2
2 s22 f v1 , v2
1
2 2

s12 1 2
s12
P 1
f v2 , v1 1
s22 f v1 , v2 2
2 s22 2
2
2 2
1 2

2 2
1 2
METODE STATISTIK II
Contoh hipotesis penelitian yang bisa diuji
Apakah Hipotesis? secara empiris:

Suatu pernyataan yang merupakan dugaan Apakah ada hubungan antara pendidikan pemilih dengan
yang mungkin benar atau mungkin salah calon presiden yang dipilih?
mengenai sesuatu hal dan perlu dibuktikan atau
Apakah peraturan lalu lintas yang baru diimplementasikan
dilakukan pengecekan lebih lanjut. di suatu ruas jalan telah menyebabkan menurunnya rata-
Pernyataan atau dugaan itu rata kecepatan kendaraan melintas di ruas jalan tersebut?
mungkin diterima, mungkin ditolak
Apakah bibit unggul padi varitas terbaru telah
Digunakan sebagai dasar meningkatkan produksi padi per hektar?
pembuatan keputusan untuk
pemecahan persoalan Apakah telah terjadi perubahan rata-rata produksi cabai
keriting akibat adanya perubahan iklim?

Hipotesis Statistik Jenis Hipotesis Statistik


Suatu pernyataan atau dugaan yang Hipotesis nol (H0): suatu pernyataan atau
mungkin benar atau mungkin salah dugaan yang akan dibuktikan
tentang parameter dari satu atau lebih Hipotesis alternatif (H1): segala hipotesis yang
populasi yang bisa diuji secara empiris berbeda dengan H0
(berdasarkan data) H0 sering disebut hipotesis yang ingin ditolak
dan H1 sering disebut hipotesis yang ingin
Pemeriksaan tentang distribusi/sebaran diterima
dari satu atau lebih peubah acak Untuk menolak atau menerima H0 harus ada uji
hipotesis, hal ini diperlukan karena
pengamatan berdasar sampel
Kesalahan yang sering dilakukan peneliti adalah membuat
bentuk H0 tidak dalam bentuk sama dengan.
Ilustrasi
Suatu vaksin influenza (A) diketahui hanya efektif 25%
Dalam (Asra & Sutomo, 2014):
setelah 2 tahun. Ingin diamati apakah Vaksin baru (B)
H0 dibuat dalam bentuk sama dengan atau tidak ada kaitan
adalah untuk memungkinkan diturunkannya distribusi lebih unggul dibanding vaksin A untuk periode waktu
sampling dari statistik yang dipakai dalam pengujian secara yang lebih lama, maka diambil sampel 20 orang secara
pasti sehingga prosedur pengujian hipotesis yang berdasar
H0 acak. Jika 9 atau lebih dari orang yang menerima vaksin
Dengan membuat H0 dalam bentuk sama dengan, berarti B dapat terbebas dari virus influenza selama 2 tahun
mengambil nilai satu parameter saja maka distribusi maka vaksin B dinilai lebih unggul dari vaksin A.
sampling dapat diturunkan secara matematik statistik.
Sehingga daerah tolak dan daerah terima untuk uji hipotesis :p 14
0
berdasar tingkat signifikansi tertentu dapat diperoleh. Atau
nilai p-value dari statistik sampel dapat dihitung. H1 : p 1 4

Hipotesis dan Pengujiannya Statistik untuk landasan keputusan:


X (banyaknya orang dari 20 orang sampel yang terjangkit
virus influenza selama periode 2 tahun)
Kemungkinan nilai X dibagi menjadi 2 kelompok:
a) < 9
b)
Semua nilai di atas 8,5 menyusun Wilayah kritis &
semua nilai di bawah 8,5 menyusun Wilayah
penerimaan. x0 = 8,5 adalah Nilai kritis
Keputusan
Bila x > x0 tolak H0 terima H1
Bila x < x0 terima H0
Sumber: www.slideshare.net/yayansaleho/uji-hipotesis
Contoh Kasus: Contoh Kasus: (lanjutan)
Seorang yang dituduh pencuri dihadapkan kepada Dalam kasus ini, ada dua kemungkinan
seorang hakim. Seorang hakim akan menganggap kesalahan yang dilakukan hakim:
orang tersebut tidak bersalah, sampai kesalahan-
nya dapat dibuktikan. Seorang jaksa akan berusaha Memenjarakan orang yang benar
membuktikan kesalahan orang tersebut. (Kesalahan Tipe I)
Dalam kasus ini, Melepaskan orang yang bersalah
H0 : "Orang tersebut tidak bersalah" (Kesalahan Tipe II)
H1 : "Orang tersebut bersalah".
H1 inilah yang akan dibuktikan

Contoh Kasus: (lanjutan) H0: Orang tersebut tidak bersalah


UJI HIPOTESIS
H1: Orang tersebut bersalah
Ada dua kondisi yang mungkin terjadi:
1. Orang tersebut tidak bersalah.
Keputusan H0 benar H1 benar
2. Orang tersebut bersalah.
Menerima H0 Keputusan yang Keputusan yang
(Orang tsb benar (1- ) salah (Kesalahan
Dan ada dua keputusan yang bisa dibebaskan) Tipe II atau )
diambil oleh hakim Menolak H0 Keputusan yang Keputusan yang
1.Melepaskan orang tersebut. (Orang tsb salah (Kesalahan benar (1- )
2.Memenjarakan orang tersebut. dipenjara) Tipe I atau )
Tipe Kesalahan Pengujian Hipotesis Kuasa Uji
a) Kesalahan jenis I Peluang untuk melakukan kesalahan tipe
Kesalahan yang disebabkan karena menolak II disebut .
H0 yang benar. Sedangkan nilai 1- disebut tingkat
kekuatan uji (power of the test).
a) Kesalahan jenis II Power of the test ini menunjukkan
Kesalahan yang disebabkan karena tidak seberapa besar peluang menolak H0 jika
menolak H0 yang salah.
Ho salah.
Kekuatan uji 0,8 biasanya sudah bisa
dianggap baik.

Tingkat Signifikansi Hubungan Nilai dengan Nilai


Tingkat signifikansi adalah besarnya Jika nilai diturunkan maka nilai akan
peluang melakukan kesalahan tipe I bertambah dan berlaku sebaliknya
(disebut ). Biasanya 10%, 5% atau 1%. Nilai dan nilai akan berkurang jika
jumlah sampel ditambah
Sedangkan nilai 1- disebut tingkat
kepercayaan/taraf nyata menyatakan
seberapa nyata (bisa menolak H0)
Penggunaan untuk tentukan keputusan Jenis Pengujian Hipotesis (2)
a) Bila peluang memperoleh statistik uji (yang
disebut p-value) < tingkat signifikansi maka 2. Pengujian hipotesis majemuk (dua
H0 ditolak. arah)
Catatan:
p-value adalah peluang memperoleh statistik uji dengan Pengujian hipotesis dengan 2 wilayah
asumsi H0 benar kritis pada bagian kurva (yaitu bagian
Jika gunakan software biasanya p-value sudah dihitung
langsung. kanan dan kiri)
b) Berdasarkan perbandingan nilai tabel (apakah Contoh: H0: = 0
tabel Z, tabel t atau tabel F) berdasarkan jenis
pengujian hipotesis (bentuk H1 apakah satu H1: 0
atau dua arah) Uji dua arah

Jenis Pengujian Hipotesis (1) Contoh Jenis Pengujian Hipotesis:


Diketahui dari informasi di surat kabar bahwa:

1. Pengujian hipotesis tunggal (satu 9.800,-


arah) H0 : µ = Rp. 9.800,-
H1 : µ < Rp. 9.800,- Pengujian satu arah-kiri
Pengujian hipotesis dengan wilayah kritis Beras jenis di Jakarta Timur tidak lebih dari
pada 1 bagian kurva saja yaitu bagian Rp. 10.500,-
kanan saja atau kiri saja. H0 : µ = Rp. 10.500,-
H1 : µ > Rp. 10.500,- Pengujian satu arah-kanan
Contoh: Ho: = 0 Ho: = 0 .
H1: < 0 H1: > 0 7.800,-
H0 : µ = Rp. 7.800,-
Uji satu arah kiri Uji satu arah kanan H1 : µ Rp. 7.800,- Pengujian dua arah
Uji Satu Arah Kiri Uji Dua Arah

Uji Satu Arah Kanan Statistik Uji untuk uji hipotesis rata-rata

H0 Nilai Statistik Uji H1 Wilayah Kritis

diketahui atau n 30

tidak diketahui dan n < 30


Statistik Uji untuk uji hipotesis rata-rata Statistik Uji untuk uji hipotesis varians
H0 Nilai Statistik Uji H1 Wilayah Kritik
H0 Nilai Statistik Uji H1 Wilayah Kritik

1 dan 2 diketahui

sebaran hampir
normal
Untuk satu populasi

1 2 tapi tidak diketahui

sebaran hampir
normal
Untuk dua populasi

dan tidak diketahui

Statistik Uji untuk uji hipotesis rata-rata Statistik Uji untuk uji hipotesis proporsi
H0 Nilai Statistik Uji H1 Wilayah Kritik
H0 Nilai Statistik Uji H1 Wilayah Kritik

n kecil

pengamatan berpasangan
Statistik Uji untuk uji hipotesis proporsi Statistik Uji untuk uji hipotesis proporsi
H0 Nilai Statistik Uji H1 Wilayah Kritik

H0 Nilai Statistik Uji H1 Wilayah Kritik


x np0
z
np0 q0
x k n besar
hampiran normal
n kecil

n besar
hampiran normal

Statistik Uji untuk uji hipotesis proporsi Prosedur Pengujian Hipotesis

H0 Nilai Statistik Uji H1 Wilayah Kritik


Peluang melakukan
kesalahan Tipe I

n kecil
Contoh soal: Soal:
Sebuah sampel random yang terdiri dari 40 1. Sebelum ada kenaikan harga BBM, rata-rata
kaleng susu bubuk yang dihasilkan oleh sebuah harga beras Saigon Bandung Rp. 8500,-/Kg
pabrik, pada kalengnya tertulis bahwa beratnya dengan standar deviasi Rp. 500,-/Kg. Diduga
400 gram. Setelah ditimbang satu persatu, harga beras tsb secara rata-rata akan naik
ternyata menunjukkan berat rata-rata 398 gram sesusdah harga BBM naik. Diambil sampel 36
dengan standar deviasi 35 gram. Jika digunakan pedagang beras memberikan rata-rata harga
1% tingkat signifikansi, benarkah bahwa tulisan beras Saigon Bandung Rp. 8750,-/Kg. Dengan
yang ada pada setiap kaleng susu itu tingkat signifikan 5% uji hipotesis tersebut dan
menunjukkan berat susu sebenarnya? beri kesimpulan.

Jawab: 2. Uji hipotesis bahwa isi kaleng rata-rata


H0 : µ = Rp. 400,- suatu minyak pelumas adalah 10 liter bila
H1 : µ Rp. 400,- isi suatu sampel acak adalah 10,2; 9,7;
= 1%
z z0,005 2,58 10,1; 10,3; 10,1; 9,8; 9,9; 10,4; 10,3 dan
/2
9,8 liter. Gunakan 1% tingkat signifikansi
Statistik uji:
x 0 398 400 dan asumsikan bahwa isi kaleng
z hitung 1,99
s n 35 40 menyebar normal!
Daerah kritis atau daerah tolak:
Daerah yang >2,58 dan daerah yang <-2,58
Kesimpulan: Karena Zhitung =-1,99 berada di daerah terima
maka H0 diterima
3. Empat puluh unit kebun apel di Kota Batu dan 36 unit 5. Diketahui 70 % dari mahasiswa UI
kebun apel di Poncokusumo dipilih secara random
sebagai sampel untuk menguji dugaan bahwa menolak rencana kenaikan biaya kuliah
produktivityas rata-rata per tahun kebun apel di Kota yang akan digunakan membangun
Batu lebih tinggi daripada kebun apel Poncokusumo. fasilitas parkir di universitas tersebut.
Berdasarkan sampel tersebut diperoleh informasi
bahwa produktivitas kebun apel di Kota Batu adalah 80 Jika 15 dari 18 mahasiswa yang terambil
ton dengan simpangan baku 1,6 ton dan di sebagai sampel acak, dlm penelitian
Poncokusumo sebesar 78,2 ton dengan simpangan menentang rencana tersebut. Uji
baku 2,1 ton. Dengan = 5%, apakah sampel
mendukung dugaan bahwa produktivitas kebun apel di penyataan Presiden BEM UI bahwa
Kota Batu lebih tinggi daripada di Poncokusumo. mahasiswa UI yang menolak rencana tsb
lebih banyak dari 70 % dengan = 0,05.

4. Sebuah mesin minuman ringan perlu diperbaiki


jika varians minuman yang dikeluarkan
melebihi 1,15 desiliter . Suatu sampel acak 25
minuman dari mesin ini menghasilkan varians
2,03 desiliter. Pada taraf nyata 0,05 apakah ini
menunjukkan bahwa mesin itu sudah perlu
diperbaiki?Asumsi bahwa isi minuman yang
dikeluarkan mengikuti distribusi normal
x
tn 1 x
s z
n n

x x
z tn 1
s
n n
1. Specify the population value of interest
The mean number of TVs in US homes
2. Formulate the appropriate null and alternative
hypotheses x 2.84 3 .16
H0: 3 HA: < 3 (This is a lower tail test) z 2.0
0.8 .08
3. Specify the desired level of significance
Suppose that = .05 is chosen for this test n 100
0.8
x z 3 1.645 2.8684
n 100
P(x 2.84 | 3.0)

2.84 3.0
P z
0.8
100
P(z 2.0) .0228
P(x 53.1| 52.0)

53.1 52.0
P z
10
64
x 53.1 52 P(z 0.88) .5 .3106
z 0.88
10 .1894

n 64
x 172.50 168
tn 1 1.46
s 15.40
n 25
x number of successes in sample
p
n sample size

p(1 p)
p p
n

p p .05 .08
z 2.47
p(1 p) .08(1 .08)
n 500

p p
z
p(1 p)
n
P(z 2.47) P(x 2.47)
2(.5 .4932)
2(.0068) 0.0136
H0 : 1 2 d0
H1 : 1 2 d0 ; H1 : 1 2 d0 ; H1 : 1 2 d0

x1 x2 d0 x1 x2 d0
z z
2 2
1 2
1 1
n1 n2 n1 n2

H1 : 1 2 d0
z z 2 atau z z 2

H1 : 1 2 d0
X1 X 2 1 2 z z
Z
2 2
n1 n2
1 2
H1 : 1 2 d0
z z
x1 x2 d0
t
1 1
sp
n1 n2

2 s12 n1 1 s22 n2 1
s p
n1 n2 2

H1 : 1 2 d0
t t 2,n1 n2 2 atau t t 2,n1 n2 2

H1 : 1 2 d0
t t ,n1 n2 2

H1 : 1 2 d0
t t ,n1 n2 2
H1 : D d0
D t t 2,n 1 atau t t 2,n 1
T D

sd n

H1 : D d0
2
t t ,n 1
n n
2
n d di
i 1
i
i 1 H1 : D d0
sd
n n 1 t t ,n 1

H0 : D d0
H1 : D d 0 ; H1 : D d0 ; H1 : D d0

d d0
t t n 1
sd n
d 9,848 dan sd 18, 474
9,848 0
t 2,06
18, 474 15
p1 p2 p1 p2
Z
x1 x2 p1 1 p1 p2 1 p2
p1 dan p2 n1 n2
n1 n2

p1 p2

p1 p2

p1 p2
H1 : p1 p2
z z 2 atau z z 2

H1 : p1 p2
z z
H1 : p1 p2
z z

H 0 : p1 p2
H1 : p1 p2 ; H1 : p1 p2 ; H1 : p1 p2

p1 p2
z
1 1
pq
n1 n2
x1 120 x2 240
p1 0,60 ; p2 0, 48
n1 200 n2 500
x1 x2 120 240 360
p 0,51
n1 n2 200 500 700

0, 60 0, 48
z 2,9
1 1
0,51 0, 49
200 500
2
2 n 1 S2 n Xi X
X 2 2
i 1
2 2 2
H0 : 0 , 0 merupakan suatu nilai tertentu
2 n 1 s2 2
2 2
H1 : 2 2
; H1 : 2 2
; H1 : 2 2

2
ekivalen dengan s n 1 0 0 0
n 1

2 n 1 s2
2
0

2 2 2 2
1 2 atau 2

2 2 2 2
1 untuk H1 : 0
2 2 2 2
untuk H1 : 0
2 2
H0 : 1 2
2 2 2 2 2 2
H1 : 1 2 ; H1 : 1 2 ; H1 : 1 2

S12 2 2 2
S
F 1 2 1
s12
S22 2
2
2 2
S
2 2 f
s22

f f v1 , v2
f f1 v1 , v2
f f v1 , v2 atau f f v1 , v2
1
2 2
2 (oi ei )2
ei

2 2
,k 1
2 2 2
,k 1 0,05;3 1 5,99147
2 (oi ei )2
ei
METODE STATISTIK II

Uji Proporsi Beberapa Populasi


Proporsi sering digunakan untuk memperkirakan
probabilitas
Pengujian proporsi dapat mencakup lebih dari 2 proporsi.
Contoh:
Pengujian persentase barang yang rusak dari 3 pabrik adalah sama
Pengujian persentase penduduk yang setuju KB di 4 desa adalah
sama
Pengujian persentase pendukung calon gubernur di 7 kabupaten
adalah sama
H 0 : p1 p2 pk
H1 :

2
Ada 2 jenis pengujian:
Uji Proporsi Beberapa Populasi 1. Pengujiian untuk k populasi binomial, dimana
kemungkinan hasil ada dua, misalkan: sukses- gagal, ya
Uji Proporsi tidak, tinggi-rendah
2. Pengujian untuk k populasi multinomial, dimana
kemungkinan hasil lebih dari dua, misalkan: sangat
1 Populasi 2 Populasi Lebih dari 2 Populasi setuju-setuju-tidak setuju, jenis ekskul yang diikuti, dll

Uji Z Uji Z Uji Chi-Square Untuk kedua jenis pengujian tersebut, tahapan yang
dilakukan sama, hanya untuk populasi binom, tabel
kontingency menjadi 2xc, dan derajat bebas chi
Gunakan sampel untuk mengambil kesimpulan tentang proporsi squarenya menjadi (c-1)
populasi

3 5

Uji Proporsi Beberapa Populasi Prosedur Pengujian


Statistik Chi Square untuk uji kebebasan dan
kebaikan suai dapat juga diterapkan untuk
menguji apakah k populasi memiliki proporsi (p)
2
yang sama 2
r c oij eij
Asumsi: i 1 j 1 eij
Sampel independen
oij
Sampel adalah random
eij
Masing-masing subject dapat diklasifikasikan ke
dalam dua atau lebih kategori yang mutually
exclusive

4 6
Pengujian k Populasi Multinomial Pengujian k Populasi Binomial
1. Ambil sampel bebas acak berukuran n . Bentuk tabel Ambil sampel bebas acak berukuran n1 , n2 . Bentuk tabel
kontingensi berukuran 2 x c,
kontingensi berukuran 2 x k,
Populasi
Kategori Sampel
1 2 .... c Total Kategori
1 2 .... k
1 n11 n12 ..... n1c n1.
Sukses n11 n12 .... n1k
2 n21 n22 ..... n2c n2.
Gagal n21 n22 .... n2k
.... .... .... ....
r c
r nr1 nr2 ..... nrc nr. 2
2
r c oij eij
Total n.1 n.2 ..... n.c n eij
i 1 j 1

Dimana r adalah jumlah kemungkinan hasil dan c adalah 2 2


0 v r 1 c 1
populasi. Nilai observasi dinotasikan dengan nij atau oij
7 9

Sehingga untuk tabel kontingensi berukuran 2 x k,


2
2
r c oij eij 2 2
0
i 1 j 1 eij

( v 2 1 k 1 k 1

n.1
e11 n1.
n

8 10
Contoh Soal:
5. Statistik hitung, buat tabel expected cell frequency,
A. Apakah ada perbedaan proporsi mahasiswa yang misalkan e11 = (40 x 26)/ 121 = 8,595, dst, sehingga diperoleh
mengikuti kegiatan ekskul pada tingkat I-III? tabel sbb:
Tingkat
Tingkat Ekskul
I II III Total
Ekskul
I II III Total Rohis 8,595 8,809 8,595 26
Rohis 5 11 10 26 Mading 18,860 17,281 16,859 51
Mading 21 21 9 51 cheby 14,545 14,909 14,545 44
Cheby 14 9 21 44 Total 40 41 40 121
Total 40 41 40 121 (5 8,595)2 (11 8,809)2 (21 14,545)2
2
........ 12,206
Tahapan Pengujian: 8,595 8,809 14,545
Karena 12,206 > 9,488, maka kita tolak Ho, yang berarti bahwa
1 . Ho : proporsi mahasiswa yang mengikuti ekskul sama
terdapat cukup bukti (data sampel mendukung) bahwa proporsi
H1 : proporsi mahasiswa yang mengikuti ekskul tidak sama mahasiswa yang mengikuti ekskul adalah tidak sama

11 13

Contoh Soal:
B. Apakah ada perbedaan proporsi kelengkapan barang yang
2. = 0,05, n= 121, r = 3 c = 3 dirakit oleh pekerja yang sama menurut waktu kerja (shift
3. Statistik uji, distribusi chi square: pagi, siang, malam). Datanya sbb:

Shift
2
r c (oij eij ) 2 Shift
Pagi Siang Malam Total
i 1 j 1 eij
Tidak Lengkap 45 55 70 170
Lengkap 905 890 870 2.665
4. Wilayah kritis: 2 > 2 0,05(2x2) 2 > 2 0,05(4)
Total 950 945 940 2835
2 > 9,488
Dengan =0,025 uji apakah proporsi ketidaklengkapan
barang adalah sama untuk ketiga shift

12 14
Tahap pengujian: Catatan:
1. H0 : p1 p2 p3 1. Rumus 2
r c (oij eij ) 2
untuk pengujian beberapa
H1 : p1, p2 , p3 i 1 j 1 eij

2. = 0,025, n= 2655, r = 2 c = 3 proporsi hanya berlaku jika eij 5 untuk semua i dan j
3. Statistik uji, distribusi chi square: 2. Jika eij 5 maka harus dilakukan penggabungan sel-sel
yang berdekatan, sehingga derajat bebasnya (dof) makin
2
r c (oij eij ) 2 berkurang
i 1 j 1 eij 3. Untuk tabel kontingensi 2x2, yang dof-nya adalah 1, jika
banyak sampel pengamatan n<40 harus diterapkan
koreksi Yate sehingga rumusnya menjadi:
4. Wilayah kritis: 2 > 2 0,025(2) 2 > 7,378 2
r c ( oij eij 0,5) 2
koreksi
i 1 j 1 eij

15 17

5. Statistik hitung, buat tabel expected cell frequency,


misalkan e11 = (950 x 170)/ 2835 = 57,0, dst, sehingga
Latihan Soal:
diperoleh tabel sbb: 1. Diduga proporsi mahasiswa STIS yang sangat resah, resah
dan cukup resah dalam menghadapi UAS adalah sama,
Shift dengan alternatif tidak sama untuk 4 tingkat. Dari sampel
Shift
Pagi Siang Malam Total penelitian datanya sbb:
Tidak Lengkap 57,0 56,7 56,3 170 Tingkat mahasiswa
Kategori
Lengkap 893,0 888,3 883,7 2665 I II III IV
Total 950 945 940 2835 Sangat resah 40 55 80 75
2 (45 57,0)2 (55 56,7)2 (870 883,7)2 Resah 15 30 40 50
........ 6,29
57,0 56,7 883,7
Cukup resah 20 25 30 40
Karena 6,29<7,378, maka kita gagal tolak Ho, yang berarti
bahwa proporsi ketidaklengkapan barang yang dirakit adalah Dengan =5% uji dugaan tersebut!
sama untuk seluruh shift

16 18
Latihan Soal:
2. Ingin diteliti apa ada perbedaan proporsi orang tua di
empat wilayah Bogor, Tangerang, Bekasi dan Depok yang
setuju dengan pemberian materi sex education di sekolah-
sekolah
Wilayah
Kategori
Bogor Tangerang Bekasi Depok
Setuju 84 72 67 81
Tidak setuju 16 28 33 19

Dengan =0,025 uji apakah proporsi orang tua yang setuju


dengan pemberian materi sex education di sekolah-
sekolah sama di ke-4 wilayah

19
2
k
(oi ei ) 2
hitung
i 1 ei
2
k
(oi ei ) 2
hitung
i 1 ei
1 k 2 ai
T3 ai ( xn i 1 xi )
D i 1
xn i 1
n
D xi x
2
xi
i 1
x
xi xi x ( xi x) 2 n
2
D xi x 3.184,96
i 1

T3 d n
G bn cn ln
1 T3
G
bn , cn , d n

ai xn i 1 xi ai ( xn i 1 xi )
2
1 k
T3 ai ( xn i 1 xi )
D i1
1 2
54,69 0,9391
3.184,96

ai
T3 0,9391 (0,10) 0,930
(0,50) 0,963

0,05

0,05

T3 d n
G bn cn ln
1 T3
0,9391 0,2106
5,605 1,862 ln
1 0,9391
1,2617