Gambar 4.1
Kita sekarang akan beralih ke contoh bahwa meskipun masih cukup sederhana, akan
memiliki aplikasi yang lebih berguna. Secara khusus, kami menyajikan prosedur untuk
membuat kesimpulan dari rata-rata populasi yang terdistribusi normal di mana
varians tidak diketahui,
membuat kesimpulan tentang varians dari populasi terdistribusi normal, dan
membuat kesimpulan pada proporsi keberhasilan dalam populasi binomial.
Meningkatkan derajat kompleksitas ditambahkan dalam bab-bab berikutnya. Ini
dimulai pada Bab 5 dengan kesimpulan untuk membandingkan dua populasi dan
Bab 6 dengan kesimpulan pada rata-rata dari sejumlah populasi. Di
Bab 7 kita menunjukkan prosedur menarik kesimpulan antara dua variabel
melalui apa yang akan kita sebut sebagai model linear, yang kemudian
digunakan sebagai dasar umum untuk banyak prosedur menarik kesimpulan statistik lainnya.
Sebagai tambahan berisi perkenalan singkat dengan metode statistik lainnya yang yang
mencakup situasi yang berbeda serta metodologi yang dapat digunakan saat
asumsi yang mendasari tidak dapat memuaskan atau tidak jelas
membuat
kesimpulan tentang populasi rata-rata. Untuk kesimpulan ini kita menggunakan fakta bahwa,
untuk setiap kira-kira pada data statistic terdistribusi secara normal
Hal ini sangat penting untuk dicatat bahwa derajat kebebasan didasarkan pada
penyebut dari rumus yang digunakan untuk menghitung s2, yang mencerminkan rumus umum
untuk menghitung s2
Dalam Contoh 3.3 kita disajikan masalah kontrol kualitas di mana kami menguji
hipotesis bahwa berat rata-rata kacang yang dimasukkan ke dalam guci itu yang dibutuhkan
8 oz. Kami berasumsi bahwa kita tahu deviasi standar populasi, mungkin
dari pengalaman. Kami sekarang santai asumsi itu dan memperkirakan keduanya berarti dan
varians dari sampel.
Tabel 4.2 berisi data dari sampel 16 botol.
Solusi Kami mengikuti lima langkah dari uji hipotesis (Bagian 3.2).
1. Hipotesisnya adalah
H0: = 8,
H1: 8.
2. Tentukan = 0,05. Tabel distribusi t (Lampiran Tabel A.2) menyediakan
nilai t untuk wilayah penolakan dua ekor untuk 15 derajat kebebasan
sebagai | t | > 2,1314.
dan s2:
= 126,28 / 16 = 7,8925,
s2 = (997,141-996,6649) / 15 = 0,03174.
Uji statistik memiliki nilai
t = (7,8925-8) /
2We dicatat dalam Bagian 2.6 bahwa ketika derajat kebebasan menjadi besar, distribusi t
sangat
erat mendekati normal. Dalam kasus tersebut, penggunaan tabel dari distribusi normal
memberikan hasil yang dapat diterima bahkan jika 2 tidak diketahui. Untuk alasan ini
banyak buku teks mengobati seperti
kasus, biasanya menentukan ukuran sampel lebih dari 30, sebagai contoh kasus besar dan
menentukan penggunaan
yang zstatistic untuk kesimpulan pada mean. Meskipun hasil metodologi tersebut tidak benar,
sampel dikotomi sampel-kecil besar tidak meluas ke sebagian besar metode statistik lainnya.
Saya Di
Selain itu, sebagian besar program komputer dengan benar menggunakan distribusi t terlepas
dari ukuran sampel.
4. Karena |t| melebihi nilai kritis 2,1314, maka hipotesis nol ditolak.
5. Perhatikan bahwa kesempatan yang dipilih ini tidak benar pada 0,05.
Nilai p sebenarnya dari uji statistik tidak dapat diperoleh dari Lampiran Tabel
A.2. Nilai p yang sebenarnya, yang diperoleh oleh program komputer, adalah 0,0290, dan
kami
dapat menolak H0 pada setiap yang ditentukan lebih besar dari nilai yang diamati dari
0,0290.
Pembeli apple bersedia membayar harga premium untuk apel jika penjual memiliki, seperti
yang diklaim yaitu diameter rata-rata lebih dari 2,5 di. Pembeli ingin menguji klaim apel
yang cukup besar, sehingga ia mengambil sampel acak dari 12 apel dan mengukur
diameternya.
Hasil diberikan dalamTabel 4.3.
SOLUSI
:
Mendapatkan apel lebih kecil bukanlah masalah, pembeli bersedia untuk mengambil
kesempatan 10% dari tidak perlu membayar harga premium. Oleh karena itu tingkat
signifikansi, , ditetapkan sebesar 0,10. Tentu saja, pembeli hanya membayar harga premium
jika apel lebih besar dari 2,5 in
yang dinyatakan dalam uji satu sisi (one-tailed test).
1. Hipotesisnya adalah
H0: = 2,5,
H1: > 2,5.
2. Dengan kata lain, ia akan membeli apel hanya jika hipotesis nol ditolak.
Kami sudah menentukan = 0,10. varians diperkirakan dari 12
sampel; maka t statistik untuk pengujian memiliki 11 derajat kebebasan
dan satu sisi daerah penolakan adalah untuk menolak H0 jika nilai dihitung dari
t melebihi 1,3634.
3. Dari sampel, nilai y dan s2 adalah
y
= 2,758,
s2 = 0,1554,
dan uji statistik adalah
t = (2,758-2,5) /
0,1554/12 = 2,267.
merupakan
memang kurang dari 0,10 yang diperlukan.
CONTOH 1.2
MENINJAU KEMBALI
Ingat bahwa pada Contoh 1.2, John Mode telah ditawari pekerjaan
di timur kota Texas. Jelas, biaya perumahan di kota ini
akan menjadi pertimbangan penting dalam keputusan untuk pindah. Mode membaca
artikel di koran dari kota di mana mereka saat ini tinggal yang diklaim
"rata-rata" harga rumah adalah $ 155.000. Ini menjadikan ingin tahu apakah
data yang dikumpulkan dalam Contoh 1.2 menunjukkan perbedaan antara kedua kota.
Mereka beranggapan bahwa "rata-rata" harga sebagaimana dimaksud dalam artikel itu
harga rata rata, dan sampel yang mereka kumpulkan dari kota baru merupakan sampel
acak
semua harga rumah di kota itu.
Untuk tujuan ini,
H0: = 155, dan
H1: 155.
Mereka menghitung hasil sebagai berikut dari Tabel 1.2:
n = 69
Jadi,
y =141,4
lalu
t=
141,4155,0
7317,4
69
= - 1,32
yang tidak cukup bukti (di = 0,05) bahwa harga rata-ratanya berbeda. Di
Dengan kata lain, harga rata-rata perumahan tampaknya tidak berbeda dari yang
kota di mana Mode saat ini tinggal.
Estimasi
interval kepercayaan pada dibangun dengan cara yang sama seperti yang di
Bab 3 kecuali yang diganti dengan s, dan nilai tabel z untuk
Koefisien ditentukan (1-) diganti dengan nilai yang sesuai
dari tabel distribusi t untuk derajat kebebasan yang tepat. Itu
rumus umum dari (1 - ) pada interval adalah
Jadi,
t / 2
s2
n
2,758-1,3634
0,1554/12 atau
2,758-0,155 = 2,603.
Ini lebih besar dari nilai yang dibutuhkan dari 2,5, setuju dengan hasil uji hipotesis.
Solusi untuk Contoh 4.1
Kita sekarang dapat memecahkan masalah dalam Contoh 4.1 dengan memberikan keyakinan
interval untuk eksponen. Kami pertama menghitung statistik sampel: y = 0,9225 dan s =
0,165. t statistik berdasarkan 24-1 = 23 derajat kebebasan, dan karena kami ingin interval
kepercayaan 95%
kita menggunakan t0.05 / 2 = 2,069 (dibulatkan). interval kepercayaan 0,95 pada adalah
diberikan oleh
0,9225 (2,069) (0,165) /
24 atau
Ukuran sampel
Persyaratan ukuran sampel untuk masalah estimasi dimana tidak diketahui
cukup rumit. Jelas kita tidak bisa memperkirakan varians sebelum kita mengambil
sampel; maka t statistik tidak dapat digunakan secara langsung untuk memperkirakan ukuran
sampel. metode berulang yang akan memberikan ukuran sampel untuk situasi tertentu ada,
tetapi mereka berada di luar lingkup teks ini. Oleh karena itu sebagian perhitungan ukuran
sampel
hanya mengasumsikan beberapa varian dikenal dan lanjutkan seperti dibahas dalam Bagian
3.4.
Derajat kebebasan
Untuk contoh di bagian ini derajat kebebasan dari statistik uji (
t statistik) adalah (n-1), di mana n adalah ukuran sampel. Hal ini, bagaimanapun,
Penting untuk diingat bahwa derajat kebebasan dari statistik t selalu
yang digunakan untuk memperkirakan varians yang digunakan dalam membangun uji
statistik. Kita
akan melihat bahwa untuk banyak aplikasi tidak (n-1).
Misalnya, bahwa kita perlu untuk memperkirakan ukuran rata-rata batu yang
diproduksi oleh pemecah batu. Sebuah sampel acak dari 100 batu yang akan digunakan.
Sayangnya, kita tidak punya waktu untuk menimbang masing-masing batu secara individual.
Kita dapat,menimbang seluruh 100 dalam satu berat, membagi berat total 100
untuk mendapatkan perkiraan , dan menyebutnya y
. Kami kemudian mengambil
100
random sampel acak 10 batu dari 100, dan kita menimbang secara individual untuk
menghitung perkiraan
dari varians,
di mana
10
dari distribusi sampling didasarkan pada ukuran sampel yang digunakan untuk
menghitung rata-rata itu.
4.3 Kesimpulan pada Sebuah Proporsi
Dalam populasi binomial, parameter yang menarik adalah p, proporsi
"Keberhasilan." Dalam Bagian 2.3 kita menggambarkan sifat populasi binomial
dan dalam Bagian 2.5 pendekatan normal terhadap distribusi
proporsi keberhasilan dalam sampel n dari populasi binomial.
distribusi ini dapat digunakan untuk membuat kesimpulan statistik tentang parameter p,
proporsi keberhasilan dalam suatu populasi.
Estimasi p dari sampel berukuran n adalah proporsi sampel,
Di bawah kondisi untuk distribusi binomial dinyatakan dalam Bagian 2.3, statistik ini
memiliki distribusi normal standar, dengan asumsi ukuran sampel yang cukup untuk
pendekatan yang akan berlaku.
Hipotesis Uji p
Hipotesisnya adalah
H0: p = p0,
H1: p P0.
Hipotesis alternatif tentu saja, menjadi satu sisi. Untuk melakukan tes,
menghitung uji statistik
yang dibandingkan dengan nilai kritis yang sesuai dari distribusi normal
(Lampiran Tabel A.1), atau nilai p dihitung dari distribusi normal.
Perhatikan bahwa kita tidak menggunakan distribusi t di sini karena varians adalah
tidak diperkirakan sebagai jumlah kotak dibagi dengan derajat kebebasan. Tentu saja,
penggunaan dari distribusi normal adalah perkiraan, dan umumnya
direkomendasikan untuk digunakan hanya jika np 5 dan n (1 - p) 5.
CONTOH 4.4
Sebuah iklan mengklaim bahwa lebih dari 60% dokter memilih tertentu
merek pembunuh rasa sakit. Sebuah lembaga yang didirikan untuk memantau kebenaran
dalam periklanan melakukan survei yang terdiri dari sampel acak dari 120 dokter. Dari 120
mempertanyakan, 82 menunjukkan preferensi untuk merek tertentu. Apakah iklan
dibenarkan?
Solusi
Parameter yang menarik adalah p, proporsi dokter di populasi yang lebih memilih merek
tertentu. Untuk menjawab pertanyaan tersebut, berikut Uji hipotesis yang dilakukan:
H0: p = 0,6,
H1: p > 0,6.
Catatan bahwa ini adalah uji satu sisi dan penolakan mendukung hipotesis
iklan. Apakah mungkin bahwa produsen obat penghilang rasa sakit akan
menggunakan satu set sedikit berbeda dari hipotesis? Sebuah tingkat signifikansi 0,05 yang
dipilih.
Statistik ujinya adalah
Estimasi dari p
Karena nilai p ini kurang dari yang ditentukan 0,05, kita menolak H0 dan menyimpulkan
bahwa proporsi sebenarnya lebih besar dari 0,6. Artinya, iklan yang muncul dibenarkan.
Internal keyakinan (1-) pada p berdasarkan ukuran sampel y successes dengan
atau
interval dari 0,455 sampai 0,661. interval ini tidak jauh berbeda dari yang dibangun tanpa
penyesuaian, terutama karena ukuran sampel besar dan perkiraan p dekat dengan 0,5. Jika
ukuran sampel yang kecil, ini pendekatan akan menghasilkan interval keyakinan yang lebih
handal.
Ukuran sampel
Sejak estimasi pada p menggunakan distribusi normal standar sampling, kita
dapat memperoleh ukuran sampel yang diperlukan untuk tingkat presisi tertentu. Di
Bagian 3.4 kita mencatat bahwa untuk (1 - ) tingkat kepercayaan dan maksimal
Kesalahan estimasi E, ukuran sampel yang dibutuhkan adalah
dengan alternatif satu sisi diperbolehkan. Statistik dari Bagian 2.6 digunakan untuk menguji
hipotesis nol
Jika hipotesis nol benar, statistik ini memiliki distribusi 2 dengan (n-1) derajat kebebasan.
Jika hipotesis nol salah, maka nilai dari SS kuantitas akan cenderung
untuk mencerminkan nilai sebenarnya dari 2. Artinya, jika 2 lebih besar (lebih kecil) dari
nol
nilai hipotesis, maka SS akan cenderung relatif besar (kecil), dan nilai
statistik uji karena itu akan cenderung lebih besar (lebih kecil) dari yang disarankan
oleh distribusi 2. Oleh karena itu daerah penolakan untuk ujian akan
two-tailed; Namun, nilai-nilai kritis akan baik positif dan kami harus menemukan
nilai kritis individu untuk setiap sisi. Dengan kata lain, wilayah penolakan
menolak H0 jika:
Seperti distribusi t, 2 adalah distribusi lain yang hanya tabel terbatas yang
tersedia. Jadi sulit untuk menghitung nilai p saat melakukan tes hipotesis
pada varian ketika tabel tersebut harus digunakan.
tes hipotesis tentang varians sering one-tailed karena variabilitas adalah
digunakan sebagai ukuran konsistensi, and we usually ingin menjaga konsistensi,
yang ditandai dengan varians kecil. Dengan demikian, hipotesis alternatif yang lebih besar
varians menyiratkan proses yang tidak stabil atau tidak konsisten.
CONTOH 4.2
MENINJAU KEMBALI
Dalam mengisi tabung dengan kacang, kami tidak hanya ingin rata-rata
berat isi menjadi 8 oz., tapi kami juga ingin mempertahankan tingkat
konsistensi dalam jumlah kacang yang dimasukkan ke dalam stoples. Jika salah satu tabung
menerima terlalu banyak kacang, itu akan meluap, dan terjadi pemborosan kacang.
Jika tabung lain terlalu sedikit kacang, itu tidak akan penuh dan konsumen tabung kacang
yang akan merasa tertipu bahkan meskipun rata-rata guci memiliki massa sama dari kacang.
Karena itu,
tes pada varians dari bobot kacang juga harus menjadi bagian dari kualitas
kontrol dari proses.
Misalkan berat dari kacang 95% dari tabungnya yang digunakan dalam 0,2 oz dari rata-rata.
Dengan asumsi kita distribusi mendekati normal dapat menggunakan aturan empiris untuk
menyatakan bahwa standar deviasi harus di antara 0,2 / 2 = 0,10, atau ekuivalen yang varians
berada di 0,01.
Solusi
Kami akan menggunakan sampel data pada Tabel 4.2 untuk menguji hipotesis
menggunakan tingkat signifikansi = 0,05. Jika kita menolak hipotesis nol demi
dari varians yang lebih besar kami menyatakan bahwa proses pengisian tidak di kontrol. Itu
daerah penolakan didasarkan pada statistik
Oleh karena itu hipotesis nol ditolak dan kami merekomendasikan mengorbankan
memodifikasi proses pengisian untuk memastikan konsistensi. Artinya, mesin
harus disesuaikan atau dimodifikasi untuk mengurangi variabilitas. Tentu, setelah
modifikasi, seri lain dari tes akan dilakukan untuk memastikan keberhasilan dalam
mengurangi variasi.
CONTOH 4.1 MENINJAU KEMBALI
Misalkan dalam studi psikologi persepsi, variabilitas subjek adalah perhatian. Secara khusus,
misalkan bahwa peneliti ingin mengetahui apakah varians dari eksponen berbeda dari 0,02.
Solusi
Hipotesisnya adalah
Dalam hal ini kita ingin batas 95% lebih rendah, yang akan membutuhkan atas
0,05 ekor distribusi 2 dengan 15 derajat kebebasan, yang kita miliki
sudah terlihat menjadi 25,00. Batas kepercayaan rendah adalah
=0,0190.
Semakin rendah 0,95 batas kepercayaan untuk standar deviasi hanya
akar kuadrat dari batas untuk varians, sehingga nilai 0,138.
Oleh karena itu 95% yakin bahwa standar deviasi benar setidaknya 0.138.
Nilai ini lebih besar dari yang ditetapkan oleh hipotesis nol dan lagi
interval kepercayaan setuju dengan hasil uji hipotesis.