com
BAB3
Estimasi Interval
dan Pengujian Hipotesis
TUJUAN PEMBELAJARAN
1.Diskusikan bagaimana '' teori sampling '' berhubungan distribusi probabilitas yang diketahui jika
dengan estimasi interval dan pengujian hipotesis. hipotesis nol benar.
2.Jelaskan mengapa penting untuk inferensi 7.Jelaskan istilahP-nilai dan cara menggunakan a P
statistik yang diberikan!xpenaksir kuadrat -nilai untuk menentukan hasil uji hipotesis;
terkecilB1danB2adalah variabel acak memberikan sketsa yang menunjukkan P-nilai.
terdistribusi normal.
3.Jelaskan ''tingkat kepercayaan'' dari penduga interval, 8.Jelaskan perbedaan antara uji satu-ekor dan dua-ekor.
dan apa artinya dalam konteks pengambilan Jelaskan, secara intuitif, bagaimana memilih wilayah
sampel, dan berikan sebuah contoh. penolakan untuk uji satu arah.
4.Jelaskan perbedaan antara penduga interval dan 9.Jelaskan kesalahan Tipe I dan ilustrasikan dalam
penduga interval. Jelaskan bagaimana sketsa. Tentukan tingkat signifikansi suatu tes.
menafsirkan perkiraan interval.
10.Jelaskan perbedaan antara signifikansi
5.Jelaskan istilah hipotesis nol, hipotesis ekonomi dan statistik.
alternatif, dan daerah penolakan, berikan
11.Jelaskan bagaimana memilih apa yang masuk dalam
contoh dan sketsa daerah penolakan.
hipotesis nol dan apa yang masuk dalam hipotesis
6.Menjelaskan logika suatu uji statistik, termasuk alternatif.
mengapa statistik uji harus memiliki
KATA KUNCI
hipotesis alternatif tingkat signifikansi P-nilai
interval kepercayaan kombinasi linier parameter daerah penolakan
nilai kritis hipotesis linier uji signifikansi
derajat kebebasan hipotesis nol statistik uji
hipotesis tes satu sisi
tes dua sisi
pengujian hipotesis statistik penting
Kesalahan tipe I
kesimpulan perkiraan poin
Kesalahan tipe II
estimasi interval nilai probabilitas
112
3.1 Estimasi Interval113
Dalam Bab 2, kami menggunakan penduga kuadrat terkecil untuk mengembangkanperkiraan poin
untuk parameter dalam model regresi linier sederhana. Perkiraan ini mewakilikesimpulantentang
fungsi regresiE(kamu|x) =1+2xmenggambarkan hubungan antara variabel ekonomi.Menyimpulkan
berarti "menyimpulkan dengan penalaran dari sesuatu yang diketahui atau diasumsikan." Definisi
kamus ini juga menjelaskan inferensi statistik. Kami telah mengasumsikan hubungan antara variabel
ekonomi dan membuat berbagai asumsi (SR1-SR5) tentang model regresi. Berdasarkan asumsi-
asumsi ini, dan diberikan perkiraan empiris parameter regresi, kami ingin membuat kesimpulan
tentang populasi dari mana data diperoleh.
Dalam bab ini, kami memperkenalkan alat tambahan untuk inferensi statistik:estimasi intervaldan pengujian
hipotesis. Estimasi interval adalah prosedur untuk membuat rentang nilai, kadang-kadang disebutinterval
kepercayaan, di mana parameter yang tidak diketahui kemungkinan besar berada. Uji hipotesis adalah prosedur
untuk membandingkan dugaan yang mungkin kita miliki tentang parameter regresi dengan perkiraan parameter
yang telah kita peroleh dari sampel data. Uji hipotesis memungkinkan kita untuk mengatakan bahwa data tersebut
kompatibel, atau tidak kompatibel, dengan dugaan atau hipotesis tertentu.
Prosedur untuk pengujian hipotesis dan estimasi interval sangat bergantung pada asumsi SR6 dari
model regresi linier sederhana dan normalitas bersyarat yang dihasilkan dari penduga kuadrat terkecil. Jika
asumsi SR6 tidak berlaku, maka ukuran sampel harus cukup besar sehingga distribusi penduga kuadrat
terkecil adalahsekitarnormal. Dalam hal ini, prosedur yang kami kembangkan dalam bab ini dapat
digunakan tetapi juga merupakan perkiraan. Dalam mengembangkan prosedur dalam bab ini, kita akan
menggunakan "Student's"T-distribusi. Anda mungkin ingin menyegarkan ingatan Anda tentang distribusi ini
dengan meninjau Lampiran B.3.7. Selain itu, terkadang ada gunanya melihat konsep yang akan kita
diskusikan dalam suasana yang lebih sederhana. Dalam Lampiran C, kami memeriksa inferensi statistik,
estimasi interval, dan pengujian hipotesis dalam konteks memperkirakan rata-rata populasi normal. Anda
mungkin ingin meninjau materi ini sekarang atau membacanya bersama dengan bab ini saat kita
melanjutkan.
3.1.1 ItuT-Distribusi
Mari kita asumsikan bahwa asumsi SR1-SR6 berlaku untuk model regresi linier sederhana. Dalam hal
ini, kita tahu bahwa diberikanxpenaksir kuadrat terkecilB1danB2memiliki distribusi normal, seperti
yang dibahas dalam Bagian 2.6. Misalnya, distribusi normal dariB2, penaksir kuadrat terkecil dari2,
adalah ( )
σ2
B2|x~n β.2,( )2
xsaya-x
Sebuah variabel acak normal standar diperoleh dariB2dengan mengurangkan meannya dan membaginya dengan
simpangan bakunya:
B2- β.2
Z=√. ~n(0,1) (3.1)
/∑( )
σ2 xsaya-x2
114BAB 3 Estimasi Interval dan Pengujian Hipotesis
Variabel acak standarZterdistribusi normal dengan mean 0 dan varians 1. Dengan menstandardisasi
distribusi normal bersyarat dariB2| ., kami menemukan statistikZyangn(0, 1) distribusi sampling tidak
bergantung pada parameter yang tidak diketahui atau padax! Statistik seperti itu disebutsangat
penting, dan ini berarti bahwa ketika membuat pernyataan probabilitas tentangZkita tidak perlu
khawatir tentang apakahxadalah tetap atau acak. Menggunakan tabel probabilitas normal (Tabel
Statistik 1) kita tahu bahwa
P(−1.96≤.Z≤.1,96) = 0,95
Mengganti (3.1) ke dalam ekspresi ini, kami memperoleh
⎛. ⎞.
⎜. B2 - β.2 ⎟.
P⎜-1.96≤.√. ≤.1.96 =0,95
/∑ ( )
⎜. σ2 xsaya-x
2 ⎟.
⎝. ⎠.
Mengatur ulang memberi kita
( √. √. )
/∑( ) /∑( )
P b21.96 σ2 xsaya-x2 ≤ β.2≤.B2+ 1,96 σ2 xsaya-x2 =0,95
cara menggunakan semua kemungkinan sampel ukuranndari suatu populasi, maka 95% interval akan berisi
parameter sebenarnya2. Derivasi yang mudah dari penduga interval ini didasarkan pada kedua asumsi SR6
dankita mengetahui varians dari istilah kesalahan2.
Meskipun kita tidak mengetahui nilai2, kita bisa memperkirakannya. Residu kuadrat terkecil adalah
Σ
ê.saya=kamusaya-B1-B2xsaya, dan penduga kita dari2adalah2= ê.saya
2 (n-2). Mengganti2oleh2dalam (3.1) kre-
memakan variabel acak yang dapat kita kerjakan, tetapi substitusi ini mengubah distribusi probabilitas dari
normal standar menjadi aT-distribusi dengann-2derajat kebebasan,
Bk- β.
T= ( )k~T(n2) untukk=1,2 (3.3)
seBk
Persamaan ini akan menjadi dasar untuk estimasi interval dan pengujian hipotesis dalam model regresi
linier sederhana. Argumen statistik tentang bagaimana kita beralih dari (3.1) ke (3.2) ada di Lampiran 3A.
Saat bekerja denganT-distribusi, ingat bahwa itu adalah kurva berbentuk lonceng yang berpusat
di nol. Sepertinya distribusi normal standar, kecuali lebih menyebar, dengan varians yang lebih besar
dan ekor yang lebih tebal. BentuknyaT-distribusi dikendalikan oleh parameter tunggal yang disebut
derajat kebebasan, sering disingkatdf.Kami menggunakan notasiT(M)untuk menentukan T-distribusi
denganMderajat kebebasan. Pada Tabel Statistik 2, terdapat nilai persentil dari T-distribusi untuk
berbagai derajat kebebasan. UntukMderajat kebebasan, persentil ke-95 dariT-distribusi[n
dilambangkanT(0].95,M). Nilai ini memiliki sifat bahwa 0,95 probabilitas jatuh ke kiri, jadiP t(M)≤.T(0,95,M)= 0
.95. Misalnya, jika derajat kebebasannya adalahM=20, kemudian, dari Tabel Statistik 2,T(0,95, 20)= 1.725.
Jika Anda mengalami masalah yang membutuhkan persentil
3.1 Estimasi Interval115
F(T)
T(M)
/2 /2
(1 – )
–TC 0 TC T
yang tidak kami berikan, Anda dapat melakukan interpolasi untuk jawaban perkiraan atau menggunakan perangkat lunak komputer Anda untuk
Untuk interval kepercayaan 95%, nilai kritis menentukan wilayah pusat dariT-distribusi yang
mengandung probabilitas 1 = 0.95. Ini meninggalkan probabilitas = 0.05 dibagi rata antara dua
ekor, sehinggaDan2 = 0.025. Maka nilai kritisnyaTC=T(1−0,025,M)=T(0,975,M). Secara sederhana
model regresi, derajat kebebasannya adalahM=n-2, jadi ekspresi (3.4) menjadi
[ ]
P-T(0,975,n2)≤.T≤.T(0,975,n2)= 0,95
Kami menemukan nilai persentilT(0,975,n2)pada Tabel Statistik 2.
Sekarang, mari kita lihat bagaimana kita dapat menggabungkan semua bit ini untuk membuat prosedur untuk interval
perkiraan. PenggantiTdari (3.3) ke (3.4) untuk mendapatkan
[ ]
Bk- β.
P-TC≤. ( )k≤.T C =1
seBk
Atur ulang ekspresi ini untuk mendapatkan
[ () ( )]
P Bk-TCseBk ≤ β.k≤.Bk+TCseBk =1 (3.5)
() ()
Titik akhir intervalBk-TCseBkdanBk+TCseBk acak karena bervariasi dari sam-
untuk sampel. Titik akhir ini defi(ne)anpenaksir intervaldarik. Pernyataan probabilitas dalam (3.5)
mengatakan bahwa intervalBk±TCseBk memiliki probabilitas 1 berisi yang benar tetapi tidak diketahui
parameterk. ( )
KapanBkdan s(eB)k di (3.5) adalah nilai perkiraan (angka), berdasarkan sampel yang diberikan dari
data, makaBk±TCseBk disebut 100(1 )%perkiraan intervaldarik. Setara, itu disebut
a 100(1 )%selang kepercayaan. Biasanya, = 0.01 atau = 0.05, sehingga diperoleh selang
kepercayaan 99% atau selang kepercayaan 95%.
Interpretasi interval kepercayaan membutuhkan banyak perhatian. Sifat-sifat prosedur estimasi
interval didasarkan pada pengertian sampling. Jika kami mengumpulkan semua mungkin
116BAB 3 Estimasi Interval dan Pengujian Hipotesis
sama
(tolong ukurannyandari suatu populasi, hitung perkiraan kuadrat terkecilBk(dan) kesalahan standarnya se
Bkuntuk setiap sampel, dan kemudian buat penduga intervalBk±TCseBkuntuk setiap sampel, maka 100(1 )%
dari semua interval yang dibangun akan berisi parameter sebenarnyak. Dalam Lampiran 3C, kami melakukan
simulasi Monte Carlo untuk mendemonstrasikan properti pengambilan sampel ini.
Setiapsatuestimasi interval, berdasarkan satu sampel data, mungkin atau mungkin tidak mengandung
parameter sebenarnyak, dan karenaktidak diketahui, kita tidak akan pernah tahu apakah itu terjadi atau
tidak. Ketika "interval kepercayaan" dibahas, ingatlah bahwa kepercayaan kita ada diprosedurdigunakan
untuk membangun perkiraan interval; inibukandalam satu estimasi interval yang dihitung dari sampel data.
Untuk data pengeluaran makanan,n=40 dan derajat Apa kegunaan penduga interval dari2? Saat melaporkan
kebebasannya adalahn-2 = 38. Untuk selang kepercayaan 95%, = hasil regresi, kami selalu memberikan perkiraan titik, sepertiB
0.05. Nilai kritisTC=T(1−α/2,n2)=T(0,975, 38)= 2.024 adalah 2= 10.21. Namun, perkiraan titik saja tidak memberikan arti
persentil 97,5 dariT-distribusi dengan 38 derajat keandalannya. Dengan demikian, kami mungkin juga
kebebasan. Untuk2, pernyataan probabilitas pada (3.5) menjadi melaporkan perkiraan interval. Estimasi interval
[ () ( )] menggabungkan estimasi titik dan kesalahan standar
P b22.024seB2≤ β.2≤.B2+ 2.024seB2 =0,95 estimasi, yang merupakan ukuran variabilitas kuadrat terkecil
(3.6) penaksir. Perkiraan interval termasuk penyisihan untuk
ukuran sampel juga karena untuk derajat kebebasan yang lebih rendah
Untuk membuat penduga interval untuk2, kita menggunakan taksiran
ituT-distribusi nilai kritisTClebih besar. Jika perkiraan interval lebar
kuadrat terkecilB2= 10.21 dan kesalahan standarnya
(menyiratkan kesalahan standar yang besar), ini menunjukkan
( ) () √. bahwa tidak banyak informasi dalam sampel tentang2. Jika
seB2 = varB2=
⋀.
4,38 = 2,09 perkiraan interval sempit, ini menunjukkan bahwa kita telah
belajar lebih banyak tentang2.
Substitusikan nilai-nilai ini ke dalam (3.6), kita peroleh “estimasi
Apa yang "lebar" dan apa yang "sempit" tergantung pada masalah
interval kepercayaan 95%” untuk2:
yang dihadapi. Misalnya, dalam model kami,B2= 10.21 adalah perkiraan
()
B2±TCseB2= 10.21±2.024(2.09) = [5.97,14.45] berapa banyak pengeluaran makanan rumah tangga mingguan akan
meningkat dengan peningkatan $100 pendapatan rumah tangga mingguan.
Artinya, kami memperkirakan "dengan keyakinan 95%" bahwa dari Seorang CEO jaringan supermarket dapat menggunakan perkiraan ini untuk
tambahan $100 pendapatan mingguan rumah tangga akan menghabiskan merencanakan kebutuhan kapasitas toko di masa depan, dengan
antara $5,97 dan $14,45 untuk makanan. mempertimbangkan perkiraan pertumbuhan pendapatan di suatu daerah.
Apakah2sebenarnya dalam interval [5.97, 14.45]? Kita tidak tahu, Namun, tidak ada keputusan yang akan didasarkan pada satu nomor ini saja.
dan kita tidak akan pernah tahu. Apa yang kitamelakukanKetahuilah CEO yang prudent akan melakukan analisis sensitivitas dengan
bahwa ketika prosedur yang kita gunakan diterapkan pada semua mempertimbangkan nilai2sekitar 10.21. Pertanyaannya adalah “Nilai yang
sampel data yang mungkin dari populasi yang sama, maka 95% dari mana?” Satu jawaban diberikan oleh estimasi interval [5.97, 14.45]. Meskipun
semua perkiraan interval yang dibangun menggunakan prosedur ini 2mungkin atau mungkin tidak dalam interval ini, CEO tahu bahwa prosedur
akan berisi parameter sebenarnya. Prosedur estimasi interval yang digunakan untuk mendapatkan perkiraan interval "berfungsi" 95% dari
"berfungsi" 95% dari waktu. Apa yang dapat kita katakan tentang waktu. Jika bervariasi2dalam interval tersebut memiliki konsekuensi drastis
perkiraan interval berdasarkan satu sampel kita adalah bahwa, pada penjualan dan keuntungan perusahaan, maka CEO dapat
mengingat keandalan prosedur, kita akan “terkejut” jika2tidak dalam menyimpulkan bahwa tidak ada cukup bukti untuk membuat keputusan dan
interval [5.97, 14.45]. memesan sampel data baru dan lebih besar.
Variasi tersebut disebabkan karena pada setiap sampel pengeluaran pangan rumah tangga berbeda.
Interval kepercayaan 95% untuk parameter1dan2diberikan pada Tabel 3.2 untuk sampel yang sama.
Variabilitas sampling menyebabkan pusat dari setiap estimasi interval berubah dengan nilai
estimasi kuadrat terkecil, dan menyebabkan lebar interval berubah dengan standar error. Jika kita
mengajukan pertanyaan "Berapa banyak dari interval ini yang berisi parameter sebenarnya, dan yang
mana?" kita harus menjawab bahwa kita tidak tahu. Tetapi karena 95% dari semua perkiraan interval
yang dibuat dengan cara ini berisi nilai parameter yang sebenarnya, kami berharap mungkin 9 atau
10 interval ini berisi parameter yang benar tetapi tidak diketahui.
Perhatikan perbedaan antara estimasi titik dan estimasi interval. Kami telah menggunakan estimator kuadrat
terkecil untuk mendapatkan estimasi titik√.dari parameter yang tidak diketahui. varians yang diperkirakan
(
⋀. ) () ()
varBk , untukk=1 atau 2, dan akar kuadratnya varBk=seBkmemberikan informasi tentang
⋀.
variabilitas sampling penaksir kuadrat terkecil dari satu sampel ke sampel lainnya. Penaksir interval adalah
cara yang mudah untuk melaporkan hasil regresi karena mereka menggabungkan estimasi titik dengan
ukuran variabilitas pengambilan sampel untuk memberikan rentang nilai di mana parameter yang tidak
diketahui mungkin jatuh. Ketika variabilitas sampling penaksir kuadrat terkecil relatif kecil, maka estimasi
interval akan relatif sempit, yang menyiratkan bahwa estimasi kuadrat terkecil “dapat diandalkan.” Jika
penduga kuadrat terkecil menderita variabilitas pengambilan sampel yang besar, maka perkiraan interval
akan lebar, menyiratkan bahwa perkiraan kuadrat terkecil “tidak dapat diandalkan.”
118BAB 3 Estimasi Interval dan Pengujian Hipotesis
Dalam setiap dan setiap uji hipotesis, lima bahan harus ada:
• H1:Β.k> c. Menolak hipotesis nol bahwak=Cmembawa kita untuk menerima kesimpulan bahwa β.k
> c. Hipotesis alternatif ketidaksetaraan banyak digunakan dalam ekonomi karena teori ekonomi
sering memberikan informasi tentangtanda-tandadari hubungan antar variabel. Misalnya, dalam
contoh pengeluaran makanan, kita mungkin menguji hipotesis nol H0:Β.2=0 melawanH1:Β.2>0
karena teori ekonomi sangat menyarankan bahwa kebutuhan seperti makanan adalah barang
normal dan pengeluaran makanan akan meningkat jika pendapatan meningkat.
• H1:Β.k< c. Menolak hipotesis nol bahwak=Cdalam hal ini membawa kita untuk menerima
kesimpulan bahwak< c.
• H1:Β.k≠.C. Menolak hipotesis nol bahwak=Cdalam hal ini membawa kita untuk menerima
kesimpulan bahwakmengambil nilai lebih besar atau lebih kecil dariC.
3.2 Uji Hipotesis119
Bk-C
T= ( )~T(n2) (3.7)
seBk
Jika hipotesis nol adalahtidak benar, makaT-statistik dalam (3.7) tidakbukanmemilikiT-distribusi
dengan n-2 derajat kebebasan. Hal ini diuraikan dalam Lampiran 3B.
Komentar
Ketika tidak ada pilihan spesifik lain yang dibuat, ekonom dan ahli statistik sering menggunakan tingkat
signifikansi 0,05. Artinya, kejadian "satu kali dalam dua puluh" dianggap sebagai peristiwa yang tidak biasa
atau tidak mungkin terjadi secara kebetulan. Ambang batas untuk signifikansi statistik ini dilekatkan sebagai
Cawan Suci tetapi pada kenyataannya hanyalah preseden sejarah berdasarkan kutipan oleh Sir Ronald
Fisher yang mempromosikan standar ituT-nilai yang lebih besar dari dua dianggap signifikan. Ambang1
batas yang lebih kuat untuk signifikansi, seperti "satu kali dalam seratus," atau 0,01, mungkin lebih
masuk akal. Pentingnya topik dengan cepat terbukti dengan pencarian web. Isu-isu tersebut dibahas
dalamKultus Signifikansi Statistik: Bagaimana Kesalahan Standar Menghabiskan Pekerjaan, Keadilan,
dan Kehidupan Kita, oleh Stephen T. Ziliak dan Deirdre N. McCloskey, 2008, The University of Michigan
Press.
Jika kita menolak hipotesis nol padahal hipotesis itu benar, maka kita melakukan apa yang disebut a
Kesalahan tipe I. Tingkat signifikansi suatu tesadalahprobabilitas melakukan kesalahan Tipe I, jadi
............................................................................................................................................
1MarkKelly (2013) “Emily Dickinson dan monyet di tangga. Atau: Berapa signifikansi tingkat signifikansi
5%,”Makna, Jil. 10(5), Oktober, 21–22.
120BAB 3 Estimasi Interval dan Pengujian Hipotesis
P(Kesalahan tipe I) = . Setiap kali kita menolak hipotesis nol, ada kemungkinan bahwa kita telah membuat kesalahan
seperti itu—tidak ada cara untuk menghindarinya. Kabar baiknya adalah kita dapat menentukan jumlah kesalahan
Tipe I yang akan kita toleransi dengan menetapkan tingkat signifikansi . Jika kesalahan seperti itu mahal, maka kami
membuat kecil. Jika kita tidak menolak hipotesis nol yang salah, maka kita telah melakukan aKesalahan tipe II.
Dalam situasi dunia nyata, kita tidak dapat mengontrol atau menghitung probabilitas jenis kesalahan ini karena
bergantung pada parameter sebenarnya yang tidak diketahuik. Untuk lebih lanjut tentang kesalahan Tipe I dan Tipe
II, lihat Lampiran C.6.9.
3.3.1 Tes Satu Ekor dengan Alternatif '' Lebih Besar Dari '' (>)
Saat menguji hipotesis nolH0:Β.k=C, jikaalternatifhipotesaH1:Β.k> cbenar, maka nilaiT-statistik
(3.7) cenderung menjadi lebih besar dari biasanya untukT-distribusi. Kami akan menolak
hipotesis nol jika statistik uji lebih besar dari nilai kritis untuk tingkat signifikansi . Nilai kritis
yang meninggalkan probabilitas di ekor kanan adalah (1 )-persentil T(1−α,n2), seperti yang
ditunjukkan pada Gambar 3.2. Misalnya, jika = 0.05 dann-2 = 30, maka dari Tabel Statistik 2, nilai
kritisnya adalah nilai persentil ke-95T(0,95, 30)= 1.697.
T(M)
Menolak
H0:k=C
Tidak
menolak
α.
H0:k=C
0 tc=T(1–,n–2)
Tes ini disebut tes "satu-ekor" karena nilai-nilai yang tidak mungkin dariT-statistik jatuh hanya dalam
satu ekor dari distribusi probabilitas. Jika hipotesis nol benar, maka statistik uji (3.7) memiliki T
-distribusi, dan nilainya akan cenderung jatuh di tengah distribusi, di sebelah kiri nilai kritis, di mana
sebagian besar probabilitas terkandung. Tingkat signifikansi dipilih sehingga jika hipotesis nol benar,
maka probabilitas bahwaT-nilai statistik jatuh di ujung paling kanan dari distribusi kecil; peristiwa
yang tidak mungkin dan tidak mungkin terjadi secara kebetulan. Jika kami memperoleh nilai statistik
uji di wilayah penolakan, kami menganggapnya sebagai buktimelawanhipotesis nol, mengarahkan
kita untuk menyimpulkan bahwa hipotesis nol tidak mungkin benar. Bukti terhadap hipotesis nol
adalah bukti yang mendukung hipotesis alternatif. Jadi, jika kita menolak hipotesis nol maka kita
menyimpulkan bahwa alternatifnya benar.
Jika hipotesis nolH0:Β.k=Cadalahbenar,maka statistik uji (3.7) memilikiT-distribusi dan nilainya
termasuk dalam daerah non-penolakan dengan probabilitas 1 . Jikat < t(1−α,n2), maka tidak ada bukti
yang signifikan secara statistik terhadap hipotesis nol, dan kami tidak menolaknya.
Daerah non-penolakan terdiri dariT-nilai statistik lebih besar dariT(α,n2). Ketika hipotesis nol benar,
probabilitas mendapatkan seperti ituT-nilai adalah 1 , yang dipilih untuk menjadi besar. Jadi jikat > t(α,n
2)maka jangan menolakH0:Β.k=C.
T(M)
MenolakH0:k=C
α.
Jangan tolak
H0:k=C
TC=T(α,n–2) 0
Mengingat di mana daerah penolakan berada dapat difasilitasi dengan trik berikut:
Trik Memori
Daerah penolakan untuk uji satu arah berada pada arah panah pada alternatif. Jika
alternatifnya adalah>, lalu tolak di ekor kanan. Jika alternatifnya adalah<, tolak di ekor kiri.
F(T)
MenolakH0:βk=C MenolakH0:βk=C
MenerimaH1:βk≠.C Jangan tolak MenerimaH1:βk≠.C
H0:βk=C
T(M)
/2 /2
–TC=T(α/2,n–2) TC=T(1–α/2,n–2) T
Biasanya, perhatian pertama kami adalah apakah ada hubungan suka mendirikan,H1:Β.2>0. Jika kemudian kita menolak hipotesis nol,
antara variabel, seperti yang telah kami tentukan dalam model kami. kita dapat membuat pernyataan langsung, menyimpulkan bahwa2
jika2= 0, maka tidak ada hubungan linier antara pengeluaran makanan positif, dengan hanya kemungkinan kecil (α) bahwa kita salah.
dan pendapatan. Teori ekonomi menyatakan bahwa makanan adalah Langkah-langkah pengujian hipotesis ini adalah sebagai berikut:
barang normal dan bahwa ketika pendapatan meningkat, pengeluaran
makanan juga akan meningkat dan dengan demikian2>0. Estimasi 1.Hipotesis nolnya adalahH0:Β.2=0. Hipotesis alternatifnya
kuadrat terkecil dari2adalahB2= 10.21, yang tentunya lebih besar dari adalahH1:Β.2>0.
nol. Namun, sekadar mengamati bahwa perkiraan itu memiliki tanda 2.Statistik t(est ) adalah (3.7). Pada kasus ini,C=0, jadiT= B2
yang benar bukanlah bukti ilmiah. Kami ingin menentukan apakah ada DanseB2~T(n2)jika hipotesis nol benar.
yang meyakinkan, ataupenting, bukti statistik yang akan mengarahkan
3.Mari kita pilih = 0.05. Nilai kritis untuk daerah penolakan ekor
kita untuk menyimpulkan bahwa2>0. Saat menguji hipotesis nol bahwa
kanan adalah persentil ke-95 dariT-distribusi dengann–2 = 38
suatu parameter adalah nol, kami menanyakan apakah perkiraannyaB2
derajat kebebasan,T(0,95, 38)= 1.686. Dengan demikian, kita
berbeda secara signifikan dari nol, dan tes ini disebut auji signifikansi.
akan menolak hipotesis nol jika nilai yang dihitung dariT≥.1.
686. Jikat <1.686, kami tidak akan menolak hipotesis nol.
Prosedur uji statistik tidak dapat membuktikan kebenaran
hipotesis nol. Ketika kita gagal menolak hipotesis nol, semua uji
hipotesis yang dapat dilakukan adalah bahwa informasi dalam sampel 4.Menggunakan pengeluaran makanan d(ata), kami menemukan bahwa B2=
data adalahkompatibeldengan hipotesis nol. Sebaliknya, uji statistik 10.21 dengan kesalahan standar seB2 =2.09. Nilai
dapat mengarahkan kita kemenolakhipotesis nol, dengan hanya dari statistik uji adalah
probabilitas kecil untuk menolak hipotesis nol ketika itu benar-benar B 10.21
benar. Dengan demikian, menolak hipotesis nol adalah kesimpulan T= (2) = =4.88
seB2 2.09
yang lebih kuat daripada gagal menolaknya. Untuk alasan ini, hipotesis
nol biasanya dinyatakan sedemikian rupa sehingga jika teori kita 5.SejakT=4.88>1.686, kami menolak hipotesis nol bahwa2= 0
benar, maka kita akan menolak hipotesis nol. Dalam contoh kita, teori dan terima alternatif yang2>0. Artinya, kami menolak
ekonomi menyiratkan bahwa harus ada hubungan positif antara hipotesis bahwa tidak ada hubungan antara pendapatan
pendapatan dan pengeluaran makanan. Kami ingin menetapkan dan pengeluaran makanan dan menyimpulkan bahwa
bahwa ada bukti statistik untuk mendukung teori ini menggunakan uji adasignifikan secara statistikhubungan positif antara
hipotesis. Dengan tujuan ini, kami membuat hipotesis nol bahwa ada pendapatan rumah tangga dan pengeluaran makanan.
tidakhubungan antar variabel,H0:Β.2=0. Dalam hipotesis alternatif,
kami menempatkan dugaan bahwa kami akan Bagian terakhir dari kesimpulan adalah penting. Ketika Anda
melaporkan hasil Anda ke audiens, Anda akan ingin menjelaskan:
124BAB 3 Estimasi Interval dan Pengujian Hipotesis
hasil tes dalam konteks masalah yang Anda selidiki, teori ekonomi salah dan tidak ada hubungan antara
bukan hanya dalam hal huruf dan simbol Yunani. pendapatan dan pengeluaran makanan? Tidak. Ingat
Bagaimana jika kita tidak dapat menolak hipotesis bahwa gagal menolak hipotesis noltidakberarti hipotesis
nol dalam contoh ini? Akankah kita menyimpulkan bahwa nol itu benar.
Misalkan profitabilitas ekonomi supermarket baru bergantung 4.Menggunakan data pengeluaran foo(de),B2= 10.21 dengan kesalahan
pada pengeluaran rumah tangga lebih dari $5,50 dari setiap standar seB2 =2.09. Nilai statistik uji
tambahan $100 pendapatan mingguan untuk makanan dan adalah
B - 5,5 10,21 5,5
konstruksi itu tidak akan dilanjutkan kecuali ada bukti kuat untuk T=2 ()= =2.25
efek ini. Dalam hal ini, dugaan yang ingin kita bangun, yang akan seB 2 2.09
masuk dalam hipotesis alternatif, adalah bahwa2>5.5. Jika β.2≤.5.5,
5.SejakT=2.25<2.429, kami tidak menolak hipotesis nol bahwa2≤.5.
maka supermarket tidak akan menguntungkan dan pemiliknya
5. Kami adalahbukandapat menyimpulkan bahwa
tidak mau membangunnya. Estimasi kuadrat terkecil dari2adalahB
supermarket baru akan menguntungkan dan tidak akan
2= 10.21, yang lebih besar dari 5,5. Yang ingin kami tentukan
memulai konstruksi.
adalah apakah ada bukti statistik yang meyakinkan yang akan
mengarahkan kami untuk menyimpulkan, berdasarkan data yang
Dalam contoh ini, kami telah mengajukan situasi di mana pilihan
tersedia, bahwa2>5.5. Penilaian ini tidak hanya didasarkan pada
tingkat signifikansi menjadi sangat penting. Sebuah proyek
perkiraanB2tetapi juga presisi yang diukur dengan seB2.
konstruksi bernilai jutaan dolar tergantung pada memiliki
Apa yang akan menjadi hipotesis nol? Kami telah
meyakinkanbukti bahwa rumah tangga akan menghabiskan lebih
menyatakan hipotesis nol sebagai persamaan, seperti2= 5
dari $5,50 dari setiap tambahan $100 pendapatan untuk
.5. Hipotesis nol ini terlalu terbatas karena secara teori
makanan. Meskipun pilihan "biasa" adalah = 0.05, kami telah
dimungkinkan2<5.5. Ternyata prosedur pengujian
memilih nilai konservatif = 0.01 karena kami mencari tes yang
hipotesis untuk pengujian hipotesis nol ituH0:Β.2≤.5.5
memiliki peluang rendah untuk menolak hipotesis nol ketika itu
melawan hipotesis alternatifH1:Β.2>5.5 adalahpersis sama
benar-benar benar. Ingatlah bahwa tingkat signifikansi suatu
sebagai pengujianH0:Β.2=5.5 melawan hipotesis alternatif
pengujian menentukan apa yang kita maksud dengan nilai
H1:Β.2>5.5. Statistik uji dan daerah penolakan sama
statistik uji yang tidak mungkin. Dalam contoh ini, jika hipotesis
persis. Untuk uji ekor kanan, Anda dapat membentuk
nol benar, maka membangun supermarket tidak akan
hipotesis nol dengan salah satu cara ini tergantung pada
menguntungkan. Kami ingin kemungkinan membangun pasar
masalah yang dihadapi.
yang tidak menguntungkan menjadi sangat kecil, dan oleh karena
Langkah-langkah pengujian hipotesis ini adalah sebagai berikut:
itu, kami ingin kemungkinan menolak hipotesis nol ketika itu
1.Hipotesis nolnya adalahH0:Β.2≤.5.5. Alternatifnya benar menjadi sangat kecil. Dalam setiap situasi dunia nyata,
hipotesis adalahH1:Β.2>5.5. pilihan harus dibuat berdasarkan penilaianmempertaruhkandan
(
)() konsekuensidari membuat keputusan yang salah.
2.Statistik ujiT=B2– 5.5DanseB2~T(n2)jika nol
Seorang CEO yang tidak mau membuat keputusan berdasarkan
hipotesis itu benar.
bukti yang tersedia mungkin akan memesan sampel data yang baru
3.Mari kita pilih = 0.01. Nilai kritis untuk daerah penolakan dan lebih besar untuk dianalisis. Ingat bahwa ketika ukuran sampel
ekor kanan adalah persentil ke-99 dariT-distribusi dengan meningkat, penduga kuadrat terkecil menjadi lebih tepat (yang diukur
n-2 = 38 derajat kebebasan,T(0,99, 38)= 2.429. Kami akan dengan varians penaksir), dan akibatnya, uji hipotesis menjadi alat
menolak hipotesis nol jika nilai yang dihitung dariT≥.2. yang lebih kuat untuk inferensi statistik.
429. Jikat <2.429, kami tidak akan menolak hipotesis nol.
3.4 Contoh Pengujian Hipotesis 125
Untuk kelengkapan, kami akan mengilustrasikan pengujian dengann–2 = 38 derajat kebebasan,T(0,05, 38)= 1.686. Kami akan
dengan daerah penolakan di ekor kiri. Pertimbangkan hipotesis menolak hipotesis nol jika nilai yang dihitung dariT≤ -1.686.
nol bahwa β.2≥.15 dan hipotesis alternatif2<15. Ingat trik memori Jikat >-1.686, kami tidak akan menolak hipotesis nol. Sebuah
kita untuk menentukan lokasi daerah penolakan untuk aT-uji. wilayah penolakan ekor kiri diilustrasikan pada Gambar 3.3.
Daerah penolakan searah dengan panah<dalam hipotesis
alternatif. Fakta ini memberitahu kita bahwa daerah penolakan 4.Menggunakan data pengeluaran foo(de),B2= 10.21 dengan kesalahan
berada di ekor kiriT-distribusi. Langkah-langkah pengujian standar seB2 =2.09. Nilai statistik uji
hipotesis ini adalah sebagai berikut: adalah
B - 15 10.21 15
T=2( )= =2.29
1.Hipotesis nolnya adalahH0:Β.2≥.15. Alternatifnya seB2 2.09
hipotesis adalahH1:Β.2<15.
( )() 5.SejakT=2.29<1.686, kami menolak hipotesis nol bahwa2≥.15 dan
2.Statistik ujiT=B215DanseB2~T(n2)jika nol terima alternatif yang2<15. Kami menyimpulkan bahwa rumah
hipotesis itu benar. tangga menghabiskan kurang dari $15 dari setiap tambahan $100
3.Mari kita pilih = 0.05. Nilai kritis untuk daerah penolakan pendapatan untuk makanan.
ekor kiri adalah persentil ke-5 dariT-distribusi
Seorang konsultan menyuarakan pendapat bahwa berdasarkan 5.Sejak –2.204<T=1.29<2.204, kami tidak menolak hipotesis
lingkungan serupa lainnya, rumah tangga di dekat pasar yang nol bahwa2= 7.5. Data sampel konsisten dengan dugaan
diusulkan akan menghabiskan tambahan $7,50 per tambahan rumah tangga akan menghabiskan tambahan $7,50 per
pendapatan $100. Dalam hal model ekonomi kami, kami dapat tambahan $100 pendapatan untuk makanan.
menyatakan dugaan ini sebagai hipotesis nol2= 7.5. Jika kita ingin
menguji apakah ini benar atau tidak, maka alternatifnya adalah2≠.7.5. Kita harus menghindari membaca kesimpulan ini lebih dari
Alternatif ini tidak membuat klaim tentang apakah2lebih besar dari 7,5 artinya. Kitatidakmenyimpulkan dari tes ini bahwa2= 7.5,
atau kurang dari 7,5, hanya saja bukan 7,5. Dalam kasus seperti itu, hanya saja data tidak kompatibel dengan nilai parameter ini.
kami menggunakan uji dua sisi, sebagai berikut: Data juga kompatibel dengan hipotesis nolH0:Β.2=8.5 (T=0.82),
H0:Β.2=6.5 (T=1.77), dan H0:Β.2=12.5 (T=1.09). Sebuah uji
1.Hipotesis nolnya adalahH0:Β.2=7.5. Alternatifnya hipotesistidak bisadigunakan untuk membuktikan bahwa
hipotesis adalahH1:Β.2≠.7.5. hipotesis nol benar.
( )()
2.Statistik ujiT=B2– 7.5DanseB2~T(n2)jika nol Ada trik yang berkaitan dengan tes dua sisi dan interval
Sementara kami yakin bahwa ada hubungan antara daerah penolakan dan nilai kritisnya. Kedua, uji signifikansi
pengeluaran makanan dan pendapatan, model sering dua sisi adalah sesuatu yang harus dilakukan setiap kali
diusulkan yang lebih spekulatif, dan tujuan pengujian model regresi diestimasi, dan akibatnya, perangkat lunak
hipotesis adalah untuk memastikan apakah ada hubungan komputer secara otomatis menghitungT-nilai untuk hipotesis
antara variabel atau tidak. Dalam hal ini, hipotesis nolnya nol bahwa parameter regresi adalah nol. Lihat kembali
adalah2= 0; yaitu, tidak ada hubungan linier antaraxdankamu. Gambar 2.9. Pertimbangkan bagian yang melaporkan
Alternatifnya adalah2≠.0, yang berarti bahwa ada hubungan perkiraan:
tetapi mungkin ada hubungan positif atau negatif antara
variabel. Ini adalah bentuk paling umum dariuji signifikansi.
Langkah-langkah pengujiannya adalah sebagai berikut: Standar
Variabel Koefisien Kesalahan T-Statistik Masalah.
3.Mari kita pilih = 0.05. Nilai kritis untuk uji dua sisi ini Perhatikan bahwa ada kolom berlabelT-statistik. Ini adalah T-nilai
adalah 2,5-persentilT(0,025, 38)= 2.024 dan 97,5- statistik untuk hipotesis nol bahwa parameter yang merespons
persentilT(0,975, 38)= 2.024. Hipotesis nol akan kita adalah nol. Ini dihitung sebagaiT=BkDanseBk.Membagi taksiran
tolak jika nilai hitungT≥.2.024atau jikaT≤ -2.024. Jika kuadrat terkecil (Koefisien) dengan kesalahan standarnya
2.024<t <2.024, kami tidak akan menolak hipotesis (Kesalahan st.) memberikan:T-nilai statistik (T-statistik) untuk
nol. menguji hipotesis bahwa parameternya adalah nol. Itu T-nilai
4.Dengan menggunakan data pengeluaran fo(od ),B2= 10.21 statistik untuk variabelPENGHASILANadalah 4.877381, yang
dengan kesalahan standarB2= 2.09. Nilai statistik uji adalah T= relevan untuk menguji hipotesis nolH0:Β.2= 0. Kami telah
B2DanseB2= 10.21Dan2.09 = 4.88. membulatkan nilai ini menjadi 4,88 dalam diskusi kami.
ItuT-nilai untuk menguji hipotesis bahwa intersep
5.SejakT=4.88>2.024, kami menolak hipotesis nol bahwa β.2= 0 dan
adalah nol sama dengan 1,92. = 0.05 nilai kritis untuk ini
menyimpulkan bahwa ada hubungan yang signifikan secara
tes dua sisi adalahT(0,025, 38)= 2.024 danT(0,975, 38)= 2.024 apakah kita
statistik antara pendapatan dan pengeluaran makanan.
sedang menguji hipotesis tentang kemiringan atau inter-
Dua poin harus dibuat tentang hasil ini. Pertama, nilaiT cept, jadi kami gagal menolak hipotesis nol bahwaH0:Β.1= 0
-statistik yang kami hitung dalam uji dua sisi ini sama diberikan alternatifH1:Β.1≠.0.
dengan nilai yang dihitung dalam uji signifikansi satu sisi Kolom terakhir, berlabel "Prob.," adalah subjek dari
pada Contoh 3.2. Perbedaan kedua tes tersebut adalah bagian berikut.
Komentar
“signifikan secara statistik” tidak selalu berarti “signifikan secara ekonomi”. Misalnya,
misalkan CEO jaringan supermarket merencanakan tindakan tertentu jika2≠.0.
Selanjutnya, misalkan bahwa sampel besar dikumpulkan dari mana kita memperoleh
perkiraanB2= 0.0001 dengan seB2= 0.00001, menghasilkanT-statistikT=10.0. Kami
akan menolak hipotesis nol bahwa2= 0 dan terima alternatif yang2≠.0. Di sini, B2= 0.0001 secara statistik
berbeda dari nol. Namun, 0,0001 mungkin tidak "secara ekonomis" berbeda dari nol, dan CEO dapat
memutuskan untuk tidak melanjutkan rencana tersebut. Pesan di sini adalah bahwa seseorang harus
berpikir dengan hati-hati tentang pentingnya analisis statistik sebelum melaporkan atau menggunakan
hasilnya.
3.5 ItuP-Nilai
Saat melaporkan hasil uji hipotesis statistik, telah menjadi praktik standar untuk
melaporkanP-nilai(singkatan darinilai probabilitas) dari tes. Jika kita memilikiP-nilai a
3.5 IniP-Nilai127
uji,P, kita dapat menentukan hasil tes dengan membandingkanP-nilai ke tingkat signifikansi
yang dipilih, ,tanpamencari atau menghitung nilai kritis. Aturannya adalah
P-Nilai Aturan
Tolak hipotesis nol ketikaP-nilai kurang dari, atau sama dengan, tingkat signifikansi
. Artinya, jikaP,lalu tolakH0. Jikap >,maka jangan menolakH0.
Jika Anda telah memilih tingkat signifikansi menjadi = 0.01,0.05,0.10,atau nilai lainnya, Anda dapat
membandingkannya denganP-nilai suatu pengujian dan kemudian ditolak, atau tidak ditolak, tanpa
memeriksa nilai kritisnya. Dalam karya tulis, pelaporanP-nilai tes memungkinkan pembaca untuk
menerapkan penilaiannya sendiri tentang tingkat signifikansi yang sesuai.
BagaimanaP-nilai dihitung tergantung pada alternatif. JikaTadalah nilai yang dihitung dari T
-statistik, maka
Trik Memori
Arah alternatif menunjukkan ekor (s) dari distribusi di manaP-nilai jatuh.
Dalam Contoh 3.3, kami menguji hipotesis nolH0:Β.2≤.5.5 MengikutiP-nilai aturan, kami menyimpulkan bahwa pada = 0.
melawan alternatif satu sisiH1:Β.2>5.5. Nilai yang dihitung 01 kami tidak menolak hipotesis nol. Jika kita memilih = 0.05,
dariT-statistik adalah kami akan menolak hipotesis nol demi alternatif.
LogikanyaP-nilai aturan ditunjukkan pada Gambar 3.5.
B25.5 10.21 5.5
T= ()= =2.25 Probabilitas [kemampuan memperoleh] aT-nilai lebih besar
seB2 2.09
dari 2,25 adalah 0,0152, P=P t(38)≥.2.25 = 0.0152. Persentil
Dalam hal ini, karena alternatifnya adalah "lebih besar dari" (>), ke-99T(0,99, 38), yang merupakan nilai kritis untuk uji ekor
itu P-nilai dari tes ini adalah probabilitas bahwaT-variabel acak kanan dengan tingkat signifikansi = 0.01 harus jatuh ke kanan
dengann[-2 = 38 derajat kebebasan lebih besar dari 2,25, atau P=P 2.25. Ini berarti bahwaT=2.25 tidak jatuh di daerah penolakan
t(38)≥.2.25 = 0.0152. jika = 0.01 dan kami tidak akan menolak hipotesis nol pada
Nilai probabilitas ini tidak dapat ditemukan dengan cara tingkat signifikansi ini. Hal ini sesuai denganaturan nilai-p:
biasa T-tabel nilai kritis, tetapi mudah ditemukan menggunakan KetikaP-nilai (0,0152) lebih besar dari tingkat signifikansi yang
komputer. Paket perangkat lunak statistik, dan spreadsheet dipilih (0,01), kami tidak menolak hipotesis nol.
seperti Excel, memiliki perintah sederhana untuk mengevaluasi Di sisi lain, persentil ke-95T(0,95, 38), yang merupakan
fungsi distribusi kumulatif(cdf) (lihat Lampiran B.1) untuk nilai kritis untuk uji arah kanan dengan = 0.05, harus di
berbagai distribusi probabilitas. JikaFx(x) adalahcdfuntuk variabel sebelah kiri 2.25. Ini berarti bahwaT=2.25 jatuh di daerah
acakx, maka untuk sembarang nilaix=C, peluang kumulatifnya penolakan, dan kami menolak hipotesis nol pada tingkat
adalahP[x≤.C] =Fx(C). Diberikan fungsi seperti itu untukT-distribusi, signifikansi = 0.05. Hal ini sesuai denganaturan nilai-p:
kami menghitung yang diinginkanP-nilai sebagai KetikaP-nilai (0,0152) kurang dari atau sama dengan
[ ] [ ] tingkat signifikansi yang dipilih (0,05), kami akan menolak
P=P t(38)≥.2.25 = 1P t(38)≤.2,25 = 1 0,9848 hipotesis nol.
=0,0152
128BAB 3 Estimasi Interval dan Pengujian Hipotesis
T(38)
T=2.25
P=0,0152
–3 –2 –1 0 1 2 3 T
Dalam Contoh 3.4, kami melakukan pengujian dengan daerah hipotesis nol yang mendukung alternatif. Lihat Gambar
penolakan di bagian kiri dariT-distribusi. Hipotesis nolnya adalahH 3.6 untuk melihat ini secara grafis. Cari persentil ke-1 dan
0:Β.2≥.15, dan hipotesis alternatifnya adalah H1:Β.2<15. Nilai yang ke-5. Ini akan menjadi nilai kritis untuk tes ekor kiri
dihitung dariT-statistik adalah T= –2.29. Untuk menghitungP-nilai dengan = 0.01 dan =0.05 tingkat signifikansi. KetikaP-nilai
untuk uji ekor kiri ini, kami menghitung probabilitas memperoleh (0,0139) lebih besar dari tingkat signifikansi (α = 0.01),
aT-statistik di sebelah kiri 2.29. Dengan menggunakan perangkat makaT-nilai 2.29 tidak berada di wilayah penolakan uji.
lunak [ komputer Anda], Anda akan menemukan nilai ini sebagaiP KetikaP-nilai (0,0139) lebih kecil atau sama dengan tingkat
t(38)≤ -2.29 = 0.0139. Mengikuti P-nilai aturan, kami menyimpulkan signifikansi (α = 0.05), makaT-nilai 2.29 berada di wilayah
bahwa pada = 0.01, kami tidak menolak hipotesis nol. Jika kita penolakan uji.
memilih = 0.05, kami akan menolak
T(38)
T= –2.29
P=0,0139
–3 –2 –1 0 1 2 3 T
Semua perangkat lunak statistik menghitungP-nilai untuk uji Di sebelah masing-masingT-nilai statistik adalah dua-ekorP-nilai, yang
signifikansi dua sisi untuk setiap koefisien ketika analisis diberi label "Prob." oleh perangkat lunak EViews. Paket perangkat
regresi dilakukan. Dalam Contoh 3.6, kita membahas lunak lain akan menggunakan nama yang mirip. Saat memeriksa
pengujian hipotesis nolH0:Β.2= 0 terhadap hipotesis alternatif keluaran komputer, kita dapat segera memutuskan apakah suatu
H1:Β.2≠.0. Untuk nilai yang dihitung dariT-statistik perkiraan signifikan secara statistik (berbeda secara statistik dari nol
T=4.88, ituP-nilai adalah menggunakan uji dua sisi) dengan membandingkanP-nilai ke tingkat
[ ] [ ] signifikansi apa pun yang ingin kami gunakan. Perkiraan intersep
P=P t(38)≥.4.88 +P t(38)≤ -4,88 = 0,0000
memilikiP-nilai 0,0622, sehingga secara statistik tidak berbeda dengan
Perangkat lunak Anda akan secara otomatis menghitung dan nol pada taraf signifikansi = 0.05, tetapi signifikan secara statistik jika =
melaporkan ini P-nilai untuk uji signifikansi dua sisi. Lihat kembali 0.10.
Gambar 2.9 dan pertimbangkan hanya bagian yang melaporkan Koefisien estimasi pendapatan memiliki aP-nilai yang nol sampai
perkiraan: empat tempat. Dengan demikian,P=0.01 atau genap = 0.0001, dan
dengan demikian, kami menolak hipotesis nol bahwa pendapatan tidak
berpengaruh pada pengeluaran makanan pada tingkat signifikansi ini.
Standar Itu P-nilai untuk uji signifikansi dua sisi ini sebenarnya tidak nol. Jika
Variabel Koefisien Kesalahan T-Statistik Masalah. lebih banyak tempat digunakan, makaP=0.00001946. Perangkat lunak
regresi biasanya tidak mencetak lebih dari empat tempat karena dalam
C 83.41600 43.41016 1.921578 0,0622
praktiknya tingkat signifikansi kurang dari = 0.001 jarang terjadi.
PENGHASILAN 10.20964 2.093264 4.877381 0,0000
dari , ingat kembali dari Probability Primer, Bagian P.5.6, bahwa jikaxdankamuadalah variabel acak, dan jikaSebuah
danBadalah konstanta, maka varians var(kapak+oleh)diberikan dalam persamaan (P.20) sebagai
Varians (s dan)d kovarians dari penduga kuadrat terkecil diberikan dalam (2.14)–(2.16). Kita
( )
perkiraan var |x=varC1B1+C2B2|xdengan mengganti varians dan kovarians yang tidak diketahui
dengan varians dan kovarians yang diperkirakan pada (2.20)–(2.22). Kemudian
()( ) () ( ) ( )
varC 1B1+C2B2|x=Cvar211 B|x + C22varB|x + 2cc
⋀. ⋀. ⋀.
⋀.
2 (3.9)
Jika selain SR6 berlaku, atau jika sampelnya besar, penduga kuadrat terkecilB1danB2memiliki distribusi
normal. Juga benar bahwa kombinasi linear dari variabel-variabel yang terdistribusi normal adalah
terdistribusi normal, sehingga
[()]
|x=C1B1+C2B2~nλ.,var |x
( )
dimana var |xdiberikan dalam (3.8). Anda mungkin berpikir berapa lama perhitungan seperti itu akan berlangsung
menggunakan kalkulator, tapi jangan khawatir. Sebagian besar perangkat lunak komputer akan melakukan perhitungan untuk Anda.
Sekarang saatnya untuk contoh.
Seorang eksekutif mungkin bertanya kepada staf peneliti, "Beri saya Menggunakan 40 pengamatan dalam file datamakanan, di
perkiraan pengeluaran makanan mingguan rata-rata oleh rumah Bagian 2.3.2, kami memperoleh regresi pas,
tangga dengan pendapatan mingguan $2.000." Menafsirkan kata ⋀.
eksekutif "rata-rata" berarti "nilai yang diharapkan," untuk model MAKANAN_EXP=83.4160 + 10.2096PENGHASILAN
pengeluaran makanan ini berarti memperkirakan
Estimasi titik rata-rata pengeluaran makanan mingguan untuk rumah tangga
E(MAKANAN_EXP|PENGHASILAN) =1+2PENGHASILAN dengan pendapatan $2.000 adalah
⋀.
E(MAKANAN_EXP|PENGHASILAN=20) =1+220 Kami memperkirakan bahwa pengeluaran makanan yang diharapkan oleh sebuah rumah
Jika asumsi SR6 berlaku, dan diberikanx, penduga memiliki Untuk mendapatkan kesalahan standar untukB1+B220, pertama-tama kita hitung
distribusi normal. Kita dapat membentuk variabel acak normal varians yang diperkirakan
standar sebagai ⋀. ( ) ()( ⋀.
( ))
varB1+ 20B2 =varB1+ 202 ×varB2
⋀.
λ - λ.
Z=( ) ~n(0,1) ( (
⋀.
))
var |x + 2×20×covB1,B2
( )
=1884,442 + 202×4.3818
Mengganti varians sebenarnya pada penyebut dengan estimasi
varians dikawinkan, kami membentuk pentingT-statistik + (2×20×(−85.9032))
( )( )
λ - λ. λ - λ. C1B1+C2B - C1β.1+C2β. 2 =2001.0169
T=( ) = ()= (2 ) ( )
se seC1B1+C2B2
⋀.
var
kesalahan dard adalah2
~T(n2) (3.11) ( ) ⋀. ( )
seB1+ 20B2 = varB1+ 20B2 =2001.0169
JikaTCadalah 1( –Dan2 persen)nilai dariT(n2)distribusi,
makaP-TC≤.T≤.TC =1 . Pengganti (3.11) untukTdan =14.1780
mengatur ulang untuk mendapatkan
[ () ⋀. ( )] C PENGHASILAN
varB1 covB1,B2
⋀.
(
⋀.
) () =C 1884,442 85.9032
covB1,B2 varB2
⋀.
PENGHASILAN-85.9032 4.3818
H0:C1β.1+C2β.2=C0 (3.12a)
di manaC0,C1, danC2adalah konstanta tertentu, denganC0menjadi nilai hipotesis. Terlepas dari kenyataan bahwa
hipotesis nol melibatkan kedua koefisien, itu masih merupakan hipotesis tunggal untuk diuji menggunakanT
-statistik. Kadang-kadang, itu ditulis secara ekuivalen dalam bentuk implisit sebagai
( )
H0:C1β.1+C2β.2-C0= 0 (3.12b)
............................................................................................................................................
2Nilai 201,0169 diperoleh dengan menggunakan perangkat lunak komputer. Jika Anda melakukan perhitungan dengan tangan menggunakan angka-angka yang
disediakan, Anda mendapatkan 201.034. Jangan khawatir jika Anda mendapatkan perbedaan kecil seperti ini sesekali, karena kemungkinan besar adalah
perbedaan antara solusi yang dihasilkan komputer dan perhitungan tangan.
132BAB 3 Estimasi Interval dan Pengujian Hipotesis
Model pengeluaran makanan yang diperkenalkan di Bagian 2.1 dan Daerah penolakan untuk uji ekor kanan
digunakan sebagai ilustrasi di seluruh memberikan contoh yang sangat baik diilustrasikan pada Gambar 3.2. Untuk uji arah kanan
tentang bagaimanahipotesis linierdalam (3.12) dapat digunakan dalam pada = 0.05 tingkat signifikansi,T-nilai kritis adalah
praktik. Untuk sebagian besar kota menengah dan besar, ada perkiraan persentil ke-95 dari T(38)distribusi, yaituT(0,95, 38)= 1.686. Jika
pertumbuhan pendapatan untuk tahun mendatang. Supermarket atau toko dihitung T-nilai statistik lebih besar dari 1,686, kami akan
ritel makanan jenis apa pun akan mempertimbangkan hal ini sebelum menolak hipotesis nol dan menerima hipotesis alternatif,
fasilitas baru dibangun. Pertanyaan mereka adalah, jika pendapatan di suatu yang dalam hal ini adalah dugaan eksekutif.
daerah diproyeksikan tumbuh pada tingkat tertentu, berapa banyak yang MenghitungT-nilai statistik
akan dihabiskan untuk makanan? Seorang eksekutif mungkin berkata, ( )
berdasarkan pengalaman bertahun-tahun, "Saya berharap bahwa sebuah
B1+20
( B2250
T= )
rumah tangga dengan pendapatan mingguan $2.000 akan menghabiskan, seB1+ 20B2
rata-rata, lebih dari $250 seminggu untuk makanan." Bagaimana kita bisa
(83.4160 + 20×10.2096) 250
menggunakan ekonometrika untuk menguji dugaan ini? =
Fungsi regresi untuk model pengeluaran makanan 14.1780
adalah
287.6089 250 37.6089
= = =2.65
E(MAKANAN_EXP|PENGHASILAN) =1+2PENGHASILAN 14.1780 14.1780
SejakT=2.65>TC=1.686, kami menolak hipotesis nol bahwa rumah tangga
Dugaan eksekutif adalah bahwa
dengan pendapatan mingguan $2.000 akan menghabiskan $250 per minggu
E(MAKANAN_EXP|PENGHASILAN=20) =1+220>250 atau kurang untuk makanan dan menyimpulkan bahwa dugaan eksekutif
bahwa rumah tangga tersebut menghabiskan lebih dari $250 adalah benar,
Untuk menguji validitas pernyataan ini, kami menggunakannya sebagai
dengan kemungkinan kesalahan Tipe I 0,05.
hipotesis alternatif
Dalam Contoh 3.8, kami memperkirakan bahwa sebuah rumah
H1:Β.1+220>250,atauH1:Β.1+220 250>0 tangga dengan pendapatan mingguan $2.000 akan membelanjakan
$287.6089, yang lebih besar dari nilai spekulasi eksekutif sebesar $250.
Hipotesis nol yang sesuai adalah alternatif logis untuk Namun, sekadar mengamati bahwa nilai taksiran lebih besar dari $250
pernyataan eksekutif bukanlah uji statistik. Mungkin secara numerik lebih besar, tetapi
apakah itusecara signifikanlebih besar? ItuT-test memperhitungkan
H0:Β.1+220≤.250,atauH0:Β.1+220 250≤.0
presisi yang kita gunakan untuk memperkirakan tingkat pengeluaran
Perhatikan bahwa hipotesis nol dan hipotesis alternatif dalam bentuk ini dan juga mengontrol kemungkinan kesalahan Tipe I.
yang sama dengan hipotesis linier umum denganC1= 1,C2= 20, danC0=
250.
3.7 Latihan133
3.7 Latihan
3.7.1Masalah
3.1Ada 64 negara pada tahun 1992 yang berkompetisi di Olimpiade dan memenangkan setidaknya satu medali.
Membiarkan MEDALImenjadi jumlah total medali yang dimenangkan, dan mariGDPBmenjadi PDB (miliar dolar 1995).
Model regresi linier yang menjelaskan jumlah medali yang diperoleh adalahMEDALI=1+2GDPB+e. Hubungan yang
diperkirakan adalah
⋀.
MEDALI=B1+B2GDPB=7.61733 + 0.01309GDPB
(se) (2,38994) (0,00215) (XR3.1)
Sebuah.Kami ingin menguji hipotesis bahwa tidak ada hubungan antara jumlah medali yang dimenangkan
dan PDBterhadap alternatif ada hubungan positif. Nyatakan hipotesis nol dan hipotesis alternatif dalam
hal parameter model.
B.Apa statistik uji untuk bagian (a) dan bagaimana distribusinya jika hipotesis nol benar?
C.Apa yang terjadi pada distribusi statistik uji untuk bagian (a) jika hipotesis alternatif benar? Apakah
distribusinya digeser ke kiri atau ke kanan, relatif terhadap yang biasa?T-distribusi? [Petunjuk:
Berapakah nilai harapan dariB2jika hipotesis nol benar, dan bagaimana jika alternatifnya benar?]
D.Untuk pengujian pada tingkat signifikansi 1%, untuk berapa nilaiT-statistik akankah kita menolak hipotesis
nol pada bagian (a)? Untuk nilai apa kita akan gagal menolak hipotesis nol?
e.LakukanT-uji hipotesis nol pada bagian (a) pada tingkat signifikansi 1%. Apa kesimpulan
ekonomi Anda? Apa arti tingkat signifikansi 1% dalam contoh ini?
3.2Ada 64 negara pada tahun 1992 yang berkompetisi di Olimpiade dan memenangkan setidaknya satu medali.
Membiarkan MEDALImenjadi jumlah total medali yang dimenangkan, dan mariGDPBmenjadi PDB (miliar dolar
1995). Model regresi linier yang menjelaskan jumlah medali yang diperoleh adalahMEDALI=1+2GDPB+e.
Estimasi hubungan diberikan dalam persamaan (XR3.1) pada Latihan 3.1.
Sebuah.Kami ingin menguji hipotesis nol bahwa peningkatan satu miliar dolar dalamPDBmengarah pada peningkatan
rata-rata, atau diharapkan, jumlah medali yang dimenangkan sebesar 0,015, dibandingkan alternatif yang tidak.
Nyatakan hipotesis nol dan hipotesis alternatif dalam hal parameter model.
B.Apa statistik uji untuk bagian (a) dan bagaimana distribusinya jika hipotesis nol benar?
C.Apa yang terjadi pada distribusi statistik uji pada bagian (a) jika hipotesis alternatif benar? Apakah
distribusinya digeser ke kiri atau ke kanan, relatif terhadap yang biasa?T-distribusi, atau arah
pergeseran tidak pasti? [Petunjuk: Berapakah nilai harapan dariB2jika hipotesis nol benar, dan
bagaimana jika alternatifnya benar?]
D.Untuk pengujian pada tingkat signifikansi 10%, untuk berapa nilaiT-statistik, akankah kita menolak hipotesis
nol pada bagian (a)? Untuk nilai apa, kita akan gagal menolak hipotesis nol?
e.LakukanT-uji hipotesis nol pada bagian (a). Apa kesimpulan ekonomi Anda?
F.Jika kita melakukan pengujian pada bagian (a) pada taraf signifikansi 5%, apa yang kita simpulkan? Pada
tingkat signifikansi 1%, apa yang kita simpulkan?
G.Lakukan pengujian yang sama pada taraf signifikansi 5%, tetapi ubah nilai hipotesis nol yang diminati
menjadi 0,016, kemudian 0,017. Apa yang dihitung?T-nilai statistik dalam setiap kasus? Hipotesis mana
yang Anda tolak, dan mana yang gagal Anda tolak?
3.3Ada 64 negara pada tahun 1992 yang berkompetisi di Olimpiade dan memenangkan setidaknya satu medali.
Membiarkan MEDALImenjadi jumlah total medali yang dimenangkan, dan mariGDPBmenjadi PDB (miliar dolar
1995). Model regresi linier yang menjelaskan jumlah medali yang diperoleh adalahMEDALI=1+2GDPB+e.
Estimasi hubungan diberikan dalam persamaan (XR3.1) pada Latihan 3.1.
Estimasi kovarians antara penduga kemiringan dan intersep adalah 0,00181 dan varian galat yang
diestimasi adalah2= 320,336. Rata-rata sampel dariGDPBadalahGDPB=390,89 dan varians sampel dari
GDPBadalahS2 GDPB =1099615.
Sebuah.Perkirakan jumlah medali yang diharapkan dimenangkan oleh suatu negara denganGDPB=25.
⋀. ( ) ()
+ (25)2varB2+
⋀.
B.Hitung galat baku pendugaan dalam (a) dengan menggunakan var variansB1
(
⋀.
)
(2)(25) covB1,B2 .
134BAB 3 Estimasi Interval dan Pengujian Hipotesis
{
C.Hitung galat baku pendugaan pada (a) dengan menggunakan varians2 (1Dann) +
[( ) 2// ]}
)
25GDPB (n-1)S2 GDPB .
D.Buatlah perkiraan interval 95% untuk perkiraan jumlah medali yang dimenangkan oleh suatu negara
dengan GDPB=25.
e.Buatlah perkiraan interval 95% untuk perkiraan jumlah medali yang dimenangkan oleh suatu negara dengan GDPB=
300. Bandingkan dan kontraskan perkiraan interval ini dengan yang di bagian (d). Jelaskan perbedaan yang Anda
amati.
3.4Asumsikan bahwa asumsi SR1-SR6 berlaku untuk model regresi linier sederhana,kamusaya=1+2xsaya+esaya, saya=1,…,n.
Umumnya, sebagai ukuran sampelnmenjadi lebih besar, interval kepercayaan menjadi lebih sempit.
Sebuah.Apakah interval kepercayaan yang lebih sempit untuk parameter, seperti2, diinginkan? Jelaskan mengapa atau mengapa tidak.
B.Memberiduaalasan spesifik mengapa, ketika ukuran sampel semakin besar, interval kepercayaan untuk2cenderung
menjadi lebih sempit. Alasan harus berhubungan dengan sifat-sifat estimator kuadrat terkecil dan/atau prosedur
estimasi interval.
3.5Jika kita memiliki sampel data yang besar, maka gunakan nilai kritis dari distribusi normal standar untuk
membangun aP-nilaidibenarkan. Tapi seberapa besar "besar" itu?
Sebuah.Untuk sebuahT-distribusi dengan 30 derajat kebebasan, ekor kananP-nilai untukT-statistik 1,66 adalah
0,05366666. Berapa perkiraannya?P-nilai menggunakan fungsi distribusi kumulatif dari distribusi normal
standar, (z), dalam Tabel Statistik 1? Menggunakan uji ekor kanan dengan = 0.05, apakah Anda akan
membuat keputusan yang benar tentang hipotesis nol menggunakan perkiraanP-nilai? Apakah tepatnya?
P-nilainya lebih besar atau lebih kecil untukT-distribusi dengan 90 derajat kebebasan?
B.Untuk sebuahT-distribusi dengan 200 derajat kebebasan, ekor kananP-nilai untukT-statistik 1,97 adalah 0,0251093.
Berapa perkiraannya?P-nilai menggunakan distribusi normal standar? Menggunakan sebuah tes dua ekordengan
= 0.05, apakah Anda akan membuat keputusan yang benar tentang hipotesis nol menggunakan perkiraanP-nilai?
Apakah tepatnya?P-nilainya lebih besar atau lebih kecil untukT-distribusi dengan 90 derajat kebebasan?
C.Untuk sebuahT-distribusi dengan 1000 derajat kebebasan, ekor kananP-nilai untukT-statistik 2.58 adalah
0.00501087. Berapa perkiraannya?P-nilai menggunakan distribusi normal standar? Menggunakan uji dua
sisi dengan = 0.05, apakah Anda akan membuat keputusan yang benar tentang hipotesis nol
menggunakan perkiraanP-nilai? Apakah tepatnya?P-nilainya lebih besar atau lebih kecil untukT-distribusi
dengan 2000 derajat kebebasan?
3.6Kami memiliki data pada 2323 rumah tangga yang dipilih secara acak yang terdiri dari tiga orang pada tahun 2013. Mari
MASUKKANmenunjukkan pengeluaran hiburan bulanan ($) per orang per bulan dan biarkanPENGHASILAN ($100)
menjadi pendapatan rumah tangga bulanan. Perhatikan model regresi linier sederhanaMASUKKANsaya= β.1+2
PENGHASILANsaya+esaya,saya=1,…,2323. Asumsikan bahwa asumsi SR1–SR6 berlaku. kuadrat terkecil
⋀.
PENGHASILAN=71.84. Uji hipotesis nol bahwa elastisitasnya adalah 0,85 terhadap alternatif yang bukan
0,85, dengan menggunakan = 0.05 tingkat signifikansi.
F.Menggunakan Tabel Statistik 1, hitung perkiraan dua ekorP-val(ue untukT-statistik di) bagian (e).
/
MenggunakanP-nilai aturan, apakah Anda menolak hipotesis nol =2PENDAPATAN ENTERT=0,85,
versus alternatif≠.0.85, pada tingkat signifikansi 10%? Menjelaskan.
3.7Kami memiliki data tahun 2008 tentangPENGHASILAN=pendapatan per kapita (dalam ribuan dolar) dan
SARJANA= persentase populasi dengan gelar sarjana atau lebih untuk 50 Negara Bagian AS ditambah
Distrik Columbia, totaln=51 pengamatan. Hasil dari regresi linier sederhana dariPENGHASILAN di
SARJANAadalah
⋀.
Sebuah.Dengan menggunakan informasi yang diberikan, hitung perkiraan intersep. Tunjukkan pekerjaan Anda.
B.Buat sketsa hubungan yang diperkirakan. Apakah bertambah atau berkurang? Apakah itu hubungan positif atau terbalik?
Apakah itu meningkat atau menurun pada tingkat yang konstan atau itu meningkat atau menurun pada tingkat yang
meningkat?
C.Dengan menggunakan informasi yang diberikan, hitung kesalahan standar dari koefisien kemiringan. Tunjukkan pekerjaan
Anda.
D.Berapakah nilaiT-statistik untuk hipotesis nol bahwa parameter intersep sama dengan 10?
e.ItuP-nilai untuk uji dua sisi yang parameter intersepnya sama dengan 10, dari bagian (d), adalah 0,572.
TunjukkanP-nilai dalam sketsa. Pada sketsa, tunjukkan daerah penolakan jika = 0.05.
F.Buat estimasi interval 99% dari kemiringan. Menafsirkan perkiraan interval.
G.Uji hipotesis nol bahwa koefisien kemiringan adalah satu terhadap alternatif yang tidak satu
pada tingkat signifikansi 5%. Nyatakan hasil ekonomi dari tes, dalam konteks masalah ini.
3.8Menggunakan data 2011 di 141 universitas riset publik AS, kami menguji hubungan antara biaya per
siswa dan pendaftaran universitas penuh waktu. MembiarkanAC=biaya akademik riil per siswa (ribuan
dolar), dan mariFTESTU=pendaftaran siswa penuh waktu (ribuan siswa). kuadrat terkecil cocok-
⋀.
e.Pada tahun 2011, Universitas Negeri Louisiana (LSU) memiliki pendaftaran siswa penuh waktu 27.950. Berdasarkan
persamaan taksiran, taksiran kuadrat terkecil dariE(AC|FTESTU=27,950) adalah 22,079, dengan kesalahan standar
0,964. Nilai sebenarnya dariACuntuk LSU tahun itu adalah 21.403. Apakah Anda akan mengatakan bahwa nilai ini
mengejutkan atau tidak mengejutkan? Menjelaskan.
3.9Menggunakan data dari tahun 2013 pada 64 perempuan kulit hitam, estimasi regresi linier antaraGAJI(penghasilan per
⋀.
Sebuah.Standar error dari estimasi koefisien kemiringan adalah 0,52. Bangun dan tafsirkan perkiraan interval 95%
untuk efek satu tahun pendidikan tambahan pada tingkat upah per jam yang diharapkan dari perempuan kulit
hitam.
B.Kesalahan standar dari perkiraan intersep adalah 7,39. Uji hipotesis nol bahwa intersep β.1= 0
terhadap alternatif bahwa intersep sebenarnya tidak nol, dengan menggunakan tingkat signifikansi
= 0,10. Dalam jawaban Anda, tunjukkan (i) hipotesis nol dan alternatif formal, (ii) statistik uji dan
136BAB 3 Estimasi Interval dan Pengujian Hipotesis
distribusinya di bawah hipotesis nol, (iii) daerah penolakan (dalam gambar), (iv) nilai statistik uji
yang dihitung, dan (v) nyatakan kesimpulan Anda, dengan interpretasi ekonominya.
C.Perkirakan upah yang diharapkan untuk seorang wanita kulit hitam dengan pendidikan 16 tahun,E(GAJI|PENDIDIKAN=16).
D.Kovarians yang diperkirakan antara intersep dan kemiringan adalah 3.75. Buatlah perkiraan interval 95% untuk upah
yang diharapkan untuk wanita kulit hitam dengan pendidikan 16 tahun.
e.Diperkirakan bahwa seorang wanita kulit hitam dengan pendidikan 16 tahun akan memiliki upah yang
diharapkan lebih dari $23 per jam. Gunakan ini sebagai "hipotesis alternatif" dalam uji dugaan pada
tingkat signifikansi 10%. Apakah bukti mendukung dugaan atau tidak?
3.10Menggunakan data dari tahun 2013 pada 64 perempuan kulit hitam, perkiraan regresi log-linear antaraGAJI(menghasilkan-
⋀.
ing per jam, dalam $) dan tahun pendidikan,PENDIDIKANadalah ln(GAJI) =1,58 + 0,09PENDIDIKAN. Terlapor T-statistik
untuk koefisien kemiringan adalah 3,95.
Sebuah.Uji pada tingkat signifikansi 5%, hipotesis nol bahwa pengembalian ke tahun pendidikan
tambahan kurang dari atau sama dengan 8% terhadap alternatif bahwa tingkat pengembalian
pendidikan lebih dari 8%. Dalam jawaban Anda, tunjukkan (i) hipotesis nol dan alternatif formal, (ii)
statistik uji dan distribusinya di bawah hipotesis nol, (iii) daerah penolakan (dalam gambar), (iv) nilai
yang dihitung dari tes statistik, dan (v) nyatakan kesimpulan Anda, dengan interpretasi
ekonominya.
B.Menguji hipotesis nol bahwa pengembalian ke pendidikan adalah 8%, melawan alternatif bahwa itu bukan
8%, kami memperolehP-nilai 0,684. Apakah yangP-nilai untuk tes di bagian (a)? Dalam sketsa, tunjukkan
untuk pengujian pada bagian (a)P-nilai dan 5% nilai kritis dariT-distribusi.
C.Buatlah perkiraan interval 90% untuk kembali ke tahun pendidikan tambahan dan nyatakan
interpretasinya.
3.11Teori penawaran tenaga kerja menunjukkan bahwa lebih banyak jasa tenaga kerja akan ditawarkan dengan upah yang
lebih tinggi. SeandainyaHRSWKadalah jumlah jam kerja biasa per minggu oleh orang yang dipilih secara acak danGAJI
adalah upah per jam mereka. Model regresi kami ditentukan sebagaiHRSWK=1+2GAJI+e. Menggunakan sampel
⋀.
dari 9799 individu dari tahun 2013, kami memperoleh estimasi regresiHRSWK=41,58 + 0,011GAJI.
Estimasi varians dan kovarians dari estimator kuadrat terkecil adalah sebagai berikut:
MENCEGAT GAJI
MENCEGAT 0,02324 0,00067
GAJI 0,00067 0,00003
Sebuah.Uji hipotesis nol bahwa hubungan tersebut memiliki kemiringan yang kurang dari, atau sama dengan, nol pada tingkat
signifikansi 5%. Nyatakan hipotesis nol dan hipotesis alternatif dalam hal parameter model. Dengan menggunakan hasilnya,
apakah kita mengkonfirmasi atau menyangkal teori penawaran tenaga kerja?
B.Gunakan Tabel Statistik 1 dari probabilitas normal untuk menghitung perkiraanP-nilai untuk tes di
(Sebuah). Gambarlah sketsa yang mewakiliP-nilai.
C.Di bawah asumsi SR1-SR6 dari model regresi sederhana, jumlah jam kerja yang diharapkan per minggu
adalahE(HRSWK|GAJI) =1+2GAJI. Buatlah perkiraan interval 95% untuk perkiraan jumlah jam kerja per
minggu untuk seseorang yang berpenghasilan $20/jam.
D.Dalam sampel, ada 203 individu dengan upah per jam $20. Jumlah jam kerja rata-rata untuk orang-
orang ini adalah 41,68. Apakah hasil ini sesuai dengan estimasi interval pada (c)? Jelaskan alasan
Anda.
e.Uji hipotesis nol bahwa jam kerja yang diharapkan untuk seseorang yang berpenghasilan $20 per jam adalah 41,68,
dibandingkan dengan alternatif yang tidak, pada tingkat signifikansi 1%.
3.12Pertimbangkan regresi log-linear untuk penjualan mingguan (jumlah kaleng) tuna kaleng merek
nasional (SAL1 = penjualan merek target) sebagai fungsi rasio harganya dengan harga pesaing,
Rp3 = 100 (harga merek target÷.harga bersaing merek #3), ln(SAL1) =1+ γ.2Rp3 +e. Menggunakan
n=52 pengamatan mingguan persamaan estimasi kuadrat terkecil adalah
Sebuah.variabelRp3 adalah harga merek target sebagai persentase dari harga merek pesaing #3 atau
lebih sederhananya "harga relatif". Rata-rata sampel dariRp3 adalah 99,66, mediannya
3.7 Latihan137
adalah 100, nilai minimumnya adalah 70,11, dan nilai maksimumnya adalah 154,24. Apa yang dikatakan statistik
ringkasan ini kepada kita tentang harga merek target relatif terhadap harga pesaingnya?
B.Interpretasikan koefisien dariRp3. Apakah tandanya masuk akal secara ekonomi?
C.Membangun dan menafsirkan perkiraan interval 95% untuk efek pada penjualan mingguan,SAL1, dari
kenaikan 1% dalam harga merek target sebagai persentase dari harga merek pesaing #3, yang
merupakan harga relatifRp3.
D.Lakukan uji hipotesis nolH0:Γ.2≥ -0.02 melawan alternatifH1:Γ.2<0.02 menggunakan = 0.01
tingkat signifikansi. Cantumkan dalam jawaban Anda (i) statistik uji dan distribusinya jika
hipotesis nol benar, (ii) sketsa daerah penolakan, (iii) tunjukkan letak nilai statistik uji, (iv)
nyatakan kesimpulan Anda, dan (v) tunjukkan pada sketsa daerah yang mewakiliP-nilai.
e.“Uji hipotesis dan penduga interval untuk model regresi adalah valid selama istilah kesalahan regresi
berdistribusi normal.” Apakah ini benar atau salah? Menjelaskan.
3.13Pertimbangkan model respons area perkiraan berikut untuk tebu (luas tebu yang ditanam dalam
ribuan hektar di wilayah Bangladesh), sebagai fungsi dari harga relatif (100 kali harga tebu
dibagi dengan harga goni, yaitu tanaman alternatif pengganti tebu, ditanam oleh Bangladesh
⋀.
adalah penurunan berat badan, obat mana yang akan Anda gunakan? Mengapa?
138BAB 3 Estimasi Interval dan Pengujian Hipotesis
3.15Dalam persidangan pembunuhan besar-besaran, dengan potensi hukuman seumur hidup di penjara, apakah Anda sebagai hakim akan memberi tahu juri
untuk memastikan bahwa kami secara tidak sengaja menghukum orang yang tidak bersalah hanya satu kali dalam seratus, atau menggunakan ambang
Sebuah.Berapa biaya ekonomi dari kesalahan Tipe I dalam contoh ini? Sebutkan beberapa faktor yang harus
dipertimbangkan dalam perhitungan seperti itu.
B.Berapa biaya ekonomi dari kesalahan Tipe II dalam contoh ini? Sebutkan beberapa faktor yang harus
dipertimbangkan dalam perhitungan seperti itu.
3.16Sebuah pertanyaan besar di Amerika Serikat, pertanyaan tentang "sebab dan akibat," adalah apakah perawatan kesehatan wajib
benar-benar akan membuat orang Amerika lebih sehat. Apa peran pengujian hipotesis dalam penyelidikan semacam itu?
3.17Pertimbangkan model regresiGAJI=1+2PENDIDIKAN+e. Di manaGAJIadalah tingkat upah per jam dalam dolar AS 2013.
PENDIDIKANadalah tahun sekolah. Model diestimasi dua kali, sekali menggunakan individu dari daerah perkotaan, dan
sekali lagi untuk individu di daerah pedesaan.
⋀.
perkotaan
GAJI=10,76 + 2,46PENDIDIKAN, n=986
(se) (2.27) (0.16)
⋀.
Pedesaan
GAJI=4.88 + 1.80PENDIDIKAN, n=214
(se) (3.29) (0.24)
Sebuah.Dengan menggunakan regresi perkotaan, uji hipotesis nol bahwa kemiringan regresi sama dengan 1,80
terhadap alternatif yang lebih besar dari 1,80. Gunakan = 0.05 tingkat signifikansi. Tunjukkan semua langkah,
termasuk grafik daerah kritis dan nyatakan kesimpulan Anda.
B.Menggunakan regresi pedesaan, hitung perkiraan interval 95% untuk perkiraanGAJIjikaPENDIDIKAN=16. Standar
eror yang dibutuhkan adalah 0,833. Tunjukkan bagaimana penghitungannya menggunakan fakta bahwa perkiraan
kovarians antara koefisien intersep dan kemiringan adalah 0,761.
C.Menggunakan regresi perkotaan, hitung perkiraan interval 95% untuk perkiraanGAJIjikaPENDIDIKAN=16. Kovarians
yang diperkirakan antara koefisien intersep dan kemiringan adalah 0,345. Apakah estimasi interval untuk regresi
perkotaan lebih lebar atau lebih sempit daripada untuk regresi pedesaan pada (b). Apakah menurut Anda ini
masuk akal? Menjelaskan.
D.Dengan menggunakan regresi pedesaan, uji hipotesis bahwa parameter intersep1sama dengan empat, atau
lebih, terhadap alternatif yang kurang dari empat, pada tingkat signifikansi 1%.
3.18Sebuah perusahaan asuransi jiwa meneliti hubungan antara jumlah asuransi jiwa yang dimiliki oleh sebuah rumah
tangga dengan pendapatan rumah tangga. MembiarkanPENGHASILANmenjadi pendapatan rumah tangga (ribuan
rupiah) dan PERTANGGUNGANjumlah asuransi jiwa yang dimiliki (ribuan rupiah). Menggunakan sampel acak dari n=20
rumah tangga, perkiraan hubungan kuadrat terkecil adalah
⋀.
PERTANGGUNGAN=6,855 + 3,880PENGHASILAN
(se) (7,383) (0,112)
Sebuah.Gambarlah sketsa hubungan pas yang mengidentifikasi perkiraan kemiringan dan intersep. Rata-rata
sampel dariPENGHASILAN=59.3. Apa rata-rata sampel dari jumlah asuransi yang dimiliki? Temukan titik
sarana dalam sketsa Anda.
B.Berapa banyak yang kita perkirakan bahwa jumlah rata-rata asuransi yang dimiliki berubah dengan setiap tambahan
$1000 dari pendapatan rumah tangga? Berikan estimasi titik dan estimasi interval 95%. Jelaskan perkiraan interval
kepada sekelompok pemegang saham di perusahaan asuransi.
3.7 Latihan139
C.Buatlah estimasi interval 99% dari perkiraan jumlah asuransi yang dimiliki oleh sebuah rumah tangga dengan
pendapatan $100.000. Kovarians yang diperkirakan antara koefisien intersep dan kemiringan adalah -0,746.
D.Salah satu anggota dewan manajemen mengklaim bahwa untuk setiap peningkatan pendapatan sebesar $1000,
jumlah rata-rata asuransi jiwa yang dimiliki akan meningkat sebesar $5000. Biarkan model aljabar menjadi
PERTANGGUNGAN= β.1+2PENGHASILAN+e. Uji hipotesis bahwa pernyataan itu benar terhadap alternatif yang tidak
benar. Nyatakan dugaan dalam bentuk hipotesis nol dan hipotesis alternatif tentang parameter model. Gunakan
tingkat signifikansi 5%. Apakah data mendukung klaim tersebut atau tidak? Jelas, tunjukkan statistik uji yang
digunakan dan daerah penolakan.
e.Uji hipotesis bahwa ketika pendapatan meningkat, jumlah asuransi jiwa yang dimiliki meningkat dengan jumlah yang
sama. Artinya, uji hipotesis nol bahwa kemiringannya adalah satu. Gunakan sebagai alternatif yang kemiringannya
lebih besar dari satu. Nyatakan hipotesis nol dan hipotesis alternatif dalam hal parameter model. Lakukan
pengujian pada taraf signifikansi 1%. Tunjukkan dengan jelas statistik uji yang digunakan, dan daerah penolakan.
Apa kesimpulan Anda?
3.7.2Latihan Komputer
3.19Pemilik motel menemukan bahwa produk cacat digunakan selama konstruksi. Butuh waktu 7
bulan untuk memperbaiki cacat di mana sekitar 14 kamar di 100 unit motel tidak dapat
digunakan selama 1 bulan pada suatu waktu. Data ada di filemotel.
Sebuah.MerencanakanMOTEL_PCTdanCOMP_PCTmelawanWAKTUpada grafik yang sama. Apa yang dapat
Anda katakan tentang tingkat hunian dari waktu ke waktu? Apakah mereka cenderung bergerak bersama?
Manakah yang tampaknya memiliki tingkat hunian lebih tinggi? Perkirakan model regresiMOTEL_PCT=1+2
COMP_PCT+e. Buatlah estimasi interval 95% untuk parameter2. Sudahkah kita memperkirakan hubungan
antara MOTEL_PCTdanCOMP_PCTrelatif tepat, atau tidak? Jelaskan alasan Anda.
B.Buatlah perkiraan interval 90% dari tingkat hunian yang diharapkan dari motel yang bersangkutan,
MOTEL_PCT, mengingat bahwaCOMP_PCT=70.
C.Dalam model regresi linierMOTEL_PCT=1+2COMP_PCT+e, uji hipotesis nol H0:Β.2≤.0 melawan
hipotesis alternatifH0:Β.2>0 pada = 0.01 tingkat signifikansi. Diskusikan kesimpulan Anda.
Tentukan dengan jelas statistik uji yang digunakan dan daerah penolakan.
D.Dalam model regresi linierMOTEL_PCT=1+2COMP_PCT+e, uji hipotesis nol H0:Β.2= 1 melawan
hipotesis alternatifH0:Β.2≠.1 di = 0.01 tingkat signifikansi. Jika hipotesis nol itu benar, apa
implikasinya tentang tingkat hunian motel versus tingkat hunian pesaing mereka? Diskusikan
kesimpulan Anda. Tentukan dengan jelas statistik uji yang digunakan dan daerah penolakan.
F.Ujilah hipotesis nol bahwa2= 0 terhadap alternatif yang2<0 pada = 0.01 tingkat
signifikansi. Diskusikan arti dari hasil tes. Nyatakan dengan jelas statistik uji, daerah
penolakan, danP-nilai.
3.21Model penetapan harga aset modal (CAPM) dijelaskan dalam Latihan 2.16. Gunakan semua pengamatan yang tersedia di
file datacapm5untuk latihan ini.
Sebuah.Buat perkiraan interval 95% dari "beta" Exxon-Mobil dan Microsoft. Asumsikan bahwa Anda adalah seorang pialang
saham. Jelaskan hasil ini kepada investor yang datang kepada Anda untuk meminta nasihat.
B.Uji pada tingkat signifikansi 5% hipotesis bahwa nilai "beta" Ford adalah satu terhadap alternatif yang tidak
sama dengan satu. Apa interpretasi ekonomi dari beta sama dengan satu? Ulangi pengujian dan nyatakan
kesimpulan Anda untuk saham General Electric dan saham Exxon-Mobil. Nyatakan dengan jelas statistik uji
yang digunakan dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai.
C.Uji pada tingkat signifikansi 5% hipotesis nol bahwa nilai "beta" Exxon-Mobil lebih besar atau sama dengan
satu terhadap alternatif yang nilainya kurang dari satu. Nyatakan dengan jelas statistik uji yang digunakan
dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai. Apa interpretasi ekonomi dari beta
kurang dari satu?
D.Uji pada tingkat signifikansi 5% hipotesis nol bahwa nilai "beta" Microsoft kurang dari atau sama dengan
satu terhadap alternatif yang nilainya lebih besar dari satu. Nyatakan dengan jelas statistik uji yang
digunakan dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai. Apa interpretasi ekonomi dari
beta lebih dari satu?
e.Uji pada tingkat signifikansi 5%, hipotesis nol bahwa istilah intersep dalam model CAPM untuk saham Ford
adalah nol, terhadap alternatif yang tidak. Apa yang Anda simpulkan? Ulangi pengujian dan nyatakan
kesimpulan Anda untuk saham General Electric dan saham Exxon-Mobil. Nyatakan dengan jelas statistik uji
yang digunakan dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai.
3.22file datanyakota kampusberisi data tentang 500 rumah keluarga tunggal yang dijual di Baton Rouge, Louisiana,
selama 2009–2013. Data termasuk harga jual (dalam $1000 unit),HARGA, dan total luas interior dalam ratusan
kaki persegi,SQFT.
Sebuah.Menggunakan regresi linierHARGA=1+2SQFT+e, perkirakan elastisitas rumah yang diharapkan
HARGAdengan hormatSQFT, dievaluasi pada rata-rata sampel. Buatlah estimasi interval 95% untuk
elastisitas, perlakukan sampel yang berarti seolah-olah mereka diberi nomor (bukan acak). Apa
interpretasi dari interval?
B.Ujilah hipotesis nol bahwa elastisitas, yang dihitung pada bagian (a), adalah satu terhadap alternatif yang
elastisitasnya bukan satu. Gunakan tingkat signifikansi 1%. Nyatakan dengan jelas statistik uji yang digunakan,
daerah penolakan, dan pengujianP-nilai. Apa yang Anda simpulkan?
C.Menggunakan model regresi linierHARGA=1+2SQFT+e, uji hipotesis bahwa efek marjinal pada harga rumah
yang diharapkan dari peningkatan ukuran rumah sebesar 100 kaki persegi kurang dari atau sama dengan
$13000 terhadap alternatif bahwa efek marjinal akan lebih besar dari $13000. Gunakan tingkat signifikansi
5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan pengujianP-nilai. Apa yang
Anda simpulkan?
D.Menggunakan regresi linierHARGA=1+2SQFT+e, memperkirakan harga yang diharapkan, E(HARGA|
SQFT) =1+2LEMBUT, untuk rumah seluas 2000 kaki persegi. Buatlah perkiraan interval 95% dari
harga yang diharapkan. Jelaskan perkiraan interval Anda kepada khalayak umum.
e.Cari rumah di sampel dengan 2000 kaki persegi ruang tamu. Hitung rata-rata sampel (rata-rata) dari
harga jual mereka. Apakah rata-rata sampel harga jual rumah denganSQFT=20 sesuai dengan hasil
pada bagian (d)? Menjelaskan.
3.23file datanyakota kampusberisi data tentang 500 rumah keluarga tunggal yang dijual di Baton Rouge, Louisiana,
selama 2009–2013. Data tersebut meliputi harga jual dalam $1000 unit,HARGA, dan total luas interior dalam
ratusan kaki persegi,SQFT.
Sebuah.Dengan menggunakan model regresi kuadrat,HARGA=1+2LEMBUT2+e, uji hipotesis bahwa efek marjinal pada
harga rumah yang diharapkan dari peningkatan ukuran rumah seluas 2000 kaki persegi dengan 100 kaki persegi
kurang dari atau sama dengan $13000 terhadap alternatif bahwa efek marjinal akan lebih besar dari $13000.
Gunakan tingkat signifikansi 5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan
pengujianP-nilai. Apa yang Anda simpulkan?
B.Dengan menggunakan model regresi kuadratik di bagian (a), uji hipotesis bahwa efek marjinal pada harga rumah
yang diharapkan dari peningkatan ukuran rumah seluas 4000 kaki persegi dengan 100 kaki persegi kurang dari
atau sama dengan $13000 terhadap alternatif bahwa efek marjinal akan lebih besar dari $13000.
3.7 Latihan141
Gunakan tingkat signifikansi 5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan
pengujianP-nilai. Apa yang Anda simpulkan?
C.Dengan menggunakan model regresi kuadrat pada bagian (a), perkirakan harga yang diharapkanE(HARGA|SQFT) =1+
2SQFT2untuk rumah seluas 2000 kaki persegi. Buatlah perkiraan interval 95% dari harga yang diharapkan. Jelaskan
perkiraan interval Anda kepada khalayak umum.
D.Cari rumah di sampel dengan 2000 kaki persegi ruang tamu. Hitung rata-rata sampel (rata-rata) dari
harga jual mereka. Apakah rata-rata sampel harga jual rumah denganSQFT=20 sesuai dengan hasil
pada bagian (c)? Menjelaskan.
3.24Kami memperkenalkan model Profesor Ray C. Fair untuk menjelaskan dan memprediksi pemilihan presiden AS
di Latihan 2.23. Data Fair, 26 pengamatan untuk tahun pemilihan 1916 hingga 2016, ada di file data adil5.
Variabel terikat adalahPILIH=persentase bagian dari suara populer yang dimenangkan oleh partai Demokrat.
MendefinisikanPERTUMBUHAN=INCUMB×tingkat pertumbuhan, di mana tingkat pertumbuhan adalah tingkat
perubahan tahunan dalam PDB per kapita riil dalam tiga kuartal pertama tahun pemilu. Jika Demokrat adalah
partai petahana, makaINCUMB=1; jika Partai Republik adalah partai petahana makaINCUMB=1.
Sebuah.Perkirakan regresi linier,PILIH=1+2PERTUMBUHAN+e, menggunakan data dari tahun 1916 hingga 2016.
Buatlah estimasi interval 95% dari pengaruh pertumbuhan ekonomi terhadap ekspektasiPILIH.Bagaimana Anda
menggambarkan temuan Anda kepada khalayak umum?
B.Yang diharapkanPILIHmendukung kandidat Demokrat adalahE(PILIH|PERTUMBUHAN) =1+2PERTUMBUHAN.
MemperkirakanE(PILIH|PERTUMBUHAN=4) dan membuat estimasi interval 95% dan estimasi interval 99%.
Asumsikan petahana Demokrat adalah kandidat untuk masa jabatan presiden kedua. Apakah mencapai
tingkat pertumbuhan 4% cukup untuk memastikan kemenangan? Menjelaskan.
C.Ujilah hipotesis bahwa ketikaINCUMB=1 pertumbuhan ekonomi memiliki efek nol atau negatif pada ekspektasiPILIH
terhadap alternatif bahwa pertumbuhan ekonomi memiliki efek positif yang diharapkan PILIH. Gunakan tingkat
signifikansi 1%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan pengujianP-nilai. Apa
yang Anda simpulkan?
D.MendefinisikanINFLAT=INCUMB×tingkat inflasi, di mana tingkat inflasi adalah pertumbuhan harga selama
15 kuartal pertama pemerintahan. Menggunakan data dari tahun 1916 hingga 2016, dan modelPILIH= α.1+
2 INFLAT+e, ujilah hipotesis bahwa inflasi tidak berpengaruh terhadap alternatif yang memang
berpengaruh. Gunakan tingkat signifikansi 1%. Nyatakan statistik uji yang digunakan, daerah penolakan,
dan ujiP-nilai dan nyatakan kesimpulan Anda.
3.25Menggunakan data di "Sekolah Ashcan", kami memiliki kesempatan untuk mempelajari pasar seni. Faktor apa saja yang
menentukan nilai sebuah karya seni? Gunakan data dalam fileashcan_small. [Catatan: fileashcan mengandung lebih
banyak variabel.]
3.26Seberapa besar pengalaman mempengaruhi tingkat upah? file datanyacps5_kecilberisi 1200 pengamatan pada
tingkat upah per jam, pengalaman, dan variabel lain dari Survei Penduduk Saat Ini (CPS) Maret 2013. [Catatan:
File datacps5berisi lebih banyak pengamatan dan variabel.]
Sebuah.Perkirakan regresi linierGAJI=1+2AHLI+edan mendiskusikan hasilnya.
B.Uji signifikansi statistik dari hubungan yang diperkirakan pada tingkat 5%. Gunakan uji satu sisi. Apa
hipotesis alternatif Anda? Apa yang Anda simpulkan?
142BAB 3 Estimasi Interval dan Pengujian Hipotesis
3.27Apakah hubungan antara pengalaman dan upah konstan sepanjang hidup seseorang? Kami akan menyelidiki
pertanyaan ini menggunakan model kuadrat. file datanyacps5_kecilberisi 1200 pengamatan pada tingkat upah
per jam, pengalaman, dan variabel lain dari Survei Penduduk Saat Ini (CPS) Maret 2013. [Catatan: file datacps5
berisi lebih banyak pengamatan dan variabel.]
Sebuah.Buat variabelnyaAHLI30 =AHLI-30. Jelaskan variabel ini. Kapan positif, negatif atau
nol?
B.Perkirakan dengan kuadrat terkecil model kuadratGAJI=1+2(AHLI30)2+e. Ujilah hipotesis nol
bahwa2= 0 terhadap alternatif2≠.0 pada tingkat signifikansi 1%. Apakah ada hubungan
kuadrat yang signifikan secara statistik antara ekspektasiGAJIdanAHLI30?
⋀.
3.29Kami memperkenalkan Project STAR (Rasio Prestasi Siswa/Guru) Tennessee di Latihan 2.22. File datanya adalah
bintang5_kecil.[file datanyabintang5berisi lebih banyak observasi dan lebih banyak variabel.] Tiga jenis kelas
dipertimbangkan: kelas kecil [KECIL=1], kelas berukuran biasa dengan asisten guru [PEMBANTU=1], dan kelas
berukuran reguler [REGULER=1].
Sebuah.Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,SKOR MATEMATIKA, di kelas
kecil. Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,SKOR MATEMATIKA, di kelas
reguler, tanpa bantuan guru. Jenis kelas mana yang memiliki skor rata-rata lebih tinggi? Apa perbedaan
skor rata-rata sampel untuk kelas kecil versus kelas biasa? Jenis kelas mana yang memiliki standar deviasi
skor yang lebih tinggi?
3.7 Latihan143
B.Pertimbangkan siswa hanya di kelas kecil atau kelas biasa tanpa asisten guru. Perkirakan model
regresiSKOR MATEMATIKA=1+2KECIL+e. Bagaimana perkiraan parameter regresi berhubungan
dengan skor rata-rata sampel yang dihitung di bagian (a)?
C.Dengan menggunakan model dari bagian (b), buatlah estimasi interval 95% dari yang diharapkanSKOR MATEMATIKA
untuk siswa di kelas berukuran biasa dan siswa di kelas kecil. Apakah intervalnya cukup sempit atau tidak? Apakah
intervalnya tumpang tindih?
D.Uji hipotesis nol bahwa nilai matematika yang diharapkan tidak berbeda dalam dua jenis kelas versus
alternatif yang diharapkanSKOR MATEMATIKAlebih tinggi untuk siswa di kelas kecil menggunakan tingkat
signifikansi 5%. Nyatakan hipotesis ini dalam hal parameter model, nyatakan dengan jelas statistik uji yang
Anda gunakan, dan wilayah penolakan uji. HitungP-nilai untuk tes. Apa kesimpulan Anda?
e.Uji hipotesis nol yang diharapkanSKOR MATEMATIKAadalah 15 poin lebih tinggi untuk siswa di kelas kecil
dibandingkan alternatif yang tidak 15 poin lebih tinggi menggunakan tingkat signifikansi 10%. Nyatakan
hipotesis ini dalam hal parameter model, nyatakan dengan jelas statistik uji yang Anda gunakan, dan
wilayah penolakan uji. HitungP-nilai untuk tes. Apa kesimpulan Anda?
3.30Kami memperkenalkan Project STAR (Rasio Prestasi Siswa/Guru) Tennessee di Latihan 2.22. File datanya adalah
bintang5_kecil.[file datanyabintang5berisi lebih banyak observasi dan lebih banyak variabel.] Tiga jenis kelas
dipertimbangkan: kelas kecil [KECIL=1], kelas berukuran biasa dengan asisten guru [PEMBANTU=1], dan kelas
berukuran reguler [REGULER=1].
Sebuah.Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,SKOR MATEMATIKA, di kelas
reguler tanpa bantuan guru. Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,
SKOR MATEMATIKA, di kelas reguler dengan asisten guru. Jenis kelas mana yang memiliki skor rata-rata
lebih tinggi? Apa perbedaan dalam skor rata-rata sampel untuk kelas berukuran reguler versus kelas
berukuran reguler dengan asisten guru? Jenis kelas mana yang memiliki standar deviasi skor yang lebih
tinggi?
B.Pertimbangkan siswa hanya di kelas berukuran biasa tanpa asisten guru dan kelas berukuran biasa
dengan asisten guru. Perkirakan model regresiSKOR MATEMATIKA=1+2PEMBANTU+e. Bagaimana
perkiraan parameter regresi berhubungan dengan skor rata-rata sampel yang dihitung di bagian
(a)?
C.Dengan menggunakan model dari bagian (b), buatlah estimasi interval 95% dari yang diharapkanSKOR MATEMATIKA
untuk siswa di kelas berukuran biasa tanpa asisten guru dan kelas berukuran biasa dengan asisten guru. Apakah
intervalnya cukup sempit atau tidak? Apakah intervalnya tumpang tindih?
D.Uji hipotesis nol yang diharapkanSKOR MATEMATIKAtidak berbeda dalam dua jenis kelas versus
alternatif yang diharapkanSKOR MATEMATIKAlebih tinggi untuk siswa di kelas reguler dengan
asisten guru, menggunakan tingkat signifikansi 5%. Nyatakan hipotesis ini dalam hal parameter
model, nyatakan dengan jelas statistik uji yang Anda gunakan, dan wilayah penolakan uji. HitungP-
nilai untuk tes. Apa kesimpulan Anda?
e.Uji hipotesis nol yang diharapkanSKOR MATEMATIKAadalah tiga poin, atau lebih, lebih tinggi untuk siswa di
kelas reguler dengan asisten guru versus alternatif yang perbedaannya kurang dari tiga poin,
menggunakan tingkat signifikansi 10%. Nyatakan hipotesis ini dalam hal parameter model, nyatakan
dengan jelas statistik uji yang Anda gunakan dan wilayah penolakan uji. HitungP-nilai untuk tes. Apa
kesimpulan Anda?
3.31Data penjualan mingguan merek utama tuna kalengan oleh jaringan supermarket di kota besar AS bagian barat
tengah selama tahun kalender pertengahan 1990-an terdapat dalam file datatuna. Ada 52 observasi untuk
masing-masing variabel. variabelSAL1 = unit penjualan merek no. 1 tuna kalengan, dan April1 = harga per
kaleng merk no. 1 tuna (dalam dolar).
Sebuah.Hitung statistik ringkasan untukSAL1 danApril1. Apa arti sampel, nilai minimum dan
maksimum, dan standar deviasinya. Plot masing-masing variabel ini versusPEKAN. Berapa banyak
variasi dalam penjualan dan harga dari minggu ke minggu?
B.Gambarkan variabelnyaSAL1 (y-sumbu) melawanApril1 (x-sumbu). Apakah ada hubungan positif atau terbalik? Apakah itu yang
Anda harapkan, atau tidak? Mengapa?
C.Buat variabelnyaHARGA1 = 100April1. Perkirakan regresi linierSAL1 =1+ β.2HARGA1 +e. Berapa
perkiraan poin untuk pengaruh kenaikan satu sen pada harga merek no. 1 pada penjualan
merek no. 1? Berapakah perkiraan interval 95% untuk pengaruh kenaikan satu sen pada
harga merek no. 1 pada penjualan merek no. 1?
D.Buatlah perkiraan interval 90% untuk perkiraan jumlah kaleng yang terjual dalam seminggu jika harga per kaleng
adalah 70 sen.
144BAB 3 Estimasi Interval dan Pengujian Hipotesis
e.Buatlah estimasi interval 95% dari elastisitas penjualan merek no. 1 sehubungan dengan harga merek no. 1 “dengan
cara.” Perlakukan sampel berarti sebagai konstanta dan bukan variabel acak. Apakah menurut Anda penjualan
cukup elastis, atau cukup tidak elastis, sehubungan dengan harga? Apakah ini masuk akal secara ekonomi?
Mengapa?
F.Uji hipotesis bahwa elastisitas penjualan merek no. 1 sehubungan dengan harga merek no. 1
dari bagian (e) minus tiga terhadap alternatif yang elastisitasnya tidak minus tiga. Gunakan
tingkat signifikansi 10%. Jelas, nyatakan hipotesis nol dan hipotesis alternatif dalam
parameter model, berikan daerah penolakan, danP-nilai untuk tes. Apa kesimpulan Anda?
3.32Apa hubungan antara kejahatan dan hukuman? Kami menggunakan data dari 90 negara bagian Carolina Utara untuk
memeriksa pertanyaan tersebut. Tingkat kejahatan kabupaten dan karakteristik lainnya diamati selama periode 1981–
1987. Data ada di filekejahatan. Gunakan data 1985 untuk latihan ini.
Lampiran 3A
Turunan dariT-Distribusi
Estimasi interval dan prosedur pengujian hipotesis dalam bab ini melibatkanT-distribusi. Di sini kami
mengembangkan hasil utama.
Hasil pertama yang dibutuhkan adalah distribusi normal dari penduga kuadrat terkecil.
Perhatikan, misalnya, distribusi normal dariB2penaksir kuadrat terkecil dari2, yang kita nyatakan
sebagai ( )
σ2
B2|x~n β.2,( )2
xsaya-x
Sebuah variabel acak normal standar diperoleh dariB2dengan mengurangkan meannya dan membaginya dengan
simpangan bakunya:
B2- β.2
Z=√. ( ) ~n(0,1) (3A.1)
varB2|x
Yaitu, variabel acak standarZterdistribusi normal dengan mean 0 dan varians 1. Terlepas dari
kenyataan bahwa distribusi penduga kuadrat terkecilB2tergantung padax, standardisasi
meninggalkan kita dengan statistik penting yang distribusinya tidak bergantung pada parameter
yang tidak diketahui ataux.
Bagian kedua dari teka-teki melibatkan variabel acak chi-kuadrat. Jika keledai (umpti) pada SR6 berlaku,
maka istilah kesalahan acakesayamemiliki distribusi normal bersyarat,esaya| .~n0,σ2. Standarisasi variabel
acak dengan membaginya dengan simpangan bakunya sehinggaesaya/ Σ ~.n(0,1). Itu
kuadrat dari variabel acak normal standar adalah variabel acak chi-kuadrat (lihat Lampiran B.5.2)
()
dengan satu derajat kebebasan, jadiesaya/ Σ2~ Χ. 2 . Jika semua kesalahan acak independen, maka
(1)
Karena kesalahan acak yang sebenarnya tidak dapat diamati, kami menggantinya dengan rekan sampelnya, residual kuadrat
terkecilê.saya=kamusaya-B1-B2xsaya, untuk memperoleh
Σ
ê.saya
2 = (n-2)2
V= (3A.3)
σ2 σ2
Variabel acakVdalam (3A.3) tidak memiliki2 (n)
distribusi karena kuadrat terkecil berada
biasanya adalahbukanvariabel acak independen. Semuanresiduê.saya=kamusaya-B1-B2xsayabergantung
pada penduga kuadrat terkecilB1danB2. Hanya dapat ditunjukkan bahwan-2 dari sisa kuadrat terkecil
adalah independen dalam model regresi linier sederhana. Akibatnya, variabel acak dalam (3A.3)
memiliki distribusi chi-kuadrat dengann-2 derajat kebebasan. Artinya, bila dikalikan dengan konstanta
(n-2)/ Σ2, variabel acak2mempunyai sebuahdistribusi chi-kuadrat dengan N-2derajat kebebasan,
(n-2)2
V= ~ Χ.2(n2) (3A.4)
σ2
Variabel acakVmemiliki distribusi yang hanya bergantung pada derajat kebebasan,n-2. SukaZ
dalam (3A.1),Vadalah statistik penting. Kita punyabukanmenetapkan fakta bahwa variabel acak
chi-kuadratVsecara statistik tidak bergantung pada penduga kuadrat terkecilB1danB2, tapi itu.
Buktinya berada di luar cakupan buku ini. Akibatnya,Vdan variabel acak normal standarZdi
(3A.1) adalah independen.
Dari dua variabel acakVdanZ, kita dapat membentukT-variabel acak. SEBUAHT-variabel acak
dibentuk dengan membagi variabel acak normal standar,Z~n(0,1), dengan akar kuadrat dari an
Mandirivariabel acak chi-kuadrat,V~ Χ.2, yang telah dibagi
(M)
dengan derajat kebebasannya,M. Itu
adalah,
Z
T=√. ~T(M) (3A.5)
VDanM
ItuT-bentuk distribusi sepenuhnya ditentukan oleh parameter derajat kebebasan,M, dan distribusinya
dilambangkan denganT(M). Lihat Lampiran B.5.3. MenggunakanZdanVdari (3A.1) dan (3A.4), masing-masing,
kami memiliki
( ) /√ /∑( )2
B2 - β.2 σ2 xsaya-x
Z
T=√. = √.
V(n-2) (n-2)2/ Σ2
n-2
B2- β.2 B - β.2 B - β.
= √. = √.2 = 2 ( )2~T(n (3A.6)
√. ( ) seB2
2)
√. σ2
⋀.
√. varB2
Σ( )
xsaya- x2
Baris kedua adalah hasil kunci yang kita nyatakan di (3.2), dengan generalisasinya di (3.3).
Lampiran 3B
Distribusi dariT-Statistik di bawahH1
Untuk lebih memahami caranyaT-tes bekerja, mari kita periksaT-statistik di (3.7) ketika hipotesis nol tidak benar. Kita
dapat melakukannya dengan menuliskannya dalam beberapa detail tambahan. Apa yang terjadi padaZ di (3A.1) jika
kita menguji hipotesisH0:Β.2=Citu mungkin tidak benar? Alih-alih mengurangi2, kita kurangiC, untuk memperoleh
( ) /√ ( )
Statistik yang kita peroleh adalah standar normalZditambah faktor lain, =2-C varB2,
itu adalah nol hanya jika hipotesis nol benar. SEBUAHnonsentralT-variabel acakdibentuk dari
rasio
Z+
T|x=√. ~T(M,) (3B.1)
VDanM
√. )( )
(
β.2-C β2-C xsaya-x2β.2-C
=( ) = √. /∑( = (3B.2)
) σ
varB2 σ2 xsaya-x2
Untuk contoh numerik, kami menggunakan nilai yang muncul dari eksperimen simulasi yang
digunakan dalam Lampiran 2H. sampel darix-nilai terdiri darixsaya=10,saya=1,…,20 danxsaya=20,
( )
saya=21,…,40. Rata-rata sampel adalahx=15 sehingga xsaya-x2= 40×52= 1000. Juga,
σ2= 2500. Parameter noncentrality adalah
√. )
()( ( )
xsaya-x2 β.2-C 10002-C ( )
= = √. =0.632462-C
σ 2500
Jadi, peluang untuk menolak hipotesis nolH0:Β.2= 9 lawanH1:Β.2>9 ketika benar
nilai dari2= 10 adalah
( ) ( )
P T(38,0.63246)>1,686 = 1P t(38,0.63246)≤.1,686 = 0,15301
Perhitungan probabilitas menggunakan fungsi distribusi kumulatif untuk non-pusat T-distribusi,
yang tersedia dalam perangkat lunak ekonometrik dan di beberapa situs web. Demikian pula,
probabilitas menolak hipotesis nolH0:Β.2= 8 lawanH1:Β.2>8 jika nilai sebenarnya dari
β.2= 10 adalah
( ) ( )
P t(38,1.26491)>1,686 = 1P t(38,1.26491)≤.1,686 = 0,34367
Mengapa kemungkinan penolakan meningkat? Efek dari parameter noncentrality adalah untuk
menggeserT-distribusi ke kanan, seperti yang ditunjukkan pada Lampiran B.7.3. Misalnya, probabilitas
menolak hipotesis nolH0:Β.2= 9 lawanH1:Β.2>9 ditunjukkan pada Gambar 3B.1.
Kurva padat adalah pusat biasaT-distribusi dengan 38 derajat kebebasan. Luas daerah di bawah
kurva di sebelah kanan 1,686 adalah 0,05. Kurva putus-putus adalah non-pusatT-distribusi dengan =
0.63246. Area di bawah kurva di sebelah kanan 1,686 lebih besar, sekitar 0,153.
Probabilitas menolak hipotesis nol palsu disebut teskekuatan. Di dunia yang ideal, kami akan selalu
menolak hipotesis nol palsu, dan jika kami memiliki jumlah data yang tak terbatas, kami bisa melakukannya.
Kunci untuk aT-kekuatan tes adalah tiga bahan yang membuat parameter noncentrality lebih besar.
Lampiran 3C Simulasi Monte Carlo147
Non-pusatT-distribusi
0.4
0,3
F(T)
0.2
0.1
0
1.686
–4 –2 0 2 4 6
T
T(38, = 0) T(38, = 0,63246)
Parameter noncentrality yang lebih besar menggeserT-distribusi lebih jauh ke kanan dan meningkatkan
kemungkinan penolakan. Dengan demikian, probabilitas menolak hipotesis nol palsu meningkat ketika
3.Semakin besar variasi total dalam variabel penjelas, yang mungkin merupakan hasil dari ukuran sampel yang
lebih besar.
Dalam situasi nyata, kekuatan sebenarnya dari sebuah tes tidak diketahui karena kita tidak tahu2atau2, dan
perhitungan daya tergantung pada pemberianx-nilai-nilai. Namun demikian, ada baiknya untuk mengetahui faktor-
faktor yang akan meningkatkan kemungkinan penolakan hipotesis nol palsu. Pada bagian berikut, kami melakukan
percobaan simulasi Monte Carlo untuk menggambarkan perhitungan daya di atas.
Ingatlah bahwa kesalahan Tipe II gagal menolak hipotesis yang salah. Akibatnya,
kemungkinan kesalahan Tipe II adalah pelengkap dari kekuatan tes. Misalnya, kemungkinan
kesalahan Tipe II saat pengujianH0:Β.2= 9 lawanH1:Β.2>9 ketika nilai sebenarnya dari2= 10 adalah
( )
P t(38,0.63246)≤.1,686 = 1 0,15301 = 0,84699
Untuk pengujianH0:Β.2(=8 lawanH1:Β.2>)8, ketika nilai sebenarnya adalah2= 10, probabilitas kesalahan
Tipe II adalahP t(38, 1.26491)≤.1.686 = 1 – 0.34367 = 0.65633. Saat daya uji meningkat, kemungkinan
kesalahan Tipe II turun, dan sebaliknya.
Lampiran 3C
Simulasi Monte Carlo
Dalam Lampiran 2H, kami memperkenalkan simulasi Monte Carlo untuk menggambarkan sifat pengambilan sampel
berulang dari penduga kuadrat terkecil. Dalam lampiran ini, kami menggunakan kerangka kerja yang sama untuk
menggambarkan kinerja pengambilan sampel berulang dari penduga interval dan uji hipotesis.
Ingat bahwaproses pembuatan datauntuk model regresi linier sederhana diberikan oleh
()
kamusaya=E ysaya|xsaya+esaya=1+2xsaya+esaya,saya=1,…,n
148BAB 3 Estimasi Interval dan Pengujian Hipotesis
Nilai parameter Monte Carlo adalah1= 100 dan2= 10. Nilaixsayaadalah 10 untuk 20 pengamatan
pertama dan 20 untuk 20 pengamatan lainnya, sehingga fungsi regresinya adalah
( )
E ysaya|xsaya=10 = 100 + 10xsaya=100 + 10×10 = 200, saya=1,…,20
( )
E ysaya|xsaya=20 = 100 + 10xsaya=100 + 10×20 = 300, saya=21,…,40
Kesalahan (rand)om secara independen dan terdistribusi normal dengan mean 0 dan variance varesaya
|xsaya=2= 2.500, atauesaya|x~n(0,2500).
Saat mempelajari kinerja uji hipotesis dan penduga interval, perlu untuk menggunakan sampel
Monte Carlo yang cukup sehingga persentase yang terlibat diestimasi cukup tepat agar berguna.
Untuk pengujian dengan probabilitas kesalahan Tipe I = 0.05, kita harus mengamati hipotesis nol
yang benar ditolak 5% dari waktu. Untuk 95% penduga interval, kita harus mengamati bahwa 95%
dari estimasi interval berisi nilai parameter sebenarnya. Kita gunakanM=10.000 sampel Monte Carlo
sehingga kesalahan eksperimen sangat kecil. Lihat Lampiran 3C.3 untuk penjelasannya.
ŷ.=127.2055 + 8.7325x
(23,3262) (1,4753)
()
Perkiraan interval 95% dari kemiringan adalahB2±T(0,975, 38)seB2= [5.7460,11.7191]. Kami melihat itu untuk
sampel ini, estimasi interval 95% berisi nilai parameter kemiringan sebenarnya2= 10.
Kami mengulangi proses estimasi dan estimasi interval 10.000 kali. Dalam sampel berulang ini,
95,03% dari perkiraan interval berisi parameter sebenarnya. Tabel 3C.1 berisi hasil untuk sampel
Monte Carlo 321–330 untuk tujuan ilustrasi. Perkiraannya adalahB2, kesalahan standarnya adalahSE,
batas bawah estimasi interval 95% adalahLB, dan batas atas adalahUB. variabelMENUTUPI=1 jika
estimasi interval berisi nilai parameter sebenarnya. Dua dari interval tidak mengandung nilai
parameter sebenarnya2= 10. 10 sampel hasil yang kami laporkan dipilih untuk menggambarkan
bahwa perkiraan interval tidak mencakup parameter sebenarnya dalam semua kasus.
Pelajarannya adalah, bahwa dalam banyak sampel dari proses pembuatan data, dan jika asumsi
SR1-SR6 berlaku, prosedur untuk membangun estimasi interval 95% "berfungsi" 95% dari waktu.
Demikian pula untuk pengujian dengan probabilitas penolakan = 0.05, ini√.e 95% estimasi interval dari
proporsi sampel Monte Carlo yang mengarah ke penolakan adalah±1,96 (1 )DanM. JikaM=10,000,
interval ini adalah [0,0457, 0,0543]. Bahwa percobaan Monte Carlo kami menolak hipotesis nol 4,98%
dari waktu berada dalam margin kesalahan ini. Jika kita telah memilihM=1000, maka proporsi
penolakan Monte Carlo diperkirakan berada dalam interval [0.0365, 0,0635], yang lagi-lagi
menyisakan sedikit ruang gerak untuk kenyamanan.
Intinya adalah bahwa jika sampel Monte Carlo lebih sedikit dipilih, "noise" dalam eksperimen Monte Carlo dapat
menyebabkan persentase keberhasilan atau penolakan yang memiliki margin kesalahan yang terlalu lebar untuk
............................................................................................................................................
3Kami menggunakanT-nilai kritis dengan lebih banyak desimal, bukan nilai tabel 1,686, untuk memastikan akurasi dalam eksperimen Monte
Carlo.
150BAB 3 Estimasi Interval dan Pengujian Hipotesis
kita untuk mengetahui apakah prosedur statistik, estimasi interval, atau pengujian hipotesis “bekerja” dengan benar
atau tidak.4
ŷ.=116,7410 + 9,7628x
(84,7107) (5,5248)
()
Perkiraan interval 95% dari kemiringan adalahB2±T(0,975, 38)seB2= [−1.4216,20.9472]. Untuk ini sama-
ple, estimasi interval 95% berisi nilai parameter kemiringan sebenarnya2= 10.
Kami menghasilkan 10.000 sampel Monte Carlo menggunakan desain ini dan menghitung
perkiraan kuadrat terkecil dan perkiraan interval 95%. Dalam sampel ini, denganxbervariasi dari
sampel ke sampel, estimasi interval 95% untuk2mengandung nilai sebenarnya dalam 94,87% dari
sampel. Tabel 3C.2 berisi hasil untuk sampel Monte Carlo 321–330 untuk tujuan ilustrasi. Perkiraannya
adalahB2, kesalahan standarSE, batas bawah estimasi interval 95% adalahLB, dan batas atas adalah
UB. variabelMENUTUPI=1 jika interval berisi nilai parameter sebenarnya. Dalam sampel yang dipilih,
satu estimasi interval, 323, tidak mengandung nilai parameter sebenarnya.
Dalam eksperimen Monte Carlo, kami menguji(t nul)l hy(poth)esisH0:Β.2= 10 melawan alternatifH
1:Β.2>10 menggunakanT-statistikT=B210DanseB2. Kami menolak hipotesis nol jika T≥.1.685954, yang
merupakan persentil ke-95 dariT(38)distribusi. Pada Tabel 3C.2,T-nilai statistik adalahTSTATdan
MENOLAK=1 jika tes menolak hipotesis nol. Dalam 5,36% dari 10.000 sampel Monte Carlo, kami
menolak hipotesis nol, yang berada dalam batas kesalahan yang dibahas dalam Bagian 3C.2. Pada
Tabel 3C.2, untuk sampel 323, hipotesis nol yang benar ditolak.
............................................................................................................................................
4Rincianlain tentang simulasi Monte Carlo dapat ditemukan diMikroekonometrika: Metode dan Aplikasi, oleh A.
Colin Cameron dan Pravin K. Trivedi (Cambridge University Press, 2005). Materinya canggih.
Lampiran 3C Simulasi Monte Carlo151
Kami menyimpulkan dari simulasi ini bahwa secara acak-xkasus tidak ada bukti bahwa inferensi tidak
berfungsi seperti yang diharapkan, dengan 95% interval mencakup nilai parameter sebenarnya dan 5%
pengujian menolak hipotesis nol yang benar.
Untuk menyelidiki kekuatanT-uji, probabilitas bahwa ia menolak hipotesis yang salah, kami
mengujiH0:Β.2= 9 lawanH1:Β.2>9 danH0:Β.2= 8 lawanH1:Β.2>8. Dalam 10.000 sampel Monte Carlo,
hipotesis pertama ditolak dalam 7,8% waktu dan hipotesis kedua ditolak 11,15%. Tingkat
penolakan ini jauh lebih sedikit daripada di fixed-xhasil yang dipelajari dalam Lampiran 3B dan
kurang dari tingkat penolakan empiris dalam hasil simulasi dalam Lampiran 3C.2. Kami
mencatat bahwa kemampuanT-tes untuk menolak√. ta hipotesis palsu terkait dengan
( )( )
besarnya parameter noncentrality dalam (3A.8), = xsaya-x2β.2-C.Dalam ini
( )
percobaan, faktor2-C =1 dan 2 dan = 50 adalah sama seperti padaxcontoh.
()
Apa yang harus berubah? Satu-satunya faktor yang tersisa adalah variasi dalamx-nilai, xsaya-x2.
()
Pada contoh sebelumnya, xsaya-x2= 1000 danx-nilai ditetapkan dalam sampel berulang. Di dalam
percobaan,x-nilai tidak tetap tetapi acak, dan untuk setiap sampelx-nilai, jumlah perubahan
variasi. Kami menentukan varians darixmenjadi 2,56, dan dalam 10.000 Monte Carlo
percobaan, rata-rata varians sampelS2 x=2.544254 dan rata-rata variasinya
()
di dalamxtentang artinya, xsaya-x2, adalah 99.22591, atau sekitar sepersepuluh variasi tetap-x
kasus. Sangat jelas mengapa kekuatan tes secara acak-xkasusnya lebih rendah, itu karena
()
rata-rata xsaya-x2lebih kecil.
BAB4
Ramalan,
Kesesuaian,
dan Masalah Pemodelan
TUJUAN PEMBELAJARAN
1.Jelaskan cara menggunakan model regresi linier 8.Menghargai berbagai fungsi nonlinier yang dapat
sederhana untuk memprediksi nilaikamuuntuk nilai diestimasi menggunakan model yang linier
tertentu darix. dalam parameter.
2.Jelaskan, secara intuitif dan teknis, mengapa prediksi 9.Tuliskan persamaan untuk bentuk fungsional
untukxnilai lebih jauh darixkurang dapat diandalkan. log-log, log-linear, dan linear-log.
4.Sebut dan jelaskan pengertian 11.Jelaskan bagaimana Anda akan memilih bentuk
koefisien determinasi. fungsional dan memutuskan bahwa bentuk
fungsional memadai.
5.Jelaskan hubungan antara analisis korelasi
danR2. 12.Jelaskan cara menguji apakah persamaan
''kesalahan'' terdistribusi normal.
6.Laporkan hasil persamaan regresi yang dipasang
sedemikian rupa sehingga interval kepercayaan dan uji 13.Jelaskan bagaimana menghitung prediksi,
hipotesis untuk koefisien yang tidak diketahui dapat interval prediksi, dan ukuran kecocokan
dibangun dengan cepat dan mudah. dalam model log-linear.
7.Jelaskan bagaimana koefisien yang diperkirakan dan 14.Jelaskan metode alternatif untuk mendeteksi nilai
besaran lain dari persamaan regresi akan berubah data yang tidak biasa, ekstrim, atau salah.
ketika variabel diskalakan. Mengapa Anda ingin
menskalakan variabel?
152