Anda di halaman 1dari 41

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

BAB3

Estimasi Interval
dan Pengujian Hipotesis

TUJUAN PEMBELAJARAN

Berdasarkan materi dalam bab ini, Anda seharusnya dapat

1.Diskusikan bagaimana '' teori sampling '' berhubungan distribusi probabilitas yang diketahui jika
dengan estimasi interval dan pengujian hipotesis. hipotesis nol benar.

2.Jelaskan mengapa penting untuk inferensi 7.Jelaskan istilahP-nilai dan cara menggunakan a P
statistik yang diberikan!xpenaksir kuadrat -nilai untuk menentukan hasil uji hipotesis;
terkecilB1danB2adalah variabel acak memberikan sketsa yang menunjukkan P-nilai.
terdistribusi normal.

3.Jelaskan ''tingkat kepercayaan'' dari penduga interval, 8.Jelaskan perbedaan antara uji satu-ekor dan dua-ekor.
dan apa artinya dalam konteks pengambilan Jelaskan, secara intuitif, bagaimana memilih wilayah
sampel, dan berikan sebuah contoh. penolakan untuk uji satu arah.

4.Jelaskan perbedaan antara penduga interval dan 9.Jelaskan kesalahan Tipe I dan ilustrasikan dalam
penduga interval. Jelaskan bagaimana sketsa. Tentukan tingkat signifikansi suatu tes.
menafsirkan perkiraan interval.
10.Jelaskan perbedaan antara signifikansi
5.Jelaskan istilah hipotesis nol, hipotesis ekonomi dan statistik.
alternatif, dan daerah penolakan, berikan
11.Jelaskan bagaimana memilih apa yang masuk dalam
contoh dan sketsa daerah penolakan.
hipotesis nol dan apa yang masuk dalam hipotesis
6.Menjelaskan logika suatu uji statistik, termasuk alternatif.
mengapa statistik uji harus memiliki

KATA KUNCI
hipotesis alternatif tingkat signifikansi P-nilai
interval kepercayaan kombinasi linier parameter daerah penolakan
nilai kritis hipotesis linier uji signifikansi
derajat kebebasan hipotesis nol statistik uji
hipotesis tes satu sisi
tes dua sisi
pengujian hipotesis statistik penting
Kesalahan tipe I
kesimpulan perkiraan poin
Kesalahan tipe II
estimasi interval nilai probabilitas

112
3.1 Estimasi Interval113

Dalam Bab 2, kami menggunakan penduga kuadrat terkecil untuk mengembangkanperkiraan poin
untuk parameter dalam model regresi linier sederhana. Perkiraan ini mewakilikesimpulantentang
fungsi regresiE(kamu|x) =1+2xmenggambarkan hubungan antara variabel ekonomi.Menyimpulkan
berarti "menyimpulkan dengan penalaran dari sesuatu yang diketahui atau diasumsikan." Definisi
kamus ini juga menjelaskan inferensi statistik. Kami telah mengasumsikan hubungan antara variabel
ekonomi dan membuat berbagai asumsi (SR1-SR5) tentang model regresi. Berdasarkan asumsi-
asumsi ini, dan diberikan perkiraan empiris parameter regresi, kami ingin membuat kesimpulan
tentang populasi dari mana data diperoleh.
Dalam bab ini, kami memperkenalkan alat tambahan untuk inferensi statistik:estimasi intervaldan pengujian
hipotesis. Estimasi interval adalah prosedur untuk membuat rentang nilai, kadang-kadang disebutinterval
kepercayaan, di mana parameter yang tidak diketahui kemungkinan besar berada. Uji hipotesis adalah prosedur
untuk membandingkan dugaan yang mungkin kita miliki tentang parameter regresi dengan perkiraan parameter
yang telah kita peroleh dari sampel data. Uji hipotesis memungkinkan kita untuk mengatakan bahwa data tersebut
kompatibel, atau tidak kompatibel, dengan dugaan atau hipotesis tertentu.
Prosedur untuk pengujian hipotesis dan estimasi interval sangat bergantung pada asumsi SR6 dari
model regresi linier sederhana dan normalitas bersyarat yang dihasilkan dari penduga kuadrat terkecil. Jika
asumsi SR6 tidak berlaku, maka ukuran sampel harus cukup besar sehingga distribusi penduga kuadrat
terkecil adalahsekitarnormal. Dalam hal ini, prosedur yang kami kembangkan dalam bab ini dapat
digunakan tetapi juga merupakan perkiraan. Dalam mengembangkan prosedur dalam bab ini, kita akan
menggunakan "Student's"T-distribusi. Anda mungkin ingin menyegarkan ingatan Anda tentang distribusi ini
dengan meninjau Lampiran B.3.7. Selain itu, terkadang ada gunanya melihat konsep yang akan kita
diskusikan dalam suasana yang lebih sederhana. Dalam Lampiran C, kami memeriksa inferensi statistik,
estimasi interval, dan pengujian hipotesis dalam konteks memperkirakan rata-rata populasi normal. Anda
mungkin ingin meninjau materi ini sekarang atau membacanya bersama dengan bab ini saat kita
melanjutkan.

3.1 Estimasi Interval


Dalam Bab 2, dalam Contoh 2.4, kami memperkirakan bahwa pengeluaran makanan rumah tangga akan meningkat
sebesar $10,21 dengan adanya peningkatan $100 dalam pendapatan mingguan. perkiraanB2= 10,21 adalahtitik
estimasi parameter populasi yang tidak diketahui2dalam model regresi. Estimasi interval mengusulkan rentang nilai
di mana parameter sebenarnya2kemungkinan akan jatuh. Memberikan rentang nilai memberikan gambaran
tentang nilai parameter yang mungkin, dan ketepatan yang kita gunakan untuk memperkirakannya. Interval seperti
ini sering disebutinterval kepercayaan. Kami lebih suka memanggil merekaperkiraan intervalkarena istilah
"keyakinan" secara luas disalahpahami dan disalahgunakan. Seperti yang akan kita lihat, keyakinan kita terletak
pada prosedur yang kita gunakan untuk mendapatkan interval, bukan pada interval itu sendiri. Ini konsisten dengan
bagaimana kami menilai sifat-sifat penduga kuadrat terkecil di Bab 2.

3.1.1 ItuT-Distribusi
Mari kita asumsikan bahwa asumsi SR1-SR6 berlaku untuk model regresi linier sederhana. Dalam hal
ini, kita tahu bahwa diberikanxpenaksir kuadrat terkecilB1danB2memiliki distribusi normal, seperti
yang dibahas dalam Bagian 2.6. Misalnya, distribusi normal dariB2, penaksir kuadrat terkecil dari2,
adalah ( )
σ2
B2|x~n β.2,( )2
xsaya-x

Sebuah variabel acak normal standar diperoleh dariB2dengan mengurangkan meannya dan membaginya dengan
simpangan bakunya:
B2- β.2
Z=√. ~n(0,1) (3.1)
/∑( )
σ2 xsaya-x2
114BAB 3 Estimasi Interval dan Pengujian Hipotesis

Variabel acak standarZterdistribusi normal dengan mean 0 dan varians 1. Dengan menstandardisasi
distribusi normal bersyarat dariB2| ., kami menemukan statistikZyangn(0, 1) distribusi sampling tidak
bergantung pada parameter yang tidak diketahui atau padax! Statistik seperti itu disebutsangat
penting, dan ini berarti bahwa ketika membuat pernyataan probabilitas tentangZkita tidak perlu
khawatir tentang apakahxadalah tetap atau acak. Menggunakan tabel probabilitas normal (Tabel
Statistik 1) kita tahu bahwa
P(−1.96≤.Z≤.1,96) = 0,95
Mengganti (3.1) ke dalam ekspresi ini, kami memperoleh

⎛. ⎞.
⎜. B2 - β.2 ⎟.
P⎜-1.96≤.√. ≤.1.96 =0,95
/∑ ( )
⎜. σ2 xsaya-x
2 ⎟.
⎝. ⎠.
Mengatur ulang memberi kita
( √. √. )
/∑( ) /∑( )
P b21.96 σ2 xsaya-x2 ≤ β.2≤.B2+ 1,96 σ2 xsaya-x2 =0,95

terval yang memiliki pro)bability


Definisi ini (denda dalam√. 0.95 berisi parameter2. Kedua ujung-
/∑( )
poinB2±1.962 xsaya-x2memberikan penduga interval. Jika kita membangun interval ini

cara menggunakan semua kemungkinan sampel ukuranndari suatu populasi, maka 95% interval akan berisi
parameter sebenarnya2. Derivasi yang mudah dari penduga interval ini didasarkan pada kedua asumsi SR6
dankita mengetahui varians dari istilah kesalahan2.
Meskipun kita tidak mengetahui nilai2, kita bisa memperkirakannya. Residu kuadrat terkecil adalah
Σ
ê.saya=kamusaya-B1-B2xsaya, dan penduga kita dari2adalah2= ê.saya
2 (n-2). Mengganti2oleh2dalam (3.1) kre-
memakan variabel acak yang dapat kita kerjakan, tetapi substitusi ini mengubah distribusi probabilitas dari
normal standar menjadi aT-distribusi dengann-2derajat kebebasan,

B2- β.2 B- β. 2 B2- β.


T=√. = √. 2( = ( )2~T(n2) (3.2)
/∑( ) ⋀.) seB2
σ2 xsaya-x2 varB2
( )( )
RasioT= B2- β.2DanseB2 mempunyai sebuahT-distribusi dengann2 derajat kebebasan, yang kita
menunjukkan sebagaiT~T(n2). Dengan menstandardisasi distribusi normal bersyarat dariB2| .dan memasukkan
penaksir2, kami menemukan statistikTyangT(n2)distribusi sampling tidak bergantung pada parameter yang
tidak diketahui atau padax! Itu juga adalahstatistik penting, dan ketika membuat pernyataan probabilitas
dengan aT-statistik, kita tidak perlu khawatir tentang apakahxadalah tetap atau acak. Hasil serupa berlaku
untukB1, jadi secara umum kita dapat mengatakan, jika asumsi SR1–SR6 berlaku dalam model regresi linier
sederhana, maka

Bk- β.
T= ( )k~T(n2) untukk=1,2 (3.3)
seBk
Persamaan ini akan menjadi dasar untuk estimasi interval dan pengujian hipotesis dalam model regresi
linier sederhana. Argumen statistik tentang bagaimana kita beralih dari (3.1) ke (3.2) ada di Lampiran 3A.
Saat bekerja denganT-distribusi, ingat bahwa itu adalah kurva berbentuk lonceng yang berpusat
di nol. Sepertinya distribusi normal standar, kecuali lebih menyebar, dengan varians yang lebih besar
dan ekor yang lebih tebal. BentuknyaT-distribusi dikendalikan oleh parameter tunggal yang disebut
derajat kebebasan, sering disingkatdf.Kami menggunakan notasiT(M)untuk menentukan T-distribusi
denganMderajat kebebasan. Pada Tabel Statistik 2, terdapat nilai persentil dari T-distribusi untuk
berbagai derajat kebebasan. UntukMderajat kebebasan, persentil ke-95 dariT-distribusi[n
dilambangkanT(0].95,M). Nilai ini memiliki sifat bahwa 0,95 probabilitas jatuh ke kiri, jadiP t(M)≤.T(0,95,M)= 0
.95. Misalnya, jika derajat kebebasannya adalahM=20, kemudian, dari Tabel Statistik 2,T(0,95, 20)= 1.725.
Jika Anda mengalami masalah yang membutuhkan persentil
3.1 Estimasi Interval115

F(T)

T(M)

/2 /2
(1 – )

–TC 0 TC T

GAMBAR 3.1 Nilai kritis dari aT-distribusi.

yang tidak kami berikan, Anda dapat melakukan interpolasi untuk jawaban perkiraan atau menggunakan perangkat lunak komputer Anda untuk

mendapatkan nilai yang tepat.

3.1.2 Memperoleh Perkiraan Interval


Dari(om St)atistic(al Tabel) 2, kita dapat menemukan “nilai kritis”TCdariT-distribusi sedemikian
rupa sehingga P t≥.TC=P t≤ -TC=Dan2, di mana adalah probabilitas yang sering dianggap = 0.01
atau = 0.05. Nilai kritisTCuntuk derajat kebebasanMadalah nilai persentilT(1−α/2,M). NilaiTC
danTCdigambarkan pada Gambar 3.1.
Setiap area “ekor” yang diarsir mengandungDan2 dari probabilitas, sehingga 1 dari probabilitas adalah
terdapat di bagian tengah. Akibatnya, kita dapat membuat pernyataan probabilitas
( )
P-TC≤.T≤.TC=1 (3.4)

Untuk interval kepercayaan 95%, nilai kritis menentukan wilayah pusat dariT-distribusi yang
mengandung probabilitas 1 = 0.95. Ini meninggalkan probabilitas = 0.05 dibagi rata antara dua
ekor, sehinggaDan2 = 0.025. Maka nilai kritisnyaTC=T(1−0,025,M)=T(0,975,M). Secara sederhana
model regresi, derajat kebebasannya adalahM=n-2, jadi ekspresi (3.4) menjadi
[ ]
P-T(0,975,n2)≤.T≤.T(0,975,n2)= 0,95
Kami menemukan nilai persentilT(0,975,n2)pada Tabel Statistik 2.
Sekarang, mari kita lihat bagaimana kita dapat menggabungkan semua bit ini untuk membuat prosedur untuk interval
perkiraan. PenggantiTdari (3.3) ke (3.4) untuk mendapatkan
[ ]
Bk- β.
P-TC≤. ( )k≤.T C =1
seBk
Atur ulang ekspresi ini untuk mendapatkan
[ () ( )]
P Bk-TCseBk ≤ β.k≤.Bk+TCseBk =1 (3.5)
() ()
Titik akhir intervalBk-TCseBkdanBk+TCseBk acak karena bervariasi dari sam-
untuk sampel. Titik akhir ini defi(ne)anpenaksir intervaldarik. Pernyataan probabilitas dalam (3.5)
mengatakan bahwa intervalBk±TCseBk memiliki probabilitas 1 berisi yang benar tetapi tidak diketahui
parameterk. ( )
KapanBkdan s(eB)k di (3.5) adalah nilai perkiraan (angka), berdasarkan sampel yang diberikan dari
data, makaBk±TCseBk disebut 100(1 )%perkiraan intervaldarik. Setara, itu disebut
a 100(1 )%selang kepercayaan. Biasanya, = 0.01 atau = 0.05, sehingga diperoleh selang
kepercayaan 99% atau selang kepercayaan 95%.
Interpretasi interval kepercayaan membutuhkan banyak perhatian. Sifat-sifat prosedur estimasi
interval didasarkan pada pengertian sampling. Jika kami mengumpulkan semua mungkin
116BAB 3 Estimasi Interval dan Pengujian Hipotesis

sama
(tolong ukurannyandari suatu populasi, hitung perkiraan kuadrat terkecilBk(dan) kesalahan standarnya se
Bkuntuk setiap sampel, dan kemudian buat penduga intervalBk±TCseBkuntuk setiap sampel, maka 100(1 )%
dari semua interval yang dibangun akan berisi parameter sebenarnyak. Dalam Lampiran 3C, kami melakukan
simulasi Monte Carlo untuk mendemonstrasikan properti pengambilan sampel ini.
Setiapsatuestimasi interval, berdasarkan satu sampel data, mungkin atau mungkin tidak mengandung
parameter sebenarnyak, dan karenaktidak diketahui, kita tidak akan pernah tahu apakah itu terjadi atau
tidak. Ketika "interval kepercayaan" dibahas, ingatlah bahwa kepercayaan kita ada diprosedurdigunakan
untuk membangun perkiraan interval; inibukandalam satu estimasi interval yang dihitung dari sampel data.

CONTOH 3 . 1Estimasi Interval untuk Data Pengeluaran Makanan

Untuk data pengeluaran makanan,n=40 dan derajat Apa kegunaan penduga interval dari2? Saat melaporkan
kebebasannya adalahn-2 = 38. Untuk selang kepercayaan 95%, = hasil regresi, kami selalu memberikan perkiraan titik, sepertiB
0.05. Nilai kritisTC=T(1−α/2,n2)=T(0,975, 38)= 2.024 adalah 2= 10.21. Namun, perkiraan titik saja tidak memberikan arti

persentil 97,5 dariT-distribusi dengan 38 derajat keandalannya. Dengan demikian, kami mungkin juga
kebebasan. Untuk2, pernyataan probabilitas pada (3.5) menjadi melaporkan perkiraan interval. Estimasi interval
[ () ( )] menggabungkan estimasi titik dan kesalahan standar
P b22.024seB2≤ β.2≤.B2+ 2.024seB2 =0,95 estimasi, yang merupakan ukuran variabilitas kuadrat terkecil
(3.6) penaksir. Perkiraan interval termasuk penyisihan untuk
ukuran sampel juga karena untuk derajat kebebasan yang lebih rendah
Untuk membuat penduga interval untuk2, kita menggunakan taksiran
ituT-distribusi nilai kritisTClebih besar. Jika perkiraan interval lebar
kuadrat terkecilB2= 10.21 dan kesalahan standarnya
(menyiratkan kesalahan standar yang besar), ini menunjukkan
( ) () √. bahwa tidak banyak informasi dalam sampel tentang2. Jika
seB2 = varB2=
⋀.

4,38 = 2,09 perkiraan interval sempit, ini menunjukkan bahwa kita telah
belajar lebih banyak tentang2.
Substitusikan nilai-nilai ini ke dalam (3.6), kita peroleh “estimasi
Apa yang "lebar" dan apa yang "sempit" tergantung pada masalah
interval kepercayaan 95%” untuk2:
yang dihadapi. Misalnya, dalam model kami,B2= 10.21 adalah perkiraan
()
B2±TCseB2= 10.21±2.024(2.09) = [5.97,14.45] berapa banyak pengeluaran makanan rumah tangga mingguan akan
meningkat dengan peningkatan $100 pendapatan rumah tangga mingguan.
Artinya, kami memperkirakan "dengan keyakinan 95%" bahwa dari Seorang CEO jaringan supermarket dapat menggunakan perkiraan ini untuk
tambahan $100 pendapatan mingguan rumah tangga akan menghabiskan merencanakan kebutuhan kapasitas toko di masa depan, dengan
antara $5,97 dan $14,45 untuk makanan. mempertimbangkan perkiraan pertumbuhan pendapatan di suatu daerah.
Apakah2sebenarnya dalam interval [5.97, 14.45]? Kita tidak tahu, Namun, tidak ada keputusan yang akan didasarkan pada satu nomor ini saja.
dan kita tidak akan pernah tahu. Apa yang kitamelakukanKetahuilah CEO yang prudent akan melakukan analisis sensitivitas dengan
bahwa ketika prosedur yang kita gunakan diterapkan pada semua mempertimbangkan nilai2sekitar 10.21. Pertanyaannya adalah “Nilai yang
sampel data yang mungkin dari populasi yang sama, maka 95% dari mana?” Satu jawaban diberikan oleh estimasi interval [5.97, 14.45]. Meskipun
semua perkiraan interval yang dibangun menggunakan prosedur ini 2mungkin atau mungkin tidak dalam interval ini, CEO tahu bahwa prosedur
akan berisi parameter sebenarnya. Prosedur estimasi interval yang digunakan untuk mendapatkan perkiraan interval "berfungsi" 95% dari
"berfungsi" 95% dari waktu. Apa yang dapat kita katakan tentang waktu. Jika bervariasi2dalam interval tersebut memiliki konsekuensi drastis
perkiraan interval berdasarkan satu sampel kita adalah bahwa, pada penjualan dan keuntungan perusahaan, maka CEO dapat
mengingat keandalan prosedur, kita akan “terkejut” jika2tidak dalam menyimpulkan bahwa tidak ada cukup bukti untuk membuat keputusan dan
interval [5.97, 14.45]. memesan sampel data baru dan lebih besar.

3.1.3 Konteks Pengambilan Sampel


Pada Bagian 2.4.3, kami mengilustrasikan sifat pengambilan sampel dari penduga kuadrat terkecil menggunakan 10
sampel data. Setiap sampel ukurann=40 termasuk rumah tangga dengan pendapatan yang sama seperti pada Tabel
2.1 tetapi dengan pengeluaran makanan yang bervariasi. Data hipotetis ini ada di file data tabel2_2. Pada Tabel 3.1,
kami menyajikan perkiraan OLS, perkiraan2, dan kesalahan standar koefisien dari masing-masing sampel.
Perhatikan variasi pengambilan sampel yang diilustrasikan oleh perkiraan ini. Itu
3.1 Estimasi Interval117

TABEL E 3.1 Estimasi Kuadrat Terkecil dari 10 Sampel Acak Hipotetis


() ()
Sampel B1 seB1 B2 seB2 ?̂?2
1 93.64 31.73 8.24 1.53 4282.13
2 91.62 31.37 8.90 1.51 4184,79
3 126.76 48.08 6.59 2.32 9828.47
4 55.98 45.89 11.23 2.21 8953.17
5 87.26 42.57 9.14 2.05 7705.72
6 122.55 42.65 6.80 2.06 7735.38
7 91.95 42.14 9.84 2.03 7549,82
8 72.48 34.04 10.50 1.64 4928.44
9 90.34 36.69 8.75 1.77 5724.08
10 128.55 50.14 6.99 2.42 10691,61

TABEL E 3.2 Estimasi Interval dari 10 Sampel Acak Hipotetis


() () () ()
Sampel B1-TCseB1 B1+TCseB1 B2-TCseB2 B2+TCseB2
1 29.40 157,89 5.14 11.34
2 28.12 155.13 5.84 11.96
3 29.44 224.09 1.90 11.29
4 36.91 148.87 6.75 15.71
5 1.08 173.43 4.98 13.29
6 36.21 208.89 2.63 10.96
7 6.65 177.25 5.73 13.95
8 3.56 141.40 7.18 13.82
9 16.07 164.62 5.17 12.33
10 27.04 230.06 2.09 11.88

Variasi tersebut disebabkan karena pada setiap sampel pengeluaran pangan rumah tangga berbeda.
Interval kepercayaan 95% untuk parameter1dan2diberikan pada Tabel 3.2 untuk sampel yang sama.
Variabilitas sampling menyebabkan pusat dari setiap estimasi interval berubah dengan nilai
estimasi kuadrat terkecil, dan menyebabkan lebar interval berubah dengan standar error. Jika kita
mengajukan pertanyaan "Berapa banyak dari interval ini yang berisi parameter sebenarnya, dan yang
mana?" kita harus menjawab bahwa kita tidak tahu. Tetapi karena 95% dari semua perkiraan interval
yang dibuat dengan cara ini berisi nilai parameter yang sebenarnya, kami berharap mungkin 9 atau
10 interval ini berisi parameter yang benar tetapi tidak diketahui.
Perhatikan perbedaan antara estimasi titik dan estimasi interval. Kami telah menggunakan estimator kuadrat
terkecil untuk mendapatkan estimasi titik√.dari parameter yang tidak diketahui. varians yang diperkirakan
(
⋀. ) () ()
varBk , untukk=1 atau 2, dan akar kuadratnya varBk=seBkmemberikan informasi tentang
⋀.

variabilitas sampling penaksir kuadrat terkecil dari satu sampel ke sampel lainnya. Penaksir interval adalah
cara yang mudah untuk melaporkan hasil regresi karena mereka menggabungkan estimasi titik dengan
ukuran variabilitas pengambilan sampel untuk memberikan rentang nilai di mana parameter yang tidak
diketahui mungkin jatuh. Ketika variabilitas sampling penaksir kuadrat terkecil relatif kecil, maka estimasi
interval akan relatif sempit, yang menyiratkan bahwa estimasi kuadrat terkecil “dapat diandalkan.” Jika
penduga kuadrat terkecil menderita variabilitas pengambilan sampel yang besar, maka perkiraan interval
akan lebar, menyiratkan bahwa perkiraan kuadrat terkecil “tidak dapat diandalkan.”
118BAB 3 Estimasi Interval dan Pengujian Hipotesis

3.2 Uji Hipotesis


Banyak masalah keputusan bisnis dan ekonomi memerlukan penilaian apakah suatu parameter adalah nilai
tertentu atau tidak. Dalam contoh pengeluaran makanan, mungkin membuat banyak perbedaan untuk
tujuan keputusan apakah2lebih besar dari 10, menunjukkan bahwa peningkatan pendapatan sebesar $100
akan meningkatkan pengeluaran untuk makanan lebih dari $10. Selain itu, berdasarkan teori ekonomi, kami
percaya bahwa2harus positif. Satu pemeriksaan data dan model kami adalah apakah proposisi teoretis ini
didukung oleh data.
Prosedur pengujian hipotesis membandingkan dugaan yang kita miliki tentang populasi dengan
informasi yang terkandung dalam sampel data. Mengingat model ekonomi dan statistik,hipotesisterbentuk
tentang perilaku ekonomi. Hipotesis ini kemudian direpresentasikan sebagai pernyataan tentang parameter
model. Uji hipotesis menggunakan informasi tentang parameter yang terkandung dalam sampel data,
perkiraan titik kuadrat terkecilnya, dan kesalahan standarnya untuk menarik kesimpulan tentang hipotesis.

Dalam setiap dan setiap uji hipotesis, lima bahan harus ada:

Komponen Uji Hipotesis


1.Sebuah hipotesis nolH0
2.Sebuah hipotesis alternatifH1
3.Sebuah statistik uji
4.Daerah penolakan
5.Sebuah kesimpulan

3.2.1 Hipotesis Null


Ituhipotesis nol, yang dilambangkan denganH0(T-tidak ada), menentukan nilai untuk parameter
regresi, yang untuk umum kami nyatakan sebagaik, untukk=1 atau 2. Hipotesis nol dinyatakan sebagai
H0:Β.k=C, di manaCadalah konstanta, dan merupakan nilai penting dalam konteks model regresi
tertentu. Hipotesis nol adalah keyakinan yang akan kita pertahankan sampai kita yakin dengan bukti
sampel bahwa itu tidak benar, dalam hal ini kitamenolakhipotesis nol.

3.2.2 Hipotesis Alternatif


Dipasangkan dengan setiap hipotesis nol adalah logishipotesis alternatifH1yang akan kita terima jika
hipotesis nol ditolak. Hipotesis alternatif fleksibel dan tergantung, sampai batas tertentu, pada teori
ekonomi. Untuk hipotesis nolH0:Β.k=C, tiga kemungkinan hipotesis alternatif adalah sebagai berikut:

• H1:Β.k> c. Menolak hipotesis nol bahwak=Cmembawa kita untuk menerima kesimpulan bahwa β.k
> c. Hipotesis alternatif ketidaksetaraan banyak digunakan dalam ekonomi karena teori ekonomi
sering memberikan informasi tentangtanda-tandadari hubungan antar variabel. Misalnya, dalam
contoh pengeluaran makanan, kita mungkin menguji hipotesis nol H0:Β.2=0 melawanH1:Β.2>0
karena teori ekonomi sangat menyarankan bahwa kebutuhan seperti makanan adalah barang
normal dan pengeluaran makanan akan meningkat jika pendapatan meningkat.
• H1:Β.k< c. Menolak hipotesis nol bahwak=Cdalam hal ini membawa kita untuk menerima
kesimpulan bahwak< c.
• H1:Β.k≠.C. Menolak hipotesis nol bahwak=Cdalam hal ini membawa kita untuk menerima
kesimpulan bahwakmengambil nilai lebih besar atau lebih kecil dariC.
3.2 Uji Hipotesis119

3.2.3 Statistik Uji


Informasi sampel tentang hipotesis nol diwujudkan dalam nilai sampel astatistik uji.
Berdasarkan nilai statistik uji, kami memutuskan untuk menolak hipotesis nol atau tidak
menolaknya. Statistik uji memiliki karakteristik khusus: distribusi probabilitasnya sepenuhnya
diketahuiketika hipotesis nol benar, dan memiliki beberapalainnyadistribusi jika hipotesis nol
tidak benar. ( )( )
Semuanya dimulai dengan hasil kunci di (3.3),T= Bk- β.kDanseBk ~T(n2).Jikahipotesis nol
H0:Β.k=Cadalahbenar,kemudiankita bisa menggantikanCuntukkdan berikut ini

Bk-C
T= ( )~T(n2) (3.7)
seBk
Jika hipotesis nol adalahtidak benar, makaT-statistik dalam (3.7) tidakbukanmemilikiT-distribusi
dengan n-2 derajat kebebasan. Hal ini diuraikan dalam Lampiran 3B.

3.2.4 Daerah Penolakan


Itudaerah penolakantergantung pada bentuk alternatif. Ini adalah kisaran nilai statistik uji yang mengarah
kepenolakandari hipotesis nol. Dimungkinkan untuk membangun daerah penolakan hanya jika kita memiliki

• Statistik uji yang distribusinya diketahui ketika hipotesis nol benar


• Sebuah hipotesis alternatif
• Sebuah tingkat signifikansi
Daerah penolakan terdiri dari nilai-nilai yangtidak sepertinyadan yang memiliki kemungkinan rendah
terjadi ketika hipotesis nol benar. Rantai logikanya adalah “Jika suatu nilai statistik uji diperoleh yang
berada di wilayah probabilitas rendah, maka statistik uji tidak mungkin memiliki distribusi yang
diasumsikan, dan dengan demikian, kecil kemungkinan hipotesis nol itu benar. ” Jika hipotesis
alternatif benar, maka nilai statistik uji akan cenderung luar biasa besar atau luar biasa kecil. Istilah
"besar" dan "kecil" ditentukan dengan memilih probabilitas , yang disebuttingkat signifikansi dari
tes, yang memberikan arti untuk "an"tidak sepertinyaperistiwa." Tingkat signifikansi tes α.biasanya
dipilih menjadi 0,01, 0,05, atau 0,10.

Komentar

Ketika tidak ada pilihan spesifik lain yang dibuat, ekonom dan ahli statistik sering menggunakan tingkat
signifikansi 0,05. Artinya, kejadian "satu kali dalam dua puluh" dianggap sebagai peristiwa yang tidak biasa
atau tidak mungkin terjadi secara kebetulan. Ambang batas untuk signifikansi statistik ini dilekatkan sebagai
Cawan Suci tetapi pada kenyataannya hanyalah preseden sejarah berdasarkan kutipan oleh Sir Ronald
Fisher yang mempromosikan standar ituT-nilai yang lebih besar dari dua dianggap signifikan. Ambang1
batas yang lebih kuat untuk signifikansi, seperti "satu kali dalam seratus," atau 0,01, mungkin lebih
masuk akal. Pentingnya topik dengan cepat terbukti dengan pencarian web. Isu-isu tersebut dibahas
dalamKultus Signifikansi Statistik: Bagaimana Kesalahan Standar Menghabiskan Pekerjaan, Keadilan,
dan Kehidupan Kita, oleh Stephen T. Ziliak dan Deirdre N. McCloskey, 2008, The University of Michigan
Press.

Jika kita menolak hipotesis nol padahal hipotesis itu benar, maka kita melakukan apa yang disebut a
Kesalahan tipe I. Tingkat signifikansi suatu tesadalahprobabilitas melakukan kesalahan Tipe I, jadi

............................................................................................................................................

1MarkKelly (2013) “Emily Dickinson dan monyet di tangga. Atau: Berapa signifikansi tingkat signifikansi
5%,”Makna, Jil. 10(5), Oktober, 21–22.
120BAB 3 Estimasi Interval dan Pengujian Hipotesis

P(Kesalahan tipe I) = . Setiap kali kita menolak hipotesis nol, ada kemungkinan bahwa kita telah membuat kesalahan
seperti itu—tidak ada cara untuk menghindarinya. Kabar baiknya adalah kita dapat menentukan jumlah kesalahan
Tipe I yang akan kita toleransi dengan menetapkan tingkat signifikansi . Jika kesalahan seperti itu mahal, maka kami
membuat kecil. Jika kita tidak menolak hipotesis nol yang salah, maka kita telah melakukan aKesalahan tipe II.
Dalam situasi dunia nyata, kita tidak dapat mengontrol atau menghitung probabilitas jenis kesalahan ini karena
bergantung pada parameter sebenarnya yang tidak diketahuik. Untuk lebih lanjut tentang kesalahan Tipe I dan Tipe
II, lihat Lampiran C.6.9.

3.2.5 Sebuah kesimpulan


Ketika Anda telah menyelesaikan pengujian hipotesis, Anda harus menyatakan kesimpulan Anda. Apakah Anda
menolak hipotesis nol, atau Anda tidak menolak hipotesis nol? Seperti yang akan kami bahas di bawah ini, Anda
harus menghindari mengatakan bahwa Anda "menerima" hipotesis nol, yang bisa sangat menyesatkan. Selain itu,
kami mendorong Anda untuk menjadikannya praktik standar untuk mengatakan apa arti kesimpulan dalam konteks
ekonomi dari masalah yang sedang Anda kerjakan dan signifikansi ekonomi dari temuan tersebut. Prosedur statistik
bukanlah tujuan itu sendiri. Mereka dilakukan karena suatu alasan dan memiliki makna, yang harus dapat Anda
jelaskan.

3.3 Daerah Penolakan untuk Alternatif Tertentu


Pada bagian ini, kami berharap menjadi sangat jelas tentang sifat aturan penolakan untuk masing-masing
dari tiga alternatif yang mungkin untuk hipotesis nol.H0:Β.k=C. Seperti disebutkan di bagian sebelumnya,
untuk memiliki daerah penolakan untuk hipotesis nol, kita memerlukan statistik uji, yang kita miliki; itu
diberikan dalam (3.7). Kedua, kita membutuhkan alternatif khusus,k> c,k< c, atauk≠.C. Ketiga, kita perlu
menentukan tingkat signifikansi tes. Tingkat signifikansi suatu pengujian, , adalah probabilitas bahwa kita
menolak hipotesis nol padahal hipotesis itu benar-benar benar, yang disebut kesalahan Tipe I.

3.3.1 Tes Satu Ekor dengan Alternatif '' Lebih Besar Dari '' (>)
Saat menguji hipotesis nolH0:Β.k=C, jikaalternatifhipotesaH1:Β.k> cbenar, maka nilaiT-statistik
(3.7) cenderung menjadi lebih besar dari biasanya untukT-distribusi. Kami akan menolak
hipotesis nol jika statistik uji lebih besar dari nilai kritis untuk tingkat signifikansi . Nilai kritis
yang meninggalkan probabilitas di ekor kanan adalah (1 )-persentil T(1−α,n2), seperti yang
ditunjukkan pada Gambar 3.2. Misalnya, jika = 0.05 dann-2 = 30, maka dari Tabel Statistik 2, nilai
kritisnya adalah nilai persentil ke-95T(0,95, 30)= 1.697.

T(M)
Menolak
H0:k=C
Tidak
menolak
α.
H0:k=C

0 tc=T(1–,n–2)

GAMBAR 3.2 Wilayah penolakan untuk uji satu sisi dariH0:Β.k=Cmelawan


H1:Β.k> c.
3.3 Daerah Penolakan untuk Alternatif Tertentu121

Aturan penolakannya adalah

Saat menguji hipotesis nolH0:Β.k=Cmelawan hipotesis alternatifH1:Β.k> c,


menolak hipotesis nol dan menerima hipotesis alternatif jikaT≥.T(1−α,n2).

Tes ini disebut tes "satu-ekor" karena nilai-nilai yang tidak mungkin dariT-statistik jatuh hanya dalam
satu ekor dari distribusi probabilitas. Jika hipotesis nol benar, maka statistik uji (3.7) memiliki T
-distribusi, dan nilainya akan cenderung jatuh di tengah distribusi, di sebelah kiri nilai kritis, di mana
sebagian besar probabilitas terkandung. Tingkat signifikansi dipilih sehingga jika hipotesis nol benar,
maka probabilitas bahwaT-nilai statistik jatuh di ujung paling kanan dari distribusi kecil; peristiwa
yang tidak mungkin dan tidak mungkin terjadi secara kebetulan. Jika kami memperoleh nilai statistik
uji di wilayah penolakan, kami menganggapnya sebagai buktimelawanhipotesis nol, mengarahkan
kita untuk menyimpulkan bahwa hipotesis nol tidak mungkin benar. Bukti terhadap hipotesis nol
adalah bukti yang mendukung hipotesis alternatif. Jadi, jika kita menolak hipotesis nol maka kita
menyimpulkan bahwa alternatifnya benar.
Jika hipotesis nolH0:Β.k=Cadalahbenar,maka statistik uji (3.7) memilikiT-distribusi dan nilainya
termasuk dalam daerah non-penolakan dengan probabilitas 1 . Jikat < t(1−α,n2), maka tidak ada bukti
yang signifikan secara statistik terhadap hipotesis nol, dan kami tidak menolaknya.

3.3.2 Tes Satu Ekor dengan Alternatif ''Kurang Dari'' (<)


Jika hipotesis alternatifH1:Β.k< cbenar, maka nilaiT-statistik (3.7) cenderung menjadi lebih kecil
dari biasanya untukT-distribusi. Kami menolak hipotesis nol jika statistik uji lebih kecil dari nilai
kritis untuk tingkat signifikansi . Nilai kritis yang meninggalkan probabilitas di ekor kiri adalah
-persentilT(α,n2), seperti yang ditunjukkan pada Gambar 3.3.
Saat menggunakan Tabel Statistik 2 untuk menemukan nilai kritis, ingatlah bahwa:T
-distribusi simetris terhadap nol, sehingga -persentilT(α,n2)adalah negatif dari (1 )-persentil
T(1−α,n2). Misalnya, jika = 0.05 dann-2 = 20, maka dari Tabel Statistik 2, persentil ke-95 dariT
-distribusi adalahT(0,95, 20)= 1.725 dan nilai persentil ke-5 adalahT(0,05, 20)= 1.725.
Aturan penolakannya adalah:

Saat menguji hipotesis nolH0:Β.k=Cmelawan hipotesis alternatifH1:Β.k< c,


menolak hipotesis nol dan menerima hipotesis alternatif jikaT≤.T(α,n2).

Daerah non-penolakan terdiri dariT-nilai statistik lebih besar dariT(α,n2). Ketika hipotesis nol benar,
probabilitas mendapatkan seperti ituT-nilai adalah 1 , yang dipilih untuk menjadi besar. Jadi jikat > t(α,n
2)maka jangan menolakH0:Β.k=C.

T(M)
MenolakH0:k=C

α.
Jangan tolak
H0:k=C

TC=T(α,n–2) 0

GAMBAR 3.3 Daerah penolakan untuk uji satu arah dariH0:Β.k=Cmelawan


H1:Β.k< c.
122BAB 3 Estimasi Interval dan Pengujian Hipotesis

Mengingat di mana daerah penolakan berada dapat difasilitasi dengan trik berikut:

Trik Memori
Daerah penolakan untuk uji satu arah berada pada arah panah pada alternatif. Jika
alternatifnya adalah>, lalu tolak di ekor kanan. Jika alternatifnya adalah<, tolak di ekor kiri.

3.3.3 Uji Dua Ekor dengan Alternatif ''Tidak Sama Dengan'' ()


Saat menguji hipotesis nolH0:Β.k=C, jika hipotesis alternatifH1:Β.k≠.Cbenar, maka nilaiT-statistik
(3.7) cenderung menjadi lebih besarataulebih kecil dari biasanya untuk T-distribusi. Untuk
melakukan pengujian dengan tingkat signifikansi , kita tentukan nilai kritisnya sehingga
probabilitas dariT-statistik jatuh di kedua ekor adalahDan2. Nilai kritis ekor kiri adalah persentil
T(α/2,n2)dan nilai kritis ekor kanan adalah persentilT(1−α/2,n2). Kami menolak hipotesis nol bahwaH0
:Β.k=Cmendukung alternatif ituH1:Β.k≠.Cjika statistik ujiT≤.T(α/2,n2)atau T≥.T(1−α/2,n2), seperti yang
ditunjukkan pada Gambar 3.4. Misalnya, jika = 0.05 dann-2 = 30, makaDan2 = 0.025 dan nilai
kritis kiri adalah nilai 2,5 persenT(0,025, 30)= 2.042; nilai kritis ekor kanan adalah 97,5-persentilT
(0,975, 30)= 2.042. Nilai kritis ekor kanan ditemukan pada Tabel Statistik 2, dan nilai kritis ekor kiri
ditemukan menggunakan simetriT-distribusi.
Karena daerah penolakan terdiri dari bagian-bagian dariT-distribusi di ekor kiri dan
kanan, tes ini disebut ates dua ekor. Ketika hipotesis nol benar, probabilitas memperoleh
nilai statistik uji yang masuksalah satuarea ekor "kecil." Jumlah probabilitas ekor adalah .
Nilai sampel dari statistik uji yang berada di area ekor tidak sesuai dengan hipotesis nol
dan merupakan bukti bahwa hipotesis nol itu benar. Sebaliknya, jika hipotesis nolH0:Β.k=C
benar, maka probabilitas memperoleh nilai statistik ujiTdi wilayah nonrejection pusat
tinggi. Nilai sampel dari statistik uji di area non-penolakan pusat sesuai dengan hipotesis
nol dan tidak diambil sebagai bukti kebenaran hipotesis nol. Jadi, aturan penolakannya
adalah

Saat menguji hipotesis nolH0:Β.k=Cmelawan hipotesis alternatifH1:Β.k≠.C,


menolak hipotesis nol dan menerima hipotesis alternatif jikaT≤.T(α/2,n2)ataujika
T≥.T(1−α/2,n2).

Kami tidak menolak hipotesis nol jikaT(α/2,n2)<t < t(1−α/2,n2).

F(T)
MenolakH0:βk=C MenolakH0:βk=C
MenerimaH1:βk≠.C Jangan tolak MenerimaH1:βk≠.C
H0:βk=C

T(M)

/2 /2

–TC=T(α/2,n–2) TC=T(1–α/2,n–2) T

GAMBAR 3.4Daerah penolakan untuk pengujianH0:Β.k=CmelawanH1:Β.k≠.C.


3.4 Contoh Pengujian Hipotesis123

3.4 Contoh Uji Hipotesis


Kami menggambarkan mekanisme pengujian hipotesis menggunakan model pengeluaran makanan. Kami
memberikan contoh uji ekor kanan, ekor kiri, dan dua ekor. Dalam setiap kasus, kita akan mengikuti serangkaian
langkah yang ditentukan, dengan cermat mengikuti daftar komponen yang diperlukan untuk semua uji hipotesis
yang tercantum di awal Bagian 3.2. Prosedur standar untuk semua masalah dan situasi pengujian hipotesis adalah:

Prosedur Langkah-demi-Langkah untuk Menguji Hipotesis

1.Tentukan hipotesis nol dan alternatifnya.


2.Tentukan statistik uji dan distribusinya jika hipotesis nol benar.
3.Pilih dan tentukan daerah penolakan.
4.Hitung nilai sampel dari statistik uji.
5.Nyatakan kesimpulan Anda.

CONTOH 3 . 2Uji Signifikansi Ekor Kanan

Biasanya, perhatian pertama kami adalah apakah ada hubungan suka mendirikan,H1:Β.2>0. Jika kemudian kita menolak hipotesis nol,
antara variabel, seperti yang telah kami tentukan dalam model kami. kita dapat membuat pernyataan langsung, menyimpulkan bahwa2
jika2= 0, maka tidak ada hubungan linier antara pengeluaran makanan positif, dengan hanya kemungkinan kecil (α) bahwa kita salah.
dan pendapatan. Teori ekonomi menyatakan bahwa makanan adalah Langkah-langkah pengujian hipotesis ini adalah sebagai berikut:
barang normal dan bahwa ketika pendapatan meningkat, pengeluaran
makanan juga akan meningkat dan dengan demikian2>0. Estimasi 1.Hipotesis nolnya adalahH0:Β.2=0. Hipotesis alternatifnya
kuadrat terkecil dari2adalahB2= 10.21, yang tentunya lebih besar dari adalahH1:Β.2>0.
nol. Namun, sekadar mengamati bahwa perkiraan itu memiliki tanda 2.Statistik t(est ) adalah (3.7). Pada kasus ini,C=0, jadiT= B2
yang benar bukanlah bukti ilmiah. Kami ingin menentukan apakah ada DanseB2~T(n2)jika hipotesis nol benar.
yang meyakinkan, ataupenting, bukti statistik yang akan mengarahkan
3.Mari kita pilih = 0.05. Nilai kritis untuk daerah penolakan ekor
kita untuk menyimpulkan bahwa2>0. Saat menguji hipotesis nol bahwa
kanan adalah persentil ke-95 dariT-distribusi dengann–2 = 38
suatu parameter adalah nol, kami menanyakan apakah perkiraannyaB2
derajat kebebasan,T(0,95, 38)= 1.686. Dengan demikian, kita
berbeda secara signifikan dari nol, dan tes ini disebut auji signifikansi.
akan menolak hipotesis nol jika nilai yang dihitung dariT≥.1.
686. Jikat <1.686, kami tidak akan menolak hipotesis nol.
Prosedur uji statistik tidak dapat membuktikan kebenaran
hipotesis nol. Ketika kita gagal menolak hipotesis nol, semua uji
hipotesis yang dapat dilakukan adalah bahwa informasi dalam sampel 4.Menggunakan pengeluaran makanan d(ata), kami menemukan bahwa B2=

data adalahkompatibeldengan hipotesis nol. Sebaliknya, uji statistik 10.21 dengan kesalahan standar seB2 =2.09. Nilai
dapat mengarahkan kita kemenolakhipotesis nol, dengan hanya dari statistik uji adalah

probabilitas kecil untuk menolak hipotesis nol ketika itu benar-benar B 10.21
benar. Dengan demikian, menolak hipotesis nol adalah kesimpulan T= (2) = =4.88
seB2 2.09
yang lebih kuat daripada gagal menolaknya. Untuk alasan ini, hipotesis
nol biasanya dinyatakan sedemikian rupa sehingga jika teori kita 5.SejakT=4.88>1.686, kami menolak hipotesis nol bahwa2= 0
benar, maka kita akan menolak hipotesis nol. Dalam contoh kita, teori dan terima alternatif yang2>0. Artinya, kami menolak
ekonomi menyiratkan bahwa harus ada hubungan positif antara hipotesis bahwa tidak ada hubungan antara pendapatan
pendapatan dan pengeluaran makanan. Kami ingin menetapkan dan pengeluaran makanan dan menyimpulkan bahwa
bahwa ada bukti statistik untuk mendukung teori ini menggunakan uji adasignifikan secara statistikhubungan positif antara
hipotesis. Dengan tujuan ini, kami membuat hipotesis nol bahwa ada pendapatan rumah tangga dan pengeluaran makanan.
tidakhubungan antar variabel,H0:Β.2=0. Dalam hipotesis alternatif,
kami menempatkan dugaan bahwa kami akan Bagian terakhir dari kesimpulan adalah penting. Ketika Anda
melaporkan hasil Anda ke audiens, Anda akan ingin menjelaskan:
124BAB 3 Estimasi Interval dan Pengujian Hipotesis

hasil tes dalam konteks masalah yang Anda selidiki, teori ekonomi salah dan tidak ada hubungan antara
bukan hanya dalam hal huruf dan simbol Yunani. pendapatan dan pengeluaran makanan? Tidak. Ingat
Bagaimana jika kita tidak dapat menolak hipotesis bahwa gagal menolak hipotesis noltidakberarti hipotesis
nol dalam contoh ini? Akankah kita menyimpulkan bahwa nol itu benar.

CONTOH 3 . 3Uji Ekor Kanan dari Hipotesis Ekonomi

Misalkan profitabilitas ekonomi supermarket baru bergantung 4.Menggunakan data pengeluaran foo(de),B2= 10.21 dengan kesalahan
pada pengeluaran rumah tangga lebih dari $5,50 dari setiap standar seB2 =2.09. Nilai statistik uji
tambahan $100 pendapatan mingguan untuk makanan dan adalah
B - 5,5 10,21 5,5
konstruksi itu tidak akan dilanjutkan kecuali ada bukti kuat untuk T=2 ()= =2.25
efek ini. Dalam hal ini, dugaan yang ingin kita bangun, yang akan seB 2 2.09
masuk dalam hipotesis alternatif, adalah bahwa2>5.5. Jika β.2≤.5.5,
5.SejakT=2.25<2.429, kami tidak menolak hipotesis nol bahwa2≤.5.
maka supermarket tidak akan menguntungkan dan pemiliknya
5. Kami adalahbukandapat menyimpulkan bahwa
tidak mau membangunnya. Estimasi kuadrat terkecil dari2adalahB
supermarket baru akan menguntungkan dan tidak akan
2= 10.21, yang lebih besar dari 5,5. Yang ingin kami tentukan
memulai konstruksi.
adalah apakah ada bukti statistik yang meyakinkan yang akan
mengarahkan kami untuk menyimpulkan, berdasarkan data yang
Dalam contoh ini, kami telah mengajukan situasi di mana pilihan
tersedia, bahwa2>5.5. Penilaian ini tidak hanya didasarkan pada
tingkat signifikansi menjadi sangat penting. Sebuah proyek
perkiraanB2tetapi juga presisi yang diukur dengan seB2.
konstruksi bernilai jutaan dolar tergantung pada memiliki
Apa yang akan menjadi hipotesis nol? Kami telah
meyakinkanbukti bahwa rumah tangga akan menghabiskan lebih
menyatakan hipotesis nol sebagai persamaan, seperti2= 5
dari $5,50 dari setiap tambahan $100 pendapatan untuk
.5. Hipotesis nol ini terlalu terbatas karena secara teori
makanan. Meskipun pilihan "biasa" adalah = 0.05, kami telah
dimungkinkan2<5.5. Ternyata prosedur pengujian
memilih nilai konservatif = 0.01 karena kami mencari tes yang
hipotesis untuk pengujian hipotesis nol ituH0:Β.2≤.5.5
memiliki peluang rendah untuk menolak hipotesis nol ketika itu
melawan hipotesis alternatifH1:Β.2>5.5 adalahpersis sama
benar-benar benar. Ingatlah bahwa tingkat signifikansi suatu
sebagai pengujianH0:Β.2=5.5 melawan hipotesis alternatif
pengujian menentukan apa yang kita maksud dengan nilai
H1:Β.2>5.5. Statistik uji dan daerah penolakan sama
statistik uji yang tidak mungkin. Dalam contoh ini, jika hipotesis
persis. Untuk uji ekor kanan, Anda dapat membentuk
nol benar, maka membangun supermarket tidak akan
hipotesis nol dengan salah satu cara ini tergantung pada
menguntungkan. Kami ingin kemungkinan membangun pasar
masalah yang dihadapi.
yang tidak menguntungkan menjadi sangat kecil, dan oleh karena
Langkah-langkah pengujian hipotesis ini adalah sebagai berikut:
itu, kami ingin kemungkinan menolak hipotesis nol ketika itu
1.Hipotesis nolnya adalahH0:Β.2≤.5.5. Alternatifnya benar menjadi sangat kecil. Dalam setiap situasi dunia nyata,
hipotesis adalahH1:Β.2>5.5. pilihan harus dibuat berdasarkan penilaianmempertaruhkandan
(
)() konsekuensidari membuat keputusan yang salah.
2.Statistik ujiT=B2– 5.5DanseB2~T(n2)jika nol
Seorang CEO yang tidak mau membuat keputusan berdasarkan
hipotesis itu benar.
bukti yang tersedia mungkin akan memesan sampel data yang baru
3.Mari kita pilih = 0.01. Nilai kritis untuk daerah penolakan dan lebih besar untuk dianalisis. Ingat bahwa ketika ukuran sampel
ekor kanan adalah persentil ke-99 dariT-distribusi dengan meningkat, penduga kuadrat terkecil menjadi lebih tepat (yang diukur
n-2 = 38 derajat kebebasan,T(0,99, 38)= 2.429. Kami akan dengan varians penaksir), dan akibatnya, uji hipotesis menjadi alat
menolak hipotesis nol jika nilai yang dihitung dariT≥.2. yang lebih kuat untuk inferensi statistik.
429. Jikat <2.429, kami tidak akan menolak hipotesis nol.
3.4 Contoh Pengujian Hipotesis 125

CONTOH 3 . 4Uji Ekor Kiri dari Hipotesis Ekonomi

Untuk kelengkapan, kami akan mengilustrasikan pengujian dengann–2 = 38 derajat kebebasan,T(0,05, 38)= 1.686. Kami akan
dengan daerah penolakan di ekor kiri. Pertimbangkan hipotesis menolak hipotesis nol jika nilai yang dihitung dariT≤ -1.686.
nol bahwa β.2≥.15 dan hipotesis alternatif2<15. Ingat trik memori Jikat >-1.686, kami tidak akan menolak hipotesis nol. Sebuah
kita untuk menentukan lokasi daerah penolakan untuk aT-uji. wilayah penolakan ekor kiri diilustrasikan pada Gambar 3.3.
Daerah penolakan searah dengan panah<dalam hipotesis
alternatif. Fakta ini memberitahu kita bahwa daerah penolakan 4.Menggunakan data pengeluaran foo(de),B2= 10.21 dengan kesalahan
berada di ekor kiriT-distribusi. Langkah-langkah pengujian standar seB2 =2.09. Nilai statistik uji
hipotesis ini adalah sebagai berikut: adalah
B - 15 10.21 15
T=2( )= =2.29
1.Hipotesis nolnya adalahH0:Β.2≥.15. Alternatifnya seB2 2.09
hipotesis adalahH1:Β.2<15.
( )() 5.SejakT=2.29<1.686, kami menolak hipotesis nol bahwa2≥.15 dan
2.Statistik ujiT=B215DanseB2~T(n2)jika nol terima alternatif yang2<15. Kami menyimpulkan bahwa rumah
hipotesis itu benar. tangga menghabiskan kurang dari $15 dari setiap tambahan $100
3.Mari kita pilih = 0.05. Nilai kritis untuk daerah penolakan pendapatan untuk makanan.
ekor kiri adalah persentil ke-5 dariT-distribusi

CONTOH 3 . 5Uji Dua Sisi dari Hipotesis Ekonomi

Seorang konsultan menyuarakan pendapat bahwa berdasarkan 5.Sejak –2.204<T=1.29<2.204, kami tidak menolak hipotesis
lingkungan serupa lainnya, rumah tangga di dekat pasar yang nol bahwa2= 7.5. Data sampel konsisten dengan dugaan
diusulkan akan menghabiskan tambahan $7,50 per tambahan rumah tangga akan menghabiskan tambahan $7,50 per
pendapatan $100. Dalam hal model ekonomi kami, kami dapat tambahan $100 pendapatan untuk makanan.
menyatakan dugaan ini sebagai hipotesis nol2= 7.5. Jika kita ingin
menguji apakah ini benar atau tidak, maka alternatifnya adalah2≠.7.5. Kita harus menghindari membaca kesimpulan ini lebih dari
Alternatif ini tidak membuat klaim tentang apakah2lebih besar dari 7,5 artinya. Kitatidakmenyimpulkan dari tes ini bahwa2= 7.5,
atau kurang dari 7,5, hanya saja bukan 7,5. Dalam kasus seperti itu, hanya saja data tidak kompatibel dengan nilai parameter ini.
kami menggunakan uji dua sisi, sebagai berikut: Data juga kompatibel dengan hipotesis nolH0:Β.2=8.5 (T=0.82),
H0:Β.2=6.5 (T=1.77), dan H0:Β.2=12.5 (T=1.09). Sebuah uji
1.Hipotesis nolnya adalahH0:Β.2=7.5. Alternatifnya hipotesistidak bisadigunakan untuk membuktikan bahwa
hipotesis adalahH1:Β.2≠.7.5. hipotesis nol benar.
( )()
2.Statistik ujiT=B2– 7.5DanseB2~T(n2)jika nol Ada trik yang berkaitan dengan tes dua sisi dan interval

hipotesis itu benar. kepercayaan yang terkadang berguna. MembiarkanQmenjadi nilai


dalam interval kepercayaan 100(1 )%, sehingga jikaTC=T(1−α/2,n2),
3.Mari kita pilih = 0.05. Nilai kritis untuk uji dua sisi ini adalah
2,5-persentilT(0,025, 38)= 2.024 dan 97,5-persentilT(0,975, 38)= 2.
kemudian
() ()
Bk-TCseBk≤.Q≤.Bk+TCseBk
024. Dengan demikian, kita akan menolak hipotesis nol
jika nilai yang dihitung dariT≥.2.024 ataujikaT≤ -2.024. Jika Jika kita menguji hipotesis nolH0:Β.k=QmelawanH1:Β.k
2.024<t <2.024, maka kita tidak akan menolak hipotesis ≠.Q, KapanQberada di dalam selang kepercayaan, maka kita akan
nol. bukanmenolak hipotesis nol pada tingkat signifikansi . JikaQ
4.Untuk (foo)d data pengeluaran,B2= 10.21 dengan kesalahan berada di luar selang kepercayaan, maka uji dua sisi akan
standar seB2= 2.09. Nilai statistik uji adalah menolak hipotesis nol. Kami tidak menganjurkan menggunakan
interval kepercayaan untuk menguji hipotesis, mereka melayani
B-7,5 10,21 7,5 T=2( ) tujuan yang berbeda, tetapi jika Anda diberi interval kepercayaan,
= =1.29
seB 2 2.09 trik ini berguna.
126BAB 3 Estimasi Interval dan Pengujian Hipotesis

CONTOH 3 . 6Uji Signifikansi Dua Ekor

Sementara kami yakin bahwa ada hubungan antara daerah penolakan dan nilai kritisnya. Kedua, uji signifikansi
pengeluaran makanan dan pendapatan, model sering dua sisi adalah sesuatu yang harus dilakukan setiap kali
diusulkan yang lebih spekulatif, dan tujuan pengujian model regresi diestimasi, dan akibatnya, perangkat lunak
hipotesis adalah untuk memastikan apakah ada hubungan komputer secara otomatis menghitungT-nilai untuk hipotesis
antara variabel atau tidak. Dalam hal ini, hipotesis nolnya nol bahwa parameter regresi adalah nol. Lihat kembali
adalah2= 0; yaitu, tidak ada hubungan linier antaraxdankamu. Gambar 2.9. Pertimbangkan bagian yang melaporkan
Alternatifnya adalah2≠.0, yang berarti bahwa ada hubungan perkiraan:
tetapi mungkin ada hubungan positif atau negatif antara
variabel. Ini adalah bentuk paling umum dariuji signifikansi.
Langkah-langkah pengujiannya adalah sebagai berikut: Standar
Variabel Koefisien Kesalahan T-Statistik Masalah.

1.Hipotesis nolnya adalahH0:Β.2=0. Hipotesis alternatif-


esis adalahH1:Β.2≠.0. C 83.41600 43.41016 1.921578 0,0622
() 10.20964 2.093264 4.877381 0,0000
2.Statistik ujiT=B2DanseB2~T(n2)jika hipotesis nol- PENGHASILAN

ess itu benar.

3.Mari kita pilih = 0.05. Nilai kritis untuk uji dua sisi ini Perhatikan bahwa ada kolom berlabelT-statistik. Ini adalah T-nilai
adalah 2,5-persentilT(0,025, 38)= 2.024 dan 97,5- statistik untuk hipotesis nol bahwa parameter yang merespons
persentilT(0,975, 38)= 2.024. Hipotesis nol akan kita adalah nol. Ini dihitung sebagaiT=BkDanseBk.Membagi taksiran
tolak jika nilai hitungT≥.2.024atau jikaT≤ -2.024. Jika kuadrat terkecil (Koefisien) dengan kesalahan standarnya
2.024<t <2.024, kami tidak akan menolak hipotesis (Kesalahan st.) memberikan:T-nilai statistik (T-statistik) untuk
nol. menguji hipotesis bahwa parameternya adalah nol. Itu T-nilai
4.Dengan menggunakan data pengeluaran fo(od ),B2= 10.21 statistik untuk variabelPENGHASILANadalah 4.877381, yang
dengan kesalahan standarB2= 2.09. Nilai statistik uji adalah T= relevan untuk menguji hipotesis nolH0:Β.2= 0. Kami telah
B2DanseB2= 10.21Dan2.09 = 4.88. membulatkan nilai ini menjadi 4,88 dalam diskusi kami.
ItuT-nilai untuk menguji hipotesis bahwa intersep
5.SejakT=4.88>2.024, kami menolak hipotesis nol bahwa β.2= 0 dan
adalah nol sama dengan 1,92. = 0.05 nilai kritis untuk ini
menyimpulkan bahwa ada hubungan yang signifikan secara
tes dua sisi adalahT(0,025, 38)= 2.024 danT(0,975, 38)= 2.024 apakah kita
statistik antara pendapatan dan pengeluaran makanan.
sedang menguji hipotesis tentang kemiringan atau inter-
Dua poin harus dibuat tentang hasil ini. Pertama, nilaiT cept, jadi kami gagal menolak hipotesis nol bahwaH0:Β.1= 0
-statistik yang kami hitung dalam uji dua sisi ini sama diberikan alternatifH1:Β.1≠.0.
dengan nilai yang dihitung dalam uji signifikansi satu sisi Kolom terakhir, berlabel "Prob.," adalah subjek dari
pada Contoh 3.2. Perbedaan kedua tes tersebut adalah bagian berikut.

Komentar

“signifikan secara statistik” tidak selalu berarti “signifikan secara ekonomi”. Misalnya,
misalkan CEO jaringan supermarket merencanakan tindakan tertentu jika2≠.0.
Selanjutnya, misalkan bahwa sampel besar dikumpulkan dari mana kita memperoleh
perkiraanB2= 0.0001 dengan seB2= 0.00001, menghasilkanT-statistikT=10.0. Kami
akan menolak hipotesis nol bahwa2= 0 dan terima alternatif yang2≠.0. Di sini, B2= 0.0001 secara statistik
berbeda dari nol. Namun, 0,0001 mungkin tidak "secara ekonomis" berbeda dari nol, dan CEO dapat
memutuskan untuk tidak melanjutkan rencana tersebut. Pesan di sini adalah bahwa seseorang harus
berpikir dengan hati-hati tentang pentingnya analisis statistik sebelum melaporkan atau menggunakan
hasilnya.

3.5 ItuP-Nilai
Saat melaporkan hasil uji hipotesis statistik, telah menjadi praktik standar untuk
melaporkanP-nilai(singkatan darinilai probabilitas) dari tes. Jika kita memilikiP-nilai a
3.5 IniP-Nilai127

uji,P, kita dapat menentukan hasil tes dengan membandingkanP-nilai ke tingkat signifikansi
yang dipilih, ,tanpamencari atau menghitung nilai kritis. Aturannya adalah

P-Nilai Aturan

Tolak hipotesis nol ketikaP-nilai kurang dari, atau sama dengan, tingkat signifikansi
. Artinya, jikaP,lalu tolakH0. Jikap >,maka jangan menolakH0.

Jika Anda telah memilih tingkat signifikansi menjadi = 0.01,0.05,0.10,atau nilai lainnya, Anda dapat
membandingkannya denganP-nilai suatu pengujian dan kemudian ditolak, atau tidak ditolak, tanpa
memeriksa nilai kritisnya. Dalam karya tulis, pelaporanP-nilai tes memungkinkan pembaca untuk
menerapkan penilaiannya sendiri tentang tingkat signifikansi yang sesuai.
BagaimanaP-nilai dihitung tergantung pada alternatif. JikaTadalah nilai yang dihitung dari T
-statistik, maka

• jikaH1:Β.k> c,P=peluang di sebelah kananT


• jikaH1:Β.k< c,P=peluang di sebelah kiriT
• jikaH1:Β.k≠.C,P=jumlahprobabilitas di sebelah kanan |T|dandi sebelah kiri |T|

Trik Memori
Arah alternatif menunjukkan ekor (s) dari distribusi di manaP-nilai jatuh.

CONTOH 3.3 (lanjutan)P-Nilai untuk Tes Ekor Kanan

Dalam Contoh 3.3, kami menguji hipotesis nolH0:Β.2≤.5.5 MengikutiP-nilai aturan, kami menyimpulkan bahwa pada = 0.
melawan alternatif satu sisiH1:Β.2>5.5. Nilai yang dihitung 01 kami tidak menolak hipotesis nol. Jika kita memilih = 0.05,
dariT-statistik adalah kami akan menolak hipotesis nol demi alternatif.
LogikanyaP-nilai aturan ditunjukkan pada Gambar 3.5.
B25.5 10.21 5.5
T= ()= =2.25 Probabilitas [kemampuan memperoleh] aT-nilai lebih besar
seB2 2.09
dari 2,25 adalah 0,0152, P=P t(38)≥.2.25 = 0.0152. Persentil
Dalam hal ini, karena alternatifnya adalah "lebih besar dari" (>), ke-99T(0,99, 38), yang merupakan nilai kritis untuk uji ekor
itu P-nilai dari tes ini adalah probabilitas bahwaT-variabel acak kanan dengan tingkat signifikansi = 0.01 harus jatuh ke kanan
dengann[-2 = 38 derajat kebebasan lebih besar dari 2,25, atau P=P 2.25. Ini berarti bahwaT=2.25 tidak jatuh di daerah penolakan
t(38)≥.2.25 = 0.0152. jika = 0.01 dan kami tidak akan menolak hipotesis nol pada
Nilai probabilitas ini tidak dapat ditemukan dengan cara tingkat signifikansi ini. Hal ini sesuai denganaturan nilai-p:
biasa T-tabel nilai kritis, tetapi mudah ditemukan menggunakan KetikaP-nilai (0,0152) lebih besar dari tingkat signifikansi yang
komputer. Paket perangkat lunak statistik, dan spreadsheet dipilih (0,01), kami tidak menolak hipotesis nol.
seperti Excel, memiliki perintah sederhana untuk mengevaluasi Di sisi lain, persentil ke-95T(0,95, 38), yang merupakan
fungsi distribusi kumulatif(cdf) (lihat Lampiran B.1) untuk nilai kritis untuk uji arah kanan dengan = 0.05, harus di
berbagai distribusi probabilitas. JikaFx(x) adalahcdfuntuk variabel sebelah kiri 2.25. Ini berarti bahwaT=2.25 jatuh di daerah
acakx, maka untuk sembarang nilaix=C, peluang kumulatifnya penolakan, dan kami menolak hipotesis nol pada tingkat
adalahP[x≤.C] =Fx(C). Diberikan fungsi seperti itu untukT-distribusi, signifikansi = 0.05. Hal ini sesuai denganaturan nilai-p:
kami menghitung yang diinginkanP-nilai sebagai KetikaP-nilai (0,0152) kurang dari atau sama dengan
[ ] [ ] tingkat signifikansi yang dipilih (0,05), kami akan menolak
P=P t(38)≥.2.25 = 1P t(38)≤.2,25 = 1 0,9848 hipotesis nol.
=0,0152
128BAB 3 Estimasi Interval dan Pengujian Hipotesis

T(38)

T=2.25
P=0,0152

–3 –2 –1 0 1 2 3 T

T(0,95, 38)= 1,686T(0,99, 38)= 2.429

GAMBAR 3.5 ItuP-nilai untuk tes ekor kanan.

CONTOH 3.4 (lanjutan)P-Nilai untuk Tes Ekor Kiri

Dalam Contoh 3.4, kami melakukan pengujian dengan daerah hipotesis nol yang mendukung alternatif. Lihat Gambar
penolakan di bagian kiri dariT-distribusi. Hipotesis nolnya adalahH 3.6 untuk melihat ini secara grafis. Cari persentil ke-1 dan
0:Β.2≥.15, dan hipotesis alternatifnya adalah H1:Β.2<15. Nilai yang ke-5. Ini akan menjadi nilai kritis untuk tes ekor kiri
dihitung dariT-statistik adalah T= –2.29. Untuk menghitungP-nilai dengan = 0.01 dan =0.05 tingkat signifikansi. KetikaP-nilai
untuk uji ekor kiri ini, kami menghitung probabilitas memperoleh (0,0139) lebih besar dari tingkat signifikansi (α = 0.01),
aT-statistik di sebelah kiri 2.29. Dengan menggunakan perangkat makaT-nilai 2.29 tidak berada di wilayah penolakan uji.
lunak [ komputer Anda], Anda akan menemukan nilai ini sebagaiP KetikaP-nilai (0,0139) lebih kecil atau sama dengan tingkat
t(38)≤ -2.29 = 0.0139. Mengikuti P-nilai aturan, kami menyimpulkan signifikansi (α = 0.05), makaT-nilai 2.29 berada di wilayah
bahwa pada = 0.01, kami tidak menolak hipotesis nol. Jika kita penolakan uji.
memilih = 0.05, kami akan menolak

T(38)

T= –2.29
P=0,0139

–3 –2 –1 0 1 2 3 T

T(0,01, 38)= –2.429 T(0,05, 38)= –1.686

GAMBAR 3.6ItuP-nilai untuk tes ekor kiri.


3.6 Kombinasi Linear Parameter129

CONTOH 3.5 (lanjutan)P-Nilai untuk Uji Dua Ekor

Untuk uji dua sisi, daerah penolakan berada di dua sisi T


-distribusi, danP-nilai sama dihitung dalam dua ekor
distribusi. Dalam Contoh 3.5, kami menguji hipotesis nol P=0.2033 T(38)
bahwa2= 7.5 melawan hipotesis alternatif β.2≠.7.5. Nilai
yang dihitung dariT-statistik adalahT=1.29. Untuk uji dua
sisi ini,P-nilai adalah probabilitas gabungan T= –1.29 T=1.29
di sebelah kanan 1.29 dan di sebelah kiri 1.29: P2 = P2 =
[ ][ ] 0.10165 0.10165
P=P t(38)≥.1.29 +P t(38)≤ -1,29 = 0,2033
Perhitungan ini digambarkan pada Gambar 3.7. sekaliP-nilai
diperoleh, penggunaannya tidak berubah. Jika kita memilih =
0.05, =0.10, atau genap = 0.20, kita akan gagal menolak
hipotesis nol karenap >. –3 –2 –1 0 1 2 3 T
Di awal bagian ini, kami menyatakan aturan komputasi
berikut:P-nilai untuk tes dua sisi: jikaH1:Β.k≠.C, P=jumlah T(0,025, 38)= –2.024
T(0,975, 38)= 2.024
probabilitas di sebelah kanan |T|dandi sebelah kiri
|T|. Alasan penggunaan nilai mutlak dalam aturan ini GAMBAR 3.7ItuP-nilai untuk uji signifikansi dua sisi.
adalah karena akan berlaku sama baiknya jika nilaiT
-statistik ternyata positif atau negatif.

CONTOH 3.6 (lanjutan)P-Nilai untuk Uji Signifikansi Dua Sisi

Semua perangkat lunak statistik menghitungP-nilai untuk uji Di sebelah masing-masingT-nilai statistik adalah dua-ekorP-nilai, yang
signifikansi dua sisi untuk setiap koefisien ketika analisis diberi label "Prob." oleh perangkat lunak EViews. Paket perangkat
regresi dilakukan. Dalam Contoh 3.6, kita membahas lunak lain akan menggunakan nama yang mirip. Saat memeriksa
pengujian hipotesis nolH0:Β.2= 0 terhadap hipotesis alternatif keluaran komputer, kita dapat segera memutuskan apakah suatu
H1:Β.2≠.0. Untuk nilai yang dihitung dariT-statistik perkiraan signifikan secara statistik (berbeda secara statistik dari nol
T=4.88, ituP-nilai adalah menggunakan uji dua sisi) dengan membandingkanP-nilai ke tingkat
[ ] [ ] signifikansi apa pun yang ingin kami gunakan. Perkiraan intersep
P=P t(38)≥.4.88 +P t(38)≤ -4,88 = 0,0000
memilikiP-nilai 0,0622, sehingga secara statistik tidak berbeda dengan
Perangkat lunak Anda akan secara otomatis menghitung dan nol pada taraf signifikansi = 0.05, tetapi signifikan secara statistik jika =
melaporkan ini P-nilai untuk uji signifikansi dua sisi. Lihat kembali 0.10.
Gambar 2.9 dan pertimbangkan hanya bagian yang melaporkan Koefisien estimasi pendapatan memiliki aP-nilai yang nol sampai
perkiraan: empat tempat. Dengan demikian,P=0.01 atau genap = 0.0001, dan
dengan demikian, kami menolak hipotesis nol bahwa pendapatan tidak
berpengaruh pada pengeluaran makanan pada tingkat signifikansi ini.
Standar Itu P-nilai untuk uji signifikansi dua sisi ini sebenarnya tidak nol. Jika
Variabel Koefisien Kesalahan T-Statistik Masalah. lebih banyak tempat digunakan, makaP=0.00001946. Perangkat lunak
regresi biasanya tidak mencetak lebih dari empat tempat karena dalam
C 83.41600 43.41016 1.921578 0,0622
praktiknya tingkat signifikansi kurang dari = 0.001 jarang terjadi.
PENGHASILAN 10.20964 2.093264 4.877381 0,0000

3.6 Kombinasi Linear Parameter


Sejauh ini, kita telah membahas inferensi statistik (estimasi titik, estimasi interval, dan pengujian hipotesis)
untuk satu parameter,1atau2. Secara lebih umum, kita mungkin ingin memperkirakan dan menguji hipotesis
tentangkombinasi linier parameter=C1β.1+C2β.2, di manaC1danC2adalah konstanta yang kita tentukan.
Salah satu contoh adalah jika kita ingin memperkirakan nilai yang diharapkan dari suatu tanggungan
130BAB 3 Estimasi Interval dan Pengujian Hipotesis

variabelE(kamu|x)Kapanxmengambil beberapa spesifikasi(c value, su)ch asx=x0. Pada kasus ini,C1= 1


danC2=x0, sehingga =C1β.1+C2β.2=1+x0β.2=E y|x=x0.
Dengan asumsi SR1–SR5, penduga kuadrat terkecilB1danB2adalah estimator tak bias
linier terbaik dari1dan2. Benar juga bahwa =C1B1+C2B2adalah tak bias linier terbaik
penduga dari =C1β.1+C2β.2. Penduga tidak bias karena
()( ) ( ) ( )
E|x=E c1B1+C2B2|x =C1E b1|x + C2E b2|x =C1β.1+C2β.2=
() [ ()]
Kemudian, dengan menggunakan hukum harapan berulang,E=Ex E |x =Ex[λ] = .Untuk menemukan vari-

dari , ingat kembali dari Probability Primer, Bagian P.5.6, bahwa jikaxdankamuadalah variabel acak, dan jikaSebuah
danBadalah konstanta, maka varians var(kapak+oleh)diberikan dalam persamaan (P.20) sebagai

var(kapak+oleh) =Sebuah2var(x) +B2var(kamu) +2abcov(X, Y)


( )
Dalam penaksirC1B1+C2B2 , keduanyaB1danB2adalah variabel acak, karena kita tidak tahu apa mereka
nilai akan sampai sampel diambil dan perkiraan dihitung. Menerapkan (H.20), kami memiliki
() ( ) ( ) ( ) ( )
var |x =varC1B1+C2B2|x =C21varB1|x + C22varB2|x + 2C1C2covB1,B2|x (3.8)

Varians (s dan)d kovarians dari penduga kuadrat terkecil diberikan dalam (2.14)–(2.16). Kita
( )
perkiraan var |x=varC1B1+C2B2|xdengan mengganti varians dan kovarians yang tidak diketahui
dengan varians dan kovarians yang diperkirakan pada (2.20)–(2.22). Kemudian
()( ) () ( ) ( )
varC 1B1+C2B2|x=Cvar211 B|x + C22varB|x + 2cc
⋀. ⋀. ⋀.

var |x= 1 2covB1,B2|x


⋀.

⋀.
2 (3.9)

Kesalahan standar =C1B1+C2B2adalah akar kuadrat dari varians yang diperkirakan,


()( ) ⋀.( )
se = seC1B1+C2B2 = varC1B1+C2B2|x (3.10)

Jika selain SR6 berlaku, atau jika sampelnya besar, penduga kuadrat terkecilB1danB2memiliki distribusi
normal. Juga benar bahwa kombinasi linear dari variabel-variabel yang terdistribusi normal adalah
terdistribusi normal, sehingga
[()]
|x=C1B1+C2B2~nλ.,var |x
( )
dimana var |xdiberikan dalam (3.8). Anda mungkin berpikir berapa lama perhitungan seperti itu akan berlangsung

menggunakan kalkulator, tapi jangan khawatir. Sebagian besar perangkat lunak komputer akan melakukan perhitungan untuk Anda.
Sekarang saatnya untuk contoh.

CONTOH 3 . 7Memperkirakan Pengeluaran Makanan yang Diharapkan

Seorang eksekutif mungkin bertanya kepada staf peneliti, "Beri saya Menggunakan 40 pengamatan dalam file datamakanan, di
perkiraan pengeluaran makanan mingguan rata-rata oleh rumah Bagian 2.3.2, kami memperoleh regresi pas,
tangga dengan pendapatan mingguan $2.000." Menafsirkan kata ⋀.

eksekutif "rata-rata" berarti "nilai yang diharapkan," untuk model MAKANAN_EXP=83.4160 + 10.2096PENGHASILAN
pengeluaran makanan ini berarti memperkirakan
Estimasi titik rata-rata pengeluaran makanan mingguan untuk rumah tangga
E(MAKANAN_EXP|PENGHASILAN) =1+2PENGHASILAN dengan pendapatan $2.000 adalah
⋀.

Ingat bahwa kita mengukur pendapatan dalam $100 unit dalam


E(MAKANAN_EXP|PENGHASILAN=20) =B1+B220
contoh ini, jadi pendapatan mingguan sebesar $2.000 sesuai
dengan PENGHASILAN=20. Eksekutif meminta perkiraan =83.4160 + 10.2096(20) = 287.6089

E(MAKANAN_EXP|PENGHASILAN=20) =1+220 Kami memperkirakan bahwa pengeluaran makanan yang diharapkan oleh sebuah rumah

tangga dengan pendapatan $2.000 adalah $287,61 per minggu.


yang merupakan kombinasi linier dari parameter.
3.6 Kombinasi Linear Parameter 131

CONTOH 3 . 8Perkiraan Interval Pengeluaran Makanan yang Diharapkan

Jika asumsi SR6 berlaku, dan diberikanx, penduga memiliki Untuk mendapatkan kesalahan standar untukB1+B220, pertama-tama kita hitung
distribusi normal. Kita dapat membentuk variabel acak normal varians yang diperkirakan
standar sebagai ⋀. ( ) ()( ⋀.
( ))
varB1+ 20B2 =varB1+ 202 ×varB2
⋀.

λ - λ.
Z=( ) ~n(0,1) ( (
⋀.
))
var |x + 2×20×covB1,B2
( )
=1884,442 + 202×4.3818
Mengganti varians sebenarnya pada penyebut dengan estimasi
varians dikawinkan, kami membentuk pentingT-statistik + (2×20×(−85.9032))
( )( )
λ - λ. λ - λ. C1B1+C2B - C1β.1+C2β. 2 =2001.0169
T=( ) = ()= (2 ) ( )
se seC1B1+C2B2
⋀.

Diberikan varB1+ 20B2 =201.0169, standar yang sesuai


⋀.

var
kesalahan dard adalah2

~T(n2) (3.11) ( ) ⋀. ( )
seB1+ 20B2 = varB1+ 20B2 =2001.0169
JikaTCadalah 1( –Dan2 persen)nilai dariT(n2)distribusi,
makaP-TC≤.T≤.TC =1 . Pengganti (3.11) untukTdan =14.1780
mengatur ulang untuk mendapatkan

[( Interval 95% es(waktu dari )E(MAKANAN_MANTAN(P|PENGHASILAN


) ( ) )=
P C1B1+C2B2 - TCseC1B1+C2B2 ≤.C1β.1+C2β.2 20) =1+2(20) adalahB1+B220±T(0,975,38)seB1+B220 atau
( ) ( )] [287.6089 2.024 (14.1780),287.6089 + 2.024 (14.1780)]
≤.C1B1+C2B2 + TCseC1B1+C2B2 =1
=[258.91,316.31]
Jadi, estimasi interval 100(1 )% untukC1β.1+C2β.2adalah
( )( ) Kami memperkirakan dengan keyakinan 95% bahwa pengeluaran makanan
C1B1+C2B2±TCseC1B1+C2B2
yang diharapkan oleh rumah tangga dengan pendapatan $2.000 adalah
Dalam Contoh 2.5, kami memperoleh matriks kovarians yang antara $258,91 dan $316,31.
diperkirakan

[ () ⋀. ( )] C PENGHASILAN
varB1 covB1,B2
⋀.

(
⋀.
) () =C 1884,442 85.9032
covB1,B2 varB2
⋀.

PENGHASILAN-85.9032 4.3818

3.6.1 Menguji Kombinasi Linear Parameter


Sejauh ini, kami telah menguji hipotesis yang melibatkan hanya satu parameter regresi pada satu waktu.
Artinya, hipotesis kami berbentukH0:Β.k=C. Lebih banyak lagihipotesis linier umummelibatkan kedua
parameter dan dapat dinyatakan sebagai

H0:C1β.1+C2β.2=C0 (3.12a)

di manaC0,C1, danC2adalah konstanta tertentu, denganC0menjadi nilai hipotesis. Terlepas dari kenyataan bahwa
hipotesis nol melibatkan kedua koefisien, itu masih merupakan hipotesis tunggal untuk diuji menggunakanT
-statistik. Kadang-kadang, itu ditulis secara ekuivalen dalam bentuk implisit sebagai
( )
H0:C1β.1+C2β.2-C0= 0 (3.12b)

............................................................................................................................................

2Nilai 201,0169 diperoleh dengan menggunakan perangkat lunak komputer. Jika Anda melakukan perhitungan dengan tangan menggunakan angka-angka yang
disediakan, Anda mendapatkan 201.034. Jangan khawatir jika Anda mendapatkan perbedaan kecil seperti ini sesekali, karena kemungkinan besar adalah
perbedaan antara solusi yang dihasilkan komputer dan perhitungan tangan.
132BAB 3 Estimasi Interval dan Pengujian Hipotesis

Hipotesis alternatif untuk hipotesis nol dalam (3.12a) mungkin adalah

saya.H1:C1β.1+C2β.2≠.C0mengarah ke dua ekorT-uji


ii.H1:C1β.1+C2β.2>C0mengarah ke ekor kananT-test [Null mungkin “”]
aku aku aku.H1:C1β.1+C2β.2<C0mengarah ke ekor kiriT-test [Null mungkin “”]

Jika bentuk implisit digunakan, hipotesis alternatif juga disesuaikan.


Pengujian hipotesis (3.12) menggunakanT-statistik
( )
C1B + cb
2 2-C
T= (1 ) 0~T-2)(jika
n hipotesis nol benar (3.13)
seC1B1+C2B2
Daerah penolakan untuk alternatif satu dan dua arah (i)–(iii) sama dengan yang dijelaskan dalam
Bagian 3.3, dan kesimpulan juga ditafsirkan dengan cara yang sama.
Bentuk (rm dariT-)statistik sangat mirip dengan aslinya (spesifikasi) di (3.7). Dalam
pembilang,C1B1+C2B2adalah penduga tak bias linier terbaik dariC1β.1+C2β.2, dan jika kesalahan
terdistribusi normal, atau jika kita memiliki sampel yang besar, estimator ini juga terdistribusi
normal.

CONTOH 3 . 9Menguji Pengeluaran Makanan yang Diharapkan

Model pengeluaran makanan yang diperkenalkan di Bagian 2.1 dan Daerah penolakan untuk uji ekor kanan
digunakan sebagai ilustrasi di seluruh memberikan contoh yang sangat baik diilustrasikan pada Gambar 3.2. Untuk uji arah kanan
tentang bagaimanahipotesis linierdalam (3.12) dapat digunakan dalam pada = 0.05 tingkat signifikansi,T-nilai kritis adalah
praktik. Untuk sebagian besar kota menengah dan besar, ada perkiraan persentil ke-95 dari T(38)distribusi, yaituT(0,95, 38)= 1.686. Jika
pertumbuhan pendapatan untuk tahun mendatang. Supermarket atau toko dihitung T-nilai statistik lebih besar dari 1,686, kami akan
ritel makanan jenis apa pun akan mempertimbangkan hal ini sebelum menolak hipotesis nol dan menerima hipotesis alternatif,
fasilitas baru dibangun. Pertanyaan mereka adalah, jika pendapatan di suatu yang dalam hal ini adalah dugaan eksekutif.
daerah diproyeksikan tumbuh pada tingkat tertentu, berapa banyak yang MenghitungT-nilai statistik
akan dihabiskan untuk makanan? Seorang eksekutif mungkin berkata, ( )
berdasarkan pengalaman bertahun-tahun, "Saya berharap bahwa sebuah
B1+20
( B2250
T= )
rumah tangga dengan pendapatan mingguan $2.000 akan menghabiskan, seB1+ 20B2
rata-rata, lebih dari $250 seminggu untuk makanan." Bagaimana kita bisa
(83.4160 + 20×10.2096) 250
menggunakan ekonometrika untuk menguji dugaan ini? =
Fungsi regresi untuk model pengeluaran makanan 14.1780
adalah
287.6089 250 37.6089
= = =2.65
E(MAKANAN_EXP|PENGHASILAN) =1+2PENGHASILAN 14.1780 14.1780
SejakT=2.65>TC=1.686, kami menolak hipotesis nol bahwa rumah tangga
Dugaan eksekutif adalah bahwa
dengan pendapatan mingguan $2.000 akan menghabiskan $250 per minggu
E(MAKANAN_EXP|PENGHASILAN=20) =1+220>250 atau kurang untuk makanan dan menyimpulkan bahwa dugaan eksekutif
bahwa rumah tangga tersebut menghabiskan lebih dari $250 adalah benar,
Untuk menguji validitas pernyataan ini, kami menggunakannya sebagai
dengan kemungkinan kesalahan Tipe I 0,05.
hipotesis alternatif
Dalam Contoh 3.8, kami memperkirakan bahwa sebuah rumah
H1:Β.1+220>250,atauH1:Β.1+220 250>0 tangga dengan pendapatan mingguan $2.000 akan membelanjakan
$287.6089, yang lebih besar dari nilai spekulasi eksekutif sebesar $250.
Hipotesis nol yang sesuai adalah alternatif logis untuk Namun, sekadar mengamati bahwa nilai taksiran lebih besar dari $250
pernyataan eksekutif bukanlah uji statistik. Mungkin secara numerik lebih besar, tetapi
apakah itusecara signifikanlebih besar? ItuT-test memperhitungkan
H0:Β.1+220≤.250,atauH0:Β.1+220 250≤.0
presisi yang kita gunakan untuk memperkirakan tingkat pengeluaran
Perhatikan bahwa hipotesis nol dan hipotesis alternatif dalam bentuk ini dan juga mengontrol kemungkinan kesalahan Tipe I.
yang sama dengan hipotesis linier umum denganC1= 1,C2= 20, danC0=
250.
3.7 Latihan133

3.7 Latihan

3.7.1Masalah
3.1Ada 64 negara pada tahun 1992 yang berkompetisi di Olimpiade dan memenangkan setidaknya satu medali.
Membiarkan MEDALImenjadi jumlah total medali yang dimenangkan, dan mariGDPBmenjadi PDB (miliar dolar 1995).
Model regresi linier yang menjelaskan jumlah medali yang diperoleh adalahMEDALI=1+2GDPB+e. Hubungan yang
diperkirakan adalah

⋀.

MEDALI=B1+B2GDPB=7.61733 + 0.01309GDPB
(se) (2,38994) (0,00215) (XR3.1)

Sebuah.Kami ingin menguji hipotesis bahwa tidak ada hubungan antara jumlah medali yang dimenangkan
dan PDBterhadap alternatif ada hubungan positif. Nyatakan hipotesis nol dan hipotesis alternatif dalam
hal parameter model.
B.Apa statistik uji untuk bagian (a) dan bagaimana distribusinya jika hipotesis nol benar?
C.Apa yang terjadi pada distribusi statistik uji untuk bagian (a) jika hipotesis alternatif benar? Apakah
distribusinya digeser ke kiri atau ke kanan, relatif terhadap yang biasa?T-distribusi? [Petunjuk:
Berapakah nilai harapan dariB2jika hipotesis nol benar, dan bagaimana jika alternatifnya benar?]

D.Untuk pengujian pada tingkat signifikansi 1%, untuk berapa nilaiT-statistik akankah kita menolak hipotesis
nol pada bagian (a)? Untuk nilai apa kita akan gagal menolak hipotesis nol?
e.LakukanT-uji hipotesis nol pada bagian (a) pada tingkat signifikansi 1%. Apa kesimpulan
ekonomi Anda? Apa arti tingkat signifikansi 1% dalam contoh ini?
3.2Ada 64 negara pada tahun 1992 yang berkompetisi di Olimpiade dan memenangkan setidaknya satu medali.
Membiarkan MEDALImenjadi jumlah total medali yang dimenangkan, dan mariGDPBmenjadi PDB (miliar dolar
1995). Model regresi linier yang menjelaskan jumlah medali yang diperoleh adalahMEDALI=1+2GDPB+e.
Estimasi hubungan diberikan dalam persamaan (XR3.1) pada Latihan 3.1.
Sebuah.Kami ingin menguji hipotesis nol bahwa peningkatan satu miliar dolar dalamPDBmengarah pada peningkatan
rata-rata, atau diharapkan, jumlah medali yang dimenangkan sebesar 0,015, dibandingkan alternatif yang tidak.
Nyatakan hipotesis nol dan hipotesis alternatif dalam hal parameter model.
B.Apa statistik uji untuk bagian (a) dan bagaimana distribusinya jika hipotesis nol benar?
C.Apa yang terjadi pada distribusi statistik uji pada bagian (a) jika hipotesis alternatif benar? Apakah
distribusinya digeser ke kiri atau ke kanan, relatif terhadap yang biasa?T-distribusi, atau arah
pergeseran tidak pasti? [Petunjuk: Berapakah nilai harapan dariB2jika hipotesis nol benar, dan
bagaimana jika alternatifnya benar?]
D.Untuk pengujian pada tingkat signifikansi 10%, untuk berapa nilaiT-statistik, akankah kita menolak hipotesis
nol pada bagian (a)? Untuk nilai apa, kita akan gagal menolak hipotesis nol?
e.LakukanT-uji hipotesis nol pada bagian (a). Apa kesimpulan ekonomi Anda?
F.Jika kita melakukan pengujian pada bagian (a) pada taraf signifikansi 5%, apa yang kita simpulkan? Pada
tingkat signifikansi 1%, apa yang kita simpulkan?
G.Lakukan pengujian yang sama pada taraf signifikansi 5%, tetapi ubah nilai hipotesis nol yang diminati
menjadi 0,016, kemudian 0,017. Apa yang dihitung?T-nilai statistik dalam setiap kasus? Hipotesis mana
yang Anda tolak, dan mana yang gagal Anda tolak?

3.3Ada 64 negara pada tahun 1992 yang berkompetisi di Olimpiade dan memenangkan setidaknya satu medali.
Membiarkan MEDALImenjadi jumlah total medali yang dimenangkan, dan mariGDPBmenjadi PDB (miliar dolar
1995). Model regresi linier yang menjelaskan jumlah medali yang diperoleh adalahMEDALI=1+2GDPB+e.
Estimasi hubungan diberikan dalam persamaan (XR3.1) pada Latihan 3.1.
Estimasi kovarians antara penduga kemiringan dan intersep adalah 0,00181 dan varian galat yang
diestimasi adalah2= 320,336. Rata-rata sampel dariGDPBadalahGDPB=390,89 dan varians sampel dari
GDPBadalahS2 GDPB =1099615.
Sebuah.Perkirakan jumlah medali yang diharapkan dimenangkan oleh suatu negara denganGDPB=25.
⋀. ( ) ()
+ (25)2varB2+
⋀.

B.Hitung galat baku pendugaan dalam (a) dengan menggunakan var variansB1
(
⋀.
)
(2)(25) covB1,B2 .
134BAB 3 Estimasi Interval dan Pengujian Hipotesis

{
C.Hitung galat baku pendugaan pada (a) dengan menggunakan varians2 (1Dann) +
[( ) 2// ]}
)
25GDPB (n-1)S2 GDPB .
D.Buatlah perkiraan interval 95% untuk perkiraan jumlah medali yang dimenangkan oleh suatu negara
dengan GDPB=25.
e.Buatlah perkiraan interval 95% untuk perkiraan jumlah medali yang dimenangkan oleh suatu negara dengan GDPB=
300. Bandingkan dan kontraskan perkiraan interval ini dengan yang di bagian (d). Jelaskan perbedaan yang Anda
amati.

3.4Asumsikan bahwa asumsi SR1-SR6 berlaku untuk model regresi linier sederhana,kamusaya=1+2xsaya+esaya, saya=1,…,n.
Umumnya, sebagai ukuran sampelnmenjadi lebih besar, interval kepercayaan menjadi lebih sempit.

Sebuah.Apakah interval kepercayaan yang lebih sempit untuk parameter, seperti2, diinginkan? Jelaskan mengapa atau mengapa tidak.
B.Memberiduaalasan spesifik mengapa, ketika ukuran sampel semakin besar, interval kepercayaan untuk2cenderung
menjadi lebih sempit. Alasan harus berhubungan dengan sifat-sifat estimator kuadrat terkecil dan/atau prosedur
estimasi interval.

3.5Jika kita memiliki sampel data yang besar, maka gunakan nilai kritis dari distribusi normal standar untuk
membangun aP-nilaidibenarkan. Tapi seberapa besar "besar" itu?
Sebuah.Untuk sebuahT-distribusi dengan 30 derajat kebebasan, ekor kananP-nilai untukT-statistik 1,66 adalah
0,05366666. Berapa perkiraannya?P-nilai menggunakan fungsi distribusi kumulatif dari distribusi normal
standar, (z), dalam Tabel Statistik 1? Menggunakan uji ekor kanan dengan = 0.05, apakah Anda akan
membuat keputusan yang benar tentang hipotesis nol menggunakan perkiraanP-nilai? Apakah tepatnya?
P-nilainya lebih besar atau lebih kecil untukT-distribusi dengan 90 derajat kebebasan?
B.Untuk sebuahT-distribusi dengan 200 derajat kebebasan, ekor kananP-nilai untukT-statistik 1,97 adalah 0,0251093.
Berapa perkiraannya?P-nilai menggunakan distribusi normal standar? Menggunakan sebuah tes dua ekordengan
= 0.05, apakah Anda akan membuat keputusan yang benar tentang hipotesis nol menggunakan perkiraanP-nilai?
Apakah tepatnya?P-nilainya lebih besar atau lebih kecil untukT-distribusi dengan 90 derajat kebebasan?

C.Untuk sebuahT-distribusi dengan 1000 derajat kebebasan, ekor kananP-nilai untukT-statistik 2.58 adalah
0.00501087. Berapa perkiraannya?P-nilai menggunakan distribusi normal standar? Menggunakan uji dua
sisi dengan = 0.05, apakah Anda akan membuat keputusan yang benar tentang hipotesis nol
menggunakan perkiraanP-nilai? Apakah tepatnya?P-nilainya lebih besar atau lebih kecil untukT-distribusi
dengan 2000 derajat kebebasan?

3.6Kami memiliki data pada 2323 rumah tangga yang dipilih secara acak yang terdiri dari tiga orang pada tahun 2013. Mari
MASUKKANmenunjukkan pengeluaran hiburan bulanan ($) per orang per bulan dan biarkanPENGHASILAN ($100)
menjadi pendapatan rumah tangga bulanan. Perhatikan model regresi linier sederhanaMASUKKANsaya= β.1+2
PENGHASILANsaya+esaya,saya=1,…,2323. Asumsikan bahwa asumsi SR1–SR6 berlaku. kuadrat terkecil
⋀.

persamaan yang diperkirakan adalahMASUKKANsaya=9,820 + 0,503PENGHASILANsaya. Kesalahan standar


penaksir koefisien kemiringan adalah seB2= 0.029, kesalahan standar dari penduga intersep adalah seB1= 2.
419, dan taksiran kovarians antara penduga kuadrat terkecilB1danB2adalah 0,062.
Sebuah.Buatlah estimasi interval kepercayaan 90% untuk2dan menafsirkannya untuk sekelompok CEO
dari industri hiburan.
B.CEO AMC Entertainment Mr. Lopez meminta Anda untuk memperkirakan pengeluaran hiburan bulanan rata-rata per
orang untuk rumah tangga dengan pendapatan bulanan (untuk rumah tangga dengan tiga orang)
dari $7500. Apa perkiraan Anda?
C.Ekonom staf AMC Entertainment meminta Anda untuk memperkirakan varians penaksir B1+ 75
B2. Apa perkiraan Anda?
D.AMC Entertainment berencana untuk membangun teater mewah di lingkungan dengan pendapatan
bulanan rata-rata, untuk rumah tangga tiga orang, sebesar $7500. Staf ekonom mereka telah menentukan
bahwa agar teater dapat menguntungkan, rata-rata rumah tangga harus menghabiskan lebih dari $45 per
orang per bulan untuk hiburan. Tuan Lopez meminta Anda untuk memberikan bukti statistik yang
meyakinkan, tanpa keraguan, bahwa teater yang diusulkan akan menguntungkan. Atur hipotesis nol dan
alternatif dengan hati-hati, berikan statistik uji, dan uji daerah penolakan menggunakan = 0.01. Dengan
menggunakan informasi dari bagian pertanyaan sebelumnya, lakukan tes dan berikan hasilnya kepada
CEO AMC Entertainment.
e.Elastisitas pendapatan dari pengeluaran hiburan pada titik rata-rata adalah =
/
β.2PENDAPATAN ENTERT.Rata-rata sampel dari variabel-variabel ini adalahMASUKKAN=45,93 dan
3.7 Latihan135

PENGHASILAN=71.84. Uji hipotesis nol bahwa elastisitasnya adalah 0,85 terhadap alternatif yang bukan
0,85, dengan menggunakan = 0.05 tingkat signifikansi.
F.Menggunakan Tabel Statistik 1, hitung perkiraan dua ekorP-val(ue untukT-statistik di) bagian (e).
/
MenggunakanP-nilai aturan, apakah Anda menolak hipotesis nol =2PENDAPATAN ENTERT=0,85,
versus alternatif≠.0.85, pada tingkat signifikansi 10%? Menjelaskan.
3.7Kami memiliki data tahun 2008 tentangPENGHASILAN=pendapatan per kapita (dalam ribuan dolar) dan
SARJANA= persentase populasi dengan gelar sarjana atau lebih untuk 50 Negara Bagian AS ditambah
Distrik Columbia, totaln=51 pengamatan. Hasil dari regresi linier sederhana dariPENGHASILAN di
SARJANAadalah
⋀.

PENGHASILAN= (Sebuah) +1.029SARJANA


se (2.672) (C)
T (4.31) (10.75)

Sebuah.Dengan menggunakan informasi yang diberikan, hitung perkiraan intersep. Tunjukkan pekerjaan Anda.
B.Buat sketsa hubungan yang diperkirakan. Apakah bertambah atau berkurang? Apakah itu hubungan positif atau terbalik?
Apakah itu meningkat atau menurun pada tingkat yang konstan atau itu meningkat atau menurun pada tingkat yang
meningkat?
C.Dengan menggunakan informasi yang diberikan, hitung kesalahan standar dari koefisien kemiringan. Tunjukkan pekerjaan
Anda.
D.Berapakah nilaiT-statistik untuk hipotesis nol bahwa parameter intersep sama dengan 10?
e.ItuP-nilai untuk uji dua sisi yang parameter intersepnya sama dengan 10, dari bagian (d), adalah 0,572.
TunjukkanP-nilai dalam sketsa. Pada sketsa, tunjukkan daerah penolakan jika = 0.05.
F.Buat estimasi interval 99% dari kemiringan. Menafsirkan perkiraan interval.
G.Uji hipotesis nol bahwa koefisien kemiringan adalah satu terhadap alternatif yang tidak satu
pada tingkat signifikansi 5%. Nyatakan hasil ekonomi dari tes, dalam konteks masalah ini.
3.8Menggunakan data 2011 di 141 universitas riset publik AS, kami menguji hubungan antara biaya per
siswa dan pendaftaran universitas penuh waktu. MembiarkanAC=biaya akademik riil per siswa (ribuan
dolar), dan mariFTESTU=pendaftaran siswa penuh waktu (ribuan siswa). kuadrat terkecil cocok-
⋀.

hubungan ted adalahAC=14.656 + 0.266FTESTU.


Sebuah.Untuk regresi, estimasi interval 95% untuk intersep adalah [10,602, 18,710]. Hitung kesalahan
standar dari perkiraan intersep.
B.Dari keluaran regresi, standar eror untuk koefisien kemiringan adalah 0,081. Uji hipotesis nol bahwa kemiringan
sebenarnya,2, adalah 0,25 (atau kurang) terhadap alternatif yang kemiringan sebenarnya lebih besar dari 0,25
menggunakan tingkat signifikansi 10%. Tunjukkan semua langkah uji hipotesis ini, termasuk hipotesis nol dan
hipotesis alternatif, dan nyatakan kesimpulan Anda.
C.Pada keluaran regresi, yang disediakan secara otomatisP-nilai untuk perkiraan kemiringan adalah 0,001. Apa arti dari
nilai ini? Gunakan sketsa untuk mengilustrasikan jawaban Anda.
D.Seorang anggota dewan pengawas menyatakan bahwaACharus jatuh jika kita menerima lebih banyak siswa.
Dengan menggunakan persamaan taksiran dan informasi pada bagian (a)–(c), uji hipotesis nol bahwa
parameter kemiringan2adalah nol, atau positif, terhadap hipotesis alternatif yang negatif. Gunakan tingkat
signifikansi 5%. Tunjukkan semua langkah uji hipotesis ini, termasuk hipotesis nol dan hipotesis alternatif,
dan nyatakan kesimpulan Anda. Apakah ada dukungan statistik untuk dugaan anggota dewan?

e.Pada tahun 2011, Universitas Negeri Louisiana (LSU) memiliki pendaftaran siswa penuh waktu 27.950. Berdasarkan
persamaan taksiran, taksiran kuadrat terkecil dariE(AC|FTESTU=27,950) adalah 22,079, dengan kesalahan standar
0,964. Nilai sebenarnya dariACuntuk LSU tahun itu adalah 21.403. Apakah Anda akan mengatakan bahwa nilai ini
mengejutkan atau tidak mengejutkan? Menjelaskan.

3.9Menggunakan data dari tahun 2013 pada 64 perempuan kulit hitam, estimasi regresi linier antaraGAJI(penghasilan per
⋀.

jam, dalam $) dan tahun pendidikan,PENDIDIKANadalahGAJI=8.45 + 1.99PENDIDIKAN.

Sebuah.Standar error dari estimasi koefisien kemiringan adalah 0,52. Bangun dan tafsirkan perkiraan interval 95%
untuk efek satu tahun pendidikan tambahan pada tingkat upah per jam yang diharapkan dari perempuan kulit
hitam.
B.Kesalahan standar dari perkiraan intersep adalah 7,39. Uji hipotesis nol bahwa intersep β.1= 0
terhadap alternatif bahwa intersep sebenarnya tidak nol, dengan menggunakan tingkat signifikansi
= 0,10. Dalam jawaban Anda, tunjukkan (i) hipotesis nol dan alternatif formal, (ii) statistik uji dan
136BAB 3 Estimasi Interval dan Pengujian Hipotesis

distribusinya di bawah hipotesis nol, (iii) daerah penolakan (dalam gambar), (iv) nilai statistik uji
yang dihitung, dan (v) nyatakan kesimpulan Anda, dengan interpretasi ekonominya.
C.Perkirakan upah yang diharapkan untuk seorang wanita kulit hitam dengan pendidikan 16 tahun,E(GAJI|PENDIDIKAN=16).
D.Kovarians yang diperkirakan antara intersep dan kemiringan adalah 3.75. Buatlah perkiraan interval 95% untuk upah
yang diharapkan untuk wanita kulit hitam dengan pendidikan 16 tahun.
e.Diperkirakan bahwa seorang wanita kulit hitam dengan pendidikan 16 tahun akan memiliki upah yang
diharapkan lebih dari $23 per jam. Gunakan ini sebagai "hipotesis alternatif" dalam uji dugaan pada
tingkat signifikansi 10%. Apakah bukti mendukung dugaan atau tidak?

3.10Menggunakan data dari tahun 2013 pada 64 perempuan kulit hitam, perkiraan regresi log-linear antaraGAJI(menghasilkan-
⋀.

ing per jam, dalam $) dan tahun pendidikan,PENDIDIKANadalah ln(GAJI) =1,58 + 0,09PENDIDIKAN. Terlapor T-statistik
untuk koefisien kemiringan adalah 3,95.

Sebuah.Uji pada tingkat signifikansi 5%, hipotesis nol bahwa pengembalian ke tahun pendidikan
tambahan kurang dari atau sama dengan 8% terhadap alternatif bahwa tingkat pengembalian
pendidikan lebih dari 8%. Dalam jawaban Anda, tunjukkan (i) hipotesis nol dan alternatif formal, (ii)
statistik uji dan distribusinya di bawah hipotesis nol, (iii) daerah penolakan (dalam gambar), (iv) nilai
yang dihitung dari tes statistik, dan (v) nyatakan kesimpulan Anda, dengan interpretasi
ekonominya.
B.Menguji hipotesis nol bahwa pengembalian ke pendidikan adalah 8%, melawan alternatif bahwa itu bukan
8%, kami memperolehP-nilai 0,684. Apakah yangP-nilai untuk tes di bagian (a)? Dalam sketsa, tunjukkan
untuk pengujian pada bagian (a)P-nilai dan 5% nilai kritis dariT-distribusi.
C.Buatlah perkiraan interval 90% untuk kembali ke tahun pendidikan tambahan dan nyatakan
interpretasinya.
3.11Teori penawaran tenaga kerja menunjukkan bahwa lebih banyak jasa tenaga kerja akan ditawarkan dengan upah yang
lebih tinggi. SeandainyaHRSWKadalah jumlah jam kerja biasa per minggu oleh orang yang dipilih secara acak danGAJI
adalah upah per jam mereka. Model regresi kami ditentukan sebagaiHRSWK=1+2GAJI+e. Menggunakan sampel
⋀.

dari 9799 individu dari tahun 2013, kami memperoleh estimasi regresiHRSWK=41,58 + 0,011GAJI.
Estimasi varians dan kovarians dari estimator kuadrat terkecil adalah sebagai berikut:

MENCEGAT GAJI
MENCEGAT 0,02324 0,00067
GAJI 0,00067 0,00003

Sebuah.Uji hipotesis nol bahwa hubungan tersebut memiliki kemiringan yang kurang dari, atau sama dengan, nol pada tingkat
signifikansi 5%. Nyatakan hipotesis nol dan hipotesis alternatif dalam hal parameter model. Dengan menggunakan hasilnya,
apakah kita mengkonfirmasi atau menyangkal teori penawaran tenaga kerja?
B.Gunakan Tabel Statistik 1 dari probabilitas normal untuk menghitung perkiraanP-nilai untuk tes di
(Sebuah). Gambarlah sketsa yang mewakiliP-nilai.
C.Di bawah asumsi SR1-SR6 dari model regresi sederhana, jumlah jam kerja yang diharapkan per minggu
adalahE(HRSWK|GAJI) =1+2GAJI. Buatlah perkiraan interval 95% untuk perkiraan jumlah jam kerja per
minggu untuk seseorang yang berpenghasilan $20/jam.
D.Dalam sampel, ada 203 individu dengan upah per jam $20. Jumlah jam kerja rata-rata untuk orang-
orang ini adalah 41,68. Apakah hasil ini sesuai dengan estimasi interval pada (c)? Jelaskan alasan
Anda.
e.Uji hipotesis nol bahwa jam kerja yang diharapkan untuk seseorang yang berpenghasilan $20 per jam adalah 41,68,
dibandingkan dengan alternatif yang tidak, pada tingkat signifikansi 1%.

3.12Pertimbangkan regresi log-linear untuk penjualan mingguan (jumlah kaleng) tuna kaleng merek
nasional (SAL1 = penjualan merek target) sebagai fungsi rasio harganya dengan harga pesaing,
Rp3 = 100 (harga merek target÷.harga bersaing merek #3), ln(SAL1) =1+ γ.2Rp3 +e. Menggunakan
n=52 pengamatan mingguan persamaan estimasi kuadrat terkecil adalah

ln(SAL1) = 11,481 0,031Rp3


(se) (0,535) (0,00529)

Sebuah.variabelRp3 adalah harga merek target sebagai persentase dari harga merek pesaing #3 atau
lebih sederhananya "harga relatif". Rata-rata sampel dariRp3 adalah 99,66, mediannya
3.7 Latihan137

adalah 100, nilai minimumnya adalah 70,11, dan nilai maksimumnya adalah 154,24. Apa yang dikatakan statistik
ringkasan ini kepada kita tentang harga merek target relatif terhadap harga pesaingnya?
B.Interpretasikan koefisien dariRp3. Apakah tandanya masuk akal secara ekonomi?
C.Membangun dan menafsirkan perkiraan interval 95% untuk efek pada penjualan mingguan,SAL1, dari
kenaikan 1% dalam harga merek target sebagai persentase dari harga merek pesaing #3, yang
merupakan harga relatifRp3.
D.Lakukan uji hipotesis nolH0:Γ.2≥ -0.02 melawan alternatifH1:Γ.2<0.02 menggunakan = 0.01
tingkat signifikansi. Cantumkan dalam jawaban Anda (i) statistik uji dan distribusinya jika
hipotesis nol benar, (ii) sketsa daerah penolakan, (iii) tunjukkan letak nilai statistik uji, (iv)
nyatakan kesimpulan Anda, dan (v) tunjukkan pada sketsa daerah yang mewakiliP-nilai.

e.“Uji hipotesis dan penduga interval untuk model regresi adalah valid selama istilah kesalahan regresi
berdistribusi normal.” Apakah ini benar atau salah? Menjelaskan.
3.13Pertimbangkan model respons area perkiraan berikut untuk tebu (luas tebu yang ditanam dalam
ribuan hektar di wilayah Bangladesh), sebagai fungsi dari harga relatif (100 kali harga tebu
dibagi dengan harga goni, yaitu tanaman alternatif pengganti tebu, ditanam oleh Bangladesh
⋀.

petani),DAERAHT=0,24 + 0,50RpTmenggunakan 34 pengamatan tahunan.


Sebuah.Rata-rata sampel dariRpadalah 114,03, dengan minimum 74,9 dan maksimum 182,2. Rp
adalah harga tebu yang diambil sebagai persentase dari harga goni. Apa statistik sampel ini
memberitahu kita tentang harga relatif tebu?
B.Menafsirkan intersep dan kemiringan dari hubungan yang diestimasi.
C.ItuT-statistik adalah 0,01 untuk hipotesis bahwa parameter intersep adalah nol. Apa yang Anda simpulkan? Apakah
ini hasil yang mengejutkan secara ekonomi? Menjelaskan.
D.Rata-rata sampel luas tanam 56,83 ribu hektar, dan rata-rata sampel untuk harga relatif adalah 114,03.
Dengan mengambil nilai-nilai ini seperti yang diberikan, ujilah pada tingkat signifikansi 5% hipotesis
bahwa elastisitas respon daerah terhadap harga pada rata-rata adalah 1,0. Estimasi varians dari koefisien
Rpadalah 0,020346.
( )
⋀.

e.Model diestimasi ulang dalam bentuk log-linear, memperoleh lnDAERAHT=3,21 + 0,0068RpT.


Interpretasikan koefisien dariRp. Kesalahan standar estimasi kemiringan adalah 0,00229. Apa yang
dapat kita ketahui tentang perkiraan hubungan?
F.Dengan menggunakan model di (e), ujilah hipotesis nol bahwa kenaikan 1% harga tebu relatif
terhadap harga rami meningkatkan luas tanam tebu sebesar 1%. Gunakan tingkat
signifikansi 5% dan uji dua sisi. Cantumkan (i) statistik uji dan distribusinya jika hipotesis nol
benar, (ii) sketsa daerah penolakan, (iii) tunjukkan letak nilai statistik uji, (iv) nyatakan
kesimpulan Anda, dan (v) tunjukkan pada sketsa, wilayah yang akan mewakiliP-nilai.
3.14Apa arti dari signifikansi statistik dan seberapa berharga konsep ini? SEBUAHT-statistik adalah T=(B-C)∕
se(B), di manaBadalah estimasi parameter ,Cadalah nilai yang dihipotesiskan, dan se(B) adalah
kesalahan standar. Jika ukuran sampelnbesar, maka statistik mendekati distribusi normal standar jika
hipotesis nol =Cadalah benar.
Sebuah.Dengan tingkat signifikansi 5%, kami menegaskan bahwa peristiwa yang terjadi dengan peluang kurang dari satu dalam
20 adalah "signifikan secara statistik", sedangkan peristiwa yang terjadi dengan peluang lebih dari satu dalam 20 tidak
signifikan secara statistik. Benar atau salah?
B.Apakah Anda akan mengatakan sesuatu yang terjadi satu kali dalam 10 secara kebetulan (10%) sangat tidak mungkin atau tidak terlalu
tidak mungkin? Apakah Anda akan mengatakan sesuatu yang terjadi satu kali dalam 100 secara kebetulan (1%) sangat tidak mungkin
atau tidak?
C.Jika kita mengadopsi aturan bahwa dalam sampel besar, aT-nilai lebih besar dari 2,0 (dalam nilai absolut)
menunjukkan signifikansi statistik, dan kami menggunakan Tabel Statistik 1 dari probabilitas kumulatif normal
standar, apa tingkat signifikansi tersirat? Jika kita mengadopsi aturan bahwa dalam sampel besar, aT-nilai lebih
besar dari 3,0 (dalam nilai absolut) menunjukkan signifikansi statistik, apa tingkat signifikansi tersirat?
D.Misalkan kita secara klinis menguji dua pil diet, satu disebut "Terpercaya" dan yang lain disebut "Lainnya".
Menggunakan pil Handal, perkiraan penurunan berat badan adalah 5 lbs dengan kesalahan standar 0,5 lbs.
Dengan pil More, perkiraan penurunan berat badan adalah 20 lbs dengan kesalahan standar 10 lbs. Saat menguji
apakah penurunan berat badan yang sebenarnya adalah nol (hipotesis nol, atau tidak sama sekali), apaT-nilai
statistik? Berapakah perbandinganT-nilai-nilai?
e.Jika obat-obatan yang Dapat Diandalkan dan Lebih Banyak setara dalam hal keamanan, biaya, dan setiap perbandingan lainnya, dan jika tujuan Anda

adalah penurunan berat badan, obat mana yang akan Anda gunakan? Mengapa?
138BAB 3 Estimasi Interval dan Pengujian Hipotesis

3.15Dalam persidangan pembunuhan besar-besaran, dengan potensi hukuman seumur hidup di penjara, apakah Anda sebagai hakim akan memberi tahu juri

untuk memastikan bahwa kami secara tidak sengaja menghukum orang yang tidak bersalah hanya satu kali dalam seratus, atau menggunakan ambang

batas lain? Apa yang akan terjadi?

Sebuah.Berapa biaya ekonomi dari kesalahan Tipe I dalam contoh ini? Sebutkan beberapa faktor yang harus
dipertimbangkan dalam perhitungan seperti itu.
B.Berapa biaya ekonomi dari kesalahan Tipe II dalam contoh ini? Sebutkan beberapa faktor yang harus
dipertimbangkan dalam perhitungan seperti itu.

3.16Sebuah pertanyaan besar di Amerika Serikat, pertanyaan tentang "sebab dan akibat," adalah apakah perawatan kesehatan wajib
benar-benar akan membuat orang Amerika lebih sehat. Apa peran pengujian hipotesis dalam penyelidikan semacam itu?

Sebuah.Merumuskan hipotesis nol dan hipotesis alternatif berdasarkan pertanyaan.


B.Apa yang dimaksud dengan kesalahan Tipe I dalam konteks pertanyaan ini? Faktor apa yang akan Anda
pertimbangkan jika Anda diberi tugas menghitung biaya ekonomi dari kesalahan Tipe I dalam contoh ini?
C.Apa kesalahan Tipe II dalam konteks pertanyaan ini? Faktor apa yang akan Anda pertimbangkan jika
Anda diberi tugas menghitung biaya ekonomi dari kesalahan Tipe II dalam contoh ini?
D.Jika kita amati bahwa individu yang memiliki asuransi kesehatan ternyata lebih sehat, apakah ini membuktikan bahwa kita
harus memiliki perawatan kesehatan yang wajib?
e.Ada pepatah, "Korelasi tidak menyiratkan sebab-akibat." Bagaimana pepatah ini berhubungan dengan bagian (d)?
F.Post hoc ergo propter hoc (Latin: "setelah ini, karena itu karena ini") adalah kekeliruan logis yang dibahas secara luas dalam
buku teks Prinsip Ekonomi. Contohnya adalah “Ayam berkokok dan kemudian matahari muncul, dengan demikian ayam
jantan yang berkokok menyebabkan matahari terbit.” Bagaimana kekeliruan ini berhubungan dengan pengamatan di
bagian (d)?

3.17Pertimbangkan model regresiGAJI=1+2PENDIDIKAN+e. Di manaGAJIadalah tingkat upah per jam dalam dolar AS 2013.
PENDIDIKANadalah tahun sekolah. Model diestimasi dua kali, sekali menggunakan individu dari daerah perkotaan, dan
sekali lagi untuk individu di daerah pedesaan.
⋀.

perkotaan
GAJI=10,76 + 2,46PENDIDIKAN, n=986
(se) (2.27) (0.16)
⋀.

Pedesaan
GAJI=4.88 + 1.80PENDIDIKAN, n=214
(se) (3.29) (0.24)

Sebuah.Dengan menggunakan regresi perkotaan, uji hipotesis nol bahwa kemiringan regresi sama dengan 1,80
terhadap alternatif yang lebih besar dari 1,80. Gunakan = 0.05 tingkat signifikansi. Tunjukkan semua langkah,
termasuk grafik daerah kritis dan nyatakan kesimpulan Anda.
B.Menggunakan regresi pedesaan, hitung perkiraan interval 95% untuk perkiraanGAJIjikaPENDIDIKAN=16. Standar
eror yang dibutuhkan adalah 0,833. Tunjukkan bagaimana penghitungannya menggunakan fakta bahwa perkiraan
kovarians antara koefisien intersep dan kemiringan adalah 0,761.
C.Menggunakan regresi perkotaan, hitung perkiraan interval 95% untuk perkiraanGAJIjikaPENDIDIKAN=16. Kovarians
yang diperkirakan antara koefisien intersep dan kemiringan adalah 0,345. Apakah estimasi interval untuk regresi
perkotaan lebih lebar atau lebih sempit daripada untuk regresi pedesaan pada (b). Apakah menurut Anda ini
masuk akal? Menjelaskan.
D.Dengan menggunakan regresi pedesaan, uji hipotesis bahwa parameter intersep1sama dengan empat, atau
lebih, terhadap alternatif yang kurang dari empat, pada tingkat signifikansi 1%.

3.18Sebuah perusahaan asuransi jiwa meneliti hubungan antara jumlah asuransi jiwa yang dimiliki oleh sebuah rumah
tangga dengan pendapatan rumah tangga. MembiarkanPENGHASILANmenjadi pendapatan rumah tangga (ribuan
rupiah) dan PERTANGGUNGANjumlah asuransi jiwa yang dimiliki (ribuan rupiah). Menggunakan sampel acak dari n=20
rumah tangga, perkiraan hubungan kuadrat terkecil adalah
⋀.

PERTANGGUNGAN=6,855 + 3,880PENGHASILAN
(se) (7,383) (0,112)

Sebuah.Gambarlah sketsa hubungan pas yang mengidentifikasi perkiraan kemiringan dan intersep. Rata-rata
sampel dariPENGHASILAN=59.3. Apa rata-rata sampel dari jumlah asuransi yang dimiliki? Temukan titik
sarana dalam sketsa Anda.
B.Berapa banyak yang kita perkirakan bahwa jumlah rata-rata asuransi yang dimiliki berubah dengan setiap tambahan
$1000 dari pendapatan rumah tangga? Berikan estimasi titik dan estimasi interval 95%. Jelaskan perkiraan interval
kepada sekelompok pemegang saham di perusahaan asuransi.
3.7 Latihan139

C.Buatlah estimasi interval 99% dari perkiraan jumlah asuransi yang dimiliki oleh sebuah rumah tangga dengan
pendapatan $100.000. Kovarians yang diperkirakan antara koefisien intersep dan kemiringan adalah -0,746.
D.Salah satu anggota dewan manajemen mengklaim bahwa untuk setiap peningkatan pendapatan sebesar $1000,
jumlah rata-rata asuransi jiwa yang dimiliki akan meningkat sebesar $5000. Biarkan model aljabar menjadi
PERTANGGUNGAN= β.1+2PENGHASILAN+e. Uji hipotesis bahwa pernyataan itu benar terhadap alternatif yang tidak
benar. Nyatakan dugaan dalam bentuk hipotesis nol dan hipotesis alternatif tentang parameter model. Gunakan
tingkat signifikansi 5%. Apakah data mendukung klaim tersebut atau tidak? Jelas, tunjukkan statistik uji yang
digunakan dan daerah penolakan.
e.Uji hipotesis bahwa ketika pendapatan meningkat, jumlah asuransi jiwa yang dimiliki meningkat dengan jumlah yang
sama. Artinya, uji hipotesis nol bahwa kemiringannya adalah satu. Gunakan sebagai alternatif yang kemiringannya
lebih besar dari satu. Nyatakan hipotesis nol dan hipotesis alternatif dalam hal parameter model. Lakukan
pengujian pada taraf signifikansi 1%. Tunjukkan dengan jelas statistik uji yang digunakan, dan daerah penolakan.
Apa kesimpulan Anda?

3.7.2Latihan Komputer
3.19Pemilik motel menemukan bahwa produk cacat digunakan selama konstruksi. Butuh waktu 7
bulan untuk memperbaiki cacat di mana sekitar 14 kamar di 100 unit motel tidak dapat
digunakan selama 1 bulan pada suatu waktu. Data ada di filemotel.
Sebuah.MerencanakanMOTEL_PCTdanCOMP_PCTmelawanWAKTUpada grafik yang sama. Apa yang dapat
Anda katakan tentang tingkat hunian dari waktu ke waktu? Apakah mereka cenderung bergerak bersama?
Manakah yang tampaknya memiliki tingkat hunian lebih tinggi? Perkirakan model regresiMOTEL_PCT=1+2
COMP_PCT+e. Buatlah estimasi interval 95% untuk parameter2. Sudahkah kita memperkirakan hubungan
antara MOTEL_PCTdanCOMP_PCTrelatif tepat, atau tidak? Jelaskan alasan Anda.
B.Buatlah perkiraan interval 90% dari tingkat hunian yang diharapkan dari motel yang bersangkutan,
MOTEL_PCT, mengingat bahwaCOMP_PCT=70.
C.Dalam model regresi linierMOTEL_PCT=1+2COMP_PCT+e, uji hipotesis nol H0:Β.2≤.0 melawan
hipotesis alternatifH0:Β.2>0 pada = 0.01 tingkat signifikansi. Diskusikan kesimpulan Anda.
Tentukan dengan jelas statistik uji yang digunakan dan daerah penolakan.
D.Dalam model regresi linierMOTEL_PCT=1+2COMP_PCT+e, uji hipotesis nol H0:Β.2= 1 melawan
hipotesis alternatifH0:Β.2≠.1 di = 0.01 tingkat signifikansi. Jika hipotesis nol itu benar, apa
implikasinya tentang tingkat hunian motel versus tingkat hunian pesaing mereka? Diskusikan
kesimpulan Anda. Tentukan dengan jelas statistik uji yang digunakan dan daerah penolakan.

e.Hitung sisa kuadrat terkecil dari regresiMOTEL_PCTdiCOMP_PCTdan merencanakan mereka


melawanWAKTU. Apakah ada fitur yang tidak biasa pada plot? Apa tanda dominan dari residu
selama periode waktu 17-23 (Juli 2004 sampai Januari 2005)?
3.20Pemilik motel menemukan bahwa produk cacat digunakan selama konstruksi. Butuh tujuh bulan
untuk memperbaiki cacat di mana sekitar 14 kamar di motel 100 unit tersebut tidak dapat
digunakan selama satu bulan setiap kalinya. Data ada di filemotel.
Sebuah.Hitung sampel rata-rata tingkat hunian motel selama tidak ada perbaikan yang
dilakukan. Berapa sampel rata-rata tingkat hunian motel selama ada perbaikan yang
dilakukan? Seberapa besar perbedaan yang ada?
B.Pertimbangkan regresi linierMOTEL_PCT=1+2MEMPERBAIKI+e, di manaMEMPERBAIKIadalah variabel indikator yang
mengambil nilai 1 selama periode perbaikan dan 0 sebaliknya. Berapa koefisien yang diperkirakan? Bagaimana
koefisien yang diperkirakan ini berhubungan dengan perhitungan di bagian (a)?
C.Buatlah estimasi interval 95% untuk parameter2dan memberikan interpretasinya. Sudahkah kita
memperkirakan efek perbaikan pada hunian motel secara relatif tepat, atau tidak? Menjelaskan.
D.Motel ingin mengklaim kerusakan ekonomi karena bahan yang rusak menyebabkan perbaikan yang
merugikan pelanggan. Untuk melakukannya, konsultan ekonomi mereka menguji hipotesis nolH0:Δ2≥.0
melawan hipotesis alternatifH1:Δ2<0. Jelaskan logika di balik pernyataan hipotesis nol dan alternatif
dengan cara ini. Lakukan pengujian pada = 0.05 tingkat signifikansi. Diskusikan kesimpulan Anda.
Nyatakan dengan jelas statistik uji, daerah penolakan, danP-nilai.
e.Untuk melanjutkan klaim motel, ekonom konsultan memperkirakan model regresi (
MOTEL_PCT-COMP_PCT) =1+2MEMPERBAIKI+e, sehingga variabel terikatnya adalah
perbedaan tingkat hunian.Bangun dan diskusikan makna ekonomi dari estimasi interval
95% dari2.
140BAB 3 Estimasi Interval dan Pengujian Hipotesis

F.Ujilah hipotesis nol bahwa2= 0 terhadap alternatif yang2<0 pada = 0.01 tingkat
signifikansi. Diskusikan arti dari hasil tes. Nyatakan dengan jelas statistik uji, daerah
penolakan, danP-nilai.
3.21Model penetapan harga aset modal (CAPM) dijelaskan dalam Latihan 2.16. Gunakan semua pengamatan yang tersedia di
file datacapm5untuk latihan ini.

Sebuah.Buat perkiraan interval 95% dari "beta" Exxon-Mobil dan Microsoft. Asumsikan bahwa Anda adalah seorang pialang
saham. Jelaskan hasil ini kepada investor yang datang kepada Anda untuk meminta nasihat.
B.Uji pada tingkat signifikansi 5% hipotesis bahwa nilai "beta" Ford adalah satu terhadap alternatif yang tidak
sama dengan satu. Apa interpretasi ekonomi dari beta sama dengan satu? Ulangi pengujian dan nyatakan
kesimpulan Anda untuk saham General Electric dan saham Exxon-Mobil. Nyatakan dengan jelas statistik uji
yang digunakan dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai.
C.Uji pada tingkat signifikansi 5% hipotesis nol bahwa nilai "beta" Exxon-Mobil lebih besar atau sama dengan
satu terhadap alternatif yang nilainya kurang dari satu. Nyatakan dengan jelas statistik uji yang digunakan
dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai. Apa interpretasi ekonomi dari beta
kurang dari satu?
D.Uji pada tingkat signifikansi 5% hipotesis nol bahwa nilai "beta" Microsoft kurang dari atau sama dengan
satu terhadap alternatif yang nilainya lebih besar dari satu. Nyatakan dengan jelas statistik uji yang
digunakan dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai. Apa interpretasi ekonomi dari
beta lebih dari satu?
e.Uji pada tingkat signifikansi 5%, hipotesis nol bahwa istilah intersep dalam model CAPM untuk saham Ford
adalah nol, terhadap alternatif yang tidak. Apa yang Anda simpulkan? Ulangi pengujian dan nyatakan
kesimpulan Anda untuk saham General Electric dan saham Exxon-Mobil. Nyatakan dengan jelas statistik uji
yang digunakan dan daerah penolakan untuk setiap pengujian, dan hitungP-nilai.

3.22file datanyakota kampusberisi data tentang 500 rumah keluarga tunggal yang dijual di Baton Rouge, Louisiana,
selama 2009–2013. Data termasuk harga jual (dalam $1000 unit),HARGA, dan total luas interior dalam ratusan
kaki persegi,SQFT.
Sebuah.Menggunakan regresi linierHARGA=1+2SQFT+e, perkirakan elastisitas rumah yang diharapkan
HARGAdengan hormatSQFT, dievaluasi pada rata-rata sampel. Buatlah estimasi interval 95% untuk
elastisitas, perlakukan sampel yang berarti seolah-olah mereka diberi nomor (bukan acak). Apa
interpretasi dari interval?
B.Ujilah hipotesis nol bahwa elastisitas, yang dihitung pada bagian (a), adalah satu terhadap alternatif yang
elastisitasnya bukan satu. Gunakan tingkat signifikansi 1%. Nyatakan dengan jelas statistik uji yang digunakan,
daerah penolakan, dan pengujianP-nilai. Apa yang Anda simpulkan?
C.Menggunakan model regresi linierHARGA=1+2SQFT+e, uji hipotesis bahwa efek marjinal pada harga rumah
yang diharapkan dari peningkatan ukuran rumah sebesar 100 kaki persegi kurang dari atau sama dengan
$13000 terhadap alternatif bahwa efek marjinal akan lebih besar dari $13000. Gunakan tingkat signifikansi
5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan pengujianP-nilai. Apa yang
Anda simpulkan?
D.Menggunakan regresi linierHARGA=1+2SQFT+e, memperkirakan harga yang diharapkan, E(HARGA|
SQFT) =1+2LEMBUT, untuk rumah seluas 2000 kaki persegi. Buatlah perkiraan interval 95% dari
harga yang diharapkan. Jelaskan perkiraan interval Anda kepada khalayak umum.
e.Cari rumah di sampel dengan 2000 kaki persegi ruang tamu. Hitung rata-rata sampel (rata-rata) dari
harga jual mereka. Apakah rata-rata sampel harga jual rumah denganSQFT=20 sesuai dengan hasil
pada bagian (d)? Menjelaskan.
3.23file datanyakota kampusberisi data tentang 500 rumah keluarga tunggal yang dijual di Baton Rouge, Louisiana,
selama 2009–2013. Data tersebut meliputi harga jual dalam $1000 unit,HARGA, dan total luas interior dalam
ratusan kaki persegi,SQFT.
Sebuah.Dengan menggunakan model regresi kuadrat,HARGA=1+2LEMBUT2+e, uji hipotesis bahwa efek marjinal pada
harga rumah yang diharapkan dari peningkatan ukuran rumah seluas 2000 kaki persegi dengan 100 kaki persegi
kurang dari atau sama dengan $13000 terhadap alternatif bahwa efek marjinal akan lebih besar dari $13000.
Gunakan tingkat signifikansi 5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan
pengujianP-nilai. Apa yang Anda simpulkan?
B.Dengan menggunakan model regresi kuadratik di bagian (a), uji hipotesis bahwa efek marjinal pada harga rumah
yang diharapkan dari peningkatan ukuran rumah seluas 4000 kaki persegi dengan 100 kaki persegi kurang dari
atau sama dengan $13000 terhadap alternatif bahwa efek marjinal akan lebih besar dari $13000.
3.7 Latihan141

Gunakan tingkat signifikansi 5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan
pengujianP-nilai. Apa yang Anda simpulkan?
C.Dengan menggunakan model regresi kuadrat pada bagian (a), perkirakan harga yang diharapkanE(HARGA|SQFT) =1+
2SQFT2untuk rumah seluas 2000 kaki persegi. Buatlah perkiraan interval 95% dari harga yang diharapkan. Jelaskan
perkiraan interval Anda kepada khalayak umum.
D.Cari rumah di sampel dengan 2000 kaki persegi ruang tamu. Hitung rata-rata sampel (rata-rata) dari
harga jual mereka. Apakah rata-rata sampel harga jual rumah denganSQFT=20 sesuai dengan hasil
pada bagian (c)? Menjelaskan.
3.24Kami memperkenalkan model Profesor Ray C. Fair untuk menjelaskan dan memprediksi pemilihan presiden AS
di Latihan 2.23. Data Fair, 26 pengamatan untuk tahun pemilihan 1916 hingga 2016, ada di file data adil5.
Variabel terikat adalahPILIH=persentase bagian dari suara populer yang dimenangkan oleh partai Demokrat.
MendefinisikanPERTUMBUHAN=INCUMB×tingkat pertumbuhan, di mana tingkat pertumbuhan adalah tingkat
perubahan tahunan dalam PDB per kapita riil dalam tiga kuartal pertama tahun pemilu. Jika Demokrat adalah
partai petahana, makaINCUMB=1; jika Partai Republik adalah partai petahana makaINCUMB=1.
Sebuah.Perkirakan regresi linier,PILIH=1+2PERTUMBUHAN+e, menggunakan data dari tahun 1916 hingga 2016.
Buatlah estimasi interval 95% dari pengaruh pertumbuhan ekonomi terhadap ekspektasiPILIH.Bagaimana Anda
menggambarkan temuan Anda kepada khalayak umum?
B.Yang diharapkanPILIHmendukung kandidat Demokrat adalahE(PILIH|PERTUMBUHAN) =1+2PERTUMBUHAN.
MemperkirakanE(PILIH|PERTUMBUHAN=4) dan membuat estimasi interval 95% dan estimasi interval 99%.
Asumsikan petahana Demokrat adalah kandidat untuk masa jabatan presiden kedua. Apakah mencapai
tingkat pertumbuhan 4% cukup untuk memastikan kemenangan? Menjelaskan.
C.Ujilah hipotesis bahwa ketikaINCUMB=1 pertumbuhan ekonomi memiliki efek nol atau negatif pada ekspektasiPILIH
terhadap alternatif bahwa pertumbuhan ekonomi memiliki efek positif yang diharapkan PILIH. Gunakan tingkat
signifikansi 1%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan pengujianP-nilai. Apa
yang Anda simpulkan?
D.MendefinisikanINFLAT=INCUMB×tingkat inflasi, di mana tingkat inflasi adalah pertumbuhan harga selama
15 kuartal pertama pemerintahan. Menggunakan data dari tahun 1916 hingga 2016, dan modelPILIH= α.1+
2 INFLAT+e, ujilah hipotesis bahwa inflasi tidak berpengaruh terhadap alternatif yang memang
berpengaruh. Gunakan tingkat signifikansi 1%. Nyatakan statistik uji yang digunakan, daerah penolakan,
dan ujiP-nilai dan nyatakan kesimpulan Anda.

3.25Menggunakan data di "Sekolah Ashcan", kami memiliki kesempatan untuk mempelajari pasar seni. Faktor apa saja yang
menentukan nilai sebuah karya seni? Gunakan data dalam fileashcan_small. [Catatan: fileashcan mengandung lebih
banyak variabel.]

Sebuah.MendefinisikanTAHUN=DATE_AUCTN-PENCIPTAAN, yaitu umur lukisan pada saat dijual. Gunakan data


karya yang dijual (TERJUAL=1) untuk memperkirakan regresi ln(RHAMMER) =1+2TAHUN+e. Buatlah
perkiraan interval 95% untuk persentase perubahan harga palu nyata mengingat bahwa sebuah karya
seni berumur satu tahun lagi pada saat penjualan. [Petunjuk: Tinjau pembahasan persamaan (2.28).]
Jelaskan hasilnya kepada calon pembeli seni.
B.Uji hipotesis nol bahwa setiap tahun tambahan usia meningkatkan "harga palu" sebesar 2%,
terhadap alternatif dua sisi. Gunakan tingkat signifikansi 5%.
C.variabelDRECadalah variabel indikator mengambil nilai satu jika penjualan terjadi selama resesi dan
nol sebaliknya. Gunakan data karya yang dijual (TERJUAL=1) untuk memperkirakan model regresi
ln(RHAMMER) =1+2DREC+e. Buatlah perkiraan interval 95% dari persentase pengurangan harga
palu saat menjual dalam resesi. Jelaskan temuan Anda kepada klien yang sedang
mempertimbangkan untuk menjual selama periode resesi.
D.Uji dugaan bahwa menjual karya seni selama resesi mengurangi harga palu sebesar 2% atau kurang,
dibandingkan dengan alternatif bahwa penurunan harga palu lebih besar dari 2%. Gunakan tingkat
signifikansi 5%. Nyatakan dengan jelas statistik uji yang digunakan, daerah penolakan, dan pengujianP-
nilai. Apa kesimpulan Anda?

3.26Seberapa besar pengalaman mempengaruhi tingkat upah? file datanyacps5_kecilberisi 1200 pengamatan pada
tingkat upah per jam, pengalaman, dan variabel lain dari Survei Penduduk Saat Ini (CPS) Maret 2013. [Catatan:
File datacps5berisi lebih banyak pengamatan dan variabel.]
Sebuah.Perkirakan regresi linierGAJI=1+2AHLI+edan mendiskusikan hasilnya.
B.Uji signifikansi statistik dari hubungan yang diperkirakan pada tingkat 5%. Gunakan uji satu sisi. Apa
hipotesis alternatif Anda? Apa yang Anda simpulkan?
142BAB 3 Estimasi Interval dan Pengujian Hipotesis

C.Perkirakan regresi linierGAJI=1+2AHLI+euntuk individu yang tinggal di wilayah metropolitan, di manaMETRO=


1. Apakah ada hubungan positif yang signifikan secara statistik antara upah yang diharapkan dan
pengalaman pada tingkat 1%? Seberapa besar pengaruhnya?
D.Perkirakan regresi linierGAJI=1+2AHLI+euntuk individu yang tidak tinggal di wilayah metropolitan, di manaMETRO=0.
Apakah ada hubungan positif yang signifikan secara statistik antara upah yang diharapkan dan pengalaman pada
tingkat 1%? Bisakah kita dengan aman mengatakan bahwa pengalaman tidak berpengaruh pada upah bagi
individu yang tinggal di daerah nonmetropolitan? Menjelaskan.

3.27Apakah hubungan antara pengalaman dan upah konstan sepanjang hidup seseorang? Kami akan menyelidiki
pertanyaan ini menggunakan model kuadrat. file datanyacps5_kecilberisi 1200 pengamatan pada tingkat upah
per jam, pengalaman, dan variabel lain dari Survei Penduduk Saat Ini (CPS) Maret 2013. [Catatan: file datacps5
berisi lebih banyak pengamatan dan variabel.]
Sebuah.Buat variabelnyaAHLI30 =AHLI-30. Jelaskan variabel ini. Kapan positif, negatif atau
nol?
B.Perkirakan dengan kuadrat terkecil model kuadratGAJI=1+2(AHLI30)2+e. Ujilah hipotesis nol
bahwa2= 0 terhadap alternatif2≠.0 pada tingkat signifikansi 1%. Apakah ada hubungan
kuadrat yang signifikan secara statistik antara ekspektasiGAJIdanAHLI30?
⋀.

C.Buat plot nilai pasGAJI=1+2(AHLI30)2, padakamu-sumbu, versusAHLI30, padax-sumbu. Sampai dengan


nilaiAHLI30 = 0 adalah kemiringan plot konstan, atau meningkat, atau menurun? Sampai dengan
nilaiAHLI30 = 0 apakah fungsi meningkat pada laju yang meningkat atau meningkat pada laju yang
menurun?
D.Jikakamu=Sebuah+bx2kemudiandyDandx=2bx. Dengan menggunakan hasil ini, hitung perkiraan kemiringan dari fitting
⋀.

fungsiGAJI=1+2(AHLI30)2, KapanAHLI=0, kapanAHLI=10, dan kapan AHLI=20.

e.HitungT-statistik untuk hipotesis nol bahwa kemiringan fungsi adalah nol,H0:2γ2


AHLI30 = 0, ketikaAHLI=0, kapanAHLI=10, dan kapanAHLI=20.
3.28Pemilik motel menemukan bahwa produk cacat digunakan selama konstruksi. Butuh waktu 7
bulan untuk memperbaiki cacat di mana sekitar 14 kamar di 100 unit motel tidak dapat
digunakan selama 1 bulan pada suatu waktu. Data ada di filemotel.
Sebuah.Buat variabel baru,RELPRICE2 = 100RELPRICE, yang sama dengan persentase harga pesaing yang
dikenakan oleh motel yang bersangkutan. MerencanakanRELPRICE2 melawanWAKTU. Hitung statistik
ringkasan untuk variabel ini. Apa mean dan median sampel? Berapa nilai minimum dan maksimumnya?
Apakah motel tersebut mengenakan biaya lebih dari pesaingnya untuk kamar, atau kurang, atau hampir
sama? Menjelaskan.
B.Pertimbangkan regresi linier dengankamu=MOTEL_PCTdanx=RELPRICE2. Menafsirkan koefisien kemiringan yang
diperkirakan. Buat perkiraan interval 95% untuk kemiringan. Sudahkah kita memperkirakan kemiringan hubungan
dengan sangat baik? Jelaskan jawabanmu.
C.Buatlah estimasi interval 90% dari tingkat hunian motel yang diharapkan jika harga motel adalah 80% dari
harga pesaingnya. Apakah menurut Anda intervalnya relatif sempit atau relatif lebar? Jelaskan alasan
Anda.
D.Uji hipotesis nol bahwa tidak ada hubungan antara variabel terhadap alternatif bahwa ada hubungan
terbalik antara mereka, pada tingkat signifikansi = 0,05. Diskusikan kesimpulan Anda. Pastikan
untuk memasukkan dalam jawaban Anda statistik uji yang digunakan, wilayah penolakan, danP-
nilai.
e.Uji hipotesis bahwa untuk setiap persen lebih tinggi untuk harga relatif yang dikenakan oleh motel yang
bersangkutan, motel tersebut kehilangan 1% dari tingkat huniannya. Rumuskan hipotesis nol dan hipotesis
alternatif dalam kaitannya dengan parameter model, lakukan uji yang relevan pada tingkat signifikansi 5%, dan
nyatakan kesimpulan Anda. Pastikan untuk menyatakan statistik uji yang digunakan, daerah penolakan, danP-nilai.

3.29Kami memperkenalkan Project STAR (Rasio Prestasi Siswa/Guru) Tennessee di Latihan 2.22. File datanya adalah
bintang5_kecil.[file datanyabintang5berisi lebih banyak observasi dan lebih banyak variabel.] Tiga jenis kelas
dipertimbangkan: kelas kecil [KECIL=1], kelas berukuran biasa dengan asisten guru [PEMBANTU=1], dan kelas
berukuran reguler [REGULER=1].
Sebuah.Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,SKOR MATEMATIKA, di kelas
kecil. Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,SKOR MATEMATIKA, di kelas
reguler, tanpa bantuan guru. Jenis kelas mana yang memiliki skor rata-rata lebih tinggi? Apa perbedaan
skor rata-rata sampel untuk kelas kecil versus kelas biasa? Jenis kelas mana yang memiliki standar deviasi
skor yang lebih tinggi?
3.7 Latihan143

B.Pertimbangkan siswa hanya di kelas kecil atau kelas biasa tanpa asisten guru. Perkirakan model
regresiSKOR MATEMATIKA=1+2KECIL+e. Bagaimana perkiraan parameter regresi berhubungan
dengan skor rata-rata sampel yang dihitung di bagian (a)?
C.Dengan menggunakan model dari bagian (b), buatlah estimasi interval 95% dari yang diharapkanSKOR MATEMATIKA
untuk siswa di kelas berukuran biasa dan siswa di kelas kecil. Apakah intervalnya cukup sempit atau tidak? Apakah
intervalnya tumpang tindih?
D.Uji hipotesis nol bahwa nilai matematika yang diharapkan tidak berbeda dalam dua jenis kelas versus
alternatif yang diharapkanSKOR MATEMATIKAlebih tinggi untuk siswa di kelas kecil menggunakan tingkat
signifikansi 5%. Nyatakan hipotesis ini dalam hal parameter model, nyatakan dengan jelas statistik uji yang
Anda gunakan, dan wilayah penolakan uji. HitungP-nilai untuk tes. Apa kesimpulan Anda?

e.Uji hipotesis nol yang diharapkanSKOR MATEMATIKAadalah 15 poin lebih tinggi untuk siswa di kelas kecil
dibandingkan alternatif yang tidak 15 poin lebih tinggi menggunakan tingkat signifikansi 10%. Nyatakan
hipotesis ini dalam hal parameter model, nyatakan dengan jelas statistik uji yang Anda gunakan, dan
wilayah penolakan uji. HitungP-nilai untuk tes. Apa kesimpulan Anda?

3.30Kami memperkenalkan Project STAR (Rasio Prestasi Siswa/Guru) Tennessee di Latihan 2.22. File datanya adalah
bintang5_kecil.[file datanyabintang5berisi lebih banyak observasi dan lebih banyak variabel.] Tiga jenis kelas
dipertimbangkan: kelas kecil [KECIL=1], kelas berukuran biasa dengan asisten guru [PEMBANTU=1], dan kelas
berukuran reguler [REGULER=1].
Sebuah.Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,SKOR MATEMATIKA, di kelas
reguler tanpa bantuan guru. Hitung mean sampel dan simpangan baku untuk nilai matematika siswa,
SKOR MATEMATIKA, di kelas reguler dengan asisten guru. Jenis kelas mana yang memiliki skor rata-rata
lebih tinggi? Apa perbedaan dalam skor rata-rata sampel untuk kelas berukuran reguler versus kelas
berukuran reguler dengan asisten guru? Jenis kelas mana yang memiliki standar deviasi skor yang lebih
tinggi?
B.Pertimbangkan siswa hanya di kelas berukuran biasa tanpa asisten guru dan kelas berukuran biasa
dengan asisten guru. Perkirakan model regresiSKOR MATEMATIKA=1+2PEMBANTU+e. Bagaimana
perkiraan parameter regresi berhubungan dengan skor rata-rata sampel yang dihitung di bagian
(a)?
C.Dengan menggunakan model dari bagian (b), buatlah estimasi interval 95% dari yang diharapkanSKOR MATEMATIKA
untuk siswa di kelas berukuran biasa tanpa asisten guru dan kelas berukuran biasa dengan asisten guru. Apakah
intervalnya cukup sempit atau tidak? Apakah intervalnya tumpang tindih?
D.Uji hipotesis nol yang diharapkanSKOR MATEMATIKAtidak berbeda dalam dua jenis kelas versus
alternatif yang diharapkanSKOR MATEMATIKAlebih tinggi untuk siswa di kelas reguler dengan
asisten guru, menggunakan tingkat signifikansi 5%. Nyatakan hipotesis ini dalam hal parameter
model, nyatakan dengan jelas statistik uji yang Anda gunakan, dan wilayah penolakan uji. HitungP-
nilai untuk tes. Apa kesimpulan Anda?
e.Uji hipotesis nol yang diharapkanSKOR MATEMATIKAadalah tiga poin, atau lebih, lebih tinggi untuk siswa di
kelas reguler dengan asisten guru versus alternatif yang perbedaannya kurang dari tiga poin,
menggunakan tingkat signifikansi 10%. Nyatakan hipotesis ini dalam hal parameter model, nyatakan
dengan jelas statistik uji yang Anda gunakan dan wilayah penolakan uji. HitungP-nilai untuk tes. Apa
kesimpulan Anda?

3.31Data penjualan mingguan merek utama tuna kalengan oleh jaringan supermarket di kota besar AS bagian barat
tengah selama tahun kalender pertengahan 1990-an terdapat dalam file datatuna. Ada 52 observasi untuk
masing-masing variabel. variabelSAL1 = unit penjualan merek no. 1 tuna kalengan, dan April1 = harga per
kaleng merk no. 1 tuna (dalam dolar).
Sebuah.Hitung statistik ringkasan untukSAL1 danApril1. Apa arti sampel, nilai minimum dan
maksimum, dan standar deviasinya. Plot masing-masing variabel ini versusPEKAN. Berapa banyak
variasi dalam penjualan dan harga dari minggu ke minggu?
B.Gambarkan variabelnyaSAL1 (y-sumbu) melawanApril1 (x-sumbu). Apakah ada hubungan positif atau terbalik? Apakah itu yang
Anda harapkan, atau tidak? Mengapa?
C.Buat variabelnyaHARGA1 = 100April1. Perkirakan regresi linierSAL1 =1+ β.2HARGA1 +e. Berapa
perkiraan poin untuk pengaruh kenaikan satu sen pada harga merek no. 1 pada penjualan
merek no. 1? Berapakah perkiraan interval 95% untuk pengaruh kenaikan satu sen pada
harga merek no. 1 pada penjualan merek no. 1?
D.Buatlah perkiraan interval 90% untuk perkiraan jumlah kaleng yang terjual dalam seminggu jika harga per kaleng
adalah 70 sen.
144BAB 3 Estimasi Interval dan Pengujian Hipotesis

e.Buatlah estimasi interval 95% dari elastisitas penjualan merek no. 1 sehubungan dengan harga merek no. 1 “dengan
cara.” Perlakukan sampel berarti sebagai konstanta dan bukan variabel acak. Apakah menurut Anda penjualan
cukup elastis, atau cukup tidak elastis, sehubungan dengan harga? Apakah ini masuk akal secara ekonomi?
Mengapa?
F.Uji hipotesis bahwa elastisitas penjualan merek no. 1 sehubungan dengan harga merek no. 1
dari bagian (e) minus tiga terhadap alternatif yang elastisitasnya tidak minus tiga. Gunakan
tingkat signifikansi 10%. Jelas, nyatakan hipotesis nol dan hipotesis alternatif dalam
parameter model, berikan daerah penolakan, danP-nilai untuk tes. Apa kesimpulan Anda?
3.32Apa hubungan antara kejahatan dan hukuman? Kami menggunakan data dari 90 negara bagian Carolina Utara untuk
memeriksa pertanyaan tersebut. Tingkat kejahatan kabupaten dan karakteristik lainnya diamati selama periode 1981–
1987. Data ada di filekejahatan. Gunakan data 1985 untuk latihan ini.

Sebuah.Hitung statistik ringkasan untukCRMRTE(kejahatan yang dilakukan per orang) danPRBARR(probabilitas


penangkapan = rasio penangkapan terhadap pelanggaran), termasuk maksimum dan minimum. Apakah
tampaknya ada banyak variasi dari satu kabupaten ke kabupaten lainnya dalam variabel-variabel ini?
B.MerencanakanCRMRTEmelawanPRBARR.Apakah Anda mengamati hubungan antara variabel-variabel ini?
C.Perkirakan model regresi linierCRMRTE=1+2PRBARR+e. Jika kita meningkatkan kemungkinan penangkapan
sebesar 10%, apa pengaruhnya terhadap tingkat kejahatan? Berapa perkiraan interval 95% dari kuantitas
ini?
D.Uji hipotesis nol bahwa tidak ada hubungan antara tingkat kejahatan kabupaten dan kemungkinan
penangkapan versus alternatif bahwa ada hubungan terbalik. Nyatakan hipotesis nol dan hipotesis
alternatif dalam hal parameter model. Nyatakan dengan jelas statistik uji dan distribusinya jika
hipotesis nol benar dan daerah penolakan uji. Gunakan tingkat signifikansi 1%. Apa kesimpulan
Anda?

Lampiran 3A
Turunan dariT-Distribusi
Estimasi interval dan prosedur pengujian hipotesis dalam bab ini melibatkanT-distribusi. Di sini kami
mengembangkan hasil utama.
Hasil pertama yang dibutuhkan adalah distribusi normal dari penduga kuadrat terkecil.
Perhatikan, misalnya, distribusi normal dariB2penaksir kuadrat terkecil dari2, yang kita nyatakan
sebagai ( )
σ2
B2|x~n β.2,( )2
xsaya-x

Sebuah variabel acak normal standar diperoleh dariB2dengan mengurangkan meannya dan membaginya dengan
simpangan bakunya:

B2- β.2
Z=√. ( ) ~n(0,1) (3A.1)
varB2|x

Yaitu, variabel acak standarZterdistribusi normal dengan mean 0 dan varians 1. Terlepas dari
kenyataan bahwa distribusi penduga kuadrat terkecilB2tergantung padax, standardisasi
meninggalkan kita dengan statistik penting yang distribusinya tidak bergantung pada parameter
yang tidak diketahui ataux.
Bagian kedua dari teka-teki melibatkan variabel acak chi-kuadrat. Jika keledai (umpti) pada SR6 berlaku,
maka istilah kesalahan acakesayamemiliki distribusi normal bersyarat,esaya| .~n0,σ2. Standarisasi variabel
acak dengan membaginya dengan simpangan bakunya sehinggaesaya/ Σ ~.n(0,1). Itu
kuadrat dari variabel acak normal standar adalah variabel acak chi-kuadrat (lihat Lampiran B.5.2)
()
dengan satu derajat kebebasan, jadiesaya/ Σ2~ Χ. 2 . Jika semua kesalahan acak independen, maka
(1)

(e)2 (e)12 ( e)2 (e)n2


saya 2
= + +···+ ~ Χ.2(n) (3A.2)
σ σ σ σ
Lampiran 3B DistribusiT-Statistik di bawahH1 145

Karena kesalahan acak yang sebenarnya tidak dapat diamati, kami menggantinya dengan rekan sampelnya, residual kuadrat
terkecilê.saya=kamusaya-B1-B2xsaya, untuk memperoleh
Σ
ê.saya
2 = (n-2)2
V= (3A.3)
σ2 σ2
Variabel acakVdalam (3A.3) tidak memiliki2 (n)
distribusi karena kuadrat terkecil berada
biasanya adalahbukanvariabel acak independen. Semuanresiduê.saya=kamusaya-B1-B2xsayabergantung
pada penduga kuadrat terkecilB1danB2. Hanya dapat ditunjukkan bahwan-2 dari sisa kuadrat terkecil
adalah independen dalam model regresi linier sederhana. Akibatnya, variabel acak dalam (3A.3)
memiliki distribusi chi-kuadrat dengann-2 derajat kebebasan. Artinya, bila dikalikan dengan konstanta
(n-2)/ Σ2, variabel acak2mempunyai sebuahdistribusi chi-kuadrat dengan N-2derajat kebebasan,

(n-2)2
V= ~ Χ.2(n2) (3A.4)
σ2
Variabel acakVmemiliki distribusi yang hanya bergantung pada derajat kebebasan,n-2. SukaZ
dalam (3A.1),Vadalah statistik penting. Kita punyabukanmenetapkan fakta bahwa variabel acak
chi-kuadratVsecara statistik tidak bergantung pada penduga kuadrat terkecilB1danB2, tapi itu.
Buktinya berada di luar cakupan buku ini. Akibatnya,Vdan variabel acak normal standarZdi
(3A.1) adalah independen.
Dari dua variabel acakVdanZ, kita dapat membentukT-variabel acak. SEBUAHT-variabel acak
dibentuk dengan membagi variabel acak normal standar,Z~n(0,1), dengan akar kuadrat dari an
Mandirivariabel acak chi-kuadrat,V~ Χ.2, yang telah dibagi
(M)
dengan derajat kebebasannya,M. Itu
adalah,
Z
T=√. ~T(M) (3A.5)
VDanM

ItuT-bentuk distribusi sepenuhnya ditentukan oleh parameter derajat kebebasan,M, dan distribusinya
dilambangkan denganT(M). Lihat Lampiran B.5.3. MenggunakanZdanVdari (3A.1) dan (3A.4), masing-masing,
kami memiliki

( ) /√ /∑( )2
B2 - β.2 σ2 xsaya-x
Z
T=√. = √.
V(n-2) (n-2)2/ Σ2
n-2
B2- β.2 B - β.2 B - β.
= √. = √.2 = 2 ( )2~T(n (3A.6)
√. ( ) seB2
2)
√. σ2
⋀.

√. varB2
Σ( )
xsaya- x2
Baris kedua adalah hasil kunci yang kita nyatakan di (3.2), dengan generalisasinya di (3.3).

Lampiran 3B
Distribusi dariT-Statistik di bawahH1
Untuk lebih memahami caranyaT-tes bekerja, mari kita periksaT-statistik di (3.7) ketika hipotesis nol tidak benar. Kita
dapat melakukannya dengan menuliskannya dalam beberapa detail tambahan. Apa yang terjadi padaZ di (3A.1) jika
kita menguji hipotesisH0:Β.2=Citu mungkin tidak benar? Alih-alih mengurangi2, kita kurangiC, untuk memperoleh

B2-C B2- β. B β.2 β.2-C


) =2+2-C
( ( ) =√.2-
( ) + ( ) =Z+~n(δ,1)
varB2 varB2 varB2 varB2
146BAB 3 Estimasi Interval dan Pengujian Hipotesis

( ) /√ ( )
Statistik yang kita peroleh adalah standar normalZditambah faktor lain, =2-C varB2,
itu adalah nol hanya jika hipotesis nol benar. SEBUAHnonsentralT-variabel acakdibentuk dari
rasio
Z+
T|x=√. ~T(M,) (3B.1)
VDanM

Ini lebih umumT-statistik, denganMderajat kebebasan dan parameter noncentrality , dilambangkanT(


M, ).Ini memiliki distribusi yang tidak berpusat di nol kecuali = 0. Non-pusat T-distribusi diperkenalkan
dalam Lampiran B.7.3. Ini adalah faktor yang memimpinT-uji untuk menolak hipotesis nol palsu
dengan probabilitas lebih besar dari , yang merupakan probabilitas kesalahan Tipe I. Karena
bergantung pada data sampel, kami telah menunjukkan bahwa non-pusatT-distribusi bersyarat padax
. Jika hipotesis nol benar maka = 0 danT-statistik tidak bergantung pada parameter yang tidak
diketahui ataux; itu adalah statistik penting.
Misalkan kita memiliki sampel ukurann=40 sehingga derajat kebebasannya adalahn–2 = 38 dan kami
menguji hipotesis tentang2sedemikian rupa sehingga2–C=1. Dengan menggunakan uji ekor kanan, peluang
untuk menolak hipotesis nol adalahP(t >1.686), dimanaT(0,95, 38)= 1.686 dari Tabel Statistik 2, persentil dari
yang biasaT-distribusi. Jika = 0, probabilitas penolakan ini adalah 0,05. Dengan β.2–C=1, kita harus
menghitung probabilitas ekor kanan menggunakan non-pusatT-distribusi dengan parameter noncentrality

√. )( )
(
β.2-C β2-C xsaya-x2β.2-C
=( ) = √. /∑( = (3B.2)
) σ
varB2 σ2 xsaya-x2
Untuk contoh numerik, kami menggunakan nilai yang muncul dari eksperimen simulasi yang
digunakan dalam Lampiran 2H. sampel darix-nilai terdiri darixsaya=10,saya=1,…,20 danxsaya=20,
( )
saya=21,…,40. Rata-rata sampel adalahx=15 sehingga xsaya-x2= 40×52= 1000. Juga,
σ2= 2500. Parameter noncentrality adalah
√. )
()( ( )
xsaya-x2 β.2-C 10002-C ( )
= = √. =0.632462-C
σ 2500
Jadi, peluang untuk menolak hipotesis nolH0:Β.2= 9 lawanH1:Β.2>9 ketika benar
nilai dari2= 10 adalah
( ) ( )
P T(38,0.63246)>1,686 = 1P t(38,0.63246)≤.1,686 = 0,15301
Perhitungan probabilitas menggunakan fungsi distribusi kumulatif untuk non-pusat T-distribusi,
yang tersedia dalam perangkat lunak ekonometrik dan di beberapa situs web. Demikian pula,
probabilitas menolak hipotesis nolH0:Β.2= 8 lawanH1:Β.2>8 jika nilai sebenarnya dari
β.2= 10 adalah
( ) ( )
P t(38,1.26491)>1,686 = 1P t(38,1.26491)≤.1,686 = 0,34367
Mengapa kemungkinan penolakan meningkat? Efek dari parameter noncentrality adalah untuk
menggeserT-distribusi ke kanan, seperti yang ditunjukkan pada Lampiran B.7.3. Misalnya, probabilitas
menolak hipotesis nolH0:Β.2= 9 lawanH1:Β.2>9 ditunjukkan pada Gambar 3B.1.
Kurva padat adalah pusat biasaT-distribusi dengan 38 derajat kebebasan. Luas daerah di bawah
kurva di sebelah kanan 1,686 adalah 0,05. Kurva putus-putus adalah non-pusatT-distribusi dengan =
0.63246. Area di bawah kurva di sebelah kanan 1,686 lebih besar, sekitar 0,153.
Probabilitas menolak hipotesis nol palsu disebut teskekuatan. Di dunia yang ideal, kami akan selalu
menolak hipotesis nol palsu, dan jika kami memiliki jumlah data yang tak terbatas, kami bisa melakukannya.
Kunci untuk aT-kekuatan tes adalah tiga bahan yang membuat parameter noncentrality lebih besar.
Lampiran 3C Simulasi Monte Carlo147

Non-pusatT-distribusi

0.4
0,3
F(T)
0.2
0.1
0

1.686
–4 –2 0 2 4 6
T
T(38, = 0) T(38, = 0,63246)

GAMBAR 3B.1 Probabilitas menolakH0:Β.2= 9.

Parameter noncentrality yang lebih besar menggeserT-distribusi lebih jauh ke kanan dan meningkatkan
kemungkinan penolakan. Dengan demikian, probabilitas menolak hipotesis nol palsu meningkat ketika

1.Besarnya kesalahan hipotesis2-Cmeningkat.


2.Semakin kecil varians kesalahan sebenarnya,2, yang mengukur ketidakpastian model secara keseluruhan.

3.Semakin besar variasi total dalam variabel penjelas, yang mungkin merupakan hasil dari ukuran sampel yang
lebih besar.

Dalam situasi nyata, kekuatan sebenarnya dari sebuah tes tidak diketahui karena kita tidak tahu2atau2, dan
perhitungan daya tergantung pada pemberianx-nilai-nilai. Namun demikian, ada baiknya untuk mengetahui faktor-
faktor yang akan meningkatkan kemungkinan penolakan hipotesis nol palsu. Pada bagian berikut, kami melakukan
percobaan simulasi Monte Carlo untuk menggambarkan perhitungan daya di atas.
Ingatlah bahwa kesalahan Tipe II gagal menolak hipotesis yang salah. Akibatnya,
kemungkinan kesalahan Tipe II adalah pelengkap dari kekuatan tes. Misalnya, kemungkinan
kesalahan Tipe II saat pengujianH0:Β.2= 9 lawanH1:Β.2>9 ketika nilai sebenarnya dari2= 10 adalah
( )
P t(38,0.63246)≤.1,686 = 1 0,15301 = 0,84699

Untuk pengujianH0:Β.2(=8 lawanH1:Β.2>)8, ketika nilai sebenarnya adalah2= 10, probabilitas kesalahan
Tipe II adalahP t(38, 1.26491)≤.1.686 = 1 – 0.34367 = 0.65633. Saat daya uji meningkat, kemungkinan
kesalahan Tipe II turun, dan sebaliknya.

Lampiran 3C
Simulasi Monte Carlo
Dalam Lampiran 2H, kami memperkenalkan simulasi Monte Carlo untuk menggambarkan sifat pengambilan sampel
berulang dari penduga kuadrat terkecil. Dalam lampiran ini, kami menggunakan kerangka kerja yang sama untuk
menggambarkan kinerja pengambilan sampel berulang dari penduga interval dan uji hipotesis.
Ingat bahwaproses pembuatan datauntuk model regresi linier sederhana diberikan oleh
()
kamusaya=E ysaya|xsaya+esaya=1+2xsaya+esaya,saya=1,…,n
148BAB 3 Estimasi Interval dan Pengujian Hipotesis

Nilai parameter Monte Carlo adalah1= 100 dan2= 10. Nilaixsayaadalah 10 untuk 20 pengamatan
pertama dan 20 untuk 20 pengamatan lainnya, sehingga fungsi regresinya adalah
( )
E ysaya|xsaya=10 = 100 + 10xsaya=100 + 10×10 = 200, saya=1,…,20
( )
E ysaya|xsaya=20 = 100 + 10xsaya=100 + 10×20 = 300, saya=21,…,40

Kesalahan (rand)om secara independen dan terdistribusi normal dengan mean 0 dan variance varesaya
|xsaya=2= 2.500, atauesaya|x~n(0,2500).
Saat mempelajari kinerja uji hipotesis dan penduga interval, perlu untuk menggunakan sampel
Monte Carlo yang cukup sehingga persentase yang terlibat diestimasi cukup tepat agar berguna.
Untuk pengujian dengan probabilitas kesalahan Tipe I = 0.05, kita harus mengamati hipotesis nol
yang benar ditolak 5% dari waktu. Untuk 95% penduga interval, kita harus mengamati bahwa 95%
dari estimasi interval berisi nilai parameter sebenarnya. Kita gunakanM=10.000 sampel Monte Carlo
sehingga kesalahan eksperimen sangat kecil. Lihat Lampiran 3C.3 untuk penjelasannya.

3C.1 Sifat Sampling Penaksir Interval


Di Lampiran 2H.4, kami membuat satu sampel data yang ada di file datamcl_fixed_x. Estimasi kuadrat
terkecil menggunakan nilai data ini adalah

ŷ.=127.2055 + 8.7325x
(23,3262) (1,4753)
()
Perkiraan interval 95% dari kemiringan adalahB2±T(0,975, 38)seB2= [5.7460,11.7191]. Kami melihat itu untuk
sampel ini, estimasi interval 95% berisi nilai parameter kemiringan sebenarnya2= 10.
Kami mengulangi proses estimasi dan estimasi interval 10.000 kali. Dalam sampel berulang ini,
95,03% dari perkiraan interval berisi parameter sebenarnya. Tabel 3C.1 berisi hasil untuk sampel
Monte Carlo 321–330 untuk tujuan ilustrasi. Perkiraannya adalahB2, kesalahan standarnya adalahSE,
batas bawah estimasi interval 95% adalahLB, dan batas atas adalahUB. variabelMENUTUPI=1 jika
estimasi interval berisi nilai parameter sebenarnya. Dua dari interval tidak mengandung nilai
parameter sebenarnya2= 10. 10 sampel hasil yang kami laporkan dipilih untuk menggambarkan
bahwa perkiraan interval tidak mencakup parameter sebenarnya dalam semua kasus.
Pelajarannya adalah, bahwa dalam banyak sampel dari proses pembuatan data, dan jika asumsi
SR1-SR6 berlaku, prosedur untuk membangun estimasi interval 95% "berfungsi" 95% dari waktu.

TABEL E 3C.1 Hasil dari 10000 Simulasi Monte Carlo

SAMPEL B2 SE TSTAT MENOLAK LB UB MENUTUPI

321 7.9600 1.8263 1.1170 0 4.2628 11.6573 1


322 11.3093 1.6709 0.7836 0 7.9267 14.6918 1
323 9.8364 1.4167 0,1155 0 6.9683 12.7044 1
324 11.4692 1.3909 1,0563 0 8.6535 14.2849 1
325 9.3579 1.5127 0,4245 0 6.2956 12.4202 1
326 9.6332 1.5574 0.2355 0 6.4804 12.7861 1
327 9.0747 1.2934 0,7154 0 6.4563 11.6932 1
328 7.0373 1.3220 2.2411 0 4.3611 9.7136 0
329 13.1959 1.7545 1.8215 1 9.6441 16.7478 1
330 14.4851 2.1312 2.1046 1 10.1708 18.7994 0
Lampiran 3C Simulasi Monte Carlo149

3C.2 Sifat Sampling Uji Hipotesis


Hipotesis nolH0:Β.2= 10 benar. Jika kita menggunakan alternatif satu arahH1(β2>10 ) dan
l(malam)l signifikansi = 0,05, hipotesis nol ditolak jika uji statistikT=B210DanseB2> 1.68595, yang
merupakan persentil ke-95 dariT-distribusi dengan 38 derajat kebebasan.3Untuk sampelmc1_
tetap_x, nilai yang dihitung dariT-statistik adalah 0.86, jadi kami gagal menolak hipotesis nol,
yang dalam hal ini adalah keputusan yang benar.
Kami mengulangi proses estimasi dan pengujian hipotesis 10.000 kali. Dalam sampel ini,
4,98% pengujian menolak hipotesis nol bahwa nilai parameter adalah 10. Pada Tabel 3C.1, T
-nilai statistik adalahTSTATdanMENOLAK=1 jika hipotesis nol ditolak. Kami melihat bahwa
sampel 329 dan 330 salah menolak hipotesis nol.
Pelajarannya adalah bahwa dalam banyak sampel dari proses pembuatan data, dan jika asumsi SR1–
SR6 berlaku, prosedur untuk menguji hipotesis nol yang benar pada tingkat signifikansi = 0.05 menolak
hipotesis nol yang benar sebanyak 5%. Atau, dinyatakan secara positif, prosedur pengujian tidak menolak
hipotesis nol yang benar 95% dari waktu.
Untuk menyelidiki kekuatanT-uji, probabilitas bahwa ia menolak hipotesis yang salah, kami
mengujiH0:Β.2= 9 lawanH1:Β.2>9 danH0:Β.2= 8 lawanH1:Β.2>8. Tingkat penolakan teoretis yang kami
hitung dalam Lampiran 3B adalah 0,15301 untuk kasus pertama dan 0,34367 untuk kasus kedua. Pada
10.000 sampel Monte Carlo, hipotesis pertama ditolak pada 1515 sampel dengan tingkat penolakan
0,1515. Hipotesis kedua ditolak di 3500 sampel, tingkat penolakan 0,35. Nilai Monte Carlo sangat
dekat dengan tingkat penolakan yang sebenarnya.

3C.3 Memilih Jumlah Sampel Monte Carlo


Penaksir interval kepercayaan 95% harus berisi nilai parameter sebenarnya 95% dari waktu di banyak
sampel. ItuMsampel dalam percobaan Monte Carlo adalah percobaan eksperimental independen di
mana probabilitas "sukses", interval yang berisi nilai parameter sebenarnya, adalahP=0.95. Jumlah
keberhasilan mengikuti abinomiumdistribusi. Ituproporsidari keberhasilanPdi dalamM percobaan
adalah variabel acak dengan harapanPdan variansP(1P)∕M. Jika jumlah Monte Carlo sam
√.mohonMbesar, perkiraan interval 95% dari proporsi keberhasilan Monte Carlo adalah P±1.96P(1P
)∕M. JikaM=10,000, interval ini adalah [0.9457, 0.9543]. Kami memilihM=10,000 sehingga interval ini akan
menjadi sempit, memberi kita keyakinan bahwajikaprobabilitas sukses yang sebenarnya adalah 0,95 kita
akan memperoleh rata-rata Monte Carlo mendekati 0,95 dengan tingkat kepercayaan "tinggi". Hasil kami
bahwa 95,03% dari perkiraan interval kami berisi parameter sebenarnya2adalah "dalam" margin kesalahan
untuk eksperimen Monte Carlo semacam itu. Di sisi lain, jika kita telah menggunakanM=1000 sampel Monte
Carlo, estimasi interval dari proporsi keberhasilan Monte Carlo adalah, [0.9365, 0.9635]. Dengan interval
yang lebih luas ini, proporsi keberhasilan Monte Carlo bisa sangat berbeda dari 0,95, menimbulkan
bayangan keraguan apakah metode kami berfungsi seperti yang diiklankan atau tidak.

Demikian pula untuk pengujian dengan probabilitas penolakan = 0.05, ini√.e 95% estimasi interval dari
proporsi sampel Monte Carlo yang mengarah ke penolakan adalah±1,96 (1 )DanM. JikaM=10,000,
interval ini adalah [0,0457, 0,0543]. Bahwa percobaan Monte Carlo kami menolak hipotesis nol 4,98%
dari waktu berada dalam margin kesalahan ini. Jika kita telah memilihM=1000, maka proporsi
penolakan Monte Carlo diperkirakan berada dalam interval [0.0365, 0,0635], yang lagi-lagi
menyisakan sedikit ruang gerak untuk kenyamanan.
Intinya adalah bahwa jika sampel Monte Carlo lebih sedikit dipilih, "noise" dalam eksperimen Monte Carlo dapat
menyebabkan persentase keberhasilan atau penolakan yang memiliki margin kesalahan yang terlalu lebar untuk

............................................................................................................................................

3Kami menggunakanT-nilai kritis dengan lebih banyak desimal, bukan nilai tabel 1,686, untuk memastikan akurasi dalam eksperimen Monte
Carlo.
150BAB 3 Estimasi Interval dan Pengujian Hipotesis

kita untuk mengetahui apakah prosedur statistik, estimasi interval, atau pengujian hipotesis “bekerja” dengan benar
atau tidak.4

3C.4 Acak-xHasil Monte Carlo


Kami menggunakan "tetap-x” dalam hasil Monte Carlo yang dilaporkan di Bagian 3C.1 dan 3C.2.
Dalam setiap sampel Monte Carlo,x-nilai-nilai adalahxsaya=10 untuk 20 pengamatan pertama danxsaya=
20 untuk 20 pengamatan berikutnya. Sekarang kita memodifikasi eksperimen menjadi random-x
kasus, seperti pada Lampiran 2H.7. Persamaan yang menghasilkan data tetapkamusaya=100 + 10xsaya+
esayadengan distribusi normal acak( error memiliki)ga dengan mean nol dan simpangan baku 50, esaya
~n0,502= 2500 . Kami secara acak memilihx-v(alues dari distribusi no)rmal dengan mean μ.x=15 dan
simpangan bakux=1.6, jadix~n15,1.62= 2.56 .
Salah satu sampel data ada di file datamc1_random_x.Dengan menggunakan nilai-nilai ini, kami memperoleh perkiraan
kuadrat terkecil

ŷ.=116,7410 + 9,7628x
(84,7107) (5,5248)
()
Perkiraan interval 95% dari kemiringan adalahB2±T(0,975, 38)seB2= [−1.4216,20.9472]. Untuk ini sama-
ple, estimasi interval 95% berisi nilai parameter kemiringan sebenarnya2= 10.
Kami menghasilkan 10.000 sampel Monte Carlo menggunakan desain ini dan menghitung
perkiraan kuadrat terkecil dan perkiraan interval 95%. Dalam sampel ini, denganxbervariasi dari
sampel ke sampel, estimasi interval 95% untuk2mengandung nilai sebenarnya dalam 94,87% dari
sampel. Tabel 3C.2 berisi hasil untuk sampel Monte Carlo 321–330 untuk tujuan ilustrasi. Perkiraannya
adalahB2, kesalahan standarSE, batas bawah estimasi interval 95% adalahLB, dan batas atas adalah
UB. variabelMENUTUPI=1 jika interval berisi nilai parameter sebenarnya. Dalam sampel yang dipilih,
satu estimasi interval, 323, tidak mengandung nilai parameter sebenarnya.
Dalam eksperimen Monte Carlo, kami menguji(t nul)l hy(poth)esisH0:Β.2= 10 melawan alternatifH
1:Β.2>10 menggunakanT-statistikT=B210DanseB2. Kami menolak hipotesis nol jika T≥.1.685954, yang
merupakan persentil ke-95 dariT(38)distribusi. Pada Tabel 3C.2,T-nilai statistik adalahTSTATdan
MENOLAK=1 jika tes menolak hipotesis nol. Dalam 5,36% dari 10.000 sampel Monte Carlo, kami
menolak hipotesis nol, yang berada dalam batas kesalahan yang dibahas dalam Bagian 3C.2. Pada
Tabel 3C.2, untuk sampel 323, hipotesis nol yang benar ditolak.

TABEL E 3C.2 Hasil 10.000 Simulasi Monte Carlo dengan Random-x

SAMPEL B2 SE TSTAT MENOLAK LB UB MENUTUPI

321 9.6500 5.1341 0,0682 0 0.7434 20.0434 1


322 7.4651 4.3912 0,5773 0 1.4244 16.3547 1
323 22.9198 5.6616 2.2820 1 11.4584 34.3811 0
324 8.6675 4.8234 0.2763 0 1.0970 18.4320 1
325 18.7736 5.2936 1.6574 0 8.0573 29.4899 1
326 16.4197 3.8797 1.6547 0 8.5657 24.2738 1
327 3.7841 5.1541 1.2060 0 6.6500 14.2181 1
328 3.6013 4.9619 1.2896 0 6.4436 13.6462 1
329 10.5061 5.6849 0,0890 0 1.0024 22.0145 1
330 9.6342 4.8478 0,0755 0 0.1796 19.4481 1

............................................................................................................................................

4Rincianlain tentang simulasi Monte Carlo dapat ditemukan diMikroekonometrika: Metode dan Aplikasi, oleh A.
Colin Cameron dan Pravin K. Trivedi (Cambridge University Press, 2005). Materinya canggih.
Lampiran 3C Simulasi Monte Carlo151

Kami menyimpulkan dari simulasi ini bahwa secara acak-xkasus tidak ada bukti bahwa inferensi tidak
berfungsi seperti yang diharapkan, dengan 95% interval mencakup nilai parameter sebenarnya dan 5%
pengujian menolak hipotesis nol yang benar.
Untuk menyelidiki kekuatanT-uji, probabilitas bahwa ia menolak hipotesis yang salah, kami
mengujiH0:Β.2= 9 lawanH1:Β.2>9 danH0:Β.2= 8 lawanH1:Β.2>8. Dalam 10.000 sampel Monte Carlo,
hipotesis pertama ditolak dalam 7,8% waktu dan hipotesis kedua ditolak 11,15%. Tingkat
penolakan ini jauh lebih sedikit daripada di fixed-xhasil yang dipelajari dalam Lampiran 3B dan
kurang dari tingkat penolakan empiris dalam hasil simulasi dalam Lampiran 3C.2. Kami
mencatat bahwa kemampuanT-tes untuk menolak√. ta hipotesis palsu terkait dengan
( )( )
besarnya parameter noncentrality dalam (3A.8), = xsaya-x2β.2-C.Dalam ini
( )
percobaan, faktor2-C =1 dan 2 dan = 50 adalah sama seperti padaxcontoh.
()
Apa yang harus berubah? Satu-satunya faktor yang tersisa adalah variasi dalamx-nilai, xsaya-x2.
()
Pada contoh sebelumnya, xsaya-x2= 1000 danx-nilai ditetapkan dalam sampel berulang. Di dalam
percobaan,x-nilai tidak tetap tetapi acak, dan untuk setiap sampelx-nilai, jumlah perubahan
variasi. Kami menentukan varians darixmenjadi 2,56, dan dalam 10.000 Monte Carlo
percobaan, rata-rata varians sampelS2 x=2.544254 dan rata-rata variasinya
()
di dalamxtentang artinya, xsaya-x2, adalah 99.22591, atau sekitar sepersepuluh variasi tetap-x
kasus. Sangat jelas mengapa kekuatan tes secara acak-xkasusnya lebih rendah, itu karena
()
rata-rata xsaya-x2lebih kecil.
BAB4

Ramalan,
Kesesuaian,
dan Masalah Pemodelan

TUJUAN PEMBELAJARAN

Berdasarkan materi dalam bab ini, Anda seharusnya dapat

1.Jelaskan cara menggunakan model regresi linier 8.Menghargai berbagai fungsi nonlinier yang dapat
sederhana untuk memprediksi nilaikamuuntuk nilai diestimasi menggunakan model yang linier
tertentu darix. dalam parameter.

2.Jelaskan, secara intuitif dan teknis, mengapa prediksi 9.Tuliskan persamaan untuk bentuk fungsional
untukxnilai lebih jauh darixkurang dapat diandalkan. log-log, log-linear, dan linear-log.

10.Jelaskan perbedaan antara kemiringan suatu


3.Jelaskan pengertian dariSST,SSR, danSSE, dan bentuk fungsional dan elastisitas dari suatu
bagaimana mereka terkait denganR2. bentuk fungsional.

4.Sebut dan jelaskan pengertian 11.Jelaskan bagaimana Anda akan memilih bentuk
koefisien determinasi. fungsional dan memutuskan bahwa bentuk
fungsional memadai.
5.Jelaskan hubungan antara analisis korelasi
danR2. 12.Jelaskan cara menguji apakah persamaan
''kesalahan'' terdistribusi normal.
6.Laporkan hasil persamaan regresi yang dipasang
sedemikian rupa sehingga interval kepercayaan dan uji 13.Jelaskan bagaimana menghitung prediksi,
hipotesis untuk koefisien yang tidak diketahui dapat interval prediksi, dan ukuran kecocokan
dibangun dengan cepat dan mudah. dalam model log-linear.

7.Jelaskan bagaimana koefisien yang diperkirakan dan 14.Jelaskan metode alternatif untuk mendeteksi nilai
besaran lain dari persamaan regresi akan berubah data yang tidak biasa, ekstrim, atau salah.
ketika variabel diskalakan. Mengapa Anda ingin
menskalakan variabel?

152

Anda mungkin juga menyukai