Anda di halaman 1dari 4

Chyka Putri Ariesta

13119062

Referensi : Chapter 6 Building Empirical Models


Buatlah resume chapter 6, dengan point-point sebagai berikut:

1. Mengapa pada simple linear regresion model terdapat 𝜖 random error?


2. Apa yang dimaksud dengan random error tersebut?
3. Jika dikatakan dalam buku : For example, suppose that the true regression model relating salt
concentration to roadway area is 𝜇𝑌|𝑥 = 3 + 15𝑥, and suppose that the variance is 𝜎2 = 2.
Jelaskan maksud kalimat di atas, dan apa yang dimaksud varian dalam kasus ini?
4. Jelaskan yang anda ketahui soal degree of freedom dalam statistika!
5. Jelaskan mengapa pembagi (penyebut) dalam rumus-rumus statistika dapat berupa n-1 atau
bahkan n-2? Ambil satu contoh rumus yang menggunakan penyebut tersebut dan jelaskan
mengapa!
6. Jelaskan dengan rinci Testing Hypotheses in Simple Linear Regression !
7. Jelaskan apa yang dimaksud dengan Confidence Intervals in Simple Linear Regression!
8. Jelaskan penngunaan regresi linear untuk Prediction of a Future Observation!
9. Apa yang dimaksud dengan model adequacy, dan bagaimana cara memeriksanya?
10. Apa yang dimaksud dengan correlation? Jelaskan hubungannya dengan ANOVA!

Jawab:

1. Pada simple linear regression kita berusaha mencari hubungan variabel x dan Y dimana
kita mengasumsikan rata – rata response variable Y memiliki hubungan secara linier
dengan regressor variable x. Meskipun kita mengasumsikan rata – rata nilai Y memiliki
hubungan linier dengan x, namun pada nilai sebenarnya tidak berlaku tepat secara linier.
Terdapat suatu penyimpangan dan penyimpangan ini disebut random error (𝜖).
2. Random error adalah besar penyimpangan atau perbedaan antara nilai aktual dengan nilai
prediksi dari variabel dependen y hasil regresi linier.
3. Maksud kalimat tersebut adalah karena Y merupakan jumlah konstanta β0 + β1x (mean)
dan random variable yang terdistribusi normal, maka Y adalah random variable yang
terdistribusi normal. Varians σ2 menentukan variabilitas dalam pengamatan Y tentang
konsentrasi garam. Jadi, jika σ2 kecil, nilai Y yang diamati akan jatuh mendekati garis,
dan jika σ2 besar, nilai Y yang diamati mungkin menyimpang dari garis. Karena σ2
konstan, variabilitas dalam Y pada setiap nilai x adalah sama. Model regresi tersebut
menggambarkan hubungan antara konsentrasi garam Y dan roadway area x. Jadi, untuk
setiap nilai roadway area, konsentrasi garam terdistribusi normal dengan mean 3 + 15x
dan varians 2. Misal, jika x = 1,25, maka Y memiliki nilai mean 3 + 15 (1.25) = 21.75
dan varians 2.
4. Derajat Kebebasan adalah jumlah nilai yang terlibat dalam perhitungan yang memiliki
kebebasan untuk bervariasi. Dengan kata lain, Degree of Freedom ini adalah jumlah
penghitungan akhir suatu statistik yang bebas berubah-ubah. Pada umumnya, Derajat
Kebebasan (DK) atau Degree of Freedom (df) dapat didefinisikan sebagai jumlah total
observasi dikurangi jumlah batasan independen yang dikenakan pada observasi.
5. Pembagi (penyebut) dalam rumus – rumus statistika biasanya dapat berupa n – 1 atau
bahkan n – 2 karena hal ini berkaitan dengan degree of freedomnya. Seperti yang telah
dijelaskan sebelumnya bahwa rumus umum untuk menentukan derajat kebebasan adalah
total pengamatan (n) dikurangi banyaknya parameter yang ditaksir. Misalnya pada rumus
varian sampel sebagai berikut. Pembagi n-1 menyatakan derajat kebebasan agar nilai
varian sampel mendekati varian populasi. Hal ini juga menandakan terdapat 1 variabel
yang sedang kita amati.

6. Untuk simple linear regression, hypothesis test yang umum digunakan adalah mengetest
hubungan linier antara variabel x dan y yang dinyatakan dengan:
H0 : β1 = 0 (no linear relationship)
H1 : β1 6= 0
dengan menggunakan asumsi
oleh karena kita akan mengestimasi σ2, kita menggunakan t-statictic:

dengan H0 true, T0 ∼ tn−2


Dengan observasi test statistic t0, kita dapat menghitung nilai p-value dan membuat
kesimpulan dari hypothesis test.
7. Confidence Intervals in Simple Linear Regression adalah suatu interval atau ukuran
sampel yang diperlukan untuk mencapai suatu jarak tertentu dari slope hingga confidence
limit. Confidence interval dapat digunakan untuk mengestimasi slope, intercept, dan main
response. lebar confidence interval adalah ukuran keseluruhan kualitas dari suatu garis
regresi.
8. Penggunaan regresi linear untuk Prediction of a Future Observation dilakukan untuk
memprediksi observasi yang baru dengan y berkorenpondensi ke suatu level regressor
variable x tertentu. Jika x0 adalah value dari regressor variable interest maka

adalah titik estimasi untuk nilai response Y 0 yang baru. Observasi yang baru ini
independen dengan observasi sebelumnya dan digunakan untuk mengembangkan model
regresi.
9. Model adequacy checking menggunakan beberapa asumsi seperti model nya benar,
observasi bersifat independen, error terdistribusi normal, dan varians konstan.
10. Anova adalah suatu teknik untuk membandingkan rata- rata dari multiple population.
Anova seperti regresi menggunakan correlation, namun itu mengkontrol secara statistik
untuk independen variabel yang lain dalam model yang sedang digunakan dengan fokus
pada variasi unik dalam DV yang dijelaskan oleh IV.

Anda mungkin juga menyukai