13119062
Jawab:
1. Pada simple linear regression kita berusaha mencari hubungan variabel x dan Y dimana
kita mengasumsikan rata – rata response variable Y memiliki hubungan secara linier
dengan regressor variable x. Meskipun kita mengasumsikan rata – rata nilai Y memiliki
hubungan linier dengan x, namun pada nilai sebenarnya tidak berlaku tepat secara linier.
Terdapat suatu penyimpangan dan penyimpangan ini disebut random error (𝜖).
2. Random error adalah besar penyimpangan atau perbedaan antara nilai aktual dengan nilai
prediksi dari variabel dependen y hasil regresi linier.
3. Maksud kalimat tersebut adalah karena Y merupakan jumlah konstanta β0 + β1x (mean)
dan random variable yang terdistribusi normal, maka Y adalah random variable yang
terdistribusi normal. Varians σ2 menentukan variabilitas dalam pengamatan Y tentang
konsentrasi garam. Jadi, jika σ2 kecil, nilai Y yang diamati akan jatuh mendekati garis,
dan jika σ2 besar, nilai Y yang diamati mungkin menyimpang dari garis. Karena σ2
konstan, variabilitas dalam Y pada setiap nilai x adalah sama. Model regresi tersebut
menggambarkan hubungan antara konsentrasi garam Y dan roadway area x. Jadi, untuk
setiap nilai roadway area, konsentrasi garam terdistribusi normal dengan mean 3 + 15x
dan varians 2. Misal, jika x = 1,25, maka Y memiliki nilai mean 3 + 15 (1.25) = 21.75
dan varians 2.
4. Derajat Kebebasan adalah jumlah nilai yang terlibat dalam perhitungan yang memiliki
kebebasan untuk bervariasi. Dengan kata lain, Degree of Freedom ini adalah jumlah
penghitungan akhir suatu statistik yang bebas berubah-ubah. Pada umumnya, Derajat
Kebebasan (DK) atau Degree of Freedom (df) dapat didefinisikan sebagai jumlah total
observasi dikurangi jumlah batasan independen yang dikenakan pada observasi.
5. Pembagi (penyebut) dalam rumus – rumus statistika biasanya dapat berupa n – 1 atau
bahkan n – 2 karena hal ini berkaitan dengan degree of freedomnya. Seperti yang telah
dijelaskan sebelumnya bahwa rumus umum untuk menentukan derajat kebebasan adalah
total pengamatan (n) dikurangi banyaknya parameter yang ditaksir. Misalnya pada rumus
varian sampel sebagai berikut. Pembagi n-1 menyatakan derajat kebebasan agar nilai
varian sampel mendekati varian populasi. Hal ini juga menandakan terdapat 1 variabel
yang sedang kita amati.
6. Untuk simple linear regression, hypothesis test yang umum digunakan adalah mengetest
hubungan linier antara variabel x dan y yang dinyatakan dengan:
H0 : β1 = 0 (no linear relationship)
H1 : β1 6= 0
dengan menggunakan asumsi
oleh karena kita akan mengestimasi σ2, kita menggunakan t-statictic:
adalah titik estimasi untuk nilai response Y 0 yang baru. Observasi yang baru ini
independen dengan observasi sebelumnya dan digunakan untuk mengembangkan model
regresi.
9. Model adequacy checking menggunakan beberapa asumsi seperti model nya benar,
observasi bersifat independen, error terdistribusi normal, dan varians konstan.
10. Anova adalah suatu teknik untuk membandingkan rata- rata dari multiple population.
Anova seperti regresi menggunakan correlation, namun itu mengkontrol secara statistik
untuk independen variabel yang lain dalam model yang sedang digunakan dengan fokus
pada variasi unik dalam DV yang dijelaskan oleh IV.