Istilah regresi dikemukakan untuk pertama kali oleh seorang antropolog dan
ahli meteorology Francis Galton dalam artikelnya “Family Likeness in Stature” pada
tahun 1886. Ada juga sumber lain yang menyatakan istilah regresi pertama kali mucul
dalam pidato Francis Galton didepan Section H of The British Association di Aberdeen,
1855, yang dimuat di majalah Nature September 1855 dan dalam sebuah makalah
“Regression towards mediocrity in hereditary stature”, yang dimuat dalam Journal of
The Antrhopological Institute (Draper and Smith, 1992).
Studinya ini menghasilkan apa yang dikenal dengan hukum regresi universal
tentang tingginya anggota suatu masyarakat. Hukum tersebut menyatakan bahwa
distribusi tinggi suatu masyarakat tidak mengalami perubahan yang besar sekali antar
generasi. Hal ini dijelaskan Galton berdasarkan fakta yang memperlihatkan adanya
kecenderungan mundurnya (regress) tinggi rata-rata anak dari orang tua dengan tinggi
tertentu menuju tinggi rata-rata seluruh anggota masyarakat. Ini berarti terjadi
penyusutan ke arah keadaan sekarang. Tetapi sekarang istilah regresi telah diberikan
makna yang jauh berbeda dari yang dimaksudkan oleh Galton. Secara luas analisis
regresi diartikan sebagai suatu analisis tentang ketergantungan suatu variabel kepada
variabel lain yaitu variabel bebas dalam rangka membuat estimasi atau prediksi dari
nilai rata-rata variabel tergantung dengan diketahuinya nilai variabel bebas.
𝑌𝑖 = 𝛽𝑜 + 𝛽1 𝑋𝑖 +∈𝑖
𝑌𝑖 : Dependent
𝛽𝑜 + 𝛽1 𝑋𝑖 : Konstan
∈𝑖 : Random Variabel/Independent
Persamaan diatas Simpel, Linier dalam parameter dan linier dalam variabel
Adapun parameternya, yaitu mean dan variansi da-pat diturunkan sebagai berikut :
Mean (Yi )
𝑌𝑖 = 𝛽𝑜 + 𝛽1 𝑋𝑖 +∈𝑖
𝘌(𝑌𝑖 ) = 𝘌(𝛽𝑜 ) + 𝘌(𝛽1 𝑋𝑖 ) + 𝘌(∈𝑖 )
𝘌(𝑦) = 𝛽𝑜 + 𝛽1 𝑋𝑖
var(Yi )
var(Yi )= var(0 + 1 Xi + i )
var(Yi )= 0 + 0 + var(i ) = 2
1 n n
𝑏0 = Yi b1 X i Y b1 X
n i 1 i 1
∑𝑛𝑖=1 𝑋𝑖 ∑𝑛𝑖=1 𝑌𝑖
∑𝑛𝑖=1 𝑋𝑖 𝑌𝑖 −
𝑏1 = 𝑛
𝑛 2
𝑛 2 (∑𝑖=0 𝑋𝑖 )
∑𝑖=0 𝑋𝑖 −
𝑛
Yˆi b0 b1 X i .
𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖
Kedua persamaan ini berbeda
𝜀𝑖 = 𝑌𝑖 − 𝐸 { Yˆi } b0 b1 X i .
𝑛
∑ ei = 0
𝑖=1
Yˆi adalah
b0 b1Estimasi
Xi. harga y jika X disubstitusikan ke dalam persamaan regresi.
Bagaimana kalau di STATA !!!
Hubungan fungsional
Y = f(x)
contoh :
y = 2x dengan mengetikkan gen y=2*High MPG maka akan dihasilkan
seperti grafik dibawah ini :
100
y80
60
40
20 30 40 50
HighMPG
Sudah terlihat dalam bentuk garis lurus karena persamaan y=2x dimana
setiap pertambahan 1 nilai x maka y bertambah sebanyak 2 nilai x.
Hubungan statistik
𝑌𝑖 = 𝛽𝑜 + 𝛽1 𝑋𝑖 +∈𝑖
𝑌𝑖 : Dependent Variable
𝛽𝑜 + 𝛽1 : Parameter
𝑋𝑖 : Independent Variable
𝛽𝑜 + 𝛽1 𝑋𝑖 : Konstan
Persamaan diatas Simpel, Linier dalam parameter dan linier dalam variabel
Estimate
Yi = β0 + β1 X i + ε i
Y i = ( β 0 + β 1 Xi )
𝑛
𝑄 = ∑𝑖=1(Yi − β0 − β1Xi )2 , kita turunkan untuk mencari maksimum.
∑ 𝑋𝑖 ∑ 𝑌𝑖
∑ 𝑋𝑖𝑌𝑖 −
𝑏1 = 𝑛
(∑ 𝑋𝑖)2
∑ 𝑋𝑖 2 −
𝑛
𝑏𝑜 = 𝑌 − 𝑏𝑖 𝑋
50
40
30
20
Yˆi b0 b1 X i .
𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖
Kedua persamaan ini berbeda
𝜀𝑖 = 𝑌𝑖 − 𝐸 { Yˆi } b0 b1 X i .
𝑛
∑ ei = 0
𝑖=1
Yˆi adalah
b0 b1Estimasi
Xi. harga y jika X disubstitusikan ke dalam persamaan regresi.