Anda di halaman 1dari 33

MATA KULIAH : Analisis Data Dasar

KODE MATA KULIAH/SKS : MA5004 / 4 sks


KURIKULUM : 2017
VERSI : 0.0
Minggu 14
Pertemuan 13
KEMAMPUAN AKHIR YANG DIHARAPKAN

Mahasiswa mampu melakukan analisis


keterkaitan antara dua atau lebih variabel
MATERI POKOK
• Analisi Regresi Linier Sederhana
• Analisis Regresi Linier Darab
SUMBER PUSTAKA
1. Newbold, P., Carlson, W., & Thorne, B. (2010).
Statistics for business and economics, 7th Ed.
Pearson.
2. Bowerman, B. L., O'Connell, R. T., Murphree,
E., Huchendorf, S. C., & Porter, D. C. (2009).
Business statistics in practice, 5th Ed. New
York: McGraw-Hill.
MODEL LINIER
Merupakan persamaan linier dua variable:

Y = β0 + β1X
dimana:
• Y adalah variabel terikat (dependent variable)
• X adalah variabel bebas (independent variable)
• β0 disebut intercept – nilai Y ketika X = 0
• β1 disebut slope – perubahan nilai Y (bertambah
atau berkurang) jika X bertambah 1 satuan
REGRESI LINIER SEDERHANA
Model regresi linier sederhana adalah:

𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝜀
dimana:
• 𝛽0 adalah konstanta
• 𝛽1 adalah koefisien arah bagi 𝑋
• 𝜀 adalah eror yang berdistribusi 𝑁(0, 𝜎 2 )

𝑌 merupakan variabel acak berdistribusi sama dengan


𝜀 dan 𝑋 bukan variabel acak.
ANALISIS REGRESI LINIER
Analisis Regresi Linier digunakan untuk:
• Menjelaskan pengaruh perubahan variabel bebas
(independent variable) pada variabel terikat
(dependent variable).
• Memprediksi nilai variabel terikat untuk suatu nilai
variabel bebas.
Variabel terikat disebu juga variabel endogen dan
variabel bebas disebut exogen.
MODEL REGRESI LINIER SEDERHANA
Model regresi populasi:
Koefisien
Intersep Variabel
slope Error
Population Bebas
populasi
Variabel
Terikat

Yi  β0  β1Xi  ε i
Komponen Linier Komponen Eror
MODEL REGRESI LINIER SEDERHANA

Y Yi  β0  β1Xi  ε i
Observed Value
of Y for Xi

εi Slope = β1
Predicted Value Random Error
of Y for Xi
for this Xi value

Intercept = β0

Xi X
PERSAMAAN REGRESI LINIER SEDERHANA
Parameter populasi: intercept, slope, dan error
ditaksir dari data.
Taksiran/ Taksiran Taksiran slope
prediksi nilai intercept regresi
observasi y regresi
ke-i
Nilai x untuk

yˆ i  b0  b1x i observasi ke-i

Taksiran error ei memiliki rata-rata 0


ei  ( yi - yˆ i )  yi - (b0  b1xi )
PENAKSIR LEAST SQUARE
Penaksir untuk koefisien slope adalah
n

 (X i  X)(Yi  Y)
Cov(X, Y)
b1  i 1
n

s 2X
 i
(X
i 1
 X ) 2

dan peaksir bagi y-intercept adalah

b 0  Y  b1X
Garis regresi selalu melalui titik (𝑥, 𝑦)
ASUMSI MODEL REGRESI LINIER
• Y adalah sebuah fungsi linier dari X, ditambah
random error
• Eror εi adalah saling bebas dangan nilai-nilai x
• Eror adalah variabel acak dengan rata-rata 0 dan
variansi konstan σ2

E[εi ]  0 and E[εi ]  σ 2 for (i  1, ,n)


2

• Eror εi yang satu dengan yang lain tidak berkorelasi


E[εiε j ]  0 for all i  j
CONTOH
Diberikan data berikut. Akan Harga Rumah Luas Tanah
dianalisis apakah Luas Tanah ($1000s) (Square Feet)
mempengaruhi Harga Rumah 245 1400
dengan menggunakan Analisis 312 1600
Regresi Linier Sederhana. 279 1700
450
308 1875
400
199 1100
Harga Rumah ($1000s)

350
300 219 1550
250
200 405 2350
150
100 324 2450
50
0 319 1425
0 1000 2000 3000
Square Feet 255 1700
CONTOH
Terlihat pada grafik bahwa terdapat 450

kecenderungan hubungan linier 400

Harga Rumah ($1000s)


350

dengan slope (kemiringan) positif. 300


250
200
150
Dengan demikian bisa dirumuskan: 100
50
0
𝐻0 : 𝛽1 = 0 0 1000 2000 3000
Square Feet
(Luas Tanah tidak mempengaruhi
Harga Rumah)

𝐻𝑎 : 𝛽1 ≠ 0
(Luas Tanah mempengaruhi Harga
Rumah)
TAMPILAN SOFTWARE
Regression Statistics
Multiple R 0.76211 The regression equation is:
R Square 0.58082
Adjusted R Square 0.52842 house price  98.24833  0.10977 (square feet)
Standard Error 41.33032
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
REPRESENTASI GRAFIS
House price model: scatter plot and
regression line
450
400
House Price ($1000s)

350 Slope
300
250
= 0.10977
200
150
100
50
Intercept 0
= 98.248 0 500 1000 1500 2000 2500 3000
Square Feet

house price  98.24833  0.10977 (square feet)


INTERPRETASI INTERCEPT
house price  98.24833  0.10977 (square feet)

Jelas bahwa tidak ada rumah dengan luas tanah 0


square feet, jadi b0 = 98.24833 hanya mengindikasikan
bahwa pada rumah-rumah itu, nilai $98,248.33 adalah
bagian harga rumah yang tidak dijelaskan oleh luas
tanah.
INTERPRETASI SLOPE
house price  98.24833  0.10977 (square feet)

b1 mengukur taksiran perubahan Y sebagai


akibat dari penambahan X sebesar satu satuan.
Di sini, b1 = 0.10977 menginformasikan bahwa
rata-rata harga rumah akan naik
0.10977( × $1000) = $109.77, jika luas tanah
bertambah 1 square feet.
TAMPILAN SOFTWARE
SSR 18934.9348
Regression Statistics
R2    0.58082
Multiple R 0.76211 SST 32600.5000
R Square 0.58082
Adjusted R Square 0.52842 58.08% variasi harga rumah
Standard Error 41.33032 dijelaskan oleh variasi luas
Observations 10
tanah.
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
INFERENSI SLOPE
b1 sb1 t
H0: β1 = 0
H1: β1  0 Coefficients Standard Error t Stat P-value
Intercept 98.24833 58.03348 1.69296 0.12892
d.f. = 10-2 = 8 Square Feet 0.10977 0.03297 3.32938 0.01039

t8,.025 = 2.3060

Statistik Hitung: t = 3.329


a/2=.025 a/2=.025

Putusan: Tolak 𝑯𝟎
Tolak H0 Jangan Tolak H0 Tolak H0
Signifikan bahwa Luas
-tn-2,α/2 0 tn-2,α/2 Tanah mempengarui
-2.3060 2.3060 3.329 Harga Rumah
INFERENSI SLOPE
P-value
Coefficients Standard Error t Stat P-value
H0: β1 = 0
Intercept 98.24833 58.03348 1.69296 0.12892
H1: β1  0 Square Feet 0.10977 0.03297 3.32938 0.01039

Ini adalah pengujian dua P-value = 0.01039 < 0.05


sisi, jadi p-value
P(t > 3.329)+P(t < -3.329) Putusan: Tolak 𝑯𝟎
= 0.01039 Signifikan bahwa Luas
(untuk 8 d.f.) Tanah mempengarui
Harga Rumah
TAMPILAN SOFTWARE
Regression Statistics
Multiple R 0.76211
MSR 18934.9348
R Square 0.58082 F   11.0848
Adjusted R Square 0.52842 MSE 1708.1957
Standard Error 41.33032
Observations 10 With 1 and 8 degrees P-value for
of freedom the F-Test
ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580
UJI F UNTUK SIGNIFIKANSI
H0: β1 = 0 Statistik Hitung:
H1: β1 ≠ 0 MSR
F  11.08
a = 0.05 MSE
df1= 1 df2 = 8
Putusan:
Titik Tolak H0 pada a = 0.05
kritis:
Fa = 5.32
a = .05 Kesimpulan:
Signifikan bahwa ukuran tanah
0Jangan Tolak H F mempengaruhi harga rumah.
0 Tolak H0
F.05 = 5.32
PREDIKSI
Prediksi harga rumah jika luas tanah 2000
square feet.
Harga Rumah  98.25  0.1098 (sq.ft.)
 98.25  0.1098(2000)
 317.85
Jadi harga prediksi rumah dengan luas tanah
2000 square feet adalah 317.85(×$1,000s) =
$317,850.
MODEL REGRESI LINIER DARAB

Ide: menentukan hubungan linier antara


1 variable terikat (Y) & 2 atau lebih variabel bebas (Xi)

Model regresi darab dengan k variable bebas:

Y-intercept Population slopes Random Error

Y  β0  β1X1  β2 X2    βk Xk  ε
PERSAMAAN REGRESI LINIER DARAB

Koefisien-koefisien dari model regresi linier darab ditaksir


menggunakan data
Persamaan regresi darab dengan k variable bebas:
Taksiran Taksiran
(atau Prediksi) Taksiran slope
intercept
nilai dari y

yˆ i  b0  b1x1i  b2 x 2i    bk x ki
LATIHAN: Lakukan Interpretasi dari Tampilan berikut.
Regression Statistics
Multiple R 0.72213
R Square 0.52148
Adjusted R Square 0.44172
Standard Error 47.46341 Sales  306.526 - 24.975(Price)  74.131(Advertising)
Observations 15

ANOVA df SS MS F Significance F
Regression 2 29460.027 14730.013 6.53861 0.01201
Residual 12 27033.306 2252.776
Total 14 56493.333

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 306.52619 114.25389 2.68285 0.01993 57.58835 555.46404
Price -24.97509 10.83213 -2.30565 0.03979 -48.57626 -1.37392
Advertising 74.13096 25.96732 2.85478 0.01449 17.55303 130.70888
REGRESI VS KORELASI
REGRESI VS KORELASI
Regression Statistics
Multiple R 0.76211
R Square 0.58082
Adjusted R Square 0.52842
Standard Error 41.33032
Observations 10

ANOVA
df SS MS F Significance F
Regression 1 18934.9348 18934.9348 11.0848 0.01039
Residual 8 13665.5652 1708.1957
Total 9 32600.5000

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 98.24833 58.03348 1.69296 0.12892 -35.57720 232.07386
Square Feet 0.10977 0.03297 3.32938 0.01039 0.03374 0.18580

• Tulislah perkiraan persamaan regresi yang didapat


• Berdasarkan uji-t Tentukan 𝐻0 dan 𝐻𝑎 !
• Dengan 𝛼 = 5% kesimpulan apa yang dapat simpulkan dari hasil keluaran diatas?
• Berdasarkan persamaan regresi yang anda tulis pada poin (a), perkirakan nilai Y untuk x=28!
• Tentukan 𝐻0 dan 𝐻𝑎 pada Uji Normalitas dan
ketentuan dalam menolak 𝐻0 !
• Dengan 𝛼 = 5% , kesimpulan apa yang bisa
diperoleh dari hasil Uji Normalitas diatas !

Anda mungkin juga menyukai