Anda di halaman 1dari 60

REGRESI LINIER SEDERHANA

Pertemuan 11
14 april 2015

1
Pengertian Regresi Linier Sederhana
(RLS)
y Metode
M d statistik
i ik yang berupaya
b memodelkan
d lk hubungan
h b antara
dua peubah acak di mana satu peubah acak mempengaruhi
ppeubah acak lainnya.
y
y Mempelajari lebih lanjut hubungan dua variabel, di mana
salah satu variabel nilainya dipengaruhi variabel lainnya.
y Kelinieran hubungan dua variabel tersebut selanjutnya akan
diuji dengan uji hipotesis yang telah dipelajari sebelumnya.

2
Fungsi Regresi
y Diperlukan jika kita ingin mempelajari scr kuantitatif, hub
antara berbagai kejadian
y Berupa kumpulan titik2 yg dpt dihubungkan oleh garis /
kurva ttt yg disebut garis regresi (linier,
(linier kuadratik,
kuadratik
logaritmik, eksponensial kubik, dll).
y Variabel yg diestimasi disebut variabel dependent/
p terikat
y Variabel yg mempengaruhi disebut variabel independent/
bebas

3
Perbedaan Regresi Linier dengan
K l i
Korelasi

y Dalam korelasi, kedua variabel diperlakukan sama.

y Dalam regresi, satu variabel dianggap peubah bebas


(X,predictor) dan yang lain peubah terikat (Y, outcome).

4
Jenis Peubah Yang Dipelajari Dalam
R g i Linier
Regresi Li i

1. Peubah bebas peubah yang mempengaruhi peubah


lainnya
2 Peubah terikat
2. peubah
b h yang dipengaruhi peubahbh
lain.
Contoh:
Anggaran belanja seorang anak kost (peubah terikat)
dipengaruhi oleh kiriman uang bulanan anak kost tersebut
(peubah bebas). Tidak berlaku sebaliknya.

5
T h
Tahapan A li i Pemodelan
Analisis P d l Statistik
St ti tik
1. Mengembangkan model yang memiliki landasan teori,
menentukan peubah bebas (X) dan peubah terikat (Y).
(Y)
2. Mengumpulkan data untuk peubah terikat dan bebas melalui
observasi atau data sekunder.
3. Berdasarkan data, membuat model yang menggambarkan
hampiran dari keadaan hubungan kedua peubah tersebut.

Tujuan Pembuatan Model


• Untuk membantu peneliti dalam melihat pola/karakteristik
hubungan antara peubah bebas dan peubah terikat.
• Membuat prediksi kondisi masa yang akan datang.

6
Model - Model Regresi
1. Regresi sederhana
Apabila hanya ada masing-masing 1 peubah terikat &
peubah bebas
2. Regresi
R i berganda
b d (multiple
( l i l regression)
i )
Apabila hanya ada 1 peubah terikat & beberapa variabel
bebas (lebih dari satu).
satu)
3. Model ekonometrik
Apabila banyaknya peubah terikat & bebas lebih dari satu.
satu

7
MODEL REGRESI LINIER
SEDERHANA

8
Jenis Data Yang Diolah Dalam Regresi
Li i Sederhana
Linier S d h

y Yang menjadi input untuk data peubah bebas & terikat: data
kuantitatif.
y Jenis data yang berpasangan (dari satu objek pengamatan
diukur dua buah ukuran (nilai) atau lebih).
y Akan
Ak ada d beberapa
b b pasangan data
d t yang nilainya
il i saling
li
berfluktuasi (berubah-ubah) satu dengan yang lainnya.
y Dari fluktuasi data tersebut,
tersebut akan diperoleh suatu model yang
memberikan gambaran keseluruhan dari perilaku pasangan
data.

9
A yangg dimaksud
Apa di k d dengan
d g “Linier”?
“Li i ”?

y Y=mX+B

10
Model Regresi Sederhana
y

11
Th Model
The M d l

The model has a deterministic and a probabilistic components

House
Cost

Most lots sell


for $25,000

H
House size
i

12
Th Model
The M d l
However house cost vary even among same size houses!
However,
Since cost behave unpredictably,
House p
we add a random component.
Cost

Most lots sell


for $25,000

H
House size
i

13
Th Model
The M d l
y The
Th fifirst order
d linear
li model
d l
y = β 0 + β1 x + ε
y = dependent variable
x = independent variable β0 and β1 are unknown population
β0 = y-intercept y parameters,
t therefore
th f are estimated
ti t d
from the data.
β1 = slope of the line
ε = error variable
Rise β1 = Rise/Run
β0 Run
x
14
Estimating the Coefficients

y The estimates are determined by


y drawing a sample from the population of interest,
y calculating sample statistics.
y producing a straight line that cuts into the data.

y
Question: What should be
considered a good line?

15 x
Th Least
The L t Squares
S (Regression)
(R g i ) Line
Li

A ggood line is one that minimizes


the sum of squared differences between the
ppoints and the line.

16
Langkah dalam Merumuskan
P
Persamaan R g i
Regresi
y

17
Langkah dalam Merumuskan
P
Persamaan R g i (Lanjutan)
Regresi (L j t )
y

SS xy
b1 =
SS xx
b0 = y − b1 x

SS xy = ∑ xi yi −
( ∑ x )( ∑ y )
i i

n
( ∑ xi )
2

SS xx = ∑ xi2 − = ( n − 1) s x2
n

18
Langkah dalam Merumuskan
P
Persamaan R g i (Lanjutan)
Regresi (L j t )

19
Regresi Linear Sederhana
Contoh : Bulan Biaya iklan Pendapatan
1 20 27
y Dalam 12 bulan, sebuah
2 20 23
perusahaan mencatat besarnya 3 25 31
biaya iklan yang dikeluarkan 4 28 45
dan hasil yang didapat oleh 5 29 47
perusahaan tersebut. Disajikan 6 28 42
dalam tabel berikut (Dalam $): 7 31 39
8 34 45
9 35 57
10 36 59
11 41 73
12 45 84
20
Regresi Linear Sederhana
Scatter Plot

21
Garis Regresi Linear Sederhana
y Untuk menentukan persamaan garis regresi maka ditentukan
kkoefisien
fi i dari
d i a dan
d b.b
y a dan b ditentukan dengan mencari jarak kuadrat dari masing-
masing data dan garis regresinya (Error) paling kecil atau
disebut metode kuadrat terkecil (Least square method)

22
Garis Regresi Linear Sederhana
Y y4

e4 Y = a + bX

y2 e3
e2 y3

e1
y1

x1 x2 x3 x4 X
23
Garis Regresi Linear Sederhana
SOAL
SOAL:
y Dari data iklan dan penghasilan, tentukan estimasi regresi
linearnya..
linearnya

24
KOEFISIEN DETERMINASI (R2)
• Koefisien determinasi (R2) adalah suatu besaran yang menyatakan
kualitas dari model regresi yang terbentuk.
• Kualitas besarnya kontribusi dari peubah bebas dalam
menjelaskan
j ppeubah terikat.

25
y Koefisien determinasi : merupakan suatu ukuran yg
di
digunakan
k utkk melihat
lih seberapa
b b
besar sumbangan
b variabel
ib l
independent terhadap variasi variabel dependent.
y Nilai
Nil i R² berkisar
b ki 0 < R² < 1
Kegunaannya:
y Utk ukuran
k k t t garis
ketepatan i regresii dari
d i hasil
h il estimasi
ti i thd
sekelompok data hasil observasi.
y Utk mengukur proporsi dr jumlah variasi yg diterangkan
oleh model regresi.

26
Cara Perhitungan Koefisien Determinasi
y

27
Cara Perhitungan Koefisien Determinasi
(
(Lanjutan)
j )

28
INTERPRETASI NILAI KOEFISIEN DETERMINASI
R2=60% dapat diartikan sebagai:
y 60% informasi mengenai nilai peubah terikat (Y) telah dapat
dijelaskan oleh nilai peubah bebas (X).
y Sedangkan
S d k sisanya 40% mengenai nilai l peubah
b h terikat
k (Y) dijelaskan
d l k
peubah lain yang belum dimasukkan dalam model regresi.
y Dengan kata lain,
lain kontribusi peubah bebas dalam menjelaskan niali
peubah terikat adalah sebesar 60%.

Jika R2=100%, maka dapat disimpulkan bahawa penjelasan mengenai


peubah terikat (Y) dapat dengan tepat dihitung apabila nilai peubah
bebasnya (X) diketahui.
29
INTERPRETASI NILAI KOEFISIEN DETERMINASI

y JJika nilai R2 yyangg diperoleh


p besar:
Pembahasan cukup pada model Regresi Linier Sederhana saja.

y Jika nilai R2 yang diperoleh kecil:


Dianjurkan untuk:
1. Menggunakan metode regresi berganda (multiple regression).
2. Melakukan transformasi data (misalnya melalui transformasi
Tukey).

30
D fi i i Korelasi
Definisi K l i
y Derajat
j hubungan
g antara variabel-variabel
y Statistik yang mengandung tingkat hubungan atau
kerjasama diantara dua variabel.
y Korelasi mengukur derajat hubungan antara 2 atau lebih
variabel.
y Korelasi Pearson adalah statistik bivariat yang
mengandung tingkat hubungan linear diantara dua
variabel
b l kuantitatif.
k f
y Hubungan antara 2 Variabel (Misal X danY) dapat linear,
non-linear,
li positif
itif atau
t negatif.
tif
31
Tipe korelasi
y Pearson Product Moment Correlation
y Sangat umum (diasumsikan bahwa korelasi adalah Pearson r
kecuali kalau spesifikasi sebaliknya)
y Hubungan Linear
y Hanya untuk skala Interval atau Ratio
y Spearman Correlation
y Skala Ordinal
y Mengandung konsistensi terlepas dari bentuk hubungan
y Intra-class Correlation

32
Hubungan antara pearson r DAN
KOEFISIEN DETERMINASI (R2)

y Koefisien determinasi (R2): seberapa besar nilai X dapat


menjelaskan nilaiY atau seberapa besar nilai X dapat
mempengaruhi nilaiY

y Koefisien korelasi ((r):


) keeratan hubungan
g antara variabel X dengan
g
Y

33
INGAT KEMBALI :
Cara Perhitungan Koefisien Determinasi
(R2)

34
CARA PERHITUNGAN KOEFISIEN
KORELASI pEARSON
EARSON (r)
( ) UNTUK SAMPEL
y

35
Makna koefisien korelasi
y Tingkat/kekuatan hubungan
y Hubungan sempurna : r = 1.0 atau –1.0
y Positif : setiap kali nilai X meningkat, maka dapat diprediksi akan semakin
meningkat nilaiY (perfect covariance).
y Negatif – setiap kali nilai X meningkat maka diprediksi nilaiY akan
menurun
y Nilai r tinggi (mendekati 1 atau –1) mengindikasikan hubungan
yang lebih
l bih erat,
y Nilai r rendah (mendekati 0) mengindikasikan hubungan yang
lebih lemah,
y Hubungan yang mendekati 0 mengindikasikan hubungan yang
tidak linear sehingga perubahan X tidak cocok untuk
p
memprediksi pperubahan variabelY

36
Ki
Kisaran nilai
il i r
y Kisaran nilai koefisien korelasi r dapat
terjadi antara rentang -1,00 hingga
+1,00.
y Korelasi positif sempurna terjadi ketika
diperoleh nilai r= +1.00 dan dengan
peningkatan satu unit untuk setiap
variabel, akan akan peningkatan
proporsional di variabel lainnya.
y Keberadaan korelasi sempurna
menandakan tidak ada faktor lain yang
mempengaruhi hubungan yang kita
pelajari. Situasi ini jarang terjadi di dunia
nyata.
nyata

37
Ki
Kisaran nilai
il i r
y Kisaran nilai koefisien korelasi r
dapat terjadi antara rentang -1,00
hingga
gg +1,00.
,
y Korelasi -1,00 mengindikasikan korelasi
negatif sempurna antara dua variabel
yyangg dipelajari.
p j Yaitu, ketika ada
peningkatan pada salah satu variabel, akan
ada penurunan yang proporsional pada
variabel lainnya.

38
Ki
Kisaran nilai
il i r

y Kisaran nilai koefisien korelasi r dapat


terjadi antara rentang -1,00 hingga
+1,00.
y Korelasi nol artinya hanya ada sedikit
atau tidak ada hubungan antara kedua
variabel.Yaitu, ketika nilai suatu
variabel
i b l meningkat,
i k nilai il i pada
d variabel
ib l
lainnya dapat juga meningkat,
menurun, atau tidak berubah sama
sekali..

39
UJI KEBERARTIAN KOEFISIEN SLOPE
(Asumsi RLS: menyatakan bahwa peubah bebas (X) mempengaruhi peubah terikat (Y)).
• Benarkah X memberikan kontribusi yang cukup berarti kepadaY?
Dilakukan uji hipotesis dari pernyataan tentang keberartian peubah
X dalam
d l menjelaskanY.
j l k Y

40
Langkah-langkah Uji Keberartian
K fi i Slope
Koefisien Sl
y

41
Langkah-langkah Uji Keberartian
K fi i Slope
Koefisien Sl (L j t )
(Lanjutan)
2. Menentukan daerah kritis & nilai titik kritis berdasarkan tingkat
( )
k l h tertentu (α).
kesalahan

y Daerah yang diarsir merupakan daerah penolakan H0.


y Nilai titik kritis diperoleh dari tabel Student (tabel t) dengan nilai
42 derajat kebebasan v=n-2 dengan n menyatakan banyaknya pengamatan.
Langkah-langkah Uji Keberartian
K fi i Slope
Koefisien Sl (L j t )
(Lanjutan)

43
Langkah-langkah Uji Keberartian
K fi i Slope
Koefisien Sl (L j t )
(Lanjutan)
y

44
Langkah-langkah Uji Keberartian
K fi i Slope
Koefisien Sl (L j t )
(Lanjutan)
y

45
UJI KELINIERAN MODEL
• RLS mengasumsikan
g bahwa hubungan
g X danY adalah linier.
• Untuk menguji kelinieran hubungan X danY, perlu dilakukan
beberapa langkah.

46
Langkah Uji Kelinieran Model RLS
y

47
Langkah Uji Kelinieran Model RLS
(l j t )
(lanjutan)
2. Menentukan daerah kritis dan nilai titik kritis berdasarkan tingkat
k l h tertentu (α).
kesalahan ( )

Pada gambar di atas, daerah yang diarsir merupakan daerah penolakan H0


dan yang tidak diarsir adalah daerah penerimaan H0. Nilai titik kritis
diperoleh dari tabel Fisher (tabel F) dengan nilai derajat kebebasan v1=1
dan v2=n-2, di mana n menyatakan banyaknya pengamatan.
48
Langkah Uji Kelinieran Model RLS
(l j t )
(lanjutan)
y

49
Langkah Uji Kelinieran Model RLS
(l j t )
(lanjutan)
y

50
CONTOH SOAL

51
Suatu lembaga kesejahteraan ibu dan anak mencoba untuk
mengamati banyaknya
b k anakk (dalam
d l satuan orang) yang dimiliki
d l k oleh
l h
peserta keluarga berencana (KB) berdasarkan usia perkawinan
mereka (dalam satuan tahun). Dengan mengamati 15 orang pasangan
peserta KB diperoleh informasi sebagai berikut:
Pasangan
g ke- 1 2 3 4 5
Usia perkawinan 12 15 8 12 3
Banyak anak 4 3 3 2 1
P
Pasangan k
ke- 6 7 8 9 10
Usia perkawinan 10 4 4 5 17
Banyak anak 1 2 1 2 3
Pasangan ke- 11 12 13 14 15
Usia perkawinan 20 2 11 2 13
Banyak anak 3 1 0 1 2

52
Permasalahan yang muncul dari kasus di atas adalah:
1. Tentukan peubah bebas dan peubah terikat.
2. Bagaimana kaitan kedua peubah dalam model taksiran RLS?
3. Selidiki
S l d k kualitas
k l darid modeld l regresi yang terbentuk.
b k
4. Selidiki keberartian peubah bebas terhadap peubah terikatnya
untuk α = 5%.
5%

53
Jawab:
Misalkan:
X=usia pasangan KB dalam (tahun)
Y= banyaknya anak (orang)
Dari data di atas, dapat disimpulkan:

54
y

55
y

56
y

57
y

58
y

daerah kritis
Daerah
penerimaan
H0

Langkah 4: karena nilai statistik uji (6,211)> dari nilai titik kritis (4,67),
maka nilai statistik uji berada di bawah daerah kritis. Hal ini menunjukkan
H0 ditolak.
ditolak
Langkah 5: dengan demikian, dapat diambil kesimpulan bahwa terdapat
59
hubungan linier antara X danY dengan tingkat kesalahan 5%
Rangkaian Analisa Model Data Berpasangan
M l l i Regresi
Melalui R g i

60

Anda mungkin juga menyukai