MUSTI
KANADI
A
NI
M :
2108202010004
JURUSAN :
MAGI
STERFI
SIKA
MATAKULI
AH :
STATI
STI
KA
Cl
assi
calLi
nearRegressionAnaly
sis
(Anal
i
sisRegresi
LinierKl
asik)
A.Tuj
uan
Regresili
niermenawar kancaralainuntukmenggambar kanhubungan
antar
a dua v ar
iabelxdan y .Sedangkan koefi
sien kor
elasiPearson
member i
kanhany aukurankasardaritr
enli
nier,modellinierdi
per
oleh
denganregr esianali
sismemungkinkanpredi
ksinil
ai-
yarbi
trerunt
uknilai
yangdiberi
kanxdal am rent
angdata.
B.Pendahul
uan
Regresili
nieradalah suat
u metode st
ati
sti
ka unt
uk mencar
itahu
hubunganantar
av ari
abelt
eri
katat
au(y
)dengansatuataul
ebi
hvari
abel
bebas(x)
.
Regresil
ini
ermerupakansalahsat
umodelanali
sissederhanadengan
j
enis datai nt
erv
alat au r
asi
o.Mel al
uianal
i
sisi ni
,peneli
tidapat
melakukanpredi
ksiber
dasar
kandat
a-datay
angdidapat
kan.
Gambar1.Regr
esi
li
nier
Gambar1.r egr
esi kl
asi
kmemi ni
mal kanpeny impangany ,dikur angi
regresisumbu ut ama meminimal kan area segitiga 0,5* (ΔxΔy )
antaratit
ikdat adangar i
sregresi,dimanaxdanyadal ahj arak
antaray ang di predi
ksidan y ang sebenar nya ni laix dan y .
Perpotongangar isdengansumbuyadal ahb0,dankemi r
inganny a
adalahb1.Duai niparametermenent ukanper samaangar isr egr esi
dan sering dianggap bebas darikesalahan.Cont ohnya adal ah
l
okasixdal am intisedimendarimanav ariabelyt elahdi ukur .NS
vari
abeldependenymengandungkesal ahankar enabesar ny at idak
dapat di t
entukan akur at. Regr esi l i
nier memi nimal kan
peny i
mpanganyant aradat
atit
ikxydanni laiyy angdi prediksiol eh
gari
stt erbaiky=b0+b1xmenggunakankr i
teriakuadr att erkecil.
Persamaandasarunt ukmodel l
i
nierumum adal ah
dimana b0 dan b1 adalah koef
isi
en r
egr
esi.Ni l
aib0 adal
ah
i
ntersepdengansumbuydanb1adal ahkemir
ingangaris.Juml
ah
kuadratdar
iypenyi
mpanganyangharusdimi
nimalkanadalah
Dif
erensiasi parsi
al suku kanan dal
am persamaan dan
meny etel
nyakenolmenghasilkanper
samaanseder
hanaunt
uk
koefi
sienregr
esib1:
Garisregresimelewat
ipusatdat
ayangditent
ukanolehsampel
berart
i,dankarenaitukamidapatmenghi
tungkoef
isi
enregr
esi
l
ainnyab0,
D.
Ekspl
orasiDat
a
menggunakanr at
a-r
at asampelunivari
atdankemi ri
nganb1y ang
di
hit
ungsebel umnya.Sebagaicontoh,mar iki
takembal imemuat
dat
akedal amanusiasi ntet
isdarif
ileagedepth_
1.txt.Kit
adapat
mendefi
nisikanduav ari
abelbar
u,met erdanumur ,danmembuat
di
agram pencardaridatater
sebut
.
cl
ear
agedept
h=l oad('
agedepth_
1.t
xt'
);
meters=agedepth(:,
1);
age=agedept h(
:,
2);
p=polyfi
t(
met er
s,age,
1)
out
put:
p=
5.
3667 21.
7607
Trenliniery angsi gni
fi
kandal am plotpencarbi variat,bersama
dengankoef isienkor elasil ebi
hbesardar ir=0, 9,menunj ukkan
l
ineary angkuatket ergant unganant ar
amet erdanusi a.Dalam
i
stil
ahgeol ogi ,inimeny iratkanbahwal aj
usedi ment asikonst an
sepanjangwakt u.sekar angki t
acobaunt ukmeny esuaikanl i
near
modelkedat ay angakanmembant umempr ediksiusi asedimen
padat i
ngkatunt uky angkamit i
dakmemi l
ikidatausi a.Fungsi
polyf
itmenghi tungkoef isiendaripol
inomialp(x)dengander ajat
ter
tentuy angcocokdengandat aydalam kuadr atterkecilnalar.
Dalam cont oh, kitamasukkanpol i
nomialderajatper tama( li
nier)
kedata.
out
put:
Sel
ainmenggunakanpersamaanuntukgar
isregr
esi
,ki
taj
uga
dapatmenggunakanf
ungsipol
iv
aluntukmenghit
ungni
lai
-y
.
pl
ot(
met
ers,
age,
'o')
,hol
don
pl
ot(
met
ers,
poly
v al
(p,
meter
s),
'
r'
),
hol
dof
f
koef i
sienp( x)danper samaany angdiperolehdenganr egresi
l
ini
erdapatsekar angdigunakanunt ukmempr edi
ksini
lai
-yuntuk
setiapni l
ai-
xy angdiber
ikan.Namun,kitahany abi
salakukani ni
dalam i nt
ervalkedalamany angmodell i
niernyadi
pasang,y ai
tu,
antar a0sampai20met er.Sebagaicont
ohumursedi menpada
suatkedal aman
dari 17met erdiber
ikanoleh
pol
yval
(p,
17)
ans=
112.
9946
Codi
ng:
[
p,s]=pol
yfi
t(
meters,
age,1);
[
p_age,
del
ta]=poly
conf(p,meter
s,s,
'
alpha'
,
0.05)
;
plot(
met ers,
age,'
o'
,meter
s,p_age,'
g-'
,.
..
meters,p_age+del
ta,
'
r-
-',
meters,p_age-del
ta,
'
r-
-'
)
axis([
0200140] ),
gri
don
xlabel
('DepthinSediment(met ers)'
)
ylabel
('
AgeofSedi ment( kyr
s)'
)
out
put:
Dal
am plot,ki
ta dapatmengamat
ipol
ali
niery
ang kuaty
ang
menunj
ukkanbeberapahal
:
Pl
otmenunj
ukkant
it
ikdat
aasl
i(l
i
ngkar
an)
,
gar
isr
egr
esi
(gar
ishi
j
au)
,
danbat
askesal
ahandar
iregr
esi
(gar
isput
us-
put
us)
Anal
yzi
ngt
heResi
dual
s
Residualmemuatinfor
masitent
angdatayangt i
dakdapatdi cakupoleh
persamaan gari
s dan ber
guna unt
ukmengev aluasikecocokan gar i
s
regresidengandat
apengamatan.Baikat
autidaknyagari
sr egresiyang
dibuatdalam menggambarkanti
ti
ktit
ikpengamatandanmenj el
askan
pengaruhv ari
abelXt erhadapv ari
abelYdipel aj
arimelaluir esidualnya.
Residualdaripersamaangar i
sy angbai kmempuny aisebar ankeci ldan
plotnyati
dakber pol aat auacak.Maki nbesarsebar anr esi dualmaka
maki nti
dakbai kkecocokangar isdengandat a.Haliniber ar t
i,semakin
ti
dak baik garist ersebutmenaksi rni l
aiY unt uk suatu ni l
aiX dan
semakin bany ak v ari
asidalam Y y ang t
idak dapatdi j
el askan oleh
persamaangar isregresi r
esi
sten.
clear
agedept h=l oad( '
agedept h_1.t
xt'
);
met ers=agedept h(:,
1);
age=agedept h(:,
2);
p=pol yfi
t(meters,age,1);
res=age-pol yval(
p,met ers);
plot(met ers,
res,'
o'
)
subplot(2,1,1)
plot(met ers,
age,'
o'),holdon
plot(met ers,
p(1)*met ers+p(2),
'
r'
),hol
dof
f
subplot(2,1,2)
stem( met ers,
res);
histogram( res,
6)
[h,
p,stats]=chi 2gof(res)
[h,
p,stats]=chi 2gof(res,'
NBins',
6)
out
put
chi
2st
at:
2.0922
df
:1
edges:
[-28.
2530-
5.57591.
98329.
542217.
1012]
O:
[11757]
E:
[8.
82828.
46037.
39275.
3187]
Boot
str
apEst
imat
esoft
heRegr
essi
onCoef
fici
ent
s
Pada bagian i
ni kita menggunakan met ode bootstrap unt uk
mendapat
kanest
imasiy angl ebi
hbaikdarikoef
isi
enregresi.Sebagai
cont
ohkit
amenggunakanf ungsiboot
str
pdengan1000sampel .
clear
agedept h=load('agedept h_1.t
xt'
);
met ers=agedept h(:,
1);
age=agedept h(:
,2);
p=pol y f
it
(meters,age,
1) ;
rng(0)
p_boot st
rp=boot strp(1000, '
pol
yfi
t'
,
met
ers,
age,
1);
histogram(p_boot st
rp(:,
1),15)
medi an(p_bootst
rp(:,
1))
ans=
5.
3855
I
nimer
upakangambarsl
ope(
kemi
ri
ngandar
iregr
esi
)denganmedi
an
5,
38
Unt
ukst
ati
sti
kkoef
isi
enkedua,
Y-I
nter
ceptr
egr
esi
nyaadal
ah:
hi
stogram(p_
bootst
rp(
:,
2),
15)
median(p_
bootst
rp(
:,
2))
ans=
21.
5374
I
nimer
upakangambarY-
Int
erceptr
egr
esi
nyadenganmedi
an21,
53
Jackkni
feEst
imat
esoft
heRegr
essi
onCoef
fici
ent
s
Metodej ackknifeadalahteknikr
esampl ingy angmi ri
pdenganmet ode
bootstr
ap.Dar isampeldengannt i
ti
kdat a,nsubsampeldengann- 1t i
ti
k
datadi ambil
.Par amet eryangdii
nginkan,mi sal
nya,regresikoefisien,
dihi
tung untuk set i
ap subsampel.Dispersidar ikoef i
sien kemudi an
dihi
tung. Kelemahan dar ii ni metode adal ah jumlah terbatas n
subsampel :per ki
raan darikoefi
sien regresikur ang tepatdar ipada
esti
masi bootstrap.Kodeyangrel
evanunt ukjackknifemudahdi buat :
clear
agedept h=l oad('agedepth_1.
txt
')
;
met ers=agedept h(:,
1);
age=agedept h( :
,2);
p=pol yf
it
(met ers,age,
1);
fori=1: 30
j_met ers=met ers;
j_age=age;
j_met ers(i
)=[ ]
;
j_age(i)=[];
p( i
,:
)=pol yfi
t(j
_met ers,
j_age,
1);
end
medi an(p(:
,1))
ans=
5.
3663
medi
an(
p(:
,
2))
ans=
21.
7964
Histogr
am a,y
angpertama( kemiri
ngangar isregresi
)danb,yangkedua
(
sumbuyi nter
sepgaris)koefi
sienregresi
,sepertiyangdi
perki
rakandari
pengambil
ansampel ulangj
ackknife.Perhati
kanbahwapar ameterny
a
ti
dakdidef
ini
sikandenganbai ksepertipadabootst
rap.
Cr
ossVal
i
dat
ion
Met odeketigauntukmenguj ikuali
tashasi lanal
i
sisregresimel
ibat
kan:
vali
dasisil
ang.Garisregresidihi
tungdenganmenggunakann- 1tit
ikdat
a.
Titi
k data ke-n dipr
ediksidan per bedaan antara predi
ksidan nil
ai
sebenarnya dihi
tung.Rat a-
rata per bedaan antar
a ni l
aiaktualdan
prediksi
selanj
utnyaditentukan.
Dalam contohinivali
dasisi
langdihi
tunguntukn=30t i
ti
kdata.30gari
s
regresiyangdi
hasilkan,masing-
masi ngdi
hitungmenggunakann-1=29
ti
ti
kdat a,tampil
kanbeber apadispersidil
er engny
adanper pot
ongan
sumbuy
Vali
dasisil
angmember ikaninfor
masi ber
hargatentangkecocokandari
hasi
l r
egresidanjugadapatdigunakanuntukkontrolkual
i
tasdibidang
l
ain,sepert
i:seper
tipr
ediksi
tempor al
danspasial
ReducedMaj
orAxi
sRegr
essi
on
Dalam beber apa contoh,t idak ada v ariabelyang di manipulasidan
karena itu keduany a dapatmenj adidi anggap mandi ri
.Dal am kasus
seper t
iitu,beberapamet odet er
sediaunt ukmenghi tunggar istt er
baik
yangmemi nimalkanjarakdar ixdany .Sebagaicont ohmet odesumbu
utamat ereduksi(RMA)memi nimalkansegi ti
gaarea0, 5* (
ΔxΔy )antara
ti
ti
kdat adangar isregresi,dimanaxdanyadal ahj arakantar anilai
prediksixdanydanni l
aisebenar nyadar ixdany( Gbr.4.4).Meski pun
pengopt imalan init ampakny a kompl eks,dapatdi t
unjukkan bahwa
koefisi
enr egr
esipertamab1( kemiringan)adalahhany ar asi
ost andar
deviasiydanx.
Sepertihalny
ar egresikl
asi
k,gar
isregresimel
ewatidat
a centroi
d
didef
ini
sikanolehmeansampel.Ol
ehkarenait
uki
tadapatmenghi
tung
yangkeduakoef i
sienr
egr
esib0(
per
pot
ongany )
,
menggunakan r ata-r
ata sampeluni var
iatdan kemi ri
ngan b1 y ang
di
hitungsebelumny a.Bi
arkankamimuatl agidatakedalamanusiadar i
fi
le agedepth_1.
txt dan t entukan dua v ar
iabel
,met er dan usia.
Diasumsi
kanbahwakeduav ar
iabelmengandungkesalahandanbahwa
hamburandat adapatdij
elaskandengandi sper
simeterdanumur .
cl
ear
agedept
h=l oad('
agedept h_
1.t
xt'
);
meters=agedept h(:,
1);
age=agedept h(
:,
2);
p(1,
1)=std(age)/std(meter
s)
p(1,
2)=mean( age)-p( 1,
1)*mean(meter
s)
pl
ot(meter
s,age,
'o')
, hol
don
pl
ot(meter
s,poly
v al
(p,meter
s),
'
r'
),hol
doff
p=
5.
6117 18.
7037
fi
tlini
ersedikitberbedadar igari
sy angdiperol
ehdariregresiklasik.
Perhatikanbahwagar isregresidariRMA bukangar i
s-bagidarigar i
s
di
hasilkanolehanalisi
sregresil
ini
erklasi
kx-ydany -
x,yait
udiproduksi
menggunakanxat auysebagaiv ari
abelindependensaatmenghi tung
gari
s-garisr
egresi
.
Cur
vil
i
nearRegr
essi
on
ter
li
hatdar ianali
sis kamisebel umny a bahwa modelr egresilini
er
meny ediakancarayangbai kuntukmenggambar kanpr
opert
ipenskalaan
data.Namun,kamimungki ni ngi
n memer i
ksa apakah data dapat
dij
elaskandenganbai kolehaf i
tpoli
nomi aldar
ideraj
atyanglebi
htinggi
,
misalnyadenganpol i
nomi alder
ajatkedua:
cl
ear
agedept
h=l oad('agedepth_1.
txt
')
;
meters=agedept h(:,
1);
age=agedept h(
:,2);
p=polyfi
t(
met ers,age,2)
pl
ot(meter
s,age,
'o'),holdon
pl
ot(meter
s,poly
v al(
p,meters)
,'
r'
),
hol
dof
f
[
p,s]=pol
yfi
t(
meters,age,
2);
[
p_age,
del
ta]=poly
v al(
p,meter
s,s)
;
Plot
nyamenunjukkanbahwamodelkuadratunt
ukdat ai
niadal
ahmodel
yang bai
k.Kuali
tasdar
ihasi
lny
a dapatdiujilagidengan menj
elaj
ahi
resi
du,denganmenggunakanskemar esampli
ng,ataudenganvali
dasi
si
lang.Menggabungkananal i
sisr
egresidengansal
ahsat umet odei ni
meny edi
akanalatyangampuhdal am anal
isi
sdatabivar
iat,sedangkan
koefi
sienkorel
asiPearsonhar
usdigunakanhanyasebagaipendahuluan
menguj i
hubunganli
nier.
Nonl
i
nearandWei
ght
edRegr
essi
on
Ruti
nitasy angmudahdi gunakanuntukmeny esuaikanmodelsepertii
tu
adalah nonl ini
er r egr esi menggunakan f ungsi nlinf
it. Untuk
mendemonst rasikanpenggunaannl i
nfi
tkamimenghasi l
kankumpul an
data bivari
atdimana sat uvari
abelberkorel
asisecara eksponensial
denganv ari
abelkedua.Kamiper tama-t
amamenghasi l
kannilaidengan
spasiy angmer ataantar a0,3dan3padai nterval0,
1dant ambahkan
beberapader auGaussi andenganst andardev i
asi0,2untukmembuat
j
arakdat at i
dakmer at
a.26dat ayangdihasil
kanpoi ndi
simpandikolom
pert
amadar idatav ari
abel .
clear
rng( 0)
dat a(:,
1)=0. 3:0.1: 3;
dat a(:,
1)=dat a(:
,1)+0. 2*randn( si
ze(data(
:,
1))
);
dat a(:,
2)=3+0. 2*exp( data(:
,1));
dat a(:,
2)=dat a(:
,2)+0. 5*randn( si
ze(data(
:,
2))
);
dat a=sor trows(dat a,1);
plot (
dat a(:,
1),
data(:,2),'
o')
xlabel ('
x-Axis')
,ylabel ('
y-Axis')
model =@( phi,
t)
(phi (1)*exp(t)+phi (2)
);
p0=[ 00] ;
p=nl infit
(data(:,
1),dat a(:,
2),
model ,
p0)
fi
ttedcur ve_1=p( 1) *exp( data(:
,1))+p(2);
plot (
dat a(:,
1),
data(:,2),'
o')
holdon
plot (
dat a(:,
1),
fit
tedcur ve_1,'
r'
)
xlabel ('
x-Axis')
,ylabel ('
y-Axis')
ti
tle('Unwei ghtedFi t')
holdof f
Sepert
iy ang dapatkit
al i
hatdarioutputp dan gr af
ik,kurva merah
ter
pasang menggambar kandatadengancukup bai k.Kamisekar ang
j
ugadapatmenggunakannl i
nfi
tuntuktampilr
egresiberbobot.Mariki
ta
asumsikan bahwa kita mengetahuikesal
ahan satu-sigma darinilai
dalam data(:
,
2).Kamidapatmenghasi l
kan kesalahan sintet
is dan
meny i
mpannyadi kol
om dataketi
ga.
data(
:,
3)=abs(
randn(si
ze(data(
:,
1))
));
err
orbar(
dat
a(:
,
1),dat
a(:
,2)
,data(
:,
3),
'
o')
xl
abel('
x-
Axi
s'
),yl
abel(
'y
-Axis'
)
Kit
asekar angdapatmenor malkantiti
kdatasehinggadibobotdengan
kebal
ikannyadarikesalahanrel
ati
f.Olehkarenai
tukamimenor mal
kan
data(
:,
3)sehinggatotalsemuakesal ahandalam data(
:,
3)adalahsatu,
danmeny impankesalahanyangdinormali
sasidal
am data(
:,
4).
f
it
tedcur
ve_
2=p(
1)*
exp(
dat
a(:
,
1))+p(
2);
err
orbar(data(:
,
1),dat
a(:
,2),
data(
:,
3),
'
o')
holdon
pl
ot(data(:
,1),
fi
tt
edcurve_2,
'r'
)
xl
abel('
x-Axis'
),yl
abel(
'y
-Axis'
)
ti
tl
e('
Wei ghtedFit
')
holdoff