Anda di halaman 1dari 48

ANALISIS REGRESI TERAPAN

RANGKUMAN

NAMA : RIZKI ALIFAH PUTRI

NIM : 15611036

KELAS :C

JURUSAN STATISTIKA

FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

UNIVERSITAS ISLAM INDONESIA

2017
BAB I
PENDAHULUAN

1.1 Distribusi peubah acak, rataan dan variansi


Misalkan Y suatu peubah acak, diskret maupun kontinu yang salah satu nilainya
y. Misalnya peluang Y mendapatkan nilai y adalah f(y). Bila banyaknya nilai y sama
dengan banyaknya bilangan bulat, maka Y disebut diskret, sedangkan bila niai y dapat
mengambil semua nilai pada sepotong garis lurus, maka Y disebut kontinu.
Dalam diskret
P (Y=y) = f(y) 0, f ( yi ) = 1, (1.1a)
i

Dalam kontinu
b

P (a < Y b) = f ( y) dy , dan f ( y) dy = 1 (1.1b)


a

Distribusi kumulatif (tumpukan) dari Y, lambang F(y) adalah


F(y) = P(Yy) = f (z) , untuk diskret (1.2a)
zy
y (1.2a)
= f (z) dz , untuk kontinu.

Dengan, F(y) disebut distribusi kumulatif (tumpukan), sedangkan f(y) disebut


fungsi peluang atau fungsi padat peluang dari Y. Nilai harapan atau rataan Y,
lambang E(Y) atau y, didefinisikan sebagai (1.3a)
E(y) = y f ( y) , bila diskret
y

(1.3b)
= y f ( y) dy , bila kontinu

Bila a dan b tetapan, maka


E (aY + b) = aE(Y) + b
Bila g dan h dua buah fungsi dari Y, maka
E [g (Y) h(Y)] = E[g(Y)] E[h(Y)]
Variansi peubah acak Y, lambang var (Y) atau y2 , adalah
Var (Y) = E(Y- y )2
= E (Y2) - y2 .
(1.4)
Akar dari variansi disebut simpangan baku, lambang y. simpangan baku mengukur
penyebaran data di sekitar rataannya.

Bila a dan b tetapan, maka


Var (aY + b) = a2 var (Y)

Kovariansi dua buah peubah acak Y dan Z dengan rataan masing-masing y dan
z, lambang kov (Y,Z) atau yz, adalah
yz = E (Y - y) (Z - z)
= E (YZ) - y z. (1.5)
Koefisien korelasi antara peubah acak Y dan Z didefinsikan sebagai
yz
yz = (1.6)
y . z

Jika yz mrnyatakan kovariansi antara Y- dan Z, sedangkan y dan z masing-masing


[(y)/ ] 2

menyatakan simpangan baku dari Y dan Z.

Misalkan Yinidan
Distribusi Z dua peubah
mempunyai acak
rataan dengan fungsi
, variansi danpadat gabungan
grafik f (y,z),
yang mirip diskret
lonceng dan
maupun kontinu. Dalam hal diskret,
P(Y=y, Z=z) = f(y,z), (1.7)
Sedangkan bila kontinu,
P[(Y,Z) A] = f ( y, z) dy dz
A

Bila g adalah distribusi peluang Y, sedangkan h bedistribusi peluang Z, maka


g(y) = f ( y, z) ,
z

h(z) = f ( y, z) , dalam diskret (1.8a)


y

dan

g(y) = f ( y, z) dz ,

(1.8b)
h(z) = f ( y, z) dy , dalam kontinu

g(y) dan h(z) disebut distribusi marginal (pias) Y dan Z.

Distribusi bersyarat Y bila diketahui Z=z, lambang f(yz) adalah


f ( y, z) , h(z) > 0 (1.9)
f(y|z)
h(z)
Atau
f ( y, z) , g(y) > 0
f(z|y)
g ( y)

Peubah acak Y dan Z disebut bebas statistik (selanjutnya hanya disebut bebas)
jika dan hanya jika untuk setiap x dan y berlaku
f (y,z) = g(y) . h(z) (1.10)
Dalam hal bebas, berlaku f(yz) = g(y) dan f(zy) = h(z).

1.2 Beberapa distribusi yang penting


Distribusi yang penting dalam statistika adalah distribusi normal atau distribusi
gauss,

1
1
e 2
f ( y) 2 (1.11)
2

tentu sepenuhnya bila dan diketahui. Suatu peubah acak Y yang berdistribusi
normal dengan rataan dan simpangan baku dilambangkan YN (,). Distribusi
normal sangat penting dalam statistika karena teorema limit pusatnya dan hampir
semua uji statistik yang digunakan dikembangkan melalui jalur distribusi normal.
Distribusi normal dengan rataan () 0 dan simpangan baku (2) 1 disebut normal
baku, lambang N(0,1). Dengan tabel memberikan
z 1
1
P(Z z) 2
eksp 2 dt (1.12)

Untuk z dari 0 sampai 3,49. Jadi, bila =5% misalnya, maka




eksp bila
P(Zz()) = dipenuhi 1 2

P(Zz()) = 1- = 0,95,
Yaitu bila z() = 1,65.
Untuk z<0, gunakan sifat setangkup distribusi normal, lihat 1-P(Zz).
Untuk -1,56
P(Z-1,65) = 1- P(Z1,56)
= 1- 0,9406
= 0,0594
Untuk suatu distribusi N(,2) berlaku
t2

P( - Y + ) = 0,6826 0,68
P( - 2 Y + 2) = 0,9544 0,95
P( - 3 Y + 3) = 0,9974 0,997. (1.13)
Ketiga sifat diatas sering berguna untuk:
1. Menentukan apakah normal dilanggar secara kasar atau tidak
Khususnya,
2. Menentukan a1 a2
bila pencilan an ndari
... jaraknya
dan , dan Y1tengah.
titik , Y2,..., Yn berdistribusi normal yang
Bila Y berdistribusi normal dengan rataan dan simpangan baku , maka aY+b
juga berdistribusi normal dengan rataan a+b dan simpangan baku a, untuk a dan b
tetapan sembarang. Bila Y1 dan Y2 dua peubah yang berdistribusi normal, masing-
masing N (1,12 ) dan N (2 , 22 ) dan koefisien korelasi antara Y1 dan Y2, maka
dan variansi y / n
fungsi padat gabungan Y1 dan Y2 adalah
1 1
f ( y 1 , y2 )
1 2
maka Y1 Y2 ... Yn mempunyai distribusi chi-kuadrat
2 (1.14) v
dengan derajat kebebasan
2 1 2

= n, lambang xv . distribusi xv ini mempunyai rataan v dan variansi 2v.
Untuk
1 y 2 2 y 2 2
Q( y1, y2 ) 1 2
1 2 1 2

Bila Y1 dan Y2 bebas satu sama lain, maka =0 dan bentuk fungsi padat gabungan
di atas menjadi:

eksp[ Q( y1, y2 )]
1 1 y 1 1 1 y 2
2 2

f ( y1, y2 ) 21 2 1 2 2 2 2
( y1 1)( y2 2 )
1 2 2
= f(y1 ) . f(y2) (1.15)

Umumnya, korelasi yang nol (0) tidak mengakibatkan kebebasan, tetapi dua
peubah yan saling bebas mempunyai korelasi yang nol (0). Bila Y1, Y2,..., Yn peubah
acak yang saling bebas, yang masing-masing berdistribusi normal dengan rataan
1,2,...,n dan simpangan baku 1, 2, ..., n maka peubah acak
Y a1Y1 a2Y2 ... anYn
Juga berdistribusi normal dengan rataan
y a11 a22 ... ann
dan variansi
y2 a1212 a22 22 ... an2 n2
1

sama, yaitu N(,2) maka


= (Y1, Y2,..., Yn)/n
Juga berdistribusi normal dengan rataan y ,
2 2

Bila Y1, Y2,..., Yn saling bebas dan masing-masing mempunyai distribusi N(0,1),
2 2 2

2 2

Bila Y1, Y2,..., Yn saling bebas dan masing-masing N(,2) maka


(1.16)
(Y )2 / 2 berdistribusi xn2
i

Bila
n1 1S12 (n2 1)S22

1
S2
n 1
(Yi Y )2
Maka
(1.17)
(n 1)S 2 / 2 berdistribusi xn21

2
v

bebas, maka
Z , (1.18)
T
Uv

Dikatakan mempunyai distribusi-t atau t-student dengan derajat kebebasan v,


lambang tv. Distribusi t mirip dengan distribusi normal, rataannya selalu nol dan
variansinya v/(v-2), v>2 jadi variansinya tergantung pada derajat bebas. Distribusi tv

sulit dibedakan dengan distribusi normal bila v>60 karena itu, tabel normal dipakai
sebagai pengganti tabel t.
Bila Bila
Y1, YZ2,...,
suatu peubahbebas
Yn saling acakdan
N(0,1) dan U berdistribusi
masing-masing dan keduanya
x N(,
berdistribusi 2) maka saling

Y (1.19)
T
S/ n

Berdistribusi-t dengan derajat kebebasan n-1. ini adalah cara yang umum
membentuk uji statistik tn-1.
Bila n maka tnN(0,1).
Misalkan Y11,Y12,...,Y1n bebas satu sama lain dan berdistribusi N(1,2). juga
1

misalkan Y21,Y22,...,Y2n saling bebas pula dan saling bebas dari peubah yang diatas,
2

masing-masing berdistribusi N(2,2). Misalkan


S2 /(n 1 n2 2) dengan

S 12 (Y 1i Y1)2 /(n1 1) dan S22 (Y 2i Y2 )2 /(n2 1)


i i
2 2 2
n1n2 2

Dan bebas dari Y1 dan Y2 , sehingga


1
, (1.20)
2

2 n1
1

kebebasan,Yn11+n
Berdistribusi-t dengan derajat
Y1i / n1
2-2.

Bila U1 dan U2 peubah yang saling bebas dan berdistribusi chi-kuadrat dengan
derejat kebebasan masing-masing v1 dan v2, maka
dan S2 n 1F Y2i Y2 ,Y2 Y2i / n2
U1 / v1
U 2 / v2 , (1.21)
Dikatakan mempunyai distribusi-F dengan derajat kebebasan v1 dan v2, lambang
Fv ,v
1 2

v2 , v2 2 dan variansi
Peubah acak ini mempunyai rataan v2 2

Maka,
2
(n,1v2 n24 2)S / berdistribusi x
U 2 v2 U1 v1 mempunyai distribusi F, tapi derajat
Perhatikan bahwa
T

Y Y
1 ,v 1
kebebasannya adalah v2 dan v1, lambang S Fv 2 1

n2
Jadi Fv ,v = 1 Fv .v 1 2 2 1

Jadi distribusi-t adalah hal khusus dari distribusi F, yaitu bila derajat kebebasan F
1n1 dan 2n2 dua terok acak
pada pembilang 1. Misalkan

berukuran n1 dan n2 yang saling bebas, masing-masing berasal dari populasi


N (1,12 ) dan N (2 , 22 ) . Maka peubah acak

2v22 v1 v2 2 S12 12
v1v2 2 v2 4 F S2 2 2 2 , (1.22)

Mempunyai distribusi F dengan derajat kebebasan n1-1 dan n2-1 bila:


1 2

S12 n1 1

Y111,Y12,...,Y
2
2
Y21,Y22,...,Y
2

Teorema Limit Pusat


Bila Y1, Y2,..., Yn peubah acak yang saling bebas dan masing-masing mempunyai
rataan maka
Y
Z
n, (1.23)
Menuju distribusi normal baku N(0,1) bila n.
Seperti dikemukakan sebelumnya Y1, Y2,..., Yn masing-masing normal maka
juga normal sehingga Z normal N(0,1) terlepas dari berapapun nilai n. Bila Y1, Y2,...,
Yn mempunyai distribusi yang setangkup maka proses limit cepat sekali menuju
N(0,1). Makin jauh distribusinya dari setangkup ,akin lambat distribusi Z menuju ke
N(0,1).
Misalkan Y1, Y2,..., Yn normal N(0, 2) maka
1 2
2
n 1
Sehingga, t n / S
N(0,1) .
Kemencongan (Skewness) 3 3

4 4

Y
Bila dan 2 menyatakan rataan dan variansi Y. Kemencongan menyangkut
momen ketiga

dan mengukur kesetangkupan suatu distribusi; distribusi yang setagkup

n n

Y Y mempunyai n-1 derajat kebebasan karena Y Y =


seperti distribusi normal dan t mempunyai 1 =0. Nilai 1 >0 menyatakan distribusi
0 ke kanan sehingga bagian kanan berisi lebih banyak massa dari yang
yang miring
kiri dan sebaliknya. Kurtosis menyangkut momen ke 4 dan mengukur
datar/runcingnya puncak suatu distribusi dibandingkan dengan distribusi normal.
Distribusi normal mempunyai 2 =0.
Misalkan Y1, Y2,..., Yn terok berukuran n dari distribusi dengan kemencongan 1
dan kurtosis 2 maka kemencongan dan kurtosis dari distribusi rata-rata terok Y

n Y N (0, 2 ) dan S 2 Yi Y
dapat dinyatakan sebagai (Scheffe (1954), h.331-333, atau Miller (1986), h.6)

1(Y y)
1 n , dan
(1.24)
2 ( y) 2 n

penaksiran takbias dari suatu
Kemencongan rataandistribusi
populasi didefinisikan
, dan S penaksiran
sebagai 1tak bias dari variansi
E Y
populasi . Untuk suatu
Kurtosis didefinisikan 2 E Ydapat
parameter
sebagai dibuat
banyak
3.
penaksiran takbias.
Misalkan Y1, Y2,..., Yn terok acak dari N (, ) . Penaksiran takbias untuk dan
Jadi bila distribusi setangkup maka kurtosis bukan masalah bila n lumayan besar
memberikan hasil yang baik. Akan tetapi bila
(n=30) dan penggunaan distribusiY takan
distribusi mencong (1 0) maka persoalannya
n berdistribusi N(0,1)
menjadi lain atau sulit menentukan
kapan n dianggap besar.

Derajat kebebasan
Derajat kebebasan (dk) menyatakan banyaknya informasi bebas diperlukan untuk
menyatakan bentuk kuadrat tersebut. Dua peubah acak dikatakan bebas bila yang satu
tidak dapat dinyatakan dengan yang lainnya. Bila Y1, Y2,..., Yn peubah acak yang bebas
(nilainya masing-masing akan ditentukan dalam terok acak berukuran n) maka bentuk
2
n i mempunyai n derajat kebebasan.

kuadrat
i1

2 2

i i
i1 i1

Jadi, Y1 Y ,Y2 Y ,...,Yn Y tidak bebas satu sama lain. Akan tetapi, bila salah satu
daripadanya dibuang makan n-1 sisanya yang tinggal menjadi bebas satu sama lain.

1.3 Inferensi Mengenai Rataan Populasi Normal


Suatu statistik ialah fungsi dari peubah acak. Bila suatu parameter populasi dan
suatu statistik untuk menaksir maka, disebut penaksiran dari . Nilai (dalam

bentuk bilangan) disebut suatu taksiran dari . Penaksiran disebut takbias bila

E .

Bila Y1, Y2,..., Yn terok acak dari populasi yang sama, maka Y merupakan
2

Y dengan var 2
n . telah dijelaskan sebelumnya bahwa

Z

Jadi, P Z 2 Z Z 2 1 ,
Y
atau n

Kalikan semua suku dalam tanda kurung dengan n , kemudian pindahkan Y
Y
dari suku tengah maka selang kepercayaan untuk dengan kepercayaan 1- adalah
Y Z 2
n n

Contoh 1.1 Nilai 40 mahasiswa pada suatu kelas dalam mata kuliah statistika
mempunyai rata rata = 2,8 ( dalam skala 4) dengan = 0,4. Bila dianggap ke 40
mahasiswa itu merupakan terok acak dari populasi mahasiswa yang jauh lebih besar,
buatlah selang kepercayaan dengan kepercayaan 95% untuk rataan populasi seluruh
mahasiswa. Y

Jawab :
Dalam soal ini = 0,05, jadi z0,025 = 1,96 ( lihat Tabel L1 di lampiran). Jadi
selang kepercayaan dengan kepercayaan 95% untuk adalah
0,4
P Z 2 2,8 Z1,96
2 0,41
, .
2,8 1,96 40 40

Atau
P Y Z 2 1 , dianggap diketahui. (1.25)
2,68 < < 2,92
Sesungguhnya terasa cukup janggal dalam soal di atas bahwa diketahui tetapi
tidak diketahui; bukankah untuk mengetahui harus diketahui terlebih dahulu ? bila
tidak diketahui maka kita harus menaksirnya dari terok. Penaksir tak bias untuk
adalah S. Jadi gunakan statistik.
T berdistribusi tn-1
S n
Y
S n
Atau, setelah disederhanakan seperti di atas, menjadi
S
n
Contoh 1.2 Diketahui n = 20, = 100, dan S = 12. Data berasal dari populasi normal.
Buatlah selang kepercayaan untuk dengan kepercayaan 99%.
Jawab :
Dalam soal ini 1 = 0.99. jadi /2 = 0,005 dan t19 ; 0,005 = 2,861 ( lihat Lampiran
L3). Selang kepercayaan yang diminta adalah
12 12
100 2,861. 100 2,861
20 20
Atau
92,32 < < 107, 68 (1.26)
Terdapat hubungan satu satu antara selang kepercayaan dengan pengujian
hipotesis. Ini berarti bahwa yang satu dapat diturunkan dari yang lainnya. Dalam
pengujian hipotesis terdapat tiga kemungkinan pilihan sebagai berikut:
1. HN : = 0
HT : 0
2. HN : 0
HT : < 0
3. HN : 0

Maka P tn1; 2 tn1; 2 1

HT : > 0 P Y tn1; 2 Y tn1; 2 1


Catatan : HN = Hipoesis Nol, sering pula ditulis H0
HT = Hipotesis Tandingan, sering pula ditulis A.
Dalam hal 1, bila selang kepercayaan mengandung titik nol maka HN tidak
ditolak, sedangkan bila sebaliknya maka HN ditolak. Dalam hal HN ditolak maka
kesimpulannya ialah bahwa berbeda dengan nol secara berarti ( significant).
Dalam hal 2, bila < C , dengan C = tn-1 ; , maka tolak HN; bila sebaliknya HN
jangan ditolak.
Dalam hal 3, bila < C , dengan C = tn-1 ; , maka tolak HN; bila sebaliknya
HN jangan ditolak.
Contoh 1.3 Ujilah untuk data pada contoh 1.2 hipotesis :
HN : = 105
HT : 105
Jawab :
Rumusan di atas dapat ditulis sebagai
HN : 105 = 0
HT : 105 0
Sehingga selang kepercayaan (1,26) menjadi (-12,68, 2,68). Terlihat bahwa
selang kepercayaan ini mengandung titik nol, jadi HN tidak ditolak. Cara lebih cepat
tanpa perhitungan tambahan, ialah dengan melihat bahwa selang kepercayaan (1,26)
mengandung titik 105, jadi HN tidak ditolak. Kalau hipotesisnya bukan seperti di atas,
tapi misalnya
HN : = 110
HT : 110,
Maka terlihat bahwa = 110 terletak diluar ( tepatnya, sebelah kanan) dari selang
pada (1,26), jadi untuk kasus terakhir ini, HN ditolak.

Nilai p
Yaitu suatu nilai uji statistik yang diperoleh dari pengamatan dikatakan berarti
(significant) bila hipotesis nol (HN) ditolak pada taraf keberartian yang ditentukan
sebelumnya. himpunan nilai yang membuat penolakan hipotesis nol disebut daerah-
kritis (penolakan). Jadi di bawah kurva normal, untuk = 0,05, daerah kritis untuk
1. HN : > 0 adalah z < - 1,645
2. HN : < 0 adalah z > 1,645
3. HN : = 0 adalah z < - 1,645 dan z > 1,645
Nilai batas dari daerah kritis tersebut disebut nilai-kritis. Jadi untuk HN: > 0 , =
0,05, di bawah kurva normal, nilai kritisnya adalah z = - 1, 645.
Dalam pengujian hipotesis, taraf keberartian biasanya diambil bernilai 0,10,
0,05, 0,01, atau 0,005. Penentuan nilai harus dikerjakan sebelum data diambil,
dengan perkataan lain, penentuan nilai tidak boleh dipengaruhi oleh data.
Pembatasan pemilihan pada nilai-nilai di atas memudahkan pekerjaan. Akan tetapi
kemudian itu juga menimbulkan kesulitan. Sebagai contoh, untuk kasus 1 di atas,
misalnya dari perhitungan diperoleh z= - 1,650, maka HN akan ditolak, sedangkan

bila diperoleh z = - 1,640 maka HN tidak ditolak. Kedua nilai z hanya berselisih 0,01
tapi memberi kesimpulan yang sangat berlainan.
Jika tadinya tidak diambil 0,05 tapi misalnya 0,10 atau 0,01, maka kedua nilai z
tadi akan menghasilkan kesimpulan yang sama; ditolak untuk = 0,10 dan tidak
ditolak untuk = 0,01. Begitupun untuk kasus 1 di atas, apakah z = -1,700 ataupun z

terakhir ini jelas memberi kesimpulan yang lebih tegas



= -170,000 tidaklah dibedakan dalam penarikan 1kesimpulan, padahal gambaran yang
dalam 2penolakan
n12 S HN : >0
Suatu cara penyampaian informasi yang lebih efisien ndengan
xn21; 2ialah 1S 2 melaporkan
2 xn21;1apa

yang disebut nilai-p atau taraf keberartian yang diamati. Dengan kata lain, nilaip
2
ialah peluang mengamati suatu nilai terok sebesar (atau lebih besar dari) nilai yang
sesungguhnya diamati bila HN benar. Makin kecil nilai- p makin sulit mempercayai
kebenaran hipotesis nol, atau makin besar dukungan dari data terhadap hipotesis
tandingan. Besarnya nilai p tergantung pada beberapa hal seperti ukuran terok,
jauhnya jarak nilai HN dengan nilai HT yang sesungguhnya, rentangan terok.
Umumnya makin besar ukuran terok makin kecil nilai p, makin besar rentang terok
makin kecil nilai p, makin jauh jarak HN dengan HT yang sesungguhnya makin
mudah memisahkannya sehingga nilai p makin kecil.
Dengan melaporkan nilai-p tidak ada keterangan yang hilang, jadi lebih objektif
daripada melaporkan penolakan atau penerimaan hipotesis nol. Umumnya paket
komputer program regresi selalu melaporkan nilai-p.

1.4. Inferensi mengenai variansi populasi bila populasi normal


Dalam persoalan analisis variansi maupun regresi sering sekali variansi populasi
tidak diketahui dan perlu ditaksir. Terkadang inferensi mengenai variansi tersebut
perlu dikerjakan. Bila terok diambil secara acak dan berasal dari distribusi normal
2

maka penaksir tak bias untuk 2 adalah S 2 Yi Y . , berdistribusi


n 1
dengan derajat kebebasan n 1. Jadi P
2 1
atau dengan peluang 1 berlaku
xn21;1 2 2 n 1S 2 xn21; 2 (1.27)
n 1S 2

Contoh 1.4 Misalkan pada contoh yang lalu diketahui n = 40 dan S2 = 0,4. Buatlah
selang kepercayaan untuk 2 dengan kepercayaan 95%.
Jawab :
Dalam soal ini = 0,05. 239;0,025 = 23,67 dan 239;0,0975 = 58,10. Kedua 2 ini
diperoleh secara interpolasi linear, karena tabel yang tersedia tidak memberikan nilai
bila dk = 39. Jadi selang kepercayaan untuk 2 dengan kepercayaan 0,95 adalah

Atau
0,27 2 0,66
C11 C12 .... C1n

C
: :

Cm2 .... Cmn
Pengujian kesamaan variansi, yang merupakan salah satu anggapan (asumsi)
dalam analisis regresi dan variansi dapat dilihat di buku karangan RE Walpole dan RH
Myers, Peluang dan Statistika untuk Insinyur dan Ilmuwan, pasal 10.3.

1.5. Beberapa sifat vektor dan matriks


Suatu matriks ialah suatu susunan unsur yang berbentuk
persegi panjang. Unsur
disusun dalam bentuk baris dan lajur (kolom). Suatu matriks A dikatakan berukuran b
x l bila matriks itu mengandung b baris dan l lajur.
Sebagai contoh di bawah ini yang merupakan matriks berukuran m x n.

C22 .... C2n
C21
:
Cm1

Jika banyaknya baris b dan lajur l suatu matriks sama maka matriks tersebut
disebut matriks bujur sangkar. Matriks C dikatakan setangkup (simetris) bila Cij = Cji.
untuk semua i dan j; disini Cij menyatakan unsur pada baris ke-i dan lajur ke-j.
Sebagai contoh suatu matriks setangkup adalah C11 C21
C 2 maka
0 10 C' C12 C22
C 0 4 3 C
10 3 1
Suatu matriks bujur sangkar dikatakan diagonal bila semua unsurnya yang tidak
pada diagonal adalah nol. Contoh matriks diagonal adalah
W1
390,4 58,10 3 20 39
0 0,4 23,67 ,
D 0 5 0 :
V 5 dan W W2
0 0 2 W
Suatu matriks diagonal dengan semua unsur diagonalnya satu disebut matriks
satuan, lambang I. Suatu matriks satuan berukuran 3 x 3 sering ditulis sebagai I3.
Transpos suatu matriks C, diberi lambang C. Transpos matrik diperoleh dengan cara
mempertukarkan baris dengan lajurnya. Contohnya adalah sebagai berikut:

C11 C12 C13


C21 C22 C23
13 C23
Transpos suatu matriks setangkup adalah matriks itu sendiri. Suatu vektor ialah
matriks yang hanya terdiri atas satu lajur. Sebagai contoh

2

3
n
Vektor V adalah matriks ukuran 3 x 1. Transpos suatu vektor akan membentuk
matriks yang hanya terdiri dari satu baris unsur.

3 0 3 7
A dan B
1 6 2
37 2 1 4
C AB
2 2 9 11 4
Penjumlahan matriks
3 7 2 7 10
Dua matriks yangC berukuran
A B sama
dapat dijumlahkan maupun dikurangkan
2 2 7 1 0
dengan menambahkan ataupun mengurangkan unsur yang sesuai. Sebagai contoh, bila
A dan B keduanya berukuran 2 x 3 maka C = A B akan berukuran 2 x 3 pula.
Contoh :
2 4 2
8 5

20 43
Maka
8 1 56

20 4 (3)
Dan
8 1 5 (6)

Perkalian dengan skalar


Bila k suatu skalar dan A suatu matriks ukuran m x n dengan unsur aij maka kA
unsur
adalah suatu matriks berukuran n x mcikdengan aijbjk kaij, yaitu suatu matriks yang
diperoleh dari matriks A dengan mengalikan semua unsurnya dengan k. Bila In suatu
matriks satuan ukuran n x n maka 2 In menyatakan suatu matriks diagonal dengan
tiap unsur diagonalnya adalah 2.

A dan B 0,5 2,5
Perkalian matriks 2 1
Perkalian dua matriks hanya dapat dikerjakan bila keduanya memenuhi sifat
tertentu dan perkalian itu dikerjakan denga cara yang tertentu pula. Dua matriks bujur
1 2 4
sangkar yang berukuran AB sama
0,5diperkalikan.
selalu dapat 2,5 Sedangkan perkalian AB
4 9,5 7
hanya memenuhi arti bila banyaknya lajur A sama dengan banyaknya baris B. Jadi
bila A berukuran m x n dan B n x p maka AB berukuran m x p. Bila unsur A
dinyatakan dengan aij dan unsur B dengan bjk maka unsur C = AB adalah:
n

j1

Sebagai contoh, bila


1 0,5 1
2 2
4
3 0

Maka,
2 2 0,5 1
3 0
2 1

a11b13 a12b23
Maka
Pada umumnya BA.Apabila
AB AB 11
a21b13 a22b23
11a a12 b b12 b13
a21 a22 b21 b22 b23

a b a12b12 a11b12 a12b22

a21b11 a22b21 a21b12 a22b22

Dalam contoh terakhir ini perkalian BA tidak dapat dilakukan ( tidak terdefinisi ).
Akan tetapi bila A dan B setangkup dan perkalian AB terdefinisi maka AB = BA.
Perkalian suatu matriks dengan matriks satuan akan menghasilkan matriks itu sendiri.
Jadi bila A berukuran n x m maka
InA = AIm = A
Transpose dari perkalian matriks adalah perkalian dari transposnya, tapi
urutannya berubah, jadi (AB) = BA. Yi2
Bila Y suatu vaktor dengan n unsur, Y = ( y1y2 ...yn ), maka YY = . Akar dari jumlah
kuadrat ini disebut norm atau panjang vektor Y. Dua vektor V1 dan V2 dikatakan
ortogonal (tegak lurus) bila V1V2 = 0. Dua peubah acak yang saling ortogonal tidak
berkorelasi.

Rang suatu matriks


Setiap lajur suatu matriks berbentuk suatu vektor. Dua vektor dapat digabungkan
secara linear disebut kombinasi linear yang membentuk vektor baru. Bila V1 dan V2
adalah dua vektor yang berukuran sama maka V = 1V1 + 2V2, untuk 1 dan 2 skalar,
disebut kombinasi linear dari V1 dan V2. Umumnya, bila V1 , V2,..., Vn adalah n vektor
dan 1, 2,..., n n buah skalar maka
V = 1V 1 + 2V2 + ... + nVn
Disebut kombinasi linear dari V1 , V2,..., Vn . vektor V1 , V2,..., Vn disebut bebas-
linear bila
1V1 + 2V2 + ... + nVn = 0,
dengan 0 yang menyatakan vektor yang semua unsurnya nol, hanya dipenuhi untuk 1
= 2 = ... = n = 0. Dengan kata lain V1 , V2,..., Vn bebas linear bila suatu vektor
1 1
sembarang di antaranya tidak dapat dinyatakan dengan kombinasi linear dari vektor
vektor lainnya.
W1 2 dan W2 0
Vektor
2 4
V1 3 dan V21 62
A 11 dan B
4 8
11

Tidak bebas linear karena V2 = 2 V1


Sebaliknya vektor


3 1
Bebas linear. Untuk melihatnya bentuklah kombinasi linear


1W1 2W2 21 0
31 2

dan samakan vektor tersebut dengan vektor nol, jadi diperoleh


1 2 0
21 0
31 2 0
Terlihat bahwa 1 = 2 = 3= 0 yang memenuhi ketiga persamaan di atas. Dengan
1 1
mudah juga dapat dilihat bahwa tidak mungkin W2 dapat dinyatakan sebagai
kelipatan dari W1, jadi W2 tidak dapat dinyatakan
3 0 dengan W1 dan sebaliknya.
Rang suatu matriks adalah ialah maksimum banyak lajurnya yang bebas linear. Jadi
matriks


W 2
1
Mempunyai rang 2, karena telah kita lihat baru
saja bahwa kedua lajurnya bebas
linear. Sebaliknya matiks
2 4
V 3 6
4 8
Hanya mempunyai rang 1, karena kedua lajurnya tidak bebas linear. Perhatikan
bahwa rang suatu matriks sama dengan transposnya. Matriks In mempunyai rang n.

Inversi suatu matriks


Misalkan A suatu matriks bujur sangkar p x p. Suatu matriks B ukuran p x p
disebut inversi (balikan ) dari A bila dipenuhi AB = BA = I. Lambang yang biasa
digunakan untuk inversi A adalah A-1 , jadi AA-1 = A-1A = I
Tidak mudah menghitung inversi suatu matriks kecuali bila ukurannya kecil
d1
seperti 2 x 2, atau bila bentuknya amat sederhana. Untuk matriks dengan ukuran yang
lebih besar dan bentuknya
D tidak sederhana biasanya perhitungan inversnya dikerjakan
dengan komputer.
-1 0 d p
Bila D matriks diagonal D
0 0
0 , d1 0, i =1,2,...,p
d 1 d10
2
D

0 1 d p
Maka


1 0

0

Bila A matriks 2 x 2
1 a22
a a12 a12
A 11 maka A1 a11a22 a12a21 a21
a21 a22 a11

Suatu matriks yang mempunyai inversi disebut taksingulir. Matriks yang lainnya
disebut singulir. Suatu matriks yang taksingulir mempunyai rang sama dengan ukuran
matriks tersebut. Jadi suatu matriks A berukuran p x p tapi mempunyai rang < p maka
A singulir. Sebaliknya, bila A singulir maka rang A < p. Suatu matriks bujur sangkar
P ukuran n x n disebut ortogonal bila PP = PP = In. Jadi P-1 = P.
Sebagai contoh matriks
1 0 1
2 1 2
P
1 2 1
21 12
1
2
2 2

Adalah ortogonal karena


1 1 1
P 02 2 2
1
11
2 2
1 1
2 2 2

Jumlah unsur diagonal suatu matriks


Bila A suatu matrikstr(A)
bujur=sangkar
11 + berukuran
22 + .... + n iijumlah unsur diagonal
nn n maka
matriks A, lambang tr (A) adalah
n

i1

Lambang tr adalah singkatan dari trace. tr(In) = n, bila A dan B dua matriks bujur
sangkar dengan ukuran yang sama dan c suatu tetapan maka
tr (A+B) = tr (A) + tr (B)
tr (A) = tr (A)
aij bij
tr (cA) = c tr (A)
n n
tr (AB) = tr (BA) =
i1 j1

Nilai eigen dan vektor eigen


Bila A suatu matriks n n maka ada bilangan 1, 2, ... , n dan vektor v1, v2, ... ,
vn yang saling ortogonal sehingga dipenuhi
Avi = i vi
Bilangan 1, 2, ... , n disebut bilangan eigen (nilai karakteristik).
v1, v2, ... , vn disebut vektor eigen (vektor karakteristik).
Bila A matriks setangkup (simetris) maka 1, 2, ... , n bernilai real. Bila D suatu
matriks diagonal maka unsur diagonal D adalah nilai eigennya, jadi tr (A) = i.
Matriks A yang setangkup (si disebut definit taknegatif bila x Ax 0 untuk
semua vektor x ; A disebut definit positif bila x Ax > 0 untuk semua vektor x. Nilai
eigen matriks yang definit taknegatif juga tak negatif, dan nilai eigen matriks positif
juga semuanya positif.
Matriks bujur sangkar P disebut idempoten bila P2 = P . Bila P setangkup (P=P)
dan idempoten maka P disebut matriks proyeksi. Bila P idempoten maka I - P juga
idempoten. Matriks proyeksi selalu definit tak negatif karena xPx = xP2x = (Px)
(Px) 0 untuk setiap x 0.

Determinan
Untuk setiap matriks bujur sangkar n n terkait dengannya suatu bilangan yang
disebut determinan A dan ditulis |A|. Bila
a b
maka | A | ad bc
c d

Bila
A
a 11 a 12 a 13

A a 21 a
22 a 23

a a a

31 32 33

Maka
| A| a11a22a33 a12a23a31 a13a21a32 a
13a22a32 a11a23a32 a12a21a33
Secara umum
a a ... 11 12 a 1n

A a a .... 21 22
a a ... a
n1 n2 nn

Maka
k 1

| A |
kofaktor, dan mij (disebut minor) merupakan determinan matriks (n-1) (n-1) yang
aik cik , untuk setiap i=1, 2, ..., n , bila Cik=(-1)i+j mij, disebut
diperoleh dari matrik A dengan menghilangkan baris ke-i dan lajur ke-j.
Contoh
Carilah nilai eigen dan vektor eigen matriks
4 0 1
A 2 1 0
2 0 1

Jawab :
4 0 1
0 ( A I ) 1 0 = (4)(1)(1) + 0 + 0(1)(1)(-2)0
2 0 1
2
0 = -3 + 62 11 + 6
Akar darri persamaan dapat diperoleh dengan menguraikannya sebagai berikut.
(-1) (-2)(-3) = 0
Jadi diperoleh nilai eigen matriks A:
1 =1, 2 =2, 3 = 3
Vektor eigen dapat diperoleh dengan menghitung v = (x1,x2,x3) pada persamaan
Av = v
Untuk 1 = 1
0 1 x1 0

2 1 1 x2 0
0
2 0 1 1 x3 0
Diperoleh untuk 1 = 1, v1=(0 x2 0) dengan x2 sembarang. Ambil x2=1 maka
diperoleh v1=(0 1 0).
Selanjutnya dengan cara yang sama untuk 2 =2 diperoleh v2=(-0,5 1 1) untuk 3
= 3 diperoleh v3=(-1 1 1). Perhatikan bahwa tr(A) = 4 +1+1 = 1 + 2 + 3 = 6

4 1

BAB II

Regresi Linier Sederhana

2.1 Pendahuluan
Dalam mengolah data akan selalu menentukan hubungan antara dua peubah atau
lebih. Bila hubungan kedua peubah linear maka keduanya disebut kolinear dan harga
mutlak korelasinya satu (1). Bila hubungan kedua peubah bebas satu sama lain maka
korelasinya nol (0).
2.2 Model Regresi Linear Sederhana
X disebut peubah bebas
Y disebut peubah tak bebas ( respons)
a bx (2.1)
a dan b disebut koefisien regresi yang nilainya ditentukan dari data sedangkan
menyatakan prediksi (taksiran) dari y. Jika x=15 maka diharapkan nilai y sebesar
a+15b, jika x=0 maka =a.
e(yy')
Dalam bentuk persamaan diatas model tersebut berbentuk deterministik sehingga
nilai akan berubah-ubah disekitaran nilai rata-ratanya yaitu i. Penyimpangan
tersebut ditaksir dengan Yi-i dan penyimpangan tersebut dinamakan ei .
ei yi yi yi a bxi (2.2)
Sehingga
yi a bxi ei, i 1,2,...,n (2.3)
Dalam ei terkandung galat yang bersifat acak dan juga penyimpangan model dari
keadaan yang sesungguhnya. Model (2.3) disebut stokhastik karena mengandung
faktor acak ei . Untuk seterusnya ei dianggap berbentuk acak dengan nilai harapan nol.
Menganggap ei acak berarti bahwa terok diambil secara acak.
Misalkan dengan menarik garis melalui titik data sejajar dengan sumbu x atau y
tidak diambil harga mutlaknya jadi, ei = yi-yi dan mencari garis regresi sedemikian
rupa sehingga
n
i i i

i1

Minimum jika n menyatakan ukuran terok. Jika pada persamaan diatas tidak
memuaskan maka terdapat pilihan yang dapat dilakukan yaitu:
ei = |yi-yi|
Dan meminimumkan
i i (2.4)
Dan
ei = (yi-yi)
Kemudian meminimumkan n

2
n
(2.5)
i1
i
1

Dari segi perhitungan bentuk (2.4) sulit menanganinya karena harus


meminimumkan suatu bentuk dalam harga mutlak (fungsi y=|x| tidak punya turunan
di x=0). Kelemahan diatas dapat dihilangkan jika menggunakan bentuk (2.5) tetapi ini
tidak berarti bahwa bentuk (2.5) tidak mempunyai kelemahan. Metode ini disebut
dengan metode kuadrat terkecil dan dipakai untuk seterusnya dalam menentukan
koefisien regresi.

2.3 Anggapan pada analisis regresi


Untuk menilai kebaikan suatu persamaan regresi maka data terok diharapkan
memenuhi anggapan (asumsi) berikut.
Data terok dianggap berasal dari suatu populasi yang berdistribusi normal dengan
mean i dan variansi 2 . Ini berarti bahwa ppeubah acak Yi berdistribusi N(i,2)
untuk setiap i. Lambang Yi menyatakan peubah acak sedangkan yi hanyalah salah
satu dari sekian banyak nilai yang diambil secara acak.
Untuk setiap distribusi normal. Tepatnya
. /
( | )

Lambang ( | ) menyatakan fungsi padat bila diketahui . Jadi pada suatu


akan diambil satu atau lebih terok dari populasi yang berdistribusi normal ( ).
Dalam bentuk teori (populasi) maka persamaan (2.1) menjadi
( | )
Dan persamaan (2.3) menjadi
(2.6)
Dalam persamaan ini , dan menyatakan parameter populasi yang merupakan
tetapan,tetapi tidak diketahui besarnya, dan merupakan galat acak yang
berdistribusi ( ).
| y Artinya
Kita anggap tidak mempunyai distribusi. y '| nilai dapat ditentukan oleh
peneliti ,nilai mungkin hanya berkisar 0 atau 1.
Karena mempunyai distribusi,sedangkan x tidak,maka Y juga mempunyai
distribusi yang sesuai dengan , yaitu
Yi berdistribusi ( ) ei ( yi yi ')2
Pemisahan bahwa var ( ) jadi juga var (Yi), sama dengan untuk setiap
i,berarti bahwa variansinya tidak berubah pada setiap data terok. Anggapan ini amat
penting untuk tujuan pengujian hipotesis kemudian. Tetapi anggapan ( ) jadi
( ) = ,untuk setiap i,tidaklah begitu penting,karena kita selalu dapat
menjadikannya seperti itu dengan translasi.
Alat uji yang dipakai , uji t dan F,cukup kekar (robust) sehingga anggapan
kesamaan variansi dan kenormalan tidaklah dituntut secara ketat dipenuhi,cukup agak
kasar. Cara memeriksa kenormalan dan kesamaan variansi akan dibicarakan kelak dan
usaha apa yang perlu dikerjakan jika terjadi penyimpangan. Tidak ada cara memeriksa
apakah terok yang diambil acak atau bukan,hanya pelakunya(yang mengambil
tersebut) yang tahu tentang hal itu.

2.4 Metode kuadrat terkecil


Misalkanlah ( ) , data terk dan kita ingin menentukan
koefisien regresi dan sedemikian rupa sehingga
( ) (2.7)
Minimum. dan bilangan yang berasal dari pengamatan sedangkan dan
berudah bila garis regresinya berubah. Jadi dalam hal ini, dan dianggap berubah.
Berarti bahwa perlu mencari turunan terhadap dan kemudian menyamarkannya
dengan nol. Jadi,bila diturunkan terhadap ,maka diperoleh

( )

Atau,
(2.8a)
Selanjutnya, turunkan terhadap dan samakan dengan nol,

( )

Atau,
(2.8b)
Kemudian gantilah nilai dan pada persamaan diatas dengan masing-masing
taksirannya dan . Persamaan tersebut menjadi suatu sistem persamaan
linear,disebut persaman normal
(2.9)

Bila kita nyatakan dan maka,persamaan yang


pertama dari (2.9) memberikan

(2.10)
Dengan demikian bagian kedua (2.9) menjadi

Atau,
. / . /

Atau,
( ) ( )
{ }

Jadi,
( )( )
( ) (2.11a)
Rumus ini dengan mudah dapat disederhakan menjadi
( )( )

( ) (2.11b)
Dalam perhitungannya,dihitung terlebih dahulu nilai b lalu kemudian
dimasukkan ke dalam persamaan (2.10) untuk mendapatkan nilai . Taksiran
persamaan regresi dapat ditulis sebagai
( )
Lambang ^ (baca topi) diatas suatu huruf menunjukan bahwa huruf tersebut suatu
taksiran,dalam hal ini taksiran dari y.
Contoh 2.2
Tabel 2.2

1 2 2 1
2 1 2 4
3 4 12 9
4 5 20 16
515 315 15
51 25
55
)( )
(( )
Jadi

Dan
( )( )

2.5 Koefesien korelasi darab,


Perhatikan kesamaan berikut:
( ) ( ) ( )

Akibat
Variasi dapat diterangkan
(penyimpangan regresi Sisa,bagian yang tidak
oleh regresi
total)

Bila ruas kiri dan kanan kita kuadratkan dan kemudian dijumlahkan maka diperoeh:

( ) *( ) ( )+

( ) ( ) ( ) ( ) (2.13)

Untuk kesederhanaan penulisan maka i=1 dan n pada

( ) ( ) ( ) ( )

Bagian kedua ruas kanan sama dengan nol:

( ) ( )

Bagian pertama ruas kanan juga sama dengan nol


( ) ( )( )
( ) ( )

( )

Jadi persamaan (2.13) dapat ditulis kembali sebagai

( ) ( ) ( ) (2.14)
( ( )
Persamaan diatas merupakan) persamaan dasar dalam analisis regresi dan analisis
variansi.
1 Persamaan
2 -1diatas tidak
1 lain daripada1,8 hokum phytagoras
-1,2 dalam
1,44 segitiga siku-
siku. Ruas kiri disebut jumlah kuadrat total (JKT) atau jumlah variasi total dan
2 1 -2 4 2,4 -0,6 0,36
menyatakan jumlah penyimpangan disekitar nilai rata-ratanya. Penyebab perubahan
3 4 1 1 3 0 0
(variasi) disekitar dapat dibagi atas dua bagian: pertama karena pengaruh sifatnya
4 5 2 4 3,6 0,6 0,36
yang berpola (sistematis); kedua karena pengaruh sifatnya yang acak. Bagian pertama
5 3 0 0 4,2 1,2 1,44
ruas kanan siebut jumlah kuadrat regresi (JKR), dan ini adalah variasi respons di
0 10 0 3,6
sekitar nilai rata-ratanya ( ) . Tidak sulit membuktikannya bahwa ,yaitu rata-rata
,sama dengan rata-rata , jadi . Bagian ini menyatakan pengaruh regresi,atau
,pada respon . Bagian kedua ruas kanan disebut jumlah kudrat galat (sisa) dan
disingkat JKS. Bagian ini mengukur sisa dari total (JKT) yang tidak dapat diterangkan
oleh , atu bagian yang siftanya acak. Jadi dengan demikian persamaannya dapat
ditulis pula sebagai

Variasi Total = Variasi karena Regresi + Variasi karena Sisa.

Jika pengaruh terhadap besar maka kita mengharapkan JKR cukup besar
dibandingkan dengan JKS . perhatikan bahwa untuk suatu kelompok data yang telah
tertentu,besar JKT telah tertentu ,jadi suatu tetapan dan tidak terpengaruh oleh model
yang digunakan. Karena itu bila JKR membesar maka JKS mengecil,dan
sebaliknya,sedangkan jumlahnya (JKT) tetap. Jadi JKT wajar untuk dijadikan
pembanding untuk menentukan besar kecilnya JKR atau JKS.

( )
( )

disebut koefisien korelasi darab atau koefisien penentu (determinasi). Karena


maka tentunya . bila , atau ,
dan bila , atau . bilai untuk setiap .

Makin dekat dengan 1 makin baik kecocokan data dengan model,dan


sebaliknya, makin dekat dengan 0 makin jelek kecocokan tersebut . biasanya
dinyatakan dalam persen dan amat sering digunakan orang.

Contoh 2.3

Tabel 2.3
Dari tabel diatas
Sumber terlihatkuadrat)
JK (jumlah bahwa JKR =Dk3,6 sedangkan
RK JKT=10,E(RK)
jadi
variasi (derajat (rataan
kebebasan) kuadrat)
Regresi ( ) 1 RKR =
Artinya, sebesar 36% dari seluruh variasi total JKR/1
y diterangkan oleh regresi atau x,
dan
sisamasih ada sebesar( 64% lagi
) variasi
n-2y yang tidak
RKSdapat diterangkan
= oleh model
yang kita gunakan. Bagian sisanya yang 64% ini mungkin
JKS/(n-2)disebabkan oleh faktor lain
yang
totalgagal diperhitungkan dalam model.
n-1
( )
2.6 Tabel analisis variansi
Untuk menentukan apakah pengaruh suatu peubah bebas x besar atau kecil
terhadap respon y kita memerlukan pembanding yang baku,yang tidak dipengaruhi
baik buruknya model yang digunakan. Pembanding baku tersebut ialah penaksir tak
bias dari ,variansi .umumnya tidak diketahui jadi harus ditaksir oleh terok.
Penaksiran yang tak bias dapat diperoleh dari jumlah kuadrat sisa,yaitu JKS
,disebut rataan kuadrat sisa. Bilangan disebut derajat kebebasan. akan
tetapi,rataan kuadrat sisa ini hanya akan menaksir tanpa bias bila model yang
digunakan tepat. Bila model yang digunakan keliru maka ( ) akan menaksir
dengan bias.
Perhatikan :

( ) ( )

Hanya yang merupakan informasi bebas dalam bentuk ini karena ( )


bukan peubah acak. Jadi hanya ada satu informasi yang perlu ditaksir dalam
JKR,karena itu dk JKR adalah 1. Derajat kebebasan JKS sedikit lebih sulit
menghitungnya secara langsung. Cara yang paling mudah ialah dengan mengambil
selisih dk JKT dengan dk JKR, jadi d ( ) . Secara umum,
bila menyatakan banyaknya parameter dalam model maka dk JKS adalah ,
sednagkan dk JKR adala , dan dk JKT tidak tergantung model,sehingga dk JKT
tetap .

Tabel 2.3

Catatan : Nama yang tepat untuk ( ) ialah jumlah kuadrat total yang
dikoreksi. Dikoreksi maksudnya,dikurangi . disebut jumlah kuadrat total yang
belum dikoreksi.
Tabel diatas memperlihatkan bentuk umum tabel analisis variansi (anava) untuk
regreai linear sederhana. Lajur keempat memberikan jumlah kuadrat dibagi dengan
derajat kebebasannya,untuk regresi dan sisa. Tidak dituliskan jumlahnya dibawah
baris total, karena hal itu tidak berlaku untuk JKT. Lajur terakhir memberikan
harapan dari lajur keempat,yaitu harapan dari rataan kuadrat regresi,E(EKR),dan
harapan dari rataan kuadrat sisa. Lajur ini memberikan dasar pengujian untuk . Bila
maka E(RKR)/E(RKS)=1,tetapi bila maka E(RKR)/E(RKS)>1,sebab
( ) . Dalam prakteknya kita akan menghitung nisbah RKR/RKS.
Bila nisbah ini lebih besar dari 1 secara berarti (significant) maka ita akan
menyimulkan bahwa sebaliknya,bila nisbah ini sama dengan 1 maka
kesimpulannya yaitu x tidak mempengaruhi respon y.
Dari segi teori nisbah RKR/RKS mempunyai distribusi F dengan derajat
kebebasannya 1 dan n-2. Yang pertama ialah dk pembilang sedangkan yang kedua dk
penyebut. Dengan demikian kita dapat mendefinisikan uji statistic
( )
( ) ( )
Nilai F (F-hitung) kemudian dibanding dengan nilai F dari tabel F,dengan dk 1
dan n-2, untuk menguji hipotesis nol (HN) lawan hipotesis tandingan (HT):

Bila F-hitungan lebih besar dari F tabel, untuk dk 1 dan n-2, maka hipotesis HN
kita tolak dan, bila sebaliknya, HN tidak ditolak. Bila HN ditolak maka tandingan HT:
0 yang kita terima. Bila HN tidak ditolak maka tidak ada alasan menolak atau
meragukan HN. Sesungguhnya, kita kecewa bila HN tidak ditolak, Karena dari
permulaan keyakinan kita terletak pada tandingan HT: 0. Keyakinan bahwa 0
atau peubah x mempengaruhi respons y, yang mendorong kita mengadakan pengujian
hipotesis dan juga akan menggunakan uji-t untuk persoalan diatas, Karena
=
Dalam hal ini, uji-t yang digunakan mempunyai dk sama dengan dk penyebut
dalam nisbah-F, yaitu n-2. Perhatikan bahwa uji-t yang digunakan disini dwisisi,
sedangkan uji-F ekasisi. Karena itu uji-t lebih luas cakupannya, Karena dapat
digunakan untuk menguji HN : > 0 lawan tandingan HT : < 0, atau sebaliknya,
sedangkan uji-F tidak dapat digunakan.

Contoh 2.4 untuk data di contoh 2.1 diperoleh tabel anova seperti tabel 2.4
Tabel 2.4 Tabel Anova untuk contoh 2.1

Sunber JK dk RK F-hitungan
Regresi 3,6 1 3,6 1,71
Sisa 6,4 3 2,1
Total 10,0 4
Pada contoh 2.2 telah dihitung bahwa JKT = 10, JKR = 3,6, sehingga JKS = 10
3,6 = 6,4. Ukuran terok n=5, jadi dk JKS adalah 5 2 = 3. F = (3,6/1)/(6,4/3) =
3,6/2,1 = 1,71. Dari tabel F di lampiran L4 diperoleh F1,3 = 10,13 untuk taraf
keberartian (kesignifikanan) = 0,05. Jadi HN: = 0 tidak ditolak. Kalau digunakan
tabel t maka dari tabel L4 di lampiran, diperoleh t3 = 3,182 untuk = 0,05. Perhatikan
bahwa
( )
Karena HN tidak ditolak, jadi hipotesis = 0 didukung oleh data, berarti bahwa
penggunaan model y = + x + tidaklah memuaskan. Model lain, yang lebih cocok,
perlu dicari jika penelitian hendak diteruskan. Dari persamaan (2.15) dan contoh (2.4)
dapat disimpulkan bahwa

(2.17)
Yang menyatakan bahwa F merupakan fungsi yang monoton dari , dan
sebaliknya. Akan tetapi, seperti terlihat pada contoh diatas, tidak dapat digunakan
untuk menguji hipotesis dan uji-F tidak dapat digunakan untuk mengukur besarnya
pengaruh suatu peubah bebas atau factor. Keduanya mempunyai tujuan yang
berlainan.
2.7 Selang kepercayaan dan prediksi
Selang kepercayaan dapat digunakan sebagai taksiran suatu parameter dan dapat
pula dipandang sebagai suatu pengujian hipotesis, yaitu apakah suatu parameter sama
dengan suatu nilai tertentu. Dibawah anggapan bahwa galat berdistribusi normal,
untuk setiap i, maka statistik a dan b juga akan berdistribusi normal. Disini kedua
hasil tersebut akan langsung digunakan. Pemisalan mengenai kebebasan, kenormalan,
dan kesamaan variansi diperlukan dalam pembuatan selang kepercayaan dan
pengujian hipotesis seperti kita akan lihat kemudian.

No x(cm) y(kg) No. x y no x y


1 120 38,4 6 150 61,2 11 160 67,5
Selang kepercayaan
2 untuk 41,6 7
126 150 59,8 12 162 68,7
Di pasal 5.4 dibuktikan
3 135 bahwa
46,2 8 155 66,5 13 162 81,8
4 135 ( )49,8 9 ( 155 ) 63,4
( 14 170 ) 75,8
5 143 55,9 10 155 65,8 15 172 78,6
Karena biasanya tidak diketahui maka harus ditaksir daridata dan di bab 5
(persamaan 5.36) ditunjukkan bahwa bila s2 = JKG / (n-2) maka E(s2) = .
Salah satu cara yang umum membentuk uji statistik, dalam hal ini mengenai ,
ialah dengan membentuk nisbah yaitu dengan mengurangi b

( ) (2.18)
Dengan E(b) dan kemudian membagi hasilnya dengan simpangan baku dari b,
s(b). dibawah anggapan normal, b akan berdistribusi normal sedangkan s2
berdistribusi X2dengan dk = n-2, sehingga nisbah (2.18) berdistribusi-t dengan dk = n-
2 atau, disingkat, t(n-2). Dengan demikian bila nilai diberikan maka kita dapat
melihat tabel nilai t dengan dk = n-2 dan (lihat tabel L3) yang memenuhi persamaan
*|( ) ( )+| . /+ (2.19)
Nilai t yang memenuhi (2.19) ditulis dengan lambang . /
menyatakan, biasanya dalam perseratus bagian, luas salah satu ujung distribusi-t
dengan dk n-2. Persamaan (2.19) dapat ditulis , setelah menghilangkan tanda harga
mutlak kemudian menyusun suku-sukunya kembali, sebagai:
* . / ( )

. /+ (2.20)
Dengan kata lain,selang kepercayaan untuk dengan kepercayaan 1- (taraf
keberartian ) adalah :
. / ( ) . / ( ) (2.21)
Contoh 2.5 Suatu penelitian ingin mengetahui kebaikan hubungan linear antara
tinggi dan berat badan manusia di suatu daerah. Terok acak sebanyak 15 orang
diambil di pasar dan hasilnya adalah sebagai berikut , bila x menyatakan tinggi dalam
cm dan y berat badan dalam kg.
Tabel 2.5 Data tinggi dan berat badan

Dari tabel 2.5 kita peroleh :


n = 15, = 2250, = 921 , = 140873,
= 340822 , dan = 58928,12.

Jadi a=-61,5530, = 93,83%,


b= 0,8197, s= 3,3594, dan s(b) = 0,0583.
Bila kita ambil = 5%, maka ujung kiri selang kepercayaan adalah
( ) ( ) ( )
Dan ujung kanannya adalah
( ) ( ) ( )
Perhatikan bahwa nilai t(13.97,5%) = 2,160 dapat dilihat dari tabel L3. Jadi
selang kepercayaan yang dicari adalah
0,69 0,95
Ini dapat ditafsirkan sebagai: dengan kepercayaan 0,95, taksiran rata-rata berat
penduduk naik antara 0,69 dan 0,95 kg untuk pertambahan tinggi badan 1 cm.
mengenai tafsiran regresi akan dibicarakan lebih lanjut di bab 4.
Selanjutnya, untuk memutuskan, dari data tadi, ada tidaknya hubungan linear antara
tinggi dan berat badan, kita mengadakan pengujian hipotesis
HN: =0
HT: 0
Untuk = 5%, telah kita lihat bahwa selang kepercayaan (2.22) tidak
mengandung titik nol (kedua ujungnya positif). Ini berarti HN: =0 ditolak,jadi
adanya hubungan linear antara berat dan tinggi badan didukung oleh data.
Kita juga dapat menggunakan uji statistik seperti pada contoh 2.3, yaitu dengan
memandang nisbah

( )
Untuk menguji (2.23) dalam hal ini
( ) +

( ) +,
Sesungguhnya yang kita pandang adalah harga mutlak t, atau nilai t tanpa
memandang tandanya, Karena ini menyangkut uji dwisisi. Dari tabel L3 kita peroleh
=2,16<14,06 , sehingga HN: =0 ditolak.

Selang kepercayaan untuk


Selang kepercayaan untuk dapat dikerjakan seperti untuk . Sesungguhnya
pengujian tidaklah terlalu menarik hati, Karena tidak banyak keterangan yang dapat
ditarik dari pengetahuan tentang apakah nol atau bukan. Jika x = 0 maka adalah
rata-rata y, tapi jika rentangan x tidak mencakup titik 0 maka tidak punya tafsiran
yang jelas. Jika maka model garis regresi melalui titik nol.
Seperti pada (2.18), pandanglah nisbah

( )
Nisbah ini berdistribusi-t dengan derajat kebebasan n-2. Sehingga dengan ini
dibuktikan bahwa
E(a) =

Dan
Var (a) = * ( ) }= *( )


= *
Sehingga,
( ) ( )
Jadi
*| | ( ) ( )+
Atau, dengan kepercayaan 1- berlaku
( ) . / ( )( )

Contoh 2.6 Dari contoh 2.5 diperoleh a= -61,5530, s = 3,3594 , jadi


s(a) = 3,3594 = 8,7857

Dari tabel L3 diperoleh t(13;0,975) = 2,160, jadi selang kepercayaan dengan


kepercayaan 95 % adalah
-61,5530 - 18,9773 -61,5530 + 18,9773
-80,5303 -42,5758.
Terlihat bahwa selang kepercayaan tidak mengandung titik nol, kedua ujungya
negatif, jadi HN: = 0 ditolak dan kita simpulkan bahwa .
Perhatian : Sebaiknya, jangan menggunakan model Y= , kecuali jika yakin
benar bahwa =0, menganggap berarti memaksa garis regresi melalui titik nol,
suatu pemisalan yang keras.

Prediksi
Sering sekali kita ingin mencari taksiran nilai y untuk suatu nilai x yang tidak
diamati dalam terok. Nilai y seperti ini disebut prediksi y pada suatu nilai x. Ada dua
hal yang perlu dibedakan disini.Var
Pertama, ,
(Y0) = prediksi (
) - nilai y pada suatu nilai x,
(rata-rata

misalnya x = x0. Persamaa regresi memberikan rata-rata nilai y pada suatu nilai x,
tepatnya, E(Y|x). Kedua, prediksi suatu nilai tunggal y0 bila x = x0. Jika diberikan
suatu nilai x0 maka nilai y berubah mengikuti suatu distribusi, misalnya ( ).
Sesungguhnya cara lain mendefinisikan regresi ialah sebagai rata-rata lajur (kolom).
Artinya, untuk setiap nilai x, ambil rata-rata y dan hubungkanlah semua nilai rata-rata
tersebut. Bila ini dikerjakan pada banyak nilai x maka akan diperoleh kurva yang
mulus dan kurva itulah yang disebut kurva regresi.

Selang kepercayaan untuk E(Y|x0)


Dibawah anggapan (distribusi) normal, untuk x=x0, peubah acak Y0 berdistribusi
normal dengan
E(Y
( )0) = ,
E(a+bx0)
(
=

= E (Y|x0)
Dan
)

Rumus ini menyatakan bahwa variansi yang mempengaruhi nilai rata-rata


prediksi y bersumber dari variansi atau galat dalam penaksiran a dan b. Seperti
sebelumnya, nisbah
( | )

( ) ( )
Dimana, rumus diatas berdistribusi t(n-2).
Selang kepercayaan untuk E(Y|x0), dengan kepercayaan 1 - , diberikan oleh
. / ( ) ( | ) . / ( )
Bila
)
( )-
Contoh 2.7
(
Buatlah selang kepercayaan ) E(Y|x0)
untuk , dari (data pada contoh 2.5, bila x0 =
165 cm.
Jawab :
Telah kita lihat diatas bahwa bila x = 165 cm , y0 = 73,70 kg. Dari contoh 2.7
telah kita peroleh bahwa x = 150 , n = 15, ( ) = 3322 dan s = 3,3594,
sehingga

( )
( )

Jadi selang kepercayaan untuk E(Y|x=165) dengan kepercayaan 0,95 adalah


( ) ( | ) ( )
Atau
( | )
Selang kepercayaan untuk nilai tunggal y0
Seperti telah dijelaskan sebelumnya, bila x=x0, prediksi rata-rata nilai y diberikan
oleh y0 = a+ bx0. Misalkan y0 suatu nilai Y bila x = x0 (rata-rata nilai y0 seperti ini
adalah y0). Pandanglah selisih Y0-y0. Nilai ini dapat dipandang sebagai salah satu nilai
dari peubah acak Y0-y0, yaitu penyimpangan prediksi dari rata-ratanya. Mudah dilihat
bahwa
( ) (
Dan
. / ( )
)- (
Seperti biasa, ditaksir. dengan s,/ yang
mempunyai
( derajat kebebasan n-2.
Variansi ini menyatakan bahwa ada dua sumber variasi yang mempengaruhi nilai
prediksi. Yang pertama ialah taksiran a dan b (keduanya fungsi dari Yi, jadi

merupakan peubah acak) yang dalam rumus diatas dinyatakan oleh dua suku terakhir
ruas kanan. Sumber variasi yang kedua ialah bahwa prediksi tersebut ditaksir dengan
nilai harapannya, Y0, untuk hal Y0 = y0. Besarnya kesalahan yang ditimbulkan ialah
, yaitu suku pertama ruas kanan.
Dengan mengikuti cara kerja seperti terdahulu, selang kepercayaan untuk suatu
pengamatan tunggal y0 dengan kepercayaan 1- ialah
)
( )

)
( )

2.8 Pemeriksaan sisa


Seperti dijelaskan di depan, sisa didefinisikan sebagai ei = Yi yi , i=1,2,...,n.
Kendati namanya mungkin menyesatkan, sisa bukan berarti sampah yang tidak
berguna. Sisa kaya akan informasi dan karena itu merupakan bagian yang amat
penting dalam setiap analisis data. Informasi dari data semula yang tidak terserap oleh
model akan menjadi sisa. Jika semua pola yang ada pada data telah masuk ke dalam
model maka sisa akan berbentuk acak. Tetapi, jika model yang digunakan tidak
mampu mengambil semua pola yang ada pada data maka sisa akan mempunyai
kecenderungan tertentu. Dalam hal itu, model belumlah baik betul, dalam arti masih
dapat disempurnakan. Jika sisa sudah berbentuk acak maka anggapan tentang
kenormalan dan kesamaan variansi dapat diuji dari sisa. Kita melihat kebaikan model
dari R2 dan pengujian hipotesis mengenai koefisien regresi. Ketidakcocokan model
dengan data dilihat dengan mengamati sisa. Sisa, secara kasar, memberi keterangan
tentang data yang tidak mengikuti pola umum model yang digunakan, ditandai oleh
sisanya yang relatif besar. Sisa yang relatif besar dapat merupakan petunjuk bahwa
modelnya belum cocok ataupun pengamatannya barangkali merupakan pencilan.
Secara umu, pencilan ialah data yang tidak mengikuti pola umum model dan, secara
kasar, dapat diambil patokan yaitu yang sisanya berjarak 3 simpangan baku atau lebih
dari rata-ratanya (yaitu nol).
Tujuan analisis data bukan hanya mencari pola umum data tapi juga mencari data
yang mana saja yang tidak mengikuti pola umum. Jika kita menangani data
penyebaran emas dalam tambang maka kita lebih tertarik melihat data yang tidak
mengikuti pola umum. Emas tersebar dalam tambang berbentuk bongkah. Bongkah
yang besar lebih jarang ditemui, jadi lebih merupakan pencilan. Suatu cara menilai
pengaruh data yang tidak mengikuti pola umum ialah dengan membuat analisis
khusus tanpa mengikut sertakan data tersebut dalam analisis, kemudian membanding
pengaruhnya dengan bila seluruh data diikut sertakan.
Besaran Menggunakan semua Tanpa
data no.13
A -61,5530 -55,9129
B 0,8197 0,7768
s (a) 8,7858 3,5504
Tabel
s (b)2.7 Menilai pengaruh
0,0583 pencilan0,0237
s 3,3594 1,3331
93,83% 98,90%

Berikut akan dibahas pemeriksaan kenormalan yang seharusnya dipenuhi oleh


sisa jika model sudah memuaskan. Pemeriksaan anggapan yang lain, kesamaan
variansi, diahas di bab 6. Di bab 6 juga akan dibahas tindakan apa yang harus diambil
bila anggapan kenormalan dan kesamaan variansi dilanggar.

2.9 Pemeriksaan Kenormalan


Pelanggaran terhadap kenormalan dapat terjadi karena terok tidak berasal dari
populasi normal atau adanya beberapa data, biasanya di pinggir, yang merupakan
pencilan (penyebab tidak jelas atau berasal dari populasi lain yang tidak sama dengan
bagian terbesar data lainnya).
Suatu distribusi normal N ( , ) memenuhi persamaan (1.13) di bab 1. Jadi cara
yang sederhana memeriksa kenormalan sisa ialah dengan melihat apakah persentasi
sisa memenuhi:
antara s dan s sekitar 68%,
antara 2s dan 2s ekitar 95%,
dan antara 3s dan 3s sekitar 99,7%.
Perhatikan bahwa rata-rata sisa adalah nol dan simpangan bakunya di sini
dimisalkan s. Kita tidak mengharapkan bahwa persamaan (1.13) harus dipenuhi
dengan tepat, cukup agak kasar. Pelanggaran terhadap ketentuan di atas dapat terjadi
karena sisa tidak memenuhi anggapan kenormalan atau ada pecilan dalam data,
misalnya sisa yang terletak lebih dari 3s dari titik rataan 0.

Contoh 2.9 Pandang kembali data sisa dari contoh 2.5 yang diterakan di tabel 2.6.
data dibulatkan menjadi satu angka di belakang koma.

Pengamatan no.13 ikut


10 6
9
.
.
2
1 06
0 237
-0 821
-1 6
-2 95110
Batang: daun :
Satuan persepuluhan.
Pengamatan no. 13 tidak ikut
2
1 13
0 6789
n -0 =9843 0,10 = 0,05 = 0,01
4 -1 0,8951
21 0,8734 0,8318
5 -2 0,9033
80 0,8804 0,8320
10Terlihat
0,9347
bahwa jika0,9180
pengamatan 0,8804
no. 13, kita memperoleh diagram yang tidak
15
setangkup 0,9506
dan juga 0,9383 0,9110 tunggal. Lebih dari itu, pengamatan no. 13
tidak berpuncak
20
memberikan 0,9600
sisa yang0,9503 0,9290jauh di atas yang lainnya. Akan tetapi jika
sangat terpencil,
25
pengamatan 0,9662 0,9582
no.13 tidak 0,9408maka kita memperoleh diagram yang cukup
diikut sertakan
setangkup,
30 berpuncak 0,9639
0,9707 tunggal.tidak0,9490
aa petunjuk bahwa anggapan normal dilanggar.
40Cara 0,9767
lain, bila hasil
0,9715dari diagram
0,9597 batang-dan-daun kurang meyakinkan, ialah
menggambarkan
50 0,9807 rajah0,9764
normal (probit), menggunakan kertas grafik peluang normal.
0,9664
Akan
60 etapi0,9835
kertas grafik ini diperoleh
0,9799 di sini. Grafik data akan keliatan berada pada
0,9710
suatu
75 garis0,9865
lurus bila data
0,9835berasal 0,9757
dari populasi normal. Pemeriksaan menggunakan
gambar ini memerlukan pengalaman. Penelitian menggunakan data simulasi
menunjukan bahwa kendati terok berasal dari populasi normal, gambar titik-titiknya
tidaklah membentuk garis lurus api agak meliuk. Bagian batang data yang terpenting
diperhatikan ialah batang pertigaan yang di tengah, yaitu yang peluangnya antara
dan . Kedua ujungnya akan mudah terganggu oleh data pencilan sehingga gambarnya
menyimpang dari garis lurus bila ada pencilan. Jika ukuran terok kecil, misalnya n
16, kendati teroknya berasal dari populasi normal gambarnya agak jauh dari garis
lurus. Makin besar n makin lurus gambarnya.
Untuk menggunakan kertas grafik peluang normal, urutkan data sisa , ,..., ,
membesar, namakan, misalnya, dengan ( ) ( ) ... ( ). Gambarkan nilai ini
pada sumbu datar. Sebagau ordinat dari () ambil = (i - )/n ()dapat pula diambil
= i/(n + 1), tapi jangan i/n, nanti gambarnya keluar bingkai bila i = n).

Distribusi yang setangkup mempunyai = 0 sedangkan yang ujungnya tebal


(puncaknya agak datar dibanding distribusi normal) mempunyai > 0. Ditribusi
yang setangkup ( = 0) kendati > 0 (jadi tidak normal), asal n cukup besar, tidak
menjadi masalah berkat teorema limit pusat. Jadi kemencongan lebih merupakan
masalah dari pada kurtosis. Sebagai ganti = (i - )/n disarankan menggunakan
= (i - )/ (n + ).
Nilai kritis hampiran untuk nilai n lainnya dapat dicari dari rumus berikut:
cv (n) ~ 1,0071 - - - , untuk = 0,10;

Tabel 2.8 Nilai kritis hampiran untuk Rp

Sumber: MINITAB, Technical Reports November 1990 hal 1-7

cv (n) ~ 1,0063 - - + , untuk = 0,05;


cv (n) ~ 1,9963 - - + , untuk = 0,01;
dan tolak hipotesis kenormalan bila korelasi hasil perhitungan lebih kecil dari yang
tertera di tabel, untuk n dan tertentu.

Anda mungkin juga menyukai

  • Laporanadkfix
    Laporanadkfix
    Dokumen18 halaman
    Laporanadkfix
    Rizki Alifah
    Belum ada peringkat
  • Laporan 4 Arw
    Laporan 4 Arw
    Dokumen20 halaman
    Laporan 4 Arw
    Rizki Alifah
    Belum ada peringkat
  • Laporanadkfix
    Laporanadkfix
    Dokumen18 halaman
    Laporanadkfix
    Rizki Alifah
    Belum ada peringkat
  • Laporan 5 Arw
    Laporan 5 Arw
    Dokumen21 halaman
    Laporan 5 Arw
    Rizki Alifah
    Belum ada peringkat
  • Laporan Adk 6
    Laporan Adk 6
    Dokumen20 halaman
    Laporan Adk 6
    Rizki Alifah
    Belum ada peringkat
  • Soal Laporan Modul 1
    Soal Laporan Modul 1
    Dokumen1 halaman
    Soal Laporan Modul 1
    Rizki Alifah
    Belum ada peringkat
  • Laporan 4 Arw
    Laporan 4 Arw
    Dokumen20 halaman
    Laporan 4 Arw
    Rizki Alifah
    Belum ada peringkat
  • Laporan Adk 3
    Laporan Adk 3
    Dokumen21 halaman
    Laporan Adk 3
    Rizki Alifah
    Belum ada peringkat
  • Materi Laporan 2
    Materi Laporan 2
    Dokumen8 halaman
    Materi Laporan 2
    Rizki Alifah
    Belum ada peringkat
  • Data Mining
    Data Mining
    Dokumen28 halaman
    Data Mining
    Rizki Alifah
    Belum ada peringkat
  • Arw
    Arw
    Dokumen32 halaman
    Arw
    Rizki Alifah
    Belum ada peringkat
  • Doa Setelah Sholat
    Doa Setelah Sholat
    Dokumen3 halaman
    Doa Setelah Sholat
    Rizki Alifah
    Belum ada peringkat
  • Peluang 3
    Peluang 3
    Dokumen215 halaman
    Peluang 3
    fendyxcyber
    Belum ada peringkat
  • Sistem Bilangan Real
    Sistem Bilangan Real
    Dokumen20 halaman
    Sistem Bilangan Real
    Rizki Alifah
    Belum ada peringkat
  • My Stat Book
    My Stat Book
    Dokumen89 halaman
    My Stat Book
    zeky_cools
    Belum ada peringkat
  • BAB 1 fiksSS
    BAB 1 fiksSS
    Dokumen25 halaman
    BAB 1 fiksSS
    Rizki Alifah
    Belum ada peringkat