Anda di halaman 1dari 17

Regresi dan Korelasi

Linier Sederhana

Setelah mempelajari bab ini, pembaca diharapkan mampu:


tr Menjelaskan tujuan-tujuan dari analisis regresi dan korelasi
A Menghitung dan menginterpretasikan arti dari persamaan regresi dan
standard error dari estimasi-estimasi untuk analisis regresi linier
sederhana
D Menggunakan ukuran-ukuran yang diperoleh dari analisis regresi dan
korelasi untuk membuat estimate-estimate interval dari variabel-variabel
terikat bagi keperluan peramalan (forecasting)
D Menghitung dan menjelaskan makna dari koefisien korelasi dan koefisien
determinasi dalam menggunakan teknik-teknik analisis korelasi linier
sederhana

12.1 Konsep-konsep Pendahuluan


12.2 Analisis Regresi Linier Sederhana
12.3 Uji-uji Relasi dan lnterval Prediksi
12.4 Analisis Korelasi Linier Sederhana
12.5 Soal-soal Latihan
'12.1.1 Analisis Regresi dan Korelasi
Sebelum suatu keputusan diambil seringkali perlu dilakukan suatu peramalan
(forecasting) mengenai kemungkinan yang terjadi/harapan di masa oepan yang
berkaitan dengan keputusan tersebut. Hal tersebut dapat lebih mudah aiUmhn
bila suatu hubungan (relasi) dapat ditentukan antara variabel yang akan diramal
dengan variabel lain yang telah diketahui ataupun sangat mudah untuk diantisipasi.
Untuk keperluan tersebut, regresi dan korelasi rungut luas digunakan sebagai
perangkat analisisnya.
Analisis regresi digunakan untuk mempelajari dan mengukur hubungan sta-
tistik yang terjadi antara dua atau lebih variabel. Dalam regiesi sederhana dika3i
, dua variabel, sedangkan dalam regresi majemuk dikaji lebih dari dua variabel.
Dalam analisis regresi, suatu persamaan regresi hendak ditentukan dan digunakan
untuk menggambarkan pola atau fungsi hubungan yang terdapat antar variabel.
Variabel yang akan diestimasi nilainya disebut variabel terikat (dependent variable
atau response variable) dan biasanya diplot pada sumbu tegak (sumbu-y).
sedang_
kan variabel bebas (independent variable atau explanatory variable) adalatr
variabel yang diasumsikan memberikan pengaruh terhadap v#asi variabel
terikat
dan biasanya diplot pada sumbu datar (sumbu-x).
Analisis korelasi bertujuan untuk mengukur "seberapa kuat',, atau ,.derajat
kedekatan", suatu relasi yang terjadi antar variabel. Jadi, kalau analisis regresi
ingin mengetahui pola relasi dalam bentuk persamaan regresi, maka analisis
korelasi ingin mengetahui kekuatan hubungan tersebut dalam koefisien korelasinya.
Dengan demikian biasanya analisis regresi dan korelasi sering dilakukan bersama-
sama.

12.1.2 Relasi yang Logis


Dalam menentukan apakah terdapat suatu hubungan yang logis antar variabel,
terutama bila penilaian dilakukan terhadap angka-angka statistik saja, perlu di-
perhatikan beberapa hal yang berkaitan dengan masuk akal atau tidaknya
hubungan
tersebut jika ditinjau dari sifat dasar hubungan tersebut. Dalam hal ini terdfat
beberapa kemungkinan bentuk relasi, meliputi hubungan sebab akibat (rair"-
and-effect relationship), hubungan akibat penyebab yang sarta (common-cause
factor relationship), dan hubungan semu (spurious relationship).
Relasi antara kenaikan temperatur dengan kecepatan reaksi proses kimia
termasuk suatu relasi sebab-akiUaj.Oalamcontoh lain, seseorang bisa menemukan
suatu hubungan yang dekat antara peningkatan penjualan rumah dan peningkatan
penjualan kendaraan bermotor. Namun relasi yang berlaku disini bukan menipakan
relasi sebab akibat, namun merupakan relasi akibat penyebab yang samn (common
cause factor) yang dikarenakan tingkat pendapatan masyarakat yang juga
me-
ningkat. Sedangkanjika yang dikaitkan adalah variabel-variabel yang tiaat Uisa
secara logis menunjukkan adanya hubungan maka akan didapatkan relasi
semu.
Misalnya seseorang mencoba mencari persamaan regresi antara data kenaikan
penjualan furniture di Jakarta dengan data perubahan temperatur harian
rata-rata
maka kemungkinan besar persamaan regresi yang diperolehnya tidak mempunyai
arti apa-apa.
Prinsip-prinsip Statistik untuk Teknik dan Sains 207

12.1.3 Diagram Pencar (Scaffer Diagraml


Langkah pertama dalam menganalisis relasi antar variabel adalah dengan membuat
diagram pencar (scatter diagram) yang menggambarkan titik-titik plot dari data
yang diperoleh. Diagram pencar ini berguna untuk:

u membantu melihat apakah ada relasi yang berguna antar variabel.


tr membantu menentukan jenis persamaafl yang akan digunakan untuk
menentukan hubungan tersebut.

Gambar 12.1 menunjukkan beberapa contoh dari diagram pencilr.

n. if ::iilli:t:tn"n:ii:i:iit ilai

12.2.1 Persamaan Regresi Linier Sederhana


Dalam analisis regresi linier sederhana ini akan ditenfukan persamaan yang meng-
hubungkan dua variabel yang dapat dinyatakan sebagai bentuk persamaan pangkat
satu (persamaan linier/persamaan garis lurus).
Persamaan umum garis regresi untuk regresi linier sederhana adalah:

9=a+bx (12.t)

di mana:
j = nilai estimate variabel terikat
a = titik potong garis regresi pada sumbu y atau nilai estimate I Uita
x=0
b = gradiefl garis regresi (perubahan nilai estimate j per satuan perubahan
nilai x)
.r = nilai variabel bebas

12.2.2 Sifat-sifat Garis Regresi Linier


Terdapat dua sifat yang harus dipenuhi sebuah garis lurus untuk dapat menjadi
garis regresi yang cocok ffit) dengan titik-titik data pada diagram pencar, yaitu:

1. Jumlah simpangan (deviasi) positif dari titik-titik yang tersebar di atas garis
regresi sama dengan (saling menghilangkan) jumlah simpangan negatif dari
titik-titik yang tersebar di bawah garis regresi (lihat Gambar 12.2). Dengan
kata lain,

Ily=Ity-i)=o
2. Kuadrat dari simpangan-simpangan mencapai nilai minimum (least square
value of deviations). Iadi:

It&)' = L(y - i)' = minimum


Dengan sifat kedua, metode regresi ini sering juga disebut sebagai metode
least square. l
i

Gambar 12.1
Beberapa
bentuk diagram
pencar

dengan
Dengan menggunakan kedua sifat di atas dan menggabungkannya
menentukan nilai ekstrim sebuah fungsi,
prinsip-pinsip kalkulus diferensial untuk
untuk mendapatkan nilai-nilai
*utu Oiuput diturunkan hubungan-hubungan
sebagai berikut:
konstanta a dan b padapersamaan garis regresi' yang hasilnya

o=,(I,y) - (>")(>, (12.2)

'64- .IY (12.3',


a =t-b7
di mana:
pengamatan (r,)r))
n = jumlah titik (pasangan
7 = mean dari variabel x I

t = mean dari variabel y


1t

,/' .l
Statislik untuk Teknik dan Sains 209

12.2
regresi
pada
pencar

Ly

Ly
:i (-)

(0) ILv
I r-l
1)

Ior.
(-)
]a
oJ

I . Dari suatu praktikum fisika dasar diperoleh data yang menghubungkari variabel
bebas x dan variabel terikat y seperti ditunjukkan dalam tabel berikut.
- -.
' .:,s.t';$f:'
s.#', "f$.lffi*,ryf
'''1$!j:'"
Uji ke- x v
1 6 30
2 9 49
J 3 18

4 8 42

5 7 39

6 5 25
7 8 41

8 t0 52

S1: 56 296

Jika berdasarkan kajian teoritis da!:sifat dari fenomena,yang menghubungkan -r dan


y dapat diasumsikan terdapat suiitsbtili.tuk'hubungan' yang linier, maka persamaan .:

garis regresinya dapat ditentukan qebagai berikut.


Uji ke- x v ry f ,?
I 6 30 180 36 900
2 9 49 441 81 2401
J 3 18 54 9 324
4 8 42 336 & 17il
5 7 39 273 49 t52t
6 5 25 125 25 625
7 8 41 328 & 1681
8 l0 52 520 100 2704
S 56 296 2257 428 12920

-)r56 -7 t=Ivn8=296=zt
n8
Catatan:
Kolom f
ditambahkaD pada tabel meskipun belum digunakan untuk perhitungan
Nilai tersebut akan digunakan kemudian. Jadi dengan meng-
persamaan garis regresi.
gunakan hasil pada tabel, nilai dari konstanta a dan b dapat ditentukan:
.;t)"

b- _
= 8(22s7) - (s6t(296)= 1480 = r'iitie
8(428t- (sef- zs8
a =, - bi = 37 - (5,1389X7) = 1,0277

Jadi persamaan garis regresi linier yang menggambarkan hubungan antara variabel
r dan y dari data sampel pada percoba4n/Araktikum di atas adalah:

j = o + bx = 1,0277 + 5,1389r

Dengan.menggunakan persamaan garis regresi yang diperoleh (Gambar 12.3), maka


dapat diperkirakan hasil yang akan diperoleh (nilai y) untuk suatu nilai.r tertentu.
Misalnya untuk x = 4 dapat diperkirakan bahwa y akan bernilai:

i = o + bx = 1,0277 + 5,1389x = 1,0277 + 5,1389(4) = 21,583

Gambar 12.3 60
Ganis regresi
untuk contoh
50
soal 12.1 Jz = 5.1389x +

40

30

20

10
.
I
i0
10 12
Prinsip-prinsip Statistik untuk Teknik dan Sains 211

persama-
Terdapat beberapa hal yang perlu diperhatikan dalam menggunakan
adalah belum
an garis regresi untuk menghitung perkiraan suatu hasil. Pertama
perkiraan tersebut. Kedua kita tidak bisa melalarkan
diketahui seberapa akurat hasil
pef-
perkiraan untuk nilai-nilai di luar kisaran yang digunakan untuk membuat
memastikan bagaimana sifat hubung-
samaan regfesi tersebut, karena kita tidak bisa
an antara variabel bebas dan variabel terikat untuk nilai-nilai yang lebih
besar
ataupun lebih kecil dari yang diamati'

12.2.3 Standard Error Estimasi


terdapat
Dalam menggunakan persamaan regresi untuk melakukan suatu perkiraan,
satu pertanyaan penting mengenai seberapa kuat hubungan antar variabel bebas

dan ierikatny u; ituo, dengan kata lain, seberapa besat derajat ketergantungan
(dependability) hasil perkiraan tersebut. Hal ini dapat lebih dimengerti dengan
mernperhatikanGambarl2.4,yangmenunjukkanduadiagrampencaryangme-
milikipersamaangarisregresiyangSama.PadaGambar|2.4(a),terlihatbahwa
titik-titik data terpencar lebih rapat di sekitar garis regresi dibandingkan dengan
titik-titik datapadaGambar I2.4 (b). Dengan nalar secara awam saja, kita dapat
mengatakanuahwasuatuestimasiyangdilakukandenganpefsamaangarisregresi
untuk keadaan pada Gambar 12.4 (a) akan lebih baik dibandingkan untuk
keadaan

pada Gambar I2.4 (b).

Gambar 12.4
l.erajat variasi
:ari sebaran
l,encaran)

Ukuran yang mengindikasikan derajat variasi sebaran data di sekitar'garis


yang
regresi dapai menunjukkan seberapa besar derajat keterikatan perkiraan
diperoleh dengan menggunakan pefsamaan regresi tersebut. ukuran ini
dinamakan
error estimasi. Dalam definisi yang lebih tepat standard error
se^bagai staniard
estiriasi (s, adalah deviasi standard yang memberikan ukuran penyebaran
") teramati di sekitar garis regresi, dirumuskan sebagai berikut:
nilai-nilai yang

Itv't-,(Lv) -a(I'v) (.12.4)


n-2
-L7

B Dengan menggunakan data dan tabel perhitungan pada Contoh 12.1, maka standard
error estimasi dari garis regresi yang diperoleh adalah:

Itv'l -,(tr)- a(I'v)


n-2
Fi<tt,szu - L027z (296\ - s,t389Q,257)
-, ".o
1 8-2

12.3.1 Relasi pada Sampel vs Relasi pada Populasi


Suatu pertanyaan akan timbul jika kemudian ingin diketahui apakah relasi antar
variabel yang diperoleh dari sampel berlaku juga untuk populasinya' Sebagai
ilustrasi, perhatikan diagram pencar populasi pada Gambar 12'5'
Gambar 12.5(a) menunjukkan diagram pencar untuk seluruh populasi yang
menggambarkan hubungan antara variabel bebas X dan variabel terikat I (simbol
huruf besar digunakan untuk populasi). Kemudian, andaikan pada pengambilan
sampel kebetulan terpilih titik-titik data seperti yang ditunjukkan oleh Gambar
12.5 (b) dan selanjutnya dihitung persamaan garis regresinya. Terlihat
jelas bahwa
interpretasi dari persamaan garis regresi yang diperoleh dari data sampel dapat
memberikan pemahaman yang menyesatkan (misleading) jlka akan diterapkan
pada populasinya. Untuk itulah perlu dilakukan uji-uji relasi dan interval prediksi
dalam suatu analisis regresi.
pada prinsipnya untuk uji-uji relasi bisa digunakan uji-uji hipotesis yang
telah dipelajari pada bab-bab sebelumnya dengan tambahan bahwa uji-uji tersebut
dikaitkan dengan hasil dari analisis regresi. Beberapa teknik uji relasi akan
I dijelaskan pada bagian berikut ini.

12.3.2 Uii-t untuk Kemiringan (Slope) Garis Regresi


Dalam melakukan inferensi statistik dengan menggunakan analisis regresi
sederhana terdapat beberapa asumsi dasar yang harus terpenuhi, yaitu:

Gambar 12.5
Diagram
pencar
populasi B
o
untuk Teknik dan Sains 213
Prinsip-prinsip Statistik

secara linier dan


l. Populasi memiliki variabel
X dan Y yang berhubungan
Y (A) dan
g*i"tytil;riki nilai perpotfnean dengan sumbu
persamaan a"yuog diperoleh dari observasi
kemiringan (B) y;;;;p.'N,r.r-crir J'ornA dan B' Jadi'
untuk
sampel adalah oifuil"iluip"rkiraan
populasi
nilai Y pada diagrar'n'Fncar
2. Untuk setiap nilai X terdapat distribusi
vansmananl"it"'Joii"'distribusisecaranormaldisekitargarisregrest
itlnl cu.u' tz'el' yang sama (sering
Masing-masing distribusi
nilai Ymemiliki deviasi standard
3.
Oit"u"i sebagai kondisi homoscedasticity)'
bebas satu sama lainnya'
4. Masing-masing nilai Y padadistribusi ini saling
dilakukan
dasar tersebut maka dapat
Dengan berdasarkan asumsi-asumsi gu'" menggunakan uji-
sebuah uji hipotesis mengenai .f:Ttltlillstop"lUiitu diterapkan
'egresi sebagai berikut:
uji hipotesis Vung
/ yang mengiftud z fang[ah
dan Hipotesis Ahemntif:
1. Pernvataan Hipotesis NoI antara variabel
Dalam petsoalan iti
d;;;J;i apararr terdapaihubungan
it# *c1:t-t:-11?':tu"u
kgmrilean citi:
X dan Yyang diindik"'ii"* -"r"i'ii
G"ttti"9""1itopi d*t
garis regresi untuk
rcrdapat hubungan, *#;il; vang akan
popiasi; adalah ""1' J;i;;;;t;; ;;i oln tripttesis alternatif

diuji adalah:
Ho:B=O
Hr:B+O
of Significance):
2. Pemilihan Tingkat Kepentingan lLevel 0'01 atau 0'05
Biasanya digunakan tingtut t"p"ntingan
en guj i an I y-S gY'nakn''
-t- P enentuan Di stribusi P
li
r' Nilai-nilai dari distribusi
oisliu"'i
Dalam uji ini yang oig"t#l" "i"rafi
ditentukan dengan mengetahui:
of significance) alT $tj\ dua-ujung)ijumlah
a. Tingkat kepentingan {level
df = n - 2 di mana 4 =
b. Derajat teueuasalnidelt* "i*tuom'
data Pasangan'

Gambar 12.6
Distribusi
normal di
sekitar garis
regresi
4. Pendefinisian Daerah Penolakan atau Dnerah Kritis:
naerJh penerimaan dan penolakan dibatasi oleh nilai kritis /.,
5. Pernyataan Aturan Keputusan (Decision Rule)"
kemiringan
Tolak /10 dan terima H, jika perbedaan yang terstandald antafa
berada di
sampel iU) autt kemiringan populasi yang dihipotesiskan Bso )
(

daerah penolakan. Jika sebaliknya, tetima H,

Perhitungan Rasio Uii (RA:


Rumus yang digunakan untuk menghitung rasio uji adalah:

b-Bn^ (12.s)
RU,=trrn=-;;-
di mana:
Jr,
"

\txz) tr!
(t2.6)

7. Pengambilan Keputusan Secara Statistik:


Jika nilai rasio uji berada di daerah penerimaan maka hipotesis
nol diterima,
sedangkanjikaberadadidaerahpenolakanmakahipotesisnolditolak.

aDenganmenggunakandatadantabelperhitunganpadaContohl2.ldanhasil
pada contoh
perhltungan siinaaro error estimasi dari garis regresi yang diperoleh
iZ.Z, kemiringan (slope) garis regresi dapat dilakukan sebagai berikut:
^&uuji
1. Hipotesis:
Ho:B=0
Hr:B+O
Z. g = 0,05
3. Digunakan distribusi fo,o,, dengan df = n-2 =8 -2 = 6
4. Batas-batas daerah penolakan uji dua tiung (two-tailefi:
Dari tabel distribusi t, batas kritis adalah = /", = 2'44'7
5. Aturan kePutusan: kemiringan
Tolak I/o dan terima 11, jika perbedaan yang terstandard antara
kemiringan populasi yang dihipotesiskan ( Bo ) kurane dari
sampet iU; dan
Jika sebaliknya' terima I/o'
-2,447 atau lebih dari 2,44'7'
6. Rasio Uji:

1.698
sb=
\ar'-l
=
# = 0,283

t(x2)
H\n -

b_Br^ 5.1389_0=18,159
RU, = t,"n =
0,2g3
--
I

Prinsip-prinsip Statistik untuk Teknik dan Sains 215

Pengambilan keputusan:
Karina RU,= 18,159 bernilai jauh lebih besar daripada nilai batas t,,= 2,447,
maka I1o : B = 0 ditolak. Ini berarti bahwa hipotesis altematif yang menyatakan
bahwa t&dapat kemiringan pada garis regresi untuk populasi serta suatu hubung-
an regresi yang berarti benar-benar ada antara variabel X dan Y'

Kesimpulan di atas dapat juga diperkuat dengan menentukan perkiraan interval


nilai B dengan tingkat kepercayaan 95 persen sebagai:
b-t(s)<B<b-t(s6)
5, I 389 - 2,441 (0,283) < B < 5, 1389 + 2,447 (0,283)
4,4464<B<5,8314

12.3.? Uji ANOVA untuk Kemiringan (S/ope) Garis Regresi


Teknik lain untuk menguji keberadaan slope suatu garis regresi populasi adalah
dengan analisis varians (ANOVA). Uji ANovA ini akan memberi hasil yang
sama dengan uji r dalam menentukan apakah ada relasi antara variabel bebas dan
terikat dalam suatu analisis regresi linier sederhana. Namun uji ANOVA me-
miliki kelebihan dibanding uji r karena uji ANOVA dapat digunakan pula dalam
analisis regresi maj emuk (multiple re gre s sion)'
Untuk analisis regresi linier sederhana, uji ANOVA untuk mengetahui apakah
anta13 X dan Y (terdapat kemiringan/slope yang signifikan
pada
ada hubungan
garis regresinya) mengikuti prosedur sebagai berikut'

1. Pernyataan Hipotesis Nol dan Hipotesis Altematif:


F1o : Tidak terdapat relasi antara X dan Y
H, : TetdaPat relasi antara X dan Y

2. Pemilihan Tingkat Kepentingan (Level of Significance):


Biasanya digunakan tingkat kepentingan 0,01 atau 0'05'

P enentuan Di stribus i P engui ian y ang Di gunakan :


Dalam uji ANOVA ini yang digunakan adalah distribusi E Nilai-nilai dari
dari distribusi F telah disajikan dalam bentuk tabel, yang dapat ditentukan
dengan mengetahui tiga hal sebagai berikut:
a. Tingkat kepentingan
b. Derajat kebebasanldegree of freedom (dfnu) yang digunakan sebagai
pembilang dalam rasio uji adalah dfnu^= ffi
di 7n = jttmTah variabel bebas (untuk regresi linier sederhana, rn
-1)^unu'
c. Derajat kebebasanldegree of freedom (dfa,n) untuk sampel yang di-
gunakan sebagai penyebut dalam rasio adalah dfu"n= (n - m - I)
di mana: 72 = jumlah observasi (data pasangan)
4. Pendefinisian D ae rah- daerah P enolakan atau Kriti s :
Daerah penerimaan dan penolakan dibatasi oleh nilai kritis {,'
5. Pernyataan Aturan Keputusan (Decision Rule)
Tolak.F1o dan terima H1jlka R(J > F,,. Jika tidak demikian, terima FIo.

6. Perhitungan Rasio Uji (R(/): i

Rumus yang digunakan untuk menghitung rasio uji (ftUo) adalah:


I

216 Bab 12 . Regresi dan Korelasi Linier Sederhana

R(Jo= F,rr, = *t* (12.7)


u dol*
Perhitungan untuk bagian pembilang dan penyebut dari rumus rasio uji
dilakukan seperti pada uji ANOVA yang telah diuraikan dalam bab 11,
dengan penyesuaian pada nilai-nilai derajat kebebasannya.

1. Pengambilan Keputusan Secara Statistik:


Jika nilai rasio uji berada di daerah penerimaan maka hipotesis nol diterima,
sedangkan jika berada di daerah penolakan maka hipotesis nol ditolak.

o Dengan menggunakan data dan tabel perhitungan pada Contoh 12.1 maka uji
kemiringan (slope) garis regresi dapat dilakukan sebagai berikut:
l. Hipotesis:
F1o : Tidak terdapat relasi antara X dan Y
-F1, : Terdapat relasi antara X dan Y
2. s = 0,05
J. Digunakan distribusiFdengan dfou =m=l,dfu.r=n-m - 1= 6

4. Dari tabel diperoleh daerah penerimaan /penolakan dibatasi oleh nilai kritis {,
= 5,99
Aturan keputusan:
Tolak I1o dan terima H, jlka RUF > 5,99. Jika tidak demikian, terima 1Jo.

Uji rasio diringkas dan disajikan dalam tabel ANOVA berikut:

7. Pengambilankeputusan:
Karena RU, = 329,61 ) F = 2,447 , maka t1o ditolak dan 11, diterima.
",

12.3.4 Estimasilnterval
Nilai estimasi darisebuah variabel terikat, yang diperoleh dengan menggunakan
suatu persamaan regresi untuk suatu nilai variabel bebas tertentu merupakan
suatu nilai estimasi titik Qtoint estimate). Pada kenyataannya, nilai estimasi ini
tidaklah mutlak tepat, mengingat data terpencar di sekitar garis regresi. Dengan
i mengetahui besarnya standard error estimasi s),,maka estimasi titik dapat diperluas
i
menjadi estimasi interval.
i
Prinsip-prinsip Statistik untuk Teknik dan Sains 217

12.3.4.1 Untuk Sampel Besar (n > 30)


Dengan menganggap nilai variabel terikat, y, yang sesungguhnya terdistribusi
normal di sekitar garis regresi maka suatu estimasi interval dapat diperoleh sebagai:

It z(sy,
")
(12.8)

Dalam relasi (12.8), z adalah skor z yang akan menentukan tingkat ke-
percayaan dari penerimaan estimasi interval yang dilakukan. Gambar 12.7 meng-
ilustrasikan estimasi interval untuk z = 2.

Cambat 12.7
lnterpretasi dan
.aplikasi
estimasi
hterval untuk
Sampel besar

Dari Gambar I2.7, estimasi interval dengan z = 2 untuk x, adalah


!t t Z1sr,,), yang memiliki probabilitas prediksi 95,4 persen.

t2.3.4.2 Untuk Sampel Kecit (z < 30)


a. Prediksi Kisaran Nilai Rata-rata y Jika Diketahui x:
Estimasi interval untuk sampel kecil dengan situasi ini dapat diperoleh dengan
rumus berikut:

, trr,rlrr,. (r2.e)

di mana: .

i = estimasi titik yang dihitung dengan persamaan regresi untuk nilai x


tertentu
dengan derajat kebebasan
tan = nTlarr untuk dJz (= tingkat kepercayaan)
n-2
x- = nilai xyarig ditentukan
n = jumlah observasi pasangan pada sampel

Diketahui x:
b. Prediksi Kisaran Nilai Spesiftk y Jika
dengan situasi ini dapat diperoleh dengan
Estimasi interva unnrh rampet te"it
rumus berikut:

..2
1 \xn-x)
U r t,rL, I*-+----=-a (12.10)

\lr2) E{

.' - :::1, *lj i-: i j ._--'-+'"1

.':ab#{oli;'f'S i,'"ffi
perhitungan pada Contoh 12'1-dan persamaan
tr Dengan menggunakan data dan tabel
Contoh 1'2'2' dapat diprediksi
garis regresi y*g Jiftutilt* serta nilai ', ' Pd
p"tifn O* derajat kebebasan = n - 2 = 8 -
bahwa, dengan tiogkut k"p"t" ayaan 95
2=6,tntukx=4,

I (x, - x)'
o *,",,f,"., -+
t
n
>,f-ry
21.583 + 2,44.7
Ilees!aF-. *-tf
_
I

= A8 (s6tr8
L'
I l
persen diperoleh: 19.038 < j <z+,tzs.
Jadi dengan derajat kepercayaan 95

Sepertitelahdiuraikansebelumnya,untukmengetahuiseberapadekathubungan
antara variab"iaip"rirt"r suatu
ukuran yang menyatakan "kekuatan" relasi
diperoieh melalui suatu analisis korelasi'
tersebut. Dalam sta-tistik, ukuran tersebut yaitu koeiisien
pada bagian i,| oiuarras dua buah okotun korelasi tersebut
t;
determinasi dan koefisien korelasi'

12.4.1 Variasi Total


Untuklebihmemahamipengertiankoefisiendeterminasily';,tltaterlebihdahulupada
membahas beberapa istilah dan
konsep seperti yang diilustrasikan
akan
Gambar 12'8'
untuk Teknik dan Sains Ztv
Prinsip-prinsip Statistik

Sebuah nilai tunggal :


&rnn6ar 12'8 pada diagram Pencar' )r
{":r:sep deviasi Deviasi tak
flrfia terjelaskan dari f
y'
Deviasi total dari
Deviasi terjelaskan
dari f

Deviasiroralmerupakannenvlmnlli?:;"fr ,T:lt"JflJil:i:Jfl'",,o".,l
T;::;;::i:::'-;:i;,U;'#i4i:!,ii;;;;iJ"1"i"''lak'lerietaskan(un.
exptaineda"i*'li1ii'T"u*'i'"':a^*'l'#iJ*f**nXf#::Jtrff'1
CJi^l"n"tsesungguhnva
11*:iru;3il$HlT-Tffi11;illffi
:TT*id#{T;:'"-i.ilTl}!$"$Xil':ffi fl ffi :"Tf,1Tlt,':""variasi'lo'|ut
to?" *'i u' i t" tl t tut kan Q x p a ne d
ti""n ?"t
l i

It o a l a
a t'"i'
r " " variation) sebagai berikut:
il *"*puLun :
t v i

variation)*"']"illl-#;;J;;# v"'.p^"'o
(12'11)
*21Y- - r)'
I(y* - y)' = I(y - t)'
di mana:
'
(v*-y) -t2 = deviasi total
i"' - y)t =
deviasi terjelaskan
deviasi tak terjelaskan
6- - l)' = koeflsien
digunakan dalam mendefinisikan
Konsep-konsep di
atas
{a1
koretast'
determinasi dan koefisien

12.4.2 dari variasi ter-


sebagai perbandingan
i::;t:):":;;n::"rirdidefinisikan
total:
:"l"trt* dengan variasi
(r2.t2)
- il'^
' ->(i
.,
I(Y - t)'
rumus
dari persamaan regresi'
konstanta-konstanta
Dengan menggunakan
sebagai:
Oz.tzl iiP" dinYatakan
ol';y) + a\Z,v) --"(Y)" (r2.r3)
02.1l
,_
.., _
,()),_n(r).
l

(relasi
Nilai koefisien determinasi berkisar antara 0 (tidak ada relasi) dan 1
sempurna).

12.4.3 KoefisienKorelasi
Koefisien korelasi merupakan akar dari koefisien
(r) mempunyai nilai yang
determinasi dan mempunyai tanda dengan ketentuan sebagai berikut:

, = x^[7 (t2.r4)

Tanda r mengikuti tanda konstanta b persamaan regresi (r positif jika b


positif dan r negatif b negati0. Dengan demikian r berkisar antara -1 sampai +1.

Elln#ift:t$:2;6
$fi ;r.#ff ta(#tw*n$Fsf."€2
Dengan menggunakan data dan tabel perhitungan pada Contoh l2'1 dan
perslunaan
garis"regresi-fang dihasilkan, dapat diperoleh koefisien determinasi dan koefisien
Dari persamaan regresi, a = 1,0277 dan b = 5,1389. Jumlah
for"tu*l"r"Uuja U"rit-,,t.
pasangan pengamatan n = 8. Maka:

, "(Ly\+a(I"y) -n(r)'
I(v)' - n(v)'
r,0277(296) + 5,1389(2257) - 8(3?'
= 0,982
t1920 8(37)-
,=+",FW=+0,991

12.4.4 lnterpretasiRelasi
Dari Contoh 12.6, apakah yang bisa diartikan dari nilai koefisien detetminasi
sebesar ? = 0,982? Dengan mengingat kembali bahwa koefisien determinasi
merupakan rasio variasi terjelaskan dengan variasi total, kita dapat mengartikan
bahwa sekitar 98,2 persen variasi dari nilai varibel terikat dapat dijelaskan, artinya
memang benar bahwa variasi tersebut dapat dijelaskan oleh variasi nilai variabel
yang tidak terjelaskan
bebasnya (tentu saja masih terdapat sekitar 1,8 persen variasi
dengan sebab-sebab yang belum diketahui). Karena nilaif tidak dapat
melebihi
1, maka nilai 0,982 merupakan nilai yang cukup tinggi'
Meskipunanalisiskorelasimerupakanmetodepentingdalammencari
eksitensi hubungan antara variabel bebas dan terikat, terdapat dua hal
yang sering
disalahartikan dari sebuah analisis korelasi, sehingga harus dihindari:

1. Korelasi sering digunakan untuk,membuktikan adanya hubungan sebab-


akibat. Hal ini merupakan suatu kesalahan interpretasi, sebab koefisien
deter-
jenis relasi yang terjadi
minasi tidak memberikan informasi apapuh mengenai
antar dua variabel. Koefisien determinasi hanya menunjukkan eksistensi
dan..kekuatan" hubungan antara variabel bebas dan terikat tanpa menilai
sifat relasi tersebut.
2. Koetrsien korelasr senng drlnrcrpretaslKan seDagar rllitl PcrsclrlasE. .ull udP.ll
menimbulkan kesalahan yang sangat serius. Misalnya untuk koefisien korelasi
0,7 tidak berarti 70 persen variasi variabel terikat-dapat terjelaskan, karena
yang sebenarnya terjelaskan adalah sebesar (O'7)2 atau 49 persen'

12.4.5 RangkumanGrafik
Beberapa relasi linier sederhana dapat dirangkum secara grafis dengan meng-
gunakan diagram pencur seperti yang ditunjukkan Gambar 12'9:

(a) korelasi positif sempurna


(b) korelasi negatif sempurna
(c) dan (d) korelasi positif dengan kekuatan relasi (c) lebih besar daripada (d)
(d) tidak ada korelasi

irnbar 12.9 sy,x=o sr*=o


laqkuman .f=1
.F=1
7dk beberapa
r=
dasi linier r=1 1

Ederhana b>0 b<0

syx<gambar(d) syx>gambar(c)
.? = 0,64 .l = 0,36
r= 0,8 r= 0,6
b>0 b>0

t
sv,

.F=0
r=0
b=0

Anda mungkin juga menyukai