Anda di halaman 1dari 14

STATISTIK 2

SEMESTER 4
REGRESI LINIER DAN KORELASI

NAMA KELOMPOK
FRANSISKUS HONAMONE
SANDRA OKYNAWA
YULIUS YOGA PRATAMA
FAK/JUR : EKONOMI / AKUNTANSI
KELAS : A2

UNIVERSITAS KANJURUHAN MALANG


Jl.Soedanco Supriadi No.48 Malang
Telp : (0341) 801488,803194,805264
Email : kanjuruhan@ukanjuruhan.ac.id

BAB XI
REGRESI LINIER
Tujuan utama dari kebanyakan penyelidikan statistik dalam dunia bisnis
dan ekonomi adalah mengadakan prediksi, Misalnya ramalan tentang pasar
potensi dari produk baru,nilai. Bagian milik perusahaan di waktu yang akan
datang, pertumbuhan suatu industri dan segala macam kondisi ekonomi.
Dalam ilmu ekonomi misal persamaan yang sederhana dan luas
penggunaannya untuk menunjukan hubungan variable-variable adalah
persamaan linier dengan persamaan dasarnya adalah:
Y

=a+

Dimana :a dan b bilangan konstan


X = Variable yang diketahui ( Independent Variable)
Y = Variable yang diramalkan (Dependent Variable)
Hubungan antara 2 variable itu ada 2 type,yakni:
1. Hubungan Functional
2. Hubungan Regresional
Dikatakan ada hubungan Functional bila ada time value of Y untuk tiap-tiap
kemungkinan nilai X dan sebaliknya. Hubungan itu kebanyakan di jumpai di
dalam ilmu pengetahuan alam.
Misalnya:

Y=
k
X

Dimana : Y

= Volume suatu gas

K = Bilangan Konstan
X = Tekanan / desakan

Persamaan linier banyak kegunaanya dan penting,tidak hanya karena


terdapatnya banyak hitungan dalam bentuk tersebut,tapi juga karena sering
digunakan dalam pendekatan untuk hubungan yang kompleks dan sukar di
gambarkan.
Contoh:

YI

= 21,9 + 3,3x

Dimana : X = Menunjukan curah hujan dalam ukuran nilai dalam bulan tertentu
di tempat tertentu.
Y = Menunjukan hasil panenan padi dalam kuintal setiap Ha
Jika di ketahui curah hujan tersebut 5 inci, maka hasil panenan diramalkan
sebesar:
YI

= 21,9 + 3,3 (5) = 28,4 kuintal per Ha

A. METODE LAST SQUARES


Untuk memberi gambaran persoalan membuat garis lurus dari sekumpulan
data hasil observasi dari variable X dan Y, diberikan contoh konkrit sebagai
berikut :
Suatu perusahaan akan meramalkan banyaknya / besarnya sales yang
dapat di capai oleh para salesman baru pada tahun pertama setelah mereka
mendapatkan penataran dan ujian departmen.
Tabel 11.1
Nilai ujian dan penjualan tahun pertama dari 10 salesman
Salesman
Bagyo
Diran
Darto
Iskak
Ateng
Edi
Jalal
Ester
Ratmi
Usup

Nilai Uji
X
48
32
40
34
30
50
26
50
22
43

First Year Sales


Y
312
164
280
146
200
288
146
361
149
252

Metode Last Squares berusaha membuat garis yang mempunyai jumlah


selisih (jarak vertikal) kuadrat antara data dengan garis regresi yang terkecil.
Adapun langkah - langkah untuk menyusun garis regresi linier dengan metode
Last Squares sebagai berikut:
a) Susunlah nilai-nilai dependent variable (Y) dan Independent (X).
2
b) Hitung nilai nilai X dan XY.
c) Kita akan mencari garis regresi
Y

Y =a+bx .dimana:

= nilai dependent variable yang sesungguhnya.

X
a

= nilai dependent variable yang diramalkan.


= nilai Independent variable.
= bilangan konstan yang merupakan titik potong dengan sumbu
vertikal .
= slope yaitu koefisien kecondongan garis itu.

Untuk mencari nilai nilai a dan b di gunakan rumus :


XI

b = n ( X I .Y I ) (
i=1

i=1

YI
i=1

XI
n

n(

n
2

i=1

i=1

YI

a=

b.

i=1

YI
i=1

n
Tabel 11.2
Menghitung nilai-nilai a dan b
X

X2

XY

48

312

3.304

14.976

32

164

1.024

5.248

40

280

1.600

11.200

34

196

1.152

6.664

30

200

900

6.000

50

288

2.500

14.400

20

146

676

3.796

50

361

2.500

18.050

22

149

484

3.278

43

252

1.849

10.836

375

2.348

14.993

94.448

Berdasarkan formula ini sekarang kita dapat meramalkan besarnya sales yang
dapat dicapai seorang salesman baru pada tahun pertama berdasarkan score
yang diperoleh pada optitude test. Bila diperoleh score 45, kita dapat
meramalkan bahwa besarnya sales adalah :
Y I =23,20+ 6,88 ( 45 )=286,4

B. Regresi Linier
Oleh karena garis regresi ini adalah ramalan, maka kita mengenal garis
regresi yang senyatanya, yakni yang terdiri dari rata rata yang senyatanya
dari y untuk nilai nilai x tertentu. Dinyatakan dengan persamaan :
Y = a + x
Sedangkan estimated regression line dinyatakan dengan persamaan:
I

Y = + bX
Dimana :a
b

= merupakan pendugaan dari (alpha)


= merupakan pendugaan dari (beta)

Pendugaan tersebut hanya di dasarkan pada sampel, oleh karnanya ada faktor

kebetulan.
C. LIMITS OF PREDICTION
Dengan anggapan bahwa deviasi standart senyatanya dari Y adalah sama
untuk nilai X, maka kita dapat melihat deviasi standart vertikal dari garis
regresinya.
Deviasi standart dari distribusi dinyatakan dengan rumus:

SY . X

I
Y I Y

=
n

i=1

Merupakan pendugaan dari pada

Y . X

Dari rumus di muka, Y.X digunakan untuk menyatakan bahwa kita menduga
deviasi standart senyatanya dari pada Y untuk nilai nilai X tertentu. Menduga
Sedangkan S Y . X di namakan standart error of estimate. Jumlah kuadrat

dibagi dengan n 2. Oleh karnanya 2 konstanta a dan b di hitung berdasarkan


data asli, dimana kita kehilangan 2 derajat kebebasan. Untuk memberi
gambaran bagaimana menghitung S Y . X ,kita ambil contoh dimuka seperti
pada tabel 11.3.

Tabel 11.3
X

YI

I
Y Y

48

312

307,04

4,96

24,6016

32

164

196,96

-32,96

1,086.3616

40

280

252,00

28,00

784,0000

34

196

210,72

-14,72

216,6784

30

200

183,20

16,80

282,2400

50

288

320,80

-32,80

1.075,8400

20

146

155.68

-9.68

93,7024

50

361

320,80

40,20

1,616,0400

22

149

128,16

20,84

434,3056

43

252

272,64

-20,64

426,0096

Y Y

6.039,7792

Ini menunjukan besarnya penyimpangan dari pada penjualan untuk jumlah


nilai uji tertentu.

Sesudah kita mengetahui standart error of estimate,bagaimana kita


dapat meramalkan jumlah penjualan (Y) untuk suatu uji (X) tertentu.Dua batas
nilai di mana nilai penjualan diramalkan akan terletak, di tentukan berdasarkan
confidence level (probabilitas) tertentu, misalnya 0,95. Limit of prediction dapat
dihitung dengan cara sebagai berikut:
Untuk nilai X tertentu kita dapat meramalkan dengan probabilitas 0,95 bahwa
I
I
nilai Y akan terletak antara Y A dan Y + A dimana:

A=

t 0,025

SY . X

X
X

n+1
+
n

t 0,025 dapat di lihat pada tabel nilai t dengan derajat kebebasan n 2

Dimana

D. UJI HIPOTESIS
Apabila kita menginginkan membuat estimasi garis regresi populasi,kita
harus memahami adnya distribusi sampling nilai 6. Distribusi sampling
nilai 6 tersebut dianggap berdistribusi normal dengan mean = dan
deviasi standart.
n

Xi
i=1

Sb

2
X i
n

i=1

SY . X

Dimana :

Sb

= Standart error of the regression coefficient.

SY . X

= Standart error of estimate.

Hipotesis nihil yang akan di uji adalah B=0, artinya tidak ada hubungan antara 2
variable. Apabila n < 20 maka distribusi sampling nilai 6 mengikuti distribusi
nialai t. Dengan degress of freedom n 2.

Kriteria pengujian :
H 0 diterima apabila: -2,306 < t < 2,306
H 0 ditolak apabila : t > 2,036 atau t < -2,036

Perhitungan nilai t:
Dari perhitungan di muka telah ditemukan:
b

= 6,88
SY . X

= 27,5
XI
n

i=1

SY . X

= 27,5

2
X

i=1

3752
10

14,993

14.99314.062,5

950,5

= 30,5
Sb

27,5
30,5

= 0,9

b
S6

6,88
0,9

=7,64

E. REGRESI LINIER BERGANDA


Analisis regresi linier berganda untuk lebih dari 2 variable disebut
dengan analisis regresi linier berganda (multiple linier regression) yang
dinyatakan dengan persamaan linier.
Y = a + b1 X 1 + b2 X 2 +...+ bk X k
Dimana Y merupakan variable yang akan diramalkan sedangkan

X 1 , X 2 ...

X k adalah variable yang diketahui yang dijadikan dasar dalam membuat


ramalan tersebut.

F. REGRESI LINIER BERGANDA DENGAN VARIABLE DUMMY


Dalam analisis regresi linier kadang kadang terjadi bahwa variable
dependent tidak hanya dipengruhi oleh variable yang dapat dinyatakan secara
kuantitatif (seperti modal usaha,pengalaman berusaha) tetapi juga di pengaruhi
oleh variable yang pada dasarnya bersifat/berbentuk kuantitatif, atribut, ataupun
kategori.
Untuk variable yang mengambil nilai seperti 0/1 tersebut disebut variable
dummy. Nama lainnya ialah variable indikator, variable binary. Modelnya dapat
digunakan seperti persamaan regresi linier berganda di muka:
Y=a+

b1 X 1

+ b2 X 2

+ ... +

bk X k

Dimana salah satu / beberapa variable independentnya merupakan variable


dummy
Atau misalnya bahwa gaji seorang karyawan di perusahaan asing itu di
pengaruhi oleh tahun pengalaman kerja, jenis kelaminm dan warna kulit, dapat
digunakan model:
Y=a+

b1 X 1 +

b2 X 2

+ ... + bk X k

Dimana :
Y

= Gaji tahunan
X1

= Tahun pengalaman kerja

X2

= Jenis kelamin
1 laki laki
0 jika perempuan

Bab XII
KORELASI

Adalah salah satu teknik statistik yang digunakan untuk mencari


hubungan antara 2 variable/lebih yang sifatnya kuantitatif. Misal banyaknya
pengunjung dan jumlah orang yang berbelanja di suatu toko, prestasi belajar
dalam mata kuliah statistik dengan mata kuliah cost accounting.
Dua variable dikatakan berkorelasi apabila perubahan pada variable
yang satu akan diikuti perubahan pada variable yang lain secara teratur dengan
arah yang sama/dapat pula dengan arah yang berlawanan. Bila 2 variable
tersebut dinyatakan dalam X dan Y maka apabila X berubah, variable Y pun
juga berubah dan sebaliknya.

a) KOEFISIEN KORELASI
Ukuran besar kecilnya / kuat tidaknya hubungan variable
variable apabila bentuk hubungan linier disebut dengan koefisien korelasi.
Koefisien korelasi yang dinyatakan dengan bilangan, bergerak antara 0 sampai
+ 1 / 1 sampai 1. Apabila koefisien korelasi (r) mendekati + 1 / -1 berarti
terdapat hubungan yang kuat , sebaliknya apabila mendekati 0 berarti terdapat
hubungan yang lemah / tidak ada hubungan . Apabila r sama dengan + 1 / - 1
berarti terdapat hubungan posiif sempurna / hubungan negatif sempurna.
b) MENGHITUNG KOEFISIEN KORELASI
Dapat dihitung dengan beberapa metode yaitu:
1. Last Squares
2. Pearson product
3. Rank Correlation

1. Metode Last Squares

Jumlah kuadrat dari deviasi vertikal dari nilai nilai Y dengan garis
regresi adalah hanya merupakan suatu ukuran terhadap goodness of fit.
i Y 1i
Y 2

i=1

Bila perbedaan antara nilai yang sebenarnya (Y) dan nilai yang di perkirakan (
Y I ) kecil dan bila perbedaaannya bear maka ukuran jumlah kuadratnya jga
besar. Besarnya ukuran ini tergantung pada unit unit Y. Apakah unit itu dalam
puluhan,ratusan,.
2. Metode Pearson product moment
Rumus:
Xi
n

i=1

Yi
n

i=1

2
Y 2i
X 2i

r=

n .
i=1

)( )

n . X i . Y i
i=1

X i ( Y i )
i=1

i=1

3. Rank correlation (Sperman Rank Correlation)


Ada kalanya kita ingin mengukur kuatnya hubungan antara 2 variable
tidak berdasarkan pasangan data dimana nilai sebenarnya diketahui tetapi
berdasarkan ranknya.

d 2i
rI

=1-

i=1

Dimana : n = banyaknya pasangan data


d = Selisih dari setiap pasangan rank

c) MENGHITUNG KOEFISIEN KORELASI DARI DATA BERKELOMPOK


d) Korelasi Dari data Kualitatif
Misalnya kita ingin menentukan apakah ada hubungan antara
penghasilan keluarga dengan macam mobil yang mereka
kendarai. Penghasilan di klarifikasikan: rendah, cukup, dan
tinggi. Sedangkan mobil di bedakan menjadi: sedam, hardtop,
dan convertible (meskipun penghasilan bisa dinyatakan dengan
bilangan tetapi mobil tidak)
e) Interprestasi dari data R
Menurut Young (1982 : 372), koefisien korelasi 0,70 1,00
(plus/minus) menunjukan adanya derajat asosiasi yang tinggi.
Koefisien korelasi lebih tinggi dari 0,40 sampai dibawah 0,70
menunjukan hubungan yang substansi. Apabila koefisienya
diatas 0,20 sampai dibawah 0,40 menunjukan adanya korelasi
yang rendah.
f) UJI SIFNIFIKAN DARI DATA R
DarI sepanjang dadu, satu merah dan satu hijau di lemparkan
ke atas bersama-sama sebanyak 5 kali. Misal kita peroleh hasil
sebagai berikut.
Dadu merah (X)
1
4
5
6
2

Dadu Hijau (Y)


2
6
4
4
2

Bila dihitung nilai r, akan di peroleh nilai yang tinggi. Yakni 0,67
bahwa sebenarnya tidak ada hubungan antara hasil lemparan 2 dadu tersebut.
Dengan demikian pengujian nilai r adalah untuk apakah benar benar terdapat
hubungan variable X dan Y.
Apabila r dihitung berdasarkan suatu sample maka nilai r nya
merupakan harga estimate P(rho) yakni koefisien korelasi populasinya. Untuk
menguji hipotesis nihil yang mengatakan bahwa tidak ada hubungan antara

variable X dan Y, yakni P (rho) = 0, kita mendasarkan pada distribusi sampling


nilai r yang mempunyai mean = 0 dan deviasi standart
1
n1
(dari populasi kita dapat mengambil banyak sample tiap tiap sample dihitung
nilai r, kemudian akan kita peroleh kumpulan nilai r.

g) Korelasi Berganda
Merupakan alat ukur untuk mengetahui pertautan antara variable tidak
bebas (variable Y) dengan beberapa variable bebas (variable X 1 , X 2 ,.. X k )
secara serempak. Koefisien korelasi berganda yang di beri

r y 1,2 k

dihitung

melalui jalur terjadinya hubungan antara satu variable tidak bebas (Y) dengan
beberapa variable bebas ( X 1 , X 2 X k ) yakni yang berapa regresi linier
berganda

Y I =a+b I X I +b2 X 2 ++ bk X k koefisien korelasi berganda di hitung

dengan rumus berikut:


r y ,1,2 k

Dimana :
X1
Y

X 1 y
X 1 y=

b1 X 1 y +b 2 X 2 y ++ bk X k y

y2

X2
Y

X 2 Y
X 2 Y =

Xk
Y

X k Y = X k Y
Y

Y 2
Y 2=

h) Korelasi Parsial
Adalah korelasi antara sebuah variable tak bebas (dependent variable)
dengan sebuah variable bebas tertentu (independent variable).
Sementara sejumlah variable bebas lainnya yang ada / di duga ada
pertautanya dengan variable tak bebas tersebut sifatnya tetap / kontans.
Ini berarti jika variable tak bebas Y ada dalam pertautan dengan variable
bebas

Anda mungkin juga menyukai