Anda di halaman 1dari 13

STATISTIKA DAN PROBABILITAS

10 PENGUJIAN HIPOTESIS

JUMLAH PERTEMUAN : 1 PERTEMUAN


TUJUAN INSTRUKSIONAL KHUSUS :
Mahasiswa dapat memprediksi kejadian berikutnya.

Materi :
10.1. PENDAHULUAN

Variabel dibedakan dalam dua jenis dalam analisis regresi:

Variabel bebas atau variabel prediktor -> variabel yang mudah didapat atau tersedia. Dapat dinyatakan
dengan X 1 , X 2 , … , X k Dengan k ≥ 1

Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan
dengan Y.

Contoh: fenomena yang meliputi hasil panen padi dengan volume pupuk yang digunakan, sebaiknya
diambil variabel bebas X = volume pupuk dan variabel takbebas Y = hasil panen padi.

Persamaan regresi secara umum:

μ y , x , x , .. ,x =f ( X 1 , X 2 , … , X k|θ1 ,θ 2 , … , θm )
1 2 k

Dengan θ1 , θ2 ,… , θm parameter-parameter yang ada dalam regresi itu.

Jenis-jenis regresi adalah

1. Regresi linier: regresi linier sederhana dan regresi linier berganda

Regresi non linier: regresi eksponensial, regresi parabola kuadratik, regresi parabola kubik, regresi
logistik, regresi geometric
STATISTIKA DAN PROBABILITAS
10.2. Regresi Linier
10.1.1. Regresi Linier Sederhana

Merupakan regresi dengan satu variabel bebas, regresi dengan variabel bebas X dan variabel
takbebasnya Y atau dinamakan juga regresi Y atas X, bentuk persamaannya:

μ y . x =θ1 +θ 2 X

Regresi linear sederhana berdasarkan sampel, maka θ1 ditaksir dengan a dan θ2 ditaksir dengan b
diperoleh:

Y^ =a+bX

Cara penentuan nilai a dan b dapat dilakukan dengan dua cara:

1. Metode tangan bebas

Metode Tangan Bebas adalah metode penentuan persamaan regresi kira-kira menggunakan
diagram pencar. Jika fenomena meliputi sebuah variabel bebas X dan variabel tak bebas Y, maka data
yang didapat digambarkan pada diagram dengan sumbu datar menyatakan X dan sumbu tegak
menyatakan Y.

Jika letak titik-titik sekitar garis lurus maka untuk menentukan persamaan regresinya, dapat dicari
dengan menggunakan dua titik yang dilalui garis tersebut, kemudian dicari persamaan garisnya, yaitu
jika garis melewati titik-titik ( x 1 , y 1 ) dan ( x 2 , y 2 ) maka:

y− y1 x−x 1
=
y 2− y 1 x 2−x 1

Penetuan regresi dengan cara ini bersifat tidak tunggal, artinya tiap orang akan memberikan
perkiraan yang berbeda bergantung pada pertimbangan pribadi masing-masing.

2. Metode kuadrat terkecil

Seperti dikatakan sebelumnya regresi dengan variabel bebas X dan variabel takbebas Y dimana
model regresi linier untuk populasi yaitu

μ y . x =θ1 +θ 2 X

akan ditaksir harga-harga θ1 dan θ2 oleh a dan b sehingga didapat persamaan regresi menggunakan
data sampel:
STATISTIKA DAN PROBABILITAS
Y^ =a+bX

Dengan

( ∑ Y i ) (∑ X 2i )−(∑ X i )( ∑ X i Y i)
a=
n ∑ X i −( ∑ X i )
2 2

n ∑ X i Y i−( ∑ X i )( ∑ Y i )
b= 2
n ∑ X i −( ∑ X i )
2

Dimana n adalah jumlah sampel, X i adalah data variabel bebas ke – i dan Y i adalah data variabel
takbebas ke – i.

Jika terlebih dahulu dihitung koefisien b, maka koefisien a dapat pula ditentukan oleh rumus:

a=Y −b X

dimana X dan Y adalah rata-rata untuk masing-masing variabel X dan Y.

Koefisien b dinamakan koefisien arah regresi linier dan menyatakan perubahan rata-rata variabel Y
untuk setiap perubahan variabel X sebesar satu unit. Perubahan ini merupakan pertambahan jika b
bertanda positif dan penurunan atau pengurangan jika bertanda negatif.

Contoh:

Data berikut melukiskan hasil pengamatan mengenai banyak orang yang datang (X) dan banyak orang
yang berbelanja (Y) di sebuah toko selama 30 hari.
STATISTIKA DAN PROBABILITAS

Daftar 2.1

Banyak Pengunjung dan yang Berbelanja

Di Sebuah Toko Selama 30 Hari

Pengunjun Berbelaja Pengunjun Berbelanja


g ( X i) (Y i ) g ( X i) (Y i )
34 32 42 38
38 36 41 37
34 31 32 30
40 38 34 30
30 29 36 30
40 35 37 33
40 33 36 32
34 30 37 34
35 32 39 35
39 36 40 36
33 31 33 32
32 31 34 32
42 36 36 34
40 37 37 32
42 35 38 34

39
38
37
36 f(x) = 0.682072117826308 x + 8.24367699339766
R² = 0.76731684892003
35
Belanja (Y)

34
33
32
31
30
29
30 32 34 36 38 40 42 44
Pengunjung (X)
STATISTIKA DAN PROBABILITAS
Gambar 2.1

Jawab:

Xi Yi Xi Y i Xi
2
Xi Yi Xi Y i Xi
2

34 32 1088 1156 42 38 1596 1764


38 36 1368 1444 41 37 1517 1681
34 31 1054 1156 32 30 960 1024
40 38 1520 1600 34 30 1020 1156
30 29 870 900 36 30 1080 1296
40 35 1400 1600 37 33 1221 1369
40 33 1320 1600 36 32 1152 1296
34 30 1020 1156 37 34 1258 1369
35 32 1120 1225 39 35 1365 1521
39 36 1404 1521 40 36 1440 1600
33 31 1023 1089 33 32 1056 1089
32 31 992 1024 34 32 1088 1156
42 36 1512 1764 36 34 1224 1296
40 37 1480 1600 37 32 1184 1369
42 35 1470 1764 38 34 1292 1444
Setelah dijumlahkan didapat:

∑ X i=1105, ∑ Y i=1001, ∑ X i Y i =37094 dan ∑ X 2i =41029


Maka diperoleh:

(1001 ) ( 41029 )−( 1105 ) (37094 )


a= 2
=8,24 37
30 ( 41029 ) −( 1105 )

30 ( 37094 )−( 1105 ) ( 1001 )


b= 2
=0,6821
30 ( 41029 )− (1105 )

Sehingga persamaan linier Y atas X adalah

Y^ =8,2437+0,6821 X

Artinya untuk setiap X bertambah dengan seorang maka rata-rata pembeli Y bertambah dengan 0,68
orang.

Berbagai Varians Sehubungan Dengan Regresi Linear Sederhana


STATISTIKA DAN PROBABILITAS
Untuk analisis selanjutnya tentang regresi linier sederhana, beberapa asumsi harus diambil.

Pertama, mengingat hasil pengamatan variabel takbebas Y belum tentu sama besarnya dengan harga
^ yang didapat dari regresi hasil pengamatan, maka terjadi perbedaan e=|Y −Y^ |,
diharapkan, yakni Y
biasa disebut kekeliruan prediksi atau galat prediksi. Dalam populasi, galat prediksi ini dimisalkan
2
berbentuk variabel acak yang mengikuti distribusi normal dengan rata-rata nol dan varians σ ϵ .

Kedua, untuk setiap harga X yang diberikan, variabel tak bebas Y independen dan berdistribusi normal
denga rata-rata ( θ1 +θ 2 X ) dan varians σ Y . X . Varians σ Y . X dimisalkan sama untuk setiap X dan karenanya
2 2

dapat dinyatakan oleh σ ϵ yang biasa pula dinamakan varians kekeliruan taksiran sedangkan σ y .x dikenal
2

dengan kekeliruan baku taksiran.

2
Berpegang kedua asumsi di atas, maka varians σ ϵ ditaksir oleh rata-rata kuadrat penyimpangan sekitar
2
regresi atau disebut juga rata-rata kuadrat residu, dinyatakan oleh varians se yaitu

∑ ( Y i−Y^i )
2
2 2
s Y .X =s = e
( n−2 )
^ = didapat dari regresi berdasarkan sampel, dan n
Dengan Y = variabel tak bebas hasil pengamatan dan Y
= ukuran sampel.

Dapat ditulis juga

s2Y . X = ( n−1
n−2 )
( s −b s )
2
Y
2 2
X

2 2
Dengan sY dan s X masing-masing menyatakan varians untuk variabel-variabel Y dan X.

Varians koefisien b:

2 s2Y . X
s=
∑ ( X i− X )2
b

Varians koefisien a:
STATISTIKA DAN PROBABILITAS

{ }
2
2 2 1 X
sa =s Y . X +
n ∑ ( X i− X )2

Varians ramalan rata-rata Y untuk X 0 yang diketahui:

{ }
2
2 2 1 ( X 0 −X )
s =s +
Y^ Y .X
n ∑ ( X i−X )2
Varians ramalan individu Y untuk X 0 yang diketahui

{ }
2
2 2 1 ( X 0− X )
sY^ =sY . X 1+ +
n ∑ ( X i−X ) 2

{∑ }
2

Untuk rumus-rumus di atas ∑ ( X i− X ) dapat diganti oleh


2 2 (∑ x i )
X− i
n

Contoh:

Untuk dengan data dalam daftar 2.1, kita dapat menghitung varians-varians di atas. Kita perlu X =36,8;
s x =11,32; s y =6,86 dan∑ ( X i− X ) =328,2, diperoleh b = 0,68 dan n = 30 didapat
2 2 2

30−1
2
sY . X = {6,86− ( 0,68 )2 ( 11,32 ) }=1,684
30−2

2 1,684 −3
sb = =5,13× 10
328,2

{ }
2
2 1 36,8
sa =1,684 + =7,005
30 328,2

Varians ramalan rata-rata Y untuk X 0=40 adalah

{ }
2
1 ( 40−36,8 )
s2Y^ =1,684 + =0,1087
30 328,2

Varians ramalan individu Y untuk X 0=40 adalah


STATISTIKA DAN PROBABILITAS

{ }
2
2 1 ( 40−36,8 )
sY^ =1,684 1+ + =1,7927
30 328,2

Korelasi

Koefisien korelasi (r): ukuran hubungan linier peubah X dan Y

Nilai r berkisar antara -1 dan 1.

r =−1 Hubungan linier sempurna tak langsung.


Titik-titik yang ditentukan oleh ( X i , Y i ) seluruhnya terletak pada garis regresi dan harga X
besar berpasangan dengan Y kecil dan X kecil berpasangan dengan Y besar
r =+1 Hubungan linier sempurna langsung.
Titik-titik yang ditentukan oleh ( X i , Y i ) seluruhnya terletak pada garis regresi dan harga X
besar berpasangan dengan Y besar dan X kecil berpasangan dengan Y kecil
r <1 Korelasi tak langsung atau korelasi negatif
r >1 Korelasi langsung atau korelasi positif
r =0 Tidak terdapat hubungan linier antara variabel X dan Y
Untuk keperluan perhitungan koefisien korelasi r berdasarkan sekumpulan data ( X i , Y i ) berukuran n
dapat digunakan rumus:

n ∑ X i Y i−( ∑ X i )( ∑ Y i)
r=
√ {n ∑ X −( ∑ X ) }{n ∑ Y −(∑ Y ) }
2
i i
2 2
i i
2

Bentuk lain dapat pula digunakan:


r = 1−
s 2y .x
s2y

dengan s y . x = kekeliruan baku taksiran dan s y = simpangan baku untuk variabel Y.

Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didapat koefisien arah,b, maka
koefisien determinasi, r 2 , dapat ditentukan oleh rumus:

2
b { n ∑ X i Y i−( ∑ X i )( ∑ Y i ) }
r=
n ∑ Y i −( ∑ Y i )
2 2
STATISTIKA DAN PROBABILITAS
atau dapat juga menggunakan formula:

b sx
r=
sy

dengan s x simpangan baku untuk variabel X dan s y simpangan baku untuk variabel Y.

Jika b 1 adalah koefisien arah regresi Y atas X dan b 2 adalah koefisien arah regresi X atas Y untuk data
yang sama, maka
2
r =b1 b2

Rumus ini menyatakan bahwa koefisien korelasi r adalah rata-rata ukur daripada koefisien-koefisien
arah b 1 dan b 2.

Contoh:
2 2
Untuk dengan data dalam daftar 2.1, untuk menentukan korelasi diperlu X =36,8; s x =11,32; s y =6,86
dan∑ ( X i− X ) =328,2, diperoleh b = 0,68 dan n = 30 didapat
2

r =0.68
√ 11.32
6.86
=0.87

10.1.2. Regresi Linier Berganda

Banyak data pengamatan yang terjadi sebagai akibat lebih dari dua variabel. Misalnya, rata-rata
pertambahan berat daging sapi (Y) bergantung pada berat permulaan ( X 1) , umur sapi ketika
pengamatan dimulai dilakukan ( X 2) , berat makanan yang diberikan setiap hari ( X 3 ) dan mungkin masih
ada faktor lain.

Akan ditentukan hubungan antara Y dan X 1 , X 2 , … , X k sehingga didapat regresi Y atas X 1 , X 2 , … , X k .


Yang akan ditinjau di sini hanyalah garis regresi sederhana ialah yang dikenal dengan regresi linier
ganda. Model tersebut ditaksir oleh:

Y^ =a0 +a 1 X 1 +a 2 X 2+ …++a k X k

Koefisien-koefisien a 0 , a 1 , … , ak ditentukan dengan menggunakan metode kuadrat terkecil.

Untuk regresi linier ganda dua variabel bebas:


STATISTIKA DAN PROBABILITAS
Y^ =a0 +a 1 X 1 +a 2 X 2

maka untuk mengetahui koefisien-koefisiennya harus menyelesaikan persamaan-persamaan berikut:

∑ Y i=a0 n+ a1 ∑ X 1i+ a2 ∑ X 2i
∑ Y i X 1i=a0 ∑ X 1i +a1 ∑ X 21i +a 2 ∑ X 1i X 2i
∑ Y i X 2i=a0 ∑ X 2i +a1 ∑ X 1i X 2i +a2 ∑ X 22i
persamaan (*)

a 0=Y −a1 X 1−a 2 X 2

(∑ x 21i ) (∑ x1i y i )−(∑ x 1i x 2i )(∑ x 2i y i )


a 1= 2
(∑ x 21i )(∑ x 22i )−(∑ x 1i x 2i )
(∑ x 21i ) ( ∑ x 2i y i )−( ∑ x 1i x 2i)( ∑ x 1i y i )
a 2=
(∑ x 21i )(∑ x 22i )−( ∑ x 1i x 2i )
2

Koefisien a 1 merupakan perubahan rata-rata Y unutuk setiap perubahan satuan dalam variabel X 1
apabila X 2 , X 3 , … , X k semua dianggap tetap, begitu juga a 2 merupakan perubahan rata-rata Y unutuk
setiap perubahan satuan dalam variabel X 2 apabila X 1 , X 3 , … , X k semua dianggap tetap dan begitu
seterusnya. Jelas bahwa di sini setiap koefisien hanya memberikan gambaran parsial apa yang terjadi
pada Y untuk perubahan X yang berhubungan dengan koefisien dimaksud. Karenanya, koefisien-
koevisien a 1 , a2 , … , ak disebut pula koefisien regresi parsil.

Untuk regresi linier ganda variabel, maka ukuran kekelirua yang digunakan adalah:

∑ ( Y i−Y^i )
2
2
sy .1,2 ,… ,k =
n−k −1
^ = nilai harapan yang didapat dari persamaan regresi.
dimana Y i = nilai data hasil pengamatan dan Y i

Korelasi Linier Berganda


2
Koefisien Determinasi Sampel untuk Regresi Linier Berganda diberi notasi sebagai berikut R y .12

Sedangkan Koefisien korelasi adalah akar positif koefisien determinasi atau


STATISTIKA DAN PROBABILITAS
r y.12 =√ R 2
y.12

Rumus:

2 JKG
R y .12=1−
( n−1 ) s 2y

Keterangan:

JKG: Jumlah Kuadrat Galat


2
s y : Jumlah Kuadrat y (terkoreksi)

Dimana:
2
n ∑ y −( ∑ y )
2
2
s=y
n ( n−1 )

JKG=∑ y 2−a 0 ∑ y −a1 ∑ x 1 y−a2 ∑ x 2 y

(sumber: thomasyunigunarto)

Berikut adalah data Volume Penjualan (juta unit) Mobil dihubungkan dengan variable biaya promosi ( X 1
dalam juta rupiah/tahun) dan variable biaya penambahan asesoris ( X 2 dalam ratusan ribu rupiah/unit)

x1 x2 y x1 x2 x1 y x2 y x 21 x 22 y2
2 3 4 6 8 12 4 9 16
3 4 5 12 15 20 9 16 25
5 6 8 30 40 48 25 36 64
6 8 10 48 60 80 36 64 100
7 9 11 63 77 99 49 81 121
8 10 12 80 96 120 64 100 144
∑ x 1=31 ∑ x 2=40 ∑ y=50 ∑ x 1 x2=239
∑ x 1 y=296
∑ x 2 y=379
∑ x 21=187∑ x 22=306∑ y2 =470
Tetapkan persamaan regresi linier berganda: a 0+ a1 X 1+ a2 X 2

Substitusi kedalam persamaan:

(i) 6 a 0+ 31a 1+ 40 a2=50


(ii) 31 a0 +187 a 1+239 a 2=296
(iii) 40 a0 +239 a1 +306 a2 =379
STATISTIKA DAN PROBABILITAS
Gunakan eliminasi dan substitusi untuk mendapatkan nilai a 0, a 1, a 2 yaitu:

Sehingga diperoleh:

3 1 3
a 0 = , a 1= , a 3 =
4 2 4

Maka bentuk regresi linier berganda:

3 1 3
Y^ = + X 1 + X 2
4 2 4

Koefisien korelasi adalah


2
2 6 ( 470 )−50
s=
y =10.667
6 ( 5)

JKG=470−0.75 ( 50 )−0.5 ( 296 ) −0.75 ( 379 )=0.25

2 0.25
R y .12=1− =0.99
5 ( 10.667 )

10.3. Regresi Non Linier

^ =a+bX + c X 2
1. Parabola kuadratik: Y
Dengan menggunakan metode kuadrat terkecil, maka a, b, dan c dapat dihitung dari sistem
persamaan:
∑ Y i=na+b ∑ X i+ c ∑ X 2i
∑ X i Y i =a ∑ X i +b ∑ X 2i + c ∑ X 3i
∑ X 2i Y i =a ∑ X 2i +b ∑ X 3i + c ∑ X 4i
^ =a+bX + c X 2 +d X 3
2. Parabolik kubik: Y
Untuk menentukan nilai a, b, c, dan d gunakan sistem persamaan berikut:
∑ Y i=na+b ∑ X i+ c ∑ X 2i + d ∑ X 3i
∑ X i Y i =a ∑ X i +b ∑ X 2i + c ∑ X 3i +d ∑ X 4i
∑ X 2i Y i =a ∑ X 2i +b ∑ X 3i + c ∑ X 4i + d ∑ X 5i
∑ X 3i Y i =a ∑ X 3i +b ∑ X 4i + c ∑ X 5i + d ∑ X 6i
STATISTIKA DAN PROBABILITAS
3. Eksponen : Y ^ =a bX

Besar nilai a dan b ditentukan menggunakan persamaan:

log a=
n (
∑ log Y i −( log b ) ∑ X i
n )
n ( ∑ X i log Y i ) −( ∑ X i )( ∑ log Y i )
log b= 2
n ∑ X i −( ∑ X i)
2

4. Geometrik: Y ^ =a X b
Besar nilai a dan b ditentukan menggunakan persamaan:

log a=
∑ log Y i −b ∑ log X i
n n
n ( ∑ log X i log Y i ) −( ∑ log X i )( ∑ log Y i )
b= 2
n ∑ log X i−( ∑ log X i )
2

^= 1
5. Logistik: Y X
a b +c
∑ log ( ) −( log b ) ∑ X
1

log a=
n
Yi
( ) n
i

log b=
n
( ∑ X i log ( ))
1
Yi
−( ∑ X i )
( ∑ log ( ))1
Yi

n ∑ X i −( ∑ X i)
2 2

^= 1
6. Hiperbola: Y
a+ bX
^ tidak ada yang bernilai nol, maka a dan b adalah
Jika Y

a=
( ∑ Y ) ( ∑ X ) −( ∑ X ) ( ∑ X Y )
1
i
2
i
1
i i
i
2
n ∑ X 2i −( ∑ X i )

Anda mungkin juga menyukai