10 PENGUJIAN HIPOTESIS
Materi :
10.1. PENDAHULUAN
Variabel bebas atau variabel prediktor -> variabel yang mudah didapat atau tersedia. Dapat dinyatakan
dengan X 1 , X 2 , … , X k Dengan k ≥ 1
Variabel tak bebas atau variabel respon -> variabel yang terjadi karena variabel bebas. Dapat dinyatakan
dengan Y.
Contoh: fenomena yang meliputi hasil panen padi dengan volume pupuk yang digunakan, sebaiknya
diambil variabel bebas X = volume pupuk dan variabel takbebas Y = hasil panen padi.
μ y , x , x , .. ,x =f ( X 1 , X 2 , … , X k|θ1 ,θ 2 , … , θm )
1 2 k
Regresi non linier: regresi eksponensial, regresi parabola kuadratik, regresi parabola kubik, regresi
logistik, regresi geometric
STATISTIKA DAN PROBABILITAS
10.2. Regresi Linier
10.1.1. Regresi Linier Sederhana
Merupakan regresi dengan satu variabel bebas, regresi dengan variabel bebas X dan variabel
takbebasnya Y atau dinamakan juga regresi Y atas X, bentuk persamaannya:
μ y . x =θ1 +θ 2 X
Regresi linear sederhana berdasarkan sampel, maka θ1 ditaksir dengan a dan θ2 ditaksir dengan b
diperoleh:
Y^ =a+bX
Metode Tangan Bebas adalah metode penentuan persamaan regresi kira-kira menggunakan
diagram pencar. Jika fenomena meliputi sebuah variabel bebas X dan variabel tak bebas Y, maka data
yang didapat digambarkan pada diagram dengan sumbu datar menyatakan X dan sumbu tegak
menyatakan Y.
Jika letak titik-titik sekitar garis lurus maka untuk menentukan persamaan regresinya, dapat dicari
dengan menggunakan dua titik yang dilalui garis tersebut, kemudian dicari persamaan garisnya, yaitu
jika garis melewati titik-titik ( x 1 , y 1 ) dan ( x 2 , y 2 ) maka:
y− y1 x−x 1
=
y 2− y 1 x 2−x 1
Penetuan regresi dengan cara ini bersifat tidak tunggal, artinya tiap orang akan memberikan
perkiraan yang berbeda bergantung pada pertimbangan pribadi masing-masing.
Seperti dikatakan sebelumnya regresi dengan variabel bebas X dan variabel takbebas Y dimana
model regresi linier untuk populasi yaitu
μ y . x =θ1 +θ 2 X
akan ditaksir harga-harga θ1 dan θ2 oleh a dan b sehingga didapat persamaan regresi menggunakan
data sampel:
STATISTIKA DAN PROBABILITAS
Y^ =a+bX
Dengan
( ∑ Y i ) (∑ X 2i )−(∑ X i )( ∑ X i Y i)
a=
n ∑ X i −( ∑ X i )
2 2
n ∑ X i Y i−( ∑ X i )( ∑ Y i )
b= 2
n ∑ X i −( ∑ X i )
2
Dimana n adalah jumlah sampel, X i adalah data variabel bebas ke – i dan Y i adalah data variabel
takbebas ke – i.
Jika terlebih dahulu dihitung koefisien b, maka koefisien a dapat pula ditentukan oleh rumus:
a=Y −b X
Koefisien b dinamakan koefisien arah regresi linier dan menyatakan perubahan rata-rata variabel Y
untuk setiap perubahan variabel X sebesar satu unit. Perubahan ini merupakan pertambahan jika b
bertanda positif dan penurunan atau pengurangan jika bertanda negatif.
Contoh:
Data berikut melukiskan hasil pengamatan mengenai banyak orang yang datang (X) dan banyak orang
yang berbelanja (Y) di sebuah toko selama 30 hari.
STATISTIKA DAN PROBABILITAS
Daftar 2.1
39
38
37
36 f(x) = 0.682072117826308 x + 8.24367699339766
R² = 0.76731684892003
35
Belanja (Y)
34
33
32
31
30
29
30 32 34 36 38 40 42 44
Pengunjung (X)
STATISTIKA DAN PROBABILITAS
Gambar 2.1
Jawab:
Xi Yi Xi Y i Xi
2
Xi Yi Xi Y i Xi
2
Y^ =8,2437+0,6821 X
Artinya untuk setiap X bertambah dengan seorang maka rata-rata pembeli Y bertambah dengan 0,68
orang.
Pertama, mengingat hasil pengamatan variabel takbebas Y belum tentu sama besarnya dengan harga
^ yang didapat dari regresi hasil pengamatan, maka terjadi perbedaan e=|Y −Y^ |,
diharapkan, yakni Y
biasa disebut kekeliruan prediksi atau galat prediksi. Dalam populasi, galat prediksi ini dimisalkan
2
berbentuk variabel acak yang mengikuti distribusi normal dengan rata-rata nol dan varians σ ϵ .
Kedua, untuk setiap harga X yang diberikan, variabel tak bebas Y independen dan berdistribusi normal
denga rata-rata ( θ1 +θ 2 X ) dan varians σ Y . X . Varians σ Y . X dimisalkan sama untuk setiap X dan karenanya
2 2
dapat dinyatakan oleh σ ϵ yang biasa pula dinamakan varians kekeliruan taksiran sedangkan σ y .x dikenal
2
2
Berpegang kedua asumsi di atas, maka varians σ ϵ ditaksir oleh rata-rata kuadrat penyimpangan sekitar
2
regresi atau disebut juga rata-rata kuadrat residu, dinyatakan oleh varians se yaitu
∑ ( Y i−Y^i )
2
2 2
s Y .X =s = e
( n−2 )
^ = didapat dari regresi berdasarkan sampel, dan n
Dengan Y = variabel tak bebas hasil pengamatan dan Y
= ukuran sampel.
s2Y . X = ( n−1
n−2 )
( s −b s )
2
Y
2 2
X
2 2
Dengan sY dan s X masing-masing menyatakan varians untuk variabel-variabel Y dan X.
Varians koefisien b:
2 s2Y . X
s=
∑ ( X i− X )2
b
Varians koefisien a:
STATISTIKA DAN PROBABILITAS
{ }
2
2 2 1 X
sa =s Y . X +
n ∑ ( X i− X )2
{ }
2
2 2 1 ( X 0 −X )
s =s +
Y^ Y .X
n ∑ ( X i−X )2
Varians ramalan individu Y untuk X 0 yang diketahui
{ }
2
2 2 1 ( X 0− X )
sY^ =sY . X 1+ +
n ∑ ( X i−X ) 2
{∑ }
2
Contoh:
Untuk dengan data dalam daftar 2.1, kita dapat menghitung varians-varians di atas. Kita perlu X =36,8;
s x =11,32; s y =6,86 dan∑ ( X i− X ) =328,2, diperoleh b = 0,68 dan n = 30 didapat
2 2 2
30−1
2
sY . X = {6,86− ( 0,68 )2 ( 11,32 ) }=1,684
30−2
2 1,684 −3
sb = =5,13× 10
328,2
{ }
2
2 1 36,8
sa =1,684 + =7,005
30 328,2
{ }
2
1 ( 40−36,8 )
s2Y^ =1,684 + =0,1087
30 328,2
{ }
2
2 1 ( 40−36,8 )
sY^ =1,684 1+ + =1,7927
30 328,2
Korelasi
n ∑ X i Y i−( ∑ X i )( ∑ Y i)
r=
√ {n ∑ X −( ∑ X ) }{n ∑ Y −(∑ Y ) }
2
i i
2 2
i i
2
√
r = 1−
s 2y .x
s2y
Jika persamaan regresi linier Y atas X telah ditentukan dan sudah didapat koefisien arah,b, maka
koefisien determinasi, r 2 , dapat ditentukan oleh rumus:
2
b { n ∑ X i Y i−( ∑ X i )( ∑ Y i ) }
r=
n ∑ Y i −( ∑ Y i )
2 2
STATISTIKA DAN PROBABILITAS
atau dapat juga menggunakan formula:
b sx
r=
sy
dengan s x simpangan baku untuk variabel X dan s y simpangan baku untuk variabel Y.
Jika b 1 adalah koefisien arah regresi Y atas X dan b 2 adalah koefisien arah regresi X atas Y untuk data
yang sama, maka
2
r =b1 b2
Rumus ini menyatakan bahwa koefisien korelasi r adalah rata-rata ukur daripada koefisien-koefisien
arah b 1 dan b 2.
Contoh:
2 2
Untuk dengan data dalam daftar 2.1, untuk menentukan korelasi diperlu X =36,8; s x =11,32; s y =6,86
dan∑ ( X i− X ) =328,2, diperoleh b = 0,68 dan n = 30 didapat
2
r =0.68
√ 11.32
6.86
=0.87
Banyak data pengamatan yang terjadi sebagai akibat lebih dari dua variabel. Misalnya, rata-rata
pertambahan berat daging sapi (Y) bergantung pada berat permulaan ( X 1) , umur sapi ketika
pengamatan dimulai dilakukan ( X 2) , berat makanan yang diberikan setiap hari ( X 3 ) dan mungkin masih
ada faktor lain.
Y^ =a0 +a 1 X 1 +a 2 X 2+ …++a k X k
∑ Y i=a0 n+ a1 ∑ X 1i+ a2 ∑ X 2i
∑ Y i X 1i=a0 ∑ X 1i +a1 ∑ X 21i +a 2 ∑ X 1i X 2i
∑ Y i X 2i=a0 ∑ X 2i +a1 ∑ X 1i X 2i +a2 ∑ X 22i
persamaan (*)
Koefisien a 1 merupakan perubahan rata-rata Y unutuk setiap perubahan satuan dalam variabel X 1
apabila X 2 , X 3 , … , X k semua dianggap tetap, begitu juga a 2 merupakan perubahan rata-rata Y unutuk
setiap perubahan satuan dalam variabel X 2 apabila X 1 , X 3 , … , X k semua dianggap tetap dan begitu
seterusnya. Jelas bahwa di sini setiap koefisien hanya memberikan gambaran parsial apa yang terjadi
pada Y untuk perubahan X yang berhubungan dengan koefisien dimaksud. Karenanya, koefisien-
koevisien a 1 , a2 , … , ak disebut pula koefisien regresi parsil.
Untuk regresi linier ganda variabel, maka ukuran kekelirua yang digunakan adalah:
∑ ( Y i−Y^i )
2
2
sy .1,2 ,… ,k =
n−k −1
^ = nilai harapan yang didapat dari persamaan regresi.
dimana Y i = nilai data hasil pengamatan dan Y i
Rumus:
2 JKG
R y .12=1−
( n−1 ) s 2y
Keterangan:
Dimana:
2
n ∑ y −( ∑ y )
2
2
s=y
n ( n−1 )
(sumber: thomasyunigunarto)
Berikut adalah data Volume Penjualan (juta unit) Mobil dihubungkan dengan variable biaya promosi ( X 1
dalam juta rupiah/tahun) dan variable biaya penambahan asesoris ( X 2 dalam ratusan ribu rupiah/unit)
x1 x2 y x1 x2 x1 y x2 y x 21 x 22 y2
2 3 4 6 8 12 4 9 16
3 4 5 12 15 20 9 16 25
5 6 8 30 40 48 25 36 64
6 8 10 48 60 80 36 64 100
7 9 11 63 77 99 49 81 121
8 10 12 80 96 120 64 100 144
∑ x 1=31 ∑ x 2=40 ∑ y=50 ∑ x 1 x2=239
∑ x 1 y=296
∑ x 2 y=379
∑ x 21=187∑ x 22=306∑ y2 =470
Tetapkan persamaan regresi linier berganda: a 0+ a1 X 1+ a2 X 2
Sehingga diperoleh:
3 1 3
a 0 = , a 1= , a 3 =
4 2 4
3 1 3
Y^ = + X 1 + X 2
4 2 4
2 0.25
R y .12=1− =0.99
5 ( 10.667 )
^ =a+bX + c X 2
1. Parabola kuadratik: Y
Dengan menggunakan metode kuadrat terkecil, maka a, b, dan c dapat dihitung dari sistem
persamaan:
∑ Y i=na+b ∑ X i+ c ∑ X 2i
∑ X i Y i =a ∑ X i +b ∑ X 2i + c ∑ X 3i
∑ X 2i Y i =a ∑ X 2i +b ∑ X 3i + c ∑ X 4i
^ =a+bX + c X 2 +d X 3
2. Parabolik kubik: Y
Untuk menentukan nilai a, b, c, dan d gunakan sistem persamaan berikut:
∑ Y i=na+b ∑ X i+ c ∑ X 2i + d ∑ X 3i
∑ X i Y i =a ∑ X i +b ∑ X 2i + c ∑ X 3i +d ∑ X 4i
∑ X 2i Y i =a ∑ X 2i +b ∑ X 3i + c ∑ X 4i + d ∑ X 5i
∑ X 3i Y i =a ∑ X 3i +b ∑ X 4i + c ∑ X 5i + d ∑ X 6i
STATISTIKA DAN PROBABILITAS
3. Eksponen : Y ^ =a bX
log a=
n (
∑ log Y i −( log b ) ∑ X i
n )
n ( ∑ X i log Y i ) −( ∑ X i )( ∑ log Y i )
log b= 2
n ∑ X i −( ∑ X i)
2
4. Geometrik: Y ^ =a X b
Besar nilai a dan b ditentukan menggunakan persamaan:
log a=
∑ log Y i −b ∑ log X i
n n
n ( ∑ log X i log Y i ) −( ∑ log X i )( ∑ log Y i )
b= 2
n ∑ log X i−( ∑ log X i )
2
^= 1
5. Logistik: Y X
a b +c
∑ log ( ) −( log b ) ∑ X
1
log a=
n
Yi
( ) n
i
log b=
n
( ∑ X i log ( ))
1
Yi
−( ∑ X i )
( ∑ log ( ))1
Yi
n ∑ X i −( ∑ X i)
2 2
^= 1
6. Hiperbola: Y
a+ bX
^ tidak ada yang bernilai nol, maka a dan b adalah
Jika Y
a=
( ∑ Y ) ( ∑ X ) −( ∑ X ) ( ∑ X Y )
1
i
2
i
1
i i
i
2
n ∑ X 2i −( ∑ X i )