LINIER BERGANDA
SKRIPSI
SKRIPSI
Diajukan untuk melengkapi tugas dan memenuhi syarat mencapai gelar Sarjana Sains
Diluluskan di
Medan, Juli 2011
Komisi Pembimbing :
Pembimbing 2, Pembimbing 1,
Diketahui/Disetujui oleh
Departemen Matematika FMIPA USU
Ketua,
SKRIPSI
Saya mengakui bahwa skripsi ini adalah hasil kerja saya sendiri, kecuali beberapa
kutipan dan ringkasan yang masing-masing disebutkan sumbernya.
Diawali dengan mengucapkan Puji Syukur Kehadirat Allah SWT, yang selama ini
telah memberikan Penulis kekuatan dan semangat sehingga penyusunan Skripsi ini
dapat diselesaikan dengan baik dan tepat waktu.
Adapun tujuan dari penulisan Skripsi ini adalah merupakan salah satu syarat
untuk menyelesaikan Program S1 Statistika Ekstensi pada Fakultas Matematika dan
Ilmu Pengetahuan Alam Universitas Sumatera Utara.
Semoga Penulisan Skripsi ini dapat memberikan manfaat dan berguna bagi
pembaca dan penulis pada khususnya. Akhir kata penulis mengucapkan banyak terima
kasih.
Penulis
Y = β 0 + β1 X i .... + β k X k + ε
Yang menunjukkan bahwa hubungan antara lebih dari satu variabel X sebagai
variabel bebas dengan Y sebagai variabel terikat.
Y = β 0 + β1 X i .... + β k X k + ε
Which indicates that the relationship between more than one variable X as the
independent variables with Y as the dependent variable.
Halaman
Persetujuan i
Pernyataan ii
Penghargaan iii
Abstrak v
Abstract vi
Daftar Isi vii
Daftar Tabel viii
BAB 1 PENDAHULUAN 1
1.1 Pendahuluan 1
1.2 Perumusan Masalah 3
1.3 Tujuan Penelitian 3
1.4 Kontribusi Penelitian 3
1.5 Tinjauan Pustaka 3
1.6 Metode Penelitian 5
BAB 3 PEMBAHASAN 17
3.1 Estimasi Parameter Menggunakan Maksimum Likelihood 17
3.2 Estimasi Interval Untuk Parameter Regresi Linier Berganda 20
3.3 Pengujian Hipotesis 25
Daftar Pustaka ix
Y = β 0 + β1 X i .... + β k X k + ε
Yang menunjukkan bahwa hubungan antara lebih dari satu variabel X sebagai
variabel bebas dengan Y sebagai variabel terikat.
Y = β 0 + β1 X i .... + β k X k + ε
Which indicates that the relationship between more than one variable X as the
independent variables with Y as the dependent variable.
PENDAHULUAN
Metode analisis yang telah dibicarakan hingga sekarang adalah analisis terhadap data
mengenai sebuah karakteristik atau atribut (jika data itu kualitatig) dan mengenai
sebuah karakteristik (jika data itu kuantitatif). Tetepi, sebagaimana disadari banyak
persoalan atau fenomena yang meliputi lebih dari sebuah variabel. Misalnya, berta
orang dewasa laki-laki sampai taraf tertentu bergantung pada tingginya, tekanan
semacam gas bergantung pada temperatur, hasil produksi padi tergantung pada jumlah
pupuk yang digunakan, banyak curah hujan, cuaca dan sebagainya.
Maka dalam hal ini dirasa perlu untuk mempelajari analisis data yang terdiri
atas banyak variabel. Jika kita mempunyai data yang terdiri atas dua variabel atau
lebih variabel, adalah sewajarnya untuk mempelajari cara bagaimana variabel-variabel
itu berhubungan. Hubungan yang didapat pada umumnya dinyatakan dalam bentuk
persamaan matematik yang menyatakan hubungan fungsional antara variabel-variabel.
Analisa yang menyangkut masalah ini dikenal dengan analisis regresi.
Analsis regresi dibedakan atas dua jenis variabel yaitu variabel bebas dan
variabel terikat. Penetuan variabel bebas dan terikat dalam beberapa hal tidak mudah
dilaksanakan. Analisis yang cermat, analisa yang seksama, berbagai pertimbanagn,
kewajaran masalah yang dihadapi dan pengalaman akan memudahakan penentuan.
Variabel yang mudah didapat atau tersedia sering dapat digolongkan kedalam variabel
bebas, sedangkan variabel yang terjadi karena variabel bebas itu merupakan varabel
Regresi linier merupakan suatu metode analisis statistik yang mempelajari pola
hubungan anatara dua atau lebih variabel. Pada kenyataan sahari-hari sering dijumpai
sebuah kejadian dipengaruhi oleh lebih dari satu variabel, oleh karenanya
dikembangkan analisis regresi linier berganda. Regresi linier berganda adalah
perluasan dari regresi sederhana yang mempunyai lebih dari satu variabel bebas X.
Regresi linier berganda digunakan untuk memodelkan hubungan antara variabel
terikat dan variabel bebas. Untuk mendapatkan estimasi β 0 , β1 , , β k digunakan
metode maksimum likelihood, dimana metode ini secara prinsip dapat
meminimumkan jumlah kuadrat kesalahan.
Salah satu cara untuk mendapatkan penaksir yang baik adalah dengan
menggunakan metode maksimum likelihood, yang telah diperkenalkan oleh seorang
ahli genetika dan statistik Sir R. A. Fisher antara tahun1912 sampai 1922 dan
memiliki aplikasi yang luas diberbagai bidang. Cara memaksimumkan likelihood
berkaiatan dengan metode estimasi dalan statistik. Estimasi maksimum likelihood
berguna untuk menentukan parameter yang memaksimalkan kemungkinan dari data
sampel. Dari sudut pandang statistik, metode maksimum likelihood ini dianggap lebih
kuat pada hasil estimator dengan sifat statistik. Selain itu, metode ini juga lebih efisin
untuk ketidakpastian pengukuran melalui batas keyakinan. Meskipun metodologi
untuk estimasi maksimum likelihood termasuk sederhana namun pelaksanaan
matematiknya sangat kuat. Parameter yang diperoleh dari fungsi estimasi maksimum
likelihood merupakan nilai yang sebenarnya. Jelas bahwa ukuran sampel menentukan
Masalah dalam penelitian ini adalah bagaimana menetukan model koefisien regresi
linier berganda dengan menggunakan maksimum likelihood.
Tujuan dari penelitian ini adalah untuk menguraikan cara mengestimasi parameter
regresi linier berganda dengan meminimumkan error menggunakan maksimum
likelihood.
Y = β 0 + β1 X 1 + + β k X k + ε
Keterngan:
Y = variabel terikat
X 1 , X 2 , X k = variabel bebas
Yi = β 0 + β1 x1i + + β k x ki + ε
Keterangan:
Yi = variabel terikat ke-i
Secara umum, bila ada sampel berukuran n dan kemungkinan sampel yang diamati,
dan nilai fungsi kemungkinan untuk β 0 , β1 , , β k : p(Y1 , Y2 , , Yk / β 0 , β1 , , β k ) .
Untuk nilai Y bebas dengan mengalikan semua kemungkinan bersama, dimana:
σ σ
e
e
σ 2π σ 2π
σ
e
n
σ π
i =1
2
∏
n
Dengan menyatakan hasil kali kemungkinan bersama untuk nilai Yi yang
i =1
σ 2π
i =1
∑
L(β 0 , β1 , β k ) =
Yi − β 0 − β1 x1i −− β k xki
(σ )
−1
n 2
1 2
i =1
σ
2π
n
e
LANDASAN TEORI
Perubahan nilai suatu variabel tidak selalu tejadi dengan sendirinya, namun perubahan
nilai variabel itu dapat pula disebabkan oleh berubahnya variabel lain yang
berhubungan dengan variabel tersebut. Untuk mengetahui pola nilai suatu variabel
yang disebabkan oleh variabel lain diperlukan alat analisis yang memungkinkan untuk
membuat perkiraan nilai variabel tersebut pada nilai tertentu variabel yang
mempengaruhinya.
Teknik yang umum digunakan untuk menganalisis hubungan antara dua atau
lebih variabel dalam ilmu statistik adalah analisis regresi. Analisis regresi adalah
teknik statistik yang berguna untuk memeriksa dan memodelkan hubungan diantara
variabel-variabel. Analisis regresi berguna dalam menelaah hubungan dua variabel
atau lebih dan terutama untuk menelusuri pola hubungan yang modelnya belum
diketahui dengan sempurna, sehingga dalam penerapannya lebih bersifat eksploratif.
Regresi linier sederhana adalah analisis regresi yang melibatkan hubungan fungsional
antara satu variabel terikat dengan satu variabel bebas. Variabel terikat merupakan
variabel yang nilainya selalu bergantung dengan nilai variabel lain. Dalam hal ini
variabel terikat yang nilainya selalu dipengaruhi oleh variabel bebas, sedangkan
variabel bebas adalah variabel yang nilainya tidak bergantung pada nilai variabel lain.
Dan biasanya variabel terikat dinotasikan dengan X. Hubungan-hubungan tersebut
dinyatakan dalam model matematis yang memberikan persamaan-persamaan tertentu.
Yi = a + bX i (2.1)
Keterangan:
Model sebenarnya : Y = A + BX + ε
Model perkiraan : Y = a + bX +e
Yi = a + bxi + ei
ei = Yi − (a + bxi )
∂ ∑ ei2
∑ (Yi − a − bxi ) 2 = ∑ Yi − na − b∑ xi = 0 → ∑ xi = 0
∂
=
∂a ∂a
⇒ aˆ =
∑Y i
=Y (2.3)
n
⇒ bˆ =
∑xY
∑x
i i
2
(2.4)
i
Nilai â dan b̂ yang diperoleh dan cara ini disebut taksiran kuadrat terkecil
masing-masing dari a dan b. Dengan demikian, taksiran persamaan regresi dapat
ditulis sebagai, Yˆ = aˆ + bˆX yang disebut persamaan prediksi.
Hubungan linier lebih dari dua variabel yang bila dinyatakan dalam bentuk
persamaan matematis adalah:
Y = β 0 + β1 X 1 + + β k X k + ε (2.5)
Keterangan:
Y = variabel terikat
β1 ∑ x1 y + β 2 ∑ x 2 y + + β k ∑ x k y
R y2(1, 2,...,k ) =
∑y 2
(2.6)
R y2(1, 2,...,k ) (n − k − 1)
Freg =
k (1 − R y2(1, 2,...,k )
(2.7)
7. Membuat Kesimpulan
2.2 Estimasi
Estimasi adalah menaksir ciri-ciri tertentu dari populasi tertentu dari populasi atau
memperkirakan nilai populasi (parameter) dengan memakai nilai sampel (statistik).
Dengan statistika kita berusaha meyimpulkan populasi. Dalam kenyataannya,
mengingat berbagai faktor untuk keperluan tersebut diambil sebuah sampel yang
represntatif dan berdasarkan hasil analisis terhadap data sampel kesimpulan mengenai
populasi dibuat. Cara pengambilan kesimpulan tentang parameter berhubugan dengan
cara-cara menaksir harga parameter. Jadi, harga parameter sebenarnya yang tidak
diketahui akan diestimasi berdasarkan statistik sampel yang diambil dari populasi
yang bersangkutan.
Sifat atau ciri estimator yang baik yaitu tidak bias, efisien dan konsisten:
1. Estimator yang tidak bias
Estimator dikatakan tidak bias apabila dapat menghasilkan estimasi yang
mengandung nilai parameter yang diestimasikan. Misalkan, estimtor ϑ̂
dikatakan estimator yang tidak bias jika rata-rata semua harga ϑ̂ yang
mungkin akan sama dengan ϑ . Dalam ekspektasinya dapat ditulis dengan
E (θˆ) = θ .
konsisten.
Estimasi nilai parameter memiliki dua cara, yaitu estimasi titik (point
estimation) dan estimasi selang (Interval estimation).
Salah satu cara untuk mendapatkan estimator yang baik adalah dengan menggunakan
metode maksimum likelihood yang diperkenalkan oleh R. A. Fisher. Maksimum
Likelihood merupakan suatu cara mendapat estimator a untuk parameter b yang tidak
diketahui dari populasi dengan memaksimumkan fungsi kemungkinan.
p( X = xi ) = pi (α ), i = 1,..., r
Unuk data sampel distribusi yang diskrit dengan nilai kemungkinan
dan frekuensi f1 ,...., f k ditentukan dengan fungsi
Likelihood sebagai berikut:
L( x1 , , x n ; α ) = ( pi (α )) 1 ( p r (α )) r , ∑f =n
n
f f
i =1
i
( )
Jika X dikurangi dengan rata-atanya, maka maka akan diperoleh variabel baru
x xi = X i − X dan selisih antara X i dan X merupakan perhitungan yang sederhana
karena jumlah dari nilai xi tersebut adalah sama dengan nol ∑ xi = 0 . Dan
n
i =1
persamaan regresi linier berganda menjadi:
Yi = β 0 + β1 X 1 + ... + β k X k + ε (2.7)
Keterangan:
x1i ,..., x ki = selisih antara variabel bebas X dengan nilai rata-ratanya pada
pengamatan ke-i
β 0, β1 ,..., β k = parameter regresi
ε = nilai kesalahan(error)
likelihood dipilih hipotesis populasi yang maksimum dalam likelihood. Secara umum,
andaikan kita mempunyai sampel berukuran n dan kita ingin mengetahui
kemungkinan sampel yang diamati. Diperlihatkan fungsi nilai kemungkinan sampel
untuk β 0, β1 ,..., β k :
p(Yi ) =
−1 1
2
1 2 σ
σ 2π
e (2.9)
p(Yi ) =
1 x − µ
−
1 2 σ
σ 2π
e . Kemungkinan nilai kedua Y sama dengan (2.9), kecuali
angka satu diganti dengan dua dan deterusnya untuk semua nilai Y amatan lainnya.
2 σ 2 σ
σ 2π σ 2π
e e
2 σ
n
i =1 σ 2π
e (2.10)
∏
n
Dengan menyatakan hasil kali n kemungkinan bersama untuk nilai Yi
i =1
yang penggunaannya dik enal untuk eksponensial. Hasil (2.10) dapat diperlihatkan
dengan penjumlahan ekspnen:
e
n
n
σ 2π
i =1
(2.11)
∑
L(β 0 , β1 ,..., β k ) =
Yi − β 0 − β1 x1i −...− β k xki
(σ )
−1
n 2
1 2
i =1
σ
2π
n
e (2.12)
σ
n
2 2 i =1
∑ (Y − β 0 − β1 x1i − ... − β k x ki ) = 0
∂Λ
= 2
n
∂β 0 σ
1
i =1
i
i =1 i =1 i =1 i =1 i =1
∑Y
n
⇒ β̂ 0 = i =1
=Y (2.14)
n
∂β1 σ
1
i =1
i =1 i =1 i =1 i =1 i =1
i =1 i =1 i =1
(2.15)
∑ − x (Y − β 0 − β1 x1i − ... − β k x ki ) = 0
∂Λ
= 2
n
∂β 2 σ
1
i =1
ki i
i =1 i =1 i =1 i =1 i =1
i =1 i =1 i =1
PEMBAHASAN
σ σ
e
e
σ 2π σ 2π
σ
e
n
i =1 σ 2π
∏
n
Dengan menyatakan hasil kali kemungkinan bersama untuk nilai Yi yang
i =1
σ 2π
i =1
(3.1)
∑
L(β 0 , β1 , β k ) =
Yi − β 0 − β1 x1i −− β k xki
(σ )
−1
n 2
1 2
i =1
σ
2π
n
e (3.2)
Λ = ln L(β 0 , β1 , β k ) = − ln(2 x) − n ln σ − ∑ i
1 n Y − β 0 − β1 x1i − − β k x ki
(3.3)
2
σ
n
2 2 i =1
Setelah diperoleh nilai Λ maka perhitungan differensialnya untuk β 0 , β1 , , β k dan
∑ (Y − β 0 − β1 x1i − β 2 x 2i ) = 0
∂Λ
= 2
n
∂β 0 σ
1
i =1
i
= ∑ Yi − nβ 0 − β1 ∑ x1i − β 2 ∑ x 2i = 0 → ∑ x1i = ∑ x 2i = 0
n n n n n
i =1 i =1 i =1 i =1 i =1
∑Y
n
⇒ β̂ 0 = i =1
=Y (3.4)
n
∑ − x (Y − β 0 − β1 x1i − β 2 x 2i ) = 0
∂Λ
= 2
n
∂β1 σ
1
i =1
1i i
i =1 i =1 i =1 i =1 i =1
∑ − x (Y − β 0 − β1 x1i − β 2 x 2i ) = 0
∂Λ
= 2
n
∂β 2 σ
1
i =1
2i i
= −∑ x 2i Yi + β 0 ∑ x 2i + β1 ∑ x1i x 2i + β 2 ∑ x 22i = 0 → ∑ x 2i = 0
n n n n n
i =1 i =1 i =1 i =1 i =1
⇒ −∑ x 2i Yi + β1 ∑ x1i x 2i + β 2 ∑ x 22i = 0
n n n
(3.6)
i =1 i =1 i =1
∑Y
n
∂Λ
⇒ β̂ 0 = i =1 = Y =65,25
∂β 0 n
∂β1 i =1 i =1 i =1
= − ∑ x 2i Yi + β1 ∑ x1i x 2i + β 2 ∑ x 22i
∂Λ n n n
∂β 2 i =1 i =1 i =1
Dengan menggunakan persamaan (3.7) dan (3.8) diperoleh nilai β1 = 1,857 dan
β 2 =-1,571.
Maka persamaan regresi linier bergandanya menjadi:
Ini berarti bahwa besarnya nilai Yˆ akan dipengaruhi oleh nilai parameter
βˆ0 = −20,74 , β̂1 = 1,875 dan β̂ 2 = -1,571 . Dari regresi ini, dapat menaksir
pengeluaran untuk membeli barang D jika keluarga yang terdiri atas lima orang
berpenghasilan Rp. 30.000. ini berarti X 1 = 30 dan X 2 = 8, setelah disubsitusikan ke
dalam persamaan maka hasilnya adalah:
Yˆ = − 20,74 + 1,875(30) − 1,571(8) = 22,94.
Maka, diperkirakan pengeluaran membeli barang D sebesar Rp. 2.294 untuk 8 orang
dalam satu keluarga dengan penghasilan Rp. 30.000 .
∑e
adalah:
Var ( β ) = s β ⇒ s =
2
n − k −1
2 2 i
e (3.9)
Keterangan:
s e2 = varians dari kesalahan pengganggu
n = banyak observasi
k = banyak variabel bebas
(Y − Yˆ )
Tabel 3.2 Penentuan nilai e 2
e = Yi − Yˆi
2
X1 X2 Y Yˆi i i
51 7 62 62.97 -0.97 0.9409
44 6 52 51.542 0.458 0.209764
52 8 68 63.256 4.744 22.50554
57 8 72 72.541 -0.541 0.292681
62 12 78 75.542 2.458 6.041764
48 7 58 57.399 0.601 0.361201
53 9 58 63.542 -5.542 30.71376
∑ = 62.64315
61 11 74 75.256 -1.256 1.577536
428 68 522
X1X 2 X 12 X 22 X 1Y X 2Y Y2
357 2601 49 3162 434 3844
264 1936 36 2288 312 2704
416 2704 64 3536 544 4624
456 3249 64 4104 576 5184
744 3844 144 4836 936 6084
336 2304 49 2784 406 3364
477 2809 81 3074 522 3364
∑ = 3721
671 3721 121 4514 814 5476
23168 608 28298 4544 34644
n − k −1
2 i
s =
e
62,64315
9 − 2 −1
=
= 12,528
sebagai berikut:
n∑ X 1i Yi − (∑ X 1i )(∑ Yi )
{n∑ X }{ }
ryx1 =
− (∑ X 1i ) 2 n∑ Yi − (∑ Yi ) 2
(3.10)
2 2
1i
2968
= = 0,93
3175,36
n∑ X 2i Yi − (∑ X 2i )(∑ Yi )
{n∑ X }{ }
ryx 2 =
− (∑ X 2i ) 2 n∑ Yi − (∑ Yi ) 2
(3.11)
2 2
2i
856
= = 0,81
1058,45
n∑ X 1i X 2i − (∑ X 1i )(∑ X 2 i )
{n∑ X }{ }
rx1x 2 =
− (∑ X 1i ) 2 n∑ X 2i − (∑ X 2i ) 2
(3.12)
2 2
1i
664
= = 0,92
720
- 1,000 ≤ r ≥ -0,800
Interval nilai r Arti hubungan
Korelasi kuat
- 0,790 ≤ r ≥ -0,500 Korelasi sedang
- 0,490 ≤ r ≥ 0,490 Korelasi lemah
0,500 ≤ r ≥ 0,790 Korelasi sedang
0,800 ≤ r ≥ 1,000 Korelasi kuat
8 428 68
X X = 428 23168 3721
T
Det X T X = 9688
522
X Y = 28298
T
4544
− 20,74
β̂ = ( X X ) T −1
X Y = 1,866
T
− 1,57
dimana d ii adalah matriks dari baris ke i dan kolom i terletak pada diagonal pokok,
maka:
Sehingga,
⇒ s β2 2 = 310,699 = 17,626
signifikan α = 0,05 .
1. β 0 = − 20,74 , s β 0 = 106,51
β 0 − t 0,025 s β ≤ β 0 ≤ β 0 + t 0,025 s β
− 25,07 ≤ β 0 ≤ −16,407
Ini berarti bahwa interval antara -25,07 dan -16,407 akan memuat β 0 .
2. β1 = 1,866 , s β = 0,557
β1 − t 0,025 s β ≤ β1 ≤ β1 + t 0,025 s β
1
0,433 ≤ β 1 ≤ 3,298
Ini berarti bahwa Interval antara 0,433 dan 3,298 akan memuat β1 .
3. β 2 = -1,57 , s β = 17,626
β 2 − t 0,025 s β ≤ β 2 ≤ β 2 + t 0,025 s β
2
− 46,886 ≤ β 2 ≤ 43,746
Ini berarti bahwa Interval antara -46,886 dan 43,476 akan memuat β 2 .
Hipotesis berasal dari kata hipo dan tesis yang berasal dari bahasa Yunani. Hipo
berarti dibawah, kurang atau lemah dan tesis proporsi. Jadi, secara umum hipotesis
dapat didefinisikan sebagai asumsi atau dugaan / pernyataan sementara yang masih
lemah kebenarannya. Pengujian Hipotesis dilakukan berdasarkan hasil penelitian pada
sampel yang diambil dari populasi tersebut. Berikut ini adalah hipotesis yang
diperoleh pada persoalan diatas:
1) Hipotesis
Ha : terdapat hubungan fungsional yang signifikan antara pendapatan dan
jumlah orang dalam satu keluarga dengan pengeluaran membeli
barang D.
H0 : tidak terdapat hubungan fungsional yang signifikan antara pendapatan
dan jumlah orang dalam satu keluarga dengan pengeluaran membeli
barang D.
β 1 ∑ x1 y + β 2 ∑ x 2 y
2) Rhit dapat diperoleh dengan:
R y2(1, 2 ) =
∑y 2
520,85
=
583,5
= 0,893
4,463
=
0,215
= 20,77
7) Kesimpulan
Karena H0 ditolak maka Ha diterima yang berarti bahwa terdapat hubungan
fungsional yang signifikan antara pendapatan dan jumlah orang dalam satu
keluarga dengan pengeluaran / minggu.
4.1 Kesimpulan
1. Maksimum likelihood merupakan salah satu metode estimasi yang tepat dalam
menentukan model koefisien regresi linier berganda.
2. Dalam perhitungan regresi linier berganda maksimum likelihood juga dapat
berperan didalamnya, dan model matematis ini juga dapat berperan
didalamnya, dan model matematis ini juga bisa diandalkan dalam melakukan
estimasi.
3. Pemodelan matematis sangat diperlukan dalam menyelesaikan suatu
permasalahan yang variabel-variabel belum diketahui apakah saling
berhubungan atau tidak, maka penggunaan regresi linier berganda adalah
penyelesaian yang tepat.
4.2 Saran