MAKALAH
TUGAS PENGAPLIKASIAN ANALISIS REGRESI
DISUSUN OLEH
Armen Muhijiri
140610120046
Oxa Sabrang Rakata
140610120090
Rama Indra Ramadhan
140610120114
Fikri Jalalluddin
140610120122
DEPARTEMEN STATISTIKA
FAKULTAS MATEMATIKA
DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS PADJADJARAN
JATINANGOR
2014
KATA PENGANTAR
Puji syukur penulis panjatkan kehadirat Tuhan Yang Maha Esa karena atas rahmat dan
nikmat yang telah dilimpahkan kepada penulis, sehingga penulis dapat menyelesaikan
makalah yang berjudul Tugas Pengaplikasian Analisis Regresi.
Terselesainya makalah
ini tidak lepas dari dukungan beberapa pihak yang telah
memberikan kepada penulis berupa motivasi, baik materi maupun moril. Oleh karena itu,
penulis bermaksud mengucapkan banyak terima kasih kepada seluruh pihak yang tak dapat
saya sebutkan satu persatu, semua yang telah membantu terselesaikannya makalah ini.
Penulis menyadari bahwa penyusunan makalah ini belum mencapai kesempurnaan,
sehingga kritik dan saran yang bersifat membangun sangat penulis harapkan dari berbagai
pihak demi kesempurnaan makalah ini. Akhirnya penulis berharap semoga makalah ini dapat
bermanfaat bagi kita semua.
Penulis
BAB 1
PENDAHULUAN
1.1 Latar Belakang
Analisis regresi merupakan alat statistik yang banyak digunakan dalam berbagai bidang.
Analisis tersebut bertujuan untuk mengetahui hubungan antara variabel dependen dan variabel
independen. Ada tiga macam tipe dari analisis regresi. Tipe yang pertama adalah regresi linier
sederhana yang berfungsi untuk mengetahui hubungan linier antara dua variabel, satu variabel
dependen dan satu variabel independen. Tipe kedua adalah regresi linier berganda yang
merupakan model regresi linier dengan satu variabel dependen dan lebih dari satu variabel
independen. Tipe ketiga adalah regresi non linier yang berasumsi bahwa hubungan antara variabel
dependen dan variabel independen tidak linier pada parameter regresinya (Yan and Gang Su,
2009).
Dalam regresi linier sederhana, metode yang biasa digunakan dalam mengestimasi parameter
regresi adalah metode kuadrat terkecil atau Ordinary Least Squares (OLS). Konsep metode ini
adalah untuk mengestimasi parameter dengan memilih garis regresi yang terdekat dengan garis
dari semua data. Secara matematika penentuan parameter regresi ini dengan cara meminimumkan
jumlah kuadrat dari residualnya (Walpole dan Myers, 1986).
Sebelum
menarik
sampel
dari
suatu
populasi
terkadang
diperoleh
informasi
mengenaiparameter yang akan diestimasi. Jika informasi tersebut ingin dimasukkan dalam
analisis data, maka estimasi parameter regresi dengan metode kuadrat terkecil tidak
memungkinkan untuk memasukkan informasi tersebut. Oleh karena itu, diperlukan metode
bayesian untuk menyelesaikan permasalahan tersebut.
Bayes memperkenalkan suatu metode yang diperlukan untuk mengetahui bentuk distribusi
awal (prior) dari populasi yang dikenal dengan metode bayesian. Informasi ini kemudian
digabungkan dengan informasi dari sampel untuk digunakan dalam mengestimasi parameter
populasi. Pada metode bayesian, seorang peneliti harus menentukan distribusi prior dari
parameter yang ditaksir. Distribusi prior ini dapat berasal dari data penelitian sebelumnya atau
berdasarkanintuisi seorang peneliti. Dugaan penentuan distribusi parameter sangatlah subyektif
(Hogg and Craig, 1978). Semakin berpengalaman seseorang, maka semakin mudah dalam
menentukan distribusi priornya. Sudah tentu penentuan distribusi prior ini harus berdasarkan alur
berpikir yang logis. Setelah informasi dari data yang didapat dari pengambilan sampel
digabungkan dengan informasi prior dari parameter, akan didapat distribusi posterior dari
parameter. Rataan dari distribusi posterior ini yang akan menjadi parameter regresi dengan
metode bayesian (Bolstad, 2007).
Dalam penelitian ini, kami menggunakan data yang terdapat di dalam buku
: S Weisberg,
Applied Linear Regression, Wiley, 1980, page 70. Dalam buku ini terdapat data mengenai
data ekonomi dan tingkat pengangguran yang tercatat di suatu perusahaan. Faktor-faktor yang
mempengaruhi nya adalah persentasedeflasiharga, Produk Nasional Bruto (Gross National
Product), jumlah pengangguran dalam ribuan, jumlah orang yang dipekerjakan, dan jumlah
pekerja di atas 14 tahun. Karena itu, kita berusaha meneliti faktor-faktor apa saja yang paling
mempengaruhi terhadap data ekonomi dan tingkat pengangguran di perusahaan tersebut.
1.2 RUMUSAN MASALAH
Adapun rumusan masalah dalam makalah ini adalah :
1. Mentukan persamaan regresi linier berganda
2. Menguji secara parsial masing-masing variabel dengan Uji T
3. Mengetahui pengaruh variabel bebas secara bersama-sama (simultan) terhadap variabel tak
bebas dengan menggunakan Uji F
4. Cek asumsi-asumsi yang ada
5. Mentukan pemilihan model terbaik regresi
1.3 TUJUAN PENULISAN
Adapun tujuan penulisan makalah ini yaitu :
1. Mengaplikasikan hal yang telah di pelajari hingga kini dalam suatu penelitian
2. Mengetahui pemilihan model terbaik regresi
BAB II
LANDASAN TEORI
2.1 UJI ASUMSI KLASIK
Uji asumsi klasik adalah persyaratan statistik yang harus dipenuhi pada
analisis regresi linear berganda yang berbasis ordinary least square (OLS). Jadi analisis
regresi yang tidak berdasarkan OLS tidak memerlukan persyaratan asumsi klasik,
misalnya regresi logistikatau regresi ordinal. Demikian juga tidak semua uji asumsi
klasik harus dilakukan pada analisis regresi linear, misalnya uji multikolinearitas tidak
dilakukan pada analisis regresi linear sederhana dan uji autokorelasi tidak perlu
diterapkan pada data cross sectional.
Uji Normalitas
Uji normalitas adalah untuk melihat apakah nilai residual terdistribusi normal
atau tidak. Model regresi yang baik adalah memiliki nilai residual yang terdistribusi
normal. Jadi uji normalitas bukan dilakukan pada masing-masing variabel tetapi pada
nilai residualnya. Sering terjadi kesalahan yang jamak yaitu bahwa uji normalitas
dilakukan pada masing-masing variabel. Hal ini tidak dilarang tetapi model regresi
memerlukan normalitas pada nilai residualnya bukan pada masing-masing variabel
penelitian.
Uji Multikolinearitas
Uji multikolinearitas adalah untuk melihat ada atau tidaknya korelasi yang
tinggi antara variabel-variabel bebas dalam suatu model regresi linear berganda. Jika
ada korelasi yang tinggi di antara variabel-variabel bebasnya, maka hubungan antara
variabel bebas terhadap variabel terikatnya menjadi terganggu. Sebagai ilustrasi,
adalah model regresi dengan variabel bebasnya motivasi, kepemimpinan dan
kepuasan kerja dengan variabel terikatnya adalah kinerja. Logika sederhananya adalah
bahwa model tersebut untuk mencari pengaruh antara motivasi, kepemimpinan dan
kepuasan kerja terhadap kinerja. Jadi tidak boleh ada korelasi yang tinggi antara
motivasi dengan kepemimpinan, motivasi dengan kepuasan kerja atau antara
kepemimpinan dengan kepuasan kerja.
Uji Heteroskedastisitas
Uji
heteroskedastisitas adalah
untuk
melihat
apakah
terdapat
ketidaksamaan varians dari residual satu kepengamatan kepengamatan yang lain.
Model regresi yang memenuhi persyaratan adalah di mana terdapat kesamaan varians
dari residual satu pengamatan kepengamatan yang lain tetap atau disebut
homoskedastisitas.
Uji Autokorelasi
Ujia utokorelasi adalah untuk melihat apakah terjadi korelasi antara suatu
periode t dengan periods ebelumnya (t -1). Secara sederhana adalah bahwa analisis
regresi adalah untuk melihat pengaruh antara variabel bebas terhadap variabel terikat,
jadi tidak boleh ada korelasi antara observasi dengan data observasi sebelumnya.
Sebagai contoh adalah pengaruh antara tingkat inflasi bulanan terhadap nilai tukar
rupiah terhadap dollar. Data tingkat inflasi pada bulan tertentu, katakanlah bulan
Februari, akan dipengaruhi oleh tingkat inflasi bulan Januari. Berarti terdapat
gangguan autokorelasi pada model tersebut. Contoh lain, pengeluaran rutin dalam
suatu rumah tangga. Ketika pada bulan Januari suatu keluarga mengeluarkan belanja
bulanan yang relative tinggi, maka tanpa ada pengaruh dari apapun, pengeluaran pada
bulan Februari akan rendah.
Uji Linearitas
Uji linearitas dipergunakan untuk melihat apakah model yang dibangun
mempunyai hubungan linear atau tidak. Uji ini jarang digunakan pada berbagai
penelitian, karena biasanya model dibentuk berdasarkan telaah teoretis bahwa
hubungan antara variabel bebas dengan variabel terikatnya adalah linear. Hubungan
antar variabel yang secara teori bukan merupakan hubungan linear sebenarnya sudah
tidak dapat dianalisis dengan regresi linear, misalnya masalah elastisita.
2.2 Regresi Linear Berganda
Analisis regresi linier berganda adalah hubungan secara linier dua atau lebih variabel
independen (X1, X2, . . . Xn ) dengan variabel dependen (Y). Analaisis ini untuk mengetahui
arah hubungan antara variabel independen dengan variabel dependen apakah masing-masing
variabel independen berhubungan positif atau negatif dan untuk memprediksi nilai dari
variabel dependen apabila nilai variabel independen mengalami kenaikan atau penurunan.
Data yang digunakan biasanya berskala interval atau rasio.
2.3 Korelasi Linear Berganda
Korelasi linear berganda merupakan alat ukur mengenai hubungan yang terjadi antara
variabel yang Y dengan dua atau lebih variabel bebas (X 1, X2Xn). Analisis korelasinya
menggunakan tiga koefisien korelasi yaitu koefisien determinasi berganda, koefisien korelasi
berganda, dan koefisien korelasi parsial.
2.4 Model Regresi Terbaik
Jika antar variabel prediktor saling berkorelasi satu sama lain, dikatakan terjadi kasus
multikolinear. Hal ini karena beberapa variabel predictor tidak significant berada dalam
model walaupun sesungguhnya variabel tersebut berhubungan sangat erat dengan variabel
respon Y. Untuk mendapatkan model yang diinginkan terdapat dua pertimbangan dalam
pembentukan model, diantaranya:
1.
Agar persamaan regresi bermanfaat untuk tujuan prediksi, seringkali diinginkan model
yang memuat sebanyak-banyaknya variabel X (prediktor) yang mempengaruhi variabel Y
(respon).
2.
Karena pertimbangan biaya untuk mendapatkan informasi, maka digunakan sesedikit
mungkin variabel X (prediktor) yang mempengaruhi variabel Y (respon)
Untuk itu dibutuhkan metode untuk dapat mengakomodasikan dua kepentingan di atas
dengan cara selecting the best regression equation. Berikut ini adalah cara-cara yang sering
digunakan dalam memilih model terbaik.
Backward Elimination
Membuat model dengan memasukkan semua variabel kemudian dikeluarkan
satu persatu dengan melakukan pengujian terhadap parameter parameternya dengan
menggunakan partial F test. Nilai partial F-test (FL) terkecil dibandingkan dengan F0 table:
Jika FL < F0, maka X yang bersangkutan dikeluarkan dari model dan dilanjutkan dengan
pembuatan model baru tanpa variabel tersebut.
Jika FL>F0, maka proses dihentikan dan persamaan terakhir tersebut yang digunakan/dipilih.
Forward Selection
Forward selection merupakan salah satu metode pemodelan (pembangunan model
linier) untuk menemukan kombinasi peubah yang terbaik dari suatu gugus peubah. Dalam
prosedur forward selection, sekalinya variabel masuk ke dalam persamaan maka tidak bisa
dihilangkan.
Selain itu, forward selection dapat berarti memasukkan variabel bebas yang memiliki
korelasi yang paling erat dengan variabel tak bebasnya (variabel yang paling potensial untuk
memiliki hubungan linier dengan Y). Kemudian secara bertahap memasukkan variabel bebas
yang potensial berikutnya dan nanti akan terhenti sampai tidak ada lagi variabel bebas yang
potensial.
BAB III
METODOLOGI PENELITIAN
3.1 Jenis dan Sumber Data
Data yang digunakan dalam penelitian ini adalah data sekunder berupa jumlah
orang yang bekerja, persentasi deflasi harga, GNP (dalam juta dollar), jumlah orang yang
tidak bekerja (dalam ribuan), jumlah orang yang bekerja di bidang militer, tahun kelahiran,
dan jumlah orang yg berusia di atas 14 tahun. Data sekunder adalah data dalam bentuk yang
sudah jadi yaitu berupa data publikasi. Data tersebut sudah dikumpulkan oleh pihak lain.
Sumber data ini diperoleh dari S Weisberg, Applied Linear Regressio, Wiley, 1980, page 70.
3.2 Metode Pengambilan Data
Data dalam penelitian ini dikumpulkan dengan cara mengambil dari internet dan
mempelajari dari buku-buku pustaka yang mendukung proses penelitian ini.
3.3 Variabel-variabel
Variabel-variabel yang ditetapkan dalam penyusunan makalah ini adalah jumlah
orang yang bekerja sebagai variabel dependent dan persentasi deflasi harga(%), GNP(dalam
juta dollar), jumlah orang yang tidak bekerja(dalam ribuan), jumlah orang yang bekerja di
.bidang militer(jiwa), tahun kelahiran(tahun), dan jumlah orang yang berusia diatas 14
tahun(jiwa) dan sebagai variabel-variabel independent.
3.4 Metode Analisis
3.4.1 Analisis Deskriptif Data
Pada analisis deskriptif data akan dilihat nilai rata-rata dari variabel dependen
(jumlah orang yang bekerja) dan variabel independen (persentasi deflasi harga(%),
GNP(dalam juta dollar), jumlah orang yang tidak bekerja(dalam ribuan), jumlah orang yang
bekerja di .bidang militer(jiwa), tahun kelahiran(tahun), dan jumlah orang yang berusia diatas
14 tahun(jiwa)) dan disertakan juga dengan nilai maksimum, minimum, dan sebaran data.
3.4.2 Persamaan Garis Regresi
Penelitian ini menggunakan metode kuantitatif dengan alat analisis regresi
berganda. Analisis regresi berganda digunakan untuk menguji pengaruh antara: independen
(persentasi deflasi harga(%), GNP(dalam juta dollar), jumlah orang yang tidak bekerja(dalam
ribuan), jumlah orang yang bekerja di .bidang militer(jiwa), tahun kelahiran(tahun), dan
jumlah orang yang berusia diatas 14 tahun(jiwa)).
3.4.3 Menguji Kecocokan Model Koefisien Determinasi
Uji F dilakukan untuk melihat apakah semua variabel-variabel independen yang
dimasukkan dalam model mempunyai pengaruh secara simultan terhadap variabel dependen.
Hipotesis:
H0: Model regresi berganda tidak signifikan (model tidak cocok)
H1: Model regresi berganda signifikan (model cocok)
Kriteria uji:
Untuk menguji hipotesis ini digunakan statistik F dengan kriteria : Jika nilai sig. <
alfa, maka H0 ditolak.
Koefisien determinasi digunakan untuk mengukur seberapa jauh kemampuan model
dalam menerangkan variabel dependen. Nilai koefisisen determinasi (Kd) adalah antara 0 dan
1. Nilai R yang kecil berarti kemampuan variabel-variabel independen dalam menerangkan
variabel dependen sangat terbatas. Nilai mendekati 1 berarti variabel independen memberikan
hampir semua informasi yang dibutuhkan untuk memprediksi variasi variabel independen.
Kelemahan Kd adalah bias terhadap jumlah variabel independen yang dimasukkan
ke dalam model. Setiap tambahan satu variabel independen maka R pasti akan meningkat
walaupun belum tentu variabel yang ditambahkan berpengaruh secara signifikan terhadap
variabel dependen. Oleh karena itu, digunakan nilai adjusted, karena nilai adjusted dapat naik
atau turun apabila satu variabel independen ditambahkan ke dalam model.
3.4.4 Menguji Keberartian Koefisien Regresi
Uji statistik t pada dasarnya menunjukkan seberapa besar pengaruh satu variabel
penjelas secara individual dalam meneragkan variasi variabel dependen. Untuk melihat
apakah variabel independen tersebut memiliki pengaruh terhadap variabel dependen dapat
dilakukan dengan hipotesis sebagai berikut:
H0: *= 0 ( koefisien arah regresi tidak berarti atau dengan kata lain tidak ada hubungan
linier antara variabel independen terhadap variabel dependen)
H1: * 0 ( koefisien arah regresi berarti atau dengan kata lain ada hubungan linier antara
variabel independen terhadap variabel dependen)
Kriteria uji: Untuk uji statistik t di atas adalah jika sig.hitung<alfa maka variabel bebas
tersebut berpengaruh secara signifikan terhadap variabel terikat.
BAB IV
PEMBAHASAN
Berikut data yang kita ambil dari :
Helmut Spaeth,
Mathematical Algorithms for Linear Regression,
Academic Press, 1991,
ISBN 0-12-656460-4.
S Weisberg,
Applied Linear Regression,
Wiley, 1980, page 70.
Discussion:
Economic and unemployment data were recorded.
There are 16 rows of data. The data include:
I, the index;
A1, the percentage price deflation;
A2, the GNP in millions of dollars;
A3, the number of unemployed in thousands;
A4, the number of people employed by the military;
A5, the number of people over 14;
A6, the year
B, the number of people employed.
We seek a model of the form:
B = A1 * X1 + A2 * X2 + A3 * X3 + A4 * X4 + A5 * X5 + A6 * X6.
8 columns
16 rows
Index
A1, the percentage price deflation;
A2, the GNP in millions of dollars;
A3, the number of unemployed in thousands;
A4, the number of people employed by the military;
A5, the number of people over 14;
A6, the year
B, the number of people employed
1 83.0 234289 2356 1590 107608 1947 60323
2 88.5 259426 2326 1456 108632 1948 61122
3 88.2 258054 3682 1616 109773 1949 60171
4 89.5 284599 3351 1650 110929 1950 61187
5 96.2 328975 2099 3099 112075 1951 63221
6 98.1 346999 1932 3594 113270 1952 63639
7 99.0 365385 1870 3547 115094 1953 64989
8 100.0 363112 3578 3350 116219 1954 63761
9 101.2 397469 2904 3048 117388 1955 66019
10 104.6 419180 2822 2857 118734 1956 67857
11 108.4 442769 2936 2798 120445 1957 68169
12 110.8 444546 4681 2637 121950 1958 66513
13 112.6 482704 3813 2552 123366 1959 68655
14 114.2 502601 3931 2514 125368 1960 69564
15 115.7 518173 4806 2572 127852 1961 69331
16 116.9 554894 4007 2827 130081 1962 70561
Analisis Deskriptif
Descriptive Statistics
Mean
Std.
Deviation
VAR00001 (Y)
VAR00002 (X1)
VAR00003 (X2)
VAR00004 (X3)
VAR00007 (X6)
VAR00006 (X5)
VAR00005 (X4)
65317,6250
101,6813
387698,4375
3193,3750
1954,5000
117424,0000
2606,6875
3512,96266
10,79155
99394,93780
934,40233
4,76095
6956,10156
695,91960
16
16
16
16
16
16
16
Jadi, dari output di atas dapat disimpulkan :
1. Rata-rata dari variabel persentasi deflasi harga adalah sebesar 101,6813 dengan standar
deviasi sebesar 10,79155.
2. Rata-rata dari variabel GNP (dalam juta dollar) adalah sebesar 387698,4375 dengan
standar deviasi sebesar 99394,93780.
3. Rata-rata dari variabel jumlah yang tidak bekerja (dalam ribuan) adalah sebesar 3193,3750
dengan standar deviasi sebesar 934,40233.
4. Rata-rata dari variabel jumlah yang bekerja di bidang militer adalah sebesar
2606,6875dengan standar deviasi sebesar 695,91960.
5. Rata-rata dari variabel the number of people over 14 adalah sebesar 117424,0000 dengan
standar deviasi sebesar 6956,10156.
6. Rata-rata dari variabel tahun kelahiran adalah sebesar 1954,5000 dengan standar deviasi
sebesar 4,76095.
Model terbaik untuk analisis regresi dari data ini adalah sebagai berikut:
Coefficientsa
Unstandardiz Standa T
Sig. 95,0%
ed
rdized
Confidence
Coefficients
Coeffi
Interval for B
cients
Correlations
Collinearity
Statistics
Model
Lowe
B
Std.
Beta
Error
(Cons 51839, 680,7
76,15
tant) 841
25
VAR0
,035
,002 ,984
0003
(Cons 52378, 572,5
4
20,40
tant) 783
53
VAR0
2
,038
,002 1,071
0003
VAR0
-,544 ,182 -,145
0004
a. Dependent Variable: VAR00001
0
91,48
3
22,16
8
2,994
,000
Upper
Zero-
Boun Bound
order
d
50379
,831
,000 ,031
,000
51141
,858
Partial Part
Toleran VIF
ce
53299,850
,038
,984
,984
,984
1,000
,042
,984
,987
,853
,635
,010 -,936
-,151
,502
-,639
-,115
,635
Y^= 52378.783 + 0.038 X3 + 0.544 X4
Kesimpulan: Jadi, faktor yang paling berpengaruh terhadap jumlah karyawan adalah X3 dan
X4.
Model Summaryc
Model R
R
are
Change Statistics
Adjust Error of
Squ ed
R the
F
Square Estimate R
Square Chan
,984a ,967 ,965
,990b ,981 ,978
00
53615,708
,000 ,034
Std.
1,0
Durbin-Watson
Sig.
df1 df2 Change
Change ge
655,999
416,1
,967
1
05
62
523,768
,013
8,961 1
54
14
,000
13
,010
,976
1,5
75
1,5
75
a. Predictors: (Constant), VAR00003
b. Predictors: (Constant), VAR00003, VAR00004
c. Dependent Variable: VAR00001
Model terbaik yang didapatkan di atas memiliki kesesuaian model sebesar 97.8 %
ANOVAa
Model
Sum
of df
Squares
Regression 179088913,286 1
1
Residual
6024686,464
14
Total
185113599,750 15
Regression 181547264,482 2
2
Residual
3566335,268
13
Total
185113599,750 15
a. Dependent Variable: VAR00001
b. Predictors: (Constant), VAR00003
c. Predictors: (Constant), VAR00003, VAR00004
Mean Square
Sig.
179088913,286 416,162
430334,747
,000b
90773632,241
274333,482
,000c
330,888
Dari output di atas terlihat bahwa nilai signifikansinya kurang dari 0.05. Maka model
ini cocok.
Correlations
Pe VAR00001
ar VAR00002
VAR00003
so
VAR00004
n VAR00007
C VAR00006
VAR00001
1,000
,971
,984
,502
,971
,960
VAR00002
,971
1,000
,992
,621
,991
,979
VAR00003
,984
,992
1,000
,604
,995
,991
VAR00004
,502
,621
,604
1,000
,668
,687
VAR00007
,971
,991
,995
,668
1,000
,994
VAR00006
,960
,979
,991
,687
,994
1,000
VAR00005
,457
,465
,446
-,178
,417
,364
,465
,446
-,178
,417
,364
1,000
,000
.
,000
,005
,000
,000
,000
,000
.
,007
,000
,000
,024
,005
,007
.
,002
,002
,000
,000
,000
,002
.
,000
,000
,000
,000
,002
,000
.
,037
,035
,042
,255
,054
,083
or
rel
VAR00005 ,457
ati
on
Si VAR00001
VAR00002
g.
VAR00003
(1 VAR00004
VAR00007
VAR00006
.
,000
,000
,024
,000
,000
tai
le
VAR00005 ,037
VAR00001
VAR00002
VAR00003
N VAR00004
VAR00007
VAR00006
VAR00005
16
16
16
16
16
16
16
,035
,042
,255
,054
,083
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
16
Dari hasil output di atas terlihat bahwa korelasi antara variabel bebas memiliki
korelasi yang kuat. Maka dapat kita simpulkan terdapat pelanggaran salah satu asumsi klasik
yaitu multikolinearitas.
Coefficient Correlationsa
Model
Correlations VAR00003
1
Covariances VAR00003
VAR00003
Correlations
VAR00004
2
VAR00003
Covariances
VAR00004
a. Dependent Variable: VAR00001
VAR00003
1,000
2,904E-006
1,000
-,604
2,916E-006
,000
VAR00004
-,604
1,000
,000
,033
Dari hasil output ini, dapat juga disimpulkan bahwa dengan memilih model terbaik
koefisien korelasi antar variabel bebasnya sangat kecil sehingga tidak ada lagi pelanggaran
asumsi multikolinieritasnya.
Dari gambar di atas dapat disimpulkan bahwa titik-titik pada plot yang terbentuk
tersebar di atas dan di bawah titik nol. Ini menandakan bahwa terdapatnya
heterokedastisisitas sebelum dilakukannya pemilihan model terbaik di atas.
BAB V
PENUTUP
5.1 Kesimpulan
Jadi faktor yang paling berpengaruh terhadap variabel y ( jumlah orang yang bekerja)
yaitu hanya variabel X3 [ jumlah orang yang tidak bekerja (dalam ribuan)] dan X4 ( jumlah
orang yang bekerja di bidang militer).
5.2 Saran
Sebaiknya suatu negara memiliki banyak rakyat dengan usia produktif dan pekerjaan
yang baik (dalam hal gaji) sehingga negara tersebut memiliki tingkat GNP yang tinggi
Dengan demikian kesejahteraan rakyat akan semakin meningkat.
DAFTAR PUSTAKA
Gujarati, Damodar(1977), Ekonometrika Dasar. Jakarta : Erlangga.
Hamang, A. 2005. Metode Statistika. Jakarta : Graha Ilmu.
Sembiring, R.K. 2003. Analisis Regresi. Edisi Kedua. Bandung: Institut Teknologi Bandung.
Spaeth, Helmut(1991), Mathematical Algorithms for Linear Regression. England : Academic
Press.
Weisberg, Smug(1980), page 70, Applied Linear Regression. England : Wiley.