Anda di halaman 1dari 41

ANALISIS REGRESI

APLIKOM 2. PERTEMUAN 7
RABU. 05 04 2017
Tempat mengambil file

Silahkan ambil data di :

\\ADMIN-PC\Users\ Public\omar\
S1 PS-Aplikom 2\pertemuan 7

a. Buka file : analisis regresi.pptx


b. File latihannya : CROSSEC1.xls
1. PENDAHULUAN

Menurut francis galton(1886), regresi universal adalah suatu


fenomena, dimana ada tendensi bahwa orang tua yang
memiliki tubuh tinggi, memiliki anak anak yang tinggi pula,
dan orang tua yang pendek memiliki anak
anak yang pendek pula. Kendati demikian, ia
mengamati ada kecendrungan bahwa tinggi
anak bergerak menuju rata rata tinggi
populasi secara keseluruhan. Dengan kata
lain ketinggian anak yang amat tinggi, atau
orang tua yang amat pendek cendrung
bergerak kearah rata rata tinggi populasi.
(maddala, 1992)
Definisi……………………………………...lanjutan

Analisis Regresi : Studi mengenai ketergantungan


variable dependen (terikat) dengan satu atau lebih
variable independen (variable bebas), dengan tujuan
untuk mengestimasi dan/atau memprediksi rata-rata
populasi atau nilai rata rata variable dependen
berdasarkan nilai variable independen yang diketahui
(gujarti,2003)
Hasil Analisis Regresi

Adalah berupa koefisien untuk masing masing variable


independen. Koefisien ini diperoleh dengan cara
memprediksi nilai variable dependen dengann suatu
persamaan. Koefisien regresi dihitung dengan dua
tujuan sekaligus. Meminimumkan penyimpangan nilai
aktual dan nilai estimasi variable dependen
berdasarkan data yang ada. (Tabachnick,1996)
2. REGRESI VS KORELASI

Analisis Korelasi
Analisis regresi selain mengukur kekuatan hubungan
antara dua variable atau lebih, juga menunjukkan arah
hubungan antara variable dependen dengan variable
independen. Variable dependen diasumsikan
random/stokastik., yang berarti mempunyai distribusi
probabilistik. Variable independen/ bebas
diasumsikan memiliki nilai tetap(dalam pengambilan
sample yang berulang)
KORELASI (CORRELATION)
7
Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi
(hubungan)linear antara dua variable. Korelasi tidak menunjukkan
hubungan fungsional atau dengan kata lain analisis korelasi tidak
membedakan antara variable dependen dengan variable independen.
Jenis:
1. Korelasi Spearman
2. Pearson Product Moment
Asumsi
Asumsi dasar korelasi diantaranya seperti tertera di bawah ini:
 Kedua variabel bersifat independen satu dengan lainnya, artinya
masing-masing variabel berdiri sendiri dan tidak tergantung satu
dengan lainnya. Tidak ada istilah variabel bebas dan variabel
tergantung. Jika digunakan istilah varaibel X dan Y itu hanya untuk
mempermudah dalam penghitungan melalui rumus yang ada.
 Data untuk kedua variabel berdistribusi normal. Data yang mempunyai
distribusi normal artinya data yang distribusinya simetris sempurna.
Koefesien Korelasi:
8
Koefesien korelasi ialah pengukuran statistik kovarian atau asosiasi antara dua
variabel. Besarnya koefesien korelasi berkisar antara +1 s/d -1. Koefesien korelasi
menunjukkan kekuatan (strength) hubungan linear dan arah hubungan dua
variabel acak. Jika koefesien korelasi positif, maka kedua variabel mempunyai
hubungan searah. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan
tinggi pula. Sebaliknya, jika koefesien korelasi negatif, maka kedua variabel
mempunyai hubungan terbalik. Artinya jika nilai variabel X tinggi, maka nilai
variabel Y akan menjadi rendah (dan sebaliknya). Untuk memudahkan melakukan
interpretasi mengenai kekuatan hubungan antara dua variabel penulis memberikan
kriteria sebagai berikut:
 0 : Tidak ada korelasi antara dua variabel
 >0 – 0,25: Korelasi sangat lemah
 >0,25 – 0,5: Korelasi cukup
 >0,5 – 0,75: Korelasi kuat
 >0,75 – 0,99: Korelasi sangat kuat
 1: Korelasi sempurna
Uji Bivariate

Digunakan untuk menguji hubungan antara dua


variable bertipe ordinal dan skala. Ada tiga macam
uji Bivariate :
1. Uji pearson
2. Uji Kendall tau-b
3. Spearman
1. Uji Pearson

Digunakan untuk mengukur hubungan dengan data


berdistribusi normal(parametrik)
Contoh : kita hendak menguji terhadap hubungan
lama kerja(EXP) dengan gaji(INCOME)
Cara mengerjakan :

1. Buka file : crosscek.xls


2. Dari menu utama, pilih analyze--- correlate --
Bivariate
3. Pada jendela bivariate
correlations
4. Masukkan variable AGE
dan variable INCOME
pada kotak variable,
pilih pearson pada
correlation coefficients.
5. Klick ok
penjelasan

Keterangan :
Pada tabel metrik
correlations. Nilai
koefisien korelasi
antara umur(AGE)
dengan gaji(INCOME)
tinggi(0.252)

T hitung > T tabel sehingga H0 ditolak. Jadi ada hubungan antara kedua
variable
Sig (2 tailed) 0.000 < α (0.05) sehingga H0 ditolak. Jadi ada hubungan antara
dua variable tersebut.
2. Uji Kendal dan Spearman

Digunakan untuk mengukur hubungan antarvariable berdasarkan


ranking, tidak memandang distribusi variable(nonparametrik)
contoh : Anda ingin melakukan pengamatan terhadap hubungan
antara Race dengan Kinerja.
Langkah langkahnya :Pertama kita buat dulu variable baru
kinerja pada data crosscek1.xls
Lalu kita isikan value/ nilai :
Baik sekali = 1 ; baik = 2 ; biasa
= 3 ; buruk = 4 ; buruk sekali
=5
Lalu pada variable Race, kita
isikan value : 1 = kulit putih ;
2 = kulit hitam ; 3 = hispanik
Langkah pengerjaan :

1. Pilih : analyze - correlate - bivariate sehingga


muncul kotak bivariate correlations.

2. Masukkan variable
Kinerja dan race
kedalam kotak
variable
3. Lalu pilih kendall dan
spearman
4. Klick ok
penjelasan

Disini bisa dilihat bahwa tidak ada hubungannya


antara kinerja dengan race.
Sig 0.179 > α(0.05) jadi H0 diterima, tidak ada
hubungan antara dua variable
3. Asumsi ordinary least squares(OLS)

Diperkenalkan oleh carl freidrich gauss, metode mengestimasi suatu garis regresi dengan
jalan meminimalkan jumlah dari kuadrat kesalahan setiap observasi terhadap garis
tersebut.
Memiliki rumus :
Yi = b + b2Xi +ui
Dimana :
 Model regresi harus linier
 Tidak terjadi otokorelasi
 Tidak terjadi multikolinieritas (regresi berganda)
 Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y)
 Data harus berdistribusi normal
 Data berskala interval atau rasio
 Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas
(disebut juga sebagai variabel predictor) sedang variabel lainnya variabel tergantung
(disebut juga sebagai variabel response)
Rangkuman:Kharakteristik Regresi Sederhana:

• Terdiri dari variabel dependent (Y) dan independent (X)


• Regresi merupakan analisis sebab akibat
• Pengaruh dari variabel yang terlibat tidak bersifat timbal balik
(hanya satu arah)
• Pendugaan koefisien menggunakan OLS (ordinary Least Square)
• Hal penting yang harus dipelajari :
1. Teori yang diperlukan
2. Model matematis yang dipilih
3. Hasil pengujian statistik :
 Uji t : uji parsial koefisien
 Uji F : uji keseluruhan model
• Kekuatan model ditunjukkan dengan R-square
Menilai goodness of Fit suatu model

Ketepatan fungsi regresi sample dalam menaksir nilai


aktual dapat diukur dari goodness of fitnya. Secara
statistik, setidaknya ini dapat diukur dari nilai
koefisien determinasi, nilai statistik F dan nilai
statistik t. perhitungan statistik disebut signifikan
secara statistik apabila nilai uji statistiknya berada
dalam daerah kritis(daerah dimana Ho ditolak).
Sebaiknya disebut tidak signifikan bila nilai uji
statistiknya berada dalam daerah dimana Ho diterima.
A. Kooefisien determinasi(R2)

Mengukur seberapa jauh kemampuan model dalam


menerangkan variasi variable dependen. Nilai
koefisien determinasi adalah antara nol dan satu. Nilai
R2 yang kecil berarti kemampuan variable variable
independen dalam menjelaskan variasi variable
dependen amat terbatas. Nilai yang mendekati satu
berarti variable variable independen memberikan
hampir semua informasi yang dibutuhkan untuk
memprediksi variasi variable dependen.
Uji autokorelasi

Autokorelasi menunjukkan apakah data random


atau tidak. Autokorelasi merupakan suatu koefisien
yang menunjukkan korelasi dua nilai dalam variable
yang sama pada horison waktu xi dan xi+k.
Diuji menggunakan pengujian Durbin-watson(DW)
dimana :
1.65 < DW < 2.35 tidak terjadi autokorelasi
1.21 < DW < 1.65 atau 2.35 < DW < 2.79 tidak dapat
disimpulkan
DW < 1.21 atau DW > 2.79 terjadi autokorelasi.
B. Uji signifikansi simultan(uji statistik F)
Menunjukkan apakah semua variable independen atau bebas yang
dimasukkan dalam model mempunyai pengaruh secara bersama
sama terhadap variable dependen/terikat.
Dari konsep dasarnya sebenarnya uji-F mendasarkan pada dua
hipotesis yaitu :
H0 : Semua koefisien variabel bebas adalah 0 (nol)
HA : Semua koefisien variabel bebas tidak sama dengan nol.

1. Apabila : H0 : b1 = b2 …… = bk = 0
Artinya, apakah semua variable independen bukan merupakan
penjelas yang signifikan terhadap variable dependen.
2. Apabila : HA : b1 ≠ b2 ≠ …..= bk ≠ 0
Artinya. Semua variable independen secara simultan merupakan
penjelas yang siginfikan terhadap variable dependen.
Cara menguji :

1. Quick look, bila nilai F lebih besar dari 4 maka H0


dapat ditolak pada derajat kepercayaan 5 %.
Dengan kata lain, kita menerima hipotesis
alternatif(HA), yang menyatakan bahwa semua
variable independen secara serentak dan signifikan
mempengaruhi variable dependen.
2. Membandingkan nilai F hitung dengan F tabel. Bila
F hitung > F tabel maka H0 ditolak, dan menerima
HA
C. Uji signifikansi parameter individual (Uji statistik t)

Menerangkan seberapa jauh pengaruh satu variable


penjelas/ independen secara individual dalam
menerangkan variasi variasi dependen. Hipotesis nol
(H0) yang hendak diuji adalah apakah suatu
parameter(bi) sama dengan nol, atau :
H0 : bi = 0
Artinya apakah suatu variable independen bukan
merupakan penjelas uang signifikan terhadap variable
dependen. Hipotesis alternatifnya(HA) parameter suatu
variable tidak sama dengan nol , atau :
HA : bi ≠ 0
Cara menguji :

1. Quick look, bila jumlah degree of fredom(df) adalah


20 atau lebih, dan derajat kepercayaan sebesar 5 %,
maka H0 yang menyatajkan b1 = 0 dapat ditolak bila
nilai t lebih besar dari 2(dalam nilai absolut)
2. Membandingkan nilai statistik t hitung dengan titik
kritis menurut tabel. Bila nilai statistik t hitung > t
tabel maka H0 ditolak, dan menerima HA
Jenis: Uji T Satu Sample, Uji T Sampel Berpasangan,
dan Uji Sampel Bebas
II. REGRESI LINIER SATU VARIABLE INDEPENDEN

Contohnya : apabila yang akan diteliti memiliki satu


variable independen.
Contoh : apabila kita mau meneliti hubungan antara
variable dependen INCOME dengan variable
independen SAVING
Langkah pengerjaan :

1. Buka file crosscek.xls


2. Dari menu utama, pilih
analyze--- regression
lalu pilih liniear
3. Tampak dilayar
windows liniear
regression
4. Masukkan INCOME ke
dalam kotak dependen
5. Pada kotak
independen masukkan
variable SAVING
Langkah langkah pengujian……lanjutan

6. Pada statistics, pilih : estimates, model fit,


coolinearity diagnostics, dan durbin-watson.
7. Tekan continue
8. Tekan ok
Koeefisien determinasi

Dari tampilan hasil, bisa dilihat ajusted R square 0.138, hali ini
berarti 13,8% variasi income dapat dijelaskan oleh variasi dari
variable independen SAVING sedangkan sisanya (100%-13.8 %=
86.2 % ) dijelaskan oleh sebab sebab yang lain diluar model
Standar error(SEE) sebesar 5.184 ribu dolar. Makin kecil nilai SEE
akan membuat model regresi semakin tepat dalam memprediksi
variable dependen.
Kolom durbin watson bernilai 2.303 berarti tidak terjadi
autokorelasi
Uji signifikansi simultan(uji statistik F)

Dari uji anova atau f test didapat nilai F hitung sebesar


16.863 dengan probabilitas jauh lebih kecil dari 0.05,
maka model regresi dapat digunakan untuk
memprediksi INCOME, atau dapat dikatakan bahwa
SAVING berpengaruh terhadap income.
Uji signifikansi parameter individual (uji statistik t)

Sig (0.00) < α (0.05) sehingga H0 ditolak. Jadi


koefisien saving signifikan
II. REGRESI LINIER BEBERAPA
VARIABLE INDEPENDEN
Apabila variable independennya lebih dari satu
macam.
Misalnya : kita hendak melakukan pengamatan
mengenai hubungan SAVING, SIZE, WEALTH,
EARNS dengan INCOME
Langkah langkah pengujian

1. Buka file crosscek.xls


2. Dari menu utama, pilih
analyze--- regression lalu
pilih liniear
3. Tampak dilayar windows
liniear regression
4. Masukkan INCOME ke
dalam kotak dependen
5. Pada kotak independen
masukkan variable SIZE,
EARNS, WEALTH, dan
SAVING
Langkah langkah pengujian……lanjutan

6. Pada statistics, pilih : estimates, model fit,


coolinearity diagnostics, dan durbin-watson.
7. Tekan continue
8. Tekan ok
Koeefisien determinasi

Dari tampilan hasil, bisa dilihat ajusted R square 0.807, hali ini
berarti 80,7% variasi income dapat dijelaskan oleh variasi dari ke
empat variable independen SIZE, EARNS, WEALTH dan SAVING
sedangkan sisanya (100%-80.7 %= 19.3 % ) dijelaskan oleh sebab
sebab yang lain diluar model
Standar error(SEE) sebesar 2.456 ribu dolar. Makin kecil nilai SEE
akan membuat model regresi semakin tepat dalam memprediksi
variable dependen.
Kolom durbin watson bernilai 2.061 berarti tidak terjadi autokorelasi
Uji signifikansi simultan(uji statistik F)

Dari uji anova atau f test didapat nilai F hitung sebesar


104.162 dengan probabilitas jauh lebih kecil dari 0.05,
maka model regresi dapat digunakan untuk
memprediksi INCOME, atau dapat dikatakan bahwa
SIZE, WEALTH, EARNS dan SAVING scara bersama
sama berpengaruh terhadap income.
Uji signifikansi parameter individual (uji statistik t)

Untuk menginterpertasikan koefisien variable


bebas(independen)dapat menggunakan unstandarized
coeffisients maupun standarized coefficients
a. Unstandarized beta coefficient:

Dari keempat variable independen yang dimasukkan


ke dalam model regresi variable SIZE dan SAVING
tidak signifikan hal ini dapat dilihat dari probabilitas
signifikansi untuk SIZE sebesar 0.075 dan SAVING
sebesar 0.892 dan keduannya jauh diatas 0.05.
sedangkan EARNS dan WEALTH signifikan pada
0.05. dari sini dapat disimpulkan bahwa variable
INCOME dipengaruhi oleh EARNS dan WEALTH
dengan persamaan matematis :
INCOME = 3.848 - 0.302 SIZE + 0.840 EARNS +
0.059 WEALTH + 0.009 SAVING
Penjelasannya :

Konstanta sebesar 3.848 menyatakan bahwa jika


variable independen dianggap konstan, maka rata rata
income keluarga sebesar 3.848 ribu dolar.
Koefisien regresi EARNS sebesar 0.840 menyatakan
bahwa setiap penambahan gaji kepala keluarga
sebesar 1000 dolar akan meningkatkan INCOME
keluarga sebesar 840 dolar
Koefisien regresi WEALTH sebesar 0.059 menyatakan
bahwa setiap penambahan kekayaan keluarga 1000
dolar akan meningkatkan INCOME keluarga sebesar 9
dolar.
b. Standarized beta coefficient:

Apabila masing – masing koefisien variable


bebas(independen) kita standarisasi lebih dahulu,
maka kita akan mempunyai koefisien yang akan
berbeda karena garis regresi melewati origin(titik
pusat) sehingga tidak ada konstantanya(lihat tampilan
pada standarized coefisients). Keuntungan dengan
menggunakan standarized beta adalah mampu
meneliminasi perbedaan unit ukuran pada variable
independen, jika ukuran variable independen tidak
sama(ada Kg, Rp, liter dll). Maka sebaiknya interpertasi
persamaan regresi menggunakan standarized beta.
penutup

Sekian
Terimakasih
MID TEST

Materi :
1. Analisis deskripsi, dan frequensi
2. Uji validasi, dan uji reliabilitas
3. Analisis regresi

Untuk materi bisa di ambil di folder tiap pertemuan :

Anda mungkin juga menyukai