Anda di halaman 1dari 16

STATISTIK LINGKUNGAN

ANALISA REGRESI

LECTURE’S NOTE

FIRRA ROSARIAWARI
MACAM – MACAM ANALISA STATISTIK
(1)
 Ada beberapa analisa yang berfungsi untuk
mengetahui pengaruh variabel independen
(x) terhadap variabel dependen (Y) :
- Analisa Regresi Linier / Sederhana dan
Korelasi.
- Regresi, Dummy, Colinier
- Penambahan Variabel
- Regresi Ganda
- Optimasi-Pure-Lack-Of-Fit
- RSM
Regresi Linier
Pengertian Analisis Regresi Linear :
 analisis yang digunakan untuk menjelaskan keterkaitan
hubungan antara suatu variabel bebas (independent)
terhadap vari-abel respon (dependent).
 Hubungan antara variabel bebas dengan respon, yang di-
anggap terjadi secara "linear", dapat dibentuk sebagai
model.

Manfaat Analisis Regresi :


 Model persamaan regresi dapat digunakan untuk
meramalkan nilai variabel respon jika nilai variabel
bebas diketahui dengan derajat keyakinan tertentu.
Deteksi untuk mengetahui pola model
suatu data
Hitung koefisien korelasi antara dua variabel
 Koefisien korelasi, -1<  < 1, dapat digunakan sebagai
nilai kasar untuk melihat ada tidaknya keterkaitan
hubungan antara dua variabel.
Grafik antara kedua variabel pengamatan
 Jika grafik menunjukkan adanya pola fluktuasi yang
linear, maka dapat dianggap terdapat hubungan linear
sederhana antara kedua variabel tersebut.
Testing hipotesis pada model
 Jika uji tiap parameter model linearnya secara statistik
dapat dianggap signifikan, maka model dapat dianggap
benar membentuk persamaan linear.
Asumsi pada Model Regresi
Dalam penggunaan model regresi diperlukan asumsi :
 Asumsi Normalitas
Nilai Y diuji norrmalitasnya dengan menggunakan uji
Kolmogorov Smirnov atau uji bentuk distribusi
(kesimetrisan dan puncak).
 Asumsi Linieritas
Nilai rata – rata Y merupakan fungsi linier dari x. Untuk
membuktikan asumsi linieritas, plot residual terhadap x.
 Asumsi Homoskedastis
untuk membuktikan asumsi homoskedastis, residual dari
masing – masing elemen distandarkan, dengan menghitung
rata – rata sisaan dan standart deviasi.
ANALISA REGRESI LINIER DAN KORELASI
(1)
 Respon : variabel dependen : hasil yang diharapkan : y
 Predictor : Variabel independen : variabel bebas : x
 Ada beberapa model Regresi :
- Regresi Sederhana / Linier
y = a + bx + ε
a : intercept, yaitu nilai pada sumbu y untuk x = 0
b : slope, yang menyatakan perubahan nilai dari
variabel dependen untuk setiap perubahan satu unit nilai
dari variabel bebas.
ε : galat random (random error)
ANALISA REGRESI LINIER DAN KORELASI
(2)
- Regresi Ganda
Jika x lebih dari satu, y = a +bx1 + bx2 + ε
- Regresi Non Linier
y = a + bx + cx^2 + ε
ε adalah variabel random
 H0 ditolak jika P_value < α
 H0 ditolak, artinya variabel independen
mempengaruhi respon
ANALISA REGRESI LINIER DAN KORELASI
(3)
 R^2 : koefisien determinasi : mendeskripsikan
prosentase variabilitas Y yang dijelaskan oleh
variabilitas x, R^2 = r^2
 S^2 : Simpangan : artinya seberapa jauh titik –
titik variabel independen menyebar terhadap
garis regresi.
 IIDN (Identik Independen Distribusi Normal),
(0,σ^2)
 Nilai Korelasi (ρ)
Nilai korelasi adalah -1 < ρ < 1
REGRESI, DUMMY, COLINIER (1)
 Regresi Linier
hanya untuk 1 respon dan 1 predictor
a. Regreseion melalui stat
b. Graph Scaterplot antara y dan x
 Dummy Variabel
untuk 1 respon dan 2 predictor (Independen
variabel)
a. regresion melalui stat
b. graph scaterplot with version in
group, y dan x dan categorical overlaid
REGRESI, DUMMY, COLINIER (2)
 Colinier
untuk mengetahui apakah prediktor yang satu
berkorelasi dengan prediktor yang lain dan
mempengaruhi respon ?
teridri dari 1 respon dan beberapa prediktor
a. Basic Stat corelation
b. Stat Regresi y vs x1, y vs x2, y vs x1,x2
PENAMBAHAN VARIABEL

 Penambahan Variabel
Awalnya 1 respon dan 1 predictor kemudian
ditambah menjadi 1 respon dan 2 predictor,
lihat pengaruhnya pada regresi.
 Stat Regresion
Analysis of Variance

Analysis of Variance
for comparing all 5 brands

Source DF SS MS F P
Brand 4 1174.8 293.7 7.95 0.000
Error 45 1661.7 36.9
Total 49 2836.5

The P-value is small (0.000, to three decimal places), so reject


the null hypothesis. There is sufficient evidence to conclude
that at least one brand is different from the others.
ANOVA Table for Study #1
“F” means “F test statistic”
One-way Analysis of Variance

Source DF SS MS F P
Factor 2 2510.5 1255.3 93.44 0.000
Error 12 161.2 13.4
Total 14 2671.7
P-Value

“Source” means “the source of the variation in the data”

“DF” means “the degrees of freedom”


“SS” means “the sum of squares”
“MS” means “mean sum of squares”
ANOVA Table for Study #1

One-way Analysis of Variance

Source DF SS MS F P
Factor 2 2510.5 1255.3 93.44 0.000
Error 12 161.2 13.4
Total 14 2671.7

“Factor” means “Variability between groups” or “Variability due to


the factor (or treatment) of interest”

“Error” means “Variability within groups” or “unexplained random


error”
“Total” means “Total variation from the grand mean”
General ANOVA Table

One-way Analysis of Variance

Source DF SS MS F P
Factor m-1 SS(Between) MSB MSB/MSE
Error n-m SS(Error) MSE
Total n-1 SS(Total)
From F-distribution
with m-1 numerator and
n-m denominator d.f.

MSB = SS(Between)/(m-1)
n-1 = (m-1) + (n-m) MSE = SS(Error)/(n-m)

SS(Total) = SS(Between) + SS(Error)


ANOVA Table for Study #1

One-way Analysis of Variance

Source DF SS MS F P
Factor 2 2510.5 1255.3 93.44 0.000
Error 12 161.2 13.4
Total 14 2671.7

1255.3 = 2510.5/2
13.4 = 161.2/12
14 = 2 + 12 93.44 = 1255.3/13.4
2671.7 = 2510.5 + 161.2

Anda mungkin juga menyukai