Anda di halaman 1dari 17
University of Indonesia
University of Indonesia

Tugas Kokurikuler V Mata Kuliah ‘Analisis Regresi Linear’

Dosen Pengajar : Pandu Riono, MD, MPH, PhD

TTrraannssffoorrmmaassii ddaann UUjjii DDiiaaggnnoossttiikk

Oleh :

Iswandi

0806470421

iswandi_2k@yahoo.com

Program Pascasarjana Departemen Biostatistik dan Kependudukan Fakultas Kesehatan Masyarakat Universitas Indonesia

Depok, 09 Mei 2009

1 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Permasalahan :

Iswandi NPM : 0806470421

09/05/2009

Dengan menggunakan data studi ‘framingham.dta’, lakukanlah uji diagnostik terhadap model

garis-lurus regresi hubungan antara bmi (IV), scl (IV), age (IV) dengan sbp (DV) untuk melihat

apakah asumsi regresi linear terpenuhi atau tidak. Selanjutnya lakukanlah transformasi data yang

sesuai dan lakukan pengujian kembali untuk membandingkan hasil yang diperoleh tersebut

sebelum dilakukan transformasi.

Penyelesaian :

Langkah 1 :

membuat model persamaan (tanpa transformasi)

. reg sbp bmi scl age

Source |

SS

df

MS

Number of obs =

4658

-------------+------------------------------

F(

3,

4654) =

466.53

Model | 559523.535

3

186507.845

Prob > F

=

0.0000

Residual | 1860541.97 4654 399.772662

R-squared

=

0.2312

-------------+------------------------------ Adj R-squared = 0.2307

19.994

Total |

2420065.5 4657 519.661908

Root MSE

=

------------------------------------------------------------------------------

sbp |

Coef.

Std. Err.

t

P>|t|

[95% Conf. Interval]

-------------+----------------------------------------------------------------

bmi |

1.430483

.0733931

19.49

0.000

1.286598

1.574368

scl |

.0456311

.0068878

6.62

0.000

.0321277

.0591344

age |

.8691387

.0363358

23.92

0.000

.7979032

.9403741

_cons |

45.68798

2.448022

18.66

0.000

40.8887

50.48726

------------------------------------------------------------------------------

Persamaan regresi hubungan antara indeks mass tubuh (bmi), serum kolesterol (scl), umur (age) terhadap tekanan darah sistolic (sbp) sebagai berikut :

sbp = 45.687+ 1.430 (bmi) + 0.045 (scl) + 0.869 (age)

Langkah 2 :

Melakukan uji diagnostik

1. Uji Normalitas

. predict r, resid

(41 missing values generated)

. kdensity r, normal

2 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Kernel density estimate -50 0 50 100 150 Residuals Kernel density estimate Normal density kernel
Kernel density estimate
-50
0
50
100
150
Residuals
Kernel density estimate
Normal density
kernel = epanechnikov, bandwidth = 2.8503
.005
.015
.025
.01
.02
0

Setelah melakukan predict terhadap residual dan menampilkannya dengan bentuk kernel density plot seperti di atas. Nampak bahwa garis estimasi kernel tersebut tidak berhimpit dengan garis fungsi normal, sehingga dapat diduga bahwa residual tidak terdistribusi normal.

.

pnorm r

.

qnorm r

0.00 0.25 0.50 0.75 1.00 -100 -50 0 50 100 Empirical P[i] = i/(N+1) Inverse
0.00
0.25
0.50
0.75
1.00
-100
-50
0
50
100
Empirical P[i] = i/(N+1)
Inverse Normal
0.00
0.25
0.50
1.000.75
-50
100
150
50
0

Dari perintah pnorm diperoleh grafik P-P plot (standardized normal probability) sementara qnorm memperlihatkan grafik invers-nya. Nampak dari kedua grafik tersebut bahwa residual terdistribusi di sekitar garis normal, akan tetapi juga terlihat banyak titik yang menyimpang jauh dari garis tersebut sehingga diduga kuat residual, terdistribusi tidak normal.

3 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

. swilk r

Iswandi NPM : 0806470421

Shapiro-Wilk W test for normal data

Prob>z

-------------+--------------------------------------------------

0.00000

Variable |

r

|

Obs

4658

W

V

z

0.94500

139.895

12.936

09/05/2009

Cara lain untuk melihat normalitas dengan menggunakan uji Shapiro wilk, apabila nilai p > 0.05 maka data terdistribusi normal. Nampak pada output di atas nilai p sangat kecil (0.00001) dengan demikian kita menolak nilai r terdistrusi normal atau dengan kata lain nilai residual tidak terdistribusi normal. 2. Uji Homoskedastisitas

. rvfplot, yline(0)

100 120 140 160 180 Fitted values -50 100 150 50 0
100
120
140
160
180
Fitted values
-50
100
150
50
0

Salah satu cara untuk mendeteksi adanya heteroskedastisitas adalah metode grafik yaitu dengan memplot residual dengan nilai yang diharapkan. Dari grafik rvfplot di atas nampak bahwa data terdistribusi tidak seimbang dari titik 0 dan cenderung meruncing kesebelah kiri, hal ini mengindikasikan adanya heterokedastisitas.

. hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of sbp

chi2(1)

=

365.53

Prob > chi2

=

0.0000

4 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Dari uji di atas, apabila nilai p lebih kecil dari 0.05 maka Ho ditolak yang berarti Hipotesis alternatif diterima yaitu varians tidak homogen. Dari hasil output di atas p(0.00001) maka dapat disimpulkan data menunjukkan heteroskedastisitas.

3. Uji Multikolienaritas

. vif

1/VIF

-------------+----------------------

Variable |

VIF

age |

1.11

0.901448

scl |

1.10

0.911595

bmi |

1.04

0.957317

-------------+----------------------

Mean VIF |

1.08

Dari output vif (variance inflation factor) di atas nampak bahwa seluruh nilai vif-nya lebih kecil dari 10, demikian juga nilai toleransi vif (1/vif) yang mendekati nilai 1, hal ini mengindikasikan tidak adanya kolinearitas. Dengan demikian dapat disimpulkan bahwa tidak ada hubungan antara masing-masing variabel independen di atas.

4. Uji Linearitas

. reg sbp bmi scl age . acprplot bmi, lowess lsopts(bwidth(1)) 20 30 40 50
.
reg sbp bmi scl age
.
acprplot bmi, lowess lsopts(bwidth(1))
20
30
40
50
60
Body Mass Index
.
acprplot scl, lowess lsopts(bwidth(1))
-50
100
150
50
0

5 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

100 200 300 400 500 600 Serum Cholesterol -50 100 150 50 0
100
200
300
400
500
600
Serum Cholesterol
-50
100
150
50
0

. acprplot age, lowess lsopts(bwidth(1))

30 40 50 60 70 Age in Years -50 100 150 50 0
30
40
50
60
70
Age in Years
-50
100
150
50
0

Secara umum, baik pada plot pertama, kedua dan ketiga di atas nampak garis sangat dekat berdekatan dengan garis pola regresi. Walaupun nampak juga pada plot pertama, kedua dan ketiga ada sedikit masalah yang mungkin disebabkan oleh beberapa titik observasi yang jauh dari mean. Akan tetapi secara umum, nampak grafik tidak terlalu buruk sehingga dapat diduga hubungan antar variabel bmi, scl dan age tetap memperlihatkan hubungan yang linear.

. nlcheck bmi scl age

Nonlinearity test:

F(

9,

4645) =

0.94

Prob > F =

0.4881

6 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Dengan perintah tambahan nlcheck.ado di atas, dapat dilakukan uji non linearitas. Dari perintah

tersebut diperoleh nilai p 0.4881 dengan demikian asumsi linear tidak dapat ditolak atau dengan

kata lain hubungan antar variabel bmi, scl dan age memperlihatkan hubungan yang linear.

Tabel 1 : Kesimpulan uji diagnostik model regresi (tanpa transformasi)

Komponen

Asumsi

Metode

Hasil Pengujian

Kesimpulan

Residu

Normality (residu

kdensity

Tidak berhimpit (berbeda)

Tidak terpenuhi

terdistribusi

pnorm

Di

sekitar diagonal tapi ada outlier

normal)

qnorm

Di

sekitar diagonal tapi ada outlier

 

swilk

p

< 0.05

Residu

Homoskedastisitas (varian residu homogeny)

rvfplot

Tidak simetris pada titik 0, cenderung ke kiri

Tidak terpenuhi

hettest

p

< 0.05

Var.

Tidak ada Multikolinearitas (tidak ada korelasi antar var. independen)

vif

p

< 10

Terpenuhi

independen

toleransi

Mendekati 1 dan > 0.1

Var. dependen

Linearitas

Acprplot

Mengikuti pola regresi tapi tidak simetris pada garis diagonal

Terpenuhi

dan

(Hubungan var.

independen

dependen dan

nlcheck

p

> 0.05

independen

linear)

Langkah 3 :

Melakukan transformasi data

Untuk pemilihan jenis transformasi yang tepat digunakan perintah ladder dan gladder

1. Variabel bmi

.

ladder bmi

.

gladder bmi

Transformation

------------------------------------------------------------------

formula

chi2(2)

P(chi2)

cubic

bmi^3

.

.

square

bmi^2

.

.

identity

bmi

.

0.000

square root

sqrt(bmi)

.

0.000

log

log(bmi)

.

0.000

1/(square root)

1/sqrt(bmi)

9.42

0.009

inverse

1/bmi

32.87

0.000

1/square

1/(bmi^2)

.

0.000

1/cubic

1/(bmi^3)

.

0.000

7 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

cubic square identity 0 50000 100000150000200000 0 1000 2000 3000 4000 20 30 40 50
cubic
square
identity
0
50000 100000150000200000
0
1000
2000
3000
4000
20
30
40
50
60
sqrt
log
1/sqrt
4
5
6
7
8
2.5
3
3.5
4
-.25
-.2
-.15
-.1
inverse
1/square
1/cubic
-.06
-.05
-.04
-.03
-.02
-.004
-.003
-.002
-.001
0
-.00025-.0002-.00015-.0001-.00005 0
Body Mass Index
Histograms by transformation
2.0e-054.0e-056.0e-05
20
40 60
80
.2 .4 .6 .8
0
0
1
0
5.0e-04
.0015 .0025
.001
.002
200400600800
1.5
2.5
.5
0
0
1
2
0
1.0e+041.5e+042.0e+04
5000
.02.04.06.08
10
20
30
.1
0
0
0

Berdasarkan output ladder di atas, maka untuk variabel bmi nampak bahwa yang memiliki nilai chi-square terkecil adalah model 1/sqrt(bmi). Juga pada output gladder, nampak bahwa model 1/sqrt(bmi) akan membantu bmi terdistribusi normal. Selanjutnya dilakukan proses transformasi

. gen bmi1sqrt = 1/sqrt(bmi) (9 missing values generated)

.

kdensity bmi1sqrt, normal

.

kdensity bmi, normal

Sebelum transformasi

Setelah transformasi

Kernel density estimate Kernel density estimate 10 20 30 40 50 60 .1 .15 .2
Kernel density estimate
Kernel density estimate
10
20
30
40
50
60
.1
.15
.2
.25
Body Mass Index
bmi1sqrt
Kernel density estimate
Kernel density estimate
Normal density
Normal density
kernel = epanechnikov, bandwidth = 0.6397
kernel = epanechnikov, bandwidth = 0.0025
.02
.04
.06
.08
.1
0
10
15
20
25
0
5

8 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

2. Variabel scl

. ladder scl

Transformation

------------------------------------------------------------------

formula

chi2(2)

P(chi2)

09/05/2009

cubic

scl^3

.

.

square

scl^2

.

.

identity

scl

.

0.000

square root

sqrt(scl)

.

0.000

log

log(scl)

15.46

0.000

1/(square root)

1/sqrt(scl)

44.19

0.000

inverse

1/scl

.

0.000

1/square

1/(scl^2)

.

0.000

1/cubic

1/(scl^3)

.

.

. gladder scl

cubic square identity 0 5.00e+071.00e+081.50e+082.00e+08 0 100000 200000 300000 100 200 300 400 500 600
cubic
square
identity
0
5.00e+071.00e+081.50e+082.00e+08
0
100000
200000
300000
100
200
300
400
500
600
sqrt
log
1/sqrt
10
15
20
25
4.5
5
5.5
6
6.5
-.09 -.08 -.07
-.06 -.05 -.04
inverse
1/square
1/cubic
-.008
-.006
-.004
-.002
-.00008-.00006-.00004-.00002
0
-6.00e-07-4.00e-07-2.00e-07
0
Serum Cholesterol
Histograms by transformation
2.0e-084.0e-086.0e-088.0e-08
100200300400500
.1
.2
.3
0
0
0
2.0e+044.0e+046.0e+04
5.0e-061.0e-05
1.5e-05
2.0e-05
2.5e-05
1.5
.5
0
0
1
2
0
2.0e+064.0e+066.0e+068.0e+06
.002.004.006.008
.01
20
40 60
80
0
0
0

Dilakukan transformasi data

. gen logscl = log(scl)

(33 missing values generated)

9 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Kernel density estimate (setelah transformasi) Kernel density estimate (sblm transformasi) 100 200 300 400 500
Kernel density estimate (setelah transformasi)
Kernel density estimate (sblm transformasi)
100
200
300
400
500
600
4.5
5
5.5
6
6.5
Serum Cholesterol
logscl
Kernel density estimate
Kernel density estimate
Normal density
Normal density
kernel = epanechnikov, bandwidth = 7.1428
kernel = epanechnikov, bandwidth = 0.0317
.002
.006 .008.004
.01
0
1.5
.5
0
1
2

Model terbaik untuk normalisasi variabel scl digunakan log transformation. 3. Variabel age

. ladder age

Transformation

------------------------------------------------------------------

formula

chi2(2)

P(chi2)

cubic

age^3

.

0.000

square

age^2

.

0.000

identity

age

.

.

square root

sqrt(age)

.

.

log

log(age)

.

.

1/(square root)

1/sqrt(age)

.

.

inverse

1/age

.

0.000

1/square

1/(age^2)

.

0.000

1/cubic

1/(age^3)

.

0.000

. gladder age

0

0

3

2

1

0

0

cubic 5.0e-061.0e-05 0 2.0e-044.0e-046.0e-048.0e-04
cubic
5.0e-061.0e-05
0
2.0e-044.0e-046.0e-048.0e-04

square

.01.02.03.04.05
.01.02.03.04.05
identity
identity

0

100000

200000

300000

1000

2000

3000

4000

5000

30

40

50

60

70

sqrt

 

log

1/sqrt

5 6 7 8 inverse -.035 -.03 -.025 -.02 -.015 100 150 50 .2 .4
5
6
7
8
inverse
-.035
-.03
-.025
-.02
-.015
100 150
50
.2
.4
.6
.8
0
0
100020003000

Histograms by transformation

10 20 30 40
10
20 30
40
3.4 3.6 3.8 4 4.2 1/square 2.0e+044.0e+046.0e+048.0e+041.0e+05
3.4
3.6
3.8
4
4.2
1/square
2.0e+044.0e+046.0e+048.0e+041.0e+05

-.0012-.001 -.0008-.0006-.0004-.0002

Age in Years

-.18 -.16 -.14 -.12 1/cubic -.00004-.00003-.00002-.00001 0 0 0
-.18
-.16
-.14
-.12
1/cubic
-.00004-.00003-.00002-.00001
0
0
0

10 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Berdasarkan hasil di atas, proses transformasi kurang membantu normalisasi sehingga variabel age tidak dilakukan transformasi. 4. Variabel sbp

. ladder sbp

Transformation

------------------------------------------------------------------

formula

chi2(2)

P(chi2)

cubic

sbp^3

.

.

square

sbp^2

.

.

identity

sbp

.

0.000

square root

sqrt(sbp)

.

0.000

log

log(sbp)

.

0.000

1/(square root)

1/sqrt(sbp)

.

0.000

inverse

1/sbp

17.39

0.000

1/square

1/(sbp^2)

.

0.000

1/cubic

1/(sbp^3)

.

0.000

. gladder sbp

cubic square identity 0 50000001.00e+071.50e+072.00e+07 0 20000 40000 60000 80000 100 150 200 250 300
cubic
square
identity
0
50000001.00e+071.50e+072.00e+07
0
20000 40000 60000 80000
100
150
200
250
300
sqrt
log
1/sqrt
8
10
12
14
16
4.5
5
5.5
-.11
-.1
-.09
-.08
-.07
-.06
inverse
1/square
1/cubic
-.012
-.01
-.008 -.006 -.004
-.00015
-.0001
-.00005
0
-2.00e-06-1.50e-06-1.00e-06-5.00e-07
0
Systolic Blood Pressure
Histograms by transformation
1.0e-072.0e-073.0e-074.0e-075.0e-07
100200300400
.2
.4
.6
0
0
0
1.0e+042.0e+043.0e+04
2.0e-054.0e-056.0e-058.0e-051.0e-04
0
0
1
2
3
0
5.0e+051.0e+061.5e+062.0e+06
.005
.015
.025
.01
.02
20
40 60
80
0
0
0

Dilakukan inverse transformation

gen invsbp = 1/sbp

11 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Kernel density estimate (sebelum transformasi) Kernel density estimate (setelah transformasi) .004 .006 .008 .01
Kernel density estimate (sebelum transformasi)
Kernel density estimate (setelah transformasi)
.004
.006
.008
.01
.012
50
100
150
200
250
300
invsbp
Systolic Blood Pressure
Kernel density estimate
Kernel density estimate
Normal density
Normal density
kernel = epanechnikov, bandwidth = 0.0002
kernel = epanechnikov, bandwidth = 3.4434
.005
.015
.01
.02
0
200 300100
400
0

Nampak bahwa variabel sbp dapat lebih dinormalisasi dengan inverse transformation.

Tabel 2 : kesimpulan transformasi yang dipilih

Nama variabel

Jenis transformasi yang dipilih

bmi (body mass index)

1/(square root)

scl (serum kolesterol)

Log

age (umur)

Angka sebenarnya

sbp (tekanan darah sistolik)

inverse

Langkah 4 :

Melakukan uji diagnostik kembali (dengan data tertransformasi)

. reg invsbp bmi1sqrt logscl age

Source |

SS

df

MS

Number of obs =

4658

-------------+------------------------------

F(

3,

4654) =

490.90

Model | .001590522

3 .000530174

Prob > F

=

0.0000

Residual | .005026355 4654 1.0800e-06

R-squared

=

0.2404

-------------+------------------------------

.006616877 4657 1.4208e-06

Total |

Adj R-squared = 0.2399 =

.00104

Root MSE

------------------------------------------------------------------------------

invsbp |

Coef.

Std. Err.

t

P>|t|

[95% Conf. Interval]

-------------+----------------------------------------------------------------

bmi1sqrt |

.021298

.0010273

20.73

0.000

.0192839

.023312

logscl | -.0006378

.0000839

-7.60

0.000

-.0008023

-.0004734

age |

-.0000437

1.89e-06

-23.07

0.000

-.0000474

-.00004

_cons |

.0089486

.0005122

17.47

0.000

.0079445

.0099528

------------------------------------------------------------------------------

12 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

1. Uji Normalitas

. predict r2, resid

(41 missing values generated)

. kdensity r2, normal

Iswandi NPM : 0806470421

09/05/2009

Kernel density estimate -.004 -.002 0 .002 .004 Residuals Kernel density estimate Normal density kernel
Kernel density estimate
-.004
-.002
0
.002
.004
Residuals
Kernel density estimate
Normal density
kernel = epanechnikov, bandwidth = 0.0002
100
200
300
400
0

Setelah dilakukan transformasi, nampak bahwa garis residual lebih berhimpit dengan garis fungsi normal sehingga dapat diduga kuat bahwa residual terdistribusi secara normal.

.

pnorm r2

.

qnorm r2

0.00 0.25 0.50 0.75 1.00 -.004 -.002 0 .002 .004 Empirical P[i] = i/(N+1) Inverse
0.00
0.25
0.50
0.75
1.00
-.004
-.002
0
.002
.004
Empirical P[i] = i/(N+1)
Inverse Normal
0.00
0.25
0.50
1.000.75
-.004
-.002
.002
.004
0

13 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Setelah dilakukan transformasi, baik grafik P-P plot maupun grafik inversnya memperlihatkan garis yang lebih baik dibandingkan sebelumnya dimana nampak bahwa garis residual tersebut di sekitar garis diagonal sehingga diduga kuat residual terdistribusi normal.

. swilk r2

Shapiro-Wilk W test for normal data

Prob>z

-------------+--------------------------------------------------

0.00135

Variable |

r2 |

Obs

4658

W

V

z

0.99876

3.144

2.999

Setelah dilakukan transformasi, uji Shapiro wilk memperlihatkan nilai p yang lebih baik (0.00135) dibandingkan sebelum transformasi, namun angka tersebut tetaplah signifikan pada 0.05, sehingga disimpulkan residual tetap tidak terdistribusi normal. Dalam kasus di atas, ternyata metode grafik dan metode analitis dengan Shapiro wilk memperlihatkan hasil yang tidak sama. Pada kondisi kasus yang demikian maka peneliti dapat saja memilih salah satu metode untuk interpretasinya. Dalam latihan ini, penulis memilih menggunakan metode grafik karena alasan graphic need somewhat of an art. Dengan demikian disimpulkan bahwa residual terdistribusi secara normal.

2. Uji Homoskedastisitas

. rvfplot, yline(0)

.006 .007 .008 .009 .01 Fitted values -.004 -.002 .002 .004 0
.006
.007
.008
.009
.01
Fitted values
-.004
-.002
.002
.004
0

14 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Setelah dilakukan transformasi, maka dari grafik rvfplot nampak data terdistribusi lebih menyebar simetris tanpa pola tertentu berada di sekitar nilai 0, hal ini mengindikasikan kecenderungan homoskedastisitas.

. hettest

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of invsbp

chi2(1)

=

16.24

Prob > chi2

=

0.0001

Dengan uji Breusch-Pagan / Cook-Weisberg di atas, terlihat nilai p yang lebih baik dibandingkan hasil sebelum dilakukan transformasi pada data. Namun hasil tersebut tetaplah signifikan pada 0.05 sehingga varians disimpulkan tetap tidak homogen. Akan tetapi sesuai dengan kesepakatan sebelumnya yaitu bahwa pada latihan ini lebih menekankan penggunaan metode grafik dalam pengambilan keputusan, maka dapat disimpulkan data menunjukkan homokedastisitas. 3. Uji Multikolienaritas

. vif

1/VIF

-------------+----------------------

Variable |

VIF

age |

1.12

0.896172

logscl |

1.11

0.902136

bmi1sqrt |

1.05

0.951301

-------------+----------------------

Mean VIF |

1.09

Setelah dilakukan transformasi, dari output vif (variance inflation factor) di atas nampak bahwa seluruh nilai vif-nya lebih kecil dari 10, demikian juga nilai toleransi vif (1/vif) yang mendekati nilai 1, hal ini mengindikasikan tidak adanya kolinearitas. Dengan demikian dapat disimpulkan bahwa tidak ada hubungan antarvariabel independen.

.

reg invsbp bmi1sqrt logscl age

.

acprplot bmi1sqrt, lowess lsopts(bwidth(1))

15 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

.1 .15 .2 .25 bmi1sqrt .008.004 .006 .012 .014 .01
.1
.15
.2
.25
bmi1sqrt
.008.004
.006
.012
.014
.01
. acprplot logscl, lowess lsopts(bwidth(1)) 4.5 5 5.5 6 6.5 logscl . acprplot age, lowess
.
acprplot logscl, lowess lsopts(bwidth(1))
4.5
5
5.5
6
6.5
logscl
.
acprplot age, lowess lsopts(bwidth(1))
-.008
-.006
-.004
-.002
.002
0
30 40 50 60 70 Age in Years -.006 -.004 -.002 .002 0
30
40
50
60
70
Age in Years
-.006
-.004
-.002
.002
0

16 Analisis Regresi Linear - Transformasi & Uji Asumsi Regresi

Iswandi NPM : 0806470421

09/05/2009

Setelah dilakukan transformasi, baik pada plot pertama, kedua dan ketiga di atas nampak garis

sangat dekat berdekatan dengan garis pola regresi. Walaupun nampak juga pada plot pertama,

kedua dan ketiga ada sedikit masalah yang mungkin disebabkan oleh beberapa titik observasi

yang jauh dari mean. Akan tetapi secara umum, nampak grafik tidak terlalu buruk sehingga dapat

diduga hubungan antar variabel bmi, scl dan age tetap memperlihatkan hubungan yang linear.

Nonlinearity test:

F(

9,

4645) =

1.43

Prob > F =

0.1687

Setelah proses transformasi, Dari perintah nlcheck di atas diperoleh hasil nilai p 0.1687 dengan

demikian asumsi linear tidak dapat ditolak atau dengan kata lain hubungan antar variabel bmi, scl

dan age memperlihatkan hubungan yang linear.

Tabel 3 : Kesimpulan uji diagnostik model regresi (setelah transformasi)

Komponen

Asumsi

Metode

Hasil Pengujian

Kesimpulan

Residu

Normality (residu

kdensity

Berhimpit (nyaris sama) Berada di diagonal tdk ada outlier Berada di sekitar garis diagonal

Terpenuhi

terdistribusi

pnorm

normal)

qnorm

 

swilk

p

< 0.05

Residu

Homoskedastisitas (varian residu homogeny)

rvfplot

Cenderung simetris pada titik 0, tanpa pola tertentu

Terpenuhi

hettest

p

< 0.05

Var.

Tidak ada Multikolinearitas (tidak ada korelasi antar var. independen)

vif

p

< 10

Terpenuhi

independen

toleransi

Mendekati 1 dan > 0.1

Var. dependen

Linearitas

Acprplot

Mengikuti pola regresi cenderung

Terpenuhi

dan

(Hubungan var.

lebih simetris pada garis diagonal

independen

dependen dan

nlcheck

p

> 0.05

independen

linear)