Perbandingan
Dua Garis Regresi
Oleh :
Iswandi
0806470421
iswandi_2k@yahoo.com
Program Pascasarjana
Departemen Biostatistik dan Kependudukan
Fakultas Kesehatan Masyarakat
Universitas Indonesia
Public Health - University of Indonesia Kampus UI, Depok 16424 Indonesia http://www.fkm. ui. ac.id/
Iswandi
1 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
Permasalahan :
Lakukanlah perbandingan model dua garis-lurus regresi dengan menggunakan data studi
Framingham ‘Fram.dta’. Masing-masing variabel yang akan dihubungkan adalah :
1. sbp (Y) dan bmi (X) pada tiap kategori sex (Z)
2. sbp (Y) dan scl (X) pada tiap kategori sex (Z)
3. sbp (Y) dan bmi (X) pada tiap kategori umur (Z)
4. sbp (Y) dan scl (X) pada tiap kategori umur (Z)
keterangan untuk kategori sbb :
sex : kode 1 = laki-laki
kode 0 = Perempuan
age : kode 1 = range antara umur termuda sampai dengan di bawah (<) nilai kuartil pertama
(25%) umur pasien.
kode 2 = nilai kuartil pertama sd di bawah (<) nilai kuartil ketiga (75%) umur pasien
kode 3 = nilai kuartil ketiga sd umur tertua pasien.
Iswandi
2 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
Penyelesaian :
Deskripsikan data
Transformasi data
S Uji NS Kesimpulan :
Coincidence Coincedence
NS Uji S
Parallelism
Yes Kesimpulan :
Uji unt kesama- No
Garis tidak parallel
an intersep & intersep tidak sama
S NS Kesimpulan :
Menggunakan var. Garis tidak parallel
terakhir & intersep sama
Kesimpulan :
Garis tidak parallel
& intersep tidak sama
Kesimpulan :
Garis parallel tetapi
tidak coincidence STOP
Iswandi
3 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
. sum
Informasi tindak-lanjut (follow up) penyakit jantung koroner atau CHD (coronary heart disease) :
9. followup = Masa follow up terhadap subjek dalam hari
10. chdfate = 1: jika subjek terpapar CHD hingga akhir masa follow-up dan 0: bila tidak.
Untuk variabel age dilakukan perintah generate dan recode untuk kepentingan kategorisasi.
. gen agegroup = age
Age in Years
-------------------------------------------------------------
Percentiles Smallest
1% 32 30
5% 34 31
10% 35 31 Obs 4699
25% 39 31 Sum of Wgt. 4699
Selanjutnya juga dilakukan log transformation terhadap variabel yang diduga berinteraksi :
. gen bmisex = logbmi*sex
(9 missing values generated)
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3985947 .0173722 22.94 0.000 .3645371 .4326523
sex | .3950265 .1004207 3.93 0.000 .1981546 .5918983
bmisex | -.1259487 .0309746 -4.07 0.000 -.1866735 -.0652238
_cons | 3.593017 .0560033 64.16 0.000 3.483224 3.70281
------------------------------------------------------------------------------
Persamaan regresi hubungan antara indeks mass tubuh (bmi) dan jenis kelamin (sex) terhadap
tekanan darah sistolic (sbp) sebagai berikut :
logsbp = 3.593 + 0.398 (logbmi) + 0.395 (sex) - 0.125 (bmisex)
2. Full model 2 : sbp (Y) dan scl (X) pada sex (Z)
. reg logsbp logscl sex sclsex
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logscl | .2539169 .0153908 16.50 0.000 .2237437 .28409
sex | .795477 .1326423 6.00 0.000 .5354354 1.055519
sclsex | -.1473443 .0244971 -6.01 0.000 -.1953703 -.0993183
_cons | 3.501642 .083392 41.99 0.000 3.338154 3.66513
------------------------------------------------------------------------------
Iswandi
6 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
Persamaan regresi hubungan antara serum kolesterol (scl) dan jenis kelamin (sex) terhadap
tekanan darah sistolic (sbp) sebagai berikut :
logsbp = 3.501 + 0.253 (logscl) + 0.795 (sex) - 0.147 (sclsex)
3. Full model 3 : sbp (Y) dan bmi (X) pada kelompok umur (Z)
. xi:reg logsbp logbmi i.agegroup bmiagegr
i.agegroup _Iagegroup_1-3 (naturally coded; _Iagegroup_1 omitted)
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .2835812 .0410088 6.92 0.000 .2031847 .3639777
_Iagegroup_2 | .0263027 .0609803 0.43 0.666 -.0932473 .1458528
_Iagegroup_3 | .0826225 .1229922 0.67 0.502 -.1585 .323745
bmiagegr | .0090356 .0190186 0.48 0.635 -.0282498 .0463209
_cons | 3.864512 .0766483 50.42 0.000 3.714245 4.014779
------------------------------------------------------------------------------
Persamaan regresi hubungan antara indeks mass tubuh (bmi) dan kelompok umur (agegroup)
terhadap tekanan darah sistolic (sbp) sebagai berikut :
logsbp = 3.864 + 0.283 (logbmi) + 0.026 (agegroup2) + 0.082 (agegroup3) + 0.009 (bmiagegr)
4. Full model 4 : sbp (Y) dan scl (X) pada kelompok umur (Z)
. xi:reg logsbp logscl i.agegroup sclagegr
i.agegroup _Iagegroup_1-3 (naturally coded; _Iagegroup_1 omitted)
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logscl | .1869181 .0352553 5.30 0.000 .117801 .2560352
_Iagegroup_2 | .2255884 .0881367 2.56 0.011 .0527988 .3983779
_Iagegroup_3 | .4899277 .1785144 2.74 0.006 .1399551 .8399003
sclagegr | -.0320994 .0165083 -1.94 0.052 -.0644636 .0002647
_cons | 3.975151 .1092194 36.40 0.000 3.76103 4.189273
------------------------------------------------------------------------------
Persamaan regresi hubungan antara serum kolesterol (scl) dan kelompok umur (agegroup)
terhadap tekanan darah sistolic (sbp) sebagai berikut :
logsbp = 3.975 + 0.186 (logscl) + 0.225 (agegroup2) + 0.489 (agegroup3) - 0.032 (sclagegr)
Iswandi
7 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3551821 .0143571 24.74 0.000 .3270354 .3833289
_cons | 3.727192 .046451 80.24 0.000 3.636126 3.818258
------------------------------------------------------------------------------
Iswandi
8 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .358977 .0144065 24.92 0.000 .3307334 .3872205
sex | -.0128971 .0044831 -2.88 0.004 -.0216861 -.0041081
_cons | 3.720557 .0464723 80.06 0.000 3.62945 3.811665
------------------------------------------------------------------------------
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3985947 .0173722 22.94 0.000 .3645371 .4326523
sex | .3950265 .1004207 3.93 0.000 .1981546 .5918983
bmisex | -.1259487 .0309746 -4.07 0.000 -.1866735 -.0652238
_cons | 3.593017 .0560033 64.16 0.000 3.483224 3.70281
------------------------------------------------------------------------------
Tiga model di atas, bila disederhanakan hasilnya sbb :
Tabel 1 : Ringkasan model sbp (Y) dan bmi (X) pada sex (Z)
Source df SS MS F
Regression (X) 1 14.0924231 14.0924231 612.02
Residual 4688 107.946032 .023026031
Rumus Coincidence :
Regression SS X,Z,XZ − Regression SS X /2
F (XZ, Z |X) =
MS residual (X,Z,XZ )
(14.661556 −14.0924231 )/2
= = 12.41867
0.022914404
. display invF(2,4686,0.95)
2.9976482
. display Ftail(2,4686,12.41867)
4.177e-06
Nilai F di atas dibandingkan dengan F tabel pada F2,4686,0.95 = 2.99, karena F hitung > F tabel maka
dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F2,4686 = 4.177e-06
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
kedua garis lurus tidak berhimpit (not coincident).
2. sbp (Y) dan scl (X) pada sex (Z)
Dengan cara yang sama seperti poin 1 di atas, maka diperoleh hasil sebagai berikut :
Tabel 2 : Ringkasan model sbp (Y) dan scl (X) pada sex (Z)
Source df SS MS F
Regression (X) 1 6.53358301 6.53358301 265.57
Residual 4664 114.746244 .024602539
. display Ftail(2,4663,18.16921)
1.380e-08
Iswandi
10 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
Nilai F di atas dibandingkan dengan F tabel pada F2,4663,0.95 = 2.99, karena F hitung > F tabel maka
dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F2,4686 = 1.380e-08
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
kedua garis lurus tidak berhimpit (not coincident).
3. sbp (Y) dan bmi (X) pada kelompok umur (Z)
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3551821 .0143571 24.74 0.000 .3270354 .3833289
_cons | 3.727192 .046451 80.24 0.000 3.636126 3.818258
------------------------------------------------------------------------------
. xi:reg logsbp logbmi i.agegroup
i.agegroup _Iagegroup_1-3 (naturally coded; _Iagegroup_1 omitted)
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .3019411 .0137208 22.01 0.000 .275042 .3288402
_Iagegroup_2 | .0551687 .0051939 10.62 0.000 .0449862 .0653513
_Iagegroup_3 | .1409874 .0059218 23.81 0.000 .1293779 .1525969
_cons | 3.834713 .0440516 87.05 0.000 3.748351 3.921075
------------------------------------------------------------------------------
. xi:reg logsbp logbmi i.agegroup bmiagegr
i.agegroup _Iagegroup_1-3 (naturally coded; _Iagegroup_1 omitted)
------------------------------------------------------------------------------
logsbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
logbmi | .2835812 .0410088 6.92 0.000 .2031847 .3639777
_Iagegroup_2 | .0263027 .0609803 0.43 0.666 -.0932473 .1458528
_Iagegroup_3 | .0826225 .1229922 0.67 0.502 -.1585 .323745
bmiagegr | .0090356 .0190186 0.48 0.635 -.0282498 .0463209
_cons | 3.864512 .0766483 50.42 0.000 3.714245 4.014779
------------------------------------------------------------------------------
Tabel 3 : Ringkasan model sbp (Y) dan bmi (X) pada kelompok umur (Z)
Source df SS MS F
Regression (X) 1 14.0924231 14.0924231 612.02
Residual 4688 107.946032 .023026031
. display invF(3,4685,0.95)
2.6068047
. display Ftail(3,4685,292.98133)
2.60e-174
Nilai F di atas dibandingkan dengan F tabel pada F3,4685,0.95 = 2.61, karena F hitung > F tabel maka
dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F3,4685 = 2.60e-174
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
kedua garis lurus tidak berhimpit (not coincident).
Dengan cara yang sama seperti poin 3 di atas, maka diperoleh hasil sebagai berikut :
Iswandi
12 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
Tabel 4 : Ringkasan model sbp (Y) dan scl (X) pada kelompok umur (Z)
Source df SS MS F
Regression (X) 1 6.53358301 6.53358301 265.57
Residual 4664 114.746244 .024602539
. display Ftail(3,4661,268.18016)
1.44e-160
Nilai F di atas dibandingkan dengan F tabel pada F3,4661,0.95 = 2.61, karena F hitung > F tabel maka
dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F3,4661 = 1.44e-160
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
kedua garis lurus tidak berhimpit (not coincident).
Rumus Parallelism :
Regression SS X,Z,XZ − Regression SS X,Z
F (XZ | X, Z) =
MS residual (X,Z,XZ )
14.661556 −14.2826922
F (XZ, Z |X) = = 16.5338
0.022914404
. display invF(1,4686,0.95)
3.843444
. display Ftail(1,4686,16.5338)
.00004857
Nilai F di atas dibandingkan dengan F tabel pada F1,4686,0.95 = 3.843, karena F hitung > F tabel
maka dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4686 = .00004857
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
kedua garis lurus tidak paralel atau koefisien kemiringannya tidak sama.
2. sbp (Y) dan scl (X) pada sex (Z)
Iswandi
14 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
7.42106651 −6.53751858
F (XZ, Z |X) = = 36.1773
0.024422728
. display invF(1,4662,0.95)
3.8434543
. display Ftail(1,4662,36.1773)
1.939e-09
Nilai F di atas dibandingkan dengan F tabel pada F1,4662,0.95 = 3.843, karena F hitung > F tabel
maka dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4662 = 1.939e-09
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
kedua garis lurus tidak paralel atau koefisien kemiringannya tidak sama.
3. sbp (Y) dan bmi (X) pada kelompok umur (Z)
26.0925732 −26.0879508
F (XZ, Z |X) = = 0.2257
0.020479399
. display invF(1,4685,0.95)
3.8434445
. display Ftail(1,4685,0.2257)
.63475285
Nilai F di atas dibandingkan dengan F tabel pada F1,4685,0.95 = 3.843, karena F hitung < F tabel
maka dengan demikian Ho gagal ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4685 = 0.63475285
Karena nilai P (0.6347) lebih besar dari 0.05, maka Ho gagal ditolak. Sehingga dapat disimpulkan
ada dua garis lurus pada ketiga kelompok umur tersebut yang paralel atau koefisien
kemiringannya sama.
4. sbp (Y) dan scl (X) pada kelompok umur (Z)
18.375235 −18.2917625
F (XZ, Z |X) = = 3.7808
0.022077793
. display invF(1,4661,0.95)
3.8434547
. display Ftail(1,4661,3.7808)
.05190395
Nilai F di atas dibandingkan dengan F tabel pada F1,4661,0.95 = 3.843, karena F hitung < F tabel
maka dengan demikian Ho gagal ditolak.
Iswandi
15 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
Untuk menguji hipotesis-hipotesis di atas, maka digunakan ringkasan tabel 1 - 4 di atas untuk
masing-masing variabel yang akan dihubungkan.
Variabel yang terlibat dimasukkan secara berurut dalam uji ini, mengikuti formula berikut :
Regression SS Z,X − Regression SS X
F (Z | X) =
MS residual (X,Z,XZ )
Iswandi
16 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
14.2826922 −14.0924231
F (XZ, Z |X) = = 8.3035
0.022914404
. display invF(1,4686,0.95)
3.843444
. display Ftail(1,4686,8.3035)
.00397485
Nilai F di atas dibandingkan dengan F tabel pada F1,4686,0.95 = 3.843, karena F hitung > F tabel
maka dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4686 = .00397485
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
titik potong (intersep) kedua garis lurus regresi tidak sama.
. display Ftail(1,4662,0.1611)
.68816418
Nilai F di atas dibandingkan dengan F tabel pada F1,4662,0.95 = 3.843, karena F hitung < F tabel
maka dengan demikian Ho gagal ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4662 = .68816418
Karena nilai P (0.688) lebih besar dari 0.05, maka Ho gagal ditolak. Sehingga dapat disimpulkan
ada kesamaan titik potong (intersep) kedua garis lurus regresi.
3. sbp (Y) dan bmi (X) pada kelompok umur (Z)
26.0879508 −14.0924231
F (XZ, Z |X) = = 585.7369
0.020479377
. display invF(1,4685,0.95)
3.8434445
. display Ftail(1,4685,585.7369)
4.97e-122
Nilai F di atas dibandingkan dengan F tabel pada F1,4685,0.95 = 3.843, karena F hitung > F tabel
maka dengan demikian Ho ditolak.
Iswandi
17 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
. display invF(1,4661,0.95)
3.8434547
. display Ftail(1,4661,532.5795)
1.14e-111
Nilai F di atas dibandingkan dengan F tabel pada F1,4661,0.95 = 3.843, karena F hitung > F tabel
maka dengan demikian Ho ditolak.
Atau dengan menggunakan nilai P berdasarkan F hitung pada F1,4661 = 1.14e-111
Karena nilai P (0.0001) jauh lebih kecil dari 0.05, maka Ho ditolak. Sehingga dapat disimpulkan
titik potong (intersep) kedua garis lurus regresi tidak sama.
2. sbp (Y) dan scl (X) pada tiap kategori sex (Z)
. twoway (lfit logsbp logscl if sex==0, lcolor(green) lwidth(medthick)) (lfit
logsbp logscl if sex==1, lcolor(blue) lwidth(medthick))
5.1
5.2
5.1
5
Fitted values
Fitted values
5
4.9
4.9
4.8
4.8
4.7
4.7
Nampak dari grafik di atas garis tidak paralel, walaupun demikian perpotongan ada yang simetris.
Iswandi
18 Analisis Regresi Linear - Perbandingan Dua Garis Regresi NPM : 0806470421 17/04/2009
3. sbp (Y) dan bmi (X) pada tiap kategori umur (Z)
. twoway (lfit logsbp logbmi if agegroup==1, lcolor(green) lwidth(medthick))
(lfit logsbp logbmi if agegroup==2, lcolor(blue) lwidth(medthick)) (lfit logsbp
logbmi if agegroup==3, lcolor(red) lwidth(medthick))
4. sbp (Y) dan scl (X) pada tiap kategori umur (Z)
. twoway (lfit logsbp logscl if agegroup==1, lcolor(green) lwidth(medthick))
(lfit logsbp logscl if agegroup==2, lcolor(blue) lwidth(medthick)) (lfit logsbp
logscl if agegroup==3, lcolor(red) lwidth(medthick)
5.2
5
5.1
4.9
Fitted values
Fitted values
5
4.9
4.8
4.8
4.7
4.7
Ket : garis hijau = age group 1 (30-38 thn), garis biru = age group 2 (39-52 thn), age group 3 = (53-68 thn)
Nampak dari grafik di atas adanya dua garis yang paralel, walaupun tidak coincidence.
Langkah 8 : Kesimpulan
1 sbp (Y) dan bmi (X) pada Signifikan Signifikan Signifikan Garis tidak paralel juga
tiap kategori sex (Z) intersepnya tidak sama
2 sbp (Y) dan scl (X) pada Signifikan Signifikan Tidak Garis tidak paralel dan
tiap kategori sex (Z) signifikan intersepnya sama
3 sbp (Y) dan bmi (X) Signifikan Tidak Signifikan Garis Paralel tapi tidak
pada tiap kategori signifikan coincidence
umur (Z)
4 sbp (Y) dan scl (X) pada Signifikan Tidak Signifikan Garis paralel tapi tidak
signifikan coincidence
tiap kategori umur (Z)