Anda di halaman 1dari 14

NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

4 Homework
Read following articles by Sørensen et all. (2009). After reading those two articles, please
answer following questions:

a. From the article by Sørensen et all. (2009), please examine table 1 and provide
assessment regarding the trend of mean GP referrals according to age groups. Use
a scatter-plot between mean of age groups and mean GP referrals. Do you see any
trend? How? Can you create a simple linear regression of this trend? What will
you write this trend? Is your regression valid (does not violate assumption?).
jawab:
Kelompok Mean Mean
umur kelompok umur GP referrals x*y x2 y2
(tahun) (x) (y)
0–9 4,5 11,7 52,7 20,3 136,9
10 – 19 14,5 12,0 174,0 210,3 144,0
20 – 29 24,5 12,0 294,0 600,3 144,0
30 – 39 34,5 14,4 496,8 1190,3 207,4
40 – 49 44,5 14,6 649,7 1980,3 213,2
50 – 59 54,5 13,5 735,8 2970,3 182,3
60 – 69 64,5 11,0 709,5 4160,3 121,0
70 – 79 74,5 6,6 491,7 5550,3 43,6
80+ 80,0 4,3 344,0 6400,0 18,5
total 396,0 100,1 3948,1 23082,0 1210,7
1
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

Variabel bebas : mean kelompok umur


Variabel terikat : mean GP referrals

scatter-plot between mean of age groups and mean GP referrals:

Dari kelompok umur 0 – 9 tahun sampai kelompok umur 40 – 49 tahun mengalami kenaikan
jumlah GP referrals (rujukan praktik umum). Selanjutnya sampai kelompok umur 80 tahun ke
atas mengalami penurunan jumlah rujukan praktik umum secara drastis. Garis linier regresi
menunjukkan korelasi yang berarah negatif antara kedua variabel, bahwa semakin bertambah
umur maka semakin menurun rujukannya. Sedangkan dari segi kekuatan, adalah tidak terlalu
kuat karena titik-titik yang tersajikan relatif menyebar.

Koefisien korelasi (r): -0.6147


p-value: 0.0781
kesimpulan: ada korelasi antara umur dengan rujukan praktik umum yang berarah negatif dan
berkekuatan tidak terlalu kuat.

2
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

simple linear regression of this trend:

Berdasarkan hasil regresi di atas dapat diketahui bahwa R2 = 0.3779 hal ini berarti 37,79% total
variasi dari jumlah rujukan praktik umum dijelaskan oleh kelompok umur, atau apabila
dibandingkan antara nilai observasi dengan estimasi hubungan kedua variabel sebesar 37,79%.
Serta dapat disimpulkan bahwa kelompok umur dan jumlah rujukan praktik umum tidak
berhubungan secara signifikan (p-value 0.078 > 0.05). Apabila dilihat dari nilai coefisien age
(β) dapat dikatakan bila ada 2 orang yang berbeda 1 kategori kelompok umur maka jumlah
rujukan akan turun sebesar 0.0806469 (“akan turun” karena nilai coefisien pada kasus ini
bertanda negatif (-)).

b. In table 3, authors compared many regression models for referrals to private practic-
ing specialists with income, education and occupation. Can you read of each model
and conclude the importance of each independent variable? Which has a stronger
relationship to dependent variables? Why? Explain
jawab:

the importance of each independent variable:


ketiga variabel independen tersebut (income, education, dan occupation), masing-
masing dapat digunakan untuk menyesuaikan (adjusted) nilai-nilai yang berkaitan
dengan variabel dependen. Nilai R2 untuk masing-masing variabel tersebut mengalami
perubahan bila dibandingkan antara yang tidak disesuaikan dengan yang disesuaikan.

3
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

stronger relationship to dependent variables:


income, karena nilai adjusted R2 paling besar (0.45) dibandingkan dengan education
dan juga occupation.
c. On the data from framingham study, check whether cholesterol level is predictor of
systolic blood pressure. Create a simple regression model for the relationship be-
tween systolic blood pressure and serum cholesterol. Examine the data use scatter
plot and check the assumptions of the regression model.
Jawab:
whether cholesterol level is predictor of systolic blood pressure:

Create a simple regression model for the relationship between systolic blood
pressure and serum cholesterol:

Berdasarkan hasil regresi di atas dapat diketahui bahwa R2 = 0.0467 hal ini berarti 4,67% total
variasi dari systolic blood pressure dijelaskan oleh serum cholesterol, atau apabila dibandingkan
antara nilai observasi dengan estimasi hubungan kedua variabel sebesar 4,67%. Serta dapat
disimpulkan bahwa serum cholesterol dan systolic blood pressure berhubungan secara
signifikan (p-value 0.000 < 0.05). Apabila dilihat dari nilai coefisien serum cholesterol (β) dapat
dikatakan bila ada 2 orang yang berbeda 1 kategori serum cholesterol maka systolic blood
pressure akan naik sebesar 0.117672 (“akan naik” karena nilai coefisien pada kasus ini bertanda
negatif (+)).

4
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

scatter plot and check the assumptions of the regression model:

Masih terdapat outlier, kita buktikan juga dengan boxplot

Terdapat outlier, maka cari tahu berapa data yang outlier

5
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

buat variabel dengan nama “outlier” dan membatasi atau menghapus outlier, 78 adalah
batas bawah, 190 adalah batas atas. kemudian cek kembali, apakah masih ada outlier.
Perintah yang digunakan:
gen outlier=( sbp >=78) & ( sbp <=190)
graph box sbp if outlier ==1

Ternyata masih ada 146 data observasi yang terdeteksi sebagai outlier, hal ini adalah
wajar.
6
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

Kemudian dilakukan uji normalitas. Uji statistik yang akan digunakan adalah shapiro-
wilk dan uji grafik yang akan digunakan adalah kernel density. Uji statistik dan uji
grafik saling melengkapi, digunakan untuk memastikan bahwa apakah variabel yang
diuji berdistribusi normal.
Uji statistik: shapiro-wilk

p-value: 0.00000 (distribusi data tidak normal), namun nilai W: 0.97539 (mendekati 1
yang berarti distribusi data normal). Karena masih ada kebingungan menyimpulkan
apakah data berdistribusi normal, maka dilakukan uji grafik kernel density.
Uji grafik: kernel density

Hasil relatif menyerupai kurva normal, maka distribusi data normal.

Karena data sudah terbukti berdistribusi normal, maka kemudian dapat dilakukan
regresi linier.

7
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

Nilai Prob > F: 0.0000 (slope tidak sama dengan 0)


Nilai p> |t|: 0.000 (tidak signifikan)
Nilai R-squared: 0.0437 (dapat memprediksi variasi variabel dependen 4.37%)

Kemudian dilakukan prediksi residual: membandingkan nilai sbp ukur dan sbp yang
diprediksi menggunakan regresi liner. Selisih antara keduanya disebut residu, selisih =
error.

8
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

Dari analisis residual sbp di atas terlihat bahwa, terdapat linier relationship dan
terpenuhi asumsi homoscedasticity.
Berikutnya yang perlu dipastikan kembali adalah apakah data residual sbp berdistribusi
normal.

p-value: 0.00000 (distribusi data tidak normal), namun nilai W: 0.90507 (mendekati 1
yang berarti distribusi data normal). Karena masih ada kebingungan menyimpulkan
apakah data berdistribusi normal, maka dilakukan uji grafik kernel density.
Uji grafik: kernel density

9
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

Hasil relatif menyerupai kurva normal, maka distribusi data normal.

Karena sudah terbukti bahwa data residual sbp terdapat linier relationship dan terpenuhi
asumsi homoscedasticity, berdistribusi normal, maka syarat regresi terpenuhi (dapat
diterima).

1
0
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

d. Do a separate regression for male and female on the relationship between systolic
blood pressure and serum. Present in two diagram the different between male and
female.
Jawab:

e. Do you think male and female blood pressures are difference? Can you check using
regresion and t-test? Can you measure the differences using simple regression and
t-test? Are they similar results? What is the difference?
Jawab:
Berbeda, karena nilai coefisien antara male dan female berbeda. Nilai coefisien pada male
sebesar 0.0792497, sedangkan pada female sebesar 0.1477755 (lebih tinggi pada female).

Cek menggunakan regresi dan t-test:

1
1
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

Dari kedua output di atas, terlihat bahwa nilai p-value dicek menggunakan regresi maupun t-
test adalah sama, yakni 0.9371. Sehingga dapat disimpulkan bahwa ada beda rata-rata antara
sistolyc blood pressure pada male dibandingkan pada female.

5 References:
5.1 Articles for Critical Appraisal
1. Sørensen TH, Olsen KR, Vedsted P. Association between general practice referral
rates and patients’ socioeconomic status and access to specialised health care. a
population-based nationwide study. Health Policy 2009; 92: 180–186.

1
2
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

5.2 Required Reading


1. Lewis, S. Regression analysis. Practical Neurology 2007;7;259-264

2. Bewick V, Cheek L, Ball J. Statistics review 7: Correlation and regression J. Critical


Care 2003, 7(6):451-459. This article is online at http://ccforum.com/content/
7/6/451

5.3 Suggested Reading


1. Rosner, B. Regression and Correlation Method. Chapter 11. Exercise of Fundamentals
of Biostatistics, 7th ed. Belmont, CA: Duxbury Press, 2011; pp: 427-515.

6 Output
Achieve competencies in :

1. to estimate and interpret regression and correlation coefficients

2. to demonstrate assessment of the assumption of regression methods

3. to appraise a simple linear regression used in the published article

1
3
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES

7 Log sheet:

No Activities Date Signature Comment


1. Group Discussion on regression and
correlation coefficients
2. Laboratory session: a simple linear
regression
3. Laboratory session: correlation coef-
ficient
4. Laboratory session: application of a
simple regression and correlation in
public health research
5. Homework

Score : Instructor Signature:

1
4

Anda mungkin juga menyukai