4 Homework
Read following articles by Sørensen et all. (2009). After reading those two articles, please
answer following questions:
a. From the article by Sørensen et all. (2009), please examine table 1 and provide
assessment regarding the trend of mean GP referrals according to age groups. Use
a scatter-plot between mean of age groups and mean GP referrals. Do you see any
trend? How? Can you create a simple linear regression of this trend? What will
you write this trend? Is your regression valid (does not violate assumption?).
jawab:
Kelompok Mean Mean
umur kelompok umur GP referrals x*y x2 y2
(tahun) (x) (y)
0–9 4,5 11,7 52,7 20,3 136,9
10 – 19 14,5 12,0 174,0 210,3 144,0
20 – 29 24,5 12,0 294,0 600,3 144,0
30 – 39 34,5 14,4 496,8 1190,3 207,4
40 – 49 44,5 14,6 649,7 1980,3 213,2
50 – 59 54,5 13,5 735,8 2970,3 182,3
60 – 69 64,5 11,0 709,5 4160,3 121,0
70 – 79 74,5 6,6 491,7 5550,3 43,6
80+ 80,0 4,3 344,0 6400,0 18,5
total 396,0 100,1 3948,1 23082,0 1210,7
1
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Dari kelompok umur 0 – 9 tahun sampai kelompok umur 40 – 49 tahun mengalami kenaikan
jumlah GP referrals (rujukan praktik umum). Selanjutnya sampai kelompok umur 80 tahun ke
atas mengalami penurunan jumlah rujukan praktik umum secara drastis. Garis linier regresi
menunjukkan korelasi yang berarah negatif antara kedua variabel, bahwa semakin bertambah
umur maka semakin menurun rujukannya. Sedangkan dari segi kekuatan, adalah tidak terlalu
kuat karena titik-titik yang tersajikan relatif menyebar.
2
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Berdasarkan hasil regresi di atas dapat diketahui bahwa R2 = 0.3779 hal ini berarti 37,79% total
variasi dari jumlah rujukan praktik umum dijelaskan oleh kelompok umur, atau apabila
dibandingkan antara nilai observasi dengan estimasi hubungan kedua variabel sebesar 37,79%.
Serta dapat disimpulkan bahwa kelompok umur dan jumlah rujukan praktik umum tidak
berhubungan secara signifikan (p-value 0.078 > 0.05). Apabila dilihat dari nilai coefisien age
(β) dapat dikatakan bila ada 2 orang yang berbeda 1 kategori kelompok umur maka jumlah
rujukan akan turun sebesar 0.0806469 (“akan turun” karena nilai coefisien pada kasus ini
bertanda negatif (-)).
b. In table 3, authors compared many regression models for referrals to private practic-
ing specialists with income, education and occupation. Can you read of each model
and conclude the importance of each independent variable? Which has a stronger
relationship to dependent variables? Why? Explain
jawab:
3
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Create a simple regression model for the relationship between systolic blood
pressure and serum cholesterol:
Berdasarkan hasil regresi di atas dapat diketahui bahwa R2 = 0.0467 hal ini berarti 4,67% total
variasi dari systolic blood pressure dijelaskan oleh serum cholesterol, atau apabila dibandingkan
antara nilai observasi dengan estimasi hubungan kedua variabel sebesar 4,67%. Serta dapat
disimpulkan bahwa serum cholesterol dan systolic blood pressure berhubungan secara
signifikan (p-value 0.000 < 0.05). Apabila dilihat dari nilai coefisien serum cholesterol (β) dapat
dikatakan bila ada 2 orang yang berbeda 1 kategori serum cholesterol maka systolic blood
pressure akan naik sebesar 0.117672 (“akan naik” karena nilai coefisien pada kasus ini bertanda
negatif (+)).
4
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
5
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
buat variabel dengan nama “outlier” dan membatasi atau menghapus outlier, 78 adalah
batas bawah, 190 adalah batas atas. kemudian cek kembali, apakah masih ada outlier.
Perintah yang digunakan:
gen outlier=( sbp >=78) & ( sbp <=190)
graph box sbp if outlier ==1
Ternyata masih ada 146 data observasi yang terdeteksi sebagai outlier, hal ini adalah
wajar.
6
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Kemudian dilakukan uji normalitas. Uji statistik yang akan digunakan adalah shapiro-
wilk dan uji grafik yang akan digunakan adalah kernel density. Uji statistik dan uji
grafik saling melengkapi, digunakan untuk memastikan bahwa apakah variabel yang
diuji berdistribusi normal.
Uji statistik: shapiro-wilk
p-value: 0.00000 (distribusi data tidak normal), namun nilai W: 0.97539 (mendekati 1
yang berarti distribusi data normal). Karena masih ada kebingungan menyimpulkan
apakah data berdistribusi normal, maka dilakukan uji grafik kernel density.
Uji grafik: kernel density
Karena data sudah terbukti berdistribusi normal, maka kemudian dapat dilakukan
regresi linier.
7
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Kemudian dilakukan prediksi residual: membandingkan nilai sbp ukur dan sbp yang
diprediksi menggunakan regresi liner. Selisih antara keduanya disebut residu, selisih =
error.
8
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Dari analisis residual sbp di atas terlihat bahwa, terdapat linier relationship dan
terpenuhi asumsi homoscedasticity.
Berikutnya yang perlu dipastikan kembali adalah apakah data residual sbp berdistribusi
normal.
p-value: 0.00000 (distribusi data tidak normal), namun nilai W: 0.90507 (mendekati 1
yang berarti distribusi data normal). Karena masih ada kebingungan menyimpulkan
apakah data berdistribusi normal, maka dilakukan uji grafik kernel density.
Uji grafik: kernel density
9
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Karena sudah terbukti bahwa data residual sbp terdapat linier relationship dan terpenuhi
asumsi homoscedasticity, berdistribusi normal, maka syarat regresi terpenuhi (dapat
diterima).
1
0
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
d. Do a separate regression for male and female on the relationship between systolic
blood pressure and serum. Present in two diagram the different between male and
female.
Jawab:
e. Do you think male and female blood pressures are difference? Can you check using
regresion and t-test? Can you measure the differences using simple regression and
t-test? Are they similar results? What is the difference?
Jawab:
Berbeda, karena nilai coefisien antara male dan female berbeda. Nilai coefisien pada male
sebesar 0.0792497, sedangkan pada female sebesar 0.1477755 (lebih tinggi pada female).
1
1
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
Dari kedua output di atas, terlihat bahwa nilai p-value dicek menggunakan regresi maupun t-
test adalah sama, yakni 0.9371. Sehingga dapat disimpulkan bahwa ada beda rata-rata antara
sistolyc blood pressure pada male dibandingkan pada female.
5 References:
5.1 Articles for Critical Appraisal
1. Sørensen TH, Olsen KR, Vedsted P. Association between general practice referral
rates and patients’ socioeconomic status and access to specialised health care. a
population-based nationwide study. Health Policy 2009; 92: 180–186.
1
2
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
6 Output
Achieve competencies in :
1
3
NIKO TESNI SAPUTRO_17/418306/PKU/16798_SIMKES
7 Log sheet:
1
4