Anda di halaman 1dari 31

Predictor variables dan

prediction models
Dewanto Andoko
01202220001
PPDS Kedokteran Keluarga Layanan Primer FK UPH
Pertanyaan Pemicu
1. Menjelaskan natural history of disease dan tingkat pencegahan
2. Menjelaskan mengenai predictor variables dan prediction model
3. Menjelaskan mengenai sensitifitas, spesificitas dan ROC
4. Menjelaskan mengenai area under curve dan presisi studi prognosis
Pendahuluan
• Predictor variables dan prediction models adalah dua konsep yang
sangat penting dalam statistik dan ilmu data. Predictor variables
adalah variabel yang digunakan untuk memprediksi nilai dari
variabel lain, sedangkan prediction models adalah model
matematis yang digunakan untuk memprediksi nilai dari variabel
yang diinginkan. Dalam manuskrip ini, akan dijelaskan lebih lanjut
tentang konsep predictor variables dan prediction models, serta
diberikan contoh penggunaannya dalam berbagai bidang.
Predictor Variables
• Predictor variables, atau sering juga disebut independent variables,
adalah variabel yang digunakan untuk memprediksi nilai dari variabel
lain yang disebut dependent variable. Contoh sederhana dari predictor
variables adalah usia dan jenis kelamin dalam memprediksi tinggi
badan seseorang. Dalam contoh ini, usia dan jenis kelamin adalah
predictor variables, sedangkan tinggi badan adalah dependent
variable.
Predictor Variables
Ada berbagai jenis predictor variables, antara lain:
1. Variabel kualitatif, seperti jenis kelamin, warna mata, atau jenis
pekerjaan.
2. Variabel kuantitatif diskrit, seperti jumlah anak, jumlah karyawan,
atau jumlah kamar tidur
3. Variabel kuantitatif kontinu, seperti usia, berat badan, atau tinggi
badan.
Prediction Models

• Prediction models adalah model matematis yang digunakan untuk


memprediksi nilai dari variabel yang diinginkan. Contoh sederhana
dari prediction models adalah regresi linear dalam memprediksi
jumlah kunjungan puskesmas berdasarkan kualitas dan kecepatan
layanan. Dalam contoh ini, regresi linear adalah prediction model,
sedangkan jumlah kunjungan adalah variabel yang diprediksi.
Prediction Models

• Ada berbagai jenis prediction models, antara lain:


1. Regresi linear, digunakan untuk memprediksi nilai variabel
kontinu berdasarkan satu atau lebih predictor variables.
2. Regresi logistik, digunakan untuk memprediksi nilai variabel biner
atau kualitatif berdasarkan satu atau lebih predictor variables.
3. Decision trees, digunakan untuk memprediksi nilai variabel
berdasarkan serangkaian pertanyaan yes/no pada predictor
variables.
1. Regresi Linear
• Dalam regresi linear, hubungan antara variabel dependent
(variabel yang diprediksi) dan variabel independent (predictor
variables) diasumsikan sebagai hubungan linear. Artinya,
hubungan antara kedua variabel dapat dijelaskan dengan
persamaan garis lurus.
• Regresi linear dapat dilakukan dengan menggunakan berbagai
teknik, seperti metode kuadrat terkecil (least squares method)
dan analisis variansi (analysis of variance). Hasil regresi linear
dapat dievaluasi dengan menggunakan berbagai ukuran, seperti
koefisien determinasi (R-squared), standar error, dan t-statistik.
1. Regresi Linear
Analisis Regressi digunakan bila ingin memprediksi variabel y dengan
diketahuinya variabel x (satu atau beberapa variabel)
Regressi Linear: hanya bila ada korelasi linear
Simple Regression: Bila hanya satu variabel independen memprediksi
variabel dependen
Multiple Regression: Bila lebih dari satu variabel independen
memprediksi variabel dependen
Simple Regression
Simple Regression
Persamaan regresi linear
Contoh:
◦Regressi antara IMT dengan Skor sensitifitas Insulin:
y = 1.587 – 0,0433 X

◦Bila IMT meningkat 1, maka Skor Insulin turun 0,0433


◦Bila IMT naik dari 20 menjadi 30, maka skor insulin berkurang dari 0,73
menjadi 0,3
Koefisien determinan
Koefisien Determinan (Coefficient of Determination) = r2
Menyatakan besarnya perubahan variabel y yang dipengaruhi oleh
variabel x
◦Contoh: r2 = 0.34 berarti perubahan pada y sebesar 34% dipengaruhi oleh
variabel x
Contoh: Hubungan Usia dan TD Sistolik
Contoh 2: Hubungan TD Sistolik dengan
Diastolik
Konsep Multi Regresi
Konsep umum sama dengan simpel regressi – membuat model
prediksi untuk korelasi linear
Perbedaan variabel independen lebih dari satu

Y = β0 + β1 X1 + β2 X2+ β3 X3 ………+ ξ
Hubungan Skor Insulin dan BMI pada perempuan hiperthiroid:

◦Y = 2,536 – 0,077 BMI


◦R2 = 0,601 , p = 0,0011 (BMI)
Peneliti ingin menambahkan variabel umur sebagai prediktor:
◦Y = 2,291 – 0,068 BMI – 0,004 Umur
◦R2 = 0,639 , p = 0,0055 (BMI), p= 0,30 (Umur)
Contoh Output SPSS
Contoh Pelaporan Regresi
Linear
2. Regresi logistik
• Regresi logistik adalah metode statistik yang digunakan untuk
memprediksi nilai variabel biner atau kualitatif berdasarkan satu atau
lebih predictor variables. Dalam regresi logistik, hubungan antara
variabel dependent (variabel yang diprediksi) dan variabel independent
(predictor variables) diasumsikan sebagai hubungan logistik. Artinya,
hubungan antara kedua variabel dapat dijelaskan dengan kurva logistik.
• Persamaan regresi logistik dapat ditulis sebagai berikut:p = 1 / (1 + e^-
(a + bX))di mana p adalah probabilitas variabel dependent, X adalah
variabel independent, a adalah intercept, b adalah slope, dan e adalah
bilangan konstan Euler.
2. Regresi logistik
• Regresi logistik dapat dilakukan dengan menggunakan
berbagai teknik, seperti maximum likelihood estimation dan
iteratively reweighted least squares. Hasil regresi logistik
dapat dievaluasi dengan menggunakan berbagai ukuran,
seperti akurasi, sensitivitas, dan spesifisitas.
3. Decision Trees / Regression Trees
• Decision Trees adalah salah satu metode dalam machine
learning yang digunakan untuk melakukan klasifikasi dan
prediksi pada data. Decision Trees bekerja dengan membuat
struktur pohon keputusan berdasarkan fitur atau atribut pada
data. Setiap node pada pohon mewakili suatu atribut,
sedangkan cabang-cabangnya mewakili nilai-nilai yang
mungkin dari atribut tersebut. Dengan menggunakan Decision
Trees, kita dapat memprediksi nilai target dari suatu data baru
dengan mengikuti cabang-cabang pada pohon keputusan.
3. Decision Trees / Regression Trees
• Keuntungan dari Decision
Trees adalah mudah
dipahami dan diinterpretasi
oleh manusia, serta dapat
bekerja dengan baik pada
data yang kompleks dan
besar. Namun, kelemahan
dari Decision Trees adalah
rentan terhadap overfitting
dan kesalahan prediksi pada
data yang tidak seimbang.
Contoh Penggunaan Predictor variables

• Predictor variables dan prediction models digunakan dalam berbagai


bidang, antara lain:
1. Ekonomi, untuk memprediksi harga saham, tingkat pengangguran,
atau inflasi.
2. Kesehatan, untuk memprediksi risiko penyakit, hasil tes medis, atau
efektivitas pengobatan.
3. Pemasaran, untuk memprediksi perilaku konsumen, preferensi
produk, atau keberhasilan kampanye iklan.

PERMENKES RI NOMOR 16 TAHUN 2015 &


PERMENPAN RI NOMOR 69 TAHUN 2021 TENTANG JABATAN FUNGSIONAL EPIDEMIOLOG KESEHATAN
Contoh Penggunaan Predictor variables

• Dalam penggunaannya, predictor variables dan prediction models


harus dipilih dengan hati-hati dan disesuaikan dengan tujuan analisis
yang ingin dicapai. Selain itu, pengolahan data dan interpretasi hasil
juga perlu dilakukan secara cermat untuk menghindari kesalahan
dalam pengambilan keputusan.
Kesimpulan
• Predictor variables dan prediction models adalah konsep penting
dalam statistik dan ilmu data. Predictor variables digunakan untuk
memprediksi nilai dari variabel lain, sedangkan prediction models
digunakan untuk memprediksi nilai dari variabel yang diinginkan.
Kedua konsep ini digunakan dalam berbagai bidang, seperti
ekonomi, kesehatan, dan pemasaran. Dalam penggunaannya,
predictor variables dan prediction models harus dipilih dengan
hati-hati dan disesuaikan dengan tujuan analisis yang ingin dicapai.
Daftar Referensi
1. Agresti, A. (2018). An Introduction to Categorical Data Analysis. John Wiley & Sons.
2. Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis. John Wiley
& Sons.
3. Witten, I. H., Frank, E., & Hall, M. A. (2016). Data Mining: Practical Machine Learning Tools and Techniques.
Morgan Kaufmann.
4. Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to Linear Regression Analysis. John Wiley
& Sons
5. Kutner, M. H., Nachtsheim, C. J., Neter, J., & Li, W. (2005). Applied Linear Statistical Models. McGraw-Hill
Education.
6. Fox, J. (2015). Applied Regression Analysis and Generalized Linear Models. Sage Publications.
7. Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression. John Wiley & Sons.
8. Agresti, A. (2018). An Introduction to Categorical Data Analysis. John Wiley & Sons.
9. Fox, J. (2015). Applied Regression Analysis and Generalized Linear Models. Sage Publications.
10.Breiman, L., Friedman, J. H., Olshen, R. A., & Stone, C. J. (1984). Classification and regression trees. CRC press.

Bustan MN. Pengantar Epidemiologi, Edisi Revisi, Cetakan II. Jakarta: PT Rineka Cipta; 2006. 122-127.
Irwan. 2019. Epidemiologi Penyakit Menular. Yogyakarta: CV. Absolute Media.
Terima Kasih

Anda mungkin juga menyukai