Anda di halaman 1dari 18

CONFOUNDING AND INTERACTION IN REGRESSION

(Perancu Dan Interaksi Dalam Regresi)

Kelompok 7 Kelas F:

Annisa Citra Islami (K012211044)


Nurfaisya (K012202032)
Puteri Humaerah (K012202002)
Tujuan Analisis Regresi
Untuk memprediksi variabel dependen
1 menggunakan seperangkat variabel
independen. Berfokus menemukan model
yang sesuai dengan data yang diamati dan
memprediksi data masa depan sebaik
mungkin Untuk mengukur hubungan satu atau lebih
variabel independen dengan variabel
dependen dan berkaitan dengan
menghasilkan perkiraan yang akurat dari
satu atau lebih koefisien regresi dalam 2
model. 
Tujuan ini menjadi perhatian khusus ketika
pertanyaan penelitian menyangkut etiologi
penyakit, seperti mencoba mengidentifikasi
satu atau lebih determinan penyakit atau
hasil terkait kesehatan lainnya.
Confounding dan Interaction
Confounding dan Interaction melibatkan penilaian asosiasi antara dua atau lebih variabel sehingga variabel tambahan yang
dapat mempengaruhi asosiasi ini diperhitungkan.

confounding ada jika interpretasi yang berbeda Interaction adalah kondisi di mana hubungan kepentingan
secara bermakna dari hubungan hasil berbeda pada tingkat yang berbeda dari variabel asing.
kepentingan ketika variabel asing diabaikan atau Penilaian Interaction tidak mempertimbangkan baik
dimasukkan dalam analisis data. perkiraan kasar atau perkiraan disesuaikan tetapi sebaliknya
berfokus pada menggambarkan hubungan kepentingan pada
nilai yang berbeda dari variabel asing.
Secara umum, confounding dan Interaction adalah fenomena yang berbeda.
Sebuah variabel dapat memanifestasikan confounding dan Interaction, tidak keduanya,
atau hanya salah satu dari keduanya. Namun demikian, jika Interaction yang kuat
ditemukan, penyesuaian untuk confounding tidak tepat. 
Interaksi dalam Regresi

◦ Contoh: Misalkan menarik untuk menentukan bagaimana dua variabel


independen, suhu (T) dan konsentrasi katalis (C), bersama-sama
mempengaruhi laju pertumbuhan (Y) organisme dalam sistem biologis
tertentu. Selanjutnya, misalkan dua tingkat suhu tertentu (To dan T1) dan
dua tingkat tertentu konsentrasi katalis (Co dan Ct) akan diperiksa dan
bahwa percobaan dilakukan di mana pengamatan pada Y diperoleh untuk
masing-masing dari empat kombinasi tingkat konsentrasi katalis suhu,
(T0, Co), (To, Ci), (T, Co), dan (T1, C,).
Interaksi dalam Regresi

• Sebaliknya, Gambar 11-1 b menggambarkan situasi di mana


• Gambar 11-la menunjukkan bahwa laju perubahan laju hubungan antara Y dan T bergantung pada C; khususnya, Y
pertumbuhan sebagai fungsi suhu adalah sama terlepas tampak meningkat dengan meningkatnya T ketika C = C0
dari tingkat konsentrasi katalis; dengan kata lain, tetapi menurun dengan meningkatnya T ketika C = C1
hubungan antara Y dan T sama sekali tidak bergantung Dengan kata lain, perilaku Y sebagai fungsi suhu tidak dapat
pada C. dianggap terlepas dari konsentrasi katalis. Jika demikian
Persamaan model regresinya: halnya, kita katakan bahwa T dan C berinteraksi atau, secara
ekuivalen, ada efek interaksi T x C. Persamaan model
regresinya:
Secara umum, dapat dikatakan bahwa tidak ada interaksi yang identik
dengan paralelisme dalam arti bahwa kurva respons Y versus T untuk
nilai-nilai tetap C adalah paralel; dengan kata lain, kurva respons ini
(yang mungkin linier atau nonlinier) semuanya memiliki bentuk umum
yang sama, hanya berbeda satu sama lain oleh konstanta aditif yang
tidak bergantung pada T

 Salah satu cara untuk mewakili efek interaksi seperti itu secara matematis adalah dengan mempertimbangkan model regresi dari bentuk

(11-2)

Di sini perubahan nilai rata-rata Y untuk perubahan 1 unit di T sama dengan + C, yang jelas tergantung pada tingkat C. Dengan kata lain,
memperkenalkan istilah produk seperti TC dalam model regresi dari tipe (11.2) adalah salah satu cara untuk menjelaskan fakta bahwa
dua faktor seperti T dan C tidak beroperasi secara independen satu sama lain .
Pemodelan Interaksi Secara Umum
• jika interaksi yang melibatkan tiga variabel X1, X2, dan X3 satu model yang perlu dipertimbangkan adalah:

Dalam model ini, produk dua faktor dari bentuk XiXj, sering disebut sebagai interaksi orde pertama, sedangkan produk
tiga faktor seperti X1 X2 X3, disebut interaksi tingkat kedua, dan seterusnya untuk produk tingkat tinggi. Semakin tinggi
urutan interaksi, semakin sulit untuk menafsirkan maknanya.
Contoh kedua :

Mempertimbangkan penelitian untuk menilai tingkat


aktivitas fisik / Physical Activity Level (PAL) sebagai
prediktor tekanan darah sistolik / Systolic Blood Pressure
(SBP), mengendalikan AGE dan SEX. Model yang
memungkinkan kemungkinan interaksi AGE dengan PAL
dan SEX dengan PAL diberikan oleh :

SBP = β0 + β1(PAL) + β2(AGE) + β3(SEX) + β4(PAL X AGE) + β5(PAL X SEX) + E

Untuk menilai interaksi untuk model ini, pertama-tama


seseorang mungkin melakukan uji F parsial ganda dari H0 : β4 = β5
= 0; jika uji signifikan, maka uji F parsial dapat dilakukan untuk
menentukan apakah satu atau lebih dari istilah produk ini harus
disimpan dalam model. Jika pengujian pertama ditemukan tidak
signifikan, maka model lengkap akan disederhanakan dengan
menghapus kedua suku produk ini seluruhnya, memberikan
model tereduksi SBP = β0 + β1(PAL) + β2(AGE) + β3(SEX) + E. Pada
titik ini fase interaksi pembangunan model akan selesai
PERANCU DALAM REGRESI
Mengontrol Untuk Satu Variabel Asing
Untuk menggambarkan hubungan antara variabel independen T dan variabel dependen kontinu Y, dengan
mempertimbangkan kemungkinan efek pengganggu dari variabel ketiga C. Perbandingan ini dapat
dinyatakan dalam dua model regresi berikut:

Y = β0 + β1T + β2C + E  (11.5) dan


Y = β0 + β1T + E     (11.6)

Dari model (11.5), hubungan antara T dan Y yang disesuaikan untuk variabel C dapat dinyatakan dalam koefisien regresi
(parsial) (β1) pada variabel T. Estimasi β1, yang akan dilambangkan dengan β1|C, diperoleh dari penyesuaian kuadrat
terkecil model (11.5), adalah ukuran efek yang disesuaikan dalam arti memberikan estimasi perubahan Y per unit
perubahan T setelah memperhitungkan C (yaitu, dengan C dalam model). Estimasi kasar dari hubungan T-Y adalah
estimasi koefisien T (yaitu, β1) berdasarkan model (11.6), model yang tidak melibatkan variabel C
 Dengan demikian, kita memiliki aturan umum berikut untuk menilai adanya perancu ketika hanya satu variabel
independen yang akan dikontrol: Perancu adalah perkiraan dari koefisien (PI) variabel studi T berubah secara bermakna
ketika variabel C dikeluarkan dari model (11.5), yaitu, jika

≠ (11.7)
Dimana :
menunjukkan estimasi (disesuaikan) dari β1 menggunakan model (11.5) dan
menunjukkan estimasi (kasar) dari β1menggunakan model (11.6).

Tanda ≠ dalam ekspresi (11.7) menunjukkan bahwa keputusan subjektif diperlukan apakah kedua perkiraan tersebut
berbeda secara bermakna; yaitu, seseorang perlu menentukan secara subyektif apakah kedua perkiraan masing-masing
menggambarkan interpretasi yang berbeda dari asosiasi T-Y yang bersangkutan. Uji statistik tidak diperlukan atau tidak
sesuai (Kleinbaum, Kupper, dan Morgenstern, 1982, bab 13).
 Sebagai contoh, misalkan Y menunjukkan SBP, T menunjukkan PAL, dan C menunjukkan AGE. Untuk beberapa
kumpulan data, misalkan ditemukan bahwa

= 4.1 dan = 15.9

Kemudian, dapat disimpulkan bahwa perubahan 1-unit di PAL menghasilkan 16-unit perubahan SBP ketika AGE
diabaikan, sedangkan, ketika AGE dikontrol, perubahan 1-unit di PAL hanya menghasilkan perubahan 4,1 unit di SBP:
yaitu, hubungan antara PAL dan SBP jauh lebih lemah setelah mengontrol AGE. Jadi , AGE atau umur akan diberi
label sebagai PERANCU dan harus dikontrol dalam analisis.
Mengontrol  beberapa variabel asing
Misalkan kita ingin menggambarkan
hubungan antara T dan Y, dengan
mempertimbangkan beberapa kovariat
C1,C2,...,Cp. Analog dengan prosedur Namun, untuk mendapatkan estimasi yang disesuaikan,
yang dijelaskan untuk satu kovariat, sekarang kita harus mempertimbangkan model yang diperluas
kita dapat menilai perancu dengan yang didefinisikan sebagai berikut:
membandingkan perkiraan kasar dari Y = β0 + β1T + β2C1 + β3C2 + … + βp+1Cp + E (11.8)
hubungan T-Y dengan beberapa
perkiraan yang disesuaikan. (Seperti model (11,5), model (11,8) mengasumsikan tidak ada
interaksi yang melibatkan T karena tidak ada produk dalam
bentuk TC, yang disertakan.)
Dengan menggunakan model ini, kita dapat mendefinisikan
perancu yang melibatkan beberapa variabel sebagai berikut:
Perancu hadir jika perkiraan koefisien regresi (β1) dari T dalam
model regresi seperti (11,6), yang mengabaikan variabel C1,
C2, ….. , Cp, adalah sangat berbeda dari perkiraan yang
sesuai dari β1 berdasarkan model seperti (11.8), yang
mengontrol C1, C2, ….. , Cp, yaitu, jika
 ≠ (11.9)

Dimana:
menunjukkan estimasi (disesuaikan) dari β1 menggunakan (11.8) \
merupakan estimasi (kasar) dari β1 menggunakan (11.6)

Ketika menangani kontrol kovariat, kemungkinan keuntungan dalam presisi harus dipertimbangkan selain
kontrol perancu. Secara khusus, subset dari Ci, variabel mungkin lebih disukai daripada seluruh set karena
subset dapat memberikan kontrol yang setara dari perancu (yaitu, dapat memberikan estimasi yang
disesuaikan yang sama) sambil memberikan presisi yang lebih besar dalam memperkirakan asosiasi yang
disesuaikan dari kepentingan.
Namun, tidak ada jaminan bahwa presisi akan ditingkatkan dengan menggunakan subset; pada kenyataannya,
presisi dapat dikurangi. Bagaimanapun, perancu harus didahulukan daripada presisi dalam arti bahwa tidak
ada subset yang harus dipertimbangkan kecuali memberikan perkiraan efek yang disesuaikan yang sama
seperti yang diperoleh saat mengendalikan semua Ci.
 

Sebagai ilustrasi, misalkan p = 5; yaitu, kami mempertimbangkan untuk mengontrol C 1, C2,….., C5 menggunakan model
(11.8). Anggap juga bahwa perkiraan mengambil nilai-nilai berikut tergantung pada himpunan C 1, C2,….., C5 mana yang
dikendalikan.

= 4.0 = 4.3 = 16.0

Kemudian, karena 16.0 jauh berbeda dari 4.0, orang dapat berargumen bahwa perancu itu hadir. Namun karena 4.0 tidak
berbeda secara bermakna dengan 4.3, dapat juga dikatakan bahwa C 3, C4, dan C5, tidak perlu dikontrol, karena pada
dasarnya estimasi yang sama (disesuaikan) diperoleh saat mengontrol hanya untuk C 1 dan C2 seperti saat menyesuaikan
untuk semua Ci.
◦ Jadi,
  untuk contoh ini, kami telah mengidentifikasi dua set C i variabel yang dapat kita gunakan untuk kontrol. Set
yang dipilih tergantung pada evaluasi presisi. Salah satu pendekatannya adalah membandingkan estimasi interval
untuk beberapa parameter yang diinginkan, satu interval diturunkan dari model yang mengontrol C 1 dan C2 saja,
dan interval lainnya dari model yang mengontrol C1 hingga C5.

◦ Parameter logis untuk contoh ini adalah koefisien regresi populasi, β 1, dari variabel T ketika mengontrol
himpunan Ci tertentu. Artinya, kita dapat membandingkan estimasi interval untuk β 1 ketika hanya C1 dan C2 yang
dikontrol dengan estimasi interval yang sesuai untuk β 1 ketika C1 melalui C5 dikontrol. Interval yang lebih sempit
dari keduanya adalah interval yang mencerminkan paling presisi. Misalnya, jika dua perkiraan interval 95%
adalah (2.6, 7.4) untuk dan (1.7, 7.6) untuk maka interval sebelumnya lebih sempit; dalam hal ini, beberapa
presisi diperoleh dengan menjatuhkan C3, C4, dan C5, dari model.
Ringkasan dan Kesimpulan
Perancu dan interaksi adalah dua konsep metodologis yang berkaitan dengan penilaian hubungan antara
variabel independen dan dependen.
Interaksi yang lebih diutamakan daripada perancu, ada keti ka hubungan kepenti ngan berbeda pada ti ngkat
variabel asing (kontrol). Dalam regresi linier, interaksi dievaluasi menggunakan uji stati sti k tentang isti lah
produk yang melibatkan variabel independen dasar dalam model.
Perancu, yang ti dak dievaluasi dengan pengujian stati sti k, hadir keti ka pengaruh kepenti ngan berbeda
tergantung pada apakah variabel asing diabaikan atau dipertahankan dalam analisis. Dalam isti lah regresi,
perancu dinilai dengan membandingkan koefi sien regresi kasar versus disesuaikan dari model yang berbeda.
Keti ka beberapa perancu potensial sedang diperti mbangkan, mungkin bermanfaat untuk mengidenti fi kasi
perancu yang dapat dikeluarkan dari model untuk mendapatkan presisi; (yaitu, presisi mungkin hilang dengan
menjatuhkan variabel) dalam beberapa situasi.
Keti ka ada interaksi kuat yang melibatkan variabel asing tertentu, penilaian perancu untuk variabel asing itu
ti dak relevan. Selain itu, dalam situasi seperti penilaian perancu yang melibatkan variabel asing lainnya,
meskipun mungkin, cukup kompleks dan sangat subjekti f. Akibatnya, penilaian perancu biasanya
direkomendasikan keti ka efek interaksi penti ng telah diidenti fi kasi.
Thank you

Anda mungkin juga menyukai