Anda di halaman 1dari 4

Diterjemahkan dari bahasa Inggris ke bahasa Indonesia - www.onlinedoctranslator.

com

Pembaur dan interaksi dalam Regresi

Pratinjau
Dua tujuan yang berbeda dari analisis regresi adalah (1) untuk memprediksi variabel
dependen menggunakan satu set variabel independen dan (2) untuk mengukur hubungan satu
atau lebih variabel independen dengan variabel dependen. Tujuannya berbeda karena yang
pertama berfokus pada menemukan model yang sesuai dengan data yang diamati dan
memprediksi data masa depan sebaik mungkin, sedangkan yang kedua berkaitan dengan
menghasilkan perkiraan yang akurat dari satu atau lebih koefisien regresi dalam model.
Selain itu, tujuan kedua menjadi perhatian khusus ketika peneliti mempertanyakan etiologi
penyakit, seperti mencoba mengidentifikasi satu atau lebih determinan penyakit atau hasil
terkait kesehatan lainnya.
Membingungkandan interaksi adalah dua konsep metodologis yang relevan untuk
mencapai tujuan kedua. Dalam bab ini, kami menjelaskan konsep-konsep ini menggunakan
terminologi regresi. Diskusi yang lebih umum tentang subjek ini dapat ditemukan di tempat
lain (misalnya, Kleinbaum, Kupper, dan Morgenstern, 1982) dalam konteks penelitian
epidemiologi, yang biasanya membahas pertanyaan etiologi yang melibatkan tujuan kedua di
atas. Kami mulai di sini dengan gambaran umum konsep-konsep ini, setelah itu kami
membahas prosedur regresi, analisis kovarians (ANACOVA), yang dapat digunakan untuk
menyesuaikan atau mengoreksi masalah pengganggu. Selanjutnya, dalam bab 16, kami akan
menjelaskan secara singkat strategi untuk mendapatkan model regresi "terbaik" yang
menggabungkan penilaian perancu dan interaksi.

Gambaran
Counfounding dan interaksi, meskipun konsepnya berbeda, keduanya melibatkan
penilaian hubungan antara dua variabel atau lebih sehingga variabel tambahan yang mungkin
mempengaruhi hubungan ini diperhitungkan. Ukuran asosiasi yang dipilih biasanya
tergantung pada karakteristik variabel yang diminati. Misalnya, jika kedua variabel kontinu,
seperti dalam konteks regresi klasik, ukuran asosiasi biasanya berupa koefisien regresi.
Variabel tambahan untuk dipertimbangkan secara sinonim disebut sebagai variabel asing,
variabel kontrol, atau kovariat. Pertanyaan penting mengenai variabel-variabel ini adalah
apakah dan bagaimana mereka harus dimasukkan ke dalam model yang dengannya asosiasi
kepentingan dapat diperkirakan.
Dalam istilah yang lebih praktis, misalkan kita mempertimbangkan studi untuk
menilai apakah tingkat aktivitas fisik (PAL) dikaitkan dengan tekanan darah sistolik (SBP),
akuntansi (yaitu mengendalikan) untuk AGE. Variabel asing di sini adalah AGE. Kami perlu
menentukan apakah kami dapat mengabaikan AGE dalam analisis kami dan masih menilai
hubungan PAL-SBP dengan benar. Secara khusus, kita perlu menjawab pertanyaan-
pertanyaan berikut: (1) apakah perkiraan hubungan antara PAL dan SBP berbeda secara
bermakna tergantung pada apakah kita mengabaikan AGE? (2) Apakah perkiraan hubungan
antara PAL dan SBP berbeda secara bermakna untuk nilai AGE yang berbeda? Pertanyaan
pertama berkaitan dengan perancu, pertanyaan kedua dengan interaksi.
Secara umum, perancu ada jika interpretasi yang berbeda secara bermakna dari
hubungan kepentingan hasil ketika variabel asing diabaikan atau dimasukkan dalam analisis
data.Dalam praktiknya, penilaian perancu membutuhkan perbandingan antara perkiraan kasar
dari suatu asosiasi (yang mengabaikan variabel asing yang diminati) dan perkiraan asosiasi
yang disesuaikan (yang dengan cara tertentu memperhitungkan variabel asing). Jika perkiraan
kasar dan perkiraan yang disesuaikan berbeda secara bermakna, maka kami mengatakan
bahwa pengganggu hadir dan satu atau lebih variabel asing harus dimasukkan dalam analisis
data kami. Catatan hadir dan satu atau lebih variabel asing harus dimasukkan dalam analisis
data kami. Perhatikan bahwa definisi ini tidak memerlukan uji statistik melainkan
perbandingan perkiraan yang diperoleh dari data (lihat Kleinbaum, Kupper, dan Morgenstern,
1982, bab 13, untuk pembahasan lebih lanjut tentang poin ini).
Misalnya, dengan menggunakan ilustrasi di atas, perkiraan kasar dari hubungan antara PAL
dan SBP (mengabaikan AGE) diberikan oleh koefisien regresi, katakanlah B1, dari variabel
PAL dalam model garis lurus yang memprediksi SBP hanya dengan menggunakan PAL.
Sebaliknya, perkiraan yang disesuaikan diberikan oleh koefisien regresi, Bi, dari variabel
yang sama, PAL, dalam model regresi berganda yang memprediksi SBP menggunakan PAL
dan AGE. Secara khusus, jika PAL didefinisikan secara dikotomis (misalnya, PAL = 1 atau 0
untuk aktivitas fisik tinggi atau rendah, masing-masing), maka perkiraan kasar hanyalah
perbedaan kasar antara tekanan darah sistolik rata-rata di setiap kelompok aktivitas fisik, dan
tekanan darah sistolik yang disesuaikan. perkiraan mewakili perbedaan yang disesuaikan
dalam dua tekanan darah sistolik rata-rata yang mengontrol AGE ini. Secara umum,
Interaksi adalah kondisi di mana hubungan kepentingan berbeda pada tingkat yang
berbeda (yaitu, nilai) dari variabel asing (s). Berbeda dengan perancu, penilaian interaksi
tidak mempertimbangkan perkiraan kasar atau perkiraan yang disesuaikan (keseluruhan),
melainkan berfokus pada menggambarkan hubungan kepentingan pada nilai yang berbeda
dari yang asing.
variabel. Misalnya, dalam menilai interaksi karena AGE dalam menggambarkan hubungan
PAL-SBP, masalahnya adalah apakah beberapa deskripsi (yaitu, perkiraan) dari hubungan ini
bervariasi dengan nilai AGE yang berbeda (misalnya, apakah hubungan itu kuat pada usia
yang lebih tua dan lemah
pada usia yang lebih muda). Jika hubungan PAL-SBP memang berbeda dengan AGE, maka
kita katakan bahwa ada interaksi PAL AGE X (baca "oleh"). Untuk menilai interaksi uji
statistik dapat digunakan di samping evaluasi subjektif kebermaknaan (misalnya, kepentingan
klinis) dari efek interaksi diperkirakan. Sekali lagi, untuk diskusi lebih lanjut, lihat
Kleinbaum, Kupper, dan Morgenstern (1982).
Ketika perancu dan interaksi dipertimbangkan untuk kumpulan data yang sama, penggunaan
perkiraan keseluruhan (disesuaikan) sebagai indeks ringkasan dari hubungan yang diminati
akan cenderung menutupi efek interaksi (kuat) yang mungkin ada. Misalnya, jika asosiasi
PAL-SBP berbeda secara bermakna pada nilai AGE yang berbeda, penggunaan perkiraan
keseluruhan tunggal, seperti koefisien regresi PAL dalam model regresi berganda yang
mengandung AGE dan PAL, akan menyembunyikan temuan interaksi ini. Ini
menggambarkan prinsip penting berikut: Interaksi harus dinilai sebelum perancu;
penggunaan ringkasan (disesuaikan) perkiraan bahwa kontrol untuk perancu dianjurkan
hanya ketika tidak ada interaksi yang berarti (Kleinbaum, Kupper, dan Morgenstern, 1982,
bab 13).
Jadi, secara umum, perancu dan interaksi adalah fenomena yang berbeda. Sebuah variabel
dapat memanifestasikan perancu dan interaksi, tidak keduanya, atau hanya salah satu dari
keduanya. Namun demikian, jika interaksi yang kuat ditemukan, penyesuaian untuk perancu
tidak tepat.
Kami sekarang siap untuk membahas bagaimana konsep-konsep ini dapat digunakan
menggunakan terminologi regresi, dengan asumsi model linier dan variabel dependen
kontinu. Sebuah analog regresi untuk variabel hasil dikotomis bisa, misalnya, melibatkan
logistik daripada model linier. Pemodelan logistik dibahas secara singkat di Bab 21; diskusi
yang lebih rinci di mana perancu dan interaksi dipertimbangkan dapat ditemukan di
Kleinbaum, Kupper, dan Morgenstern (1982, bab 20-24).

Interaksi dalam Regresi


Pada bagian ini, kami akan menjelaskan bagaimana variabel independen dapat berinteraksi
untuk mempengaruhi variabel dependen dan bagaimana interaksi tersebut dapat diwakili oleh
model regresi yang sesuai.

Sebuah contoh
Untuk mengilustrasikan konsep interaksi, kita akan mempertimbangkan contoh
sederhana berikut.
Misalkan menarik untuk menentukan bagaimana dua variabel independen, suhu (T) dan
konsentrasi katalis (C), bersama-sama mempengaruhi laju pertumbuhan (Y) organisme dalam
sistem biologis tertentu. Selanjutnya, anggaplah bahwa dua tingkat suhu tertentu (To dan T1)
dan dua tingkat konsentrasi katalis tertentu (Co dan C) akan diperiksa, dan bahwa percobaan
dilakukan di mana pengamatan pada Y diperoleh untuk masing-masing dari empat kombinasi
tingkat konsentrasi katalis suhu, (To, Co), (To, C), (T1, Co), dan (T1, C1).
(Dalam bahasa statistik, percobaan ini disebut percobaan faktorial lengkap, karena
pengamatan pada Y diperoleh untuk semua kombinasi pengaturan untuk variabel bebas (atau
faktor). Keuntungan dari percobaan faktorial adalah bahwa setiap efek interaksi yang ada
dapat dideteksi dan diukur secara efisien.)
Sekarang, mari kita perhatikan dua grafik berdasarkan dua kumpulan data hipotetis
untuk skema percobaan yang dijelaskan di atas. Gambar 11-1a menunjukkan bahwa laju
perubahan laju pertumbuhan sebagai fungsi suhu adalah sama terlepas dari tingkat
konsentrasi katalis; dengan kata lain, hubungan antara Y dan T sama sekali tidak bergantung
pada C.
(Bagi pembaca yang akrab dengan kalkulus, frasa "laju perubahan" terkait dengan
gagasan turunan dari suatu fungsi. Secara khusus, Gambar 11-1a menggambarkan
situasi di mana turunan parsial sehubungan dengan T dari fungsi yang berkaitan
dengan rata-rata dari Y ke T dan C tidak tergantung pada C).
Penting untuk menunjukkan bahwa kita tidak mengatakan bahwa Y dan C tidak
berhubungan, tetapi bahwa hubungan antara Y dan T tidak bervariasi sebagai fungsi dari C.
Jika demikian halnya, kita katakan bahwa T dan C tidak berinteraksi atau, secara ekuivalen,
tidak ada pengaruh interaksi TXC. Secara praktis, ini berarti bahwa kita dapat menyelidiki
efek T dan C pada Y secara independen satu sama lain dan bahwa kita dapat secara sah
berbicara tentang pengaruh terpisah (kadang-kadang disebut efek utama) T dan C pada Y.
Salah satu cara untuk mengukur hubungan yang digambarkan pada gambar 11-1a
dengan model regresi dari bentuk.
C = 0 + 1T+2C
Di sini, perubahan rata-rata Y untuk perubahan 1 unit di T sama dengan 1, terlepas dari level
C. sebenarnya, mengubah level C pada (11.1) hanya memiliki efek menggeser garis lurus
yang berkaitan Cdan T baik naik atau turun tanpa mempengaruhi nilai kemiringan 1,
seperti yang terlihat pada Gambar 11.1a. secara khusus,C0 = (0 + 2C0)+1T dan C1=
(0 + 2C1)+1T.
Secara umum, dapat dikatakan bahwa tidak ada interaksi yang identik dengan
parallelis, dalam arti bahwa kurva respons Y versus T untuk nilai-nilai tetap C adalah paralel;
dengan kata lain, kurva respons ini (yang mungkin linier atau nonlinier) semuanya memiliki
bentuk umum yang sama, hanya berbeda satu sama lain oleh konstanta aditif yang tidak
bergantung pada T (misalnya, lihat gambar 11-2).
Sebaliknya, Gambar 11-1b menggambarkan situasi di mana hubungan antara Y dan T
bergantung pada C ; khususnya, Y tampak meningkat dengan meningkatnya T ketika C= C0
tetapi menurun dengan meningkatnya T ketika C=C1. Dengan kata lain, perilaku Y sebagai
fungsi suhu tidak dapat dianggap terlepas dari konsentrasi katalis. Jika demikian halnya, kita
katakan bahwa T dan C berinteraksi atau, secara ekuivalen , bahwa ada efek interaksi T x C.
Secara praktis, ini berarti bahwa sangat tidak masuk akal untuk membicarakan efek terpisah
(atau utama) dari T dan C pada Y, karena T dan C tidak beroperasi secara independen satu
sama lain dalam efeknya pada Y.

Anda mungkin juga menyukai