DosenPembimbing :
Dr.H.Karim, M.Si.
Oleh:
Maulidah 1710118320020
BANJARMASIN
2020
BAB 11
REGRESI
Sekarang beralih ke analisis simultan dari dua variabel. Meskipun kami mungkin
telah mempertimbangkan lebih dari satu variabel pada satu waktu dalam penelitian kami
sejauh ini (misalnya, konsentrasi air laut dan konsumsi oksigen dalam Kotak 9.1 atau usia
anak perempuan dan lebar wajah mereka dalam Kotak 9.3), hanya analisis kami yang
sebenarnya satu variabel. Namun, kami sering mengukur dua variabel atau lebih pada masing-
masing variabel individu dan karena itu kami ingin dapat mengekspresikan lebih tepat sifat
hubungan antara variabel-variabel ini. Ini membawa kita ke subjek regresi dan korelasi.
Dalam regresi kami memperkirakan hubungan tersebut dari satu variabel dengan variabel
lainnya dengan mengekspresikan satu dalam istilah linier (atau yang lebih kompleks) fungsi
lainnya. Kami juga menggunakan regresi untuk memprediksi nilai dari satu variabel dalam hal
yang lain. Dalam analisis korelasi, terkadang bingung dengan regresi, kami memperkirakan
sejauh mana dua variabel bervariasi bersama. Bab 12 membahas korelasi, dan kami akan
menunda upaya kami untuk memperjelas hubungan dan perbedaan antara regresi dan korelasi
sampai kemudian. Variabel yang terlibat dalam regresi dan korelasi bersifat kontinu atau
meristik; jika meristik, mereka diperlakukan seolah-olah mereka terus menerus. Kapan
variabel bersifat kualitatif (yaitu, jika mereka adalah atribut), metode dari regresi dan korelasi
tidak dapat digunakan.
Dalam Bagian 11.1 kami meninjau gagasan tentang fungsi matematika dan
memperkenalkan terminologi baru yang diperlukan untuk analisis regresi. Ini diikuti di
Bagian 11.2 dengan diskusi tentang model statistik yang sesuai untuk regresi analisis.
Perhitungan dasar dalam regresi linier sederhana ditunjukkan di Bagian 11.3 untuk kasus satu
variabel dependen untuk setiap variabel independen. Kasus dengan beberapa variabel
dependen untuk setiap variabel independen diperlakukan di Bagian 11.4. Pengujian
signifikansi dan perhitungan interval kepercayaan untuk masalah regresi dibahas dalam
Bagian 11.5.Bagian 11.6 berfungsi sebagai ringkasan regresi dan membahas berbagai
penggunaan analisis regresi dalam biologi. Bagaimana transformasi skala bisa diluruskan
hubungan lengkung keluar untuk memudahkan analisis ditunjukkan pada Bagian 11.7. Kapan
transformasi tidak dapat melinierisasi hubungan antar variabel, sebuah alternatif
pendekatannya adalah dengan uji nonparametrik untuk regresi. Tes semacam itu diilustrasikan
dalam Bagian 11.8.
Gambar 11.1
Tekanan darah atau hewan dalam mmHg sebagai fungsi konsentrasi obat dalam µg per cc
darah.
Hubungan hewan yang digambarkan dalam grafik ini dapat diekspresikan oleh
rumus Y = a + bX. Jelasnya, Y adalah fungsi dari X. Kita menyebut variabel Y sebagai
variabel terikat, sedangkan X disebut variabel bebas. Besarannya tekanan darah Y tergantung
pada jumlah obat X dan karenanya dapat diprediksi dari variabel bebas yang diduga bebas
bervariasi. Meskipun penyebabnya akan selalu dianggap sebagai variabel independen dan
mempengaruhi variabel dependen, hubungan fungsional yang diamati di alam mungkin
sebenarnya menjadi sesuatu selain hubungan sebab-akibat. Tertinggi garis hubungan Y = 20 +
15X, yang merepresentasikan pengaruh obat A pada hewan P. Jumlah obat diukur dalam
mikrogram, darah tekanan dalam milimeter merkuri. Jadi, setelah 4 µg obat diberikan,
tekanan darah akan menjadi Y = 20 + (15) (4) = 80 mmHg. Independen variabel X dikalikan
dengan koefisien h, faktor kemiringan. Dalam contoh dipilih, b = 15; yaitu, untuk peningkatan
satu mikrogram obat, darah tekanan dinaikkan 15 mm.
Dalam biologi, hubungan seperti itu jelas bisa sesuai hanya dalam beberapa hal
kisaran nilai X. Nilai-nilai negatif X tidak ada artinya dalam kasus ini; ini juga tidak mungkin
bahwa tekanan darah akan terus meningkat dengan kecepatan yang seragam. Tidak mungkin
kemiringan hubungan fungsional akan mendatar sebagai tingkat obat meningkat. Tapi, untuk
porsi terbatas dari rentang variabel X (mikrogram obat), hubungan linier Y = a + hX mungkin
merupakan deskripsi yang memadai dari ketergantungan fungsional Y pada X.
Dengan rumus ini. Jika variabel independen sama dengan nol, tergantung variabel
sama dengan α. Titik ini adalah perpotongan garis fungsi dengan Sumbu Y. Ini disebut
perpotongan Y. Pada Gambar 11.1, ketika X = O. Fungsinya baru dipelajari akan
menghasilkan tekanan darah 20 mmHg, yang merupakan darah normal tekanan hewan P tanpa
adanya obat.
Dua fungsi lainnya pada Gambar 11.1 menunjukkan efek dari memvariasikan a,
perpotongan Y dan h lereng. Di baris terbawah. Y = 20 + 7,5 X , yang Y Berpotongan tetap
sama tetapi kemiringannya telah dibelah dua. Kami memvisualisasikan ini sebagai efek obat
yang berbeda. B, pada organisme yang sama P. Jelas, jika tidak ada obat diberikan, tekanan
darah harus pada intersepsi Y yang sama, karena organisme identik sedang dipelajari. Namun,
kemungkinan obat yang berbeda untuk menciptakan efek hipertensi yang tajam, yang
tercermin dari kemiringan yang berbeda. Itu Hubungan ketiga juga menggambarkan pengaruh
obat B yang diasumsikan tetap ada sama, tetapi percobaan dilakukan pada spesies berbeda, Q.
Yang tekanan darah normal diasumsikan 40 mmHg. Jadi. persamaan untuk efek obat B pada
spesies Q ditulis sebagai Y = 40 + 7,5X. Garis ini sejajar
untuk itu sesuai dengan persamaan kedua.
Dari pengetahuan Anda tentang geometri analitik, Anda akan mengenali faktor
kemiringan b sebagai kemiringan fungsi Y = a + bX, biasanya dilambangkan oleh m. Dalam
kalkulus b adalah hasil dari fungsi yang sama (dY / dX = b). Dalam biostatistik b disebut
koefisien regresi, dan fungsinya disebut a persamaan regresi. Ketika kami ingin menekankan
bahwa koefisien regresi adalah variabel Y pada variabel X, kita tulis by. x .
Dalam contoh nyata apa pun, observasi tidak akan terlihat sempurna di sepanjang
garis regresi tetapi akan tersebar di kedua sisi garis. Ini biasanya karena sifat yang permanen,
variasi alami dari item (disebabkan secara genetik dan lingkungan) dan juga karena kesalahan
pengukuran. Jadi, dalam regresi hubungan fungsional tidak berarti bahwa diberi X nilai Y
harus a + bX. melainkan itu berarti (atau nilai yang diharapkan) dari Y adalah a + bX.
Perhitungan yang tepat dan uji signifikansi dalam regresi berhubungan dengan dua
model berikut. Yang lebih umum dari ini, regresi Model I sangat cocok dalam situasi
eksperimental. Ini didasarkan pada empat asumsi
1. Variabel bebas X diukur tanpa kesalahan. Karena itu kami katakan bahwa X adalah
"'tetap."' Yang kami maksud dengan ini bahwa sedangkan Y,variabel dependen
adalah variabel acak, X tidak bervariasi secara acak tetapi berada di bawah kontrol
penyidik Jadi. pada contoh Gambar 11.1 kami telah memvariasikan dosis obat sesuka
hati dan mempelajari respon tekanan darah variabel acak. Kita bisa memanipulasi X
dengan cara yang sama seperti kita mampu memanipulasi efek pengobatan dalam
anova Model I. faktanya, seperti yang akan Anda lihat nanti. ada hubungan yang
sangat erat antara Model I anova dan regresi Model I
2. Nilai yang diharapkan pada variabel Y untuk setiap nilai yang diberikan. X
dijelaskan oleh fungsi linier µr = α + βX. Ini adalah relasi yang sama yang kita
hitung, tapi kami menggunakan huruf Yunani, bukan a dan b. karena kami
menggambarkan hubungan parametrik. Cara lain untuk menyatakan ini Asumsinya
adalah rata-rata parametrik µr dari nilai-nilai Y adalah a fungsi X dan terletak pada
garis lurus yang dijelaskan oleh persamaan ini.
3. Untuk setiap nilai X dari X, Y adalah independen dan normal didistribusi. Hal ini
dapat direpresentasikan dengan persamaan Yi = α + βX + ∈i dimana ∈i’s diasumsikan
sebagai istilah kesalahan terdistribusi normal Dengan a rata-rata nol. Gambar 11.2
mengilustrasikan konsep ini dengan garis regresi mirip dengan yang ada di Gambar
11.1. Ekspresi tertentu dapat diulangi beberapa kali. Jadi. misalnya kita bisa
keturunan (Y) sebagai fungsi Jumlah keturunan (X) di tandu tikus. Mungkin ada tiga atau
empat keturunan per anak tetapi tidak akan ada nilai antara X mewakili 3,25 tikus per anak.
Tidak setiap percobaan memiliki lebih dari satu pembacaan Y untuk masing-masing
nilai X. Sebenarnya, perhitungan dasar yang akan kita pelajari selanjutnya bagian hanya untuk
satu nilai Y per nilai X, ini lebih kasus umum. Namun, Anda harus menyadari bahwa bahkan
dalam keadaan seperti itu, asumsi dasar regresi Model I adalah bahwa varian tunggal Y sesuai
dengan nilai X yang diberikan adalah sampel dari populasi Variasi independen dan
terdistribusi normal.
4. Asumsi terakhir adalah asumsi yang sudah biasa. Kami berasumsi bahwa sampel ini
sepanjang garis regresi bersifat homoscedastic; itu adalah. bahwa mereka memiliki
ragam umum σ2 yang merupakan varian dari ∈’s dalam ekspresi di 3 item. Jadi, kami
mengasumsikan bahwa varians di sekitar garis regresi adalah konstan dan tidak
tergantung pada besarnya X atau Y.
Banyak analisis regresi dalam biologi tidak memenuhi asumsi regresi Model I.
Seringkali X dan Y mengalami variasi alami atau kesalahan pengukuran. Selain itu, variabel
X terkadang tidak tetap. yaitu, di bawah kendali penyidik. Misalkan kita mengambil sampel
populasi lalat betina dan mengukur panjang sayap dan berat total masing-masing individu.
Kami mungkin tertarik dalam mempelajari panjang sayap sebagai fungsi berat atau kita
mungkin ingin memprediksi panjang sayap untuk bobot tertentu. Dalam hal ini bobotnya.
yang kami perlakukan sebagai file variabel bebas. tidak tetap dan tentu saja bukan "penyebab"
perbedaan dalam panjang sayap. Bobot lalat akan bervariasi untuk genetik dan lingkungan
alasan dan juga akan dikenakan kesalahan pengukuran. Kasus umum dimana
kedua variabel menunjukkan variasi acak disebut regresi Model 11. Meskipun. seperti yang
akan dibahas pada bab selanjutnya. kasus semacam ini jauh lebih baik. dianalisis dengan
metode analisis korelasi. terkadang kami ingin menjelaskan hubungan fungsional antara
variabel tersebut. Untuk melakukannya, kita perlu menggunakan teknik khusus regresi Model
II. Dalam buku ini kita akan membatasi diri kita pada perlakuan regresi Model I
Lampiran Sumber Bahan (Bahasa Inggris)