Anda di halaman 1dari 16

BIOSTATISTIK LANJUT

REGRESI DALAM VARIABEL DUMMY

KELOMPOK V
KELAS D

ALIMUDDIN (K012202068)
H A S R I A N I ( K 0 1 2 2 11 0 7 0 )
K H A S R U L T S A N I WA L I U L U ( K 0 1 2 2 11 0 8 4 )
Regresi dalam Variabel Dummy
DEFINIS
I
Variabel dummy, atau indikator, adalah Variabel apa saja dalam regresi persamaan
yang mengambil jumlah terbatas values sehingga yang berbeda kategori dari
nominal variabel dapat diidentifikasi

Dummy hanya berkaitan dengan fakta bahwa nilai-nilai yang diambil seperti variabel
(biasanya nilai seperti 0, 1, dan -1) menunjukkan tidak ada pengukuran yang berarti,
melainkan kategori yang menarik

contoh
variabel dummy
Aturan untuk mendefinisikan Variabel Dummy

H A R U S D I P E R H AT I K A N
• jika intersep digunakan dalam persamaan
regresi, yang tepat definisi dari k – 1 dummy
variabel secara otomatis indeks semua k
kategori.

• Jika k variabel dummy yang digunakan untuk menggambarkan nominal variabel dengan k kategori dalam
model yang mengandung intersept semua koefisien dalam model tidak dapat secara unik diperkirakan
karena kolinearitas di masa sekarang.
• Ada banyak cara yang berbeda untuk menentukan k - 1 dummy variabel untuk indeks k kategori dari yang
variabel nominal diberikan. Sebagai contoh, dua persamaan.
L A N JU TA N . ...

• Jika variabel nominal independen memiliki


kategorik, maka kita harus mendefinisikan k - 1
variabel dummy untuk indeks kategori ini,
asalkan regresi model berisi istilah yang konstan
(misal: sebuah intersep β0).

• Jika regresi model tidak mengandung intercept,


maka k dummy variabel diperlukan untuk indeks
k kategori. Misalnya, jika ada k = 3 kategori,
jumlah dummy variabel harus k - 1 = 2 untuk
model yang mengandung intercept.
Membandingkan Dua Regresi Garis Lurus

Perbandingan berdasarkan jenis kelamin regresi garis lurus tekanan


darah sistolik pada usia
Tabel. Perbedaan Jenis Kelamin terhadap Tekanan Darah Sistolik
Untuk Uji statistik ini, nilai kritis untuk uji dua sisi (yaitu, HA :
β1M ≠ β1F) dengan α = 0.05 ditentukan oleh t65,0.975 = 1.9964.
Dari│T│= 0,069 tidak melebihi 1,9964, maka tidak menolak H0.
Dengan demikian, kami menyimpulkan bahwa tidak ada bukti
Uji Statistik dihitung sebagai berikut yang kuat untuk menolak hipotesis paralelisme (yaitu, garis untuk
laki-laki dan perempuan memiliki kemiringan yang sama).
MEMBANDINGKAN DUA GARIS LURUS
MENGGUNAKAN KECOCOKAN REGRESI
TERPISAH

Untuk uji dua sisi (HA: β0M ≠ β0F) dengan α


= 0.05, ditemukan bahwa │T │= 1.85 tidak
melebihi 165.0.975 = 1.9964 (yaitu, 0.05 <
P< 0.1). Jadi, hipotesis nol dari pernyataan
umum tidak ditolak pada α = 0,05 tetapi
ditolak pada α = 0,1 .
Lanjutan….
Regresi Dalam Variabel Dummy

Tabel 14-2. Tiga contoh model untuk usia tekanan darah-sistolik


Sumber df SS MS F P
Regresi (X) 1 14,951.25 14,951.25 121.27 121.27 Statistik uji ini dihitung sebagai berikut :
Residual 67 8,260.51 123.29    
           
Regresi (X, Z) 2 18,009.78 9,004.89 114.25
Residual 66 5,201.99 78.82   114.25
           
Regresi (X, Z, XZ) 3 18,010.33 6,003.44 75.02  
Residual 65 5,201.44 80.02 75.02
 

Statistik F antara 1 dan 65 sangat kecil dibanding P (sangat besar), tidak


menolak Ho
Secara teori F dihitung dari kuadrat T yang bersesuaian menggunakann
kecocokan garis lurus terpisah pada tabel 14-7
Meskipun jawaban numerik mungkin tidak sepenuhnya sesuai oleh sebab
kesalahan pembulatan.
UJI untuk Penyadapan Setara: Pendekatan Model
Tunggal
Tes ini menggabungkan keseluruhan model ke dalam bentuk pengurangan
• Y = β0 + β1X + β2Z + β3XZ + E
• Y = β0+ β1X + β3XZ + E
• Y = β0 + β1X + β2Z + E
• Y = β0 + β1X + E
Memungkinkan kemiringan yang tidak sama oleh karena hipotesis dua intersep
adalah sama atau setara dengan H0: β2 = 0

Uji Kebetulan: Pendekatan Model Tunggal


Informasi dalam tabel 14-2 atau 14-3 mengarah ke perhitungan
berikut. Jika uji kebetulan tidak ditolak, model (14-3). dapat direduksi
menjadi bentuk Y = β0 + β1X
Metode II: Membandingkan Dua Garis Lurus Menggunakan
Persamaan Regresi Tunggal

Tabel 14-3 : ANOVA tabel untuk metode II untuk Uji urutan variabel tambahan untuk
contoh tekanan darah sistolik usia H0: β2 = 0 menggunakan rumus :
Sumber df SS MS F P
X (AGE) 1 14,951.25 14,951.25 186.84 .0001
Z (SEX)│X 1 3,058.52 3,058.52 38.22 .0001
X x Z│X, Z 1 0.55 0.55 0.01 .9342
Residual 65 5,201.44 80.02

Total coreksi) 68 23,211.76      

Antara 1 dan 65 tingkat kebebasan, kita melihat dari tabel


14-3 bahwa P < 0.0001, maka penyadapan dinilai berbeda
untuk model garis lurus pria dan wanita.
Gabungan Dari Metode I Dan II

Jika β0M, β0F, β1M, dan β1F menunjukkan


koefisien regresi yang diperkirakan
berdasarkan kecocokan regresi
yang terpisah, maka β0M = β0, β0F =
β0 + β2, β1M = β1 dan β1F = β1 + β3.
Strategi Pengujian dan Interpretasi :
Membandingkan Dua Garis Lurus

Menerapkan strategi ini pada data tekanan


darah sistol berdasarkan usia, dapat
disimpulkan, bahwa uji kebetulan adalah
signifikan dan uji paralelisme tidak signifikan,
sehingga kesimpulan keseluruhan adalah bahwa
model terbaik memiliki bentuk:
Y = βo + β₁X + β₂Z + β₃XZ + E
Lanjutan….
Model Variabel Dummy
Lainnya
Dua model variabel dummy lain yang bisa digunakan

Y = β0 + β1X + β2Z + β3XZ + E

persamaan regresi terpisah


Z = 1: YM = (β0 + β2) + (β1 + β3) X + E
Y = β0MZ1 + β0FZ2 + β1M XZ1 + β1FXZ2 + E
Dan
Z = -1: YF = (β0 + β2) + (β1 + β3) X + E
Model Lain Variabel Dummy

dapat menyatakan koefisien model (14,9) dalam hal


koefisien regresi untuk model laki-laki dan perempuan yang
terpisah :
Thank you

Anda mungkin juga menyukai