Variable (DIV), sertai dengan ilustrasi contoh data dan prosedur pengolahan datanya?
dimana :
X = pendapatan keluarga
Y= 1 Jika rumah milik keluarga, 0 jika rumah bukan milik keluarga
Model tersebut dinamakan model probabilitas linier karena regresi bersifat linier.
Rata-rata bersyarat dari Yi diberikan Xi, ditulis sebagai E(YiIXi), diinterpretasikan sebagai
proobabilitas bersyarat bahwa peristiwa tersebut akan terjadi untuk nilai Xi-yaitu. Pr
(Yi=1IXi) memberikan probabilitas sebuah rumah dimiliki oleh keluarga yang
penghasilannya diberika oleh Xi. Sekarang, menggunkaan asumsi OLS E (uIXi)=0, kita
mendapatkan
Hubungan ini menunjukkan bahwa Li linear terhadap Xi, tetapi probabilitasnya tidak linier
dalam hal Xi.
Model Probit
Model lain yang dikembangkan untuk mengimbangi kelemahan LPM adalah model
probit. Model probit menggunakan pendekatan non-linearitas yang sama seperti model
logit; namun, ia menggunakan CDF normal, bukan CDF logistik.
dimana u~ N(0,o2) adalah istilah kesalahan . Dalam model, perempuan = 1 bila orang
tersebut perempuan dan perempuan = 0 bila orang tersebut laki-laki. dapat diartikan sebagai
perbedaan upah antara perempuan dan laki-laki, memegang pendidikan konstan. Jadi, δ 0
membantu untuk menentukan apakah ada diskriminasi upah antara laki-laki dan perempuan.
Misalnya, jika δ 0 > 0 (koefisien positif), maka perempuan memperoleh upah lebih tinggi
daripada laki-laki (menjaga faktor-faktor lain tetap konstan). Koefisien yang dilampirkan
pada variabel dummy disebut koefisien intersep diferensial . Model tersebut dapat
digambarkan secara grafis sebagai pergeseran intersep antara perempuan dan laki-laki. Dalam
gambar, kasus δ 0 <0 ditampilkan (di mana laki-laki mendapatkan upah lebih tinggi daripada
perempuan).
Variabel tiruan dapat diperluas ke kasus yang lebih kompleks. Misalnya, efek
musiman dapat ditangkap dengan membuat variabel tiruan untuk setiap musim : D1 = 1 Jika
observasi untuk musim panas, dan sebaliknya sama dengan nol; D2 = 1 jika dan hanya jika
musim gugur, jika tidak sama dengan nol; D3 = 1 jika dan hanya jika musim dingin, jika
tidak sama dengan nol; dan D 4 = 1 jika dan hanya jika pegas, jika tidak sama dengan nol.
Dalam data panel , boneka penaksir efek tetap dibuat untuk masing-masing unit dalam data
penampang (misalnya perusahaan atau negara) atau periode dalam rangkaian waktu yang
dikumpulkan. Namun, dalam regresi seperti itu baik suku konstan harus dihilangkan atau
salah satu boneka harus dihilangkan, dengan kategori yang terkait menjadi kategori dasar
yang digunakan untuk menilai variabel lain untuk menghindari perangkap variabel dummy.
Konstanta dalam semua persamaan regresi adalah koefisien yang dikalikan dengan
regressor yang sama dengan satu. Ketika regresi dinyatakan sebagai persamaan matriks,
matriks regresi kemudian terdiri dari kolom satu (suku konstanta), vektor nol dan satu
(dummies), dan kemungkinan regresi lainnya. Jika seseorang menyertakan boneka laki-laki
dan perempuan, katakanlah, jumlah vektor ini adalah vektor satu, karena setiap pengamatan
dikategorikan sebagai laki-laki atau perempuan. Jadi, jumlah ini sama dengan regressor suku
konstanta, vektor pertama satu. Akibatnya, persamaan regresi tidak akan terpecahkan, bahkan
dengan metode pseudoinverse yang khas. Dengan kata lain: jika ada regresi vektor-satu (suku
konstan) dan kumpulan boneka lengkap, terjadi multikolinearitas sempurna, dan sistem
persamaan yang dibentuk oleh regresi tidak memiliki solusi yang unik. Ini disebut sebagai
perangkap variabel dummy . Jebakan dapat dihindari dengan menghilangkan suku konstanta
atau salah satu boneka yang melanggar. Dummy yang dihapus kemudian menjadi kategori
dasar yang dibandingkan dengan kategori lainnya.