Anda di halaman 1dari 4

Anlisis discriminante

3) Para el anlisis discriminante se trabaj con dos bases de datos las cuales
han sido separadas por la variable pco1 la cual corresponde a los que son y no
son jefes de hogar. Y las variables independientes de Escala: edad, numper,
o13, s19, esc, yopraj, ytrabhoj, ymonehaj, ytohaj.
Aplicando un anlisis discriminante tomando en cuenta a la variable corte2
como dependiente, para empezar esta variable tiene un rango de 2 categoras
de resultado que son 0 y 1, estas son una recodificacin de la variable original
que se denomina corte, esta variable original corresponde a la situacin de
pobreza, la cual ha sido recodificada como corte, corte=1 ser Corte2 =0 y
corte=2 ser Corte2=1, los dems valores sern perdidos, para el caso de las
regiones 6 y 7 que corresponden a este anlisis los valores 0 y 1 corresponden
a 0= pobres extremos. 1=pobres no extremos y existe una tercera categora a
la cual se le denomino no pobres, a esta variable se le considero como perdida.
Lo primero observado es los caso validos los cuales son de un 6.1 % para jefes
de hogary un 1,4% de casos validos para no jefes de hogar.

las variables tienen poder discriminante?


Evaluar si las variables introducidas tienen o no poder discriminante. Para ello
se contrasta la prueba de igualdad de las medias de los grupos (tambin se le
llama Lambda de Wilks). La variable introducida tiene poder discriminatorio si
el Sig. (p-valor) < 0.05. En este ejemplo tanto el tamao medio de grano como
el coeficiente de seleccin tiene un Sig. (p-valor) < 0.05 (ambas variables
tienen poder discriminante).
Esta prueba (Lambda de Wilks) nos indica que las medidas de cada variable
son distintas en cada grupo. Si p-valor (Sig.) < 0.05, entonces las variables son
significativas, por lo que las varianzas son distintas. Por el contrario, si p-valor
(Sig.) > 0.05 las variables no son significativas, lo que se traduce a que las
varianzas de los Grupos A y B son iguales, en cuyo caso no tiene sentido
realizar el anlisis discriminante
.

SE observa que todos los datos son significante, a excepcin de la variable s19
con una significancia de un ,016, lo que quiere decir es que estas variables
aportan a la discriminacin, tienen poder discrimnate, ahora que ya
comprobamos las varianzas entre si analizaremos la igualdad de las
covarianzas. Con la prueba de Box.

La prueba de Box sobre la igualdad de las matrices de covarianza, como se


indica en el pie de la tabla de resultados, contrasta la hiptesis nula de que las
matrices de covarianza poblacionales son iguales, es decir:
- Prueba de igualdad de las medias de los grupos (Prueba de Box):
Si Sig. (p-valor) < 0.05 > las covarianzas son distintas > aplicable anlisis
discriminante.
Si Sig. (p-valor) > 0.05 > las covarianzas son iguales > no aplicable anlisis
discriminante.
En el anlisis discriminante es importante (aunque no necesario) que las
matrices de covarianza poblacionales sean distintas
.
Se aprecia que las covarianzas si son distintas. Por su significancia
Segun estas tablas no deveria haber problemas al aplicar el analisis.

Con un 96,2% de casos de los originales agrupados correctamente para los


jefes de hojar y un 97,2% para los no jefes de hogar,
Observando el resultado de las clasificasiones para ambas bases de datos se
aprecia que la gran cantidad de las personas se agrupan en el grupo de los
pobre no extremos y que el factor jefe de hogar no es una variable secisoria
para diferenciar entre pobre extremos y no extremos la proporcion de los grupo
es similar.
Lo que concluye en que la distribucion de jefes de hogar tomando en cuenta
las variables de Escala: edad, numper, o13, s19, esc, yopraj, ytrabhoj,
ymonehaj, ytohaj.no es muy diferente tomando el nivel de pobreza desde el
punto de vista extremo.

4) Para este analisis se uso la variable qaur como dependiente y como


variables independientes las de Escala: edad, numper, o13, s19, esc, yopraj,
ytrabhoj, ymonehaj, ytohaj.
La variable qaur corresponde a una variable de 5 categorias I, II, III, IV Y V que
son los quintiles de ingreso autonomo nacional
Analisasndo los datos validos para ambas bases de datos
.
Se observa que para la base de datos de jefes de familia hay un 65% de datos
validosy para la base de datos de los no jefes de hogar presentan un 27% de
datos validos la diferencia es alta
Analizando el lamda de wilks para las 2 bases de datos
.
Se observa que todas las variables tienen poder discriminante, Bueno para el
analisis discriminante
Analisando la pueba de Box para ambas bases de datos

Para ambas bases de datos las covariansas son distintas.


Analizando las tlablas de clasificasion
.
Se observa que el gran grupo son los del V quintil para las dos bases de datos
pero se apresia que para la base de datos de jefes de hogar los grupos parasen
ser mas omogeneos ser que en las regions 6 y 7 de chile los jefes de hogar
existen en casi igual medida en rangos de pobreza altos.

Anda mungkin juga menyukai