Anda di halaman 1dari 7

ANÁLISIS FACTORIAL

El modelo de Análisis Factorial es un modelo de regresión múltiple que relaciona variables latentes con
variables observadas. El Análisis Factorial tiene muchos puntos en común con el análisis de
componentes principales, y busca esencialmente nuevas variables o factores que expliquen los datos.

En el análisis de componentes principales, en realidad, sólo se hacen transformaciones ortogonales de


las variables originales, haciendo hincapié en la varianza de las nuevas variables. En el análisis
factorial, por el contrario, interesa más explicar la estructura de las covarianzas entre las variables.

Al igual que en el método de los componentes principales, para efectuar el análisis factorial, es
necesario que las variables originales no estén incorreladas porque si lo estuvieran no habría nada que
explicar de las variables.

Las nuevas variables o Componentes, se pueden utilizar con múltiples objetivos, tales como:

 Describir con claridad gran cantidad de datos cuantitativos y analizar las relaciones existentes
entre ellos.

 Realizar estudios Multivariantes posteriores, como un Análisis Cluster , o construir un modelo de


Regresión utilizando los pocos datos dados por las Componentes en lugar de los muchos
proporcionados por las variables iniciales.

El objetivo de este método Multivariante, es precisamente, identificar y cuantificar estos Factores


Comunes. Por otro lado, el Análisis de Componentes Principales no exige condiciones previas acerca
de la estructura de los datos de partida, mientras que el Análisis Factorial de Correlaciones, supone la
existencia de un Modelo que ha generado dichos datos. Además, dentro del Análisis Factorial de
Correlaciones, se puede tener, o no, conocimiento del número de Factores Comunes.
EJEMPLO: Muestra de 122 personas que fueron encuestadas en el año 2017 por personas que
pertenecían al Centro de Salud (POSTA CLASS) ubicada en AV Principal s/n La Legua, para tener un
registro de las personas que acudían a este centro de Salud y su situación económica.

Se midieron diferentes variables como: Su identificación, sexo, edad, estado civil, número de hijos,
ingresos mensuales, salario, ahorros anuales, peso, altura, salud y actividades. Para este caso se
analizara a través del análisis factorial.

Utilizamos un análisis factorial sobre las variables edad, número de hijos, salario, ingresos mensuales,
ahorros anuales, peso y altura
Análisis factorial

Estadísticos descriptivos

Desviación
Media estándar N de análisis

EDAD 44,63 9,769 122


HIJOS 1,66 ,839 122
SALARIO 899,18 202,666 122
INGRESOSMENSUALES 1055,74 295,713 122
AHORROSANUALES 2426,23 1094,978 122
PESO 81,20 17,046 122
ALTURA 1,7205 ,10594 122

INTERPRETACION

De los 122 sujetos se concluyó que el numero promedio de hijos es aproximadamente 2, su edad
promedio es de 45 años y su salario de cada uno es aproximadamente de s/ 900.00.

El peso aproximadamente es de 81.20 kg y su altura de 1.7205, concluyendo así que tienen un peso y
una altura promedio.

Matriz de correlacionesa

INGRESOSMENS AHORROSANUA
EDAD HIJOS SALARIO UALES LES PESO ALTURA

Correlación EDAD 1,000 -,145 ,062 ,003 ,076 -,010 ,009

HIJOS -,145 1,000 ,246 ,173 -,163 ,026 -,023

SALARIO ,062 ,246 1,000 ,806 ,221 ,094 ,063

INGRESOSMENSUALES ,003 ,173 ,806 1,000 ,159 ,104 ,009

AHORROSANUALES ,076 -,163 ,221 ,159 1,000 ,042 ,042

PESO -,010 ,026 ,094 ,104 ,042 1,000 ,013

ALTURA ,009 -,023 ,063 ,009 ,042 ,013 1,000


Sig. (unilateral) EDAD ,055 ,249 ,487 ,203 ,458 ,461

HIJOS ,055 ,003 ,029 ,036 ,387 ,400

SALARIO ,249 ,003 ,000 ,007 ,151 ,245

INGRESOSMENSUALES ,487 ,029 ,000 ,040 ,126 ,462

AHORROSANUALES ,203 ,036 ,007 ,040 ,323 ,325

PESO ,458 ,387 ,151 ,126 ,323 ,445

ALTURA ,461 ,400 ,245 ,462 ,325 ,445


a. Determinante = ,277
Prueba de KMO y Bartlett

Medida Kaiser-Meyer-Olkin de adecuación de muestreo ,891


Prueba de esfericidad de Bartlett Aprox. Chi-cuadrado 151,249

gl 21

Sig. ,043

INTERPRETACION

El test KMO (Kaiser, Meyer y Olkin) relaciona los coeficientes de correlación, en este caso se obtiene
0.891 quiere decir que cuanto más cerca de 1 tenga el valor obtenido del test KMO, implica que la
relación entre las variables es alta.

La prueba de esfericidad de Bartlett evalúa la aplicabilidad del análisis factorial de las variables
estudiadas. El modelo es significativo ,cuando se puede aplicar el análisis factorial

Prueba de esfericidad de Bartlett:

Si Sig. (0.043) < 0.05 entonces se puede aplicar el análisis factorial.

Comunalidades

Inicial Extracción

EDAD 1,000 ,331


HIJOS 1,000 ,619
SALARIO 1,000 ,878
INGRESOSMENSUALES 1,000 ,828
AHORROSANUALES 1,000 ,502
PESO 1,000 ,045
ALTURA 1,000 ,040

Método de extracción: análisis de componentes principales.

INTERPRETACION

La variable salario es la mejor explicada (0.878), mientras la variable edad es la peor explicada (0.331),
el modelo solo puede explicar el 33.1 % de su variable original.
A partir de esta tabla podemos empezar a plantearnos si el número de factores obtenidos es suficiente
para explicar todas y cada una de las variables incluidas en el análisis.
También podemos empezar en este momento si, dando por bueno el número de factores extraído,
alguna de las variables incluidas podría quedar fuera del análisis
Varianza total explicada

Autovalores iniciales Sumas de extracción de cargas al cuadrado

Componente Total % de varianza % acumulado Total % de varianza % acumulado

1 1,976 28,232 28,232 1,976 28,232 28,232


2 1,267 18,095 46,327 1,267 18,095 46,327
3 ,998 14,253 60,580
4 ,979 13,985 74,564
5 ,911 13,020 87,584
6 ,689 9,836 97,420
7 ,181 2,580 100,000

Método de extracción: análisis de componentes principales.

INTERPRETACION

La tabla de varianza total explicada, explica más en detalle la selección de los dos componentes
principales. Como se puede observar, únicamente los dos primeros factores tienen valores propios
mayores que 1 y explican el 56.327% de la varianza, esto quiere decir que con estos dos factores se
puede representar un 56.327 % del problema original, produciéndose la perdida de tan solo el 43.673 %
de la información original representada por siete variables iniciales

Matriz de componentea

Componente

1 2

EDAD ,035 ,575


HIJOS ,343 -,708
SALARIO ,937 ,016
INGRESOSMENSUALES ,910 -,013
AHORROSANUALES ,318 ,633
PESO ,211 ,019
ALTURA ,077 ,184

Método de extracción: análisis de componentes principales.


a. 2 componentes extraídos.

INTERPRETACION

Podemos observar que el primer factor estaría compuesto por 7 variables, mientras que el segundo
factor lo componen 5 variables.

Con estos resultados observamos que la primera componente tiende a ser muy general agrupando a un
número significativo de variables, mientras que la otra componente agrupa a un número poco
significativo de variables, sin embargo, las cargas son claras, por lo que no existe ambigüedad en la
selección de las variables por factor
Correlaciones reproducidas

EDAD HIJOS SALARIO INGRESOSMENSUALES AHORROSANUALES PESO ALTURA

Correlación reproducida EDAD ,331a -,395 ,041 ,024 ,375 ,018 ,108

HIJOS -,395 ,619a ,310 ,321 -,339 ,059 -,104

SALARIO ,041 ,310 ,878a ,852 ,308 ,198 ,075

INGRESOSMENSUALES ,024 ,321 ,852 ,828a ,281 ,192 ,068

AHORROSANUALES ,375 -,339 ,308 ,281 ,502a ,079 ,141

PESO ,018 ,059 ,198 ,192 ,079 ,045a ,020

ALTURA ,108 -,104 ,075 ,068 ,141 ,020 ,040a


Residuob EDAD ,250 ,021 -,021 -,299 -,028 -,099

HIJOS ,250 -,064 -,148 ,176 -,033 ,081

SALARIO ,021 -,064 -,046 -,087 -,104 -,012

INGRESOSMENSUALES -,021 -,148 -,046 -,122 -,088 -,059

AHORROSANUALES -,299 ,176 -,087 -,122 -,037 -,099

PESO -,028 -,033 -,104 -,088 -,037 -,007

ALTURA -,099 ,081 -,012 -,059 -,099 -,007

Método de extracción: análisis de componentes principales.


a. Comunalidades reproducidas
b. Los residuos se calculan entre las correlaciones observadas y reproducidas. Existen 13 (61,0%) residuos no redundantes con valores absolutos mayores que
0,05.

Matriz de coeficiente de puntuación de componente

Componente

1 2

EDAD ,017 ,454


HIJOS ,173 -,559
SALARIO ,474 ,013
INGRESOSMENSUALES ,460 -,010
AHORROSANUALES ,161 ,500
PESO ,107 ,015
ALTURA ,039 ,145

Método de extracción: análisis de componentes principales.


Puntuaciones de componente.
Matriz de covarianzas de puntuación de componente

Componente 1 2

1 1,000 ,000
2 ,000 1,000

Método de extracción: análisis de componentes principales.


Puntuaciones de componente.

INTERPRETACION

La matriz de las covarianzas de las puntuaciones factoriales contiene en la diagonal principal la varianza
de las puntuaciones factoriales y las covarianzas entre pares de factores. Si vale cero, eso significa que
son completamente independientes entre sí, es decir no existe correlación entre ellas.

CONLUSIONES

El análisis factorial (AFP) es una técnica de análisis multivariante que se utiliza para el estudio e
interpretación de las correlaciones entre un grupo de variables, parte de la idea de que dichas
correlaciones no son aleatorias sino que se deben a la existencia de factores comunes entre ellas.

Por ejemplo, hay variables como salud, estado civil, actividades, etc, que es necesario conocer pero que
no se pueden medir con una sola pregunta, porque se trata de fenómenos complejos que se manifiestan
en infinidad de situaciones, comportamientos y opiniones concretas. En consecuencia estos fenómenos
son el resultado de la medición de un conjunto de características. El AF nos permitirá obtener nuevas
variables o factores que no son directamente medibles pero que tienen un significado. Por lo tanto se
trata de una técnica adecuada para el caso de variables continuas altamente correlacionadas.

Anda mungkin juga menyukai