Anda di halaman 1dari 61

Ejercicios de repaso

Tterreno.sav

los cohes de 4 cilindros consumen en


promedio lo mismo que los de 6 a 90, 120 o
urbano? Parametrico y no paramtrico
Tablas cruzadas c1 directivos y e6 estudios
procedencia

Archivo: trabajo.sav

relacin entre sexo (c1) e idelologa (c9)?


Muestrea los residentes de Andalucia y
Aragon (c15) y elige el 20% de cada uno ellos

EJERCICIOS REPASO FACTORIAL


Y CLUSTER
ARCHIVO DE CC.AA.sav, realiza el anlsis

cluster en 2 etapas, jerrquico y no


jerrquico. Graba las variables para utilizarlas
en otros anlisis, existen diferencias entre
criterio jerrquico y no-jerrquico??
Anlisis factorial con trabajo.sav (b13 a b21):
mejora el anlisis si elimino alguna variable
siguiendo la comunalidad?
Anlisis factorial con facto1.

Ejercicios de repaso
Con el fichero de xls de trabajo de IMD

realizar descriptivos y factorial y cluster.


variables capital humano, ..

REGRESION LINEAL
TRATAMOS DE EXPLICAR UNA VARIABLE

DEPENDIENTE (EXPLICADA) MTRICA A


TRAVS DE VARIABLES INDEPENDIENTES
(EXPLICATIVAS) MTRICAS.
UNA INDEPENDIENTE, REGRESION
SIMPLE
DOS O MS INDEPENDIENTES,
REGRESIN MLTIPLE

REGRESION LINEAL
La F (Anova) nos da informacin sobre si el modelo es

globalmente significativo, vlido, si bien eso no implica que


todas las variables sirvan
Por lo tanto, hay que ver como contribuye cada variable
independiente a la explicacin, en signo (sentido), valor
(intensidad) y validez (significatividad)
La R2 (R cuadrado corregida) es el grado de la bondad del
ajuste, que significa la calidad del ajuste, o el % en el que
la variable dependiente es explicada por las
independientes

Ejemplo: R2 = 0,8, significa que el 80% de la variable est


explicada por las variables independientes.

REGRESIN LINEAL
Una vez hemos obtenido las o estimadores

(predictores) podremos predecir la variable


dependiente para el sujeto n+1
Por lo tanto es una tcnica de ajuste y
prediccin.
Si hay varias variables la explicacin se har
en unidades estandarizadas, en
estandarizadas
Si hay variables no mtricas entonces
realizaremos la trampa de las ficticias,
interpretando sobe la omitida

EJERCICIOS
INTERPRETACIN DEL EJERCICIO EN

CLASE (EXPLICACIN SUELDO, PP.315)


Cmo realizaramos la prediccin si un nuevo
individuo tiene 35 aos de edad, lleva 3 en la
empresa, es mujer, tiene estudios universitarios
(1), 2 hijos y categora media laboral?

ESPECIFICA EL MODELO E INTERPRETA

REGRESION LINEAL
FICHERO TTERRENO.SAV

PODEMOS EXPLICAR EL PRECIO (PVP) A


TRAVS DE EL PESO Y LA POTENCIA?
QU INTERPRETACIN TENDRA?

FICHERO TTERRENO.SAV

PODEMOS EXPLICAR EL CONSUMO A 120


KM/H A TRAVS DE LA CILINDRADA, CC?
QU INTERPRETACIN TENDRA?

EJERCICIOS
FICHERO TRABAJO.SAV

SE PUEDE EXPLICAR LA SATISFACCIN


EN EL TRABAJO (b36) con las VARIABLES
DESDE b22 hasta b32?
cules son las variables que realmente
contribuyen al model y con las que podramos
resumir toda la informacin para explicar la
SATISFACCIN (b36)?

Regresin
Podemos sufrir el problema de

COLINEALIDAD o Correlacin entre las


variables INDEPENDIENTES, en este caso,
se pueden enmascarar variables buenas, con
pobres betas por culpa de la influencia de
otras variables

ANLISIS DISCRIMINANTE y
REGRESIN LOGSTICA
El anlisis discriminante y la
regresin logstica son tcnicas
SIMILARES A LA REGRESIN; son
estadsticas apropiadas cuando la
variable dependiente es categrica
(NOMINAL)
y
las
variables
independientes
son mtricas.
A MODO DE REPASO, TANTO FACTORIAL COMO CLUSTER
Y DISCRIMINANTE, TODAS LAS MULTIVARIANTES
FUNCIONAN MEJOR CON DATOS MTRICOS

ANLISIS DISCRIMINANTE y
REGRESIN LOGSTICA
El A.D. tiene la capacidad de tratar tanto dos
grupos como grupos mltiples (tres o ms).
Sin
embargo,
no
tiene
la
misma
interpretacin directa que la regresin
La regresin logstica o anlisis logit,
est restringida en su forma bsica a dos
grupos, a una respuesta dicotmica, si bien
es ms estable y presenta mejores
propiedades que el AD.

No se basa en una distribucin


paramtrica

AD y Regresin logstica
AD lo utilizaremos cuando su variable dependiente o

explicada es categrica, pudiendo representar ms


de dos respuestas o categoras

EJEMPLO: SUBESPECIE

A
B
C
D

EJEMPLO: TIPO DE EMPRESAS


EXCELENTE (GACELA)
SUPERVIVIENTE
RETRASADA (TORTUGA)

EJEMPLO: CLASIFICACIN IDEOLGICA


DERECHA
CENTRO
IZQUIERDA

Regresin logstica
El LOGIT, slo admite una respuesta

(variable explicada o dependiente)


DICOTMICA (2 CATEGORAS)

VOTACIN ELECCIONES

PP
PSOE

EJEMPLO: DEPARTAMENTO DE MK

SI
NO

REGRESION LOGISTICA
Son tcnicas de PREDICCIN

TENEMOS LOS GRUPOS ESTABLECIDOS A PRIORI

POR EJEMPLO, DESPUS DE HABER REALIZADO UN


ANLISIS CLUSTER Y OBTENIDO DIFERENTES
SEGMENTOS DE MERCADO O DIFERENTES GRUPOS
(2)

QUEREMOS SABER QUE VARIABLES DISCRIMINAN A


LAS OBSERVACIONES A QUE PERTENEZCAN A UNO U
OTRO GRUPO O CATEGORA. ES DECIR, QUEREMOS
SABER QU VARIABLES HACEN QUE LOS
INDIVIDUOS PERTENEZCAN A UNO U OTRO GRUPO

Regresin logstica
LO QUE NOS INTERESA ES DETERMINAR

QUE VARIABLES INDEPENDIENTES


EXPLICAN LA PERTENENCIA A UN
DETERMINADO GRUPO

SI LO AVERIGUAMOS, PODREMOS

PREDECIR YA QUE PARA NUEVAS

EMPRESAS O PERSONAS EN LA
MUESTRA PODREMOS PRONOSTICAR A
QU GRUPO PERTENECERA

UTILIDADES DE LAS
HERRAMIENTAS
UTILIDADES
EMPRESAS: EL QUE LA EMPRESA SOBREVIVA (1)
O QUIEBRE (0)
QUE LA EMPRESA EXPORTE O NO
QUE LOS CONSUMIDORES COMPREN (1) O NO(2)
MDICAS
POR EJEMPLO, SI DETERMINAMOS LAS
VARIABLES QUE EXPLICAN EL SUFRIR (1) O NO
SUFRIR (0) UN ATAQUE AL CORAZN PODREMOS
PRONOSTICA LA POSIBILIDAD O PROBABILIDAD
DE QUE LAS PERSONAS EN FUNCIN DE SU
CONDUCTA SUFRAN O NO EL ATAQUE

Regresin logstica
Ofrece una medida de ajuste o bondad

expresada como
-2 log. Verosimilitud (-2LL) cuanto MS BAJA
mejor, cero sera lo perfecto. Adems, se
apoya en una Chi-Cuadrado, que nos
corrobora la VALORACIN GLOBAL DEL
MODELO, lo que tampoco implica (como en la
regresin) que todas las variables sean
buenas.
El grupo de menos individuos, normalmente el
que toma valor 0, debe tener ms individuos
que el nmero de variables y, adems, como
mnimo el 10% de la muestra total.

Regresin logstica
Se ofrece la Matriz de clasificacin o confusin,
confusin

donde se recogen los valores observados y los


predicted para evaluar, con las variables que hemos
utilizado, si el modelo es capaz o no de predecir la
pertenencia de un individuo a uno u otro grupo
Posteriormente, debemos evaluar la contribucin de
cada variable (Significatividad) y la interpretacin de
las mismas como la influencia significativa (+)
positiva o negativa (-) en la probabilidad de
pertenecer al grupo 1. No obstante la intensidad de la
influencia NO SE INTERPRETA COMO EN LA
REGRESIN, sino en el cambio exponenecial que
debe estar alejado de 1 por arriba (+) o por abajo (-)

Regresin logstica: ejercicios


Ejercicio de prediccin de quiebra

empresarial (AMD-Levy)
Cmo funciona el modelo?
Qu variable es la ms importante?

ANLISIS DISCRIMINATE
El anlisis discriminante permite determinar

cules son las variables (de entre la serie de


variables seleccionadas previamente por el
investigador), que mejor explican la
pertenencia de un individuo a un grupo
determinado (Pedret et al., 2000:228). En
otras palabras, tratamos de determinar si un
conjunto de variables pueden explicar la
pertenencia a un grupo previamente
determinado por el investigador

ANLISIS DISCRIMINANTE
La ecuacin lineal discriminante, similar a

una regresin mltiple, es la siguiente:


D = B0 + B1 X1 + B2 X2 + ..+ Bp Xp
Donde Xi son las variables independientes,

B0 es la constante y Bi son los coeficientes


estimados a partir de los datos originales de
modo que los valores de la funcin difieran el
mximo posible entre los diferentes grupos.

ANLISIS DISCRIMINANTE
Muestra total: relacin ptima de 20 a 1. Mnima de 5

a 1.
El grupo de menos individuos tiene que ser como
mnimo mayor que el nmero de variables
La regla general es que cada grupo tenga al menos
20 individuos.
ESTIMAR TANTAS FUNCIONES
DISCRIMINANTES COMO GRUPOS MENOS 1

SI POR EJEMPLO HAY 3 GRUPOS CON UNA SOLA


FUNCIN PUEDE DISCRIMINAR ENTRE EL 3 Y 2
PERO NO 1 Y 2

Anlisis discriminante
LAS PONDERACIONES o CARGAS FACTORIALES

ESTANDARIZADAS, SEALAN EL SIGNO Y


CUANTA QUE CADA VARIABLE TIENE DE
DISCRIMINACIN.
Es la contribucin de la variable a la funcin
discriminante
Funciona como las de la regresin, si bien el signo
no importa
La Matriz de estructura nos ordenar la importancia
en trminos de contribucin de cada variable
El stepwise es muy vlido para quedarnos las que
realmente importan

Anlisis discriminante
LA CAPACIDAD DE PREDICCIN O

POTENCIA DE CLASIFICACIN LA
OBSERVAREMOS EN LA MATRIZ DE
CONFUSIN,
CONFUSIN QUE CLASIFICA LOS
GRUPOS OBSERVADOS (A PRIORI) Y LOS
ESTIMADOS CON LAS VARIABLES
INDEPENDIENTES

Pruebas de igualdad de las medias de los grupos

IMAGEN
VARIEDAD
instituto

Lambda
de Wilks
,136
,126
,553

F
97,534
106,818
12,381

gl1

gl2
3
3
3

46
46
46

Sig.
,000
,000
,000

LA IGUALDAD DE MEDIAS (COMPARACIN DE MEDIAS)


UTILIZA UNA F, COMO EL ANOVA UN FACTOR Y ME DICE
QUE TODAS LAS VARIABLES FUNCIONAN COMO
DISCRIMINANTES

Resultados de la prueba
M de Box
F

Aprox.
gl1
gl2
Sig.

18,317
,882
18
4003,896
,602

Contrasta la hiptesis nula de que las matrices


de covarianza poblacionales son iguales.

EL M-BOX ME INDICA SI REALMENTE HAY DIFERENCIAS ENTRE LOS


GRUPOS (MATRICES DE COVARIANZAS)
ES COMO EL KMO Y BARLETT DEL FACTORIAL, ME INDICA SI LA PRUEBA
PUEDE FUNCIONAR, SIN EMBARGO, NO ES TAN ESTRICTO COMO EN EL
CASO FACTORIAL

Autovalores
Funcin
1
2
3

Autovalor % de varianza
12,563a
93,3
,829a
6,2
,077a
,6

% acumulado
93,3
99,4
100,0

Correlacin
cannica
,962
,673
,267

a. Se han empleado las 3 primeras funciones discriminantes


cannicas en el anlisis.
Lambda de Wilks
Contraste de
las funciones
1 a la 3
2 a la 3
3

Lambda
de Wilks
,037
,508
,928

Chi-cuadrado
149,493
30,858
3,377

gl
9
4
1

Sig.
,000
,000
,066

EN ESTE CASO, 3 FUNCIONES DISCRIMINANTES PORQUE


HEMOS TRABAJADO CON 4 GRUPOS; LAS TRES SON
SIGNIFICATIVAS

Resultados de la clasificacina

Original

Recuento

Nmero inicial de casos


1
2
3
4
1
2
3
4

Grupo de pertenencia pronosticado


1
2
3
4
17
0
0
0
0
13
0
0
0
0
12
0
0
0
0
8
100,0
,0
,0
,0
,0
100,0
,0
,0
,0
,0
100,0
,0
,0
,0
,0
100,0

Total
17
13
12
8
100,0
100,0
100,0
100,0

a. Clasificados correctamente el 100,0% de los casos agrupados originales.

LA MATRIZ DE CONFUSIN NOS INDICA QUE CAPACIDAD DE


CLASIFICACIN O PREDICCIN TIENE EL MTODO, COMPARANDO
LOS CASOS PRONOSTICADOS Y COMPARNDOLO CON LOS
GRUPOS A PRIORI.

EJERCICIOS DISCRIMINANTE
EJERCICIO DISCRIMINANTE
ARCHIVO: 13.1

ESTUDIOS (EGB, BUP FP) POR LA

EDAD
HABITAT
N LIBROS LEIDOS
HORAS TV
NOTA MEDIA
NUMERO HERMANOS

MUNDO.SAV

CLIMA (TROPICAL, MEDITERRANEO O TEMPLADO) CON

INGESTA CALORAS
PIB-CAP
% HABITANTES CIUDADES
POBLAC

EJERCICIOS DISCRIMINANTE
TRABAJO.SAV

B1 (DEPENDIENTE, DICOTOMICA)
C1 (CATEGORIACA), C2, C6
TODO ELLO EN INDIVIDUOS DE MENOS DE
60 AOS
ARCHIVO: TERRENO.SAV

CILINDRO (4,5,6,7,8)
TODAS LAS VARIABLES MENOS MARCA

EJERCICIOS DISCRIMINANTE
11.1 (CANCER)
NODOS (DEPENDIENTE, DICOTOMICA)
EDAD
ACIDO
GRADO
ETAPA
RADIOGRAFA
REVALORIZACIN PV
ARCHIVO: CRECIMIENTO
GENERO (NIO/NIA)
DISTANCIA
EDAD

ANLISIS DISCRIMINANTE

REGRESIN LOGSTICA

EJERCICIOS DE PRCTICA CLUSTER


Archivo: mundo.sav

Variables:

Alfabetizacin (alfabet)
Incremento poblacin (inc_pob)
Esperanza vida femenina (espvidaf)
Mortalidad infantil (mortinf)
Numero promedio hijos mujer (fertilid)
Tasa natalidad (tas_nat)
Log_pib
Urbana
Tasa mortalidad (tasa_mor)

Ejercicios prctica: FACTORIAL

ARCHIVO: FACTO2.SAV

PRINCIPLES EMPRESAS ESPAOLAS

CASH/VENTAS; INMOVILIZADO/ACTIVO;
VENTAS /PALANTILLA; VENTAS/ACTIVO;
BEFOS /VENTAS; VENTAS / INMOVILIZADO

Ejercicios de repaso
Fichereo: comparacin medias y tablas.xls
Averigua: si existe relacin de contingencia entre el
tamao y el pertenencer a un instituto
Existen diferencias entre la imagen y el tamao, y
entre los productos y el tamao
Existen diferencias entre el tamao y las
rentabilidades 94??
Antes debes analizar los datos
Fichero: comparacin medias.xls

Realizar una prueba para averiguar si el tamao nos


lleva o no a una diferente variedad de productos
Antes, realiza un estudio de los datos

Tablas de contingencia: dicotomas


mltiples; EJERCICIO
Fichero: directivos; variable C1 (c1.1 a c1.11)
C1. Podra indicar qu incentivos salariales tiene en su

empresa (elija los que crea convenientes)


Por resultado empresa
por resultado negocio
Por objetivos individuales
Por objetivos equipo
Por evaluacin cumplimiento
Colectivos
Comisiones
Participacin en beneficios
otros

MUESTRAS Y MUESTREO

CONCEPTOS BSICOS
-MUESTRA: conjunto reducido de individuos o elementos de una
poblacin, escogidos para obtener informacin sobre los
mismos y generalizarla al resto de la poblacin
-POBLACIN: todos y cada uno de los individuos o elementos de
los cuales se quiere tener una informacin
-ERROR SISTEMTICO: o de muestreo, es el asociado a la
difernecia entre un estimador concreto de una muestra y el
parmetro calculado en la poblacin

PLANIFICACIN DE LA OBTENCIN DE LA MUESTRA

Fuente:
Investigacin de
Mercados
Miquel et al.
(1997:140) captulo 7

Tipos de muestreo
Aleatorio
Estratificado (afijaciones)

-Afijacin simple: consiste en el reparto a partes


iguales de la muestra entre los diversos estratos conocidos
-Afijacin proporcional: consiste en el reparto
proporcional de la muestra entre los distintos estratos, en
base al nmero de efectivos de cada uno de los mismos
(as se mantiene constante el coeficiente de elevacin)
Por conglomerados
otros

CLCULO DEL TAMAO MUESTRAL

TABLA DE MUESTRAS EN FUNCIN DEL ERROR Y LA


POBLACIN

Fuente: Miquel
et al.
(1997:151)

CLCULO DE LA MUESTRA

Fuente: Miquel et al.


(1997:150)

EJERCICIOS
N= 25.534, ERROR DEL 5%, Z = 2,

VARIANZA = 3.56 PRETEST


LO ANTERIOR CON POBLACIN INFINITA
N = 54.000, ERROR DEL 7%, 95,5%
CONFIANZA, P=Q
LO ANTERIOR CON POBLACIN INFINITA

EJERCICIOS
FICHERO: TRABAJO
SELECCIONAR FORMA ALEATORIA 200

CASOS
POR CONGLOMERADOS: POR SEXOS
PROCEDE: DATOS /SELECCIONAR CASOS
SOBRE EL SECTOR DEL AZULEJO

SUPONIENDO VARIABLE ES NOMINAL

BASE DE DATOS SABI

Anda mungkin juga menyukai