Tterreno.sav
Archivo: trabajo.sav
Ejercicios de repaso
Con el fichero de xls de trabajo de IMD
REGRESION LINEAL
TRATAMOS DE EXPLICAR UNA VARIABLE
REGRESION LINEAL
La F (Anova) nos da informacin sobre si el modelo es
REGRESIN LINEAL
Una vez hemos obtenido las o estimadores
EJERCICIOS
INTERPRETACIN DEL EJERCICIO EN
REGRESION LINEAL
FICHERO TTERRENO.SAV
FICHERO TTERRENO.SAV
EJERCICIOS
FICHERO TRABAJO.SAV
Regresin
Podemos sufrir el problema de
ANLISIS DISCRIMINANTE y
REGRESIN LOGSTICA
El anlisis discriminante y la
regresin logstica son tcnicas
SIMILARES A LA REGRESIN; son
estadsticas apropiadas cuando la
variable dependiente es categrica
(NOMINAL)
y
las
variables
independientes
son mtricas.
A MODO DE REPASO, TANTO FACTORIAL COMO CLUSTER
Y DISCRIMINANTE, TODAS LAS MULTIVARIANTES
FUNCIONAN MEJOR CON DATOS MTRICOS
ANLISIS DISCRIMINANTE y
REGRESIN LOGSTICA
El A.D. tiene la capacidad de tratar tanto dos
grupos como grupos mltiples (tres o ms).
Sin
embargo,
no
tiene
la
misma
interpretacin directa que la regresin
La regresin logstica o anlisis logit,
est restringida en su forma bsica a dos
grupos, a una respuesta dicotmica, si bien
es ms estable y presenta mejores
propiedades que el AD.
AD y Regresin logstica
AD lo utilizaremos cuando su variable dependiente o
EJEMPLO: SUBESPECIE
A
B
C
D
Regresin logstica
El LOGIT, slo admite una respuesta
VOTACIN ELECCIONES
PP
PSOE
EJEMPLO: DEPARTAMENTO DE MK
SI
NO
REGRESION LOGISTICA
Son tcnicas de PREDICCIN
Regresin logstica
LO QUE NOS INTERESA ES DETERMINAR
SI LO AVERIGUAMOS, PODREMOS
EMPRESAS O PERSONAS EN LA
MUESTRA PODREMOS PRONOSTICAR A
QU GRUPO PERTENECERA
UTILIDADES DE LAS
HERRAMIENTAS
UTILIDADES
EMPRESAS: EL QUE LA EMPRESA SOBREVIVA (1)
O QUIEBRE (0)
QUE LA EMPRESA EXPORTE O NO
QUE LOS CONSUMIDORES COMPREN (1) O NO(2)
MDICAS
POR EJEMPLO, SI DETERMINAMOS LAS
VARIABLES QUE EXPLICAN EL SUFRIR (1) O NO
SUFRIR (0) UN ATAQUE AL CORAZN PODREMOS
PRONOSTICA LA POSIBILIDAD O PROBABILIDAD
DE QUE LAS PERSONAS EN FUNCIN DE SU
CONDUCTA SUFRAN O NO EL ATAQUE
Regresin logstica
Ofrece una medida de ajuste o bondad
expresada como
-2 log. Verosimilitud (-2LL) cuanto MS BAJA
mejor, cero sera lo perfecto. Adems, se
apoya en una Chi-Cuadrado, que nos
corrobora la VALORACIN GLOBAL DEL
MODELO, lo que tampoco implica (como en la
regresin) que todas las variables sean
buenas.
El grupo de menos individuos, normalmente el
que toma valor 0, debe tener ms individuos
que el nmero de variables y, adems, como
mnimo el 10% de la muestra total.
Regresin logstica
Se ofrece la Matriz de clasificacin o confusin,
confusin
empresarial (AMD-Levy)
Cmo funciona el modelo?
Qu variable es la ms importante?
ANLISIS DISCRIMINATE
El anlisis discriminante permite determinar
ANLISIS DISCRIMINANTE
La ecuacin lineal discriminante, similar a
ANLISIS DISCRIMINANTE
Muestra total: relacin ptima de 20 a 1. Mnima de 5
a 1.
El grupo de menos individuos tiene que ser como
mnimo mayor que el nmero de variables
La regla general es que cada grupo tenga al menos
20 individuos.
ESTIMAR TANTAS FUNCIONES
DISCRIMINANTES COMO GRUPOS MENOS 1
Anlisis discriminante
LAS PONDERACIONES o CARGAS FACTORIALES
Anlisis discriminante
LA CAPACIDAD DE PREDICCIN O
POTENCIA DE CLASIFICACIN LA
OBSERVAREMOS EN LA MATRIZ DE
CONFUSIN,
CONFUSIN QUE CLASIFICA LOS
GRUPOS OBSERVADOS (A PRIORI) Y LOS
ESTIMADOS CON LAS VARIABLES
INDEPENDIENTES
IMAGEN
VARIEDAD
instituto
Lambda
de Wilks
,136
,126
,553
F
97,534
106,818
12,381
gl1
gl2
3
3
3
46
46
46
Sig.
,000
,000
,000
Resultados de la prueba
M de Box
F
Aprox.
gl1
gl2
Sig.
18,317
,882
18
4003,896
,602
Autovalores
Funcin
1
2
3
Autovalor % de varianza
12,563a
93,3
,829a
6,2
,077a
,6
% acumulado
93,3
99,4
100,0
Correlacin
cannica
,962
,673
,267
Lambda
de Wilks
,037
,508
,928
Chi-cuadrado
149,493
30,858
3,377
gl
9
4
1
Sig.
,000
,000
,066
Resultados de la clasificacina
Original
Recuento
Total
17
13
12
8
100,0
100,0
100,0
100,0
EJERCICIOS DISCRIMINANTE
EJERCICIO DISCRIMINANTE
ARCHIVO: 13.1
EDAD
HABITAT
N LIBROS LEIDOS
HORAS TV
NOTA MEDIA
NUMERO HERMANOS
MUNDO.SAV
INGESTA CALORAS
PIB-CAP
% HABITANTES CIUDADES
POBLAC
EJERCICIOS DISCRIMINANTE
TRABAJO.SAV
B1 (DEPENDIENTE, DICOTOMICA)
C1 (CATEGORIACA), C2, C6
TODO ELLO EN INDIVIDUOS DE MENOS DE
60 AOS
ARCHIVO: TERRENO.SAV
CILINDRO (4,5,6,7,8)
TODAS LAS VARIABLES MENOS MARCA
EJERCICIOS DISCRIMINANTE
11.1 (CANCER)
NODOS (DEPENDIENTE, DICOTOMICA)
EDAD
ACIDO
GRADO
ETAPA
RADIOGRAFA
REVALORIZACIN PV
ARCHIVO: CRECIMIENTO
GENERO (NIO/NIA)
DISTANCIA
EDAD
ANLISIS DISCRIMINANTE
REGRESIN LOGSTICA
Variables:
Alfabetizacin (alfabet)
Incremento poblacin (inc_pob)
Esperanza vida femenina (espvidaf)
Mortalidad infantil (mortinf)
Numero promedio hijos mujer (fertilid)
Tasa natalidad (tas_nat)
Log_pib
Urbana
Tasa mortalidad (tasa_mor)
ARCHIVO: FACTO2.SAV
CASH/VENTAS; INMOVILIZADO/ACTIVO;
VENTAS /PALANTILLA; VENTAS/ACTIVO;
BEFOS /VENTAS; VENTAS / INMOVILIZADO
Ejercicios de repaso
Fichereo: comparacin medias y tablas.xls
Averigua: si existe relacin de contingencia entre el
tamao y el pertenencer a un instituto
Existen diferencias entre la imagen y el tamao, y
entre los productos y el tamao
Existen diferencias entre el tamao y las
rentabilidades 94??
Antes debes analizar los datos
Fichero: comparacin medias.xls
MUESTRAS Y MUESTREO
CONCEPTOS BSICOS
-MUESTRA: conjunto reducido de individuos o elementos de una
poblacin, escogidos para obtener informacin sobre los
mismos y generalizarla al resto de la poblacin
-POBLACIN: todos y cada uno de los individuos o elementos de
los cuales se quiere tener una informacin
-ERROR SISTEMTICO: o de muestreo, es el asociado a la
difernecia entre un estimador concreto de una muestra y el
parmetro calculado en la poblacin
Fuente:
Investigacin de
Mercados
Miquel et al.
(1997:140) captulo 7
Tipos de muestreo
Aleatorio
Estratificado (afijaciones)
Fuente: Miquel
et al.
(1997:151)
CLCULO DE LA MUESTRA
EJERCICIOS
N= 25.534, ERROR DEL 5%, Z = 2,
EJERCICIOS
FICHERO: TRABAJO
SELECCIONAR FORMA ALEATORIA 200
CASOS
POR CONGLOMERADOS: POR SEXOS
PROCEDE: DATOS /SELECCIONAR CASOS
SOBRE EL SECTOR DEL AZULEJO