Anda di halaman 1dari 94

Manual SPSS (PASW)

Msc. Renzo Claure Aracena

Introduccin
Msc. Renzo Claure Aracena

SPSS-PASW-PASW Statistics
2005-2007, compra por IBM
Caractersticas

Amplia variedad de funciones, procedimientos e indicadores


Simplicidad en la lgica de los procedimientos
Soluciones grficas bastante completa
Soluciones a medida para distintos usos
Marketing, Administracin
Gentica
Ingeniera

Lenguaje de programacin sencillo e intuitivo


Excelente rendimiento en grandes volmenes de informacin
Msc. Renzo Claure Aracena

Entorno
Msc. Renzo Claure Aracena

Inicio
Mens
Herramientas
rea de edicin
Edicin de datos
Edicin de variables

Msc. Renzo Claure Aracena

Barra mens

Archivo: Mediante este men se pueden abrir, crear o grabar los diferentes ficheros que SPSS emplea, ya
sean de datos, instrucciones, resultados o procesos. Igualmente, es posible controlar las tareas de
impresin.
Edicin: Permite realizar las tareas habituales de edicin: modificar, borrar, copiar, pegar, seleccionar, etc.
Ver: Permite controlar diversos parmetros de visualizacin en pantalla.
Datos: Este men permite insertar variables, as como efectuar modificaciones en los ficheros de datos:
seleccionar, aadir, ponderar, etc.
Transformar: Aqu se encuentran todas las opciones relativas a la modificacin y generacin de nuevas
variables.
Analizar: Mediante este men se accede a los diferentes anlisis estadsticos que se pueden realizar con
los datos.
Grficos: Permite la creacin y edicin de diversos tipos de grficos de alta resolucin. Algunos de ellos
son tambin accesibles a travs de determinadas tcnicas estadsticas.
Utilidades: Entre otras, posibilita mostrar informacin sobre los ficheros de SPSS, las variables o el
tratamiento de conjuntos de variables.
Ventana: Dispone de las funciones habituales para controlar las ventanas.
Ayuda: Proporciona ayuda al usuario en el formato tpico de Windows.
Msc. Renzo Claure Aracena

Variables
Msc. Renzo Claure Aracena

Breve repaso de estadstica


Tipos de variables
Variables cualitativas
Variables nominales
Variables ordinales

Variables cuantitativas
Variables discretas
Variables contnuas
Msc. Renzo Claure Aracena

Normas para las variables


El nombre debe comenzar por una letra. Los dems
caracteres pueden ser letras, dgitos, puntos o los
smbolos _, @, #, - <
Los nombres de variable no pueden terminar en punto.
Se deben evitar los nombres de variable que terminan
con subrayado (para evitar conflictos con las variables
creadas automticamente por algunos procedimientos).
No se pueden utilizar espacios en blanco ni caracteres
especiales (por ejemplo, !, ?, y *).
Cada nombre de variable debe ser nico.
Los nombres de variable no distinguen maysculas de
minsculas.
Msc. Renzo Claure Aracena

Definicin del tipo

Numrica: En este formato, la separacin decimal se


hace mediante una coma (abajo). En la anchura de
los datos cuenta el signo (+ o -), si es que lo vamos a
poner, y cuenta la coma de la separacin decimal.
Coma: Se emplea cuando queremos que la coma
sea el separador de los miles y el punto el separador
de los decimales.
Punto: Se emplea cuando se quiere que el punto sea
el separador de los miles y la coma el separador de
los decimales.
Notacin cientfica: Los valores de la variable se
muestran con una E (o una D) intercalada y un
exponente con signo que representa una potencia de
base diez. El editor de datos acepta para estas
variables valores numricos con o sin el exponente.
Msc. Renzo Claure Aracena

Definicin del tipo

Fecha: Mediante este formato es posible introducir


las variables temporales. Comentaremos ms sobre
este tipo cuando definamos la variable entrada.
Dlar: A un valor numrico dado se le aade el
smbolo del dlar en los diferentes formatos que
aparecen en la ventana desplegable.
Moneda personalizada: Si a travs de la opcin
Edicin Opciones Carpeta de Moneda de la
barra de mens se han creado formatos especficos
para este tipo de variables, mediante esta opcin se
puede elegir uno de ellos.
Cadena: Variable cuyos resultados no son
numricos. En su definicin debe especificarse
nicamente su longitud mxima. Con este tipo de
variables, y a diferencia de lo que ocurra con los
nombres de las variables, s hay diferencia entre
emplear maysculas o minsculas
Msc. Renzo Claure Aracena

Otras caractersticas
Anchura
Etiqueta: Breve descripcin de la variable
Etiqueta de valor: til para representar
niveles, clases o categoras con nmeros,
algunos procedimientos que veremos
exigen que los datos est clasificados.

Perdidos: Sirve para especificar datos


perdidos, generalmente se presentan en
el proceso de recoleccin de los datos

Msc. Renzo Claure Aracena

Valores perdidos
Se pueden introducir hasta tres valores perdidos (individuales) de tipo
discreto, un rango de valores perdidos o un rango ms un valor de tipo
discreto
Solo pueden especificarse rangos para las variables numricas.
No se pueden definir los valores perdidos para variables de cadena larga
(variables de cadena cuyos resultados tengan ms de 8 caracteres).
Para las variables de cadena, se considera que son validos todos los
valores de cadena, incluidos los valores vacos o nulos, a no ser que se
definan explcitamente como perdidos. Para definir como perdidos los
valores vacos o nulos de una variable de cadena, se escribe un espacio en
blanco en uno de los campos de Valores perdidos discretos.

Msc. Renzo Claure Aracena

Manejo de fechas
Existe una diferencia importante
entre definir fechas y definir los
formatos de fecha

Manejo de Decimales

Si seleccionamos Coma entonces la separacin


de los miles se escribir con una coma y la
separacin de los decimales se escribir con un
punto. Si seleccionamos Punto entonces la
separacin de los miles se escribir con un punto
y la separacin de los decimales se escribir con
una coma.
Msc. Renzo Claure Aracena

Ejemplo de Clase
Definir una base de datos, con el nombre autos, que contenga las
siguientes variables.

MPG, millas por galn


Cilindros
Desplazamiento
Potencia_HP, potencia en caballos de fuerza
Peso_Lb, peso en libras
Aceleracin, segundos en alcanzar las 100 MPH
Modelo_ano, ao de fabricacin
Origen, origen de fabricacin: 1=USA, 2=Europa, 3=Asia
Nombre, nombre del modelo de automvil
Msc. Renzo Claure Aracena

Ejercicio para los alumnos


Crear una base de datos con las siguientes variables

Edad, edad en aos


Fecha_nac, fecha de nacimiento ao mes dia
Ingresos, ingresos en dolares
Nivel_est, nivel de estudios 1=bachiller 2=egresado
3=Titulado 4=Masterado 5=Doctorado
Idioma, idioma nativo
Sexo, sexo 1=masculino 2=femenino
Trabajo actual
Msc. Renzo Claure Aracena

Trabajo con datos


Msc. Renzo Claure Aracena

Edicin de datos y variables

Ir a un caso
Seleccionar
Corregir un dato
Buscar un dato
Insertar un nuevo caso
Ir a una variable

Msc. Renzo Claure Aracena

Apariencia del editor de datos

Barra de estado: Sirve para mostrar (cuando est sealado con un X) u ocultar
(cuando no lo est) la barra de estado del sistema.
Barras de herramientas: Sirve para mostrar u ocultar, personalizar y crear nuevas
barras de herramientas. En las barras de herramientas puede incluirse cualquier
herramienta disponible, incluso la de cualquier accin de men. Adems pueden
contener herramientas personalizadas que ejecutan otras aplicaciones, que
ejecutan archivos de sintaxis de comandos o archivos de procesos.
Fuentes: Si se elige esta opcin se abre un cuadro de dialogo similar al de todas las
aplicaciones Windows, que permite seleccionar las fuentes, estilos y tamaos.
Cuadricula: Sirve para mostrar (cuando est sealado) u ocultar (cuando no lo
est) la cuadricula que separa las diferentes casillas del editor de datos.
Etiquetas de valor: Sirve para mostrar (cuando est sealado) u ocultar (cuando
no lo est) las etiquetas de las variables en el editor de datos.
Variables (o Datos): Sirve para ver la carpeta Vista de variables o la carpeta Vista
de datos.
Msc. Renzo Claure Aracena

Importacin desde otras fuentes

Archivos de datos grabados en cdigo ASCII, con o sin tabulacin (con la opcin Archivo)Leer
datos de texto).
Archivos de otros paquetes estadsticos, como Systat (se selecciona Archivo)Abrir)Datos y en
el cuadro de dialogo que aparece se indica Systat(*.sys) en Tipo de archivos).
Archivos de hojas de clculo, como Lotus, Excel o formato SYLK (se selecciona
Archivo)Abrir)Datos y en Tipo de archivos se indica Lotus(*.w*), Excel(*.xls) o SYLK(*.slk),
respectivamente).
Archivos de sistemas de gestin de bases de datos, como dBASE (se selecciona Archivo
)Abrir)Datos y en el cuadro de dialogo que aparece se indica dBASE(*.dbf) en Tipo de
archivos).
Por supuesto, ficheros de datos SPSS creados en otros entornos y sistemas operativos (se
selecciona Archivo)Abrir)Datos y en Tipo de archivos se indica SPSS/PC+(*.sys) si estn
generados por SPSS en su versin para MS-DOS; o se indica SPSS portable(*.por) si se trata de
ficheros porttiles creados en otros entornos como Macintosh o VMS).
Adicionalmente, y mediante ODBC, se pueden capturar y manejar datos de Access,
Msc. Renzo Claure Aracena

Ejemplo
Importar el archivo autos2.xlsm
Importar el archivo autos3.csv

Msc. Renzo Claure Aracena

Un Parntesis
El Proceso de descubrimiento de conocimiento
KDD
Msc. Renzo Claure Aracena

Extraccin de Conocimiento
Fuentes de
Informacin
(CRM, Trfico, etc.)

Almacn
de Datos
(Datawarehouse)
Datos seleccionados
Limpios
(Vista Minable)

1.- Recopilacin e
Integracin de
Bases de Datos
2.-Seleccin,
Limpieza y
Transformacin

3.- Minera de
Datos
Patrones
4.- Evaluacin e
Interpretacin
Msc. Renzo Claure Aracena

Decisiones

Preparacin de datos
Msc. Renzo Claure Aracena

Ordenar
Se puede ordenar de dos
formas
Desde la barra de
mens
Directamente desde la
columna

Desde el men tambin


se puede hacer una
jerarqua de criterios de
ordenacin

Msc. Renzo Claure Aracena

Identificar duplicados
Se puede ordenar por ms
de un criterio
Crea una variable que
identifica los valores
duplicados, donde asigna 0
al caso original y 1,2,3 a
los duplicados
Contabiliza la cantidad de
duplicados
Se puede ordenar el
resultado para mejorar la
visibilidad
Msc. Renzo Claure Aracena

Agregar casos
Agregacin es un proceso donde
se resumen los datos en funcin
de una o ms variables nominales
Es posible entonces definir la
variable de segmentacin, las
variables de agregacin
Se puede tambin definir la
funcin de agregacin
Se puede generar un nuevo
archivo de las variables agregadas
(recomendable)
Msc. Renzo Claure Aracena

Agregacin
TIPO
a
b
a
a
b
c

Valor
1
3
5
7
9
11

Tipo
a
b
c

Suma_valor
13
16
0

Msc. Renzo Claure Aracena

Tipo
a
b
c

Contar_valor
3
2
1

Ejercicio
Ordenar el archivo autos1.sav por las siguientes variables y orden
Origen, ascendente
Peso_lb, ascendente
Potencia_HP, descendente

Identificar si existen duplicados con la misma potencia y nmero de


cilindros
Realizar una agregacin de los datos del archivo segmentado por:
Modelo_ano, Origen; la agregacion debe ser realizada en base a
Potencia, contabilizando la cantidad de casos y adems obteniendo
el promedio de la potencia.
Msc. Renzo Claure Aracena

Ejercicio para el alumno


En el archivo ingresos identificar si existen duplicados y su cantidad
por caso, entre educacin, pas de origen y raza.
Ordenar el archivo de acuerdo a:
Relacin, ascendente
Raza, descendente
Ingresos, descendente

Segmentar el archivo por


Relacin, raza, sexo
Agregarlo por Horas por semana en un nuevo archivo, sumarizado

Msc. Renzo Claure Aracena

Transformacin de variables
Msc. Renzo Claure Aracena

Creacin de nuevas variables

Calcular variables
Calcular Si
Ejemplos
Crear una variable que sea
igual al logaritmo de MPG,
solo en los casos que el auto
sea de origen asitico o
europeo

Ejemplo para el alumno


Crear una variable de peso en
kilogramos
Crear una variable que sea
igual a 1 si el origen es
asitico y el nmero de
cilindros es menor a 4

Msc. Renzo Claure Aracena

Recodificacin de variables
Recodificar en distintas variables

Msc. Renzo Claure Aracena

Recodificacin de variables
Recodificacin en la misma variable

Msc. Renzo Claure Aracena

Recodificacin de variables
Recodificacin automtica

Msc. Renzo Claure Aracena

Ejemplos
Recodificar en la misma variable, la variable numero de
cilindros, cambiando a todos los que tienen 3 cilindros
por un cilindro
Recodificar en distintas variables, la variables origens,
con la siguiente codificacin: 1=uno, 2=dos,
3=tres
Abrir el archivo ingresos1.sav, recodificar de forma
automtica la variable educacin.
Grabar el resultado como autos5.sav
Msc. Renzo Claure Aracena

Ejercicios para el alumno


Recodificar en distintas variables, creando una variable
que diga 6-8 cilindros, 4-5 cilindros, menos de 4
cilindros
Recodificar en la misma variable, los que tienen una
potencia mayor o igual a 180 como 2, a los que tienen
menos de 180 como 1 y a los perdidos como 0
En el archivo ingresos1.sav recodificar de forma
automtica la variable estado_civil
Msc. Renzo Claure Aracena

Estadstica descriptiva
unidimensional
Msc. Renzo Claure Aracena

Distribucin de frecuencias

Lista de
variables del
archivo de
datos abierto

Esta opcin est activada,


pero
esAracena
posible desactivarla
Msc. Renzo
Claure

Trasladar aqu
las variables
sobre las que se
quiere obtener
la distribucin
de frecuencias.

Distribucin de frecuencias
Estadsticos

Msc. Renzo Claure Aracena

Distribucin de frecuencias

Resultados
En esta
ventana
aparecen los
ttulos de
los
contenidos
del Visor de
Resultados

Para moverse de uno a


otro basta con hacer clic
con el ratn

Msc. Renzo Claure Aracena

Ejemplo
Determine la distribucin de frecuencias del
archivo autos.sav, para las variables: Cilindros,
Origen y Modelo_ano
Determine la distribucin de frecuencias del
archivo ingresos.sav, para las variables:
Tipo_trabajo, Educacin, raza
Msc. Renzo Claure Aracena

Ejercicio para el alumno


Determine la distribucin de frecuencias del
archivo ingresos1.sav, para las variables:
Horas por semana
Ingreso
Pas de origen

Msc. Renzo Claure Aracena

Estadsticos descriptivos
Presenta un resumen
rpido de los
principales
estadsticos

Msc. Renzo Claure Aracena

Explorar variables

Una forma ms completa de


analizar los datos,
estadsticos, distribuciones,
extremos, etc.

Msc. Renzo Claure Aracena

Ejemplo
Determine los estadsticos descriptivos del
archivo autos.sav, para las variables: Cilindros,
Origen y Modelo_ano.
Explore el archivo ingresos.sav, para las
variables: Tipo_trabajo, Educacin; utilice la
variable raza como agrupador
Msc. Renzo Claure Aracena

Ejercicio para el alumno


Determine los estadsticos descriptivos del
archivo ingresos1.sav, para las variables: Edad,
Horas semana,
Explore el archivo autos1.sav, para las
variables: Desplazamiento, Potencia_HP;
agrupados por el Origen de fabricacin
Msc. Renzo Claure Aracena

Ejemplo para el alumno


En el archivo cancer1.sav explorar las variables:
Radio
Textura
Permetro

Agrpelas por el Tipo


Identifquelas por el ID
Msc. Renzo Claure Aracena

Grficos unidimensionales
Diagrama de barras

Grfica de sectores

Msc. Renzo Claure Aracena

Grficos unidimensionales
Histograma de frecuencias

Tallo y hoja, se encuentra en


el men de explorar

Msc. Renzo Claure Aracena

Grficos unidimensionales

Diagrama de caja

Valores atpicos

Contiene
el 50% de
los casos
centrales

Centil 75

Valor mximo
que toma la
variable

Mediana
Centil 25

Msc. Renzo Claure Aracena

Valor mnimo
que toma la
variable

Grficos unidimensionales

Diagrama de caja,
analizando clases y
ms de una variable

Msc. Renzo Claure Aracena

Edicin de grficos

Msc. Renzo Claure Aracena

Ejemplo
Obtenga diagramas de barras y de sectores del
archivo autos.sav, para las variables: Cilindros,
Origen y Modelo_ano, coloque los datos de
cantidad de casos en cada barra
Obtenga un diagrama de cajas del archivo
ingresos.sav, para las variable:
Horas_por_semana, con la categora raza y
agrupado por sexo
Msc. Renzo Claure Aracena

Ejercicio para el alumno


En el archivo cancer1.sav, obtenga un
diagrama de cajas, para la variable Radio,
agrupado por el Tipo.
Coloque en azul la caja de B y en amarillo la caja
de M
Coloque los nombres (ID) de los casos extremos
Analice los resultados
Msc. Renzo Claure Aracena

Ejercicio para el alumno


En el archivo ingresos1.sav, obtenga un diagrama de barras
para la variable raza y un histograma para la variable
horas_semana.

Categorizado por raza


Agrupado por sexo
Obtenga uno para la cantidad de casos
Obtenga otro para el promedio de horas_semana

Obtenga un diagrama de sectores para la variable Ingreso,


que muestre tanto el porcentaje como la cantidad de casos
Msc. Renzo Claure Aracena

Relacin entre dos variables


Msc. Renzo Claure Aracena

Variables cuantitativas
Diagrama de
dispersin
Agrupacin
Matriz de
diagramas de
dispersin
Tendencia

Msc. Renzo Claure Aracena

Ejemplo
Crear un diagrama de dispersin del archivo
autos1.sav, para las variables Peso_Lb y MPG. Agregar
una lnea de tendencia que mejor se ajuste
Crear un diagrama de dispersin del archivo
autos1.sav, para las variables Peso_Lb y MPG
agrupados por Origen
Crear un diagrama de dispersin del archivo
autos1.sav, para las variables Peso_Lb, MPG,
Aceleracin y Potencia_HP
Msc. Renzo Claure Aracena

Ejemplo para el alumno


Crear un diagrama de dispersin matricial,
para todas las variables del caso cancer1.sav y
establezca visualmente posibles dependencias
entre las variables

Msc. Renzo Claure Aracena

Correlacin simple

Pearson: Calcula el coeficiente de


correlacin lineal de Pearson entre
cada par de variables cuantitativas.
Tau-b de Kendall: Calcula el
coeficiente de correlacin de
Kendall entre cada par de variables
ordinales (este no lo hemos
estudiado, pero es similar, en su
interpretacin, al coeficiente de
correlacin de Spearman).
Spearman: Calcula el coeficiente
de correlacin de Spearman entre
cada par de variables ordinales.

Msc. Renzo Claure Aracena

Regresin lineal simple


Funcin lineal entre
variables
cuantitativas

Msc. Renzo Claure Aracena

Ejercicio
Determine la correlacin existente entre las
variables: MPG, Potencia_HP, Peso_LB
Determine un modelo de regresin lineal
simple, entre las variables: radio y perimetro
del archivo cancer.sav

Msc. Renzo Claure Aracena

Principales resultados de la regresin


Significancia de los factores,
Si el valor de Sig es menor de 0,05
entonces se asume que el efecto
del factor es estadsticamente
significativo

Aceptacin estadstica
Regresin, la variacin que explica el
modelo
Residual, lo que no explica el modelo
Si el valor de Sig es menor de 0,05
entonces se asume que el modelo es
estadsticamente significativo
Msc. Renzo Claure Aracena

Principales resultados de la regresin


R, correlacin mltiple, el signo indica la direccin
de la relacin (+ relacin directa))-relacin
inversa), mas cercano a 1 la relacin es ms
intensa
R2, determinacin o porcentaje de explicacin del
modelo, mientras ms elevado el modelo
representa mejor a la relacin entre las variables

Comparar las Desv tpica con el error


de estimacin, para ver si con un
simple promedio se mejora la
cantidad de error
Msc. Renzo Claure Aracena

Principales resultados de la regresin


Debe tener una forma de
campana, para aceptar la
normalidad de los datos

Debe estar cerca de la curva


de 45 grados para aceptar
la normalidad de los datos
Msc. Renzo Claure Aracena

Principales resultados de la regresin

Identifica los casos ms


influyentes en el modelo, que
deben ser analizados con ms
cuidado

Msc. Renzo Claure Aracena

Ejercicio para el alumno


Elabore un anlisis de regresin para las variables:
MPG (dependiente)
Peso_lb (independiente)

Elabore un anlisis de regresin para las variables:


Aceleracin (dependiente)
Peso_lb (independiente)
Potencia (independiente)

Msc. Renzo Claure Aracena

Anlisis de variables cualitativas


Tablas de contingencia
Anlisis Chi Cuadrado para la prueba de dependencia de variables

Msc. Renzo Claure Aracena

Ejemplos
Realice el anlisis de dependencia de las
variables ingreso y raza, del archivo
ingresos1.sav
Realice el anlisis de dependencia de las
variables ingreso y raza, agrupados por sexo,
del archivo ingresos1.sav
Msc. Renzo Claure Aracena

Ejercicio para el alumno


Realice el anlisis de dependencia de chi
cuadrado, para las variables ingreso y
educacin, del archivo ingresos1.sav
Realice el anlisis de dependencia de chi
cuadrado, para las variables ingreso y
educacin, agrupados por sexo, del archivo
ingresos1.sav
Msc. Renzo Claure Aracena

Manejo de Cubos
Manejo de variables conjuntas, cualitativas y cuantitativas

Msc. Renzo Claure Aracena

Ejemplo
Realice un anlisis con Cubos OLAP, de las
variables: Cantidad de horas para las
variables: Sexo, Ingreso y Raza

Msc. Renzo Claure Aracena

Ejercicio para el alumno


Realice un anlisis con Cubos OLAP, de las variables:
Cantidad de horas y Edad para las variables: relacin,
educacin e ingreso
Qu cantidad de personas tienen un grado de educacin de
Masters, su relacin es Not in family y su ingreso >50K
Cual es el promedio de horas que trabajo ese grupo
Cual es la cantidad de horas mxima que trabaja ese grupo
Cual es el promedio de edad de las personas que ganan ms de
50K y tienen un Doctorado

Msc. Renzo Claure Aracena

Anlisis de medias
Msc. Renzo Claure Aracena

Anlisis bsico
Comparacin rpida de medias, que pueden ser
agrupadas por ms de un factor.

Msc. Renzo Claure Aracena

Ejemplo
Determine el promedio de horas trabajadas
por semana, para las razas y agrupadas por el
sexo

Msc. Renzo Claure Aracena

Pruebas para una muestra


Nos ayuda a contrastar si una
media est significativamente
por encima o por debajo de
un valor
Utilizando para esto la prueba
de significancia y los lmites
de las diferencias de medias
Se puede segmentar los casos
si se desea hacer el anlisis
para ms de un nivel

Msc. Renzo Claure Aracena

Ejemplo
Realice una comparacin de la media del
radio, contra un valor de 12[cm], realice el
anlisis en paralelo para los tumores malignos
y benignos. (archivo cancer1.sav)

Msc. Renzo Claure Aracena

Ejemplo para el alumno


Realice una comparacin de la media de horas
semana, contra un valor de 40[horas], realice
el anlisis en paralelo para hombres y
mujeres. (archivo ingresos1.sav)

Msc. Renzo Claure Aracena

Comparacin de medias
para muestras independientes
Sirve para contrastar
promedios en muestras
no relacionadas o
independientes
El objetivo es encontrar
diferencias significativas
Para la prueba en general
si es menor de 0,05 se
asume que son
significativamente
distintos
Msc. Renzo Claure Aracena

Ejemplo
Determinar si son significativamente distintos
los radios y la concavidad de los tumores
malignos y benignos, archivo cancer1.sav

Msc. Renzo Claure Aracena

Ejercicio para el alumno


Determine si el promedio de edad y de horas
semana son significativamente distintos entre
hombres y mujeres, archivo ingresos1.sav

Msc. Renzo Claure Aracena

Comparacin de medias
para muestras relacionadas

Sirve para comprobar efectos en tratamientos, campaas o


correcciones sobre un mismo grupo o grupo de control

Msc. Renzo Claure Aracena

Ejemplo
En el archivo dietas1.sav, determine si el
tratamiento redujo significativamente el nivel
de triglicridos y peso al final de todo el
tratamiento

Msc. Renzo Claure Aracena

Ejercicio para el alumno


En el archivo dietas1.sav, determine si el
tratamiento redujo significativamente el nivel
de triglicridos y peso al final del segundo
trmino del tratamiento

Msc. Renzo Claure Aracena

Anlisis
ANOVA
Sirve para contrastar ms de dos grupos independientes
En este caso el factor de agrupacin debe estar en un valor numrico y con valores
asignados para cada nivel, de no estar asi la variable se debe auto recodificar
En este caso la prueba de significancia nos dice que si es mayor de 0,05 los grupos
son diferentes

Msc. Renzo Claure Aracena

Ejemplo
Comparar las medias de horas trabajadas por
raza, archivo ingresos1.sav

Msc. Renzo Claure Aracena

Ejercicio para el alumno


Comparar la potencia_hp de los autos segn
su origen

Msc. Renzo Claure Aracena

Casos de estudio
Msc. Renzo Claure Aracena

Caso1: Determinacin del tipo de flor


Archivo flores1.sav
Iris es un gnero de plantas
bulbosas de la familia
Iridaceae con vistosas flores
Tipo de planta (Irirs), Ancho
del ptalo (PW), largo del
ptalo (PL), ancho del spalo
(SW) y largo del spalo (SL)
Tipo 0 es Setosa; tipo 1 es
Verginica y tipo 2 es Versicolor

Msc. Renzo Claure Aracena

Tareas
Verifique la calidad de la informacin
Frecuencias
Anlisis de descriptivos
Diagramas de caja

Realice las transformaciones necesarias o calcule nuevas variables si


las requiere
Verifique correlaciones existentes entre las variables cuantitativas
Realice una comparacin de medias de los grupos, para verificar si
las diferencias son significativas
Proponga conclusiones
Msc. Renzo Claure Aracena

Caso 2, Aprobacin de crditos


Un banco desea determinar si se debe aprobar o no un
crdito a un cliente, para esto proporciona el set de
datos histrico de clientes que entraron en mora, el
archivo se llama credito1.sav, pero no proporciona los
nombres de las variables para cuidar su informacin
Se cuentan con 16 variables, entre cualitativas y
cuantitativas
Las variables A16 indica con un signo (+) si el cliente
ingreso en mora, y () si el cliente no ingreso en mora
Msc. Renzo Claure Aracena

Tareas

Verifique la calidad de la informacin


Frecuencias
Anlisis de descriptivos
Diagramas de caja

Realice las transformaciones necesarias o calcule nuevas variables si las requiere


Verifique correlaciones existentes entre las variables cuantitativas
Realice una comparacin de medias de los grupos, para verificar si las diferencias
son significativas para los clientes que entraron o no en mora
Proponga conclusiones
Elabore un diagrama de pareto de la variable A2, asumiendo que representa el
ingreso anual en miles de dolares

Msc. Renzo Claure Aracena

Anda mungkin juga menyukai