Anda di halaman 1dari 47

TTULO

GUA DE USO DE SPSS

SESIN 1: PROCEDIMIENTOS BSICOS CON SPSS


SESIN 2: ESTADSTICA DESCRIPTIVA
SESIN 3: INTERVALOS DE CONFIANZA Y PRUEBA DE HIPTESIS
SESIN 4: REGRESIN LINEAL SIMPLE
SESIN 5: REGRESIN CURVILINEAL
SESIN 6: REGRESIN LINEAL MLTIPLE

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

SESIN 1: Procedimientos bsicos con SPSS


1) Se desea elaborar una base de datos para en base a la siguiente encuesta de opinin:
ENCUESTA DE OPININ
Apellidos:
Nombres:
_________________________________
______________________________
Carrera :
N veces que llevas el curso:
_________________________________
__________________
N cursos matriculados:
N crditos matriculados
______________________
__________________
N crditos acumulados
______________________
Con qu profesor llevaste el curso de Estadstica
Nota obtenida en el curso
Aplicada a los negocios?
Estadstica Aplicada a los
negocios:
1. En una escala de 0 a 5 puntos (donde 0: completamente
completamente de acuerdo) responde lo siguiente:
1.1. Tengo facilidad para desarrollar operaciones
0
que involucra realizar muchos clculos.
1.2. No s como calcular la varianza con mi
0
calculadora.
1.3. Prefiero dar prcticas calificadas utilizando
0
paquetes de cmputo.
1.4. Cuando no me sale el resultado inmediatamente
0
me pongo muy nervioso.
1.5. Me aburre la clase.
0
1.6. Estadstica se me hace complicado.
0
1.7. Tengo temor que mis compaeros se burlen de
0
m si no respondo correctamente.
1.8. Siempre estudio con mucho tiempo de
0
anticipacin a una prctica.
1.9. No es necesario estudiar constantemente, ya
0
que con el examen final se puede aprobar el
curso.
1.10. Prefiero hacer trabajos de investigacin antes
0
de asistir a clase o asistir a las prcticas.
2. Qu opinin tienes sobre este curso?

en desacuerdo y 5:
1

1
1
1

2
2
2

3
3
3

4
4
4

5
5
5

3. Practicas algn deporte?


3.1. S
3.2. No
4. Qu deporte practicas?

Se puede hacer en SPSS?


Veamos previamente como es el entorno del SPSS con un pequeo ejemplo para
posteriormente elaborar la base de datos en SPSS.
2

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Descripcin Preliminar del entorno del SPSS


La pantalla principal del SPSS presenta dos ventanas principales: Vista de datos y
Vista de variables a las cuales se puede acceder dando un click en las pestaas
ubicadas en la parte inferior izquierda.

En la ventana Vista de datos se ingresan los datos (valores numricos o carcter) de


cada una de las variables, mientras que en la ventana Vista de variables se define la
estructura de las variables que comprende la tabla de datos.
Por ejemplo:
Elabore un archivo con la siguiente informacin:
N
1
2
3
4
5
6
7
8
9
10
11
12

Apellidos y
Nombres
Oscar Estrada
Miriam Castro
Enrique Palacios
Mario Poggi
Maruja Ostolaza
Julio Hinostroza
Rosa Martn
Lourdes Paredes
Tania Mendoza
Jos Rodrguez
Julio Campos
Santiago Quispe

Especialidad PC1 PC2 PC3


Economa
Finanzas
Economa
Economa
Economa
Finanzas
Economa
Finanzas
Finanzas
Finanzas
Finanzas
Economa

18
5
15
20
19
12
15
15
14
10
12
11

19
10
12
15
12
11
15
16
14
12
11
5

18
14
15
18
12
13
12
10
15
11
15
10

Ex.final
(40%)
10
13
12
12
15
16
12
13
13
10
17
12

Prom.PC Prom.
(60%)
final

Nota: La variable Especialidad ser codificada de la siguiente manera


1: Economa
2: Finanzas
para que sea ms fcil su digitacin.
a) Defina la estructura de las variables
Ingrese a la ventana Vista de variables, defina cada uno de los campos de la estructura
de las variables:
 Nombre: Aqu se puede definir el nombre de la variable. Este campo no permite
que se ingresen algunos caracteres como: *, $, , etc.

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Tipo: Mediante esta opcin se puede indicar el tipo de variable, las cuales pueden
ser: Numrica, Coma, Punto, Notacin cientfica, fecha, Dlar, Moneda
personalizada, Cadena.

Por lo general se usan variables de tipo numrico y cadena (de caracteres, como el caso
de nombres)


Anchura: Define la cantidad de dgitos o caracteres que puede ocupar la variable,


esto incluye el punto decimal.

Decimales: Define la cantidad de decimales que puede tener la variable, siempre y


cuando esta no sea de tipo fecha o cadena.

Etiqueta: Se puede indicar alguna descripcin de la variable.

Valores: Algunas variables tienen valores predefinidos o codificados, mediante esta


opcin se pueden definir dichos valores.

Se debe escribir el cdigo en el recuadro Valor y en el recuadro Etiqueta se debe


digitar el nombre que se le asigna al valor. Finalmente se da un click en el botn
Aadir.

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Perdidos: Aqu se define si existen valores perdidos.

Se pueden introducir hasta tres valores perdidos (individuales) de tipo discreto, un


rango de valores perdidos o un rango ms un valor de tipo discreto.


Columnas: Se define el nmero de caracteres que desea estn visibles en la pgina


de vista de datos.

Alineacin: Se define la alineacin en la que se quiere que aparezcan los datos que
puede ser: izquierda, derecha o centrado.

Medida: Define el tipo de medida de la variable, que puede ser: Escala, Nominal,
Ordinal.

Finalmente se debe obtener una estructura como la siguiente:


Vista de Variables

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

b) Visualice los datos ingresados


Ingrese a la opcin Vista de datos, digite los datos presentados anteriormente
Vista de datos

c) Grabe el archivo con el nombre LISTA.


Ingrese a la opcin Archivo de la Barra de Men y posteriormente elija Guardar
como. Aparecer la siguiente ventana:

Especifique el nombre en el recuadro File name, por defecto SPSS guarda los
archivos con extensin sav.

d) Ordenar a los estudiantes por especialidad


Ingrese a la opcin Datos de la barra de men y de ah elija Ordenar casos

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Aparecer la siguiente ventana; en el recuadro Ordenar por, se debe seleccionar la


variable con la cual desea ordenar los datos (Especialidad)

e) Calcule el promedio de las prcticas calificadas


Ingrese a la opcin Transformar de la barra de men y de ah elija Calcular

Aparecer la siguiente ventana; en el recuadro Expresin numrica se debe


especificar la expresin de clculo
7

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

f) Calcule el promedio final considerando los pesos de cada evaluacin.


Ejercicio para Ud.

g) Si la nota aprobatoria es por lo menos 11, seleccione a los alumnos aprobados.


Ingrese a la opcin Datos de la barra de men y elija Seleccionar casos. En la parte
derecha existen opciones de seleccionar casos, elija la opcin Si se satisface la
condicinde un clic en el botn Si

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Aparecer la siguiente pantalla:

En el recuadro de la derecha escriba la condicin.


Finalmente, en la ventana Vista de datos aparecer una nueva variable Filtro
que indicar a los elementos que pertenecen a una u otra categora.

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

SESIN 2: ESTADSTICA DESCRIPTIVA


1.

Con los datos del archivo LISTA.SAV, desarrolle lo siguiente:


1. Calcule la media y la desviacin estndar para cada una de las tres prcticas
calificadas.

Seleccione las variables correspondientes a las Prcticas y haga clik en el tringulo que
separa los dos campos, para que las variables seleccionadas pasen al campo de variables

Haga clic en el botn Aceptar. Debe obtener los siguientes resultados:


Estadsticos descriptivos
N
Prctica 1
Prctica 2
Prctica 3
N vlido (segn lista)

12
12
12
12

Mnimo
5.00
5.00
10.00

10

Mximo
20.00
19.00
18.00

Media
13.8333
12.6667
13.5833

Desv. tp.
4.19596
3.52480
2.74552

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

2. En qu prctica se obtuvieron notas ms altas? (Rpta: Primera)


3. En qu prctica se obtuvieron notas ms variables? (Rpta: Primera)
4. Cuntos alumnos son de economa? Cuntos de finanzas?
En Analizar seleccione Estadsticos descriptivos y luego Frecuencias

Seleccione la variable especialidad y psela al campo de Variables

Resultado (Fjese en las frecuencias):


especial

Vlidos

Economia
Finanzas
Total

Frecuencia
6
6
12

Porcentaje
50.0
50.0
100.0

11

Porcentaje
vlido
50.0
50.0
100.0

Porcentaje
acumulado
50.0
100.0

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

5. Compare mediante un grfico el promedio de prcticas por especialidad. Qu


especialidad tiene mejor promedio?

Debe aparecer el siguiente cuadro de dilogo:

12

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Manteniendo oprimido el botn izquierdo del mouse, arrastr el grfico de barras


(primero en la parte superior izquierda) al centro de la zona de presentacin
preliminar. Luego arrastr la variable Promedio de Prcticas al eje vertical y la
variable especial al eje horizontal.

Finalmente de clic en aceptar.


El resultado ser el siguiente:

Media Promedio Prcticas

15,00

10,00

5,00

0,00

Economia

Finanzas

especial

13

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

6. Compare mediante un grfico las notas de las tres prcticas calificadas por
especialidad.

En este caso seleccione la opcin de barras agrupadas, y en el eje vertical, coloque las
tres prcticas calificadas.

14

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Obtendr el siguiente resultado:

Prctica 1
Prctica 2
Prctica 3

20,00

Media

15,00

10,00

5,00

0,00
Economia

Finanzas

especial

15

Gua de la laboratorio SPSS

2.

Gonzalo Cuadros Herrera

Los datos que se presentan a continuacin corresponden al nmero de meses de


experiencia para una muestra de 30 trabajadores de una empresa.
96
34
144

43
137
36

54
66
190

83
48
138

120
70
67

68
103
114

52
48
115

113
75
244

49
124
143

46
171
26

a) Ingrese estos datos en una columna del editor de datos de SPSS.

b) Calcule la media, la desviacin estndar y el coeficiente de asimetra para estos


datos.

16

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Los resultados obtenidos deben ser los siguientes:


Estadsticos descriptivos

Experiencia
N vlido (segn lista)

N
Estadstico
30
30

Media
Estadstico
93.90

Desv. tp.
Estadstico
52.046

Asimetra
Estadstico Error tpico
.981
.427

c) Elabore un histograma con los datos de esta variable. Comente sobre la asimetra
de la distribucin.
En el men Grficos entre en el generador de grficos, y seleccione la opcin
histograma.

17

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Arrastre la primera opcin, Histograma simple, al rea de presentacin preliminar, y


arrastre la variable Experiencia al eje horizontal.

18

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

El grfico que se obtiene ser el siguiente:

Frecuencia

Media =93,9
Desviacin tpica =52,046
N =30
0
0

50

100

150

200

250

Experiencia

El grfico refleja lo encontrado en la pregunta (b) para el coeficiente de asimetra,


esto es, que los datos presentan asimetra positiva (valores agrupados al lado
izquierdo del grfico y valores extremos al lado derecho).

3.

En el archivo Datos de empleados.sav se presentan datos para el salario de los


empleados de una empresa, clasificados de acuerdo con su categora laboral.
a) Calcule las estadsticas descriptivas para el sueldo actual en cada categora
laboral.

19

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Debe obtener los siguientes resultados:


Descriptivos
Salario actual

Categora laboral
Administrativo

Seguridad

Directivo

Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis

20

Lmite inferior
Lmite superior

Lmite inferior
Lmite superior

Lmite inferior
Lmite superior

Estadstico
$27,838.54
$27,057.40

Error tp.
$397.217

$28,619.68
$27,290.50
$26,550.00
57274548
$7,567.995
$15,750
$80,000
$64,250
$8,400
1.905
7.977
$30,938.89
$30,102.37

.128
.255
$406.958

$31,775.40
$31,007.72
$30,750.00
4471602.6
$2,114.616
$24,300
$35,250
$10,950
$1,200
-.368
3.652
$63,977.80
$60,018.44

.448
.872
$1,990.67

$67,937.16
$62,728.31
$60,500.00
3.3E+008
$18,244.78
$34,410
$135,000
$100,590
$20,475
1.181
2.107

.263
.520

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

b) Compare los ingresos en las tres categoras laborales utilizando un diagrama de


cajas.

21

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

El resultado ser el siguiente:

29

$125.000
32
343
18

Salario actual

$100.000
218

$75.000

272

234

$50.000
52

72

161
80

5 17

146

291 303
281
206
386

$25.000

126

$0
Administrativo

Seguridad

Categora laboral

22

Directivo

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

SESIN 3: Intervalos de confianza y prueba de hiptesis


El concepto de p valor
Cuando se interpretan los reportes en pruebas de hiptesis, las conclusiones estn
basadas en una regla de decisin; sta se establece tendiendo en cuenta el riesgo que
asume el investigador de cometer un error de tipo I, siendo la probabilidad de este error
el nivel de significacin . Pero en algunas ocasiones, sin embargo, la decisin a tomar
puede realizarse con un nivel de significacin diferente, con lo cual seria til conocer
que tipo de decisin se puede adoptar segn el nivel de significacin real de una prueba
basndose en los datos observados. Este concepto actuar como contrapuesto al nivel de
significacin elegido antes de realizar la prueba.
p-valor: probabilidad que, bajo H0 el estadstico de contraste tome un valor al menos
tan alejado como el realmente obtenido.
Cuanto ms pequeo sea el p-valor mayor es la evidencia en contra de H0.

Prueba t para una muestra


Ejemplo1
Los conductores metlicos o tubos huecos se usan en el cableado elctrico. En la prueba
de tubos de una pulgada, se obtienen los datos siguientes respecto del dimetro exterior
(en pulgadas).
1,281 1,288 1,292 1,289 1,291 1,293 1,293 1,291 1,289 1,288
1,287 1,291 1,290 1,286 1,289 1,286 1,295 1,296 1,291 1,286
Suponga que el muestreo se realiza en una distribucin normal.
a) Determine un intervalo del 90% de confianza para la media del dimetro exterior
b) Pruebe la hiptesis de que la longitud media del dimetro exterior es de 1,29
pulgadas. Use un nivel de significacin del 10%
Solucin:
Comenzamos introduciendo los datos en el editor de datos de SPSS como una
variable de nombre Dimetro.
a) Elegimos en el men Analizar Comparar medias Prueba T para una
muestra.

23

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Rellenamos la siguiente ventana

Observe que en valor de prueba se ha considera el valor cero, para obtener


directamente el intervalo de confianza solicitado
Para indicar al SPSS el nivel de confianza hacemos un clic en Opciones y en
Intervalo de confianza escribimos 90 (es nuestro caso) y continuamos.

Al hacer clic en aceptar obtenemos:


Estadsticos para una muestra
N
Dimetro exterior

20

Media
1.28960

Desviacin
tp.
.003500

Error tp. de
la media
.000783

Estimacin puntual de la media

Prueba para una muestra


Valor de prueba = 0

Dimetro exterior

t
1647.613

gl
19

Sig. (bilateral)
.000

Diferencia
de medias
1.289600

90% Intervalo de
confianza para la
diferencia
Inferior
Superior
1.28825
1.29095

Lmite inferior de confianza de la media


Lmite superior de confianza de la media

Segn este resultado el intervalo de confianza para la media se encuentra en el rango de


[1,288; 1,291]

24

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Tenemos un 90% de confianza de que el intervalo [1,288; 1,291] contenga al


verdadero dimetro medio de los conductores metlicos usados en el cableado
elctrico
b) Para probar la hiptesis de que la longitud media del dimetro exterior es de 1,29
procedemos de la misma manera que en la parte a)
Las hiptesis son:
H 0 : = 1,29
H1 : 1,29
El nivel de significacin que se usa en esta prueba es del 10% ( = 0,10 )
Procedimiento:
Elegimos en el men Analizar Comparar medias Prueba T para una
muestra.

Rellenamos la siguiente ventana

Observe que en valor de prueba se ha considera el 1,29 es decir se ha considerado el


valor hipottico (hiptesis nula)
Para indicar a SPSS el nivel de confianza hacemos un clic en opciones y en
Intervalo de confianza escribimos 90 (es nuestro caso) y continuamos.

25

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

y al hacer clic en aceptar obtenemos:


Estadsticos para una muestra
N
Dimetro exterior

Desviacin
tp.
.003500

Media
1.28960

20

Error tp. de
la media
.000783

Prueba para una muestra


Valor de prueba = 1.29

Dimetro exterior

t
-.511

gl
19

Sig. (bilateral)
.615

El criterio de decisin se basa en la


comparacin de esta probabilidad con el nivel
de significacin de la prueba

Diferencia
de medias
-.000400

90% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.00175
.00095

En el caso de pruebas unilaterales


bebe tomarse la mitad de este
valor

Como H 0 : = 1,29 frente a H 1 : 1,29 se trata por tanto de una prueba de hiptesis
de dos colas (bilateral), el estadstico de prueba toma el valor -0,511. En este caso no
podemos rechazar la hiptesis nula, el valor p de 0,615 es mayor que el nivel de
significacin de 0,10.

Bajo un nivel de significacin del 10% concluimos que la longitud media del dimetro
exterior de los tubos usados en el cableado elctrico es de 1,29 pulgadas
Observacin:
 Puede calcularse el intervalo de confianza de la media sumando a la media
hipottica los valores -0,00175 y 0,00095 de la tabla anterior y obtenemos el
mismo resultado que en la parte a)
 Cuando la prueba de hiptesis es de una sola cola (lateral izquierda o lateral
derecha), el nivel de significacin debe compararse con la mitad de Sig que aparece
en la tabla anterior

Prueba t para dos muestras independientes cuando las varianzas


poblacionales son similares
Ejemplo 2.
Se piensa que el rendimiento de combustible en un modelo especfico de automvil
sera ms alto si se utiliza gasolina sin plomo Premium que con la gasolina sin plomo
normal. A fin de recopilar datos para sustentar esta afirmacin, se selecciona en forma
aleatoria 10 vehculos de una lnea de montaje y se prueban con una marca especifica de
gasolina Premium, adems de seleccionar al azar otros 10 y probarlos con la de gasolina

26

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

normal. Las pruebas se realizan bajo condiciones controladas idnticas. Los datos
resultantes son los siguientes:
Premium
Normal

35,0
40,0

34,5
29,6

31,6
32,1

32,4
35,4

34,8
34,0

31,7
34,8

35,4
34,6

35,3
34,8

36,6
32,6

36,0
32,2

Suponga que las muestras provienen de poblaciones normales.


a) Determine e interprete un intervalo del 99% de confianza para la diferencia del
rendimiento medio de la gasolina sin plomo Premium y de la gasolina sin plomo
normal
b) Realice una prueba de hiptesis para comparar la media de rendimiento de
combustible con esas dos gasolinas. Use un nivel de significacin del 1%. Interprete
los resultados en el contexto del problema.

Solucin:
a) Comenzamos introduciendo los datos en el editor de datos de SPSS creando dos
variables: una de ellas corresponde al tipo de gasolina (variable de agrupacin): 1:
gasolina sin plomo premium y 2: gasolina sin plomo normal (existen tantos 1 como
repeticiones tiene el tipo de gasolina sin plomo Premium; existen tantos 2 como
repeticiones tiene el tipo de gasolina sin plomo Normal), una segunda variable es el
rendimiento, cuyos valores estn dados por el rendimiento en ambos tipos de
gasolina. La ventana siguiente muestra una de las formas de tratar esta informacin.
Para determinar el intervalo de confianza solicitado, es necesario saber si las
varianzas de las poblaciones de las cuales se han extrado las muestras son
homogneas, entonces debe realizarse una prueba de hiptesis de homogeneidad de
varianza.
Las hiptesis son:
H 0 : P2 = N2

H 1 : P2 N2
Consideramos un nivel de significacin del 1% en esta prueba
Para realizar esta prueba aprovechamos el reporte de SPSS, obtenido mediante el
siguiente procedimiento:
Elegimos en el men Analizar Comparar medias Prueba T para muestras
independientes.

27

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Debe llenarse ahora la siguiente ventana


Una vez seleccionadas las variables como se indica con las flechas, hacemos clic en
definir grupos y digitamos los grupos definidos anterior mente.

Para indicar a SPSS el nivel de confianza hacemos un clic en Opciones y en Intervalo


de confianza escribimos 99 (es nuestro caso) y continuamos.luego de hacer clic en
aceptar obtenemos el siguiente reporte:
Estadsticos de grupo

Rend

Tipo_gas
Gasolina sin
plomo premium
Gasolina sin
plomo normal

Media

Desviacin
tp.

Error tp. de
la media

10

34.370

1.8105

.5725

10

33.980

2.6720

.8450

28

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Prueba de muestras independientes


Prueba de Levene
para la igualdad de
varianzas

F
Rend

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

.401

0,535 >0,01: No se
rechaza la hiptesis
nula de varianzas
iguales

Sig.
.535

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

99% Intervalo de
confianza para la
diferencia
Inferior
Superior

.382

18

.707

.3900

1.0207

-2.5479

3.3279

.382

15.825

.707

.3900

1.0207

-2.5955

3.3755

Lmite inferior de
confianza para la
diferencia de medias
asumiendo varianzas
iguales

Lmite Superior de
confianza para la
diferencia de medias
asumiendo varianzas
iguales

Observamos que la prueba de Levene para la igualdad de varianza result no


significativa (SIG. 0,535), es decir que, las varianzas de las poblaciones de las cuales
se ha extrado stas dos muestras son similares. En base a este resultado los lmites
inferior y superior de confianza del 99% para la diferencia de medias son -2,5479 y
3,3279 respectivamente.

Existe un 99% de confianza de que el intervalo [-2,5479; 3,3279] contenga la


verdadera diferencia del rendimiento medio de la gasolina sin plomo Premium y de la
gasolina sin plomo normal
Tambin podemos concluir que el rendimiento medio de la gasolina sin plomo Premium
y el rendimiento medio de la gasolina sin plomo normal son similares (puesto que el
intervalo en mencin contiene el cero).
b) En este caso aprovechamos el reporte anterior:
Las hiptesis son:

H0 : P = N
H1 : P N
Nivel de significacin: 1%
En esta prueba tambin requerimos saber si las varianzas de las poblaciones de las
cuales se han extrado las muestras son homogneas, pero en la parte a) se ha concluido
que las varianzas son similares.

29

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Prueba de muestras independientes


Prueba de Levene
para la igualdad de
varianzas

F
Rend

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

.401

Valor del estadstico de


prueba cuando las varianzas
son similares

Sig.
.535

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

99% Intervalo de
confianza para la
diferencia
Inferior
Superior

.382

18

.707

.3900

1.0207

-2.5479

3.3279

.382

15.825

.707

.3900

1.0207

-2.5955

3.3755

p = 0,707 >0,01: No se
rechaza la hiptesis nula de
medias iguales

Si la prueba fuera unilateral este


valor debe dividirse entre dos y
compararse con el nivel de
significacin

Conclusin:

Bajo un nivel de significacin del 1% concluimos que los rendimientos medios de


ambos tipos de gasolinas son similares.
Como puede observarse este resultado concuerda con el resultado obtenido en la
parte a).

Prueba t para dos muestras independientes cuando las varianzas


poblacionales no son similares
Ejemplo 3
Se obtienen los datos siguientes de la produccin de energa elctrica, en kilowatts, de
dos nuevos motores Diesel de dos autos compactos, los datos son los siguientes:

Inyeccin indirecta de combustible


37,7
39,2
39,1
39,0
36,8
39,7
36,9
38,2
35,9
37,3
39,2
37,8
36,4

Inyeccin directa de combustible


38,5
38,2
39,2
38,5
38,9
38,0
39,1
39,1
37,4
37,6
39,0
38,0
39,0
37,7
38,1
37,4

a) Construya un intervalo de confianza de 95% para la diferencia de medias de


produccin de energa elctrica cuando se usa inyeccin directa de combustible y
cuando se usa inyeccin indirecta
b) El intervalo de la parte a) nos indica que existe una diferencia en la media de
produccin de energa de esos dos motores? Explique su respuesta
c) Con una probabilidad de cometer error tipo I de 0,05; pruebe la hiptesis de que la
produccin media de energa en ambos casos son similares.

Solucin:
Procedemos de la misma manera que en el ejemplo 2

30

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Prueba de hiptesis
a) para la igualdad de varianzas
2
H 0 : ID
= II2
2
H 1 : ID
II2

Estadsticos de grupo

Produccin de energa

Tipo de Inyeccin
Inyeccin directa
Inyeccin idirecta

Media
38.356
37.938

16
13

Desviacin
tp.
.6408
1.2319

Error tp. de
la media
.1602
.3417

Prueba de muestras independientes


Prueba de Levene
para la igualdad de
varianzas

F
Produccin de energa

Se han asumido
varianzas iguales
No se han asumido
varianzas iguales

8.568

Sig.
.007

Prueba T para la igualdad de medias

gl

Sig. (bilateral)

Diferencia
de medias

Error tp. de
la diferencia

95% Intervalo de
confianza para la
diferencia
Inferior
Superior

1.178

27

.249

.4178

.3547

-.3101

1.1457

1.107

17.192

.283

.4178

.3774

-.3777

1.2133

Nivel de significacin: 5%
Como Sig. = 0,007 < 0,05; rechazamos la hiptesis nula de varianzas iguales

31

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Bajo un nivel de significacin del 5%, podemos afirmar que existe evidencia
estadstica suficiente para concluir que las varianzas de las poblaciones de las cuales
fueron extradas las muestras no son similares
Luego los lmites inferior y superior de confianza del 95% para la diferencia de
medias de produccin de energa elctrica cuando se usa inyeccin directa de
combustible y cuando se usa inyeccin indirecta de combustible son -0,3777 y
1,2133 respectivamente.

Existe un 95% de confianza de que el intervalo [-0,3777; 1,2133] contenga la


verdadera diferencia de produccin de energa elctrica cuando se usa inyeccin
directa de combustible y cuando se usa inyeccin indirecta de combustible.
b) Mediante este intervalo tambin podemos concluir que las producciones medias de
energa elctrica cuando se usa inyeccin directa de combustible y cuando se usa
inyeccin indirecta son similares. (el cero est contenido en este intervalo), es decir,
no existe diferencias significativas entre las producciones medias de energa
cuando se usa inyeccin directa e inyeccin indirecta de combustible.
La misma conclusin debe obtenerse al realizar la siguiente prueba de hiptesis
c) Prueba de hiptesis para la diferencia de medias
H0 : P = N
H1 : P N
Nivel de significacin: 5%
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas

F
Produccin de energa
Se han asumido
8.568
varianzas iguales
No se han asumido
varianzas iguales

Sig.
.007

gl

Prueba T para la igualdad de medias


95% Intervalo de
confianza para la
diferencia
DiferenciaError tp. de
Sig. (bilateral)de mediasla diferencia Inferior Superior

1.178

27

.249

.4178

.3547

-.3101

1.1457

1.107

17.192

.283

.4178

.3774

-.3777

1.2133

Dado que las varianzas no son similares, el valor del estadstico de prueba es 1,107 (no
se han asumido varianzas iguales) y la significacin bilateral es de 0,283; por lo tanto
no podemos rechazar la hiptesis nula de igualdad de media, entonces la conclusin es:
Bajo un nivel de significacin del 5% podemos concluir que no existen diferencias
significativas entre las producciones medias de energa cuando se usa inyeccin directa
e inyeccin indirecta de combustible.

32

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

SESIN 4: REGRESIN LINEAL SIMPLE


A continuacin se muestra la base de datos con la que se explicar los procedimientos
involucrados al realizar un anlisis de regresin lineal simple.
Los datos corresponden a las ventas totales por ao de cada una de 11 regiones en las
que una compaa opera. Dicha compaa se dedica a la venta de repuestos para
automviles. Se pretende estimar el valor de las ventas futuras conociendo el nmero de
distribuidoras establecidas en cada regin y el nmero de automviles registrados para
cada regin.

MATRIZ DE CORRELACIONES
El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizando
dicha matriz se podr determinar cul de las variables independientes esta ms
correlacionada con la variable dependiente.
La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:

33

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Obtenemos el siguiente resultado:


Correlaciones

Ventas (mills $)

Nro distribuidoras

Nro Autos (mills)

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

Ventas
(mills $)
1

Nro
Nro Autos
distribuidoras
(mills)
.739**
.548
.009
.081
11
11
11
.739**
1
.670*
.009
.024
11
11
11
.548
.670*
1
.081
.024
11
11
11

**. La correlacin es significativa al nivel 0,01 (bilateral).


*. La correlacin es significante al nivel 0,05 (bilateral).

Se observa que la variable ventas est ms correlacionada con la variable Nmero de


distribuidoras (correlacin 0.739) por lo que un primer paso ser realizar un anlisis de
regresin lineal simple con esta variable independiente.

REGRESION LINEAL SIMPLE ENTRE LA VARIABLE INDEPENDIENTE


MS CORRELACIONADA CON Y
La secuencia es:
Analizar, Regresin, Lineal, se mostrar el siguiente cuadro de dilogo:

Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos
valores representativos para la validacin de dicho modelo.
Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin
lineal mltiple.

34

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Resultados obtenidos:
Resumen del modelo
Modelo
1

R
.739a

R cuadrado
corregida
.496

R cuadrado
.546

Error tp. de la
estimacin
9.7718

a. Variables predictoras: (Constante), Nro distribuidoras

El coeficiente de determinacin, denotado por R2 (0.546) implica que el 54.6% de


variacin en las ventas pueden ser explicadas por el modelo de regresin.
ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
1033.836
859.393
1893.229

gl
1
9
10

Media
cuadrtica
1033.836
95.488

F
10.827

Sig.
.009a

a. Variables predictoras: (Constante), Nro distribuidoras


b. Variable dependiente: Ventas (mills $)

La tabla de Anlisis de Varianza permite realizar la prueba de significacin global del


modelo, se propone las siguientes hiptesis:
H o : 0 = 1 = 0 En forma conjunta las variables no contribuyen al modelo
H1 : i 0

Al menos una variable es significativa para el modelo

Analizando el P-Valor (0.009), el cual es inferior al 5% (nivel de significacin


propuesto usualmente para la prueba), se decide que se debe rechazar la hiptesis nula
con lo cual concluimos que la variable Nmero de distribuidoras s contribuye al
modelo.
Coeficientesa

Modelo
1

(Constante)
Nro distribuidoras

Coeficientes no
estandarizados
B
Error tp.
10.881
6.409
.012
.004

Coeficientes
estandarizad
os
Beta
.739

t
1.698
3.290

Sig.
.124
.009

a. Variable dependiente: Ventas (mills $)

El modelo estimado para el presente caso ser:


Ventas = 10.881 + 0.012( Nro de distribuidoras)
Adems de la prueba de verificacin global se puede realizar la prueba de verificacin
individual de cada variable independiente.
H o : i = 0 La variable no es significativa para el modelo
H 1 : i 0 La variable es significativa para el modelo
Para el caso desarrollado (regresin lineal simple), esta prueba es anloga a la prueba de
verificacin global.

35

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de
dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable
dependiente e independiente.
La secuencia para obtener dicho grfico es la siguiente:

En el cuadro de dilogo se ingresar la informacin de la siguiente manera:

El resultado que se obtiene es el siguiente:

36

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

52.3

46.2


Ventas (mills $)

38.2

35.0


33.1


30.0

26.0


25.2


20.2


16.0
3.5

125

480

650

1233

1694

1699

1840

Nro distribuidoras

37

2011

2214

2302

2850

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

SESIN 5: REGRESIN CURVILINEAL


Analizaremos los diferentes modelos curvilneos que puedan formarse para determinar
cul de ellos es el mejor. Los datos se muestran en la siguiente grfica:
La secuencia para realizar una regresin curvilnea es la siguiente:

Analizar, Regresin, Estimacin Curvilnea

Como se muestra, tenemos la posibilidad de elegir entre varios modelos. Para


desarrollar nuestro ejemplo hallaremos los coeficientes estimados y la tabla de anlisis
de varianza de los modelos: Lineal, Logartmico, Cuadrtico, Cbico y Exponencial.
Los resultados que obtenemos son los siguientes:

LINEAL
Resumen del modelo

R cuadrado

.966

.933

R cuadrado
corregida
.920

Error tpico de la
estimacin
9.017

La variable independiente esMillas.


ANOVA
Suma de
cuadrados

gl

Media
cuadrtica

Sig.

Regresin

5675.152

5675.152

69.795

.000

Residual

406.557

81.311

Total

6081.709

6
La variable independiente esMillas.
Coeficientes

38

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Coeficientes no
estandarizados

Coeficientes
estandarizados

Millas

B
-2.040

Error tpico
.244

(Constante)

91.660

5.080

Beta
-.966

Sig.

-8.354

.000

18.042

.000

LOGARTMICO
Resumen del modelo

R cuadrado
corregida

R cuadrado

.973

Error tpico de la
estimacin

.946
.936
La variable independiente esMillas.

8.071

ANOVA
Suma de
cuadrados

gl

Media
cuadrtica

Sig.

5756.025

5756.025

88.368

.000

Residual

325.683

65.137

Total

6081.709

Regresin

6
La variable independiente esMillas.
Coeficientes

Coeficientes no
estandarizados

Coeficientes
estandarizados

ln(Millas)

B
-22.189

Error tpico
2.360

(Constante)

106.754

5.818

Beta
-.973

Sig.

-9.400

.000

18.350

.000

CUADRTICO
Resumen del modelo

R cuadrado

.993

.986

R cuadrado
corregida
.979

Error tpico de la
estimacin
4.584

La variable independiente esMillas.


ANOVA
Suma de
cuadrados
5997.661

gl
2

Media
cuadrtica
2998.830

Residual

84.048

21.012

Total

6081.709

Regresin

La variable independiente esMillas.


Coeficientes

39

F
142.721

Sig.
.000

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Coeficientes no
estandarizados

Millas

B
-3.924

Coeficientes
estandarizados

Error tpico
.497

Beta
-1.858
.922

Millas ** 2

.048

.012

(Constante)

99.897

3.330

Sig.

-7.900

.001

3.918

.017

29.998

.000

CBICO
Resumen del modelo

R
.997

R cuadrado
corregida
.988

R cuadrado
.994

Error tpico de la
estimacin
3.559

La variable independiente esMillas.


ANOVA
Suma de
cuadrados
6043.709

gl
3

Media
cuadrtica
2014.570

Residual

38.000

12.667

Total

6081.709

Regresin

F
159.047

Sig.
.001

La variable independiente esMillas.


Coeficientes
Coeficientes no
estandarizados

Coeficientes
estandarizados

Error tpico

Beta

Sig.

-5.626

.972

-2.664

-5.786

.010

Millas ** 2

.160

.059

3.055

2.695

.074

Millas ** 3

-.002

.001

-1.371

-1.907

.153

(Constante)

103.925

3.339

31.124

.000

Millas

EXPONENCIAL
Resumen del modelo

R
.989

R cuadrado
.979

R cuadrado
corregida
.974

Error tpico de la
estimacin
.104

La variable independiente esMillas.


ANOVA

Regresin

Suma de
cuadrados
2.496

gl
1

Media
cuadrtica
2.496

Residual

.054

.011

Total

2.550

6
La variable independiente esMillas.

40

F
229.924

Sig.
.000

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera


Coeficientes

Coeficientes no
estandarizados

Millas
(Constante)

Coeficientes
estandarizados

Error tpico

Beta

Sig.

-.043

.003

-.989

-15.163

.000

99.496
5.840
17.036
La variable dependiente es ln(Porcentaje).

.000

Porcentaje
Observada
Lineal
Logartmico
Cuadrtico
Cbico
Exponencial

100,00

80,00

60,00

40,00

20,00

0,00
0,00

20,00

40,00

Millas

41

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

SESIN 6: REGRESIN LINEAL MLTIPLE

Para la explicacin de los procedimientos relacionados con el anlisis de regresin


mltiple, se usar el siguiente caso:
Un analista realiza una investigacin de las ganancias por accin de grandes
corporaciones. Las variables de prediccin que estima le sern tiles son las siguientes:
ventas en millones de dlares, utilidades como porcentaje de inversin, activos en
millones de dlares e inversin de los accionistas millones de dlares.
Como primer paso de anlisis veremos las correlaciones entre las variables involucradas
en el anlisis.

Analizar, Correlaciones, Bivariadas, se obtiene los siguientes resultados:


Correlaciones

Ganancias por accin

Ventas (mills)

Activos (mills)

Inversion de accionistas

Utilidades %

Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N

Ganancias
por accin
1
30
.316
.089
30
.333
.072
30
.355
.054
30
.451*
.012
30

Inversion de
Activos (mills)
accionistas
Utilidades %
.333
.355
.451*
.072
.054
.012
30
30
30
.994**
.978**
-.085
.000
.000
.653
30
30
30
30
.994**
1
.992**
-.062
.000
.000
.744
30
30
30
30
.978**
.992**
1
-.051
.000
.000
.790
30
30
30
30
-.085
-.062
-.051
1
.653
.744
.790
30
30
30
30

Ventas (mills)
.316
.089
30
1

*. La correlacin es significante al nivel 0,05 (bilateral).


**. La correlacin es significativa al nivel 0,01 (bilateral).

Como se observa, existe una baja correlacin entre la variable dependiente y las
posibles predictoras. Adems, existe una alta correlacin entre las variables
independientes.

MULTICOLINEALIDAD:
El problema de multicolinealidad se presenta cuando existe una alta correlacin entre
variables independientes, como es el caso: correlacin entre Ventas y Activos (0.994);
correlacin entre Ventas e Inversin (0.978).
Adems se comprueba la multicolinealidad siguiendo el criterio propuesto en clase:
Menor correlacin entre Y y las Xs 0.316
Existe correlaciones entre Xs mayor que 0.316
An en la presencia detectada de multicolinealidad estimaremos el modelo para
determinar lo adecuado que puede ser su uso para la prediccin:
Seguimos la siguiente secuencia: Analizar, Regresin, Lineal

42

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

En el cuadro mostrado se selecciona la variable dependiente y las independientes segn


se indica:
Ingresar aqu la variable
dependiente

Ingresar aqu las variables


independientes

Los resultados obtenidos son los siguientes:


Resumen del modelo
Modelo
1

R cuadrado
corregida
.257

R
R cuadrado
.600a
.360

Error tp. de la
estimacin
2.70416

a. Variables predictoras: (Constante), Utilidades %, Inversion


de accionistas, Ventas (mills), Activos (mills)

El porcentaje de variacin que es explicado por la ecuacin de regresin es bajo, slo


36%.
ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
102.660
182.812
285.472

gl
4
25
29

Media
cuadrtica
25.665
7.312

F
3.510

Sig.
.021a

a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas, Ventas


(mills), Activos (mills)
b. Variable dependiente: Ganancias por accin

En forma conjunta las variables son significativas para el modelo, considerando un nivel
de significacin del 5% (P-Valor = 0.021). Las hiptesis que se proponen son las
siguientes:
H o : 0 = 1 = ... = 4 = 0 En forma conjunta las variables no contribuyen al modelo
H1 : i 0

Al menos una variable es significativa para el modelo

El siguiente cuadro permite analizar la contribucin individual de cada variable


regresora al modelo propuesto:
43

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Coeficientesa

Modelo
1

(Constante)
Ventas (mills)
Activos (mills)
Inversion de accionistas
Utilidades %

Coeficientes no
estandarizados
B
Error tp.
-.039
1.313
.000
.001
.000
.001
.001
.001
.186
.065

Coeficientes
estandarizad
os
Beta

t
-.029
.275
-.549
.966
2.862

.457
-1.444
1.364
.470

Sig.
.977
.786
.588
.343
.008

a. Variable dependiente: Ganancias por accin

En forma individual, slo la variable Utilidades es significativa para el modelo pues su


P-Valor (0.008) es menor al nivel de significacin usual (5%), sin embargo las otras
variable no contribuyen de manera individual al modelo.
H o : i = 0 La variable i no es significativa para el modelo
H 1 : i 0 La variable es significativa para el modelo

MTODO DE SELECCIN DE VARIABLES: HACIA ADELANTE


Se ha determinado hasta el momento que el modelo presenta deficiencias puesto que el
porcentaje de variacin explicado es bajo, se ha detectado la presencia de
multicolinealidad y de manera individual existe variables que no contribuyen al modelo.
El siguiente paso consiste en retirar las variables que presentan multicolinealidad y
analizar el nuevo modelo resultante.
Lo propuesto se puede realizar en la opcin: Mtodo. Al seleccionar Introducir, el
programa ir ingresando variables al modelo y a la vez verificar su contribucin.

Aqu se debe seleccionar el


mtodo par seleccionar
variables

Los resultados obtenidos son los siguientes:

44

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Resumen del modelo


Modelo
1
2

R cuadrado
corregida
.175
.298

R
R cuadrado
.451a
.204
.589b
.347

Error tp. de la
estimacin
2.84917
2.62787

a. Variables predictoras: (Constante), Utilidades %


b. Variables predictoras: (Constante), Utilidades %, Inversion
de accionistas
ANOVAc
Modelo
1

Regresin
Residual
Total
Regresin
Residual
Total

Suma de
cuadrados
58.175
227.297
285.472
99.018
186.454
285.472

gl
1
28
29
2
27
29

Media
cuadrtica
58.175
8.118
49.509
6.906

F
7.166

Sig.
.012a

7.169

.003b

a. Variables predictoras: (Constante), Utilidades %


b. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas
c. Variable dependiente: Ganancias por accin

Coeficientes a

Modelo
1
2

(Constante)
Utilidades %
(Constante)
Utilidades %
Inversion de accionistas

Coeficientes no
estandarizados
B
Error tp.
.493
1.243
.179
.067
-.054
1.168
.186
.062
.000
.000

Coeficientes
estandarizad
os
Beta
.451
.471
.379

t
.397
2.677
-.047
3.022
2.432

Sig.
.695
.012
.963
.005
.022

a. Variable dependiente: Ganancias por accin

Variables excluidas c

Modelo
1

Ventas (mills)
Activos (mills)
Inversion de accionistas
Ventas (mills)
Activos (mills)

Beta dentro
.357a
.362a
.379a
-.349b
-.808b

t
2.259
2.304
2.432
-.449
-.662

Sig.
.032
.029
.022
.657
.514

Correlacin
parcial
.399
.405
.424
-.088
-.129

Estadsticos
de
colinealidad
Tolerancia
.993
.996
.997
.041
.017

a. Variables predictoras en el modelo: (Constante), Utilidades %


b. Variables predictoras en el modelo: (Constante), Utilidades %, Inversion de accionistas
c. Variable dependiente: Ganancias por accin

MODELO FINAL:
Luego, el programa nos entrega el mejor modelo. En este caso las variables de
prediccin seleccionadas son Ventas y Activos. A continuacin se muestra el
resumen para este modelo:

45

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

Resumen del modelo


Modelo
1

R
.589a

R cuadrado
corregida
.298

R cuadrado
.347

Error tp. de la
estimacin
2.62787

a. Variables predictoras: (Constante), Utilidades %, Inversion


de accionistas
ANOVAb
Modelo
1

Regresin
Residual
Total

Suma de
cuadrados
99.018
186.454
285.472

gl
2
27
29

Media
cuadrtica
49.509
6.906

F
7.169

Sig.
.003a

a. Variables predictoras: (Constante), Utilidades %, Inversion de accionistas


b. Variable dependiente: Ganancias por accin
Coeficientes a

Modelo
1

(Constante)
Inversion de accionistas
Utilidades %

Coeficientes no
estandarizados
B
Error tp.
-.054
1.168
.000
.000
.186
.062

Coeficientes
estandarizad
os
Beta
.379
.471

t
-.047
2.432
3.022

Sig.
.963
.022
.005

a. Variable dependiente: Ganancias por accin

SUPUESTO DE NORMALIDAD:
Otro supuesto del modelo es la normalidad que presentan los errores. Para verificar este
supuesto podemos realizar el grfico de probabilidad normal.
Lo primero que se debe hacer es seleccionar la opcin guardar y en el cuadro de
dilogo que se muestra marcar las pociones: Residuos: No tipificados y Valores
Pronosticados: No tipificados. Los valores de los residuos se generaran
automticamente y se guardaran en dos columnas adicionales en nuestra base de datos.

46

Gua de la laboratorio SPSS

Gonzalo Cuadros Herrera

El siguiente paso es ingresar a la opcin grficos y marcar la opcin de grfico de


probabilidad normal.
Primero generar los valores
de residuales

Luego generar el grfico con


los residuales ya calculados
en el paso anterior

El resultado que se obtiene es el que se muestra:


Grfico P-P normal de regresin Residuo tipificado

Variable dependiente: Ganancias por accin

Prob acum esperada

1,0

0,8

0,6

0,4

0,2

0,0
0,0

0,2

0,4

0,6

0,8

Prob acum observada

47

1,0

Anda mungkin juga menyukai