a
stica
con
Statgraphics Plus
Dpto. de Estad
stica e I.O.
Universidad de Granada
15 de abril de 2008
ii
Indice general
Introduccin
o
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
2. Variables estad
sticas unidimensionales
2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . .
o
2.2. Tabla de frecuencias y representacin de variables discretas .
o
2.2.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . .
a
2.3. Tabla de frecuencias y representacin de variables continuas
o
2.3.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . .
a
2.4. Representacin de variables cualitativas . . . . . . . . . . . .
o
2.4.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . .
a
3. S
ntesis numrica de una variable estad
e
stica
3.1. Introduccin . . . . . . . . . . . . . . . . . . .
o
3.2. Medidas de posicin, dispersin y forma . . .
o
o
3.2.1. Ejemplo prctico . . . . . . . . . . . .
a
3.3. Ejercicios . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
3
3
3
8
17
18
19
19
22
23
27
.
.
.
.
.
.
.
29
29
29
30
34
34
39
39
.
.
.
.
43
43
43
44
54
4. Distribuciones estad
sticas bidimensionales
55
4.1. Distribuciones bidimensionales de frecuencias . . . . . . . . . . . . . . . . . 55
4.1.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
a
iii
INDICE GENERAL
4.2. Distribuciones condicionadas . . . . . . . .
4.2.1. Ejemplo prctico . . . . . . . . . .
a
4.3. Ejercicios . . . . . . . . . . . . . . . . . .
4.4. Anlisis bidimensional de datos categricos
a
o
4.4.1. Ejemplo prctico . . . . . . . . . .
a
4.5. Procedimiento Tabulacin Cruzada . . . .
o
4.5.1. Tabla de frecuencias . . . . . . . .
4.5.2. Test de la 2 . . . . . . . . . . . .
4.6. Procedimiento Tablas de Contingencia . .
4.6.1. Ejemplo prctico . . . . . . . . . .
a
4.7. Ejercicios . . . . . . . . . . . . . . . . . .
5. Regresin y Correlacin
o
o
5.1. Introduccin . . . . . . . . . . .
o
5.2. Regresin lineal simple . . . . .
o
5.2.1. Ejemplo prctico . . . .
a
5.2.2. Predicciones . . . . . . .
5.2.3. Comparacin de Modelos
o
5.2.4. Residuos At
picos . . . .
5.3. Regresin no Lineal . . . . . . .
o
5.4. Opciones Grcas . . . . . . . .
a
5.5. Ejercicios . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
Alternativos
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
conocidas
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
7. Estimacin
o
7.1. Introduccin . . . . . . . . . . . . . . . . .
o
7.2. Intervalos de conanza para una muestra .
7.2.1. Ejemplo prctico . . . . . . . . . .
a
7.3. Intervalos de conanza para dos muestras .
7.3.1. Ejemplo prctico . . . . . . . . . .
a
7.4. Ejercicios . . . . . . . . . . . . . . . . . .
iv
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
60
60
62
63
63
64
66
67
68
68
70
.
.
.
.
.
.
.
.
.
71
71
72
72
75
75
76
76
77
79
.
.
.
.
.
.
83
83
85
85
86
87
95
.
.
.
.
.
.
97
97
97
99
101
103
106
Introduccin
o
El contenido de este guin de prcticas se orienta a la presentacin de las tcnicas de
o
a
o
e
anlisis estad
a
stico de una forma sencilla de entender a travs del programa Statgraphics
e
Plus 5.1.
Hoy en d se utiliza la estad
a
stica en diferentes campos de la ciencia, desde la econom
a,
las nanzas, la ingenier la matemtica en general, hasta la sociolog la psicolog la
a,
a
a,
a,
biolog la medicina, etc. Lo esencial para empezar a trabajar en estad
a,
stica, sea cual sea
el campo en que se aplique, es la comprensin de los propios conceptos estad
o
sticos, tarea
que no exige el dominio del aparato matemtico. Posteriormente, cuando ya sea necesaria
a
la operatoria avanzada, los programas de ordenador permiten obtener los resultados sin
necesidad de descifrar el desarrollo matemtico de los algoritmos que estn debajo de los
a
a
procedimientos estad
sticos.
Cada una de las prcticas que se incluyen comienza con una breve introduccin teria
o
o
ca sobre los mtodos estad
e
sticos a utilizar para, a continuacin, presentar las diferentes
o
opciones que aporta el programa para abordar dichos mtodos, aplicndolas a casos prctie
a
a
cos.
INDICE GENERAL
Prctica 1
a
Introduccin al Statgraphics Plus
o
1.1.
1.1.1.
La pantalla StatWizard
Al ejecutar el programa se presenta la pantalla StatWizard (Figura 1.1), cuya nalidad es
ofrecer ayuda sobre el tema que el usuario seleccione. En esta ventana puede elegirse la
opcin de que no vuelva a aparecer al arrancar el programa, quitando la seal que aparece
o
n
en el campo Mostrar StatWizard al Iniciar.
3
Guardar Statfolio
Cortar seleccin
o
Copiar seleccin
o
Grco de dispersin
a
o
Histograma
Estad
sticos: Resumen estad
stico
Regresin mltiple
o
u
Anlisis de la capacidad
a
Anlisis cluster
a
1.2.
o
9
Grco
a
Grco
a
Grco
a
Grco
a
Indice (contenidos)
Conocer el Programa (aprendiendo el programa)
Accediendo y Usando Ficheros (acceso y uso de cheros)
Datos y Hojas de Datos (datos y hojas de datos)
Grcos y Opciones Grcas (grcos y opciones grcas)
a
a
a
a
Imprimiendo (impresin)
o
Publicacin Web (obtener un chero html de resultados)
o
16
1.3.
Editor de datos
datos con los que trabajar. Estos se pueden obtener de varias formas:
1. Introduccin directa de los datos.
o
2. Exportarlos desde un archivo.
3. Modicar algunos datos ya introducidos.
17
1.3.1.
Para introducir directamente los datos, se escriben los valores en el editor de datos, como
si fuera una hoja de clculo, teniendo en cuenta que:
a
1. Cada la ser un individuo y cada columna una variable. Por ejemplo, si se tiene
a
una encuesta que conste de 10 preguntas realizadas a 1000 individuos, esto ser un
a
chero de datos en forma matricial de 10 columnas y 1000 las. Para pasar de un
individuo a otro se pulsa el botn ENTER y para pasar de una variable a otra el
o
botn TABULACION.
o
2. Por defecto el programa solo permite la introduccin de valores numricos.
o
e
3. Para modicar alguna de las caracter
sticas de las variables con las que vamos a
trabajar:
Se selecciona la variable deseada.
Se pulsa el botn derecho del ratn.
o
o
Y se selecciona de la ventana la opcin Modicar Columna...
o
Se genera un cuadro de dialogo en el que es posible cambiar el nombre de la variable,
introducir un comentario, modicar el ancho de la columna as como el tipo de dato
con el se va a trabajar.
18
1.3.2.
1.3.3.
Una vez creado un chero de datos, este se puede modicar. Para ello se selecciona la
variable a modicar y se pulsa el botn derecho del ratn.
o
o
o
2. Cortar : Cortar
3. Copiar : Copiar
4. Pegar : Pegar
5. Pegar Enlace: Pegar con v
nculo a su fuente
6. Insertar : Insertar
7. Borrar : Borrar
8. Modicar Columna: Eleccin de las opciones de la variable
o
9. Generar Datos: Generar datos. En esta nueva ventana podemos realizar operaciones
que nos proporcionaran nuevas variables con los resultados de las mismas. Estas
operaciones pueden ser de tipo lgico (<, >, , ,and,or), de tipo aritmtico (+,o
e
,*,/)o mediante alguno de los operadores que tiene implementado el programa. Una
vez elegido el operador, tendremos que completar los parmetros de los que depende
a
y que aparecen con ?. Por ejemplo, si existe una variable que se llama ingresos y
11. Ordenar Fichero: Permite ordenar los datos de modo ascendente o descendente, de
modo que al ordenar el chero segn una variable, modica el resto de variables para
u
que no se pierda la coherencia del chero. Tambin permite introducir una segunda
e
variable de orden para los casos en los que en la primera exista el mismo valor.
21
1.4.
Ventana de anlisis
a
1.5.
Finca Sueldo
Finca 1
40,5
Finca 2
30
Finca 3
30
Finca 4
40,5
Finca 1
30
Finca 3
30
Finca 2
40,5
Finca 2
30
Finca 4
30
Finca 3
40,5
Finca 1
30
Finca 1
30
Finca 2
30
Finca 4
30
Finca 4
30
Finca 2
30
Finca 3
30
Finca 4
30
Finca 1
30
Finca 3
40,5
Finca 1
30
Finca 4
40,5
Finca 2
30
Finca 1
30
Finca 4
40,5
Finca 3
30
Finca 3
30
Finca 4
40,5
Finca 2
40,5
Finca 2
30
D
as
30
68
13
95
30
39
17
68
114
91
15
15
153
57
76
34
52
57
15
13
30
38
17
15
57
52
65
76
17
17
Para introducir los datos se comienza deniendo las columnas con el nombre de las
variables y el tipo de dato. Para ello se pincha con el botn secundario del ratn sobre
o
o
cada columna y se elige la opcin Modicar Columna... y se introducen los nombres y
o
tipo de las variables (Cuadro 1.1).
24
26
1.6.
Ejercicios
27
1.6. Ejercicios
28
Prctica 2
a
Variables estad
sticas
unidimensionales
En Estad
stica la informacin se recoge en variables. Estas variables se organizan de
o
forma ordenada y se almacenan en cheros. Posteriormente ser posible operar con estas
a
variables y aplicar funciones a las mismas para realizar las transformaciones y los anlisis
a
estad
sticos que se desee.
2.1.
Introduccin
o
grcas.
a
2.2.
o
barras.
29
2.2.1.
Ejemplo prctico
a
3 4
1 0
1 2
1 5
8
9
9 8
9 8
7 6
0 8
6
8
7 9
8 9
8 7
5 7
Figura 2.4: Ventana (por defecto) de resultados del anlisis de la variable nota.
a
En esta ventana de anlisis de resultados se observan tres zonas esenciales:
a
a) La barra de icono y t
tulo del anlisis. Presenta el nombre del procedimiento
a
estad
stico cuyos resultados se muestran en la ventana de anlisis (en este caso
a
se trata del procedimiento Tabulacin). A continuacin se expresa el nombre
o
o
31
donde se pueden marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, se deja marcada la opcin Diagrama de Barras, que es el grco que
o
a
se utiliza para representar una variable estad
stica discreta. Se pulsa Aceptar.
Entonces, en la parte izquierda de la ventana de resultados, en la parte de abajo,
aparece la tabla de frecuencias para la variable nota. Haciendo doble click sobre
este trozo de ventana se puede maximizar el resultado para ver la tabla completa
(Figura 2.8).
2.3.
o
histograma.
2.3.1.
Ejemplo prctico
a
3,3
3,3
2,6
3,3
3,7
3,4
donde se pueden marcar y desmarcar las opciones que aparecen, segn interese.
u
En este caso, se quitan las marcas que aparecen por defecto y se marca la opcin
o
Histograma, que es el grco que se utiliza para representar una variable estad
a
stica
continua. Se pulsa Aceptar.
El ejercicio pide una tabla de frecuencias dividida en 6 clases. Para ello se procede a
modicar los l
mites de los intervalos. Se pulsa sobre la tabla con el botn derecho y
o
se selecciona Opciones de ventana, (ver Figura 2.16), se introducen unos valores
que den una tabla de frecuencias fcil de interpretar.
a
2.17.
Volviendo a hacer doble click sobre la pantalla anterior aparecen de nuevo todos los
resultados. En la parte derecha aparece el histograma para la variable peso. Haciendo
doble click sobre el grco se maximiza para verlo en detalle (Figura 2.18).
a
38
2.4.
a
los datos que se tienen son las propias observaciones.
Si en lugar de las observaciones se dispone de una tabla donde se reejan las distintas modalidades de la variable junto con su frecuencia absoluta, entonces las opciones
son Grcos / Diagramas de Presentacin / Diagrama de Barras... y Grcos
a
o
a
/ Diagramas de Presentacin / Diagrama de Sectores..., respectivamente, para
o
realizar el diagrama de barras y el diagrama de sectores.
2.4.1.
Ejemplo prctico
a
Especies Toneladas
Almeja
4453
Calamar
1644
Cigala
7799
Langosta
525
Langostino
3548
Mejilln
o
96253
Pulpo
55205
Euros
5640
21998
30253
2568
10513
11326
51975
39
2. Se va a realizar un diagrama de barras para cada una de las variables. Dado que en
este caso los datos vienen dados a partir de las frecuencias de las modalidades se
selecciona en el Men principal la opcin Grcos / Diagramas de Presentacin
u
o
a
o
/ Diagrama de Barras... (Figura 2.20).
42
Prctica 3
a
S
ntesis numrica de una variable
e
estad
stica
3.1.
Introduccin
o
Una vez denidos los conceptos bsicos en el estudio de una distribucin de frecuencias
a
o
de una variable, se estudian las distintas formas de resumir dichas distribuciones mediante medidas de posicin (o de centralizacin), teniendo presente el error cometido en el
o
o
resumen mediante las correspondientes medidas de dispersin. A su vez se analizar la
o
a
forma de la distribucin mediante las medidas de forma. El histograma de frecuencias y
o
el diagrama de barras, vistos en la prctica anterior, ya aportan una representacin visual
a
o
de las tres propiedades ms importantes de los datos muestrales relativos a variables: la
a
forma de su distribucin, su tendencia central y su dispersin. Ahora se trata de cuanticar
o
o
estos conceptos.
3.2.
3.2.1.
Ejemplo prctico
a
Sean los siguientes datos que representan el peso en kg., la altura en cm. y el sexo de 12
individuos. Para este conjunto de datos se pide:
a) Realizar un anlisis descriptivo completo de las variables peso y altura, para todo el
a
conjunto de individuos.
b) A la vista de los resultados, decidir qu variable es ms homognea.
e
a
e
c) Realizar un anlisis descriptivo completo de las variables peso y altura, para cada
a
grupo.
peso altura
sexo
75
173
hombre
81
172
hombre
56
136
mujer
68
180
mujer
79
182
hombre
89
185
hombre
62
157
hombre
59
165
mujer
83
180
hombre
55
160
mujer
72
174
hombre
56
161
mujer
a) A continuacin, se detallan los pasos a seguir:
o
1. En primer lugar, se denen las variables peso, altura y sexo y se introducen los
datos. (Ver Figura 3.1)
44
Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
2. Entonces se selecciona en el Men principal la opcin Descripcin / Datos
u
o
o
Numricos / Anlisis Unidimensional...
e
a
En el cuadro de dilogo que aparece se introduce en el recuadro Datos: la variable
a
que se va a analizar (en primer lugar, peso); para ello se selecciona con el ratn en
o
el recuadro de la izquierda y se pulsa el icono que aparece debajo de la opcin. Una
o
vez seleccionada la variable se pulsa el botn Aceptar y se abre una nueva ventana
o
de resultados.
Por defecto, aparecen algunos resultados del men Anlisis Unidimensional...
u
a
(Ver Figura 3.2)
donde se puede marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, se dejan marcadas las opciones: Resumen del Procedimiento y Resumen estad
stico y se marca Percentiles. Se pulsa Aceptar.
Entonces, en la parte central izquierda de la ventana de resultados aparecen algunas
medidas para la variable peso. Haciendo doble click sobre esta parte de la ventana
se puede maximizar esta ventana concreta de resultados. (Ver Figura 3.4)
Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
De los resultados se obtiene, por ejemplo: que el peso medio es de 69.58 kgs; la
mitad de los individuos pesan menos de 70 kgs; lo ms usual es un peso de 56 kgs.
a
El coeciente de asimetr da un valor de 0.160211, es decir, una ligera asimetr
a
a
a la derecha y el coeciente de curtosis es -1.4683, es decir, la distribucin de las
o
frecuencias es menos aplastada que la normal.
47
Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
4. Se repite el procedimiento con la variable altura y se obtienen los siguientes resultados para el resumen estad
stico (ver la Figura 3.9) y los percentiles (ver la Figura
3.10).
De los resultados obtenidos se puede resaltar que: la altura media es 168.75 cm; la
mitad de los individuos miden menos de 172.5 cm y la altura que ms se repite es
a
180 cm. El signo negativo del coeciente de asimetr indica asimetr a la izquierda
a
a
y el coeciente de curtosis indica que la distribucin es ms apuntada que la normal.
o
a
49
Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
donde se puede marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, dejamos marcadas las opciones: Resumen del Anlisis, y Resumen
a
estad
stico.
Entonces, en la parte inferior izquierda de la ventana de resultados aparecen algunas
medidas para la variable altura, en cada uno de los grupos. Haciendo doble click sobre
51
De los resultados se obtiene, por ejemplo: que la altura media en los hombres es de
174.714, mientras que en las mujeres es de 160.4; la mitad de los hombres miden
ms de 174 cm y la mitad de las mujeres miden ms de 161 cm; destaca el hecho de
a
a
que no aparece ningn valor para la moda en los grupos, lo que quiere decir que en
u
este caso no hay ningn valor que se repita ms que otro o que pueden existir ms
u
a
a
de una moda. El coeciente de asimetr da en ambos casos valores negativos, es
a
decir, asimetr a la izquierda y el coeciente de curtosis, indica que la distribucin
a
o
de las frecuencias es ms apuntada que la normal, en los dos grupos.
a
3. Un estudio similar se realiza con la variable peso y el resultado que se obtiene se
puede ver en la gura 3.16.
52
Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
53
3.3. Ejercicios
3.3.
Ejercicios
8 9 12 15
8 12 10 8
10 8 12 7
16 9 5
6 15 8
9 11 9
Determine:
a) Tipo de variable estad
stica.
b) Tabla de frecuencias, diagrama de tallo y hojas e histograma.
c) Nmero medio de pginas, mediana y nmero de pginas ms frecuente.
u
a
u
a
a
d ) Nmero mximo de pginas del 10 % de los art
u
a
a
culos ms cortos.
a
e) Dispersin, asimetr y curtosis.
o
a
f ) Comentar el resultado de todas las medidas de los apartados anteriores.
g) Compara la forma de la distribucin y la dispersin con la del nmero de
o
o
u
pginas de los art
a
culos de otra revista en la que se han observado los siguientes
valores:
10
18
12
19
16
11
14
18
19
15
13
17
15
10
19
16
14
14
16
13
19
19
12 10 17
10 12 11
16 15 18
13
15
12
2. La EPA (Agencia de Proteccin del medio ambiente de EEUU) exige a los fabricantes
o
de automviles que indiquen los consumos, tanto por ciudad como por carretera,
o
de cada uno de sus modelos. A continuacin se presentan los datos de consumo por
o
carretera de 30 modelos de automvil de 1994, expresados en litros por cada 100
o
km:
12.3
10.8
11.8
9.1
10.5
14.1
10.1 10.4
11.3 9.7
10.8 18.8
9.7
10.8
10.8
11.3
10.5
10.4
11.3 10.8
12.3 11.3
10.1 10.8
9.7
9.1
12.8
10.1
11.8
10.8
Analizar descriptivamente la variable y calcular todas las medidas descriptivas estudiadas en el tema 2. Comenta el resultado de dichas medidas.
54
Prctica 4
a
Distribuciones estad
sticas
bidimensionales
4.1.
4.1.1.
Ejemplo prctico
a
[6,12]
10
5
0
(12,18]
15
20
15
(18,24]
0
25
5
(24,30]
0
0
5
Se pide:
a) Obtener las distribuciones de frecuencias marginales de cada variable.
b) Obtener las medias, varianzas, desviaciones tpicas y coecientes de variacin, asime
o
tr y curtosis de ambas variables conjuntamente. Y la covarianza entre ambas vaa
riables.
c) Representar los datos mediante un diagrama de dispersin.
o
En este caso se observa que los valores de las variables vienen dados en una tabla
bidimensional de frecuencias absolutas. El primer paso ser introducir adecuadamente los
a
valores de las dos variables como dos columnas de la hoja de clculo de Statgraphics. El
a
par de valores RM=18 y C=9 (que son las marcas de clase) se introduce 10 veces, el par
de valores RM=24 C=9 se introduce 5 veces, y as sucesivamente se introduce cada par
Figura 4.9: Grco de dispersin correspondiente a las variables Consumo y Renta Mena
o
sual.
59
4.2.
Distribuciones condicionadas
4.2.1.
Ejemplo prctico
a
Se consideran los datos usados en el ejemplo anterior, correspondientes a la Renta Mensual y al Consumo de 100 familias. Se pide obtener la distribucin de frecuencias y algunas
o
medidas descriptivas del Consumo para aquellas familias que tienen una Renta Mensual
superior a 2000 euros.
Para obtener la distribucin de frecuencias se selecciona la opcin Descripcin /
o
o
o
Datos numricos / Anlisis Unidimensional... y en el cuadro de dilogo que aparece
e
a
a
se introduce en el campo Datos: la variable C (consumo) y en (Seleccin:) RM > 20.
o
(Ver gura 4.10).
61
4.3. Ejercicios
4.3.
Ejercicios
[20,30]
74
7
3
(30,40]
82
6
2
(40,50]
78
5
2
(50,60]
72
6
1
(60,70]
7
5
1
62
4.4.
Dentro de esta opcin se puede elegir entre varias opciones, y estudiar concretamente
o
el procedimiento Tabulacin. Sean los siguientes procedimientos:
o
Tabulacin Cruzada
o
Procedimiento que resume la distribucin conjunta de dos variables discretas meo
diante su tabulacin bidimensional. Los recuentos se efectan midiendo el nmero
o
u
u
de veces que aparece cada modalidad de la primera variable con la otra de la segunda
variable.
Tablas de Contingencia
Es anlogo al anterior y su particularidad es que la informacin se introduce ya
a
o
tabulada.
4.4.1.
Ejemplo prctico
a
FUTBOL
si
si
no
no
si
no
no
si
no
si
no
si
si
Antes de empezar con el anlisis se introducen los datos, teniendo en cuenta que al
a
denir la variable se tiene que indicar que son categricos.
o
4.5.
65
4.5.1.
Tabla de frecuencias
Al elegir la opcin de Tabla de Frecuencias, se crea una tabla con las frecuencias
o
absolutas para cada par de valores y la frecuencia relativa con respecto al total de la tabla.
Si se pulsa el botn derecho del ratn se obtienen porcentajes con respecto a las las (se
o
o
66
4.5.2.
Test de la 2
4.6.
est en la forma en la que se introducen los datos ya que en este caso la informacin
a
o
est tabulada.
a
4.6.1.
Ejemplo prctico
a
Se clasican las notas de una asignatura en tres grupos distintos. Los datos aparecen en
la siguiente tabla:
GRUPO SUSPENSOS
A
10
B
14
C
8
APROBADOS
32
12
10
NOTABLES SOBRESALIENTES
12
40
10
30
6
16
En el editor de datos se introducen los datos en cinco columnas semejantes a las del
enunciado. La primera columna contiene a la variable Grupo y es de tipo categrica, las
o
otras cuatro variables son numricas y sern, respectivamente, suspensos, aprobados, noe
a
tables y sobresalientes como se muestra en la imagen.
A continuacin se accede al men Descripcin / Datos Cualitativos / Tablas
o
u
o
de Contingencia tras el que aparece el siguiente cuadro de dialogo. En Columnas se
68
Figura 4.20:
introducen las variables que se han denido como numricas y en Etiquetas la variable
e
denida como categrica. A partir de aqu todo ser igual que en el apartado anterior:
o
69
4.7. Ejercicios
4.7.
Ejercicios
tertulia tertulia
si
no
20
70
60
70
30
30
pelo
rubio moreno pelirrojo canoso
azul
1768
807
186
47
verde
946
1387
746
53
castao 115
n
438
288
16
a)
b)
c)
d)
e)
De las personas con el pelo rubio, qu porcentaje tienen los ojos azules?
e
De las personas con ojos azules, qu porcentaje tienen el pelo rubio?
e
De las personas con el pelo canoso, qu porcentaje tienen los ojos castaos?
e
n
De las personas con ojos castaos, qu porcentaje tienen el pelo canoso?
n
e
Cul es el porcentaje que tiene el pelo canoso y los ojos castaos?
a
n
Ingenier Letras
a
30
14
10
16
Prctica 5
a
Regresin y Correlacin
o
o
5.1.
Introduccin
o
anlisis.
a
Con este anlisis se pretende conocer si una o varias variables independientes o exa
plicativas aportan algn tipo de informacin sobre el comportamiento de otra variable
u
o
dependiente o explicada. Una de las nalidades de este anlisis es realizar predicciones
a
para los datos. En esta prctica se considera el caso en el que se dispone de una unica
a
variable independiente (regresin simple), es decir, hay que expresar una variable indeo
pendiente en funcin de una variable dependiente.
o
En regresin lineal, la funcin mediante la cul se expresa esta relacin ser del tipo:
o
o
a
o
a
Y = a + bX
donde los parmetros a y b sern determinados a partir de los datos. Evidentemente el
a
a
objetivo ser que este ajuste sea lo mejor posible.
a
5.2.
5.2.1.
Ejemplo prctico
a
Sean los siguientes datos que representan el Peso en kg. y la Altura en cm. de 12 individuos. Con este conjunto de datos se procede a obtener posibles resultados en el anlisis
a
de regresin:
o
peso altura
75
173
81
172
56
136
68
180
79
182
89
185
62
157
59
165
83
180
55
160
72
174
56
161
Una vez introducidos los datos se selecciona en el Men principal la opcin Dependencia
u
o
/ Regresin Simple...
o
En el Cuadro de dilogo que aparece se introducen las variables a analizar.
a
72
74
5.2.2.
Predicciones
5.2.3.
La regresin que se ha realizado est basada en el modelo lineal. Ahora lo que se pretende
o
a
es estudiar si existe otro modelo no lineal que mejore los resultados que se han obtenido con
75
5.2.4.
Residuos At
picos
Esta opcin proporciona los valores de la variable que son anmalos o extremos. Estos
o
o
puntos son aquellos que tienen un residuo estandarizado fuera del intervalo [-2,2].
5.3.
Regresin no Lineal
o
5.4.
Opciones Grcas
a
La salida grca de la ventana inicial del anlisis de regresin consiste en un grco donde
a
a
o
a
estn representadas la nube de puntos y la recta de regresin ajustada, as como otras
a
o
77
78
5.5.
Ejercicios
8 13 -4
66 63 97
-6 -8 -11
82 90 107
0.9 1 1.4
10 15 21
de mortalidad
102.5
104.5
100.4
95.9
87.0
95.0
88.6
89.2
78.9
84.6
81.7
72.2
65.1
68.1
67.3
52.5
79
5.5. Ejercicios
a) Determinar la recta de regresin de m
o
nimos cuadrados, que relaciona la variable
ndice de mortalidad en funcin de la temperatura anual media.
o
b) Qu
e ndice de mortalidad puede predecirse para una temperatura anual media
de 33 o F?.
c) Es able esta prediccin?
o
4. Una fbrica de cerveza quiere averiguar si existe una relacin lineal entre el dinero
a
o
que gasta en anuncios de televisin y sus ventas totales para lo que se anotan los
o
siguientes datos:
Mes
Ventas (miles de euros)
Enero
50
Febrero
90
Marzo
30
Abril
90
Mayo
91
Junio
95
Julio
95
Obtener la recta de regresin y comprobar si existe relacin lineal entre las variables.
o
o
5. La factura mensual del gasto telefnico de una pequea empresa se ha incrementado
o
n
notablemente en los ultimos meses. Los estudios realizados por el administrador de la
0.9 1 1.4
10 15 21
81
5.5. Ejercicios
82
Prctica 6
a
Algunas distribuciones de
probabilidad conocidas
6.1.
Introduccin
o
6.1. Introduccin
o
Al pulsar Aceptar se obtiene una pantalla con informacin sobre la distribucin elegio
o
da. Si sobre esta pantalla se pincha el icono Opciones Tabulares de la barra de herramientas, se obtiene el Cuadro de dilogo de la Figura 6.3, en la que se observan las distintas
a
opciones de trabajo con la distribucin elegida.
o
84
6.2.
Funciones de distribucin
o
Si, al pulsar el botn derecho del ratn, se elige la opcin Opciones de Anlisis... del
o
o
o
a
men emergente resultante se obtiene el cuadro de dilogo Opciones... de la distribucin
u
a
o
correspondiente, en cuyos campos se pueden introducir hasta 5 pares de valores distintos
de los parmetros para las que se hallar los valores de la funcin de distribucin, la
a
a
o
o
funcin de densidad o la funcin masa de probabilidad y el complementario de la funcin
o
o
o
de distribucin.
o
6.3.
La opcin CDF Inversa del Cuadro de dilogo Opciones Tabulares permite hallar el
o
a
valor de la funcin inversa de la funcin de distribucin (valor cr
o
o
o
tico) en 5 puntos dados
para el modelo elegido.
85
6.4.
Opciones grcas
a
Si sobre una salida cualquiera se elige el icono Opciones Grcas de la barra de hea
rramientas, se obtiene la opcin Densidad/Funcin Masa, (Figura 6.6) entonces se reo
o
presenta la funcin de densidad (para variables aleatorias continuas) y la funcin masa de
o
o
probabilidad (para variables aleatorias discretas) para el modelo de probabilidad elegido;
y la opcin CDF, representa la funcin de distribucin para el modelo de probabilidad
o
o
o
elegido.
86
6.5.
Ejemplos prcticos
a
1. Para este ejemplo se van a utilizar las distribuciones normales N (0,1) y N (5,10).
Para ello se accede al siguiente men: Descripcin / Distribuciones / Distribuu
o
ciones de Probabilidad...
A continuacin se selecciona la distribucin con la que se va a trabajar, en este caso
o
o
Distribucin Normal.
o
Una vez que se ha introducido la distribucin con la que trabajar, aparece una
o
primera pantalla de resultados (Figura 6.8) donde se indica con que parmetro se
a
est trabajando y la representacin grca de esa distribucin.
a
o
a
o
87
Clculo de Valores Cr
a
ticos
En este caso, el objetivo es encontrar un valor que acumula una determinada probabilidad. Para realizarlo, una vez seleccionada la distribucin, se pulsa el botn de
o
o
Opciones Tabulares y Inversa CDF. Una vez realizado esto, aparece una ventana con la siguiente tabla:
89
Para cambiar estos valores se pulsa el botn derecho del ratn y la opcin Opciones
o
o
o
de Ventana. En esta ventana se sustituye alguno de los valores que aparecen por
los que se quieran calcular.
Opciones Grcas
a
Para obtener resultados grcos dentro del men de probabilidad se pulsa el icono
a
u
Opciones Grcas, apareciendo la siguiente ventana:
a
90
a
Distribucin Acumulada, (ver Figura 6.16 cuyo campo Valores para la Vario
able se rellena con el valor 10.
93
94
6.6.
Ejercicios
6.6. Ejercicios
d ) ms de 5
a
3. Un canal de comunicacin recibe impulsos independientes a razn de 12 impulsos
o
o
por microsegundo. La probabilidad de un error de transmisin es de 0.001 para cada
o
impulso. Calcular las probabilidades de los siguientes sucesos.
a) No hay ningn error en un microsegundo.
u
b) Hay exactamente un error en un microsegundo.
c) Hay al menos un error en un microsegundo.
d ) Hay exactamente dos errores en un microsegundo.
4. En una facultad universitaria el Coeciente Intelectual tiene una media de 108 y
una desviacin t
o pica de 7 unidades. Se pide calcular los valores del Coeciente de
Inteligencia tales que
a) Por debajo de l se encuentre el 5 % de los individuos.
e
b) Por encima se siten el 25 % de los alumnos.
u
c) Por debajo estn el 80 % de los estudiantes.
e
5. Dada una distribucin 2 ,
o
a) Representar en un mismo grco las funciones de distribucin de una 2 con
a
o
10, 20, 30, 40 y 50 grados de libertad
b) Si X
96
Prctica 7
a
Estimacin
o
7.1.
Introduccin
o
Esta prctica desarrolla la obtencin de intervalos de conanza para una y dos muesa
o
tras. Los intervalos de conanza que proporciona el programa se basan exclusivamente
en poblaciones normales. Por lo tanto, un paso previo antes de calcular los intervalos de
conanza es contrastar la existencia de normalidad en los datos, desde la opcin Gro
a
cos / Grcos Exploratorios / Grco Probabil
a
a
stico... del Men principal. En el
u
grco resultante se concluye que los datos proceden de una distribucin normal si stos
a
o
e
se encuentran sobre la bisectriz.
7.2.
Cuando se utilizan directamente los datos de una unica muestra de una poblacin, Stat
o
graphics permite el trabajo con estimacin por intervalos en poblaciones normales meo
diante la opcin Descripcin / Datos Numricos / Anlisis Unidimensional... del
o
o
e
a
Men principal del programa.
u
98
Prctica 7. Estimacin
a
o
7.2.1.
Ejemplo prctico
a
Los siguientes datos corresponden a las calicaciones obtenidas por 25 alumnos e dos
pruebas consecutivas de una misma asignatura. (Se supone que las dos variables siguen
una distribucin normal).
o
prueba1
5.27
6.20
5.97
6.84
5.78
7.62
4.87
6.88
7.34
6.34
6.30
7.16
4.71
6.52
6.49
5.68
6.32
6.61
4.56
5.09
6.23
4.06
6.53
5.75
4.71
prueba2
3.61
5.29
4.55
3.08
4.71
2.58
3.96
5.69
7.32
5.36
2.71
4.78
4.49
4.85
5.70
0.65
4.66
2.68
2.91
2.46
6.81
3.82
3.02
3.73
8.05
99
El programa genera la misma ventana de resultados que se ha estudiado con anterioridad. Para obtener los intervalos de conanza se pulsa el icono de Opciones Tabulares
y se selecciona Intervalos de Conanza
Prctica 7. Estimacin
a
o
(n 1)s2
2
n1,1/2
Por lo tanto, para obtener los intervalos para la varianza, se elevan los extremos
del intervalo al cuadrado, resultando el intervalo de conanza al 95 % para la varianza:
[0,529;1,679].
Anlogamente para la variable prueba2 se obtienen los siguientes intervalos al 95 %
a
para la media y la desviacin t
o pica:
7.3.
Cuando se utilizan directamente los datos de dos muestras de dos poblaciones diferentes,
Statgraphics permite el trabajo con estimacin por intervalos para comparar medias y
o
varianzas en poblaciones normales mediante la opcin Comparacin / Dos Muestras
o
o
/ Comparacin de Dos Muestras... (ver Figura 7.8) del Men principal del programa.
o
u
101
Prctica 7. Estimacin
a
o
7.3.1.
Ejemplo prctico
a
Con los datos del ejemplo anterior, puede considerarse que las puntuaciones medias sean
iguales en las dos pruebas?
Para responder a la pregunta hay que obtener un intervalo de conanza para la diferencia de medias de las dos variables. Dado que no se tiene ninguna informacin sobre las
o
varianzas poblaciones, en primer lugar, habr que obtener un intervalo de conanza para
a
el cociente de varianzas y determinar si stas se pueden considerar iguales.
e
Se pulsa Aceptar y se obtienen algunos resultados por defecto para este anlisis. A
a
continuacin se pincha el icono de Opciones Tabulares y se seleccionan las opciones
o
Comparacin de Medias y Comparacin de Desviaciones T
o
o
picas.
Prctica 7. Estimacin
a
o
El intervalo que se obtiene para el cociente de varianzas: [0,136099;0,700856] no contiene el valor 1, luego no se puede considerar que las varianzas sean iguales. Es decir, en
este caso no se puede llegar a una conclusin nal sobre la diferencia de medias, ya que
o
el programa slo resuelve el intervalo de conanza para diferencia de medias, cuando las
o
varianzas se suponen iguales.
En el caso de haber obtenido que las varianzas fueran iguales, se observar ahora el
a
resultado obtenido en la ventana Comparacin de Medias.
o
105
7.4. Ejercicios
7.4.
Ejercicios
2.3
2.1
No fumadora 3.1
4.5
3.2
2.6
2.7
3.6
3.1
2.4
3.6
3.7
2.5
2.7
3.8
3.8
Suponiendo que ambos grupos provienen de poblaciones normales de medias desconocidas y con varianzas desconocidas pero iguales, determinar si inuye que la
madre sea fumadora en el peso del hijo.
3. Los tiempos de ejecucin (en segundos) de 40 trabajos procesados por un centro de
o
clculo han resultado ser:
a
10 19 90
23 13 36
27 1 57
9 11 20
40 15 11 32 17 4 152
101 2 14 2 23 34 15
17 3 30 50 4 62 48
13 38 54 46 12 5 26
80.02
80.02
79.98
80.04 79.97
79.95 79.97
Prctica 7. Estimacin
a
o
Se supone que en ambos mtodos el calor tiene una distribucin normal. Obtener
e
o
un intervalo de conanza al 95 % para comparar las mediciones medias obtenidas
por ambos mtodos. Comprobar primero si se puede suponer que las varianzas son
e
iguales.
5. Se ha hecho un estudio para comparar los tiempos de acceso, en diferentes momentos
del d a internet desde ordenadores domsticos con modem. Para ello se cargan 8
a,
e
pginas web por la tarde en el per
a
odo de 14 a 15 h. y, con el mismo ordenador, las
mismas 8 pginas por la noche en el periodo de 22 a 23 h. Los respectivos tiempos
a
de acceso en minutos fueron los siguientes:
De 22 a 23 h.
De 14 a 15 h.
1.6 1.8
0.8 1.1
107