Anda di halaman 1dari 111

Prcticas de Estad

a
stica
con
Statgraphics Plus
Dpto. de Estad
stica e I.O.
Universidad de Granada
15 de abril de 2008

ii


Indice general
Introduccin
o

1. Introduccin al Statgraphics Plus


o
1.1. El entorno de Statgraphics Plus . . . . . . . . . .
1.1.1. Entorno de trabajo de Statgraphics . . . .
1.2. Opciones de la barra de men principal . . . . . .
u
1.3. Editor de datos . . . . . . . . . . . . . . . . . . .
1.3.1. Introduccin directa de datos . . . . . . .
o
1.3.2. Introduccin de datos desde un chero . .
o
1.3.3. Modicacin de los datos . . . . . . . . . .
o
1.4. Ventana de anlisis . . . . . . . . . . . . . . . . .
a
1.5. Ejemplo de introduccin de datos en Statgraphics
o
1.6. Ejercicios . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

2. Variables estad
sticas unidimensionales
2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . .
o
2.2. Tabla de frecuencias y representacin de variables discretas .
o
2.2.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . .
a
2.3. Tabla de frecuencias y representacin de variables continuas
o
2.3.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . .
a
2.4. Representacin de variables cualitativas . . . . . . . . . . . .
o
2.4.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . .
a
3. S
ntesis numrica de una variable estad
e
stica
3.1. Introduccin . . . . . . . . . . . . . . . . . . .
o
3.2. Medidas de posicin, dispersin y forma . . .
o
o
3.2.1. Ejemplo prctico . . . . . . . . . . . .
a
3.3. Ejercicios . . . . . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.

3
3
3
8
17
18
19
19
22
23
27

.
.
.
.
.
.
.

29
29
29
30
34
34
39
39

.
.
.
.

43
43
43
44
54

4. Distribuciones estad
sticas bidimensionales
55
4.1. Distribuciones bidimensionales de frecuencias . . . . . . . . . . . . . . . . . 55
4.1.1. Ejemplo prctico . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
a
iii


INDICE GENERAL
4.2. Distribuciones condicionadas . . . . . . . .
4.2.1. Ejemplo prctico . . . . . . . . . .
a
4.3. Ejercicios . . . . . . . . . . . . . . . . . .
4.4. Anlisis bidimensional de datos categricos
a
o
4.4.1. Ejemplo prctico . . . . . . . . . .
a
4.5. Procedimiento Tabulacin Cruzada . . . .
o
4.5.1. Tabla de frecuencias . . . . . . . .
4.5.2. Test de la 2 . . . . . . . . . . . .
4.6. Procedimiento Tablas de Contingencia . .
4.6.1. Ejemplo prctico . . . . . . . . . .
a
4.7. Ejercicios . . . . . . . . . . . . . . . . . .
5. Regresin y Correlacin
o
o
5.1. Introduccin . . . . . . . . . . .
o
5.2. Regresin lineal simple . . . . .
o
5.2.1. Ejemplo prctico . . . .
a
5.2.2. Predicciones . . . . . . .
5.2.3. Comparacin de Modelos
o
5.2.4. Residuos At
picos . . . .
5.3. Regresin no Lineal . . . . . . .
o
5.4. Opciones Grcas . . . . . . . .
a
5.5. Ejercicios . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
Alternativos
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .

6. Algunas distribuciones de probabilidad


6.1. Introduccin . . . . . . . . . . . . . . .
o
6.2. Funciones de distribucin . . . . . . . .
o
6.3. Inversa de la funcin de distribucin .
o
o
6.4. Opciones grcas . . . . . . . . . . . .
a
6.5. Ejemplos prcticos . . . . . . . . . . .
a
6.6. Ejercicios . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

conocidas
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .

7. Estimacin
o
7.1. Introduccin . . . . . . . . . . . . . . . . .
o
7.2. Intervalos de conanza para una muestra .
7.2.1. Ejemplo prctico . . . . . . . . . .
a
7.3. Intervalos de conanza para dos muestras .
7.3.1. Ejemplo prctico . . . . . . . . . .
a
7.4. Ejercicios . . . . . . . . . . . . . . . . . .

iv

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

60
60
62
63
63
64
66
67
68
68
70

.
.
.
.
.
.
.
.
.

71
71
72
72
75
75
76
76
77
79

.
.
.
.
.
.

83
83
85
85
86
87
95

.
.
.
.
.
.

97
97
97
99
101
103
106

Introduccin
o
El contenido de este guin de prcticas se orienta a la presentacin de las tcnicas de
o
a
o
e
anlisis estad
a
stico de una forma sencilla de entender a travs del programa Statgraphics
e
Plus 5.1.
Hoy en d se utiliza la estad
a
stica en diferentes campos de la ciencia, desde la econom
a,
las nanzas, la ingenier la matemtica en general, hasta la sociolog la psicolog la
a,
a
a,
a,
biolog la medicina, etc. Lo esencial para empezar a trabajar en estad
a,
stica, sea cual sea
el campo en que se aplique, es la comprensin de los propios conceptos estad
o
sticos, tarea
que no exige el dominio del aparato matemtico. Posteriormente, cuando ya sea necesaria
a
la operatoria avanzada, los programas de ordenador permiten obtener los resultados sin
necesidad de descifrar el desarrollo matemtico de los algoritmos que estn debajo de los
a
a
procedimientos estad
sticos.
Cada una de las prcticas que se incluyen comienza con una breve introduccin teria
o
o
ca sobre los mtodos estad
e
sticos a utilizar para, a continuacin, presentar las diferentes
o
opciones que aporta el programa para abordar dichos mtodos, aplicndolas a casos prctie
a
a
cos.


INDICE GENERAL

Prctica 1
a
Introduccin al Statgraphics Plus
o
1.1.

El entorno de Statgraphics Plus

Hoy en d es imposible trabajar en estad


a
stica sin el apoyo de un ordenador, m
nimo
de una calculadora. No obstante, es estrictamente necesario conocer los conceptos estad
sticos, su metodolog y sus aplicaciones. La combinacin de una buena metodolog
a
o
a,
prcticas y aplicaciones informticas producen como resultado la optimizacin de la aplia
a
o
cacin de los mtodos estad
o
e
sticos en la prctica.
a
El programa Statgraphics se trata de un softwar estad
a
stico considerado actualmente
como estndar, tanto en el entorno universitario como en el profesional. A pesar de las
a
dicultades de los procedimientos estad
sticos, Statgraphics los presenta de tal forma que
resultan inteligibles a primera vista sin necesidad de conocimientos muy profundos en
la materia. El programa incluye las tcnicas estad
e
sticas bsicas, modelos lineales y no
a
lineales, anlisis multivariante, series temporales, etc.
a
Comenzando con Statgraphics en Windows
Para empezar a trabajar con el programa se tiene que seleccionar la siguiente ruta en el
men de Windows:
u
Inicio / Programas / Statgraphics Plus 5.1 / Sgwin

1.1.1.

Entorno de trabajo de Statgraphics

La pantalla StatWizard
Al ejecutar el programa se presenta la pantalla StatWizard (Figura 1.1), cuya nalidad es
ofrecer ayuda sobre el tema que el usuario seleccione. En esta ventana puede elegirse la
opcin de que no vuelva a aparecer al arrancar el programa, quitando la seal que aparece
o
n
en el campo Mostrar StatWizard al Iniciar.
3

1.1. El entorno de Statgraphics Plus

Figura 1.1: Pantalla StatWizard.


La ventana de aplicacin
o
Es el marco de trabajo del programa (Figura 1.2).
En la l
nea superior de esta ventana est el icono de Statgraphics y el nombre del
a
programa, seguido del nombre del chero con el que se trabaja en ese momento (Figura
1.3).

Figura 1.3: Icono del programa y nombre del chero abierto.


La siguiente l
nea corresponde a la Barra de men (Figura 1.4), que contiene el
u
men general de la aplicacin con todas sus opciones.
u
o
4

Prctica 1. Introduccin al Statgraphics Plus


a
o

Figura 1.2: Pantalla de aplicacin.


o

Figura 1.4: Barra de men.


u
La tercera l
nea corresponde a la Barra de herramientas (Figura 1.5) que contiene diferentes iconos que permiten el acceso rpido a las opciones ms comunes sin necesidad de
a
a
acudir al men general. El signicado de cada icono se identica dinmicamente situando
u
a
el ratn sobre el propio icono.
o

Figura 1.5: Barra de herramientas.

1.1. El entorno de Statgraphics Plus


A continuacin se describen cada uno de estos iconos:
o
Abrir Statfolio

Guardar Statfolio

Abrir chero de datos existente

Guardar chero de datos actual

Cortar seleccin
o

Copiar seleccin
o

Pegar lo copiado en la seleccin


o

Deshacer la ultima accin

Imprimir la pantalla actual

Vista preliminar de la impresin actual


o

Grco de dispersin
a
o

Grco de caja y bigotes


a

Histograma

Estad
sticos: Resumen estad
stico

Regresin mltiple
o
u

Grco de medias y rangos


a

Anlisis de la capacidad
a

Prediccin de series temporales


o

Abrir chero de diseo


n

Anlisis cluster
a

Modelo lineal general

StatAdvisor: Intrprete de resultados


e

StatWizard: Ayuda estad


stica
Ayuda general
En el centro de la pantalla de aplicacin se encuentra el Editor de datos (Figura 1.6),
o
desde el que se pueden introducir las observaciones . Es similar a una hoja de clculo cuyas
a
columnas sern las variables utilizadas en los anlisis estad
a
a
sticos. El conjunto de todas
las columnas (variables) forma un chero. Cuando se tiene activo un chero, el nombre
de este aparece en la parte superior de esta ventana.

Figura 1.6: Editor de datos.

En la parte inferior de la pantalla de aplicacin se muestra la Barra de tareas (Figura


o
1.7) que incluye cuatro iconos de los que surgen las siguientes ventanas:
6

Prctica 1. Introduccin al Statgraphics Plus


a
o

Figura 1.7: Barra de tareas.


La ventana StatAdvisor (Figura 1.8)
En esta ventana aparece una interpretacin de los resultados obtenidos despus de haber
o
e
ejecutado un procedimiento.

Figura 1.8: Ventana StatAdvisor.

La ventana StatGallery (Figura 1.9)


La ventana StatGallery se utiliza para realizar presentaciones de grcos a medida. Los
a
grcos obtenidos en las salidas de los procedimientos pueden colocarse en esta ventana
a
para una posterior presentacin ptima de los mismos.
o o

Figura 1.9: Ventana StatGallery.

La ventana StatReporter (Figura 1.10)


La ventana StatReporter permite generar informes que contienen texto, grco o anlisis
a
a
estad
sticos
La ventana de comentarios (Figura 1.11)
Bloc de notas para introducir comentarios sobre el Statfolio activo.
7

1.2. Opciones de la barra de men principal


u

Figura 1.10: Ventana StatReporter.

Figura 1.11: Ventana de comentarios.

1.2.

Opciones de la barra de men principal


u

A continuacin se explica la nalidad de las distintas opciones que aparecen en la Barra


o
de men del programa (Figura 1.4).
u
La opcin Archivo de la Barra de men principal presenta las siguientes opciones:
o
u
Abrir StatFolio... (abrir macro)
Abrir Datos... (abrir chero de datos)
Abrir StatGallery... (abrir StatGallery)
Abrir StatReport... (abrir StatReport)
Info. Base de Datos (ODBC)... (abrir consulta a base de datos)
Leer Portapapeles... (leer el contenido actual del portapapeles)
Cerrar StatFolio (cerrar la macro actual)
Cerrar Datos (cerrar el chero de datos actual)
8

Prctica 1. Introduccin al Statgraphics Plus


a
o
Cerrar StatGallery (cerrar StatGallery)
Cerrar StatReport... (cerrar StatReport)
Guardar StatFolio (guardar macro)
Guardar Datos (guardar el chero de datos actual)
Guardar StatGallery (guardar StatGallery)
Guardar StatReport... (guardar StatReport)
Guardar StatFolio Como... (guardar macro con otro nombre)
Guardar Datos Como... (guardar el chero con otro nombre)
Guardar StatGallery Como... (guardar StatGallery con otro nombre)
Guardar StatReport Como... (guardar StatReport con otro nombre)
StatLink (enlazar con un origen de datos)
Imprimir... (imprimir el contenido de la ventana actual)
Vista Previa... (vista preliminar)
Conguracin de impresin... (denir las caracter
o
o
sticas de impresin)
o
Conguracin de pgina... (denir las caracter
o
a
sticas de pgina)
a
Guardar Grco... (guardar grco)
a
a
StatPublish... (editar la macro actual en formato HTML)
Vista de resultados editados... (ver macro editada)
Combinar StatFolios... (combinar distintas macros)
Combinar Datos... (combinar distintos cheros)
Enviar (enviar documento)
V
nculos... (editar objetos vinculados)
Salir de Statgraphics (salir del programa)
La opcin Edicin de la Barra de men principal presenta las siguientes opciones:
o
o
u
Deshacer (deshacer la ultima opcin)

o
9

1.2. Opciones de la barra de men principal


u
Cortar (cortar la seleccin)
o
Copiar (copiar la seleccin)
o
Pegar (pegar la seleccin)
o
Pegar V
nculo (insertar contenido del bloc de notas y un v
nculo a su fuente)
Pegado Especial (insertar el contenido del bloc de notas con opciones)
Preferencias... (preferencias grcas y del sistema)
a
Cambiar Fuente... (cambiar la fuente del texto)
Cambiar T
tulo de Anlisis... (cambiar el t
a
tulo de un anlisis)
a
Copiar Anlisis (copiar un anlisis)
a
a
Insertar (insertar el contenido del portapapeles)
Borrar (borrar la seleccin)
o
Actualizar Frmulas (actualizar frmulas)
o
o
Modicar Columna... (modicar columna)
Generar Datos... (generar nuevos datos)
Recodicar Datos... (recodicar datos)
Ordenar Datos... (ordenar chero)
La opcin Grcos de la Barra de men principal presenta las siguientes opciones:
o
a
u
Grcos de Dispersin (grcos de dispersin de datos)
a
o
a
o
Grco Unidimensional... (grcos unidimensionales)
a
a
Grco X-Y... (grco bidimensional)
a
a
Grco X-Y-Z... (grco tridimensional)
a
a
Grco de Matriz... (grcos matriciales)
a
a
Grco X-Y M ltiple... (grco mltiple bidimensional)
a
u
a
u
Grco X-Y-Z M ltiple... (grco mltiple tridimensional)
a
u
a
u
Grco de Coordenadas Polares... (grco en coordenadas polares)
a
a
Grcos Exploratorios (grcos exploratorios de datos)
a
a
10

Prctica 1. Introduccin al Statgraphics Plus


a
o
Grco de Caja y Bigotes... (grco de caja y bigotes)
a
a
Grco de Caja y Bigotes M ltiple... (grco mltiple de caja y bigotes)
a
u
a
u
Grco Normal de Probabilidad... (grco probabil
a
a
stico normal)
Histograma... (histograma de frecuencias)
Diagrama de Puntos... (diagrama de puntos)
Diagrama de Puntos M ltiple... (diagrama de puntos mltiple)
u
u
Grco de Burbujas... (grco de burbujas)
a
a
Grco Radar/Ara a... (diagrama radar/araa)
a
n
n
Diagramas de Presentacin (grcos de presentacin)
o
a
o
Diagrama de Barras... (grco de barras)
a
Diagrama de Barras M ltiple... (grco de barras mltiple)
u
a
u
Diagrama de Sectores... (grco de sectores)
a
Grco L
a
nea de Componentes... (grco de l
a
neas)
Grco Alto-Bajo-Prximo... (grcos sobre tiempo)
a
o
a
Distribuciones de Probabilidad... (distribuciones de probabilidad)
Supercies de Respuesta... (grcos de supercie de respuesta)
a
Grcos a Medida... (grco a medida del usuario)
a
a
La opcin Descripcin de la Barra de men principal presenta las siguientes opciones:
o
o
u
Datos Numricos (datos de variables numricas)
e
e
Anlisis Unidimensional... (anlisis de una variable)
a
a
Anlisis Multidimensional... (anlisis de varias variables)
a
a
Anlisis de Subgrupo... (anlisis de subconjuntos de datos)
a
a
Estad
sticos por Filas... (estad
sticas por las)
Transformacin de Potencia... (transformaciones de Box-Cox)
o
L
neas de Tolerancia Estad
stica... (tolerancia 3)
Identicacin de Valores At
o
picos... (valores at
picos en series)
Datos Cualitativos (datos de variables categricas)
o
Tabulacin... (tabulacin)
o
o
Tabulacin Cruzada... (tabulacin cruzada)
o
o
11

1.2. Opciones de la barra de men principal


u
Tablas de Contingencia... (tablas de contingencia)
Distribuciones (distribuciones)
Distribuciones de Probabilidad... (distribuciones de probabilidad)
Grcos de Probabilidad... (grcos de probabilidad)
a
a
Ajuste de Distribuciones (Datos no Censurados)... (ajuste sin censura)
Ajuste de Distribuciones (Datos Censurados)... (ajuste con censura)
Datos de Vida (tablas de vida)
Tablas de Vida (Intervalos)... (tablas de vida por intervalos)
Tablas de Vida (Tiempos)... (tablas de vida puntuales)
Anlisis Weibull... (anlisis de Weibull)
a
a
Grcos Arrhenius... (grcos de Arrhenius)
a
a
Contrastes de Hiptesis... (contrastes de hiptesis)
o
o
Determinacin del Tama o de la Muestra... (clculo del tamao de muestra)
o
n
a
n
La opcin Comparacin de la Barra de men principal presenta las siguientes opo
o
u
ciones:
Dos Muestras (anlisis con dos muestras)
a
Comparacin de Dos Muestras... (comparacin para dos muestras)
o
o
Comparacin de Muestras Pareadas... (comparacin para muestras pao
o
readas)
Contraste de Hiptesis... (contrastes de hiptesis)
o
o
Determinacin del Tama o de Muestra... (clculo del tamao de mueso
n
a
n
tra)
Muestras M ltiples (anlisis con mltiples muestras)
u
a
u
Comparacin de Varias Muestras... (comparacin para varias muestras)
o
o
Comparacin de Proporciones... (comparacin para proporciones)
o
o
Comparacin de Tasas... (comparacin para tasas de casos)
o
o
Anlisis de la Varianza (anlisis de la varianza)
a
a
Grcos de Medias Factorial (grcos factoriales para medias)
a
a
12

Prctica 1. Introduccin al Statgraphics Plus


a
o
ANOVA Simple... (anlisis de la varianza simple)
a
ANOVA Factorial... (anlisis de la varianza mltiple)
a
u
Componentes de la Varianza... (componentes de la varianza)
La opcin Dependencia de la Barra de men principal presenta las siguientes opo
u
ciones:
Regresin Simple... (anlisis de regresin simple)
o
a
o
Regresin Polinomial... (anlisis de regresin polinomial)
o
a
o
Transformaciones Box-Cox... (transformaciones de Box-Cox de una serie)
Regresin M ltiple... (anlisis de regresin mltiple)
o
u
a
o
u
La opcin Avanzado de la Barra de men principal presenta las siguientes opciones:
o
u
Control de Calidad (tcnicas de control de calidad)
e
Anlisis de Pareto (anlisis de Pareto)
a
a
Anlisis de Capacidad de Proceso (anlisis de capacidad de un proceso)
a
a
Grcos de Control por Variables (grcos de control por variables)
a
a

X-bar y R (grcos de recorridos o rangos)


a
X-bar y S (grcos de desviaciones t
a
picas)
X-bar y S-cuadrado (grcos de varianzas)
a
Individuales (grcos de valores individuales)
a

Grcos de Control por Atributos (grcos de control por atributos)


a
a

Grco
a
Grco
a
Grco
a
Grco
a

p (grcos de proporcin de unidades defectuosas)


a
o
np (grcos de nmero de unidades defectuosas)
a
u
u (grcos de nmero de defectos por unidad)
a
u
c (grcos de nmero de defectos)
a
u

Grcos de Tiempo Ponderados (grcos de tiempo ponderados)


a
a
Grco de Medias Mviles (grco de medias mviles)
a
o
a
o
Grco de Medias Mviles Individuales (grco de medias mviles
a
o
a
o
individuales)
Grco EWMA (grco exponencial ponderado de medias mviles)
a
a
o
Grco EWMA Individuales (grco exponencial ponderado de mea
a
dias mviles individuales)
o
Grco CuSum (V-Mscara) (grcos de sumas acumulativas)
a
a
a
13

1.2. Opciones de la barra de men principal


u
Grco CuSum Individuales (V-Mscara) (grcos de sumas acua
a
a
mulativas individuales)
Grco CuSum (H-K)... (grcos de sumas acumulativas H-K)
a
a
Grco CuSum Individuales (H-K)... (grcos de sumas acumulativas
a
a
individuales H-K)
Grcos Multivariable (grcos de control multivariable)
a
a
Grcos de Control con Propsito Especial (grcos de control espea
o
a
ciales)
Grcos ARIMA... (grcos ARIMA segn Box-Jenkins)
a
a
u
Grcos ARIMA Individuales... (grcos ARIMA segn Box-Jenkins
a
a
u
individuales)
Grcos Toolwear... (grcos de desgaste)
a
a
Grcos Toolwear Individuales... (grcos de desgaste individuales)
a
a
Grcos de Aceptacin... (grcos de aceptacin)
a
o
a
o
Grcos de Aceptacin Individuales... (grcos de aceptacin india
o
a
o
viduales)
Medida R&R (medida de la repetibilidad y reproductividad)

Conguracin Datos (instalacin de datos)


o
o
Mtodo Media y Rango (mtodo media y rango)
e
e
Mtodo ANOVA (mtodo del anlisis de la varianza)
e
e
a
Mtodo Rango (mtodo del rango)
e
e

Grcos a Medida (grcos a medida)


a
a
Diagrama de Espina de Pescado... (grcos de causa-efecto)
a
Aceptacin de la Muestra (muestreo de aceptacin)
o
o
Atributos... (muestreo de aceptacin por atributos)
o
Variables... (muestreo de aceptacin por variables)
o
Grco Multi-Vari... (grco multivariable)
a
a
Dise o Experimental (diseo de experimentos)
n
n
Crear Dise o... (crear diseo)
n
n
Optimizar Dise o... (optimizar diseo)
n
n
Abrir Dise o... (abrir diseo)
n
n
Analizar Dise o... (analizar diseo)
n
n
Aumentar Dise o... (aumentar diseo)
n
n
14

Prctica 1. Introduccin al Statgraphics Plus


a
o
Optimizar Respuesta M ltiple... (optimizar diseo de respuesta mltiple)
u
n
u
Anlisis Series Temporales (anlisis de series temporales)
a
a
Mtodos Descriptivos... (mtodos descriptivos)
e
e
Suavizado... (suavizado)
Descomposicin Estacional... (descomposicin estacional)
o
o
Prediccin... (prediccin)
o
o
Prediccin Automtica... (prediccin automtica)
o
a
o
a
Mtodos Multivariables (mtodos multivariantes)
e
e
Componentes Principales... (componentes principales)
Anlisis Factorial... (anlisis factorial)
a
a
Anlisis Cluster... (anlisis cluster)
a
a
Anlisis Discriminante... (anlisis discriminante)
a
a
Correlaciones Cannicas... (correlacin cannica)
o
o
o
Regresin Avanzada (regresin avanzada)
o
o
Modelos Lineales Generales... (ajustes a modelos lineales generales)
Modelos de Calibracin... (ajustes de modelos de calibracin)
o
o
Comparacin de Rectas de Regresin... (comparacin de modelos)
o
o
o
Seleccin del Modelo de Regresin... (seleccin de modelos ptimos)
o
o
o
o
Regresin no Lineal... (regresin con modelos no lineales)
o
o
Regresin en Cadena... (regresin en cadena)
o
o
Regresin Log
o
stica... (regresin log
o
stica)
Regresin Probit... (ajuste del modelo Probit)
o
Regresin de Poisson... (ajuste de modelos de Poisson)
o
Regresin de Datos de Vida... (regresin de Box-Cox)
o
o
La opcin SnapStats!! de la Barra de men principal presenta las siguientes opciones,
o
u
que corresponden a los procedimientos estad
sticos ms comunes y sencillos que se utilizan
a
en Statgraphics. Su nalidad es acceder de forma rpida sin tener que desdoblar mens:
a
u
Anlisis Una Muestra
a
Comparacin Dos Muestras
o
15

1.2. Opciones de la barra de men principal


u
Comparacin Muestras Pareadas
o
Comparacin Muestras M ltiples
o
u
Ajuste de la Curva
Valoracin de Capacidad (Individuales)
o
Valoracin de Capacidad (Datos Agrupados)
o
Medida R&R
Prediccin Automtica
o
a
La opcin Ver de la Barra de men principal presenta las siguientes opciones:
o
u
Barra de Herramientas (activa y desactiva la barra de herramientas)
Barra de Estado (activa y desactiva la barra de estado)
StatAdvisor (activa y desactiva el intrprete de resultados)
e
La opcin Ventana de la Barra de men principal presenta las siguientes opciones:
o
u
Cascada (cascada)
Mosaico (mosaico)
Organizar Iconos (organizar iconos)
Restablecer Ventanas (restablecer ventanas a la forma por defecto)
Evaluacin de Expresin (evaluacin de expresiones)
o
o
o
La opcin Help de la Barra de men principal presenta las siguientes opciones:
o
u

Indice (contenidos)
Conocer el Programa (aprendiendo el programa)
Accediendo y Usando Ficheros (acceso y uso de cheros)
Datos y Hojas de Datos (datos y hojas de datos)
Grcos y Opciones Grcas (grcos y opciones grcas)
a
a
a
a
Imprimiendo (impresin)
o
Publicacin Web (obtener un chero html de resultados)
o
16

Prctica 1. Introduccin al Statgraphics Plus


a
o
Caracter
sticas Especiales (caracter
sticas especiales)
Anlisis de Edicin Estndar (edicin estndar de los anlisis)
a
o
a
o
a
a
Utilizando Anlisis Avanzados (uso de los anlisis avanzados)
a
a
Anlisis para Control de Calidad (anlisis de control de calidad)
a
a
Anlisis para Dise o de Experimentos (anlisis de diseo de experimena
n
a
n
tos)
Anlisis para Regresin Avanzada (anlisis de regresin avanzada)
a
o
a
o
Anlisis para Mtodos Multivariables (anlisis de mtodos multivariana
e
a
e
tes)
Anlisis para Series Temporales (anlisis de series temporales)
a
a
Informacin de Referencia (informacin referenciada)
o
o
Soporte Tcnico (soporte tcnico)
e
e
Acceso a Manuales On-Line
Acceso a Fichero Notas en Leeme
Adquiere STATGRAPHICS Ahora
Noticias STATGRAPHICS
Aprendiendo STATGRAPHICS
StatWizard... (activa la ventana StatWizard )
Acerca de... (sobre Statgraphics 5.1.)

1.3.

Editor de datos

Para realizar cualquier anlisis estad


a
stico, en primer lugar, hay que disponer de algunos

datos con los que trabajar. Estos se pueden obtener de varias formas:
1. Introduccin directa de los datos.
o
2. Exportarlos desde un archivo.
3. Modicar algunos datos ya introducidos.
17

1.3. Editor de datos

1.3.1.

Introduccin directa de datos


o

Para introducir directamente los datos, se escriben los valores en el editor de datos, como
si fuera una hoja de clculo, teniendo en cuenta que:
a
1. Cada la ser un individuo y cada columna una variable. Por ejemplo, si se tiene
a
una encuesta que conste de 10 preguntas realizadas a 1000 individuos, esto ser un
a
chero de datos en forma matricial de 10 columnas y 1000 las. Para pasar de un
individuo a otro se pulsa el botn ENTER y para pasar de una variable a otra el
o

botn TABULACION.
o
2. Por defecto el programa solo permite la introduccin de valores numricos.
o
e
3. Para modicar alguna de las caracter
sticas de las variables con las que vamos a
trabajar:
Se selecciona la variable deseada.
Se pulsa el botn derecho del ratn.
o
o
Y se selecciona de la ventana la opcin Modicar Columna...
o
Se genera un cuadro de dialogo en el que es posible cambiar el nombre de la variable,
introducir un comentario, modicar el ancho de la columna as como el tipo de dato

con el se va a trabajar.

Figura 1.12: Opciones de las variables.

18

Prctica 1. Introduccin al Statgraphics Plus


a
o

1.3.2.

Introduccin de datos desde un chero


o

En este caso se elige el siguiente men:


u
Archivo / Abrir / Abrir Datos
Se selecciona el chero y la extensin del archivo que deseemos abrir:
o
1. Si el archivo tiene extensin SG PLUS le, se abre directamente.
o
2. Si se selecciona un chero procedente de Excell, se tiene que indicar si el nombre de
las variables aparece en la primera la o las genera el programa automticamente,
a
y si existe algn valor que ha sido asignado a los valores perdidos.
u
3. Si el archivo es de tipo ASCII, adems de indicar si el nombre de las variables
a
aparece en la primera la del archivo y si existe un cdigo para los valores perdidos,
o
se debe seleccionar el tipo de separacin entre las variables (por tabulador, por un
o
espacio en blanco, por comas o por algn formato).
u

1.3.3.

Modicacin de los datos


o

Una vez creado un chero de datos, este se puede modicar. Para ello se selecciona la
variable a modicar y se pulsa el botn derecho del ratn.
o
o

Figura 1.13: Modicacin de datos.


o
Adems de realizar las tareas propias de edicin (insertar, copiar o cortar las variables),
a
o
Statgraphics permite realizar una serie de modicaciones. A continuacin se comentan
o
algunas de ellas:
19

1.3. Editor de datos


1. Deshacer : Deshacer la ultima accin

o
2. Cortar : Cortar
3. Copiar : Copiar
4. Pegar : Pegar
5. Pegar Enlace: Pegar con v
nculo a su fuente
6. Insertar : Insertar
7. Borrar : Borrar
8. Modicar Columna: Eleccin de las opciones de la variable
o
9. Generar Datos: Generar datos. En esta nueva ventana podemos realizar operaciones
que nos proporcionaran nuevas variables con los resultados de las mismas. Estas
operaciones pueden ser de tipo lgico (<, >, , ,and,or), de tipo aritmtico (+,o
e
,*,/)o mediante alguno de los operadores que tiene implementado el programa. Una
vez elegido el operador, tendremos que completar los parmetros de los que depende
a
y que aparecen con ?. Por ejemplo, si existe una variable que se llama ingresos y

Figura 1.14: Generar datos.


se quiere calcular su valor absoluto, hay que hacer ABS(ingresos). Si existen varios
signos de interrogacin ser que esa operacin requiere de varios parmetros en
o
a
o
a
cuyo caso se sustituye cada signo de interrogacin por un parmetro y se separan
o
a
por puntos y comas.
20

Prctica 1. Introduccin al Statgraphics Plus


a
o
10. Recodicar Datos: Recodicar los valores de una variable. Se asignan nuevos valores
a todos los comprendidos en un intervalo, teniendo que indicar las condiciones de
los l
mites de esos intervalos, es decir, si los extremos se consideran dentro o fuera
del intervalo.

Figura 1.15: Recodicacin de datos.


o

11. Ordenar Fichero: Permite ordenar los datos de modo ascendente o descendente, de
modo que al ordenar el chero segn una variable, modica el resto de variables para
u
que no se pierda la coherencia del chero. Tambin permite introducir una segunda
e
variable de orden para los casos en los que en la primera exista el mismo valor.

Figura 1.16: Ordenador datos.

21

1.4. Ventana de anlisis


a

1.4.

Ventana de anlisis
a

Despus de ejecutar cualquier procedimiento estad


e
stico de Statgraphics, el programa
presenta una ventana de anlisis (Figura 1.17), en la que se muestran los resultados.
a

Figura 1.17: Ventana de anlisis.


a
En esta ventana se observan tres zonas esenciales:
1. La barra de icono y t
tulo del anlisis. Presenta el nombre del procedimiena
to estad
stico cuyos resultados se muestran en la ventana de anlisis. Adems se
a
a
muestra el nombre de la variable que se analiza.
2. La barra de herramientas del anlisis. Presenta una sucesin de iconos que van
a
o
a posibilitar las diferentes opciones de trabajo del anlisis actual.
a
Introducir Texto. Reabre la ventana de dialogo que presenta las variables del chero activo, permitiendo as la eleccin de nuevas variables o pro
o
cedimientos para el anlisis.
a
Opciones Tabulares. Se utiliza para presentar todas las posibles subopciones con resultados anal
ticos que permite el procedimiento activo.
Opciones Grcas. Se utiliza para presentar todas las posibles subopa
ciones con resultados grcos que permite el procedimiento activo.
a
22

Prctica 1. Introduccin al Statgraphics Plus


a
o

Guardar Resultados. Se utiliza para guardar los resultados numricos


e
del anlisis estad
a
stico en variables cuyo nombre se indica en la pantalla correspondiente.
A adir Texto. Para aadir texto a un grco.
n
n
a
Separar Puntos. Para separar puntos en las zonas densas de un grco.
a
Resaltar Puntos. Resalta los puntos de una zona sealada.
n
Suavizar/Rotar. Rotacin de un grco 3D.
o
a
Identicar. Identica puntos de un grco.
a
Excluir. Excluye puntos de un grco.
a
Localiza puntos de un grco por nombre.
a
Localiza puntos de un grco por etiqueta.
a
3. La ventana de salida de resultados. Se sita debajo de la barra de herramientas
u
de anlisis y se divide en dos zonas. La zona de la izquierda presenta los resultados
a
del anlisis estad
a
stico y la zona de la derecha los resultados grcos, si existen.
a
Pulsando dos veces con el ratn sobre alguna de ellas se maximizan. Para volver al
o
tamao original, se vuelve a hacer click dos veces el ratn.
n
o
A su vez, si en en la parte de resultados se pulsa el botn de la derecha aparecen dos
o
opciones ms:
a
1. Opciones de Ventana. Ofrece ms opciones de ese mismo anlisis.
a
a
2. Opciones de Anlisis. Proporciona opciones generales del anlisis.
a
a

1.5.

Ejemplo de introduccin de datos en Statgrao


phics

A continuacin se explica, paso a paso, mediante un ejemplo, como introducir un conjunto


o
de datos en Statgraphics.
Sea el siguiente conjunto de observaciones, que representan el sueldo diario y d
as
trabajados de los trabajadores de distintas ncas de una cooperativa agr
cola:
23

1.5. Ejemplo de introduccin de datos en Statgraphics


o
Nombre
Francisco Lpez
o
Sonia Ruiz
Rafael Len
o
Luc Lara
a
Dolores Milln
a
Antonio Cano
Manuel Cano
Juan Ariza
Diego Giron
Julio Villar
Carmen Prez
e
Eva Morn
o
Isabel Lpez
o
Francisco Molina
Luisa Giron
Antonio Lpez
o
Luis Paz
Mar Reyes Garc
a
a
Luc Mart
a
nez
Rafael Trechera
Diego Delgado
Tamara Lpez
o
Fernando Guerrero
Andrea Garc
a
Francisco Espada
Teresa Gimenez
Alberto Requena
Roc Cobo
o
Mar Luisa Yllera
a
Salud Montero

Finca Sueldo
Finca 1
40,5
Finca 2
30
Finca 3
30
Finca 4
40,5
Finca 1
30
Finca 3
30
Finca 2
40,5
Finca 2
30
Finca 4
30
Finca 3
40,5
Finca 1
30
Finca 1
30
Finca 2
30
Finca 4
30
Finca 4
30
Finca 2
30
Finca 3
30
Finca 4
30
Finca 1
30
Finca 3
40,5
Finca 1
30
Finca 4
40,5
Finca 2
30
Finca 1
30
Finca 4
40,5
Finca 3
30
Finca 3
30
Finca 4
40,5
Finca 2
40,5
Finca 2
30

D
as
30
68
13
95
30
39
17
68
114
91
15
15
153
57
76
34
52
57
15
13
30
38
17
15
57
52
65
76
17
17

Para introducir los datos se comienza deniendo las columnas con el nombre de las
variables y el tipo de dato. Para ello se pincha con el botn secundario del ratn sobre
o
o
cada columna y se elige la opcin Modicar Columna... y se introducen los nombres y
o
tipo de las variables (Cuadro 1.1).
24

Prctica 1. Introduccin al Statgraphics Plus


a
o

Cuadro 1.1: Denicin de variables.


o
25

1.5. Ejemplo de introduccin de datos en Statgraphics


o
A continuacin, se introducen los datos en las casillas correspondientes (ver la Figura
o
1.18).

Figura 1.18: Pantalla de edicin de datos.


o
Para nalizar la introduccin de datos se guarda el chero en el directorio de trabajo
o
seleccionando la opcin Archivo / Guardar Como / Guardar Datos Como.... La
o
extensin de los cheros de Statgraphics es .sf3.
o

26

Prctica 1. Introduccin al Statgraphics Plus


a
o

1.6.

Ejercicios

1. Introducir los siguientes datos:


peso altura edad
sexo
75
173
21
hombre
81
172
22
hombre
56
136
22
mujer
68
180
21
mujer
79
182
24
hombre
89
185
24
hombre
62
157
21
hombre
59
165
22
mujer
83
180
23
hombre
55
160
22
mujer
72
174
21
hombre
56
161
23
mujer

27

1.6. Ejercicios

28

Prctica 2
a
Variables estad
sticas
unidimensionales
En Estad
stica la informacin se recoge en variables. Estas variables se organizan de
o
forma ordenada y se almacenan en cheros. Posteriormente ser posible operar con estas
a
variables y aplicar funciones a las mismas para realizar las transformaciones y los anlisis
a
estad
sticos que se desee.

2.1.

Introduccin
o

Las variables estad


sticas se dividen en variables cuantitativas (contienen datos numrie
cos) y cualitativas (contienen datos categricos no cuanticables). A su vez, las variables
o
cuantitativas pueden ser discretas y continuas.
Una variable es discreta cuando toma una cantidad nita o numerable de valores
aislados y es continua cuando toma una innidad no numerable de valores.
En este cap
tulo se ver como organizar y representar los datos contenidos en una unica
a

variable, y se habla, por tanto, de variable estad


stica unidimensional. Se explicar cmo
a o
calcular su tabla de frecuencias, as como la forma de obtener distintas representaciones

grcas.
a

2.2.

Tabla de frecuencias y representacin de variao


bles discretas

La opcin Descripcin / Datos Cualitativos / Tabulacin... permite el clculo de


o
o
o
a
la tabla de frecuencias (conjunto de los valores que presenta la variable junto con sus
frecuencias: frecuencia absoluta, relativa, absoluta acumulada y relativa acumulada) de
una variable estad
stica discreta, as como su representacin mediante un diagrama de

o
barras.
29

2.2. Tabla de frecuencias y representacin de variables discretas


o

Figura 2.1: Men tabulacin.


u
o

2.2.1.

Ejemplo prctico
a

Las notas de Matemticas de un grupo de personas han sido las siguientes:


a
5
7

3 4
1 0

1 2
1 5

8
9

9 8
9 8

7 6
0 8

6
8

7 9
8 9

8 7
5 7

Realizar la tabla de frecuencias y representacin grca correspondiente a estos datos.


o
a
Se detallan los pasos a seguir:
1. En primer lugar se dene la variable nota y se introducen los datos.

Figura 2.2: Ejemplo de introduccin de datos de una variable discreta.


o

2. Se selecciona en el Men principal la opcin Descripcin / Datos Cualitativos


u
o
o
/ Tabulacin...
o
En el cuadro de dilogo que aparece se introduce en el campo Datos: la variable que
a
se va a analizar; para ello se selecciona con el ratn en el recuadro de la izquierda y
o
se pulsa el icono que aparece debajo de la opcin. (Figura 2.3)
o
Una vez seleccionada la variable se pulsa el botn Aceptar y se abre una nueva
o
ventana de resultados.
Por defecto, aparecen algunos resultados del men Tabulacin, (ver Figura 2.4).
u
o
30

Prctica 2. Variables estad


a
sticas unidimensionales

Figura 2.3: Cuadro de dilogo: Insercin de variable.


a
o

Figura 2.4: Ventana (por defecto) de resultados del anlisis de la variable nota.
a
En esta ventana de anlisis de resultados se observan tres zonas esenciales:
a
a) La barra de icono y t
tulo del anlisis. Presenta el nombre del procedimiento
a
estad
stico cuyos resultados se muestran en la ventana de anlisis (en este caso
a
se trata del procedimiento Tabulacin). A continuacin se expresa el nombre
o
o
31

2.2. Tabla de frecuencias y representacin de variables discretas


o
de la variable afectada por el procedimiento estad
stico (en este caso la variable
nota).
b) La barra de herramientas de anlisis. Presenta una sucesin de iconos que van a
a
o
posibilitar las diferentes opciones de trabajo en el anlisis actual. Est situada
a
a
inmediatamente debajo de la barra anterior (ver Figura 2.5).

Figura 2.5: Barra de herramientas de anlisis.


a
c) La ventana de salida de resultados. Se sita debajo de la barra de herramientas
u
de anlisis y se divide en dos zonas. La zona de la izquierda (zona de texto)
a
presenta los resultados de anlisis estad
a
stico y la zona de la derecha (zona de
grcos) presenta los resultados grcos, si existen. Si se pulsa dos veces con el
a
a
ratn sobre cualquiera de las zonas se obtiene su maximizacin ocupando esa
o
o
zona toda la pantalla. Se regresa a la situacin anterior volviendo a pulsar dos
o
veces con el ratn en cualquier parte de la pantalla maximizada. Cuando se
o
maximiza la zona grca, el programa considera el grco como seleccionado y
a
a
se activan las opciones grcas de la barra de herramientas de anlisis referentes
a
a
al trabajo con grcos.
a
3. Se observa la ventana de resultados obtenidos.
Se pulsa el icono de Opciones Tabulares y se obtiene un cuadro de dilogo (Figura
a
2.6)

Figura 2.6: Opciones tabulares.


donde se pueden marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, se dejan marcadas las dos opciones: Resumen del Procedimiento y
Tabla de Frecuencias. Se pulsa Aceptar.
Se pulsa el icono de Opciones Grcas y se obtiene un cuadro de dilogo (Figura
a
a
2.7)
32

Prctica 2. Variables estad


a
sticas unidimensionales

Figura 2.7: Opciones grcas.


a

donde se pueden marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, se deja marcada la opcin Diagrama de Barras, que es el grco que
o
a
se utiliza para representar una variable estad
stica discreta. Se pulsa Aceptar.
Entonces, en la parte izquierda de la ventana de resultados, en la parte de abajo,
aparece la tabla de frecuencias para la variable nota. Haciendo doble click sobre
este trozo de ventana se puede maximizar el resultado para ver la tabla completa
(Figura 2.8).

Figura 2.8: Tabla de frecuencias de la variable nota.


Volviendo a hacer doble click sobre la pantalla anterior aparecen de nuevo todos los
resultados. En la parte derecha aparece el diagrama de barras para la variable nota.
Haciendo doble click sobre el grco se maximiza para verlo en detalle. Si se pulsa
a
la opcin Opciones de Ventana del botn derecho del ratn, existe la posibilidad
o
o
o
de cambiar la direccin del grco, para que sea vertical. Obtenindose nalmente
o
a
e
el grco que se observa en la Figura 2.9.
a
33

2.3. Tabla de frecuencias y representacin de variables continuas


o

Figura 2.9: Diagrama de barras de la variable nota.

2.3.

Tabla de frecuencias y representacin de variao


bles continuas

La opcin Descripcin / Datos Numricos / Anlisis Unidimensional... permite


o
o
e
a
el clculo de la tabla de frecuencias (conjunto de los valores que presenta la variable
a
junto con sus frecuencias: frecuencia absoluta, relativa, absoluta acumulada y relativa
acumulada) de una variable estad
stica continua, as como su representacin mediante un

o
histograma.

Figura 2.10: Men Anlisis unidimensional...


u
a

2.3.1.

Ejemplo prctico
a

Se ha determinado el peso de 20 nios al nacer obtenindose los siguientes resultados:


n
e
2,3 3 3,1 3,2
4,1 4,4 3 3,2

3,3
3,3

2,6
3,3

2,7 3,5 3,5


3,1 2,8 3,6

3,7
3,4

Realizar la tabla de frecuencias y representacin grca correspondiente a estos datos,


o
a
agrupando los datos en 6 clases iguales.
34

Prctica 2. Variables estad


a
sticas unidimensionales
A continuacin, se detallan los pasos a seguir:
o
1. En primer lugar se dene la variable peso y se introducen los datos.

Figura 2.11: Datos de la variable peso.


2. Entonces se selecciona en el Men principal la opcin Descripcin / Datos
u
o
o
Numricos / Anlisis Unidimensional...
e
a
En el cuadro de dilogo que aparece se introduce en el campo Datos: la variable que
a
se va a analizar; para ello se selecciona con el ratn en el recuadro de la izquierda y
o
se pulsa el icono que aparece debajo de la opcin. Una vez seleccionada la variable
o
se pulsa el botn Aceptar y se abre una nueva ventana de resultados.
o
Por defecto, aparecen algunos resultados del men Anlisis Unidimensional...
u
a
3. Se observa la ventana de resultados obtenidos.
Se pulsa el icono de Opciones Tabulares y se obtiene la Figura 2.12,

Figura 2.12: Opciones tabulares.


35

2.3. Tabla de frecuencias y representacin de variables continuas


o
donde se pueden marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, se deja marcada la opcin: Resumen del Procedimiento y se marca
o
Tabla de Frecuencias. Se pulsa Aceptar.

Se pulsa el icono de Opciones Grcas y se obtiene la Figura 2.13,


a

Figura 2.13: Opciones grcas.


a

donde se pueden marcar y desmarcar las opciones que aparecen, segn interese.
u
En este caso, se quitan las marcas que aparecen por defecto y se marca la opcin
o
Histograma, que es el grco que se utiliza para representar una variable estad
a
stica
continua. Se pulsa Aceptar.

Entonces, en la parte izquierda de la ventana de resultados, en la parte de abajo,


aparece la tabla de frecuencias para la variable peso. Haciendo doble click sobre este
trozo de ventana se puede maximizar el resultado para ver la tabla completa.
36

Prctica 2. Variables estad


a
sticas unidimensionales

Figura 2.14: Tabla de frecuencias (por defecto) para la variable peso.

El ejercicio pide una tabla de frecuencias dividida en 6 clases. Para ello se procede a
modicar los l
mites de los intervalos. Se pulsa sobre la tabla con el botn derecho y
o
se selecciona Opciones de ventana, (ver Figura 2.16), se introducen unos valores
que den una tabla de frecuencias fcil de interpretar.
a

Figura 2.15: Opciones de ventana.


37

2.3. Tabla de frecuencias y representacin de variables continuas


o

Figura 2.16: Opciones de ventana.

Por ultimo, la tabla de frecuencias que se obtiene es la que aparece en la Figura

2.17.

Figura 2.17: Tabla de frecuencias para la variable peso.

Volviendo a hacer doble click sobre la pantalla anterior aparecen de nuevo todos los
resultados. En la parte derecha aparece el histograma para la variable peso. Haciendo
doble click sobre el grco se maximiza para verlo en detalle (Figura 2.18).
a
38

Prctica 2. Variables estad


a
sticas unidimensionales

Figura 2.18: Histograma para la variable peso.

2.4.

Representacin de variables cualitativas


o

La opcin Descripcin / Datos Cualitativos / Tabulacin... permite la realizacin


o
o
o
o
del grco de barras, as como el grco de sectores de una variable cualitativa, cuando
a

a
los datos que se tienen son las propias observaciones.
Si en lugar de las observaciones se dispone de una tabla donde se reejan las distintas modalidades de la variable junto con su frecuencia absoluta, entonces las opciones
son Grcos / Diagramas de Presentacin / Diagrama de Barras... y Grcos
a
o
a
/ Diagramas de Presentacin / Diagrama de Sectores..., respectivamente, para
o
realizar el diagrama de barras y el diagrama de sectores.

2.4.1.

Ejemplo prctico
a

En la siguiente tabla se indican las cantidades en toneladas de siete especies desembarcadas


en los puertos espaoles as como su valor expresado en euros:
n

Especies Toneladas
Almeja
4453
Calamar
1644
Cigala
7799
Langosta
525
Langostino
3548
Mejilln
o
96253
Pulpo
55205

Euros
5640
21998
30253
2568
10513
11326
51975
39

2.4. Representacin de variables cualitativas


o
Representar los datos grcamente, mediante un diagrama de barras y un diagrama de
a
sectores.
Se detallan los pasos a seguir:
1. En primer lugar se denen las variables especies, toneladas y euros, y se introducen
los datos.

Figura 2.19: Ejemplo de datos de variables de tipo cualitativo.

2. Se va a realizar un diagrama de barras para cada una de las variables. Dado que en
este caso los datos vienen dados a partir de las frecuencias de las modalidades se
selecciona en el Men principal la opcin Grcos / Diagramas de Presentacin
u
o
a
o
/ Diagrama de Barras... (Figura 2.20).

Figura 2.20: Acceso al men de la opcin Diagrama de Barras...


u
o
En el cuadro de dilogo que aparece se introduce en el campo Recuentos: la variable
a
que contiene las frecuencias; para ello se selecciona con el ratn en el recuadro de
o
la izquierda y se pulsa el icono que aparece debajo de la opcin, y en el campo
o
Etiquetas: la variable que contiene los nombres de las modalidades de la variable
cualitativa (ver Figura 2.21).
40

Prctica 2. Variables estad


a
sticas unidimensionales

Figura 2.21: Introduccin de variables.


o
Una vez seleccionadas las variables se pulsa el botn Aceptar y se abre una nueva
o
ventana de resultados.
3. Se observa la ventana de resultados obtenidos.
En la parte izquierda de la ventana de resultados, aparece un resumen de la variable
y a la derecha el grco representado. Haciendo doble click sobre esta parte de
a
ventana se puede maximizar el resultado para ver el grco en detalle (ver Figura
a
2.22).

Figura 2.22: Diagrama de barras de la variable toneladas.


41

2.4. Representacin de variables cualitativas


o
De igual forma se puede hacer el diagrama de barras para la variable euros.
4. Para representar las variables mediante un diagrama de sectores, se pulsa en el
Men principal la opcin Grcos / Diagramas de Presentacin / Diagrama
u
o
a
o
de Sectores... (Figura 2.23)

Figura 2.23: Acceso al men Diagrama de sectores...


u
Para cada variable hay que seguir los mismos pasos que se han dado para realizar el
diagrama de barras. Introducir el nombre de las variables en el lugar correspondiente
y pulsar el icono Aceptar (ver Figura 2.24).

Figura 2.24: Diagrama de sectores para la variable toneladas.

42

Prctica 3
a
S
ntesis numrica de una variable
e
estad
stica
3.1.

Introduccin
o

Una vez denidos los conceptos bsicos en el estudio de una distribucin de frecuencias
a
o
de una variable, se estudian las distintas formas de resumir dichas distribuciones mediante medidas de posicin (o de centralizacin), teniendo presente el error cometido en el
o
o
resumen mediante las correspondientes medidas de dispersin. A su vez se analizar la
o
a
forma de la distribucin mediante las medidas de forma. El histograma de frecuencias y
o
el diagrama de barras, vistos en la prctica anterior, ya aportan una representacin visual
a
o
de las tres propiedades ms importantes de los datos muestrales relativos a variables: la
a
forma de su distribucin, su tendencia central y su dispersin. Ahora se trata de cuanticar
o
o
estos conceptos.

3.2.

Medidas de posicin, dispersin y forma


o
o

Statgraphics, mediante la opcin Descripcin de la barra de men principal, permite


o
o
u
analizar y resumir una distribucin de frecuencias, posibilitando tabular los datos adeo
cuadamente, hallar medidas de posicin, dispersin y asimetr para los mismos. Asimismo
o
o
a
permite realizar grcos de barras, sectores, histogramas de frecuencias, etc, relativos a
a
la distribucin dada.
o
La opcin Descripcin / Datos Numricos / Anlisis Unidimensional... pero
o
e
a
mite el clculo de medias, varianzas, desviaciones t
a
picas, medianas, modas, m
nimos,
mximos, rangos, cuartiles inferiores, cuartiles superiores, rangos intercuart
a
licos, coecientes de asimetr y curtosis, y coeciente de variacin. La varianza y desviacin t
a
o
o pica
usan como denominador n 1.
43

3.2. Medidas de posicin, dispersin y forma


o
o

3.2.1.

Ejemplo prctico
a

Sean los siguientes datos que representan el peso en kg., la altura en cm. y el sexo de 12
individuos. Para este conjunto de datos se pide:
a) Realizar un anlisis descriptivo completo de las variables peso y altura, para todo el
a
conjunto de individuos.
b) A la vista de los resultados, decidir qu variable es ms homognea.
e
a
e
c) Realizar un anlisis descriptivo completo de las variables peso y altura, para cada
a
grupo.
peso altura
sexo
75
173
hombre
81
172
hombre
56
136
mujer
68
180
mujer
79
182
hombre
89
185
hombre
62
157
hombre
59
165
mujer
83
180
hombre
55
160
mujer
72
174
hombre
56
161
mujer
a) A continuacin, se detallan los pasos a seguir:
o
1. En primer lugar, se denen las variables peso, altura y sexo y se introducen los
datos. (Ver Figura 3.1)

Figura 3.1: Vista de algunos de los datos introducidos en Statgraphics.

44

Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
2. Entonces se selecciona en el Men principal la opcin Descripcin / Datos
u
o
o
Numricos / Anlisis Unidimensional...
e
a
En el cuadro de dilogo que aparece se introduce en el recuadro Datos: la variable
a
que se va a analizar (en primer lugar, peso); para ello se selecciona con el ratn en
o
el recuadro de la izquierda y se pulsa el icono que aparece debajo de la opcin. Una
o
vez seleccionada la variable se pulsa el botn Aceptar y se abre una nueva ventana
o
de resultados.
Por defecto, aparecen algunos resultados del men Anlisis Unidimensional...
u
a
(Ver Figura 3.2)

Figura 3.2: Resultados por defecto.

3. Se observa la ventana de resultados obtenidos.


Pulsando el icono de Opciones Tabulares se obtiene la Figura 3.3,
45

3.2. Medidas de posicin, dispersin y forma


o
o

Figura 3.3: Opciones tabulares

donde se puede marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, se dejan marcadas las opciones: Resumen del Procedimiento y Resumen estad
stico y se marca Percentiles. Se pulsa Aceptar.
Entonces, en la parte central izquierda de la ventana de resultados aparecen algunas
medidas para la variable peso. Haciendo doble click sobre esta parte de la ventana
se puede maximizar esta ventana concreta de resultados. (Ver Figura 3.4)

Figura 3.4: Medidas descriptivas que aparecen por defecto.

Se observa que no aparecen, por ejemplo la mediana o la moda. Se pulsa sobre


la ventana con el botn derecho y se selecciona Opciones de ventana, donde se
o
marcan todas aquellas medidas que sean necesarias (ver Figura 3.5). Finalmente el
resumen estad
stico aparece en la Figura 3.6.
46

Prctica 3. S
a
ntesis numrica de una variable estad
e
stica

Figura 3.5: Opciones de ventana.

Figura 3.6: Resumen estad


stico para la variable peso.

De los resultados se obtiene, por ejemplo: que el peso medio es de 69.58 kgs; la
mitad de los individuos pesan menos de 70 kgs; lo ms usual es un peso de 56 kgs.
a
El coeciente de asimetr da un valor de 0.160211, es decir, una ligera asimetr
a
a
a la derecha y el coeciente de curtosis es -1.4683, es decir, la distribucin de las
o
frecuencias es menos aplastada que la normal.
47

3.2. Medidas de posicin, dispersin y forma


o
o
La informacin obtenida sobre la forma de la distribucin se puede observar tambin
o
o
e
si se representa un histograma de los datos. (Ver gura 3.7)

Figura 3.7: Histograma para la variable peso.

Volviendo a hacer doble click sobre la pantalla, sta se maximiza apareciendo de


e
nuevo todos los resultados. En la tercera ventana de la izquierda aparecen algunos
percentiles para la variable peso. (Ver la Figura 3.8)

Figura 3.8: Percentiles para la variable peso.

Los percentiles que se calculan se pueden modicar en el botn derecho y seleccioo


nando la opcin Opciones de Ventana.
o
48

Prctica 3. S
a
ntesis numrica de una variable estad
e
stica
4. Se repite el procedimiento con la variable altura y se obtienen los siguientes resultados para el resumen estad
stico (ver la Figura 3.9) y los percentiles (ver la Figura
3.10).

Figura 3.9: Resumen estad


stico para la variable altura.

De los resultados obtenidos se puede resaltar que: la altura media es 168.75 cm; la
mitad de los individuos miden menos de 172.5 cm y la altura que ms se repite es
a
180 cm. El signo negativo del coeciente de asimetr indica asimetr a la izquierda
a
a
y el coeciente de curtosis indica que la distribucin es ms apuntada que la normal.
o
a

Figura 3.10: Percentiles para la variable altura.

49

3.2. Medidas de posicin, dispersin y forma


o
o
b) La variable ms homognea es la que presente un coeciente de variacin inferior.
a
e
o
En este caso, los valores obtenidos (en porcentaje) son:

Variable peso: 17.1413 %

Variable altura: 8.2078 %

Luego la variable altura es ms homognea. Sus valores se encuentran ms concentrados


a
e
a
en torno al valor medio de la variable.
c) A continuacin se detallan los pasos a seguir:
o

1. En primer lugar, se selecciona en el Men principal la opcin Descripcin / Datos


u
o
o
numricos / Anlisis de Subgrupo... (Figura 3.11).
e
a

Figura 3.11: Men Anlisis de Subgrupo.


u
a

En el cuadro de dilogo que aparece hay que introducir en el recuadro Datos: la


a
variable que se va a analizar (en primer lugar, altura); para ello se selecciona con
el ratn en el recuadro de la izquierda y se pulsa el icono que aparece debajo de la
o
opcin y en el recuadro Cdigos: la variable que diferencia los grupos, en este caso
o
o
sexo. Una vez seleccionadas las variables se pulsa el botn Aceptar y se abre una
o
nueva ventana de resultados.
Por defecto, aparecen algunos resultados del men Anlisis de Subgrupo... (Ver
u
a
Figura 3.12)
50

Prctica 3. S
a
ntesis numrica de una variable estad
e
stica

Figura 3.12: Resultados por defecto.

2. Se observa la ventana de resultados obtenidos.


Pulsando el icono de Opciones Tabulares se obtiene la Figura 3.13,

Figura 3.13: Opciones tabulares

donde se puede marcar y desmarcar las opciones que aparecen, segn interese. En
u
este caso, dejamos marcadas las opciones: Resumen del Anlisis, y Resumen
a
estad
stico.
Entonces, en la parte inferior izquierda de la ventana de resultados aparecen algunas
medidas para la variable altura, en cada uno de los grupos. Haciendo doble click sobre
51

3.2. Medidas de posicin, dispersin y forma


o
o
esta parte de la ventana se puede maximizar el resultado para verlas todas. (Ver
Figura 3.14)

Figura 3.14: Medidas descriptivas que aparecen por defecto.

De nuevo no aparecen, por ejemplo la mediana o la moda. Se pulsa sobre la ventana


con el botn derecho y se selecciona Opciones de ventana, donde se marcan todas
o
aquellas medidas que sean necesarias. Finalmente el resumen estad
stico aparece en
la Figura 3.15.

Figura 3.15: Resumen estad


stico para la variable altura, por sexo.

De los resultados se obtiene, por ejemplo: que la altura media en los hombres es de
174.714, mientras que en las mujeres es de 160.4; la mitad de los hombres miden
ms de 174 cm y la mitad de las mujeres miden ms de 161 cm; destaca el hecho de
a
a
que no aparece ningn valor para la moda en los grupos, lo que quiere decir que en
u
este caso no hay ningn valor que se repita ms que otro o que pueden existir ms
u
a
a
de una moda. El coeciente de asimetr da en ambos casos valores negativos, es
a
decir, asimetr a la izquierda y el coeciente de curtosis, indica que la distribucin
a
o
de las frecuencias es ms apuntada que la normal, en los dos grupos.
a
3. Un estudio similar se realiza con la variable peso y el resultado que se obtiene se
puede ver en la gura 3.16.
52

Prctica 3. S
a
ntesis numrica de una variable estad
e
stica

Figura 3.16: Resumen estad


stico para la variable peso, por sexo.

53

3.3. Ejercicios

3.3.

Ejercicios

1. Una editorial pretende sacar al mercado una nueva revista cient


ca. Se estudia el
nmero de pginas de los art
u
a
culos de este tipo para decidir el nmero de ellos que se
u
pueden aceptar para cada volumen de la nueva revista. Se observan los art
culos de
una revista con una temtica similar obtenindose el nmero siguiente de pginas:
a
e
u
a
5 10 6
7 13 14
13 9 16

8 9 12 15
8 12 10 8
10 8 12 7

16 9 5
6 15 8
9 11 9

Determine:
a) Tipo de variable estad
stica.
b) Tabla de frecuencias, diagrama de tallo y hojas e histograma.
c) Nmero medio de pginas, mediana y nmero de pginas ms frecuente.
u
a
u
a
a
d ) Nmero mximo de pginas del 10 % de los art
u
a
a
culos ms cortos.
a
e) Dispersin, asimetr y curtosis.
o
a
f ) Comentar el resultado de todas las medidas de los apartados anteriores.
g) Compara la forma de la distribucin y la dispersin con la del nmero de
o
o
u
pginas de los art
a
culos de otra revista en la que se han observado los siguientes
valores:
10
18
12
19

16
11
14
18

19
15
13
17

15
10
19
16

14
14
16

13
19
19

12 10 17
10 12 11
16 15 18

13
15
12

2. La EPA (Agencia de Proteccin del medio ambiente de EEUU) exige a los fabricantes
o
de automviles que indiquen los consumos, tanto por ciudad como por carretera,
o
de cada uno de sus modelos. A continuacin se presentan los datos de consumo por
o
carretera de 30 modelos de automvil de 1994, expresados en litros por cada 100
o
km:
12.3
10.8
11.8

9.1
10.5
14.1

10.1 10.4
11.3 9.7
10.8 18.8

9.7
10.8
10.8

11.3
10.5
10.4

11.3 10.8
12.3 11.3
10.1 10.8

9.7
9.1
12.8

10.1
11.8
10.8

Analizar descriptivamente la variable y calcular todas las medidas descriptivas estudiadas en el tema 2. Comenta el resultado de dichas medidas.

54

Prctica 4
a
Distribuciones estad
sticas
bidimensionales
4.1.

Distribuciones bidimensionales de frecuencias

La opcin Descripcin / Datos numricos / Anlisis Multidimensional... del


o
o
e
a
Men principal permite realizar varios anlisis estad
u
a
sticos y grcos sobre variables mula
tidimensionales numricas, y en particular, sobre variables bidimensionales.
e

Figura 4.1: Men Anlisis Multidimensional.


u
a

Como en todo anlisis con Statgraphics, en la barra de herramientas de anlisis se


a
a
pueden elegir dos iconos esenciales, el icono Opciones Tabulares y el icono Opciones
Grcas, que permiten manejar todas las subopciones tabulares y grcas, respectivaa
a
mente, para el anlisis.
a
La opcin tabular Resumen del Procedimiento es la opcin por defecto, y presenta
o
o
un primer resumen de los datos. La opcin Resumen Estad
o
stico incluye por defecto
varias medidas de posicin, dispersin, asimetr y curtosis (nmero de valores de las vao
o
a
u
riables, medias, cuasivarianzas, cuasidesviaciones t
picas, mximos, m
a
nimos, coecientes
de asimetr y curtosis, y sumas de los valores de las variables).
a
55

4.1. Distribuciones bidimensionales de frecuencias

4.1.1.

Ejemplo prctico
a

El consumo C y la renta mensual RM de 100 familias, expresadas en 102 euros se presentan


en la siguiente tabla bidimensional de frecuencias.
RM \C
[15,21]
(21,27]
(27,33]

[6,12]
10
5
0

(12,18]
15
20
15

(18,24]
0
25
5

(24,30]
0
0
5

Se pide:
a) Obtener las distribuciones de frecuencias marginales de cada variable.
b) Obtener las medias, varianzas, desviaciones tpicas y coecientes de variacin, asime
o
tr y curtosis de ambas variables conjuntamente. Y la covarianza entre ambas vaa
riables.
c) Representar los datos mediante un diagrama de dispersin.
o
En este caso se observa que los valores de las variables vienen dados en una tabla
bidimensional de frecuencias absolutas. El primer paso ser introducir adecuadamente los
a
valores de las dos variables como dos columnas de la hoja de clculo de Statgraphics. El
a
par de valores RM=18 y C=9 (que son las marcas de clase) se introduce 10 veces, el par
de valores RM=24 C=9 se introduce 5 veces, y as sucesivamente se introduce cada par

de valores tantas veces como indique su frecuencia absoluta.


a) Las distribuciones de frecuencias marginales se obtienen desde el men Descripcin
u
o
/ Datos numricos / Anlisis Unidimensional..., como ya se vi en la prctica 2.
e
a
o
a
Los resultados que se obtienen son:

Figura 4.2: Tabla de frecuencias para Consumo.


En las tablas de frecuencias (Figuras 4.2, 4.3) se ha modicado el nmero de clases
u
para obtener exactamente los intervalos que aparecen en el enunciado del ejercicio.
56

Prctica 4. Distribuciones estad


a
sticas bidimensionales

Figura 4.3: Tabla de frecuencias para Renta Mensual.

b) Las medidas descriptivas para ambas variables conjuntamente se obtienen desde


el men Descripcin / Datos Numricos / Anlisis Multidimensional.... En el
u
o
e
a
cuadro de dilogo que aparece se introducen las variables en el campo Datos: (Figura
a
4.4) y se pulsa Aceptar.

Figura 4.4: Cuadro de dilogo del men Anlisis Multidimensional.


a
u
a

Por defecto aparecen algunas opciones tabulares y grcas en el anlisis resultante.


a
a
Para obtener las medidas descriptivas se selecciona la opcin Resumen Estad
o
stico
y para obtener la covarianza se selecciona la opcin Covarianzas, ambas en el icono
o
Opciones Tabulares (Figura 4.5).
57

4.1. Distribuciones bidimensionales de frecuencias

Figura 4.5: Opciones tabulares del men Anlisis Multidimensional.


u
a
El resultado del resumen estad
stico se encuentra en la Figura 4.6.

Figura 4.6: Resumen estad


stico.
De los resultados se puede decir que el Consumo medio son 1650 euros y la Renta
Mensual media es de 2400 euros. La variable Consumo es ligeramente asimtrica a la
e
derecha, (coeciente > 0) y la variable Renta Mensual es simtrica (coeciente = 0). Con
e
respecto a los coecientes de variacin, la variable Renta Mensual es ms homognea con
o
a
e
respecto a su media, ya que tiene un coeciente de variacin menor.
o
En la matriz de covarianzas, en la diagonal estn las varianzas (divididas por n 1)
a
de cada variable y fuera de la diagonal la covarianza entre las variables. La covarianza
entre las variables es 9,09091 (Figura 4.7). Lo que indica que existe relacin directa entre
o
las variables, es decir, a mayor Renta Mensual, mayor Consumo.
58

Prctica 4. Distribuciones estad


a
sticas bidimensionales

Figura 4.7: Covarianza.


c) El diagrama de dispersin se realiza desde la opcin Grcos / Grcos de
o
o
a
a
Dispersin / Grco X-Y... (Figura 4.8).
o
a

Figura 4.8: Men Grco X-Y.


u a

En el cuadro de dilogo que aparece se introduce una variable en el campo Y: y la


a
otra en X:. El grco que se obtiene aparece en la Figura 4.9.
a

Figura 4.9: Grco de dispersin correspondiente a las variables Consumo y Renta Mena
o
sual.
59

4.2. Distribuciones condicionadas

4.2.

Distribuciones condicionadas

La opcin Descripcin / Datos numricos / Anlisis Unidimensional... del Men


o
o
e
a
u
principal permite realizar resmenes estad
u
sticos y grcos para una seleccin de un cona
o
junto de datos. Por lo que esta opcin se puede utilizar para obtener distribuciones condio
cionadas.

4.2.1.

Ejemplo prctico
a

Se consideran los datos usados en el ejemplo anterior, correspondientes a la Renta Mensual y al Consumo de 100 familias. Se pide obtener la distribucin de frecuencias y algunas
o
medidas descriptivas del Consumo para aquellas familias que tienen una Renta Mensual
superior a 2000 euros.
Para obtener la distribucin de frecuencias se selecciona la opcin Descripcin /
o
o
o
Datos numricos / Anlisis Unidimensional... y en el cuadro de dilogo que aparece
e
a
a
se introduce en el campo Datos: la variable C (consumo) y en (Seleccin:) RM > 20.
o
(Ver gura 4.10).

Figura 4.10: Cuadro de dilogo.


a

En el icono Opciones Tabulares se seleccionan Resumen estad


stico y Tabla de
frecuencias. Los resultados obtenidos se pueden ver en las Figuras 4.11 y 4.12.
60

Prctica 4. Distribuciones estad


a
sticas bidimensionales

Figura 4.11: Resumen estad


stico para C|RM>20.

Figura 4.12: Tabla de frecuencias para C|RM>20.

61

4.3. Ejercicios

4.3.

Ejercicios

1. Sobre un conjunto de conductores se ha realizado una encuesta para analizar su


edad (Y ) y el nmero de accidentes que han sufrido (X). A partir de la misma, se
u
obtuvieron los siguientes resultados:
X Y
0
1
2

[20,30]
74
7
3

(30,40]
82
6
2

(40,50]
78
5
2

(50,60]
72
6
1

(60,70]
7
5
1

A partir de estos datos, se pide determinar para este conjunto de conductores:


a) Las medias y varianzas de las distribuciones marginales.
b) Qu variable es ms homognea?
e
a
e
c) El nmero medio de accidentes que tienen los conductores con edades comu
prendidas entre los 40 y los 50 aos.
n
d ) La covarianza entre las dos variables.
e) Qu edad tendr como mucho un conductor con un solo accidente para ene
a
contrarse en el grupo del 20 % de los ms jvenes?
a o
f ) Obtener el diagrama de dispersin de los datos.
o

62

Prctica 4. Distribuciones estad


a
sticas bidimensionales

4.4.

Anlisis bidimensional de datos categricos


a
o

Cuando se trabaja con datos categricos (o cualitativos), se utiliza el siguiente men:


o
u
Descripcin / Datos Cualitativos...
o

Figura 4.13: Men Datos Cualitativos...


u

Dentro de esta opcin se puede elegir entre varias opciones, y estudiar concretamente
o
el procedimiento Tabulacin. Sean los siguientes procedimientos:
o

Tabulacin Cruzada
o
Procedimiento que resume la distribucin conjunta de dos variables discretas meo
diante su tabulacin bidimensional. Los recuentos se efectan midiendo el nmero
o
u
u
de veces que aparece cada modalidad de la primera variable con la otra de la segunda
variable.

Tablas de Contingencia
Es anlogo al anterior y su particularidad es que la informacin se introduce ya
a
o
tabulada.

4.4.1.

Ejemplo prctico
a

Se utilizan los datos provenientes de clasicar a 13 individuos segn la variable sexo


u
(hombre y mujer) y ftbol (deseo de ver una nal de campeonato de ftbol) y que se
u
u
muestran en la siguiente tabla:
63

4.5. Procedimiento Tabulacin Cruzada


o
SEXO
hombre
hombre
mujer
hombre
mujer
mujer
mujer
hombre
mujer
hombre
mujer
hombre
hombre

FUTBOL
si
si
no
no
si
no
no
si
no
si
no
si
si

Antes de empezar con el anlisis se introducen los datos, teniendo en cuenta que al
a
denir la variable se tiene que indicar que son categricos.
o

4.5.

Procedimiento Tabulacin Cruzada


o

Se accede mediante el men Descripcin / Datos Cualitativos / Tabulacin Cruzau


o
o
da obteniendo un cuadro de dilogo en el que se tiene que decidir que variable aparea
cer por las y cual por columnas. En Variable Fila se introduce la variable que aparea
64

Prctica 4. Distribuciones estad


a
sticas bidimensionales
cer por las, en este caso, por ejemplo, ftbol y en Variable Columna se introduce la
a
u
variable que aparecer por columnas, en este caso sexo.
a

Figura 4.15: Tabulacin Cruzada.


o
La primera ventana de resultados muestra el resumen del procedimiento: variables que
intervienen y en que orden, el nmero de observaciones y el nmero de columnas y las
u
u
(modalidades de cada una de las variables), adems de un diagrama de barras para cada
a
una de las modalidades.

65

4.5. Procedimiento Tabulacin Cruzada


o

Figura 4.16: Ventana de Anlisis en Tabulacin Cruzada


a
o
Al pulsar Opciones Tabulares se obtiene una serie de opciones que son:

Figura 4.17: Opciones Tabulares en Tabulacin Cruzada


o

4.5.1.

Tabla de frecuencias

Al elegir la opcin de Tabla de Frecuencias, se crea una tabla con las frecuencias
o
absolutas para cada par de valores y la frecuencia relativa con respecto al total de la tabla.
Si se pulsa el botn derecho del ratn se obtienen porcentajes con respecto a las las (se
o
o
66

Prctica 4. Distribuciones estad


a
sticas bidimensionales
divide cada casilla entre el total de su la), con respecto a su columna (se divide cada
casilla respecto al total de su columna), la frecuencia esperada (resultado de multiplicar
en cada casilla el total de su la por el de su columna y dividirlo entre el total de la tabla)
las desviaciones y los totales chi-cuadrado.

Figura 4.18: Opciones de la tabla de frecuencias


En este resultado se puede comentar por ejemplo:
Hay un 7.69 % (en negro) de hombres que no quieren ver la nal del campeonato
(porcentaje del total, todos los individuos entran en el calculo del porcentaje).
Del grupo de las personas que no quieren ver la nal del campeonato, un 16.67 % (en
rojo) son hombres (porcentaje de la, solo los individuos que presentan la modalidad
de esa la entran en el calculo del porcentaje, en este caso, solo las personas que no
quieren ver la nal del campeonato).
De los hombres (solamente ese grupo), un 14.29 % (en verde) no quieren ver la
nal del campeonato (porcentaje de columna, solo los individuos que presenten la
modalidad de esa columna entran en el calculo del porcentaje, en este caso, solo los
hombres).

4.5.2.

Test de la 2

El contraste de la 2 proporciona un test para determinar si existe o no independencia


entre las variables con las que se trabaja. Es un procedimiento inferencial en el que si
el p-valor proporcionado por el test es inferior a 0.05 se concluye rechazar la hiptesis
o
de independencia entre las y columnas. La correccin de Yates se aplicar cuando las
o
a
67

4.6. Procedimiento Tablas de Contingencia


frecuencias esperadas sean menores de 5 y el contraste exacto de Fisher para tablas de 2
x 2. En este caso se obtiene:

Figura 4.19: Contraste de hiptesis.


o
Por lo tanto, al ser el p-valor menor de 0.05, se rechaza la hiptesis de independencia
o
para aceptar la dependencia (relacin) entre ambas variables.
o

4.6.

Procedimiento Tablas de Contingencia

Este procedimiento es anlogo al procedimiento Tabulacin Cruzada, la unica diferencia


a
o

est en la forma en la que se introducen los datos ya que en este caso la informacin
a
o
est tabulada.
a

4.6.1.

Ejemplo prctico
a

Se clasican las notas de una asignatura en tres grupos distintos. Los datos aparecen en
la siguiente tabla:
GRUPO SUSPENSOS
A
10
B
14
C
8

APROBADOS
32
12
10

NOTABLES SOBRESALIENTES
12
40
10
30
6
16

En el editor de datos se introducen los datos en cinco columnas semejantes a las del
enunciado. La primera columna contiene a la variable Grupo y es de tipo categrica, las
o
otras cuatro variables son numricas y sern, respectivamente, suspensos, aprobados, noe
a
tables y sobresalientes como se muestra en la imagen.
A continuacin se accede al men Descripcin / Datos Cualitativos / Tablas
o
u
o
de Contingencia tras el que aparece el siguiente cuadro de dialogo. En Columnas se
68

Prctica 4. Distribuciones estad


a
sticas bidimensionales

Figura 4.20:
introducen las variables que se han denido como numricas y en Etiquetas la variable
e
denida como categrica. A partir de aqu todo ser igual que en el apartado anterior:
o

Figura 4.21: Cuadro de dilogo


a

69

4.7. Ejercicios

4.7.

Ejercicios

1. La siguiente tabla clasica a un nmero de personas segn la frecuencia con que


u
u
leen perod
cos o escuchan tertulias radiofnicas.
o
Lectura
prensa
Todos los dias
Alguna vez
Nunca

tertulia tertulia
si
no
20
70
60
70
30
30

a) Introduzca los datos y obtenga la tabla que muestre la distribucin conjunta


o
en porcentajes.
b) Obtener la tabla que exprese las distribuciones condicionadas de LECTURA
PRENSA a las opciones de TERTULIA.
c) Son independientes las dos variables?
2. Se clasican 6800 varones atendiendo a dos caracter
sticas, el color de pelo y el color
de los ojos. Estudiar si hay o no independencia.
Ojos

pelo
rubio moreno pelirrojo canoso
azul
1768
807
186
47
verde
946
1387
746
53
castao 115
n
438
288
16
a)
b)
c)
d)
e)

De las personas con el pelo rubio, qu porcentaje tienen los ojos azules?
e
De las personas con ojos azules, qu porcentaje tienen el pelo rubio?
e
De las personas con el pelo canoso, qu porcentaje tienen los ojos castaos?
e
n
De las personas con ojos castaos, qu porcentaje tienen el pelo canoso?
n
e
Cul es el porcentaje que tiene el pelo canoso y los ojos castaos?
a
n

3. Un centro escolar ha encargado a un psiclogo que estudie si hay relacin entre


o
o
el sexo y la preferencia por una carrera universitaria (ciencias, ingenier y letras)
a
en los alumnos de Bachiller. Para ello el psiclogo ha seleccionado una muestra
o
aleatoria de 100 alumnos y les ha preguntado su opinin como se muestra en la
o
siguiente tabla:
Sexo \ Carrera Ciencias
Varn
o
16
Mujer
14

Ingenier Letras
a
30
14
10
16

Cul ser la conclusin del psiclogo con = 0,05?


a
a
o
o
70

Prctica 5
a
Regresin y Correlacin
o
o
5.1.

Introduccin
o

Statgraphics analiza ampliamente el tema de la regresin. Aporta procedimientos para


o
regresin simple lineal y no lineal. Los procedimientos simples a utilizar se implementan
o
en la opcin Dependencia de la barra de Men principal.
o
u
La opcin Dependencia / Regresin Simple... resuelve un modelo de regresin
o
o
o
con una sola variable independiente, utilizando el ajuste por m
nimos cuadrados.
Se puede representar grcamente la l
a
nea de ajuste y los residuos para todos los
modelos. El sistema, adems, genera y representa predicciones para valores dados de X o
a
Y, as como permite guardar en archivos los residuos y las predicciones para posteriores

anlisis.
a
Con este anlisis se pretende conocer si una o varias variables independientes o exa
plicativas aportan algn tipo de informacin sobre el comportamiento de otra variable
u
o
dependiente o explicada. Una de las nalidades de este anlisis es realizar predicciones
a
para los datos. En esta prctica se considera el caso en el que se dispone de una unica
a

variable independiente (regresin simple), es decir, hay que expresar una variable indeo
pendiente en funcin de una variable dependiente.
o
En regresin lineal, la funcin mediante la cul se expresa esta relacin ser del tipo:
o
o
a
o
a
Y = a + bX
donde los parmetros a y b sern determinados a partir de los datos. Evidentemente el
a
a
objetivo ser que este ajuste sea lo mejor posible.
a

5.2.

Regresin lineal simple


o

El procedimiento a utilizar es Dependencia / Regresin Simple...


o
71

5.2. Regresin lineal simple


o

Figura 5.1: Men Regresin lineal...


u
o

5.2.1.

Ejemplo prctico
a

Sean los siguientes datos que representan el Peso en kg. y la Altura en cm. de 12 individuos. Con este conjunto de datos se procede a obtener posibles resultados en el anlisis
a
de regresin:
o

peso altura
75
173
81
172
56
136
68
180
79
182
89
185
62
157
59
165
83
180
55
160
72
174
56
161

Una vez introducidos los datos se selecciona en el Men principal la opcin Dependencia
u
o
/ Regresin Simple...
o
En el Cuadro de dilogo que aparece se introducen las variables a analizar.
a

72

Prctica 5. Regresin y Correlacin


a
o
o

Figura 5.2: Cuadro de Entrada de datos.


En el campo Y: se introduce la variable dependiente, en este caso Peso y en X: la
variable independiente, en este caso Altura. Al pulsar el botn Aceptar se genera la
o
ventana de resultados correspondiente a este anlisis.
a

Figura 5.3: Ventana de resultados.


A la izquierda aparecen los siguientes resultados numricos:
e
1. Valores estimados de los parmetros del modelo a = 46,5885 y b = 0,688426
a
(Ordenada y Pendiente), su error estndar y el siguiente contraste de hiptesis
a
o
73

5.2. Regresin lineal simple


o
sobre ellos:
H0 : parmetro = 0
a
H1 : parmetro = 0
a
si el p-valor del contraste es menor de 0.05, se rechaza la hiptesis nula (H0 ) del
o
contraste.
2. La tabla ANOVA de anlisis de la varianza. En esta tabla aparecen la variabilidad
a
explicada por nuestro modelo lineal de regresin (1000.11), la variabilidad que el
o
modelo deja sin explicar (564.806) y la variabilidad total de la variable Peso que
se quiere explicar (1564.92). Tambin la tabla ANOVA resuelve el contraste de
e
regresin:
o
H0 : R 2 = 0
H1 : R 2 = 0
Si el p-valor es menor de 0.05, se aceptar la hiptesis alternativa (H1 ) de existencia
a
o
de regresin.
o
3. El coeciente de correlacin r = 0,799426 y el coeciente de determinacin R2 =
o
o
0,639082. El coeciente de correlacin lineal da una medida de la relacin lineal que
o
o
existe entre las variables. El coeciente de determinacin da una medida del ajuste
o
de la regresin a los datos, siendo sta mejor cuanto ms cerca est de 1.
o
e
a
e
Por lo tanto, la ecuacin del modelo ajustado es Peso=-46.5885+0.688426 Altura.
o
En el icono Opciones Tabulares se obtienen las siguientes opciones.

Figura 5.4: Opciones Tabulares.

74

Prctica 5. Regresin y Correlacin


a
o
o

5.2.2.

Predicciones

Como se ha dicho, uno de los objetivos principales de la regresin es la de poder reao


lizar predicciones sobre los datos. Statgraphics proporciona una opcin que calcula dichas
o
predicciones. Se genera una nueva ventana que contendr una prediccin y su intervalo
a
o
de conanza para un valor seleccionado por el programa.

Figura 5.5: Predicciones por defecto.


En este caso realiza las predicciones para x = 136 y x = 185. Para modicar el valor
para el que se realiza la prediccin y el nivel al cual se hace el intervalo de conanza, se
o
pulsa el botn derecho del ratn y se selecciona la opcin Opciones de Ventana.
o
o
o

Figura 5.6: Opciones de prediccin.


o

5.2.3.

Comparacin de Modelos Alternativos


o

La regresin que se ha realizado est basada en el modelo lineal. Ahora lo que se pretende
o
a
es estudiar si existe otro modelo no lineal que mejore los resultados que se han obtenido con
75

5.3. Regresin no Lineal


o
el modelo lineal. La opcin Comparacin de Modelos Alternativos de las opciones
o
o
tabulares proporciona los coecientes de determinacin (R2 ) de una serie de modelos,
o
ordenados de mayor a menor.

Figura 5.7: Comparacin de modelos.


o
Observando los resultados se obtiene que el modelo para los datos es el modelo
Inverso-Y, con un coeciente de determinacin de 0.6655.
o

5.2.4.

Residuos At
picos

Esta opcin proporciona los valores de la variable que son anmalos o extremos. Estos
o
o
puntos son aquellos que tienen un residuo estandarizado fuera del intervalo [-2,2].

Figura 5.8: Valores at


picos.
La la 3 tiene valores anmalos o extremos (x = 136).
o

5.3.

Regresin no Lineal
o

Para obtener un modelo de regresin simple de tipo no lineal, en la ventana de resultados


o
inicial se pincha con el botn derecho del ratn y se elige la opcin Opciones de Anlisis
o
o
o
a
que proporciona el siguiente Cuadro de dilogo, en el que se puede elegir el tipo de modelo
a
76

Prctica 5. Regresin y Correlacin


a
o
o
de regresin. La expresin de cada uno de estos modelos aparece en la primera l
o
o
nea de
la ventana de resultados correspondiente.

Figura 5.9: Tipos de regresin.


o

5.4.

Opciones Grcas
a

La salida grca de la ventana inicial del anlisis de regresin consiste en un grco donde
a
a
o
a
estn representadas la nube de puntos y la recta de regresin ajustada, as como otras
a
o

curvas con los l


mites de conanza. Adems del grco inicial de resultados Grco del
a
a
a
Modelo Ajustado, existe la posibilidad de construir otros tipos de grcos. El icono
a
Opciones Grcas,
a

77

5.4. Opciones Grcas


a

Figura 5.10: Opciones Grcas.


a
tiene las siguientes opciones:
1. Grco del Modelo Ajustado: representa la nube de puntos y la recta de regrea
sin y los l
o
mites de conanza de la recta. La aleatoriedad de los puntos
ndica que
el modelo es bueno. Si se obtiene un grco con un patrn denido, indica que los
a
o
residuos estn relacionados y, por tanto, el modelo no es adecuado para los datos.
a
2. Observado frente a Predicho: es la grca de los valores observados frente a los
a
predichos por el modelo ajustado incluyendo como referencia una linea con pendiente
igual a 1. La aleatoriedad de los puntos
ndica que el modelo es bueno. Si se obtiene
un grco con un patrn denido, indica que los residuos estn relacionados y, por
a
o
a
tanto, el modelo no es adecuado para los datos.
3. Residuos frente a X: residuos frente a la variable explicativa. La aleatoriedad de
los puntos
ndica que el modelo es bueno. Si se obtiene un grco con un patrn
a
o
denido, indica que los residuos estn relacionados y, por tanto, el modelo no es
a
adecuado para los datos.
4. Residuos frente a Predichos: residuos frente a la variable explicativa.
5. Residuos frente a N mero de Fila: residuos frente al orden de aparicin.
u
o

78

Prctica 5. Regresin y Correlacin


a
o
o

5.5.

Ejercicios

1. Una compa elctrica desarrollo un modelo de consumo de energ en funcin de


na e
a
o
la temperatura. Se obtuvo la siguiente informacin:
o
temperatura 0 2 4
consumo
70 79 67
a)
b)
c)
d)

8 13 -4
66 63 97

-6 -8 -11
82 90 107

Determinar la nube de puntos.


Obtener la ecuacin de regresin.
o
o
Es bueno el ajuste?.
Obtener una prediccin para el consumo de energ cuando la temperatura es
o
a
10.

2. Se dispone de la informacin referente a 6 familias sobre el gasto en libros (Y ) y la


o
renta disponible mensual (X):
Y
X

0.3 0.5 0.6


6
7
8

0.9 1 1.4
10 15 21

Explicar el comportamiento de Y a travs de X mediante una relacin lineal. Como


e
o
de bueno es el ajuste?.
3. En 1965 A. J. Lea recogi datos sobre la temperatura anual media en varias ciudades
o
de Gran Bretaa, Noruega y Suecia y la tasa de mortalidad en un tipo de cncer de
n
a
pecho de mujeres. Los datos que obtuvo fueron los siguientes:
Temperatura anual media (o F)
Indice
51.3
49.9
50.0
49.2
48.5
47.8
47.3
45.1
46.3
42.1
44.2
43.5
42.3
40.2
31.8
34.0

de mortalidad
102.5
104.5
100.4
95.9
87.0
95.0
88.6
89.2
78.9
84.6
81.7
72.2
65.1
68.1
67.3
52.5
79

5.5. Ejercicios
a) Determinar la recta de regresin de m
o
nimos cuadrados, que relaciona la variable
ndice de mortalidad en funcin de la temperatura anual media.
o
b) Qu
e ndice de mortalidad puede predecirse para una temperatura anual media
de 33 o F?.
c) Es able esta prediccin?
o
4. Una fbrica de cerveza quiere averiguar si existe una relacin lineal entre el dinero
a
o
que gasta en anuncios de televisin y sus ventas totales para lo que se anotan los
o
siguientes datos:
Mes
Ventas (miles de euros)
Enero
50
Febrero
90
Marzo
30
Abril
90
Mayo
91
Junio
95
Julio
95

Gastos en anuncios de TV (miles de euros)


0.5
0.9
0.4
0.7
1.1
0.75
0.8

Obtener la recta de regresin y comprobar si existe relacin lineal entre las variables.
o
o
5. La factura mensual del gasto telefnico de una pequea empresa se ha incrementado
o
n
notablemente en los ultimos meses. Los estudios realizados por el administrador de la

misma argumentan que el mayor uso de Internet dentro de la misma es la principal


causa del mayor gasto en telfono, lo que ha hecho que se estudie la posibilidad
e
de acogerse a alguno de los mltiples bonos o tarifas especiales que ofrecen las
u
compa lo que hasta la fecha no se hab llevado a cabo. Las ultimas cifras
nas,
a

mensuales no hacen sino conrmar esta relacin.


o
Enero Febrero Marzo Abril Mayo
Cuant de la factura telefnica (e)
a
o
55
100
118
120
142
Tiempo de conexin (minutos)
o
200
500
700
800
1000
a) Suponiendo la existencia de una relacin lineal entre el tiempo de conexin y
o
o
gasto telefnico, obtener la recta de regresin.
o
o
b) Cul ser la cuant de la factura telefnica si no se conectase a Internet la
a
a
a
o
empresa?.
c) Cul ser el gasto telefnico estimado segn esta relacin lineal si el tiempo
a
a
o
u
o
de conexin a Internet fuera de 900 minutos?.
o
80

Prctica 5. Regresin y Correlacin


a
o
o
d ) Si se considera que un incremento del 20 % en el tiempo de conexin a Internet
o
respecto al realizado en el mes de mayo conllevar a que la factura telefnica se
a
o
elevase de forma extraordinaria, cul ser el incremento relativo en la misma
a
a
si ello se produjese?.
6. Sobre el gasto en libros (Y ) y la renta disponible mensual (X) se dispone de la
informacin referente a 6 familias
o
Y
X

0.3 0.5 0.6


6
7
8

0.9 1 1.4
10 15 21

Explicar el comportamiento de Y por X mediante


a) una relacin lineal.
o
b) una hiprbola equiltera.
e
a
c) una curva potencial.
d ) Qu ajuste es el ms adecuado?
e
a

81

5.5. Ejercicios

82

Prctica 6
a
Algunas distribuciones de
probabilidad conocidas
6.1.

Introduccin
o

Statgraphics implementa hasta 25 distribuciones de probabilidad, calculando para todas


ellas valores de la funcin de distribucin, valores cr
o
o
ticos (valores para los que la funcin
o
de distribucin tiene una probabilidad dada, es decir, puntos inversos de los valores de la
o
funcin de distribucin), secuencias de nmeros aleatorios segn una distribucin dada y
o
o
u
u
o
permite representar las correspondientes leyes de probabilidad, funciones de densidad y
funciones de distribucin.
o
La opcin Grcos / Distribuciones de Probabilidad... (Figura 6.1) del Men prino
a
u
cipal de Statgraphics posibilita el trabajo con distribuciones de probabilidad.

Figura 6.1: Men Distribuciones de Probabilidad...


u

El Cuadro de dilogo de entrada permite seleccionar la distribucin que se desee, tal


a
o
y como se indica en la Figura 6.2.
83

6.1. Introduccin
o

Figura 6.2: Distribuciones de Probabilidad.

Al pulsar Aceptar se obtiene una pantalla con informacin sobre la distribucin elegio
o
da. Si sobre esta pantalla se pincha el icono Opciones Tabulares de la barra de herramientas, se obtiene el Cuadro de dilogo de la Figura 6.3, en la que se observan las distintas
a
opciones de trabajo con la distribucin elegida.
o

Figura 6.3: Opciones Tabulares.

84

Prctica 6. Algunas distribuciones de probabilidad conocidas


a

6.2.

Funciones de distribucin
o

La opcin Distribucin Acumulada del Cuadro de dilogo Opciones Tabulares pero


o
a
mite hallar el valor de la funcin de distribucin en un punto dado para el modelo elegido.
o
o
En esa pantalla se dan los valores para F (x) = P (X < x), f (x) (funcin de densidad) o
o
P [X = x] (funcin masa de probabilidad) y 1 F (x) = P (X > x), hasta para 5 valores
o
de parmetros distintos de la distribucin en cuestin simultneamente.
a
o
o
a
Si sobre la pantalla que se obtiene se pulsa el botn derecho del ratn y se elige la opcin
o
o
o
Opciones de Ventana... del men emergente resultante, se obtiene el cuadro de dilogo
u
a
Opciones Distribucin Acumulada, en cuyo campo Valores para la Variable: se
o
pueden introducir hasta 5 valores distintos de la variable para los que se halla la funcin de
o
distribucin, la funcin de densidad o funcin masa de probabilidad y el complementario
o
o
o
de la funcin de distribucin. (Ver Figura 6.4).
o
o

Figura 6.4: Opciones Distribucin Acumulada.


o

Si, al pulsar el botn derecho del ratn, se elige la opcin Opciones de Anlisis... del
o
o
o
a
men emergente resultante se obtiene el cuadro de dilogo Opciones... de la distribucin
u
a
o
correspondiente, en cuyos campos se pueden introducir hasta 5 pares de valores distintos
de los parmetros para las que se hallar los valores de la funcin de distribucin, la
a
a
o
o
funcin de densidad o la funcin masa de probabilidad y el complementario de la funcin
o
o
o
de distribucin.
o

6.3.

Inversa de la funcin de distribucin


o
o

La opcin CDF Inversa del Cuadro de dilogo Opciones Tabulares permite hallar el
o
a
valor de la funcin inversa de la funcin de distribucin (valor cr
o
o
o
tico) en 5 puntos dados
para el modelo elegido.
85

6.4. Opciones grcas


a
Si sobre la pantalla que se obtiene se pincha con el botn derecho del ratn y se elige
o
o
la opcin Opciones de Ventana... del men emergente resultante, se obtiene el Cuadro
o
u
de dilogo Opciones de la Funcin Inversa, (Figura 6.5) en cuyo campo CDF se
a
o
pueden introducir hasta 5 valores distintos para los que se halla la inversa de la funcin
o
de distribucin.
o

Figura 6.5: Opciones de la Funcin Inversa.


o

6.4.

Opciones grcas
a

Si sobre una salida cualquiera se elige el icono Opciones Grcas de la barra de hea
rramientas, se obtiene la opcin Densidad/Funcin Masa, (Figura 6.6) entonces se reo
o
presenta la funcin de densidad (para variables aleatorias continuas) y la funcin masa de
o
o
probabilidad (para variables aleatorias discretas) para el modelo de probabilidad elegido;
y la opcin CDF, representa la funcin de distribucin para el modelo de probabilidad
o
o
o
elegido.
86

Prctica 6. Algunas distribuciones de probabilidad conocidas


a

Figura 6.6: Opciones Grcas.


a

6.5.

Ejemplos prcticos
a

1. Para este ejemplo se van a utilizar las distribuciones normales N (0,1) y N (5,10).
Para ello se accede al siguiente men: Descripcin / Distribuciones / Distribuu
o
ciones de Probabilidad...
A continuacin se selecciona la distribucin con la que se va a trabajar, en este caso
o
o
Distribucin Normal.
o

Figura 6.7: Distribuciones de probabilidad.

Una vez que se ha introducido la distribucin con la que trabajar, aparece una
o
primera pantalla de resultados (Figura 6.8) donde se indica con que parmetro se
a
est trabajando y la representacin grca de esa distribucin.
a
o
a
o

87

6.5. Ejemplos prcticos


a

Figura 6.8: Ventana de resultados Distribuciones de Probabilidad.


Como se ha visto, el programa trabaja por defecto con la distribucin seleccionada
o
con unos parmetros aleatorios, para cambiar los parmetros con los que se trabaja
a
a
o aadir ms (puede trabajar hasta con 5 distribuciones con distintos parmetros)
n
a
a
se pulsa el botn de la derecha del ratn y se selecciona la opcin Opciones de
o
o
o
Anlisis y en esta ventana se introducen los parmetros elegidos.
a
a

Figura 6.9: Seleccin de parmetros.


o
a
Clculo de Probabilidades
a
Una vez seleccionada una distribucin, para calcular probabilidades sobre ella, se
o
selecciona en el icono Opciones Tabulares, la opcin Distribucin Acumulatio
o
88

Prctica 6. Algunas distribuciones de probabilidad conocidas


a
va. Los resultados obtenidos se muestran a continuacin:
o

Figura 6.10: Algunas Probabilidades.

Es decir, la probabilidad de que la variable sea menor que 0 (0.5 en la primera


distribucin y 0.3085 en la segunda), el valor de la funcin de densidad en el cero
o
o
(0.3989 y 0.035205 respectivamente) y la probabilidad de que la variable sea mayor
que 0 (0.5 y 0.6914).
Para calcular alguna de estas probabilidades para otro valor que no fuese el cero, se
pulsa en el botn de la derecha del ratn, la opcin Opciones de Ventana. En la
o
o
o
ventana resultante se introducir el valor deseado.
a

Clculo de Valores Cr
a
ticos

En este caso, el objetivo es encontrar un valor que acumula una determinada probabilidad. Para realizarlo, una vez seleccionada la distribucin, se pulsa el botn de
o
o
Opciones Tabulares y Inversa CDF. Una vez realizado esto, aparece una ventana con la siguiente tabla:

89

6.5. Ejemplos prcticos


a

Figura 6.11: Valores que acumulan una determinada probabilidad a la izquierda.

Para cambiar estos valores se pulsa el botn derecho del ratn y la opcin Opciones
o
o
o
de Ventana. En esta ventana se sustituye alguno de los valores que aparecen por
los que se quieran calcular.

Figura 6.12: Opciones Inversa CDF

Opciones Grcas
a

Para obtener resultados grcos dentro del men de probabilidad se pulsa el icono
a
u
Opciones Grcas, apareciendo la siguiente ventana:
a

90

Prctica 6. Algunas distribuciones de probabilidad conocidas


a

Figura 6.13: Opciones Grcas.


a

En esta ventana hay las siguientes opciones:

a) Densidad/Funcin Masa: funcin de densidad de la variable si es continua


o
o
o la funcin masa de probabilidad si es discreta.
o

b) CDF: funcin de distribucin.


o
o

c) Funcin de Supervivencia: funcin que representa la probabilidad de obteno


o
er un valor mayor o igual que un valor dado.

d ) Funcin Log Supervivencia: logaritmo de la funcin anterior.


o
o

e) Funcin de Riesgo: se obtiene dividiendo la funcin de densidad por la funo


o
cin de supervivencia y se utiliza para modelizar datos sobre tiempo de vida.
o
91

6.5. Ejemplos prcticos


a

Figura 6.14: Grcos de densidad, CDF, Supervivencia y Riesgo.


a

2. El nmero medio de automviles que llega a una estacin de suministro de gasolina


u
o
o
es de 210 por hora. Si dicha estacin puede atender a un mximo de 10 automviles
o
a
o
por minutos, determinar la probabilidad de que en un minuto dado lleguen a la
estacin de suministro ms automviles de los puede atender.
o
a
o
El nmero aleatorio de automviles que llegan a la estacin de servicio en un minutos
u
o
o
puede representarse por una variable X de Poisson de parmetro = 210/60 = 3,5
a
llegadas/minuto.
La probabilidad que hay que calcular es P [X > 10], ya que para que lleguen a la
estacin ms automviles por minuto de los que se puedan atender es necesario que
o
a
o
lleguen ms de 10 por minuto.
a
Para calcular dicha probabilidad se elige el men Grcos / Distribuciones de
u
a
Probabilidad... y en su pantalla de entrada se selecciona la opcin Poisson. Se
o
pulsa Aceptar y sobre la pantalla resultante se pulsa el botn derecho del ratn y se
o
o
elige la opcin Opciones de Anlisis para obtener el cuadro de dilogo Opciones
o
a
a
Poisson, (ver Figura 6.15) en cuyo campo Media se introduce el valor 3.5. Al
pulsar Aceptar ya se tiene la distribucin P(3,5) como distribucin de trabajo.
o
o
92

Prctica 6. Algunas distribuciones de probabilidad conocidas


a

Figura 6.15: Opciones Poisson.

Para calcular la probabilidad pedida se selecciona la opcin Opciones Tabulares


o
de la barra de herramientas y en el men resultante la opcin Distribucin Acuu
o
o
mulada. Se pulsa Aceptar y a continuacin el botn derecho del ratn sobre
o
o
o
cualquier zona de la pantalla resultante y se elige la opcin Opciones de Veno
tana... del men emergente obtenido. As se llega a la caga de dilogo Opciones
u

a
Distribucin Acumulada, (ver Figura 6.16 cuyo campo Valores para la Vario
able se rellena con el valor 10.

Figura 6.16: Opciones Distribucin Acumulada.


o

Al pulsar Aceptar se obtiene la pantalla que se presenta a continuacin, en cuya


o
ultima la, se observa que P [X > 10] = 0,00101939.

93

6.5. Ejemplos prcticos


a

Figura 6.17: Resultado.

94

Prctica 6. Algunas distribuciones de probabilidad conocidas


a

6.6.

Ejercicios

1. En una biblioteca se hace un estudio de su actividad y el estado de sus fondos


a) Se observa que se realizan unos 7 prstamos cada media hora.
e
Calcular la probabilidad de hacer 6 prstamos en la prxima media hora.
e
o
Calcular la probabilidad de hacer ms de 3 prstamos en la prxima media
a
e
o
hora.
Calcular la probabilidad de hacer entre 5 y 8 prstamos en la prxima
e
o
media hora.
Calcular la probabilidad de hacer 15 prstamos en la prxima media hora.
e
o
Calcular la probabilidad de hacer menos de 13 prstamos en la prxima
e
o
media hora.
b) La probabilidad de que un libro devuelto est daado es 0.3.
e n
Calcular la probabilidad de que haya 10 libros daados entre los 50 que se
n
han devuelto hoy.
Calcular la probabilidad de que haya entre 10 y 15 libros daados entre
n
los 50 que se han devuelto hoy.
Calcular la probabilidad de que haya mas de 7 libros daados entre los 50
n
que se han devuelto hoy.
Calcular la probabilidad de que haya menos de 14 libros daados entre los
n
75 que se han devuelto otro d
a.
c) Las horas que la biblioteca est abierta a la semana sigue una distribucin
a
o
Normal de media 45 horas y desviacin t
o pica 2.5 horas.
Calcular la probabilidad de que la biblioteca est abierta entre 43 y 46
e
horas.
Calcular la probabilidad de que la biblioteca est abierta ms de 45 horas.
e
a
Calcular la probabilidad de que la biblioteca est abierta menos de 41
e
horas.
Calcular la probabilidad de que la biblioteca est abierta entre 44 y 45
e
horas.
2. En un ao, el nmero medio de accidentes en una curva es 4. Determine la proban
u
bilidad de que en seis meses:
a) no ocurra ningn accidente
u
b) ocurran exactamente 2
c) menos de 5
95

6.6. Ejercicios
d ) ms de 5
a
3. Un canal de comunicacin recibe impulsos independientes a razn de 12 impulsos
o
o
por microsegundo. La probabilidad de un error de transmisin es de 0.001 para cada
o
impulso. Calcular las probabilidades de los siguientes sucesos.
a) No hay ningn error en un microsegundo.
u
b) Hay exactamente un error en un microsegundo.
c) Hay al menos un error en un microsegundo.
d ) Hay exactamente dos errores en un microsegundo.
4. En una facultad universitaria el Coeciente Intelectual tiene una media de 108 y
una desviacin t
o pica de 7 unidades. Se pide calcular los valores del Coeciente de
Inteligencia tales que
a) Por debajo de l se encuentre el 5 % de los individuos.
e
b) Por encima se siten el 25 % de los alumnos.
u
c) Por debajo estn el 80 % de los estudiantes.
e
5. Dada una distribucin 2 ,
o
a) Representar en un mismo grco las funciones de distribucin de una 2 con
a
o
10, 20, 30, 40 y 50 grados de libertad
b) Si X

2 , calcular P [X 32,1], P [X 20] y P [13,8 X 22,4].


12

c) Calcular a, b y c tales que:


P [X a] = 0,85 con X
2
20
P [X b] = 0,975 con X
2
18
P [X c] = 0,05 con X
2
10

96

Prctica 7
a
Estimacin
o
7.1.

Introduccin
o

Esta prctica desarrolla la obtencin de intervalos de conanza para una y dos muesa
o
tras. Los intervalos de conanza que proporciona el programa se basan exclusivamente
en poblaciones normales. Por lo tanto, un paso previo antes de calcular los intervalos de
conanza es contrastar la existencia de normalidad en los datos, desde la opcin Gro
a
cos / Grcos Exploratorios / Grco Probabil
a
a
stico... del Men principal. En el
u
grco resultante se concluye que los datos proceden de una distribucin normal si stos
a
o
e
se encuentran sobre la bisectriz.

7.2.

Intervalos de conanza para una muestra

Cuando se utilizan directamente los datos de una unica muestra de una poblacin, Stat
o
graphics permite el trabajo con estimacin por intervalos en poblaciones normales meo
diante la opcin Descripcin / Datos Numricos / Anlisis Unidimensional... del
o
o
e
a
Men principal del programa.
u

Figura 7.1: Men Anlisis unidimensional...


u
a
Al pulsar el icono Opciones Tabulares (Figura 7.2) aparece la opcin Intervalos
o
de Conanza que permite hallar intervalos de conanza para la media y la desviacin
o
97

7.2. Intervalos de conanza para una muestra


t
pica de una poblacin normal con desconocida y de la cual se supone que la variable
o
dada es una muestra.

Figura 7.2: Opciones Tabulares.

Si sobre la ventana de resultados obtenida se pulsa el botn derecho del ratn y se


o
o
elige la opcin Opciones de Ventana... del men emergente resultante, se obtiene el
o
u
Cuadro de dilogo Opciones de Intervalos de Conanza de la Figura 7.3, cuyo campo
a
Nivel de Conanza permite elegir el nivel de conanza.

Figura 7.3: Nivel de conanza

98

Prctica 7. Estimacin
a
o

7.2.1.

Ejemplo prctico
a

Los siguientes datos corresponden a las calicaciones obtenidas por 25 alumnos e dos
pruebas consecutivas de una misma asignatura. (Se supone que las dos variables siguen
una distribucin normal).
o
prueba1
5.27
6.20
5.97
6.84
5.78
7.62
4.87
6.88
7.34
6.34
6.30
7.16
4.71
6.52
6.49
5.68
6.32
6.61
4.56
5.09
6.23
4.06
6.53
5.75
4.71

prueba2
3.61
5.29
4.55
3.08
4.71
2.58
3.96
5.69
7.32
5.36
2.71
4.78
4.49
4.85
5.70
0.65
4.66
2.68
2.91
2.46
6.81
3.82
3.02
3.73
8.05

Utilizando el 95 % de conanza obtenga un intervalo de conanza para la media y la


desviacin t
o pica de cada una de las variables.
Como siempre el primer paso ser la introduccin de los datos en el editor, para luego elegir
a
o
el men apropiado para el anlisis. En este caso ser: Descripcin / Datos Numricos
u
a
a
o
e
/ Anlisis Unidimensional...
a
En la ventana que aparece, se introduce en la casilla Datos: la variable, en este caso
prueba1.

99

7.2. Intervalos de conanza para una muestra

Figura 7.4: Entrada de datos.

El programa genera la misma ventana de resultados que se ha estudiado con anterioridad. Para obtener los intervalos de conanza se pulsa el icono de Opciones Tabulares
y se selecciona Intervalos de Conanza

Figura 7.5: Opciones Tabulares.

Los intervalos al 95 % para la media y la desviacin t


o pica de la variable prueba1, en
este caso, son:
100

Prctica 7. Estimacin
a
o

Figura 7.6: Intervalos de conanza para la variable prueba1.


El programa calcula el intervalo de conanza para la desviacin t
o pica, este intervalo
tiene la siguiente expresin:
o
(n 1)s2
;
2
n1,/2

(n 1)s2
2
n1,1/2

Por lo tanto, para obtener los intervalos para la varianza, se elevan los extremos
del intervalo al cuadrado, resultando el intervalo de conanza al 95 % para la varianza:
[0,529;1,679].
Anlogamente para la variable prueba2 se obtienen los siguientes intervalos al 95 %
a
para la media y la desviacin t
o pica:

Figura 7.7: Intervalos de conanza para la variable prueba2.


Y el intervalo para la varianza es: [1.713;5.437].

7.3.

Intervalos de conanza para dos muestras

Cuando se utilizan directamente los datos de dos muestras de dos poblaciones diferentes,
Statgraphics permite el trabajo con estimacin por intervalos para comparar medias y
o
varianzas en poblaciones normales mediante la opcin Comparacin / Dos Muestras
o
o
/ Comparacin de Dos Muestras... (ver Figura 7.8) del Men principal del programa.
o
u

Figura 7.8: Men Comparacin de Dos Muestras...


u
o

101

7.3. Intervalos de conanza para dos muestras


La pantalla de entrada se presenta en la Figura 7.9. En el campo Muestra 1: de
esta pantalla se introduce el nombre de la variable que contiene los datos de la primera
muestra. En el campo Muestra 2: se introduce el nombre de la variable que contiene
los datos de la segunda muestra. Statgraphics calcula un intervalo de conanza para la
diferencia de medias de la Muestra 1 - Muestra 2, y para el cociente de las varianzas de las
muestras. Si se pulsa el botn Aceptar se obtiene el resumen de los datos con el nmero
o
u
de valores de las dos muestras y sus dominios de denicin.
o

Figura 7.9: Comparacin para dos muestras.


o

Como en todo anlisis con Statgraphics, en la barra de herramientas del anlisis se


a
a
puede elegir el icono Opciones Tabulares que permite las opciones Comparacin de
o
Medias y Comparacin de Desviaciones T
o
picas.
La opcin tabular Comparacin de Medias ofrece por defecto los intervalos de
o
o
conanza al 95 por ciento para las medias de las dos poblaciones (supuestas normales)
basados en las dos muestras. Tambin ofrece los intervalos de conanza para la diferencia
e
de medias suponiendo igual varianza para ambas poblaciones normales.
La opcin tabular Comparacin de Desviaciones T
o
o
picas ofrece por defecto los
intervalos de conanza al 95 por ciento para las desviaciones t
picas de las dos poblaciones
(supuestas normales) basados en las dos muestras. Tambin ofrece el intervalo de conanza
e
para el cociente de varianzas.
102

Prctica 7. Estimacin
a
o

Figura 7.10: Opciones Tabulares.

7.3.1.

Ejemplo prctico
a

Con los datos del ejemplo anterior, puede considerarse que las puntuaciones medias sean
iguales en las dos pruebas?

Para responder a la pregunta hay que obtener un intervalo de conanza para la diferencia de medias de las dos variables. Dado que no se tiene ninguna informacin sobre las
o
varianzas poblaciones, en primer lugar, habr que obtener un intervalo de conanza para
a
el cociente de varianzas y determinar si stas se pueden considerar iguales.
e

Para ello, se selecciona el men Comparacin / Dos Muestras / Comparacin


u
o
o
de Dos Muestras.... Se introducen las dos variables como se ha indicado, prueba1 en el
campo Muestra 1: y prueba2 en el campo Muestra 2:. (Ver Figura 7.11)
103

7.3. Intervalos de conanza para dos muestras

Figura 7.11: Entrada de datos.

Se pulsa Aceptar y se obtienen algunos resultados por defecto para este anlisis. A
a
continuacin se pincha el icono de Opciones Tabulares y se seleccionan las opciones
o
Comparacin de Medias y Comparacin de Desviaciones T
o
o
picas.

En la ventana de Comparacin de Desviaciones T


o
picas se obtienen los siguientes
resultados (ver Figura 7.12).
104

Prctica 7. Estimacin
a
o

Figura 7.12: Comparacin de Desviaciones T


o
picas.

El intervalo que se obtiene para el cociente de varianzas: [0,136099;0,700856] no contiene el valor 1, luego no se puede considerar que las varianzas sean iguales. Es decir, en
este caso no se puede llegar a una conclusin nal sobre la diferencia de medias, ya que
o
el programa slo resuelve el intervalo de conanza para diferencia de medias, cuando las
o
varianzas se suponen iguales.
En el caso de haber obtenido que las varianzas fueran iguales, se observar ahora el
a
resultado obtenido en la ventana Comparacin de Medias.
o

Figura 7.13: Comparacin de Medias.


o

En cuyo caso, con el intervalo [0,923251;2,46555] obtenido suponiendo varianzas iguales,


se llega a la conclusin que la media de la prueba2 es superior.
o

105

7.4. Ejercicios

7.4.

Ejercicios

1. Se ha extra una muestra de 20 paquetes cuyos peso en gramos son:


do
520, 503, 538, 447, 506, 436, 478, 463, 525, 494
521, 524, 515, 550, 457, 520, 428, 519, 491, 548
Obtener la estimacin del peso medio de la poblacin mediante un intervalo de
o
o
conanza a un nivel del 80 % y del 95 %.
2. Se estudian los pesos de dos grupos de nios recin nacidos segn sus madres fumen
n
e
u
o no. Los pesos son:
Fumadora

2.3
2.1
No fumadora 3.1
4.5

3.2
2.6
2.7
3.6

3.1
2.4
3.6
3.7

2.5
2.7
3.8
3.8

3.2 2.6 2.3 2.9 2.2 2.6 2.4 3 2.1 3 2.6


3.6
3.1 2.9 2.7 3.4 3.1 2.9 2.7 3.4 3.1 2.9
4.2

Suponiendo que ambos grupos provienen de poblaciones normales de medias desconocidas y con varianzas desconocidas pero iguales, determinar si inuye que la
madre sea fumadora en el peso del hijo.
3. Los tiempos de ejecucin (en segundos) de 40 trabajos procesados por un centro de
o
clculo han resultado ser:
a
10 19 90
23 13 36
27 1 57
9 11 20

40 15 11 32 17 4 152
101 2 14 2 23 34 15
17 3 30 50 4 62 48
13 38 54 46 12 5 26

Calcular la media y la cuasidesviacin t


o pica muestrales. Obtener intervalos de conanza al 90 % para la media y la desviacin t
o pica del tiempo de ejecucin de un
o
trabajo, suponiendo que esta variable aleatoria tiene distribucin normal.
o
4. Se quiere comparar dos mtodos, A y B para determinar el calor latente de fusin
e
o
del hielo. La siguiente tabla da los resultados obtenidos (en calor por gramo de
as
o
o
masa para pasar de -0.72 C a 0 C ) usando reiteradamente ambos mtodos:
e
Mtodo A 79.98 80.04
e
80.05 80.03
Mtodo B 80.02 79.94
e
106

80.02
80.02
79.98

80.04 80.03 80.03


80.00 80.02
79.97 79.97 80.03

80.04 79.97
79.95 79.97

Prctica 7. Estimacin
a
o
Se supone que en ambos mtodos el calor tiene una distribucin normal. Obtener
e
o
un intervalo de conanza al 95 % para comparar las mediciones medias obtenidas
por ambos mtodos. Comprobar primero si se puede suponer que las varianzas son
e
iguales.
5. Se ha hecho un estudio para comparar los tiempos de acceso, en diferentes momentos
del d a internet desde ordenadores domsticos con modem. Para ello se cargan 8
a,
e
pginas web por la tarde en el per
a
odo de 14 a 15 h. y, con el mismo ordenador, las
mismas 8 pginas por la noche en el periodo de 22 a 23 h. Los respectivos tiempos
a
de acceso en minutos fueron los siguientes:
De 22 a 23 h.
De 14 a 15 h.

2.9 1.4 1.2


2.3 1.5 1

3.4 1.3 2.5


2.7 1.4 1.9

1.6 1.8
0.8 1.1

Puede demostrarse que el acceso es ms lento en el horario nocturno?


a

107

Anda mungkin juga menyukai