Anda di halaman 1dari 143

1

PROBABILIDAD Y ESTADSTICA I

Los estudiantes desarrollarn capacidades y habilidades a travs del anlisis de
problemticas relacionadas con su entorno, para aplicar la probabilidad y la estadstica en los
campos de la investigacin, el desarrollo tecnolgico y el medio ambiente, para resolver los
problemas que se les presenten.


























ESTADSTICA
DESCRIPTIVA
VARIABLES Y
REPRESENTACIONES
DISTRIBUCIONES DE
FRECUENCIAS
MEDIDAS DE
TENDENCIA CENTRAL
MEDIDAS DE
DISPERSIN
- Introduccin
- Poblacin y
muestra
- Variables
discretas y
continuas.
- Redondeo de
datos.
- Notacin
sistematizada.
- Cifras
significativas.
- Clculos.
- Toma de datos.
- Ordenacin.
- Distribuciones de
frecuencias
- Intervalos de clase.
- Limites de clase.
- Limites reales de clase.
- Tamao del intervalo
de clase.
- Marca de clase.
- Histograma y polgonos
de frecuencia.
- Distribuciones de
frecuencia.
- Distribuciones de
frecuencia acumulada.
- Distribuciones de
frecuencia relativas
acumuladas.
- Promedios.
- Media.
- Mediana
- Moda
- Cuartiles.
- Deciles.
- Percentiles.
- Regresin lineal

- Dispersin.
- Rango.
- Desviacin media.
- Rango
semiintercuartlico.
- Rango entre
percentiles.
- Desviacin tpica.
- Varianza.
2


















CATEGORAS: DIVERSIDAD, ESPACIO Y TIEMPO

VALORES:
LIBERTAD, JUSTICIA, SOLIDARIDAD


PROCEDIMENTALES:
Investigar, Clasificar, Debatir, Ordenar,
Comunicar, Representar, Estimar, Predecir,
Experimentar, Trazar, Graficar, Observar,
comprobar.

PROBABILIDAD
INTRODUCCIN PERMUTACIONES Y
COMBINACIONES.
PROBABILIDAD
AXIOMTICA
PROBABILIDAD PARA
EVENTOS SUCESIVOS
- Antecedentes.
- Conceptos bsicos
- Modelos
matemticos.

- Selecciones
sucesivas.
- Diagramas de rbol.
- Proceso de contar.
- Subconjunto.
- Combinaciones.
- Teorema del
binomio.
- Eventos
complementarios.
- La probabilidad de la
unin de eventos.

- Probabilidad
condicional.
- Eventos
independientes.
- Teorema de Bayes.
- Selecciones al Azar.
3
INDICE

PRIMERA PARTE ESTADSTICA DESCRIPTIVA

. Encuadre sugerido para el curso .................................................................................5
. Introduccin. El mtodo cientfico ..................................................................... 8
. Secuencias Didcticas (de la 1 a la 10) ....................................................................... 11
. Captulo 1. Conceptos bsicos. ................................................................................ 24
. Ejercicios Capitulo 1 .................................................................................................. 37
. Capitulo 2.
. Descripcin grfica de un conjunto de datos. (tablas estadsticas) ............................ 40
. Ejercicios construccin de tablas estadsticas ............................................................ 49
. Distribuciones de frecuencias datos no agrupados...................................................... 52
. Distribuciones de frecuencias datos agrupados .......................................................... 54
. Ejercicios relativos a distribuciones de frecuencias .................................................... 60
. Descripcin grfica (reglas para la representacin grafica) ........................................ 62
. Ejercicos relativos a la descripcin grfica ................................................................ 84
. Descripcin numrica de un conjunto de datos ........................................................... 89


SEGUNDA PARTE TEORA DE LA PROBABILIDAD

. Introduccin. Conceptos bsicos. ................................................................................. 100
. Definicin y propiedades de la probabilidad ................................................................. 102
. Probabilidad bajo el enfoque clsico. ............................................................................ 103
. Probabilidad bajo el enfoque de frecuencia relativa y la ley de los grandes nmeros.. 105
. Probabilidad subjetiva y probabilidades a favor. .......................................................... 107
. Reglas bsicas para combinar probabilidades. ............................................................. 111
Regla general para la adicin de probabilidades.
Diagramas de Venn
Regla de la multiplicacin para eventos independientes.
. Ejercicio relativos a los conceptos bsicos de la probabilidad ...................................... 116
4
. Distribuciones de probabilidad. Introduccin. ............................................................ 120
Variables aleatorias, continuas y discretas
Funcin de probabilidad y funcin de distribucin
. La distribucin binomial. ............................................................................................ 125
. Ejercicios relativos a distribucin binomial ............................................................... 130
. La distribucin normal. ............................................................................................... 131
. La distribucin normal estndar ................................................................................. 133
. Ejercicios relativos a distribucin normal ................................................................... 136
. Regresin lineal simple. ............................................................................................... 138
. Bibliografa .................................................................................................................. 142































5
PRIMERA SEMANA Actividad 1 Encuadre (sugerencia 5 horas Total)

Primera clase Presentacin del curso por parte del profesor: Se sugiere que el profesor inicie la
primera sesin presentndose (tambin puede presentarlo algn alumno que lo conozca) y pidiendo a
los alumnos que se presenten, la dinmica puede ser sentados en semicrculo y que cada alumno
presente a un compaero, (nombre y pasatiempo favorito). Otro modo puede ser que escriban 5 de las
mejores cosas que han hecho en la vida y las utilicen como carta de presentacin o bien que entre
compaeros se presenten sealando 3 aspectos positivos.

Segunda sesin El profesor con aportaciones de los alumnos resear brevemente las respuestas a las
siguientes preguntas: Qu es la estadstica? Para que sirve la estadstica? De qu trata este curso? Se
presentarn los contenidos del curso, aunque ya estn impresos en su libro de texto, se sugiere
presentarlos a groso modo a travs de un mapa conceptual en el pizarrn.

Tercera sesin (2 Horas) Se presentar el horario de la materia y se tomarn acuerdos para la
calificacin, sugerencia;

1. Evaluacin terico conceptual, mediante dos exmenes parciales y un final ......... 40 puntos.
2. Actitudes, participacin, disposicin al trabajo, asistencia ...................................... 10 puntos.
3. Acciones practicas (resolucin de ejercicios en clase) .................................... 10 puntos.
4. Acciones practicas, resolucin de ejercicios tareas extraclase ......................... 10 puntos.
5. Presentacin de resultados estadsticos en una investigacin real caso ........ 20 puntos.
6. Servicio social. Adopta un abuelo (3 servicios 10 Hrs. al menos documentados). 10 puntos

Los criterios anteriores se podrn modificar por acuerdo con los alumnos, y se sugiere que firmen una
lista en la cual estn definidos los criterios aceptados por el grupo.

Se sugiere tambin hacer las siguientes preguntas a los estudiantes: (Cada alumno deber entregar sus
respuestas por escrito al profesor -debidamente firmadas-, para su anlisis extraclase)
- Qu esperas de este curso?
- Que esperas de este profesor y que le sugieres para que se logren las metas?
- Qu te gustara que sucediera durante este prximo semestre en esta materia?
6
- Qu no te gustar que ocurriera en esta materia?
- A que estas dispuesto(a) a comprometerte para que todo funcione bien en este curso?

Quinta sesin. Finalmente se puede pedir que realicen la siguiente tarea, la cual podr ser compartida
en plenaria:

Tarea de primera semana
Desde Google busque estadstica, (si es necesario puede consultar otras fuentes vea la bibliografa
sugerida-) luego haga un recuento de cuantos pases tienen un instituto nacional de estadstica u oficina
nacional de estadstica, Qu funcin tienen estos institutos?

Ah mismo visite otros sitios y responda a las siguiente preguntas: (Puede ir a la pgina
http://www.usuarios.lycos.es/esantoyo vaya al link UDG y luego a maestra, luego estadstica y luego
a gua estadstica, ah encontrar algunas cosas de las que busca)

1. A quin se atribuye la frase "Todas las oscuridades que presenta nuestra sociedad podran ser
iluminadas por la Estadstica" ?

2. Qu es la estadstica? haga un resumen del origen e historia de la estadstica.

3. Cuales son los registros ms antiguos que se mencionan acerca de la estadstica y a que cultura se
refieren? Egipcios, sumerios, Judos, Chinos, Aztecas ?

4. Para que sirve la estadstica? seale y explique al menos 10 usos reales o potenciales de la
estadstica.

5. Estadstica y computacin. Explique como se relacionan ambas, y que paquetes (software) son los
ms utilizados en estadstica.

6. Diga porque frecuentemente se dice que la estadstica es una mentira.

7. En la pgina de esantoyo en la misma gua de estadstica al final lea como apoya la estadstica al
mtodo cientfico y explquelo.

8. Dado que tu pas es Mxico consulta las pginas http://www.siea.sagarpa.gob.mx
http://www.inegi.gob.mx y la pgina de la PROFECO estn muy interesantes!!!

9. Seala que aprendiste de la actividad nmero ocho?


7
Vaya al sitio del INEGI, o busque INEGI Mxico en cifras, desde cualquier motor de bsqueda, o bien
teclee SIMBAD sistema municipal de base de datos del INEGI, en la parte superior izquierda de la
pgina principal Estadsticas despliegue la pestaa y elija la informacin que le interese, o si lo
prefiere consulte ah mismo indicadores estratgicos de ocupacin y empleo
http://www.inegi.org.mx/sistemas/tabuladosbasicos2/indesttrim.aspx?c=26232&s=est tambin puede
teclear directamente;
http://www.inegi.org.mx/sistemas/mexicocifras/MexicoCifras.aspx?e=0&m=0&sec=M&ind=1005000
001&ent=0&enn=Estados%20Unidos%20Mexicanos&ani=2010&src=0


Otros sitios de inters:

1. http://espaol.dir.yahoo.com/ciencia_y_tecnologa/matemticas/estadstica/
2. http://www.mor.itesm.mx
3. http://www.qro.itesm.mx
4. http://www.estadistica.unam.mx
5. http://www.dgeec.gov.py
6. http://xue.unalmed.edu.co
7. http://www.cft.gob.mx
8. http://www.consulta.mx/

10. Agregue usted dos sitios diferentes INTERESANTES- donde se pueda hallar informacin
estadstica importante y seale que tipo de informacin es.









8
INTRODUCCIN


EL MTODO CIENTFICO

En su primera etapa, el mtodo cientfico requiere observar la realidad, registrando los hechos
observados, con frases del lenguaje ordinario del tipo de:

a) Se lanz una moneda tres veces, primero sali guila, luego sol y despus tambin sol.
b) En un tubo de ensayo se mezcl agua con cido sulfrico, la mezcla se calent y hubo una
disminucin de volumen del 10%
c) Se quito el tope a los precios y estos se dispararon; luego vinieron demandas de aumento salarial en
el sector obrero.
Acerca de estas situaciones se pueden plantear las siguientes interrogantes: Muy bien, al lograrse tales
y cuales condiciones, se observaron tales y cuales resultados, pero, ser que siempre que se den las
mismas condiciones se producirn idnticos efectos? Qu pasa si se cambian dichas condiciones por
otras?
Para contestar a estas preguntas el ser humano recurre a una segunda etapa del mtodo cientfico que
es la Experimentar con la realidad, de tal manera que podamos decir si son falsos o verdaderos los
enunciados del tipo de si se dan las condiciones P entonces se tendr el resultado Q o ms
brevemente, si P entonces Q. En su forma ms general, dicha experimentacin consistir en
reproducir las condiciones P y ver si se registra o no Q.
Una vez que se ha establecido la validez del enunciado si P entonces Q, ste puede entonces usarse
con fines de prediccin, para orientar la toma de decisiones, al indicar que debe que debe generarse la
condicin P para que se de Q o no deben generarse las condiciones P, pues de hacerlo se dar Q.
Debe hacerse notar que la validez de un enunciado general del tipo si P entonces Q nunca es
definitivo; siempre se esta a la espera de que la evidencia experimental acumulada en el futuro lo
desmienta.
Las leyes obtenidas en las dos etapas anteriores pueden combinarse entre s para dar lugar a una teora.
En ella se ver que algunos de esos enunciados se pueden deducir a partir de otros ms generales,
mediante un proceso de deduccin lgica. (Mtodo inductivo primero y luego deductivo). No slo esto,
9
sino tambin por la deduccin se puede enriquecer la teora con nuevos enunciados que, an no
observados, constituyen predicciones susceptibles de ser verificadas mediante experimentos. De esta
confrontacin con el experimento resultar una teora enriquecida, si las predicciones se confirman, o
disminuida en caso contrario.
Esto es en breve, una resea del quehacer del hombre en busca de conocimiento cuando sigue el
mtodo cientfico, y la podemos ilustrar mediante el siguiente diagrama de flujo:














Si No



El mtodo cientfico: Diagrama de flujo

Ntese el papel tan importante que juegan la observacin y la experimentacin en la aplicacin del
mtodo cientfico. En cuanto a la deduccin de las consecuencias que se obtienen de las premisas de la
teora es una actividad primordialmente lgica. Requiere que la teora se exprese en una buena sintaxis,
y en ese sentido la matemtica ha prestado grandes servicios a la ciencia, al servicio de la cual pone su
buena construccin lgica para las deducciones.
Observacin y
experimentacin
Formulacin de
teoras
Deduccin de
predicciones
Nuevos
experimentos
Concuerdan las
predicciones con el
experimento?
10
Los resultados de la experimentacin se denominan datos y la primera parte de este curso de estadstica
(estadstica descriptiva) se encarga del manejo de datos empricos; recopilacin, ordenamiento,
procesamiento, interpretacin y descripcin de resultados.
En una segunda parte se estudian las leyes de la probabilidad y los modelos matemticos adecuados a
los fenmenos en los que interviene el azar lo cual es el soporte para la estadstica inferencial tercera
parte-, la cual trata de los modos de obtener informacin acerca de una poblacin para modelar mejor
sus caractersticas, bsicamente los modos de extraer informacin sobre una poblacin solamente a
partir del anlisis de algunos individuos, suponiendo que estos constituyen una muestra representativa.
Es importante hacer esto, pues a menudo experimentar con toda la poblacin resulta costoso, y a veces,
de hecho, es imposible.
































11
A partir de segunda semana. Secuencia 1 Conceptos bsicos.
Da 1 Apertura
En torno a los conocimientos previos, se propiciar una lluvia de ideas sobre conceptos y
procedimientos comunes en torno a la actividad de desarrollo, Iniciado con los conceptos bsicos
acerca de la estadstica; Primer momento en equipos de 3 integrantes construyan (elaboren) una
definicin, puedes consultar tu libro texto o no consultar libros, de los siguientes conceptos;
a. Estadstica.
b. Estadstica Descriptiva.
c. Estadstica Inferencial.
d. Muestra.
e. Muestreo.
f. Variables, Cualitativas (nominales)
g. Variables cuantitativas (ordinales y cardinales).
h. Medidas de tendencia central.
i. Medidas de dispersin.
j. Rango y amplitud.
k. Frecuencia.
l. Clases, grupos e intervalos.
m. Probabilidad.
n. Nivel o grado de confianza.
o. Planteamiento y prueba de hiptesis.
p. Correlacin y regresin.
q. Cuartiles, deciles y Percentiles.
r. Poblacin o universo
s. Muestra.
t. Elemento o unidad esencial
Desarrollo
En un segundo momento, buscar (rigurosamente) las mismas definiciones ahora en su libro de
texto, (tambin podr consultar otras fuentes, por ejemplo, la bibliografa sugerida en fsico o en
internet, si lo consideran necesario y/o conveniente se podrn redefinir los conceptos construidos en el
primer momento.
12
Cierre
Finalmente en una sesin plenaria se pondr en comn todos los conceptos tratados y se llegar a una
definicin comn a todo el grupo, para cada concepto.

Secuencia 2 Variables cuantitativas y cualitativas
Apertura. Renete en equipos de tres integrantes y responde a lo siguiente;

a) Considerando algunos aspectos fsicos, emocionales, intelectuales u otros, de los seres
humanos, enumera al menos 20 variables o caractersticas que puedan ser observados o
medidos.
Enumera ahora 15 caractersticas que se pueden observar en un animal cualquiera.

Enumera otras 15 caractersticas que se pueden medir en una organizacin, fbrica o empresa,
equipo deportivo, etc.

b) De las caractersticas que mencionaste en los incisos anteriores seala 20 de aquellas que si
puedas medir o pesar o cuantificar. (Variables cardinales)

De las caractersticas que mencionaste en los incisos anteriores seala 20 de aquellas que slo
puedas observar pero que no se pueden medir. (Variables nominales)

Finalmente seala 5 caractersticas que no se puedan medir o pesar y que adems de ser
observables puedan tener un sentido de orden. (Variables ordinales)

Desarrollo
A partir de tu lista de variables de los seres humanos, elige una o varias caractersticas que te parezcan
interesantes o necesarias de conocer de los alumnos de tu grupo. Realiza una medicin real de la o las
caractersticas elegidas en las personas de tu grupo, (la caracterstica debe ser medible en trminos de
cantidad) registra en tu libreta los datos obtenidos y consrvalos pues los necesitars en futuras tareas.
Define con precisin cual es tu universo o poblacin, tu muestra y tu unidad de observacin, puede ser
slo tu grupo o el turno o toda la escuela, etc.

13
Cierre.
- Reescribe la definicin de variables cardinales (continuas y discretas), ordinales y nominales,
escribe un ejemplo de cada una de ellas.
- Responde a los ejercicios que se presentan en las pginas 37 a 39 (subtitulo 1.2) de tu libro
de texto.


Secuencia 3 Tablas estadsticas
Apertura. Por equipos de tres integrantes responda a las preguntas planteadas. Si lo desean pueden
buscar la informacin en su libro texto o en otras fuentes citadas en la bibliografa.

Qu es una tabla estadstica?
Cul es la utilidad de construir tablas estadsticas?
Cules son los elementos necesarios indispensables que debe contener la tabla estadstica?

Desarrollo. A continuacin, con la informacin dada, construye la tabla estadstica correspondiente y
anxale la columna de frecuencias porcentuales. Si se considera necesario se pueden observar los
ejemplos correspondientes en el libro texto, p. 40-49

El Anuario estadstico 2011, del Centro de Bachillerato Tecnolgico industrial y de servicios 226 ,
informa que, de los 388 alumnos egresados en este ao, 130 egresaron de la especialidad de
administracin, 155 de Informtica, 86 de contabilidad, 78 de electrnica y 35 de Mantenimiento
industrial.

Con la siguiente informacin construye otra tabla estadstica;
Segn informacin del anuario estadstico del estado de Jalisco a partir del apartado de medio
ambiente, http://www.inegi.org.mx/est/contenidos/espanol/sistemas/sisnav/default.aspx?proy=aee&edi=2009&ent=14 se
registraron durante el ao 2008 en el estado, 643 incendios con un total de 23,932 Hectreas
afectadas, 12,481 de pastizal, 9,576 hierbas y arbustos, 773 de renuevo y 1,102 de arbolado adulto. El
estado de Jalisco se divide en 12 regiones Norte, Altos Norte, Altos Sur, Cinaga, Sureste, Sur, Sierra
de Amula, Costa Sur, Costa Norte, Sierra Occidental, Valles y Centro, investigue ms informacin y
presente la tabla por regiones.
14
a) De modo similar al ejercicio anterior y desde el mismo apartado de medio ambiente, presente
tablas estadsticas que informen acerca de los rubros Volumen de basura recolectada por regin
(en el estado de Jalisco), y seale cul es el municipio con mayor volumen de basura generada
per cpita.

b) A partir de informacin del anuario estadstico de Jalisco, seale el mnimo, el promedio y el
mximo de los volmenes de concentracin de los principales contaminantes atmosfricos en la
zona metropolitana de Guadalajara en 2008, segn nivel de concentracin en particular el
Ozono y el Plomo.

c) A parir del apartado indicadores financieros, observe la tabla estadstica Tasas de inters
netas mensuales de los depsitos a plazo fijo y de los pagars con rendimiento liquidable al
vencimiento 2008, responda a lo siguiente: si usted tuviera que invertir $50,000 durante un
ao, en que cuenta los habra invertido y cunto ganara a final de ao por concepto de
intereses? Considere que el objetivo es ganar la mayor cantidad posible.

d) Visite http://www.banxico.org.mx/ busca el apartado informe sobre la inflacin Junio 2011 y
a partir de una tabla estadstica, seala cual fue el producto con mayor y menor porcentaje de
variacin mensual y cual fue su incidencia en la inflacin en Junio de 2011.

e) En un texto de cinco renglones explica como se calcula la inflacin mensual.

Cierre
A partir de los datos obtenidos de tus compaeros de grupo, presenta una tabla estadstica que muestre
alguna de las caractersticas observadas.







15
Secuencia 4 Tablas estadsticas
Apertura. Realiza las lecturas Terminologa relativa a datos agrupados y Agrupamiento en intervalos
de clase pgina 55 a 59. Responde a las siguientes preguntas:
a) Qu es y para que sirve una tabla estadstica?
b) Define intervalo de clase
c) Cul es un nmero adecuado de intervalos de clase?
d) A que se refiere el trmino categora numrica de una variable?
e) Cmo se calcula una marca de clase?
f) Define Lmites o fronteras de clase (reales y aparentes)
g) A qu se refiere el trmino distribucin en clases y frecuencias?
h) Defina amplitud o anchura aparente de una clase
i) Exprese en dos renglones como supuestamente se distribuyen los datos dentro de una clase
j) A qu se refiere la frase evitar que los datos originales se traslapen en los intervalos?

Desarrollo.
A partir de los siguientes Datos construye una tabla estadstica que muestre la informacin de modo
conciso, averigua la informacin necesaria para completar exhaustivamente los datos que debe tener
las tablas.

Calificaciones del grupo de estadstica (2011-A ) primer examen parcial
9.5 5.8 7 7.5 10 8.5
6.5 6.5 9 7 2.5 7.5
5.5 7.7 8 8 3.5 9
9.5 8.5 8.5 8 8 9.5
7.5 8 6.5 9 9 7
8.5 9.5 5 8 6 7

Porcentajes cambiarios en 30 valores de la bolsa de valores en un da.
6.6 0.4 5.7 1.5 -2.1
2.2 8.3 -1.8 2 -3.9
2.3 -1.9 -2 1.6 4.8
-0.9 -1.4 7.4 5.2 4
7.9 0 -1.3 2.5 2.3
-0.4 -0.8 6.1 5.8 -3




16
Tiempos de coagulacin en minutos al pinchar 32 dedos.
1.42 1.38 1.42 1.46 1.21 1.49 1.41 1.66
1.42 1.4 1.37 1.39 1.45 1.23 1.48 1.43
1.42 1.57 1.46 1.41 1.36 1.4 1.37 1.4
1.37 1.38 1.34 1.32 1.33 1.42 1.27 1.36


Cierre
Resuelve los ejercicios del apartado correspondiente que se muestran en la pgina 60.



Secuencia 5 (Medidas de tendencia central datos no agrupados)
Apertura
Lluvia de ideas sobre conceptos y procedimientos comunes en torno a las medidas de tendencia central
media (promedio), mediana (valor que queda a la mitad de la distribucin) y moda (como el valor que
ms se repite), intervalo (como una forma de clasificar o categorizar la informacin), de modo que se
cuente con una idea inicial suficiente para realizar la actividad.
Desarrollo
a) La siguiente informacin muestra el nmero de hermanos en 20 familias diferentes. Observe la
informacin y seale el valor promedio que mejor represente a este conjunto de datos, Expresa ese
valor promedio en trminos de palabras.

1, 3, 5, 6, 5, 5, 2, 3, 7, 5, 4, 5, 3, 2, 6, 5, 3, 0, 4, 5

b) Seala a continuacin el valor (nmero) que divide o separa en dos partes, al 50% de los que ms
tienen y al 50% de los que menos tienen (hermanos). Exprsalo en palabras.

c) Ahora escribe el nmero que ms veces se repite y expresa esto en palabras, es decir, describe a este
grupo de familias en trminos que cul es el nmero de hijos que ms frecuentemente aparece en estas
familias.



17
Cierre
Investiga en tu libro texto los conceptos de Media, mediana y moda y escrbelos. Replica lo que
realizaste en las actividades a, b y c, con la informacin que obtuviste de la variable medida en tu grupo
en la secuencia anterior.



Secuencia 6 (Medidas de tendencia central datos agrupados)
Apertura
Lluvia de ideas sobre conceptos y procedimientos comunes en torno a las medidas de tendencia central
media (promedio), mediana (valor que queda a la mitad de la distribucin) y moda (como el valor que
ms se repite), intervalo (como una forma de clasificar o categorizar la informacin), de modo que se
cuente con una idea inicial suficiente para realizar la actividad.
Desarrollo

La siguiente grfica muestra las calificaciones de un grupo de estudiantes.


Sealar:
a) De qu tipo de grfica se trata.
b) Cul es el ancho de intervalo.
6.00 8.00 10.00
Calificaciones
0
1
2
3
4
5
6
A

l

u

m

n

o

s

C a l i f i c a c i n
18
c) Cuntas veces aparece la calificacin 7.
d) Cul es la moda.
e) Cul es la mediana.
f) Cul es el promedio o media.
g) Cuntos datos son en total.

Al final de esta actividad, busque la definicin de histograma y grfica de barras, seale en que
radica la diferencia entre ambos, as como las propiedades del primero.

Cierre
A continuacin los alumnos tendrn que replicar lo que hicieron en el ejercicio anterior, pero aplicando
lo aprendido en otra situacin de su inters, definida en la actividad siguiente.
Se pide a los estudiantes construir una grfica similar para la siguiente lista de datos, que se refieren al
nmero de novias/os que han tenido los alumnos de un grupo, y encontrar las mismas medidas
sealadas en los incisos d, e y f de la actividad anterior.

Alumna 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Novios 3 5 6 7 1 2 2 3 1 2 3 4 5 3 1 1 2 2 3 2


Secuencia 7 Descripcin grafica de un conjunto de datos
En el siguiente link encontrar el nmero de pacientes atendidos por adicciones en Jalisco durante
2005; http://www.inegi.gob.mx/est/contenidos/espanol/sistemas/aee06/estatal/jal/index.htm vaya al
apartado 5 salud y luego al 5.17 pacientes farmacodependientes atendidos por organismos no
gubernamentales, por sexo, grupo de edad y grado de dependencia, 2005. Construya un histograma
con esta informacin (por rangos de edad) y calcule e interprete medidas de tendencia central.

Elaborar grafico circular con informacin de personas atendidas por grados de dependencia, es decir,
calcule los porcentajes correspondientes a cada grado de dependencia y luego exprselos en una grafica
circular, (de pastel), una gua detallada de cmo se elabora una grafica de este tipo, la puede encontrar
en este texto, pgina, 63.

19
Porcentajes. Nuevamente desde, el mismo sitio del inegi http://www.inegi.gob.mx/est/contenidos etc.
Vaya al apartado 6 educacin, cultura y deporte, sub-apartado 6.2 poblacin de 6 aos y ms por
regin y municipio segn condicin para leer y escribir y sexo. Calcule porcentajes por regin y dentro
de regin SUR haga un comparativo entre los diferentes municipios y seale cual de ellos es el ms
aventajado y cual el menos aventajado.
Observe el cuadro y la grafica en el apartado G6.1 y seale que errores contiene al presentar la
informacin, diga como la presentara usted. Realice lo mismo con la grafica G6.2 a que poblacin se
refiere? De que cantidad habla?

Secuencia 8

Apertura
1.- El facilitador destaca la importancia del conocimiento de una poblacin a partir de la
descripcin adecuada de una variable en la vida cotidiana. Cmo analizaras a una poblacin o
grupo si necesitas conocer algunas caractersticas de la misma?
3.-El facilitador obtiene los conocimientos previos del alumno: Por medio de una lluvia de ideas
en donde se destaque la necesidad de investigar diferentes caractersticas poblacionales.
4.- El facilitador plantea una situacin problemtica en la cual deduzca y analice la importancia de
manejar el tema a abordar, relacionndolo a las acciones y experiencias de la vida real. Qu
pasara si no sabes como se realiza un estudio de una poblacin a partir de la descripcin adecuada
de una variable, y que conclusiones se podran extraer al respecto de esa poblacin?

Desarrollo
Este ejercicio tiene como finalidad ponerlo en contacto con la realidad socioeconmica de su localidad,
en sus diferentes aspectos. Para ello se sugieren las siguientes actividades:

a) Disee una forma para vaciar los datos de una encuesta que contenga preguntas sobre:
- Padre: Edad, ocupacin, grado de escolaridad, ingresos mensuales, medio de transporte a su
trabajo, y tiempo que emplea viajando entre su hogar y el lugar de trabajo.
- Madre: Edad, ocupacin, grado de escolaridad, ingresos mensuales, medio de transporte a su
trabajo, y tiempo que emplea viajando entre su hogar y el lugar de trabajo.
- Hijos: Nmero, sexo, edad, ocupacin y grado de escolaridad de cada uno.
20
- Casa: es propia o alquilada; valor de la propiedad o renta mensual, segn corresponda.
- Necesidades: Gasto mensual del hogar en alimentacin, transporte, vestido, salud y diversiones;
por separado.
- Salud: Nmero de visitas al medico el ao anterior por motivo de enfermedad y dinero invertido
en este rubro.
- Orgenes: Edad, ocupacin y grado de escolaridad alcanzado por cada uno de los abuelos.

b) Seleccione una colonia Ms rica y otra Ms pobre que la suya.
c) Visite diez casas de su colonia y otras diez de cada una de las dos colonias seleccionadas en el punto
d) Aplique el cuestionario que usted diseo en a) a cada uno de las treinta familias.
e) Escriba una composicin acerca de las impresiones que recibi durante las visitas.
f) De los datos obtenidos, d el porcentaje de los ingresos de cada familia que se destina a
alimentacin, transporte, vestido y diversiones.
g) Cmo se relaciona cada uno de los porcentajes anteriores con el estrato socioeconmico de la
poblacin?

Cierre

Los equipos expondrn en plenaria el desarrollo de sus trabajos y sus conclusiones, las conclusiones
pueden abordar aspectos como calidad de vida (salud, alimentacin, vivienda, vestido, empleo, etc.) y
nivel educativo.











21
Secuencia 9 Medidas de dispersin


A
P
E
R
T
U
R
A


Solicitar a las estudiantes que lleven el dato real o un estimado del monto del ltimo recibo
telefnico, para quienes cuenten con ese servicio. Una vez listados en el pizarrn, se les pide que
los agrupen por intervalos revisar la parte correspondiente en su libro de texto Pgina 55-60 y que
obtengan las siguientes medidas:
a) Rango.
b) Media, mediana y moda. Pginas
c) Percentiles 25% y 75%, para el resumen de cinco puntos.


D
E
S
ARRO
L
L
O

Luego se pide a los estudiantes consultar la parte correspondiente en su libro de texto para sacar la
varianza y la desviacin estndar pgina 89-93, por intervalos o
2
, o, junto con las sumatorias
correspondientes. Se orienta su atencin hacia esos componentes y su significado.
Para comparar, se induce a la obtencin de la desviacin estndar a partir de los datos simples,
utilizando la calculadora cientfica o el programa Excel. Luego se proceda a calcular empleando la
frmula. Se completa con la varianza y el coeficiente de variacin. En esta parte, se introducen
preguntas generadoras que ayuden a la construccin de significado a las estudiantes sobre las
medidas. Por ejemplo:
- Dnde hay ms desviacin?
- Es mucha o poca? Por qu?
- Qu significa eso sobre el fenmeno?


C
I
E
RR
E

Parte I:

Se solicita a las estudiantes que recuperen en sus palabras los conceptos implicados y los
procedimientos que hicieron.

Parte II:

Rplica con otro tipo de datos (por ejemplo, del ingreso familiar).













22
Secuencia 10 Descripcin grfica y analtica de un conjunto de datos. RESUMEN


A
P
E
R
T
U
R
A


Analizar el siguiente problema y resolverlo en forma individual:
Partiendo de los estndares establecidos por el sector salud como ideales, relativos al peso,
estatura y edad de las personas (indicar tabla, citando fuente de informacin,); obtener los datos de
tu grupo, referentes al peso y estatura de cada uno de sus integrantes, agrupar los datos obtenidos,
calcular las medidas de centralizacin, contrastar las medidas obtenidas con las medidas ideales
enunciadas en la tabla, indicar en que porcentaje est cada alumno arriba o debajo de las variables
ptimas.
- Reunirse en equipos de 3 integrantes y comparen los resultados obtenidos.
- Si hay diferencias discute con tus compaeros, con los argumentos requeridos para demostrar
que hay razn en las respuestas obtenidas.
- Como equipo obtener una solucin completa del problema.
- Exponer estas propuestas de solucin ante el grupo.
- Obtener conclusiones sobre el trabajo realizado y conceptos que no hayan sido comprendidos o
que se desconocen completamente.
- Comentar que tipo de variables conocen, cuales son las diferencia de unas y otras y donde
clasificara las que se mencionan en el problema
- Hacer una relacin de variables con caractersticas afines
- Analiza si los datos presentados son agrupados o como los clasificaras.







D
E
S
A
RR
O
L
L
O
- Integrado en tu equipo de trabajo analicen el material escrito que se te entregue.
- Considerando la lectura realizada y con la gua del profesor si consideran necesario registra,
ordena y clasifica los datos obtenidos en el grupo.
- Elabora un glosario para que tengas presentes los conceptos de: frecuencia, frecuencia
acumulada, marca de clase, intervalo de clase, lmite superior e inferior, lmites reales,
frecuencia relativa y frecuencia relativa acumulada.
- Determinar el tamao del intervalo de clase para cada grupo de trabajo
- Investiga las frmulas utilizadas para la obtencin de las medidas de tendencia central, para
datos agrupados y no agrupadas y elabora un formulario
- Se sugiere para mayor precisin instalar una bscula para pesar a los estudiantes y una forma
de medir su estatura.
- El maestro aplicar tcnicas grupales para estudiar grupos de alumnos mas pequeos o
grandes (primeros y ltimos semestres)
- El mismo procedimiento con otras variables y otros campos de la ciencia
23
- Se formar una tabla indicando un mtodo de solucin para las medidas de tendencia central.




C
I
E
RR
E
- En plenaria: los alumnos presentarn sus resultados al comparar las medidas de centralizacin
con otros grupos
- De igual manera con otras variables (temperatura, velocidad, elasticidad) usada en campos de
economa, sociales, biologa, etc.
- Los alumnos indicarn Qu medida de centralizacin es la ms confiable?
- Al graficar los datos, explicar su comportamiento. Por qu est sesgada a la derecha o a la
izquierda o centrada, etc.?
- Al usar diferentes intervalos de clase en un mismo problema Cuales fueron sus
observaciones?
- Contrastar la informacin del maestro para la evaluacin del grupo.
Consultar con un especialista los aspectos de nutricin del grupo para las recomendaciones
correspondientes.

Recursos didcticos Materiales
Computadora
Can
Proyector de acetatos
Televisin
Equipo de laboratorio multimedia
Pintarron


Material visual o audiovisual
Pelculas
Revistas
Mapas conceptuales
Libros
Cuaderno de trabajo (Obligatorio)
Diccionarios
Copias de textos y marcadores

Bibliografa

1. LEVIN Y. Richard & Rubin Davis S. Estadstica para administradores.Prentice Hall. 6
a
edicin. 1996
2. CHRISTENSEN H. Estadstica paso a paso. Trillas. 3 edicin. 1997.
3. CUELLAR L. Estadstica y Probabilidad. Compaa editorial nueva imagen. 2 edicin. 1994.
4. MANSON/ LIND/ MARCHAL. Estadstica para Administracin y Economa. Alfaomega. 10 edicin. 2001.
5. MONTAO A., Estadstica I. Pac, S.a de C.V. Mxico 1992,
6. FREUND JOHN E. y SIMON GARY A. Estadstica elemental. Pearson (Phh). 8
va
edicin. 1994
7. LARIOS R. IRMA y GUTIERREZ F. GERARDO. Material para la materia de estadstica de la Maestra en
Ciencias MCEC Ciidet. Quertaro. 2001
8 CHAO, LINCOLN. Estadstica para las Ciencias Administrativas. McGraw-Hill. 3
ra
edicin. 1993.
9 KAZMIER, LEONARD e.t. Estadstica aplicada a la Administracin y a la Economa. McGraw-Hill. 1993.
10 CANAVOS, GEORGE C. Probabilidad y Estadstica (aplicaciones y mtodos). McGraw-Hill. 1988.
11 WALPOLE RONALD. Probabilidad y estadstica. McGraw-Hill. 1992.
12 MENDEHALL, WILLIAM. Estadstica para administradores. Gripo editorial Iberoamrica. 1988
13 FREEMAN, HAROLD. Introduccin a la inferencia estadstica. Trillas.
14 MILLER, IRWIN y FREUND E. JOHN. Probabilidad y Estadstica para Ingenieros. Editoral Reverte.
15 SNEDECOR W GEORGE e.t. Mtodos estadsticos. C.E.C.S.A.
24
CAPTULO I

Introduccin y conceptos bsicos.

Si bien el origen de la estadstica es tan lejano como la civilizacin misma, no alcanz un desarrollo
notable hasta el surgimiento de los Estados, acontecimiento bajo el cual se convirti en un instrumento
preciso para describirlos utilizando elementos numricos. De ah viene el nombre de esta disciplina,
cuyo estudio en su forma elemental ser objeto de muchas de las pginas que componen este libro.

La estadstica es un mtodo cientfico que encuentra aplicacin en una gran diversidad de campos del
saber humano y cuya utilidad, como qued demostrado desde el siglo pasado, va ms all de la mera
descripcin, pues permite el descubrimiento de leyes y tendencias. Dentro de los muchos ejemplos que
permiten ilustrar esto, basta con citar el caso del estadstico alemn Ernesto Engel** (1821 1896) que
adquiri renombre en el terreno de las investigaciones econmicas y sociales al descubrir la ley que
lleva su nombre y que se enuncia as: Cunto menor es el ingreso familiar, mayor es la proporcin
destinada a la compra de alimentos.

Con datos recabados en 1857, observ que esa proporcin era de 62%, 55% y 50% en familias de clase
baja, media y alta, respectivamente. Al difundirse esta ley, result evidente que cuanto mayor es la
parte del ingreso familiar que se invierte en alimentos, menor es la que se puede destinar a otros fines
(vestido, salud, recreacin comodidades, etc.) y viceversa. Por esta razn, esta proporcin ha sido
utilizada como unidad de medida del bienestar social.

El estudiante encontrar con suma facilidad una gran variedad de aplicaciones del mtodo estadstico,
lo cual ser suficiente para deponer la idea de que la estadstica es la simple acumulacin de hechos y
cifras con fines meramente acadmicos o de archivo; ms bien se convencer de que se trata de una
disciplina que incide significativamente en la vida cotidiana de los seres humanos.

No obstante, como todo instrumento, la estadstica tiene sus limitaciones; no puede, por ejemplo,
disear investigaciones ni seleccionar problemas para someterlos a estudio, ni puede, por si sola,
aportar resultados valiosos o dar interpretaciones de resultados en ausencia de una slida teora. Por
otro lado, todos los resultados estadsticos, exactos o no, expresan de modo preciso mediante nmeros.
Pero preciso no es sinnimo de exacto; son exactas las operaciones aritmticas, pero las mediciones
25
que conducen a los datos que las hacen posibles no siempre son confiables. Por esta razn los
resultados estadsticos deben ser siempre sometidos a crtica.

Pero, qu es la estadstica? Desde mediados del siglo XVIII hasta una centuria despus, la estadstica
ha sido objeto de muchsimas definiciones, las cuales han obedecido, evidentemente, a las diferentes
concepciones que se han tenido de ella a lo largo del tiempo. Sin embargo, ser suficiente por ahora
con que nos familiaricemos con una definicin que responde a los objetivos de este curso:








Tambin podemos entender la estadstica como la ciencia que permite responder a ciertas preguntas
basndose en datos empricos, es decir, en datos que se originan de la observacin o la experiencia
Entendida as, diremos que es la ciencia que tiene que ver con los mtodos que dan respuesta a
determinadas cuestiones, mediante la recoleccin y la interpretacin apropiadas de datos empricos. Las
observaciones o las experiencias que constituyen los datos pueden resultar de la investigacin
cientfica, de la actividad comercial o de la vida cotidiana. En cualquier caso, las estadstica busca dar
sentido a los datos; esto implica tanto la recoleccin como la interpretacin de stos.

La recoleccin abarca el diseo de las investigaciones empricas la planeacin de lo que se quiere
observar, la calidad y suficiencia de la observacin y el registro de los datos; la interpretacin, el
anlisis y el resumen de los datos, la extraccin de conclusiones a partir de ellos y el reporte y la
presentacin de los resultados.

Para su estudio, la estadstica se divide en dos grandes ramas; descriptiva e inferencial.





Estadstica
Es un conjunto de procedimientos que sirven para organizar y resumir datos, hacer inferencias
a partir de ellos y transmitir los resultados de manera clara, concisa y significativa.
Estadstica descriptiva

Es un conjunto de procedimientos que sirven para organizar, describir y sintetizar datos, sin que las
conclusiones que se extraigan de stos rebasen su mbito especfico.
26
Por ejemplo, si al recolectar las calificaciones de un grupo de estudiantes es una asignatura determinada
las resumimos diciendo que la calificacin promedios es 7.5, estamos describiendo y sintetizando una
caracterstica de los datos; es decir, del total de calificaciones. La validez de esta descripcin numrica
atae nicamente al grupo de estudiantes del cual provienen los datos y no encierra incertidumbre.





Las inferencias y generalizaciones en esta rama, que complementa a la descriptiva, se basan en la teora
de la probabilidad, algunos de cuyos fundamentos sern estudiados en la segunda parte de este curso.

El carcter propio del mtodo estadstico descansa en el estudio de grupos o masas, a travs de los
elementos que los componen. En estadstica no interesan aisladamente las caractersticas de un
elemento de la masa. No interesa, por ejemplo, que la vida til de una lmpara de cierto diseo sea de
10 mil horas y la de otra de 3 mil. Lo que importa es ver la tendencia de cierto nmero de lmparas que
puedan ser representativas de toda la produccin; lo que se busca es descubrir, por ejemplo, que la vida
til promedio de ese tipo de lmparas de de 7 mil horas. Si lo que se estudia es un grupo de personas,
no interesa que una de ellas en particular profese el catolicismo y otra el protestantismo, por mencionar
algo; lo que quisiramos conocer podran ser los cultos existentes y el que ms se profesa en el grupo.

El medio empleado para el estudio estadstico es la enumeracin o recuento. Enumerar es captar las
caractersticas de los elementos sometidos a estudio y anotarlos o medirlos bajo las condiciones que se
presentan. La estadstica es, bsicamente, un mtodo de induccin basado en los grandes nmeros y sus
propiedades, con lo cual se eliminan los errores propios de la observacin y se aumenta la validez de
los resultados obtenidos.

1.1 CONCEPTOS FUNDAMENTALES







Estadstica inferencial
Es un conjunto de procedimientos que se emplean para hacer inferencias y generalizaciones respecto
a una totalidad, partiendo del estudio de un nmero limitado de casos tomados de esta ltima.
Poblacin
Tambin llamada universo, es todo conjunto de personas, cosas u objetos con ciertas caractersticas
comunes.
27
Por ejemplo: los estudiantes de preparatoria con promedio mnimo de 8 en el Estado de Jalisco en
2004; las fbricas de automviles existentes en la Repblica Mexicana hasta el 31 de diciembre de
1989; el conjunto de los nmeros primos; el conjunto de las formas imaginables en que se puede
repartir las riqueza nacional, etc.

De estos ejemplos debe quedar claro que en estadstica el concepto de poblacin no se refiere
necesariamente a personas ni objetos materiales. Tampoco tiene que estar integrada por un gran
nmero de elementos. Si decimos los nmeros naturales < 10, estaremos definiendo con precisin un
universo que consta de muy pocos elementos.

Cuando se trata de elementos concretos, por ejemplo, estudiantes, fbricas de automviles, ejidos,
viviendas, etc., su definicin rigurosa se alcanza, por regla general, aadiendo a la caracterstica la
ubicacin o lugar y el perodo, es decir, el espacio de tiempo en el cual se considera vlida esa
caracterstica. Ejidos en el municipio de Crdoba hasta el 31 de junio de 1980. viviendas con ms
de 3 habitaciones en Yucatn hasta el 30 de marzo de 1993, etc. Un elemento puede ser individual o
colectivo. En una poblacin formada por estudiantes, el elemento o unidad esencial es el estudiante,
cuyo carcter es, evidentemente, individual; en una poblacin formada por fbricas de automviles, el
elemento es la fbrica de automviles, de naturaleza colectiva, ya que se trata de un establecimiento
en el que hay muchos obreros, empleados, departamentos, etc. Es claro que, para su estudio, revisten
mayor complejidad los universos formados por elementos de ndole colectiva.



Si de una poblacin formada por N elementos, se toma una parte de ellos, esta parte o subconjunto de
la totalidad ser una muestra. Grficamente, universo, elemento y muestra se representan como en la
figura siguiente:




Cada uno de los componentes de una poblacin recibe el nombre de elemento o unidad esencial
28






Relatividad de los trminos poblacin, elemento y muestra.

Consideremos un universo formado por todas las facultades de una universidad: cada facultad ser un
elemento de ese universo. Si tomsemos unas cuantas facultades, tendramos una muestra (Fig. 1.2.2).
No obstante, el universo objeto de estudio podra ser redefinido en un momento dado. Podramos estar
interesados en estudiar una facultad determinada, que sera un universo cuyos elementos podran estar
dados por sus profesores, alumnos, empleados, etc.



Figura 1.2.

Tambin podemos considerar como universo al conjunto de todas las universidades de un pas. En este
caso la universidad que inicialmente habamos considerado pasa a ser un elemento del nuevo universo.
Si tomsemos unas cuentas universidades del conjunto, esa porcin o subconjunto pasara a formar una
muestra.




Definida una poblacin cualquiera, se llama muestra a toda porcin de elementos sacada de ella.
29


Figura 1.2.4

Lo anterior pone de manifiesto la relatividad de los trminos poblacin, elemento y muestra.



Muestreo, inferencia estadstica, parmetro y estadgrafo.

Con frecuencia es imposible o innecesario observar las caractersticas de todos y cada uno de los
elementos de la poblacin, es decir, realizar un censo.

Cuando un mdico quiere conocer la calidad de la sangre de un paciente, le basta con ordenar el
anlisis de una muestra, ya que en el caso de lquidos o de otros cuerpos de constitucin homognea,
una porcin o muestra es exactamente igual a la totalidad. Este ejemplo ilustra que el anlisis del todo
no slo es imposible sino innecesario. Lo mismo sucedera con otros universos, por ejemplo, el
conjunto de lmparas de cierto diseo producidas por una fbrica; si se les somete a una prueba de
resistencia que implique su destruccin para conocer esa caracterstica, es imposible plantearse el
someter a todas a prueba. En este caso la necesidad de estudiar el todo, pero a travs de una muestra,
resulta indispensable.

En otros casos, donde es urgente conocer la situacin que guarda cierto orden de cosas para la toma de
decisiones, resulta inconveniente levantar un censo porque los resultados de la indagacin podran
resultar extemporneos. Por esto es necesario estudiar el todo a travs de una muestra. Adems, es
claro que si un universo es muy numeroso, el censo resulta muy costoso debido a la gran cantidad de
recursos materiales y humanos que hay que poner en juego. Esta es la razn por la cual los censos
nacionales de poblacin, de agricultura y ganadera o industriales, entre otros, slo puede ejecutarlos el
Estado mediante instituciones dedicadas a ello. En Mxico el INEGI.

30
El procedimiento mediante el cual se recopila informacin de los elementos de una muestra, se conoce
con el nombre de muestreo; diferente al censo, que consiste en hacer lo mismo, pero con todos los
elementos que componen un universo.

Analizado lo anterior, diremos que cuando es imposible, innecesario o inconveniente observar
caractersticas de todos los elementos de un universo, se recurre a estimarla a partir de una o ms
muestras tomadas de l.

No obstante, la calidad de las estimaciones depende, bsicamente, de la representatividad de la muestra.
Una muestra es representativa si rene, en trminos generales, las caractersticas del universo del cual
procede.

Esta propiedad no siempre se cumple. Si la poblacin est integrada, digamos, por personas, una
porcin de ellas, tomada de manera arbitraria, difcilmente tendr las caractersticas generales del
conjunto. As, pues, no es fcil cumplir el requisito de la representatividad, sin embargo, la teora del
muestreo aporta elementos para poder cumplirlo en grado aceptable. En otras palabras, existen
procedimientos de seleccin de muestra que garantizan altos niveles de representatividad,
independientemente del universo de que se trate.

Ahora bien, el estimar las caractersticas de un universo de la manera sealada anteriormente es un
procedimiento estadstico que va de lo particular a lo general. Dicho de otro modo, es una inferencia o
induccin, la cual se define as:





Toda descripcin numrica que sintetice informacin respecto a un universo, recibe el nombre de
parmetro: si se refiere a una muestra, estadgrafo o, como le llaman algunos autores, estadstico. Por
ejemplo, el porcentaje de viviendas en mal estado en un universo es un parmetro; en una muestra
tomada de dicho universo, un estadgrafo.

Inferencia estadstica
Es el proceso mediante el cual se estiman caractersticas de una poblacin a partir de las
observaciones hechas en una muestra sacada de esa poblacin.

31
Fundamental en el quehacer estadstico es la nocin de variable.




Se dice que algo vara si puede tomar por lo menos dos valores, grados o formas o, incluso, cuando
una caracterstica puede estar presente o ausente en una situacin especfica.

Dicho esto, podramos estar de acuerdo en que nociones como sexo, nmero de hijos por familia, color
de automvil, nmero de huelgas anuales, nivel de estudios, etc., son variables, ya que son
caractersticas que admiten por lo menos dos valores, grados o formas dentro de un universo
determinado.

No obstante, la prctica docente ensea que, al empezar a familiarizarse con este tema, los alumnos
suelen confundir la caracterstica que admite variaciones con el universo o con los elementos del
mismo. Comprese la lista del prrafo anterior con esta otra; persona, vivienda, lmpara, automvil.
Estos trminos se refieren a objetos y no a caractersticas de objetos; por lo tanto, no son variables.
Variables seran las caractersticas que quisiramos indagar de esos objetos. Por ejemplo, de un
universo formado por personas podramos conoce su edad, lugar de nacimiento, nivel de escolaridad,
clase social a que pertenecen, etc. Estas peculiaridades son variables. Tambin son variables, de un
universo formado por automviles, su marca, modelo, color, potencia, etc., ya que son caractersticas
que van cambiando de auto en auto.

Otra confusin frecuente se da con los datos estadsticos. Consideremos estos ejemplos: nmero de
huelgas y produccin de azcar- Si decimos que el nmero de huelgas en una regin y en un
perodo determinados es A, estamos aportando informacin global del fenmeno, que es un dato
estadstico, no una variable. El nmero de huelgas se convierte en variable si se estudia, digamos, en un
perodo determinado y en diferentes regiones, o en un asola regin y en diferentes perodos
(anualmente, sexenalmente, etc.) lo mismo pasa si afirmamos que la produccin de azcar en el ingenio
X es B toneladas: se trata de un dato estadstico, no de una variable. La produccin de azcar se
convertir en variable cuando se indague en diferentes fbricas y en un mismo momento o en una
misma fbrica y en distintos momentos.
Variable.- Es toda propiedad o caracterstica que admite variaciones dentro de un conjunto de
objetos.

32
Ejemplo 1.1 La tabla siguiente muestra la produccin de azcar en la zafra 1988/1989, en cuatro
ingenios de los ms importantes del pas (Fuente: Manual Azucarero Mexicano, 1990).

Ingenio Produccin
(miles de ton.)






En este caso la produccin es una variable, porque se ha indagado en un mismo momento (zafra 88/89)
y en diferentes fbricas.


Ejemplo 1.2 A continuacin se muestra la produccin de azcar en el ingenio El Potrero, durante
cuatro zafras consecutivas (Fuente: Idem. P. 373).

Ejemplo 1.2

Zafra Produccin
(miles de ton.)

84/85 138.2
85/86 160.4
86/87 158.0
87/88 146.60

Tambin aqu la produccin es una variable, porque se registra en una misma fbrica (Ingenio el
Potrero ) y en diferentes momentos.

Ahora bien, toda variable tiene dos niveles un conceptual o terico y otro operacional o de medicin, Si
nos preguntaran qu se entiende por alcoholismo, por ejemplo, podramos decir que se trata de una
enfermedad progresiva y mortal, exclusiva de los seres humanos, que consiste en la ingestin de
bebidas alcohlicas. De ser ms o menos correcta esta definicin, estaramos en el nivel estrictamente
conceptual o terico, que no permite efectuar ninguna medicin. Si, en cambio, partir de este concepto
definimos al alcoholismo como el grado de dependencia de los seres humanos respecto a la ingestin
de bebidas alcohlicas, habremos pasado del nivel conceptual a otro donde es posible medir, pues en
una poblacin dada encontraramos desde el que no ha bebido jams una gota de alcohol, el abstemio,
hasta el que no puede dejar de beber.


El potrero 154.8
Emiliano Zapata 116.9
San Cristbal 153.3
Tala 115.3
33
La correspondencia entre el nivel terico y el operacional de una variable se consigue mediante un
procedimiento llamado medicin, que no debe entenderse como un procedimiento arbitrario de
asignacin de nmeros u otros smbolos a las observaciones: et asignacin se efecta en concordancia
con un conjunto de procedimientos admisibles para la variable conceptual que se est manejando.

A nivel operacional o de medicin, variable es un conjunto de nmeros u otros smbolos asignados a
las observaciones, que sirven para clasificarlas con respecto a una variable conceptual. Sin embargo, no
ahondaremos en esta cuestin; ser suficiente, por ahora, que sepamos identificar variables, ya que del
tipo a que pertenezcan depender el procedimiento estadstico con que se les trate, tema que
estudiaremos ms adelante.

1.3 TIPOS DE VARIABLES

Desde el punto de vista conceptual, existen tres tipos de variables nominales, ordinales y cardinales.

Variables Nominales. Son las ms simples y abundantes y su nica funcin es clasificar. Su variable
operacional correspondiente es una escala nominal que sirve para clasificar las observaciones en un
conjunto de categoras mutuamente excluyentes cuyo orden de colocacin es indistinto. A estas se les
puede asignar cifras u otros smbolos arbitrarios con el fin de distinguirlas; si son cifras no tienen
ningn valor intrnseco ni propiedades numricas como la aritmtica.

En la tabla 1.3.1 Observamos que los smbolos 1, 2, 3, y 4 si bien son los mismos que se emplean
para representar nmeros, no representan sino distritos de riego; es decir, carecen de propiedades
numricas. Adems el orden que se les de en la tabla es indistinto, ya que slo sirven para distinguir un
distrito de otro. Ntese de manera importante que la variable sealada es el distrito de riego y no el
nmero de hectreas sembradas.

Tabla 1.3.1

Distrito de Hectreas
Riesgo sembradas

1 680
2 1200
3 300
4 500

34
Veamos ahora el siguiente ejemplo:

Variable Estado Civil


Escala de soltero casado viudo divorciado unin libre
Medicin
Nominal 1 2 3 4 5


Categora de la variable

Vase que, a nivel de medicin, estado civil en este ejemplo es un conjunto de 5 categoras
mutuamente excluyentes, cuyo orden de colocacin es indistinto, ya que pudimos haber puesto primero
viudo o casado y terminar en solero. Adems, si a soltero le llamamos 1, a casado 2, etc., estas
cifras carecen de propiedades numricas, ya slo sirven para distinguir un estado civil de otro.

Aprovecharemos esta explicacin para sealar que comn tambin confundir la variable con sus
categoras. Suele orse que en un ejemplo como en el anterior hay 5 variables; esto es un error. La
variable es slo una: Estado civil, que en este caso tiene 5 categoras o posibilidades de respuesta en un
universo determinado. Se debe hablar en las categoras soltero o divorciado por citar algunas,
pertenecientes a la variable estado civil. Otras variables nominales seran: sexo, nacionalidad, color
de automvil, tipo de lmpara, lugar de nacimiento, etc.

Variables Ordinales

Clasifican las observaciones en categoras mutuamente excluyentes que exigen ordenacin ya que
guardan entre s relaciones de mayor que. Su Variable operacional es una escala ordinal que va desde
la categora ms baja a la ms alta o viceversa. De modo que las observaciones queden en el orden
apropiado. Estas categoras tampoco tienen propiedades numricas, aunque se las represente por cifras.


Ntese que en la tabla 1.3.2 es preciso ordenar las cifras 1, 2 y 3, puesto que representan la gravedad de
las quemaduras de mayor a menor.



35
Tabla 1.3.2

Grado de las No. De casos
Quemaduras

1 70
2 40
3 10


La variable alcoholismo, definida como el grado de dependencia respecto a las bebidas embriagantes,
es un buen ejemplo de variable ordinal. Veamos:

Variable Estado Alcoholismo


Escala de Abstemio Bebedor Bebedor Bebedor
Medicin Ocasional Regular Consuetudinario
Nominal 1 2 3 4


Categora de la variable


Nos damos cuenta que el nivel de la medicin alcoholismo es un conjunto de categoras mutuamente
excluyentes, que van desde la posibilidad de no beber nunca hasta la de beber continuamente, dos
extremos entre los cuales cabran un sin nmero de gradaciones. Si definimos al bebedor regular como
en el que ingiere bebidas alcohlicas con ms frecuencia que el ocasional, pero con menos frecuencia
que el consuetudinario, podemos afirmar que aquel tiene un grado de dependencia respecto al alcohol,
mayor que el bebedor ocasional y menor que el consuetudinario. Estas categoras tienen que estar
ordenadas, puede ser por su nombre o por medio de cifras que carecen de propiedades numricas: las
cifra 3 indicara un grado de dependencia menor que la 4 y mayor que la 2, pero nada ms. Otras
variables del tipo ordinal seran grado de escolaridad, rango militar o jerarqua eclesistica.

Variables Cardinales

Son las ms complejas. Su variable operacional es una escala cardinal que se caracteriza porque las
diferencias iguales entre 2 de sus puntos con iguales entre s. Las cifras asociadas a las categoras son
efectivamente cuantitativas y, en consecuencia, se puede efectuar con ellas operaciones aritmticas.
36
Las variables cardinales se dividen en continuas y discretas.

Continuas: son las que pueden tomar cualquier valor dentro de un intervalo (edad, salarios, estatura,
produccin anual de azcar, etc.

Discretas: son las que toman algunos valores dentro de un intervalo hijos por familia, nmeros de
huelgas anuales, produccin mensual de automviles, etc..

Por ejemplo, la edad de los nios de una escuela primaria podra admitir como categoras posibles, las
siguientes:
Variable Edad


Escala de
Medicin
cardinal 6 7 8 9 10 11 12 aos


Categora de la variable


Sin embargo, aunque por razones prcticas se acostumbre reportar las edades de las personas, en aos
cumplidos, bien se podra decir que un nio tiene 7.25 aos; es decir, 7 aos 3 meses. Con esto
queremos destacar que la variable puede tomar cualquier valor entre los lmites 6 12. Por lo tanto,
edad es una variable continua.
Supongamos ahora que investigamos en una comunidad el nmero de nios por familia. Esta variable
podra admitir las siguientes respuestas:

Variable No. De hijos


Escala de
Medicin
Cardinal 1 2 3 4 .. 12 hijos


Categora de la variable


37
Es evidente que entre los lmites 0 12 no puede caber cualquier valor; no podramos registrar 4.25
hijos por lo tanto, nmero de hijos es una variable discontinua o discreta.

Expliquemos finalmente el significado de la expresin las diferencias iguales entre dos de sus puntos
son iguales entre s.
Si retomamos el ejemplo de las edades de los nios de la escuela primaria, veremos que la diferencia
entre 6 y 8 es la misma que entre 10 y 12 o sea, 2 aos. Un anlisis parecido podramos realizar con el
nmero de hijos: la diferencia entre 1 y 2 es la misma que entre 3 y 4 o entre 11 y 12, es decir, un hijo.
Este breve anlisis, que parece ocioso, resulta de gran importancia, pues si los repetimos con las
categoras de la variable grado de las quemaduras de la tabla 1.3.2, descubrimos que la diferencia de
entre 1 y 2 no es la misma que entre 2 y 3, ms claro: la diferencia entre quemaduras de primer y
segundo grado no es igual a la diferencia entre quemadura de segundo y tercer grado; slo sabemos que
un grado de quemadura es ms o menos grave que el otro.

EJERCICIOS

Subttulo 1.2

De los universos siguientes, Cules estn definidos rigurosamente y cules no? Por qu ?

1/1. Habitantes de la ciudad de Puebla mayores de 18 aos. Marzo de 1993

1/ 2. Estudiantes de Ingeniera. 1990

1/ 3 Obreros de planta permanente de la fbrica de autos Volkswagen.

1/ 4. Establecimientos industriales con ms de cinco trabajadores en el estado de Tlaxcala. Junio
agosto de 1992.

1/5. Nmeros naturales < 20.

1/6. Los nmeros primos < 20.

1/7. Ejidos del municipio de Emiliano Zapata. Estado de Veracruz. 1980-1990.

1/8 Viviendas con ms de dos recamaras en la Ciudad de Mxico.

1/9. Artculos periodsticos sobre cafeticultura. Diario El Universo. Enero-Diciembre de 1992.

38
Identifica la unidad esencial de cada uno de los universos siguientes y diga si posee carcter individual
o colectivo:

1/10. Facultades de la Universidad Nacional Autnoma de Mxico. 1993.

1/11. Obreros de la fbrica Nestl. Coatepec, Ver. Jun.-dic. De 1992.

1/12. Viviendas de la cabecera municipal de Tlaxcala. Julio e 1993.

1/13. Aparatos de televisin producidos por la fbrica SONY del 1 al 31 de octubre de 1992.

1/14. Escuelas primarias federales del municipio de Toluca. 1990.

1/15. Colonias de la ciudad de Puebla hasta el 31 de julio de 1992.

En cada uno de los casos siguientes define con precisin cinco universos:

1/16 Formados por personas.

1/17 Formados por cosas materiales.

1/18 Formados por cosas inmateriales.

En cada uno de los casos siguientes defina con precisin tres universos en que la unidad esencial tenga:

1/19 Carcter individual.

1/20 Carcter colectivo.

Di si las descripciones numricas siguientes, que aparecen en negritas, son parmetros o estadgrafos.

1/21 Diez alumnos, elegidos por sorteo, de un grupo de 30, tienen una calificacin promedio de 8.2 en
la asignatura de Historia.

1/22 Del total de profesores de una escuela primaria, el 65% son de sexo femenino.

1/23 Un subconjunto de empleados de cierto establecimiento comercial tiene un ingreso promedio
mensual de $520.00

1/24 El tratamiento de los datos de edad de todos los nios de una escuela secundaria rural sometida a
investigacin demostr que su edad promedio es 15 aos.

1/25 En una muestra de empleados de un supermercado se encontr que su ingreso promedio mensual
es de $ 580.00

1/26 Sometido a estudio un ejido mediante un censo, se descubri que el caso ms notorio es el de los
ejidatarios que tienen 5 hijos.

39
Con tus propias palabras explica cul es la diferencia:

1/27 Entre universo y muestra:

1/28 Entre censo y muestreo;

1/29 Entre muestra y muestreo.

De los conceptos siguientes di cules son variables, cules simples objetos y cules datos estadsticos.

1/30 Tractores,

1/31 Marcas de tractores.

1/32 Nmero de hijos por familia en una comunidad.

1/33 Nmero de habitantes de una comunidad determinada.

1/34 Produccin de automviles de la fbrica Nissan. Cuernavaca. Del 1. De enero al 31 diciembre de
1992.

1/35 Produccin anual de automviles de la fbrica Nissan. Cuernavaca. 1980-1990.

1/36 Tipo de deporte practicado por los estudiantes de una escuela profesional.

Subttulo 1.3.

Del universo habitantes mayores de 18 aos del puerto de Campeche en 1993, se indagan las
variables siguientes en cada uno de ellos; a qu tipo pertenece cada una?

1/37 Estado civil.

1/38 Escolaridad.

1/39 Grado de politizacin.

1/40 Lugar de nacimiento.

1/41 Nmero de hermanos.

1/42 Nmero de orden de nacimiento entre sus hermanos (el primero en nacer, el segundo, etc.)

1/43 Edad.

1/44 Partido poltico de su preferencia.

1/45 Define un universo cualquiera, identifica su unidad esencial y menciona tres variables de cada uno
de los tipos existentes (nominales, ordinales y cardinales).
40
DESCRIPCIN GRFICA DE UN CONJUNTO DE DATOS

PARTE 1
TABLAS ESTADSTICAS (Una tabla estadstica es una distribucin de la frecuencia de la
variable tratada).

Efectuados la clasificacin y el conteo de los datos, es necesario presentarlos de manera clara, sinttica
y significativa par su mejor y fcil entendimiento. Para ello se recurre a la tabla estadstica y el grfico
estadstico. De estos dos recursos, la tabla juega el papel fundamental, pues es la base de la
construccin de grficos y del anlisis estadstico.

La tabla o cuadro estadstico consta de tres partes, que reciben nombres que anuncian la peculiaridad
fundamental de su estructura: cabeza, cuerpo y pie.

La cabeza o encabezamiento de la tabla ocupa la parte superior de la misma y contiene: el ttulo, que ha
de expresar clara y concisamente el contenido o significado estricto de la informacin; el perodo, o
sea, el espacio de tiempo para el cual es vlida la informacin; y la unidad de medida, siempre y
cuando sea comn a toda la informacin.

El cuerpo est localizado en la parte central de la tabla y en el se encuentra la esencia misma de la
informacin, o sea, las categoras de las variables y sus correspondientes frecuencias o intensidades.
Por regla general, las categoras se colocan del lado izquierdo y sus frecuencias o intensidades del lado
derecho, pero a veces puede ser al revs, dependiendo del tipo y de las peculiaridades de la informacin
que se presenta. Es decir, al respecto no hay reglas rgidas.

Algunos autores llaman taln y campo a las partes izquierda y derecha del cuerpo de una tabla y hacen
luego una subdivisin de esas partes, a las que asignan nuevos nombres. Nosotros no entraremos en
esos detalles, puesto que pretendemos que se asimile sin dificultad el procedimiento es comn a todos
los datos o cuando se requiere aadir claves u otras indicaciones, que sirven para identificar las
categoras de las variables, se anexan al cuerpo de la tabla columnas bajo el nombre de unidad de
medida, clave nmero, etc. Que pasan a formar parte del taln Vase la tabla siguiente:

41
Tabla 2.1.1

Algunos artculos producidos por la industria
De la transformacin. Mxico. 1978.

Artculo Unidad de Medida Clave No. Produccin Valor (millones
De pesos)

Leche evaporada Miles de ton. 01510 146.6 1 714

Cerveza Millones de l. 03128 1 793.0 13 991

Cigarros Millones de caj. 01200 2 529.0 11 312

Estufas de gas pieza 12500 8 828.0 911 012


Fuente : datos supuestos.

El pie lo forman la parte inferior de la tabla, que esta destinada a las notas o aclamaciones indicadas en
el encabezamiento o el cuerpo (cuando necesarias); adems menciona la fuente u origen de la
informacin. Podr no haber aclaraciones en un cuado, pero la fuente debe aparecer al pie.

Para que quede claro lo dicho, analicemos a continuacin la estructura de algunos cuadros.

Tabla 2.1.2

Poblacin rural y urbana, Mxico, 1990-1930
(millones)
Ao Total Urbana Rural
1900 13.6 2.6 11.0
1910 15.2 3.7 11.5
1921 14.4 4.5 9.9
1930 16.5 5.5 11.0
1921 el censo que debi levantar en 1920 se retras un ao debido al movimiento armado de la Revolucin
Mexicana. Poblacin rural: menos de 2500 habitantes. Fuente: censos generales de poblacin, 1900-1960.


La cabeza de la tabla anterior nos dice, de manera clara y breve, que los datos se refieren a la poblacin
en nuestro pas, tanto en el campo como en la ciudad, de 1900 a 1930 y que estn expresados en
millones. En el cuerpo aparece ordenadamente el ao, la columna de totales y luego los sumandos
componentes. Esta disposicin de la informacin facilita una lectura coherente.

42
Leemos, por ejemplo, que en 1900 la poblacin mexicana era de 13 millones 600 mil habitantes, de los
cuales 2 millones 600 mil se encontraban en el medio urbano y 11 millones en el medio rural, etc.

Al pie de la tabla aparecen algunas notas aclaratorias y la fuente de donde provienen los datos.
Obsrvese que si no se diera ninguna explicacin referida al ao 1921, se podra pensar que se escribi
mal el inicio de la tercera dcada del siglo, ya que los censos generales de poblacin se realizan cada
decenio y al inicio del mismo en nuestro pas. Tambin est parte de la tabla nos dice lo que debemos
entender por poblacin rural. Sin las notas aclaratorias al pie de tabla, el lector no quedara exento de
dudas.

Tabla 2.1.3


Entidad Produccin
Campeche 30,013,100
Jalisco 365,217,400
Michoacn 131,218,800
Veracruz 1 018,439,850
Fuente: Manual Azucarero Mexicano, 1980, p. 14


Consideremos ahora la tabla 2.1.3. Su encabezamiento nos dice que los datos se refieren a la
produccin de azcar en algunos estados de la Repblica y que estn dados en kilogramos. Luego, en el
cuerpo en su parte izquierda, aparecen las entidades que fueron objeto de estudio, y a la derecha, la
produccin. Leemos, por ejemplo, que en 1979, Campeche produjo 30 millones 13 mil 100 kilogramos
de azcar, etc. Ntese que la informacin no requiere ninguna aclaracin para ser comprendida
fcilmente; por eso al pie del cuadro no aparece ms que la fuente.

En estructuras como esta, bien podramos transferir la unidad de medida kilogramos del
encabezamiento al cuerpo de la tabla, colocndola debajo de la palabra produccin, sin que dificulte
la lectura o se originen confusiones. O, incluso, anexando un asterisco a la palabra produccin y
mandando al pie de la unidad de medida.

Por otro lado, conviene saber desde ahora que abundan las tablas en las cuales la unidad de medida es
evidente y por ello no se hacen explcita. Veamos:

43
Tabla 2.1.4.

Alumnos de primer ingreso,
Por especialidad. E N S V. 1990

Especialidad Total
243
C. Sociales 73
Espaol 53
C. Naturales 49
Matemticas 38
Ingls 30
Escuela normal superior veracruzana Dr. Manuel Suarez Trujillo
Fuente: Listas de alumnos


En el cuadro 2.1.4 no aparece explcita ninguna unidad de medida; sin embargo, el encabezamiento, al
precisar que se trata de alumnos de primer ingreso por especialidad, nos hace comprender que la unidad
de medida, implcita, es un alumnos, y que esta unidad corresponde a la columna de totales. As
leemos que, de los 243 alumnos que se inscribieron en la escuela Normal Superior Veracruzana Dr.
Manuel Surez Trujillo en 1990, 73 escogieron la especialidad de Ciencias Sociales, etc.

Antes de dar fina a este subttulo, con la mencin de algunas reglas bsicas para la construccin de
cuadros, detengmonos en el significado de unidad de medida, de la que hemos hablado en todos los
ejemplos anteriores.

La unidad de medida es el nmero que indica la veces que la unidad (uno) esta contenida en ella. La
unidad de medida milln de habitantes indica que la unidad un habitante esta contenida un milln
de veces en la unidad de medida tomada como base. Veamos un par de ejemplos:

Ejemplo 2.1.

Unidad de medida: milln de habitantes.

Para expresar en esta unidad un nmero concreto, digamos 13 607 259 habitantes, simplemente se le
divide entre un milln.

13 607 259/ 1 000 000 = 13.607259
44

Este cociente, con 0.01 de aproximacin, se escribir 13.61; y con 0.1 de aproximacin 13.6. En la
prctica, la divisin se ejecuta mentalmente de una sola vez con aproximacin previamente definida.

Ejemplo 2.2. Unidad de medida: toneladas.

Para convertir el nmero concreto 18325 kilogramos a toneladas, basta con dividirlo por mil y
redondear, digamos, a 0.1; as, 18 325 kilogramos podemos expresarlos como 18.3 toneladas.

La unidad de medida para datos de variable discreta puede escribirse escuetamente utilizando
nicamente la palabra que indica el nmero de veces que la unidad est contenida en ella. Volviendo el
ejemplo 1, es vez de escribir millones de habitantes, basta con escribir millones en el
encabezamiento de la tabla.

La finalidad e introducir unidades de medida en un cuadro estadstico es simplificar datos que
originalmente son del orden de miles, cientos de miles, millones, etc. Esta simplificacin, si se le
acompaa del redondeo correcto, no produce errores significativos en los datos originales y facilita
enormemente la lectura y anlisis de los mismos Por esta razn, se recomienda utilizar unidades de
medida adecuadas cuando los datos que se manejan son, por lo menos del orden de miles.

Importante: en todo cuadro que presenta datos concretos, es decir, datos que se refieren a variables
especificas, siempre existe la unidad de medida, explcita a implcita. Ahora bien, lo que hemos tratado
de explicar ltimamente es la necesidad de introducir, cuando sea necesario, unidades de medida
adecuadas que den como resultado la simplificacin y por lo tanto, la facilidad de la lectura de los
datos.
Este asunto de la simplificacin de datos introduciendo unidades de medida, se debe aclarar
desarrollando un ejemplo, simplifiquemos el cuadro siguiente:






45
Tabla 2.1.5.
Programa de alimentacin escolar,
Comidas servidas, Chile. 1970-1973
Ao Total
1970 619,196
1971 653,796
1972 715,877
1973 674,272
Fuente: L Impact de la recesin mondiale sur les Enfants, 1984
p. 131, Estudio publicado por UNICEF

Solucin: esta tabla contiene informacin sobre el nmero de comidas servidas entre 1970 y 1973 en la
Repblica de Chile.. La unidad de medida, implcita, es evidente- una comida. As, pues, sabemos
que, dentro del programa de alimentacin escolar en Chile, en 1970 se sirvieron 619 196 comidas y
que 3 aos despus, por ejemplo, se sirvieron 674 272. Si analizamos un poco estos nmeros, no damos
cuenta que el reportarlos con precisin de unidades no tiene ninguna ventaja; por lo contrario, esa
precisin vuelve tediosa la lectura y dificulta el anlisis. Bien podemos decir 619 mil comida en 1970y
674 mil tres aos despus.

Esto nos indica que resulta conveniente introducir en el cuadro una unidad de medida que simplifique
la informacin, sin deformarla de modo inadmisible, y que facilite la lectura y el anlisis. Podramos
metes cualquier unidad de medida; docenas, cientos, miles, decenas de miles, millones, docenas de
millones, etc. No obstante, la ms adecuada, dado el orden numrico de los datos, es miles. As, basta
con dividir por 1 000 cada dato y redondear el cociente hasta el limite permisible, que en este caso
puede ser enteros. Estas sencillas operaciones aritmticas producen la tabla 2.1.6, en la cual se nota que
el valor de los datos simplificados ha cambiado ligeramente con respecto a los originales, sin que ello
implique deformacin inaceptable.

Tabla 2.1.6
Programa de alimentacin escolar,
Comidas servidas, Chile, 1970-1973
(miles)
Ao Total
1970 619.0
1971 654.0
1972 716.0
1973 674.0
Fuente: L Impact de la recesin mondiale sur les Enfants, 1984
p. 131, Estudio publicado por UNICEF

46

Rematemos la explicacin del procedimiento de construccin de tablas desarrollando un par de
ejemplos.

Tabla 2.4 El anuario estadstico 1984 de la Faculta de Sociologa de la Universidad Veracruzana, nos
dice que hasta 1983 haba 137 egresados de los cuales 8 eran hombres y 57 mujeres, repartidos como
sigue: la primera generacin, salida en febrero de 1981, estuvo formada por 17 hombres y 11 mujeres;
la segunda, en agosto de 1981, por 23 y 15; la tercera, en febrero de 82, por 11 y 10; la cuarte en agosto
de 82, por 5 y 1 y la quinta, en agosto de 83, por 24 y 20. Presentemos est informacin en una tabla.

Solucin: En primer paso consiste en localizar los elementos que formaran el encabezamiento, el
cuerpo y el pie. Si leemos con detenimiento la informacin, nos daremos cuenta que se refiera a la
Facultad de Sociologa de la U.V.; por lo tanto, sta es la universo. Las variables objeto de estudio son:
No. De egresados por generacin y sexo2. La unidad de medida es un egresado, que en el
encabezamiento quedara implcita. El perodo va de febrero de 1981 a agosto de 1983. Adems,
encontramos la fecha de egreso de cada generacin. Por lo tanto, el encabezamiento podra ser el
siguiente:

Egresados por generacin, de egreso y sexo. Fac. de Sociologa, U.V. (Feb 81- Ago 83).

El cuerpo tendra cinco columnas: generacin, fecha (de egreso) y, respetando el principio de lo
general a lo particular, el nmero de egresados hombres y el de mujeres, precedido del total.

Tabla 2.1.7.
Egresados por generacin, fecha de egreso y sexo.
Fac. de sociologa, U.V. (feb. 81 Ago 83)

Generacin Fecha Total
137
Hombres
80
Mujeres
87
1. Feb 81 28 17 11
2. Ago 80 38 23 15
3. Feb 82 21 11 10
4. Ago 82 6 5 1
5. Ago 83 44 24 20
Fuente Anuario estadstico 1984, Fac. de Sociologa U. V.

47
Ejemplo 2.5 En el vol. 8 de la Enciclopedia de Mxico (3. Ed., 1978, p. 1981) leemos el siguiente
prrafo referente al nmero de viviendas del pas: Del total (8,286,369), 2,494,950 (30.1%) tienen
muros de adobe, 3,658,146 (44.1%) de ladrillo y 2,133,273 (25.8%) de madera y otros materiales,,, -
Esta informacin es vlida para 1970, pues el libro dice que proviene del IX Censo General de
Poblacin. Construyamos dos cuadros: uno que exhiba esta informacin y otro con la informacin
simplificada, introduciendo una unidad de medida adecuada.

Solucin: La informacin se refiere a las viviendas en el pas; por lo tanto, stas son el universo. La
variable es tipo de material de sus muros. La unidad de medida es una vivienda y el perodo, 1970.
As el encabezamiento podra ser ste:

Viviendas por tipo de material de sus muros. Mxico. 1970.

Las columnas que aparecen en el cuerpo seran: tipo, total y %. Y la fuente: enciclopedia de
Mxico, 3. Ed., 1978, Vol. 8, P. 991.

En fin, el cuadro sera el siguiente:

Tabla 2.1.8

Vivienda por tipo de material de sus muros, Mxico. 1970

Tipo Total
8,286,369
%
100.0
Adobe 2,494,950 30.1
Ladrillo 3,658,146 44.1
Madera u otro 2,133,273 25.8

Fuente: Enciclopedia de Mxico, 3. Ed., 1978, Vol. 8 p. 991.


Es evidente que la informacin del cuadro anterior puede ser simplificada introduciendo la unidad de
medida millones . Vase.



48

Tabla 2.1.9

Viviendas por tipo de material de sus muros. Mxico. 1970

Tipo Total
(millones)
8.29
%
100.0
Adobe 2.49 30.1
Ladrillo 3.66 44.1
Madera u otros 2.13 25.8


Fuente: Enciclopedia de Mxico. 3. Ed., 1978, Vol. 8 p. 991



Concluiremos este punto haciendo algunas observaciones de tipo prctico, que pueden ser de utilidad:

1. Para efectos de simplificacin, una unidad de medida resulta adecuada si al introducirla en un
conjunto de datos, los resultantes pueden ser ledos sin dificultad.
2. Existen al menos dos unidades muy socorridas en la prctica, que cumplen cabalmente con el
punto anterior: las que tienen por base 1 000 y 1 000 000.
3. Cuanto mayor es el orden numrico de los datos originales, mayor es la necesidad de
simplificarlos expresndolos en una nueva unidad de medida.
4. La simplificacin de los datos puede ser recomendable por diversas razones, pero en particular
recomendamos hacerla cuando los datos en su mayora sean por lo menos del orden de decenas
de miles (18 525, 305 778, 5 715 200, etc).








49
2.2 ALGUNAS REGLAS PARA LA CONFECCIN Y PRESENTACIN DE TABLAS
ESTADSTICAS.

De la prctica han surgido diversas reglas, que no deben tomarse como normas rgidas, para la
confeccin y presentacin de cuadros. A continuacin daremos a conocer algunas.

1. La tabla debe ser lo ms breve y concisa posible, para facilitar su lectura y anlisis, pero esta
doble condicin de brevedad y concisin tiene un lmite: no puede haber omisin de indicadores
indispensables en el anlisis.

2. Tanto el encabezamiento de la tabla, como las categoras de las variables y los ttulos de las
columnas de concentraciones numricas han de ser claros y brevemente redactados, dejando
para el pie las aclaraciones u observaciones.

3. Cuando los datos se dan en totales, acompaados de sus sumandos componentes, se deben
colocar siguiendo el principio de lo general a lo particular; es decir, primero se anotan los
totales y luego los sumandos componentes (tablas 2.1.2 y 1.2.7)




EJERCICIOS

Subttulos 2.1 y 2.2

Con la informacin dada a continuacin, construye la tabla correspondiente a cada caso y anxale la
columna de frecuencias porcentuales.

2/1 El Anuario estadstico 1984, de la Facultad de sociologa de la U.V., informa que, de los 188
alumnos inscritos en 1984, 130 haban realizado el propedutico en Xalapa, 22 en Veracruz, 3 en Cd.
Mendoza, 2 en Minatitln, 18 en Crdova, 3 en Coatzacoalcos, 7 en Poza Rica y 3 no hicieron
propedutico, sino que entraron a la facultad revalidando estudios.

50
2/2 La Agenda estadstica 1992, p.78 publicada por el INEGI, nos dice que en 1991 se produjeron en
el pas 976,682 miles de barriles de petrleo crudo, de los cuales correspondi a la regin norte 38,885;
a la regin sur, 242,741 y a la regin marina 695,056.

2/3 Segn el Anuario de los estados Unidos Mexicanos, 1990, p. 198, publicado por el INEGI, de los
70`562.202 habitantes de 5 aos y ms registrados en 1990, 63285,027 eran catlicos; 3447,507,
protestantes o evanglicos; 57,918, Judos; 1021,326, otra: 2288,234, ninguna y 462,90 sin
especificar.

2/4 El Anuario estadstico 1964, de la UNAM., nos reporta que alumnos de esa institucin, aparte de la
carrera en que estn inscritos, estudiaban otra como se ilustra a continuacin: universitaria, 410,
tcnica, 40, comercial, 70; artstica. 280; idiomas, 1,900; normal, 40 y otras, 400.

2/5 Segn el archivo del Registro Civil del municipio de Tenosique, Tab., de enero a junio de 1990 se
expidieron 1,036 actas, repartidas como sigue: nacimientos, 699, defunciones, 85; matrimonios, 251 y
reconocimientos, 1

2/6 En una encuesta aplicada a clientes de una fbrica de automviles de 1976, a la pregunta: de qu
color prefiere su automvil?, se respondi as: blanco, 18; azul, 22; verde, 40; amarillo, 25; rojo, 75.

Con la informacin dad a continuacin, construye la tabla correspondiente a cada caso, que exhiba
nicamente frecuencias simples.

2/7 El Anuario estadstico 1984, de la facultad de fsica de la UAEM, nos dice que, de los 137
egresados de febrero de 1981 a agosto de 1983, 93 salieron como regulares y 44 como irregulares,
de la primera generacin, 22 regulares y 6 irregulares; de la segunda, 24 y 14; de la tercera, 12 y 9 de la
cuarta, 6 y 0; de la quinta, 29 y 15.

2/8 En la p. 49 de la Agenda estadstica 1992, publicada por el INEGI, se registra que en 1990 se
realizaron en el pas 642,201 matrimonios, de los cuales, menores de 20 aos fueron 109,255 hombres
y 239,019 mujeres; de 20 a 24 aos, 263,704 y 235,465; de 25 29, 153,547 y 96,780, de 30 a 34,
51
56,516 y 34,081; de 35 a 39, 22,938 y 14,587; de 40 a 49, 19,176 y 12,382, de 50 y ms. 16,550 y
8,837 y en edad no especificada 515 y 1,052.

Con la informacin que sigue, haz, para cada caso, dos cuadros: uno que presente la informacin tal
como se dice, y el otro que la presente simplificada, introduciendo una unidad de medida adecuada.

2/9 En el vol. 8 de la Enciclopedia de Mxico (3. Ed., 1978 p 495), leemos refirindose a los datos de
la poblacin 1970) de los mayores de 6 aos (38370,438), 21393,508 (55.8%) han tenido
instruccin primaria, pero slo 4959,158 (12.9%) han cursado hasta 6to. Ao; 3600,498 (9.4% han
recibido instruccin posterior y 13367,217 (34.8%) no han tenido ninguna

2/10 Segn el Anuario estadstico de los Estados Unidos Mexicanos, 1990, p. 180, publicado por el
INEGI, de la poblacin total registrada en 1990 (81249,645), 31146,504 tenan edades por debajo de
los 15 aos, 46234,035, entre 15 y 64 aos; 3376,841, por arriba de los 64 aos y 492,265 sin
especificar. )

















52
DISTRIBUCIONES DE FRECUENCIAS

Las tablas estadsticas descritas en la parte anterior, son distribuciones de frecuencias de la variable
tratada.

Una distribucin de frecuencias de una variable es una descripcin del nmero de veces, es decir, de
las frecuencias con que se presentan las diversas categoras mutuamente excluyentes y exhaustivas que
corresponden a esa variable.


DISTRIBUCIONES CUANTITATIVAS DE FRECUENCIAS (DATOS NO AGRUPADOS)

Cuando se recolecta una masa de datos pertenecientes a una variable cardinal, conviene colocarlos en
columna buscando dar forma al cuerpo de una tabla- sin repetirlos, siguiendo un orden creciente o
decreciente, y asociarles la frecuencia que corresponde a cada uno. De esta manera surgen tablas como
la siguiente:

calificaciones
No de
estudiantes
x F
20 1
30 4
50 8
60 10
70 20
80 15
95 10
90 5
100 2


Una tabla como sta, donde aparecen de manera ordenada las categoras numricas de la variable con
su correspondiente frecuencia, recibe el nombre de: Distribucin cuantitativa de frecuencias o
distribucin numrica de frecuencias.



53
TERMINOLOGA RELATIVA A LAS DISTRIBUCIONES DE FRECUENCIAS

De la distribucin anterior, si se divide cada una de sus frecuencias entre su total, se obtiene una
frecuencia relativa expresada en decimales que, si se multiplica por 100, se expresa en porcentaje, lo
cual puede ser anexado a la tabla:
calificaciones
No de
estudiantes

x F
f. r. %
20 1
1.3 %
30 4
5.3 %
50 8
10.6 %
60 10
13.3 %
70 20
26.6 %
80 15
20 %
90 10
13.3 %
95 5
6.6 %
100 2
2.6 %

Note que con la anexin de la columna de frecuencias relativas se logra una mejor captacin de las
particularidades de la variable estudiada dentro del universo determinado.

De igual modo se puede construir la distribucin de frecuencias acumuladas, absolutas o relativas.
Tales distribuciones pueden ser ascendentes (+) cuando la acumulacin inicia por la frecuencia simple
del dato menor, en cuyo caso recibe el nombre de distribucin de frecuencias acumuladas
ascendente, o si se inicia por el dato mayor, descendentes (-) distribucin de frecuencias
acumuladas descendente.
Para una mejor comprensin vea el ejemplo:

calificaciones
No de
estudiantes


X f
f. a. (+) f. a. (-)
20 1
1
75
30 4
5
74
50 8
13
70
60 10
23
62
70 20
43
52
80 15
58
32
90 10
68
17
95 5
73
7
100 2
75
2

54
Toda esta explicacin tiene como fin que se aprenda a construir de una sola vez un cuadro que incluya
frecuencias simples, acumuladas y porcentuales y que se este en condiciones de leer correctamente el
significado de cada una. Un cuadro como el siguiente:

Calificaciones
No de
estudiantes


x F f. r. %
f. a. (+)
f. r. (+)%
f. a. (-)
f. r. (-)%
20 1
1.33% 1
1.33 75 100
30 4
5.33% 5
6.66 74 98.66
50 8
10.66% 13
17.33 70 93.33
60 10
13.33% 23
30.66 62 82.66
70 20
26.66% 43
57.33 52 69.33
80 15
20% 58
77.33 32 42.66
90 10
13.33% 68
90.66 17 22.66
95 5
6.66% 73
97.33 7 9.33
100 2
2.66% 75
100 2 2.66

Cmo se leen estas tablas?

a) 4 personas, que representan un 5.33 % del total, obtuvieron 30 de calificacin.
b) 20 personas, que representan un 26.66 % del total, obtuvieron 70 de calificacin.
c) 68 personas, representan un 90.66 del total obtuvieron entre 20 y 90 de calificacin.
d) 74 personas, representan un 98.66 del total obtuvieron entre 30 y 100 de calificacin.

Cuadros como el anterior son de gran utilidad para el anlisis de datos, pero de ningn modo para la
presentacin.




DISTRIBUCIONES EN CLASES Y FRECUENCIAS DATOS AGRUPADOS

Cuando las categoras numricas de una variable son distintas y numerosas, no conviene presentarlas
como una distribucin simple de frecuencias, ya que resultara una larga lista que dificultara el
anlisis. En este caso lo mejor es agruparlas. Al hacerlo, los diferentes valores o categoras se dividen
en intervalos de clase y se determina el nmero de casos pertenecientes a cada clase. Una ordenacin
de las categoras de la variable en clases, reunidas todas, e indicada la frecuencia de cada una recibe el
nombre de distribucin en clases y frecuencias. Vea el siguiente ejemplo:

55
Alumnado segn tiempo dedicado
al estudio fuera de clases Ciclo 2000A-

Horas semanarias Frecuencia F

1 hr - 3 hr 50

4 hr - 6 hr 38

7 hr - 9 hr 26

10 hr-12 hr 36

13 hr-15 hr 19

16 hr-18 hr 7

19 hr-21 hr 7

22 hr-28 hr 5


En este cuadro la primera clase va de 1 a 3 horas por semana y 50 estudiantes (frecuencia) caen en este
intervalo o clase, es decir 50 estudiantes estudian entre una y tres horas extra-clase a la semana.




TERMINOLOGA RELATIVA A DATOS AGRUPADOS

Clase o intervalo de clase, es el smbolo 1-3, en el cual 1 es el lmite inferior y 3 el lmite superior,
la distancia entre el lmite inferior y superior recibe el nombre de amplitud o anchura aparente de ese
intervalo.

Si un alumno estudia, digamos 3.6 horas o 4.3 horas en cul clase se ubica? Los lmites reales
inferior y superior del segundo intervalo son: 3.5 y 6.499, respectivamente, de este modo los datos 3.6
horas y 4.3 horas, se ubicaran en la segunda clase.
A los puntos como 3.5, 6.5, 9.5, localizados a la mitad de los espacios aparentes de un conjunto de
intervalos de clase se llaman lmites o fronteras reales de clase.

La marca de clase, es el punto medio del intervalo de clase y se determina a partir de dividir la
amplitud aparente entre dos y sumar el resultado al lmite inferior del intervalo. Desde el punto de vista
conceptual, La marca de clase de un intervalo puede ser interpretada como el valor donde se
concentran todos los datos pertenecientes a ese intervalo.
56
AGRUPAMIENTO EN INTERVALOS DE CLASE (Ejercicios pgina 35-37 de este texto de
apoyo)
La prctica constante en el manejo de conjuntos de datos diversos y numerosos, har que el lector
desarrolle sus propias tcnicas tiles para agruparlos.

Al agrupar la informacin existen varios factores importantes a considerar entre los cuales
mencionaremos los siguientes:

1) Nmero de intervalos adecuados para agrupar la informacin original. Es importante tener
presente que al formar grupos de datos existe cierta prdida informacin de los datos originales, as
pues si la informacin se agrupa en pocos intervalos se perder ms informacin, sin embargo si se
agrupa en demasiados intervalos, se pueden presentar los mismos problemas que en el caso de los
datos individuales, de tal forma que al agrupar los datos se debe de resolver la situacin de perdida de
informacin y tener una representacin significativa, esto se logra eligiendo un intervalo no muy
amplio ni muy angosto.

Sobre tal particular la bibliografa hace sugerencias como las siguiente: Rara vez usamos menos de 6
o ms de 15 clases; el nmero exacto que usaremos en una situacin determinada depender en gran
medida del nmero de lecturas u observaciones implcitas (John E, Freud &Gary A. Simon,
Estadstica Elemental. Octava Edicin, Editorial Prentice Hall); Coincidiendo con este criterio, Wayne
W. Daniel. Estadstica con aplicaciones a las Ciencias Sociales y a la educacin. de la editorial Mc.
Graw. Hill.; Douglas C Mongotmery y Geroge C. Runger , el libro Probabilidad y Estadstica Aplicada
a la Ingeniera de la Editorial Mc Graw Hill seala El nmero de clases depende del numero de
observaciones y de la dispersin de los datos.

En general, una distribucin de frecuencias que emplea pocas o demasiadas clases no contiene mucha
informacin. Hemos visto que, en muchos casos, resulta satisfactorio usar entre cinco y 20 clases, y que
el nmero de clases debe de aumentar en funcin de n
1
.
En el libro Estadstica para administracin y economa de Mason/ Lind/ Marchal 10 edicin edit.
Alfaomega, recomiendan determinar el nmero de clases del siguiente modo:


1
Donde n significa el nmero total de datos.
57
Nmero de clases = 1 + 3.322(Log. Del total de frecuencias)

Ejemplo: para 60 datos


Nmero de clases = 1 + 3.322 (Log. 60) = 1 + 3.322 (1.778) = 6.9 (se redondea a 7 Clases)

i = intervalo de clase
Clases de Nmero
Bajo ms Valor alto ms Valor
i

=

Cabe sealar que estos mismos autores mencionan que adems de su juicio profesional, tambin se
puede utilizar la regla de 2 a la k. Para calcular el nmero en cuestin, seleccionamos el nmero
entero ms pequeo tal que
n 2
k
>
, donde n es el nmero total de observaciones. De este modo
para el ejemplo anterior, el nmero de clases conveniente sera
60 2
k
>
fcilmente se puede
encontrar K de tal modo que 2 a la K sea igual o mayor a 60 en este caso K = 6. Note que con esta
frmula el nmero de clases recomendado es 6, mientras que con la otra, el nmero de clases
recomendado es 7. Aqu es donde se tiene que emplear el juicio profesional o experiencia de quien hace
la descripcin, considerando las recomendaciones ya sealadas.


2) La anchura o amplitud de los intervalos. La regla para amplitud de los intervalos es la de
considerarlos de misma anchura, an existen contextos en las cuales el intervalo menor y/o el mximo
quedan abiertos, esto presenta dificultades al momento del tratamiento de algunas de las medidas de
centralizacin y variacin que ms adelante analizaremos. Evidentemente que la amplitud de los
intervalos esta ligada con el nmero de intervalos que se selecciona, ya que el recorrido de los datos
para una situacin particular esta definido si se toman pocos intervalos, la anchura del mismos ser
mayor que si se seleccionan muchos intervalos.

3) La variabilidad de los datos en cada intervalo de clase. Cuando la informacin esta presentada en
forma agrupada, difcilmente podemos tener la certeza de cuales ni cuantos de los valores originales
que se encuentran agrupados en determinado intervalo, es decir no sabemos realmente como se
58
distribuyen los datos en cada intervalo, si estos por ejemplo se sesgan hacia el limite inferior, o hacia
al superior, si se distribuyen normalmente alrededor de la mitad del recorrido. Sin embargo si hay la
consideracin de que estos se distribuyen uniformemente en cada intervalo.

4) Importancia del punto medio de intervalo. Como ya se argumento no se puede precisar que datos
ni cuantos datos se agrupan en determinado intervalo, sin embargo es importante y necesario
determinar un representante de los datos originales en cada intervalo, ya que esto es necesario para
realizar ciertos tratamiento estadsticos como son el clculo de la media aritmtica y la desviacin
estndar por mencionar alguno. Siendo entonces conveniente considerar como tal representante al
punto medio del recorrido del intervalo.

4) Al momento de realizar el procedimiento de agrupamiento de informacin en los intervalos, es
importante evitar que los datos originales se traslapen en los intervalos, es decir hay que asegurarse
que cada dato pertenece a slo y slo uno de los intervalos. Para la construccin de los intervalos de
clase, considerando la anchura de intervalo, en dependencia del autor consultado los valores de los
intervalos pueden ser continuos o no. En el caso de que sean continuos hay que definir si el intervalo
superior o inferior es cerrado, particularmente Douglas C. Mongomery y George C Runger,
Probabilidad y Estadstica, de la editorial Mc. Graw. Hill recomiendan cerrar los limites inferiores
2
.
Como se muestra en la siguiente tabla:

Calificaciones obtenidas por un grupo de
estudiantes en un examen de estadstica
Calificaciones (x) No de estudiantes
0 s x <20 5
20s x<40 15
40sx<60 30
60sx<80 12
80sx<100 2


2
Aunque este autor recomienda el considerar cerrado los limites inferior, es importante tener presente que cuando existan
datos que coincidan con el lmite superior del ltimo intervalo estos deben de ser agrupados en l.
59
Si los intervalos no son continuos sino que pegan un pequeo brinco, como se muestra en la siguiente
tabla, habr que utilizar al momento de aplicar ciertos tratamientos un factor de correccin, para
encontrar los lmites reales esta es la tcnica utilizada por varios autores como por ejemplo John E.
Freud y Gary A Simon. Estadstica Elemental de la Editorial Prentice Hall.


No de reactivos correctos obtenidos por un
grupo de estudiante en un examen de
estadstica
No de reactivos
Correctos
No de estudiantes
0-4 5
5-9 15
10-14 30
15-19 12
20-24 2

Es importante aclarar que cualquier criterio que se utilice de los recomendados en la bibliografa
estadstica sobre el agrupamiento de datos es adecuada, independientemente de los que didcticamente
se decidieron utilizar en el diseo de este curso.

5) Mason/ Lind/ Marchal 10 edicin edit. Alfaomega, recomiendan que; el lmite inferior de la
primera clase debe ser un mltiplo par del intervalo de clase.
Consideraciones sobre la representacin grfica de informacin agrupada.

Un grfico estadstico es la representacin de datos estadsticos por medio de figuras geomtricas
(puntos, lneas, rectngulos, etc.), cuyas dimensiones son proporcionales al valor numrico de los
datos.




60
EJERCICIOS

Para secciones de 2.3 a 2.5

Para cada uno de los casos siguientes, presenta la informacin en una distribucin simple de
frecuencias, aadiendo en cada caso la columna de frecuencias porcentuales:

2/11 Calificaciones estadstica alumnos 5 semestre:
5, 5, 9, 8, 7, 7, 7, 6, 6, 6, 6, 8, 9, 10, 9, 5, 5, 6, 6, 6, 7, 7, 8, 10, 7, 7, 8, 7, 7, 7.

2/12 Nmero de hermanos de un grupo de personas:
1, 3, 5, 6, 5, 5, 2, 3, 7, 5, 4, 5, 3, 2, 6, 5, 3, 0, 4, 5, 1, 4, 7, 5, 3, 6, 5, 5, 3, 1, 5, 3, 5, 4

2/13 Das que trabajan a la semana vendedores ambulantes:

7 4 6 3 3 6 6 7 7 5
5 6 4 6 3 6 7 5 7 7
6 2 7 7 6 3 3 4 6 6
6 5 2 6 2 6 7 7 6 7
6 3 5 5 6 6 5 7 7 7
7 5 6 6 6 7 6 7 7 6
7 7 7 7 6 7 7 6 7 6
7 6 7 7 5

2/14 Jornada diaria de trabajo, en horas, de un conjunto de trabajadores menores de 16 aos.
4 3 4 4 5 6 7 7 6 5 4 4 3 3 4
5 6 8 8 6 5 4 4 3 10 9 9 9 8 6
5 4 4 3 3 3 3 4 4 5 6 8 6 6 5
4 4 4 4 5 6 8 7 5 4 4 3 3 4 4
5 7 7 5 4 3 4 5 5 3 7 5 4 3 10


2/15 Antigedad en el trabajo en aos de un grupo de trabajadores






2/16 Horas semanales frente a grupo de profesores universitarios:

4 18 12 20 5 12 16 6 20 24 8 18
10 18 4 16 24 16 8 20 18 16 4




6 10 7 12 11 14 10 14 12 9 6 8
13 13 10 10 12 5 14 10 7 7
61
2/17 Con los datos dados a continuacin construye el grfico correspondiente. (histograma)
Tiempos en minutos al pinchar 32 dedos para comprobar la coagulacin.







2/18 Con los datos dados a continuacin construye el grfico correspondiente.
Porcentajes cambiarios en 30 valores de la bolsa de valores en un da.

6.6 0.4 5.7 1.5 -2.1
2.2 8.3 -1.8 2 -3.9
2.3 -1.9 -2 1.6 4.8
-0.9 -1.4 7.4 5.2 4
7.9 0 -1.3 2.5 2.3
-0.4 -0.8 6.1 5.8 -3


2/19 Con los datos siguientes que representan litros de leche vendidos diariamente por un pequeo
comerciante durante el bimestre (Junio-Julio de 2002), construye una distribucin agrupada de 9
intervalos:

29 30 26 32 44 37 27 40 40 51 57 28
46 35 26 37 42 59 61 60 34 27 52 44
46 54 35 36 41 31 45 54 33 35 37 39
42 59 60 37 36 55 39 31 36 43 49 29
38 40 28 52 35 49 32 38 43 54 59 37

2/20 Con los datos dados a continuacin construye el grfico correspondiente.

Calificaciones del grupo de estadstica primer examen parcial

9.5 5.8 7 7.5 10 8.5
6.5 6.5 9 7 2.5 7.5
5.5 7.7 8 8 3.5 9
9.5 8.5 8.5 8 8 9.5
7.5 8 6.5 9 9 7
8.5 9.5 5 8 6 7







1.42 1.38 1.42 1.46 1.21 1.49 1.41 1.66
1.42 1.4 1.37 1.39 1.45 1.23 1.48 1.43
1.42 1.57 1.46 1.41 1.36 1.4 1.37 1.4
1.37 1.38 1.34 1.32 1.33 1.42 1.27 1.36
62
2/21 Con los datos siguientes, que representan el tiempo dedicado al estudio fuera de clases, en horas
por semana, por estudiantes universitarios, construye una distribucin de datos agrupados de 7
intervalos (haz que los intervalos tengan amplitud constante consecutivamente)

3 2 5 8 2 5 11 21 7 1 11 4 3 15 5 4 16 6
13 10 8 9 20 4 3 12 1 12 23 11 22 6 17 5 2 13
8 1 10 3 7 4 2 15 6 4 14 5 12 10 5 2 10 17
9 2 1 6 16 1 3 18 18 3 6 1 6 11 4 2


2/22 Con los datos dados a continuacin construye el grfico correspondiente.

Estaturas de alumnos y alumnas del grupo 1 de Maestra en administracin.
1.53 1.59 1.55 1.64 1.79 1.69 1.57 1.68 1.63 1.64
1.69 1.73 1.67 1.56 1.68 1.52 1.55 1.51 1.6 1.52
1.52 1.78 1.67 1.57 1.54 1.64 1.74 1.59 1.69 1.67
1.68 1.69 1.59 1.55 1.53 1.66 1.67 1.63 1.67 1.77







DESCRIPCIN GRFICA DE UN CONJUNTO DE DATOS

ALGUNAS REGLAS PARA LA REPRESENTACIN GRFICA

1. Cuando se hace la representacin grfica de una sola variable, es costumbre indicar los datos de
sta en el eje horizontal.

2. Como abundan las variables que dependen del tiempo, las unidades en que se exprese ste se
colocan en el eje horizontal (hora, das, meses, aos, etc.).

3. Al representar los datos de dos variables (X, Y), cada una queda asociada a uno de los ejes. Se
acostumbra poner los valores de la variable que se considera independiente en el eje horizontal (eje
de las abscisas) y los valores de las dependientes en el eje vertical ( eje de las ordenadas).

4. En algunos casos, dadas dos variables, una puede depender de la otra o ambas de una tercera; en tal
caso, la asignacin de los ejes a las variables es arbitraria.

5. La disposicin general de un diagrama debe avanzar de izquierda a derecha.

6. Se debe procurar que aparezca en el diagrama la lnea correspondiente al cero.

7. Cuando la lnea del cero no pueda aparecer de modo normal en el diagrama, se le representa
mutilndola como sigue:
63




















8. Las dos escalas deben guardar proporcionalidad, de suerte que el grfico no d la impresin
de variaciones muy pequeas o muy exageradas. La mayor objetividad visual se logra con la regla de
los tres cuartos de altura, que puede ser enunciada como sigue:


En la representacin grfica se debe construir el eje vertical de tal modo que la altura del punto mximo
(que representa el dato asociado a la frecuencia ms alta) sea aproximadamente igual a 3 / 4 de la
longitud que media entre el origen y el ltimo dato indicado en el eje horizontal.


Frecuencia








a




0


Figura 2.11.3
No. de accidentes No. de accidentes
a = 3 b
4
b
0
70
80



90
1982 1984 1986
Ao
1980
0
20
30



40
22 23 24
Edad



ed
21 20
10
Figura 2.11.1 Figura 2.11.2
64


Sugerimos manejar esta regla cada vez que se pueda, ya que existe un uso engaoso, no poco
frecuente, de las tcnicas de representacin grfica. Basta con manejar maosamente los ejes de
coordenadas para dar impresiones radicalmente diferentes: Si se extienden las abscisas en relacin a las
ordenadas, las diferencias entre los datos parecen reducidas; si, en cambio, se extienden las ordenadas
con respecto a las abscisas, las diferencias parecen exageradas*.

Un grfico se considera terminado cuando cumple con estos requisitos:

1. El titulo de la tabla que dio origen al grfico debe parecer arriba y fuera de ste; el peridico se
escribe debajo del ttulo; la unidad de medida puede formar parte del encabezamiento,
quedando debajo del peridico, o fuera del grfico, quedando a un lado o arriba de la escala
numrica. Esto ltimo es lo ms usual (vid. Grfico 2.12.1).
2. Cuando un grfico aparecen las categoras de ms de una variable, se representan por la misma
figura geomtrica, pero distinguindolas por diferente color, sombreado u otra caractersticas.
El significado de esta diferenciacin se colocar, de preferencia, dentro del grfico mismo; pero
si esto no es posible, en su parte exterior.


GRFICO DE BARRAS

En uno de los mejores para realizar comparaciones de datos estadsticos, porque adems de
representar los valores absolutos o relativos de los datos en s, da una imagen de cmo se reparten los
elementos de conjunto respecto al total. La construccin de este grfico se basa en la representacin de
un valor numrico por un rectngulo, cuya longitud es proporcional a ese valor. Lo ms importante es
la determinacin de la longitud o altura de los rectngulos que representan valores. El clculo se
realiza mediante regla de tres simple, una vez establecida la correspondiente igualdad entre una
unidad de valor y una unidad de medida. La igualdad se establece entre el dato mayor y una medida
determinada.


Ejemplo 2.9 Calculemos la altura de los rectngulos correspondientes a los datos cuyas
frecuencias o intensidades numricas son:


25, 75, 40, 60

Solucin: Se elige una longitud conveniente y se establece una razn por cociente con el dato
mayor de la distribucin. Supongamos que la longitud es 10 cm. Entonces se establece la relacin
10/75, y con base en ella se plantean proporciones con los datos restantes.


10 = X , de donde X = 10 (25) =3.3 cm
75 25 75



65
Lase 10 es 75 como X es a 25.

10 = X X = 10 (40) =5.3 cm
75 40 75

10 = X X = 10 (75) =10.0 cm
75 75 75


10 = X X = 10 (60) =8.0 cm
75 60 75

Observando la solucin para X en las proporciones anteriores, nos damos cuenta que cada datos se ha
multiplicado por un factor constante (10/75), que indica el nmero de unidades de longitud por cada
unidad de valor. En este ejemplo corresponde 0.133 cm a cada unidad de valor.

La existencia de un factor constante en toda proporcin, como las anteriores, conduce a una va
rpida para el clculo de las longitudes a alturas de los rectngulos: para determinar las longitudes o
alturas de las barras que correspondan a cada uno de los datos de un conjunto determinado, basta con
elegir una longitud conveniente y establecer una razn entre elle y la frecuencia mayor del conjunto. El
cociente de esta razn es un factor que, multiplicado por cada una de las frecuencias restantes, de la
longitud de cada rectngulo.

En nuestro ejemplo










En la construccin de un grfico de barras se han de tener en cuenta estos factores:

1. La lnea base.

2. El ancho de las barras.

3. La se porcin entre barras.


La lnea base

Todas las barras deben partir de una horizontal llamada lnea base, para poder hacer
comparaciones entre las dimensiones de las mismas por una simple y rpida inspeccin.

25 (.133) = 3.3 cm

40 (.133) = 5.3 cm

60 (.133) = 8.0 cm

75 (.133) = 10.0 cm
66

Ancho de las barras


Es arbitrario, pero tiene que ser igual para todas las barras de un mismo grfico. Depende del
nmero de datos que se vayan a representar y del espacio disponible para la construccin del
grfico.


Separacin entre barras

Las barras de un grfico pueden o no estar separadas, dependiendo del tipo de variable que
representen. Debe haber espacio entre una y otra cuando los datos pertenezcan a variable nominal u
ordinal. Dicho espacio no debe ser menor que la mitad de ancho de una barra ni mayor que el
ancho de la misma y ha de ser igual entre todas las barras. Cuando los datos son de variable
cardinal no debe haber separacin entre las barras que los representan.
Independientemente de la variable, se bebe dejar espacio entre el origen de coordenadas y la
primera barra.

Con los elementos dados desde el inicio de este captulo, podemos ahora construir cualquier
grfico para distribuciones de una sola variable. Explicaremos el procedimiento general con un
ejemplo.

Ejemplo 2.10 De la tabla siguiente, construyamos un grfico de barras

Tabla 2.12.1
Presupuesto* para 6 municipios de los ms importantes del
Estado de Veracruz. 1991 (millones de pesos)





















Municipio Total
137 437

Coatzacoalcos 35 363
Crdoba 13 309
Orizaba 12 885
Poza Rica 10 644
Veracruz 42 592
Xalapa 22 644


* Aprobado por la Legislatura del Estado.
Fuente: Legislatura del Estado de Veracruz,
Direccin de Contadura y Glosa, 1991.
67
Procedimiento:
1. Los seis municipios representan categora nominales; por lo tanto, se usarn seis rectngulos
separados entre s.

2. Se trazan los ejes de coordenadas y se procede a marcar el inicio y trmino de cada una de las
barras, haciendo fijado previamente el ancho y la separacin entre stas. Luego se mide la
distancia entre el origen de coordenadas y el extremo de la ltima barra (supongamos que da 12
cm).

3. Se determinan los 3/4 de la distancia anterior y se establece una razn entre la medida resultante
y la mayor intensidad numrica de la distribucin (regla de los 3/4 de altura).

(3/4) (12)= 9 cm


Es decir, la barra correspondiente al presupuesto ms alto deber tener 9 centmetros de altura y la
razn de 9 cm a 42 592 millones de pesos da el factor constante 2.1 (10)
-4
, que representan el
nmero de centmetros por cada milln de pesos. Para facilitar su manejo, sea k este factor.

4. Se calculan las alturas de las barras correspondientes a los datos de la distribucin por va
rpida.




5. Se aproxima la frecuencia ms alta de la distribucin al nmero inmediatamente mayor que
permita una divisin apropiada del eje vertical, preferentemente en decenas, o un submltiplo o
mltiplo de 10, respecto a la unidad de medida de la distribucin. Ese nmero, en este ejemplo,
es 50 000, que se multiplica por k para conocer el nmero de unidades de longitud que le
corresponden.


50 000 k = 10.6 cm

Luego se parte 10.6 entre 5, para hallar la longitud equivalente a 10 000 millones de pesos.
En otras palabras, estas operaciones permiten fraccionar al eje de las ordenadas en 5 partes
iguales, cada una de las cuales es una unidad conveniente para la lectura y el dibujo del
grfico.

6. Finalmente se dibuja el grfico anexndole las indicaciones mnimas necesarias para su fcil
comprensin, segn las reglas convencionales (subttulo 2.11).







35 363 k = 7.5 cm
12 885 k = 2.7 cm
22 644 k = 4.8 cm
13 309 k = 2.8 cm
10 644 k = 2.2 cm
42 592 k = 9.0 cm
68
Grfico 2.12.1



* Aprobado por la Legislatura del Estado.
Fuente: Legislatura del Estado de Veracruz, Direccin de Contadura y Glosa, 1991.



GRFICO CIRCULAR

Se le llama tambin grfico de pastel y es bastante til para representar proporciones o porcentajes.
Es, de hecho, una forma alternativa al grfico de barras para representar una distribucin de
variable nominal. En su construccin se utiliza una circunferencia, cuyo crculo se divide en
sectores tales que sus medidas angulares sean proporcionales a los valores que representan. Estas
medidas se obtienen, al igual que para el tipo de grfico ya estudiado, mediante una regla de tres
simple, una vez que se establece la relacin entre una unidad de medida y una unidad de valor. Sin
embargo, en este caso particular resulta todava ms simple, ya que el factor constante que surge de
la relacin es siempre el mismo en todos los casos, debido a que toda circunferencia se divide
convencionalmente en 360 y la suma de todos los datos de una distribucin determinada equivale
al 100%. As la relacin que se establece es

6 . 3
% 100
360
=




0
5
10
15
20
25
30
35
40
45
P
r
e
s
u
p
u
e
s
t
o

e
n

m
i
l
l
o
n
e
s
Municipios
Presupuesto* para 6 municipios de los ms
importantes del Estado de Veracruz. 1991
(millones de pesos)
69
Dicha relacin da el nmero de grados por cada unidad porcentual. Consecuentemente, para
encontrar la medida angular que correspondera a un conjunto de frecuencias porcentuales cuya
suma es 100%, se multiplica cada una de stas por 3.6.*

Los estudiosos de estas cuestiones han demostrado que, para lograr la ptima legibilidad, los
sectores deben ser dibujados de mayor a menor a partir de la posicin que equivaldra en un reloj a
las 12 horas en punto y en sentido de las manecillas.


Ilustraremos el procedimiento a continuacin.


Ejemplo 2.11 Construyamos un grfico circular que represente la informacin de la tabla
2.12.1.


Instrumentos necesarios: regla, comps y transportador.

Procedimiento:

1. Se suman las frecuencias de las categoras de la variable (si la suma o total no aparece en la
tabla). En nuestro ejemplo aparece: 137 437.

2. Se expresan todas las frecuencias en porcentaje. Para ello, segn aprendimos en el subtitulo
2.5, se divide cada uno entre el total y el cociente se multiplica por 100.
La suma de los porcentajes debe dar 100%.

3. Se multiplican las frecuencias porcentuales por el factor constante 3.6; esto da la medida
angular del sector representativo de cada porcentaje. La suma de las medidas angulares debe
dar 360; a veces, por efecto de redondeo, se presenta alguna diferencia insignificante. Esto
carece de importancia; si la diferencia es ms o menos un grado, se le resta o aumenta al
sector ms grande al momento de trazarlo.









4. Se traza una circunferencia de radio arbitrario, en funcin del espacio disponible.

5. Se traza un radio vertical ya a partir de l se miden con un transportador los grados
correspondientes a cada sector, yendo del mayor al menor. A medida que se marcan los
grados en la circunferencia, se van dibujando los radios que formarn a su vez los sectores
buscados.

25.73 (3.6) = 93
9.68 (3.6) = 35
9.38 (3.6) = 34
7.74 (3.6) = 28
30.99 (3.6) = 112
16.48 (3.6) = 59
70

* Se puede establecer tambin la relacin de 360 al total de frecuencias, es decir, a la suma no
expresada en porcentaje. El factor constante ya no ser 3.6 sino otro valor, pero el resultado grfico
ser siempre el mismo.

6. Terminando el punto anterior, se escriben en cada sector los datos porcentuales
correspondientes; luego se anexa el encabezamiento y el pie, con todas las indicaciones
necesarias para hacer comprensible el conjunto grfico. Siempre es conveniente que aparezca
la suma de frecuencias en el encabezamiento; eso da la oportunidad de reconstruir, si se
quiere, el cuadro que dio origen al grfico.


Grfico 2.13.1

* Aprobado por la Legislatura del Estado.
Fuente: Legislatura del Estado de Veracruz, Direccin de Contadura y Glosa, 1991.
PICTOGRAMA


Es uno de los grficos que ms atrae la atencin del lector, razn por la cual se recurre a l con
frecuencia. Consiste en representar, por medio de figuras, determinadas magnitudes. Su desventaja
principal es que no permite comparaciones satisfactorias.

Para construir se procede as:

1. Se escoge una figura alusiva al asunto que se describe y se le asigna un valor o unidad de
medida.
2. Las cantidades menores que la unidad de medida se representan mediante un smbolo mutilado.
3. Terminado el grfico, se aade las indicaciones necesarias para su fcil lectura. Veamos:






42592
35363
22644
13309
12885
10644
Presupuesto* para 6 municipios de los ms
importantes del Estado de Veracruz. 1991
(millones de pesos)
Veracruz
Coatzacoalcos
Xalapa
Cordoba
Orizaba
Poza Rica
71
Ejemplo 2.12 Representemos por medio de un pictograma la informacin siguiente:

Tabla 2.14.1

Entidades federativas* con ms de 200 bibliotecas, Mxico. 1980


Entidad N de bibliotecas


Jalisco 282
Mxico 225
Nuevo Len 200
Oaxaca 275
Puebla 320
Veracruz 315


* Excluido el D.F.
Fuente: Agenda estadstica, 1979, p. 78,
Secretara de Programacin y Presupuesto.


Solucin: Alusiva a una biblioteca podemos escoger, por ejemplo, la figura de un libro abierto, al cual
le asignamos ** el valor de * 50 bibliotecas. De esta decisin sale el siguiente pictograma:



** Esta asignacin depender siempre del tamao de los datos que queramos representar, est en
funcin del espacio disponible y slo se pide facilite la lectura aproximada rpidamente.

















72
Grfico 2.14.1

Entidades Federativas *
Con ms de 200 bibliotecas Mxico. 1980



* Excluido el D.F.
Fuente: Agenda estadstica, 1979, p. 78, S.P.P.






HISTOGRAMA Y POLGONO DE FRECUENCIAS


Se da el nombre de histogramas a los grficos de barras cuando representan variables cardinales,
principalmente continuas. Si se unen con segmentos de recta los puntos medios de los techos de los
rectngulos, resulta un polgono de frecuencias.

Aunque el procedimiento de construccin de un histograma es bsicamente el mismo que para
cualquier grfico de barra, tiene algunas caractersticas que hacen necesario explicarlo de nuevo. Para
ello se utilizar una distribucin de datos agrupados.





Ejemplo 2.13 Construyamos tanto el histograma como el polgono de frecuencias de la tabla
siguiente:



73
Tabla 2.15.1

















Este cuadro es el mismo que el 2.9.2 del ejemplo 2.7; se le ha aadido nicamente la columna de
frecuencias porcentuales, con el fin de justificar las identificaciones diferentes de ambos cuadros.

Procedimiento:

1. Las siete categoras de la variable cardinal continua estn agrupadas en intervalos de amplitud
constante; por lo tanto, se usarn siete rectngulos del mismo ancho, unidos entre s.

2. Trazados los ejes coordenados, se procede a marcar el inicio y el trmino de cada barra,
habiendo fijado previamente su anchura. Puesto que no existen datos entre el origen de las
coordenadas y el primer intervalo, se mutila el eje horizontal para empezar el trazo de las barras
a una separacin razonable del origen. Luego se mide la distancia entre este ltimo y el extremo
del ltimo rectngulo (suponga que da 10 cm.).

3. Se determina tres cuartas partes de 10 cm. y con este valor (7.5 cm.) y la mxima frecuencia
(19) se establece una razn.


7.5 = 0.3947 = k
19
la cual indica el nmero de centmetros por cada unidad de frecuencia, o sea, por cada empleado.

4. Se calculan la altura de las barras para todos los intervalos por va rpida.







Edad de los empleados del supermercado X

Aos Total %
70 100

18 21 10 14
22 25 9 13
26 29 19 27
30 33 12 17
34 37 9 13
38 41 4 6
42 45 7 10


Fuente: datos supuestos
10 k = 3.9 cm.
9 k = 3.6 cm.
------ = -------
------ = -------
7 k = 2.8 cm.
74
0
4
8
12
16
20
5. Se aproxima la frecuencia ms alta de la distribucin al nmero inmediatamente mayor que
haga posible una divisin apropiada del eje vertical. Ese nmero es 20, que se multiplica por k
para conocer el nmero de centmetro que le corresponden.

20 k = 7.9 cm.

Luego se fracciona 7.9 cm, digamos en 10 partes iguales, para encontrar la longitud equivalente a 32
unidades de frecuencia, es decir, a 2 empleados. La decisin de dividir en dcimos y no en cuartos,
quintos o veinteavos, en este ejemplo, es por conveniencia; no existe otro motivo.



6. Finalmente se dibuja el grfico, y se le aaden las indicaciones necesarias



Grfico 2.15.1
Edad de los empleados del supermercado X
No. de empleados
















19.5 23.5 27.5 31.5 35.5 39.5 43.5 Aos

Fuente: datos supuestos


Este grfico muestra tanto el histograma como el polgono de frecuencias*. Se observa que el punto
medio de la base de cada barra es, precisamente, la marca de clase de cada intervalo: el inicio y el fin
de una barra representan los lmites reales de un intervalo y, en consecuencia, el ancho de la barrar
equivale a la amplitud real de la distribucin.




75
Reproduzcamos de nuevo el histograma y dividmoslo en pequeos bloques, cada uno de los cuales
represente un empleado (grfico 2.15.2).


Grfico 2.15.2
Edad de los empleados del supermercado X
No. de empleados


















19.5 23.5 27.5 31.5 35.5 39.5 43.5 Aos
Fuente: datos supuestos



Pensemos ahora que cada bloque tiene igual a la unidad; entonces, el nmero de unidades de rea en
cada rectngulo, o sea, el rea total de ste, representa la frecuencia de un intervalo de clase, o de un
dato, si se trata de una distribucin simple de frecuencias. Mirando detenidamente el grfico, resulta
claro que el rea de todos los rectngulos representa la suma de frecuencias o total de datos, y es igual a
la superficie limitada por el polgono y el eje de las abscisas del grfico 2.15.1.


* De ninguna manera es un requisito que ambos tipo de grfico se construyan juntos; con fines de
presentacin se puede elegir uno u otro, segn se prefiera.



Ahora bien, cuando las amplitudes de los intervalos son desiguales, el procedimiento sufre algunas
modificaciones para calcular el tamao correcto de los rectngulos. Estudiemos el ejemplo que sigue.




0
4
8
12
16
20
76
Ejemplo 2.14 construyamos tanto el histograma como el polgono de frecuencias de la tabla
siguiente:

Tabla 2.15.2


















Procedimiento:


1. Las categoras de la variable cardinal continua estn agrupadas en intervalos de amplitud
desigual; por lo tanto se usarn 6 rectngulos de ancho diferente, unidos entre s.

2. Como la amplitud ms frecuente es 10, correspondiente a los intervalos segundo, tercero y
cuarto, podemos tomarla como amplitud unitaria; entonces, la amplitud del primer intervalo
tendr 1.1 veces la amplitud unitaria; la del quinto, 1.5 veces, y la del sexto, 0.6 veces.
Visualicemos esto en el cuadro siguiente:












Estos valores permiten fijar las alturas de los rectngulos en funcin de la que se ha tomado como
unidad.


Personas que se suicidaron
por grupos de edad

Edad Nmero
de personas

14 24 28
25 34 14
35 44 12
45 54 9
55 69 9
70 - 75 6

Fuentes: Datos supuestos
Datos frecuencias # de veces que un intervalo
Contiene a la amplitud unitaria

14 24 28 11/10 = 1.1
25 34 14 10/10 = 1.0
35 44 12 10/10 = 1.0
45 54 9 10/10 = 1.0
55 69 9 15/10 = 1.5
70 75 6 6/10 = 0.6


77
3. La eleccin de un intervalo de referencia cuya amplitud se considera igual a la unidad, da como
resultado una frecuencia ajustada cuya determinacin representa las alturas de los
rectngulos. As,

Frecuencia ajustada = frecuencia de clase
Nmero de veces que un
Intervalo contiene a la amplitud
Unitaria.


Aplicando la expresin anterior, tendremos:

Para el primer intervalo,

frec. ajustada = 28 = 25.5
1.1

para el quinto,

frec. ajustada = 9 = 6
1.5

y para el sexto,

frec. ajustada = 6 = 10
0.6

Construimos luego un cuadro que muestre los datos y sus frecuencias simples y ajustadas*.












4. Finalmente, se procede exactamente igual que en los casos anteriores aplicando la regla de los
tres cuartos de altura. Se ha de tener en cuenta, no obstante, que lo que se grfica son las
frecuencias ajustadas y no las originales. Estas pueden ser anotadas arriba del rectngulo
correspondiente para permitir lecturas exactas. El grfico resultante (histograma y polgonos de
frecuencias) es el siguiente:

* Si lo que se maneja son frecuencias porcentuales, se usa la misma expresin (1) para calcular
frecuencias porcentuales ajustadas.
Datos frecuencia frec. ajustada

14 24 28 25.5
25 34 14 14.0
35 44 12 12.0
45 54 9 9.0
55 69 9 6.0
70 75 6 10.0


78



Grfico 2.15.3
No. de personas




Personas que se suicidaron por grupos de edad

















19 29.5 39.5 49.5 62 72.5






2.16 GRFICO DE LNEAS

Es bastante til para comparar los datos de dos o ms distribuciones. Consiste en unir, por medio de
segmentos de recta, los puntos de coordenadas determinados por los datos de dos variables que se
corresponden o de variables que dependen del tiempo. En su construccin tambin se aplica la regla de
los 3 /4 de altura. El trazo del grfico puede o no comenzar en el eje de coordenadas; esto no tiene
importancia y depende del diseo del grfico.







0
5
10
15
20
25
30
28
14
12
9
9
6
79

Ejemplo 2.15 Mediante un grfico de lneas, presentemos la informacin de la tabla siguiente:

Tabla 2.16.1
















1970: Poblacin corregida y proyectada al 30 de junio de 1970.
1979: Estimaciones del Consejo Nacional de Poblacin.
Poblacin rural: Menos de 2 500 habitantes.
Fuentes: Mxico demogrfico, breviario, 1979 , p. 44.

Procedimiento:

1. La Poblacin es funcin del tiempo. Es decir, la magnitud tiempo es la variable independiente;
por lo tanto, segn las normas convencionales, se debe ubicar las unidades de tiempo en el eje
horizontal y los datos de la poblacin en el vertical.
2. Trazados los ejes de coordenadas, se marcan puntos igualmente espaciados para los aos
dados. Luego se mide la distancia entre el origen de coordenadas y el punto correspondiente al
ltimo dato en el eje de las abscisas (supongamos, 16 cm.).
3. Se determina los 3 / 4 de la distancia anterior y se establece una relacin entre la longitud
resultante y el dato mayor de la serie, que se localiza en la columna de totales.

La razn de 12 a 67.9 indicar el nmero de centmetros por cada milln de habitantes.

12.0 = 0.1767
67.9

4. Se calculan las alturas de los datos de poblacin usando el factor constante, que en esta ocasin
simbolizaremos por k.





Poblacin rural y urbana. Mxico, 1900 1979 (millones)

Ao Total urbana rural

1900 13.6 2.6 11.0
1910 15.2 3.7 11.5
1921 14.4 4.5 9.9
1930 16.5 5.5 11.0
1940 19.7 6.9 12.8
1950 25.8 11.0 14.8
1960 34.9 17.7 17.2
1970 50.7 29.8 20.9
1979 67.9 44.6 23.3


80










5. Se aproxima 67.9 a 70 y se multiplica este ltimo nmero por k, para saber el nmero de
unidades de longitud que le corresponden.

70 k = 12.4 cm.

6. Se parten los 12.4 cm. en 7 partes iguales, para hallar la longitud equivalente a 10 millones de
habitantes.

7. Fijados los puntos correspondientes a las tres distribuciones de datos (total, urbana y rural), se
traza el grfico tres curvas- y se le anexan las indicaciones mnimas necesarias para hacer
accesible la lectura.

Grfico 2.16.1

Poblacin rural y urbana Mxico 1900 1979
Millones
De habitantes




















Fuente: Mxico Demogrfico, Breviario, 1979, p. 44, Consejo Nacional de Poblacin.

Totales Urbanas Rural
13.6 k = 2.4 cm. 2.6 k = 0.5 cm. 11.0 k = 1.9cm.
15.2 k = 2.7 cm. 3.7 k = 0.7 cm. 11.5 k = 2.0cm.
------- = -------- ------ = ------- ------- = -------
------- = -------- ------ = ------- ------- = -------
67.9 k = 12 cm 44.6k= 7.9 cm. 23.3 k = 4.1 cm.




50
10
20
30
40
60
0
70
0
Poblacin total
Poblacin rural
Poblacin urbana
81
DISTRIBUCIONES ACUMULADAS Y POLGONOS DE FRECUENCIAS
ACUMULADAS


Estudiamos en el subttulo 2.5 el concepto de frecuencia acumulada. Vimos que la
acumulacin de las frecuencias y, por consiguiente, de las categoras de la variable, puede ser
frecuencias simples o relativas, ascendentes o descendentes. Tambin aprendimos a construir
e interpretar correctamente distribuciones de frecuencias acumuladas para distribuciones
simples de frecuencias, es decir, para datos no agrupados. A continuacin ensancharemos
nuestro conocimiento de este tipo de distribuciones.

Hablamos con propiedad de distribucin de frecuencias acumuladas siempre y cuando las
categoras de la variable que se maneja sean ordenables. En otras palabras: para variables
ordinales o cardinales. Si aculamos las categoras de menor a mayor (acumulacin
ascendente), resulta una distribucin menos de, en la cual una frecuencia acumulada incluye
todas las categoras menores de cierto valor. Si las acumulamos de mayor a menor
(acumulacin descendente), resulta una distribucin o ms, en la cual una frecuencia
acumulada incluye todas las categoras mayores o iguales que cierto valor. Toda
representacin tabular de una distribucin acumulada se conoce como distribucin de
frecuencias acumuladas. Ilustremos de dicho.

La tabla 2.17.1 presenta al mismo tiempo una distribucin de frecuencias acumuladas
simple y otra porcentual, menos de, de las edades de los empleados del supermercado X,
que se dan en la tabla del subttulo 2.15.

Tabla 2.17.1

















Este cuadro posibilita la siguiente lectura: por ejemplo, 38 empleados, que representan el 54% del total,
son menores de 29 aos y medio; 59 empleados, que representan el 84% del total, son menores de 37
aos y medio, etc.

Distribucin de frecuencias acumuladas
menos de de las edades de los empleados
del supermercado X.

Aos Empleados
No. %

Menos de 17.5 0 0
21.5 10 14
25.5 19 27
29.5 38 54
33.5 50 71
37.5 59 84
41.5 63 90
45.5 70 100

82
Ahora bien, la representacin grfica de una distribucin de frecuencias acumuladas se llama
ojiva o polgono de frecuencias acumuladas.


No se debe confundir el polgono de frecuencias acumuladas (ojiva) con el polgono de
frecuencias. Este, para su trazo, tiene como base los puntos medios de los intervalos de clase y limita
una superficie con el eje horizontal que es representativa del total de frecuencias (vid. Grfico 2.15.1);
aqul se basa en los lmites reales inferiores de clase y, por ms caractersticas, recuerda la forma de
una ese.
Podemos construir ojivas con distribuciones acumuladas simples o porcentuales. Por sencillez
hemos preferido las acumulaciones porcentuales, aplicamos la regla de los tres cuartos de altura y
dividimos en 10 partes iguales al eje de las ordenadas, ya que las distribucin siempre abarcar de 0 a
100%. Veamos.



Grfico 2.17.1

% de empleados menos de























17.5 21.5 25.5 29.5 33.5 37.5 41.5 45.5 Aos


Ntese que el carcter ascendente de este grfico queda de manifiesto al leer los lmites reales
de menor a mayor, ya que aumenta el porcentaje de casos que caen por debajo de ellos.

0
10
20
30
40
50
60
70
80
90
100
83

Los polgonos de frecuencias acumuladas son muy tiles porque permiten responder distintas
preguntas sin necesidad de clculo. Por ejemplo, si en nuestra ojiva trazamos una paralela al eje
horizontal, podemos estimar la edad (29 aos) bajo la cual se encuentra el 50% de los empleados.
Tambin podemos estimar la edad (29 aos) bajo la cual se encuentra el 50% de los empleados.
Tambin podemos proceder en sentido inverso: fijada una edad que sea de nuestro inters, en el eje de
las abscisas, proyectarla hasta que corte a la ojiva y leer el porcentaje de empleados cuyas edades son
menores a ese valor.


Ahora consideremos el cuadro siguiente:

Tabla 2.17.2


















En este cuadro leemos, por ejemplo, que 60 empleados que representan el 86% del total, tiene 21 aos
y medio de edad o ms; que 11 empleados, que representan el 16% del total, tienen por lo menos 37.5
aos de edad; etc. A continuacin mostramos la ojiva correspondiente a esta nueva distribucin
acumulada.













Distribucin de frecuencias acumuladas
o ms de las edades de los empleados
del supermercado X

Ao Empleados
No. %

17.5 ms 70 100
21.5 60 86
25.5 51 73
29.5 32 46
33.5 20 29
37.5 11 16
41.5 7 10
45.5 0 0


84

Grfico 2.17.2 % de empleados o ms



















El carcter descendente de esta ojiva sobresale porque al leer los limites reales de menor a mayor
disminuye el porcentaje de casos que estn por arriba de ellos.

Concluiremos diciendo que los polgonos de frecuencia acumuladas pueden ser construidos
para cualquier tipo de distribucin de datos agrupados, sin importar cul sea la anchura de sus
intervalos.





















17. .5 21. 5 25..5 29..5 33. 5 37. 5 41. 5 45. 5 Aos


85

EJERCICIOS

Subttulos 2.10-2.13


Representa, mediante un grfico de barras y otros de pastel, la informacin de cada uno de los cuadros
siguientes:


2/24

















2/25


















Fuente: Anuario estadstico de los Estados Unidos
Pelculas exhibidas segn su nacionalidad
Distrito Federal. 1988.

Nacionalidad Total
4, 257

Mexicana 705
Alemana 75
Americana 2, 689
Francesa 176
Inglesa 71
Italiana 142
Otras 399



Accidentes de trnsito con resultados fatales, en
zona urbana, por tipo de accidente. Mxico.
1989.

Total de accidentes Total
2, 910

Choque con otros 835
vehculos de motor

Atropellamiento 1, 249

Accidente de un solo 625
vehculo

Otros 201


86
Mexicanos, 1990, p.551.
2/26














* Por agencias del Ministerio Pblico
** No se dispone de la informacin de los casos
ocurridos en el Distrito Federal.
Fuente: Anuario estadstico de los Estados
Unidos Mexicanos, 1990, p, 562.


Subttulo 2.15

2/27. Elabora histograma de las distribuciones dadas en los ejercicios 2/11, 2/12, 2/13 y 2/14.

2/28. Haz el polgono de frecuencias de las distribuciones dadas en los ejercicios 2/15, 2/16,
2/17 y 2/18.

Subttulo 2.16

2/29. Del cuadro siguiente haz un grfico de lneas que seale el nmero de divorcios por
duracin del matrimonio en cada ao. Sugerencia: simplifica antes el cuadro introduciendo una unidad
de medida adecuada.













Suicidios registrados * por estado civil
del individuo actuante **. Mxico. 1989.

Estado civil Total
1, 160

Soltero 455
Casado 456
Viudo 41
Divorciado 19
Unin libre 120
Separado 6
Se ignora 63


Divorcios registrados por duracin del matrimonio. Mxico.
1985-1989

Aos

Ao Total Menos de 1 1-5 6-9 10 y ms Sin especificar

1985 34, 114 1, 120 13, 588 7, 322 11, 515 5, 609
1986 38, 287 1, 382 15, 083 8, 191 13, 405 766
1987 45, 323 1, 432 17, 122 9, 568 16, 185 1, 016
1988 47, 464 1, 554 17, 228 9, 779 17, 378 1, 525
1989 46, 039 1, 913 16, 338 9, 235 17, 126 1, 427
Fuente: Anuario estadstico de los Estados Unidos Mexicanos, 1990, pp.402-403


87

Tomando los dos cuadros siguientes haz un grfico de lneas para cada uno, que seale el total de
alumnos, el de hombres y el de mujeres, por ciclo escolar, Sugerencia: simplificalos antes
introduciendo una unidad de medida adecuada.

2/30











* Al inicio de cursos.
Fuente: Anuario Estadstico de los Estados Unidos Mexicanos, 1990, p. 423.

2/31













* Al inicio de cursos.
Fuente: Anuario estadstico de los Estados Unidos
Mexicanos, 1990, p. 442.











Alumnos en escuelas primarias*, por sexo y ciclo
escolar. Mxico 1985 1990

Ciclo Total Hombres Mujeres

85/86 15124,160 7762,887 7361,273
86/87 14994,642 7702,263 7292,379
87/88 14768,008 7595,628 7172,380
88/89 14656,357 7539,440 7116,917
89/90 14493,763 7484,342 7009,421

Alumnos en escuelas secundarias *,
por sexo y ciclo escolar. Mxico.
1985 1990.

Ciclo Total Hombre Mujeres

85/86 4179,466 2162,769 2016,697
86/87 4294,596 2219,445 2075,151
87/88 4347,257 2244,452 2102,805
88/89 4355,334 2244,848 2110,486
89/90 4267,156 2192,832 2074,324


88

2/32 El cuadro siguiente representa las edades de los trabajadores de la fbrica de ladrillos Barro
fino, en junio de 1993.











a) Construye su histograma.

b) Construye una distribucin acumulada o menos y la ojiva correspondiente.


c) Usando la ojiva o menos estima la edad por debajo de la cual se halla el 25%, el 50% y
el 75% de los trabajadores.

d) Construye una distribucin acumulada o ms y la ojiva correspondiente.


e) Usando la ojiva o ms estima la edad por arriba de la cual se halla el 25%, el 50% u el
75% de los trabajadores



2/33. Con los datos de los ejercicios 2/19, 2/20, 2/21, 2/22 y 2/23, para cada caso:


a) Construye su histograma

b) Construye unas distribucin acumulada o menos y la ojiva correspondiente


c) Usando la ojiva o menos, estima el valor por debajo del cual se encuentra 25%, el 50% y el
75% de los casos

d) Construye una distribucin acumulada o ms y la ojiva correspondiente


e) Usando la ojiva o ms, estima el valor por arriba del cual se encuentra el 25%, el 50% y el
75% de los casos.



Aos Total

27-30 3
31-34 5
35-38 7
39-42 3
43-46 2
47-50 1


89

DESCRIPCIN NUMRICA DE UN CONJUNTO DE DATOS


MEDIDAS DE TENDENCIA CENTRAL

CALCULO DE MEDIA, MEDIANA Y MODA.

Datos no agrupados


Media aritmtica
n
x
n
1 i
i
=
=


Mediana: (llamada tambin valor mediano), es el punto dentro del recorrido de una variable que
supera a no ms de la mitad de los datos y es superado por no ms de la otra mitad.

Dicho de otro modo; si formramos en una lnea a todos los datos, (a partir del ms pequeo, hasta el
ms grande) sera el dato que cae en exactamente a la mitad.

Una forma rpida de obtener la mediana en una serie ordenada de datos es determinar el nmero de
orden que le corresponde.
Nmero de orden
2
1 N
. No
+
=



Moda. Tambin llamado modo o valor modal, es el dato de variable que aparece ms veces en una
distribucin.
En otras palabras es el dato de variable que tiene mayor frecuencia, ejemplo:

Tengamos los siguientes datos: 5, 5, 4, 7, 9, 10, 3, 7, 5, 8
Media:
3 . 6
10
8 5 7 3 10 9 7 4 5 5
n
x
n
1 i
i
=
+ + + + + + + + +
= =

=




Mediana: Primero formamos los datos, 3, 4, 5, 5, 5, 7, 7, 8, 9, 10, luego calculamos el nmero de
orden del dato mediano,
5 . 5
2
1 10
2
1 N
. No =
+
=
+
=
lo cual significa en este caso que se
90
tienen que sumar los datos ubicados en los lugares 5 y 6 y dividirlo entre dos, esto es
6
2
7 5
Me =
+
=

Moda, es el dato que se repite ms veces, Mo = 5

As tendremos: Media = 6.3; Mediana = 6 y Moda = 5

Dados los datos anteriores podemos decir que el promedio de los datos es 6.3, que el 50% de los datos
es por lo menos 6 o mayor, otro 50% es cuando mucho 6 o menor que 6 y que el valor que se repite
mas veces es 5.

RELACIONES ENTRE LOS VALORES NUMRICOS DE LA MEDIA, LA MEDIANA Y LA
MODA, SEGN LA FORMA DE LA DISTRIBUCIN.

Se dice que una distribucin es simtrica si, partindola imaginariamente por su punto mediano, una
vez hecha la representacin grafica, se obtienen dos mitades exactamente iguales. Si no son iguales es
asimtrica. Esta asimetra puede darse en diversos grados, pudindose decir que una distribucin es
ligera o marcadamente asimtrica.








Mo Me= =

Fig. a Fig. b fig. c Fig. d

Las asimetras tienen sesgo positivo o negativo. Es positivo cuando sus datos se extienden hacia el
extremo de valores altos, tomando como punto de referencia el valor mediano; negativo, cuando se
extienden hacia el extremo de valores bajos.

Dependiendo de la forma de la distribucin, las relaciones entre los valores numricos de la media,
mediana y moda son como se afirma a continuacin:

1- Si es simtrica unimodal, las tres son iguales. (Figura a)
2- Si es simtrica, pero tiene ms de una moda, slo la media y la mediana son iguales. (Fig b)
3- Si es asimtrica, por lo regular las tres son diferentes, habiendo siempre diferencia entre la
mediana y la moda. Fig. c y d





91
Si el sesgo es positivo Si el sesgo es negativo
Mo Me > >

Mo Me s <










La media es un indicador muy sensible a los valores extremos muy altos o muy bajos- de una
distribucin; en cambio la mediana es muy poco sensible a este tipo de datos. Esta propiedad en los dos
indicadores mencionados, conocida como estabilidad relativa, hace que la mediana se use como el
promedio adecuado para resumir distribuciones marcadamente asimtricas*.

CALCULO DE MEDIA MEDIANA Y MODA EN DATOS NO AGRUPADOS (En una distribucin
simple de frecuencias)
En una distribucin de datos no agrupados la media se obtiene mediante la frmula

=
=
=
n
i
i
n
i
i i
f
x f
1
1


La mediana y la moda se obtienen como ya se indico en el ejemplo anterior.

EJEMPLO
Un estudio sobre el aprovechamiento de los alumnos de un grupo A en cierto semestre, condujo a los
siguientes datos:

Calificacin Frecuencia
(f)
No. de
estudiantes
(f)(x)
20 1
20
30 4
120
50 8
400
60 10
600
70 20
1400
80 15
1200
95 10
950
90 5
450
100 3
300
76 5440
Media 71.57
Mediana 70
Moda 70
Interpretacin:

Media: Este indicador supone que cada uno de los 76 estudiantes
obtuvieron 71.57 de calificacin en promedio, durante el
semestre considerado.

Mediana: Por lo menos la mitad (50%) de los estudiantes
obtuvieron 70 de calificacin o ms.

Moda: El caso ms notorio fue el de os estudiantes que
obtuvieron 70 de calificacin.



92
CALCULO DE MEDIA MEDIANA Y MODA EN DATOS AGRUPADOS

Media

=
=
=
n
i
i
n
i
i i
f
x f
1
1

Mediana
j
f
f
N
L Me
j
a
*
2
(
(


+ =




Moda; Es el dato de variable que aparece ms veces en una distribucin.
En otras palabras es el dato de variable que tiene mayor frecuencia. (Es el dato que se repite ms veces)



EJEMPLO DE CALCULO DE MEDIA MEDIANA Y MODA EN DATOS AGRUPADOS

Alumnado segn tiempo dedicado
al estudio fuera de clases
2000
Horas semanarias Frecuencia
1-3 50
4-6 38
7-9 26
10-12 36
13-15 19
16-18 7
19-21 7
22-28 5


Para encontrar la Media, mediana y moda llenaremos la siguiente estructura.

Datos f dfa Puntos medios
(X)
F(X)
1-3 50 50 2 100
4 -6 38 88 5 190
7 9 26 114 8 208
10 12 36 150 11 396
13 15 19 169 14 266
16 18 7 176 17 119
19 21 7 183 20 140
22 28 5 188 25 125
Suma = 188 Suma = 1544


93

Media
. Hrs 2 . 8
188
1544
f
x f
n
1 i
i
n
1 i
i i
= = =

=
=



Interpretacin: En el ao 2000 el alumnado sometido a investigacin dedicaba al estudio fuera de
clases 8.2 Horas semanarias en promedio.

Mediana
19 . 7 3 *
26
6
5 . 6 3 *
26
88
2
188
5 . 6 j *
f
f
2
N
L Me
j
a
=
|
.
|

\
|
+ =
(
(


+ =
(
(


+ =



Interpretacin: En el ao 2000 la mitad del alumnado dedicaba al estudio fuera de clases entre 1 y
7.19 horas a la semana ( 7.19 horas como mximo).

Moda: Es la marca de clase del primer intervalo, puesto que es el de ms alta frecuencia. Mo. = 2 Hrs.
Semanarias.

Interpretacin: Entre el alumnado, en el 2000, el caso ms notorio fue el de los estudiantes que
dedicaban 2 horas semanarias al estudio fuera de clases: el 26.6 % de los alumnos.


LA MEDIA, MEDIANA Y MODA EN VARIABLE NOMINAL Y ORDINAL

Investigue y conteste Qu medidas de tendencia central se pueden calcular en variables de tipo
nominal y ordinal?















94
MEDIDAS DE DISPERSIN. RANGO (R), VARIANZA (
o
2
o S
2
), DESVIACIN ESTNDAR (
o
o S), DESVIACIN ABSOLUTA PROMEDIO (D.M.), COEFICIENTE DE VARIABILIDAD
(C.V.), Y DESVIACIN CUARTIL.

Una medida de dispersin dice cuanto se desvan los datos respecto a las tendencias centrales, y
es necesario su uso dado que las medidas de tendencia central no son suficientes para describir una
poblacin, observe las siguientes figuras:











RANGO (R). Es la ms simple de las medidas de dispersin. Representa la distancia entre el menor y el
mayor de los datos de una distribucin, por lo cual puede ser interpretado como la dispersin total de
todos ellos, se obtiene restando el dato menor del dato mayor.

Ejemplo: Se tienen los siguientes valores, 2, 3, 4, 4, 5, 5, 5, 5, 6, 7 obtenga el rango R = 7 2 R = 5

El rango brinda una primera idea de la dispersin o heterogeneidad de una poblacin, pero es
insuficiente dado que slo considera los datos extremos y descuida los intermedios, por ejemplo,
observe las siguientes figuras:










Note que se trata de distribuciones con igual media, mediana, moda y RANGO, sin embargo, la
dispersin, entre los datos es diferente. Los datos de la segunda grafica estn ms dispersos que en la
primera y menos que en la tercera. Es necesario aclarar, tales dispersiones al hacer la descripcin, para
esto utilizamos generalmente a la desviacin estndar, dado que se presume que es la medida de
dispersin ms adecuada.

Hasta finales del siglo pasado, la desviacin media (Desviacin absoluta promedio) fue la medida de
dispersin de ms uso, esta fue desplazada por la construccin del concepto de desviacin estndar la
cual tiene mejores propiedades algebraicas y genera valores numricos muy parecidos a los que se
obtienen con la desviacin media.
Note que se trata de distribuciones con igual
media, mediana y moda, sin embargo, la
distancia entre el menor y el mayor de los datos
es diferente. Los datos de la segunda grafica
estn ms dispersos. Es necesario aclarar, tal
diferencia al hacer la descripcin, para esto
utilizamos el rango.

95

Aunque la D.M. haya cado en desuso, conviene estudiarla dado que es muy fcil de comprender y
facilita a su vez la comprensin del concepto de desviacin estndar.

La desviacin media se define como la desviacin promedio de los valores absolutos de las
desviaciones de los datos de una variable respecto a su media.

Para calcular la desviacin media se utiliza la siguiente frmula:


N
X X
M D


= . .

Tengamos los siguientes datos: 5, 5, 4, 7, 9, 10, 3, 7, 5, 8
Media:
3 . 6
10
8 5 7 3 10 9 7 4 5 5
n
x
n
1 i
i
=
+ + + + + + + + +
= =

=



CLCULO DE LA DESVIACIN MEDIA
Xi Media Xi-Media
Valor
Absoluto
1 5 6.3 -1.3 1.3
2 5 6.3 -1.3 1.3
3 4 6.3 -2.3 2.3
4 7 6.3 0.7 0.7
5 9 6.3 2.7 2.7
6 10 6.3 3.7 3.7
7 3 6.3 -3.3 3.3
8 7 6.3 0.7 0.7
9 5 6.3 -1.3 1.3
10 8 6.3 1.7 1.7
19
DM = 19/10 DM = 1.9

Lo anterior quiere decir que los datos de la variable X se desvan 1.9 unidades en promedio respecto a
su media.

Observe los datos de la cuarta columna, podr notar que el primer dato se separa 1.3 unidades
respecto a la media, en cambio el quinto dato se desva 2.7 unidades por arriba del valor medio, etc.
As resulta fcil comprender que la D. M. obtenida indica que los 10 datos de la variable se separan 1.9
unidades en promedio de la media aritmtica.






96

DESVIACIN ESTNDAR Y VARIANZA (DATOS SIMPLES, SIN FRECUENCIA ASOCIADA)

Es la desviacin promedio de los datos de una distribucin respecto a su media.

Se utiliza el smbolo
o
cuando se trata de desviaciones estndar de poblaciones, y S si se trata de
muestras. La varianza es el cuadrado de la desviacin estndar. Varianza =
o
2


( )
N
X X
S
2


=


Ejemplo: Calcular la desviacin estndar y la varianza de los siguientes datos; 5, 5, 4, 7, 9, 10, 3, 7, 5,
8

CALCULO DE VARIANZA Y DESVIACIN ESTNDAR

Xi Media (Xi-Media)
2

1 5 6.3 1.69
2 5 6.3 1.69
3 4 6.3 5.29
4 7 6.3 0.49
5 9 6.3 7.29
6 10 6.3 13.69
7 3 6.3 10.89
8 7 6.3 0.49
9 5 6.3 1.69
10 8 6.3 2.89
= 46.1

Varianza = 46.1/10 = 4.61 Desv. Stdr. = RAIZ 4.61= 2.14
















97
DESVIACIN ESTNDAR Y VARIANZA (DATOS AGRUPADOS)

Tengamos la siguiente tabla de un ejemplo anterior para calcular los datos sealados:

Alumnado segn tiempo dedicado
al estudio fuera de clases
2000
Horas semanarias Frecuencia
1-3 50
4-6 38
7-9 26
10-12 36
13-15 19
16-18 7
19-21 7
22-28 5

Horas
semanarias
Frecuencia
F
Puntos
Medios (X)
X*X = X
2
F(X) F(X)
2

1 hr - 3 hr 50
2 4 100 200
4 hr - 6 hr 38
5 25 190 950
7 hr - 9 hr 26
8 64 208 1664
10 hr-12 hr 36
11 121 396 4356
13 hr-15 hr 19
14 196 266 3724
16 hr-18 hr 7
17 289 119 2023
19 hr-21 hr 7
20 400 140 2800
22 hr-28 hr 5
25 625 125 3125
188 1544 18842

Para el calculo de la varianza y desviacin estndar utilizaremos la siguiente frmula reducida:

( )
2
2
2
x
N
x f
S =


2
S S =


( ) 66 . 32 56 . 67 22 . 100 2 . 8
188
842 , 18
S
2
2
= = =


71 . 5 66 . 32 S = =


Varianza = 32.66 Desviacin estndar = 5.71

98
COEFICIENTE DE VARIABILIDAD

Considere las siguientes distribuciones datos- 5, 15, 25, cuya desviacin estndar es 8.16, Ahora
consideremos los datos 190, 200, 210, cuya desviacin estndar es 8.16. Qu conclusiones podemos
extraer?
En el primer caso el rango es 20 que comparado con la media es 133.3 % ms grande, en el segundo
caso el rango es 20 pero comparado con la media 200 apenas es el 10%.

La desviacin estndar o desviacin tpica es insuficiente para dar cuenta objetivamente de la
dispersin de dos o ms conjuntos de datos, dos poblaciones pueden tener una desviacin estndar
igual, sin embargo, una de las distribuciones puede ser mucho ms homognea que la otra en trminos
relativos.


Coeficiente de Variabilidad: Es la razn de la desviacin estndar a la media de una distribucin
dada.

X
S
CV =
El coeficiente de variabilidad permite llegar a conclusiones ms objetivas y se
acostumbra expresarlo en %.

Aplicando a los datos dados al inicio de este tema tendremos:

% 4 . 54 544 . 0
15
16 . 8
X
S
CV = = = =

% 4 040 . 0
200
16 . 8
X
S
CV = = = =


Note que la variabilidad es considerablemente ms grande en el primer caso, dicho de otro modo los
datos de la segunda distribucin son mucho ms homogneos que los de la primera en trminos
relativos.














99
DESVIACIN CUARTIL
Es la medida de dispersin ms usada en relacin con la mediana: algunos autores la llaman rango
semiintercuartil. Se le simboliza por Q y se le define por la frmula
2
Q Q
Q
1 3

=
en la cual Q
1
y
Q
3
son los puntos bajo los cuales se halla el 25% y el 75% de los datos, respectivamente. A estos
puntos se da un nombre especfico Q
1
es el primer cuartil, Q
3
es el tercer cuartil, de este modo el
valor mediano ser Q
2
o el segundo cuartil.

La desviacin cuartil representa la desviacin promedio del primer y tercer cuartil con respecto a la
mediana de la distribucin y nos dar idea de cunto se desvan estos dos puntos respecto a la mediana.






10% 20% 10%
5% 10% 15% 15% 10% 5%




Al igual que los cuartiles Q
1
Q
2
y Q
3
hay casos especiales conocidos como percentiles. Estos son
puntos bajo los cuales se halla determinado porcentaje de datos, se les da el smbolo P, con un
subndice que denota un porciento; as P
20
representa el punto bajo el cual se halla el 20% e los datos.
Hay otros casos de percentiles especiales que se usan frecuentemente, uno de ellos es el decil. Los
deciles como su nombre lo indica dividen a una distribucin en 10 partes iguales.




















100
TEORA DE LA PROBABILIDAD

Definicin y enfoques de la probabilidad


5.1 INTRODUCCIN

Cuando definimos la estadstica en el subtitulo 1.1, dijimos, al hablar de las dos ramas en que se divide esta
disciplina, que la inferencial descansa en la teora de la probabilidad. Esta teora tiene, adems, muchas
aplicaciones en diversos campos del quehacer humano: mediante ella se establecen los puntos de ventaja en
las carreras de caballos y otros eventos deportivos; se conoce la eficacia de nuevos medicamentos; se
mantiene el control de calidad en la industria o se colocan nuevos artculos en el mercado; se fija el monto
de los seguros de vida, etc. Estos ejemplos ensean que el terreno de la probabilidad es vasto y atrayente.
Nos propondremos, en consecuencia, estudiar a continuacin algunos de sus fundamentos.

5.2 FENMENOS DETERMINISTAS Y ALEATORIOS

Si ponemos al fuego un recipiente con agua, sabemos que sta va a hervir indefectiblemente y que, adems,
el tiempo en que alcance el punto de ebullicin guardar relacin inversa con la temperatura a que se le
someta: a mayor intensidad del fuego, menor el tiempo en que rompa el hervor y viceversa. Si lanzamos una
piedra al vaco, sabemos de antemano que caer; podemos incluso predecir adnde, conociendo el ngulo de
inclinacin y la velocidad inicial de lanzamiento, si la del viento en ese momento es despreciable.





Si, en cambio, tiramos un dado en cuyas caras aparezcan los smbolos de 1 al 6, desconocemos cual de ellos
quedar hacia arriba; o si echamos un volado, ignoramos si la moneda caer guila o sol.







5.3 ESPACIO MUESTRAL Y EVENTO

Si retomamos los ejemplos del dado y del volado, notaremos que en el primero los resultados posibles son:
1, 2, 3, 4, 5, 6; en el segundo: guila o sol. Pues bien el conjunto de todos los resultados posibles de un
experimento aleatorio se conoce como espacio muestral; cada uno de ellos es un punto muestral y el
resultado que obtenemos o esperamos obtener al realizar una o varias veces el mismo experimento es un
evento o suceso. Si el experimento se repite dos o ms veces, el nmero de resultados posibles cambia
notoriamente al igual que la naturaleza de los puntos muestrales. Veamos.


Ejemplo 5.1 Determinamos el espacio muestral resultante de echar dos volados.

Estos experimentos, cuyos resultados pueden ser anticipados con toda certeza, reciben
el nombre de fenmenos deterministas.
Estos experimentos, en que no es posible adelantar el resultado con toda certidumbre, se llaman
fenmenos aleatorios y son el objeto de estudio de la teora de la probabilidad
101
Solucin: se trata de un experimento formado por dos repeticiones del mismo tipo: echar un volado.
Pensando un poco, encontramos que los resultados posibles pueden ser 2 guilas, 1 guila y 1 sol, 1 sol y un
guila, 2 soles. Usando las inciales correspondientes, podemos anotar este espacio muestral como sigue:

(AA, AS, SA, SS)

Si el evento esperado es cualquiera de estos dos puntos, se dice que es un evento conjunto ya que consta de
ms de un evento simple.

Como acabamos de ver, la determinacin del espacio muestral de experimentos que implican una o dos
repeticiones de su tipo, como echar uno o dos volados, tirar dos veces un dado, planear tener dos hijos, es
muy fcil ya que basta una simple inspeccin. No obstante, cuando se quiere conocer a todos los resultados
posibles de una serie de experimentos o repeticiones del mismo tipo, en el cual los puntos muestrales son
necesariamente eventos conjuntos, esa facilidad desaparece rpidamente y se torna ms y ms difcil a
medida que se alarga la serie. Por fortuna, para resolver estos casos existe una tcnica conocida como
diagrama de rbol cuya aplicacin conduce metdicamente al espacio muestral que se quiere conocer.
Explicaremos en que consiste recurriendo a un ejemplo.

Ejemplo 5.2 Se nos informa que una pareja planea procrear tres hijos. De cuntas maneras diferentes
puede suceder este hecho? En otras palabras: Cul es el espacio muestral del experimento procrear 3
hijos?

Solucin: Sea H el evento ser Hombre y M el evento ser Mujer. Es evidente que el primer hijo puede
ser tanto de un sexo como del otro; las dos ramas primarias de la figura 5.3.1 ilustran la situacin. Para el
segundo y el tercer hijo, la posibilidad de cualquiera de los dos sexos sigue siendo la misma; en
consecuencia, de cada rama primaria se desprenden dos secundarias y, de cada secundaria, dos terciarias con
lo cual se termina el diagrama necesario para resolver el problema.

Segundo Hijo Tercer Hijo

Primer Hijo H (HHH)

H
M (HHM)
H
H (HMH)
M
M (HMM)

H (MHH)

H M (MHM)
M
H (MMH)
M
M (MMM)


102
5.4 DEFINICIN Y PROPIEDADES DE LA PROBABILIDAD








Ejemplo 5.3 Si el reporte meteorolgico informa que la probabilidad de que llueva es 85%,
entendemos que si bien no puede llover, es casi seguro que llueva; si ese nmero es 50%, nos quedar
una gran duda, ya que ambas alternativas son igualmente probables.


Ejemplo 5.4 En el sorteo zodiaco de la Lotera Nacional, la probabilidad de sacarse el premio mayor
es uno en ciento veinte mil. En otras palabras, esta probabilidad es un nmero, .0000083, que se asigna
al evento pegarle al gordo y que indica que tan probable es su ocurrencia. Es claro que aunque puede
suceder, es muy difcil; hablando con propiedad: muy poco probable.

Una probabilidad no puede ser cualquier nmero, digamos -2 o 110%, sino un nmero real, P, que se
asigna a un evento A, que tiene las propiedades siguientes:

1. La probabilidad de que ocurra A no puede ser menor que cero ni mayor que uno. El cero indica
la imposibilidad de ocurrencia del suceso; el uno, la certidumbre de que ocurrir.
2. Para dos eventos A y A mutuamente excluyentes, la probabilidad de ocurrencia de uno u otro es
igual a la suma de sus probabilidades separadas.

En smbolos, P (A o A) = P(A) + P (A), si A y A son mutuamente excluyentes.

Adaptado al tema que estamos estudiando, la expresin mutuamente excluyentes, cuyo significado
explicamos en el subtitulo 1.3, quiere decir que si ocurre uno de los eventos de un espacio muestral,
ninguno de los otros puede ocurrir al mismo tiempo; la ocurrencia de cualquiera de ellos excluye
automticamente la de los restantes. Dicho de otro modo: la probabilidad de que sucedan A y A es
cero.

P(A o A) = 0, si A y A son mutuamente excluyentes.

Nota. Si A y A son mutuamente excluyentes y exhaustivos, o sea, que juntos abarcan todo el espacio
muestral, la probabilidad de ocurrencia de uno u otro sigue siendo la suma de sus probabilidades
separadas, pero en este caso esa suma es igual a uno.

En smbolos, P (A o A) = P(A) + P (A) = 1 si A y A son mutuamente excluyentes y exhaustivos.






Probabilidad
Es un nmero que se asigna a un evento para indicar la posibilidad de su ocurrencia
103


Ejemplo 5.5 Una investigacin realizada en una facultad de la universidad Veracruzana revela
que la probabilidad de que un alumno dedique al estudio, fuera del aula, ms de 12 horas a la semana es
0.20. Determinemos la posibilidad de que estudie 12 horas ms o menos.
Solucin: Sea A el evento mas de 12 horas y A el evento 12 horas o menos. Vemos que
ambos son no lo mutuamente excluyentes sino tambin exhaustivos, es decir, que juntos agotaron el
espacio muestral.

Entonces por la propiedad 2, podemos plantear:

P(A) + P(A) = 1

P(A) = 1 - P(A)

= 1 0.2

P(A) = 0.8

Es decir, la probabilidad de que un alumno de esa facultad invierta en estudiar fuera de clases
12 horas ms o menos a la semana es 80%.

Las posibilidades pueden ser escritas en forma fraccionaria, decimal o porcentual. Por ejemplo,
las expresiones 2/5, 0.4 y 40% se refieren todas a la misma probabilidad. Las tres son aceptables; la
eleccin de una u otra estar en funcin de la facilidad con que puedan leerse en un contexto
especfico. Por ejemplo, 1/64 es mas simple que sus equivalentes 0.015625 1.5625%, y 1/3 es ms
exacto que 0.333 33.3%. Pero 2/7 y 4/17 son ms difciles de comparar que sus formas decimales,
0.286 y 0.236, o porcentuales, 28.6% y 23.6%. la prctica, acompaada de un poco de reflexin, nos va
enseando a escoger adecuadamente una u otra forma.

Visto el concepto genrico de probabilidad, sus propiedades y las distintas maneras en que podemos
escribir sus valores numricos, a continuacin interpretaremos las probabilidades en funcin del modo
en que se determinan.

5.5 PROBABILIDAD BAJO EL ENFOQUE CLSICO

El estudio de la probabilidad tienes sus races en los juegos de azar, donde el requisito bsico de
imparcialidad exige que ciertos resultados sean igualmente probables. Un dado limpio o, como se dice en la
jerga de este tipo de juegos, no cargado, es aquel en que cualquiera de sus 6 caras tiene la misma
oportunidad de aparecer cuando se tira. Bajo las mismas condiciones de imparcialidad, el guila y el sol
tienen la misma oportunidad al echar el volado. Este requisito, que los resultados de un experimento
aleatorio sean igualmente probables, es la caracterstica fundamental de la interpretacin clsica de la
probabilidad, que dice:

Si para un evento A hay n resultados igualmente probables, de los cuales f son del tipo que nos interesa, la
probabilidad de que ocurra un resultado de ese tipo es f/n, es decir,

104
P(A)=

, para n resultados igualmente probables.



El supuesto de equiprobabilidad de los resultados posibles de un experimento aleatorio, estar implcito en
los ejemplos relativos al subttulo que estamos desarrollando.





Ejemplo 5.6 Determinamos la probabilidad de que al tirar un dado: a) aparezca el nmero 3; b) no
aparezca el 3.

Solucin a): Existen, como ya vimos, 6 resultados posibles al echar un dado, entre los cuales hay uno
del tipo que nos interesa. Por lo tanto,

P(3) = 1/6 = 16.7%

Solucin b): Entro los resultados posibles hay ahora 5 del tipo que nos interesa; es decir, existen 5
alternativas diferentes que no son el 3. Entonces,

P(no sea 3) = 5/6 = 83.3%

Nota: Dado un evento A, la probabilidad de que no ocurra suele escribirse as:

P(~A)

Que, en el ejemplo 5.6, es igual a 5/6.

Observa que los eventos A y ~A son, aparte de mutuamente excluyentes, exhaustivos, ya que juntos
abarcan la totalidad del espacio muestral. En consecuencia, por la propiedad 2 de las probabilidades,
P(3) + P(~3) = 1

Lo cual concuerda con las posibilidades calculadas:

1/6 + 5/6 = 1




Ejemplo 5.7 qu probabilidad existe en el juego de dominio: a) de sacar la ficha seis tres; b) de
sacar una mula?

Solucin a): Como el juego consta de 28 fichas, el espacio muestral esta formado por 28 resultados
posibles, entre los cuales hay un solo seis tres. Por esto,

P(seis tres) = 1/28 = .036 = 3.6%

105
Solucin b): Puesto que en el juego existen 7 mulas, la probabilidad de extraer una de ellas es 7/28.

P(mula) = 7/28 = 1/4 = 25%

El enfoque clsico se aplica no solo a los juegos de azar, sino tambien a cualquier situacin en que
todos los resultados posibles sean igualmente probables. No obstante, este puesto no se cumple en una gran
variedad de problemas, razn por la cual no siempre es aplicable el enfoque clsico en el cual, como ya se
debi ver el lector, la determinacin de una probabilidad se efecta suponiendo un solo intento del
experimento, bastando con conocer el total de resultados posibles y la frecuencia del que nos interesa.




5.6 PROBABILIDAD BAJO EL ENFOQUE DE FRECUENCIA RELATIVA Y LA LEY DE LOS
GRANDES NMEROS

La segunda manera de interpretar la probabilidad tiene como base un teorema establecido por el
matemtico suizo Jacobo Bernoulli (1654-1705). Este teorema dice:







Sea n un nmero grande de intentos o repeticiones de un experimento aleatorio; f, las veces que un
resultado especfico ocurre en ellos y P(A), la probabilidad de ese resultado en cada intento, Entonces,
la proporcin f/n es la probabilidad P(A).

Esto, en notacin sinttica, se escribe as:

P(A) = f/n, cuando n es grande.



El teorema de Bernoulli, conocido tambin como Ley de los grandes nmeros, puede ser ilustrado
repitiendo un gran nmero de veces un experimento aleatorio sencillo, por ejemplo, echar volados o
tirar un dado, y anotar de vez en cuando, digamos cada 25 repeticiones, la proporcin en que se
presenta cierto resultado, tabularlo y, para mejor visualizacin, hacer la representacin grfica
correspondiente. De un modo semejante sali este grfico:








La Probabilidad de un evento es la frecuencia observada de ese evento en un
nmero muy grande de casos.
106

Proporcin de guilas en 300 volados f/n


















Grfico 5.6.1


Por la gran variedad de aplicaciones que tiene este teorema en la estimacin de probabilidades,
es necesario que nos convenzamos, por va emprica, de la verdad que encierra.

Supongamos que en una caja colocamos cierto nmero de canicas de igual tamao, digamos 70,
de las cuales 42 sean blancas y el resto negras.* Mezclmoslas concienzudamente, saquemos uno al
azar y registremos en una tabla de conteo el color que tenga, cuidando de reintegrar la esferita antes de
repartir muchas veces el experimento. Esperamos, por la ley que acabamos de enunciar, que a la larga
el evento blanca se presentar mas o menos un 60% de las veces. La probabilidad 60% no significa
que de cada 10 repeticiones la canica saldr 6 veces; de cada 100, 60; de cada 1000, 600. la ley de los
grandes nmeros seala que si se repite el experimento un nmero de veces grande, el evento blanca
ocurrir en una proporcin cercana a 0.6. pero cundo un nmero de intentos se considera
suficientemente grande? No hay cifra especfica; depende de la aproximacin que requiramos al
verdadero valor de probabilidad y de que tan seguros queramos estar respecto a esa aproximacin.

Esta ley permite estimar probabilidades con base en la proporcin de veces que un hecho haya
ocurrido en el pasado en un gran nmero de repeticiones bajo la misma situacin. Ilustremos este caso.


Ejemplo 5.8 Las 7 generaciones estudiantiles anteriores a la fecha en que un nuevo estudiante
se inscribe en cierta facultad de la Universidad, constaron de 435 alumnos, de los cuales 229 cursaron
los 8 semestres reglamentarios; pero hablando con rigor, solo 166 tenan la calidad de egresados, pues
terminaron su formacin bsica profesional sin adeudar asignaturas. Calculemos la probabilidad de que
el recin inscrito: a) curse los 8 semestres de la carrera; b) concluya los 8 semestres sin adeudar
asignaturas.

107
Solucin a): De acuerdo con los datos, el acto de inscribirse para hacer carrera profesional se
repiti en 435 ocasiones, en las cuales el evento cursar los 8 semestres se presento en 229 veces; por
lo tanto, la proporcin 229/435 = .526 = 53% ser indicativa de la probabilidad que tiene el recin
inscrito de hacer todos los semestres.

P(8 Semestres) = 229/435 = 53%

Solucin b): La proporcin de egresados efectivos es de 166/435 = .382 = 38%. En
consecuencia la probabilidad de que el alumno de nuevo ingreso termine los 8 semestres en calidad de
egresado es de 38%.

P(egresado) = 166/435 = 38%

Nota: la objetividad de estas estimaciones depende no slo del nmero de intentos observados
(435 en este caso), sino tambin de la situacin en que se hayan presentado sea igual, en lo esencial, a
la situacin en que se quiere conocer la probabilidad. Por ejemplo, para la nueva generacin estudiantil,
siguen vigentes el mismo plan de estudios, las mismas estrategias didcticas que condicionaron a las 7
generaciones anteriores? Si la respuesta es afirmativa, la probabilidad estimada es confiable; de lo
contrario no.

Esto nos hace recordar la nica exigencia del enfoque de frecuencia relativa: que las
repeticiones, aparte de numerosas, sean iguales en lo esencial. En otras palabras: que se repitan bajo las
mismas condiciones. Es indudable que muchas situaciones a las que se pretende aadir un enunciado de
probabilidad pueden no ser repetibles, sino mas bien nicas, lo cual har discutible la objetividad de los
valores de probabilidad por la va de la frecuencia relativa.

Con todo, este enfoque es el ms aceptado y de mayor aplicacin para la determinacin de
probabilidades de eventos: posee la ventaja de eliminar la restriccin de equiprobabilidad que tiene el
enfoque clsico, introduciendo el principio de repetir el proceso de seleccin n veces. Buena parte del
quehacer estadstico y de la confiabilidad de sus resultados descansa, como afirmamos en el subttulo
1.1, precisamente en el Teorema de Bernoulli.


5.7 PROBABILIDAD SUBJETIVA Y PROBABILIDADES A FAVOR

Segn el enfoque subjetivo, una probabilidad es una medida del grado de certidumbre que tiene una
persona respecto a la ocurrencia de un evento. Este punto de vista, que ha atrado la atencin de los
estudiosos de estas interrogantes, no es tan arbitrario como puede parecer; no quiere decir que se escoja sin
ton ni son un nmero entre 0 y 1 y se anuncie que se trata de la probabilidad de un evento. Asociar un
nmero al grado de certeza que podamos tener respecto a un suceso es asunto separado del principio de la
probabilidad subjetiva, a saber: que la probabilidad puede ser vista como una medida del grado de creencia
que no tiene a partir juicio o la valoracin propios de evidencias e incertidumbres relevantes. El enfoque
subjetivo es un modo de entender la probabilidad de eventos donde no hay ni resultados igualmente
probables ni un gran numero de repeticiones con las mismas caractersticas.

Qu significa, por ejemplo, que un dirigente de un partido poltico diga que la probabilidad
subjetiva de que su agrupacin ganar las elecciones en cierto municipio es 80%? Significa que, partiendo
108
de su conocimiento de la situacin y juzgando las evidencias que rodean la campaa, siente cuatro veces
mas probable (probabilidad = .08) que gane su partido a que pierda (probabilidad = 0.2).

En ocasiones, las probabilidades de ocurrencia de un evento se denota por p y la de su no ocurrencia
por

q = 1- p

Entonces las probabilidades a favor del evento se definen como la razn de p a q. por convencin,
estas probabilidades se expresan como la razn de 2 enteros positivos, c a d, que carecen de factores
comunes. En notacin matemtica, si
p/q = c/d

Donde c y d son enteros positivos sin factores comunes, las probabilidades a favor del evento son c a
d y en contra son d a c. se enuncian a favor si p es mayor que q, y en contra si q es mayor que p; es decir, se
pone primero el entero mayor.





Ejemplo 5.9 La probabilidad de que al tirar un dado resulte un nmero mayor que 2 es /3.
Expresar este valor en probabilidad a favor.

Solucin sea p = 2/3, entonces q = 1 p = 1 2/3 = 1/3

Y la razn de p a q es p = 2/3 = 2
q 1/3 1

Por lo tanto, las probabilidades a favor de que aparezca un nmero > 2 son 2 a 1.




Ejemplo 5.10 En cierta escuela universitaria, la probabilidad de que un alumno de nuevo ingreso
concluya sus estudios sin deber ninguna asignatura es .38. expresemos este valor en trminos de razn.

Solucin: Sea p = .38; entonces q = 1- p = 1 - .38 = .62.

p/q = .38/.62 = 38/62 = 19(2)/31(2)

Entonces, por la regla convencional de que se debe siempre poner primero el nmero mayor, diremos
que las probabilidades de que el alumno termine sus estudios sin deber ninguna materia estn en contra 31 a
19.

Acabamos de ver que la proporcin p/q = c/d conduce a la conversin de probabilidades en
probabilidades a favor o en contra. Aprendamos ahora a realizar la operacin inversa. Para ello, mediante un
109
simple ejercicio de lgebra, se resuelve la ecuacin para ello, mediante un simple ejercicio de lgebra, se
resuelve la ecuacin p como sigue:

p/q es equivalente a p/1-p.

Podemos escribir entonces:

p/1-p = c/d
De donde

pd = c(1-p) = c-cp
pd+cp = c
p(c+d) = c
p = c/c+d

La educacin resultante para p permite calcular la probabilidad de un evento a partir de sus
probabilidades a favor o en contra.



Ejemplo 5.11 respecto a la posibilidad de ser derecho o zurdo, las probabilidades a favor de que un
recin nacido sea derecho es 13 a 1. Cul es la probabilidad correspondiente?

Solucin p(derecho) = 13/ 13+1 = 13/14 = .93





Ejemplo 5.12 las probabilidades de que un estudiante de licenciatura de la U. V. provenga de una
familia cuyo padre haya realizado estudios profesionales completos estn en contra 23 a 2.
Expresemos este dato como probabilidad simple.

Solucin la expresin estn 23 a 2 significa que por cada 23 probabilidades en contra solo hay
2 de que ocurra el evento mencionado. Por lo tanto, puesto que la probabilidad de un evento es siempre, por
definicin, su probabilidad de ocurrencia, no la de su ocurrencia, escribiremos.

P = c/c+d = 2/2+23 = .08

Es decir, la probabilidad de que un estudiante de la u. v. provenga de una familia cuyo padre haya
realizado estudios profesionales completos es 8%.

La expresin (1), que acabamos de aplicar en los dos ejemplos anteriores, puede usarse para estimar
la probabilidad subjetiva de una persona respecto a un evento, siempre y cuando pueda decir cuales son,
desde su punto de vista, las probabilidades a favor de ese evento para hacer una apuesta imparcial. Veamos.



110


Ejemplo 5.13 Un aficionado al boxeo apuesta 2 a 1 a que entre los boxeadores A y B, ganar A.
Cul es el valor mnimo de su probabilidad subjetiva de que ganar A?

Solucin si el aficionado apuesta 2 a 1 a favor del pgil A es porque piensa que, de cada
dos probabilidades que este tiene de ganar, solo hay una en contra. Por lo tanto,
P = 2/2-1 = 2/3 = .67

Es decir, seguramente la probabilidad subjetiva del aficionado es mayor de 0.67


Ejemplo 5.14 Un aficionado a las peleas de gallos apuesta $50,000 contra $30,000 a que entre
el giro y el colorado ganar este ltimo. Estimar la probabilidad subjetiva que lleva a la persona de
apostar de esa manera.

Solucin si el aficionado arriesga $50,000 contra $30,000 es por que cree, que de cada 5
probabilidades que tiene el colorado de ganar, hay 3 en contra, por lo tanto,

P = $50,000/$50,000 + $30,000 = $50,000/$80,000
P = .625 = 62.5%

En palabras: la probabilidad subjetiva del apostador a favor del evento gana el Colorado no
puede ser menor de 62.5%.

Daremos fin a la explicacin de los distintos enfoques de la probabilidad asentado que no se
trata de alternativas que compitan entre s; son tres modos de calcular e interpretar probabilidades, cada
uno de los cuales cuenta con su propio mbito de aplicacin. Cul es, por ejemplo, la probabilidad de
que un trabajador escogido por sorteo, supongamos, de un gran almacn, sea del sexo masculino? No
podemos dar respuesta por va del enfoque clsico, pues desconocemos como estn distribuidos los
sexos en ese universo o, en el lenguaje que hemos estudiado, nada nos dice que los resultados
hombre y mujer sean igualmente probables. En casos como ste no hay ms camino que el enfoque
de frecuencia relativa, cuya aplicacin podra consistir en consultar una nmina confiable del universo
objeto de estudio y determinar, mediante censo o muestreo, la proporcin de hombres.

Esa proporcin o frecuencia relativa ser indicativa de la probabilidad de que un trabajador
elegido al azar, es decir por sorteo, sea hombre. Y en el conjunto de situaciones donde no existen
resultados igualmente probables ni se necesitan muchas repeticiones, el enfoque subjetivo es, como ya
lo ilustramos, un auxiliar muy valioso para la estimacin de probabilidades.









111
5.8 REGLAS BSICAS PARA COMBINAR PROBABILIDADES

Como ya vimos (subttulo 5.3), el conjunto de todos los resultados posibles de un experimento aleatorio
integra lo que se llama espacio muestral. Este, en el experimento, digamos, de lanzar un dado, consta de seis
resultados posibles, es decir, de seis puntos muestrales: 1, 2, 3, 4, 5, 6. si cualquiera de estos se propone
como un evento esperado, por ejemplo, que caiga el 2, se esta proponiendo un evento simple cuya
probabilidad es 1/6.

No obstante, definido un espacio muestral, el calculo de probabilidades puede enfocarse tambin a la
ocurrencia de eventos formados por la combinacin de dos o ms eventos simples del espacio muestral de
que se trate. Tal es el caso, en el ejemplo del dado, del evento numero par, o del evento mayor o igual
que 2. Ahora bien, dado un evento combinado, se dice que este ocurre si ocurre uno cualquiera de los
eventos ms simples que lo forman. As, el evento numero par ocurrir si al lanzar el dado aparece el 2, el
4 o el 6.

Eventos de este tipo se conocen como eventos disyuntos. La probabilidad de un evento disyunto es
una probabilidad disyunta. Por ejemplo, la probabilidad disyunta p(A o A) es la probabilidad de que ocurra
cualquiera de los dos eventos A o A, o ambos. Este tipo de probabilidades se puede determinar mediante la
regla siguiente:

Regla general para la adicin de probabilidades

La probabilidad disyunta de dos eventos A o A, es igual a la suma de sus probabilidades simples
menos su probabilidad conjunta.

En smbolos, P(A o A) = P(A) + (A) P(A o A)

Esta regla es de carcter general porque se aplica a eventos mutuamente excluyentes* o no
excluyentes. Veamos.





Ejemplo 5.15 En el experimento de tirar un dado, hallemos la probabilidad de que aparezcan el 2 o el 6.

Solucin: Es evidente que el evento salga el 2 y el evento salga el 6 son mutuamente excluyentes. Por
lo tanto:

P(2 6) = P(2) + P(6) P(2 y 6).



* Al dar a conocer las propiedades de la probabilidad, dijimos (subtitulo 5.4) que para dos eventos A y A
mutuamente excluyentes, la probabilidad de ocurrencia de uno u otro es igual a la suma de sus
probabilidades separadas. Estrictamente hablando, esto ltimo no es ms que la regla de la adicin de
probabilidades restringida a eventos mutuamente excluyentes.

112



Pero, la probabilidad de que el 2 y el 6 ocurran simultneamente es cero.

Entonces, P(2 o 6) = 1/6 + 1/6 0 P(2 o 6) = 1/3



Ejemplo 5.16 En el mismo experimento de tirar un dado, determinemos la probabilidad de que salga un
nmero par o un nmero mayor que 3.
Solucin: Sea U el evento numero par, formado por los eventos simples, 2, 4, 6; y M, el evento numero
mayor que tres, formado por los eventos 4, 5, 6. as, aplicando la regla general tendremos:

P(U o M) = P(U) + P(M) P(U y M)
= 3/6 2/6
= 1/2 + 1/2 1/3
P(U o M) = 2/3

Es decir, la probabilidad de que salga un nmero par o un nmero mayor que 3, al tirar un dado, es 2/3
66.7%.









Diagramas de Venn

Problemas como los que acabamos de ejemplificar, que involucran eventos formados por dos o mas eventos
simples, se visualizan mucho mejor y se logran comprender cabalmente, mediante los diagramas de Venn,
mtodo diseado en 1880 por el lgico britnico John Venn para la representacin grfica de eventos y de
las relaciones entre ellos. En el contexto de la teora de la probabilidad, un diagrama de Venn emplea lo
siguiente: 1. Circulos o rectngulos para representar diversas clases de eventos; 2. Entrelazamiento de los
crculos para representar la posibilidad de ocurrencia de eventos conjuntos o simultneos; y 3. reas de la
grfica para representar probabilidades de ocurrencia, aunque, por lo general, aquellas no se dibujan a
escala.



La figura 5.8.1 presenta los elementos bsicos de los diagramas de Venn. El espacio muestral se simboliza
por una S. puesto que definir un espacio muestral es incluir todos los resultados posibles de un experimento,
la probabilidad de que el resultado cualquier intento dado provenga del espacio muestral es, por fuerza, igual
a uno. P(S) = 1

113
(a) (b) (c)
s

A




Espacio Muestral Evento A Complemento de A






















Figura 5.8.1
Generalmente, el rectngulo representa el espacio muestral, como se seala en (a); un evento A en el espacio
muestral, por un circulo dentro del rectngulo S, como en (b). considerando el rea total del rectngulo (S =
1), se puede pensar que el rea del crculo A representa la probabilidad del evento A; la porcin del espacio
muestral no incluida en este evento se conoce como el complemento del evento A, que se escribe A
c
, y su
probabilidad queda indicada por el rea dentro de S, pero afuera de A (parte sombreada en (c)), el evento
disyunt., que consiste en la ocurrencia del evento A
1
, o del evento A
2
, o de ambos, se conoce como la union
de A
1
y A
2
, y su probabilidad P(A
1
y A
2
) se ilustra en (d). La ocurrencia conjunta de los eventos A
1
y A
2
es
la interseccin de ambos eventos y su probabilidad P(A
1
y A
2
) se dibuja en (e). Si los eventos son
mutuamente excluyentes, su representacin grfica aparece en (f) y la probabilidad de que ocurran
conjuntamente es, por supuesto, igual a cero.





P(S) = 1

P(A)

P(A)

P(A
c
)

114
Ejemplo 5.17 En el mismo experimento de lanzar un dado, representamos grficamente y hallemos las
probabilidades que se indican a continuacin:

a) de que salga un nmero par o un nmero menor que 5;
b) del complemento del evento nmero menor que 5.


Solucin a): En este experimento el espacio muestral es, como ya sabemos, S = 1, 2, 3, 4, 5, 6. ahora bien,
sea U = 2, 4, 6, el evento numero par, y L= 1, 2, 3, 4, el evento numero menor que 5. Es claro que U y L
tienen dos elementos comunes, el 2 y el 4. por tanto, para representar grficamente ambos eventos nos
valdremos de dos crculos entrelazados, como se indica en la figura 5.8.2.












Luego, como trata de eventos disyuntos, la probabilidad disyunta correspondiente es

P(U o L) = P(U) + P(L) P(U y L)

Evidentemente, P(U) = 3/6, P(L) = 4/6 y P(U y L) = 2/6, entonces,
P(U o L) = 3/6 + 4/6 2/6
P(U o L) = 5/6
Es decir, la probabilidad de que al lanzar un dado salga un nmero par o un nmero mayor de 5
es 5/6 u 83.3%.

Solucin b): Para la representacin de evento L
c
, es decir, del complemento del evento nmero
menor de 5, basta con dibujar un crculo para indicar el evento nmero menor de 5 y sombrear toda el
rea del rectngulo no incluida en el crculo. La superficie sombreada representa P(L
c
), o sea la probabilidad
del complemento de L.











115
Luego, puesto que L est integrado por los puntos 1, 2, 3, 4, entonces, L
c
, el complemento de L,
queda integrado por 5, 6. por lo tanto,

P(L
c
) = 2/6 = 1/3 = 33.3%




Eventos independientes y dependientes

Se dice que dos o ms eventos son independientes si la ocurrencia de uno no afecta la probabilidad
de ocurrencia de los otros. Por ejemplo, si echamos un volado dos veces, es claro que si cae primero guila,
esto no afecta la probabilidad de que el segundo caiga sol o nuevamente guila. Si el primer hijo de una
pareja es varn, esto no determina que el segundo tambin sea varn o no lo sea.

Si por el contrario, la ocurrencia de un evento afecta la ocurrencia de eventos subsecuentes, se dice
que los eventos son dependientes. Si en el juego domin mezclamos las fichas segn las normas
convencionales, la probabilidad de extraer cualquier ficha en el primer intento es 1/28; si no se reintegra, la
probabilidad de extraer algunas de las restantes en el segundo intento es 1/27, pero ya que se tiene la primera
ficha, la probabilidad de que esta misma salga en el segundo intento es cero.

Sean independientes o dependientes los eventos, se trata de experimentos aleatorios concebidos
como una serie de intentos o repeticiones de la misma ndole en los cuales se plantea la probabilidad de que
se den, sucesiva o simultneamente, al menos dos eventos A
1
y A
2
. Para los fines que perseguimos, ser
suficiente con aprender a calcular probabilidades para eventos independientes.




La regla es la siguiente:

Regla de multiplicacin

Para hallar la probabilidad de ocurrencia de un conjunto de eventos independientes, se multiplican
las probabilidades separadas de los eventos que comprenden el conjunto.

P(A
1
y A
2
) = P(A
1
) P(A
2
) para eventos A
1
y A
2
independientes.


Ejemplo 5.18 Si se tira un dado dos veces, hallemos la probabilidad de que en ambas tiradas aparezca el 1.

Solucin: Es claro que la ocurrencia del 1 en el primer dado no afecta la probabilidad de ocurrencia
del mismo numero en el otro. Hay, pues, independencia y, adems, se trata de un evento conjunto formado
por dos simples: 1 y 1. la probabilidad de que en una tirada salga esta cifra es 1/6. Entonces.

P(1 y 1) = (1/6)(1/6) = 1/36


116

Ejemplo 5.19 Vimos en el ejemplo 4.11 que la probabilidad de que un recin nacido sea derecho es .93. Si
en una clnica de maternidad nacen 4 nios en un da, calculemos la probabilidad de que:
a) los 4 sean derechos; b) 2 sean derechos y dos zurdos; c) los 4 sean zurdos.

Solucin a): el que el primer nio sea derecho, no afecta la probabilidad de que los restantes tambin lo
sean, por lo tanto:

P(DDDD) = .93(.93)(.93)(.93)
P(DDDD) = .75 = 75%

Es decir, la probabilidad de que los 4 sean derechos es 75%.

Solucin b): si la probabilidad de ser derecho es .93, la de ser zurdo es .07. por lo tanto,

P(DDZZ) = .93(.93)(.07)(.07)
P(DDZZ) = 0.42%

Es decir, la probabilidad de que 2 sean zurdos y 2 derechos es apenas .42%.

Solucin c):
P(ZZZZ) = (.07)(.07)(.07)(.07)
P(ZZZZ) = .0024% La probabilidad de este evento es casi nula; sin embargo, existe.



EJERCICIOS

Subttulos 5.1 5.3

Anotar el espacio muestral a los experimentos que se indican a continuacin:

5/1. Se echa un volado

5/2. Se hace una tirada de un par de dados en cada una de cuyas caras est inscrita slo
Una de las cifras del 1 al 16.

5/3. Una pareja planea procrear 2 hijos.

5/4. De 5 representantes distinguidos en la asignatura de espaol, Juan, Liliana, Pedro,
Alma, y Roberto, se va a seleccionar, para hacer la exposicin de un tema, a 2 de
ellos imparcialmente. De cuantas maneras distintas pueden quedar formadas las
parejas?

5/5. En cierto universo se efecta una rifa de 5 libros, cada uno de los cuales versa sobre
las siguientes temticas: matemticas, fsica, literatura, espaol y qumica. La
condicin del sorteo es que el ganador puede escoger nicamente 3 libros
cualesquiera. De cuntas maneras distintas puede hacerse la eleccin?
117

5/6. Una investigacin realizada entre vendedores ambulantes menores de 15 aos revela
que la probabilidad de que el vendedor no vaya a la escuela es 2/15. hallar la
probabilidad de que si vaya.

Subttulo 5.4

5/7. De los nmeros siguientes. Cules no pueden ser probabilidades?
1.5, 7/18, 1, 0.9, 65%, 100.1%, 0, 18/13,, -0.4, -1, 136/128, -0.6, 3/2, 72%

5/8. Expresar las probabilidades siguientes en sus otras alternativas:
1/7, 0.5, 75%, 18/27, 35%, 108/113, 3/8, 0.5, 80%, .02%, 1/8, 1343/1625.

Subtitulo 5.5

5/9. Determinar el espacio muestral del experimento echar un volado 4 veces y hallar la
probabilidad de obtener:

a) 0 guilas
b) 1 guila o ms
c) 2 guilas o ms
d) 3 guilas o mas
e) 4 guilas
f) 3 guilas y un sol, en ese orden
g) 3 guilas y un sol en cualquier orden
h) 2 guilas y 2 soles, en cualquier orden

5/10. Resuelto el ejercicio 5/2, hallar la probabilidad de que la suma de puntos:

a) d 12
b) no d 12
c) d 7
d) no d 7
e) d 1
f) no d 1
g) d 13
h) no d 13

5/11 Resuelto el ejercicio 5/4, determinar la probabilidad de que la pareja elegida est
integrada por:

118
a) 1 hombre y 1 mujer.
b) 2 mujeres
c) 2 hombres

Subttulo 5.6

5/12. Una investigacin realizada con una muestra de 1880 alumnos de una universidad
sobre el lugar donde, fuera del aula, estudian habitualmente, revela que 180 lo
hacen en bibliotecas, 1480 en su casa y 220 en otros sitios. Encontrar la probabilidad
de que un alumno de esa misma casa de estudios elegido al azar acostumbre:

a) estudiar en su casa
b) estudiar en bibliotecas
c) no estudiar en bibliotecas
5/13. De los 64 ingenios instalados en Mxico que trabajaron en la zafra 89/90, 50
Produjeron menos de 80 mil toneladas de azcar. Si se elige por sorteo un ingenio
Muela:

a) menos de 80 mil toneladas
b) 80 mil toneladas o ms

5/14. En el mismo universo del ejercicio anterior, solo 24 ingenios molieron durante 150 das
O menos. Determinar la probabilidad de que, escogido al azar, un ingenio muela:

a) 150 dias
b) Ms de 150 dias

Subttulo 5.7

Escribir las probabilidades siguientes como probabilidades a favor o en contra,
el caso:

5/15. La probabilidad de ser hospitalizado en los Estados Unidos de America por enfermedades
mentales al menos una vez en la vida es 1/8.

5/16. En ese mismo pas, la probabilidad de sufrir graves crisis de depresion, al menos una
una vez en la vida, al punto de necesitar ayuda profesional, es .

5/17. La probabilidad de que un alumno de la universidad Veracruzana estudie
habitualmente en bibliotecas es 0.12.

5/18. La probabilidad de que un ingenio azucarero de la Republica Mexicana produzca
menos de 80 mil toneladas de azucar es de 0.78.

119
Expresar como probabilidades simples las que estn a favor o en contra y que se dan a continuacin:

5/19. Las probabilidades de que un estudiante de la universidad veracruzana haya
nacido en el estado de Veracruz estn a favor 21 a 4.

5/20. Las probabilidades de que un estudiante de alguna facultad de la capital
Veracruzana haya nacido en Xalapa estn en contra 2 a 1.

5/21. Las probabilidades a favor de que un alumno de la U. V. tenga menos de 24 aos
de edad son 17 a 10.

5/22. Las apuestas a que el equipo A ganar la prxima serie mundial de bisbol contra
el B estn 7 a 6. Cul es el valor mnimo de probabilidad subjetiva de que vencer
el equipo A?

Subttulo 5.7

5/24. Sea S el espacio muestral formado por los nmeros primos 1, 2, 3, 7, 11, 13, 17, 19,
23, 29, sometidos todos a seleccin aleatoria; R, el evento nmero primo menor
17; T, el evento nmero primo mayor que 7; U, el evento nmero primo mayor que
11 y menor que 23. Hacer la representacin grfica y hallar las probabilidades que
Se indican:

a) P(R o T)
b) P(R o U)
c) P(T o U)
d) P(R
c
)
e) P(T
c
)
f) P(U
c
)

5/25. Sea S el espacio muestral formado por los numeros pares 2, 4, 6, 8, 10, 12, 14, 16, 18,
20, sometidos todos a seleccin aleatoria; U, el evento nmero par menor que 8; W
el evento nmero par mayor a 4; T, el evento nmero par mayor que 2 y menor
que 14. hacer la representacin grfica y hallar las probabilidades que se indican:

a) P(U o W)
b) P(U o T)
c) P(W o T)
d) P(U
c
)
e) P(W
c
)
f) P(T
c
)

120
5/26. La probabilidad de que un ingenio azucarero en Mxico muela mas de 150 das
Por ciclo es .625. Si se seleccionan al azar una muestra de 4 ingenios, determinar la
probabilidad:

a) De que los 4 muelan ms de 150 das.
b) De que 2 muelan ms de 150 das y 2 150 das o menos.
c) De que los 4 muelan los 150 das o menos.





DISTRIBUCIONES DE PROBABILIDAD

6.1 CONCEPTOS BASICOS

En el capitulo 2 vimos que una distribucin de frecuencia de una variable es una descripcin de las
frecuencias con que se presentan, en un caso especifico, las categoras de esa variable. En el capitulo 5,
introdujimos algunos modos de calcular e interpretar la probabilidad de un evento, ahora, el capitulo
que iniciamos junta los temas de distribuciones y probabilidades,. Veremos que las probabilidades,
asociadas con un conjunto de eventos o con posibles valores de una variable, pueden ser organizadas en
descripciones coherentes.

La naturaleza de las distribuciones de probabilidad

La distribucin de probabilidad de una variable es una descripcin de las probabilidades con
que ocurren los diversos valores o categoras de esa variable.

En el ejemplo 5.2 conocimos el espacio muestral del experimento procesar tres hijos.
Hay en ste ocho resultados igualmente probables: HHH, HHM, HMH, MHH, MHM, MMH, MMM,
donde H= hombre y M= mujer. Considerando, por ejemplo, el numero de hombres, de estos 8
resultados posibles, 1 esta formado por 3 hombres; 3, por 2; 3, por 1 y 1, por 0. Por lo tanto, aplicando
la interpretacin clsica de probabilidad, conocemos que las probabilidades asociadas con los 4
resultados posibles del numero de hijos varones son: 1/8, 3/8, 3/8, y 1/8, respectivamente; esto
constituye la distribucin de probabilidad que puede ser representada en forma de tabla como sigue:










121
Tabla 6.1.1
probabilidad del nmero de hijos varones si se procrean tres hijos.

Nmero
de varones
Probabilidad
0 1/8 = 0.125
1 3/8 = 0.375
2 3/8 = 0.375
3 1/8 = 0.175
Total 8/8 = 1



La tabla siguiente, construida partir de la tabla 2.6.1, muestra la probabilidad asociada con cada una de
las nueve categoras de la variable tiempo de circulacin de 270 automviles.


Tabla 6.1.2

Distribucin de probabilidad del tiempo
de circulacin de automviles (N=270)


Anos Probabilidad

0 -1 0.07
2 -3 0.11
4 -5 0.15
6 -7 0.15
8 -9 0.19
10 -12 0.26
13 -16 0.03
17 -20 0.03
21 -30 0.02

Total 1.0


Observando las dos tablas anteriores, nos daremos cuenta que las distribuciones de probabilidad estn
estrechamente relacionadas con las distribuciones de frecuencias porcentuales estudiadas en el subtitulo
2.4. una distribucin porcentual muestra, para un conjunto particular de datos provenientes de cierta
recoleccin, los porcentajes o proporciones con que se presentaron las distintas categoras. Si el
conjunto de datos constituye una poblacin, estadsticamente hablando, entonces la distribucin
porcentual resulta idntica a la distribucin de probabilidad que resultara de hacer selecciones
aleatorias de esa poblacin. Si la distribucin porcentual pertenece a daos mustrales, ella puede ser
considerada como una estimacin de la distribucin de probabilidad de la poblacin que le
corresponde. Sea que los datos constituyan una poblacin o una muestra, la distribucin de frecuencias
122
porcentuales describe un conjunto de observaciones previamente realizadas. Una distribucin de
probabilidad proveniente de observaciones realizadas recibe el nombre de distribucin emprica de
probabilidad. Si, en cambio, la distribucin de probabilidad proviene de tratamiento matemtico, por
ejemplo, aplicando la regla de probabilidad y no de conceptos se ilustran en las tablas precedentes. La
6.1.1 muestra una distribucin terica de probabilidad para el proyecto de engendrar 3 hijos, sin que el
hecho se lleve a cabo; la 6.1.2, en cambio, muestra una distribucin emprica de probabilidad, que
resulta de medir el tiempo de circulacin de un conjunto de vehculos. Por razones de disponibilidad y
conveniencia matemtica, se usa a veces una distribucin terica en lugar de una distribucin emprica.
Debemos estar conscientes, sin embargo, que quiz nunca se encuentren en los datos del mundo real las
condiciones subyacentes a cualquier distribucin terica dada; consecuentemente, las distribuciones
tericas de probabilidad deben verse como aproximaciones cuando se aplican a datos empricos.






Variables aleatorias.

En estadstica aplicada, se conoce como variable aleatoria cualquier variable cuyos valores
puedan describirse mediante una distribucin de probabilidad

En la tabla 6.1.1 la variable aleatoria esta representada por los valores numricos 0, 1, 2, o 3, o
sea por el numero de varones que podran resultar al procrear tres hijos. En la tabla 6.1.2 la variable
aleatoria esta representada por los datos, en aos del tiempo de circulacin, correspondiente a distintos
automviles.

Variables discretas y continuas.

Partiendo de la base de sus posibles valores, las variables se clasifican en discretas o continuas.
En el subtitulo 1.3 vimos que una variable es discreta si no puede tomar cualquier valor dentro de un
intervalo determinado; en otras palabras, si cada valor de la variable en la recta numrica esta separado
de los valores prximos, mayor o menor, por nmeros reales que no puede asumir la variable. Los
ejemplos mas comunes de variables discretas son los que se limitan a enteros (,-3, -3, -1, 0, 1, 2,
3,). Las variables, pongamos por caso, nmeros de hijos por familia, numero de guilas en una serie
de intentos o repeticiones del experimento echar un volado, no pueden adoptar mas que valores enteros.

Las variables continuas, por el contrario, pueden tomar cualquier valor dentro de un intervalo.
La estatura de un grupo de personas ilustra el carcter continuo de las variables, ya que entre dos
valores, digamos 1.68m. y 1.69m., es posible cualquier valor como 1.687m., y entre este y 1.688m.,
seria posible registrar otra estatura, como 1.6873m., y asi hasta el infinito. El que las estaturas de las
personas se reporten solo con dos decimales de aproximacin, tiene que ver con una operacin de
redondeo por razones practicas; la variable sigue siendo continua ya que, tericamente, es posible
cualquier valor entre dos limites dados.

En resumen, los valores de una variable discreta son puntos desconectados en la recta numrica;
pero los posibles valores de una variable continua incluyen todos los valores dentro de una regin o
intervalo ininterrumpido de eje real.
123

Si una distribucin de probabilidad la variable aleatoria es discreta, se dice que es una
distribucin discreta de probabilidad; si la variable aleatoria es continua, distribucin continua de
probabilidad.


Funciones de probabilidad

Un modo conveniente de representar una distribucin discreta de probabilidad es por medio de su
funcin de probabilidad.


Funcin de probabilidad

Es una funcin matemtica que da la probabilidad de ocurrencia de cada valor de una variable aleatoria
discreta.

Consideremos la distribucin del numero de puntos (x = 1, 2, 3, 4, 5, 6) que pueden resultar en un solo
lanzamiento de un dado. La funcin de probabilidad que describe esta distribucin es:

P(X)= 1/6 para x = 1, 2, ..., 6 (1)

Esta expresin es un modo compacto de escribir P(1) = 1/6, P(2) =1/6,..., P(6)= 1/6.

La variable aleatoria es el numero de puntos en la cara superior, y la funcin de probabilidad P(x) da la
probabilidad de ocurrencia de cada uno de los 6 resultados posibles de esta variable discreta.


Como los valores de una funcin de probabilidad son probabilidades, deben cumplir las propiedades
sealadas en el subtitulo 5.4, en particular las siguientes :

0 s P(x) s 1 para todos los valores de x

P(X) = 1

P(
i
x
o
j
x ) = P(
i
x
) + P (
j
x ) para
i
x
=
j
x


Funcin de distribucin

Una funcin que muestra probabilidades acumuladas hasta determinados valores de la variable
aleatoria se conoce como funcin de distribucin.

La funcin de distribucin, que se designa por el smbolo F(
i
x ) , da la probabilidad de obtener
un valor de la variable aleatoria x menor o igual a
i
x ;

124
F(
i
x ) = (X s
i
x ) (2)

Un valor esperado es simplemente un promedio. Ahora bien, para los fines de este curso
introductorio, bastara con estudiar este concepto para variables aleatorias discretas.

Veremos a continuacin que el concepto de esperanza matemtica juega un papel central al
describir distribuciones de probabilidad.
La media de una distribucin de probabilidad se define como el valor esperado de la variable
aleatoria:

x = E(X) (5)

La varianza de una distribucin de probabilidad se define como el valor esperado (la media)
de las desviaciones cuadrticas con respecto al valor medio:


2 2
) ( x x S
i
=
(6)
i i
P x x S
2 2
) ( =



La desviacin estndar de una distribucin de probabilidad es S, la raz cuadrada positiva
de la varianza.

Ejemplo 6.3 La tabla 6.1.1 da la distribucin de probabilidad del numero de hijos varones
que podra haber si se procrearan 3 hijos. Hallemos la media, la varianza y la desviacin estndar de
esta distribucin.

Solucin: Sea x la variable aleatoria numero de hijos. Usando las expresiones (4), (5), (6),
tendremos.

El valor esperado de una variable aleatoria continua, que no estudiaremos en este texto, se
define en trminos de calculo integral de manera anloga a la expresin (4).
)
8
1
( 3 )
8
3
( 2 )
8
3
( 1 )
8
1
( 0 ) ( + + + = = x E x


La media es: x = 1.5 varones

)
8
3
( )
8
6
( )
8
3
( + + =
125
Y la varianza de la distribucin es p x x x x E S
2 2 2
) ( ) ( = =




2
S = 0.75

De donde, desviacin estndar 9 . 0 75 . 0 = = S Varones





6.2 LA DISTRIBUCIN BINOMIAL

Hay muchas distribuciones discretas de probabilidad, pero quizs la mas importante por sus numerosas
aplicaciones en problemas empricos y por el papel que juega en la comprensin de otros temas
estadsticos, es la distribucin binomial, desarrollada por Jacobo Bernoulli y publicada en 1713.

La variable aleatoria en una distribucin binomial

La distribucin binomial es la distribucin terica de probabilidad del nmero de xitos en una serie de
repeticiones independientes donde la probabilidad de xito en cada repeticin permanece constante. En
este contexto, el termino xito se refiere al resultado o categora de la variable cuya probabilidad se
requiere determinar; cualquier otro resultado se conoce como fracaso. En otras palabras, xito,
estadsticamente hablando, equivale a resultado favorable; fracaso, a resultado desfavorable.

La variable aleatoria en una distribucin binomial es el numero de xitos y la distribucin binomial
muestra la probabilidad de 0, 1, 2, ......, n xitos en n repeticiones independientes en que la probabilidad
del xito en cada intento se mantiene constante. Un intento que tiene dos resultados mutuamente
excluyentes y una probabilidad constante de xito se llama intento de Bernoulli o prueba de
Bernoulli.

La funcin de probabilidad binomial

En general, la funcin de probabilidad binomial da la probabilidad de n, xitos, exactamente en
n repeticiones independientes en que la probabilidad de xito en cada repeticin se mantiene constante.
La forma general de la funcin de probabilidad binomial se puede escribir as:

Pbin (n1)=
2 1
2 1
! !
!
n n
q p
n n
n
(7)

Donde Pbin (n1) es la probabilidad de obtener n1 xitos exactamente (y, por lo tanto, n2
fracasos) en n = n1 + n2 repeticiones independientes. Si la probabilidad de xito en cada intento es p,
la probabilidad de fracaso es q = 1 p

En la expresin (1) existen 3 posibilidades.
8
1
) 5 . 1 (
8
3
) 5 . 0 ( )
8
3
( ) 5 . 0 ( )
8
1
( ) 5 . 1 0 (
2 2 2 2
+ + + = =
126

Distingmoslas.

P es la probabilidad de xito en cualquier intento.
q = 1 p, la probabilidad de fracaso en cualquier intento.
Pbin (n1), la probabilidad de n1 xitos y n2 fracasos exactamente en total de n = n1 + n2
intentos independientes.

Dado un problema, conocemos o se nos da la probabilidad p a partir de la cual calculamos q y
usamos la expresin (7) para hallar la probabilidad de algn valor particular de xitos que nos interese.
Ilustremos lo anterior mediante un par de ejemplos, pero antes recordemos el concepto de factorial.

Sea n, un numero entero y positivo, entonces el factorial de n, que se simboliza n! Y se lee n
factorial, es el producto de todos los enteros positivos desde 1 hasta n. As.
5! = 5 *4 *3 *2 *1 = 120.

Obsrvese que 5! = 5 *4!
= 5 *4 *3!
= 5 *4 *3 *2!
= 5 *4 *3 *2 *1!
Por definicin: 0! = 1! = 1

Ejemplo 6.4 retomando el experimento de procrear 3 hijos, y suponiendo que la probabilidad de
engendrar un hijo varn es 0.5, determinemos la probabilidad de que el nmero de varones sea:
a) 0 b) 1 c) 2 d) 3
Solucin: en este problema, que consiste en 3 intentos o repeticiones, entendemos por xito el
engendrar 1 hijo varn; su probabilidad es p =0.5. por lo tanto, q = 1 p = 0.5. As, tendremos:

Para el inciso a:

n= 3;
1
n = 0;
2
n = 3, entonces

Pbin (n1)=


8
1
)
8
1
)( 1 ( 1 )
2
1
( )
2
1
(
! 3 ! 0
! 3
) 0 (
3 0
= = =
bin
P

Para el inciso b:

n= 3;
1
n = 1;
2
n = 2


8
3
)
8
1
( 3 )
2
1
(
! 2
! 2 * 3
)
2
1
( )
2
1
(
! 2 ! 1
! 3
) 1 (
3 2 1
= = = =
bin
P

Para el inciso c:

2 1
2 1
! !
!
n n
q p
n n
n
127
n= 3;
1
n = 2;
2
n = 1


8
3
)
2
1
)(
4
1
(
! 2
! 2 * 3
)
2
1
( )
2
1
(
! 1 ! 2
! 3
) 2 (
1 2
= = =
bin
P


Para el inciso d:

n= 3;
1
n = 3;
2
n = 0


8
1
) 1 )(
8
1
( 1 )
2
1
( )
2
1
(
! 0 ! 3
! 3
) 3 (
0 3 .
= = =
bin
P



Si comparamos el procedimiento que condujo a estos resultados con la manera en que se
determinaron las mismas probabilidades en el subtitulo 6.1 (la naturaleza de...), en que se obtuvo
primero el espacio muestral correspondiente, sern todava mas evidentes las ventajas que ofrece la
aplicacin del concepto de distribucin binomial.

Ejemplo 6.5 segn el censo de 1990, el 90% de la poblacin mexicana de 5 aos de edad y ms,
profesa la religin catlica, y el resto, otra o ninguna. Si elegimos al azar 4 personas de 5 aos de edad
o ms, determinemos la probabilidad de que, entre los 4, sean catlicos:

|a) 0; b) 1; c) 2; d) 3; e) 4;

Solucin: este problema consiste de 4 intentos o repeticiones independientes. Llamamos xito al
resultado profesar la religin catlica, cuya probabilidad, p = 0.9, para cada intento, es siempre la
misma. Entonces, la probabilidad del resultado desfavorable (fracaso) es q = 1 p = 0.1. as,
tendremos:

Para el inciso a:

n= 4;
1
n = 0;
2
n = 4. Entonces


0001 . ) 0001 )(. 1 ( 1 ) 1 (. ) 9 (.
! 4 ! 0
! 4
) 0 (
4 0
= = =
bin
P


Para el inciso b:

n= 4;
1
n = 1;
2
n = 3


0036 . ) 001 )(. 9 (.
! 3
! 3 * 4
) 1 (. ) 9 (.
! 3 ! 1
! 4
) 1 (
3 1
= = =
bin
P


Para el inciso c:
128

n= 4;
1
n = 2;
2
n = 2



Para el inciso d:
n= 4;
1
n = 3;
2
n = 1


29 . 0 ) 1 )(. 729 (.
! 3
! 3 * 4
) 1 (. ) 9 (.
! 1 ! 3
! 4
) 3 (
1 3
= = =
bin
P


Para el inciso e:

n= 4;
1
n = 4;
2
n = 0

66 . 0 ) 1 )( 66 (. 1 ) 1 (. ) 9 (.
! 0 ! 4
! 4
) 4 (
0 4
= = =
bin
P


As las interpretaciones correspondientes, serian: la probabilidad de que entre las 4 personas de 5 aos
y ms, elegidas al azar, haya exactamente cero que profesen la religin catlica es .0001; que haya
exactamente una, .0036; que haya exactamente dos, .049; que haya exactamente tres, .29 y que haya
exactamente cuatro, .66.

Es claro que la funcin de distribucin correspondiente F
bin
(n
1
) da la probabilidad de obtener n
1
xitos
o menos. As, para el ejemplo anterior, tendremos:

F
bin
(0) = P
bin
(0) = .0001
F
bin
(1) = P
bin
(0) + P
bin
(1) =.0037
F
bin
(2) = P
bin
(0) + P
bin
(1) + P
bin
(2) = .053
F
bin
(3) = P
bin
(0) + P
bin
(1) + P
bin
(2) + P
bin
(3) =.343
F
bin
(4) = P
bin
(0) + P
bin
(1) + P
bin
(2) + P
bin
(3) + P
bin
(4) = 1.000

Descripcin de la distribucin binomial

Las distribuciones tericas de probabilidad como la binomial pueden ser descritas en trminos de
muchos de los conceptos introducidos para distribuciones empricas en el capitulo 2.

Una medida de tendencia central de una distribucin terica de probabilidad indica el lugar en que se
localizan en la recta numrica los valores posibles de la variable aleatoria. Vimos ya que la media de
una distribucin de probabilidad es el valor esperado de la variable aleatoria. La media de una
distribucin binomial, designada x bin, es el valor esperado del nmero de xitos:
049 . ) 01 )(. 81 (. 6 ) 01 )(. 81 (.
! 2 ! 2
! 2 * 3 * 4
) 1 (. ) 9 (.
! 2 ! 2
! 4
) 2 (
2 2
= = = =
bin
P
129

x bin = E (n1) = 0 P
bin
(0) +1 P
bin
(1) +2 P
bin
(2) +...+ n P
bin
(n)

Que se simplifica a:
x
bin
= np

Donde p es la proporcin que se obtendra a la larga del nmero de xitos y, en consecuencia,
np es el numero matemticamente esperado de xitos en n intentos.

Ejemplo 6.6. En el ejemplo 6.5 consideramos las probabilidades de que exactamente 0, 1, 2, 3 y 4 de
cuatro personas de 5 aos de edad y ms elegidas al azar, profesen la religin catlica, dado que la
probabilidad de que cada una de esas personas sea catlica es .9. As, la media de esa distribucin se
calcula directamente usando la expresin :

x
bin
= 4(.9) = 3.6 catlicos

Este resultado significa que a la larga se podra esperar una media de 3.6 catlicos de cada 4 personas
cuyas edades fuesen de 5 aos y ms.

Una media de dispersin de una distribucin terica de probabilidad indica cunto tienden a dispersarse
en la recta numrica los posibles valores de la variable aleatoria.

Aprendimos ya que la varianza de una distribucin de probabilidad es el valor esperado de las
desviaciones cuadrticas con respecto a la media. La varianza de una distribucin binomial se
simboliza por
2
bin
S y se define as:


2
bin
S = E (n1 np)
) ( ) ( ... ) 1 ( ) 1 ( ) 0 ( ) 0 (
2 2 2
n P np n P np P np
bin bin bin
+ + + =


Que finalmente se simplifica a:


2
bin
S
= npq

Por lo tanto, la desviacin estndar de una distribucin binomial es:


npq S
bin
=
2


Para el caso de la distribucin binomial de los catlicos, los datos son: p = 0.9; q = 0.1 y n = 4.
Entonces,

6 . 0 36 . 0 ) 1 . 0 )( 9 . 0 ( 4 S
2
bin
= = =
Catlicos

130

Es decir, los datos de la variable aleatoria se desvan 0.6 catlicos en promedio y el valor esperado es
3.6



EJERCICIOS
Subttulo 6.1

6/1. Una variable aleatoria x tiene valores posibles x =1, 2, 3. Indicar si cada uno de los datos
siguientes es una funcin de probabilidad para esa variable. Si no, explicar por qu.

a) P (1) =.18 P (2) = .38 P (3) = .44
b) P (1) = 2 P (2) = .43 P (3) = .28
c) P (1) =-.55 P (2) = .08 P (3) = -.53
d) P (1) = 1/6 P (2) = 1/2 P (3) = 1/3
e) P (1) = 78 P (2) = 12 P (3) = 10

6/2. Indicar si los datos siguientes en cada inciso son funciones de probabilidad. Si no, explicar
por qu.

a) P (x) = 1/4 para x = 6, 7, 8, 9.
b) P (x) = 1/30 para x = 6, 7, 8, 9.
c) P (x) = x/30 para x = 0, 1, 2.
d) P (x) = x/5 para x = 1, 2, 3, 4.
d) P (x) =
2
x para x = -3, .9, 10 .

6/3. Las probabilidades asociadas con cada uno de los cuatro valores posibles de una variable
aleatoria x (distribucin de probabilidad) son como se seala en cada inciso. Calcular e interpretar las
funciones de distribucin F(0), F(1), F(2) y F(3).

a) P(0) = .18 P(1) = .39 P(2) = .35 P(3) = .08
b) P(0) = .07 P(1) = .43 P(2) = .28 P(3) = .22
c) P(0) = 0 P(1) = 2/5 P(2) = 2/5 P(3) = 1/5
d) P(0) = 1/2 P(1) = 1/3 P(2) = 1/6 P(3) = 0

6/4 calcular el valor esperado (media) la varianza y la desviacin estndar para cada
distribucin de probabilidad del ejercicio anterior.

Subttulo 6.2

6/5. En Mxico, la probabilidad de que una persona muera pro enfermedades del aparato
circulatorio es 0.2. si se eligen al azar cinco personas:

a) determinar la probabilidad de que de esas 5 personas mueran exactamente 0, 1, 2, 3, 4, y 5
por la causa mencionada.
b) Determinar e interpretar F(3) y F(5).
131
c) Determinar el valor esperado (media), la varianza y la desviacin estndar.

6/6. En Mxico, la probabilidad de que una pareja que contrae matrimonio se divorcie es .07. si
se eligen al azar cuatro parejas recin casadas:

a) determinar la probabilidad de que de esas 4 parejas, se divorcien exactamente 0, 1, 2, 3, y 4.
b) Calcular e interpretar la funcin de distribucin para todos los valores de la variable
aleatoria, es decir, F(0), F(1) etc.
c) Calcular la media, la varianza y la desviacin estndar.

6/7. En Mxico la probabilidad de que una persona al morir tenga ms de 64 aos de edad es
.47. si dentro del universo de defunciones se eligen al azar 5:

a) Determinar la probabilidad de que exactamente 0, 1, 2, 3, 4 y 5 hayan tenido al morir ms de
64 aos de edad.
b) Calcular e interpretar la funcin de distribucin para todos los valores de la variable
aleatoria, es decir, F(0), F(1),etc.-
c) Calcular la media, la varianza y la desviacin estndar.


LA DISTRIBUCION NORMAL

Recibe este nombre toda distribucin acampanada y continua, como se ve en la Fig. 6.4.1. Debido a su
continuidad, se traza como una curva suave y no como histograma. Ahora bien: puesto que la x y
la S varan de una distribucin a otra, no hay una sino muchas distribuciones normales. Lo que se les da
el carcter normal es que tienen la mima proporcin de rea bajo la curva en ciertas ordenadas.













- x +
Grafico 6.4.1


Esto significa que si dibujamos lneas verticales en +1 y -1 desviaciones estndar, por ejemplo, en dos
distribuciones normales cualesquiera, la proporcin con respecto a la distribucin total limitada por las
lneas verticales ser la misma en ambas distribuciones. (Vid. Grficos 6.4.2 y 6.4.3). El rea
sombreada es la proporcin del rea total bajo la curva limitada por puntos que estn a una desviacin

132
estndar a ambos lados de la media. Para cualquier distribucin normal, el rea entre x - s y x + s
es siempre el 68.26% del rea total. Por supuesto que podemos sustituir x - s y x + s por otros dos
puntos y buscar la proporcin o parte del rea total bajo la curva, que ser la misma en todas las
distribuciones normales.













x - 1s x x + 1s x - 1s x x +1s

Grfico 6.4.2 Grfico 6.4.3


La figura 6.4.4 muestra las proporciones de rea bajo la curva total, limitadas por puntos
seleccionados que son muy tiles para la comprensin de ciertos temas fundamentales en la teora del
muestreo.



99.72%

95.46%

.14% .14%
- +

68.26%

34.13%


x - 3s x - 2s x - s x x +s x +2s x +3s

Grfico 6.4.4

Tericamente, las colas de la curva normal nunca tocan el eje de la abscisas, sino que se extienden
infinitamente en ambas direcciones. Tanto el supuesto de rango infinito como el de continuidad


133
permiten asegurar que, en la prctica las observaciones jams se distribuyen de manera perfectamente
normal. Sin embargo, muchas distribuciones empricas se acercan a la normalidad aunque sean
discretas. Con frecuencia esta aproximacin es tan cercana a la normalidad que se puede tratar como
normal una distribucin emprica sin menoscabo de la presin.



6.3 LA DISTRIBUCION NORMAL ESTNDAR


Aunque las distribuciones normales pueden tener medias y desviaciones estndar cualesquiera,
es muy importante el caso donde la media y la desviacin estndar son 0 y 1, respectivamente. Esta
distribucin se conoce como distribucin normal estndar. Se trata, de hecho, de una distribucin de
datos Z que tiene forma normal. Su utilidad ha hecho que se construyan tablas que muestran el rea
bajo la curva limitada por dos ordenadas cualesquiera. Estas tablas pueden ser usadas en todo conjunto
de datos distribuidos normalmente, luego de haber sido estandarizados.

Ilustremos ahora la manera de usar la tabla de reas bajo la curva normal que aparece en el
apndice, explicando primero algunas de sus caractersticas.

1. La proporcin del rea total que aparece en el cuerpo de la tabla est representada por la
porcin sombreada de la figura 6.5.1.
2. El rea total bajo la curva es 1 o 100% y, puesto que es simtrica, el rea a ambos lados de
la media es 0.5 50%.
3. Para ahorrar espacio, slo la mitad de la curva normal est representada en la tabla (siendo
simtrica no se necesitara la otra mitad). Para hallar ciertas reas, bastar con hacer algunas
operaciones aritmticas extras.

La tabla no incluye esta mitad de la curva














Z = 0 cualquier dato Z

Grfico 6.5.1



134


Ejemplo 6.8. Hallamos el rea bajo la curva limitada, a un lado, por la media, y el otro por Z = 1.3.

Solucin: Representamos grficamente el rea solicitada.


a





c b





x Z =1.3

Grfico 6.5.2

Localicemos Z= 1.3 en la primera columna de la izquierda en la tabla del apndice (recordemos
que los datos Z son unidades de desviacin estndar; as, Z = 1.3 es lo mismo que Z = 1.3s).

La proporcin buscada se lee directamente bajo la columna .00. Esta: sealada que la cifra
que corresponde al segundo decimal del dato Z es 0, es decir, nula. Puesto que el segundo decimal de Z
= 1.3 es nulo, usamos solo la columna .00.

El rea limitada por la x y Z = 1.3 es .4032 = 40.32%. esto significa que el 40.32% de todos
los datos de la distribucin tienen valores comprendido entre la media y 1.3 desviaciones estndar.

Ejemplo 6.9. Determinamos el rea que se halla por arriba de Z = 1.3.
Se trata del rea b representada en el grfico 6.5.2

Solucin: puesto que la mitad de la curva vale 0.5 50%, bastar con restar .4032 a 0.5. As, el rea
que se halla por arriba de Z = 1.3 es .0968 = 9.68%.

Esto significa que el 9.68% de los datos de la distribucin tienen valores no menores de 1.3
desviaciones estndar.







135
Ejemplo 6.10. Hallemos el rea que ser por debajo de Z = 1.3.
Solucin: Considerando una vez ms el grfico 6.5.2, es evidente que se trata del rea resultante de
sumar c + a. En cifras.

0.5 + .4032 = .9032 = 90.32%

Podemos decir que el 90.32% de los datos de la distribucin tienen valores no mayores de 1.3
desviaciones estndar. Los significados de las reas resultantes en los tres ejemplos anteriores, deben
quedar claros en el siguiente ejemplo

Ejemplo 6.11. Supongamos que .en una prueba de inteligencia (I.Q) aplicada a un grupo de
estudiantes, la variable calificacin se distribuye normalmente. La calificacin promedio es 100 y la
desviacin estndar 14.

Datos: x = 100 S = 14

Uno de los estudiantes obtuvo una calificacin de 124. Qu % de estudiantes alcanzaron
calificaciones entre la x y 124?





Solucin: Grficamente, el % de estudiantes que se pide est representado por el rea sombreada de la
figura siguiente:













x - 100 x - 100

Grfico 6.5.3


Ahora convertimos el dato X en z.


136
S
x
=
X
Z

14
100 124
= Z
71 . 1 = Z


Busquemos luego en la tabla el rea limitada por la x y Z = 1.71, y leemos .4564 = 45.64%.
Por lo tanto, el 45.64% de los estudiantes sometidos a prueba de inteligencia obtuvieron calificaciones
comprendidas entre el valor medio y 124, o sea, entre 100 y 124.



EJERCICIOS

Subtitulo 6.3

6/8. Transforma a datos Z cada una de las distribuciones siguientes y comprobar en cada caso que
Z=0 y Z
2
= N:

a) 3, 4, 5, 7, 6, 4, 2, 3, 4
b) 1, 3, 5, 2, 3, 4, 6, 7.
c) 20, 30, 30, 40, 20, 30, 10, 40, 50.
d) 50, 55, 53, 57, 52, 55, 54, 54, 56, 54

Subtitulo 6.4 y 6.5

6/9. Determinar el rea bajo la curva normal limitada como se indica:

a) entre la media y Z = 2
b) entre la media y Z = -1.8
c) por arriba de Z =1
d) pro debajo de Z =1
e) entre Z = - .5 y Z = .8
f) entre Z = -2.3 y Z= -.4
g) por arriba de Z = -2.1
h) por debajo de Z = -.7

6/10. En una prueba de duracin para determinar la vida til de un nuevo tipo de lmpara lanzada al
mercado, los datos de la muestra se distribuyen de manera casi normal. Se calcul una vida til
promedio de 7000 horas y una desviacin tpica de 520 horas. Halla es porcentaje de lmparas que
tendrn una vida til:

a) entre la media y 7600 horas
b) entre 6500 horas y 7600 horas
c) ms de 7600 horas
d) menos de 7600 horas

137


Simbologa bsica para estadgrafos y parmetros

Puesto que hablar de investigacin por muestreo es referirse a universos previamente definidos de los
cuales se indignan diversas caractersticas (parmetros) con base en las correspondientes caractersticas
observadas en la muestra (estadgrafos), existe una simbologa universalmente adoptada para distinguir
claramente entre una y otras. Daremos a continuacin algunos de estos smbolos y los usaremos
sistemticamente en lo sucesivo.


Indicador En la poblacin En la muestra

Tamao N n

Media (mu) X

Mediana Me

Moda Mo

Varianza
2
o S

Desviacin estndar
o
S


Existe aun tres smbolos de amplio uso para representar la media, la varianza y la desviacin estndar
de distribuciones de muestreo de medidas:

x
= media de la distribucin muestral de medidas (dmm)

2
x
o = varianza de la (dmm)

x
o = desviacin estndar de la dmm












138


REGRESIN LINEL SIMPLE


Uso de las tcnicas que genera el Anlisis de Regresin Lineal en el estudio comparativo de la
observacin de dos caractersticas que se hacen en ella.

En el contexto de la investigacin en general existen situaciones donde es importante hacer
predicciones de cierta variable (de respuesta o dependiente), en funcin de otra u otras variables que
pueden ser controladas (independientes), para estos casos uno de los objetivos primarios es identificar
un modelo funcional que ayude a describir la relacin que existe entre una variable y otra(s), en esta
seccin slo trataremos el caso de la relacin entre dos variables. As por ejemplo se puede estar
interesado en saber si existe alguna relacin entre los resultados obtenidos en un examen y los niveles
de partida de los estudiantes sobre los tpicos tratados en el mismo; tambin puede estar interesado en
ver si la antigedad laboral de los docentes de una institucin con el rendimiento escolar de sus
estudiantes. Supongamos que un profesor tiene inters en conocer la relacin que existe entre el
aprovechamiento de los estudiantes y el nmero de horas extraclase que le dedican a estudiar la
materia.


Problema #14.
Un profesor est interesado en establecer un programa de trabajo extraclase para sus estudiantes, de tal
manera que desea saber si existe relacin entre el tiempo que los estudiantes dedican a la materia fuera
de clase y el aprovechamiento que tiene en la materia, el cual ser medido con los exmenes. Despus
de realizado el primer parcial, selecciona una muestra aleatoria de 20 estudiantes y les pregunta el
tiempo promedio que le dedican al da a su curso fuera de clase, los resultados obtenidos son los
siguientes:

Tiempo dedicado al
curso fuera de clase
(hrs)
Puntos del examen

1 64
1.5 70
0.5 54
2 71
139
2.25 86
3 97
1.25 67
0.75 62
0.5 67
1 60
0 40
2 76
1.5 75
2.75 92
0.75 68
1 66
1 70
2.5 93
2.5 90
2 84


a) Cul es la variable que se puede controlar (independiente)?
b) Cul es la variable de respuestas (dependiente)?
c) Considera Usted que existe relacin entre una variable y otra?
d) En caso que la respuesta del inciso anterior sea afirmativa, Qu tipo de relacin?
e) Graficar estos puntos en un plano cartesiano.
f) Cul es el comportamiento de los puntos?
g) Qu tipo de comportamiento tiene los datos?


La relacin funcional exacta de estas variable es posible que no se pueda obtener, pero si es posible
encontrar un modelo que ayude para hacer predicciones aceptables de una de las variables. De la
grfica que hiciste en el problema, que llamaremos diagrama de dispersin, se puede identificar una
tendencia de los puntos hacia un comportamiento lineal, esto es una recta puede ser utilizada como
modelo de la relacin entre ambas variables. Podemos suponer que el modelo verdadero que expresa la
relacin entre estas variables es una recta de la forma:
| o + = X Y


donde | representa el valor de la ordenada cuando la recta corta al eje Y y o la pendiente de la recta,
esto es, mide la rapidez con que cambia Y cuando cambia X.

Cuando se utiliza un modelo de regresin lineal, la recta que mejor ajusta a los datos, utilizando la
tcnica de mnimos cuadrados, el objetivo es encontrar una estimacin de los parmetro de la recta que
genere la sumatoria mnima de distancias al cuadrado entre la ordenada estimada por el modelo y las
140
ordenadas de los puntos de la muestra que corresponden al mismo valor de X; es decir, encontrar a y b
estimaciones para o y | respectivamente, tal que
b aX Y + = , donde
( ) | | b ax y
i i
n
i
+
=1
sea mnima.

A partir de esta idea se tiene que los valores de a y b se pueden obtener de la siguiente manera:




=
=
=
n
i
n
i
i
i
X n x
XY n y x
a
1
2 2
1



X a Y b =



Problema # 15.
Con los datos del problema #1:

a) Encuentre la recta que mejor ajusta los datos (el tiempo que dedican los estudiantes al estudio
extraclase de la materia y las calificaciones obtenidas en el primer examen parcial).
b) El modelo obtenido, predice la calificacin que corresponde a un estudiante que se dedica en
promedio:
i) 0.25 hrs. al da de estudio extraclase?,
ii) 1 hr. al da de estudio extraclase?,
iii) 2.5 hrs al da de estudio extraclase?.
c) Qu tan confiables son las predicciones que hace el modelo?
d) Considera que el modelo representa adecuadamente la relacin que existe entre la informacin que
se tiene?.


Por las expresiones que se tiene para el clculo de los estimadores a y b, los cuales dependen de los
valores que se tiene para X y Y, se puede concluir que para cualquier conjunto de parejas de variables
es posible modelar la relacin que existe entre ellas de manera lineal. Por lo anterior, es que surge la
inquietud de saber qu tan confiable es el modelo que se ha obtenido, una manera de responder a esta
pregunta es midiendo el grado de relacin lineal que existe entre las variables en cuestin, esto es,
medir la fuerza de la relacin lineal. Para medir esta correlacin lineal que existe entre las variables,
utilizaremos el siguiente coeficiente:


141
2
1 1
2
1
2
1
2
1 1 1
|
.
|

\
|
|
.
|

\
|

=


= = = =
= = =
n
i
i
n
i
i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
y y n x x n
y x y x n
r



r toma valores en el intervalo [-1,1], cuando el valor de r es prximo a 1 o -1 se dice que existe una
buena relacin lineal entre las variable, lo que nos lleva a que las predicciones que se hacen son
confiables (teniendo cuidado con los rangos de las variable utilizados en la muestra), es decir, se debe
tener cuidado con las extrapolaciones que se hagan; cuando el valor de r es prximo a 0 entonces se
tiene que el modelo de regresin lineal no refleja realmente la relacin que existe entre las variables.

Problema # 16.
Qu tan confiables son las predicciones que se hacen con el modelo de regresin lineal obtenido en el
problema anterior?.

Existen problemas donde la relacin que existe entre las variables involucradas en el estudio no es
lineal, esto es, existe otro tipo de modelos que se pueden presentar como por ejemplo: parablico,
exponencial, logartmico, etc., ms an se pueden presentar situaciones donde no exista una relacin
definida entre las variables.



EJERCICIOS
Los siguiente tabla muestra los resultados de las calificaciones de 10 alumnos del tercer semestre en las
materias de clculo y estadstica, a partir de estos datos, dibuja una grafica de dispersin y efecta el
anlisis de regresin lineal simple para encontrar la ecuacin de la recta de regresin. Al final de los
clculos debers anotar tus conclusiones.

Alumno Clculo Estadstica x
2
Y
2
x.y
1 8 8
2 9 5
3 8 7
4 9 7
5 5 4
6 5 6
7 10 10
8 9 9
9 7 6
10 10 7


b mx y + =
(ecuacin de la recta de mejor ajuste recta de los cuadrados mnimos)

Si un alumno obtuvo 6.5 de
calificacin en clculo, qu
calificacin estimas que obtendr
en estadstica?

Y si obtuvo 7.5 en clculo?
142



( )


|
|
|
.
|

\
|

|
|
.
|

\
|

=
n
x
x
n
y x
y x
m
2
2
.

x m y b . =




A continuacin calcula el coeficiente de correlacin r y lee las copias respectivas para
responder a las preguntas y establecer conclusiones al respecto.

r = Coeficiente de correlacin lineal simple (Correlacin de Pearson)

( )
( ) ( )


|
|
.
|

\
|

|
|
.
|

\
|

|
.
|

\
|

=
n
. y
y
n
. x
x
n
y
x xy
r
2
2
2
2



Finalmente extra-clase debers leer la onceava unidad del libro Estadstica paso a paso (pgina 555 )
para responder a las siguientes preguntas. (Puedes consultar otros libros)
Para que sirve el anlisis de regresin y el anlisis de correlacin?
Qu es la regresin lineal simple?
Qu ejemplo se propone en el libro y cules son tus conclusiones?



BIBLIOGRAFA RECOMENDADA Y UTILIZADA PARA LA ELABORACIN DE ESTE
TEXTO


1. LEVIN Y. Richard & Rubin Davis S. Estadstica para administradores.Prentice Hall. 6
a
edicin. 1996
2. CHRISTENSEN H. Estadstica paso a paso. Trillas. 3 edicin. 1997.
3. CUELLAR L. Estadstica y Probabilidad. Compaa editorial nueva imagen. 2 edicin. 1994.
4. MANSON/ LIND/ MARCHAL. Estadstica para Administracin y Economa. Alfaomega. 10 edicin. 2001.
5. MONTAO A., Estadstica I. Pac, S.a de C.V. Mxico 1992,
6. FREUND JOHN E. y SIMON GARY A. Estadstica elemental. Pearson (Phh). 8
va
edicin. 1994
7. LARIOS R. IRMA y GUTIERREZ F. GERARDO. Material para la materia de estadstica de la Maestra en
Ciencias MCEC Ciidet. Quertaro. 2001
143
8. CHAO, LINCOLN. Estadstica para las Ciencias Administrativas. McGraw-Hill. 3
ra
edicin. 1993.
9. KAZMIER, LEONARD e.t. Estadstica aplicada a la Administracin y a la Economa. McGraw-Hill. 1993.
10. CANAVOS, GEORGE C. Probabilidad y Estadstica (aplicaciones y mtodos). McGraw-Hill. 1988.
11. WALPOLE RONALD. Probabilidad y estadstica. McGraw-Hill. 1992.
12. MENDEHALL, WILLIAM. Estadstica para administradores. Gripo editorial Iberoamrica. 1988
13. FREEMAN, HAROLD. Introduccin a la inferencia estadstica. Trillas.
14. MILLER, IRWIN y FREUND E. JOHN. Probabilidad y Estadstica para Ingenieros. Editoral Reverte.
15. SNEDECOR W GEORGE e.t. Mtodos estadsticos. C.E.C.S.A.


Websites

http://espaol.dir.yahoo.com/ciencia_y_tecnologa/matemticas/estadstica/
http://www.mor.itesm.mx
http://www.qro.itesm.mx
http://www.estadistica unam.mx
http://www.dgeec.gov.py
http://xue.unalmed.edu.co
http://www.cft.gob.mx