Anda di halaman 1dari 39

CAPTULO 1

Distribuciones de frecuencia
OBJETIVOS
Al concluir el captulo, ser capaz de:
Comprender la razn por la que estudia estadstica.
Describir lo que es poblacin y muestra.
No pecar de ignorancia con las nociones del muestreo.
Explicar los conceptos de estadstica descriptiva y
estadstica inferencial.
Distinguir entre una variable cualitativa y una variable
cuantitativa.
Describir la diferencia entre una variable cualitativa
nominal y una variable cualitativa ordinal.
Describir la diferencia entre una variable discreta y una
variable continua.
Distinguir entre los niveles de medicin nominal, ordinal, de
intervalo y de razn.
Redondear correctamente datos numricos.
Manejar adecuadamente la notacin sumatoria.
Convertir los datos sin procesar en informacin til.
Representar una distribucin de frecuencias en un
histograma, en un polgono de frecuencias y en una ojiva.
Crear e interpretar distintas grficas, digamos por ejemplo,
de lneas, de barras, circulares, de puntos y grficas de
tallo y hojas.
~1~

PANORAMA GENERAL DE LA ESTADSTICA

Una meta comn e importante de la materia de la estadstica es la siguiente:


aprender acerca de un grupo grande examinando los datos de algunos de sus
miembros. En dicho contexto, los trminos muestra y poblacin adquieren
importancia. Las definiciones formales de estos y otros trminos bsicos se
presentan a continuacin, en la siguiente seccin.

DESCRIPCIN DE LOS DATOS

El propsito esencial del contenido que se desarrolla en este captulo es aprender a


organizar, resumir y presentar datos de manera informativa. Datos tales como la
edad de una poblacin, la altura de los estudiantes de una escuela, la temperatura
en los meses del ao, etctera.

QU ES ESTADSTICA?

La estadstica desempea un significativo papel en casi todos los aspectos del


adelanto humano. Inicialmente solo era aplicada a los asuntos del Estado, de donde
viene su nombre; pero ahora la influencia de la estadstica se ampla a la
agricultura, biologa, ciencias polticas, comunicaciones, economa, educacin,
electrnica, fsica, medicina, negocios, psicologa, qumica, sociologa y otros
muchos campos de la ciencia e ingeniera.
Estadstica es un conjunto de mtodos para planear estudios y experimentos,
obtener datos y luego organizar, resumir, presentar, analizar, interpretar y llegar
a conclusiones basadas en los datos
Los datos son las observaciones recolectadas (como mediciones, gneros,
respuestas de encuestas, resultados de censos, etctera).
Un censo es el conjunto de datos de cada uno de los miembros de la poblacin.

POR QU ESTUDIAR ESTADSTICA?

Una razn imprescindible consiste en que la informacin numrica prolifera por


todas partes. Si se revisan peridicos (El Comercio, El Hoy, La Hora), revistas de
informacin (Vistazo, Muy Interesante), revistas de negocios (Lderes),
publicaciones de inters general (Hogar), revistas femeninas (Vanidades), o
revistas de deportes (Estadio, Carburando), y quedar sorprendido con la cantidad
de informacin numrica que contienen, ms an, si navega en la Internet. Existen
por lo menos tres razones para estudiar estadstica:
1. Los datos proliferan por todas partes.
2. Las tcnicas estadsticas se emplean en la toma de decisiones que influyen
en su vida.

~2~

3. Sin importar la carrera que elija, tomar decisiones profesionales que


incluyan datos. Una comprensin de los mtodos estadsticos permite
tomar decisiones con mayor eficacia.

POBLACIN Y MUESTRA

La poblacin es el conjunto de todos los elementos (puntuaciones, personas,


mediciones, etctera) a estudiar. Esta coleccin es completa, pues incluye a todos
los sujetos que se estudiarn.
La muestra es un subconjunto de miembros seleccionados de una poblacin.
Cuando la poblacin es numerosa, realizar el estudio de una (o varias variables) es
complicado, molesto y se invierte mucho tiempo y dinero, sera deseable tomar un
subconjunto de la poblacin cuyas caractersticas sean similares a sta. A ese
subconjunto lo vamos a llamar muestra. Tomar una muestra en lugar de la
poblacin presenta ventajas notables pues al disminuirse el nmero de elementos
se reducen los costes y se invierte menos tiempo en el estudio. Por otro lado hay
casos en los que no se puede tomar toda la poblacin, supongamos que queremos
estudiar el funcionamiento de unos fuegos artificiales, habr que tomar una
muestra de los fuegos y probarla, porque si usamos toda la poblacin nos
quedamos sin fuegos artificiales.
El problema se presenta cuando hay que elegir una muestra que sea

representativa de la poblacin. Para ello veremos distintas tcnicas de muestreo


que se elegirn en funcin de las caractersticas de la poblacin que se quiere
estudiar.

MUESTREO Y TIPOS DE MUESTREO

Muestreo es el proceso seguido para la extraccin de una muestra. En la siguiente


red se indican los tipos de muestreo.

Muestreo

Simple

Aleatorio

No aleatorio

Sistemtico

Estratificado

~3~

TIPOS DE MUESTREO

Muestreos no aleatorios y muestreos aleatorios.

MUESTREOS NO ALEATORIOS

Se eligen los elementos, en funcin de que sean representativos, segn la


opinin o conveniencia del investigador
EJEMPLO
El lder de un grupo elige 5 personas de entre 23, de acuerdo a su experiencia o criterio
personal, para efectuar cierta actividad administrativa.
SOLUCIN
Esta persona, utilizando su experiencia o criterio propio, escoger a 5 personas de entre las
23 disponibles.

MUESTREOS ALEATORIOS

Todos los miembros de la muestra han sido elegidos al azar, de forma que cada
miembro de la poblacin tuvo igual oportunidad de salir en la muestra.

MUESTREO ALEATORIO SIMPLE

Elegido el tamao de la muestra, los elementos que la compongan se han de


elegir aleatoriamente entre los N de la poblacin. Con calculadora u
ordenador: se utilizan los nmeros aleatorios (Un nmero aleatorio es aquel
obtenido al azar, es decir, que todo nmero tenga la misma oportunidad de ser
elegido y que la eleccin de uno no dependa de la eleccin del otro. El ejemplo
clsico ms utilizado para generarlos es el lanzamiento repetitivo de una moneda
o un dado)

MUESTREO ALEATORIO SISTEMTICO

Se ordenan previamente los individuos de la poblacin; despus se elige uno de


ellos al azar, a continuacin, a intervalos constantes, se eligen todos los dems
hasta completar la muestra.

MUESTREO ALEATORIO ESTRATIFICADO

Se divide la poblacin total en clases homogneas, llamadas estratos; por


ejemplo, por grupos de edades, por gnero, por barrios o sectores, etctera.
Hecho esto la muestra se escoge aleatoriamente en nmero proporcional al de los
componentes de cada clase o estrato.

~4~

EJEMPLO
Un colegio tiene 120 alumnos de bachillerato se quiere extraer una muestra de 30 alumnos.
Obtener la muestra mediante:
a) Mediante muestreo aleatorio simple.
b) Mediante muestreo aleatorio sistemtico.
c) Mediante muestreo estratificado.
SOLUCIN
a) Mediante muestreo aleatorio simple
Se numeran los alumnos del 1 al 120.
Se sortean 30 nmeros de entre los 120.
La muestra estar formada por los 30 alumnos a los que les correspondan los nmeros
obtenidos.
b) Mediante muestreo aleatorio sistemtico
Se numeran los alumnos del 1 al 120.
Se calcula el intervalo constante,
N (poblacin) 120
=
=4
n (muestra)
30
Sorteamos un nmero del 1 al 4. Supongamos que sale el nmero 3. El primer alumno
seleccionado para la muestra sera el nmero 3, los siguientes alumnos se obtendran
sumando 4, hasta llegar a obtener 30 alumnos. Los alumnos seleccionados para la muestra
son los que corresponden a los nmeros:
3, 7, 11, , 119
A continuacin se indican otras posibilidades.
1er alumno
seleccionado
1
2
3
4

2
5
6
7
8

3
9
10
11
12

30
117
118
119
120

c) Mediante muestreo aleatorio estratificado


Clasificamos los alumnos, digamos por gnero, en mujeres y hombres.
Supongamos que hay 67 mujeres y 53 hombres. El nmero de mujeres a tomar para la
muestra sera entonces:
67
120

30 = 16,75 17

y el nmero de hombres, lgicamente sera 13.


Finalmente hacemos un muestreo aleatorio, simple o sistemtico, en cada estrato
mujeres y hombres.

~5~

EJEMPLO
De una poblacin de N=50 individuos (Poblacin) deseamos extraer una muestra de tamao
n=5. Mediante el uso de los nmeros aleatorios, se designa cules son los 5 individuos que
componen la muestra.
SOLUCIN
Con el uso de Excel, o con una calculadora cientfica, se pueden generar los nmeros
aleatorios y as obtener una muestra para este caso, as:
Numeramos los elementos de la poblacin (en otras palabras codificamos o etiquetamos la
poblacin).
En la hoja de Excel se busca: frmulas matemticas y trigonomtricas
Luego se busca aleatorio y el resultado se multiplica por N (50 en nuestro caso).
Finalmente se toma la parte entera del producto as obtenido, con lo cual ya tendremos el
elemento a tomar para la muestra.

ESTADSTICA DESCRIPTIVA E INFERENCIAL

La estadstica se divide en dos grandes reas: la estadstica descriptiva y la


estadstica inferencial.
La estadstica descriptiva, que incluye mtodos para organizar, resumir y presentar
datos de manera informativa.
Una aglomeracin de datos desorganizados como el censo de poblacin,
los salarios mensuales de miles de empleados y las respuestas de millones de
votantes registrados para elegir presidente de Ecuador resulta de poca utilidad.
No obstante, las tcnicas de la estadstica descriptiva permiten organizar esta clase
de datos y darles significado. La estadstica descriptiva, se dedica a la descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos de estudio.
Los datos pueden ser resumidos numrica o grficamente.
La estadstica inferencial, que comprende un conjunto de mtodos para determinar
una propiedad de una poblacin con base en la informacin de una muestra.
La estadstica inferencial, se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en
cuenta la aleatoriedad de las observaciones. Si una muestra es representativa de
una poblacin, se pueden deducir importantes conclusiones acerca de sta, a partir
del anlisis de la muestra. Por ejemplo una encuesta reciente mostr que
solamente 46% de los estudiantes del ltimo grado de secundaria podan resolver
problemas que incluyen fracciones, decimales y porcentajes. Adems slo el 77%
de los estudiantes del ltimo ao de secundaria pudo sumar correctamente el
costo de una ensalada, una hamburguesa, unas papas fritas y un refresco de cola,
que figuraban en el men de un restaurante. Ya que stas son inferencias
relacionadas con una poblacin (todos los estudiantes de ltimo ao de
secundaria), basadas en datos de una muestra, se trata de estadstica inferencial.

~6~

TIPOS DE VARIABLES ESTADSTICAS

En virtud de que la estadstica analiza los datos y estos son resultado de las
mediciones, necesitamos dedicar cierto tiempo al estudio de las variables.
Una variable estadstica es cada una de las caractersticas o
cualidades que poseen los individuos de una poblacin. En la siguiente
red se indican los tipos de variables estadsticas.

Variable
estadstica

Cualitativa

Nominal

Cuantitativa

Ordinal

Discreta

Continua

Existen dos tipos de variables estadsticas: cualitativas y cuantitativas.

VARIABLE CUALITATIVA

Las variables cualitativas se refieren a caractersticas o cualidades que no pueden


ser medidas con nmeros. Podemos distinguir dos tipos: variable cualitativa
nominal y variable cualitativa ordinal.

VARIABLE CUALITATIVA NOMINAL

Una variable
cualitativa
nominal
presenta
modalidades
no
numricas que no admiten un criterio de orden. Por ejemplo, el estado civil, con
las siguientes modalidades: soltero, casado, separado, divorciado y viudo.

VARIABLE CUALITATIVA ORDINAL

Una variable cualitativa ordinal presenta modalidades no numricas, en las que


existe un orden. Por ejemplo, la nota en un examen: suspenso, aprobado,
notable, sobresaliente. El puesto conseguido en una prueba deportiva: 1, 2, 3,
Las medallas de una prueba deportiva: oro, plata, bronce.

~7~

VARIABLE CUANTITATIVA

Una variable cuantitativa es la que se expresa mediante un nmero, por tanto


se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos
tipos:
Variable cuantitativa discreta y variable cuantitativa continua.

VARIABLE CUANTITATIVA DISCRETA

Una variable
discreta es aquella que toma valores
aislados, es
decir no admite valores intermedios entre dos valores especficos y,
normalmente, existen agujeros entre dichos valores. Por ejemplo, el nmero de
hermanos de 5 amigos: 2, 1, 0, 1, 3. No se admiten valores como 2,35.

VARIABLE CUANTITATIVA CONTINUA

Una variable continua es aquella que puede tomar valores comprendidos


entre dos nmeros, es decir, puede asumir cualquier valor dentro de un
intervalo especfico. Por ejemplo, la estatura, en metros, de los 5 amigos: 1,73;
1,82; 1,77; 1,69; 1,75. En la prctica medimos la estatura con dos decimales, pero
tambin se podra dar con tres o ms decimales.
En general, una variable se representa con un smbolo, tal como , o , que
puede tomar un valor cualquiera de un conjunto determinado de ellos, llamado
dominio de la variable. Si la variable puede tomar solamente un valor se llama
constante.
Por ejemplo, en una familia el nmero de hijos puede tomar cualquiera de los
valores {0, 1, 2, }, pero no puede ser 2,5 o 3,842; es, pues, una variable discreta.
As, tambin, el tiempo que los autos tardan en un viaje de Ibarra a Quito, puede
ser, por ejemplo, 1 hora 30 minutos 54 segundos, 1 hora 50 minutos 14 segundos o
1 hora 10 minutos 30 segundos, dependiendo de la exactitud de medida que nos d
el cronmetro utilizado; es una variable continua.
En la siguiente tabla, se muestran otros ejemplos de variables estadsticas
discretas o continuas, con sus dominios respectivos.
Variable
Nmero w de litros de agua en
una mquina de lavar.
Nmero b de libros de un
estante de librera.
Suma s de puntos obtenidos en
el lanzamiento de un par de
dados.
Dimetro d de una esfera.
Pases p de Amrica.

Continua

Discreta

Continua
Discreta
Discreta
Continua
Discreta

~8~

Dominio
Cualquier valor de 0 litros hasta la capacidad de
la mquina.
0, 1, 2, 3,, hasta el mayor nmero de libros que
puedan entrar en el estante.
{2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}
Todos los valores de cero a ms infinito.
Brasil, Argentina, Ecuador, etc., que pueden
representarse numricamente por 1, 2, 3, etc.

La investigacin de problemas en temas como educacin, salud, importaciones,


produccin, y salarios por hora generalmente requiere de datos publicados
(peridicos, revistas especializadas, etc.) Pero, no siempre se encuentran datos
publicados sobre cada tema de inters. Se puede solicitar informacin a las
personas en un centro comercial, en sus hogares, por telfono, o por correo. La
Internet est cambiando la forma en la que vivimos y en la que se hacen los
negocios. Es una fuente de informacin excelente.

TIPOS DE DATOS

Una forma comn de clasificar los datos consiste en usar cuatro niveles de
medicin: nominal, ordinal, de intervalo y de razn. Cuando se aplica la estadstica
a problemas reales, el nivel de medicin de los datos es un factor importante para
determinar el procedimiento a utilizar. Poco a poco, encontraremos algunas
referencias a estos niveles de medicin; sin embargo, lo importante aqu se basa
en el sentido comn: no hay que hacer clculos ni utilizar mtodos estadsticos que
no sean apropiados para los datos.
Por ejemplo, no tendra sentido calcular el promedio de los nmeros del
seguro social, ya que estos nmeros son datos que se utilizan como identificacin,
y no representan mediciones o conteos de algo. Por la misma razn, no tendra
sentido calcular un promedio de los nmeros que aparecen en las camisetas de los
jugadores de ftbol.

NIVEL DE MEDICIN NOMINAL

El nivel de medicin nominal se caracteriza por datos que consisten


exclusivamente en nombres, etiquetas o categoras. Los datos no se pueden
acomodar en un esquema de orden (como del ms bajo al ms alto).
Considere los siguientes ejemplos.
1. S/no/indeciso: Respuestas de s, no e indeciso en una encuesta.
2. Colores: Los colores de los automviles conducidos por estudiantes
universitarios (rojo, negro, azul, blanco, magenta, prpura, etctera)
Puesto que los datos nominales carecen de orden y no tienen un significado
numrico, no se deben utilizar para hacer clculos. En ocasiones se asignan
nmeros a las distintas categoras (especialmente cuando los datos se codifican
para utilizarse en computadoras), pero estos nmeros no tienen un significado
computacional real y cualquier promedio que se calcule carece de sentido.

NIVEL DE MEDICIN ORDINAL

Los datos estn en el nivel de medicin ordinal cuando pueden acomodarse en


algn orden, aunque no es posible determinar diferencias entre los valores de los
~9~

datos o tales diferencias carecen de significado. Los siguientes ejemplos ilustran el


nivel de medicin ordinal.
1. Las calificaciones de un curso: Un profesor universitario asigna
calificaciones de A, B, C, D, E o F. Tales calificaciones se pueden ordenar,
aunque no es posible determinar diferencias entre tales calificaciones. Por
ejemplo, sabemos que A es mayor que B (por lo que hay un orden); pero no
podemos restar B de A (por lo que no se puede calcular la diferencia)
2. Rangos: Con base en varios criterios, una revista ordena las ciudades de
acuerdo con su habitabilidad. Dichos rangos (primero, segundo, tercero,
etctera) determinan un orden. Sin embargo, las diferencias entre los
rangos no tienen ningn significado. Por ejemplo, una diferencia del
segundo menos el primero sugerira 2 1 = 1, pero esta diferencia de 1
no tiene significado porque no es una cantidad exacta que sea comparable
con otras diferencias de este tipo. La diferencia entre la primera y la
segunda ciudades no es la misma que la diferencia entre la segunda y la
tercera ciudades. Utilizando los rangos de la revista, la diferencia entre la
ciudad de Quito y Cuenca no se puede comparar de forma cuantitativa con
la diferencia entre Guayaquil y Manta.
Los datos ordinales proporcionan informacin sobre comparaciones relativas,
pero no las magnitudes de las diferencias. Por lo general, los datos ordinales no
deben utilizarse para hacer clculos como promedios, aunque en ocasiones esta
norma se infringe (como sucede cuando utilizamos calificaciones con letras para
calcular una calificacin promedio).

NIVEL DE MEDICIN DE INTERVALO

El nivel de medicin de intervalo se parece al nivel ordinal, pero con la propiedad


adicional de que la diferencia entre dos valores de datos cualesquiera tiene un
significado. Sin embargo, los datos en este nivel no tienen punto de partida cero
natural inherente (donde nada de la cantidad est presente).
Los siguientes ejemplos ilustran el nivel de medicin de intervalo.
1. Temperaturas: Las temperaturas corporales de 98,2F y 98,6F son
ejemplos de datos a nivel de medicin de intervalo. Dichos valores estn
ordenados, y podemos determinar su diferencia de 0,4F. Sin embargo, no
existe un punto de inicio natural. Pareciera que el valor de 0F es un punto
de inicio; sin embargo, ste es arbitrario y no representa la ausencia total de
calor. Puesto que 0F no es un punto de partida cero natural, sera
incorrecto decir que 50F es dos veces ms caliente que 25F.
2. Aos: Los aos 1000, 2008, 1776 y 1492. (El tiempo no inici en el ao 0,
por lo que el ao 0 es arbitrario y no constituye un punto de partida cero
natural que represente la ausencia de tiempo).

~ 10 ~

NIVEL DE MEDICIN DE RAZN

El nivel de medicin de razn es similar a nivel de intervalo, pero con la propiedad


adicional de que s tiene un punto de partida cero natural (donde el cero indica que
nada de la cantidad est presente). Para valores a este nivel, tanto las diferencias
como las proporciones tienen significado.
Los siguientes son ejemplos de datos al nivel de medicin de razn. Observe la
presencia de un valor cero natural, as como el uso de proporciones que significan
dos veces y tres veces.
1. Pesos: Los pesos (en quilates) de anillos de compromiso de diamante (el 0
realmente representa la ausencia de peso y 4 quilates es dos veces el peso
de 2 quilates).
2. Precios: Los precios de libros de texto universitarios ($0 realmente
representa ningn costo y un libro de $90 es tres veces ms caro que un
libro de $30).

Este nivel de medicin se denomina de razn porque el punto de partida cero hace
que las razones o cocientes tengan significado. Entre los cuatros niveles de
medicin, la principal dificultad surge al distinguir entre los niveles de intervalo y
de razn. Sugerencia: Para simplificar esta diferencia, utilice una sencilla prueba
de razn: Considere dos cantidades en las cuales un nmero es dos veces el otro y
pregntese si dos veces sirve para describir correctamente las cantidades.
Puesto que un peso de 200 libras es dos veces ms pesado que un peso de 100
libras, pero 50F no es dos veces ms caliente que 25F, los pesos estn en el nivel
de razn, mientras que las temperaturas Fahrenheit estn en el nivel de intervalo.
Para una comparacin y un repaso concisos, estudie el grfico subsiguiente, que
seala las diferencias entre los cuatro niveles de medicin.

PARMETRO
MUESTRAL

POBLACIONAL

ESTADSTICO

El parmetro poblacional es una medicin numrica que describe algunas


caractersticas de una poblacin.
El estadstico muestral (o la estadstica muestral) es una medicin numrica que
describe algunas caractersticas de una muestra.
Los siguientes ejemplos muestran la diferencia entre parmetro y estadstico.
1. Parmetro: En la ciudad de Quito hay 325 botones para caminar, que los
peatones emplean en las intersecciones de trnsito. Se descubri que el
77% de dichos botones no funciona. La cifra del 77% es un parmetro
porque est basada en la poblacin de todos los 325 botones para peatones.

~ 11 ~

2. Estadstico: Con base en una muestra de 87 ejecutivos encuestados, se


encontr que el 45% de ellos no contratara a alguien con un error
ortogrfico en su solicitud de empleo. Esta cifra del 45% es un estadstico,
ya que est basada en una muestra y no en la poblacin completa de todos
los ejecutivos.

Niveles de
medicin

Nominal

Ordinal

Intervalo

Razn

Los datos
slo se
clasifican

Los datos se
ordenan

Diferencia
significativa
entre valores

Punto 0
significativo
y razn entre
valores

-Temperatura
-Talla

-Nmero de pacientes
atendidos
-Nmero de llamadas
de ventas realizadas
-Distancia a clase

-Nmero de camiseta
de los jugadores de
ftbol
-Marca de automvil

-Su nmero de lista


en clase
-Posicin de los
equipos dentro de
los diez grandes

REDONDEO DE DATOS

El resultado de redondear un nmero tal como 72,8 al entero ms prximo es


73, puesto que 72,8 est ms cerca de 73 que de 72. Anlogamente, 72,8146
redondeado al nmero decimal con dos decimales ser 72,81, puesto que 72,8146
est ms cerca de 72,81 que de 72,82. En el redondeo de 72,465 a un decimal con
aproximacin de centsimas, nos encontramos con el dilema de que 72,465 est
justamente a la mitad de recorrido entre 72,46 y 72,47. Se acostumbra en tales
casos redondear al nmero par ms prximo que antecede al 5. As, 72,465 se
redondea a 72,46; 183,475 se redondea a 183,48; redondeando 112500000 con
aproximacin de millones ser 112000000. Esta prctica es especialmente til al
minimizar la acumulacin de errores de redondeo cuando se abarca un nmero
grande de operaciones.
EJEMPLO
Sumar los nmeros 4,35; 8,65; 2,95; 12,45; 6,65; 7,55 y 9,75
a) Directamente.
b) Redondeando de acuerdo con el criterio del par ms prximo
c) Redondeando todos los datos por exceso.
SOLUCIN
Y as, tenemos:
~ 12 ~

a) 4,35+8,65+2,95+12,45+6,65+7,55+9,75 = 52,35
b) 4,4+8,6+3,0+12,4+6,6+7,6+9,8 = 52,4
c) 4,4+8,7+3,0+12,5+6,7+7,6+9,8 = 52,7
Ntese que el mtodo b) es ms exacto que el c), puesto que la acumulacin de errores se
minimiza en el mtodo b).

NOTACIN SUMATORIA O NOTACIN SIGMA

El smbolo (lase ) representa cualesquiera de los valores


1 , 2 , 3 , , , que una variable puede tomar. La letra en , la cual puede
representar cualquiera de los nmeros 1, 2, 3, , se llama ndice o subndice.
Anlogamente puede utilizarse como subndice cualquier otra letra distinta de ,
como o , por ejemplo. El smbolo =1 , se utiliza para indicar la suma de
todas las desde = 1 hasta = , es decir que, por definicin,

= 1 + 2 + 3 + +
=1

Cuando no cabe confusin posible, se representa esta suma por la notacin ms


simplificada,

El smbolo es la letra griega mayscula sigma, denotando sumatoria. La notacin


se llama, a veces, notacin sigma. Por ejemplo,

= 1 1 + 2 2 + 3 3 + +
=1

Tambin,
4

= 1 + 2 + 3 + 4
=1
4

= (1 + 2 + 3 + 4 )
=1
4

=
=1

=1

siendo a una constante. Ms sencillamente, =


EJEMPLO
Si , y son constantes cualesquiera, entonces, puede demostrarse que:

~ 13 ~

( + ) = +
SOLUCIN
Y as tenemos que, para = 3:
3

( + ) = (1 + 1 ) + (2 + 2 2 ) + (3 + 3 3 )
1
3

( + ) = (1 + 2 + 3 ) + (1 + 2 + 3 ) (1 + 2 + 3 )
1
3

( + ) = +
1

=1

=1

=1

Se puede demostrar para toda n, de manera similar (ver el ejercicio E12)

DISTRIBUCIN DE FRECUENCIAS

La distribucin de frecuencias es una lista de datos ya sea de manera individual


(datos sin agrupar) o por grupos de intervalos (datos agrupados), junto con sus
frecuencias (o conteos) correspondientes.

DISTRIBUCIN DE FRECUENCIAS CON DATOS SIN


AGRUPAR
La distribucin de frecuencias es la representacin estructurada, en forma de tabla,
de toda la informacin que se ha recogido sobre la variable que se estudia. Veamos
un ejemplo demostrativo.
EJEMPLO
Medimos la talla de 30 nios de una clase y obtenemos los siguientes resultados en metros
(tabla subsiguiente)
Alumno
Alumno 1
Alumno 2
Alumno 3
Alumno 4
Alumno 5
Alumno 6
Alumno 7
Alumno 8
Alumno 9
Alumno 10

Estatura
1,25
1,28
1,27
1,21
1,22
1,29
1,30
1,24
1,27
1,29

Alumno
Alumno 1
Alumno 12
Alumno 13
Alumno 14
Alumno 15
Alumno 16
Alumno 17
Alumno 18
Alumno 19
Alumno 20

Estatura
1,23
1,26
1,30
1,21
1,28
1,30
1,22
1,25
1,20
1,28

SOLUCIN

~ 14 ~

Alumno
Alumno 21
Alumno 22
Alumno 23
Alumno 24
Alumno 25
Alumno 26
Alumno 27
Alumno 28
Alumno 29
Alumno 30

Estatura
1,21
1,29
1,26
1,22
1,28
1,27
1,26
1,23
1,22
1,21

Si presentamos esta informacin estructurada obtendramos la siguiente tabla de


frecuencias:
Estatura
(metros)
1,20
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
Total

Frecuencias absolutas
Simple
Acumulada
1
1
4
5
4
9
2
11
1
12
2
14
3
17
3
20
4
24
3
27
3
30
30

Frecuencias relativas
Simple
Acumulada
3,3%
3,3%
13,3%
16,6%
13,3%
30,0%
6,7%
36,6%
3,3%
40,0%
6,7%
46,6%
10,0%
56,6%
10,0%
66,6%
13,3%
80,0%
10,0%
90,0%
10,0%
100,0%
100%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy
pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera
obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos
de sntesis. (Tal como se ver en la siguiente seccin)

DISTRIBUCIN DE FRECUENCIAS CON DATOS


AGRUPADOS
Una distribucin de frecuencias (con datos agrupados) es una agrupacin de datos
en clases o categoras, que muestra el nmero de observaciones en cada clase; Los
pasos recomendados para elaborar una distribucin de frecuencias son los que se
muestran en la siguiente red:
Distribucin de
frecuencias con
datos agrupados

Paso 2: Determine el
intervalo o ancho de
clase

Paso 1: Defina el
nmero de clases

Paso 4: Cuente el
nmero de
elementos de cada
clase

Paso 3: Establezca
los lmites de cada
clase y antelos

EJEMPLO
Consideremos la cantidad semanal (en dlares), que se gasta en transporte. La tabla
siguiente (datos en bruto o datos no agrupados), se obtuvo de una muestra de 54 hogares y,
refleja la cantidad semanal gastada, en dlares, en transporte por dichos hogares.

71
79
42
66
49
21

63
25
33
40
44
26

Cantidad gastada semanalmente en transporte


59
76
27
37
69
78
66
63
77
62
28
39
46
78
40
51
40
74
57
40
70
42
79
35
34
39
38
30
23
50
~ 15 ~

29
32
41
71
23
40

50
33
35
30
35
28

Cuntas clases recomendara? Qu, ancho de clase o intervalo de clase sugerira?


Establezca los lmites de clase, es decir construya los intervalos de clase. Construya la
distribucin de frecuencias.
SOLUCIN

Paso 1 :

Defina el nmero de clases

El objetivo consiste en emplear suficientes agrupamientos o clases, de manera tal que se


perciba la forma de la distribucin. Aqu se necesita criterio. Una gran cantidad de clases o
muy pocas podran no permitir ver la forma fundamental del conjunto de datos.
Demasiadas clases o muy pocas pueden no revelar la forma bsica del conjunto de datos.
Una receta til para determinar el nmero de clases es la regla 2 a la k o regla de Sturges.
Esta regla sugiere utilizar como nmero de clases el menor nmero k tal que 2 k sea mayor
que el nmero de observaciones n, esto es:

{}, 2 >

= nmero de clases
= nmero de datos

O bien,
= (1 +


)
2

= nmero de clases
= nmero de datos

En nuestro caso, tenemos 54 observaciones. Si probamos con k = 5, entonces 2 5 = 32 es


menor que 54. Por tanto 5 clases no son suficientes. Si escogemos k = 6, entonces 2 6 = 64,
que es mayor que 54. En consecuencia, el nmero de clases que se recomienda utilizar es 6.
De otra manera:
= (1 + 54/ 2 ) = 6 , .

Paso 2:

Determine el intervalo o ancho de clase

Generalmente el intervalo (o ancho) de clase deber ser el mismo para todas las clases.
Todas las clases juntas deben cubrir por lo menos la distancia que hay desde el menor
hasta el mayor valor que se tiene en los datos sin procesar. Expresado esto mediante una
frmula tenemos:

= tamao del intervalo de clase


= mayor valor observado
= menor valor observado
= nmero de clases

En nuestro caso, el dato mnimo es 21, el mximo 79 y el nmero de clases k, encontrado


en el paso 1, es 6, por lo tanto:

79 21
=
= 9,67

Entonces, redondeamos c al entero ms cercano, 10. Psicolgicamente, preferimos (o nos


gusta) trabajar con nmeros redondos, (terminados en cero) porque son ms sencillos
para realizar clculos. Por eso, se sugiere aproximar al entero redondo ms prximo,
siempre que esto, sea posible.
~ 16 ~

Paso 3

Establezca los lmites de cada clase y antelos

Es necesario establecer los lmites de clase de manera que cada observacin pertenezca
slo a una clase. Por ejemplo, clases (en dlares) como las siguientes: 1300-1400 y
1400-1500, no deberan usarse porque no es claro si el valor de 1400 dlares pertenece
a la primera o a la segunda clase. Pero, si quedamos que el intervalo 1300-1400 es el
intervalo [1300; 1400[, es decir que 1400 no est incluido, no habr ninguna confusin. En
la clase 1300-1400, 1300 es el lmite inferior de clase y 1400 el lmite superior de dicha
clase. Recuerde, el lmite superior de clase no est incluido. El primer lmite inferior de
clase que debe establecerse, es el correspondiente a la primera clase; asimismo, se sugiere,
como en el paso 2, un nmero redondo en lo posible, pero si no es el caso, no importa.
En nuestro caso, el valor ms bajo es 21, por lo tanto, 20 sera el lmite inferior sugerido de
la primera clase: 20-30. Ahora, se construye la tabla:

Cantidad gastada
semanalmente (dlares)
20-30
30-40
40-50
50-60
60-70
70-80
Ntese que sta cubre todos los datos observados. Fjese, que otra tabla sugerida podra ser
la mostrada a continuacin:

Cantidad gastada
semanalmente (dlares)
21-31
31-41
41-51
51-61
61-71
71-81
No perder de vista, que tambin cubre todos los datos observados. Preferimos la primera
opcin a la segunda, por lo que se coment antes, acerca de nmeros redondos.

Paso 4:

Cuente el nmero de elementos de cada clase

Al distribuir (realizando el conteo) los datos sin procesar en las distintas clases, ubicando
dichos datos en cada clase, creamos la distribucin de frecuencia buscada. Una vez
establecidas las clases o, ms correctamente, los intervalos de clase, procedemos al
conteo y clasificacin de los datos en la distribucin de frecuencias, tal como se muestra a
continuacin; recuerde que si un dato aparece en dos clases, el lmite superior no est
incluido. Para comenzar, la primera cantidad gastada en transporte en la tabla del ejemplo
es de $71. Este se anota en la clase 70 80. La segunda cantidad en la segunda columna de
dicha tabla es $63. El que se anota en la clase 60 70. Los dems valores de gastos en
transporte, se cuadran de forma similar. Cuando todos los gastos en transporte se hayan
registrado, la tabla tendr la siguiente apariencia:

~ 17 ~

Cantidad gastada
semanalmente (dlares)
20-30
30-40
40-50
50-60
60-70
70-80
Total

Frecuencia
9
13
11
5
6
10
54

A continuacin se formalizan algunas definiciones, otras se complementan y otras


se introducen.
La frecuencia f es el nmero de observaciones en cada clase; por ejemplo, la
frecuencia de la clase 20 30, es decir, de la primera clase, es 9.
El intervalo de clase c es la diferencia entre los lmites superior e inferior de
cualquier clase, as:
c = 30 20 = 40 30 = 50 40 = 60 50 = 70 60 = 80 70 = 10
El punto medio de clase, conocido mejor como marca de clase se calcula sumando el
lmite inferior de la clase al lmite superior de la misma clase, y dividiendo el
resultado entre 2. En nuestro ejemplo, la marca de clase de la clase 40 50, es
decir, de la tercera clase, es 45, obtenida como sigue:
40 + 50
= 45
2
La frecuencia relativa es el porcentaje de observaciones en cualquier clase.
=

Por ejemplo, la frecuencia relativa de la clase 50 60, de nuestro ejemplo, es


9,26%, obtenida as:
2
= 0,926 = 9,26%
54
La suma de las frecuencias relativas de todas las clases es evidentemente 1
100%.
La frecuencia acumulada de una clase es la suma de las frecuencias para esa clase y
todas las clases previas. As, por ejemplo, la frecuencia acumulada hasta el
intervalo de clase 40-50 en nuestro ejemplo, es 9+13+11 = 33, significando que
33 hogares consumen semanalmente en alimentos menos de 50 dlares.

~ 18 ~

VISUALIZACIN DE LOS DATOS

Se pueden visualizar los datos, mediante los histogramas, los polgonos de


frecuencia o las ojivas. En la siguiente red, se muestran los grficos estadsticos
ms comunes.

Absolutos
Histogramas

Grficos estadsticos

Relativos

Polgonos de
frecuencias

Absolutos
Relativos
Absolutas

Ojivas
Porcentuales
Otros

Para construir dichos grficos estadsticos, se requiere la siguiente tabla de


trabajo o de clculos, en donde se resume todo lo requerido, para poder realizar
grficos estadsticos.

Tabla de clculos

Clases

Frecuencias
Frecuencias
Marca
absolutas
relativas
de
clase Simple Acumulada Simple Acumulada
(%)
(%)

EJEMPLO
Consideremos la cantidad semanal (en dlares), que se gasta en transporte. La tabla
siguiente (datos en bruto o datos no agrupados), se obtuvo de una muestra de 54 hogares
y, refleja la cantidad semanal gastada, en dlares, en transporte por dichos hogares.
Cantidad gastada semanalmente en transporte
~ 19 ~

71
79
42
66
49
21

63
25
33
40
44
26

59
78
28
51
70
39

76
66
39
40
42
38

27
63
46
74
79
30

37
77
78
57
35
23

69
62
40
40
34
50

29
32
41
71
23
40

50
33
35
30
35
28

Llene la tabla de clculos (tabla de frecuencias)


SOLUCIN
Del ejemplo previo utilizamos la distribucin de frecuencias para llenar la tabla de
frecuencias siguiente.
Tabla de Frecuencias
Cantidad
gastada
Marca de
semanalmente
clase
(dlares)
20-30
25
30-40
35
40-50
45
50-60
55
60-70
65
70-80
75
Total

Frecuencias absolutas

Frecuencias relativas

Simple

Acumulada

Simple
(%)

Acumulada
(%)

9
13
11
5
6
10
54

9
22
33
38
44
54

17
24
20
9
11
19
100

17
41
61
70
81
100

HISTOGRAMAS

Un histograma (en realidad histograma de frecuencias absolutas), es una


representacin grfica, que muestra el nmero de frecuencia en cada clase, en
forma de rectngulos que tienen sus bases en el eje horizontal con centros en las
marcas de clase y ancho igual a los intervalos de clase. Las frecuencias de clase
estn representadas por las alturas de las barras, y stas se colocan adyacentes una
a otra (sin espacios entre ellas). Si el histograma muestra la frecuencia relativa en
cada clase, se llama histograma porcentual. Guarda la misma forma del histograma
comn, con una diferencia, en vez de las frecuencias absolutas simple se utilizan
las frecuencias relativas simples.

POLGONOS DE FRECUENCIAS

Un polgono de frecuencias (absolutas) est formado por segmentos de recta que


unen los puntos determinados por las intersecciones provenientes de las marcas
de clase y las frecuencias de clase. Estos segmentos forman un polgono o figura
de varios lados Se deben agregar las marcas de clase inferior y superior
inmediatas a las establecidas en la tabla de trabajo, para poder cerrar el polgono
de frecuencias. Si en lugar de las frecuencias absolutas se utilizan las frecuencias
relativas, se tiene el polgono de frecuencias relativas, que guarda exactamente la
misma forma que la del polgono de frecuencias.
~ 20 ~

OJIVAS

Una ojiva es la representacin grfica de una distribucin de frecuencias


acumuladas. Cuando en la ojiva se cambia la escala de frecuencias absolutas
acumuladas por frecuencias relativas acumuladas, o sea los valores normales se
convierten en porcentajes, la ojiva se llama ojiva porcentual. Que guarda fielmente
la misma forma de la ojiva.
EJEMPLO
Consideremos la cantidad semanal (en dlares), que se gasta en transporte. La tabla
siguiente (datos en bruto o datos no agrupados), se obtuvo de una muestra de 54 hogares y,
refleja la cantidad semanal gastada, en dlares, en transporte por dichos hogares.

71
79
42
66
49
21

63
25
33
40
44
26

Cantidad gastada semanalmente en transporte


59
76
27
37
69
78
66
63
77
62
28
39
46
78
40
51
40
74
57
40
70
42
79
35
34
39
38
30
23
50

29
32
41
71
23
40

50
33
35
30
35
28

Construya grficos estadsticos: histogramas, polgonos de frecuencias y ojivas.


SOLUCIN
Tabla de frecuencias
Cantidad gastada
semanalmente
(dlares)

Marca
de
clase

20-30
30-40
40-50
50-60
60-70
70-80
Total

25
35
45
55
65
75

Frecuencias
absolutas
Simple

Acumulada

9
13
11
5
6
10
54

9
22
33
38
44
54

Frecuencias
relativas
Simple Acumulada
(%)
(%)
17
17
24
41
20
61
9
70
11
81
19
100
100

Para construir el histograma, necesitamos utilizar las columnas: Marca de clase y


Frecuencia absoluta simple. El histograma se muestra en la siguiente figura.

Histograma

Frecuencia

15
10
5
0

25
35
45
55
65
75
Cantidad gastada semanalmente (dlares)
~ 21 ~

Para construir el polgono de frecuencias, necesitamos utilizar las columnas: Marca de


clase y Frecuencia absoluta simple El polgono de frecuencias se representa en la
siguiente figura. Ntese que, se han agregado las marcas de clase inferior y superior
inmediatas, 15 y 85, respectivamente, que corresponderan a clases de frecuencia cero,
para poder cerrar el polgono de frecuencias.

P OL GONO D E F RECUENCI AS
1,2

Frecuencia

1
0,8
0,6
0,4
0,2
0
15

25

35

45

55

65

75

85

Cantidad gastada semanalmente (dlares)

Para construir la ojiva, necesitamos utilizar las columnas: Marca de clase y Frecuencia
absoluta a cumulada La ojiva se representa en la figura:

Ojiva
Frecuencia acumulada

60
50
40
30
20
10
0
15
25
35
45
55
65
Cantidad gastada semanalmente (dlares)

75

De esta ojiva vemos, por ejemplo, que, aproximadamente, 28 de los hogares visitados,
gastan menos de 40 dlares semanales en transportacin. Tambin, observamos, que, para
transporte se gasta menos de 70 dlares semanales (aproximadamente), en 50 de los
hogares.

OTRAS REPRESENTACIONES GRFICAS DE DATOS

Hay muchas graficas que se utilizan en libros, peridicos y revistas, entre ellas
tenemos, las grficas de lneas, las grficas de barras, las grficas circulares, los
diagramas de puntos y las grficas de tallo y hojas.

GRFICAS DE LNEAS

Una grfica de lneas es adecuada para mostrar la tendencia de ventas o de


ingresos en un periodo determinado.
EJEMPLO
~ 22 ~

Los ingresos y los gastos mensuales de una microempresa, se registran a continuacin.

Mes
Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre

Ingresos
(Dlares)
3200
3500
2900
3100
2500
4100
3400
3500
2300
1700
5000
3600

Gastos
(Dlares)
2500
1800
900
980
3200
750
1300
1200
950
2500
2100
1000

SOLUCIN
Para construir nuestra grfica de lneas, hemos ubicado en el eje x los meses y en el eje y
los ingresos y los gastos.
Ingresos

Gastos

6000
5000
4000
3000
2000
1000
0

MES

GRFICAS DE BARRAS

Las grficas de barras son similares a las grficas de lneas, y resultan tiles para
mostrar cambios en un negocio o datos econmicos en un lapso de tiempo,
pudiendo ser barras horizontales o verticales. Tambin se utilizan con datos
cualitativos.
EJEMPLO
Los ingresos y los gastos mensuales de una microempresa, se registran a continuacin.

Mes

Ingresos
~ 23 ~

Gastos

(Dlares)
3200
3500
2900
3100
2500
4100
3400
3500
2300
1700
5000
3600

Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre

(Dlares)
2500
1800
900
980
3200
750
1300
1200
950
2500
2100
1000

SOLUCIN
Para construir nuestra grfica de barras horizontales, hemos ubicado en el eje x los
ingresos y los gastos y en el eje y los meses y, para construir nuestra grfica de barras
verticales, hemos ubicado en el eje x los meses y los ingresos y gastos en el eje y.

Barras Horizontales

Barras Verticales
6000

Diciembre
Noviembre
Octubre
Septiembre
Agosto
Julio
Junio
Mayo
Abril
Marzo
Febrero
Enero

5000
4000
3000
2000
1000

2000
Gastos

4000

6000

Enero
Febrero
Marzo
Abril
Mayo
Junio
Julio
Agosto
Septiembre
Octubre
Noviembre
Diciembre

Ingresos

Ingresos

Gastos

EJEMPLO
Cybernet.com realiza una prueba de mercado de su nuevo sitio web y le interesa saber con
qu facilidad se navega en su diseo de pgina web. Selecciona al azar 200 usuarios
frecuentes de internet y les pide que lleven a cabo una tarea de investigacin en la pgina
web. A cada individuo le solicita que califique la relativa facilidad para navegar como mala,
buena, excelente o sobresaliente. Los resultados aparecen en la siguiente tabla:

Sobresaliente
Excelente
Buena
Mala

102
58
30
10

a) Qu tipo de escala de medicin se emplea para facilitar la navegacin?


b) Elabore una grfica de barras con los resultados de la encuesta.
c) Construya una grfica de pastel con los resultados de la encuesta.
SOLUCIN

~ 24 ~

a) Los datos se miden de acuerdo con una escala ordinal. Es decir, que la escala se grada
en conformidad con la facilidad relativa y abarca de malo a sobresaliente. Adems, el
intervalo entre cada calificacin se desconoce, as que resulta imposible, por ejemplo,
concluir que una buena calificacin representa el doble de una mala calificacin.
b) Es posible usar una grfica de barras para representar los datos. La escala vertical
muestra la frecuencia relativa y la horizontal los valores relativos a la facilidad de
medida de navegacin.

Facilidad de navegacin: Grfica de barras


Frecuencia relativa, %

0,6
0,5
0,4
0,3
0,2
0,1
0
Mala

Buena

Excelente

Sobresaliente

c) Tambin se emplea una grfica de pastel para representar estos datos. La grfica de
pastel hace hincapi en que ms de la mitad de los encuestados calificaron de
sobresaliente la relativa facilidad para utilizar el sitio web.

5%
15%
51%
29%

GRFICAS CIRCULARES (O DE PASTEL)

Las grficas circulares son tiles para mostrar datos cualitativos o porcentajes. Una
grfica circular presenta datos cualitativos como si fueran rebanadas de un pastel.
EJEMPLO
Se est verificando la calidad del servicio telefnico. Algunas de las quejas en contra de las
compaas telefnicas incluyen los cambios, es decir, se cambia de compaa al cliente sin su
consentimiento, y el cobro forzoso de cargos no autorizados. Datos recientes mostraron que
las quejas en contra de las compaas telefnicas eran las siguientes:

~ 25 ~

Descripcin
Tarifas y servicios
Marketing
Llamadas internacionales
Cargos de acceso
Servicios de operadora
Cambios sin consentimiento
Forzamiento
Total

Nmero de quejas
447
100
77
61
53
1248
121
2107

En una grfica circular represente los porcentajes de las quejas ms comunes hacia las
compaas telefnicas.
SOLUCIN
El diagrama circular correspondiente las quejas en contra de las compaas telefnicas, se
ver as:
Llamadas
Cargos de
internacionales;
acceso; 61
77
Marketing; 100

Servicios de
operadora; 53

Forzamiento;
121
Tarifas y
servicios; 447

Cambios sin
consentimiento;
1248

Cambios sin consentimiento

Tarifas y servicios

Forzamiento

Marketing

Llamadas internacionales

Cargos de acceso

Servicios de operadora

GRFICAS DE PUNTOS

Una grfica de puntos consiste en una grfica en donde se marca cada valor de un
dato como un punto a lo largo de una escala de valores. Los puntos que
representan valores iguales se amontonan. Un diagrama de puntos se asemeja a un
histograma en el sentido de que consiste en una representacin grfica de una
distribucin de los valores de los datos. Sin embargo, se diferencia de ste en que
los valores se representan individualmente, en lugar de agruparse en clases. Los
diagramas de puntos se aplican preferentemente a pequeos conjuntos de datos y
son particularmente tiles en la comparacin de dos conjuntos de datos diferentes,
o de dos subgrupos de un conjunto de datos.
~ 26 ~

EJEMPLO
En un condominio viven 10 familias (identificadas por un nmero del 1 al 10), constituidas
por padres e hijos. La cantidad de hijos por familia est dada en la siguiente tabla:
Familia N

10

Cantidad de hijos

En una grfica de puntos, represente el nmero de hijos que tienen las familias. Conocido el
grfico de puntos y/o la tabla resumen, se puede hacer algunas preguntas de inters. Por
ejemplo:
a) En cuntas familias hay tres hijos?
b) Cuntos hijos viven en el condominio?
c) Cuntos hijos no son nicos?
SOLUCIN
La grfica de puntos queda as:

Grfica de puntos

Nmero de hijos
Ahora podemos contestar las preguntas:
a) En dos familias hay tres hijos.
b) Veinte hijos.
c) Diecisiete hijos no son nicos.

GRFICAS DE TALLO Y HOJAS

Una grfica de tallo y hojas es una representacin de un conjunto de datos


estadsticos, de la siguiente forma. Cada valor numrico se divide en dos partes, el
dgito principal se convierte en el tallo y los dgitos secundarios en las hojas. El
tallo se localiza a lo largo del eje vertical y los valores de las hojas se apilan unos
contra otros a lo largo del eje horizontal. Esta representacin tiene la ventaja de
que no se pierde la identidad de cada observacin.
EJEMPLO
La tabla siguiente, muestra la cantidad de espacios publicitarios de 30 segundos en radio,
que compr cada uno de los 45 locales comerciales de la cadena de ventas del Centro
Comercial CCM, el ao pasado. Organice los datos en una representacin de tallo y hojas.
~ 27 ~

96
139
112
118

93
142
135
136

88
94
132
125

117
107
111
143

127
125
125
120

95
155
104
103

113
155
106
113

96
103
139
124

108
112
134
138

94
127
119

148
117
97

156
120
89

SOLUCIN
Se advierte que la menor cantidad de anuncios es 88, por tanto el primer valor del tallo es
8. El valor ms grande es 156, por lo que los valores de tallo comenzarn en 8 y
continuarn hasta 15. El primer valor en la tabla es 96, que tendr un valor de tallo de 9 y
un valor de hoja de 6. Recorriendo el rengln superior, el segundo valor es 93 y el tercero
es 88, y as sucesivamente. Despus de organizar todos los datos, tenemos:
Tallo
8
9
10
11
12
13
14
15

Hojas
8
6
8
7
7
9
8
6

9
3
7
3
5
5
2
5

5
3
2
7
2
3
5

6
4
7
0
9

4
6
2
5
4

4
3
1
5
6

7
9
0
8

8
4

El procedimiento final es ordenar los valores de las hojas, de menor a mayor. As:
Tallo
8
9
10
11
12
13
14
15

Hojas
8
3
3
1
0
2
2
5

9
4
3
2
0
4
3
5

4
4
2
4
5
8
6

5
6
3
5
6

6
7
3
5
8

6
8
7
5
9

7
7
7
9

8
7

Es posible deducir algunas conclusiones del diagrama de tallo y hojas. Por ejemplo, la
cantidad mnima de espacios publicitarios comprados es de 88, y la mxima de 156; dos
almacenes compraron menos de 90 espacios, y tres compraron 150 o ms. Observe, por
ejemplo, que los tres almacenes que compraron ms de 150 espacios, en realidad
compraron 155,155 y 156 espacios. La concentracin de la cantidad de espacios se
encuentra entre 110 y 130. Hubo 17 almacenes que compraron entre 110 y 130 espacios
publicitarios.

Existen otros diagramas estadsticos, tales como los diagramas de dispersin, los
diagramas de caja o de cuadro, los pictogramas, etc., algunos de los cuales se
revisarn ms adelante.

~ 28 ~

EJERCICIOS

E1

Decir de las variables siguientes cules son discretas y cules continuas.


a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)

Temperaturas registradas cada media hora en un observatorio.


Peso de las cajas registradas en un contenedor.
Nmero de billetes de veinte dlares circulando a la vez en Ecuador.
Estudiantes matriculados en la PUCE-SI en un este semestre.
Velocidad de un automvil en kilmetros por hora.
Nmero de libros en un estante de librera.
Pases de Europa.
Nmero de galones de gasolina en un tanque de automvil.
Longitud de un cuarto.
Suma de puntos obtenidos en el lanzamiento de un par de dados.
Nmero de kilogramos de trigo producidos por hectrea en una
granja en un determinado nmero de aos.
l) Nmero de individuos de una familia.
m) Tiempo de vuelo de un avin.
n) Estado civil de un individuo.
o) Nmero de ptalos de una flor.
E2

Ubique las variables en la siguiente tabla de clasificacin.


a)
b)
c)
d)
e)
f)

Salario.
Gnero.
Volumen de ventas de reproductores de MP3.
Preferencia por los refrescos.
Temperatura (Co)
Lugar que ocupa un estudiante en clase, en lo que a rendimiento
acadmico se refiere.
g) Cantidad de computadoras domsticas.
h) Calificaciones de un profesor de Programacin.
Cualitativa

Cuantitativa

Nominal
Ordinal
Discreta
Continua
E3

Suponga que las variables del ejercicio E2 generan datos. Ubique estos
datos en la siguiente tabla de clasificacin.
Discreto
Nominal
Ordinal
Intervalo
Razn

~ 29 ~

Continuo

E4

Suponga que estamos investigando sobre el porcentaje de alumnos que


trabajan de una poblacin de 20 alumnos de un curso de la Universidad.

Base de datos de la poblacin


Nmero
1

Nombre
Alumno
Juan

Trabaja?
SI

Nmero
11

Nombre
Alumno
Mara

Trabaja?
NO

Alicia

NO

12

Fernanda

NO

Pedro

NO

13

Julio

SI

Marcos

NO

14

Rosa

NO

Alberto

SI

15

Fabin

NO

Jorge

SI

16

Ana

NO

Jos

NO

17

Laura

NO

Carlos

NO

18

Enrique

NO

Miguel

NO

19

Carmen

SI

10

Victoria

SI

20

Marcelo

SI

Elija una muestra aleatoria simple de tamao n=4 de esta poblacin.


a)
b)
c)
d)
E5

Mediante muestreo aleatorio simple.


Mediante muestreo aleatorio sistemtico.
Mediante muestreo estratificado (hombres y mujeres).
Mediante muestreo estratificado (trabaja y no trabaja).

En cada caso identifique la muestra y la poblacin.


a) Un reportero de El Comercio se para en una esquina y pregunta a
100 adultos si creen que el presidente actual est haciendo un buen
trabajo.
b) Una encuestadora especializada en estudios de mercadotecnia
encuesta a 200 amas de casa seleccionadas al azar y encuentra que el
19% utiliza como lavavajillas Axion a la hora de lavar la vajilla.
c) Una estudiante graduada de la universidad realiz un proyecto de
investigacin acerca de cmo se comunican los adultos ecuatorianos.
Empez por una encuesta que envi por correo a 150 adultos que
ella conoca. Les pidi que le enviaran por correo la respuesta a esta
pregunta: Prefiere usted usar el correo electrnico o el correo
tortuga? Ella recibi a vuelta de correo 20 respuestas y 7 de ellas
indicaron una preferencia por el correo tortuga.
d) Un fabricante afirma con razn en virtud de su experiencia, que la
carga promedio que soportan los cables de acero producidos por su
compaa es de 4006 libras. Un cliente pone en duda dicha
afirmacin y para comprobarlo toma 10 de dichos cables y encuentra
que la carga media soportada por stos es de 4003 libras. Cul es la
muestra?, Cul es la poblacin?

E6

Suponga usted, que una organizacin no gubernamental, quiere hacer una


investigacin sobre el desempleo y el subempleo en la provincia de
~ 30 ~

Imbabura y que para tal efecto ha reflexionado y deliberado ampliamente


sobre los objetivos que se persiguen y sobre la justificacin de dicha
investigacin, encontrando con ello va libre para iniciar la investigacin.
Qu aspectos tomara en cuenta usted antes de emprender la
investigacin?
E7

Redondear cada uno de los siguientes nmeros a la aproximacin indicada.


a)
b)
c)
d)
e)
f)
g)
h)
i)
j)

E8

48,6
136,5
2,484
0,0435
4,50001
143,95
368
24448
5,56500
2345,6751

aproximando a unidades.
aproximando a unidades.
aproximando a centsimas.
aproximando a milsimas.
aproximando a unidades.
aproximando a dcimas.
aproximando a centenas.
aproximando a unidades de millar (mil).
aproximando a centsimas.
aproximando a centsimas.

Hallar el valor de las siguientes expresiones, sabiendo que:


a = 4,

b = 7,

x = 3,

y = 5

a) 2x 3y
b) 8x + 4y + 28
ax+by
c) bxay
d) x 2 3xy 2y 2
e) 2(x + 3y) 4(x 2y)
f)
g)

x2 y2
b2 a2 +1
1 + x 2
bx +ya

h)

+ y 2 + a2 + b 2

+3

i) log + log
j) ln(b) ln(y)
E9

Escribir los sumandos de cada una de las siguientes sumas indicadas y


simplificar si es posible.
a)
b)
c)
d)
e)

E10

6i=1 xi
4i=1(xi 3)2
ni=1 a
9i=3(fi xi )
5i=1(xi a)

Expresar cada una de las siguientes sumas mediante la notacin .


2
a) x12 + x22 + x32 + + x20

~ 31 ~

b)
c)
d)
e)
E11

(x1 + y1 ) + (x2 + y2 ) + (x3 + y3 ) + + (x100 + y100 )


2
f1 x12 + f2 x22 + f3 x32 + + f50 x50
a1 b1 + a2 b2 + a3 b3 + + an bn
(x1 + x2 + x3 + +xn )(y1 + y2 + y3 + +yn )

Dos variables X y Y toman los valores, mencionados en la siguiente lista:


x1 = 2
x2 = 3
x3 = 5
x4 = 7

y1 = 3
y2 = 6
y3 = 4
y4 = 8

Llene la tabla siguiente, y calcule lo que se pide a continuacin.


x

xy

x2

y2

xy 2

(x + y)(x y)

Suma
a)
b)
c)
d)
e)
f)
g)
h)

x
y
xy
x2
y2
( x)( y)
xy 2
[(x + y)(x y)]

E12

Demuestre que: (ax + by cz) = a x + b y c z. Siendo a, b y c


constantes cualesquiera.

E13

El nmero de hermanos de los alumnos de una clase es el siguiente: 0, 1, 0,


0, 3, 2, 1, 4, 0, 0, 1, 1, 2, 0, 1, 1, 2, 0, 1, 1, 2, 1, 3, 0, 0, 2, 1, 2, 3, 5, 2, 4, 3, 6.
Elabore una tabla de frecuencias con datos no agrupados en las que se
incluyan: frecuencia absoluta, absoluta acumulada, relativa y relativa
acumulada.
a) Qu porcentaje de alumnos son hijos nicos?
b) Cuntos alumnos tienen ms de un hermano?

E14

El nmero de goles metidos por partido por un cierto equipo es el siguiente:


0, 1, 0, 2, 3, 2, 1, 3, 0, 0, 1, 0, 3, 0, 1, 1, 0, 0, 1, 1, 2, 1, 2, 0, 1, 2, 1, 5, 3, 5.
Elabore una tabla con las cuatro frecuencias y el porcentaje, para datos no
agrupados.
a) Qu porcentaje de partidos han metido al menos un gol?
b) Cuntos partidos han jugado?
~ 32 ~

E15

En una encuesta sobre vivienda se pregunta, entre otras cosas, cuntas


personas viven en la casa, obtenindose las siguientes respuestas:
4, 4, 8, 1, 3, 2, 1, 3, 4, 2, 2, 7, 0, 3, 8, 0, 1, 5, 6, 4, 2, 3, 1, 5, 2, 6, 4, 8, 9, 2, 4, 2,
5, 3, 3, 4, 5, 6, 8, 6, 2, 5, 3, 3, 5, 4, 6, 2, 0, 4, 3, 6, 1, 3, 5, 4, 6, 3, 4, 5, 4, 7.
a) Elabore una tabla en la que se recojan las cuatro frecuencias, para
datos agrupados.
b) Cuntas viviendas fueron objeto de estudio?
c) En cuntas de ellas no vive nadie?
d) Qu porcentaje de viviendas est ocupado por ms de cinco
personas?
e) Dibuje un diagrama de circular.
f) Dibuje una ojiva.

E16

En un estudio estadstico sobre el nmero de horas que duran 12 pilas de


una determinada marca se obtuvieron los siguientes datos:
10, 12, 12, 11, 12, 10, 13, 11, 13, 11, 13, 9.
a) Agrupar los datos en una tabla de frecuencias y porcentajes.
b) Representar los datos en un diagrama de barras y en un diagrama de
circular.

E17

La siguiente tabla refleja las calificaciones de 30 alumnos en un examen de


Matemticas:
Nota
Nmero de alumnos

2
2

4
5

5
8

6
7

7
2

8
3

9
2

10
1

a) Cuntos alumnos aprobaron, si la nota mnima para aprobar es al


menos 7?
b) Cuntos alumnos sacaron como mximo un 7?
c) Cuntos sacaron como mnimo un 6?
E18

Los pesos, en kg, de los 65 empleados de una fbrica vienen dados por la
siguiente tabla:
Peso
f

[50,60)
8

[60,70)
10

[70,80)
16

[80,90)
14

[90,100)
10

[100,110)
5

[110,120)
2

Representar el histograma y el polgono de frecuencias.


E19

A partir de la siguiente grfica de barras sobre los gustos deportivos:

~ 33 ~

Nmero de personas

6
5
4
3
2
1
0
atletismo

ciclismo

baloncesto

natacin

Deporte favorito

a) Calcular la tabla de frecuencias.


b) A qu porcentaje de las personas no le gusta el ciclismo?
c) Convierta a diagrama circular.
En una encuesta a 35 personas se les preguntaba sobre sus preferencias a la
hora de ver pelculas. Los resultados se recogieron en la siguiente grfica:

Nmero de personas

E20

16
12
8
5

AVENTURAS

AMOR

MISTERIO

CIENCIAFICCIN

HUMOR

Tipo de pelcula

a) Cmo se llama la grfica?


b) Construya la tabla de frecuencias.
c) A qu porcentaje de las personas encuestadas les gustan las pelculas
de amor?
d) Y las de ciencia-ficcin?
E21

Consulte lo que es un pictograma, e inserte uno cualquiera de su agrado.

E22

Se ha lanzado un dado 20 veces y se han obtenido los siguientes resultados:


3, 4, 5, 2, 1, 4, 6, 1, 3, 2, 5, 5, 3, 2, 4, 4, 1, 2, 5, 6.
a) Construir la tabla de frecuencias.
b) Representar los datos con un diagrama de barras y un diagrama de
puntos.

~ 34 ~

E23

Realizar una pirmide de poblacin (no sabe qu es?, consulte:


http://www.youtube.com/watch?v=QZdEPAeVqTw), con las edades de los
hermanos de los compaeros de clase (incluido el alumno). Calcular
porcentajes por edades y gneros. Hacer la grfica respectiva.

E24

Un conjunto de datos consiste en 83 observaciones. Cuntas clases


recomendara para una distribucin de frecuencias?

E25

Un conjunto de datos consta de 145 observaciones que van desde 56 hasta


490. Qu tamao de intervalo de clase recomendara?

E26

A continuacin, en la tabla, se presenta el nmero de minutos para viajar


desde el hogar al trabajo, en una ciudad grande, para un grupo de ejecutivos
con automvil.
28
31

a)
b)
c)
d)
E27

25
26

48
21

37
32

41
25

19
31

32
43

26
35

16
42

23
38

23
33

29
28

36

Cuntas clases recomendara?


Qu intervalo de clase es de sugerir?
Qu recomendara como lmite inferior de la primera clase?
Organice los datos en una distribucin de frecuencias.

El administrador local del centro comercial Santa Mara est interesado en


conocer el nmero de veces que un cliente realiza compras en su almacn
durante un periodo de un mes. Las respuestas de 80 clientes fueron como se
describen en la tabla:
5
1
8
1
4
6

3
14
4
10
4
7

3
1
7
8
3
8

1
2
6
9
3
7

4
4
5
2
2
6

4 5
4 4
9 11
12 1
4 1

6
5
3
2
1

4
6
12
3
1

2
3
4
4
1

6
5
7
3
2

6
3
6
2
3

6
4
5
5
4

7
5
15
4
4

1
6
1
3
5

a) Comenzando con el 0 como el lmite inferior de la primera clase y


utilizando un intervalo de clase igual a 3, organice los datos en una
distribucin de frecuencias.
b) Convierta la distribucin en una distribucin de frecuencias
relativas.
c) Construya un histograma de frecuencias.
d) Construya un polgono de frecuencias.
e) Construya una ojiva.
E28

La figura siguiente, es un histograma que muestra las calificaciones de un


primer examen de estadstica de un curso.
a) Cuntos estudiantes hicieron el examen?
b) Cul es el intervalo de clase?
~ 35 ~

c) Cul es el punto medio de clase para la primera de ellas?


d) Cuntos estudiantes obtuvieron una calificacin menor que 70?
25
21

Frecuencia

20
14

15

12

10
6
5

0
55

E29

85

95

En la tabla siguiente, se muestra una distribucin de frecuencias de salarios


anuales.
Salario anual
2400-2600
2600-2800
2800-3000
3000-3200
3200-3400
3400-3600
a)
b)
c)
d)
e)
f)
g)
h)
i)

E30

65
75
Calificaciones

Nmero de obreros
7
20
33
25
11
4

Cuntos obreros participaron?


Cul es el intervalo de clase?
Cul es el punto medio de la primera clase?
Cul es el punto medio de la quinta clase?
Cuntos obreros ganan menos de $2800 al ao?
Cuntos obreros ganan ms de $3000 al ao?
Cuntos obreros ganan entre $2600 y $2999 al ao?
Construya un histograma de frecuencias.
Construya una ojiva.

La figura siguiente, resume el precio de venta de las casas que se vendieron


el mes pasado en el rea de Colinas Verdes, en una ciudad.
a)
b)
c)
d)

Cmo se llama la grfica?


Cuntas casas se vendieron en el mes pasado?
Cul es el intervalo de clase?
Ciento setenta y cinco de estas casas se vendieron en menos de qu
cantidad?

~ 36 ~

250
225

Frecuencia

200

125

50
0
5

E31

a)
b)
c)
d)
e)

30

35

84
79
65
78
78
62
80
67

75
88
75
82
89
67
73
73

82
73
87
75
61
97
57
81

68
60
74
94
75
78
88
72

90
93
62
77
95
85
78
63

62
71
95
69
60
76
62
76

88
59
78
74
79
65
76
75

76
85
63
68
83
71
53
85

93
75
72
60
71
75
74
77

Elabore una representacin de tallo y hojas.


Las puntuaciones de los cinco estudiantes de mayor puntuacin.
Las puntuaciones de los cinco estudiantes de menor puntuacin.
La puntuacin del dcimo estudiante de mayor puntuacin.
Cuntos estudiantes obtuvieron puntuacin de 75 o mayor?

En la siguiente tabla, se indican las notas del examen final de Bases de


Datos, de 30 estudiantes. Elabore una grfica de puntos.
8,5
7,2
9,2

E33

10
15
20
25
Precio de venta (miles de dlares)

La puntuacin final de matemticas de 80 estudiantes en una prestigiosa


universidad se registra a continuacin, en la tabla:
68
73
61
66
96
79
65
86

E32

12,5

3,9
9,2
9,4

7,6
7,0
6,0

6,5
4,0
8,5

9,2
10,0
8,0

8,5
7,6
8,0

6,5
9,4
7,6

9,4
6,5
5,0

7,2
4,0
7,6

6,5
7,6
8,5

Se toman 10 mediciones del dimetro interno de los tornillos para los


pistones del motor de un automvil. Los datos (en mm) son:
{74,001; 74,003; 74,015; 74,000; 74,002; 74,005; 74,001; 74,001; 74,002; 74,004}

Realice una grfica de puntos.


E34

La siguiente tabla representa el porcentaje de algodn en un material


utilizado para la fabricacin de camisas para caballeros.
~ 37 ~

Datos del porcentaje de algodn


33,1

35,3

34,2

33,6

33,6

33,1

37,6

33,6

34,5

34,7

33,4

32,5

35,4

34,6

37,3

34,1

35,6

35,0

34,7

34,1

34,6

35,9

34,6

34,7

36,3

35,4

34,6

35,1

33,8

34,7

35,5

35,7

35,1

36,2

35,2

36,8

37,1

33,6

32,8

36,8

34,7

36,8

35,0

37,9

34,0

32,9

32,1

34,3

33,6

35,1

34,9

36,4

34,1

33,5

34,5

32,7

32,6

33,6

33,8

34,2

34,6

34,7

35,8

37,8

Elabore una grfica de tallo y hojas para los anteriores datos.


E35

El nmero de estrellas de los hoteles de una ciudad viene dado por el


siguiente conjunto, donde cada elemento representa a un hotel:
{3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1}

Bosqueje una grfica de puntos.


E36

La figura siguiente, es una representacin de tallo y hojas muestra el


nmero de unidades producidas por da en una fbrica.
3
4
5
6
7
8
9
10

a)
b)
c)
d)
e)
f)
g)
h)
i)
E37

8
6
0
0
5
0
3

1
2
9
0
6

3
3

3
6

5
7

9
8

Cuntos das se estudiaron?


Cuntas observaciones hay en la primera clase?
Cules son el valor ms pequeo y el valor ms grande?
Indique los valores reales en el cuarto rengln.
Indique los valores reales en el segundo rengln.
Cuntos valores son inferiores a 70?
Cuntos valores son iguales o superiores a 80?
Cul es el valor intermedio?
Cuntos valores hay entre 60 y 89 inclusive?

Resuelva las ecuaciones siguientes.


a)

5
7

6y

3y

11y

(x 3) 3 (x 4) + 4 (x 5) = 0
2

b) 2y 2 11

22y2
3

44

~ 38 ~

E38

Resuelva los siguientes sistemas de ecuaciones.


x

a) {

b) {
E39

+3+4 =5+6+7

2x + 3y + 4 = 5x + 6y + 7

ax + by = e
cx + dy = f

Resuelva las desigualdades siguientes.


a)

5x1
3

2x
5

x1
2

+4

b) 2y 3 + 2 (y 12) < 8
E40

Evale las integrales definidas:


a) 02 x2 dx
b) 01(x3 x2 + 5x + 1)dx

~ 39 ~