Anda di halaman 1dari 7

CONGREGACIÓN DE LOS HERMANOS DE LAS ESCUELAS CRISTIANAS

DISTRITO DE MEDELLÍN
INSTITUTO LA SALLE
LA EXIGENCIA DA EXCELENCIA
Código Fecha
Material de Estudio No. 1
07 ­ 04 ­ 11

Docente: Angélica María López          Asignatura: Estadística       Curso: 9°03 


– 9°04

Caracterización de Variables Cuantitativas
Para caracterizar variables cuantitativas se consideran dos casos teniendo en cuenta
la forma en que están presentados los datos: datos agrupados y datos no agrupados.

 Datos agrupados: Se caracterizan a partir de la construcción de un diagrama de
tallo   y   hojas,   una   tabla   de   frecuencias,   los   histogramas   y   polígonos
correspondientes.

 Datos   no   agrupados:  Se   caracterizan   a   partir   de   las   medidas   de   tendencia


central, las medidas de posición, las medidas de dispersión y el diagrama de caja y
bigotes.

Caracterización de datos agrupados

Tabla de frecuencias
Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada
característica   en   que   se   han   dividido   los   datos.     La   construcción   de   una   tabla   de
frecuencias para datos cuantitativos presenta como su punto de mayor importancia la
determinación   del   número   de   intervalos   (clases)   que   la   conformaran.   Este   número
depende de la cantidad y de la naturaleza de los datos a resumir y del propósito que se
busca con el resumen. A continuación se presentan ciertas pautas para la construcción
de una tabla de frecuencias.

1. El número de intervalos debe escogerse de acuerdo con el número de datos.
Para ello se emplea la siguiente aproximación:

Donde n corresponde al número de datos que se van a agrupar.
2. Una vez escogido el número de intervalos, se determina la longitud  o tamaño
que deben tener los intervalos, de tal manera que todos los intervalos tengan el
mismo tamaño. Para ello se utiliza el siguiente criterio:

3. Construcción  de  la  tabla:   Se  construye  el   primer   intervalo  a  partir   del   dato
menor, así:

En   el   primer   intervalo   siempre   debe   estar   contenido   el   dato   menor   y   en   el


último el dato mayor.

Al elaborar la tabla de frecuencias se debe incluir:

 f la cual es la frecuencia del intervalo y corresponde al número de datos que están
en ese rango.

 fr  es la frecuencia relativa o proporción y corresponde a la frecuencia comparada
con el total.

 F es la frecuencia acumulada y corresponde a la sumatoria de las frecuencias de los
intervalos anteriores incluyendo su frecuencia.

 Fr  es la frecuencia acumulada relativa y corresponde a la frecuencia acumulada
comparada con el total.

 Mi es la marca de clase y corresponde al punto medio de cada uno de los intervalos.
Se calcula mediante la siguiente expresión:

Ejemplo:  Elaboraremos la tabla de frecuencias para los datos que se encuentran en
siguiente tabla.

Tabla 1

33.1 35.3 34.2 33.6 33.6 33.1 37.6 33.6


34.5 34.7 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.0 34.7 34.1 34.6 35.9 34.6 34.7
36.3 35.4 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.2 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.8 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.1 34.9 36.4 34.1 33.5 34.5 32.7
32.6 33.6 33.8 34.2 34.6 34.7 35.8 37.8

Desarrollo:

1. El número de intervalos a utilizar es 8. Puesto que:

2. Tamaño del intervalo:

3. Construcción de la tabla:

Intervalo f fr F Fr Mi
32.1 – 32.8 5 0,08 5 0,08 32.45
32.9 – 33.6 11 0,17 16 0,25 33.25
33.7 – 34.4 9 0,14 25 0,39 34.05
34.5 – 35.2 20 0,31 45 0,70 34.85
35.3 – 36.0 8 0,13 53 0,83 35.65
36.1 – 36.8 6 0,09 59 0,92 36.45
36.9 – 37.6 3 0,05 62 0,97 37.25
37.7 – 38.4 2 0,03 64 1,00 38.05
Total 64 1,00

Algunas conclusiones a partir de la tabla son:

El 8% de las camisas fue fabricado con un material que contenía entre el 32.1% y el
32.8% de algodón y un porcentaje igual fue fabricado con un material que contenía
entre el 36.9% y el 38.4% de algodón.

El 84% de las camisas fue fabricado con un material que contenía entre el 32.9% y el
36.8% de algodón.
Diagramas para datos cuantitativos agrupados

Diagrama de tallo y hojas
Un diagrama de tallo y hojas es una representación gráfica en la cual, los datos se
clasifican de acuerdo con la expresión decimal de cada uno de ellos. Este diagrama es
usado   cuando   hay   una   cantidad   no   muy   pequeña   de   datos   y   dan   una   idea   de   la
localización de los datos y de la forma de la distribución.

Para construir un diagrama de este estilo se debe dividir cada dato en tallo y hoja. El
tallo corresponde a la primera, o primeras cifras del dato, y en la mayoría de los casos
la hoja corresponde a la última cifra del dato.

Ejemplo:

La siguiente tabla representa el porcentaje de algodón en un material utilizado para la
fabricación de camisas para caballeros.

Tabla 1. Datos del porcentaje de algodón

33.1 35.3 34.2 33.6 33.6 33.1 37.6 33.6


34.5 34.7 33.4 32.5 35.4 34.6 37.3 34.1
35.6 35.0 34.7 34.1 34.6 35.9 34.6 34.7
36.3 35.4 34.6 35.1 33.8 34.7 35.5 35.7
35.1 36.2 35.2 36.8 37.1 33.6 32.8 36.8
34.7 36.8 35.0 37.9 34.0 32.9 32.1 34.3
33.6 35.1 34.9 36.4 34.1 33.5 34.5 32.7
32.6 33.6 33.8 34.2 34.6 34.7 35.8 37.8

El diagrama de tallos y hojas para los anteriores datos aparece a continuación.

Diagrama de tallo y hojas para porcentaje de algodón. n = 64. Unidad de la hoja = 0.10
(el número 1 después del punto significa que se usa una sola cifra decimal).

Tallo Hojas
32 156789
33 114566666688
34 011122355666667777779
35 00111234456789
36 234888
37 13689
Del diagrama se puede concluir que:

En 6 camisas se usó un porcentaje de algodón entre el 32.0 y 33.0; 12 camisas fueron
elaboradas   con   un   porcentaje   de   algodón   entre   el   33.0   y   33.9;   21   camisas   fueron
elaboradas con un porcentaje de algodón entre el 33.9 y el 35.0; 14 camisas fueron
elaboradas   con   un   porcentaje  de  algodón   entre   el   34.9  y  el   36.0;   6  camisas   fueron
elaboradas con un porcentaje de algodón entre el 36.0 y el 37.0 y 5 camisas fueron
elaboradas con un porcentaje de algodón entre el 37.0 y el 38.0. Luego la mayoría de
las camisas tienen un porcentaje de algodón entre el 33.9 y el 35.0.

Histogramas 
Un histograma es una representación gráfica de una variable en forma de barras. Se
utilizan para variables continuas o para variables discretas, con un gran número de
datos, y que se han agrupado en clases. 

En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del
intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada
barra es proporcional a la frecuencia de los valores representados.

Así el histograma correspondiente a los datos de la tabla 1 seria:
Polígono de Frecuencias
A   partir   del   diagrama   de   clases   (M i)   es   posible   construir   el   diagrama   de   líneas   o
polígono de frecuencias; en el eje horizontal se ubican las marcas de clase y en el eje
vertical las frecuencias. 

Las marcas de clase coinciden con el punto medio de cada rectángulo de un histograma
y se unen mediante segmentos para formar el polígono de frecuencias.
El polígono de frecuencias acumuladas se llama  ojiva. Para el caso de la tabla 1 la
ojiva se muestra a continuación.

Anda mungkin juga menyukai