Anda di halaman 1dari 8

DISTRIBUCIONES DE FRECUENCIAS

La distribución de frecuencia es una disposición tabular de datos estadísticos, ordenados


ascendente o descendentemente, de acuerdo a la frecuencia de cada dato. Las
frecuencias pueden ser:

FRECUENCIA ABSOLUTA (fi):

Es el número de veces que se repite un determinado valor de la variable (xi). Se designa


por fi.

PROPIEDAD: la suma de todas las frecuencias absolutas es igual al total de


observaciones (n).

FRECUENCIA ACUMULADA (Fi):

Las frecuencias acumuladas de una distribución de frecuencias son aquellas que se


obtienen de las sumas sucesivas de las fi que integran cada una de las filas de una
distribución de frecuencia, esto se logra cuando la acumulación de las frecuencias se
realiza tomando en cuenta la primera fila hasta alcanzar la ultima. Las frecuencias
acumuladas se designan con las letras Fi. Se calcula:
i
Fi =å f j = Fi-1 + f i j
=1

PROPIEDAD: La última frecuencia acumulada absoluta es igual al total de observaciones.

FRECUENCIA RELATIVA (hi):

Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el número total
de datos. Las frecuencias relativas se designan con las letras hi.
f
Se calcula, hi = i
n

PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.


.
FRECUENCIA RELATIVA ACUMULADA (Hi):

Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre
F
número total de datos. Se designa con las letras Hi . Se calcula; H = i
i
n

PROPIEDAD: La última frecuencia relativa acumulada es la unidad.


DISTRIBUCION DE FRECUENCIAS ABSOLUTAS

Es la representación estructurada en forma de tabla de toda la información que se ha


recogido sobre la variable que se estudia, es decir, es una tabla que presenta de manera
ordenada los distintos valores de una variable y sus correspondientes frecuencias. Su
forma mas común es la siguiente:

Variable (xi) fi Fi hi Hi
x1 f1 F1 h1= f1/n h1
x2 f2 f1+f2 h2= f2/n h1+h2
... ... ... ... ...
xn fn f1+f2+ … + fn hn= fn/n h1+h2+ … + hn
Sfi=n Shi=1

Ejemplo 1:

El gobierno desea averiguar si el número medio de hijos por familia ha


descendido respecto de la década anterior. Para ello ha encuestado a 50 familias
respecto al número de hijos, y ha obtenido los siguientes datos:

0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
Se pide:
a. Construir la tabla de frecuencias absolutas
b. ¿Cuál es el número de familias que tiene como máximo dos hijos?
c. ¿Cuántas familias tienen más de 1 hijo pero como máximo 3?
d. ¿Qué porcentaje de familias tiene más de 3 hijos?

Solución:

a. Para construir la tabla de frecuencias hay que tener en cuenta que la variable en
estudio es el número de hijos (discreta), que toma los valores existentes entre 0 y 6 hijos
y las frecuencias son el conjunto de familias, de esta forma tenemos:
xi fi Fi hi Hi
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.3 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.02 1
n=50

b. En la columna de las fi: 2+4+21=27 ó en la columna de las Fi: F2= 27


c. En la columna de las fi: 21+15=36 ó en la columna de las Fi: 42-6=36
d. En la columna de las hj: 0.12+0.02+0.02=0.16, que supone un 16% ó en la
columna de las Hi: 1-0.84=0.16, 16%
DISTRIBUCIONES DE FRECUENCIAS AGRUPADAS

Es aquella distribución en la que la disposición tabular de los datos estadísticos se


encuentran ordenados en clases y con la frecuencia en cada clase; es decir, los datos
originales de varios valores adyacentes del conjunto se combinan para formar un
intervalo de clase. No existen normas establecidas para determinar cuándo es apropiado
utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el
número total de datos (N) es igual o superior 50 y además el rango o recorrido de la
serie de datos es mayor de 20, entonces, se utilizará la distribución de frecuencia para
datos agrupados, también se utilizará este tipo de distribución cuando se requiera
elaborar gráficos lineales como el histograma, el polígono de frecuencia o la ojiva.

La razón fundamental para utilizar la distribución de frecuencia de clases es


proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar
la manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar,
resumir, condensar o hacer que la información obtenida de una investigación sea
manejable con mayor facilidad.

Al agrupar los datos en una distribución de frecuencia de clase se pierde parte de la


información. La reducción o agrupamiento a que son sometidos los datos de una serie de
valores cuando existen muchos valores diferentes, originan los denominados errores de
agrupamiento; sin embargo, estos errores son en general muy pequeños, razón por la
cual la distribución de frecuencia de clase tiene una validez estadística práctica.

Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas
generales:
• El numero de intervalos de clase se toma entre 5 y 15 dependiendo de los datos.
• Cada observación debe estar incluida en una y solo una clase o intervalo.
• El valor mas pequeño y mas grande deben entrar en la clasificación.
• No deben existir brechas o vacíos entre clases sucesivas.
• Los intervalos no se deben sobreponer.
• En la medida de lo posible, se debe utilizar la misma amplitud para todos los
intervalos.

COMPONENTES DE UNA DISTRIBUCIÓN DE FRECUENCIAS DE CLASES

1.- Clase o Intervalo de clase.- Son divisiones o categorías en las cuales se agrupan un
conjunto de datos ordenados con características comunes. Para organizar los valores de
la serie de datos hay que determinar un número de clases que sea conveniente. En otras
palabras, que ese número de intervalos no origine un número pequeño de clases ni muy
grande. Un número de clases pequeño puede ocultar la naturaleza natural de los datos y
un número muy alto puede provocar demasiados detalles como para observar alguna
información de gran utilidad en la investigación. A las fronteras del intervalo, la
llamaremos, límites inferior y superior de la clase y los denotaremos por Li-1, Li.
2.- Punto medio o Marca de clase ( X& ).- Es la semisuma del límite inferior y
· L +L
superior de una clase, tal como lo indica la siguiente formula: X i = i i-1 .
2

3.- Amplitud , Longitud o Tamaño del Intervalo.- Los intervalos de clases pueden ser
de tres tipos: Clases de igual tamaño, clases de tamaños desiguales y clases abiertas. En
términos generales, las clases de igual tamaño son los mas utilizados y recomendados
para los cálculos estadísticos. Se designa por las letras Ic.

Nota: Al número de observaciones de una clase se le llama frecuencia de clase, si


dividimos esta frecuencia por el número total de observaciones, se llama frecuencia
relativa de clase, y del mismo modo que lo hacíamos para datos sin agrupar
definiríamos Hi, y Fi.

PROCEDIMIENTO PARA CONSTRUIR UNA DISTRIBUCIÓN DE


FRECUENCIAS AGRUPADA EN INTERVALOS

1. Determinar el máximo y mínimo entre los valores que tenemos en la muestra y


calcular el recorrido de la variable o rango, es decir, R=Xmax-Xmin

2. Calcular el número de clases a utilizar. Existen diversos criterios para determinar


el numero de clases, ante tanta diversidad de criterios, se ha considerado que lo
mas importante es dar un ancho o longitud de clases a todos los intervalos de tal
manera que respondan a la naturaleza de los datos y al objetivo que se persigue y
esto se logra con la practica. Existe una forma para determinar el numero de
clases y la misma puede ilustrarse en el siguiente cuadro:

Numero de Datos Numero de Intervalos


10 - 100 De 4 a 8
100 - 1.000 De 8 a 11
1.000 - 10.000 De 11 a 14

Cuando se tenga dudas en determinar el numero de intervalos de clases, es de gran


utilidad utilizar el método sugerido por Hebert A. Sturges, el cual establece que: K=
1+3,322 log(n) = numero de intervalos. En este curso se utilizará este método siempre y
cuando el mismo sea aplicable.

3. Determinamos la amplitud o tamaño de los intervalos través de la


R
siguiente formula: Ic = = ancho o tamaño del intervalo.
N ºde int ervalos
Ejemplo 2

Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio
de sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la
misma categoría de esta ciudad. Los datos obtenidos (en miles de pesetas) fueron:

3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1

Procedimiento:

1.- El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8. 2.- K=
1+3,322 log(40) = 6.3 ≈ 6 números de intervalos
3.- Ic = 2.8 / 6 = 0.467 ≈ 0.5 tamaño de los intervalos Así

pues la tabla sería:

CLASES fi Fi Ci hi Hi
[3.3, 3.8) 3 3 3.5 0.075 0.075
[3.8, 4.3) 8 11 4 0.2 0.275
[4.3, 4.8) 14 25 4.5 0.35 0.625
[4.8, 5.3) 6 31 5 0.15 0.775
[5.3, 5.8) 4 35 5.5 0.1 0.875
[5.8, 6.3) 5 40 6 0.125 1

¿Cuantos hoteles tienen un precio entre 3.3 y 3.8? 3


¿Cuantos hoteles tienen un precio superior a 4.8? 15
¿Que porcentaje de hoteles cuestan como mucho 4.3? 27.5 %
MÉTODOS GRÁFICOS

La forma de la distribución de frecuencias se percibe más rápidamente si la


representamos gráficamente. Se resume la información de la muestra de forma grafica
con fines clarificadores o para enfatizar y descubrir determinadas características que de
otra manera seria muy difícil de apreciar. Un grafico siempre es mas inmediato de
comprender que un conjunto de datos estadísticos. Las representaciones graficas varían
según el tipo de variable:

a. Gráficos para variables Discretas y Categóricas

DIAGRAMA DE BARRAS: Es la representación gráfica usual para variables


cuantitativas discretas o para variables cualitativas. En el eje de ordenadas
representamos los diferentes valores de la variable (xi). Sobre cada valor levantamos
una barra de altura igual a la frecuencia (absoluta o relativa). Ejemplo:
180
160
140
120
100
80
60
40
20
0

1er 2do 3er 4to


trim. trim. trim. trim.

DIAGRAMA DE SECTORES O DE PASTEL: Es el más usual en variables


cualitativas. Se representan mediante círculos. A cada valor de la variable se le asocia el
sector circular proporcional a su frecuencia.

Ejemplo: Los siguientes datos corresponden a una encuesta referente a elecciones


locales de un partido político:

xi fi
a favor 50%
en contra 40%
abstención 10%

Para construir el diagrama de sectores partimos del hecho de que un circulo encierra un
total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados
en distintos sectores, de acuerdo con cada porcentaje; tenemos así que para determinar
el sector correspondiente al 50%, resolvemos la ecuación:
50 * 360
X= = 180
100
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuación,
con ayuda de un transportador, señalaremos el sector circular de medida 180 grados.
Igualmente, para el 40% se tiene 144 grados y para el 10% se tiene 36 grados. La
siguiente figura muestra la representación grafica.

abstencion

b. Gráficos para variables continuas

HISTOGRAMA: Es la representación gráfica de las frecuencias agrupadas de una


variable continua sobre intervalos. A diferencia de los diagramas de barras, los
histogramas dibujan rectángulos unidos entre si, lo que significa que existe continuidad
en la variable cuyos valores se representan en el eje horizontal que se haya dividido en
intervalos de igual amplitud. Las áreas de los rectángulos son proporcionales a las
frecuencias que representan.

Ejemplo:

Histograma correspondiente a las horas extras laboradas


por un grupo de obreros petroleros.

25
21
20
16 16
Frecuencias

15
15
11
10
8
6
5 4
3

0
15 20 25 30 35 40 45 50 55 60 65
Clases
El histograma o diagrama de barras proporcionan mucha información respecto a
la estructura de los datos, nos permite evidenciar fundamentalmente tres
características:

1. Forma de la distribución.
2. Acumulación o tendencia posicional (valor central de la distribución).
3. Dispersión o variabilidad.

Cuando nos encontramos en distribuciones donde los intervalos no tienen la


misma amplitud, las barras del histograma tienen que tener un área proporcional a
la frecuencia que queramos representar

Anda mungkin juga menyukai