Anda di halaman 1dari 8

Medidas de dispersión o variabilidad

Las medidas de dispersión nos informan sobre cuánto se alejan del centro los
valores de la distribución.

Las medidas de dispersión, también llamadas medidas de variabilidad,


muestran la variabilidad de una distribución, indicando por medio de un número
si las diferentes puntuaciones de una variable están muy alejadas de la media.
Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea,
más homogénea será a la media. Así se sabe si todos los casos son parecidos
o varían mucho entre ellos.

Dispersión: La dispersión se refiere a la separación de los datos en una


distribución, es decir, al grado en que las observaciones se separan. Note que
la curva A de la figura 3-2 tiene una mayor separación o dispersión que la curva
B.

Existen otras dos características de los conjuntos de datos que proporcionan


información útil: el sesgo y la curtosis. Aunque la derivación de la estadística
específica para medir dichas características está más allá de los objetivos de
este texto, nos será útil tener un conocimiento general de su significado.

Sesgo: Las curvas que representan los datos puntuales de un conjunto de


datos pueden ser simétricas o sesgadas.

Curtosis: Cuando medimos la curtosis de una distribución, estamos midiendo


qué tan puntiaguda es. En la figura 3-5, por ejemplo, las curvas A y B difieren
entre sí sólo en que una tiene un pico más pronunciado que la otra. Tienen la
misma posición central y la misma dispersión, y ambas son simétricas. Los
estadísticos dicen que tienen un grado diferente de curtosis.

Utilidad de estas medidas

Son de gran utilidad ya que permiten comparar distribuciones, dos conjuntos de


datos pueden tener la misma media y ser distintos.

Por ejemplo: alguien puede tener una media de 5 con los siguientes datos (
5,4,6,5,5) y otro pueden tener una media de 5 con los datos (10,0,9,5,1).

Por tanto para conseguir una visión completa de los datos hay que
complementar las medidas de tendencias central (mediana, media) con otra
que nos hablen de cuanto se parecen se parece o no los datos entre sí. Esto es
las medidas de variabilidad o dispersión.

Importancia de estas medidas:

1. Nos proporciona información adicional que nos permite juzgar la


confiabilidad de nuestra medida de tendencia central.
2. Ya que existen problemas característicos para datos muy dispersos,
debemos ser capaces de reconocer esa dispersión amplia para poder
abordar esos problemas.
3. Quizá se desee comparar las dispersiones de diferentes muestras. Si no
se desea tener una amplia dispersión de valores con respecto del centro
de distribución, o esto presenta riesgos inaceptables, necesitamos poder
reconocerla y evitar elegir distribuciones que tengan las dispersiones
más grandes.

Medidas de dispersión absolutas:

Miden cuánto se dispersan (en términos globales) los valores de la variable


respecto de alguna medida de tendencia central.

Rango
El rango es la diferencia entre el más alto y el más pequeño de los valores
observados. En forma de ecuación, podemos decir:

Rango interfractil:

El rango interfractil es una medida de la dispersión entre dos fractiles de una


distribución de frecuencias, es decir, la diferencia entre los valores de los dos
fractiles.

Los fractiles tienen nombres especiales, dependiendo del número de partes


iguales en que dividen a los datos. Los fractiles que los dividen en 10 partes
iguales se llaman deciles. Los cuartiles dividen los datos en cuatro partes
iguales. Los percentiles dividen al conjunto de datos en 100 partes iguales.

Ejemplo:

Suponga que deseamos encontrar el rango interfractil entre el primero y


segundo tercios de los donativos recibidos por Cumberland de la organización
Blue Cross-Blue Shield. Empezamos por dividir las observaciones en tercios,
como en la tabla 3-17. Cada tercio contiene cuatro observaciones (.33% del
total de 12 elementos). Entonces, 33.33% de los elementos está en $1,
041,000 o debajo de este valor, y 66.66% es menor o igual que $1, 624,000.
Ahora podemos calcular el rango interfractil entre los fractiles .33 y .66 restando
$1, 0141,000 del valor $1, 624,000. Esta diferencia de $583,000 es la
dispersión entre el valor más alto del primer tercio de los pagos y el valor más
alto del segundo tercio.

Rango intercuartil

El rango intercuartil mide aproximadamente qué tan lejos de la mediana


debemos ir en cualquiera de las dos direcciones antes de recorrer una mitad de
los valores del conjunto de datos. Para calcular este rango, dividimos nuestros
datos en cuatro partes, cada una de las cuales contiene 25% de los elementos
de la distribución. Los cuartiles son, entonces, los valores más altos de cada
una de estas cuatro partes, y el rango intercuartil es la diferencia entre los
valores del primero y tercer cuartiles:

Medidas de desviación promedio

Las descripciones más completas de la dispersión son aquellas que manejan la


desviación promedio respecto a alguna medida de tendencia central. Dos de
estas medidas son importantes para nuestro estudio de la estadística: la
varianza y la desviación estándar. Ambas medidas nos dan una distancia
promedio de cualquier observación del conjunto de datos respecto a la media
de la distribución.

Varianza de población:

Cada población tiene una varianza, su símbolo es (sigma cuadrada). Para


calcular la varianza de una población, la suma de los cuadrados de las
distancias entre la media y cada elemento de la población se divide entre el
número total de observaciones en población. Al elevar al cuadrado cada
distancia, logramos que todos los números sean positivos y, al mismo tiempo,
asignamos más peso a las desviaciones más grandes (desviación es la
distancia entre la media y un valor).

La fórmula para calcular la varianza es:


Desviación estándar de la población

La desviación estándar de la población, es simplemente la raíz cuadrada de la


varianza de la población. Como la varianza es el promedio de los cuadrados de
las distancias de las observaciones a la media, la desviación estándar es la raíz
cuadrada del promedio de los cuadrados de las distancias entre las
observaciones y la media. Mientras que la varianza se expresa con el cuadrado
de las unidades utilizadas para medir los datos, la desviación estándar está en
las mismas unidades que las que se usaron para medir los datos. La fórmula
para la desviación estándar es:

Ejemplo de cálculo de la varianza y la desviación estándar

Hallar la varianza y la desviación estándar de la series de números siguientes:


2, 3, 6, 8, 11.
Cálculo de la varianza y la desviación estándar utilizando datos
agrupados

Desviación estándar de una muestra:

Para calcular la varianza y la desviación estándar de una muestra, utilizamos


las mismas fórmulas de la población, sustituyendo con y N con n-1. Las
fórmulas tienen el siguiente aspecto:

Para datos agrupados son la misma formulas de la población,


sustituyendo con y N con n-1. Las formulas serian:

Varianza de una muestra:


Desviación de una muestra:

Ejemplo:

Medidas de dispersión relativa:

Son indicadores de la dispersión de la distribución que se han relativizado, para


que no afecten las unidades de medida de la variable y para que puedan
hacerse comparaciones entre las dispersiones de conjuntos de datos dispares.

El coeficiente de variación

El coeficiente de variación es una de estas medidas relativas de dispersión.


Relaciona la desviación estándar y la media, expresando la desviación
estándar como porcentaje de la media. La unidad de medida, entonces, es
“porcentaje”, en lugar de las unidades de los datos originales. Para una
población, la fórmula para el coeficiente de variación es:
Para utilizar esta fórmula en un ejemplo, podemos suponer que cada día
el técnico A del laboratorio realiza un promedio de 40 análisis con una
desviación estándar de 5. El técnico B efectúa un promedio de 160 análisis
diarios con una desviación estándar de 15. ¿Cuál de los dos técnicos muestra
menos variabilidad?

A primera vista, parece que el técnico B tiene una variación en su


producción tres veces mayor que el técnico A. Pero B realiza sus análisis con
una rapidez cuatro veces mayor que A. Tomando en cuenta toda esta
información, podemos calcular el coeficiente de variación para ambos técnicos:

Así, tenemos que el técnico B, quien tiene una variación absoluta mayor que la
del técnico A, tiene una variación relativa menor que la de A, debido a que la
media de producción de B es mucho mayor que la de A.

Anda mungkin juga menyukai