Anda di halaman 1dari 6

MEDIDAS DE DISPERSIN

La informacin que arrojan las medidas de tendencia central no siempre


proporciona conclusiones contundentes frente al conjunto de datos. El conjunto de
datos, adems de tener una tendencia de agruparse hacia el centro, en ocasiones
suelen estar bastante alejados de esa tendencia central. Medir esa variacin
respecto a los promedios es un clculo importante en el tratamiento estadstico de
datos, medidas a las que se les denomina de dispersin o de variacin.
Entre las medidas de dispersin ms comunes estn:

Rango o recorrido
Varianza
Desviacin tpica o estndar
Coeficiente de variacin
Desviacin media
Puntaje tpico o estandarizado
VARIANZA
Es una de las medidas ms usadas en estadstica, ella a su vez da origen a otra
mucho ms significativa: la desviacin tpica o estndar. Se define como la media
aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica.
La varianza indica la desviacin de los datos respecto a la media. Para comparar
dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utilizar sus
varianzas de manera que el resultado indique cul de ellas es ms homognea o
cul es ms heterognea.

DESVIACIN TPICA O ESTNDAR
Esta medida se obtiene extrayendo la raz cuadrada de la varianza, tomando
siempre el valor positivo. Se simboliza por s en la muestra . Esta es la medida de
dispersin ms conocida y ms utilizada en el anlisis de datos estadsticos.

COEFICIENTE DE VARIACIN

Las medidas de dispersin como rango, varianza y desviacin estndar medidas
absolutas y se expresan en las mismas unidades con las que se mide la variable.
Cuando se comparan dos o ms conjuntos de datos con unidades de medida de
observacin diferentes, no es posible compararlas con estas medidas absolutas.
Para efectuar comparaciones entre series de observaciones distintas, en
estadstica se usa el coeficiente de variacin y as se puede determinar cul serie
tiene mayor o menor variabilidad relativa.
Cuando el coeficiente de variacin es muy alto se dice que la media aritmtica no
es lo suficientemente representativa en la distribucin.
MEDIDAS DE ASIMETRIA

En cualquier distribucin el valor de la mediana se localiza entre la media y la
moda. En una distribucin simtrica se tiene que:
MEDIA = MEDIANA = MODA

En las distribuciones asimtricas la media se corre en el sentido del alargamiento
o sesgo por efecto de las frecuencias y de los valores extremos de la variable; la
mediana tambin se corre pero menos que la media ya que en ella slo influyen
las frecuencias; en tanto que la moda no es influenciada ni por las frecuencias ni
por los valores extremos.
Los datos sesgados a la derecha (sesgo positivo) poseen una cola derecha ms
larga y su mediana y media estn a la derecha de la moda. La distribucin es
asimtrica positiva y:
MODA < MEDIANA < MEDIA

Los datos sesgados a la izquierda (sesgo negativo) presentan una cola izquierda
ms larga y su media y mediana se encuentran a la izquierda de la moda. Ser
asimtrica negativa y:
MEDIA < MEDIANA < MODA

Figura
Distribuciones sesgadas
(a) Sesgada a la derecha; (b) Sesgada a la izquierda; (c) Simtrica



Las asimetras positivas son las ms frecuentes que las sesgadas hacia la
izquierda, porque con frecuencia es ms fcil obtener valores excepcionalmente
grandes que valores excepcionalmente pequeos. Ejemplo de ello es la
distribucin de valores en los consumos de servicios pblicos, las calificaciones en
pruebas, los sueldos, etc.

MEDIDAS DE APUNTAMIENTO O CURTOSIS

Las curvas de distribucin, comparadas con la curva de distribucin normal,
pueden presentar diferentes grados de apuntamiento o altura de la cima de la
curva. Esta agudeza en la cima se observa en la moda.
Si la curva es ms plana que la normal se dice que la curva es platicrtica; si es
ms aguda que la normal, recibe el nombre de apuntada o leptocrtica. Si la
distribucin es normal, la curva se conoce tambin como mesocrtica.



REGRESIN Y CORRELACIN


En muchos casos se requiere conocer ms que el comportamiento de una sola
variable, la relacin entre dos o ms variables. Muchos de estos comportamientos
tienen una tendencia lineal, aunque hay muchos otros que lo hacen de forma
curva, en este curso slo se trabajar sobre variables con correlacin lineal.
Una distribucin bidimensional o bivariante puede representarse grficamente en
un plano cartesiano, ubicando en el eje horizontal o abscisa los valores de la
primera variable denominada X y en el eje vertical u ordenada, los valores de la
segunda variable, Y. De manera pues que se grafican tantas parejas ordenadas
como observaciones hayan de las variables. A este conjunto de puntos o nube de
puntos se le denomina diagrama de dispersin, dado que los puntos se ubican de
forma dispersa en el plano cartesiano.
En muchos casos el slo diagrama de dispersin indica una tendencia de
agrupacin de los puntos, que puede ser lineal (hacia arriba o hacia abajo),
exponencial, curvilnea o poligonal.
Parte del anlisis estadstico que hace el investigador es determinar cul es la
mejor lnea o curva que representa a ese conjunto de datos. El mejor ajuste se
hace cuando se elabora bien la grfica, se conoce la distribucin y se va
adquiriendo experiencia en su clculo y determinacin.
REGRESIN LINEAL SIMPLE

La regresin lineal simple examina la relacin entre dos variables restringiendo
una de ellas respecto a la otra, con el objeto de estudiar las variaciones de la
primera cuando la otra permanece constante. La regresin es un mtodo que se
emplea para pronosticar o predecir el valor de una variable en funcin de los
valores dados de la otra (o de las otras, cuando se trabaja ms de dos variables).
Se trata pues de una dependencia funcional entre las variables. Cuando se trata
de dos variables, una (la X ) ser la variable independiente mientras que la otra (la
Y ) ser la variable dependiente. Se habla as de una regresin de Y sobre (o en
funcin de) X .
La mejor lnea es aquella que hace mnima la suma de los cuadrados de las
diferencias entre los puntos dados y los obtenidos mediante la lnea ajustada o
estimada. Es por eso que a este mtodo tambin se le conoce como el mtodo de
los mnimos cuadrados.

CORRELACIN

La correlacin entre dos variables busca determinar el grado de relacin que
existe entre ellas dos. Ella se calcula con los coeficientes de correlacin.
Los coeficientes de correlacin son nmeros que varan entre +1 y -1. Su
magnitud indica el grado de asociacin entre las variables, si es 0 indica que no
existe relacin alguna y los valores extremos +1 y -1 indican una correlacin
perfecta positiva o negativa respectivamente.
Se dice que existe una correlacin lineal positiva entre dos variables, si al
aumentar o disminuir los valores de la variable independiente aumentan o
disminuyen los de la variable dependiente. En un grfico de dispersin, la nube de
puntos tiene forma ascendente y por tanto la recta que se ajusta tendr una
pendiente positiva.
En cambio, cuando al aumentar los valores de la variable independiente
disminuyen los valores de la variable dependiente, o viceversa, se dice que la
correlacin lineal es negativa. En este caso la nube de puntos descender de
izquierda a derecha y la pendiente de la recta ajustada ser negativa.




COEFICIENTE DE CORRELACIN

Para determinar el coeficiente de correlacin, es necesario conocer primero el
error estndar del estimado de la recta ajustada. Se trata pues de medir el grado
de confiabilidad de la ecuacin de la recta estimada. El error estndar indicar la
dispersin o la variabilidad de los valores observados alrededor de la lnea de
regresin.





NUMEROS INDICE

Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que
sirven para indicar las variaciones que sufre una serie de valores respecto a una
de ellas, tomada como punto de referencia y a la cual se le denomina base.
Los nmeros ndices no son una medida cuantificable, se trata de un indicador de
variacin en la variable observada. Son indicadores muy utilizados en el sector
econmico por ejemplo, la variacin en los precios de un producto respecto al ao
anterior, la cantidad de unidades vendidas de un producto respecto al mes
anterior, el costo de produccin por unidad de este trimestre comparado con el
inmediatamente anterior, etc.
Si se trata de una serie corta, el perodo base seleccionado ser el primer valor de
la serie; pero si la serie es extensa se debe seleccionar cono perodo base aquel
que haya sido ms estable, es decir, que no presente cambios muy bruscos
debido a factores internos y/o externos. Sin embargo, la seleccin de la serie base
depender de los anlisis que el investigador requiera hacer para sus variables.
Los nmeros ndice se pueden construir para una sola observacin o para un
conjunto de ellas; en el primer caso, se hablar de ndices simples y para un
conjunto de datos dados, se hablar de ndices compuestos. Estos ltimos se
clasifican a su vez en agregativos y de promedios. Los promedios se clasifican en
aritmticos, geomtricos, medianos, etc., pero en la prctica los ms utilizados son
los aritmticos.
INDICES COMPUESTOS
Se construyen a partir de un grupo de series de tiempo, concernientes a varios
artculos. Se trata de examinar el valor no de un artculo, sino de un grupo de ellos
respecto a otro considerado de ms importancia. Los ndices compuestos
determinan una condicin particular, por ejemplo el costo de vida relativo a
transporte, vivienda, alimentacin, etc. Se habla entonces de calcular un ndice
agregado ponderado.
Son muchas las frmulas para calcular ndices ponderados, los ms conocidos
son los de Laspeyres, Paashe, Fisher, Keynes, Marshall, Edgeworth, Walsh,
Drobisch y Sidgwick. Generalmente en ellos las ponderaciones son las cantidades
o precios. Cuando se van a calcular los ndices de precios en un grupo de
artculos, las ponderaciones son las cantidades, y en el clculo de los ndices de
cantidad las ponderaciones son los precios.

Anda mungkin juga menyukai