Anda di halaman 1dari 19

ct 7.

RECONOCIMIENTO UNIDAD 2


RECONOCIMIENTO UNIDAD 2
Esta actividad tiene como propsito fundamental para el desarrollo del curso
acadmico, hacer un reconocimiento de los contenidos que se tratarn en esta
SEGUNDA unidad del curso de ESTADSTICA DESCRIPTIVA.

A continuacin usted encontrar una lectura acerca de las medidas de dispersin,
estadsticas Bivariantes y nmeros ndices. Lea detalladamente, con mxima
concentracin y posteriormente responda la leccin evaluativa
INTRODUCCIN
RECONOCIMIENTO UNIDAD 2

Esta actividad tiene como propsito fundamental para el desarrollo del curso
acadmico hacer un reconocimiento de los contenidos que se tratarn en esta
SEGUNDA unidad del curso de ESTADSTICA DESCRIPTIVA.
De esta manera se ha diseado esta actividad para que se revisen algunos
conocimientos especficos que ayudarn al desarrollo del estudio y se han
propuesto algunos contenidos en esta leccin para que se complementen los
mismos.
Esta actividad es evaluativa y de refuerzo, por lo tanto recuerde que debe leer
cuidadosamente y posteriormente responder preguntas para seguir adelante.

UNIDAD 2 MEDIDAS ESTADSTICAS.

La Unidad Didctica 1 se dedic a explicar los mtodos que deben aplicarse en
una investigacin estadstica tales como la planeacin, recoleccin, organizacin y
presentacin de ella, adems de las medidas de tendencia central. Esta unidad
tiene como propsito indicar otros mtodos para medir e interpretar el
comportamiento de un conjunto de datos dados.
Se ha visto que tanto las tablas como las muy diversas formas de graficar la
informacin describen fenmenos de una poblacin o muestra, pero no siempre lo
hacen en forma satisfactoria; es all donde se hace visible la importancia de las
medidas estadsticas bien sean univariantes, en donde interviene una variable, o
bivariantes cuando lo hacen dos.

UNIDADES ESTADSTICAS

UNIDADES ESTADSTICAS

Esta Unidad Didctica se ha dividido en tres grandes captulos: Medidas de
dispersin, Medidas Estadsticas Bivariantes y nmeros ndices, obedeciendo al
nmero de variables que intervienen en estos clculos aritmticos. En el primer
captulo, se considerarn tres clases de medidas: de dispersin o variabilidad, de
asimetra o de deformacin y de apuntamiento o curtosis.

En el segundo captulo y tercer captulo, se estudiar el comportamiento de dos
variables, a fin de determinar si existe alguna relacin entre s y de cuantificar
dicho grado de relacin. Se desarrollarn aqu los conceptos de regresin y
correlacin de dos variables y el concepto y usos de los nmeros ndices.

OBJETIVOS
Objetivos
Los objetivos especficos de esta segunda unidad son:
Desarrollar destrezas para calcular algunas medidas de Dispersin.
Interpretar las medidas de Dispersin y comprender sus aplicaciones.
Comparar las medidas de dispersin y seleccionar la ms til segn las
circunstancias.
Reconocer que las medidas de dispersin complementan la descripcin que
proporcionan las medidas de tendencia central.
Interpretar y utilizar las medidas de simetra y apuntamiento.
Identificar los tipos de asimetra y apuntamiento en una distribucin de datos.
Identificar hechos que admitan intuitivamente un comportamiento lineal simple.
Interpretar y manejar los conceptos de regresin y correlacin.
Dibujar y aplicar grficos de dispersin.
Calcular el coeficiente de correlacin entre dos variables.
Calcular la ecuacin de regresin para dos variables.
Identificar e interpretar correctamente nmeros ndices.
-Desarrollar destrezas necesarias para elaborar y aplicar nmeros ndices en
circunstancias especficas.
MEDIDAS DE DISPERSIN


MEDIDAS DE DISPERSIN
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la
moda slo nos revelan una parte de la informacin que necesitamos acerca de las
caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de
los datos, debemos medir tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida
de tendencia central. Si los datos se encuentran ampliamente dispersos, la
posicin central (promedio) ,es menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos,
debemos ser capaces de distinguir que presenta es dispersin antes de abordar
esos problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea
tener una amplia dispersin de valores con respecto al centro de distribucin o
esto presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y
evitar escoger distribuciones que tengan las dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad
de describirla. Ya que la dispersin ocurre frecuentemente y su grado de
variabilidad son importantes.

REGRESIN Y CORRELACIN

En muchos casos se requiere conocer ms que el comportamiento de una sola
variable, se requiere conocer la relacin entre dos o ms variables como la
relacin entre produccin y consumo; salarios y horas de trabajo; oferta y
demanda; salarios y productividad; la altura de un rbol y el dimetro de su tronco;
el nivel socioeconmico de una persona y su grado de depresin; etc.
Muchos de estos comportamientos tienen una tendencia lineal, aunque hay
muchos otros que lo hacen de forma curva, en este curso slo se trabajar sobre
variables con correlacin lineal. A continuacin se describir brevemente en qu
consiste un diagrama de dispersin y cules son los criterios que deben tenerse
en cuenta para hallar la mejor lnea o lnea de tendencia del comportamiento de
las variables.
La palabra regresin la utilizamos para significar la estimacin de una variable en
funcin de otro valor conocido, correspondiente a la otra variable.

Decimos que la mejor lnea que se ajusta a un conjunto de puntos es aquella en
donde la suma de los cuadrados de las diferencias entre los valores reales y los
estimados es mnima.
Para determinar el grado de correlacin entre las variables, no basta con
calcular la varianza explicada, pues existe el coeficiente de
determinacin o coeficiente de correlacin al cuadrado; sin embargo,
frecuentemente se utiliza un coeficiente de correlacin rectilneo, r siendo
este un valor entre -1 y 1.
Los nmeros ndice son cifras relativas expresadas en trminos
porcentuales, que sirven para indicar las variaciones que sufre una serie
de valores respecto a una de ellas, tomada como punto de referencia y a
la cual se le denomina base.

Los nmeros ndices no son una medida cuantificable, se trata de un
indicador de variacin en la variable observada. Son indicadores muy
utilizados en el sector econmico por ejemplo, la variacin en los precios
de un producto respecto al ao anterior, la cantidad de unidades
vendidas de un producto respecto al mes anterior, el costo de produccin
por unidad de este trimestre comparado con el inmediatamente anterior,
etc.

Si se trata de una serie corta, el perodo base seleccionado ser el
primer valor de la serie; pero si la serie es extensa se debe seleccionar
cono perodo base aquel que haya sido ms estable, es decir, que no
presente cambios muy bruscos debido a factores internos y/o externos.
Sin embargo, la seleccin de la serie base depender de los anlisis que
el investigador requiera hacer para SUS VARIABLES





http://es.scribd.com/doc/166078956/Retroalimentacion-de-Todos-Los-
Examenes

g




http://es.scribd.com/doc/163302258/ESTADISTICA-DESCRIPTIVA-FINAAAAAALLL
evaluacionnnn nnn nnnfinal

LECCIN EVALUATIVA UNIDAD 2

En esta leccin evaluativa se revisan conceptos de la unidad 2 del curso
Estadstica Descriptiva que el estudiante debi estudiar previamente.

Encontrar sntesis de los conceptos ms importantes y seguidamente algunas
preguntas relacionadas. Esta actividad es EVALUATIVA, por lo tanto recuerde que
debe leer cuidadosamente y posteriormente responder la leccin.

A continuacin usted encontrar una lectura acerca de las medidas de dispersin,
estadsticas Bivariantes y nmeros ndices. Lea detalladamente, con mxima
concentracin y posteriormente responda la leccin evaluativa.

xitos


MEDIDAS DE DISPERSIN
La informacin que arrojan las medidas de tendencia central no siempre
proporciona conclusiones contundentes frente al conjunto de datos. El conjunto de
datos, adems de tener una tendencia de agruparse hacia el centro, en ocasiones
suelen estar bastante alejados de esa tendencia central. Medir esa variacin
respecto a los promedios es un clculo importante en el tratamiento estadstico de
datos, medidas a las que se les denomina de dispersin o de variacin.
Entre las medidas de dispersin ms comunes estn:

Rango o recorrido
Varianza
Desviacin tpica o estndar
Coeficiente de variacin
Desviacin media
Puntaje tpico o estandarizado
VARIANZA
Es una de las medidas ms usadas en estadstica, ella a su vez da origen a otra
mucho ms significativa: la desviacin tpica o estndar. Se define como la media
aritmtica de los cuadrados de las desviaciones respecto a la media aritmtica.
La varianza indica la desviacin de los datos respecto a la media. Para comparar
dos distribuciones, en cuanto a su variabilidad absoluta, se pueden utilizar sus
varianzas de manera que el resultado indique cul de ellas es ms homognea o
cul es ms heterognea.

DESVIACIN TPICA O ESTNDAR
Esta medida se obtiene extrayendo la raz cuadrada de la varianza, tomando
siempre el valor positivo. Se simboliza por s en la muestra . Esta es la medida de
dispersin ms conocida y ms utilizada en el anlisis de datos estadsticos.

COEFICIENTE DE VARIACIN

Las medidas de dispersin como rango, varianza y desviacin estndar medidas
absolutas y se expresan en las mismas unidades con las que se mide la variable.
Cuando se comparan dos o ms conjuntos de datos con unidades de medida de
observacin diferentes, no es posible compararlas con estas medidas absolutas.
Para efectuar comparaciones entre series de observaciones distintas, en
estadstica se usa el coeficiente de variacin y as se puede determinar cul serie
tiene mayor o menor variabilidad relativa.
Cuando el coeficiente de variacin es muy alto se dice que la media aritmtica no
es lo suficientemente representativa en la distribucin.


MEDIDAS DE ASIMETRIA

En cualquier distribucin el valor de la mediana se localiza entre la media y la
moda. En una distribucin simtrica se tiene que:
MEDIA = MEDIANA = MODA

En las distribuciones asimtricas la media se corre en el sentido del alargamiento
o sesgo por efecto de las frecuencias y de los valores extremos de la variable; la
mediana tambin se corre pero menos que la media ya que en ella slo influyen
las frecuencias; en tanto que la moda no es influenciada ni por las frecuencias ni
por los valores extremos.
Los datos sesgados a la derecha (sesgo positivo) poseen una cola derecha ms
larga y su mediana y media estn a la derecha de la moda. La distribucin es
asimtrica positiva y:
MODA < MEDIANA < MEDIA

Los datos sesgados a la izquierda (sesgo negativo) presentan una cola izquierda
ms larga y su media y mediana se encuentran a la izquierda de la moda. Ser
asimtrica negativa y:
MEDIA < MEDIANA < MODA

Figura
Distribuciones sesgadas
(a) Sesgada a la derecha; (b) Sesgada a la izquierda; (c) Simtrica



Las asimetras positivas son las ms frecuentes que las sesgadas hacia la
izquierda, porque con frecuencia es ms fcil obtener valores excepcionalmente
grandes que valores excepcionalmente pequeos. Ejemplo de ello es la
distribucin de valores en los consumos de servicios pblicos, las calificaciones en
pruebas, los sueldos, etc.

MEDIDAS DE APUNTAMIENTO O CURTOSIS

Las curvas de distribucin, comparadas con la curva de distribucin normal,
pueden presentar diferentes grados de apuntamiento o altura de la cima de la
curva. Esta agudeza en la cima se observa en la moda.
Si la curva es ms plana que la normal se dice que la curva es platicrtica; si es
ms aguda que la normal, recibe el nombre de apuntada o leptocrtica. Si la
distribucin es normal, la curva se conoce tambin como mesocrtica.



REGRESIN Y CORRELACIN
En muchos casos se requiere conocer ms que el comportamiento de una sola
variable, la relacin entre dos o ms variables. Muchos de estos comportamientos
tienen una tendencia lineal, aunque hay muchos otros que lo hacen de forma
curva, en este curso slo se trabajar sobre variables con correlacin lineal.
Una distribucin bidimensional o bivariante puede representarse grficamente en
un plano cartesiano, ubicando en el eje horizontal o abscisa los valores de la
primera variable denominada X y en el eje vertical u ordenada, los valores de la
segunda variable, Y. De manera pues que se grafican tantas parejas ordenadas
como observaciones hayan de las variables. A este conjunto de puntos o nube de
puntos se le denomina diagrama de dispersin, dado que los puntos se ubican de
forma dispersa en el plano cartesiano.
En muchos casos el slo diagrama de dispersin indica una tendencia de
agrupacin de los puntos, que puede ser lineal (hacia arriba o hacia abajo),
exponencial, curvilnea o poligonal.
Parte del anlisis estadstico que hace el investigador es determinar cul es la
mejor lnea o curva que representa a ese conjunto de datos. El mejor ajuste se
hace cuando se elabora bien la grfica, se conoce la distribucin y se va
adquiriendo experiencia en su clculo y determinacin.
REGRESIN LINEAL SIMPLE

La regresin lineal simple examina la relacin entre dos variables restringiendo
una de ellas respecto a la otra, con el objeto de estudiar las variaciones de la
primera cuando la otra permanece constante. La regresin es un mtodo que se
emplea para pronosticar o predecir el valor de una variable en funcin de los
valores dados de la otra (o de las otras, cuando se trabaja ms de dos variables).
Se trata pues de una dependencia funcional entre las variables. Cuando se trata
de dos variables, una (la X ) ser la variable independiente mientras que la otra (la
Y ) ser la variable dependiente. Se habla as de una regresin de Y sobre (o en
funcin de) X .
La mejor lnea es aquella que hace mnima la suma de los cuadrados de las
diferencias entre los puntos dados y los obtenidos mediante la lnea ajustada o
estimada. Es por eso que a este mtodo tambin se le conoce como el mtodo de
los mnimos cuadrados.

CORRELACIN

La correlacin entre dos variables busca determinar el grado de relacin que
existe entre ellas dos. Ella se calcula con los coeficientes de correlacin.
Los coeficientes de correlacin son nmeros que varan entre +1 y -1. Su
magnitud indica el grado de asociacin entre las variables, si es 0 indica que no
existe relacin alguna y los valores extremos +1 y -1 indican una correlacin
perfecta positiva o negativa respectivamente.
Se dice que existe una correlacin lineal positiva entre dos variables, si al
aumentar o disminuir los valores de la variable independiente aumentan o
disminuyen los de la variable dependiente. En un grfico de dispersin, la nube de
puntos tiene forma ascendente y por tanto la recta que se ajusta tendr una
pendiente positiva.
En cambio, cuando al aumentar los valores de la variable independiente
disminuyen los valores de la variable dependiente, o viceversa, se dice que la
correlacin lineal es negativa. En este caso la nube de puntos descender de
izquierda a derecha y la pendiente de la recta ajustada ser negativa.



COEFICIENTE DE CORRELACIN

Para determinar el coeficiente de correlacin, es necesario conocer primero el
error estndar del estimado de la recta ajustada. Se trata pues de medir el grado
de confiabilidad de la ecuacin de la recta estimada. El error estndar indicar la
dispersin o la variabilidad de los valores observados alrededor de la lnea de
regresin.


NUMEROS INDICE.
Los nmeros ndice son cifras relativas expresadas en trminos porcentuales, que
sirven para indicar las variaciones que sufre una serie de valores respecto a una
de ellas, tomada como punto de referencia y a la cual se le denomina base.
Los nmeros ndices no son una medida cuantificable, se trata de un indicador de
variacin en la variable observada. Son indicadores muy utilizados en el sector
econmico por ejemplo, la variacin en los precios de un producto respecto al ao
anterior, la cantidad de unidades vendidas de un producto respecto al mes
anterior, el costo de produccin por unidad de este trimestre comparado con el
inmediatamente anterior, etc.
Si se trata de una serie corta, el perodo base seleccionado ser el primer valor de
la serie; pero si la serie es extensa se debe seleccionar cono perodo base aquel
que haya sido ms estable, es decir, que no presente cambios muy bruscos
debido a factores internos y/o externos. Sin embargo, la seleccin de la serie base
depender de los anlisis que el investigador requiera hacer para sus variables.
Los nmeros ndice se pueden construir para una sola observacin o para un
conjunto de ellas; en el primer caso, se hablar de ndices simples y para un
conjunto de datos dados, se hablar de ndices compuestos. Estos ltimos se
clasifican a su vez en agregativos y de promedios. Los promedios se clasifican en
aritmticos, geomtricos, medianos, etc., pero en la prctica los ms utilizados son
los aritmticos.
INDICES COMPUESTOS
Se construyen a partir de un grupo de series de tiempo, concernientes a varios
artculos. Se trata de examinar el valor no de un artculo, sino de un grupo de ellos
respecto a otro considerado de ms importancia. Los ndices compuestos
determinan una condicin particular, por ejemplo el costo de vida relativo a
transporte, vivienda, alimentacin, etc. Se habla entonces de calcular un ndice
agregado ponderado.
Son muchas las frmulas para calcular ndices ponderados, los ms conocidos
son los de Laspeyres, Paashe, Fisher, Keynes, Marshall, Edgeworth, Walsh,
Drobisch y Sidgwick. Generalmente en ellos las ponderaciones son las cantidades
o precios. Cuando se van a calcular los ndices de precios en un grupo de
artculos, las ponderaciones son las cantidades, y en el clculo de los ndices de
cantidad las ponderaciones son los precios.