Anda di halaman 1dari 34

ESTADSTICA

Estadstica es una ciencia que utiliza datos numricos para obtener inferencias basadas
en el clculo de probabilidades. Una estadstica es tambin un conjunto de datos
obtenidos a travs de un estudio estadstico.
Este trmino procede del alemn statistik (con un significado diferente al actual) y a su
vez del latn statisticum collegium.
Tipos de Estadstica
Se pueden establecer dos tipos de
tcnicas descriptivas o inferenciales.
Estadstica Descriptiva

Estadstica, dependiendo

de

si

utilizan

La Estadstica Descriptiva se puede definir como el estudio que incluye la


obtencin, organizacin, presentacin y descripcin de informacin numrica. Su
objetivo, por lo tanto, es decribir las caractersticas principales de los datos reunidos.
Estadstica Inferencial
Por su parte, la Estadstica Inferencial es el estudio que utiliza tcnicas a partir de las
cuales se obtienen generalizaciones o se toman decisiones en base a una informacin
parcial o completa obtenida mediante tcnicas descriptivas. Su objetivo es extraer
conclusiones de utilidad sobre el total de las observaciones posibles basndose en la
informacin obtenida.
Probabilidad estadstica
La probabilidad estadstica es una forma de medicin de la certidumbre que asociada a
la observacin u ocurrencia de un fenmeno o al hecho de que una caracterstica de un
objeto de estudio adopte cierto valor. Se puede simplificar dividiendo el nmero de
ocurrencias de un hecho entre el nmero total de casos posibles.
Estadstica aplicada
La Estadstica aplicada es la rama de la Estadstica encargada de realizar inferencias a
partir de una o varias muestras de una determinada poblacin como objeto de estudio.
La Estadstica aplicada se utiliza en diversas ciencias, como la Historia, la Economa, la
Educacin o la Sociologa para realizar estudios y anlisis estadsticos.
Estadstica Paramtrica y Estadstica No Paramtrica
La Estadstica Paramtrica es un conjunto de tcnicas desarrolladas para niveles altos
de medicin. La Estadstica No Paramtrica es un conjunto de tcnicas diseadas para
niveles menores de medicin menores.
Poblacin estadstica
Se utiliza este trmino para referirse a un conjunto de personas, entidades u objetos
sobre el que se pretende obtener cierta informacin para realizar algn tipo de anlisis.

ANTECEDENTES HISTRICOS DE LA ESTADSTICA:


Los antecedentes de la estadstica aparecen en pocas antiguas. Uno de los
antecedentes de la estadstica de los que se puede hacer constancia son los escritos
sobre el historiador Tcito, al que el emperador Augusto le orden crear una encuesta y
una especie de inventario de todos sus bienes, ya fuesen soldados, armamento, barcos
entre otros.
La ciencia de la estadstica aparece poco a poco mediante una evolucin histrica y
que se puede constatar en los distintos escritos histricos de la humanidad. Siempre ha
existido la necesidad de realizar recuentos, antes y despus de las guerras, de modo
que se pueda visualizar de forma fcil la evolucin de un reino o la evolucin de un
imperio.
Otro antecedente de la estadstica surge en la isla italiana de Cerdea donde los
primeros pobladores de esta isla, los llamados "Nuragas" levantaron bloques de piedra
en los cuales realizaban escritos donde anotaban con mucha escrupulosidad los
nmeros de ganado o de piezas cazadas de la poca. El trmino alemn statistik, que
fue primeramente introducido por Gottfried Achenwall (1749), designaba originalmente
el anlisis de datos del Estado, es decir, la "ciencia del Estado" (tambin llamada
aritmtica poltica de su traduccin directa del ingls). No fue hasta el siglo XIX cuando
el trmino estadstica adquiri el significado de recolectar y clasificar datos. Este
concepto fue introducido por el ingls John Sinclair. En su origen, por tanto, la
Estadstica estuvo asociada a los Estados, para ser utilizados por el gobierno y cuerpos
administrativos (a menudo centralizados). La coleccin de datos acerca de estados y
localidades contina ampliamente a travs de los servicios de estadsticas nacionales e
internacionales. En particular, los censos suministran informacin regular acerca de la
poblacin.
Ya se utilizaban representaciones grficas y otras medidas en pieles, rocas, palos de
madera y paredes de cuevas para controlar el nmero de personas, animales o ciertas
mercancas. Hacia el ao 3000 a. C. los babilonios usaban ya pequeos envases
moldeados de arcilla para recopilar datos sobre la produccin agrcola y de los gneros
vendidos o cambiados. Los egipcios analizaban los datos de la poblacin y la renta del
pas mucho antes de construir las pirmides en el siglo XI a. C. Los libros bblicos de
Nmeros y Crnicas incluyen en algunas partes trabajos de estadstica. El primero
contiene dos censos de la poblacin de Israel y el segundo describe el bienestar
material de las diversas tribus judas. En China existan registros numricos similares
con anterioridad al ao 2000 a. C. Los antiguos griegos realizaban censos cuya
informacin se utilizaba hacia el 594 a. C. para cobrar impuestos.
Los mtodos estadstico-matemticos emergieron desde la teora de probabilidad, la
cual data desde la correspondencia entre Pascal y Pierre de Fermat (1654). Christian
Huygens (1657) da l primer tratamiento cientfico que se conoce a la materia. El Ars
coniectandi (pstumo, 1713) de Jakob Bernoulli y la Doctrina de posibilidades (1718) de
Abraham de Moivre estudiaron la materia como una rama de las matemticas. En la era
moderna, el trabajo de Kolmogrov ha sido un pilar en la formulacin del modelo
fundamental de la Teora de Probabilidades, el cual es usado a travs de la estadstica.
La teora de errores se puede remontar a la pera miscellnea (pstuma, 1722) de
Roger Cotes y al trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) el

cual aplica por primera vez la teora de la discusin de errores de observacin. La


reimpresin (1757) de este trabajo incluye el axioma de que errores positivos y
negativos son igualmente probables y que hay unos ciertos lmites asignables dentro de
los cuales se encuentran todos los errores; se describen errores continuos y una curva
de probabilidad.
Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la
combinacin de observaciones desde los principios de la teora de probabilidades.
Laplace represent la ley de probabilidades de errores mediante una curva y dedujo
una frmula para la media de tres observaciones. Tambin, en 1871, obtiene la frmula
para la ley de facilidad del error (trmino introducido por Lagrange, 1744) pero con
ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el principio del mximo
producto de las probabilidades de un sistema de errores concurrentes. El mtodo de
mnimos cuadrados, el cual fue usado para minimizar los errores en mediciones, fue
publicado independientemente por Adrien-Marie Legendre (1805), Robert Adrain (1808),
y Carl Friedrich Gauss (1809). Gauss haba usado el mtodo en su famosa prediccin
de la localizacin del planeta enano Ceres en 1801. Pruebas adicionales fueron escritas
por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837),
Friedrich Bessel (1838), W.F. Donkin (1844, 1856), John Herschel (1850) y Morgan
Crofton (1870). Otros contribuidores fueron Ellis (1844), Augustus De Morgan (1864),
Glaisher (1872) y Giovanni Schiaparelli (1875). La frmula de Peters para r, el probable
error de una observacin simple es bien conocido. El siglo XIX incluye autores como
Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert
(1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y
George Boole mejoraron la presentacin de la teora. Adolphe Quetelet (1796-1874),
fue otro importante fundador de la estadstica y quien introdujo la nocin del hombre
promedio (lhomme moyen) como un medio de entender los fenmenos sociales
complejos tales como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.
ESTADO ACTUAL
Durante el siglo XX, la creacin de instrumentos precisos para asuntos de salud pblica
(epidemiologa, bioestadstica, etc.) y propsitos econmicos y sociales (tasa de
desempleo, econometra, etc.) necesit de avances sustanciales en las prcticas
estadsticas. Hoy el uso de la estadstica se ha extendido ms all de sus orgenes
como un servicio al Estado o al gobierno. Personas y organizaciones usan la estadstica
para entender datos y tomar decisiones en ciencias naturales y sociales, medicina,
negocios y otras reas. La estadstica es entendida generalmente no como un sub-rea
de las matemticas sino como una ciencia diferente aliada. Muchas universidades
tienen departamentos acadmicos de matemticas y estadstica separadamente. La
estadstica se ensea en departamentos tan diversos como psicologa, educacin y
salud pblica.
Al aplicar la estadstica a un problema cientfico, industrial o social, se comienza con un
proceso o poblacin a ser estudiado. Esta puede ser la poblacin de un pas, de granos
cristalizados en una roca o de bienes manufacturados por una fbrica en particular
durante un periodo dado. Tambin podra ser un proceso observado en varios instantes
y los datos recogidos de esta manera constituyen una serie de tiempo. Por razones
prcticas, en lugar de compilar datos de una poblacin entera, usualmente se estudia
un subconjunto seleccionado de la poblacin, llamado muestra. Datos acerca de la

muestra son recogidos de manera observacional o experimental. Los datos son


entonces analizados estadsticamente lo cual sigue dos propsitos: descripcin e
inferencia. El concepto de correlacin es particularmente valioso. Anlisis estadsticos
de un conjunto de datos puede revelar que dos variables (esto es, dos propiedades de
la poblacin bajo consideracin) tienden a variar conjuntamente, como si hubiera una
conexin entre ellas. Por ejemplo, un estudio del ingreso anual y la edad de muerte
podra resultar en que personas pobres tienden a tener vidas ms cortas que personas
de mayor ingreso. Las dos variables se dicen que estn correlacionadas. Sin embargo,
no se puede inferir inmediatamente la existencia de una relacin de causalidad entre las
dos variables. El fenmeno correlacionado podra ser la causa de una tercera,
previamente no considerada, llamada variable confusora. Si la muestra es
representativa de la poblacin, inferencias y conclusiones hechas en la muestra pueden
ser extendidas a la poblacin completa. Un problema mayor es el de determinar que tan
representativa es la muestra extrada. La estadstica ofrece medidas para estimar y
corregir por aleatoriedad en la muestra y en el proceso de recoleccin de los datos, as
como mtodos para disear experimentos robustos como primera medida, ver diseo
experimental.
El concepto matemtico fundamental empleado para entender la aleatoriedad es el de
probabilidad. La estadstica matemtica (tambin llamada teora estadstica) es la rama
de las matemticas aplicadas que usa la teora de probabilidades y el anlisis
matemtico para examinar las bases tericas de la estadstica. El uso de cualquier
mtodo estadstico es vlido solo cuando el sistema o poblacin bajo consideracin
satisface los supuestos matemticos del mtodo. El mal uso de la estadstica puede
producir serios errores en la descripcin e interpretacin, afectando las polticas
sociales, la prctica mdica y la calidad de estructuras tales como puentes y plantas de
reaccin nuclear.
Incluso cuando la estadstica es correctamente aplicada, los resultados pueden ser
difcilmente interpretados por un inexperto. Por ejemplo, el significado estadstico de
una tendencia en los datos, que mide el grado al cual la tendencia puede ser causada
por una variacin aleatoria en la muestra, puede no estar de acuerdo con el sentido
intuitivo. El conjunto de habilidades estadsticas bsicas (y el escepticismo) que una
persona necesita para manejar informacin en el da a da se refiere como cultura
estadstica
Los antecedentes de la estadstica aparecen en pocas antiguas. Uno de los
antecedentes de la estadstica de los que se puede hacer constancia son los escritos
sobre el historiador Tcito, al que el emperador Augusto le orden crear una encuesta y
una especie de inventario de todos sus bienes, ya fuesen soldados, armamento, barcos
entre otros. La ciencia de la estadstica aparece poco a poco mediante una evolucin
histrica y que se puede constatar en los distintos escritos histricos de la humanidad.
Siempre ha existido la necesidad de realizar recuentos, antes y despus de las guerras,
de modo que se pueda visualizar de forma fcil la evolucin de un reino o la evolucin
de un imperio. Otro antecedente de la estadstica surge en la isla italiana de Cerdea
donde los primeros pobladores de esta isla, los llamados "Nuragas" levantaron bloques
de piedra en los cuales realizaban escritos donde anotaban con mucha escrupulosidad
los nmeros de ganado o de piezas cazadas de la poca.

MANEJO DE LA INFORMACIN

En general las fuentes de informacin estadstica son las particularidades de los


procesos o fenmenos: calidad. concepcin, eficacia, eficiencia u otros atributos que
den cuenta de su modo de ejecucin; as como los participantes directos, de aquellos
procesos o fenmenos acerca de los cuales se necesita recopilar informacin: las
personas, sus opiniones, sus planteamientos, sus formas de vida , la labor que realizan,
sus apreciaciones , sus estados de nimo, actos y acerca de la realidad circundante.
En el desarrollo de las investigaciones cientficas resulta muy necesario obtener
informacin teniendo en cuenta el problema a investigar, el objeto de la investigacin y
los mtodos que se empleen para el desarrollo del trabajo. En la bsqueda de tal
informacin es de vital importancia un adecuado manejo de las Fuentes de informacin
estadstica, concebido como el proceso que permite obtener la informacin contenida
en las fuentes que la portan, en forma de datos.
Este proceso indagativo est presente durante todo el desarrollo de un trabajo
cientfico, sin embargo la bsqueda y manejo de la informacin estadstica se hace
necesaria en la realizacin del diagnstico inicial, la caracterizacin del estado inicial
del objeto y en la etapa de corroboracin de la validez de la hiptesis.
Este tipo de indagacin est relacionado con el empleo de los procedimientos
empricos, para medir variables que en general estn relacionadas con conceptos,
o teoras en las que resulta relevante el comportamiento de determinados procesos o
sujetos que intervienen como actores de estos procesos. "Medir es el proceso de
vincular conceptos abstractos con indicadores empricos, mediante clasificacin y/o
cuantificacin [.] como lo fundamenta Roberto Hernandez Sampieri,
que esa medicin es efectiva cuando el instrumento de recoleccin de los datos
realmente representa a las variables que tenemos en mente, por ende, para recolectar
los datos se requieren dar tres pasos:

Seleccionar o elaborar un instrumento de recoleccin de los datos, aplicar ese


instrumento de medicin. Es decir, obtener las observaciones y mediciones de las
variables que son de inters para nuestro estudio (medir variables) y preparar las
mediciones obtenidas para que puedan analizarse correctamente (a esta actividad
se le denomina codificacin de los datos).
Las variables a medir pueden ser cualitativas o cuantitativas, por cuanto son
expresin de cualidades, caractersticas, atributos, comportamiento o condicin de
objetos o sujetos y dicha medicin requiere de la aplicacin de instrumentos
diseados a tal efecto, los cuales estn concebidos en la Metodologa de la
Investigacin Cientfica y estn relacionados con mtodos y tcnicas como el censo,
la encuesta y la entrevista.

Segn los fundamentos del colectivo de autores del presente manuscrito, en


dependencia del fenmeno o proceso que se desee investigar se utilizan diferentes
instrumentos para acceder a estas fuentes, entre ellos tenemos la observacin, el
censo, la encuesta y la entrevista. Para la elaboracin de estos instrumentos se

requiere tener en cuenta las variables o caractersticas a medir y dentro de ellas los
indicadores, que a veces se desglosan en subindicadores. Este proceder permite definir
hacia donde va dirigida la indagacin, es decir aquellos aspectos a considerar en la
medicin a realizar. La delimitacin de los indicadores depende del inters del
investigador al observar un proceso y de sus supuestos tericos, que son los que
determinan los aspectos a tomar en cuenta en la forma de definirlos. Cuando eso
sucede, hay que considerar tambin si lo que se desea medir es la forma en que se
ejecuta el proceso o las caractersticas o cualidades de los actores del proceso.
Por ejemplo en una investigacin sobre la enseanza de la Estadstica se quiere
determinar el nivel de preparacin que tienen los estudiantes para
resolver problemas profesionales relacionados. El profesor les orienta una tarea que
consiste en resolver este tipo de problemas y observa el resultado de la actividad de los
estudiantes, pero lo hace empleando los indicadores a partir de las habilidades que
considera deben demostrar estos para realizar la tarea orientada, y dentro de los
indicadores, define subindicadores que expresan habilidades ms especficas a
desarrollar para llegar a las antes mencionadas.
MUESTREO (ESTADSTICA)
En estadstica se conoce como muestreo a
una muestra a partir de una poblacin.

la

tcnica

para

la

seleccin

de

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean
extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener
resultados parecidos a los que se alcanzaran si se realizase un estudio de toda la
poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio
adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar
tambin los mrgenes de error correspondientes a dichas estimaciones), debe cumplir
ciertos requisitos. Nunca podremos estar enteramente seguros de que el resultado sea
una muestra representativa, pero s podemos actuar de manera que esta condicin se
alcance con una probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la
poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al conjunto de
muestras que se pueden obtener de la poblacin se denomina espacio muestral. La
variable que asocia a cada muestra su probabilidad de extraccin, sigue la
llamada distribucin muestral.
Tcnicas de muestreo estadstico
Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no
aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como recurso en el

proceso de seleccin). Cuando este ltimo cumple con la condicin de que todos los
elementos de la poblacin tienen alguna oportunidad de ser escogidos en la muestra, si
la probabilidad correspondiente a cada sujeto de la poblacin es conocida de
antemano, recibe el nombre de muestreo probabilstico. Una muestra seleccionada por
muestreo de juicio puede basarse en la experiencia de alguien con la poblacin.
Algunas veces una muestra de juicio se usa como gua o muestra tentativa para decidir
cmo tomar una muestra aleatoria ms adelante.
Muestreo Probabilstico
Forman parte de este tipo de muestreo todos aquellos mtodos para los que se puede
calcular la probabilidad de extraccin de cualquiera de las muestras posibles. Este
conjunto de tcnicas de muestreo es el ms aconsejable, aunque en ocasiones no es
posible optar por l. En este caso se habla de muestras probabilistas, pues no es
correcto hablar en rigor de muestras representativas dado que, al no conocer las
caractersticas de la poblacin, no es posible tener certeza de que tal caracterstica se
haya conseguido.

Tipos
Sin reposicin de los elementos:' Cada elemento extrado se descarta para la
subsiguiente extraccin. Por ejemplo, si se extrae una muestra de una "poblacin" de
bombillas para estimar la vida media de las bombillas que la integran, no ser posible
medir ms que una vez la bombilla seleccionada.
Con reposicin de los elementos: Las observaciones se realizan con remplazo de los
individuos, de forma que la poblacin es idntica en todas las extracciones. En
poblaciones muy grandes, la probabilidad de repetir una extraccin es tan pequea que
el muestreo puede considerarse con reposicin aunque, realmente, no lo sea.
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de repetir una
extraccin es tan pequea que el muestreo puede considerarse con reposicin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til la
extraccin de nmeros aleatorios mediante ordenadores, calculadoras o tablas
construidas al efecto.
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el
tiempo. Primero hay que identificar las unidades y relacionarlas con el calendario
(cuando proceda). Luego hay que calcular una constante, que se denomina coeficiente
de elevacin:

K= N/n
Donde N es el tamao del universo y n el tamao de la muestra.

Para determinar en qu fecha se producir la primera extraccin, hay que elegir al azar
un nmero entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares.
Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la
poblacin (N) y queremos escoger de esa poblacin un nmero ms pequeo el cual es
la muestra (n), dividimos el nmero de la poblacin por el nmero de la muestra que
queremos tomar y el resultado de esta operacin ser el intervalo, entonces escogemos
un nmero al azar desde uno hasta el nmero del intervalo, y a partir de este nmero
escogemos los dems siguiendo el orden.
Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se
suponen homogneos con respecto a alguna caracterstica de las que se van a
estudiar. A cada uno de estos estratos se le asignara una cuota que determinara el
nmero de miembros del mismo que compondrn la muestra. Dentro de cada estrato se
suele usar la tcnica de muestreo sistemtico, una de las tcnicas de seleccin ms
usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los
estratos, existen dos tcnicas de muestreo estratificado:

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es


proporcional al tamao del estrato dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que


tengan ms variabilidad. Para ello es necesario un conocimiento previo de la
poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por
separado las opiniones de hombres y mujeres pues se estima que, dentro de cada uno
de estos grupos, puede haber cierta homogeneidad. En la asignacin proporcional, si la
poblacin est compuesta de un 55% de mujeres y un 45 % de hombres, se tomara
una muestra que contenga tambin esos mismos porcentajes de hombres y mujeres.
En la asignacin ptima, si todos los hombres piensan igual, pero las mujeres son
impredecibles, se tomara una muestra con ms del 55% de mujeres.

Para una descripcin general del muestreo estratificado y los mtodos de inferencia
asociados con este procedimiento, suponemos que la poblacin est dividida
en h subpoblaciones o estratos de tamaos conocidos N 1, N2,..., Nh tal que las unidades
en cada estrato sean homogneas respecto a la caracterstica en cuestin. La media y
la varianza desconocidas para el i-simo estrato son denotadas por mi y si2,
respectivamente.
MUESTREO POR ETAPAS MLTIPLES
Esta tcnica es la nica opcin cuando no se dispone de lista completa de la poblacin
de referencia o bien cuando por medio de la tcnica de muestreo simple o estratificado
se obtiene una muestra con unidades distribuidas de tal forma que resultan de difcil
acceso. En el muestreo a estadios mltiples se subdivide la poblacin en varios niveles
ordenados que se extraen sucesivamente por medio de un procedimiento de embudo.
El muestreo se desarrolla en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria en un
pas determinado, stos pueden subdividirse en unidades primarias representadas por
circunscripciones didcticas y unidades secundarias que seran los propios profesores.
En primer lugar extraemos una muestra de las unidades primarias (para lo cual
debemos tener la lista completa de estas unidades) y en segundo lugar extraemos
aleatoriamente una muestra de unidades secundarias de cada una de las primarias
seleccionadas en la primera extraccin.
MUESTREO POR CONGLOMERADOS
Se utiliza cuando la poblacin se encuentra dividida, de manera natural, en grupos que
se supone que contienen toda la variabilidad de la poblacin, es decir, la representan
fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo algunos de
estos grupos o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por ejemplo,
las personas a encuestar, y podra aplicrsele el instrumento de medicin a todas las
unidades, es decir, los miembros del grupo, o slo se le podra aplicar a algunos de
ellos, seleccionados al azar. Este mtodo tiene la ventaja de simplificar la recogida de
informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos
para integrar la muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer
mtodo funciona mejor cuanto ms homognea es la poblacin respecto del estrato,
aunque ms diferentes son stos entre s. En el segundo, ocurre lo contrario. Los

conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos
entre s.
Homogeneidad de las poblaciones o sus subgrupos
Homogneo significa, en el contexto de la estratificacin, que no hay mucha
variabilidad. Los estratos funcionan mejor cuanto ms homogneos son cada uno de
ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la estatura de una
poblacin, es bueno distinguir entre los estratos mujeres y hombres porque se espera
que, dentro de ellos, haya menos variabilidad, es decir, sean menos heterogneos.
Dicho de otro modo, no hay tantas diferencias entre unas estaturas y otras dentro del
estrato que en la poblacin total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan las
mismas diferencias dentro del estrato que en toda la poblacin, no hay por qu usar
este mtodo de muestreo. En los casos en los que existan grupos que contengan toda
la variabilidad de la poblacin, lo que se construyen son conglomerados, que ahorran
algo del trabajo que supondra analizar toda la poblacin. En resumen, los estratos y los
conglomerados funcionan bajo principios opuestos: los primeros son mejores cuanto
ms homogneo es el grupo respecto a la caracterstica a estudiar y los
conglomerados, si representan fielmente a la poblacin, esto es, contienen toda su
variabilidad, o sea, son heterogneos.
Muestreo no probabilstico
Es aqul para el que no se puede calcular la probabilidad de extraccin de una
determinada muestra. Por tal motivo, se busca seleccionar a individuos que tienen un
conocimiento profundo del tema bajo estudio y se considera que la informacin
aportada por esas personas es vital para la toma de decisiones.
Muestreo por cuotas
Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de opinin.
En primer lugar es necesario dividir la poblacin de referencia en varios estratos
definidos por algunas variables de distribucin conocida (como el gnero o la edad).
Posteriormente se calcula el peso proporcional de cada estrato, es decir, la parte
proporcional de poblacin que representan. Finalmente se multiplica cada peso por el
tamao de n de la muestra para determinar la cuota precisa en cada estrato. Se
diferencia del muestreo estratificado en que una vez determinada la cuota, el
investigador es libre de elegir a los sujetos de la muestra dentro de cada estrato.

Muestreo de bola de nieve


Indicado para estudios de poblaciones clandestinas, minoritarias o muy dispersas pero
en contacto entre s. Consiste en identificar sujetos que se incluirn en la muestra a
partir de los propios entrevistados. Partiendo de una pequea cantidad de individuos
que cumplen los requisitos necesarios, servirn como localizadores de otros con
caractersticas anlogas.
Muestreo subjetivo por decisin razonada
En este caso las unidades de la muestra se eligen en funcin de algunas de sus
caractersticas de manera racional y no casual. Una variante de esta tcnica es
el muestreo compensado o equilibrado, en el que se seleccionan las unidades de tal
forma que la media de la muestra para determinadas variables se acerque a la media
de la poblacin. La cual funciona en base a referencias o por recomendacin despus
se reconoce por medio de la estadstica.

FRECUENCIAS
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de
tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
FRECUENCIA ABSOLUTA
Es el promedio de una suma predeterminada y adems consiste en saber cul es el
nmero o smbolo de mayor equivalencia. (ni) de una variable estadstica Xi, es el
nmero de veces que este valor aparece en el estudio. A mayor tamao de la muestra
aumentar el tamao de la frecuencia absoluta; es decir, la suma total de todas las
frecuencias absolutas debe dar el total de la muestra estudiada (N).
FRECUENCIA RELATIVA (FI)
Es el cociente entre la frecuencia absoluta y el tamao de la muestra (N). Es decir,

f i= =
N

Siendo el fi para todo el conjunto i. Se presenta en una tabla o nube de puntos en una
distribucin de frecuencias.
Si multiplicamos la frecuencia relativa por 100 obtendremos el porcentaje o tanto por
ciento (pi)
FRECUENCIA ABSOLUTA ACUMULADA (Ni)

Es el nmero de veces ni en la muestra N.


FRECUENCIA RELATIVA ACUMULADA (Fi)
Es el cociente entre la frecuencia absoluta acumulada y el total de la muestra.
F i=
N

EJEMPLO DE FRECUENCIA
Supongamos que las calificaciones de un alumno de secundaria fueran las siguientes:
18, 13, 12, 14, 11, 08, 12, 15, 05, 20, 18, 14, 15, 11, 10, 10, 11, 13. Entonces:
La frecuencia absoluta de 11 es 3, pues 11 aparece 3 veces.
La frecuencia relativa de 11 es 0.17, porque corresponde a la divisin 3/18 ( 3 de las
veces que aparece de las 18 notas que aparecen en total).

DISTRIBUCIN DE FRECUENCIAS
La distribucin de frecuencias es una tabla que divide un conjunto de datos en un
numero de clases (categoras) apropiadas, mostrando tambin el nmero de elementos
en cada clase. La tabla sacrifica parte de la informacin contenida en los datos; En
lugar de conocer el valor exacto de cada elemento. Solo sabemos que pertenece a una
clase determinada. Por otra parte, ese tipo de agrupamiento hace resaltar
caractersticas importantes en los datos, y en lo que se gana en legibilidad, compensa
con creces la perdida de informacin. A continuacin consideraremos principalmente las
distribuciones numricas, es decir, distribuciones de frecuencias donde los datos se
hallan agrupados por su tamao: si se hallan agrupados de acuerdo con alguna
cualidad o atributo denominaremos distribucin categrica a esa distribucin.
La primera etapa la construccin de una distribucin de frecuencias consiste en decir en
cuantas clases utilizar y elegir los lmites de cada clase, es decir, de donde a donde
abarca cada una. En general, el nmero de clases que usemos depende del nmero de
observaciones, pero tiene muy poca utilidad utilizar menos de 5 o ms de 15. Depende
de s mismo del rango de los datos, es decir, la diferencia entre la observacin ms
grande y la ms pequea.
Para ejemplificar la construccin de una distribucin de distribucin de frecuencia,
consideramos la siguientes mediciones de la emisin diaria (en toneladas) de xido de
azufre de una planta industrial.
10.5 1526.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2
22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7
22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7

15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0


18.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5
14.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.1
21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8
25.9.9 27.5 18.1 17.9 9.4 24.1 20.1 18.5
En vista de que las observacin ms grande es 31.8, y la ms pequea es 6.2 y el
rango es 25.6, podramos elegir seis clases que tuvieran los limites 5.0-.9.9,10.014.9,...,30.0-34.9. Podramos tambin elegir las siete clases 5.o-8.9, 9.0-12.9,..., 29.031.9. Ntese que en cada caso las clases no se traslapan, incluyen todos los datos y
tienen la misma medida.
Supngase que hemos optado por la segunda de estas clasificaciones; ordenamos las
80 observaciones y obtenemos los resultados que se muestran en la siguiente tabla:
Lmites de clase Etiqueta Frecuencia
5.0-8.9 /// 3
9.0-12.9 //// //// 10
13.0-16.9 //// //// //// 14
17.0-20.9 //// //// //// //// //// 25
21.0-24.9 //// //// //// // 17
25.0-28.9 //// //// 9
29.0-32.9 // 2
Total 80
Obsrvese que los lmites de clase se dan con el mismo nmero de decimales que los
datos originales. Si los datos se hubiesen dado con dos decimales, habramos usado
los lmites de clase 5.00-8.99, 9.00-12.99,..., 29.0-32.99 y, de haber sido redondeados
al entero ms prximo, se habran utilizado los lmites de clase 5-8, 9-12,..., 29-32.
Como sealamos anteriormente, una vez que lo datos han sido agrupados, cada
observacin pierde su identidad en el sentido de que su valor exacto ya no se conoce.
Esto puede originar dificultades cuando queremos dar algunas descripciones ulteriores
de los datos, pero podemos evitarlas representando cada observacin en una clase por
su punto medio, denominando marca de clase. En general, las marcas de clase de una
distribucin de frecuencias se obtiene promediando los lmites de clase consecutivos o
fronteras de clases sucesivas. Si todas las clases de una distribucin tienen la misma
longitud, como en nuestro ejemplo, al intervalo comn entre cuales quiera marcas d
clase sucesivas lo llamaremos intervalo de clase de la distribucin. Ntese que el
intervalo puede obtenerse tambin en la diferencia entre dos fronteras cualquiera de
clase consecutivas, pero no de la diferencia entre los lmites de clases sucesivos.
Ejemplo:

En relacin con el ejemplo de la distribucin de los datos de xido de azufre, indquese,


a) Las marcas de clase y b) el intervalo de clase.
a) Las marcas de clase son 5.0+8.9=6.95 9.0+ 12.9= 10.95, 14.95,
18.95,22.95, 26.95 y 30.95. b) El intervalo de clase es: 10.95 - 6.95 =4.
Existen varias formas alternas de agrupar los datos. Entre estas se encuentran las
distribuciones acumuladas menor que o menor, mayor que y o mayor. Una distribucin
acumulada menor que muestra el nmero total de observaciones que son menores que
los valores dados. Esto deben ser fronteras de clase o lmites de clase apropiados, pero
no pueden ser marcas de clase.
Ejemplo convirtase la distribucin de la emisin del xido de azufre en una distribucin
que muestre cuantas observaciones son menores que 4.95, menores que 8.95,
menores que 12.95, ..., y menor que 3.95.
Como ninguno de los valores es menor que 4.95., menores que 8.95, 3+ 10 =13 son
menores que 12.95, 3-10+ 14 =7 son menores que 16.95, y los 80 valores son menores
que 32.95.
Las distribuciones acumuladas mayor que y o mayor se construyen, de manera similar,
sumando las frecuencias una por una empezando en el otro extremo de la distribucin
de la frecuencia. En la prctica, las distribuciones acumuladas menor que se utilizan
con mayor frecuencia, y es bastante comn referirse a ellas simplemente como
distribuciones acumuladas.
Si se desea comparar distribuciones de frecuencias, puede ser necesario (o al menos
ventajoso), convertidas en distribuciones porcentuales. Basta dividir cada frecuencia de
clase entre la frecuencia total (el nmero total de observaciones en la distribucin), y
multiplicar por cien; en esta forma se indica que porcentaje de los datos esta en cada
clase de la distribucin puede hacerse lo mismo tambin con las distribuciones
acumuladas, convirtindolas as en distribuciones porcentuales acumuladas.

REPRESENTACIN GRAFICA E INTERPRETACIN


Grfica o grfico son las denominaciones de la representacin de datos, generalmente
numricos, mediante recursos grficos (lneas, vectores, superficies o smbolos), para
que se manifieste visualmente la relacin que guardan entre s.

EXISTEN DIFERENTES TIPOS DE GRFICAS, QUE SE PUEDEN CLASIFICAR EN:


GRFICO LINEAL
Se representan los valores en dos ejes cartesianos ortogonales entre s. Las grficas
lineales se recomiendan para representar series en el tiempo, y es donde se muestran
valores mximos y mnimos; tambin se utilizan para varias muestras en un diagrama.

GRFICO

DE

BARRAS

Se usa cuando
se
pretende
resaltar
la
representacin de
porcentajes de
datos
que
componen
un
total. Una grfica
de
barras
contiene barras
verticales que
representan
valores
numricos,
generalmente
usando una hoja
de clculo. Las
grficas de barras
son una manera
de
representar
frecuencias; las frecuencias estn asociadas con categoras. Una grfica de barras se
presenta de dos maneras: horizontal o vertical. El objetivo es poner una barra de largo
(alto si es horizontal) igual a la frecuencia. La grfica de barras sirve para comparar y
tener una representacin grfica de la diferencia de frecuencias o de intensidad de la
caracterstica numrica de inters. Ver archivo Adjunto

HISTOGRAMA
Se emplea para ilustrar muestras agrupadas en intervalos. Est formado por
rectngulos unidos a otros, cuyos vrtices de la base coinciden con los lmites de los
intervalos y el
centro
de
cada
intervalo es la
marca de clase que
representamos
en el eje de las
abscisas.
La
altura
de
cada
rectngulo
es
proporcional a la
frecuencia del
intervalo respectivo.

GRFICO CIRCULAR
Permite ver la distribucin interna de los datos que representan un hecho, en forma de
porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o
menor valor, segn lo que se desee destacar.

PICTOGRAMA
Con imgenes que
representar
el
distribucin de los

sirven
para
comportamiento o la
datos cuantitativos

de una poblacin, utilizando smbolos de tamao proporcional al dato representado.


Una posibilidad es que el grfico sea analgico por ejemplo, la representacin de los
resultados de las elecciones con colores sobre un hemiciclo.

BIBLIOGRAFA:
PAGINAS CONSULTADAS
http://es.wikipedia.org/wiki/Muestreo_%28estad%C3%ADstica%29
http://html.rincondelvago.com/estadistica_51.html
http://www.monografias.com/trabajos73/estadistica-descriptiva/estadisticadescriptiva3.shtml
MEDIDAS
CENTRAL

DE

TENDENCIA

DEFINICIONES:
Las medidas de
tendencia central son
valores que se
ubican al centro de
un conjunto de
datos
ordenados
segn
su
magnitud.
Generalmente
se utilizan 4 de estos
valores tambin conocidos como estadigrafos, la media aritmtica, la mediana, la moda
y al rango medio.
La media aritmtica es la medida de posicin utilizada con ms frecuencia. Si se tienen
n valores de observaciones, la media aritmtica es la suma de todos y cada uno de los
valores dividida entre el total de valores: Lo que indica que puede ser afectada por los
valores extremos, por lo que puede dar una imagen distorsionada de la informacin de
los datos.
La Mediana, es el valor que ocupa la posicin central en un conjunto de datos, que
deben estar ordenados, de esta manera la mitad de las observaciones es menor que la

mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se
poseen observaciones extremas.
La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No
depende de valores extremos, pero es ms variables que la media y la mediana.
Rango Medio es la media de las observaciones menor y mayor. Como intervienen
solamente estas observaciones, si hay valores extremos, se distorsiona como medida
de posicin, pero ofrece un valor adecuado, rpido y sencillo para resumir al conjunto
de datos.

MEDIA ARITMTICA
La medida de tendencia central ms ampliamente usada es la media aritmtica,
usualmente abreviada como la media y denotada por (lase como "X barra").

La media aritmtica para datos no agrupados

Si se dispone de un conjunto de n nmeros, tales como X1, X2, X3,,Xn, la media


aritmtica de este conjunto de datos se define como "la suma de los valores de los ni
nmeros , divididos entre n", lo que usando los smbolos explicados anteriormente ,
puede escribirse como:

EJEMPLO:
Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23,
27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que:

La media aritmtica para datos agrupados

Si los datos se presentan en una tabla de distribucin de frecuencias, no es posible


conocer los valores individuales de cada una de las observaciones, pero si las
categoras en las cuales se hallan. Para poder calcular la media, se supondr que
dentro de cada categora, las observaciones se distribuyen uniformemente dentro
alrededor del punto medio de la clase, por lo tanto puede considerarse que todas las
observaciones dentro de la clase ocurren en el punto medio, por lo expuesto la media
aritmtica para datos agrupados puede definirse de la siguiente manera:
Si en una tabla de distribucin de frecuencia, con r clases, los puntos medio son: X1,
X2, X3,,Xn; y las respectivas frecuencias son f1, f2, f3, , fn, la media aritmtica se
calcula de la siguiente manera:

donde: N = nmero total de observaciones, por tanto fi puede simplificarse y escribirse


como N ( N= fi )
EJEMPLO:
Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de
frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los
siguientes:
Clases 1 2 3 4 5 6
Puntos Medios (Xi) 14,628 29,043 43.458 57,873 72.288 86.703
Frecuencias (fi) 10 4 5 3 3 5
Al calcular la cuenta promedio por cobrar (media aritmtica) de estos datos se tiene lo
siguiente:

Media aritmtica ponderada

Por otro lado, si al promediar los datos estos tienen diferentes pesos, entonces estamos
ante un caso de media aritmtica ponderada, que puede definirse de la siguiente
manera
DEFINICIN:
Sea dado un conjunto de observaciones, tales como X1, X2; X3; ; Xn; y un conjunto
de valores p1, p2; p3; ; pn; asociado con cada observacin Xi respectivamente, que
reciben el nombre de factores de ponderacin, entonces la media ponderada se calcula
como:

MEDIANA
La mediana es una medida de posicin y se define como la posicin central en el
arreglo ordenado de la siguiente manera:
Dado un conjunto de nmeros agrupados en orden creciente de magnitud, la mediana
es el nmero colocado en el centro del arreglo, de tal forma que una mitad de las
observaciones est por encima y la otra por debajo de dicho valor. Si el nmero de
observaciones es par, la mediana es la media de los dos valores que se hallan en el
medio del arreglo, de donde se concluye en la siguiente definicin:
Mediana. Es el punto medio de los valores de una serie de datos despus de haber sido
ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como
posteriores en el arreglo de datos

La mediana para datos agrupados

Si se tiene una distribucin de frecuencias, la mediana es igualmente ese valor que


tiene 50% de las observaciones por debajo y 50 % por encima. Geomtricamente, la
mediana es el valor de X sobre el eje de las abscisas correspondiente a la ordenada
que divide un histograma en dos partes de igual rea.
Para hallar el valor de la mediana, en el caso de datos agrupados debe encontrarse
primero la clase mediana, la que se define como la clase ms baja para la cual la
frecuencia acumulada excede N/2 (siendo N=fi ). Encontrada esta clase, la siguiente
formula servir para hallar el valor de la mediana
N/2 fa
X0.5 = Li + ------------- ( C )
fi

DONDE:
L = lmite inferior de la clase mediana.
N = frecuencia total o fi.
fa = frecuencia absoluta acumulada hasta la clase premediana
fi = frecuencia absoluta de la clase mediana
C = amplitud de la clase mediana.
MODA
A veces es importante conocer cul es el valor que ms prevalece en el conjunto de
datos. El valor que ocurre con ms frecuencia se le conoce como moda. La moda es la
medida de tendencia central especialmente til para describir mediciones de tipo
ordinal, de intervalos y nominal.

En un conjunto de nmeros la moda se define como el valor nmero que ocurre con
ms frecuencia
Ejemplo:
En el siguiente conjunto de nmeros 1, 5, 5, 9, 12, 12, 12, 14. La moda es igual a 12,
por cuanto que es el nmero que ms se repite (tres veces)

LA MODA PARA DATOS AGRUPADOS (MO.):

La Moda puede deducirse de una distribucin de frecuencia o de un histograma a partir


de la frmula.
Mo. = Li + [ ( 1 / 1+2 ) ] C
Donde;
Li = lmite inferior de la clase modal (clase de mayor frecuencia absoluta (fa)
1 = diferencia de las frecuencias absolutas de la clase modal y premodal.
2 = diferencia de las frecuencias absolutas de la clase modal y postmodal
C = amplitud de la clase modal.

Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal,
de intervalos, y relativa).
La moda tiene la ventaja de no ser afectada por valores extremos.
Al igual que la mediana, puede ser calculada en distribuciones con intervalos
abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningn valor aparece ms de
una vez.
En algunas series de datos hay ms de una moda, en este caso uno podra
preguntarse cual es el valor representativo de la serie de datos?

MEDIA GEOMTRICA
Es la raz de ndice de la frecuencia total cuyo radicando es el producto de las potencias
de cada valor de la variable elevado a sus respectivas frecuencias absolutas, se denota
por g; suele utilizarse cuando los valores de la variable siguen una progresin
geomtrica. Tambin para promediar porcentajes, tasas, n ndices, etc. siempre que
nos vengan dados en porcentajes y se calcula mediante la siguiente frmula como la
que se muestra a bajo:
g = n(X1 * X2 * * Xn
Frmula que algunas veces es conveniente expresarla en forma logartmica. El
logaritmo de la media geomtrica es la media aritmtica de los logaritmos de los valores
de la variable. El problema se presenta cuando algn valor es 0 negativo y exponente
de la raz par ya que no exista raz par de un nmero negativo, entonces la frmula
anterior se presenta de la siguiente manera:

log Xg = 1/N (log X1 + log X2 + + log Xn)


Respuesta: la media geomtrica de los datos es 4

Propiedades de la media geomtrica (g)


La media geomtrica esta basada en todas las observaciones, por lo que est
afectada por todos los valores de la variable. Sin embargo, da menos pesos a los
valores extremadamente grandes que el que les da la media aritmtica.
La media geomtrica es igual a cero si algunos de los valores es cero, y se
puede volver imaginaria si ocurren valores negativos. Con la excepcin de estos
dos casos, su valor siempre es definitivo y est rgidamente definido.
La media geomtrica es la que se debe utilizar cuando lo que se va a promediar
son tasas de cambios o proporciones, y se intenta dar igual peso a tasas de
cambios iguales.

MEDIA ARMNICA
Media Armnica, la representaremos como a, es la inversa de la media aritmtica de
las inversas de los valores de la variable, responde a la siguiente definicin:
Si se tiene un conjunto de observaciones tales como: X1, X2, . Xn; la media
armnica, denotada por a, se define como el reciproco de la suma de los valores
inversos de la variable estadstica divididos entre el nmero total de datos y se calcula
con la siguiente frmula

EJEMPLO:
Un automvil que hace viajes de ida y vuelta entre las ciudades A y B, realiza el viaje
entre A y B a razn de 80 Km por hora y el viaje entre B y A a 120 Km por hora, La
velocidad promedio del viaje de ida y vuelta ser de
a = (1/80 + 1/120)/2 = [(120+80)9600]/2 = 19200/200 = 96 km/h
Propiedades de la media armnica

La media armnica se basa en todas las observaciones por lo que est


afectada por todos los valores de la variable. Da a los valores
extremadamente grandes un peso menor que el que les da la media
geomtrica, mientras que a los valores pequeos les da un peso mayor que
el que les da tanto la media aritmtica como la media geomtrica.
La media armnica esta indeterminada si alguno de los valores es cero, pues
hallar el recproco de cero implica dividir entre cero, lo cual no es vlido. La
media armnica est rgidamente definida y siempre es definitiva, excepto
cuando uno de los valores es cero.

La media armnica es el promedio que se ha de usar, cuando lo que se va a


promediar son proporciones donde los numeradores de las razones son los
mismos para todas las proporciones.

BIBLIOGRAFA:
PAGINAS CONSULTADAS
http://www.monografias.com/trabajos43/medidas-tendencia-central/medidas-tendenciacentral2.shtml#ixzz3EBv8qyXx
https://sites.google.com/site/estadisticadm/b-organizacion-y-presentacon-de-datos/b-3medidas-de-tendencia-central
http://fcps.uaq.mx/descargas/prope2014/estadistica/3/tendencia_central_14.pdf

MEDIDAS DE DISPERSIN.
Medidas de dispersin, tambin llamadas medidas de variabilidad, muestran la
variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes
puntuaciones de una variable estn muy alejadas de la media. Cuanto mayor sea ese
valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la media.
As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula
la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero
la suma de las desviaciones es siempre cero, as que se adoptan dos clases de
estrategias para salvar este problema. Una es tomando las desviaciones en valor
absoluto (desviacin media) y otra es tomando las desviaciones al cuadrado (varianza).
RANGO ESTADSTICO

Recorrido estadstico al intervalo entre el valor mximo y el valor mnimo; por ello,
comparte unidades c
En estadstica descriptiva se denomina rango estadstico (R) on los datos. Permite
obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms
dispersos estn los datos de un conjunto.
Por ejemplo, para una serie de datos de carcter cuantitativo, como lo es la estatura
medida en centmetros, tendramos:

es posible ordenar los datos como sigue:

donde la notacin x(i) indica que se trata del elemento i-simo de la serie de datos. De
este modo, el rango sera la diferencia entre el valor mximo (k) y el mnimo; o, lo que
es lo mismo:

En nuestro ejemplo, con cinco valores, nos da que R = 185-155 = 30


El rango o recorrido estadstico es la diferencia entre el valor mximo y el valor mnimo
en un grupo de nmeros aleatorios. Se le suele simbolizar con R.

REQUISITOS DEL RANGO


Ordenamos los nmeros segn su tamao.
Restamos el valor mnimo del valor mximo

Ejemplo Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus
valores se encuentran en un rango de:

MEDIO RANGO O RANGO MEDIO


El medio rango o rango medio de un conjunto de valores numricos es la media del
mayor y menor valor, o la tercera parte del camino entre el dato de menor valor y el dato
de mayor valor. En consecuencia, el medio rango es:

EJEMPLO

Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato de
mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente frmula
sera:

REPRESENTACIN DEL MEDIO RANGO:


Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el
rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo
(X1 Xmin) en un conjunto de datos.
Rango para datos no agrupados;
R = Xmx.-Xmn = Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier ao, a saber: 18,23,
27,34 y 25., para calcular la media aritmtica (promedio de las edades, se tiene que:
R = Xn-X1 ) = 34-18 = 16 aos
Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos
de clases abiertos podemos aproximar el rango mediante el uso de los lmites de
clases. Se aproxima el rango tomando el limite superior de la ltima clase menos el
limite inferior de la primera clase.
Rango para datos agrupados;
R= (lim. Sup. de la clase n lim. Inf. De la clase 1)
Ejemplo:
Si se toman los datos del ejemplo resuelto al construir la tabla de distribucin de
frecuencia de las cuentas por cobrar de Cabreras y Asociados que fueron los
siguientes:
Clases

7.420 21.835

21.835 36.250
36.250 50.665
50.665 65.080
65.080 79.495
79.495 93.910

DESVIACIN TPICA
La varianza a veces no se interpreta claramente, ya que se mide en unidades
cuadrticas. Para evitar ese problema se define otra medida de dispersin, que es la
desviacin tpica, o desviacin estndar, que se halla como la raz cuadrada positiva de
la varianza. La desviacin tpica informa sobre la dispersin de los datos respecto al
valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos. Esta
medida viene representada en la mayora de los casos por S, dado que es su inicial de
su nominacin en ingls.
Desviacin tpica muestral

Desviacin tpica poblacional

-->x = [17 14 2 5 8 7 6 8 5 4 3 15 9]
x = 17. 14. 2. 5. 8. 7. 6. 8. 5. 4. 3. 15. 9.
-->stdev(x)
ans = 4.716311
-->
Primero hemos declarado un vector con nombre X, donde introduzco los nmeros de la
serie. Luego con el comando stdev se hallar la desviacin tpica.

DESVIACIN MEDIA
Estadstica la desviacin absoluta promedio o, sencillamente desviacin media o
promedio de un conjunto de datos es la media de las desviaciones absolutas y es un
resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula:

La desviacin absoluta respecto a la media,


, la desviacin absoluta respecto a la
mediana,
, y la desviacin tpica, , de un mismo conjunto de valores cumplen la
desigualdad:

Siempre ocurre que

donde el Rango es igual a:

El valor:

ocurre cuando los datos son exactamente iguales e iguales a la media aritmtica. Por
otro lado:

cuando solo hay dos valores en el conjunto de datos.

VARIANZA
La varianza es una medida estadstica que mide la dispersin de los valores respecto a
un valor central (media), es decir, es el cuadrado de las desviaciones:

PROPIEDADES

La varianza es siempre positiva o 0:


Si a los datos de la distribucin les sumamos una cantidad constante la varianza no se
modifica.
1

Si a los datos de la distribucin los multiplicamos una constante, la varianza queda


multiplicada por el cuadrado de esa constante.

Propiedad distributiva:

cov

REFERENCIAS.
http://es.wikipedia.org/w/index.php?title=Desviacin_media&oldid=75959388
Categora:
http://es.wikipedia.org/w/index.php?title=Desviacin_media&oldid=75959388
Categora:
Wikipedia:Artculos que necesitan referencias
http://www.monografias.com/trabajos43/medidas-dispersion/medidasdispersion.shtml#ixzz3FVJDlxLe
http://www.monografias.com/trabajos43/medidas-dispersion/medidasdispersion.shtml#ixzz3FVJDlxLe

MEDIDAS DE FORMA
SESGO
En estadstica se llama sesgo de un estimador a la diferencia entre su esperanza
matemtica y el valor numrico del parmetro que estima. Un estimador cuyo sesgo es
nulo se llama insesgado o centrado.
En notacin matemtica, dada una muestra
del parmetro muestral , el sesgo es:

y un estimador

El no tener sesgo es una propiedad deseable de los estimadores. Una propiedad


relacionada con sta es la de la consistencia: un estimador puede tener un sesgo pero
el tamao de ste converge a cero conforme crece el tamao muestral.
Dada la importancia de la falta de sesgo, en ocasiones, en lugar de estimadores
naturales se utilizan otros corregidos para eliminar el sesgo. As ocurre, por ejemplo,
con la varianza muestral.
Formula para datos agrupados

Formula para datos agrupados

Otra propiedad razonable que podemos pedir al estimador de un parmetro es que,


en promedio, sus valores coincidan con . Cuando sucede esto decimos que el
estimador es centrado o insesgado.
Un smil coloquial que suele aplicarse a la estimacin puntual es considerarla como un
ejercicio de tiro a una diana. En este sentido, el centro de la diana sera el parmetro a
estimar (). De manera los disparos de un tirador insesgado estaran centrados
alrededor del centro de la diana. Mientras que los disparos de un tirador sesgado
estaran sistemticamente desviados de la diana (como sucedera si el can de
nuestra arma no estuviese recto).

Tirador insesgado

Tirador sesgado

Podemos fijarnos que en la diana del tirador insesgado, el centro de masas de los
disparos coincide con el centro de la diana (que representa el verdadero valor del
parmetro). Como ya vimos anteriormente, el concepto de centro de masas est
relacionado con la esperanza de una variable aleatoria y, precisamente as, obtenemos
la definicin formal de estimador insesgado: un estimador T de un parmetro diremos
que es centrado o insesgado si su esperanza es precisamente .

Si, al contrario, tenemos un estimador U sesgado, la desviacin respecto al verdadero


valor a estimar se mide por el sesgo:

De manera que el sesgo de un estimador puede ser:

Positivo: Si producen, en promedio, estimaciones por exceso.

Cero: Si es un estimador centrado o insesgado.

Negativo: Si producen, en promedio, estimaciones por defecto.

Un ejemplo de estimador insesgado es la media aritmtica, que es un estimador


insesgado de la esperanza de una variable aleatoria.

Un ejemplo de estimador sesgado es la varianza muestral, que es un estimador


sesgado de la varianza poblacional.

Por tanto

Con lo que el sesgo de este estimador ser

Es decir, el sesgo es negativo y, por tanto, la varianza muestral es un estimador de la


varianza poblacional sesgado por defecto. Por dicha razn, suele utilizarse la llamada
varianza muestral corregida como estimador de la varianza poblacional:

que se comprueba trivialmente que s es un estimador insesgado.

APUNTAMIENTO
CURTOSIS O APUNTAMIENTO
La curtosis mide el grado de agudeza o achatamiento de una distribucin con relacin a
la distribucin normal, es decir, mide cun puntiaguda es una distribucin.
TIPOS DE CURTOSIS
La curtosis determina el grado de concentracin que presentan los valores en la regin
central de la distribucin. As puede ser:
Leptocrtica.- Existe una gran concentracin.
Mesocrtica.- Existe una concentracin normal.
Platicrtica.- Existe una baja concentracin.

MEDIDAS DE CURTOSIS
Medida de Fisher
Para datos sin agrupar se emplea la siguiente frmula:
Para datos agrupados en tablas de frecuencias se emplea la siguiente frmula:
Para datos agrupados en intervalos se emplea la siguiente frmula:

Donde: = cada uno de los valores; n = nmero de datos; = media aritmtica;


=
Cudruplo de la desviacin estndar poblacional; f = frecuencia absoluta; xm = marca
de clase
nota
Si a < 3 ? la distribucin es platictica
Si a = 3 ? la distribucin es normal o mesocrtica
Si a > 3 ? la distribucin es leptocrtica
Medida basada en Cuartiles y Percentiles

(letra griega minscula kappa) = Coeficiente percentil de curtosis


Nota:
Si < 0,263 ? la distribucin es platicrtica
Si = 0,263 ? la distribucin es normal o mesocrtica
Si > 0,263 ? la distribucin es leptocrtica
Esta medida no es muy utilizada.
Ejemplo ilustrativo: Determinar qu tipo de curtosis tiene la siguiente distribucin: 6, 9,
9, 12, 12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Solucin: Calculando la media aritmtica se obtiene

Calculando la desviacin estndar poblacional se obtiene:

MOMENTOS
Los momentos potenciales o muestrales son valores que caracterizan a una muestra
aleatoria. Los momentos muestrales aproximan a los momentos de la distribucin, estos
ltimos tienen la propiedad de que dos distribuciones de probabilidad son iguales si
tienen todos sus momentos iguales.
Los momentos de una muestra forman una sucesin de nmeros, para cada nmero
natural r se define puede definir el momento r-ensimo.
MOMENTOS RESPECTO AL ORIGEN
Los momentos muestrales estndar o centrados respecto al origen se calculan de la
siguiente manera. Dada una muestra aleatoria de tamao N el momento muestral rsimo se calcula mediante:

Donde:
son los diferentes valores que aparecen en la muestra.
es el nmero de veces que se presenta el valor en la muestra.
es el nmero total de elementos de la muestra.
De modo que se cumple que el momento de orden 0 con respecto al origen vale 1 y el
momento de orden 1 con respecto al origen es la media aritmtica:

MOMENTOS RESPECTO A LA MEDIA O CENTRALES

Se cumple que el momento de orden 0 con respecto a la media vale 1, el momento de


orden 1 con respecto a la media vale 0 y el momento de orden 2 con respecto a la
media es la varianza.

Los momentos de rdenes 3 y 4 con respecto a la media se emplean en el clculo de


los coeficientes de asimetra y curtosis respectivamente.

BIBLIOGRAFA
http://cetis112samsprobabilidadunidad2.blogspot.mx/2011/09/medidas-de-formasesgo.html
http://cetis112samsprobabilidadunidad2.blogspot.mx/2011/09/apuntamiento.html
http://cetis112samsprobabilidadunidad2.blogspot.mx/2011/09/momentos.html

Anda mungkin juga menyukai