Anda di halaman 1dari 43

UNIVERSIDAD CENTROCCIDENTAL

LISANDRO ALVARADO
DECANATO DE INGENIERIA CIVIL






ESTADISTICAS




REALIZADO POR:
Ing. Ana Tatiana Portillo C.I 15.265.233
Ing. Yanmarli Sanchez C.I 19.344.069
Ing. Paiva Ciccone C.I 19.355.106


NOVIEMBRE 2013

INTRODUCCIN


Desde los comienzos de la civilizacin han existido formas sencillas
de estadstica, pues ya se utilizaban representaciones grficas y otros
smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar
el nmero de personas, animales o ciertas cosas.
En nuestros das, la estadstica se ha convertido en un mtodo
efectivo para describir con exactitud los valores de datos econmicos,
polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como
herramienta para relacionar y analizar dichos datos. El trabajo del experto
estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo
en el proceso de interpretacin de esa informacin. El desarrollo de la teora
de la probabilidad ha aumentado el alcance de las aplicaciones de la
estadstica.
Muchos conjuntos de datos se pueden aproximar, con gran exactitud,
utilizando determinadas distribuciones probabilsticas; los resultados de
stas se pueden utilizar para analizar datos estadsticos. La probabilidad es
til para comprobar la fiabilidad de las inferencias estadsticas y para
predecir el tipo y la cantidad de datos necesarios en un determinado estudio
estadstico.
.



OBJETIVO GENERAL:
La estadstica tiene por objeto el desarrollo de tcnicas para el
conocimiento numrico de un conjunto para hacer inferencia acerca de una
poblacin con base a la informacin obtenida en una muestra

MTODOS ESTADSTICOS:
El mtodo estadstico consiste en una serie de procedimientos para el
manejo de los datos cualitativos y cuantitativos de la investigacin.
Las caractersticas que adoptan los procedimientos propios del
mtodo estadstico dependen del diseo de investigacin seleccionado para
la comprobacin de la consecuencia verificable en cuestin.
El mtodo estadstico tiene las siguientes etapas:
Recoleccin (medicin)
Recuento (computo)
Presentacin
Descripcin
Anlisis
Tales etapas siempre se encuentran en el orden descrito y cada una de ellas
consiste de manera resumida en lo siguiente:

RECOLECCIN (MEDICIN): En esta etapa se recoge la informacin
cualitativa y cuantitativa sealada en el diseo de la investigacin. En vista
que los datos recogidos suelen tener diferentes magnitudes o intensidades

en cada elemento observado (por ejemplo densidad y porcentaje de asfalto
en una mezcla asfltica), a dicha informacin o datos tambin se le conoce
como variable.
La recoleccin o medicin de datos en ocasiones se puede adquirir por
simple observacin tambin existen losa casos donde se grequiere de
complejos procedimientos de medicin; en algunas ocasiones basta con una
sola medicin y en otras se requiere una serie de ellas a lo largo de amplios
periodos de tiempo.

La calidad tcnica de esta etapa es fundamental ya que de ella depende que
se disponga de datos exactos y confiables en los cuales se fundamenten las
conclusiones de toda la investigacin.

Es tan grande la importancia de esta etapa que alguna clasificacin es de las
investigaciones se basan en la forma en que ocurre la medicin: por ejemplo
si la medicin es recogida en una sola ocasin suele decirse que la
investigacin es transversal; en cambio si la informacin es recogida a lo
largo del tiempo se denomina longitudinal a la investigacin.

En ocasiones, la recoleccin de la informacin debe ocurrir en grupos tan
grandes de individuos que se hace impartido tratar de abarcar a todos ellos;
entonces es cuando se pone en prctica procedimientos de muestreo. Tales
procedimientos de muestreo estn subordinados a la consecuencia
verificable que se desea comprobar y al diseo de investigacin
seleccionado.


Recuento (computo) En esta etapa del mtodo estadstico la
informacin recogido es sometida a revisin clasificacin y computo
numrico.
A veces el recuento puede realizarse de manera muy simple, por ejemplo
con rayas o palotes; en otras ocasiones se requiere del empleo de tarjetas
con los datos y, en investigaciones con mucha informacin y muchos casos
puede requerirse de computadoras y programas especiales para el manejo
de base de datos.
En trminos generales puede decirse que el recuento consiste en la
cuantificacin de la frecuencia con que aparecen las diferentes
caractersticas medidas en los elementos en estudio; por ejemplo el nmero
de personas de sexo femenino y el de personas de sexo masculino o el
nmero de nios con peso menor de 3 kilos y el nmero de nios con peso
igual o mayor a dicha cifra.
Presentacin: En esta etapa del mtodo estadstico se elaboran los
cuadros y los grficos que permiten una inspeccin precisa y rpida de los
datos.

La elaboracin de cuadros que tambin suele llamarse tablas, tiene por
propsito acomodar los datos de manera que se pueda efectuar una revisin
numrica precisa de los mismos.
La elaboracin de grficos tiene por propsito facilitar la inspeccin visual
rpida de la informacin, casi siempre a cada cuadro con datos le puede
corresponder una grfica pertinente que represente la misma informacin.

Presentar la misma informacin tanto en tabla como en su correspondiente
grfico permite obtener una clara idea de la distribucin de las frecuencias
de las caractersticas estudiadas.
Descripcin: En esta etapa la informacin es resumida en forma de
medidas que permiten expresar de manera sinttica las principales
propiedades numricas de grandes series o agrupamiento de datos.

La condensacin de la informacin, en forma de medidas llamadas de
resumen, tiene por propsito facilitar la comprensin global de las
caractersticas fundamentales de los agrupamientos de datos.
Tales medidas de resumen, al ser comunicadas, permiten a los
interlocutores evocar de una misma esencia de los datos.

DEFINICION DE VARIABLES
En probabilidad y estadstica, una variable aleatoria o variable estocstica
es una variable estadstica cuyos valores se obtienen de mediciones en
algn tipo de experimento aleatorio. Formalmente, una variable aleatoria es
una funcin, que asigna eventos.
Los valores posibles de una variable aleatoria pueden representar los
posibles resultados de un experimento an no realizado, o los posibles
valores de una cantidad cuyo valor actualmente existente es incierto
Intuitivamente, una variable aleatoria puede tomarse como una cantidad
cuyo valor no es fijo pero puede tomar diferentes valores; una distribucin de
probabilidad se usa para describir la probabilidad de que se den los
diferentes valores.

Las variables aleatorias suelen tomar valores reales, pero se pueden
considerar valores aleatorios como valores lgicos, funciones. El trmino
elemento aleatorio se utiliza para englobar todo ese tipo de conceptos
relacionados. Un concepto relacionado es el de proceso estocstico, un
conjunto de variables aleatorias ordenadas (habitualmente por orden o
tiempo).

TIPOS DE VARIABLES
Segn la medicin
Variables cualitativas
Son las variables que expresan distintas cualidades, caractersticas o
modalidad. Cada modalidad que se presenta se denomina atributo o
categora, y la medicin consiste en una clasificacin de dichos atributos.
Las variables cualitativas puede ser dicotmicas cuando slo pueden tomar
dos valores posibles, como s y no, hombre y mujer o ser politmicas
cuando pueden adquirir tres o ms valores. Dentro de ellas podemos
distinguir:
Variable cualitativa ordinal o variable cuasicuantitativa: La
variable puede tomar distintos valores ordenados siguiendo una escala
establecida, aunque no es necesario que el intervalo entre mediciones sea
uniforme, por ejemplo: leve, moderado, fuerte.
Variable cualitativa nominal: En esta variable los valores no pueden
ser sometidos a un criterio de orden, como por ejemplo los colores.

Variables cuantitativas
Son las variables que toman como argumento, cantidades numricas, son
variables matemticas. Las variables cuantitativas adems pueden ser:
Variable discreta : Es la variable que presenta separaciones o
interrupciones en la escala de valores que puede tomar. Estas separaciones
o interrupciones indican la ausencia de valores entre los distintos valores
especficos que la variable pueda asumir. Ejemplo: El nmero de hijos (1, 2,
3, 4, 5).
Variable continua: Es la variable que puede adquirir cualquier valor
dentro de un intervalo especificado de valores. Por ejemplo la densidad
generada en campo de una mezcla asfltica (2,5 ton/m, 2,7 ton/m , 2,59
ton/m, 2,47 ton/m ) Solamente se est limitado por la precisin del aparato
medidor, en teora permiten que exista un valor entre dos variables.
Segn la influencia: Segn la influencia que asignemos a unas variables
sobre otras, podrn ser:
Variables independientes: Una variable independiente es aquella cuyo
valor no depende de otra variable. La variable independiente se representa
en el eje de abscisas.
Son las que el investigador escoge para establecer agrupaciones en el
estudio, clasificando intrnsecamente a los casos del mismo. Un tipo especial
son las variables de control, que modifican al resto de las variables
independientes y que de no tenerse en cuenta adecuadamente pueden
alterar los resultados por medio de un sesgo.

Es aquella caracterstica o propiedad que se supone ser la causa del
fenmeno estudiado. En investigacin experimental se llama as a la variable
que el investigador manipula.
Variables dependientes: Una variable dependiente es aquella cuyos
valores dependen de los que tomen otra variable, en una funcin se suele
representar por Y, La variable dependiente se representa en el eje
ordenadas. Son las variables de respuesta que se observan en el estudio y
que podran estar influidas por los valores de las variables independientes.
Variables intervinientes: Son aquellas caractersticas o propiedades que,
de una manera u otra, afectan el resultado que se espera y estn vinculadas
con las variables independientes y dependientes.
Variables moderadoras: Segn Tuckman; Representan un tipo especial de
variable independiente, que es secundaria, y se selecciona con la finalidad
de determinar si afecta la relacin entre la variable independiente primaria y
las variables dependientes. Son las variables que expresan distintas
cualidades, caractersticas o modalidad. Cada modalidad que se presenta se
denomina atributo o categora y la medicin consiste en una clasificacin de
dichos atributos. Las variables cualitativas pueden ser dicotmicas cuando
slo pueden tomar dos valores posibles como s y no, hombre y mujer o son
politmicas cuando pueden adquirir tres o ms valores.

DISTRIBUCION DE FRECUENCIAS
En estadstica, se le llama distribucin de frecuencias a la agrupacin de
datos en categoras mutuamente excluyentes que indican el nmero de

observaciones en cada categora Esto proporciona un valor aadido a la
agrupacin de datos. La distribucin de frecuencias presenta las
observaciones clasificadas de modo que se pueda ver el nmero existente
en cada clase. Estas agrupaciones de datos suelen estar agrupadas en
forma de tablas.
Caractersticas
Una distribucin de frecuencias es un formato tabular en la que se
organizan los datos en clases, es decir, en grupos de valores que describen
una caracterstica de los datos y muestra el nmero de observaciones del
conjunto de datos que caen en cada una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En
principio, en la tabla de frecuencias se detalla cada uno de los valores
diferentes en el conjunto de datos junto con el nmero de veces que
aparece, es decir, su Frecuencia. Se puede complementar la frecuencia
absoluta con la denominada frecuencia relativa, que indica la frecuencia en
porcentaje sobre el total de datos. En variables cuantitativas se distinguen
por otra parte la frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representar grficamente en un histograma
(Diagrama De Barras). Normalmente en el eje vertical se coloca las
frecuencias y en el horizontal los intervalos de Caractersticas .Una
distribucin de frecuencias es un formato tabular en la que se organizan los
datos en clases, es decir, en grupos de valores que describen una
caracterstica de los [datos] y muestra el nmero de observaciones del
conjunto de datos que caen en cada una de las clases.

La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En
principio, en la tabla de frecuencias se detalla cada uno de los valores
diferentes en el conjunto de datos junto con el nmero de veces que
aparece, es decir, su Frecuencia. Se puede complementar la frecuencia
absoluta con la denominada frecuencia relativa, que indica la frecuencia en
porcentaje sobre el total de datos. En variables cuantitativas se distinguen
por otra parte la frecuencia simple y la frecuencia acumulada.
Tipos de frecuencias
Frecuencia absoluta. Es el nmero de veces que aparece un determinado
valor en un estudio estadstico. Se representa por ni. La suma de las
frecuencias absolutas es igual al nmero total de datos, que se representa
por N. Para indicar resumidamente estas sumas se utiliza la letra griega
(sigma mayscula) que se lee suma o sumatoria. Puesto que es mentira se
hace el intercambio en la interfaz de la frecuencia absoluta.
Frecuencia relativa. Es el cociente entre la frecuencia absoluta de un
determinado valor y el nmero total de datos. Se puede expresar en tantos
por ciento y se representa por fi. La suma de las frecuencias relativas es
igual a 1, siempre y cuando no sea igual que 7 o por debajo de los 7
primeros nmeros sucesivos.
Frecuencia acumulada .Es la suma de las frecuencias absolutas de todos
los valores inferiores o iguales al valor considerado. Se representa por Fa.
Frecuencia relativa acumulada .Es el cociente entre la frecuencia
acumulada de un determinado valor y el nmero total de datos. Se puede
expresar en tantos por ciento.

Histograma
En estadstica, un histograma es una representacin grfica de una variable
en forma de barras, donde la superficie de cada barra es proporcional a la
frecuencia de los valores representados, ya sea en forma diferencial o
acumulada. Sirven para obtener una "primera vista" general, o panorama, de
la distribucin de la poblacin, o la muestra, respecto a una caracterstica,
cuantitativa y continua, de la misma y que es de inters para el observador
(como la longitud o la masa). De esta manera ofrece una visin en grupo
permitiendo observar una preferencia, o tendencia, por parte de la muestra o
poblacin por ubicarse hacia una determinada regin de valores dentro del
espectro de valores posibles (sean infinitos o no) que pueda adquirir la
caracterstica.
As pues, podemos evidenciar comportamientos, observar el grado de
homogeneidad, acuerdo o concisin entre los valores de todas las partes
que componen la poblacin o la muestra, o, en contraposicin, poder
observar el grado de variabilidad, y por ende, la dispersin de todos los
valores que toman las partes, tambin es posible no evidenciar ninguna
tendencia y obtener que cada miembro de la poblacin toma por su lado y
adquiere un valor de la caracterstica aleatoria-mente sin mostrar ninguna
preferencia o tendencia, entre otras cosas.


En el eje vertical se representan las frecuencias, es decir, la cantidad de
poblacin o la muestra, segn sea el caso, que se ubica en un determinado
valor o sub-rango de valores de la caracterstica que toma la caracterstica
de inters, evidentemente, cuando este espectro de valores es infinito o muy
grande el mismo es reducido a slo una parte que muestre la tendencia o
comportamiento de la poblacin, en otras ocasiones este espectro es
extendido para mostrar el alejamiento o ubicacin de la poblacin o la
muestra analizada respecto de un valor de inters.
En general se utilizan para relacionar variables cuantitativas continuas, pero
tambin se lo suele usar para variables cuantitativas discretas, en cuyo caso
es comn llamarlo diagrama de frecuencias y sus barras estn separadas,
esto es porque en el "x" ya no se representa un espectro continuo de
valores, sino valores cuantitativos especficos como ocurre en un diagrama
de barras cuando la caracterstica que se representa es cualitativa o
categrica. Su utilidad se hace ms evidente cuando se cuenta con un gran
nmero de datos cuantitativos y que se han agrupado en intervalos de clase.
Ejemplos de su uso es cuando se representan franjas de edades o altura de
la muestra, y, por comodidad, sus valores se agrupan en clases, es decir,
valores continuos. En los casos en los que los datos son cualitativos (no-
numricos), como sexto grado de acuerdo o nivel de estudios, es preferible
un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y
econmicas que en ciencias naturales y exactas. Y permite la comparacin
de los resultados de un proceso.


Tipos de histograma: Diagramas de barras simples
Representa la frecuencia simple (absoluta o relativa) mediante la altura de la
barra la cual es proporcional a la frecuencia simple de la categora que
representa.
Diagramas de barras compuesta: e usa para representar la
informacin de una tabla de doble entrada o sea a partir de dos variables, las
cuales se representan as; la altura de la barra representa la frecuencia
simple de las modalidades o categoras de la variable y esta altura es
proporcional a la frecuencia simple de cada modalidad.
Diagramas de barras agrupadas: Se usa para representar la
informacin de una tabla de doble entrada o sea a partir de dos variables, el
cual es representado mediante un conjunto de barras como se clasifican
respecto a las diferentes modalidades.
Polgono de frecuencias: Es un grfico de lneas que de las
frecuencias absolutas de los valores de una distribucin en el cual la altura
del punto asociado a un valor de las variables es proporcional a la frecuencia
de dicho valor.
Ojiva porcentual: Es un grfico acumula, el cual es muy til cuando
se quiere representar el rango porcentual de cada valor en una distribucin
de frecuencias.
En los grficos las barras se encuentran juntas y en la tabla los nmeros
poseen en el primer miembro un corchete y en el segundo un parntesis.


Pol gono de frecuenci a
Polgono de frecuencia es el nombre que recibe una clase de grafico que se
crea a partir de un histograma de frecuencia. Estos histogramas emplean
columnas verticales para reflejar frecuencia: El polgono de frecuencia es
realizado uniendo los puntos de mayor altura de estas columnas
Es decir, por lo tanto, podramos establecer que un polgono de frecuencia
es aquel que se forma a partir de la unin de los distintos puntos medios de
las cimas de las columnas que configuran lo que es un histograma de
frecuencia. Este se caracteriza porque utiliza siempre lo que es un
histograma de frecuencia. Este se caracteriza porque utiliza siempre lo que
son columnas de tipo vertical y porque nunca debe haber espacios entre lo
que son unas y otras.
En las ciencias sociales, en las ciencias naturales y tambin en las
econmicas es donde con ms frecuencia se hace uso de estos
mencionados histogramas ya que se emplean para llevar a cabo lo que es la
comparacin de los resultados de un proceso determinado.

Se conoce como polgonos de frecuencia para datos agrupados a aquellos
que se desarrollan mediante la maraca de la clase que tiene coincidencia
con el punto medio de las distintas columnas del histograma. En el momento
de la representacin de todas las frecuencias que forman parte de una tabla
de datos agrupados, se genera el histograma de frecuencias acumuladas
que posibilita la diagramacin del polgono correspondiente.

Los polgonos de frecuencia se suelen usar cuando se pretende retratar
varias distribuciones distintas o la clasificacin cruzada de una variable
continua con una cualitativa o cuantitativa discreta en el mismo dibujo.
El punto de ms atura de un polgono de frecuencia equivale a la mayor
frecuencia, mientras que el rea que se sita debajo de la curva incluye
todos los datos que existen. Cabe recordar que la frecuencia es la repeticin
mayor o menor de un evento, o el nmero de veces que un acontecimiento
peridico se reitera en una unidad temporal
Dado el valor y la utilidad que tienen los citados polgonos hay que resaltar
que estos se pueden confeccionar de una manera muy sencilla y rpida. En
concreto, se da la oportunidad de acometerlos mediante un programa
informtico que se ha convertido en uno de los ejes claves del
funcionamiento de cualquier empresa. Nos estamos refiriendo al software
conocido como Excel.
Este es un programa, de Microsoft Office, que se confeccion con el claro
objetivo de que sus usuarios pudieran trabajar con lo que son hojas de
clculo. Por tal motivo, es lgico que tambin permita la posibilidad de crear
polgonos de frecuencia a la hora de comparar cifras y tomar decisiones en
base a las mismas.
En concreto, para conseguir crear los mismos con Excel se tiene que partir
de la existencia de una serie de grficos que se hayan confeccionado
previamente para seguidamente desarrollar un conjunto de acciones que
den lugar a aquellos.


MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia es conveniente resumir
la informacin con un solo nmero. Este nmero que, para tal fin, suele
situarse hacia el centro de la distribucin de datos se denomina medida o
parmetro de tendencia central o de centralizacin. Cuando se hace
referencia nicamente a la posicin de estos parmetros dentro de la
distribucin, independientemente de que sta est ms o menos centrada,
se habla de estas medidas como medidas de posicin.
1
En este caso se
incluyen tambin los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:
Media.
Media ponderada.
Media geomtrica.
Media armnica.
Mediana.
Moda.
Se debe tener en cuenta que existen variables cualitativas y variables
cuantitativas, por lo que las medidas de posicin o medidas de tendencia
se usan de acuerdo al tipo de variable que se est observando, en este caso
se observan variables cuantitativas.
MEDIDAS DE DISPERSION: tambin llamadas medidas de variabilidad,
muestran la variabilidad de una distribucin, indicando por medio de un
nmero, si las diferentes puntuaciones de una variable estn muy alejadas
de la mediana media. Cuanto mayor sea ese valor, mayor ser la

variabilidad, cuanto menor sea, ms homognea ser a la mediana media.
As se sabe si todos los casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media,
se calcula la media de las desviaciones de las puntuaciones respecto a la
media aritmtica. Pero la suma de las desviaciones es siempre cero, as que
se adoptan dos clases de estrategias para salvar este problema. Una es
tomando las desviaciones en valor absoluto (Desviacin media) y otra es
La variabilidad es la caracterstica ms importante de la distribucin. Ya
que ser constituye en un eficaz test de validacin referido al nivel de
significacin de las medidas de posicin.
Las distintas medidas de Variabilidad estn dirigidas a mensurar los desvos
con respecto a un valor central. la media aritmtica.
Las que ms estudiaremos es :
La varianza o variancia.
La dispersin o desviacin Standard
El desvo medio
La semidesviacion intercuartilica
Las tres primeras se refieren a la media aritmtica. En cambio la ltima trata
de analizar el espacio existente entre el tercer y el primer cuartil obteniendo
as una medida diferente no relacionada con la media aritmtica.
A diferencia del captulo anterior veremos que recurriremos a la Variancia y a
la Dispersin. Mientras que el desvo medio trata de evitar la compensacin
calculando los desvos en valores absolutos.


La varianza
La varianza resulta ser el promedio cuadrado de las distancias entre la
media aritmtica y cada uno de los valores de la variable.
Varianza de una distribucin es la Media Aritmtica de los desvos
cuadrados de los valores de la variable con respecto a la media aritmtica de
esa distribucin.
Propiedades de la Varianza
Unidad de medida de la variable es el cuadro de la unidad de medida
de la variable.
La varianza de una constante es =0
Ya que como es un constante todos los desvos respecto a si misma es cero
La varianza de una suma de variables es igual a la suma de la varianza de
las variables dadas. Si y solo si las Variables son independientes.
la varianza de una constante ms una variable es = a la varianza de la
Variable.
Dispersin: surge en consecuencia de solucionar la obtencin de la medida
expresada en el cuadro de la unidad de medida de la variable con lo que
resulta compleja su interpretacin.
Sea pues, la raz cuadrada de la anterior.
Propiedades de la dispersin
Es la misma unidad de media de la variable.
La disp. De una constante es = 0
La disp. De una suma de variables no es igual a la suma de las
dispersiones de las variables

La disp de una variable mas cuna K, es igual a la dispersin de la
variable.
La disp del producto de una variable por K, es = a esa constante por
la dispersin de la variable.

LA DISPERSION COMO MEDIDA DE LA REPRESENTATIVIDAD
DE LA MEDIA ARITMETICA
La Media Aritmtica tendr ms valor como centro de gravedad, esto es,
ser ms representativa la distribucin cuanto menor sea la si dispersin.
Dado dos distribuciones que tienen igual Media Aritmtica, gozara de mayor
representatividad, la Media de aquella distribucin para la que la dispersin
es menor.
Teorema de BIENAYME-CHEBYCHEV
Dice que la probabilidad de encontrar desvos con respecto a la Media
Aritmtica, que en valores absolutos sean inferiores o iguales a K veces la
dispersin, es siempre mayor que:
1- 1
k
K = Ctte. Cualquiera
Resulta evidente que cuanto mayor sea el valor de dispersin que
corresponde a una distribucin dad, ms grandes sern los desvos para
mantener constante la mencionada probabilidad.



MEDIA:
Vamos a estudiar en este apartado los distintos tipos de media que hemos
detallado en el apartado anterior
Media aritmtica:
La media aritmtica de una variable se define como la suma ponderada de
los valores de la variable por sus frecuencias relativas y lo denotaremos por
y se calcula mediante la expresin:
x
i
representa el valor de la variable o en su
caso la marca de clase.
Propiedades:
1. Si multiplicamos o dividimos todas las observaciones por un mismo
nmero, la media queda multiplicada o dividida por dicho nmero.
2. Si le sumamos a todas las observaciones un mismo nmero, la media
aumentar en dicha cantidad.
3. Adems de la media aritmtica existen otros conceptos de media,
como son la media geomtrica y la media armnica.
Media geomtrica:
La media geomtrica de N observaciones es la raz de ndice N del producto
de todas las observaciones. La representaremos por G.


Solo se puede calcular si no hay observaciones negativas. Es una medida
estadstica poco o nada usual.
Media armnica:
La media armnica de N observaciones es la inversa de la media de las
inversas de las observaciones y la denotaremos por H

Al igual que en el caso de la media geomtrica su utilizacin es bastante
poco frecuente.
MEDIANA
La mediana es el valor central de la variable, es decir, supuesta la muestra
ordenada en orden creciente o decreciente, el valor que divide en dos partes
la muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta
o continua.
Clculo de la mediana en el caso discreto:
Tendremos en cuenta el tamao de la muestra.

Si N es Impar, hay un trmino central, el trmino que ser el valor de
la mediana.
Si N es Par, hay dos trminos centrales, la mediana ser la
media de esos dos valores
Veamos un ejemplo.
N parN Impar

1,4,6,7,8,9,12,16,20, 24,25,27 N=12 1,4,6,7,8,9,12,16,20, 24,25,27,30
N=13
Trminos Centrales el 6 y 7 9 y 12 Trmino Central el 7 , 12
Me=
Me=12
Clculo de la mediana en el caso contino:
Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula
de la siguiente forma:
Nos vamos a apoyar en un grfico de un histograma de frecuencias
acumuladas.


De donde la mediana vale: donde a
i
es la amplitud
del intervalo
Vemoslo por medio de un ejemplo.
Supongamos los pesos de un grupo de 50 personas se distribuyen de la
siguiente forma:
Li-1 Li ni Ni Como el tamao de la muestra es N=50, buscamos el
intervalo en el que la Frecuencia acumulada es mayor
que 50/2=25, que en este caso es el 3 y aplicamos la
frmula anterior. Luego la Mediana ser
Me=
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50



MODA:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la
que ms se repite, es la nica medida de centralizacin que tiene sentido
estudiar en una variable cualitativa, pues no precisa la realizacin de ningn
clculo.
Por su propia definicin, la moda no es nica, pues puede haber dos o ms
valores de la variable que tengan la misma frecuencia siendo esta mxima.
En cuyo caso tendremos una distribucin bimodal o polimodal segn el caso.
Por lo tanto el clculo de la moda en distribuciones discretas o cualitativas
no precisa de una explicacin mayor; sin embargo, debemos detenernos un
poco en el clculo de la moda para distribuciones cuantitativas continuas.

Apoyndonos en el grfico podemos llegar a la determinacin de la
expresin para la Moda que es:


Otros autores dan una expresin aproximada para la moda que viene dada
por la siguiente expresin:

Veamos su clculo mediante un ejemplo, para ello usaremos los datos del
apartado anterior
Li-1 Li ni Ni

Utilizando la frmula aproximada

45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50

El primer paso en el anlisis de datos, una vez introducidos los mismos, es
realizar un anlisis descriptivo de la muestra. Este anlisis nos permitir
controlar la presencia de posibles errores en la fase de introduccin de los
datos, es decir, detectaremos con l valores fuera de rango (p. ej. un peso
de 498 Kg es claramente un dato extrao), o la presencia de valores
perdidos. Este anlisis inicial tambin nos proporcionar una idea de la
forma que tienen los datos: su posible distribucin de probabilidad con sus
parmetros de centralizacin; media, mediana y moda; as como sus
parmetros de dispersin; varianza, desviacin tpica, etc.


CURTOSIS
ndice que expresa el grado en que una distribucin acumula casos en sus
colas en comparacin con los casos acumulados en las colas de una
distribucin normal con la misma varianza. La curtosis positiva indica que en
las colas de distribucin hay acumulados ms casos que en las colas de
distribucin normal (lo cual suele coincidir con las distribuciones ms
puntiagudas que una distribucin normal).Los ndices de curtosis prximos a
cero indican semejanza con la curva normal.
Los resultados tambin recogen el error tpico del ndice de curtosis, el cual
puede utilizarse para tipificar el valor del ndice de curtosis y poder
interpretarlo como una puntuacin z distribuida aproximadamente
N(0,1).ndices mayores que 1.96 en valor absoluto permiten afirmar que la
distribucin se aleja de la distribucin normal.
SESGO ESTADISTICO
En estadstica se llama sesgo de un estimador a la diferencia entre su
esperanza matemtica y el valor numrico del parmetro que estima. Un
estimador cuyo sesgo es nulo se llama insesgado o centrado.
En notacin matemtica, dada una muestra y un estimador
del parmetro muestral , el sesgo es:


El no tener sesgo es una propiedad deseable de los estimadores. Una
propiedad relacionada con sta es la de la consistencia: un estimador puede

tener un sesgo pero el tamao de ste converge a cero conforme crece el
tamao maestral.
Dada la importancia de la falta de sesgo, en ocasiones, en lugar de
estimadores naturales se utilizan otros corregidos para eliminar el sesgo. As
ocurre, por ejemplo, con la varianza muestral.
Fuentes del sesgo en las ciencias experimentales
En el diseo y elaboracin de un estudio de investigacin en clnica, puede
haber distintos tipos de sesgos:
de seleccin: debido a que los grupos no comparables a causa de
cmo se eligieron los pacientes o sujetos.
de informacin: debido a que los grupos no comparables a causa de
cmo se obtuvieron los datos.
de confusin: debido a una mezcla de efectos debido a una tercera
variable (variable de confusin).








EJERCICIO
Se tiene la recoleccin de datos de una mezcla de una planta productora de
mezcla, al que se satisface una obra determinada, sin cambios ni
alteraciones al diseo seleccionado. Determinar las medidas de tendencia
central para las densidades con datos no agrupados y agrupados.

Abrilc
N Gm VAM Vv Vll %Gmb %Raice Espesor Prog. %Pb Gmb Gse RAICE
1 2.55 15% 5% 69% 99% 95% 6.85 0+060 5% 2.57 2.94 2.68
2 2.57 14% 4% 72% 100% 96% 7.05 0+200 5% 2.57 2.94 2.68
3 2.59 14% 3% 76% 100% 97% 7.15 0+400 5% 2.57 2.94 2.68
4 2.47 18% 8% 56% 96% 92% 4.73 0+600 5% 2.57 2.94 2.68
5 2.55 15% 5% 68% 99% 95% 6.51 0+800 5% 2.57 2.93 2.68
6 2.58 14% 3% 78% 100% 97% 5.98 1+000 5% 2.57 2.91 2.66
7 2.53 16% 5% 68% 98% 95% 6.95 1+200 5% 2.57 2.92 2.66
8 2.47 18% 8% 57% 96% 93% 6.89 1+400 5% 2.57 2.93 2.67
9 2.53 16% 5% 68% 99% 95% 6.13 1+600 5% 2.56 2.92 2.66
10 2.47 18% 8% 57% 96% 92% 6.38 1+800 5% 2.57 2.93 2.67
11 2.50 17% 6% 61% 97% 94% 8.15 2+000 5% 2.57 2.93 2.67
12 2.58 14% 4% 73% 100% 96% 7.36 2+200 5% 2.57 2.92 2.68
13 2.55 15% 4% 72% 99% 96% 5.17 2+400 5% 2.57 2.92 2.66
14 2.57 14% 4% 75% 100% 97% 8.89 2+600 5% 2.57 2.92 2.66
15 2.56 15% 4% 75% 100% 96% 7.23 2+800 5% 2.56 2.92 2.66
16 2.48 17% 7% 57% 97% 93% 5.42 3+000 5% 2.56 2.93 2.68
17 2.56 15% 4% 70% 100% 96% 8.35 3+200 5% 2.56 2.93 2.68

18 2.51 16% 6% 63% 98% 94% 5.85 3+400 5% 2.57 2.93 2.67
19 2.56 14% 4% 75% 100% 96% 5.65 3+600 5% 2.57 2.91 2.66
20 2.56 15% 4% 74% 100% 96% 9.13 3+800 5% 2.57 2.91 2.66
21 2.55 15% 5% 70% 99% 96% 6.70 4+000 5% 2.56 2.93 2.67
22 2.49 17% 7% 61% 97% 93% 5.78 4+200 5% 2.56 2.93 2.67
23 2.48 17% 7% 59% 97% 93% 7.80 4+380 5% 2.56 2.93 2.67

Con la toma de datos realizada a la planta de produccin de MAC, se realiza
una distribucin de frecuencias para las densidades tomadas en campo y
poder determinar los parmetros estadsticos de esta produccin.

xi ni Ni Fi Fi
1 2.47 3 3.00 13% 13%
2 2.48 2 5.00 9% 22%
3 2.49 1 6.00 4% 26%
4 2.50 1 7.00 4% 30%
5 2.51 1 8.00 4% 35%
6 2.53 2 10.00 9% 43%
7 2.55 4 14.00 17% 61%
8 2.56 4 18.00 17% 78%
9 2.57 2 20.00 9% 87%
10 2.58 2 22.00 9% 96%
11 2.59 1 23.00 4% 100%



Calculo de la media para datos no agrupados:








Nc Gm
1 2.55
2 2.57
3 2.59
4 2.47
5 2.55
6 2.58
7 2.53
8 2.47
9 2.53
10 2.47
11 2.50
12 2.58
13 2.55
14 2.57
15 2.56
16 2.48
17 2.56
18 2.51
19 2.56
20 2.56
21 2.55
22 2.49
23 2.48
58.26
Media:
X = x
1
+ x
2
+ x
3
+....x
n

n


X = 2.55 + 2.57 + 2.59 +2.47+....2.48

23
X = 58.26 = 2,53
23

Calculo de media para datos Agrupados:

xi Ni Ni fi Fi xi*ni
1 2.47 3 3.00 13% 13% 7.41
2 2.48 2 5.00 9% 22% 4.96
3 2.49 1 6.00 4% 26% 2.49
4 2.50 1 7.00 4% 30% 2.50
5 2.51 1 8.00 4% 35% 2.51
6 2.53 2 10.00 9% 43% 5.06
7 2.55 4 14.00 17% 61% 10.20
8 2.56 4 18.00 17% 78% 10.24
9 2.57 2 20.00 9% 87% 5.14
10 2.58 2 22.00 9% 96% 5.16
11 2.59 1 23.00 4% 100% 2.59

58.26







X = xi*ni
23

X = 58.26
23

X = 2.53

Calculo de Mediana para datos no agrupados:
Si el nmero de valores es impar, la mediana coincide con el valor central.

















N Gm
1 2.47
2 2.47
3 2.47
4 2.48
5 2.48
6 2.49
7 2.50
8 2.51
9 2.53
10 2.53
11 2.55
12
2.55
13 2.55
14 2.55
15 2.56
16 2.56
17 2.56
18 2.56
19 2.57
20 2.57
21 2.58
22 2.58
23 2.59
Mediana (Me)

Calculo de mediana para datos agrupados
xi Ni Ni fi Fi xi*ni
1 2.47 3 3.00 13% 13% 7.41
2 2.48 2 5.00 9% 22% 4.96
3 2.49 1 6.00 4% 26% 2.49
4 2.50 1 7.00 4% 30% 2.50
5 2.51 1 8.00 4% 35% 2.51
6 2.53 2 10.00 9% 43% 5.06
7 2.55 4 14.00 17% 61% 10.20
8 2.56 4 18.00 17% 78% 10.24
9 2.57 2 20.00 9% 87% 5.14
10 2.58 2 22.00 9% 96% 5.16
11 2.59 1 23.00 4% 100% 2.59

Se busca el valor mayor o igual a n/2 en (Ni) la frecuencia acumulada y el
perteneciente al (xi) es mediana indicada

Me = n/2 n = 23
Me= 23/2 = 11.5





Moda
Es el valor de la variable que tiene mayor frecuencia
xi ni Ni fi Fi xi*ni
1 2.47 3 3.00 13% 13% 7.41
2 2.48 2 5.00 9% 22% 4.96
3 2.49 1 6.00 4% 26% 2.49
4 2.50 1 7.00 4% 30% 2.50
5 2.51 1 8.00 4% 35% 2.51
6 2.53 2 10.00 9% 43% 5.06
7 2.55 4 14.00 17% 61% 10.20
8 2.56 4 18.00 17% 78% 10.24
9 2.57 2 20.00 9% 87% 5.14
10 2.58 2 22.00 9% 96% 5.16
11 2.59 1 23.00 4% 100% 2.59

58.26
El ejemplo es bimodal ya que existen dos modas
Moda 1: 2.55
Moda 2: 2.56








-
1,00
2,00
3,00
4,00
5,00
6,00
7,00
8,00
9,00
2.49 2.51 2.53 2.55 2.57 2.59
2.47 2.49 2.51 2.53 2.55 2.57
Histograma de Frecuencia
0
0,5
1
1,5
2
2,5
3
3,5
4
4,5
2,47 2,48 2,49 2,50 2,51 2,53 2,55 2,56 2,57 2,58 2,59
Poligono de Frecuencia

Calculo de curtosis


Xi ni Ni fi Fi xi*ni xi-X (xi-X)*ni (xi-X)3 (xi-X)4*ni
1 2.47 3 3.00 13% 13% 7.41 -0.0630 0.0119 -2.51E-04 4.74E-05
2 2.48 2 5.00 9% 22% 4.96 -0.0530 0.0056 -1.49E-04 1.58E-05
3 2.49 1 6.00 4% 26% 2.49 -0.0430 0.0019 -7.97E-05 3.43E-06
4 2.50 1 7.00 4% 30% 2.50 -0.0330 0.0011 -3.61E-05 1.19E-06
5 2.51 1 8.00 4% 35% 2.51 -0.0230 0.0005 -1.22E-05 2.82E-07
6 2.53 2 10.00 9% 43% 5.06 -0.0030 0.0000 -2.82E-08 1.72E-10
7 2.55 4 14.00 17% 61% 10.20 0.0170 0.0012 4.88E-06 3.31E-07
8 2.56 4 18.00 17% 78% 10.24 0.0270 0.0029 1.96E-05 2.11E-06
9 2.57 2 20.00 9% 87% 5.14 0.0370 0.0027 5.05E-05 3.73E-06
10 2.58 2 22.00 9% 96% 5.16 0.0470 0.0044 1.04E-04 9.72E-06
11 2.59 1 23.00 4% 100% 2.59 0.0570 0.0032 1.85E-04 1.05E-05

58.26 -0.03 0.04 -1.65E-04 9.45E-05

X = 2.53 G2 = 1 / 23 x 9.45E-05 - 3
(1 / 23 x 0.04)^2
G2 = - 1.27
Por lo tanto, el Coeficiente de Curtosis de esta muestra es -1,27, lo que
quiere decir que se trata de una distribucin platicrtica, es decir, con una
reducida concentracin alrededor de los valores centrales de la distribucin.




Calculo del sesgo

Xi ni Ni fi Fi xi*ni xi-X (xi-X)*ni (xi-X)3 (xi-X)4*ni
1 2.47 3 3.00 13% 13% 7.41 -0.0630 0.0119 -2.51E-04 4.74E-05
2 2.48 2 5.00 9% 22% 4.96 -0.0530 0.0056 -1.49E-04 1.58E-05
3 2.49 1 6.00 4% 26% 2.49 -0.0430 0.0019 -7.97E-05 3.43E-06
4 2.50 1 7.00 4% 30% 2.50 -0.0330 0.0011 -3.61E-05 1.19E-06
5 2.51 1 8.00 4% 35% 2.51 -0.0230 0.0005 -1.22E-05 2.82E-07
6 2.53 2 10.00 9% 43% 5.06 -0.0030 0.0000 -2.82E-08 1.72E-10
7 2.55 4 14.00 17% 61% 10.20 0.0170 0.0012 4.88E-06 3.31E-07
8 2.56 4 18.00 17% 78% 10.24 0.0270 0.0029 1.96E-05 2.11E-06
9 2.57 2 20.00 9% 87% 5.14 0.0370 0.0027 5.05E-05 3.73E-06
10 2.58 2 22.00 9% 96% 5.16 0.0470 0.0044 1.04E-04 9.72E-06
11 2.59 1 23.00 4% 100% 2.59 0.0570 0.0032 1.85E-04 1.05E-05

58.26 -0.03 0.04 -1.65E-04 9.45E-05
X = 2.53
G1 = 1 / 23 x -5.88E-04 G1 = - 0.42
(1 / 23 x 0.04)^(3/2)

Por lo tanto, el Coeficiente de Sesgo o simetra de esta muestra es -0,42, lo
que quiere decir que se trata de una distribucin con sesgo negativo o
inclinado a su izquierda.



Calculo de la Desviacin media:




Donde n es la frecuencia total








DM = |x
1
x | + |x
2
x | +.........|x
n
x |
n


Xi ni Ni fi Fi xi*ni xi-X (xi-X)*ni (xi-X)3 (xi-X)4*ni
1 2.47 3 3.00 13% 13% 7.41 -0.0630 0.0119 -2.51E-04 4.74E-05
2 2.48 2 5.00 9% 22% 4.96 -0.0530 0.0056 -1.49E-04 1.58E-05
3 2.49 1 6.00 4% 26% 2.49 -0.0430 0.0019 -7.97E-05 3.43E-06
4 2.50 1 7.00 4% 30% 2.50 -0.0330 0.0011 -3.61E-05 1.19E-06
5 2.51 1 8.00 4% 35% 2.51 -0.0230 0.0005 -1.22E-05 2.82E-07
6 2.53 2 10.00 9% 43% 5.06 -0.0030 0.0000 -2.82E-08 1.72E-10
7 2.55 4 14.00 17% 61% 10.20 0.0170 0.0012 4.88E-06 3.31E-07
8 2.56 4 18.00 17% 78% 10.24 0.0270 0.0029 1.96E-05 2.11E-06
9 2.57 2 20.00 9% 87% 5.14 0.0370 0.0027 5.05E-05 3.73E-06
10 2.58 2 22.00 9% 96% 5.16 0.0470 0.0044 1.04E-04 9.72E-06
11 2.59 1 23.00 4% 100% 2.59 0.0570 0.0032 1.85E-04 1.05E-05

58.26 -0.03 0.04 -1.65E-04 9.45E-05

DM = |-0.03|
23
El valor 0.0015 es la desviacin media de todas las muestras tomadas.

Calculo de varianza:



S
2
=
n
x x
n k
k

1
2
) (

El clculo de la varianza es similar a la desviacin tpica

Xi ni Ni fi Fi xi*ni xi-X (xi-X)*ni (xi-X)3 (xi-X)4*ni
1 2.47 3 3.00 13% 13% 7.41 -0.0630 0.0119 -2.51E-04 4.74E-05
2 2.48 2 5.00 9% 22% 4.96 -0.0530 0.0056 -1.49E-04 1.58E-05
3 2.49 1 6.00 4% 26% 2.49 -0.0430 0.0019 -7.97E-05 3.43E-06
4 2.50 1 7.00 4% 30% 2.50 -0.0330 0.0011 -3.61E-05 1.19E-06
5 2.51 1 8.00 4% 35% 2.51 -0.0230 0.0005 -1.22E-05 2.82E-07
6 2.53 2 10.00 9% 43% 5.06 -0.0030 0.0000 -2.82E-08 1.72E-10
7 2.55 4 14.00 17% 61% 10.20 0.0170 0.0012 4.88E-06 3.31E-07
8 2.56 4 18.00 17% 78% 10.24 0.0270 0.0029 1.96E-05 2.11E-06
9 2.57 2 20.00 9% 87% 5.14 0.0370 0.0027 5.05E-05 3.73E-06
10 2.58 2 22.00 9% 96% 5.16 0.0470 0.0044 1.04E-04 9.72E-06
11 2.59 1 23.00 4% 100% 2.59 0.0570 0.0032 1.85E-04 1.05E-05

58.26 -0.03 0.04 -1.65E-04 9.45E-05



El valor 0.0015 es la Varianza de todas las muestras tomadas.




S^2 = 0.04
23

Calculo de Desviacin Estndar:


Xi ni Ni fi Fi xi*ni xi-X (xi-X)*ni (xi-X)3 (xi-X)4*ni
1 2.47 3 3.00 13% 13% 7.41 -0.0630 0.0119 -2.51E-04 4.74E-05
2 2.48 2 5.00 9% 22% 4.96 -0.0530 0.0056 -1.49E-04 1.58E-05
3 2.49 1 6.00 4% 26% 2.49 -0.0430 0.0019 -7.97E-05 3.43E-06
4 2.50 1 7.00 4% 30% 2.50 -0.0330 0.0011 -3.61E-05 1.19E-06
5 2.51 1 8.00 4% 35% 2.51 -0.0230 0.0005 -1.22E-05 2.82E-07
6 2.53 2 10.00 9% 43% 5.06 -0.0030 0.0000 -2.82E-08 1.72E-10
7 2.55 4 14.00 17% 61% 10.20 0.0170 0.0012 4.88E-06 3.31E-07
8 2.56 4 18.00 17% 78% 10.24 0.0270 0.0029 1.96E-05 2.11E-06
9 2.57 2 20.00 9% 87% 5.14 0.0370 0.0027 5.05E-05 3.73E-06
10 2.58 2 22.00 9% 96% 5.16 0.0470 0.0044 1.04E-04 9.72E-06
11 2.59 1 23.00 4% 100% 2.59 0.0570 0.0032 1.85E-04 1.05E-05

58.26 -0.03 0.04 -1.65E-04 9.45E-05



El valor 0.04 es la desviacin media de todas las muestras tomadas.

Anda mungkin juga menyukai