CARRERA:
JULIACAPER
JUNIO 2016
DEDICATORIA:
A nuestras familias por su apoyo y por darnos la herencia ms noble: nuestra
educacin y el apoyo incondicional,
que desde la infancia nos forjaron y nos dieron una personalidad
y futuro con gran cambio, por ser el apoyo para la realizacin de nuestras
metas.
INTRODUCCIN
Las sociedades modernas son ricas en datos: la prensa escrita, la televisin y la radio,
Internet y las intranets de las organizaciones ofrecen cantidades inmensas de datos que
pueden ser procesados y analizados. Esto convierte a la estadstica en una ciencia
interesante y til puesto que proporciona estrategias y herramientas que permiten obtener
informacin a partir de dichos datos. Adems, gracias a la evolucin de la tecnologa
(ordenadores y software estadstico) hoy en da es posible automatizar gran parte de los
clculos matemticos asociados al uso de tcnicas estadsticas, lo que permite extender su
uso a un gran rango de profesionales en mbitos tan diversos como la biologa, las ciencias
empresariales, la sociologa o las ciencias de la informacin.
La prctica de la estadstica requiere aprender a obtener y explorar los datos tanto
numricamente como mediante grficos, a pensar sobre el contexto de los datos y el
diseo del estudio que los ha generado, a considerar la posible influencia de observaciones
anmalas en los resultados obtenidos, a discutir la legitimidad de los supuestos requeridos
por cada tcnica y, finalmente, a validar la fiabilidad de las conclusiones derivadas del
anlisis. La estadstica requiere tanto de conocimientos sobre los conceptos y tcnicas
empleados como de la suficiente capacidad crtica que permita evaluar la conveniencia de
usar unas u otras tcnicas segn el tipo de datos disponible y el tipo de informacin que se
desea obtener.
INDICE:
CAPTULO I: MEDIA ARITMETICA..5
CAPTULO II: MEDIA PONDERADA8
CAPTULO III: MEDIANA...8
CAPITULO IV: MODA.9
CAPITULO V: MEDIA GEOMETRICA, CUADRATICA Y ARMONICA9
CAPITULO VI: CUARTILES, DECILES Y PERCENTILES .9
CAPITULO VII: VARIANZA11
CAPITULO VIII: RANGO INTERCUARTILICO.11
CAPITULO IX: COEFICIENTE DE VARIACION12
DESVIACION ESTANDAR13
DISTRIBUCIONES BIDIMENSIONALES14
VARIABLES15
GRAFICOS VARIABLE CUANTITATIVO..16
GRAFICOS VARIABLE CUALITATIVOS...17
TABLA ESTADISTICA..19
Bibliografa...22
Media (mean): la media (tambin conocida por valor promedio o valor esperado) de un
conjunto de observaciones muestrales se representa con el smbolo x. Intuitivamente, la
media simboliza el centro de masas o punto de equilibrio central del conjunto de
datos considerado. El par-metro asociado, la media poblacional, se representa por .
Para calcular la media de un conjunto de datos se usa la siguiente expresin:
x x ... x
1
n xi
i1
5,4
5
5
(Alicia Vila, ngel A. Juan; pag.18) (A. Vila)
CONCEPTO (PROPOSITO)
La media aritmtica es una medida de tendencia central: Casi siempre, cuando nos
referimos al promedio de algo, estamos hablando de la media aritmtica. Es el valor
resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el nmero
total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.
FORMULA
Para escribir las frmulas correspondientes a estas dos medias, combinamos los smbolos
matemticos y los pasos que utilizamos para determinar la media aritmtica. Si se suman
los valores de las observaciones y esta suma se divide entre el nmero de observaciones,
obtendremos:
Sin embargo, si calculamos el tiempo medio para los primeros seis corredores y excluimos
el valor de 9.0 minutos, la respuesta aproximada es 4.7 minutos. El valor extremo 9.0
distorsiona el valor que obtenemos para la media. Sera ms representativo calcular la
media sin incluir el valor extremo. Un segundo problema con la media es el mismo que
encontramos con los 600 saldos de cuentas de cheques. Resulta tedioso calcular la media
debido a que utilizamos cada uno de los datos en nuestro clculo (a menos, desde luego,
que usemos el mtodo corto que consiste en utilizar datos agrupados para determinar la
media aproximada). La tercera desventaja es que somos incapaces de calcular la media para
un conjunto de datos que tiene clases de extremo abierto en la parte inferior o superior de la
escala. Suponga que los datos de la tabla 3-6 se clasifican en la distribucin de frecuencias
de la tabla 3-7. No podemos calcular un valor para la media de estos datos debido a la clase
de extremo abierto 5.4 o ms. No tenemos forma de saber si el valor de la observacin de
esta clase es 5.4, cercano a 5.4 o mucho mayor que 5.4. (Levin and Rubin, 2004 pag.65)
La media ponderada nos permite calcular un promedio que toma en cuenta la importancia
de cada valor con respecto al total. Considere, por ejemplo, la compaa cuyos datos
presentamos en la tabla 3-8; sta utiliza tres niveles de trabajo no calificado,
semicalificado y calificado para la produccin de dos de sus productos finales. La
compaa desea saber el promedio del costo de trabajo por hora para cada uno de los
productos. (Levin and Rubin, 2004 pag.69)
10
de los datos ordenados a su izquierda (es decir, un 50% de los datos muestran
valores inferiores a l y un 50% de los datos muestran valores superiores a l).
Finalmente, el tercer cuartil, Q3, es aquel valor que deja tres cuartas partes de los
datos ordenados a su izquierda (es decir, un 75% de los datos muestran valores
inferiores a l y un 25% de los datos muestran valores superiores a l).
Cuartiles de un conjunto ordenado de datos(figura 12,pag.19)
11
Esto significa que la varianza es una medida de la dispersin de los datos con respecto a su
media, es decir, cuando menor sea la varianza, tanto ms agrupados estarn los datos
alrededor de su valor promedio. Por el contrario, cuanto mayor sea la varianza, tanto ms
dispersos estarn los datos.
Ejemplo: la varianza muestral de la serie de 5 datos {6, 3, 8, 5, 3} es:
12
anterior, s =
Al igual que ocurra con la varianza, a mayor desviacin estndar ms dispersin en los
datos y viceversa.(Alicia Vila y ngel A. Juan,pag.20)
KURTOSIS
Cuando medimos la curtosis de una distribucin, estamos midiendo qu tan puntiaguda es.
En la figura 3-5, por ejemplo, las curvas A y B difieren entre s slo en que una tiene un
pico ms pronunciado que la otra. Tienen la misma posicin central y la misma dispersin,
y ambas son sim- tricas. Los estadsticos dicen que tienen un grado diferente de curtosis.
13
DISTRIBUCIONES BIDIMENSIONALES
Son aquellas en las que a cada individuo le corresponden los valores de
dos variables, las representamos por el par (x i , y i ).
Fsic
14
10
10
10
VARIABLES
15
16
Un grfico similar, aunque algo ms elaborado y con una orientacin transpuesta de los
ejes, es el llamado diagrama de tallos y hojas (stem-and-leaf). En l tambin se representan
los valores observados pero usando los propios valores numricos en lugar de puntos, lo
que proporciona un mayor nivel de detalle. La figura 8 muestra un ejemplo de grfico de
tallos y hojas para los mismos datos empleados en la figura 7. Se observa que el grfico se
ha construido a partir de una muestra de cincuenta calificaciones y quese ha usado una
unidad de hoja (leaf) de 0,1. Esto significa que la segunda columna del grfico representa la
parte entera de la calificacin, mientras que cada uno de los nmeros situados a su derecha
representa la parte decimal de una observacin con dicha parte entera. As, se pueden leer
las siguientes calificaciones por orden de menor a mayor: 1,4, 2,9, 3,0, 3,5, 3, 9, 4,0, 4,3,
etc.
17
Pag.14-15
18
Un grfico que tambin suele usarse bastante para describir datos cualitativos es el llamado
diagrama de Pareto. Este grfico est compuesto por: (a) un diagrama de barras en el que
las categoras estn ordenadas de mayor a menor frecuencia y (b) una lnea que representa
la frecuencia relativa acumulada (figura 6).
Los diagramas de Pareto son muy tiles para detectar cundo un porcentaje reducido de
categoras (p. ej.: un 20% de las categoras) acapara o representa un porcentaje alto de
observaciones (p. ej.: un 80% de los datos). Estos fenmenos de excesiva representatividad
por parte de unas pocas categoras suelen darse con frecuencia en contextos
socioeconmicos (p. ej.: un porcentaje reducido de los ciudadanos de un pas acapara un
alto porcentaje de la renta), educativos (p. ej.: un porcentaje reducido de causas generan la
mayor parte de los abandonos del curso) o de ingeniera de la calidad (p. ej.: un alto
porcentaje de fallos son debidos a un nmero muy reducido de causas). Identificar aquellas
pocas categoras que representan una gran parte del porcentaje total puede servir para
corroborar ciertos desequilibrios distributivos como una distribucin poco equilibrada de
19
las rentas en un pas o de los sueldos en una empresa, o para proporcionar pistas sobre los
principales factores de causa de un problema como el alto nivel de abandono de un curso o
un elevado nivel de fallos en un servicio o producto.
Pag.14
TABLA ESTADISTICA
Descripcin de datos mediante tablas y grficos
Cuando se dispone de un conjunto de observaciones procedentes de una muestra conviene
hacer un primer anlisis exploratorio de stas mediante grficos y tablas que ayuden a
interpretar los datos y a extraer informacin de los mismos. Existen diferentes tipos de
grficos que pueden usarse en esta fase exploratoria y el uso de unos u otros dependern en
gran medida del tipo de datos de los que se disponga (cualitativos o cuantitativos), as
como de la informacin que se desee visualizar. En este apartado se presentaran algunos de
los grficos y tablas ms habituales para la descripcin de datos univariantes.
Grficos y tablas para datos cualitativos o categricos
Si se dispone de datos cualitativos o categricos, pueden sintetizarse mediante una tabla
que recoja, para cada categora: el nmero de veces que aparece (frecuencia absoluta), el
porcentaje de apariciones sobre el total de observaciones (frecuencia relativa), as como los
acumulados de ambos valores. La tabla 1 muestra esta informacin para la variable
nmero de hotspots (conexiones wi-fi) identificados en cada comunidad autnoma.
20
Adems de mediante una tabla de frecuencias, suele ser habitual representar datos
categricos mediante el uso de grficos circulares (figura 3) o bien mediante diagramas de
barras (figura 4).
21
22
Bibliografa
A. Vila, A. J. (s.f.). estadistica descriptiva y univariante. catalua: uoc.
Levin, R. and Rubin, D. (2004). Estadistica para administracion y economia. Mxico: Pearson Educacin.