Anda di halaman 1dari 50

ESTADISTICA

09/09/17 ARITMETICA 1
CEPRE-UNI
OBJETIVOS
Saber qu significa Estadstica y sus campos de estudio.

Diferenciar entre una variable cualitativa y una variable cuantitativa.

Organizar los datos en una distribucin de frecuencias.

Presentar datos empleando histogramas y otros grficos.

Calcular la media aritmtica, la mediana y la moda para datos


agrupados y no agrupados.

Calcular otras medidas de centralizacin como la media ponderada,


media geomtrica y armnica.

09/09/17 ARITMETICA 2
CEPRE-UNI
NOTA HISTRICA

Desde la antigedad, reyes y emperadores se preocuparon por


conseguir datos sobre sus posesiones. El censo, por ejemplo, es un
vasto proyecto de recopilacin de datos y no es una idea nueva;
hace 2 mil aos el emperador Augusto mand realizar una gran
encuesta sobre las riquezas del imperio Romano: soldados, navos,
recursos, rentas, etc. Mucho antes los egipcios haban registrado
informacin numrica que an se estudia, al igual que los
misteriosos quipus que almacenaban informacin para la
administracin del imperio Inca.

Durante mucho tiempo se entendi por estadstica a la


informacin relacionada con el gobierno. La palabra se deriva del
latn statisticus que significa del Estado y este trmino pas a
referirse, durante el siglo XIX, a otros tipos de informacin numrica
y ms tarde a los mtodos para analizar dicha informacin.

09/09/17 ARITMETICA 3
CEPRE-UNI
ESTADSTICA

Definicin:

Es la parte de la matemtica que estudia los fenmenos


que se pueden cuantificar y generan un conjunto de
datos. El especialista en esta rea debe simplificar al
mximo la informacin disponible para que pueda ser
clara y til; y cuando sea posible tratar de inferir las
leyes que explique el comportamiento de este fenmeno.

09/09/17 ARITMETICA 4
CEPRE-UNI
El estudio de la estadstica puede dividirse en dos reas principales:

Estadstica descriptiva:
Comprenden las tcnicas que se emplean para la recopilacin,
organizacin, resumen y presentacin de los datos (o informacin).

Estadstica inferencial:
Comprende tcnicas que basado nicamente en una muestra o
subconjunto de la poblacin sometida a observacin, se toma
decisiones sobre toda la poblacin. Dado que esta decisin se toma en
condiciones de incertidumbre, supone el uso de conceptos de
probabilidad.

09/09/17 ARITMETICA 5
CEPRE-UNI
Unidad Elemental
Es cada persona o cada objeto de la cual se requiere alguna
informacin.

Dato (observacin)
Es el resultado de observar o medir una caracterstica de una
unidad elemental.

Poblacin
Es el conjunto de las unidades elementales.

Muestra
Es un sub-conjunto representativo de la poblacin,
tomado aleatoriamente, el cual sirve para hacer
inferencias acerca de dicha poblacin.

09/09/17 ARITMETICA 6
CEPRE-UNI
Tamao de la Muestra
Es la cantidad de elementos de una muestra.

Variables estadsticas:
Son las distintas formas en que se puede
expresar una observacin.

09/09/17 ARITMETICA 7
CEPRE-UNI
CLASES DE VARIABLES ESTADSTICAS

I) Variable Cuantitativa: cuando representa una cantidad.


Discreta : cuando se obtiene por conteo, puede tomar
solo valores enteros.
Ejemplo: El estudio del nmero de hijos de cada
familia del distrito de Pueblo Libre.
Continua : cuando se obtiene por medicin, puede
asumir cualquier valor real dentro de un cierto
intervalo.
Ejemplo: La estatura de los alumnos de CEPRE UNI.

II) Variable Cualitativa: cuando representa cualidad.


Ejemplo: Estado civil de una persona.

09/09/17 ARITMETICA 8
CEPRE-UNI
PRESENTACIN Y ORDENACIN DE
DATOS
Frecuencia absoluta (f) designa al nmero de
veces que el valor correspondiente aparece en el
conjunto de datos .

Frecuencia relativa (h) es la frecuencia


expresada como fraccin o porcentaje del total.
Si N es en nmero de datos, la frecuencia
relativa h est dado por:
f
h
n

09/09/17 ARITMETICA 9
CEPRE-UNI
PRESENTACION DE DATOS NO AGRUPADOS

Ejemplo 1:
Se realiz una encuesta entre los 50 empleados de una
empresa, consultando sobre el nmero de hijos en edad
escolar que tena cada empleado, a fin de estimar el pago
de una bonificacin por gastos escolares que proyecta hacer
la empresa. Estos fueron los resultados:

0 2 1 0 3 2 0 1 1 0
0 1 1 2 4 1 0 1 1 0
2 1 0 0 3 0 0 1 2 1
0 0 2 4 1 1 0 1 2 0
1 1 0 3 5 1 2 1 3 2

09/09/17 ARITMETICA 10
CEPRE-UNI
PRESENTACION DE DATOS NO AGRUPADOS

Frecuenci
No de hijos a Frecuencia
Conteo
X absoluta relativa (h)
(f)
0 \\\\ \\\\ \\\\ \ 16 16/50 = 0.32 = 32%
1 \\\\ \\\\ \\\\ \ 18 18/50 = 0.36 = 36%
\\
2 \\\\ \\\\ 9 9/50 = 0.18 = 18%
3 \\\\ 4 4/50 = 0.08 = 8%
4 \\ 2 2/50 = 0.04 = 4%
5 \ 1 1/50 = 0.02 = 2%
n = 50 Total = 100%

Tabla 1. No de hijos por empleados de una empresa

09/09/17 ARITMETICA 11
CEPRE-UNI
REPRESENTACIONES GRAFICAS

09/09/17 ARITMETICA 12
CEPRE-UNI
Diagrama de Barras
Asignan a cada valor de la variable una barra de
altura proporcional a su frecuencia

09/09/17 ARITMETICA 13
CEPRE-UNI
09/09/17 ARITMETICA 14
CEPRE-UNI
PRESENTACIN DE DATOS AGRUPADOS

Cuando los datos consisten en solo unos cuantos


valores distintos (es el caso de los datos del
ejemplo anterior que tomaba solo los valores 0,
1, 2, 3, 4 y 5), podemos organizarlos fcilmente
y determinar cualquier tendencia, sin embargo
cuando los datos consisten en muchos valores
en su mayora no repetidos es conveniente
agrupar los datos y determinar las frecuencias
absolutas y relativas de cada grupo que
llamaremos clase.

09/09/17 ARITMETICA 15
CEPRE-UNI
DEFINICIONES PREVIAS:
Rango Recorrido (R).
Es la diferencia entre el mayor de los datos x mx y el
menor de los datos xmin.

R = xmax xmin
Intervalo de clase [a, b>
Son cada una de las categoras excluyentes (o clases) en los
que se pueden clasificar los datos. Los extremos de un
intervalo [ai, bi son ai y bi, donde
ai = lmite inferior del intervalo de clase
bi = lmite superior del intervalo de clase
Cada intervalo es cerrado por la derecha y abierto por la
izquierda

09/09/17 ARITMETICA 16
CEPRE-UNI
Marca de clase (xi)

Son los puntos medios de cada clase, as en el intervalo


la marca de clase xi ser: a , b
i i

ai bi
xi
2

Nmero de intervalos (k)

No existen reglas fijas para establecer el valor de k. Una


regla sugiere que sea un nmero prximo a N y otra dice
que el nmero ideal es 1 + 3,3 logN (Regla de Sturges),
siendo N el total de datos. En muchos casos, entre 5 y 10
intervalos puede ser el nmero adecuado.

09/09/17 ARITMETICA 17
CEPRE-UNI
Amplitud del intervalo (A)

Es la diferencia entre sus extremos. Es conveniente que


todos los intervalos tengan la misma longitud A

R
A
k
Es preferible redondear el valor de A por exceso para no
perder datos.

Frecuencia absoluta (fi)


Es el nmero de datos que corresponden al i-simo intervalo
de clase.

09/09/17 ARITMETICA 18
CEPRE-UNI
Frecuencia acumulada (Fi)
Se define para cada i-simo intervalo de clase, como la
suma de todas las frecuencias absolutas fi desde el
primero hasta el i-esimo intervalo:
Fi f1 f2 ... fi

Frecuencia relativa (hi)


Es el cociente entre la frecuencia absoluta del i-simo
intervalo y el nmero total de datos

fi
hi
n

09/09/17 ARITMETICA 19
CEPRE-UNI
Frecuencia relativa acumulada (Hi)

Es el cociente entre la frecuencia acumulada absoluta


correspondiente al i-simo intervalo y el nmero total
de datos.
Fi
Hi
n

09/09/17 ARITMETICA 20
CEPRE-UNI
Ejemplo 2: El administrador del gimnasio ABC
est interesado en conocer la distribucin de las
edades de las 42 personas inscritas y recopil las
siguientes edades:
26 16 21 34 45 18 41 38 22
48 27 22 30 39 62 25 25 38
29 31 28 20 56 60 24 61 28
32 33 18 23 27 46 30 34 62
49 59 19 20 23 24

La distribucin de frecuencias requiere los


siguientes clculos:
09/09/17 ARITMETICA 21
CEPRE-UNI
Determinacin del rango:
El dato mayor es 62 y el menor 16, por lo tanto
R = 62 16 = 46 aos

Nmero de intervalos: Segn una de las reglas elegimos


K = 6 intervalos, un valor prximo a
42
Amplitud: el cociente por exceso de R entre K:
R 46
7,6 A 8
K 6
Intervalos de clase: elegimos el menor dato como lmite
inferior del primer intervalo 16;..... , el lmite superior

se obtiene al sumarle la amplitud:
16 + 8 = 24, queda as
establecido 16 ; 24 como primer intervalo;
24 ; 32


el segundo y as sucesivamente.

09/09/17 ARITMETICA 22
CEPRE-UNI
Marca de
i Intervalo Conteo Frecuencia
clase
16 ; 24 \\\\ \\\\ \
1 20 11
24 ; 32 \\\\ \\\\ \\\
2 28 13
3 32; 40 \\\\ \\ 36 7

4 40 ; 48 \\\ 44 3

5 48 ; 56 \\ 52 2

6 56 ; 64 \\\\ \ 60 6

Tabla 2. Edades de asistentes al gimnasio

09/09/17 ARITMETICA 23
CEPRE-UNI
Marca de clase: se obtiene por la frmula
ai bi
xi
2
16 24 24 32
x1 20 x2 28 etc.
2 2
La frecuencia de cada intervalo se obtiene contando las
marcas que resultan del conteo.
Si se consideran adems las frecuencias relativas y las
frecuencias acumuladas, se obtiene la siguiente tabla:

09/09/17 ARITMETICA 24
CEPRE-UNI
I Intervalo xi fi Fi hi Hi
16 ; 24
1
20 11 11 0,26 0,26
24 ; 32
2 28 13 24 0,31 0,57

3 32 ; 40 36 7 31 0,17 0,74

4 40 ; 48 44 3 34 0,07 0,81

5 48 ; 56 52 2 36 0,05 0,86

6 56 ; 64 60 6 42 0,14 1,00

n = 42 1,00

Tabla 3. Edades de asistentes al gimnasio


09/09/17 ARITMETICA 25
CEPRE-UNI
Histogramas
Son grficos especficos para datos agrupados por
intervalos. Los histogramas asocian a cada intervalo un
rectngulo de superficie proporcional a la frecuencia. Los
lmites de clase se marcan en el eje horizontal y
determinan las bases de los rectngulos y las frecuencias
se anotan en el eje vertical y determinan sus alturas.

09/09/17 ARITMETICA 26
CEPRE-UNI
09/09/17 ARITMETICA 27
CEPRE-UNI
Polgono de frecuencias

09/09/17 ARITMETICA 28
CEPRE-UNI
Ojiva
Frecuencias
acumuladas Frecuencias
acumuladas
relativas (en %)

09/09/17 ARITMETICA 29
CEPRE-UNI
Observacin
Si f es la frecuencia en el intervalo de clase [a, b> y se
considera que los datos se distribuyen de manera
uniforme en ese intervalo, entonces podemos considerar
por ejemplo que en el intervalo [a, c] contenido en [a, b>
existen aproximadamente:

c a
f /
.f
ba

09/09/17 ARITMETICA 30
CEPRE-UNI
Ejemplo: En el intervalo [24; 32> la frecuencia es 13
(hay 13 datos), luego en el intervalo [24; 27] habr

27 24
f' .13 4.875 5 datos
32 24

Igualmente para una frecuencia relativa h:

ca
h
/
.h
ba

09/09/17 ARITMETICA 31
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN

Los nmeros que describen de manera concisa el


comportamiento y las caractersticas generales de un
conjunto de datos son los parmetros estadsticos.

Los parmetros que miden la tendencia central de los


datos se llaman medidas de centralizacin y los ms
representativos son la media, la mediana y la moda.

09/09/17 ARITMETICA 32
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
MEDIA ARITMTICA

Se calcula dividiendo la suma de los valores de


todos los datos entre el nmero de datos

Para datos no agrupados: x x i

Para datos agrupados: x


f x'
i i

n
En la ltima frmula fi es la frecuencia de cada
intervalo y xi es la marca de clase.

09/09/17 ARITMETICA 33
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN

MEDIA ARITMTICA PONDERADA

Se aplica cuando no todos los datos tienen la misma


importancia o peso. Su frmula es similar a la de los
datos agrupados, cambiando fi por los pesos pi y el
denominador N por la suma de todos los pesos; en este
caso xi sera el valor de cada dato.

xp
xp
i i

x1p1 x 2p 2 ... x k p k
p i p1 p 2 ... p k

09/09/17 ARITMETICA 34
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
MEDIANA
Es el valor del dato que ocupa la posicin central cuando
stos se ordenan de menor a mayor (o viceversa). Divide
a la lista de datos en dos grupos de igual nmero de
elementos.
Si el nmero de datos es par la mediana es la media de
los dos que ocupan las posiciones centrales.
Si el nmero de datos es impar la mediana es el dato
central.
Ejemplo:
Sean los datos: 9, 7, 8, 10, 8, 11; al ordenar se tiene:
7, 8, 8, 9, 10, 11. La mediana es: 8 9
8,5
2
09/09/17 ARITMETICA 35
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
Para datos agrupados debe encontrarse primero
el intervalo mediano, y luego ubicar en dicho
intervalo la mediana (Me) con la frmula:
N
Fi1
Me a i 2 .A
fi
ai = lmite inferior del intervalo mediano
N = nmero de datos
i = el menor intervalo que cumple Fi > n/2
Fi-1 = frecuencia acumulada del intervalo i-1
fi = frecuencia absoluta del intervalo mediano
A = amplitud del intervalo
09/09/17 ARITMETICA 36
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
Ejemplo: En el caso de la gente que va al gimnasio, de
la tabla 3, la mediana es:
42
11
Me 24 2 .8 30.15
13
Es decir, la mitad de las personas tienen 30
aos o menos y la otra mitad supera esta edad

09/09/17 ARITMETICA 37
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
Moda
Se define como el valor que ms veces se repite en el
conjunto de datos. Si hay dos valores que se repiten
mayoritariamente y con igual frecuencia, la distribucin
se llama bimodal.
d1
Para datos agrupados la moda es: Mo a i .A
d1 d 2

ai =lmite inferior de la clase modal (la que tiene la mayor frecuencia)


d1 =exceso de la frecuencia modal sobre la frecuencia de la clase
inmediatamente anterior a la clase modal
d2 =exceso de la frecuencia modal sobre la frecuencia de la clase que
sigue inmediatamente a la clase modal
A = amplitud del intervalo de clase modal.
09/09/17 ARITMETICA 38
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN

Ejemplo: En el caso de la gente del gimnasio la clase


modal es la segunda

2
Mo 24 .8 26
26
Es decir tienen 26 aos la mayora de las personas que
va a ese gimnasio

09/09/17 ARITMETICA 39
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
Media Geomtrica
Es la raz n-sima del producto de los n datos.

MG n x 1 x 2 x 3 ............... x n

la media geomtrica es siempre menor o igual que la


media aritmtica

09/09/17 ARITMETICA 40
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
Media Armnica
Es el inverso de la media aritmtica de los inversos de los
datos. Sus frmulas son; para n datos:
n 1
MH
1 1 1 1

x1 x2
...
xn
x
i

Para datos que se repiten: n


MH
1
fi xi
(fi es el nmero de veces que cada valor xi se repite)
La media armnica es siempre menor o igual que la media
geomtrica.
09/09/17 ARITMETICA 41
CEPRE-UNI
MEDIDAS DE CENTRALIZACIN
Ejemplo: en los datos: 7; 8; 8; 9; 10; 11
La media aritmtica es:
53
8,833
6

La media geomtrica es: 6


7.8.8.9.10.11 8,73

6
La media armnica es: 8,63
1 1 1 1 1 1

7 8 8 9 10 11
09/09/17 ARITMETICA 42
CEPRE-UNI
MEDIDAS DE DISPERSIN
Las medidas de tendencia central determinan el centro
de los datos estadsticos, pero no nos indican nada
acerca de la posicin respecto al centro. Por lo tanto se
necesita una medida que nos indique el grado de
dispersin o variacin respecto al centro con la finalidad
de tener una comparacin y ampliar la descripcin de los
datos.
Las medidas de dispersin son:
El rango, rango intercuartil, la varianza, la desviacin
estndar y el coeficiente de variacin.
En este curso solo veremos la varianza y la desviacin
estndar.
09/09/17 ARITMETICA 43
CEPRE-UNI
MEDIDAS DE DISPERSIN
VARIANZA Y DESVIACIN ESTNDAR
Definicin:
La varianza es una medida que indica el grado de
dispersin o variacin de los valores de una variable
cuantitativa respecto a la media aritmtica.
Si los valores de la variable tienden a acercarse
alrededor de la media, la varianza es pequea.
Si los valores de la variable tienden a estar lejos de
la media, la varianza es grande.

09/09/17 ARITMETICA 44
CEPRE-UNI
MEDIDAS DE DISPERSIN
Definicin Matemtica
La varianza es la media aritmtica de los cuadrados de las
diferencias de los datos respecto a su media aritmtica.
Sus unidades estn elevadas al cuadrado.

Definicin Matemtica
La desviacin estndar es la raz cuadrada positiva de la
varianza.
La varianza calculada a partir de una muestra se denota
s2 y la desviacin estndar es
s s
2

09/09/17 ARITMETICA 45
CEPRE-UNI
MEDIDAS DE DISPERSIN
Varianza para datos no tabulados
Si x1, x2, ...., xn son variables estadsticas cuantitativas y

x es su media, entonces la varianza es:


n n
(xi x) 2
aplicando propiedades de
xi
2

s 2 i1 sumatorias, se obtiene: 2

n
s
2 i1
x
n
Ejemplo:
Si: 18, 19, 20, 16, 17, 22 son datos no tabulados que
representan las edades de los alumnos del CEPRE-UNI.
La varianza y la desviacin estndar es:
09/09/17 ARITMETICA 46
CEPRE-UNI
MEDIDAS DE DISPERSIN
Resolucin
n = 6,
n 2
x 112 x 18,6 n

i1
i
x
i1
i 2114

Luego la varianza es:


n

xi
2
2 2114
s
2 i1
x 18,6 2 6,373 aos 2
n 8

La desviacin estndar es:

S s 6,373 2,52 aos


2

09/09/17 ARITMETICA 47
CEPRE-UNI
MEDIDAS DE DISPERSIN
Varianza para datos tabulados por Intervalos

Si x1, x2, ............. xk, son las marcas de clase de k


x
intervalos, f1, f2, ...., fk, son las frecuencias absolutas de
una variable x y es la media, entonces la varianza s 2
es:

k aplicando k

f ( x' x) f x'
2 2
i i propiedades i i
2
de sumatoria S x
2 i 1
S 2 i 1
n
n se obtiene:
09/09/17 ARITMETICA 48
CEPRE-UNI
Ejemplo:
El siguiente cuadro representa el nmero de hijos de una
urbanizacin A, se desea saber, cul es la varianza y
desviacin estndar.

fi
li xi Xi fi fi xi2
de hijos
[0,2> 1 15 15 15
[2,4> 3 12 36 108
5 7 35 175
[6,8> 7 1 7 49
[8,10> 9 3 27 243
[10,12> 11 2 22 242

40 142 832
09/09/17 ARITMETICA 49
CEPRE-UNI
k k

f x' 142 f x'


2
n 40 , k 6, i i i i 832
i 1 i1

142
x 3,55 hijos
40
Luego la varianza es:
k

i
f x ' 2

832
2
S
2 i 1
x 3,552 8,1975 hijos 2
n 40
La desviacin estndar es:

s s 2 8,1975 2,86 hijos

09/09/17 ARITMETICA 50
CEPRE-UNI

Anda mungkin juga menyukai