x1 x2 ... xn
El promedio de la muestra se
denomina
Dicho promedio es un estimador de la
media de la poblacin. La media de la
poblacin es un parmetro y se
denomina
MEDIA ARITMETICA
x1 x2 ... xn
x
n
Frecuencia absoluta
xi ni
x
n
1
n
x x fi
1
fi
Frecuencia relativa
10d et 4d c d nr
d
10 4 1
MEDIA ARITMETICA
Siempre es razonable calcular
directamente el promedio sin
analizar los datos?
Si una distancia es medida 5 veces y los
valores en metros son:
10.65
10.62
10.63
10.63
12.63
Ms adelante, cuando se
vean los distintos tipos de
errores, se ver de que
forma detectar los errores
groseros u outliers.
La idea es detectar esos
valores atpicos y
eliminarlos para volver
poder hacer los clculos que
correspondan
Volviendo al
promedio
xi
x1 x2 ... xn
x
x
1 n
Hay que tener presente
que el verdadero valor
n
de una magnitud nunca se puede conocer con
n
vi xi x
v
1
v1 x1 x
v2 x2 x
vn xn x
n
xi nx
v
1
n
xi
x
1 n
n
Recordemos que:
n
vi
1
n
x nx
i
v nx nx
i
MEDIANA
Es un nmero tal que la mitad de
las observaciones sean menores
y la otra mitad mayores.
Si n es impar
M es la observacin
central
Si n es par
M es la media de las
observaciones
centrales
LA MEDIANA DE
UNA CURVA DE
DENSIDAD ES EL
PUNTO QUE
DIVIDE AL AREA
POR DEBAJO DE
LA CURVA EN DOS
PARTES IGUALES
Cuartiles
Cuartiles
Ordenar datos
El primer cuartil Q1 es la mediana
de las observaciones a la izquierda
de la mediana de la totalidad
El tercer cuartil Q3 es la mediana
de las observaciones situadas a la
derecha de la mediana de la
totalidad
Grados de libertad
La suma de las desviaciones es siempre 0
La ltima desviacin se puede hallar cuando se
conocen las otras n-1. Por tanto slo n-1
observaciones son independientes
Al nmero n-1 se le llama grados de libertad de la
varianza o desviacin estndard
Lo correcto es calcular dividiendo por n-1, para
valores de n muy grandes no habrn diferencias
apreciables
Curvas de densidad
La curva es ms sencilla
para trabajar que el
histograma
Notacin importante
Dado que la curva de densidad es una descripcin idealizada de una
distribucin de datos, se debe distinguir entre la media y desviacin tpica de
una curva de densidad, y la media x y la desviacin estndar s calculadas a
partir de observaciones reales
Distribucin normal
Sin duda, la distribucin continua de
probabilidad ms importante, por la
frecuencia con que se encuentra y
por sus aplicaciones tericas, es la
distribucin normal, gaussiana o
de Laplace-Gauss.
Fue descubierta y publicada por
primera vez en 1733 por De Moivre.
A la misma llegaron, de forma
independiente, Laplace (1812) y
Gauss (1809), en relacin con la
teora de los errores de observacin
astronmica y fsica .
x = )
Puntos
de
inflexin
- , Mo, Mn +
+
33
N(, ): Interpretacin
probabilista
Entre la media y
una desviacin
tpica tenemos
siempre la misma
probabilidad:
aproximadamente
el 68%.
Entre la media y
dos desviaciones
tpicas aprox. 95%
34
Problema
z=
x -
68 %
2 95 %
3 99 %
68%
95%
-3
-2
-1
99%
0
z
1
37
Ejemplo
La distribucin de alturas de
mujeres es aproximadamente
normal con 1.64m
0.06m
Ejemplo