Anda di halaman 1dari 19

1.

Estadstica clsica

1-1

Estadstica Avanzada y Anlisis de Datos


Javier Gorgas y Nicols Cardiel

Curso 2006-2007

Mster Interuniversitario de Astrofsica

1. Estadstica clsica Introduccin


En ciencia tenemos que tomar decisiones (son los datos compatibles con la teora? cules son los parmetros que mejor ajustan? son las dos muestras similares? qu ha fallado, cmo podemos mejorar el experimento?) Para cada medida o parmetro derivado necesitamos una estimacin del error que nos diga, en trminos de probabilidades, la confianza que tenemos en su valor. La estadstica es la herramienta, en la mayora de los casos, inevitable para tomar las decisiones (el mtodo cientfico).

1-2

If your experiment needs statistics, you ought to have done a better experiment (E. Rutherford) En particular, en astrofsica: Nuestras medidas estn sujetas a (grandes) errores de medida. Tenemos la mana de observar al lmite de las capacidades instrumentales. El mtodo clsico de repetir los experimentos no es aplicable. No podemos disear los experimentos (las muestras pueden ser muy pequeas)

1. Estadstica clsica Introduccin (II)


No podemos evitar la estadstica: Cmo asignamos errores a nuestros datos? (o los de otros) Cmo podemos extraer la informacin mxima de los datos? (o los tiramos?) Cmo comparamos muestras? (de diferentes objetos o de diferentes autores) Cmo hacer correlacin, contrastar hiptesis, ajustar modelos? Qu hacer con las muestras incompletas? (lmites superiores?) NECESITAMOS DECIDIR Nuestros colegas usan estadstica. Tenemos que entender lo qu hacen y cmo lo hacen. Curso con un enfoque prctico (recetas) Mtodos paramtricos clsicos Mtodos no paramtricos Estadstica bayesiana

1-3

1. Estadstica clsica Programa


1. 2. 3. 4. 5. 6. 7. 8. 9. Estadstica clsica Introduccin a la estadstica bayesiana Clculo de errores Regresin lineal Correlacin Regresin mltiple Contrastes de hiptesis para una muestra Contrastes de hiptesis para varias muestras Anlisis de componentes principales

1-4

10. Estimacin de parmetros 11. Deteccin de la seal Surveys 12. Anlisis de datos astrofsicos

1. Estadstica clsica

1-5

Tema 1
Estadstica clsica
Introduccin Estadstica descriptiva Distribuciones de probabilidad Distribuciones discretas de probabilidad Distribucin normal Estimacin de parmetros poblacionales Distribuciones muestrales de los estadsticos Estimacin por intervalos de confianza Contrastes de hiptesis Mtodos no paramtricos

1. Estadstica clsica Estadstica descriptiva


centralizacin
Media aritmtica Media geomtrica Media armnica Media cuadrtica

1-6

Mediana
Me: Valor central (con
los datos ordenados de mayor a menor)

Moda
Mo: Valor con
mayor frecuencia

dispersin

Varianza Desviacin media Desviacin tpica Coeficientes de variacin

asimetra

curtosis

Momento de orden r respecto a c

1. Estadstica clsica Distribuciones de probabilidad


Funcin de probabilidad para una variable discreta: Funcin de distribucin:

1-7

Funcin de densidad para una variable continua:

Funcin de distribucin:

media (esperanza matemtica)

varianza

covarianza

1. Estadstica clsica Distribuciones discretas de probabilidad


Distribucin Binomial
Probabilidad de obtener x xitos en n ensayos (p = probabilidad de xito en un ensayo)
donde

1-8

Media:

Desviacin tpica:

Distribucin de Poisson
Probabilidad de que se den x sucesos ( = nmero medio de sucesos)
donde

Media:

Desviacin tpica:

1. Estadstica clsica Distribucin normal

1-9

Media:

Desviacin tpica:

Normal tipificada:

Teorema del lmite central: Si X1, X2, , Xn son variables aleatorias independientes con

medias i, desviaciones tpicas i y distribuciones de probabilidad cualesquiera, y definimos la variables Y = X1 + X2 + + Xn, entonces la variable:
cuando

Ej. la distribucin binomial tiende a la distribucin normal:

Ej. la distribucin de Poisson tiende a la distribucin normal:

1. Estadstica clsica Estimacin de parmetros poblacionales


La estimacin se hace a partir de estadsticos (variables aleatorias definidas sobre los valores de la muestra) con funciones de probabilidad conocidas

1-10

Estimacin puntual

Estimacin por intervalos de confianza

Mtodo de mxima verosimilitud: Mtodo objetivo para encontrar buenos estimadores


puntuales: Funcin de mxima verosimilitud: probabilidad de obtener la muestra observada dado un valor del parmetro poblacional:

El estimador de mxima verosimilitud es el valor de que hace mximo L Ejemplo: para una distribucin normal:

1. Estadstica clsica Distribuciones muestrales de los estadsticos


es la media de una muestra aleatoria de tamao n que se toma de una poblacin con distribucin cualquiera, media y varianza 2, entonces la variable tipificada: tiende a una normal N(0,1) cuando n tiende a infinito

1-11

Distribucin muestral de la media: Si

Dsitribucin muestral de la diferencia de medias: Si


muestrales de dos distribuciones (1, 1) y (2, 2) entonces:

son las medias

tiende a una normal N(0,1) cuando n1 y n2 tienden a infinito

Distribucin muestral de la varianza:

El estadstico t:

Distribucin muestral de la razn de varianzas:

sigue una distribucin con n-1 grados de libertad

sigue una distribucin t de Student con n-1 grados de libertad

sigue una distribucin F de Fisher con n1-1 y n2-1 grados de libertad

1. Estadstica clsica Estimacin por intervalos de confianza


Ejemplo: media de una poblacin normal

1-12

nivel de confianza

Si la desviacin tpica es desconocida:

Muestras grandes (n > 30)

Muestras pequeas

(significado del intervalo de confianza)

1. Estadstica clsica
Intervalos de confianza

1-13

1. Estadstica clsica
Intervalos de confianza

1-14

1. Estadstica clsica Contrastes de hiptesis


Formulacin de las hiptesis: Hiptesis nula (H0)
Aceptacin de la hiptesis nula Rechazo de la hiptesis nula

1-15

vs

Hiptesis alternativa (H1)

los datos no estn en contra los datos indican que es improbable que sea cierta

Se utiliza un estadstico de prueba con distribucin conocida en el caso de que H_0 sea cierta

Ejemplo: media de una poblacin normal

: nivel de significacin

Contraste bilateral
regin crtica regin de aceptacin regin crtica

Contrastes unilaterales
regin crtica regin de aceptacin regin de aceptacin

1. Estadstica clsica
Contrastes de hiptesis

1-16

1. Estadstica clsica
Contrastes de hiptesis

1-17

1. Estadstica clsica
Contrastes de hiptesis

1-18

1. Estadstica clsica Mtodos no paramtricos


Mtodos parmetricos: muestras aleatorias extradas de poblaciones con distribucin
de probabilidad conocida (normal). El problema es determinar los parmetros de la poblacin (ej. , )

1-19

Mtodos de distribucin libre o NO paramtricos: no se supone ninguna


distribucin de probabilidad. Muchas veces se basan en ordenar los datos en una escala asignando rangos (anlisis de rangos). VENTAJAS En general no se conoce la distribucin de probabilidad (el teorema del lmite central puede no aplicarse). Menos suposiciones sobre los datos. Vlidos para muestras muy pequeas. Sirven para datos no numricos (variables cualitativas y de rango). Respuestas rpidas con menos clculos. La conversin a rangos elimina incertidumbres con la escala. A veces no existe la poblacin (no hay parmetros que estimar). DESVENTAJAS No usan toda la informacin disponible. Al no haber parmetros, es difcil hacer estimaciones cuantitativas. Son algo menos eficientes: (para rechazar la hiptesis nula con el mismo nivel de confianza se necesitan muestras mayores)
Eficiencia relativa asinttica: para tomar la decisin con el mismo (tpicamente: ARE entre 0.6 y 0.95)

(Ante la duda es ms seguro usar mtodos no paramtricos)

Anda mungkin juga menyukai