Anda di halaman 1dari 27

TEOREMA DEL LMITE CENTRAL

Paloma Pez de la Cadena Universidad Autnoma de Madrid

Estadstica Inferencial
Mtodos para obtener conclusiones vlidas para

toda la poblacin a partir del estudio de una muestra. Aos 30 del siglo XX: Relacin entre la Probabilidad y la Estadstica Algunos nombres: De Moivre, Gauss Ronald A. Fisher (1890-1962) Karl Pearson Yale, Neyman y E. Pearson

Por qu se recurre a las muestras?


La poblacin es excesivamente numerosa
La poblacin es muy difcil o imposible de controlar El proceso de medicin es destructivo Se desea conocer rpidamente ciertos datos de la poblacin y

se tardara demasiado en consultar a todos

Poblacin y muestra

300.000 puntos

1.200 puntos

Muestreos

Distribuciones Muestrales
El estudio de determinadas caractersticas de una poblacin se

efecta a travs de diversas muestras que pueden extraerse de ella. Los estadsticos (media, mediana, desviacin tpica) obtenidos de las muestras nos van a permitir decidir sobre la aproximacin apropiada del correspondiente parmetro de la poblacin. Para abordar de manera satisfactoria los problemas anteriores, es necesario el conocimiento de las relaciones existentes entre los estadsticos muestrales y los parmetros de la poblacin. Como estos ltimos se infieren de los estadsticos, es necesario conocer la distribucin muestral de estos estadsticos.

Distribucin muestral de medias


Comenzamos con la situacin de obtener conclusiones sobre

la media de la poblacin a partir del estudio de las medias obtenidas en las muestras. Consideramos una poblacin y de ella extraemos muestras de tamao n Cada una de estas muestras tendr una media. Consideramos la variable aleatoria X, que asigna a cada muestra su media. As podemos estudiar su distribucin, llamada distribucin muestral de medias.

Ejemplo: Lanzamiento de varios dados

Media y desviacin tpica


MEDIA DESVIACIN TPICA

UN DADO DOS DADOS (PROMEDIO) TRES DADOS (PROMEDIO) CUATRO DADOS (PROMEDIO)

3,5 3,5 3,5 3,5

1,71 1,21 0,98 0,86

Conclusiones sobre la Media y la Desviacin Tpica


Las cuatro medias son iguales
La desviacin tpica es tanto menor cuantos ms dados

participan En la tabla anterior se puede comprobar que la desviacin tpica para n dados es:

desviacin tpica para 1 dado /n

Distribucin de las medias muestrales

Distribucin de las medias muestrales


El resultado del lanzamiento de un dado puede considerarse

un individuo de una poblacin infinita: lanzar un dado indefinidamente.


Lanzar un dado cuatro veces (o lanzar cuatro dados) puede

ser considerado como una muestra de tamao 4 de esa poblacin.


Segn ese punto de vista, la experiencia que hemos descrito

puede resumirse as:

Conclusiones sobre la Distribucin de las medias muestrales


Si de la distribucin resultado obtenido al lanzar un dado

extraemos muestras de tamaos n = 2, n = 3, n = 4, la distribucin de sus correspondientes medias se parece a una distribucin normal tanto ms cuanto mayor sea n. Todas las distribuciones tienen la misma media. Cuantos ms dados intervienen, menor desviacin tpica tiene la distribucin. Este resultado relativo al lanzamiento de un dado se generaliza para cualquier distribucin segn el siguiente teorema:

Teorema del Lmite Central


Dada una poblacin de media y desviacin tpica , no

necesariamente normal, la distribucin de las medias de las muestras de tamao n:


Tiene la misma media que la poblacin Su desviacin tpica es n y, por consiguiente, disminuye al

aumentar n Cuando n 30 es prcticamente normal

Condiciones
Es importante sealar que este teorema es vlido cualquiera que

sea la distribucin de la poblacin de partida El grado de aproximacin de la distribucin de las medias muestrales a la correspondiente normal depende del tipo de poblacin de partida y del valor de n
Si la poblacin de partida es normal, tambin lo ser la distribucin

de las medias muestrales, cualquiera que sea el valor de n Aunque la poblacin de partida no sea normal, la distribucin de las medias muestrales puede ser muy parecida a la normal, incluso para valores pequeos de n, pero para n30 es seguro que se consigue una gran aproximacin a la normal cualquiera que sea la distribucin de partida

Una simulacin del Teorema del Lmite Central


Simulacin de un estudio sobre el peso de una poblacin con

sobrepeso
Francisco Javier Barn

Universidad de Mlaga
http://www.youtube.com/watch?v=FcDcJnw00hk

Consecuencias / Ventajas
1.

Control de las medias muestrales En una poblacin de media y desviacin tpica , nos disponemos a extraer una muestra de tamao n. Antes de hacerlo, sabemos que la distribucin de las medias x, de todas las posibles muestras es normal, con media y desviacin tpica n y, por tanto, podemos averiguar la probabilidad de que la media de una muestra concreta est en un cierto intervalo

2.

Control de la suma de todos los individuos de la muestra La suma de todos los individuos de la muestra es una distribucin normal de media n y desviacin tpica n Por tanto podemos calcular cul es la probabilidad de que la suma de los elementos de una muestra est, a priori, en un cierto intervalo

3.

Inferir la media de la poblacin a partir de una muestra Esta es la aplicacin ms importante del Teorema del Lmite Central. A partir de una muestra se pueden extraer conclusiones vlidas sobre la media de la poblacin de partida

Mapa Conceptual

Estadstica inductiva y deductiva


Estadstica inductiva. Estimacin de parmetros
Buscar estadsticos muestrales que puedan considerarse buenos

estimadores de los parmetros poblacionales.

Estadstica deductiva. Contrastes de hiptesis


Plantear hiptesis sobre la poblacin y el uso de los datos de una

muestra para saber si son aceptables o no

El problema: Estimacin de la media


Uno de los problemas ms sencillos de la estadstica inductiva

es el de:

ESTIMAR EL VALOR DE LA MEDIA DE UNA POBLACIN A PARTIR DE UNA MUESTRA

Estimacin Puntual
Desconocemos los cocientes intelectuales de los alumnos de

una universidad, pero disponemos de los datos de una muestra de 200 de estos alumnos Calculamos x = 108 media del CI de los individuos de la muestra Parece razonable estimar que la media de la poblacin ser aproximadamente, igual que la media de la muestra, 108 Pero cmo de aproximadamente? La estimacin puntual sirve de poco mientras desconozcamos cul es el grado de aproximacin de x a

Estimacin por intervalos


A partir de una muestra aleatoria de tamao n podemos

estimar el valor de un parmetro de la poblacin del siguiente modo:


Dando un intervalo dentro del cual confiamos que est el

parmetro. Se llama intervalo de confianza.


Hallando la probabilidad de que tal cosa ocurra.

A dicha probabilidad se la llama nivel de confianza

Eficacia de una estimacin


Cuanto mayor sea el tamao de la muestra, mayor eficacia

tendremos en nuestra estimacin.


Esta eficacia se manifiesta de dos formas:
En el tamao del intervalo (cuanto ms pequeo, ms precisos

estamos siendo ) En el nivel de confianza (ms nivel de confianza significa mayor seguridad en la estimacin
Tamao de la muestra, longitud del intervalo y nivel de

confianza son tres variables estrechamente relacionadas

La Distribucin Normal
En un estudio estadstico, la distribucin normal se puede

aplicar a casi todas las muestras que se extraigan y a muchas poblaciones que las incluyan Karl Pearson entusiasta de la curva normal
Comprob que en la naturaleza haba medidas que no se distribuyen

normalmente Elabor esquemas especficos de dichas distribuciones Muchas distribuciones que a primera vista no son normales, resultan ser, despus de cuidadosos anlisis, una combinacin de dos o ms distribuciones normales

A lo largo de su historia ha sido mitificada y denostada

La distribucin Normal en Educacin


La CONSTANTE MACABRA o cmo se ha desmotivado a

muchos estudiantes (El rompecabezas)


Andr Antibi. Universidad Paul Sabati de Toulouse http://firgoa.usc.es/drupal/node/20362 Universidad de Santiago de Compostela

Extrado del libro


Alsina, C. Vitaminas matemticas. Cien claves sorprendentes para introducirse en

el fascinante mundo de los nmeros. Barcelona. Ariel. 2008

Anda mungkin juga menyukai