Anda di halaman 1dari 29

Temas adicionales

Causas pequeas, grandes efectos.

En este captulo se estudiarn algunos temas de especial importancia en la teora de la probabilidad y la estadstica. 1. Teorema central del lmite Sin duda alguna, ste es uno de los teoremas ms importantes en la teora de la estadstica y justifica el papel preponderante de la distribucin normal en ella.
TEOREMA 6.1 (Teorema central del lmite). Sean Xh X2, X3,,.., Xn observaciones aleatorias e independientes de una funcin de distribucin arbitraria tal que E(X) = //, y V(E) = a2 (i y a finitos). Entonces la variable aleatoria

converge a una variable aleatoria normal, con media Oyvarianza 1: lm Yn = Z ~ N(0,1).


n*oo

Demostracin Observe que


y/a a/y/

donde Z, = 2g

ww w.

at em

at

ic a

1.c

om

La funcin generatriz de momentos de Z, i = 1 , . . . , n,

es tal que MZ/(0) = 1; M'z(0) = E(Z) = 0; y Km Mz(t) = V(Z,) = -. Y por el teorema de Taylor, se sabe que existe un nmero real 6 (0, i) tal que

y por la independencia de las variables aleatorias Xi9 i = 1, 2, 3 , . . . , n (las variables aleatorias Z,- tambin son independientes), se tiene

De todo esto se sigue que

que es la funcin generatriz de momentos de una distribucin normal, con media igual a cero y varianza igual a uno. Y como la funcin generatriz de momentos es inyectiva, se prueba el teorema. El teorema central del lmite afirma que para cualquier muestra aleatoria, con la nica condicin de que su media y varianza sean valores finitos, la funcin de distribucin de Y\ X,-, de X y de y/(X IL)/(T se puede aproximar con una distribucin normal, y se cumple tanto con distribuciones continuas como con discretas. Cuando la variable aleatoria es discreta, se introduce un factor de correccin, como ser ver ms adelante.

ww w.

at em

at

ic

Entonces,

a1

.c om

De acuerdo con el teorema central del lmite, cuando el tamao de la muestra es "grande", se tiene que

X ~ N(ii, <r2/n)

cr

U).

(X) = 1^+2^ + 3 ^ + 4 ^ + 5 i + 6 ^ = 3.5


0 0 0 0 0 0

y su varianza es

V(X) = Cl-3.5) 2 + ( 2 3 55 ) + . )2
o o

ww w.

EJEMPLO 6.1. Se lanza sucesivamente un dado no cargado. X indica el nmero de la cara del dado que cae hacia arriba en el -simo lanzamiento; as, i = 1, 2,3,4,... Como se puede ver, X, es una variable aleatoria uniforme discreta cuyo rango es Rx = {1,2,3,4,5,6} y cuya funcin de densidad es f(x) = 1/6. La media de X es

at em

at

ic

El siguiente ejemplo es un caso en que la convergencia hacia la distribucin normal es excepcionalmente rpida.

. ++((5533 5 )

a1
2

.c om

El tamao de la muestra requerido para tener una "buena" aproximacin normal depende de la distribucin particular de las variables.

+(63.5)

= f.
12

En seguida se presenta grficamente el comportamiento de la funcin de densidad de X, donde X\9 X2,... Xn indican los resultados de las observaciones de n tiradas de un dado no cargado para una muestra de tamao n, con n = 1,2,3, 4, 5 y 6. En la grfica se dibuj la funcin de distribucin exacta de X, distribucin que es discreta, y la aproximacin normal correspondiente, que es continua.

Resultados de la tirada de un dado, n = 1 y Xx = Xu X = 1, 2, 3, 4, 5, 6. Las barras representan la densidad de X\\ la curva punteada, la aproximacin normal correspondiente. 1 2 3 ' 4 5 6

Resultados de las tiradas de tres dados, n = 3, X3 = * 1+ ^ + *? X = 1, f, ,...,f, 6. Las barras representan la densidad de X3; la curva punteada, la aproximacin normal correspondiente.

Se tiene el resultado de las tiradas de cuatro dados, n = 4, X4 = Xi+x2+x3+x4^ L a s b a r r a s representan la densidad de X4; la curva punteada, la aproximacin normal correspondiente.

ww w.

at em

at
1 2 3 ' 4

ic

Resultados de las tiradas de dos dados. n=2,X2 = && X = 1, 1.5, 2 , . . . , 5.5, 6. Las barras representan la densidad de X2; la curva punteada, la aproximacin normal correspondiente.

a1

.c om

Se tiene el resultado de las tiradas de cinco dados, n = 5, X$ = Xx+Xi+Xt+Xt+x^ Las barras representan la densidad de X5; la curva punteada, la aproximacin normal correspondiente.

3. ,4

Se tiene el resultado de las tiradas de seis dados, n = 6 X = xx+x2+Xi+x4+x5+x^ Las barras reo

En este ejemplo se puede observar lo siguiente: En los primeros casos la aproximacin es muy mala y conforme aumenta el tamao de la muestra, la aproximacin mejora. Adems, conforme n crece, la curva normal se concentra ms, esto es, su varianza disminuye. La probabilidad en la distribucin discreta corresponde a la suma de las reas de las barras; la probabilidad en la distribucin continua corresponde al rea bajo la curva en el intervalo correspondiente a las barras consideradas. 1.1 La binomial, aproximada por la normal. Si X es una variable aleatoria binomial con parmetros n y p (n, nmero de experimentos Bernoulli, y /?, probabilidad de xito en cada uno de estos experimentos), entonces

donde X ~ Bernoulli(p), i = 1,..., n. Por ser X igual al resultado de una suma de variables aleatorias para valores "grandes" de n la distribucin binomial se puede aproximar con una distribucin normal.

ww w.

at em

at

ic

a1

presentan la densidad de X\ la curva punteada, la aproximacin normal correspondiente.

.c om
2

33'54

L
5

20

P(X = k)~P(k-0.5<Y<k

ww w.

La media y la varianza de la aproximacin normal coinciden con la media y la varianza de la distribucin binomial: i = npyo2 = np{\ p). Si X es una variable aleatoria binomial y Y es la correspondiente variable normal que la aproxima, entonces se cumple la relacin

at em

at

ic

a1

FIGURA

6.1 Funcin de densidad binomial con n = 20 y p = 0.30. La grfica est recargada hacia el cero, ya que la media es 6.

+ 0.5) = /
Jk-0.5

.c om

fY(y)dy.

El valor de 0.5 es el factor de correccin para compensar el cambio de una distribucin discreta a una continua. En un caso se tiene que la probabilidad es el rea de una barra, en el otro caso es el rea bajo la curva. En general, se tiene que P(a < X < b) = P(a - 0.5 < Y < b + 0.5).
EJEMPLO 6.2. Si X es una variable aleatoria binomial con parmetros n = 15y/? = 0.15, encuentre la probabilidad de que X est entre 5 y 10.

Solucin La probabilidad "exacta" se encuentra con la tabla de la distribucin binomial, con n 15 y p = 0.15. P(5 < X < 10) = F(10) - F(4) = 1 - 0.9383 = 0.0617

... 1
4

k -0.5

k + 0.5

La probabilidad "aproximada" se encuentra con la tabla de la distribucin normal. Para ello, primero se encuentran la media y la varianza de la variable aleatoria binomial. tL = np = 15(0.15) = 2.25 o2 = np{\ - p) = 15(0.15)(0.85) = 1.9125 = o- = 1.3829317 con estos valores se estandariza la variable aleatoria:

ww w.

La diferencia entre el valor "real" y el valor "aproximado" de la probabilidad es igual 0.0101.


EJEMPLO 6.3. Sea X una variable aleatoria binomial con n = 15 y p = 0.35; encuentre el valor exacto y el valor aproximado de

at em
P(5<X<

= P(1.63 < Z < 5.96) = P(0<Z< 5.96) - P(0 < Z < 1.63) = 0.5 - 0.4484 = 0.0516.

at

ic
10).

FIGURA

6.2 rea de una barra aproximada por el rea bajo la curva normal.

a1

.c om

II

Solucin La probabilidad "exacta" se encuentra con la tabla de la distribucin binomial, con n 15 y p = 0.35. P(5<X< 10) = 0.9972 - 0.3519 = 0.6453. La probabilidad aproximada se encuentra con la tabla de la distribucin normal, li = np= 15(0.35) = 5.25 o2 = np{\ -p) = 15(0.35)(0.65) = 3.4125 o- = 1.8473

6.4. Sea X una variable aleatoria binomial con parmetros = 18 y p = 0.5. Encuentre el valor exacto y el aproximado de la probabilidad que X sea igual a 9.
n

Solucin Utilizando la tabla de la distribucin binomial, se tiene que P(X = 9) = F(9) - F(8) = 0.5927 - 0.4073 = 0.1854, mientras que por la aproximacin normal se tiene que i = 18(0.5) = 9 a2 = 18(0.5X0.5) = 4.5 a = 2.1713203

} ~ V2.1713203 - 2.1713203; P(-0.2354 < Z < 0.2354) = 0.1850. La diferencia entre los dos valores es 0.0004.

<X<9.5)ff
"

ww w.

EJEMPLO

La diferencia entre el valor exacto y el aproximado es igual a 0.0078. La diferencia es menor que en el caso anterior, y este hecho no es casual ya que mientras el valor de p se encuentre ms cerca de 0.5, la convergencia hacia la normal ser ms rpida (0.35 est ms cerca de 0.50 que 0.15).

at em

at

= P(-0.40 < Z < 2.84) = P(0<Z< 0.40) + P(0 < Z < 2.84) = 0.1554 + 0.4977 = 0.6531.

ic

a1

<Z<

.c om

De estos tres ltimos ejemplos se puede ver que aunque n no sea muy grande, la aproximacin normal ya es buena. El teorema central del lmite afirma que esta aproximacin mejora conforme n aumenta de valor. La tabla de la distribucin binomial que se incluye en este libro, slo tiene los clculos para valores de n menores o iguales a 25; para valores mayores que 25, se puede hacer el clculo de las probabilidades con la funcin de densidad exacta (lo que resulta muy latoso y poco preciso por los redondeos), o aplicar el teorema central del lmite y utilizar una aproximacin normal. En los casos en que la probabilidad de xito sea casi 0, o casi de 1, y n sea grande, la distribucin binomial se puede aproximar con una distribucin de Poisson. 1.2 El promedio muestral aproximado por una normal. Se tiene una poblacin de tamao N, y X es la variable de inters (X podra ser: edad, ingreso, nmero de hijos, etc.). La media y la varianza poblacionales de la variable X son E(X) = /n y V(X) = o2 respectivamente. De esta poblacin se extrae una muestra aleatoria de n unidades, X\, X2,.. , Xn. Sin importar cul sea la distribucin de la variable X, con base en el teorema central del lmite se puede afirmar que el promedio X tiene una distribucin aproximadamente normal, con media / y varianza o2 n, cuando n es grande. 6.5. La media y la varianza poblacional de la variable X son: x = 67 y o2 = 81; qu porcentaje de las muestras de tamao 100 tiene un promedio muestral entre 65 y 69?
EJEMPLO

Solucin El teorema central del lmite afirma que X es aproximadamente N(/JL, ~ ) , as que X-#(67,81/100)
y

ww w.

at em

= P(-2.22 < Z < 2.22) = 0.9736.

at

ic

a1

.c om

Este resultado implica que el 97.36% de las muestras tienen un promedio entre 65 y 67. 6.6. Se proyecta hacer un muestreo de 100 unidades de una poblacin cuya varianza poblacional es 9. 1. Qu porcentaje de las posibles muestras tiene un promedio que no difiere del promedio poblacional en ms de 0.5? 2. Al realizar el muestreo se encontr que X = 29. Cmo se puede utilizar esta informacin para hacer inferencias con respecto a /JL'1
EJEMPLO

Solucin 1. Se pide encontrar la probabilidad P(-0.50


<X-/JL<

0.50),

para lo cual se utiliza el hecho de que X ~ P(\X


-/JL\<

a1

.c om
N(/JL,

9/100).

Si la muestra no forma parte de ese grupo, se tendr que |29 - /x| > 0.5 = //, (28.5,29.5). Entonces, al obtener la muestra se tiene un 90.30% de confianza de que la media poblacional estar contenida en el intervalo sealado. Ejercicios 6.1. El 5% de la produccin de tornillos de una fbrica resulta tener algn tipo de defecto. Si se empacan cajas con 250 tornillos y se garantiza que no ms del 7% de los mismos son defectuosos, cul es la probabilidad de que una caja dada no cumpla la garanta?
EJERCICIO

ww w.

El 90.30% de las muestras tiene un promedio entre fi 0.5 y \x + 0.5. 2. Se sabe que el 90.30% de todas las posibles muestras tiene un promedio que difiere menos de 0.5 del valor de fi. Si la muestra que se obtuvo pertenece a este grupo, se tendr

|29 - /x| < 0.5 => ne (28.5,29.5).

at em

at

0.50) = P(-0.50/0.3 < (X - jtO/0.3 < 0.50/0.3) - P(-1.66 < Z < 1.66) = 0.9030.

ic

6.2. Sean X\, X2, X 3 ,..., X50 el tiempo que duran funcionando 50 focos. Encuentre el intervalo de 90% de confianza para el valor medio de vida de la poblacin de focos, si X = 305 horas y a2 = 50. Use la aproximacin normal.
EJERCICIO EJERCICIO 6.3. Sean X\9 X2, X3, ...X50 una muestra de variables aleatorias Bernoulli independientes. Si X = 0.39, encuentre un intervalo de 95% de confianza para el parmetro p. Use la aproximacin normal. EJERCICIO 6.4. Sea X\, X2, X 3 ,... X50 una muestra de variables aleatorias Poisson independientes. Si X 17, encuentre un intervalo de 99% de confianza para el parmetro A. Use la aproximacin normal.

1. Para seleccionar una muestra de una distribucin particular. 2. Para simular un proceso aleatorio que sondee sus propiedades estadsticas. Una simulacin permite tener resultados cuando es muy difcil efectuar el experimento o bien cuando resulta difcil analizar las caractersticas de los estimadores. La herramienta indispensable para hacer una simulacin es una tabla de nmeros aleatorios. Una tabla de nmeros aleatorios presenta, en una serie numrica, los resultados de elegir al azar, sucesivamente y con reemplazo, uno de los diez dgitos: 1,2,3,4,5,6,7,8,9,0. Entonces, la tabla representa los resultados de una muestra de una distribucin uniforme discreta con 10 valores posibles.
En realidad el proceso para generar los nmeros aleatorios no es aleatorio. Se obtienen utilizando algoritmos que aprovechan las propiedades de congruencia de los nmeros enteros. En la actualidad se pueden utilizar las subrutinas de algunos lenguajes de cmputo, como Pascal o C, los cuales tienen una funcin RANDOM(X) que proporciona un nmero "aleatorio".

ww w.

at em

Una serie de nmeros aleatorios est formada por los resultados de elegir sucesivamente con reemplazo uno de los 10 dgitos. Los nmeros aleatorios se utilizan para dos cosas:

at

ic

a1

2. Nmeros aleatorios y simulacin

.c om

Por lo general, las tablas de nmeros aleatorios se presentan en columnas de cinco cifras cada una. Uno puede iniciar la eleccin de los nmeros aleatorios en cualquier columna o rengln, y se puede recorrer la tabla en cualquier direccin: hacia atrs o hacia adelante, hacia arriba o hacia abajo. En los ejemplos aqu presentados se iniciar siempre en la primera columna y en el primer rengln, y se recorre la tabla hacia adelante. El siguiente es un fragmento de una tabla de nmeros aleatorios. 10480 15011 01536 02011 81647 94739 31648 30598 29650 94383 con este fragmento se resolvern los siguientes ejemplos. 6.7. Simule la tirada de 10 volados usando la tabla de nmeros aleatorios.
EJEMPLO

{guila} {0,2,4, 6, 8}

at em

Solucin Como al lanzar una moneda se tiene igual probabilidad de que salga un guila o un sol, se considerar que si en la tabla de nmeros aleatorios aparece un nmero par, el resultado del volado es guila, y si el nmero es non el resultado del volado es sol. As, los dos posibles eventos tienen igual probabilidad.

at
y

ic

| s, a, a, a, a, s, s, a, s, s | EJEMPLO 6.8. Simule 8 veces la tirada de un dado no cargado usando la tabla de nmeros aleatorios. Solucin Si el resultado de lanzar un dado es un nmero entero entre 1 y 6, cada vez que uno de estos nmeros est en la tabla se considerar que es el resultado de una tirada, y si se tiene uno de los nmeros 7, 8, 9 o 0, se pasar al siguiente nmero. Observe los resultados que se tienen utilizando los primeros nmeros del fragmento de la tabla de nmeros aleatorios. Nmeros en la tabla: 10480 15011 01536 02011 8164 7 Note que se han escrito en negritas los nmeros que, de acuerdo con el ejemplo, se pueden elegir.

ww w.

De esta manera, el primer rengln del fragmento de la tabla de nmeros aleatorios (10480 15011) dara un resultado para los diez volados de

a1

{sol} {1,3, 5,7,9}

.c om

Resultados de las ocho tiradas del dado (simulacin): 1,4,1,5,1,1,1,5


EJEMPLO 6.9. Simule la eleccin al azar de 5 personas de un total de 20, si el muestreo se hace 1. sin reemplazo, 2. con reemplazo.

20 20, 40, 60, 80,00 1. Muestreo con reemplazo: Se elige a una persona de acuerdo con el nmero en la tabla, sin restringirlos. Nmeros en la tabla:

10480 15011 01536 02011 81647


Eleccin con reemplazo de 5 personas: 10,8,1,10,11. 2. Muestreo sin reemplazo: Se elige una persona de acuerdo con el nmero en la tabla, pero si aparece un nmero que ya antes apareci, no se escoge y se pasa al siguiente nmero. Nmeros en la tabla:

10480 15011 01536 02011 81647


Eleccin sin reemplazo de 5 personas: 10,8,1,11,3.
EJEMPLO 6.10. Simule la eleccin de 2 nmeros de una distribucin normal, con media 0 y varianza 1.

ww w.

at em

1 2 3

01,21,41,61,81 02,22,42,62,82 03,23, 43, 63, 83

at

ic

a1

Solucin Como el total de personas es 20, se toman nmeros de dos dgitos para representar a cada una. Observe que desde 01, 02, etc., hasta 99 y 00 hay un total de 100 valores. A cada persona le corresponden 5 nmeros de la tabla; por ejemplo, la asociacin puede ser la siguiente: Persona Nmeros que se le asocian

.c om

Solucin La tabla de nmeros aleatorios es el resultado de las observaciones de una distribucin uniforme discreta. Por el teorema central del lmite, se sabe que el promedio de n observaciones tiene una distribucin que tiende a la normal; y, como se vio en el ejemplo de las tiradas sucesivas de un dado, cuando la distribucin de las observaciones es uniforme, la convergencia hacia la normal es muy rpida. Si X es la variable aleatoria uniforme con recorrido igual a Rx = {0,1,2, 3,4, 5, 6,7, 8, 9}, entonces E(X) = 4.5, V(X) = 8.25 y a/n = V0.825 = 0.908. Considere el promedio de 10 observaciones de una distribucin uniforme. Por el teorema central del lmite, se tiene que y, finalmente, se tiene que la variable aleatoria
z

Xl=

ww w.

=-

1+0+4+8+0+1+5+0+1+1

Los nmeros en la tabla de nmeros aleatorios son 10480 15011 01536 02011 81647. Ei promedio de 10 de ellos es

_ X X2

0+1+5+3+6+0+2+0+1+1 =
_X7-4.5_2.1-4.5_ _0.908 0.908

at em

at
o

ic

a1
1.9

X ~ JV(4.5,0.825)

Las dos realizaciones de una normal con media 0 y varianza 1 son


1

0.908 0.908 TEOREMA 6.2. Sea X ~ 7(0,1) una variable aleatoria y sea y = h(x) una funcin continua y extrictamente creciente; entonces la funcin de densidad deY = h(X) es FY(y) = h~\y) y fY(y) = fyh~\y). Demostracin Si X ~ C/(0,1), entonces fx(x) = 1, para 0 < x < 1.

.c om

Si Y = h(X) y h(x) es invertible, entonces

fr(y) = fx{h-\y))^h~\y) = fy~\y)


queda demostrado el teorema.
EJEMPLO 6.11. Simule la seleccin al azar de una observacin exponencial con A = 1.

10480 15011 01536 02011 81647

son

ww w.

Fi = 0.11071, Y2 = 0.69535, Y3 = 0.76791, Y4 = 0.12575. Ejercicios

6.5. Simule la eleccin de una observacin de Poisson con parmetro A = 3, usando la tabla de nmeros aleatorios (considere la aproximacin a la binomial cuando n = 1000 y p = 0.003).
EJERCICIO

6.6. Simule la seleccin con reemplazo de 4 bolas de una urna que contiene 3 bolas rojas y 7 bolas negras.
EJERCICIO EJERCICIO 6.7. Simule la eleccin de una observacin binomial con parmetros n = 10 y p = 0.40, usando la tabla de nmeros aleatorios.

6.8. Simule la eleccin de 10 observaciones exponenciales con A = 3, usando la tabla de nmeros aleatorios (considere la funcin inversa de la exponencial).
EJERCICIO EJERCICIO 6.9. Simule la eleccin al azar de una pgina de un directorio telefnico de 2000 pginas.

at em

Las observaciones uniformes son Xl = 0.104801, X2 = 0.501101, X3 = 0.536020, X4 = 0.118164. Las observaciones exponenciales correspondientes, Y = ln{\ X),

at

ic

Solucin Aplicando el teorema anterior, considere la funcin de distribucin exponencial F{x) = 1 e"X9 cuya funcin inversa es h(x) = ln{\ x). Entonces, si X ~ /(0,1) y Y = - / n ( l - X), Y es una variable aleatoria exponencial. Para hacer la simulacin escoja nmeros de 6 dgitos, como se indica en seguida (pueden ser menos dgitos, pero no menos de 3). Los nmeros en la tabla de nmeros aleatorios son

a1

.c om

3. Mnimos cuadrados El mtodo de los mnimos cuadrados es uno de los muchos mtodos estadsticos que se utilizan para estimar el valor de uno o ms parmetros desconocidos en un modelo probabilstico. La idea del mtodo es dar un estimador de la media, encontrando el valor "ms cercano" a los datos. 6.12. La estatura promedio de una poblacin de personas i es un parmetro desconocido, para estimarlo se toma una muestra aleatoria. Sean X\, X2,..., Xn, las estaturas de las personas en la muestra. Se va a estimar la estatura promedio de la poblacin usando el mtodo de mnimos cuadrados.
EJEMPLO

M/) = y = o * -/*)2i=i i=i

El valor que minimiza esta suma es el estimador de mnimos cuadrados de /x. El estimador de mnimos cuadrados se encuentra al derivar la funcin h(/jb) e igualar a cero esta derivada.

Esta expresin se hace cero cuando fi = x; as, el estimador de mnimos cuadrados de //, es el promedio muestral. Otra aplicacin del mtodo de mnimos cuadrados es la estimacin de los parmetros de una funcin, que describe la asociacin entre dos o ms variables numricas. Por ejemplo, considere que en un proceso industrial, la temperatura y la presin estn asociadas mediante una relacin lineal. Al tomar algunas observaciones de la temperatura y presin del proceso, se obtiene la grfica de la figura 6.3. X corresponde a la temperatura y Y a la presin asociada.

ww w.

at em

donde e es el error aleatorio de la observacin con E(e) = 0 y V(e) = a2. Dado que i es un parmetro desconocido, un criterio para estimarlo es haciendo que la suma de los cuadrados de los errores, h(fi)9 sea mnima:

at

ic

X = fi + e,

a1

Solucin Sea x la media poblacional de la estatura de las personas, y entonces se puede considerar que cada dato en la muestra es de la forma

.c om

donde e indica el error aleatorio de observacin con las propiedades

E(e) = 0 y V(e) = a2.


E(Y\X = x) = a + bx y V(Y) = a2.

ww w.

De aqu se sigue que

at em

Y = a + bX + e,

at

ic

Al observar la grfica se infiere que el modelo ms simple para describir la presin como funcin de la temperatura es una recta; as, puede pensarse que cada dato de Y es igual a

a1

FIGURA

6.4 Recta que describe la tendencia de los datos.

.c om

FIGURA

6.3 Diagrama de la dispersin de

XyY.

- X

La recta queda determinada cuando se conoce la ordenada al origen el nmero a , y la pendiente de la recta | el nmero b . Los estimadores de mnimos cuadrados para a y b tienen la caracterstica de hacer mnima la suma

H{a, b) = * ? = ( U - {a + bXd)2.
i=l 1=1

Para encontrar los valores de a y b que hacen mnima esta suma, se deriva con respecto a las dos variables, se igualan a cero las derivadas respectivas y se resuelve el sistema de ecuaciones lineales resultante.

.c om

dH(a, b) = 0 da La solucin es

dH(a, b) =0 db = Y-bX.

Se propone como modelo la ecuacin de una recta, para lo cual hay que obtener X. = (11.93 +11.81 + 11.48 +11.49 +10.13 + 8.87)/6 = 10.951 Y = (62.56 + 57.78+53.10+48.61+44.38+40.57)/6 = 51.167 Y) = 44.103 Y.UiXi-XXYi ?=i(X - X)2 = 7.271 Los estimadores de a y b se calculan ahora fcilmente: -7) 44.103 b= = 6.065 TS-i(Xt-Xy 7.271 a = Y - bX = 51.167 - 6.065 x 10.951 = -15.259. As, la recta estimada es ?= -15.259 + 6.065X. TEOREMA 6.3. Los estimadores de mnimos cuadrados de los parmetros del modelo Y = a + bx + e son insesgados.

ww w.

at em

6.13. Los siguientes datos corresponden a la velocidad (en km/s) y a la altura (en km) de la estrella fugaz nmero 1242; con estos datos se quiere determinar una funcin que describa la asociacin entre las dos variables: zX (velocidad, km/s) 11.93 11.81 11.48 11.49 10.13 8.87 62.56 57.78 53 10 48.61 44.38 40.57 Y (altura, km)

- xy

at

ic

EJEMPLO

a1

Ahora, observe que

De aqu se sigue que

J=1

La demostracin del corolario es trivial. 6.4. Sea t(x) = a + bx la recta estimada por el mtodo de mnimos cuadrados, entonces para un valor fijo XQ, se tiene que la varianza de Y(xo) est dada por
TEOREMA

Demostracin Observe que

f(x0) = + bxo = Y-hX + bxo = Y + (xo- X)b


1

ww w.

at em

Se concluye que los estimadores de los parmetros obtenidos por el mtodo de mnimos cuadrados son insesgados. COROLARIO 6.1. Sea t(x) = a + bx la recta estimada por el mtodo de mnimos cuadrados, y entonces

at

ic

a1

.c om

Solucin Primero se van a encontrar algunas identidades que sern tiles en la demostracin. 1.

1=1

=1

1=1

1=1

i=

at

ic
=i

a1 at em
d -X) =
1=1

.c om
- X)X
1=1

X^n

(Y.

Y\2

Vn

(Y

Y\Y.

3.

- Y) = E L i ( ^ -

Esta demostracin es anloga a la anterior. Para probar que b es insesgado, se usa la identidad 3, b = U (Xt - X)(Yt - Y) EU (Xi - X)Yi

y usando la propiedad de linealidad de la esperanza, bX)

ww w.

M
1= 1

Por ser Y, i = 1,2,..., n variables aleatorias independientes,

" \_

2(x0 - X)(Xi - X)

hw
(1

j2U(Xxf
(xp-Xf
2

(xo-XfjXj-X)2}

(zu(Xx) ) r

2 2

"\
TEOREMA 6.5.

Sdl) )

^ a t = a + bX el estimador de mnimos cuadrados de Y(Xi), y entonces n-2 wn estimador insesgado de a2, esto es,
n-

Demostracin Observe que

ww w.

Antes de proseguir con esta expresin se analiza cada trmino:


F(V2} V(Y) 4- FY-'W2 rr2 A- FFY-YI2

at em
4?
n i
/=1

at
<r2 +

y, por ltimo,
t^ kY k)

= FYk E(Y

ic
u-xy

a1

.c om

Con la contribucin de uno de los trminos del primer sumando, se completa la segunda suma sobre todos los ndices.

- +

EYktk) =
ww w.

at em

at
(E(Yk)f.
n-2f

Regresando a la primera expresin de la demostracin, se obtiene

ic
1=1

lo cual prueba que -^ Y%=i o-2.


EJEMPLO

6.14. Se realiza un estudio sobre la cantidad de azcar transformada en cierto proceso a varias temperaturas. Los datos se dan en la tabla 6.1. Encuentre la recta de mnimos cuadrados para estos datos. Solucin X = (1 + 1.2 + 1.4 + 1.6 + 1.8 + 2)/6 = 1.5 Y = (7.8 +JS.5 + 9 + 8.8 + 9.3 + 10.2)/6 = 8.93

a1
n-2
es un estimador insesgado para

.c om

TABLA

6.1 Datos del ejemplo 6.14

Temperatura x Azcar transformada y 1 7.8 1.2 8.5 1.4 9.0 1.6 8.8 1.8 9.3 2 10.2

As, Y) 1.42

Y la recta estimada es:

Adems, el estimador de la varianza a2 es igual a n-2 4

Para analizar la varianza de % se calcula la varianza en cada punto de la muestra, y se escriben el mximo y mnimo de un intervalo de confianza para la recta estimada dado por % s y % + s. En la tabla 6.2 se presentan los valores de Yu s2 = V{%) y de Y s yY+s. Observe que cuando X, est ms cerca de X, la varianza de Y es menor. En la grfica de la figura 6.5 se presenta la varianza alrededor de la recta estimada. En la misma figura, los puntos ( . ) indican los extremos de los intervalos de confianza alrededor de la recta estimada, y los asteriscos ( *) representan los datos mustrales.

ww w.

Y = 5.89 + 2.0286X

at em

_ a = Y - bX = 8.93 - 2.0986 x 1.5 = 5.89.

at

ic

a1

.c om

TABLA 6.2

Intervalo de confianza para la recta. Pronstico Mnimo Mximo Y (T 2 =4 ti-s ti+S 7.919 0.0367 7.7274 8.1106 0.0226 8.1847 8.4653 8.325 8.730 0.0156 8.6134 8.8466 0.0156 9.0194 9.2526 9.136 9.542 0.0226 9.4017 9.6823 9.948 0.0367 9.7564 10.1396

Temp. Az. t. X Y 1 7.8 1.2 8.5 1.4 9.0 1.6 8.8 1.8 9.3 2 10.2

FIGURA

6.5 Extremos del intervalo de confianza de la recta en un punto dado. Ejercicios

EJERCICIO

6.10. Probar que el punto (X, Y) es un punto de la recta

Y = a + bX. 6.11. Dadas las variables aleatorias independientes Y\, Y2, ...,Yn tales que V(Yi) = a2, para i = 1,2,..., n, pruebe que:
EJERCICIO

(b) V(a) = o-2EJL, Xj/n EU(Xi - *f = V(h)EU


EJERCICIO

(a) V(h) =

cr2/ZU(Xi-X)2

ww w.

1.0

at em
1.2

10.5 10 9.5 9 8.5 8 7.5 7

at
1.4 1.6 1.8 2.0 2.2

ic
^/n.

6.12. Las cantidades de sustancia qumica (Y) diluidas en agua a diferentes temperaturas (X) se encuentran en la siguiente tabla:

a1

.c om

0 0 0 15 15 15 30 30 30 45 45 45 60 60 60 75 75 75 y 8 6 8 12 10 14 25 21 24 31 33 28 44 39 42 48 50 44
X

(a) Estime la recta de regresin lineal para estos datos. (b) Estime la cantidad de sustancia diluida en el agua cuando la temperatura es de 50 C.
EJERCICIO 6.13. Una compaa refresquera quiere determinar la ecuacin que asocia el costo de publicidad (X) con las ventas realizadas (Y). Se tienen 12 observaciones en miles de pesos.

40 20 25 20 30 50 40 20 50 40 25 50 y 385 400 395 365 475 440 490 420 560 525 480 510
X

Considere una partcula que se mueve sobre un plano con un movimiento de acuerdo con los resultados de una serie de experimentos independientes del tipo Bernoulli, con probabilidad de xito igual a p. Cuando en el experimento Bernoulli ocurre un xito, la partcula se mueve a la derecha / mm; si, por el contrario, ocurre un fracaso, la partcula se mueve / mm hacia la izquierda. Al principio del proceso, la partcula se encuentra en el origen. Los experimentos Bernoulli se efectan cada T segundos y los movimientos a la derecha se consideran positivos y hacia la izquierda negativos. En este contexto, la variable aleatoria X(t), que indica la posicin de la partcula en el tiempo t, describe un procedimiento aleatorio conocido como caminatas aleatorias. Por ejemplo, considere los siguientes 10 resultados del lanzamiento de una moneda no cargada. La caminata aleatoria correspondiente a este resultado est dada en la grfica de la figura 6.6.
DEFINICIN 6.1. Dada una sucesin de experimentos Bernoulli independientes, con probabilidad de xito igual a /?, se definen las variables aleatorias X\, X2, X 3 ,..., tales que X = I si ocurre xito y Xt = -I

ww w.

s, a, a, s, s, a, s, s, s, a, a

at em

at

ic

4. Caminatas aleatorias

a1

(a) Estime la recta de regresin lineal para estos datos. (b) Estime las ventas cuando el costo de publicidad es 50.

.c om

FIGURA

TEOREMA 6.6. Sea X(ln) una caminata aleatoria definida por n experimentos Bernoulli independientes. El recorrido de X(ln) est dado por

Rx(in) = {-/i/, ~(n - 2)/, -(n - 4 ) / , . . . , (n - 4)/, (n - 2)/, ni}, y su funcin de densidad por P(X(ln) = mi) = Demostracin Sea X la variable aleatoria que indica el nmero de xitos en los n experimentos Bernoulli independientes, y entonces X ~ B(n, p)\ el rango de Xes Rx = {0,1,2,. . . , * }

ww w.

esto es, una caminata aleatoria indica la diferencia entre el nmero de xitos menos el nmero de fracasos de los n experimentos Bernoulli multiplicada por /.

at em

at

/i) = X,;

ic

si ocurre fracaso en el /-simo experimento Bernoulli (/ > 0). Se llama caminata aleatoria a la sucesin dada por

a1

.c om

6.6 Caminata aleatoria.

y su funcin de densidad es

fx(x)=(")px(l-p)n-x.
La caminata aleatoria indica la diferencia entre el nmero de xitos, X, menos el nmero de fracasos n X, multiplicada por /; as, X(ln) = [X - (n - X)]l = (2X - n)l y considerando el rango de X, el rango de X(ln) es % = {-*/, - ( * - 2)/, -(/i - 4 ) / , . . . , (/i - 4)/, (n - 2)/, n/}. X{n)(ml) = P(X(ln) = mi) = P[(2X - n)l = m] Su funcin de densidad es

Esto es lo que se quera demostrar.


TEOREMA

6.7. Sea X{lri) una caminata aleatoria, y entonces

E(X(ln)) = (2p - \)nl y

Demostracin X(ln) = (2X ri)ly dado que se conoce la media y la varianza de la variable aleatoria binomial, se pueden utilizar las propiedades de linealidad del valor esperado y las propiedades de la varianza para calcular la media y la varianza de la caminata aleatoria. As, se tiene que

E(X(ln)) = E[(2X-n)l] = [E(2X)-E(n)]l = (2np-n)l = (2p-l)ln


y

V(X(ln)) = V[(2X - n)l] = V(21X) = 4l2np(l - p); entonces queda demostrado el teorema. EJEMPLO 6.15. Un borrachito sale de la cantina y quiere llegar a su casa, pero sus pies no le responden. As, l puede dar un paso hacia su casa con probabilidad p = | y un paso hacia atrs con probabilidad

ww w.

at em

at
V(X(ln)) = 4np(l - p)l2.

i+n 2

ic

a1

.c om

(a) Cul es la posicin esperada del borrachito, con respecto a la cantina, en el intento nmero 50? (b) Si su casa est a 40 pasos de la cantina, cul es el nmero esperado de intentos necesarios para llegar a ella? Solucin (a) La posicin del borrachito con respecto a la cantina en el intento 50 es una caminata aleatoria con / = 1 y n = 50; entonces (X(50/)) = (f - 1)50 = f = 16.66. Esto significa que en el intento 50, el borrachito estar en promedio a unos 17 pasos de la cantina, en direccin de su casa. (b) Sea Y(i) la variable que indica el nmero de intentos necesarios para que el borrachito est por primera vez a i pasos en direccin de su casa, partiendo desde cualquier punto. As, para i > 1, Y (i) = Y(i - 1 ) + 7(1); esto es, el nmero de intentos para llegar por primera vez a la posicin i desde un punto dado, es igual al nmero de intentos para llegar por primera vez a la posicin i 1 ms el nmero de intentos para llegar desde ah por primera vez a la posicin 1. En general, Y(i) = 7^1) + 72(1) + ... + 7,(1). Si la casa del borrachito est a 40 pasos de la cantina, entonces el nmero de intentos que ste requiere para llegar a su casa est dado por la variable 7(40) = 7i(l) + 72(1) + ... + r-(l); as, el valor esperado de 7(40) es (7(40)) = EiXxd)) + E(Y2(1)) + + Efl^CD) = 40Z< (7(1)). Para encontrar el valor esperado de 7(1) se utiliza la propiedad ((7(1) | Xi)) = E(YiX donde Xl indica el resultado del experimento Bernoulli que determina el primer movimiento desde la posicin dada. Ahora observe que X1 = l) = l de manera que E(E(Yl | X0) = E(Y, | Xx = y

ww w.

at em

at

ic

a1

l))

.c om

y entonces
E{YX) = 3.

Finalmente, E(Y40) = 40^(70 = 120. Ejercicios 6.14 (Magnetismo). Un tomo tiene un spin \ y un momento magntico JA. De acuerdo con la mecnica cuntica, su spin puede apuntar hacia arriba o hacia abajo con respecto a una direccin dada. Cuando se tienen N tomos, el momento magntico es igual a JL veces el nmero de tomos con spin apuntando hacia arriba, menos i veces el nmero de tomos con spin apuntando hacia abajo. Si las dos posiciones del spin son igualmente probables, cul es el momento magntico total neto?
EJERCICIO EJERCICIO 6.15. Suponga que un apostador est jugando un peso cada vez en un juego de azar. La probabilidad de que gane o pierda un peso es igual a 0.5. Si comienza con 10 pesos, cul es la probabilidad de que despus de 8 juegos tenga 6 pesos?

6.16. Considere una partcula que se mueve una unidad hacia la derecha, con probabilidad 0.3, o hacia la izquierda, con probabilidad 0.7. Cada movimiento es independiente de los anteriores. Despus de 20 movimientos, cul es la probabilidad de que la partcula se encuentre 8 lugares a la derecha de su posicin original?
EJERCICIO

ww w.

at em

at

ic

a1

.c om

Anda mungkin juga menyukai