Variables aleatorias
En este tema se introduce el concepto de variable aleatoria y se estudian los distintos tipos de variables aleatorias a un nivel muy general, lo que nos permitir manejar los modea los estad sticos para describir los posibles resultados de un experimento aleatorio y asignar probabilidades a los diferentes sucesos que nos interesen.
Contenido
4.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 4.2. Variable aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3. Variables discretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. Variables continuas . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.5. Independencia de v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . 4.6. Caracter sticas de una v.a. . . . . . . . . . . . . . . . . . . . . . . . 4.7. Desigualdad de Chebichev . . . . . . . . . . . . . . . . . . . . . . . Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 9 10 11 12 12 13 14
4.1.
Introduccin o
Tanto en la vida cotidiana como en el campo cient co estamos habituados a observar fenmenos aleatorios cuyos resultados se expresan mediante nmeros; por ejemplo el voltaje o u de salida en una fuente de alimentacin, el nmero de personas en la cola del cine, la velocidad o u de conexin a la red, etc. Incluso en problemas de naturaleza puramente cualitativa es muy o frecuente recurrir a la codicacin numrica; en situaciones tales como: el diagnstico de un o e o paciente sano o enfermo, preguntas del tipo estudias o trabajas?, etc., las respuestas son usualmente codicadas con 0 y 1, aunque en realidad podr emplearse cualquier pareja a de s mbolos con igual precisin. o
4.2.
Variable aleatoria
Este proceso de cuanticacin nos lleva de manera natural a considerar la siguiente o denicin: o 9
Curso 2007 - 08
Denicin 4.1 (Variable aleatoria). Dado un espacio de probabilidad (, A, Pr), una vao riable aleatoria es cualquier funcin, X, o X : R X() que asocia a cada suceso elemental un nmero real, vericando que u PrX (B) = Pr[X B] = Pr{ | X() B} B R.
En general emplearemos las siglas v.a. para referirnos a una variable aleatoria. Para caracterizar la distribucin de probabilidad inducida por una v.a. X deniremos o una nueva funcin ms sencilla de manejar: o a Denicin 4.2 (Funcin de distribucin). Dada la v.a. X se denomina funcin de distrio o o o bucin asociada a X, a la funcin F : R R denida por: o o F (t) = Pr[X t] = Pr(X (, t]) t R.
2. F () = l Pr[X t] = 1. m
t
4. F es no decreciente, es decir, si t1 < t2 entonces F (t1 ) F (t2 ). Teorema 4.1. Una funcin F : R R se dice que es de distribucin si y slo si verica o o o las cuatro propiedades anteriores.
4.3.
Variables discretas
Denicin 4.3 (Variable discreta). Una variable aleatoria discreta es aquella que slo o o puede tomar valores dentro de un conjunto nito o innito numerable. Denicin 4.4 (Funcin de probabilidad). Sea X una v.a. discreta que toma los valores xi o o con probabilidades pi = Pr(X = xi ), con i pi = 1. Se denomina funcin de probabilidad o de la variable X a la funcin que asigna a cada xi su probabilidad pi . o En las variables aleatorias discretas la funcin de distribucin viene dada por la siguiente o o expresin: o F (t) = Pr[X t] = Pr(xi ).
xi t
Esta funcin es escalonada, no decreciente, con saltos de discontinuidad en los puntos xi . El o valor del salto en xi coincide con la probabilidad, pi , de dicho valor. Dpto. Estadstica e I.O. y D.M. 10
Curso 2007 - 08
4.4.
Variables continuas
Denicin 4.5 (Variable continua). Una variable aleatoria continua es aquella que toma o valores en uno o varios intervalos de la recta real. En las v.a. continuas la funcin de distribucin no se puede calcular como la suma de las o o probabilidades de ciertos puntos porque el conjunto de posibles valores de la variable es no numerable. Para abordar esta nueva situacin necesitamos la nocin de funcin de densidad. o o o Denicin 4.6 (Funcin de densidad). Dada una v.a. continua X, su funcin de densidad o o o es la funcin real de variable real o f (x) = l m Pr(x h X x + h) . 2h
h0+
De este modo, surge el concepto de funcin de densidad como la funcin l o o mite a la cual se aproxima el histograma. As la probabilidad de un intervalo (a, b) ser el area limitada , a por esta funcin de densidad, las rectas x = a, x = b y el eje de abscisas. Aunque, de acuerdo o con la anterior, la probabilidad de que la variable aleatoria tome un valor concreto es igual a cero, tiene sentido analizar lo densamente que est repartida la probabilidad en torno a a ese valor. De la denicin anterior, se deduce que la funcin de densidad verica las siguientes o o propiedades: 1. f (x) 0 x R.
2.
f (x)dx = 1.
En general, cualquier funcin real que verica las propiedades anteriores es la funcin o o de densidad de alguna v.a. continua X. La funcin de distribucin de una v.a. continua X se expresa a partir de la funcin de o o o densidad como:
t
F (t) =
f (x)dx t R.
Esta funcin es continua. o Por lo tanto, la funcin de densidad de una v.a. continua es la derivada de su funcin o o de distribucin, f (x) = F (x). o Por otro lado, las v.a. continuas verican las siguientes propiedades:
t2
1. Pr(t1 < X t2 ) =
t1
3. Pr(X = t) =
t
f (x)dx = 0
x R. 11
Curso 2007 - 08
4.5.
Independencia de v.a.
Frecuentemente, al realizar un experimento aleatorio interesa estudiar conjuntamente varias caracter sticas de la poblacin que se van a representar mediante v.a. Si limitamos el o estudio al caso de dos v.a. Denicin 4.7. Se dice que dos v.a. X e Y son independientes si se verica que o Pr(X = x Y = y) = Pr(X = x) Pr(Y = y) si X e Y son discretas f(X,Y ) (x, y) = fX (x)fY (y) si X e Y son continuas
4.6.
Las medidas resumen denidas para v.e. pueden generalizarse al caso de variables aleatorias, sin ms que equiparar las frecuencias relativas de variables estad a sticas con las probabilidades de las variables aleatorias. Entre los descriptores ms habituales de las variables a aleatorias se encuentran: Denicin 4.8 (Esperanza). Dada una v. a. X denida sobre (, A, Pr), se denomina eso peranza o valor medio de X a la siguiente expresin o xi Pr(xi ) si X es discreta xi SX = E(X) = xf (x)dx si X es continua
1. E(aX + b) = aE(X) + b. 2. E(X Y ) = E(X) E(Y ). 3. Si X e Y son independientes, entonces E(X Y ) = E(X)E(Y ). Denicin 4.9 (Varianza). La varianza de una v.a. X viene dada por la expresin o o (xi )2 Pr(xi ) si X es discreta si X es continua
2 = Var(X) = E (X )2 =
xi SX
(x )2 f (x)dx
La varianza de una v.a. verica las siguientes propiedades: 1. Var(X) 0. 2. Var(aX + b) = a2 Var(X). 3. Var(X) = E(X 2 ) E(X)2 . Dpto. Estadstica e I.O. y D.M. 12
Curso 2007 - 08
4. Si X e Y son independientes, Var(X + Y ) = Var(X Y ) = Var(X) + Var(Y ). Para simplicar la interpretacin de las medidas de dispersin, se suele recurrir a la o o desviacin t o pica que viene dada en las mismas unidades que la variable Denicin 4.10 (Desviacin t o o pica). La desviacin t o pica de una v.a. X viene dada por la expresin o = + Var(X). De igual forma a como se ha hecho para las variables estad sticas se denen otras caracter sticas de una v.a.: Moda Es el valor que maximiza la funcin de probabilidad o la funcin de densidad, segn o o u se trate de una v.a. discreta o continua, respectivamente. Mediana Es la medida de centralizacin que divide la distribucin en dos partes de igual o o probabilidad, por lo tanto verica que Me = nf{x | F (x) 1/2}. Cuantiles de orden p Para 0 < p < 1, Qp = nf{x | F (x) p}. Recorrido intercuart lico Se dene a partir de los cuart como RIC(X) = Q3 Q1 . les Coeciente de variacin Medida de dispersin relativa con respecto a la media, dada por o o CV (X) = si > 0.
4.7.
Desigualdad de Chebichev
Dada una v.a. X con media y desviacin t o pica , la desigualdad de Chebichev arma que para cualquier constante positiva, k > 0 se cumple que Pr(|X | k) 1 2 , k2 equivalentemente Pr(|X | > k) 2 k2 k > 0.
La desigualdad anterior tambin se puede expresar como e Pr(|X | k) 1 1 , k2 equivalentemente Pr(|X | > k) 1 k2 k > 0.
Por ejemplo, se tiene que Pr(X [ 2, + 2]) 0,75 o Pr(X [ 3, + 3]) 0,889.
Este resultado destaca la bondad de la desviacin t o pica como medida de dispersin reso pecto a la media, proporcionando un l mite inferior para la probabilidad de que una v.a. est comprendida en el intervalo [ k, + k]. e
13