Anda di halaman 1dari 11

Estadstica y Anlisis de Datos 2014

PLANTILLA DE FRMULAS
Axiomas de la probabilidad
1. P(A) 0.
2. P(S) = 1.
3. ( ) ( ) , cuando los Ai son eventos mutuamente excluyentes
Algunas propiedades de la probabilidad
a) P(A) = 1 P(A) para cualquier evento o suceso A.
b) P() = 0.
c) Si A B, entonces P(A) P(B).
d) Si A B, entonces P(B A) = P(B) P(A).
e) 0 P(A) 1.
f) P(A B) = P(A) + P(B) P(A B).
g) P(A B C) = P(A) + P(B) + P(C) P(A B) P(A C) P(B C) + P(A B C).

PROBABILIDAD CONDICIONAL
PA B
PA/B
PB
TEOREMA DEL PRODUCTO
Sean S el espacio muestral de un experimento aleatorio, A y B dos sucesos tales que P(A) 0 y P(B) 0,
entonces:
P(AB) = P(B).P(A/B) = P(A).P(B/A)

SUCESOS INDEPENDIENTES
Definicin: Se dice que dos eventos cualesquiera A y B son independientes si se cumple la condicin
P(A/B)= P(A) cuando P(B) > 0.
De manera anloga puede interpretarse la igualdad equivalente P(B/A) = P(B), suponiendo naturalmente
que P(A) > 0.
Teorema 1: A es independiente de B B es independiente de A
Teorema 2: A y B son independientes P(AB) = P(A). P(B)

PROPIEDADES DE LA INDEPENDENCIA
1. A y S son sucesos independientes
2. A y son sucesos independientes
3. Si A y B son incompatibles y adems P(A) 0 y P(B) 0 A y B no son independientes
4. Si A y A son sucesos contrarios A y A no son independientes
5. Si AB y P(A) 0, P(B) 1 A y B no son independientes

1
Estadstica y Anlisis de Datos 2014
1) Ay B son independientes

6. Si A y B son independientes 2) A y Bson independientes
3) Ay Bson independientes

TEOREMA DE LA PROBABILIDAD TOTAL


S
Sea un suceso A, que se presenta en forma conjunta con
Bn
otros B i , donde: B1 , B 2 , B 3 , ... , B n son sucesos excluyentes B1
entre s, pero compatibles con A. A

Adems, todos los sucesos estn incluidos en S, es decir: ...


B2
A S ; Bi S . Adems se cumple:
B3
B1 B2 B3 ..... Bn S

Entonces:

P(A) P(A / B1 ) .P(B1 ) P (A / B 2 ) .P(B 2 ) P (A / B 3 ) .P(B 3 ) ..... P(A / Bn ) .P(Bn )

Que es la frmula que permite hallar la Probabilidad Total del suceso A.


P(A / B1 ) ; P (A / B 2 ) ; P (A / B 3 ) ; .....; P(A / Bn ) y P(B1 ) ; P(B 2 ) ; P(B 3 ) ......P(Bn ) son conocidas, es decir
que son datos.

TEOREMA DE BAYES
El teorema de Bayes trata de encontrar un valor para la probabilidad condicional de BK: P(BK/A)
P(A B K ) P(A/B K ).P (B K ) P(A/B K ).P (B K )
P(BK/A) = n
P(A) P(A)


P(A/B ).P(B )
i 1
i i

P(A/B K ).P (B K )
Por lo tanto: P(BK/A) = n
(1)


P(A/B ).P(B )
i 1
i i

n
Propiedad: P(B /A) 1
K 1
K

VARIABLES ALEATORIAS
FUNCIN DE DISTRIBUCIN
Definicin: F(t) = P(X t) se llama funcin de distribucin correspondiente a la variable aleatoria
unidimensional X.

PROPIEDADES DE LA FUNCIN DE DISTRIBUCIN


Teorema 1: Sea F la funcin de distribucin de una variable aleatoria X. Sean a y b nmeros reales que
verifican a < b.
I. P(a < X b) = F(b) F(a)

2
Estadstica y Anlisis de Datos 2014
II. P(a X b) = F(b) F(a) + P(X =a)
III. P(a X < b) = F(b) F(a) P(X =b) + P(X =a)
IV. P(a < X < b) = F(b) F(a) P(X =b)

VARIABLES ALEATORIAS DISCRETAS


Teorema: Para cualquier distribucin de probabilidad discreta, lo siguiente debe ser verdadero:
1. 0 pj 1 para toda xj.

2. p j j 1 , donde la sumatoria es para todos los valores de xj con probabilidad distinta de cero.

Definicin: Llamamos funcin de distribucin de una variable discreta X a la funcin:

F(t) = P(X t) = p
x t
j
j

VARIABLES ALEATORIAS CONTINUAS


Definicin: Sea X una variable aleatoria continua con funcin de distribucin F. Una funcin f no negativa se
denomina funcin de densidad de probabilidad de X (o de F) si es integrable en todo intervalo [a; t] y si
t
F(t) F(a) = a f(x) dx
t
F(t) = P(X t) = f(x) dx vlida para todo t real
Teorema: Propiedades de una funcin de densidad. Si f(x) es una funcin de densidad para una variable
aleatoria continua, entonces:
1. f(x) 0 para todo x.

2. f(x) dx 1
t
3. F(t) = f(x) dx
dF
4. f(x) =
dx
ESPERANZA MATEMTICA
Definicin: Sea X una variable aleatoria discreta con la funcin de probabilidad p(x). Entonce

EX p j .x j
j

Definicin: Sea X una variable aleatoria continua y f(x) su funcin de densidad de probabilidad. Entonces

E(X) = x f x dx

PROPIEDADES DEL OPERADOR ESPERANZA


1) Si Y = a.X + b, con a Ryb R E(Y) = a. E(X) + b
2) Si Y = a, con a constante E(Y) = E(a) = a

3
Estadstica y Anlisis de Datos 2014
VARIANZA
Definicin: consideremos una v.a. X, definimos
D2(X)=
D2(X) = E(X2) [E(X)]2
DESVIACIN TPICA
Definicin: consideremos una v.a. X, definimos desviacin tpica de la v.a. X, a la raz cuadrada positiva de la
varianza.
Notacin: D(X) = .
PROPIEDADES DE LA VARIANZA Y LA DESVIACIN TPICA
1) D2(X) 0
1) D(X) 0
2) Si Y = a.X + b D2(Y) = a2.D2(X)
2) Si Y = a.X + b D(Y) = | |.D(X)
3) Caso particular: Si Y = a.X D2(Y) = a2.D2(X) y D(Y) = | |.D(X)
4) Si Y = a D2(Y) = 0.

MODELOS PROBABILISTICOS DISCRETOS

MODELO BERNOULLI
La distribucin de probabilidad es:
X Fallo xito
p(X) q P
Esperanza matemtica y Varianza
E(X) =
xjpj = p
j

2 = D2(X) = E X E X = p.q
2 2

2
E(X 2) = x j p j = p
j

Desviacin tpica
= D(X) = p . q
El parmetro de este modelo es p (pR, 0 < p < 1)

MODELO BINOMIAL
Se define la variable aleatoria X que indica el nmero de veces que se present el suceso xito en las n
repeticiones del experimento 1 . Esta variable aleatoria se llama binomial, es discreta y asume n+1 valores:
0, 1, 2, , n.
La funcin de probabilidad es:
n
P( X x) . p x .q n x (1)
x

4
Estadstica y Anlisis de Datos 2014
siendo p la probabilidad de xito

La distribucin de probabilidad es:


X 0 1 2 n
n 0 n n 1 n 1 n 2 n2 n n 0
P(X) p q p q p q p q
0 1 2 n
Los parmetros de este modelo son n y p (nN, pR, 0 < p < 1)

Esperanza matemtica y Varianza


La esperanza matemtica de X es:
E( X ) E X 1 X 2 ... X n n. p
La varianza de X es:
D 2 ( X ) D 2 X 1 X 2 ... X n n. p.q
La desviacin tpica de X es: D( X ) n. p.q

MODELO GEOMETRICO
Se define la variable aleatoria X que indica el nmero de veces que se debio repetir un experimento tipo
Bernoulli hasta obtener el suceso xito. Esta variable tiene distribucin geomtrica, es discreta y asume n
valores: 1, 2, , n.
La funcin de probabilidad es:
P( X x) p .q x 1 (1)
siendo p la probabilidad de xito

El parmetro de este modelo es p (pR, 0 < p < 1)


Esperanza matemtica y Varianza
La esperanza matemtica de X es:
E( X ) 1/ p
La varianza de X es:
D 2 ( X ) (1 p) / p 2
La desviacin tpica de X es: D( X ) (1 p) / p 2

MODELO DE POISSON
Definimos la variable aleatoria X que indica el nmero de eventos que ocurre en un intervalo de tiempo o
regin espacial.
X es discreta y asume los valores: 0, 1, 2, 3.
La tasa media de ocurrencias del evento en un intervalo de tiempo o regin espacial es constante. Se
denota con .
t , donde denota el nmero promedio de ocurrencias del evento por unidad de tiempo,
espacio, volumen, etc. y t es el intervalo de tiempo o regin espacial considerado.

Se puede probar que la probabilidad de que X asuma el valor r, con r = 0, 1, 2, 3, se obtiene con la
frmula:
r
e
P (X r )
r!
En este modelo el nico parmetro es .

5
Estadstica y Anlisis de Datos 2014

Esperanza matemtica
E( X )
Varianza
Si E(X2) = 2 + .
De donde: D ( X ) E ( X ) ( E ( X ))
2 2 2

MODELOS PROBABILSTICOS CONTINUOS


DISTRIBUCIN UNIFORME EN UN INTERVALO

1
a xb
f x b a

0 para otros valores de x

Puede observarse que los parmetros de este modelo son a y b.


Integrando f(x), obtenemos la funcin de distribucin del modelo uniforme.

0 si xa
x a
F x si a x b
ba
1 si xb

Esperanza y Varianza
E X a2b

a 2
D 2 X b12

Desviacin tpica

D X
b a 2
12

DISTRIBUCIN EXPONENCIAL
Definicin: Una variable aleatoria continua X, que toma valores no negativos tiene distribucin exponencial
con parmetro > 0 si su funcin de densidad de probabilidad es:

.e x x0
f x
0 para otros valores de x

6
Estadstica y Anlisis de Datos 2014
1 e x x0
De manera que: F x
0 x0

Esperanza y Varianza
1
EX

1
D 2 X
2
Desviacin tpica
1 1
DX
2
DISTRIBUCIN NORMAL
Definicin: Una variable aleatoria continua X tiene distribucin normal general con parmetros (con un
valor entre y +) y (con un valor mayor que cero), si su funcin de densidad es:
2
1 x
1
f x e 2
para todo x
2
en donde m y son, respectivamente, la media y la desviacin tpica de la variable normal.
Con la notacin X es N(, 2) indicamos que X es normal general con parmetros y 2.

Esperanza y varianza
E(X) =
D2(X) = 2

Desviacin tpica
D(X) = 2

MODELO NORMAL STANDARIZADO O TIPIFICADO


Definicin: se dice que una distribucin normal es de forma estndar si su media = 0 y su desviacin tpica
= 1. Es una distribucin normal con parmetros 0 y 1, N(0, 1).

Funcin de densidad
A partir de la funcin de densidad de la distribucin normal general, vemos que la funcin de densidad de
la distribucin normal estandarizada es:

x2
1
x e 2 para todo x
2

Funcin de distribucin
u2 u
2
x 1 1 x
x e 2 du e 2 du
2 2

RELACIN ENTRE EL MODELO N(, 2) Y EL N(0, 1)

7
Estadstica y Anlisis de Datos 2014
X
Teorema: Sea X variable aleatoria con distribucin normal N(, 2) entonces Z es normal

N(0, 1).
Demostracin:
X
E Z E 0

X
D 2 Z D 2 1

Corolario: Si X es N(, 2) entonces:
a
P X a

b a
Pa X b

Para facilitar el clculo de probabilidad con la Distribucin Normal Estndar, existen tablas con (x) para
algunos valores de x.

Nota. Algunas tablas en los textos no traen los valores de (x) para valores negativos de x, por lo cual,
considerando la simetra de (x), se puede usar la siguiente relacin:
P(X x) = P(X x) = 1 P(X x) = 1 (x)

TEOREMA CENTRAL DEL LMITE


Caso de componentes iguales (Lindeberg Levy)
Teorema: Sean X1, X2, , Xn variables aleatorias independientes con la misma distribucin (con la misma
esperanza y con la misma varianza) y sean:
E(Xi) = 1 y D2(Xi) = 12 i = 1, 2, , n
Entonces, la variable aleatoria X = X1 + X2 + + Xn es asintticamente normal:
X

d
N n.1 , 12 .n
n

A su vez, la variable aleatoria = (X1 + X2 + + Xn )/n es asintticamente normal:


X

d

N .1 , 12 / n
n

DISTRIBUCIONES MUESTRALES

I) Distribucin de la proporcin muestral p


Pueden presentarse los siguientes casos:

a) que la muestra aleatoria se elija con reemplazo; en este caso p tendr distribucin binomial y los
valores previstos se calculan de la siguiente manera:
pq
E( p ) p ; D( p )
n
b) que la muestra aleatoria se elija sin reemplazo; en este caso p tendr distribucin hipergeomtrica y
los valores previstos se calculan de la siguiente manera:

8
Estadstica y Anlisis de Datos 2014

N1 pq Nn
E( p ) p ; D( p )
N n N 1
c) que la muestra aleatoria seleccionada sea grande (n 100), en este caso:
pq
p N p; , por teorema de De Moivre-Laplace.
n n

II) Distribucin de la media muestral X


Pueden presentarse los siguientes casos:

a) que la muestra aleatoria se elija con reemplazo y sea pequea.


Los valores previstos se calculan de la siguiente manera:
D 2 (X)
E( X) E(X) ; D( X) , donde E(X) y D2(X) son poblacionales
n
b) que la muestra aleatoria se elija sin reemplazo y sea pequea.
Los valores previstos se calculan de la siguiente manera:
D 2 (X) (N n)
E( X) E(X) ; D( X)
n (N 1)
c) que la muestra provenga de una poblacin normal, es decir X es N(m;), entonces:
2
X es N ;

n
(Nota: n puede asumir cualquier valor, no necesariamente debe ser grande, pues la muestra proviene de
una poblacin normal).

9
Estadstica y Anlisis de Datos 2014
INTERVALOS DE CONFIANZA
Estimar un parmetro mediante intervalos de confianza con un coeficiente
de confianza (1-) % consiste en encontrar valores 1 y 2 ( 1 2 ) de p: nivel de significacin
0 En general p p = .100
modo tal que P ( 1 2 ) 1 1
100

Media poblacional p . p .
1 , con conocido
P X X 1 Buscar p en Tabla
n n

Buscar tp en Tabla para (n-


Media poblacional , con t p.S t p.S
2 P X X 1 1) grados de libertad, S es
n
desconocido
n el corregido y buscar a 2
colas
n S corregido 2

Media poblacional , xi
n
n
x i2
n
xi

Luego se utiliza 2) para
3 X i1
con datos muestrales i 1 i1 desconocido
n S2
n ( n 1)
2 2
Buscar '' y , en Tabla para (n-1) grados de
p p
Varianza poblacional ( n 1) . S 2 ( n 1) . S 2
8 P 2 1 libertad siendo:
2 2 ,, 2, p
p p p ,, ; p , 100 p ,,
2

Amplitud del Se resta el extremo superior menos el inferior: Amplitud( 1 ; 2 ) 2 1


9
intervalo
Es el trmino que suma y resta en los extremos del intervalo que se estima, por ejemplo, el error mximo de
estimacin para la media poblacional
10 Error mximo de p . tp .S
estimacin con conocido es , y con desconocido es
n n

Para estimar el tamao n de la muestra de modo que el error mximo de estimacin sea menor, o bien,
menor o igual que un valor dado a, por ejemplo:
11 Tamao n de la p . 2p . 2
muestra a n y luego se aproxima al entero superior
n a2

TEST DE HIPTESIS
Realidad
H0 (V) H0 (V)
Decisin
ACEPTAR H0 Decisin correcta ERROR DE TIPO II
RECHAZAR H0 ERROR DE TIPO I Decisin correcta

Hiptesis nula: H0 hiptesis que se desea probar.


Hiptesis alternativa: H1 hiptesis que aceptamos al rechazar H0.
Riesgo : P(I): es una probabilidad muy pequea. Es decir, muy difcil rechazar H0, siendo verdadera.
Riesgo : P(II): es muy probable, que con esta regla de decisin, aceptemos un H0 falso.
Regin crtica: es donde se encuentran los valores de que nos llevan a no rechazar H0.
Valor p: es el nivel ms bajo de significancia en el cual el valor observado del estadstico de prueba es
significativo.
Regla de decisin
HIPTESIS DECISIN
H0: = 0 RECHAZAR H0 p
0 p = 1- (z)
H1 < 0 p = (z)
0 p = 2 [1- (z)]

10
Estadstica y Anlisis de Datos 2014
PARMETROS PARA LA MEDIA MUESTRAL
Caso I: Poblacin normal con conocido.

Estadstico de la prueba:

Caso II: Muestras grandes con desconocido

Estadstico de la prueba:

Caso III: Muestras pequeas con desconocido (Poblacin normal).

Estadstico de la prueba: tiene distribucin t con n-1 grados de libertad.

PARMETROS PARA LA PROPORCION



Estadstico de la prueba:
( )

PASOS PARA UNA PRUBA DE HIPOTESIS


. Elegir el nivel de confianza
. Identificar el parmetro de inters
. Determinar parmetro nulo y proponer H0 y H1 apropiada
. Determinar el estadstico de prueba: funcin de los datos muestrales en los que se basar la
decisin de rechazar o no la hiptesis nula. Dar la frmula sin reemplazar los valores muestrales.
. Establecer la regin de rechazo o regin crtica.: conjunto de todos los valores del estadstico
para los cuales se rechazar H0 para el nivel elegido.
. Calcular las cantidades necesarias.
. Decidir si H0 se rechaza o no y dar una conclusin en el contexto del problema.

11

Anda mungkin juga menyukai