O Que Estatstica?
ESTATSTICA
A estatstica divide-se
em duas reas:
Estatstica Descritiva
Inferncia Estatstica
Exemplo:
Clculo do coeficiente de rendimento
(c.r.) = mdia ponderada das notas em
cada disciplina medida-resumo do
desempenho acadmico de um aluno.
Estatstica Descritiva ou
Anlise Exploratria de Dados
Inferncia Estatstica ou
Estatstica Inferencial
Exemplo:
Tipos de Dados
Dados = matria prima da estatstica.
1. ESTATSTICA
DESCRITIVA
11,8 3,6
8,9 9,1
10,2 8,0
15,3 12,3
6,2 11,2
Distribuio de Frequncias
A distribuio de frequncias
uma tabela que agrupa os dados
em classes (intervalos), indicando o
nmero ou a proporo de observaes
que pertencem a cada uma das classes.
As classes no precisam
ter amplitudes iguais.
Frequncia
2 | 5
5 | 8
8 | 11
11 | 14
14 | 17
17 | 20
Total:
30
Limitaes da distribuio
de frequncias absolutas:
1. A frequncia absoluta de cada classe no
tem interpretao direta. sempre necessrio
olhar para o total de observaes consideradas.
2. No permite a comparao com outra
distribuio cujos totais sejam diferentes.
O uso de frequncias relativas
soluciona os problemas acima.
Frequncia Relativa
2 | 5
5 | 8
8 | 11
11
| 14
14 | 17
17 | 20
Total:
Frequncia Acumulada
3 ou 10%
5 | 8
3 + 7 = 10 ou 33,3%
8 | 11
3 + 7 + 7 = 17 ou 56,7%
11
| 14
24 ou 80%
14 | 17
28 ou 93,3%
17 | 20
30 ou 100%
Histograma
Frequncias
10
8
6
4
2
0
Grfico de Barras
2-|5
5-|8
8-|11
11-|14
14-|17
Classes
17-|20
Exemplo 1.2
Nmero de reclamaes dirias x frequncia
em certo ms, no SAC de uma empresa:
Exemplo 1.3:
Grfico de Pizza ou de Setores
O grfico de pizza, ou de setores, um
diagrama estatstico bastante popular.
apropriado quando o objetivo
identificar partes de um todo.
Medidas de Posio
Uma medida de posio um valor em
torno do qual os dados esto concentrados.
Mdia
a soma das observaes dividida
pelo nmero de observaes:
n
x
i =1
x 1 + x 2 + ... + x n
.
n
no de
observaes
i-sima
observao
Exemplo 1.4:
No exemplo 1.1, o faturamento mdio
= 307,7/30 = 10,3 milhes.
Note que o valor 10,3 no ocorre.
Nenhum problema!
A mdia de um conjunto de dados no
precisa ser um dos valores observados.
Mediana
o valor Md que divide os dados
ordenados em duas partes iguais.
Concluso:
A mdia uma medida de posio
muito sensvel presena de outliers!
Md = 3,0.
Se n for par:
Md = mdia das duas observaes centrais.
Moda
A moda o valor que ocorre com
maior frequncia em um conjunto
de observaes (notao: Mo).
Mdia Ponderada
A mdia ponderada, p, definida como:
k
p =
jx j
j=1
k
1x 1 + 2 x 2 + ... + k x k
.
1 + 2 + ... + k
j=1
Frequncia
2
5
7
8
3
Faixas de Consumo
Frequncia Relativa
0 | 50 KWh
8%
50 | 100 KWh
12%
32%
Frequncia Acumulada
40%
0 | 50 KWh
8%
8%
50 | 100 KWh
20%
Total:
100%
52%
92%
100%
150 100 52 20
=
.
h
50 20
Assim, h = 46,8 e a mediana :
Md 100 + h = 146,8 KWh.
Mdia Geomtrica
A mdia geomtrica g
definida da seguinte forma:
g = (x 1 x 2 ...x n )n .
1
fator de capitalizao
no ano 2
(1+Req) = [(1+R1)(1+R2)...(1+Rn)]1/n
E da se obtm o Req.
No exemplo 1.8:
(1 + R eq ) =
Medidas de Disperso
Frequentemente, uma medida de posio
no fornece todas as informaes de que
precisamos para tomar uma certa deciso.
Por exemplo, uma pessoa com metade
do corpo em um forno, e a outra metade
em um freezer, na mdia estar bem!
( x ) ou
i =1
i =1
( x )
i
Problema:
n
(x ) = 0, sempre!
i =1
Soluo:
trabalhar com
os mdulos
ou quadrados
dos desvios!
Varincia (
2)
DM =
| xi |
i =1
2 =
(x
i =1
) 2
10
=
2
x
i =1
2
i
x
i =1
2.
Interpretao?
Desvio Padro (
)
= 2 .
No exemplo 1.9, para o fornecedor A: =
6,72 dias, e para o fornecedor B: = 1,10 dias.
O desvio padro preserva a unidade original
dos dados e ainda possui interpretao direta.
99,72%
11
Exemplo 1.10:
Aplicao em Anlise de Investimentos
Ao A
49
45
41
37
33
29
25
21
17
Ao B
13
12
10
8
6
4
2
0
-2
-4
-6
-8
DIAS
mdia amostral.
s2 =
(x i x )2
i =1
n 1
x i2 nx 2
i =1
n 1
graus de liberdade
2
j ( x j )
j=1
12
Frequncia
2
5
7
8
3
R: 128.
CV = .
13
Assimetria
Curtose
esta distribuio
apresenta assimetria
positiva ou direita
esta distribuio
apresenta assimetria
negativa ou esquerda
referncia
14
Clculo de Quartis
Quartis
So medidas Q1, Q2 e Q3 que
dividem os dados em 4 partes iguais.
Faixas de Consumo
Frequncia Relativa
0 | 50 KWh
8%
50 | 100 KWh
12%
32%
Faixas de Consumo
Frequncia Acumulada
40%
0 | 50 KWh
8%
8%
50 | 100 KWh
20%
Total:
100%
52%
92%
100%
150 100 52 20
=
.
h
50 20
E obtivemos:
Md (= Q2) 100 + h = 146,8 KWh.
Vamos agora ao clculo dos demais quartis:
15
150 100 52 20
=
.
h
25 20
300 150 92 52
=
.
h
75 52
Amplitude Interquartlica
uma medida de disperso dada pela
diferena entre o terceiro e o primeiro quartis:
Q = Q3 Q1.
Obs - no confundir com amplitude
total = valor mximo - valor mnimo.
16
Box-Plot
Aplicaes do Box-Plot
Soluo:
17
Anlise Bidimensional
Diagrama de Disperso
Um diagrama de disperso um
grfico de pontos {(xi,yi); i = 1,2,...,n}
que indica se parece ou no existir
alguma relao entre 2 variveis X e Y,
e identificar qual o tipo desta relao.
cada ponto desses representa o valor
de X e de Y para a i-sima observao
Covarincia
A covarincia uma medida da
variabilidade conjunta de X e Y.
Frmula:
n
Interpretao da Covarincia:
Uma covarincia positiva nos diz que
quando X tende a variar acima de sua mdia
(xi> X), Y tambm tende (yi> Y), e quando
X tende a variar abaixo de sua mdia
(xi< X), Y tambm tende (yi< Y), ou seja:
X e Y variam no mesmo sentido.
XY =
(x
i =1
X )( y i Y )
n
18
Aluno 1
Aluno 2
Aluno 3
XY =
x i y i n X Y x i y i
=
i =1
i =1
X Y .
Interpretao do
Coeficiente de Correlao:
- Se a relao linear entre X e Y for
positiva e perfeita, a correlao igual a 1.
- Se a relao linear entre X e Y for
negativa e perfeita, a correlao igual a -1.
- Se no houver relao linear: o valor
do coeficiente de correlao zero.
Coeficiente de Correlao
O coeficiente de correlao um
nmero entre -1 e 1, que mede a fora
da associao linear entre X e Y.
Frmula:
XY =
XY
.
XY
19
Resposta:
XY =
XY
3
=
0,98.
X Y 2,16 *1,41
s XY =
isto que a
funo COVAR
do Excel calcula!
(x i x )( yi y)
i =1
rXY =
n 1
s XY
,
s Xs Y
Covarincia (amostral):
COVAR(A1:A8;B1:B8).
Correlao: CORREL(A1:A8;B1:B8).
Importante: na hora de calcular a
covarincia e a correlao entre duas
variveis, no ordene os dados. Isto no
faz o menor sentido e induz uma relao
crescente espria entre as variveis.
20
2.
PROBABILIDADE
(CONCEITOS E
LEIS BSICAS)
Experimento Aleatrio
Um experimento aleatrio uma ao
cujo resultado no pode ser previsto.
Exemplos:
2.1 - Lanar um dado e observar a
face que fica voltada para cima.
2.2 - Selecionar uma bolinha de uma urna com
bolinhas vermelhas e azuis e verificar sua cor.
Espao Amostral
O espao amostral associado a um
experimento aleatrio o conjunto
de todos os seus possveis resultados.
Evento
Um evento um
subconjunto do espao amostral.
No exemplo 2.1, alguns possveis eventos so:
Notao: S.
No exemplo 2.1 S = {1,2,3,4,5,6}.
No exemplo 2.2 S = {azul`,vermelha`}.
21
Probabilidade Definio
AB = {2,4,5,6}.
AB = {4,6}.
Notas de Aula - Professor Eduardo
Lima Campos.
Propriedades da Probabilidade:
Axiomas da Probabilidade
quanto mais perto de 1, maior a probabilidade de que A ocorra.
este um evento
especial, chamado
evento certo.
22
Atribuio de Probabilidades
Se os elementos do espao amostral so
todos equiprovveis, a probabilidade de
um evento A obtida da seguinte forma:
#A
P( A ) =
#S
casos favorveis
ao evento A
casos possveis
P( A ) =
#A 3
= .
#S 8
Abordagens da Probabilidade
A abordagem anterior para obter
probabilidades chamada clssica.
Existem ainda duas outras formas de
pensar, abordar ou, ainda, interpretar o
conceito de probabilidade, denominadas
abordagens frequentista e subjetivista.
Notas de Aula - Professor Eduardo
Lima Campos.
Abordagem Frequentista:
A probabilidade de um evento A a
frequncia relativa de ocorrncia de A,
quando o experimento aleatrio repetido
muitas vezes (rigorosamente, o limite da
frequncia relativa de A, quando n ).
Abordagem Subjetivista:
A probabilidade de um evento A baseada
em achismo ou na opinio de especialistas.
Lei da Adio
(Probabilidade do OU`)
Sejam A e B dois eventos, com interseo
AB. Qual a probabilidade de AB?
(ou seja, de que A ou B ocorram)
A Lei da Adio fornece a soluo deste
problema, por meio da seguinte frmula:
P(A
B) = P(A) + P(B) - P(A
B)
Notas de Aula - Professor Eduardo
Lima Campos.
23
AcBc = (A
B)c
AcBc = (A
B)c
24
Soluo:
a) A = {(3,4),(4,3),(2,5),(5,2),(1,6),(6,1)}
e B = {(5,6),(6,5)} e AB = . Portanto:
A e B so mutuamente exclusivos.
b) A ={(3,6),(6,3),(4,5),(5,4),(4,6),(6,4),
(5,6),(6,5),(5,5),(6,6)}, B =
{(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}
e AB = {(5,5),(6,6)}. Portanto:
A e B no so mutuamente exclusivos.
Promovidos
No-Promovidos
Total
Masc.
46
184
230
Fem.
72
80
Total
54
256
310
No-Promovidos
Total
Masc.
46
184
230
Fem.
72
80
Total
54
256
310
A probabilidade de A dado B
, portanto, 46/230 = 0,2.
25
Probabilidade Condicional
Sejam 2 eventos A e B,
tais que P(B)>0.
A probabilidade de A dado B :
P(A|B) = P(A
B)/P(B).
R: 2/3.
Eventos Independentes
2 eventos so independentes se a
ocorrncia de um no interfere na
probabilidade de ocorrncia do outro.
Ou seja, se:
P(A|B) = P(A).
Notas de Aula - Professor Eduardo
Lima Campos.
Soluo:
Sejam A = ter passado em lgebra`
e B = ter passado em literatura`.
a) P(AB) = P(A) + P(B) - P(AB)
= 0,75 + 0,84 0,63 = 0,96.
b) P(A|B) = P(AB)/P(B) = 0,75.
c) Sim, pois P(A|B) = P(A) = 0,75.
Notas de Aula - Professor Eduardo
Lima Campos.
26
P(A
B) = P(A|B)P(B).
Lei da Multiplicao
(Probabilidade do E`)
P(A
B) = P(A|B)P(B)
Evento A
B no Diagrama de rvore:
Diagrama de rvore:
P(A|B)
P(B)
P(B)
P(Ac|B)
P(A|Bc)
P(Bc)
Bc
P(Ac|Bc)
Notas de Aula - Professor Eduardo
Lima Campos.
Ac
P(Ac|B)
Ac
P(A|Bc)
P(Ac|Bc)
Ac
Ac
P(Bc)
P(A|B)
Bc
27
P(B)
P(A|B)
P(Ac|B)
Ac
P(A|Bc)
P(Ac|Bc)
Ac
Considere novamente:
A = segunda bolinha azul e
B = primeira bolinha vermelha.
Notas de Aula - Professor Eduardo
Lima Campos.
P(Bc)
Bc
28
Soluo:
a) Qual a probabilidade de que o concorrente
introduza o servio e que, mesmo assim, ele
seja lucrativo para a empresa X?
b) Qual a probabilidade de que o servio
seja lucrativo para a empresa X?
c) Qual a probabilidade de que o servio
seja lucrativo para a empresa X ou o
concorrente introduza o servio?
c) Ac e Bc tambm so independentes.
29
a) Qual a probabilidade de
que ele seja defeituoso?
e que:
1% dos itens fabricados por M1 tm defeito,
2% dos itens fabricados por M2 tm defeito.
Notas de Aula - Professor Eduardo
Lima Campos.
Soluo do item a:
Pede-se P(A)
So fornecidas no enunciado
as seguintes probabilidades:
P(B|A) = P(A
B)/P(A)
= P(A|B)P(B)/P(A)
= 0,01*0,6/0,014 = 0,429.
A frmula acima, que permite obter P(B|A) a
partir de P(A|B) chamada Teorema de Bayes.
30
Teorema de Bayes
Sejam A e B eventos definidos em S, sendo
A dependente de B, na sequncia: B A.
O Teorema de Bayes (p/ 2 eventos) se ocupa
da sequncia reversa: A B, fornecendo:
P( B | A ) =
P(A | B)P(B)
.
P(A)
obtida
pela Lei da
Probabilidade
Total
Soluo do Item a:
A = ser selecionado`
B = ter cursado o MFEE`.
Pede-se P(A).
So fornecidas no enunciado
as seguintes probabilidades:
Soluo do Item b:
Pede-se P(B|A)
P(B|A) = P(A|B)P(B)/P(A)
= 0,9*0,7/0,72 = 0,875.
O Teorema de Bayes pode ser ampliado
para mais de 2 Eventos, fazendo, por
exemplo: B1, B2 e B3, ao invs de B e Bc.
Notas de Aula - Professor Eduardo
Lima Campos.
31
32
3. VARIVEIS
ALEATRIAS
S (espao amostral):
Valores de X:
(CO,CO,CO)
(CA,CO,CO)
(CO,CA,CO)
(CO,CO,CA)
(CA,CA,CO)
(CA,CO,CA)
(CO,CA,CA)
(CA,CA,CA)
0
1
2
3
Distribuio de Probabilidade
Representa como as probabilidades
distribuem-se de acordo com os valores de X.
Notao:
Para a v.a. em si X (maiscula).
33
Distribuio de
Probabilidade Discreta
P(X=x)
1/8
3/8
1) P( X = x ) 0, x
3/8
2) P ( X = x ) = 1
1/8
Distribuio de Probabilidade
Contnua (Funo de Densidade)
Uma distribuio contnua f(x)
uma funo que permite calcular
a probabilidade de que uma v.a.
contnua pertena a um intervalo.
P(aXb) a rea sob o grfico de f(x)
que corresponde ao intervalo [a,b].
f(x)
f ( x )dx
6.000
b) Calcule P(X>1).
R: a) 3/8 b) 7/8.
34
Soluo:
E (X ) = xP( X = x ).
Observaes:
1 - E(X) tambm chamado mdia de X.
2 - E(X) no um valor que se espera que
ocorra, podendo ser (e em geral ) um
valor que no ocorre, como neste caso!
3 - E(X) pode ser interpretado como o
ponto de equilbrio da distribuio, em
que as probabilidades so os pesos.
Soluo:
O retorno de (- 4)% ocorre com
probabilidade 0,6.
O retorno de 10% ocorre com
probabilidade 0,4.
O retorno esperado : (- 4)*0,6 + 10*0,4
= 1,6%, bem inferior, por exemplo,
rentabilidade anual da poupana.
Portanto, o investimento no compensa.
E(X) = x f ( x )dx.
35
2
3
E(X) = x x 2 dx =
0 8
4 2
32 3
3x
x dx =
80
8 4
3
= .
2
E (X i ) rf = (E (X m ) rf ).
O prmio de risco da ao i a diferena
entre o valor esperado de seu retorno Xi e
o retorno de um investimento sem risco rf.
3 2
3k 2
x dx = 0,5 x dx = 0,5
80
08
3
k
= 0,5 k 3 = 4 k = 3 4.
8
Sendo:
Exemplo 3.10 - Calcule V(X),
sendo X a v.a. definida no exemplo 3.5.
e
E (X 2 ) = x 2 f(x) dx, no caso contnuo.
36
f(x)
Soluo:
3
E (X ) = x x 2 dx =
8
0
32 4
3 x5
12
x
dx
=
= .
80
8 5 0 5
12 3
3
V(X) = E(X ) E (X) = = .
5 2
20
DP (X ) = V( X)
Coeficiente de Variao de uma V.A.
CV( X) =
DP(X)
.
E(X)
Soluo do item a:
a) Seja X o preo do produto em dlares.
Ento: E(X) = 80, DP(X) = 8 e V(X) = 64.
Seja Y o preo do produto em R$.
Ento: Y = 2X. Logo, E(Y) = 2E(X) =
R$ 160, V(Y) = 22V(X) = 4*64 = 256 R$2,
DP(Y) = R$ 16 e CV(Y) = 16/160 = 0,1 = 10%.
37
Soluo do item b:
b) Seja Z o preo em dlares aps o
aumento. Ento: Z = X + 10.
Demonstrao:
Z pode ser escrito da seguinte forma:
aX+b, sendo a = 1/ e b = -/.
Funo de Distribuio
(Acumulada)
Assim:
E(Z) = E(X)/ - / = 0 e
V(Z) = (1/)2V(X) = 1, C.Q.D..
Soluo:
Soluo:
Para 0 x < 1:
x
F( x ) = P( X x ) = f ( x )dx = 2 xdx = x 2 .
Para x 1, F(x) = 1.
38
Propriedades de F(x):
1. Lim F( x ) = 0 e Lim F( x ) = 1.
x
f (x) =
dF( x )
.
dx
Desigualdade de Chebyshev
Seja X uma v.a. c/ valor esperado
E(X) e varincia V(X), ambos finitos.
Ento, para arbitrrio > 0:
P[ X E ( X ) ]
V (X )
ou
2
V(X)
P[ X E ( X ) < ] 1 2 .
R: 0,75.
Corr ( X, Y ) = XY =
Propriedades da Covarincia
(a, b, c e d constantes)
Cov( X, Y )
.
V (X) V (Y )
a)
b)
c)
d)
e)
Cov(X,Y) R:8.
Cov(X,Z) R: 12.
Cov(Y,Z) R: 24.
Corr(X,Z) R: 1.
Corr(Y,Z) R: 1.
39
4. DISTRIBUIOES
DISCRETAS
1
P(X = x ) = , x = 1, 2, ..., k.
k
Exemplo 4.1 - No lanamento de um dado,
a v.a. que representa a face voltada para
cima segue distribuio uniforme discreta.
Distribuio de Bernoulli
Experimento de Bernoulli um
experimento aleatrio que possui
apenas dois resultados possveis.
Exemplos:
Como consequncia, a
probabilidade de fracasso 1-p.
.
x
0
P(X=x)
1-p
o ~ significa
segue distribuio
40
Distribuio Binomial
Sejam agora n realizaes independentes
de experimentos de Bernoulli com a
mesma probabilidade de sucesso p.
Considere que estejamos interessados
no nmero de sucessos observados.
n x
n x
P(X = x) = p (1 p) , x = 0,1,..., n; 0 < p < 1.
x
n!
=
.
x!( n x )!
probabilidade de
obter x sucessos
em n realizaes
independentes
3 1 1 3
P(X = 2) = = .
2 2 2 8
41
Soluo:
A v.a. de interesse :
X = nmero de acertos.
Se considerarmos que as tentativas so
independentes, ento: X ~ Bin(5,2/3).
E(X) = np
V(X) = np(1-p)
Da:
5 2
P(X = 3) =
3 3
1
= 0,3292.
3
Soluo:
Exemplo 4.6 - Considere um exame com
20 questes de mltipla escolha, cada uma
com 5 alternativas. Se um aluno que no
estudou nada resolve chutar todas as
respostas, qual a probabilidade de que
acerte 30% da prova (isto , 6 questes)?
20
6
14
P(X = 6) = (0,2) (0,8) = 0,1091.
6
Qual o valor esperado do nmero
de questes que o aluno acerta?
Soluo:
A trajetria da ao pode ser representada
em uma rvore, chamada rvore binomial.
A v.a. de interesse :
X = nmero de vezes que a ao sobe.
Qual a distribuio de X?
42
P(X=x)
0,0256
0,1536
0,3456
0,3456
0,1296
P(Y=y)
96
0,0256
98
0,1536
100
0,3456
102
0,3456
104
0,1296
E(aX+b) = aE(X) + b.
Y = 2X+96,
43
Distribuio Hipergeomtrica
Resposta:
N
.
n
O nmero de casos favorveis o nmero de
formas de extrair x sucessos dentre os r possveis
e (n-x) fracassos dentre os N-r possveis:
r N r
.
x n x
44
r N r
x n x
P(X = x) =
.
N
n
probabilidade de que ocorram x sucessos, em
uma amostra sem reposio de tamanho n
P(X = 3) =
=
= 0,3916.
13
13
4
4
Exemplo 4.9
Soluo:
Seja X o nmero de peas defeituosas
na amostra de tamanho 5. Ento:
4 6
2 3
P(X = 2) = = 0,4762.
10
5
45
r
N
r N n
r
V(X) = n 1
N N N 1
E( X ) = n
Aproximao da
Hipergeomtrica pela Binomial
Se N muito maior do que n (N 20n),
a distribuio hipergeomtrica pode ser
aproximada pela distribuio binomial
(cujas probabilidades so mais simples
de calcular), com parmetros n e p = r/N.
5 5
P(X = 5) =
.
1000
10
Note que as combinaes envolvidas
so bastante chatas de se calcular...
46
Distribuio Geomtrica
Considere, como na definio da
Binomial, realizaes independentes
de experimentos de Bernoulli, todos
com mesma probabilidade de sucesso p.
A distribuio da v.a. que representa
o nmero de realizaes necessrias
at que ocorra o primeiro sucesso
chama-se geomtrica, com parmetro p.
Parmetro: p.
Notao: X ~ Geom(p).
V(X) = (1-p)/p2
E(X) = 1/p
2 2
P(X = 5) = 1 = 0,0082.
3 3
Soluo:
Exerccio (Resolvido) 4.1 - Um jogador
converte 10% dos pnaltis que cobra.
a) Qual a probabilidade de que ele acerte
apenas uma cobrana em 5 tentativas?
5
P(X = 1) = (0,1)1 (0,9) 4 = 0,32805.
1
47
Parmetros: r e p.
Notao usual: X ~ BNeg(r,p).
E(X) = r/p
2
3 2 2
P(X = 4) = 1 = 0,1481.
1 3 3
V(X) = r(1-p)/p2
48
Distribuio de Poisson
Seja a taxa de ocorrncia de um evento
por unidade de tempo ou de espao. Por
exemplo, acidentes/hora em uma estrada.
A distribuio da v.a. que representa
o nmero de ocorrncias de um evento
com taxa , no intervalo correspondente,
chama-se Poisson, com parmetro .
E(X) =
V(X) =
x e
P(X = x ) =
, x = 0,1,...; > 0.
x!
probabilidade de que ocorram x eventos, em um
intervalo no qual ocorrem, em mdia, eventos
Parmetro: .
Notao usual: X ~ Poi().
Soluo:
a ) P ( X = 2) =
3 2 e 3
= 4,5e 3 .
2!
49
Soluo:
Um olhar desatento poderia nos levar a
calcular P(X=4) + P(X=5), quando o que
pedido uma probabilidade condicional:
P(X 5 | X > 3) =
P(X = 4) + P(X = 5)
=
1 [P(X = 1) + P(X = 2) + P(X = 3)]
sendo X ~ Geom(0,1).
Esta probabilidade
calculada da seguinte forma:
Observaes:
1 - A probabilidade do denominador
no exclui P(X = 0), porque uma v.a.
geomtrica no pode assumir valor 0!
Note que a geomtrica e a binomial
negativa so as nicas distribuies
discretas que no assumem valor 0.
0,1385
= 0,19.
0,729
50
5. DISTRIBUIOES
CONTNUAS
Frmula da Uniforme:
a distribuio contnua
mais simples que existe.
Pressupe que as probabilidades estejam
distribudas de maneira uniforme pelo
intervalo de variao de X (de a ).
Clculo de Probabilidades
Utilizando a Uniforme:
E(X) = (
+
)/2
V(X) = (
-
)2/12
R: 1/6.
51
Distribuio Exponencial
Distribuio definida para valores de X
estritamente positivos, usual para
representar tempo (durao, espera, etc.).
Parmetro: .
Notao: X ~ Expo().
Valor Esperado e Varincia:
Frmula da Exponencial:
E(X) = 1/
V(X) = 1/
2
f ( x ) = e , x > 0; > 0.
x
E(X ) = xe x dx = xe x dx.
e x
e x
E (X ) = x
dx
0 0
= ( xex ) 0 + e x dx
= ( xe
x
1
e
+
= .
0
Assim:
Demonstrao da Varincia:
E(X2)
E(X2)
E2(X).
V(X) =
E (X 2 ) = x 2 e x dx = x 2 e x dx.
Esta integral tambm deve ser resolvida
por partes, mas agora fazendo u = x2 e
dv = e-xdx.
Funo Distribuio
Acumulada da Exponencial:
F(x) = P(X
x) = 0, x
0
-
= 1-e x, x>0.
52
Demonstrao da F.D.A.:
Para x0, F(x) = P(Xx) = 0.
Para x>0:
x
F( x ) = P(X x ) = e x dx =
0
x
e x dx =
0
1 e x
= 1 e x .
Falta de Memria
uma importantssima propriedade
da distribuio exponencial. Ela diz que:
P(X>x+s|X>x) = P(X>s).
Isto considerado uma crtica ao uso da
exponencial para este tipo de aplicao.
53
Se o nmero X de ocorrncias de um
evento por unidade de tempo segue
distribuio de Poisson com parmetro :
X ~ Poi(),
ento o intervalo de tempo T (medido
na mesma unidade de tempo) entre duas
ocorrncias sucessivas segue distribuio
exponencial com parmetro , ou seja:
T ~ Expo().
Distribuio Normal
1
f (x) =
e
2
( x ) 2
2 2
; x ; , 2 > 0.
54
Z=
X
,
1 ( x50170)
e
dx
170 5 2
172, 3
P(170 X 172,3) =
Problema:
1
A integral de f ( x ) =
e
2
no possui soluo analtica!
( x ) 2
22
172,3 170
170 170
P
<Z<
=
5
5
55
Neste caso:
175 170
170 170
P
<Z<
=
5
5
Soluo:
P(-1 < Z < 1)
99,72%
Considerando =
E(X) e = DP(X).
56
P(Z > 0)
Soluo: P(X > 175) = P(Z > 1) = 0,5 P(0 < Z < 1) = 0,5 - 0,3413 = 0,1587.
Soluo:
VPL do projeto
a)
80 X 83
P
<
<
=
83 80
80 80
P
<Z<
=
4
4
= P(0 < Z < 0,75).
57
79 80 X 82 80
P
<
<
=
4
4
P( 0,25 < Z < 0,5) =
P( 0,25 < Z < 0) + P(0 < Z < 0,5) =
P(0 < Z < 0,25) + P(0 < Z < 0,5).
0,0987+0,1915 = 0,2902.
Soluo:
Exemplo 5.7 - A rentabilidade de uma
estratgia financeira no mercado futuro,
referente a certo perodo, possui distribuio
Normal, com mdia 5% e desvio padro 3%.
P ( X1 < 0) =
X 0
P 1
<
=
05
P Z <
=
3
Soluo:
b) Compare a estratgia do item a)
com outra cuja mdia 6% e cujo desvio
padro 4%. Considere como critrio
de comparao a probabilidade de
perda (rentabilidade negativa).
Considerando este critrio, por
qual das estratgias voc optaria?
P Z <
=
4
Considerando a
probabilidade de
perda, a primeira
estratgia mais
vantajosa.
58
59
Frmula:
Distribuio Lognormal
Seja uma v.a. Normal
X ~ N(,2) e seja Y = eX.
A distribuio de Y chamada
lognormal, com parmetros e 2.
Aplicao da lognormal
em economia e finanas:
Pressuposto usual para a distribuio dos
preos de ativos no mercado financeiro.
f ( y) =
1
y 2
1
2 2
(ln y )2
; y > 0, , > 0.
A distribuio lognormal
apresenta assimetria positiva.
Valor Esperado: E ( Y ) = e
2
2
5,1.
60
Distribuio Qui-Quadrado
Frmula:
f (x) =
2
E(X) =
V(X) = 2
x 2 e 2 ; x > 0; > 0.
Se Z ~ N(0,1) :
Y = Z 2 ~ 12
Notao: X ~ 2 .
Distribuio Gama
Frmula:
A distribuio qui-quadrado um caso
particular de uma distribuio geral chamada
gama, apresentada a seguir (no cai na prova).
f (x) =
1 x
x e ; x > 0; , > 0,
( )
sen do : () = x 1e x dx = ( 1)!, se Z.
0
Notao: X ~ Gama(,).
Distribuio Beta
(tambm no cair na prova)
Frmula:
- A distribuio exponencial ( = 1 e = );
- A distribuio qui-quadrado com graus
de liberdade ( = /2 e = 1/2).
Aplicao da Gama em economia e finanas:
modelos de severidade em risco operacional.
( + ) 1
x (1 x )1 ;
()()
0 < x < 1; , > 0.
f (x) =
Notao: X ~ Beta(,).
61
Soma de V.A.`s
6. FUNES
LINEARES DE V.A.`s
S = Xi ,
i =1
peso da
i-sima pessoa.
E (S) = E (X i ).
i =1
Varincia da Soma de n
V.A.`s Descorrelacionadas:
n
V(S) = V(Xi ).
i =1
S = X i , e queremos P(S>500).
i =1
500 490
)=
700
P( Z > 0,38) = 0,3520.
S ~ N(n, n 2 ).
E agora estamos aptos a calcular a
probabilidade de interesse do exemplo 6.1.
62
Mdia de V.A.`s
Soluo:
peso total = soma dos pesos
S = X i ~ N(n, n ).
2
i =1
49.960 50.000
40
X ~ N(,
2
).
n
X=
Xi
i =1
x:
1 n
1 n
E(X) = E( Xi ) = E( Xi ) =
n i=1
n i=1
1 n
1
E(Xi ) = n = .
n i=1
n
Demonstrao da Varincia de
x:
n
1n
1
V(X) = V( Xi ) = V( Xi ) =
n i=1
n i=1
1 2 2
1 n
V
(
X
)
=
n = .
i
n2
n
n i=1
2
v.a.`s descorrelacionadas
500 ,7 500
P (Z < 1,75 ) =
0,5 + P (0 < Z < 1,75 ) =
0,5 + 0, 4599 = 0,9599 .
63
R: 0,9544.
Exemplo 6.3
Sejam X1, X2, ..., X32 v.a.`s independentes,
com distribuio de Poisson com = 8.
Calcule a probabilidade aproximada de que a
mdia destas 32 variveis seja menor que 9.
R: 0,9772.
R: 0,2843.
Formalmente :
C = a iXi .
i =1
Lim P X = 0 , > 0.
n
64
V (C) = a 2 V ( X ) + b 2 V (Y ).
E se X e Y forem correlacionadas?
Neste caso, a frmula da varincia de uma
combinao linear C = aX + bY torna-se:
ateno!
Soluo:
V(Z) = (2)2V(Y) + (-3)2V(X)
+ 2*2*(-3)*Cov(X,Y) = 4*16 +
9*4 - 12*3 = 100 36 = 64.
pesos propores do
capital alocadas em cada ao.
65
O retorno esperado de C :
E(C) = aE(X) + bE(Y) =
0,6*0,03 + 0,4*0,06 =
0,042 = 4,2%.
A covarincia entre X e Y :
Cov(X,Y) = XYXY =
-0,5*0,07 *0,1 = -0,0035.
A varincia da carteira :
V(C) = a 2 2X + b 2 2Y + 2abCov(X, Y) =
0,36*0,072+0,16*0,12 +
2*0,6*0,4*(-0,0035) = 0,0017.
E o desvio padro (volatilidade):
C = V(C) = 0,041 = 4,1%.
66
a=
2Y Cov( X, Y)
2X + 2Y 2Cov( X, Y)
Concluso:
A diversificao leva a um risco menor do
que o da ao mais voltil e, se as carteiras
apresentam a mesma volatilidade, conduz a
uma reduo desta volatilidade, qualquer que
seja a correlao entre elas (contanto que < 1).
Se XY = -1, possvel formar uma
carteira com risco zero. Todavia, isto
tem pouca aplicao prtica (por que?).
Cov(aX+bY,cZ+dW) =
Cov(aX,cZ) + Cov(aX,dW)
+ Cov(bY,cZ) + Cov(bY,dW).
b = 1 a.
Soluo:
Determine a varincia de Z, se Cov(X,Z) = 4.
Cov(X,Z) = Cov(X,2Y-3X) =
Cov(X,2Y) + Cov(X,-3X) =
2Cov(X,Y) - 3Cov(X,X) =
2Cov(X,Y) - 3V(X) = 2*3 3*4 = -6.
R: 4.
67
Estimao Pontual
7. ESTIMADORES E
SUAS PROPRIEDADES
Populao
Define-se populao como a
distribuio de probabilidade
considerada adequada para
a caracterstica de interesse.
Uma suposio usual que a caracterstica de
interesse (no caso, a altura dos alunos) siga
distribuio Normal populao Normal.
Parmetro
Um parmetro uma quantidade fixa
e desconhecida na populao, sobre
a qual queremos obter informao.
No exemplo, o parmetro de interesse a
altura mdia dos alunos, ou seja, a mdia da
distribuio das alturas, que denotamos por .
68
Amostra
Estimador
o chapu significa
que estamos
estimando
= X =
X
i =1
mdia da
amostra
ou mdia
amostral
Estimador x Estimativa
Questo importante:
A estimativa de : x =
xi
i =1
= 180.
69
Se a populao Normal, a
distribuio de
Normal.
Tecnicamente, a distribuio de um
estimador chamada distribuio amostral.
Estimador No Viciado
Um estimador no viciado (ou no
tendencioso, no viesado) aquele cujo
valor esperado igual ao parmetro.
Distribuio Amostral
A distribuio amostral de um estimador
a sua distribuio de probabilidade.
Ela representa o comportamento dos valores
assumidos pelo estimador em amostras
repetidas isto significa: considerando
todas as amostras de tamanho n possveis.
Ou seja, um estimador no
viciado para um parmetro se:
E ( ) = .
no viciado
viciado p/ baixo
viciado p/ cima
E ( X ) = , e assim X
no viciado para .
:
O vcio (ou tendncia, ou vis) de
B( ) = E ( ) .
70
Quanto menor a
varincia, maior ser:
distribuio de 1
P( < < + ),
distribuio de 2
- +
Estimao de 2
Erro Padro
O desvio padro de um estimador
denominado erro padro (EP).
V (X ) =
2 e assim:
EP ( X ) =
.
n
n
Isto porque:
E( *2 ) =
* =
2
( n 1) 2
, que diferente de 2 .
n
(X X )
i =1
X nX
i =1
Problema:
o estimador acima viciado.
S2 =
(X i X ) 2
i =1
n 1
X
i =1
2
i
nX 2
n 1
O vcio do estimador :
2
B( ) = E ( ) = .
n
2
*
2
*
71
Comparao de Estimadores
Se 2 estimadores so no viciados para
um parmetro, qual deles o melhor?
R: o que tiver menor varincia.
Este estimador dito mais eficiente.
Interpretao:
Se Ef > 1, significa que o
estimador 1 mais eficiente
Eficincia Relativa
Sejam 1 e 2 dois estimadores
no-viciados para um parmetro .
A eficincia relativa do estimador 1
em relao ao 2 dada pela razo entre
as varincias dos estimadores 2 e 1, isto :
V( 2 )
Ef ( 1 , 2 ) =
.
V( 1 )
X1 + X 2 + X 3
3
X + X3
e 2 = 1
.
2
1 = X =
Se Ef < 1, significa que o
estimador 2 mais eficiente
Se Ef = 1, os estimadores
so igualmente eficientes.
V( ) = E[ E ( )]2 ,
e o que queremos a incerteza em
torno do valor real do parmetro:
E ( ) 2 .
Esta medida chamada erro quadrtico
mdio, em geral abreviado por EQM.
72
EQM ( 2 )
Ef ( 1 , 2 ) =
.
EQM ( 1 )
EQM( ) = V( ) + B 2 ( ).
Estimador Eficiente
(= Melhor Estimador No Viciado)
1. Ser no viciado.
1. no viciado
e
2. sua varincia menor do que a de
qualquer outro estimador no viciado.
Estimador Consistente
1) no viciado e:
Lim V( ) = 0.
n
assintoticamente
no viciado.
ou 2) viciado, mas:
Lim
B( ) = 0 e Lim
V( ) = 0.
n
n
73
1 n
1 n
Xi ) = E( Xi ) =
n i=1
n i=1
n
n
1
1
1
E(Xi ) = p = np = p.
n i=1
n i=1
n
E(p) = E(
Propriedades de p :
1. um estimador no viciado para p.
2. um estimador consistente para p
(consequncia da aplicao da L.G.N.).
3. Tem distribuio amostral
assintoticamente Normal (T.C.L.).
Estimador para p:
Seja C o conjunto de unidades, dentre i = 1,
2, ..., n, que contm o atributo de interesse.
Seja: Xi = 0, se a unidade iC
Seja: Xi = 1, se a unidade iC
n
frequncia
relativa ou
proporo
amostral
Xi
p = i =1
n
= X.
V(p) = V(
2 n
n
1 n
1
1
Xi ) = V(Xi ) =
n i=1
n
n
i =1
1
n
2 n
p(1 p) = n
i =1
np(1 p) =
V(X ) =
i =1
p(1 p)
.
n
Distribuio Amostral de p :
p(1 p)
p N p,
.
n
p p
N (0,1).
p(1 p)
n
74
8. MTODOS
DE ESTIMAO
xe
P(X = x ) =
; x = 0,1,2,...; > 0.
x!
P(X = 2) =
2e
.
2!
75
Funo de Verossimilhana
P(X=x), encarada como funo de ,
chamada funo de verossimilhana.
0,3
0,25
0,2
0,15
0,1
0,05
14,5
13,9
13,2
12
12,6
11,4
10,7
10,1
9,46
8,2
8,83
7,57
6,94
6,31
5,68
5,05
4,42
3,79
3,16
1,9
2,53
1,27
0,64
0,01
mximo da funo
0,25
0,2
0,15
ponto de mximo
0,1
0,05
14,5
13,9
13,2
12,6
12
11,4
10,7
10,1
9,46
8,83
8,2
7,57
6,94
6,31
5,68
5,05
4,42
3,79
3,16
2,53
1,9
1,27
0,64
0,01
i =1
L()
L ( ) =
xi
i=1 e n
n
x !
i =1
76
Funo de Log-Verossimilhana
l() = ln[L()] chamada
funo de log-verossimilhana.
O valor de que maximiza l()
o mesmo que maximiza L().
n xi
n
i=1
e n
l() = ln n
= x ln n + c
i =1 i
x i!
i =1
Maximizando a Funo
de Log-Verossimilhana:
l`() =
xi
i =1
MV = X.
cuja soluo : =
xi
i =1
= x.
77
Caso Contnuo:
f (x1 , x 2 ,..., x n ) = f (x i ),
i =1
(x1,x2,...,xn).
Obtenha o EMV de .
L(), caso
contnuo
Soluo:
A funo de log-verossimilhana :
x i
x i
n i=1
n
l() = ln e
= ln + ln e i=1 =
A funo de verossimilhana :
i=1
e
i=1
x i
=e
n
xi
i=1
( )
n ln() xi .
n
i =1
L() = f (x i ) =
n n
n
1
xi = 0 = n
= .
i
=
1
xi x
i =1
78
Logo, o EMV :
Obtenha o EMV de p.
1
MV = .
X
R:
p MV = X.
n
(1xi )
i=1
(1- p)
i=1
n
xi
i=1
n
n xi
i=1
Obtenha os EMV`s de e 2.
xi n xi
xi np
xi
=
i
1
l`(p) = i=1 +
(1) = i=1
= 0 p = i=1 .
p
(1 p)
p(1 p)
n
p
(1- p)
Soluo:
A funo de verossimilhana :
n
L(, = 2 ) = f (x i ) =
i=1
(2) e
i =1
( x ) 2
i
2
n
2
=(2) e
i=1
( x i ) 2
2
79
Derivando em relao :
A funo de log-verossimilhana :
(x i )
l(, )
.
= i=1
n ( xi )
2
i=1
l(, ) = ln (2) e
=
Igualando a zero:
(xi )
n
ln(2) i=1
.
2
2
2
Derivando em relao :
n
(xi )
l(, )
n
= + i=1
2
22
(x
i =1
) = 0 = x MV = X.
MV = X.
n
2MV =
(X
i =1
i =1
X) 2
.
(x x)
1
.
X
1
= .
X
exp onencial : MV =
geomtrica : p MV
Normal : MV = X e
2
MV
(X i X )
i =1
80
R : PMV ( X = 0) = e MV = e X .
q MV = 1 p MV = 1 X.
L() = x i1 = n x i 1.
i=1
Obtenha o EMV de .
i=1
R : MV =
n
n
ln(X i )
l`() =
n
+ ln(x i ) = 0 =
i=1
i =1
n
n
ln(x )
i=1
O que so momentos ?
Mtodo dos Momentos
Momentos populacionais:
E(X), E(X2), ..., E(Xk).
Vantagem: bem mais simples do que
o mtodo da mxima verossimilhana
e, na maior parte dos casos prticos
de interesse, leva ao mesmo resultado.
Momentos amostrais:
n
Xi
i =1
X i2
,
i =1
X ik
,...,
i =1
81
E(X) = X.
+X =
2
i =1
2
i
2
i
i =1
nX 2
i =1
2MM =
(X
X2
MM
1
exponencial : MM = .
X
1
geomtrica : p MM = .
X
R : MM = X e 2MM =
(X i X ) 2
i =1
R : MM =
X
.
1 X
X)2
i =1
Bernoulli : p MM = X.
Poisson :
= X.
2
i
.
+1
82
Motivao
9. INTERVALOS
DE CONFIANA
(PARTE 1 - CONCEITOS BSICOS,
ICS P/ MDIA E PROPORO,
TAMANHO DE UMA AMOSTRA)
R: No.
Pode (e deve) haver um
erro de estimao:
x .
Este erro devido ao fato de no estarmos
observando todo o universo em estudo, e
sim apenas um subconjunto deste universo.
Intervalo de Confiana
Um intervalo de confiana (IC) um
intervalo numrico, construdo a partir
da estimativa pontual, no qual podemos
confiar que o parmetro esteja contido.
o quanto confiamos determinado por uma
quantidade denominada grau de confiana
83
Construo de um IC para
Para explicar como construir um IC,
partiremos do conceito de margem de erro,
considerando uma probabilidade de 0,95.
Na estimao da mdia de uma populao
Normal, a margem de erro o valor tal que:
[ x ; x + ],
estar contido em 95% deles.
[ x ; x + ].
Pergunta: est correto afirmar que:
(I)
(II)
84
Significado de Confiana
[ x ; x + ]
85
P( < X < + ) = (1 )
( + )
( )
P
<Z<
= (1 )
/ n
/ n
P
<Z<
= (1 )
/ n
/ n
.
= z = z
n
/ n
2
2
k tal que p(Z>k) = /2, sendo Z ~ N(0,1).
No caso mais comum, = 0,05 e k = 1,96.
Estimadores e suas Propriedades Prof. Eduardo Lima Campos.
Clculo de
Para obter o IC, necessrio calcular .
No caso da estimao da mdia de
uma Normal, podemos usar o resultado:
X ~ N(,
2
X
)Z=
~ N(0,1).
n
n
Assim:
IC100(1 )% () = x z
; x + z
.
n
n
2
2
grau de confiana do IC
(90, 95 ou 99 %).
86
Interpretao Errada
6
6
5
5
= [174,74;185,26].
Interpretao Correta
Temos 95% de confiana de que
esteja no intervalo [174,74;185,26].
X
,
/ n
a distribuio no mais
N(0,1), e sim t de Student.
87
Distribuio t de Student
s
s
IC100(1 )% () = x t
;x + t
.
n 1;
n 1;
n
n
2
2
grau de confiana do
IC (90, 95 ou 99 %).
n1;
Consultando a Tabela t:
s2 =
(x i x) 2
=
n 1
2
(174 180) + (186 180) + (186 180) + (180 180) 2 + (174 180) 2
4
= 36 s = 36 = 6.
2
i =1
88
5
5
= [172,55;187,45].
Soluo:
Consultando a Tabela t:
x = 400; s = 450.
O valor na tabela t t 24;0,05 = 1,711.
O IC solicitado :
450
450
[ 246,01;553,99].
Interpretao: com 90% de confiana, o salrio mdio de
todos os trabalhadores da fbrica encontra-se neste intervalo.
Consultando a Tabela t:
89
Soluo (95%):
Soluo (99%):
x = 8.900; s = 500.
O valor na tabela t 15;0,025 = 2,131.
O IC de 95% :
O IC de 99% :
500
500
[8.633,6;9.166,4].
500
500
[8.531,6;9.268,4].
t 8; 0 , 005 = 3,355.
90
Soluo (99%):
x = 52, s = 30.
O valor na tabela t 8;0,005 = 3,355.
t 8; 0 , 025 = 2,306.
O IC de 99% :
30
30
IC99% () = 52 3,355
;52 + 3,355
=
9
9
[18,5;85,5].
Interpretao: com 99% de confiana, o ndice mdio de
endividamento das empresas deste setor est entre 18,5 e 85,5.
Soluo (95%):
Consultando a Tabela t para 90%:
O valor na tabela t 8;0,025 = 2,306.
t 8; 0 , 05 = 1,86.
O IC de 95% :
30
30
IC95% () = 52 2,306
;52 + 2,306
=
9
9
[28,9;75,1].
Interpretao: com 95% de confiana, o ndice mdio de
endividamento das empresas deste setor est entre 28,9 e 75,1.
Soluo (90%):
O IC de 90% :
30
30
IC90% () = 52 1,86
;52 + 1,86
=
9
9
[33,4;70,6].
Interpretao: com 90% de confiana, o ndice mdio de
endividamento das empresas deste setor est entre 33,4 e 70,6.
a) A probabilidade de que
esteja entre 2 e 8 0,95 ( )
b) Temos 95% de confiana de que
o intervalo [2;8] contm ( )
91
Determinando o Tamanho
de uma Amostra
Um aspecto importante da estatstica a
determinao do nmero de unidades a
serem selecionadas = tamanho da amostra.
obs = z
2
s
n
= z
2
z 2 2
n=
92
H 2 solues paliativas:
Note que no faz sentido usar a estimativa
de na frmula, uma vez que ainda no
temos a amostra (a frmula para definir
o tamanho da amostra que ser coletada!).
2 - Utilizar estimativa do
em uma amostra piloto.
p(1 p)
p N p,
.
n
p(1 p)
p(1 p)
IC100(1 )% (p) = p z
; p + z
.
n
n
2
2
0,7 * 0,3
0,7 * 0,3
IC95% (p) = 0,7 1,96
;0,7 + 1,96
70
70
n=
z 2 p(1 p)
2
93
0,9
0,96
0,84
0,78
0,72
0,6
0,66
0,48
0,42
0,3
0,36
0,24
0,18
0,12
0,54
P = 0,5
p
p(1-p)
1/4
0,06
n=
z2
4 2
1
= 400.
2
22
1
1
= 2 =
= 100.
2
4
(0,1) 2
n
0,1 100
0,05 400
0,02 2.500
n usual das
pesquisas
eleitorais!
94
10. INTERVALOS
DE CONFIANA
(PARTE 2 - IC`S PARA VARINCIA E
PARMETROS DE 2 POPULAES)
IC para a Varincia de
uma Populao Normal
s2
s2
IC 100(1)% ( ) = (n 1) 2 ; (n 1) 2
.
n 1,
n 1, 1
2
2
Q = (n 1)
S2
~ 2n 1 .
2
valor k 2 na tabela
valor k1 na tabela
P(X > k 2 ) = .
2
P(X < k1 ) = .
2
95
X1 X 2
Pr ova : E( X1 X2 ) = E(X1 ) E( X2 ) = 1 2 .
Distribuio Amostral de X1 X 2 :
(X1 X2 ) ~ N(1 2 ,
amostras so independentes!
V(X1 X 2 ) = V(X1 ) + V (X 2 )
=
12 22
+ .
n1 n 2
Na prtica, 12 e 22 so desconhecidas
12 22
+ ).
n1 n2
Padronizando:
Z=
(X1 X2 ) (1 2 )
~ N(0,1).
12 22
+
n1 n 2
IC100(1)% (1 2 ) =
1 1
1 1
+ ; (x1 x2 ) + t
+ ,
(x1 x2 ) t n +n 2;sp
sp
n
n
2
;
+
n1 n2
n1 n2
2
2
2
p
S2p =
pooled
sp =
96
Soluo:
Consultando a Tabela t:
sp =
1
8
1
n1
+ 101
+ n12 =
97
Soluo:
4 * 5,425 + 3 * 7
= 2,4698.
7
sp =
1
5
+ 14
p1 p 2 .
(diferena das propores amostrais)
Interpretao?
E(p1 p 2 ) = p1 p 2 .
Logo, o estimador no viciado para p1-p2.
A varincia do estimador proposto
(supondo amostras independentes) :
V(p1 p 2 ) =
p1 (1 p1 ) p 2 (1 p 2 )
+
.
n1
n2
Padronizando:
Z=
(p
p 2 ) (p1 p 2 )
N(0,1).
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
Distribuio Amostral de p1 p 2 :
p (1 p1 ) p2 (1 p2 )
.
p1 p2 N p1 p2 , 1
+
n1
n2
p (1 p1 ) p2 (1 p2 )
IC100(1)%(p1 p2 ) = (p1 p2 ) m z 1
+
.
n1
n2
2
98
Soluo:
140 220
IC90% (p1 p 2 ) =
m
180 300
140 140 220 220
1
R: [-0.0216;0.1105].
Distribuio F
O prximo IC a ser estudado baseia-se
em uma distribuio contnua chamada
F, que tem como parmetros 1 e 2.
p SE = 0,18 e p NE = 0,168.
Ache o IC de 99% para a diferena entre as
propores de aposentados nas 2 regies.
R: [-0,218;0,242].
Distribuio F - Grfico:
/2
A notao :
graus de liberdade
do denominador
IC p/ a Razo de Varincias
de Duas Populaes Normais
s2
22
s 22
2
IC100(1)% ( 2 ) = 2 f
;
f
.
2 n 1,n 1;
n 1,n 1; 1
1
s1 1 2 2 s1 1 2 2
valor k1 tal que :
P(F < k1 ) =
1 , 2 ;
F ~ F1 ,2 .
graus de
liberdade do
numerador
.
2
/2
k2
99
Problema:
A distribuio F s tabelada para a cauda
superior. Entretanto, como a distribuio F no
simtrica, o valor da cauda inferior no o
negativo do valor da cauda superior, como
ocorre com a Normal e com a t de Student.
1 , 2 ; 1
2
1
f
2 , 1 ;
22
.
12
f4,3;0,025 =
15,10.
E o intervalo solicitado :
22
IC95% 2 = [0,1293;19,4839].
1
f3,4;0,025 =
9,98.
Invertendo: f4,3;0,975 =
1/9,98 = 0,1002.
100
Soluo:
f 5 , 5; 0 , 95 = 1 / 5,05 = 0,198.
E o intervalo solicitado :
f5,5;0,05 =
5,05.
2
IC90% 22 = [0,1831;4,6713].
1
IC`s Assintticos
1. baseados na aproximao da t pela Normal.
101
Testes de Hipteses
11. TESTES
DE HIPTESES
(PARTE 1 - CONCEITOS BSICOS E
TESTES PARA MDIA E PROPORO)
102
R: H0: ru inocente
H1: ru culpado.
Nvel de Significncia
O erro tipo I o erro que consiste em
rejeitar H0, quando ela verdadeira.
nvel de significncia.
103
H0 Falsa
Erro Tipo I
No Rejeitar
H0
Erro Tipo II
104
permite testar ao
nvel de significncia:
90%
0,1
95%
0,05
99%
0,01
105
Estatstica de teste
- Regio crtica
106
Xk
Z=
.
/ n
erro padro
Quando H0 verdadeira
( = k), sabemos que:
Z=
Xk
~ N(0,1).
/ n
O valor observado de Z :
z0 =
xk
.
/ n
107
z0 =
T=
Xk
.
S/ n
t0 =
xk
.
s/ n
estimativa
do erro
padro
108
RC = (-,-tn-1;/2][tn-1;/2,).
Assim:
RC = (-,-2,776][2,776,).
Concluso: no rejeitamos
H0, ao nvel 0,05.
O correto seria:
no rejeitar H0 porque k pertence ao IC
ou
rejeitar H0 porque t0 ou (z0) pertence RC.
109
Soluo:
1 - As hipteses de interesse so:
H0: = 600 (hiptese nula);
H1: 600 (hiptese alternativa).
O nvel de significncia pedido = 0,1.
2 - A regio crtica do teste :
RC = (-,-t24;0,05][t24;0,05,).
3 - Clculo de t0:
t0 =
Testes Unilaterais/Unicaudais
Exemplo 11.4 - Um fabricante afirma
que seus cigarros contm, em mdia, no
mximo 30mg de nicotina. Queremos
verificar a partir de uma amostra se
existe evidncia contra esta afirmao.
Neste caso, H1, a hiptese que se quer
evidenciar, no 30, e sim > 30.
110
Resposta:
(quais as hipteses pertinentes?)
proporo amostral.
Z=
p p
N(0,1).
p(1 p)
n
111
Z=
p k
.
k (1 k )
n
z0 =
p k
,
k (1 k )
n
Soluo:
As hipteses de interesse so:
H0: p = 0,3
H1: p 0,3,
0,3125 0,3
z0 =
= 0,2182.
0,3(1 0,3)
64
112
Para = 0,05:
RC = (-,-1,645].
z0 =
0,55 0,6
= 2,04.
0,6(1 0,6)
400
Soluo:
As hipteses de interesse so:
H0: p = 0,6
H1: p < 0,6,
sendo p a proporo de audincia do
programa na populao em estudo.
Concluso:
113
P-Valor
Podemos definir um ponto de corte, isto ,
um valor de abaixo do qual no rejeitamos
H0, e acima do qual passamos a rejeitar H0.
se p-valor rejeitamos H0
se p-valor > no rejeitamos H0
Clculo do P-Valor
O p-valor de um teste dado pela
probabilidade, calculada sob H0,
de que a estatstica de teste assuma
um valor igual ou mais extremo
do que o valor calculado na amostra.
Mais extremo = mais dentro da RC.
114
Se z0 = z, o p-valor
igual a , e H0 rejeitada.
Soluo:
Em um teste bilateral, o p-valor obtido
multiplicando o p-valor unilateral por 2.
p - valor = PH0 (Z 2,5) = 0,5 0,4938 = 0,0062.
Concluso?
R: 0,0207.
115
12. TESTES DE
HIPTESES
S2
.
k
s2
q0 = (n 1) ,
k
e verificar se q0 pertence ou no
RC, definida no slide a seguir.
Regio Critica:
RC = (0, 2
n 1, 1
2
] [ 2
n 1,
, ).
ou :
P(X > k1 ) = 1
2
Conduza o teste:
H0: 2 = 16 contra H1: 2 16,
ao nvel = 0,05.
116
Soluo:
q 0 = (n 1)
s2
(3,63) 2
= 29
= 23,88.
k
16
RC = (0,16] [45,7, ).
Concluso?
Caso 1 - 1 e 2 so conhecidos.
12 22
(X1 X2 ) ~ N(1 2 , + ).
n1 n2
Estatstica do Teste
obtida substituindo em Z o valor do
parmetro testado (que no caso 1-2)
quando H0 verdadeira (1-2 = 0):
Padronizando:
Z=
(X1 X2 ) (1 2 )
~ N(0,1).
12 22
+
n1 n 2
Z=
(X1 X2 )
12 22
+
n1 n 2
117
z0 =
(x1 x 2 )
Caso 2 - 1 e 2 so
desconhecidos e estimados.
12 22
+
n1 n 2
e verificar se z0 pertence ou no
RC, baseada na distribuio Normal.
Estatstica do Teste:
T=
X1 X 2
.
1 1
Sp
+
n1 n 2
RC = (-,-tn1+n2-2,/2][tn1+n2-2,/2,).
t0 =
sp =
x1 x 2
,
1 1
sp
+
n1 n 2
Portanto: RC = (-,-2,921][2,921,).
118
sp =
= 49.843,75 = 223,26.
t0 =
x1 x 2
4.600 4.000
=
= 5,67.
1 1
1 1
sp
+
223,26 +
n1 n 2
8 10
Soluo Parcial:
Implementao no Excel
RC = (-,-2,365][2,365,).
t 0 = 0,0604.
Concluso?
p (1 p1 ) p2 (1 p2 )
.
p1 p2 N p1 p2 , 1
+
n1
n2
As hipteses do teste so
H0: p1 = p2 contra H1: p1 p2,
o que pode ser reescrito da forma:
H0: p1-p2 = 0 contra H1: p1-p2 0.
Padronizando:
Z=
(p
p 2 ) (p1 p 2 )
N(0,1).
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
1
119
Substituindo p1 e p2 no denominador
por suas respectivas estimativas, a
aproximao permanece vlida. Assim:
Z=
z0 =
(p1 p 2 ) (p1 p 2 )
N (0,1)
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
p1 p 2
,
p1 (1 p1 ) p 2 (1 p 2 )
+
n1
n2
Soluo:
120
H 0 : 12 = 22
H1 : 12 22
H1 :
Estatstica do teste:
S12 22
~ Fn11,n 2 1.
S22 12
F=
S12
.
S22
RC = (0; f
n1 1, n 2 1; 1
2
s12
f0 = 2 .
s2
e verificar se f0 pertence ou no RC.
22
1
12
] [f
n1 1, n 2 1;
; ).
1 , 2 ; 1
2
1
f
2 , 1 ;
2
P(F > k 2 ) = .
2
/2
k2
121
Soluo:
Valor da estatstica F: f0 = 40/37 = 1,08.
O processo para obter os valores da tabela F
o mesmo do exemplo 10.5, repetido a seguir.
f5,5;0,05 =
5,05.
5,05.
0,198.
Valor da estatstica F: f0 = 0,775.
Concluso: f0 no pertence RC e,
assim, no rejeitamos, ao nvel 0,1,
a hiptese de varincias iguais.
f4,3;0,025 =
15,10.
f3,4;0,025 =
9,98.
Invertendo: f4,3;0,975 =
1/9,98 = 0,1002.
122
Regio Crtica:
Poder de um Teste
O poder de um teste de
hipteses a probabilidade de
rejeitar H0 quando ela falsa.
Implementao no Excel
O teste F pode ser implementado no
Excel por intermdio da funo
TESTE.F. s entrar com dados em
colunas, e a funo retorna o p-valor.
No caso do exerccio 12.3,
o p-valor 0,7844 (interprete!).
Rejeitar H0
No Rejeitar
H0
H0 Verdadeira
H0 Falsa
Erro Tipo I
Deciso
Correta
Erro Tipo II
123