ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Amostragem
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Aleat
oria sistem
atica: Uma amostra aleat
oria sistematica e
constituda pelos elementos da populacao seleccionados de k
em k elementos.
Aleat
oria simples: Significa que todos os elementos da
populacao tem a mesma probabilidade de serem escolhidos e
de virem a fazer parte da amostra de dimensao previamente
fixada.
Estratificada: Inicialmente a populacao e dividida em
estratos e depois selecciona-se uma amostra em cada estrato.
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Amostra
Sejam
X uma v.a. de interesse;
X1 , X2 , . . . , Xn v.a independentes e identicamente
distribudas (i.i.d.) a X , i.e., Xi i.i.d X ,
i = 1, 2, . . . , n.
Entao o vector aleat
orio X = (X1 , X2 , . . . , Xn ) diz-se uma
amostra aleatoria (a.a.) de dimensao n proveniente da
populacao X .
` observacao particular da a.a. X = (X1 , X2 , . . . , Xn ) da-se
A
o nome de amostra e representa-se por x = (x1 , x2 , . . . , xn ).
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Caso discreto
P(X = x) = P(X1 = x1 , X2 = x2 , . . . , Xn = xn )
= P(X1 = x1 ) . . . P(Xn = xn )
n
n
Y
Y
=
P(Xi = xi ) =
P(X = xi )
i=1
i=1
Caso contnuo
fX (x) = fX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn )
= fX1 (x1 ) . . . fXn (xn )
n
n
Y
Y
=
fXi (xi ) =
fX (xi )
i=1
Lusa Morgado
i=1
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Estatstica
Seja X = (X1 , X2 , . . . , Xn ) a.a.de dimensao n proveniente da
populacao X .
T diz-se uma estatstica se se tratar de uma funcao exclusiva
da a.a. i.e., T = T (X ).
Note que T nao depende de nenhum parametro desconhecido.
Exemplo
Estatstica
Mnimo da a.a.
M
aximo da a.a.
Amplitude da a.a.
M
edia da a.a.
Var. corrigida da a.a.
Var. n
ao corrigida da a.a.
X(1) = mini=1,...,n Xi
X(n) = maxi=1,...,n Xi
R = X(n) X(1)
Pn
X = n1
i=1 Xi
2
1 Pn (X X )2
S = n1
i=1 i
2
2
1 Pn
1
= n1
i=1 Xi n1 X
P
n
2
S 02 = n1
(X
X
)
i
Pn i=1
2
1 2
= n1
i=1 Xi n X
Lusa Morgado
x)
i
Pn i=1
2
1 2
= n1
i=1 xi n x
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Estimador
A estatstica T = T (X ) diz-se um estimador do parametro
desconhecido se T = T (X ) apenas toma valores no espaco
parametrico .
Estimativa
Ao valor observado do estimador de , t = T (x) da-se o
nome de estimativa de .
Note que o estimador e uma v.a. e como tal tem uma distribuicao
de probabilidade.
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Enviesamento de um estimador
O estimador do parametro desconhecido possui enviesamento dado
por
bias [T (X )] 6= E [T (X )] .
Notas:
Um estimador centrado possui enviesamento nulo;
Regra geral ha mais do que um estimador para um mesmo
parametro desconhecido. Quanto menor for o enviesamento
de um estimador mais rigorosas serao as estimativas por ele
fornecidas.
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Suponhamos que X
e uma v.a. de interesse com distribuic
ao arbitr
aria, valor esperado
e vari
ancia 2 .
P
A m
edia da a.a. X = n1 ni=1 Xi
e um estimador centrado de pois
!
n
n
1X
1X
Xi =
E (Xi )
E (X ) = E
n i=1
n i=1
=
n
n
1X
1X
1
E (X ) =
= n =
n i=1
n i=1
n
A vari
ancia corrigida
e um estimador centrado de 2 uma vez que
"
#
" n
!
#
n
X
1 X
1
E (S 2 ) = E
(Xi X )2 =
E
Xi2 n(aX )2
n 1 i=1
n1
i=1
" n
#
X
1
=
E (Xi2 ) nE [(X )2 ]
n 1 i=1
( n
)
X
1
2
2
=
[V (Xi ) + E (Xi )] n[V (X ) + E (X )]
n 1 i=1
" n
2
#
X
1
1
( 2 + 2 ) n
=
+ 2
=
(n 2 + n2 2 n2 )
n 1 i=1
n
n1
=
1
(n 1) 2 = 2 .
n1
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
EQM [T2 (X )]
.
EQM [T1 (X )]
Assim, se
e [T1 (X ), T2 (X )] > 1 EQM [T2 (X )] > EQM [T1 (X )],
e portanto o estimador T1 (X ) e mais eficiente que o estimador
T2 (X ).
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
n
Y
P(X = xi |),
i=1
Caso contnuo
L(|x) = fX (x|) =
n
Y
fX (xi |),
i=1
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
ou equivalentemente
= max ln L(|x)
ln L(|x)
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo
Um inqu
erito realizado a um grupo de 1000 indivduos com queixas de ins
onia revelou
que 448 respondem ter dormido bem ap
os a toma de um certo soporfero.
Deduza a EMV da probabilidade (p) de uma pessoa escolhida ao acaso ter dormido
bem tendo tomado o soporfero.
V.a. de interesse:
X =resposta ao inqu
erito
Distribuic
ao:
X Bernoulli(p)
Par
ametro desconhecido:
p = P(X = 1), 0 p 1
F.p.:
P(X = x) = p x (1 p)1x ,
x = 0, 1
Amostra:
x = (x1 , . . . , xn ) amostra de dimens
ao n = 1000, proveniente da populac
ao onde
xi = resposta de i-
esima pessoa.
448
x = 1000
= 0.448 = 44.8% de respostas afirmativas.
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo (cont.)
Func
ao de
Qnverosimilhanca: Qn
L(p|x)
= i=1 P(X
= xi ) = i=1 p xi (1 p)1xi =
Pn
Pn
p i=1 xi (1 p)n i=1 xi
Func
ao de log-verosimilhan
ca:
Pn
Pn
x
i
i=1
(1 p)n i=1 xi =
ln L(p|x) = ln p
P
P
ln(p) ni=1 xi + ln(1 p) (n ni=1 xi )
Maximizac
ao: A EMV de p, p, obtem-se resolvendo
( d ln L(p|x)
|p=p = 0 (ponto de estacionaridade)
dp
p :
d 2 ln L(p|x)
|p=p < 0 (ponto de maximo)
dp 2
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo (cont.)
p
:
Pn
P
P
n ni=1 xi
(n ni=1 xi )]
i=1 xi
|p=p = 0
|p=p = 0
p
1p
dp
P
Pn
P
P
n ni=1 xi
d 2 [ln(p) ni=1 xi +ln(1p)(n ni=1 xi )]
i=1 xi
|p=p <
p 2 (1p)2
|p=p < 0
dp 2
Pn
Pn
(
P
P
x
x
n
i=1 i
i=1 i
(1 P
p
) ni=1 xiP p
n ni=1 xi =
=0
1
n
n
Pnp
Pnp
x
x
n
i
i=1 i
i=1
(1
<0
i=1 xi n i=1 xi < 0
p
2
p )2
p
2
(1
p )2
d [ln(p)
Pn
i=1 xi +ln(1p)
Lusa Morgado
Estimac
ao
0
0
P
p
= n1 ni=1 xi
proposic
ao verdadeira
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo (cont.)
Estimador de P
MV de p:
EMV (p) = n1 ni=1 Xi = X (m
edia da amostra).
Concretizac
ao:
p
=
=
=
n
1X
xi
n i=1
no de respostas afirmativas
no de pessoas inquiridas
0.448
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo
Os tempos observado (em anos) at
e`
a 1a colis
ao de detritos espaciais com di
ametro
inferior a 1mm em 4 sat
elites em MEO foram de 1.2, 1.5, 1.8 e 1.4.
Admitindo que tal tempo tem distribuic
ao pertencente ao modelo exponencial de
par
ametro , vamos determinar o estimador e a estimativa de MV de .
V.a. de interesse:
X =tempo (em anos) at
e`
a 1a colis
ao de detritos espaciais
Distribuic
ao:
X exponencial()
Par
ametro desconhecido:
, > 0
F.d.p.:
e x , x 0
fX (x) =
0, c.c.
Amostra:
x = (x1 , . . . , xn ) amostra de dimens
ao n = 4, proveniente da populac
ao onde
xi = resposta de i-
esima pessoa.
x = 1.2+1.5+1.8+1.4
= 1.475
4
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo (cont.)
Func
ao de
ca:
Pn
Q
Qnverosimilhan
L(|x) = i=1 fX (xi ) = ni=1 e xi = n e i=1 xi
Func
ao de log-verosimilhan
ca:
Pn
P
x
n
i
i=1
= n ln() ni=1 xi
ln L(|x) = ln e
Maximizac
ao: A EMV de ,
(
d ln L(|x)
|= = 0
d
:
d 2 ln L(|x)
|= < 0
d2
Lusa Morgado
obtem-se resolvendo
,
(ponto de estacionaridade)
(ponto de maximo)
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo (cont.)
P
ni=1 xi |= = 0
:
n2 |= < 0
( P
n
n
i=1 xi = 0
n
2 < 0
(
= Pnn
i=1 xi
proposicao verdadeira
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo (cont.)
Estimador de MV de p:
edia da amostra).
EMV () = Pn n X = (X )1 (m
i=1
Concretizac
ao:
n
Pn
(
x )1
1.4751 = 0.678
i=1 xi
inverso da m
edia da amostra
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Distribuicoes amostrais
A caracterizac
ao probabilstica de estatsticas, de estimadores ou de suas func
oes
e
crucial n
ao s
o para avaliar as propriedades dos estimadores (como p.e., enviesamento,
EQM, efici
encia), mas tamb
em como veremos a seguir, para obter estimativas
intervalares dos par
ametros desconhecidos (aos quais chamaremos intervalos de
confianca).
ent
E
ao fundamental conhecer a distribuic
ao de uma estatstica, de um estimador ou
de sua func
ao, `
a qual chamamos distribuic
ao amostral (ou distribuic
ao por
amostragem).
Exemplo
Sendo X = (X1 , . . . , Xn ) uma a.a. de dimens
ao n proveniente da populac
ao X com
f.d. FX (x), ent
ao facilmente se mostra que
Estatstica
X(1) = mini=1,...,n Xi
X(n) = maxi=1,...,n Xi
Distribuic
ao amostral
FX(1) (x) = 1 [1 FX (x)]n
FX(n) (x) = [FX (x)]n
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
A m
edia
e, em geral, o estimador de MV (ou de alguma forma est
a com ele
relacionada) do valor esperado de uma v.a. de interesse, pelo que
e fundamental
conhecer a sua distribuic
ao.
Seja X = (X1 , . . . , Xn ) uma a.a. de dimens
ao n proveniente da populac
ao X . Ent
ao
Populac
ao
Distribuic
ao amostral da m
edia
X normal(, 2 )
X com distribuic
ao arbitr
aria (n
ao normal)
E (X ) = , V (X ) = 2 , n grande
X normal(,
X
2
)
n
normal(0, 1)
e suficientemente grande.
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo
Assuma que a press
ao sist
olica de uma populac
ao saud
avel segue uma distribuic
ao
normal de m
edia 120mmHg e desvio padr
ao 10mmHg . Num grupo de 25 pessoas, a
m
edia da press
ao sist
olica foi de 124mmHg .
Qual a probabilidade de se encontrar uma m
edia superior a esta numa amostra de 25
indivduos? Ou, dito de outro modo, qual a proporc
ao de amostras de 25 indivduos
escolhidas ao acaso nessa populac
ao que t
em uma m
edia superior a 124mmHg ?
De acordo com o 1o dos resultados anteriores, a distribuic
ao amostral da m
edia segue
= 4, i.e.,
uma distribuic
ao normal de par
ametros = 120 e 2 = 100
25
X normal(120, 4).
A probabilidade pedida
e ent
ao dada por
P(X > 124) = 1 P(X 124) = 1 FX (124) = 0.023
no scilab:
cdfnor(PQ, 124, 120, 2) = 0.977
com consulta das tabelas
120
normal(0, 1)
Sendo Z = X
10
25
120
P(X 124) = P( X
10
25
124120
10
25
Lusa Morgado
) = P(Z 2) = (2).
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Intervalos de confianca
Para alem de uma estimativa pontual para um parametro
desconhecido e importante obter um intervalo que nos de uma
ideia da confianca que se pode depositar na estimativa pontual.
Essa estimativa intervalar e designada por intervalo de confianca
(IC).
A um intervalo de confianca esta associado um grau de confianca,
usualmente representado por (1 ) 100%, cujos valores mais
usuais sao 90%, 95% e 99% (ou, = 0.1, 0.05, 0.01,
respectivamente).
Antes de mais e necessario descever a situacao com que lidamos,
em particular
a v.a. X de interesse e a respectiva distribuicao
o parametro desconhecido para o qual se pretende obter um IC
outro eventual parametro (conhecido ou nao) da distribuicao
de X .
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
ou ainda, recorrendo `
as tabelas ou ao scilab, determinar a e b tal que
P(Z < a ) =
a = 1
= 1 1
2
2
2
1
P(Z > b ) = 2
b =
1 2
Assim
P(a Z b ) = 1 P(a
X b X a
n
P X 1 1
X + 1 1
2
n
2
P
b ) = 1
=1
n
=1
IC(1)100% () = x 1 1
, x + 1 1
2
n
2
n
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
a e b tal que
P(a Z b ) ' 1
ou ainda, recorrendo `
as tabelas ou ao scilab, determinar a e b tal que
P(Z < a ) =
= 1 1
a = 1
2
2
2
P(Z > b ) =
b = 1 1
2
2
Assim
P(a Z b ) = 1 P(a
X b X a
n
1
P X
1
X + 1 1
2
n
2
P
b ) ' 1
'1
n
'1
IC(1)100% () = x 1 1
, x + 1 1
2
n
2
n
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo
O QI numa populacao segue uma distribuicao normal de variancia
152 . Com base numa amostra de dimensao 25, com media
amostral de 100, vejamos como contruir o IC a 95% para a media
na populacao.
Ora
1
1
IC(1)100% () = x
1
,x +
1
2
2
n
n
onde, neste caso = 0.05.
0.05
No scilab, o comando cdfnor(X
, 0, 1, 1 0.05
2 , 2 ) devolve-nos o
0.05
1
valor de
1 2 = 1.96, logo
15
15
IC95% () = 100 1.96 , 100 + 1.96
= [94.1, 105.6]
25
25
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Quando n
ao conhecemos o valor de 2 na populac
ao, ent
ao a v.a.
deixa de ser u
til. Neste caso,
ser
a estimado por
Z =
X
S
S2
normal(0, 1)
e usa-se a v.a.
tn1
e l
e-se Z possui distribuic
ao de t-student com (n 1) graus de liberdade.
A distribuic
ao de t-student
e semelhante `
a distribuic
ao normal reduzida. E
sim
etrica em relac
ao `
a m
edia, (0), mas com um desvio padr
ao dependente de
um par
ametro denominado graus de liberdade;
Existe uma distribuic
ao de t-student diferente para cada no de graus de
liberdade;
Geralmente, os graus de liberdade correspondem `
a diferenc a entre a dimens
ao
amostral e o no de par
ametros a estimar.
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
X
S
P(a Z b ) ' 1
ou ainda, recorrendo `
as tabelas ou ao scilab, determinar a e b tal que
(
a = Ft1
= Ft1
1
P(Z < a ) =
2
2
(n1)
(n1)
2
P(Z > b ) =
b = Ft1
1
2
(n1)
P(a Z b ) = 1 P(a
X Ft1
(n1)
S
X b X a
n
S
1
1
X + Ft1
(n1)
2
n
2
P
b ) ' 1
S
'1
n
S
'1
s
s
IC(1)100% () = x Ft1
1
, x + Ft1
1
(n1)
(n1)
2
n
2
n
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
Exemplo
A durac
ao em horas de uma pilha de certa m
aquina possui distribuic
ao que se admite
normal com valor esperado e vari
ancia desconhecidas. Recolheu-se uma amostra de
10, tendo-se obtido o seguinte conjunto de dados:
x = (251, 238, 236, 229, 252, 253, 245, 242, 235, 230).
Determinemos um intervalo de confianca a 99% para .
t(n1) , o IC pedido
e dado por
Considerando a v.a. Z = X
S
n
s
s
1
IC(1)100% () = x Ft1
1
,
x
+
F
1
t
(n1)
(n1)
2
n
2
n
onde = 0.01, n = 10, x = 241.1, s 2 = 79.66 e Ft1
1
(n1)
No scilab, o comando cdft(T , 9, 1
= Ft1
1 0.01
= 3.2498, logo
2
(9)
0.01 0.01
, 2 )
2
"
IC99% ()
241.1 3.2498
[231.927, 250.273]
Lusa Morgado
= Ft1
1
(9
0.01
2
devolve-nos o valor de
79.66
, 241.1 + 3.2498
10
Estimac
ao
79.66
10
.
Estimac
ao pontual
Estimac
ao por intervalos
P(Z > b ) = 2
b = 1 1
2
P(a Z b ) = 1 P(a
X
S
S
X b X a
n
S
1
P X
1
X + 1 1
2
n
2
P
b ) ' 1
S
'1
n
S
'1
s
s
IC(1)100% () = x 1 1
, x + 1 1
2
n
2
n
Lusa Morgado
Estimac
ao
Estimac
ao pontual
Estimac
ao por intervalos
(n1)S 2
2
2(n1) e l
e-se Z possui distribuic
ao do qui-quadrado com
2
a = F 2
(n1)
b
=
F
1
2
2
P(Z < a ) =
2
P(Z > b ) =
2
(n1)
(n 1)S 2
P(a Z b ) = 1 P a
b
'1
(n 1)S 2
(n 1)S 2
2
' 1
P
1
F 1
1 2
F 2
2
2
(n1)
(n1)
(n 1)S 2
(n 1)S 2
2
,
IC(1)100% ( ) =
1
F 1
1
F
2
2
2
2
(n1)
Lusa Morgado
Estimac
ao
(n1)
Estimac
ao pontual
Estimac
ao por intervalos
IC para a vari
ancia de uma populac
ao normal com valor esperado conhecido
Procede-se como no caso anterior mas a distribuic
ao de Z passa a ter (n) graus
de liberdade.
Nota: No scilab, o comando cdfchi(X , n,
Lusa Morgado
,1
2
)
2
Estimac
ao
devolve o valor de F 1
2
(n)
Estimac
ao pontual
Estimac
ao por intervalos
r X p
normal(0, 1).
X (1X )
n
Determinamos a e b por
a = 1 1
2
b = 1 1
2
X p
P(a Z b ) ' 1 P a q
X (1X )
n
P X 1 1
X (1 X )
p X + 1 1
n
2
b ' 1
X (1 X )
'1
n
O seguinte
ca aproximadamente igual a (1 ) 100%:
IC possui grau de confian
q x(1x)
q x(1x)
1
IC (p) = x
1 2
, x + 1 1
n
2
n
Lusa Morgado
Estimac
ao