INTRODUO
A Inferncia Estatstica um conjunto de
tcnicas que objetiva estudar a populao
atravs de evidncias fornecidas por uma
amostra.
a amostra que contm os elementos que
podem ser observados e, a partir da,
quantidades de interesse podem ser medidas.
Estimao de Parmetros
Amostra
Populao
Distribuio de Probabilidade (ou FDP)
Parmetros
(valor fixo)
Estimao
estimar
Estatsticas
(varivel aleatria)
pontual (estatsticas)
por intervalo (intervalos de confiana)
Estimao
Distribuio Amostral
Retrata o comportamento de uma estatstica (mdia,
proporo, entre outras), caso retirssemos todas as
possveis amostras de tamanho n de uma populao.
Uma estatstica uma funo da amostra. Uma amostra
consiste de observaes de uma varivel aleatria.
Assim,estatsticas tambm so variveis aleatrias e,
por isso, possuem uma distribuio de probabilidade.
DISTRIBUIO AMOSTRAL DA
MDIA
Considere uma populao de 5 elementos
(N = 5): 1, 2, 3, 4, 5. Determine todas as
amostras possveis de n=2 com reposio
e calcule a mdia e a varincia.
Soluo: Na populao, temos que =3 e
2=2.
DISTRIBUIO AMOSTRAL DA
MDIA
DISTRIBUIO AMOSTRAL DA
MDIA
DISTRIBUIO AMOSTRAL DA
MDIA
Qualidade do Estimador
Qualidade do Estimador
Qualidade do Estimador
Exemplo: Um pesquisador deseja estimar
a produo mdia de um processo
qumico com base na observao da
produo de trs realizaes X1, X2, X3
de um experimento. Considere dois
estimadores da mdia
ESTIMAO PONTUAL
No processo de estimao por ponto
admite-se como valor numrico do
parmetro exatamente a estimativa
calculada a partir de uma amostra
aleatria extrada da populao em
estudo.
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
mdia populacional
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de ?
k o k-simo estimador de
n
1 = X =
2 = xi
i =1
1
n
= E ( X1 + X 2 + L + X n ) =
=
n
n
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
mdia populacional
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de ?
k o k-simo estimador de
testando a tendenciosidade dos estimadores
1 = X =
E ( 1 ) =
i =1
E ( 2 ) = E ( X i ) =
2 = xi
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
mdia populacional
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de ?
k o k-simo estimador de
procurando a menor varincia
1 = X =
2 = xi
i =1
E ( 1 ) =
E ( 2 ) =
X + X2 +L+ Xn
Var( 1 ) = Var ( X ) = Var 1
2
1
n
2
= 2 Var ( X 1 + X 2 + L + X n ) = 2 =
n
n
n
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
mdia populacional
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de ?
k o k-simo estimador de
procurando a menor varincia
1 = X =
E ( 1 ) =
i =1
2 = xi
Var ( 1 ) =
2
n
Var ( 2 ) = Var ( X i ) = 2
E ( 2 ) =
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
mdia populacional
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de ?
k o k-simo estimador de
n
1 = X =
2 = xi
i =1
2
n
E ( 1 ) =
Var ( 1 ) =
E ( 2 ) =
Var ( 2 ) = 2
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
varincia populacional 2
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de 2?
n
( x
X)
i =1
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
varincia populacional 2
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de 2?
n
( x
i X)
2 =
i =1
( X
i =1
X ) = ( X i2 2 XX i + X 2 )
2
i =1
n
= X i2 2 X X i + nX 2
i =1
n
i =1
= X 2nX 2 + nX 2
2
i
i =1
n
= X i2 nX 2
i =1
X
X =
i =1
X i = nX
i =1
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
varincia populacional 2
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de 2?
n 2
n
2
2
X i nX 1 n
x
X
(i )
2
i =1
= E X i2 E ( X 2 )
E ( ) = E
2 = i =1
n
n i =1
1 n
= E ( X i2 ) E ( X 2 )
n i =1
2
Var( X i ) = 2 = E ( X i2 ) ( E ( X i ) ) = E ( X i2 ) 2 E ( X i2 ) = 2 + 2
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
varincia populacional 2
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de 2?
n 2
n
2
2
X i nX 1 n
x
X
(
)
i
2
i =1
= E X i2 E ( X 2 )
E ( ) = E
2 = i =1
n
n
i =1
1 n
= E ( X i2 ) E ( X 2 )
n i =1
Var( X ) =
2
n
= E ( X 2 ) E ( X ) = E ( X 2 ) 2 E ( X 2 ) =
2
n
+ 2
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
varincia populacional 2
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de 2?
n 2
n
2
2
X i nX 1 n
x
X
(i )
2
i =1
= E X i2 E ( X 2 )
E ( ) = E
2 = i =1
n
n i =1
1 n
= E ( X i2 ) E ( X 2 )
n i =1
= 2 + 2
2
n
2 =
n 2 2
n 1 2 estimador
=
n
n
tendencioso!
Estimao Pontual
Seja X uma v.a. normalmente distribuda com a mdia () e a varincia
(2) desconhecidas. Retira-se uma amostra de tamanho n com a
finalidade de se estimar e 2.
varincia populacional 2
De que maneira os valores da amostra podem ser combinados a fim de
se produzir uma boa estimativa de 2?
n
( x X )
i =1
n
n
( x X )
n
n 1
s2 =
i =1
n 1
E ( s2 ) = 2
estimador
no tendencioso
ESTIMAO PONTUAL
ESTIMAO PONTUAL
Exemplo. Deseja-se conhecer o preo
mdio de determinado artigo em certa
localidade. Para este fim, observou-se o
preo do mesmo em 5 pontos de venda
escolhidos aleatoriamente na localidade,
encontrando-se os seguintes valores: 85,
80, 86, 88 e 83. Estime por ponto o preo
mdio do artigo em todos os pontos de
venda da localidade.
ESTIMAO PONTUAL
Estimao Intervalar
Introduo
ZX =
/ n
P( X z / 2
X
< z / 2 ) = 1
/ n
< < X + z / 2
) = 1
x z / 2
n
N n < < x + z
/2
N 1
n
N n
N 1
N n 1
N 1
e a amostragem sem reposio equivalente amostragem
com reposio
Exemplo
Para estimar o salrio mdio de operrios em
certa localidade na qual o salrio em R$ uma
VAC N(, 100), um pesquisador analisou os
salrios de 80 operrios, escolhidos
aleatoriamente na localidade, constatando que o
salrio mdio dos mesmos R$310,00.
Construa e interprete um intervalo de confiana
de 95% para o salrio mdio de todos dos
operrios da localidade considerada, admitindose que o nmero de operrios na localidade
seja muito maior que 100.
Soluo
No tendo sido dado o tamanho da
populao (nmero de operrios na
localidade) admite-se amostragem com
reposio
Ento, sendo X o salrio de um operrio
na localidade, o intervalo de confiana
para o salrio mdio nesta localidade
x z / 2 < < x + z / 2
n
n
Soluo (cont.)
Pelo enunciado do problema tem-se que a
estimativa do salrio mdio na localidade
obtida a partir da amostra de tamanho n =
80 x = 310, sendo que o desvio padro
dos salrios na localidade = 100 = 10.
Sendo 1 = 0,95, = 0,05 e o
coeficiente de confiana, , tal que como
ilustra o grfico a seguir.
Soluo (cont.)
Soluo (cont.)
310 1,96 10 < < 310 + 1,96 10
80
80
SX = S
n
i=1 ( X i X ) 2
n
S=
n 1
Define-se a varivel
padronizada
TX =
X
S
n
lim T = Z
X
< t / 2 ) = 1
S
n
P( X t / 2 S < < X + t / 2 S ) = 1
n
n
denominado intervalo de confiana de 100(1)%
para a mdia populacional.
Diz-se ento que a probabilidade de que este intervalo
contenha a mdia populacional 1.
x t / 2 s
n
N n
< < x + t / 2 s
N 1
n
N n
N 1
N n 1
N 1
e a amostragem sem reposio equivalente amostragem
com reposio
Exemplo
Um pesquisador analisou o custo de
produo, em R$, numa amostra de 10
unidades de um artigo produzido por certo
fabricante escolhidas aleatoriamente da
produo, encontrando os seguintes
valores: 10, 11, 7, 9, 6, 7, 10, 7, 6 e 8.
Construa e interprete um intervalo de 95%
para o custo mdio de produo do artigo
considerado.
Soluo
i=1 x i
10
x=
10
i =1 xi2 (i =1 x i )
10
s=
10
10 1
i =1 xi2 (i =1 x i )
10
10(10 1)
10
90
i =1 x i = 10 + 11 + 7 + 9 + 6 + 7 + 10 + 7 + 6 + 8 = 81
10
10
2
x
i=1 i
= 10 + 11 + 7 + 9 + 6 + 7 + 10 + 7 + 6 + 8 = 685
x = 81 = 8,1
10
2
s=
685 81
= 1,79
9
90
Sendo
1 = 0,95,
= 0,05
coeficiente
de
confiana,
t 0, 025 ,
tal
que
Figura 5
A varivel TX tem distribuio t de Student com = n 1 = 10 1 = 9 graus de
liberdade. Pela tabela do apndice 2 tem-se para = 9 e = 0,05 que t 0, 025 = 2,26.
Como no foi informado o tamanho da populao (nmero de unidades produzidas)
considera-se amostragem com reposio ou amostragem sem reposio de uma populao muito
maior que a amostra. Assim sendo, o intervalo de confiana de 95% para o custo mdio deste artigo
1,79
1,79
8,1 2,26
< < 8,1 + 2,26
R $6,82 < < R $9,38
10
10
Este resultado significa que a probabilidade de que o intervalo acima contenha o custo
mdio das unidades deste artigo 0,95.
P =
(1 )
n
P
p (1 p )
n
P ( z / 2 < Z P < z / 2 ) = 1
p z / 2
p
< z / 2 ) = 1
p(1 p)
n
p(1 p)
< < p + z / 2
n
p(1 p)
n
p(1 p) N n
p(1 p) N n
< < p + z / 2
n
N 1
n
N 1
N n 1
N 1
e a amostragem sem reposio equivalente amostragem
com reposio
Exemplo
Um produtor deseja estimar a proporo de
itens de certo artigo na linha de produo de
sua empresa que apresentam defeito de
fabricao. Para esta finalidade, retirou uma
amostra de 200 itens retirados aleatoriamente
da linha de produo, constatando que 16
destes apresentam defeito de fabricao.
Construa e interprete um intervalo de confiana
de 95% para a proporo de itens na linha de
produo que apresentam defeito de fabricao.
Soluo
No tendo sido informado o tamanho da populao (nmero de itens produzidos) admite-se
amostragem com reposio ou amostragem sem reposio de uma populao infinita ou populao
finita muito maior que a amostra e o intervalo de confiana para a proporo de itens defeituosos na
linha de produo
p (1 p )
p (1 p )
p z / 2
< < p + z / 2
n
n
onde p = x/n. Na amostra de tamanho n = 200 foram observados x = 16 itens defeituosos. Ento a
estimativa da proporo de itens defeituosos na linha de produo
16
p=
= 0,08
200
Sendo 1 = 0,95, = 0,05 e o coeficiente de confiana z / 2 tal que
P( z / 2 < Z P < z / 2 ) = 0,95 como ilustra o grfico a seguir.
Soluo (cont.)
P(0 < Z P < z / 2 ) = P( z / 2 < Z P < z / 2 ) / 2 = 0,95 / 2 = 0,475
Pela tabela do apndice 1 tem-se que z / 2 = 1,96. Assim sendo, o intervalo de 95% para a
proporo de itens defeituosos na linha de produo
0,08(1 0,08)
0,08(1 0,08)
0,042 < < 0,118
0,08 1,96
< < 0,08 + 1,96
200
200
Com este resultado, a probabilidade de que o intervalo acima contenha a proporo de itens
defeituosos na linha de produo 0,95.
DETERMINAO DO TAMANHO DA
AMOSTRA PARA ESTIMAO DA MDIA
Considere uma varivel X N (, 2). Para um
intervalo de confiana de 100(1)% para
construdo a partir de uma determinada amostra
com mdia extrada com reposio tem-se que
x
z =
/2
n=
/2
e02
x
N n
n N 1
n=
z2 / 2 2 N
( N 1)e02 + z2 / 2 2
Exemplo
Um pesquisador deseja estimar o preo
mdio de um produto nos pontos de
venda de certa regio, de modo que o erro
de estimao seja no mximo igual a
R$2,00, admitindo-se um nvel de
confiana de 95%. O pesquisador dispe
de uma amostra piloto de 40 pontos de
venda nos quais o desvio padro do preo
do produto igual a R$12,00. Qual deve
ser o tamanho da amostra?
Soluo
No tendo sido informado o tamanho da populao (nmero de pontos de venda da regio), o
tamanho da amostra
z2 2
n = / 22
e0
Pelos dados do problema, tem-se que e0 = 2 e = 12. Sendo 1 = 0,95, = 0,05 e
z 0,025 tal que P( z / 2 < Z X < z / 2 ) = 0,95 como ilustra o grfico a seguir.
Figura 5.8
p
(1 )
n
z2 / 2 (1 )
e02
p
(1 ) N n
n
N 1
n=
z2 / 2 (1 ) N
( N 1)e02 + z2 / 2 (1 )
Exemplo
Com o objetivo de estimar a proporo de itens
defeituosos numa produo, um administrador
de produo deseja extrair uma amostra
aleatria de itens da referida produo para tal
fim. Uma amostra piloto de 40 itens apresentou
4 defeituosos. Qual deve ser o tamanho da
amostra definitiva para que o erro de estimao
da proporo de defeituosos na populao seja
de no mximo 3% a um nvel de confiana de
95%?
Soluo
No tendo sido informado o tamanho da populao (nmero de itens produzidos) o tamanho
da amostra
z 2 (1 )
n = /2 2
e0
Sendo desconhecido, considera-se a partir da amostra piloto
4
=
= 0,1
40
Pelos dados do problema, tem-se que e 0 = 0,03. Sendo 1 = 0,95, = 0,05 e z0 ,025
tal que P ( z / 2 < Z X < z / 2 ) = 0,95 como ilustra o grfico a seguir.
Soluo (cont.)
Observando-se o grfico acima tem-se que
P(0 < Z X < z / 2 ) = P( z / 2 < Z X < z / 2 ) / 2 = 0,95 / 2 = 0,475
Pela tabela do apndice 1 tem-se que z / 2 = 1,96. Assim sendo, o tamanho da amostra para estimar
a proporo de itens defeituosos na produo
1,96 0,1(1 0,1)
n = 385
n=
0,032
Neste caso deve-se acrescentar 345 itens amostra piloto.
tem distribuio do
chi-quadrado com
n 1 graus de
liberdade
(n 1) s 2
~ n21
Distribuio 2
f ( x) =
1
x g 21e x 2
2 g 2 ( g 2)
g>2
x0
g2
E( X ) = g
Var ( X ) = 2 g
X ~
2
g
Propriedades:
a) se Z ~ N (0,1), ento Z 2 ~ 12
n
2
b) se X i ~ 1 , ento
~ n2
i =1
~ n21
n21
P ( xa <
( n 1) s 2
< xb ) = 1
1
2
1
P <
< = 1
2
x
(
n
1)
s
x
a
b
2
0 xa
xb
(n 1) s 2
(n 1) s 2
P
<2 <
= 1
xa
xb
IC para 2
Exemplo
Uma mquina produz uma grande quantidade
de peas e o nmero de peas defeituosas da
produo se distribui normalmente com
varincia (x) = 16. Com o objetivo de diminuir
a variabilidade do processo, foi providenciada
uma reforma na mquina. Uma amostra
aleatria de 51 peas produzidas aps a
reforma forneceu varincia 14. Construa um
intervalo de confiana de 98% para a nova
varincia populacional.
Soluo
n = 51
s = 14
P(
P(
)=1
) = 0,98
X 1 ~ ?N ( 1 ,
12
n1
X 2 ~ N ( 2 , 22 )
X 2 ~ N ( 2 ,
( X 1 X 2 ) ( 1 2 )
2
1
n1
P( z <
2
2
12
n1
X 1 X 2 ~ ?N ( 1 2 ,
12
n1
22
n2
N (0,1)
~N
? (0,1)
( X 1 X 2 ) ( 1 2 )
12
n2
n2
n1
P( X 1 X 2 z
22
22
n2
22
< z) = 1
n2
< 1 2 < X 1 X 2 + z
IC para 1 - 2
-
12
n1
-z
22
n2
P( z < Z < z ) = 1
) = 1
Exemplo
Duas populaes normais independentes,
com distribuies x1 e x2, apresentam
(x1) = 5 e (x2) = 2. Uma amostra
aleatria de 12 elementos da primeira
populao apresentou x1 = 34. Uma
amostra aleatria de 8 elementos da
segunda populao apresentou x2 = 9,4.
Calcule o intervalo de confiana de 98%
para a diferena - .
Soluo
] = 0,98
X 2 ~ N ( 2 , 22 )
( X 1 X 2 ) ( 1 2 )
12
n1
22
~ ?N (0,1)
i e i2 desconhecidas
(considerando 12 22 )
n2
s12 s22
+
n n
( X 1 X 2 ) ( 1 2 )
g 12 2 2
~ tg
2
2
2
s1 s22
s1 s2
+
n1 n2
n1 + n2
n1 1 n2 1
( X X 2 ) ( 1 2 )
P ( t < 1
< t) = 1
s12 s22
+
n1 n2
tg
P( X 1 X 2 t
2
1
2
2
2
1
2
2
s
s
s
s
+
< 1 2 < X 1 X 2 + t
+ ) = 1
n1 n2
n1 n2
-t
P ( t < T < t ) = 1
Exemplo
Com os dados de resistncias
compresso em concretos com cimentos
das marcas A e B, considerando
varincias desconhecidas. E nvel de
confiana de 95%.
Exemplo
Exemplo
Exemplo
Duas mquinas produzem o mesmo tipo de
pea, que so misturadas para embalagem
posterior. Uma amostra de 40 peas da primeira
mquina apresentou 1 pea defeituosa,
enquanto uma amostra de 36 peas da segunda
mquina apresentou 2 peas defeituosas.
Calcule, ao nvel de 98%, um intervalo de
confiana para a diferena das propores de
peas defeituosas na produo dessas
mquinas.
Soluo