Anda di halaman 1dari 19

CAPTULO 8

Exerccios Resolvidos

R8.1) Controle de Qualidade


Tem o selo do Inmetro?

Um fabricante de equipamentos eletrnicos vende resistores, em lotes de 500 unidades,
ao preo de 1500,00 u.m. o lote. O valor nominal da resistncia eltrica desses
componentes de 47 kO e o seu custo de fabricao de 2,00 u.m. a unidade. Admita
que o valor da resistncia eltrica de um tal resistor na verdade se comporta como uma
varivel aleatria com mdia e desvio padro 1 kO. Ocorre que os compradores
exigem que, antes de fechado um negcio, seja extrada do lote uma amostra aleatria
simples com n resistores, cujas resistncias eltricas x
1
, x
2
, x
3
, ..., x
n
so medidas, e a
venda s se concretiza se
x 47 0,2 < (em kO).
Caso contrrio, o lote inutilizado.


(a) Que tamanho mnimo n da amostra o vendedor deve propor que seja utilizado, para
que o seu lucro esperado em cada lote seja de pelo menos 400,00 u.m., no caso de o seu
processo produtivo estar perfeitamente regulado, isto , = 47kO ?
(b) Usando o valor de n calculado em (a), qual o lucro esperado do vendedor em cada
lote, se = 46,9 kO (ou seja, se h uma pequena desregulagem no processo)?
(c) E se = 46,8kO?

Soluo:
Lucro = Receita Despesa, sendo que

<
=
contrrio caso 0,
0,2 47 x se 1500,
Receita e Despesa = 1000 500 2 = .
Ento
| | 1000
n
1
8 , 46
n
1
2 , 47
1500 1000 $ 2 , 47 x 8 , 46 P 1500 $ ) Lucro ( E
|
|
|
.
|

\
|
|
|
|
.
|

\
|

u
|
|
|
.
|

\
|

u = < < =

(a) Se = 47, para que E(Lucro) > $400, devemos ter


( ) ( ) { } 400 1000 n 0,2 n 0,2 1500 > .
Por outro lado, devido simetria da curva Normal, temos
) a ( 1 ) a ( u = u , ou seja, 1 ) a ( 2 ) a ( ) a ( u = u u .
Ento, ( )
1500
1000 400
1 n 2 , 0 2
+
> u , o que implica que o tamanho n da amostra
deve ser de pelo menos
=
|
|
.
|

\
|
|
.
|

\
|
u

2
1
30
29
5 84 resistores.
(b) Se = 46,9 e n = 84, ento
. 98 , 225 $ 1000
84
1
9 , 46 8 , 46
84
1
9 , 46 2 , 47
1500 ) Lucro ( E =
|
|
|
.
|

\
|
|
|
|
.
|

\
|

u
|
|
|
.
|

\
|

u =
(c) Se = 46,8 e n = 84, ento
. 19 , 250 $ 1000
84
1
8 , 46 8 , 46
84
1
8 , 46 2 , 47
1500 ) Lucro ( E =
|
|
|
.
|

\
|
|
|
|
.
|

\
|

u
|
|
|
.
|

\
|

u =
Ou seja, neste caso o nvel da desregulagem j seria suficiente para gerar uma
expectativa de prejuzo.


R8.2) Gasto mensal das famlias com alimentao
Deseja-se estimar o gasto mensal mdio com alimentao das famlias de uma
determinada cidade. O procedimento proposto consiste em entrevistar n = 100 famlias
e adotar a mdia aritmtica X dos seus gastos mensais em alimentao como uma
estimativa do parmetro de interesse. Consultando estatsticas de perodos anteriores,
verifica-se que o coeficiente de variao do gasto familiar mensal em alimentao nessa
cidade tem oscilado pouco ao longo do tempo em torno de 0,5. Assim sendo aqui ele
ser considerado conhecido e igual a 0,5.
(a) Qual a probabilidade de que o erro relativo

X
no exceda 5%?
(b) Calcule c para que o erro relativo seja menor que c com probabilidade 0,9.
(c) Qual ao menor valor de n necessrio para que o erro relativo no exceda 5% com
probabilidade 0,9?
Obs.:
Neste problema voc pode trabalhar como se a populao da cidade fosse infinita.

Soluo:
Sabemos que 0,5

= , onde e so, respectivamente, a mdia e o desvio padro


populacionais do consumo familiar mensal em alimentao.
Usando a aproximao dada pelo Teorema Central do Limite, temos:

(
(
(

s =
(
(
(

=
(
(

n
Z P

n
n
X
P

X
P 1 .


Isso implica que

n
z
2

1
=

. (*)
(a) Substituindo em (*) os valores = 0,05 e n = 100, temos
1
5 , 0
100 05 , 0
2
1
= =

o
z , de onde se conclui que 68 , 0 1 = o .
Isso quer dizer que, se usarmos uma amostra com 100 famlias, h uma probabilidade
de 68% de que o erro relativo na estimativa do consumo mdio mensal em alimentao
seja inferior a 5%.
(b) A partir da relao (*) deduz-se que
n

1

=

. Por outro lado:
- 90 , 0 1 = o implica que 64 , 1
2
1
=

o
z .
- n = 100 e 0,5

=
Logo 082 , 0
100
5 , 0 64 , 1
=

= c ou 8,2%.
Novamente com uma amostra de 100 famlias, h uma probabilidade de 90% de que o
erro relativo na estimativa do consumo mdio mensal em alimentao seja inferior a
8,2%.
(c) A partir da relao (*) obtemos tambm
2
2 2
2

z
n
|
.
|

\
|
|
.
|

\
|
=

.
Substituindo nessa expresso 64 , 1
2
1
=

o
z e = 0,05, obtemos 269
05 , 0
5 , 0 64 , 1
n
2
2 2
~

=
Logo, para que, com 90% de chance, o erro relativo de estimao seja menor que 5%,
temos que usar uma amostra com 269 famlias.


R8.3) Estabelecimentos hoteleiros nos municpios do Estado do Rio de
Janeiro
Queremos estimar o nmero mdio de estabelecimentos hoteleiros por municpio do
Estado do Rio de Janeiro no ano de 2001, com base em uma amostra composta por 20
municpios.
Dois esquemas alternativos de amostragem devem ser comparados:
Esquema A:
Extrair da populao de N = 98 municpios do Estado do RJ uma amostra aleatria com
n = 20 municpios e estimar pela mdia amostral do nmero de estabelecimentos
hoteleiros referente a esses 20 municpios. Ento


Esquema B:
Aqui usaremos: o subscrito 1 para referncia sub-populao dos N
1
= 93 menores
municpios do estado; e o subscrito 2 para referncia sub-populao dos N
2
= 5
maiores municpios do estado (a julgar pela sua vocao hoteleira): Itatiaia, Bzios,
Parati, Angra dos Reis e Rio de Janeiro.
(a) Extrair uma amostra aleatria com n
1
= 15 municpios entre os N
1
= 93 menores
municpios do estado e estimar a mdia populacional
1
pela mdia amostral

do
nmero de estabelecimentos hoteleiros referente a esses 15 municpios.


(b) Apurar o nmero de estabelecimentos hoteleiros em cada um dos N
2
= 5 maiores
municpios do estado. Calcular a mdia populacional
2
do nmero de
estabelecimentos hoteleiros nesses 5 municpios. Neste caso obviamente no h erro
de estimao.
(c) Estimar a partir dos resultados em (a) e (b), usando como estimador

.
Sabe-se que:
- A distribuio de freqncias do n
o
de hotis nos 93 menores municpios em 2001
era:
Nmero de hotis Municpios
0 e 20 71
20 e 40 13
40 e 60 5
60 e 80 1
80 e 100 3
Total 93

- O nmero de hotis em cada um dos 5 maiores municpios em 2001 era o seguinte:
Itatiaia 121
Armao dos Bzios 149
Angra dos Reis 160
Paraty 149
Rio de Janeiro 397

Qual dos dois esquemas amostrais o mais preciso? Por que?

Soluo:
Com base na tabela de freqncias aqui apresentada podemos obter aproximaes
grosseiras para os parmetros a seguir:
A mdia do nmero de hotis entre os 93 menores municpios



A varincia do nmero de hotis entre os 93 menores municpios



A mdia do nmero de hotis entre os 5 maiores municpios



A varincia do nmero de hotis entre os 5 maiores municpios


A mdia do nmero de hotis entre todos os 98 municpios



A varincia do nmero de hotis entre todos os 98 municpios




Como ambos os estimadores

so no tendenciosos (Por que?), para compar-los


em termos de preciso, basta calcularmos suas varincias.
Var(

) =
2


Por outro lado,


Conclumos, portanto, que o Esquema B mais preciso que o Esquema A. Isto ocorre
porque a variabilidade do nmero de estabelecimentos hoteleiros muito grande entre
os 5 maiores municpios do estado (Veja o valor de

). Assim, no Esquema B, ao
obrigar que todos esses 5 municpios estejam presentes entre os 20 considerados,
eliminamos do nosso processo de estimao uma fonte expressiva de variabilidade, o
que representa um ganho em termos de preciso.


R8.4) Propores de casais com filhos gmeos e com 2 ou mais filhos
Em uma determinada cidade feita uma pesquisa demogrfica em que se deseja estimar
a proporo P
1
de casais com filhos gmeos e a proporo P
2
de casais com 2 ou mais
filhos. Acredita-se, com base em levantamentos anteriores, que 1%P
1
5% e
35%P
2
60%. Dimensione uma amostra aleatria simples que permita estimar
simultaneamente P
1
e P
2
. As exigncias em termos de preciso so de que:
- no caso de P
1
, com probabilidade 0,95, o erro absoluto de estimao seja menor que
0,006, e,
- no caso de P
2
, tambm com probabilidade 0,95, o erro absoluto de estimao seja
menor que 0,010.
Obs.: Para simplificar a soluo, a populao de casais dessa cidade ser tratada como
se fosse infinita.

Soluo:
Para resolver esse exerccio, lembremo-nos do comportamento do produto p(1p), como
funo de p: ele igual a 0 para p = 0, cresce at atingir 0,25 quando p = 0,5, e depois
decresce novamente voltando a 0 quando p = 1.
No intervalo de variao correspondente a P
1
, a saber, entre 1% e 5%, essa funo
crescente. Por isso, se na expresso
) P 1 ( P
006 , 0
96 , 1
n
1 1
2
1
|
.
|

\
|
= ,
substituirmos P
1
por 0,05, aquele entre os seus valores possveis que est mais prximo
de 0,5, obteremos o tamanho de amostra de 5069 casais, que garante o nvel de preciso
especificado acima, para qualquer valor de P
1
entre 1% e 5%.
No intervalo de variao correspondente a P
2
, a saber, entre 35% e 60%, essa funo
crescente at 50% quando atinge seu valor mximo e depois decresce. Por isso, se
substituirmos o valor P
2
= 0,50 na expresso
) P 1 ( P
01 , 0
96 , 1
n
2 2
2
2
|
.
|

\
|
= , obteremos o tamanho de amostra de 9604 casais,
que garante o nvel de preciso especificado acima, para qualquer valor de P
2
entre 35%
e 60%.


Comparando os valores de n
1
e n
2
, vemos que o tamanho de amostra de 9604 casais
aquele que nos permite garantir o nvel de preciso desejado em ambos os casos.


R8.5) Os EMVs de a e b, no caso da Distribuio Uniforme[a,b]
Seja X
1
, X
2
,...,X
n
uma amostra aleatria simples da distribuio Uniforme no
intervalo [a,b], onde a e b so constantes desconhecidas, tais que a < b.
Considere as v.a.s:
X
min
= min(X
1
, X
2
,...,X
n
) e X
max
= max(X
1
, X
2
,...,X
n
).
Verifique que a = X
min
e b

= X
max
so os estimadores de mxima verossimilhana
dos parmetros a (limite mnimo) e b (limite mximo), respectivamente. E que,
portanto,
min max
X X

= e
2
X X

max min
+
=
so tambm os estimadores de mxima verossimilhana dos parmetros
= b a (amplitude de variao) e = (a + b) / 2 (valor central), respectivamente.

Soluo:
J que a densidade de X
i

, para cada i, a funo de


verossimilhana pode ser escrita como
L(a,b) =

.
Nota: Observe que, na expresso acima,


claro que o quociente

atinge o seu mximo quando o denominador o


maior possvel e isto ocorre para a =

e b =

. Logo, esses so os
valores de a e b que maximizam a funo de verossimilhana L.
Ou seja,

so os estimadores de mxima verossimilhana de


a e b, respectivamente.
Conseqentemente, com base na propriedade de invarincia dos estimadores de
mxima verossimilhana, podemos concluir que

e
2
X X

max min
+
=
so tambm estimadores de mxima verossimilhana de e , respectivamente.

Exemplificando: No caso de uma amostra com n = 5 observaes: 8, 9, 10, 11, 12 ,
teramos

= 12. O grfico da funo de verossimilhana seria ento


o seguinte:



Vemos que a funo de verossimilhana L(.,.):
- igual a

dentro do quadrante definido pelas desigualdades simultneas a


e b
- nula quando o ponto (a,b) est fora desse quadrante.



R8.6) Distribuio Uniforme[a,b] Propriedades dos estimadores (*)
No Exerccio anterior vimos que, dada uma amostra aleatria X
1
, X
2
,...,X
n
da distribuio
Uniforme no intervalo [a,b], = X
min
e

= X
max
so os estimadores de mxima
verossimilhana dos parmetros a (limite mnimo) e b (limite mximo), respectivamente.
Ento, considerando cada um desses 4 parmetros (a, b, e ) e seus respectivos estimadores
( a , b

e ), o propsito aqui responder s seguintes perguntas:


(a) O estimador no tendencioso?
(b) Qual o seu vis?
(c) Qual a sua varincia?
(d) Qual o seu erro quadrtico mdio?
possvel mostrar que as respostas so as seguintes:
Estimador tend.? Vis Varincia EQM
a No



No


No



Sim 0





Note que, para grandes amostras, todos esses so bons estimadores, no sentido de que seus erros
quadrticos mdios tendem a zero quando n cresce indefinidamente.
Esboce as linhas gerais dessas demonstraes.

Sugesto: Para determinar as funes de distribuio acumuladas de X
min
e de X
max
, lembre-se
que
P(X
max
x) = P(X
i
x, para todo i) e P(X
min
x) = P(X
i
x, para todo i).
Por outro lado, para determinar a funo de distribuio acumulada conjunta de X
min
e de X
max
,
verifique que:
P(X
min
x, X
max
y) = P(X
max
y) P(X
max
y,X
min
>x).

Soluo:
Consideraremos em mais detalhe somente a estimao do parmetro b atravs de
b

= X
max
. Se G a funo de distribuio acumulada de

, ento:
G(x) = P(X
max
x) = P(X
i
x, para todo i) =

, se a x b,
(sendo G(x) = 0, se x < a e G(x) = 1, se x > b).
Conseqentemente, se g a funo densidade de

,
g(x) =

, se a x b,
(sendo g(x) = 0, se x < a ou se x > b).
Da,


Fazendo a mudana de varivel x = a + (ba) u, obtemos

. Logo,


(porque

).
Isso significa que

um estimador tendencioso de b e seu vis B(

) =

.
Sabemos tambm que Var(

) =

. Mas,


Fazendo novamente a mudana de varivel x = a + (ba) u, obtemos



(porque, alm das duas integrais acima,

).
Var(

) =


Finalmente, EQM(

) = Var(

) +





De maneira anloga, podemos provar que:
- um estimador tendencioso de a
- B() =


- Var() =


- EQM() =


Para faz-lo muitas vezes til usarmos as propriedades das funes Gama e Beta.

Quanto estimao dos parmetros e , o nico detalhe que vale a pena abordarmos,
j que ele foge ao padro do raciocnio usado at aqui, o seguinte: Para determinar as
varincias de

e , precisamos tambm obter uma expresso para Cov(

). Esta, por
sua vez, decorre da funo de distribuio acumulada conjunta (.,.) de

:
(x,y) = P(X
min
x, X
max
y) = P(X
max
y) P(X
max
y,X
min
>x) =


a partir da qual se obtem a densidade conjunta (.,.) de

:
(x,y) =

(x,y) =


Da vem Cov(

) =


Minha mente se rebela diante da estagnao.
Dem-me problemas, dem-me trabalho, dem-
me o criptograma mais abstruso, ou a anlise
mais complicada, e eu estarei no meu prprio
ambiente. Mas eu abomino a rotina montona
da existncia. Eu imploro pela exaltao
mental.
Arthur Conan Doyle, escritor


R8.7) Simulando a estimao dos parmetros da Distribuio Uniforme
Gere, por simulao, m = 100 amostras independentes da distribuio Uniforme no
intervalo [a,b], sendo a = 8 e b = 17, cada uma delas contendo n = 20 observaes.
(a) Para cada uma dessas m=100 amostras, obtenha as respectivas estimativas de a e b.
(b) Faa histogramas para e

, usando as 100 estimativas obtidas de cada um dos


parmetros a e b.
(c) Use as 100 estimativas de a para estimar o valor esperado, o vis, a varincia e o
erro quadrtico mdio de . Faa o mesmo para

.
(d) As concluses obtidas confirmam o que os resultados tericos do Exerccio anterior
nos levariam a esperar?
Soluo:
Cada uma dessas 100 amostras um conjunto: x
1
, x
2
, ..., x
20
, onde x
i
= (1u
i
) a + u
i
b, (*)
sendo as u
i
s 20 observaes geradas a partir da U[0;1].
(a) Para cada uma dessas amostras, = min x
i
e

= max x
i
.

Temos ento:
-
100 observaes de :
1

2
...
100
-
100 observaes de

2
...

100



(b) Usemos as 100 observaes de para fazer um histograma de e
as 100 observaes de

para fazer um histograma de

.


(c) A estimativa de E(

= 8,34.
A estimativa de B( E( a = E( 8= 0,34.
A estimativa de Var(

= 0,1124.

A estimativa de EQM( Var( + (B(
2
= 0,2279
Analogamente para

:
E(

16,56
B(

0,44
Var(

0,1816
EQM(

) 0,3783

(d) Calculando essas mesmas medidas atravs das expresses que foram demonstradas no
Exerccio anterior, obtemos:

= 0,4286
Var(

= 0,1670
EQM(

= 0,3506

= 0,4286
Var(

= 0,1670

= 0,3506
Comparando os resultados obtidos por simulao com os seus correspondentes valores
tericos, vemos que h uma coerncia razovel entre eles.

R8.8) Movimento de partculas - Estimao de Densidade (*)
Seja X
1
,...,X
n
uma amostra aleatria de um modelo probabilstico com densidade f,
que descreve o movimento de partculas de determinado tipo. Suponhamos que a
forma analtica dessa funo f desconhecida. Estamos, portanto, diante de um
problema no paramtrico. Dado um nmero real x, o estimador de Rosenblat do
valor f(x) dessa funo de densidade f no ponto x

, (I)
onde > 0 uma constante a ser especificada.
Mostre que, medida que decresce para zero:
a) o vis de estimao de

tambm decresce para zero.


b) a varincia de

cresce indefinidamente.
c) possvel concluir de (a) e (b) que existe um timo em termos da
minimizao do erro quadrtico mdio de

?
Esclarecimento: Observe que na expresso acima foi usado um smbolo do tipo
I
A
(x) para representar o valor da funo indicador de A no ponto x, ou seja,


Sendo assim, o somatrio acima corresponde simplesmente ao nmero de
observaes X
i
pertencentes ao intervalo

.

Soluo:
(a) A partir da expresso (I), que define o estimador

, podemos deduzir que

.
Por outro lado, a v.a.

tem distribuio de Bernoulli(p), onde


p =

, e da decorre que

.
Portanto,

,
onde F a FDA comum s X
i
s.

Mas sabemos tambm que

.
Conseqentemente,

, cqd.
(b)

.

Aplicando propriedades da varincia, obtemos:




Por outro lado, como a v.a.

tem distribuio de Bernoulli(p),


onde p =

, temos

.
Ento,


Ora, medida que tende a zero,

, o que
acarreta que

.
(c) O item (a) sugere que medida que cresce, o vis do estimador tambm cresce.
Por outro lado, o item (b) sugere que medida que cresce, a varincia do
estimador decresce. Portanto, os dois itens em conjunto nos levam a crer que deve
existir um valor timo para , se o nosso objetivo for minimizar o erro quadrtico
mdio de

.




Exerccios propostos

P8.1) Estimando a populao de uma rea
Uma amostra aleatria de 30 famlias foi selecionada de uma populao de 14361
famlias residentes em uma determinada rea urbana. O nmero de pessoas em cada
famlia da amostra :
4 2 6 4 3 2 3 6 4 5 5 2 3 4 5 1 2 5 4 3 2 3 2 5 4 2 1 5 2 5
Estimar o nmero total de pessoas na rea e calcular a probabilidade de que essa
estimativa esteja a 20% do valor correto.

P8.2) Tenso de ruptura de implantes mamrios
Considere novamente os dados do exerccio P7.4 relativos tenso de ruptura de
implantes mamrios fabricados com gel de Silicone:
72,2 80,1 70,4 67,8 70,9 72,1 75,1 73,0 59,4 77,2
65,1 66,5 64,1 79,0 70,6 70,3 63,1 64,4 74,9 75,3
Admitindo que essa varivel segue uma distribuio Normal:
(a) Qual a probabilidade de que o erro absoluto cometido na estimao da sua mdia
populacional com base nessa amostra seja inferior a 2 unidades?
(b) Qual deveria ser o tamanho de uma nova amostra para que o coeficiente de
variao do estimador de fosse menor que 1%?



P8.3) Dimensionamento de amostra para estimao da mdia populacional
Usando os mesmos dados do exerccio P7.15, isto ,
9,5 11,4 7,2 10,0 9,4 8,2 6,4 10,9 7,6 9,5 10,7 9,9 8,8 8,6 9,9
porm admitindo que a mdia populacional desconhecida, dimensione uma nova
amostra dessa populao que nos permita estimar de forma que o erro absoluto de
estimao seja menor que 0,5 com probabilidade 98%:
(a) Se o desvio padro populacional conhecido e igual a 2;
(b) Se desconhecido.
P8.4) Algoritmo para seleo de uma amostra aleatria de tamanho fixo
No Exerccio Resolvido R6.5 foi apresentado um algoritmo para a seleo de uma
amostra aleatria com n elementos de uma populao de tamanho N. Porm esse
algoritmo s nos permite garantir que, se N for grande, o tamanho da amostra resultante
ser aproximadamente o n desejado. O fluxograma a seguir se refere a um novo
algoritmo para selecionar, de uma populao de tamanho N, uma amostra aleatria com
exatamente n elementos. Para isso ser utilizado um gerador de nmeros aleatrios que
permite simular uma seqncia de sorteios independentes a partir da distribuio
uniforme no intervalo [0;1].
Obs.: Note que neste algoritmo i representa um contador dos registros da populao,
enquanto que s representa um contador dos registros selecionados para fazer parte da
amostra.

Considere o caso particular em que N = 5 e n = 2.
Mostre que, ao utilizarmos um tal algoritmo, podemos garantir que:
a. Todos os elementos da populao tem a mesma chance n/N de serem
selecionados para serem includos na amostra.
b. A amostra resultante ter obrigatoriamente n elementos.


Obs.: Na realidade essas duas propriedades so vlidas para quaisquer inteiros positivos
N e n, desde que 1 n N.

Tradicionalmente, a amostra
sempre melhor do que o estoque que
voc entrega para a loja.
Calvin Klein, estilista


P8.5) Abaixo assinado
Um abaixo assinado feito em uma determinada municipalidade para pedir autoridade
competente que seja realizada uma grande obra de interesse pblico. As assinaturas foram
coletadas em 600 folhas. Para obter uma estimativa rpida do nmero total de assinaturas
coletadas, foram contadas as assinaturas que constam em 25 folhas escolhidas ao acaso, tendo-
se obtido valores x
1
, x
2
, ... , x
25
tais que

= 728 x
i
e

= 27185 x
2
i

Use os resultados obtidos a partir dessa primeira amostragem para dimensionar uma outra
amostra aleatria que permita estimar o nmero total de assinaturas com um erro menor que
1000 com probabilidade 95%.


P8.6) Custos de amostragem
Queremos estimar a mdia populacional de uma determinada varivel atravs da sua mdia
amostral A deciso a ser tomada quanto ao tamanho n da amostra implica em minimizar o
custo total de amostragem, que igual soma de duas parcelas:
- O custo da coleta de dados: a + bn
- O custo devido falta de preciso na estimao: c.E


onde a, b e c so constantes positivas.
(a) Expresse o tamanho timo da amostra em funo das constantes a, b e c e do desvio padro
populacional .
(b) Calcule o valor do n timo no caso em que:
A varivel x um peso, medido em gramas
a = R$500,00 o custo fixo da amostragem
b = R$20,00 o custo por unidade amostrada
c = R$50,00/g o custo da impreciso na estimao de
= 800g o desvio padro populacional de X.
Obs.: Para podermos usar as ferramentas do Clculo Diferencial, aqui o tamanho n da
amostra dever ser tratado como se pudesse assumir qualquer valor real, desde que positivo.
(c) Usando os valores de a, b, c e do item (b), construa um grfico onde:
- no eixo horizontal estar o tamanho n da amostra
- no eixo vertical estaro os custos (em reais)
- o custo da coleta de dados como funo de n ser representado por uma curva
- o custo devido impreciso como funo de n ser representado por outra curva
- o custo total como funo de n ser representado por uma terceira curva
- possamos ver que o custo total mnimo para n igual ao n timo calculado
Obs.: Aqui voc pode supor que a amostra suficientemente grande para que seja aplicvel o
Teorema Central do Limite.







P8.7) Por que S um estimador tendencioso de ?
Na teoria deste captulo, foi feita afirmao de que o desvio padro amostral


um estimador tendencioso do desvio padro populacional .
(a) Por que isso verdade?
(b) possvel afirmar que o vis B(S) sempre negativo? Ou que ele sempre
positivo? Por que?
Sugesto:
Lembre-se que 0 Var(S) = E(S
2
)

e que S
2
um estimador no tendencioso
de
2
.

P8.8) Preenchendo lacunas
Complete as lacunas na frase a seguir para que a afirmao fique correta, usando
somente uma vez cada um dos seguintes termos: amostra, populao, mdia,
varincia, varivel e raiz quadrada.
No processo de obteno de uma amostra aleatria de determinada
................................, o coeficiente de variao na ................................ da mdia da
amostra igual ao quociente entre a raiz quadrada da mdia na populao da
................................ da amostra e o produto da ................................ do tamanho da
amostra pela ................................ na populao da mdia da ................................

P8.9) Lasers semicondutores
Lasers semicondutores usados em produtos ticos de gravao prestam-se tanto para
operaes de leitura como para operaes de escrita. Estas ltimas requerem nveis mais
altos de potncia, o que tende a reduzir a vida til do laser. Quando a finalidade
principal realizar cpias de discos magnticos de alta velocidade, o laser,
fundamentalmente, escreve. Por outro lado, quando a finalidade principal
armazenagem, o laser gasta aproximadamente a mesma quantidade de tempo na leitura
e na escrita. Preocupado com a questo da durabilidade da sua produo, um fabricante
de lasers deseja realizar uma pesquisa por amostragem junto sua clientela, para
estimar a proporo p dos seus produtos que so usados para realizar cpias.
(a) Se a inteno estimar p com um erro absoluto inferior a 0,05 com
probabilidade 95%, qual deve ser o tamanho da amostra?
(b) Sob as mesmas condies do item (a), calcule o tamanho da amostra a ser
utilizada, se o fabricante sabe que 0,15 s p s 0,30.

P8.10) Ser que a amostra de empresas representativa?
Visando conduzir uma pesquisa sobre o setor empresarial de determinado pas, foi
extrada uma amostra aleatria com n = 1000 empresas, a partir de um cadastro onde
constam todas as empresas ali sediadas. Para que essa amostra possa ser considerada
representativa, os diversos segmentos do setor empresarial, enumerados a seguir, devem
estar presentes na amostra aproximadamente nas mesmas propores em que eles esto
presentes no universo. Sabe-se que, na populao de todas as empresas do pas,
Quanto ao setor de atividade econmica:
- 25% delas dedicam-se principalmente ao ramo industrial;
- 45% delas dedicam-se principalmente ao ramo comercial;
- 30% delas dedicam-se principalmente ao ramo de servios;


Quanto origem do seu capital:
- 20% so empresas pblicas;
- 50% so empresas privadas nacionais;
- 30% so empresas multinacionais;
Quanto ao tamanho da empresa:
- 10% so de grande porte;
- 30% so de mdio porte;
- 60% so de pequeno porte.
(a) Mostre que, para cada um dos 9 segmentos acima, se a constante p
j
a proporo de
empresas do segmento j na populao e a varivel aleatria
j
p a proporo de
empresas desse segmento na amostra, ento
j j
p ) p E( = e
n
) p (1 p
) p Var(
j j
j

= .
(b) Para cada j, j = 1,2,...,9, determine um intervalo I
j
= (p
j

j
; p
j
+
j
) tal que
P[
j
p
e I
j
] = 0,95.
(c) Calcule CV
max
, o maior de todos os coeficientes de variao dos
j
p , ou seja,
CV
max
= max
1j9

) p E(
) p DP(
j
j
.

Obs.: Intuitivamente, podemos dizer que, quanto mais prximo
j
p estiver de p
j
para
todo j, maior ser a representatividade da amostra. Isso exatamente o que acontece
quanto menores forem as amplitudes dos intervalos I
j
s e quanto menor for CV
max
.

Sugesto: Cada
j
p pode ser expresso como o quociente entre uma binomial
(aproximadamente, uma Normal) e o tamanho da amostra.

P8.11) Dimensionamento de amostra para estimao simultnea de parmetros
Em um determinado pas h um total de 5 milhes de empresas. Atravs de um processo
de amostragem deseja-se estimar simultaneamente o nmero total de empregados dessas
empresas (com um erro absoluto menor que 3 x 10
6
) e a proporo dessas empresas que
tiveram prejuzo financeiro no ano anterior (com um erro relativo menor que 10%),
sendo que em ambos os casos o erro mximo acima especificado no deve ser
ultrapassado com probabilidade 0,99. A partir de estimativas anteriores sabe-se que o
nmero mdio de empregados da ordem de 30 e o coeficiente de variao dessa
varivel (nmero de empregados por empresa) da ordem de 1,6. Alm disso, sabe-se
que a proporo de empresas que tiveram prejuzo no ano anterior est entre 2% e 8%.
Dimensione uma amostra aleatria simples que satisfaa simultaneamente ambas as
especificaes de preciso acima.

P8.12) Estimao de covarincia
Mostre que se (X
1
, Y
1
), ..., (X
n
,Y
n
) so n vetores aleatrios bivariados tais que

=
=
contrrio caso 0,
j i se C,
)
j
Y ,
i
Cov(X
ento
( )( )
=

n
1 i
Y
i
Y X
i
X
1 n
1
um estimador no tendencioso de C, ou seja, a
covarincia amostral um estimador no tendencioso da covarincia populacional.



P8.13) Proporo de peas no conformes de uma linha de produo
Admita que p a proporo de peas no conformes de uma linha de produo, isto ,
peas que no atendem s especificaes fornecidas pelo fabricante. Queremos estimar
o parmetro p com base em uma amostra aleatria de n peas dessa linha de produo.
Temos ento n v.a.s iid X
1
, X
2
, ..., X
n
que seguem uma lei de probabilidade de
Bernoulli(p).
(a) Obtenha o estimador de mxima verossimilhana de p.
Sugesto: Para isso, note que P(X
i
= x) = p
x
(1 p)
1 x
, onde x = 0 ou x = 1,
para todo i. Em seguida, monte a funo de verossimilhana e maximize o seu
logaritmo neperiano.
(b) Verifique que, entre os estimadores no tendenciosos e lineares de p (ou seja,
estimadores da forma

, onde os c
i
so constantes a determinar), o
estimador de mxima verossimilhana obtido no item (a) aquele que possui a
menor varincia.
Sugesto: Use multiplicadores de Lagrange.

P8.14) Inundaes em um rio
(a) Mostre que se X
1
, X
2
,...,X
n
uma amostra aleatria do modelo de Laplace com
parmetros m e T (onde T > 0), definido pela densidade

, para todo x real,


os EMVs de m e T so = mediana(X
1
,X
2
,...,X
n
) e

.
Sugesto: Faa um grfico da funo de verossimilhana.
(b) Em seu artigo Interval Estimation for the two-parameter double exponential
distribution, Technometrics, 1973, Bain e Englehart reportam o seguinte conjunto
de dados sobre diferenas nos nveis de inundao entre estaes em um rio:
1,96 1,97 3,6 3,8 4,79 5,66 5,76 5,78 6,27 6,3 6,76
7,65 7,84 7,99 8,51 9,18 10,13 10,24 10,25 10,43 11,45 11,48
11,75 11,81 12,34 12,78 13,06 13,29 13,98 14,18 14,4 16,22 17,06
Admitindo que o modelo de Laplace descreve adequadamente este fenmeno,
obtenha, a partir dos dados, as estimativas de mxima verossimilhana para m e T.

P8.15) Molculas em movimento segundo a distribuio de Maxwell
Conforme foi visto no Exerccio R3.5, a densidade da velocidade absoluta de uma
molcula dada pela distribuio de Maxwell

, para x > 0 e f(x) = 0, para x 0,


sendo uma constante. Se as v.a.s iid X
1
, , X
n
tem distribuio de Maxwell, obtenha
o estimador de mxima verossimilhana do parmetro .

P8.16) Pesos de recm-nascidos
Use como a sua populao de interesse, os pesos em kg de N = 5 recm-nascidos:
2,3 2,5 3,0 3,5 4,0.
(a) Calcule a mdia e a varincia
2
populacionais.
(b) Obtenha todas as 10 possveis amostras de tamanho n = 2.
(c) Calcule a mdia amostral x para cada uma delas.
(d) Use esses valores para confirmar a validade das expresses ) x E( = e
|
.
|

\
|
=
N
1
n
1
) x Var(
2
neste caso.



P8.17) Comparando estimadores em termos de preciso
Considere novamente o modelo Uniforme no intervalo [a,b], onde a e b so parmetros
desconhecidos, sendo a < b. Vimos no Exerccio Resolvido R8.5 que, se X
1
, ..., X
n

uma amostra aleatria desse modelo, ento


um estimador da mdia populacional

. Por outro lado, sabemos que a mdia


amostral

tambm um estimador de .
(a) Expresse o erro quadrtico mdio (EQM) de

como estimador de , em funo


dos parmetros a e b, e do tamanho n da amostra.
(b) Para que valores de n,

um estimador mais preciso do que

em termos de
erro quadrtico mdio? Por que?


P8.18) Filtros passa-faixa
Os filtros passa-faixa (band-pass filters) so utilizados em diversos tipos de aplicaes
que envolvem a seleo de sinais de determinadas freqncias. Alguns exemplos
seriam:
- o reconhecimento de um sinal de uma nica freqncia, em um sistema de
controle remoto;
- a seleo de uma faixa completa de sinais, em um sistema de telefonia ou de
telecomunicaes.
O filtro passa-faixa transmite a faixa de freqncias para a qual foi projetado,
bloqueando sinais de freqncias inferiores e superiores aos limites dessa faixa.
Suponha que, para um determinado filtro passa-faixa, no sabemos exatamente como
ele funciona. Ou seja, esse filtro como uma caixa preta que s deixa passar sinais de
determinadas freqncias, mas gostaramos de obter um modelo probabilstico que
descrevesse o seu comportamento.
Para isso foi obtida uma amostra com n=100 sinais que esse filtro deixou passar. Suas
freqncias (em kHz) foram as seguintes:

9866 10223 9713 9926 9567 10441 9971 9730 10463 10276
10164 10423 10122 10252 10062 9862 9821 9843 10335 10444
9693 10423 9731 10271 10140 9604 9551 9977 9775 9616
10054 9772 9743 10187 10331 10273 9707 9574 9979 9784
10368 9974 9692 10014 10041 9734 10170 10492 10283 10398
10382 9658 10324 10177 9986 10421 9992 10209 9680 9864
10223 9615 9544 10315 9520 9689 9722 9694 10444 10128
10255 10419 9693 9926 10331 10108 10338 9805 10055 10280
9915 10335 9911 9656 9851 10022 10316 9586 10009 10421
10082 9808 10023 10086 9674 9858 9525 9548 9623 10168

(a) Use esses dados para obter um histograma da varivel freqncia do sinal, no
qual as classes a serem consideradas so: [9500 9700), [9700 9900),
[9900 10100), [10100; 10300), [10300 10500). A partir da anlise do
aspecto visual da figura, que modelo probabilstico lhe parece ser o mais
adequado? Por que?


(b) Que procedimento seria o mais indicado para estimar os parmetros desse
modelo?
(c) Quais seriam as suas estimativas dos parmetros desse modelo a partir dos dados
disponveis?
(d) Que concluses podem ser extradas dessa anlise e quo confiveis elas lhe
parecem ser? Por que?
Sugesto: Verifique se entre os assuntos abordados nos exerccios resolvidos deste
captulo voc capaz de encontrar subsdios para ajud-lo a raciocinar neste caso.

Anda mungkin juga menyukai