Anda di halaman 1dari 19

CAPTULO 8

Exerccios Resolvidos

R8.1) Controle de Qualidade

Tem o selo do Inmetro?

Um fabricante de equipamentos eletrnicos vende resistores, em lotes de 500 unidades,


ao preo de 1500,00 u.m. o lote. O valor nominal da resistncia eltrica desses
componentes de 47 k e o seu custo de fabricao de 2,00 u.m. a unidade. Admita
que o valor da resistncia eltrica de um tal resistor na verdade se comporta como uma
varivel aleatria com mdia e desvio padro 1 k. Ocorre que os compradores
exigem que, antes de fechado um negcio, seja extrada do lote uma amostra aleatria
simples com n resistores, cujas resistncias eltricas x1, x2, x3, ..., xn so medidas, e a
venda s se concretiza se
x 47 0,2 (em k).
Caso contrrio, o lote inutilizado.
(a) Que tamanho mnimo n da amostra o vendedor deve propor que seja utilizado, para
que o seu lucro esperado em cada lote seja de pelo menos 400,00 u.m., no caso de o seu
processo produtivo estar perfeitamente regulado, isto , = 47k ?
(b) Usando o valor de n calculado em (a), qual o lucro esperado do vendedor em cada
lote, se = 46,9 k (ou seja, se h uma pequena desregulagem no processo)?
(c) E se = 46,8k?

Soluo:
Lucro = Receita Despesa, sendo que
1500, se x 47 0,2
Receita e Despesa = 2 500 1000 .
0, caso contrrio
Ento

47,2 46,8
E(Lucro ) $1500 P46,8 x 47,2 $1000 1500 1000
1 1
n n

(a) Se = 47, para que E(Lucro) $400, devemos ter



1500 0,2 n 0,2 n 1000 400 .
Por outro lado, devido simetria da curva Normal, temos
(a ) 1 (a ) , ou seja, (a ) (a ) 2(a ) 1 .

Ento, 2 0,2 n 1 400 1000
1500
, o que implica que o tamanho n da amostra
deve ser de pelo menos
2
1 29
5 84 resistores.
30
(b) Se = 46,9 e n = 84, ento

47,2 46,9 46,8 46,9
E(Lucro ) 1500 1000 $225,98.
1 1
84 84
(c) Se = 46,8 e n = 84, ento

47,2 46,8 46,8 46,8
E(Lucro ) 1500 1000 $250,19.
1 1
84 84
Ou seja, neste caso o nvel da desregulagem j seria suficiente para gerar uma
expectativa de prejuzo.

R8.2) Gasto mensal das famlias com alimentao


Deseja-se estimar o gasto mensal mdio com alimentao das famlias de uma
determinada cidade. O procedimento proposto consiste em entrevistar n = 100 famlias
e adotar a mdia aritmtica X dos seus gastos mensais em alimentao como uma
estimativa do parmetro de interesse. Consultando estatsticas de perodos anteriores,
verifica-se que o coeficiente de variao do gasto familiar mensal em alimentao nessa
cidade tem oscilado pouco ao longo do tempo em torno de 0,5. Assim sendo aqui ele
ser considerado conhecido e igual a 0,5.
X
(a) Qual a probabilidade de que o erro relativo no exceda 5%?

(b) Calcule para que o erro relativo seja menor que com probabilidade 0,9.
(c) Qual ao menor valor de n necessrio para que o erro relativo no exceda 5% com
probabilidade 0,9?
Obs.:
Neste problema voc pode trabalhar como se a populao da cidade fosse infinita.

Soluo:
Sabemos que 0,5 , onde e so, respectivamente, a mdia e o desvio padro

populacionais do consumo familiar mensal em alimentao.
Usando a aproximao dada pelo Teorema Central do Limite, temos:
X X
n n
1 P P P Z .
n

n
Isso implica que z1 . (*)
2

(a) Substituindo em (*) os valores = 0,05 e n = 100, temos
0,05 100
z1 1 , de onde se conclui que 1 0,68 .
2 0,5
Isso quer dizer que, se usarmos uma amostra com 100 famlias, h uma probabilidade
de 68% de que o erro relativo na estimativa do consumo mdio mensal em alimentao
seja inferior a 5%.
z1

(b) A partir da relao (*) deduz-se que 2
. Por outro lado:
n
1 0,90 implica que z1 1,64 .
2

n = 100 e 0,5

1,64 0,5
Logo 0,082 ou 8,2%.
100
Novamente com uma amostra de 100 famlias, h uma probabilidade de 90% de que o
erro relativo na estimativa do consumo mdio mensal em alimentao seja inferior a
8,2%.
2 2
z
1 2
(c) A partir da relao (*) obtemos tambm n .
2
1,64 2 0,5 2
Substituindo nessa expresso z1 1,64 e = 0,05, obtemos n 269
2 0,05 2
Logo, para que, com 90% de chance, o erro relativo de estimao seja menor que 5%,
temos que usar uma amostra com 269 famlias.

R8.3) Estabelecimentos hoteleiros nos municpios do Estado do Rio de


Janeiro
Queremos estimar o nmero mdio de estabelecimentos hoteleiros por municpio do
Estado do Rio de Janeiro no ano de 2001, com base em uma amostra composta por 20
municpios.
Dois esquemas alternativos de amostragem devem ser comparados:
Esquema A:
Extrair da populao de N = 98 municpios do Estado do RJ uma amostra aleatria com
n = 20 municpios e estimar pela mdia amostral do nmero de estabelecimentos
hoteleiros referente a esses 20 municpios. Ento
Esquema B:
Aqui usaremos: o subscrito 1 para referncia sub-populao dos N1 = 93 menores
municpios do estado; e o subscrito 2 para referncia sub-populao dos N2 = 5
maiores municpios do estado (a julgar pela sua vocao hoteleira): Itatiaia, Bzios,
Parati, Angra dos Reis e Rio de Janeiro.
(a) Extrair uma amostra aleatria com n1 = 15 municpios entre os N1 = 93 menores
municpios do estado e estimar a mdia populacional 1 pela mdia amostral do
nmero de estabelecimentos hoteleiros referente a esses 15 municpios.
(b) Apurar o nmero de estabelecimentos hoteleiros em cada um dos N 2 = 5 maiores
municpios do estado. Calcular a mdia populacional 2 do nmero de
estabelecimentos hoteleiros nesses 5 municpios. Neste caso obviamente no h erro
de estimao.
(c) Estimar a partir dos resultados em (a) e (b), usando como estimador
.
Sabe-se que:
A distribuio de freqncias do no de hotis nos 93 menores municpios em 2001
era:
Nmero de hotis Municpios
0 e 20 71
20 e 40 13
40 e 60 5
60 e 80 1
80 e 100 3
Total 93

O nmero de hotis em cada um dos 5 maiores municpios em 2001 era o seguinte:


Itatiaia 121
Armao dos Bzios 149
Angra dos Reis 160
Paraty 149
Rio de Janeiro 397

Qual dos dois esquemas amostrais o mais preciso? Por que?

Soluo:
Com base na tabela de freqncias aqui apresentada podemos obter aproximaes
grosseiras para os parmetros a seguir:
A mdia do nmero de hotis entre os 93 menores municpios

A varincia do nmero de hotis entre os 93 menores municpios

A mdia do nmero de hotis entre os 5 maiores municpios

A varincia do nmero de hotis entre os 5 maiores municpios

A mdia do nmero de hotis entre todos os 98 municpios

A varincia do nmero de hotis entre todos os 98 municpios


2
Como ambos os estimadores e so no tendenciosos (Por que?), para compar-los
em termos de preciso, basta calcularmos suas varincias.
Var( ) = 2 =
Por outro lado,

Conclumos, portanto, que o Esquema B mais preciso que o Esquema A. Isto ocorre
porque a variabilidade do nmero de estabelecimentos hoteleiros muito grande entre
os 5 maiores municpios do estado (Veja o valor de ). Assim, no Esquema B, ao
obrigar que todos esses 5 municpios estejam presentes entre os 20 considerados,
eliminamos do nosso processo de estimao uma fonte expressiva de variabilidade, o
que representa um ganho em termos de preciso.

R8.4) Propores de casais com filhos gmeos e com 2 ou mais filhos


Em uma determinada cidade feita uma pesquisa demogrfica em que se deseja estimar
a proporo P1 de casais com filhos gmeos e a proporo P2 de casais com 2 ou mais
filhos. Acredita-se, com base em levantamentos anteriores, que 1% P1 5% e
35% P2 60%. Dimensione uma amostra aleatria simples que permita estimar
simultaneamente P1 e P2. As exigncias em termos de preciso so de que:
no caso de P1, com probabilidade 0,95, o erro absoluto de estimao seja menor que
0,006, e,
no caso de P2, tambm com probabilidade 0,95, o erro absoluto de estimao seja
menor que 0,010.
Obs.: Para simplificar a soluo, a populao de casais dessa cidade ser tratada como
se fosse infinita.

Soluo:
Para resolver esse exerccio, lembremo-nos do comportamento do produto p(1p), como
funo de p: ele igual a 0 para p = 0, cresce at atingir 0,25 quando p = 0,5, e depois
decresce novamente voltando a 0 quando p = 1.
No intervalo de variao correspondente a P1, a saber, entre 1% e 5%, essa funo
crescente. Por isso, se na expresso
2
1,96
n1 P1 (1 P1 ) ,
0,006
substituirmos P1 por 0,05, aquele entre os seus valores possveis que est mais prximo
de 0,5, obteremos o tamanho de amostra de 5069 casais, que garante o nvel de preciso
especificado acima, para qualquer valor de P1 entre 1% e 5%.
No intervalo de variao correspondente a P2, a saber, entre 35% e 60%, essa funo
crescente at 50% quando atinge seu valor mximo e depois decresce. Por isso, se
substituirmos o valor P2 = 0,50 na expresso
2
1,96
n2 P2 (1 P2 ) , obteremos o tamanho de amostra de 9604 casais,
0,01
que garante o nvel de preciso especificado acima, para qualquer valor de P2 entre 35%
e 60%.
Comparando os valores de n1 e n2, vemos que o tamanho de amostra de 9604 casais
aquele que nos permite garantir o nvel de preciso desejado em ambos os casos.

R8.5) Os EMVs de a e b, no caso da Distribuio Uniforme[a,b]


Seja X1, X2,...,Xn uma amostra aleatria simples da distribuio Uniforme no
intervalo [a,b], onde a e b so constantes desconhecidas, tais que a < b.
Considere as v.a.s:
Xmin = min(X1, X2,...,Xn) e Xmax = max(X1, X2,...,Xn).
Verifique que a = Xmin e b = Xmax so os estimadores de mxima verossimilhana
dos parmetros a (limite mnimo) e b (limite mximo), respectivamente. E que,
portanto,
X X max
X max X min e min
2
so tambm os estimadores de mxima verossimilhana dos parmetros
= b a (amplitude de variao) e = (a + b) / 2 (valor central), respectivamente.

Soluo:
J que a densidade de Xi , para cada i, a funo de
verossimilhana pode ser escrita como
L(a,b) = .

Nota: Observe que, na expresso acima,

claro que o quociente atinge o seu mximo quando o denominador o


maior possvel e isto ocorre para a = e b= . Logo, esses so os
valores de a e b que maximizam a funo de verossimilhana L.
Ou seja, e so os estimadores de mxima verossimilhana de
a e b, respectivamente.
Conseqentemente, com base na propriedade de invarincia dos estimadores de
mxima verossimilhana, podemos concluir que
X X max
e min
2
so tambm estimadores de mxima verossimilhana de e , respectivamente.

Exemplificando: No caso de uma amostra com n = 5 observaes: 8, 9, 10, 11, 12 ,


teramos = 12. O grfico da funo de verossimilhana seria ento
o seguinte:
Vemos que a funo de verossimilhana L(.,.):
igual a dentro do quadrante definido pelas desigualdades simultneas a
e b
nula quando o ponto (a,b) est fora desse quadrante.

R8.6) Distribuio Uniforme[a,b] Propriedades dos estimadores (*)


No Exerccio anterior vimos que, dada uma amostra aleatria X1, X2,...,Xn da distribuio
Uniforme no intervalo [a,b], = Xmin e = Xmax so os estimadores de mxima
verossimilhana dos parmetros a (limite mnimo) e b (limite mximo), respectivamente.
Ento, considerando cada um desses 4 parmetros (a, b, e ) e seus respectivos estimadores
( a , b , e ), o propsito aqui responder s seguintes perguntas:
(a) O estimador no tendencioso?
(b) Qual o seu vis?
(c) Qual a sua varincia?
(d) Qual o seu erro quadrtico mdio?
possvel mostrar que as respostas so as seguintes:
Estimador tend.? Vis Varincia EQM
a No

b No

No

Sim 0
Note que, para grandes amostras, todos esses so bons estimadores, no sentido de que seus erros
quadrticos mdios tendem a zero quando n cresce indefinidamente.
Esboce as linhas gerais dessas demonstraes.

Sugesto: Para determinar as funes de distribuio acumuladas de X min e de Xmax, lembre-se


que
P(Xmax x) = P(Xi x, para todo i) e P(Xmin x) = P(Xi x, para todo i).
Por outro lado, para determinar a funo de distribuio acumulada conjunta de X min e de Xmax,
verifique que:
P(Xmin x, Xmax y) = P(Xmax y) P(Xmax y,Xmin >x).

Soluo:
Consideraremos em mais detalhe somente a estimao do parmetro b atravs de
b = Xmax. Se G a funo de distribuio acumulada de , ento:
G(x) = P(Xmax x) = P(Xi x, para todo i) = , se a x b,
(sendo G(x) = 0, se x < a e G(x) = 1, se x > b).
Conseqentemente, se g a funo densidade de ,
g(x) = , se a x b,
(sendo g(x) = 0, se x < a ou se x > b).
Da,
Fazendo a mudana de varivel x = a + (ba) u, obtemos
. Logo,

(porque e ).
Isso significa que um estimador tendencioso de b e seu vis B( ) = .

Sabemos tambm que Var( ) = . Mas,

Fazendo novamente a mudana de varivel x = a + (ba) u, obtemos

(porque, alm das duas integrais acima, ).

Var( ) =

Finalmente, EQM( ) = Var( ) + = +


De maneira anloga, podemos provar que:
um estimador tendencioso de a
B( ) =

Var( ) =

EQM( ) =
Para faz-lo muitas vezes til usarmos as propriedades das funes Gama e Beta.

Quanto estimao dos parmetros e , o nico detalhe que vale a pena abordarmos,
j que ele foge ao padro do raciocnio usado at aqui, o seguinte: Para determinar as
varincias de e , precisamos tambm obter uma expresso para Cov( ). Esta, por
sua vez, decorre da funo de distribuio acumulada conjunta (.,.) de :
(x,y) = P(Xmin x, Xmax y) = P(Xmax y) P(Xmax y,Xmin >x) =
a partir da qual se obtem a densidade conjunta (.,.) de :
(x,y) = (x,y) = .

Da vem Cov( )= =

Minha mente se rebela diante da estagnao.


Dem-me problemas, dem-me trabalho, dem-
me o criptograma mais abstruso, ou a anlise
mais complicada, e eu estarei no meu prprio
ambiente. Mas eu abomino a rotina montona
da existncia. Eu imploro pela exaltao
mental.
Arthur Conan Doyle, escritor

R8.7) Simulando a estimao dos parmetros da Distribuio Uniforme


Gere, por simulao, m = 100 amostras independentes da distribuio Uniforme no
intervalo [a,b], sendo a = 8 e b = 17, cada uma delas contendo n = 20 observaes.
(a) Para cada uma dessas m=100 amostras, obtenha as respectivas estimativas de a e b.
(b) Faa histogramas para e , usando as 100 estimativas obtidas de cada um dos
parmetros a e b.
(c) Use as 100 estimativas de a para estimar o valor esperado, o vis, a varincia e o
erro quadrtico mdio de . Faa o mesmo para .
(d) As concluses obtidas confirmam o que os resultados tericos do Exerccio anterior
nos levariam a esperar?

Soluo:
Cada uma dessas 100 amostras um conjunto: x1, x2, ..., x20, onde xi = (1ui) a + ui b, (*)
sendo as uis 20 observaes geradas a partir da U[0;1].
(a) Para cada uma dessas amostras, = min xi e = max xi. Temos ento:
100 observaes de : 1 2 ... 100
100 observaes de : 1 2 ... 100
(b) Usemos as 100 observaes de para fazer um histograma de e
as 100 observaes de para fazer um histograma de .

(c) A estimativa de E( = 8,34.


A estimativa de B( E( a = E( 8= 0,34.

A estimativa de Var( = 0,1124.

2
A estimativa de EQM( Var( + (B( = 0,2279
Analogamente para :
E( 16,56
B( 0,44
Var( 0,1816
EQM( ) 0,3783

(d) Calculando essas mesmas medidas atravs das expresses que foram demonstradas no
Exerccio anterior, obtemos:
= 0,4286
Var( = 0,1670

EQM( = 0,3506
= 0,4286
Var( = 0,1670

= 0,3506
Comparando os resultados obtidos por simulao com os seus correspondentes valores
tericos, vemos que h uma coerncia razovel entre eles.

R8.8) Movimento de partculas - Estimao de Densidade (*)


Seja X1,...,Xn uma amostra aleatria de um modelo probabilstico com densidade f,
que descreve o movimento de partculas de determinado tipo. Suponhamos que a
forma analtica dessa funo f desconhecida. Estamos, portanto, diante de um
problema no paramtrico. Dado um nmero real x, o estimador de Rosenblat do
valor f(x) dessa funo de densidade f no ponto x
, (I)

onde > 0 uma constante a ser especificada.


Mostre que, medida que decresce para zero:
a) o vis de estimao de tambm decresce para zero.
b) a varincia de cresce indefinidamente.
c) possvel concluir de (a) e (b) que existe um timo em termos da
minimizao do erro quadrtico mdio de ?

Esclarecimento: Observe que na expresso acima foi usado um smbolo do tipo


IA(x) para representar o valor da funo indicador de A no ponto x, ou seja,

Sendo assim, o somatrio acima corresponde simplesmente ao nmero de


observaes Xi pertencentes ao intervalo .

Soluo:
(a) A partir da expresso (I), que define o estimador , podemos deduzir que
.
Por outro lado, a v.a. tem distribuio de Bernoulli(p), onde

p= , e da decorre que

Portanto,
. ,
onde F a FDA comum s Xis.

Mas sabemos tambm que .


Conseqentemente, , cqd.

(b) .

Aplicando propriedades da varincia, obtemos:


Por outro lado, como a v.a. tem distribuio de Bernoulli(p),

onde p = , temos

.
Ento,

Ora, medida que tende a zero, e , o que


acarreta que .
(c) O item (a) sugere que medida que cresce, o vis do estimador tambm cresce.
Por outro lado, o item (b) sugere que medida que cresce, a varincia do
estimador decresce. Portanto, os dois itens em conjunto nos levam a crer que deve
existir um valor timo para , se o nosso objetivo for minimizar o erro quadr tico
mdio de .

Exerccios propostos
P8.1) Estimando a populao de uma rea
Uma amostra aleatria de 30 famlias foi selecionada de uma populao de 14361
famlias residentes em uma determinada rea urbana. O nmero de pessoas em cada
famlia da amostra :
4 2 6 4 3 2 3 6 4 5 5 2 3 4 5 1 2 5 4 3 2 3 2 5 4 2 1 5 2 5
Estimar o nmero total de pessoas na rea e calcular a probabilidade de que essa
estimativa esteja a 20% do valor correto.

P8.2) Tenso de ruptura de implantes mamrios


Considere novamente os dados do exerccio P7.4 relativos tenso de ruptura de
implantes mamrios fabricados com gel de Silicone:
72,2 80,1 70,4 67,8 70,9 72,1 75,1 73,0 59,4 77,2
65,1 66,5 64,1 79,0 70,6 70,3 63,1 64,4 74,9 75,3
Admitindo que essa varivel segue uma distribuio Normal:
(a) Qual a probabilidade de que o erro absoluto cometido na estimao da sua mdia
populacional com base nessa amostra seja inferior a 2 unidades?
(b) Qual deveria ser o tamanho de uma nova amostra para que o coeficiente de
variao do estimador de fosse menor que 1%?
P8.3) Dimensionamento de amostra para estimao da mdia populacional
Usando os mesmos dados do exerccio P7.15, isto ,
9,5 11,4 7,2 10,0 9,4 8,2 6,4 10,9 7,6 9,5 10,7 9,9 8,8 8,6 9,9
porm admitindo que a mdia populacional desconhecida, dimensione uma nova
amostra dessa populao que nos permita estimar de forma que o erro absoluto de
estimao seja menor que 0,5 com probabilidade 98%:
(a) Se o desvio padro populacional conhecido e igual a 2;
(b) Se desconhecido.

P8.4) Algoritmo para seleo de uma amostra aleatria de tamanho fixo


No Exerccio Resolvido R6.5 foi apresentado um algoritmo para a seleo de uma
amostra aleatria com n elementos de uma populao de tamanho N. Porm esse
algoritmo s nos permite garantir que, se N for grande, o tamanho da amostra resultante
ser aproximadamente o n desejado. O fluxograma a seguir se refere a um novo
algoritmo para selecionar, de uma populao de tamanho N, uma amostra aleatria com
exatamente n elementos. Para isso ser utilizado um gerador de nmeros aleatrios que
permite simular uma seqncia de sorteios independentes a partir da distribuio
uniforme no intervalo [0;1].
Obs.: Note que neste algoritmo i representa um contador dos registros da populao,
enquanto que s representa um contador dos registros selecionados para fazer parte da
amostra.

Considere o caso particular em que N = 5 e n = 2.


Mostre que, ao utilizarmos um tal algoritmo, podemos garantir que:
a. Todos os elementos da populao tem a mesma chance n/N de serem
selecionados para serem includos na amostra.
b. A amostra resultante ter obrigatoriamente n elementos.
Obs.: Na realidade essas duas propriedades so vlidas para quaisquer inteiros positivos
N e n, desde que 1 n N.

Tradicionalmente, a amostra
sempre melhor do que o estoque que
voc entrega para a loja.
Calvin Klein, estilista

P8.5) Abaixo assinado


Um abaixo assinado feito em uma determinada municipalidade para pedir autoridade
competente que seja realizada uma grande obra de interesse pblico. As assinaturas foram
coletadas em 600 folhas. Para obter uma estimativa rpida do nmero total de assinaturas
coletadas, foram contadas as assinaturas que constam em 25 folhas escolhidas ao acaso, tendo-
se obtido valores x1, x2, ... , x25 tais que
x i 728 e x i2 27185
Use os resultados obtidos a partir dessa primeira amostragem para dimensionar uma outra
amostra aleatria que permita estimar o nmero total de assinaturas com um erro menor que
1000 com probabilidade 95%.

P8.6) Custos de amostragem


Queremos estimar a mdia populacional de uma determinada varivel atravs da sua mdia
amostral A deciso a ser tomada quanto ao tamanho n da amostra implica em minimizar o
custo total de amostragem, que igual soma de duas parcelas:
O custo da coleta de dados: a + bn
O custo devido falta de preciso na estimao: c.E
onde a, b e c so constantes positivas.
(a) Expresse o tamanho timo da amostra em funo das constantes a, b e c e do desvio padro
populacional .
(b) Calcule o valor do n timo no caso em que:
A varivel x um peso, medido em gramas
a = R$500,00 o custo fixo da amostragem
b = R$20,00 o custo por unidade amostrada
c = R$50,00/g o custo da impreciso na estimao de
= 800g o desvio padro populacional de X.
Obs.: Para podermos usar as ferramentas do Clculo Diferencial, aqui o tamanho n da
amostra dever ser tratado como se pudesse assumir qualquer valor real, desde que positivo.
(c) Usando os valores de a, b, c e do item (b), construa um gr fico onde:
no eixo horizontal estar o tamanho n da amostra
no eixo vertical estaro os custos (em reais)
o custo da coleta de dados como funo de n ser representado por uma curva
o custo devido impreciso como funo de n ser representado por outra curva
o custo total como funo de n ser representado por uma terceira curva
possamos ver que o custo total mnimo para n igual ao n timo calculado
Obs.: Aqui voc pode supor que a amostra suficientemente grande para que seja aplicvel o
Teorema Central do Limite.
P8.7) Por que S um estimador tendencioso de ?
Na teoria deste captulo, foi feita afirmao de que o desvio padro amostral

um estimador tendencioso do desvio padro populacional .


(a) Por que isso verdade?
(b) possvel afirmar que o vis B(S) sempre negativo? Ou que ele sempre
positivo? Por que?
Sugesto:
Lembre-se que 0 Var(S) = E(S2) e que S2 um estimador no tendencioso
de 2.

P8.8) Preenchendo lacunas


Complete as lacunas na frase a seguir para que a afirmao fique correta, usando
somente uma vez cada um dos seguintes termos: amostra, populao, mdia,
varincia, vari vel e raiz quadrada.
No processo de obteno de uma amostra aleatria de determinada
................................, o coeficiente de variao na ................................ da mdia da
amostra igual ao quociente entre a raiz quadrada da mdia na populao da
................................ da amostra e o produto da ................................ do tamanho da
amostra pela ................................ na populao da mdia da ................................

P8.9) Lasers semicondutores


Lasers semicondutores usados em produtos ticos de gravao prestam-se tanto para
operaes de leitura como para operaes de escrita. Estas ltimas requerem nveis mais
altos de potncia, o que tende a reduzir a vida til do laser. Quando a finalidade
principal realizar cpias de discos magnticos de alta velocidade, o laser,
fundamentalmente, escreve. Por outro lado, quando a finalidade principal
armazenagem, o laser gasta aproximadamente a mesma quantidade de tempo na leitura
e na escrita. Preocupado com a questo da durabilidade da sua produo, um fabricante
de lasers deseja realizar uma pesquisa por amostragem junto sua clientela, para
estimar a proporo p dos seus produtos que so usados para realizar cpias.
(a) Se a inteno estimar p com um erro absoluto inferior a 0,05 com
probabilidade 95%, qual deve ser o tamanho da amostra?
(b) Sob as mesmas condies do item (a), calcule o tamanho da amostra a ser
utilizada, se o fabricante sabe que 0,15 p 0,30.

P8.10) Ser que a amostra de empresas representativa?


Visando conduzir uma pesquisa sobre o setor empresarial de determinado pas, foi
extrada uma amostra aleatria com n = 1000 empresas, a partir de um cadastro onde
constam todas as empresas ali sediadas. Para que essa amostra possa ser considerada
representativa, os diversos segmentos do setor empresarial, enumerados a seguir, devem
estar presentes na amostra aproximadamente nas mesmas propores em que eles esto
presentes no universo. Sabe-se que, na populao de todas as empresas do pas,
Quanto ao setor de atividade econmica:
25% delas dedicam-se principalmente ao ramo industrial;
45% delas dedicam-se principalmente ao ramo comercial;
30% delas dedicam-se principalmente ao ramo de servios;
Quanto origem do seu capital:
20% so empresas pblicas;
50% so empresas privadas nacionais;
30% so empresas multinacionais;
Quanto ao tamanho da empresa:
10% so de grande porte;
30% so de mdio porte;
60% so de pequeno porte.
(a) Mostre que, para cada um dos 9 segmentos acima, se a constante p j a proporo de
empresas do segmento j na populao e a varivel aleatria p j a proporo de
p j (1 p j )
empresas desse segmento na amostra, ento E(p j ) p j e Var( p j ) .
n
(b) Para cada j, j = 1,2,...,9, determine um intervalo I j = (pj j; pj + j) tal que
P[ p j Ij] = 0,95.
(c) Calcule CVmax, o maior de todos os coeficientes de variao dos p j , ou seja,
DP(p j )
CVmax = max 1j9 .
E(p j )

Obs.: Intuitivamente, podemos dizer que, quanto mais prximo p j estiver de pj para
todo j, maior ser a representatividade da amostra. Isso exatamente o que acontece
quanto menores forem as amplitudes dos intervalos Ijs e quanto menor for CVmax.

Sugesto: Cada p j pode ser expresso como o quociente entre uma binomial
(aproximadamente, uma Normal) e o tamanho da amostra.

P8.11) Dimensionamento de amostra para estimao simultnea de parmetros


Em um determinado pas h um total de 5 milhes de empresas. Atravs de um processo
de amostragem deseja-se estimar simultaneamente o nmero total de empregados dessas
empresas (com um erro absoluto menor que 3 x 10 6) e a proporo dessas empresas que
tiveram prejuzo financeiro no ano anterior (com um erro relativo menor que 10%),
sendo que em ambos os casos o erro mximo acima especificado no deve ser
ultrapassado com probabilidade 0,99. A partir de estimativas anteriores sabe-se que o
nmero mdio de empregados da ordem de 30 e o coeficiente de variao dessa
varivel (nmero de empregados por empresa) da ordem de 1,6. Alm disso, sabe-se
que a proporo de empresas que tiveram prejuzo no ano anterior est entre 2% e 8%.
Dimensione uma amostra aleatria simples que satisfaa simultaneamente ambas as
especificaes de preciso acima.

P8.12) Estimao de covarincia


Mostre que se (X1, Y1), ..., (Xn,Yn) so n vetores aleatrios bivariados tais que
C, se i j
Cov(X , Y )
i j 0, caso contrrio
1 n
ento X X Yi Y um estimador no tendencioso de C, ou seja, a
n 1i 1 i
covarincia amostral um estimador no tendencioso da covarincia populacional.
P8.13) Proporo de peas no conformes de uma linha de produo
Admita que p a proporo de peas no conformes de uma linha de produo, isto ,
peas que no atendem s especificaes fornecidas pelo fabricante. Queremos estimar
o parmetro p com base em uma amostra aleatria de n peas dessa linha de produo.
Temos ento n v.a.s iid X1, X2, ..., Xn que seguem uma lei de probabilidade de
Bernoulli(p).
(a) Obtenha o estimador de mxima verossimilhana de p.
Sugesto: Para isso, note que P(Xi = x) = px(1 p)1 x, onde x = 0 ou x = 1,
para todo i. Em seguida, monte a funo de verossimilhana e maximize o seu
logaritmo neperiano.
(b) Verifique que, entre os estimadores no tendenciosos e lineares de p (ou seja,
estimadores da forma , onde os ci so constantes a determinar), o
estimador de mxima verossimilhana obtido no item (a) aquele que possui a
menor varincia.
Sugesto: Use multiplicadores de Lagrange.

P8.14) Inundaes em um rio


(a) Mostre que se X1, X2,...,Xn uma amostra aleatria do modelo de Laplace com
parmetros m e T (onde T > 0), definido pela densidade
, para todo x real,
os EMVs de m e T so = mediana(X1,X2,...,Xn) e .
Sugesto: Faa um grfico da funo de verossimilhana.
(b) Em seu artigo Interval Estimation for the two-parameter double exponential
distribution, Technometrics, 1973, Bain e Englehart reportam o seguinte conjunto
de dados sobre diferenas nos nveis de inundao entre estaes em um rio:
1,96 1,97 3,6 3,8 4,79 5,66 5,76 5,78 6,27 6,3 6,76
7,65 7,84 7,99 8,51 9,18 10,13 10,24 10,25 10,43 11,45 11,48
11,75 11,81 12,34 12,78 13,06 13,29 13,98 14,18 14,4 16,22 17,06
Admitindo que o modelo de Laplace descreve adequadamente este fenmeno,
obtenha, a partir dos dados, as estimativas de mxima verossimilhana para m e T.

P8.15) Molculas em movimento segundo a distribuio de Maxwell


Conforme foi visto no Exerccio R3.5, a densidade da velocidade absoluta de uma
molcula dada pela distribuio de Maxwell
, para x > 0 e f(x) = 0, para x 0,
sendo uma constante. Se as v.a.s iid X1, , Xn tem distribuio de Maxwell, obtenha
o estimador de m xima verossimilhana do parmetro .

P8.16) Pesos de recm-nascidos


Use como a sua populao de interesse, os pesos em kg de N = 5 recm-nascidos:
2,3 2,5 3,0 3,5 4,0.
(a) Calcule a mdia e a varincia 2 populacionais.
(b) Obtenha todas as 10 possveis amostras de tamanho n = 2.
(c) Calcule a mdia amostral x para cada uma delas.
(d) Use esses valores para confirmar a validade das expresses E(x) e
1 1
Var(x) 2 neste caso.
n N
P8.17) Comparando estimadores em termos de preciso
Considere novamente o modelo Uniforme no intervalo [a,b], onde a e b so parmetros
desconhecidos, sendo a < b. Vimos no Exerccio Resolvido R8.5 que, se X1, ..., Xn
uma amostra aleatria desse modelo, ento

um estimador da mdia populacional . Por outro lado, sabemos que a mdia


amostral tambm um estimador de .
(a) Expresse o erro quadrtico mdio (EQM) de como estimador de , em funo
dos parmetros a e b, e do tamanho n da amostra.
(b) Para que valores de n, um estimador mais preciso do que em termos de
erro quadrtico mdio? Por que?

P8.18) Filtros passa-faixa


Os filtros passa-faixa (band-pass filters) so utilizados em diversos tipos de aplicaes
que envolvem a seleo de sinais de determinadas freqncias. Alguns exemplos
seriam:
o reconhecimento de um sinal de uma nica freqncia, em um sistema de
controle remoto;
a seleo de uma faixa completa de sinais, em um sistema de telefonia ou de
telecomunicaes.
O filtro passa-faixa transmite a faixa de freqncias para a qual foi projetado,
bloqueando sinais de freqncias inferiores e superiores aos limites dessa faixa.
Suponha que, para um determinado filtro passa-faixa, no sabemos exatamente como
ele funciona. Ou seja, esse filtro como uma caixa preta que s deixa passar sinais de
determinadas freqncias, mas gostaramos de obter um modelo probabilstico que
descrevesse o seu comportamento.
Para isso foi obtida uma amostra com n=100 sinais que esse filtro deixou passar. Suas
freqncias (em kHz) foram as seguintes:

9866 10223 9713 9926 9567 10441 9971 9730 10463 10276
10164 10423 10122 10252 10062 9862 9821 9843 10335 10444
9693 10423 9731 10271 10140 9604 9551 9977 9775 9616
10054 9772 9743 10187 10331 10273 9707 9574 9979 9784
10368 9974 9692 10014 10041 9734 10170 10492 10283 10398
10382 9658 10324 10177 9986 10421 9992 10209 9680 9864
10223 9615 9544 10315 9520 9689 9722 9694 10444 10128
10255 10419 9693 9926 10331 10108 10338 9805 10055 10280
9915 10335 9911 9656 9851 10022 10316 9586 10009 10421
10082 9808 10023 10086 9674 9858 9525 9548 9623 10168

(a) Use esses dados para obter um histograma da varivel freqncia do sinal, no
qual as classes a serem consideradas so: [9500 9700), [9700 9900),
[9900 10100), [10100; 10300), [10300 10500). A partir da anlise do
aspecto visual da figura, que modelo probabilstico lhe parece ser o mais
adequado? Por que?
(b) Que procedimento seria o mais indicado para estimar os parmetros desse
modelo?
(c) Quais seriam as suas estimativas dos parmetros desse modelo a partir dos dados
disponveis?
(d) Que concluses podem ser extradas dessa anlise e quo confiveis elas lhe
parecem ser? Por que?
Sugesto: Verifique se entre os assuntos abordados nos exerccios resolvidos deste
captulo voc capaz de encontrar subsdios para ajud-lo a raciocinar neste caso.