Estatística II
Volta Redonda
2010
ÍDICE
Apêndices........................................................................................................................58
Bibliografia ....................................................................................................................66
2
Capítulo 1 - IFERÊCIA ESTATÍSTICA
A Estatística Inferencial compreende as técnicas por meio das quais são tomadas
decisões sobre uma população, decisões baseadas unicamente na observação de uma
amostra. Devido ao fato de que tais decisões são tomadas em condições de incerteza,
requer-se, na estatística inferencial, o uso de conceitos de probabilidade.
Nos problemas reais estes parâmetros devem ser determinados antes da construção do
modelo. Como os parâmetros muitas vezes não são observáveis (por exemplo, se a
população for muito grande exigindo um trabalho exaustivo e de custo elevado, ou se os
ensaios forem destrutivos) as informações sobre os mesmos podem ser obtidas através
de valores das variáveis em questão, uma vez que estes são observáveis.
Resumo
3
Capítulo 2 - DISTRIBUIÇÃO DE AMOSTRAGEM DA MÉDIA
Parâmetro
(medida que descreve certa Simbologia Fórmula para o cálculo
característica dos elementos
da população)
n
X 1 + X 2 + ... + X n 1
Média µ X =
=
∑X
i =1
i
1
Variância σ2 ∑ ( X i − µ )2
i =1
1
Desvio-padrão σ ∑ ( X i − µ )2
i =1
Tabela 2.1 – Distribuição de Amostragem da Média (Parâmetro)
Estatística
(medida que descreve certa Simbologia Fórmula para o cálculo
característica dos elementos
da amostra)
X 1 + X 2 + ... + X n 1 n
Média X = ∑ Xi
n n i =1
n
1
Variância S2 ∑
n − 1 i =1
( X i − X )2
1 n
Desvio-padrão S ∑ ( X i − X )2
n − 1 i =1
Tabela 2.2 - Distribuição de Amostragem da Média (Estatística)
Para qualquer tamanho dado n de amostra tomada de uma população com média µ , o
valor da amostra X irá variar de amostra para amostra.
σ
E( X ) = µ ; σ x= √
4
Exemplo: Suponha que a média de uma população bastante grande seja µ = 50,0 e o
desvio padrão σ = 12,0. Determinamos a distribuição de amostragem das médias das
amostras de tamanho n = 36, em termos de valor esperado da seguinte forma:
E( X ) = µ = 50,0
σ , ,
σ x= √
=
√
=
= 2,0
Observações:
σ x = σ
√
√
sx =
O erro padrão da média fornece a base principal para a inferência estatística no que diz
respeito a uma população com média desconhecida. Um teorema em estatística que
conduz o uso do erro padrão da média é o seguinte:
5
Seja X uma população de média µ a variância σ ² ,ou seja, N( µ ; σ ²). Seja (x1, x2, ...,
xn) uma amostra aleatória então x1, x2, ..., xn são independentes. Então:
σ²
µ = E( X ) = µ ; σ x =
x √
σ²
Então se X ~ N( µ ; σ ²) , temos X ~ N( µ ;
√
)
X µ
Variável ormal Padronizada: Zx =
σ
√
Solução
E( X ) = µ = $ 260,00
√ √
Sx = = = = 7,17
Logo, a probabilidade de que a média seja menor ou igual a $ 250,00 é igual a 8,23%.
6
Capítulo 3 - ESTIMADOR OU ESTATÍSTICA
θ : Parâmetro
Qualidade de um estimador:
Para resolver esse problema leva-se em consideração alguns conceitos sobre qualidade
de um estimador, já que nunca pode-se conhecer o valor do parâmetro θ e sendo assim
não se pode afirmar que θ1 é “mais correto” que θ2 , ou vice versa.
2) ESTIMADOR EFICIENTE
Variância mínima
Um estimador θ1 será mais eficiente que θ2 se e somente se:
σ ²( θ1) < σ ²( θ2)
X 1 + X 2 + ... + X n 1 n
X= = ∑ X i é uma estimativa pontual de µ
n n i =1
1 n
S² = ∑ ( X i − X ) 2 é uma estimativa pontual de σ ², ou seja S² é um estimador de
n − 1 i =1
qualidade de σ ².
7
Capítulo 5 - ESTIMAÇÃO ITERVALAR
X ± Zx σ x ou X ± ZxSx
1 - α grau de confiança
α grau de significância
Neste caso sabe-se da distribuição amostral da média que a média amostral X tem
distribuição normal µ e desvio padrão
√
Xµ
Assim a variável associada a X é a normal padronizada Zx =
√
E o intervalo de confiança:
8
Exemplo: Para uma dada semana, foi tomada uma amostra aleatória de 30 empregados
horistas selecionados de um grande número de empregados de uma fábrica, a qual
apresentou um salário médio de X = $ 180,00 com um desvio padrão da população de
σ = $ 14,00. Estime o salário médio para todos os empregados horistas da fábrica
admitindo-se um grau de confiança de 95%.
Solução
1 − = 0,95
= 0,05 "
/2 = 0,025
Conclusão: podemos dizer que o nível do salário médio para todos os empregados está
entre $ 174,98 e $ 185,02, com um grau de confiança de 95% nesta estimativa.
Neste caso deve-se estimar a variância populacional σ ². Então S2, a variância amostral,
é um estimador de qualidade de σ ²
S² = Σ ( X – X )²
Sendo o tamanho da amostra menos que 30, ou seja n ≤ 30, define-se a variável
Xµ
padronizada tx = #
√
9
ota: quanto maior o grau de liberdade, mais a distribuição se aproxima da distribuição
normal.
Solução
1 − = 0,95
= 0,05 " ; graus de liberdade g.l. ν = n – 1 = 10 - 1 = 9
/2 = 0,025
Conclusão: a vida média para a população de lâmpadas está no intervalo de 3857 à 4142
horas.
10
Resumo
Suponha uma certa população com proporção p de objetos defeituosos. Neste caso, o
estimador não tendencioso de p é a proporção amostral f. Para grandes amostras (n ≥
30), a proporção amostral f tem distribuição aproximadamente normal e a variável
normal padronizada é:
%&
Zx =
'()*')
%(%)
Sendo o erro padrão estimado da proporção é: sf =
%(%) %(%)
P (f - Zα/2
≤ p ≤ f + Zα/2
)=1-α
11
tais estudantes têm diploma técnico. Usando um intervalo de confiança de 90%, estimar
a proporção nacional de estudantes que possuem diploma técnico.
Solução
1 − = 0,90
= 0,10 " ; logo Zα/2 = 1,65
/2 = 0,05
f= = 0,235
Ou seja, a proporção amostral de alunos que têm diploma técnico é igual a 23,5%.
%(%) (,)(,)
Sendo o erro padrão sf =
=
= 0,028
Xµ
Zα/2 =
√
n = ,² σ ²
-²
12
Onde: Z é o valor usado para o grau de confiança específico (Tabela da Distribuição
Normal Padrão – Apêndice)
σ é o desvio padrão da população
Xµ
.*
Zα/2 =
√ .*)
/²²
n = ()0²1/²²
Solução
13
5.5 - Determinação do Tamanho necessário da Amostra para estimar a Proporção
Considere uma população com uma proporção p de objetos que apresentam certas
características de interesse. Para um intervalo de confiança de 100(1-α)% construído a
partir de uma grande amostra (n ≥ 30) extraída com uma proporção f de objetos com a
característica considerada, extraída com reposição, tem-se que:
%&
Zα/2 =
'()*')
Solução
f = = 0,1; e = 0,03
1 − = 0,95
= 0,05 " ; logo Zα/2 = 1,96
/2 = 0,025
3² (4 − 1)
5²
14
Tem distribuição Quiquadrado χ²(n – 1)
P( ≤ ² ≤ )=1–α
6² (7/) 3² (4−1) 6²(7/)
3² (4−1)
P( ≤ σ² ≤ 3² (4−1) ) = 1 – α
6²(7/) 6²(7/)
Exemplo: Uma máquina produz uma grande quantidade de peças e o número de peças
defeituosas da produção se distribui normalmente com variância σ²(x) = 16. Com o
objetivo de diminuir a variabilidade do processo, foi providenciada uma reforma na
máquina. Uma amostra aleatória de 51 peças produzidas após a reforma forneceu
variância 14. Construa um intervalo de confiança de 98% para a nova variância
populacional.
Solução
Variância amostral s² = 14
3² (4−1)
P( ≤ σ² ≤ 3² (4−1) ) = 1 – α
6²(7/) 6²(7/)
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 149
15
5.7 Intervalo de Confiança para Diferença de duas Médias
P( ( X ₁ - X ₂) - Zα/2
₁² ₂² < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2
₁² ₂²
+ +
)=1–α
₁ ₂ ₁ ₂
Observação: Caso σ₁² e σ₂² não sejam conhecidos, e a amostra n < 30, devemos
aproximar o valor da variância populacional pela variância amostral s₁² e s₂² e substituir
a variável Normal Padronizada, Z, pela variável t de Student.
Solução
P( ( X ₁ - X ₂) - Zα/2
₁² ₂² < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2
₁² ₂²
+ +
)=1–α
₁ ₂ ₁ ₂
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.140, 141
16
5.8 Intervalo de Confiança para a diferença entre duas Proporções
µ (f₁) = p₁ µ (f₂) = p₂
Se x = f₁ - f₂ , então temos:
C D
Z = = (E₁ E₂) (F₁ F₂)
G₁H₁ G₂H₂
1
₁ ₂
Exemplo: Duas máquinas produzem o mesmo tipo de peça, que são misturadas para
embalagem posterior. Uma amostra de 40 peças da primeira máquina apresentou 1 peça
defeituosa, enquanto uma amostra de 36 peças da segunda máquina apresentou 2 peças
defeituosas. Calcule, ao nível de 98%, um intervalo de confiança para a diferença das
proporções de peças defeituosas na produção dessas máquinas.
Solução
f₁ = = 0,025 f₂ = = 0,055
q₁ = (1 – f₁) = 0,975 q₂ = (1- f₂) = 0,945
n₁ = 40 n₂ = 36
17
1 − = 0,98
= 0,02 " ; logo, temos Zα/2 = 2,325
/2 = 0,01
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.145
Exercícios
5.3) Procurando dimensionar a ajuda de custo para seus 50 vendedores, uma empresa
acompanhou os gastos de 15 vendedores e verificou despesa média de 20 u.m. Se a
empresa acredita que o desvio padrão para o gasto é 2 u.m., determine um intervalo de
confiança de 98% para o gasto médio dos vendedores desta empresa.
18
Resposta: 18,98 à 21,02 u.m.
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 114
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 121
5.5) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100
homens em uma grande comunidade e verifica que uma proporção de 0,40 na amostra
prefere lâminas de barbear da marca YY em vez de qualquer outra marca. Determine o
intervalo de confiança de 95% para proporção de todos os homens na comunidade que
preferem a lâmina de barbear YY.
5.6) Para uma amostra de 30 empregados de uma grande empresa, o salário médio
horário foi X ₁ = $ 7,50 com s₁ = $ 1,00. Em uma segunda grande empresa, o salário
médio horário para uma amostra de 40 empregados foi X ₂ = $ 7,05 com s₂ = $ 1,20.
Estimar a diferença dos salários médios horários das duas empresas, usando um
intervalo de confiança de 90%.
19
5.8) Um guarda de trânsito vistoriou 200 carros em um bairro de certa cidade e
constatou que 25 motoristas não estavam usando o cinto de segurança no momento da
vistoria. Determine um intervalo de confiança de 95% para a proporção de motoristas
que usam regularmente o cinto de segurança neste bairro.
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 132
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 146
5.10) Para um produto particular, a média de vendas por estabelecimento no último ano,
em uma amostra de n = 10 estabelecimentos foi X = $ 3425 com s = $ 200. Supõe-se
que as vendas por estabelecimento sejam normalmente distribuídas. Estimar (a)
variância e (b) o desvio padrão das vendas deste produto em todos os estabelecimentos,
no ultimo ano, utilizando um intervalo de confiança de 90%.
Resposta: (a) 21278 < σ² < 108271 ; (b) 145,9 < σ < 329,0
5.12) Em um parque existe uma população muito grande de esquilos. De uma amostra
aleatória de 40 destes esquilos achou-se que 4 estão infectados com o bacilo da peste.
20
Pede-se: (a) Determine um intervalo de confiança de 95% para a verdadeira proporção
de esquilos infectados na população. (b) de que tamanho deveria ser tomada a amostra
para estimar a dita proporção com um erro não maior que 5% com um nível de
confiança de 99%?
15,7; 15,7; 16,3; 15,8; 16,1; 15,9; 16,2; 15,9; 15,8; 15,66
Resposta: 15,746 a 16,065 o. O inspetor não deve multar o fabricante já que o valor esperado
está dentro do intervalo de confiança das amostras analisadas.
5.14) Uma amostra de 800 eleitores indicou uma preferência de 25% para um
determinado candidato. Pede-se: (a) Determine um intervalo de 98% de confiança para
a proporção de todos os eleitores que têm preferência por esse candidato. (b) determine
o tamanho necessário da amostra para se obter um intervalo de confiança de 98% para a
proporção na população com uma amplitude de ± 2%.
5.15) Uma fundição produz blocos para motor de caminhões. Os blocos têm furos para
as camisas e deseja-se verificar qual é o diâmetro médio no processo do furo. A empresa
retirou uma amostra de 36 blocos e mediu os diâmetros de 36 furos (1 a cada bloco). A
amostra acusou média de 98,0 mm e desvio padrão de 4,0 mm. Construa um intervalo
de confiança de 99%. Se o processo deveria ter média de 100 mm, há evidência (com o
mesmo nível de confiança) de que a média do processo não está no valor ideal?
Explique.
Resposta: 96,2828 a 99,7171 mm. A média está por baixo do valor ideal com uma confiança de
99%.
5.16) Duas máquinas são usadas para encher garrafas de plástico com detergente para
lavagem de pratos. Os desvios-padrão do volume de enchimento são conhecidos como
sendo σ 1 = 0,10 onça fluida e σ 2 = 0,15 onça fluida para as duas máquinas,
respectivamente. Duas amostras aleatórias de n1 = 12 garrafas da máquina 1 e n2 = 10
garrafas da máquina 2 são selecionadas. Os volumes médios de enchimento nas
amostras são X 1 = 30,87 onças fluidas e X 2 = 30,68 onças fluidas. Suponha
21
normalidade. Construa um intervalo bilateral de confiança de 90% para a diferença nas
médias do volume de enchimento. Interprete esse intervalo.
5.17) Uma amostra aleatória de dez recém nascidos em uma maternidade deu os
seguintes valores de peso, em quilogramas, no momento do nascimento:
2,8; 3,2; 4,1; 3,5; 3,4; 3,0; 3,2; 3,2; 2,7; 2,3
Resposta: (a) 2,8201 à 3,4399 kg ; (b) 2,7723 à 3,4877 Kg ; (c) 2,72 à 3,53 Kg ; 2,62 à 3,63
Kg; (d) O IC aumenta quando o desvio padrão é desconhecido e também quando o nível de
confiança aumenta.
6,5; 4,0; 5,0; 6,0; 7,5; 3,5; 8,0; 4,5; 7,0; 5,5; 4,0; 5,5; 8,5; 6,5; 5,5
22
Capítulo 6 - TESTE DE HIPÓTESE
Portanto, o Teste de Hipótese é uma regra de decisão que permite aceitar ou rejeitar
como verdadeira uma hipótese nula Ho, com base na evidência amostral
Isto significa que utilizaremos uma amostra desta população para verificar se a amostra
confirma ou não o valor do parâmetro informado pela hipótese Ho.
ERRO TIPO I: é aquele que se comete ao rejeitar uma hipótese que é correta. A
probabilidade desse erro é simbolizada por α e é definido pelo nível de significância
exigido no teste.
ERRO TIPO II: é o erro que se comete ao aceitar uma hipótese que é incorreta. A
probabilidade desse erro é simbolizada por β.
a) Formular as hipóteses Ho e Ha
b) Escolher a variável teste
c) Arbitrar o nível de significância α
d) Determinar as regiões de aceitação e rejeição de Ho
e) Conclusão: aceitar ou rejeitar Ho
23
6.1 - Teste da Média Populacional para σ² conhecida
Ho: µ = µo
Xµ
Zx = com reposição
√
X µ
Zx= K* sem reposição
√ K*)
Solução
Hipóteses Ho: µ = 59
Ha: µ > 59
Xµ 2
Zc = = L = 2,108
√ √MN
24
Definimos assim uma região de aceitação (RA) e uma região crítica (RC) para a
hipótese nula, Ho:
Figura 6.1 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 159
Conclusão: o valor de Zc = 2,108 > Zα = 1,64 , está na região crítica para a hipótese
nula, Ho. Portanto, ao nível de significância de 5%, rejeita-se Ho, ou seja, a média
populacional é superior a 59.
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 159, 160
As hipóteses são:
Ho: µ = µo
Xµ
tx = O com reposição
√
X µ
tx =
O K* sem reposição
√ K*)
25
Exemplo: Uma amostra de 12 elementos retirados ao acaso de uma população normal
Solução
Xµ
tc = O = P = - 1,39
√ √)Q
Definimos, portanto, as regiões de aceitação (RA) e região crítica (RC) para a hipótese
nula Ho:
Figura 6.2 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 160
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 160
26
6.3 - Teste da Proporção Populacional
As hipóteses são:
Ho: p = p0
Sob a hipótese nula a proporção amostral f, no caso de grandes amostras (n ≥ 30) tem
%(%)
distribuição aproximadamente normal com média µ e desvio padrão sf =
Exemplo: Uma máquina está regulada quando produz 3% de peças defeituosas. Uma
amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças defeituosas.
Teste ao nível de 2% a hipótese de que a máquina está regulada.
Solução
TN
27
Definimos, assim, uma região de aceitação (RA) e uma região crítica (RC) para a
hipótese nula, Ho:
Figura 6.3 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 164
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 163, 164
Suponha que uma variável normalmente distribuída, tenha variância σ1² numa
população 1 e σ2² em outra população 2.
ota: Por uma questão de referência, considera-se índice 1 para a maior variância e
índice 2 para a menor.
28
A hipótese Ho será rejeitada num nível de significância α se Fc > Fα,(n1 - 1),(n2 - 2) e aceita
caso contrário.
*sendo Fc o valor calculado através das variâncias amostrais e Fα,(n1 - 1),(n2 - 2) o valor
obtido da tabela da Distribuição F (Apêndice).
Solução
gl 1: ν1 = n1 – 1 = 10 – 1 = 9; gl2: ν2 = n2 – 1 = 8 – 1 = 7
Conclusão: Fc = 1,91 < Ftabelado= 3,68, portanto aceita-se Ho. Ou seja, a um nível de
significância de 5%, não existe diferença na variabilidade dos dois processos.
29
Portanto, a estatística usada para testar um valor hipotético da variância da população
² ()
χ² = ²
Exemplo: A média da vida útil para uma amostra de n = 10 lâmpadas é x = 4000 horas,
com um desvio padrão de s = 200 horas. Supõe-se que a vida útil das lâmpadas, em
geral, seja normalmente distribuída. Suponha que, antes de ser coletada a amostra, foi
feita a hipótese de que o desvio padrão não era maior do que σ = 150. Com base nos
resultados amostrais, teste tal hipótese ao nível de significância de 1%.
Solução
Conclusão: Como χ²calculado =16 < χ²tabelado = 21,67, aceita-se Ho, ao nível de
significância de 1%. Ou seja, o desvio padrão não é maior que σ = 150.
V X X W ( µ µ)
A distribuição amostral de X 1 e X 2 é normal e Zc =
₁²1₂²
₁ ₂
As hipóteses são Ho: µ1 = µ2
Ha: µ1 ≠ µ2
30
Figura 6.4 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 139
O teste da diferença entre duas médias é, portanto, um teste bilateral e assim temos uma
região de aceitação (- Zα/2 < Zc < Zα/2) e duas regiões críticas ( Zc < - Zα/2 e Zc > Zα/2).
Tomamos a decisão comparando-se esses valores de Zc e Zα/2.
Solução
Hipóteses Ho: µ1 = µ2
H a: µ1 ≠ µ2
s1 = 14,00 s2 = 10,00
n1 = 30 n2 = 40
V X X W
Zc = = = = 3,327
₁²1₂²
)M²1 )N²
₁ ₂ LN MN
Conclusão: Como Zc = 3,327 > Zα/2, rejeita-se Ho num nível de significância de 5%. Ou
seja, as duas firmas apresentam diferença entre os valores médios dos salários semanais.
31
6.7 - Teste da Diferença entre duas Médias (usando Distribuição t de Student)
No caso anterior, se σ² não for conhecido ou os tamanhos das amostras (n1 e n2) for
menor que 30, use aproximação de σ²(x) por s²(x), utilizando a distribuição t de Student.
X X ₁ X ₂Y(µ₁ µ₂)
tc =
O₁²1O₂²
₁ ₂
Assim como no caso anterior, sendo este um teste bilateral, temos uma região de
aceitação (- tα/2 < tc < tα/2) e duas regiões críticas ( tc < - tα/2 e tc > tα/2). Tomamos a
decisão comparando-se esses valores de tc e tα/2.
Exemplo: Para uma amostra aleatória de n1 = 10 lâmpadas, a vida útil média foi
X 1 = 4000 horas, com s1 = 200. Para outra marca de lâmpadas, cuja vida útil também
supõe-se ser normalmente distribuída, uma amostra n2 = 8, apresentou média X 2 =
4300 horas, e desvio padrão amostral s2 = 250. Teste a hipótese de que não existe
diferença entre a média de vida útil das duas marcas de lâmpadas, usando nível de
significância de 1%.
Solução
Hipóteses Ho: µ1 = µ2
Ha: µ1 ≠ µ2
s1 = 200 s2 = 250
n1 = 10 n2 = 8
Conclusão: Como tc encontra-se na região de aceitação (- tα/2 < tc = - 2,76 < tα/2).
Conclui-se que, aceita-se Ho, ao nível de significância de 1%. Ou seja, a média da vida
útil das duas marcas de lâmpadas são iguais.
32
Exercícios
6.2) O valor médio de vendas por estabelecimento varejista, durante o último ano, de
um particular produto, foi de X = $ 3425 para uma amostra de n = 25 estabelecimentos.
Com base em dados de vendas de outros produtos similares, supõe-se que a distribuição
das vendas seja normal e que o valor do desvio padrão da população seja σ = $ 200. Foi
afirmado que o verdadeiro valor de vendas por estabelecimento é no mínimo de $ 3500.
Testar esta afirmação ao nível de significância de (a) 5% e (b) 1%.
Resposta: Rejeita-se Ho
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.161
6.4) Um projeto de investimento está sendo avaliado pelo método pay-back. Uma
simulação envolvendo vários cenários futuros forneceu os seguintes tempos de retorno
do investimento (em anos): 2,8; 4,3; 3,7; 6,4; 3,2; 4,1; 4,4; 4,6; 5,2; 3,9. Teste ao
nível de 10% a hipótese de que o tempo médio de retorno seja de 4 anos.
Resposta: Aceita-se Ho
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.162
33
6.5) A proporção de mulheres que ocupam cargo administrativo nas empresas é
tradicionalmente de 15%. Um levantamento efetuado entre 200 administradores revelou
que 40 eram mulheres. Teste ao nível de significância de 5% a hipótese de que a
proporção de mulheres que ocupam cargo administrativo não tenha aumentado.
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.165
6.6) Uma agência de viagens tem um tradicional plano de férias que é oferecido a todos
os possíveis clientes que procuram a agência. O índice de respostas positivas é
historicamente 20%. Este ano, uma amostra aleatória de 50 potenciais clientes mostrou
que 15 adquiriram o plano de férias. Teste ao nível de 6% a hipótese de que o percentual
de respostas positivas não tenha aumentado este ano.
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.166
6.7) Deseja-se testar a diferença entre duas médias da renda de duas comunidades. Para
uma amostra de n₁ = 30 famílias na primeira comunidade, a renda média anual é $15500
com desvio padrão amostral de s₁ = 1800. Para uma amostra de n₂ = 40 famílias na
segunda comunidade, a renda média anual é $14600 e s₂ = 2400. Teste a hipótese ao
nível de significância de 1%.
Resposta: Aceita-se Ho, as duas comunidades apresentam montante médio de renda iguais.
6.8) Com objetivo de testar a eficiência de dois métodos de aprendizagem, eles foram
aplicados durante um ano em duas escolas da mesma organização. Ao final do curso,
selecionou-se uma amostra aleatória de 10 alunos de cada escola e a mesma tarefa foi
proposta a estes alunos. No primeiro grupo, o tempo médio para concluir a tarefa foi
2h46min, enquanto no segundo grupo a média foi de 2h31min, com desvio padrão de
23min e 16min respectivamente. Supondo que a distribuição do tempo de realização das
tarefas são normais, é possível afirmar que o segundo método é mais eficiente que o
primeiro ao nível de significância de 5%?
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.172
34
6.9) Um órgão de defesa do consumidor testa regulamente o peso de botijões de gás
para uso doméstico. Eles devem apresentar um peso médio líquido de 13kg, com desvio
padrão não superior a 250g. Uma amostra aleatória realizada no depósito de uma
companhia engarrafadora de gás revelou entre 26 botijões um desvio padrão de 305g.
Testar a hipótese de os botijões estarem dentro das especificações, contra a alternativa
de os botijões estarem fora de especificação, ao nível de 5%.
Resposta: Aceita-se Ho. Ao nível de significância de 5%, o produto está dentro da especificação.
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.182, 183
Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.180
6.12) O rótulo de uma garrafa indica que ela contém 1,5 litros de um refrigerante. Um
órgão de fiscalização deseja testar esta afirmação e multar o fabricante se constatar que
o valor médio da quantidade de refrigerante for inferior a 1,5 litros. Com esta finalidade,
o órgão faz uma amostra aleatória de 30 garrafas e obtém uma média amostral de 1,482
litros e um desvio padrão amostral de 0,025 litros. Verificar se a afirmação do fabricante
pode ser rejeitada ao nível de 10% e de 5%.
6.13) O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar
uma alergia, em um período de 8 horas. Se a droga é aplicada a 200 doentes curando a
170 deles, pode-se considerar correta a reivindicação do fabricante?
35
Resposta: Rejeita Ho, a afirmação do fabricante não é correta a um nível de significância de 5%.
Com base nestas observações, pode-se manter a hipótese de que as duas marcas
apresentam igual conteúdo de nicotina? Considere que a variância populacional é igual
a variância amostral.
Resposta: Rejeita Ho, as duas marcas não apresentam o mesmo conteúdo de nicotina a um nível
de 5%.
Resposta: (a) Rejeita Ho, há diferença significativa entre os aproveitamentos das duas classes
com um nível de significância de 5% e a segunda classe é, provavelmente, melhor. (b) Não há
diferença significativa entre as classes num nível de significância de 1%.
Paciente 1 2 3 4 5 6 7 8 9
Antes 120 110 118 128 126 124 132 139 125
Depois 116 112 114 120 130 123 124 130 118
Tabela 6.1 – Pacientes antes e depois do tratamento
Pode-se concluir, com base nesta experiência, a um nível de significância de 5%, que o
medicamento é eficaz na redução do açúcar no sangue?
Resposta: Rejeita Ho, as médias de açúcar são diferentes antes e depois, a um nível de
significância de 5%. Conclui-se que o medicamento é eficaz na redução do açúcar no sangue.
36
6.17) Uma máquina que empacota bolsas de café automaticamente está regulada para
empacotar bolsas cujos pesos estão distribuídos normalmente com média µ e variância
400. A máquina foi regulada para µ = 500 gramas. Decide-se escolher uma amostra de
16 bolsas a cada 30 minutos com o objetivo de verificar se a produção está controlada
ou não , isto é, se µ = 500 gramas ou não. Se uma dessas amostras tem média 492
gramas, deve-se deter a produção para verificar se a máquina está corretamente
regulada?
Resposta: Aceita Ho, a produção não seria interrompida. Conclui-se que a máquina esteja
corretamente regulada.
6.18) Criou-se dois grupos de animais, com 50 animais em cada grupo, com duas dietas
diferentes. Ao final de 5 meses o peso médio do grupo 1 foi 149,2 gramas, com um
desvio padrão de 8 gramas; o segundo grupo apresentou um peso médio de 152,3
gramas, com desvio padrão de 10 gramas. Devemos aceitar a hipótese de que uma dieta
é melhor que a outra?
37
Capítulo 7 - TESTE QUIQUADRADO
- Teste de Aderência
- Teste de Independência
- Teste de Homogeneidade
O teste de Aderência é um teste não paramétrico que é utilizado para verificar se uma
variável apresenta determinada distribuição de probabilidade (Distribuição Normal,
Binomial, Poison).
As hipóteses são:
Ha: os resultados ocorrem com freqüências diferentes das previstas pelo modelo.
Z (%[ %0)²
%0
χ²c =
Território
A B C D Total
Freqüência observada fo 6 12 14 8 40
Freqüência esperada fe 10 10 10 10 40
Tabela 7.1 – Instalações do sistema nos diferentes territórios
Solução
Hipóteses
gl: ν = k – m – 1 = 4 – 0 – 1 = 3
Conclusão: Como χ²calculado = 4,0 < 7,81, aceita-se Ho num nível de significância de 5%.
Ou seja, pode-se afirmar que as freqüências estão igualmente distribuídas entre os
quatro territórios.
Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 195, 196, 197
39
7.2 - Teste de Independência
Como intervêm duas variáveis, as freqüências observadas são colocadas em uma Tabela
de Contingência. As dimensões de tal tabela são definidas pela expressão r x k, onde r
indica o número de linhas e k indica o número de colunas.
(2)()
por exemplo: fe = = 18, e assim consecutivamente, constrói-se a tabela da
freqüência esperada:
Conclusão: Portanto, sendo χ²calculado = 1,03 < 3,84, à um nível de significância de 5%,
aceita-se Ho. Ou seja, as duas variáveis, nível do curso e reação à expansão do programa
de atletismo, são independentes.
41
Observe as hipóteses:
Σ\Σ]
onde a freqüência esperada é equivalente à fe = , e n é o total geral, ou seja, o
total do somatório de todas as linhas da tabela de contingência (que por sua vez, é igual
ao somatório de todas as colunas).
Municípios
Eleitores 1 2 3 4 Total
a favor de A 126 103 109 98 436
outro candidato 174 197 191 202 764
Total 300 300 300 300 1200
Tabela 7.4 – Frequência observada da pesquisa de opinião dentre os votantes de cada município
42
Solução
()()
por exemplo: fe = = 109, e assim consecutivamente, constrói-se a tabela da
freqüência esperada:
Municípios
Eleitores 1 2 3 4 Total
a favor de A 109 109 109 109 436
outro candidato 191 191 191 191 764
Total 300 300 300 300 1200
Tabela 7.5 – Frequência esperada da pesquisa de opinião dentre os votantes de cada município
Conclusão: Portanto, sendo χ²calculado = 6,43 < 7,81, aceita-se Ho, num nível de
significância de 5%. Ou seja, a proporção de votantes no candidato A é a mesma para os
quatro municípios.
Exercícios
7.1) Em 200 lançamentos de uma moeda, foram observadas 115 caras e 85 coroas. Teste
a hipótese de que a moeda é legal utilizando um nível de significância de (a) 5% e (b)
1%.
Resposta: Rejeita-se a hipótese de que a moeda é legal a um nível de significância de 5%. Não
se tem o mesmo resultado a um nível de significância de 1%.
43
7.2) A tabela abaixo apresenta as freqüências observadas, ao lançar-se um dado 120
vezes. Testar a hipótese de o dado ser honesto.
Face 1 2 3 4 5 6
Freqüência observada 25 17 15 23 24 16
Tabela 7.5 – Frequência observada no lançamento de um dado
7.4) Em geral, 20% dos clientes em potencial visitados pelo vendedor de uma firma
fazem uma compra. Durante o período de testes, um novo vendedor faz 30 visitas à
possíveis clientes e realiza três vendas. Teste a hipótese nula de que este padrão de
vendas não difere do padrão histórico, usando nível de significância de 5%
44
7.6) Um gerente de um departamento de pessoal estima que uma proporção de π = 0,40
dos empregados de uma grande empresa participará de um novo programa de
investimento em ações. São feitos contatos com uma amostra aleatória de n = 50
empregados, sendo que 10 deles indicam sua intenção de participar. Teste , através do
uso do quiquadrado o valor hipotético da proporção da população, ao nível de
significância de 5%
Resposta: Rejeita-se Ho
7.7) Nas experiências que Mendel realizou com ervilhas, ele observou 315 redondas e
amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas e verdes. De
acordo com a sua teoria da hereditariedade, os números deveriam estar na proporção
9:3:3:1. Há evidência para se duvidar de sua teoria, ao nível de significância de (a) 1% e
(b) 5%?
Diga se o gerente pode afirmar que existe preferência por um dos caixas num nível de
significância igual a 0,05.
Resposta: Rejeita Ho, existe evidência de que há preferência por um dos caixas.
7.9) Uma amostra de peças forneceu a seguinte tabela de contingência sobre a qualidade
da peça por linha de produção. O gerente afirma que a qualidade da peça independe da
linha de produção, realize um teste de hipótese para verificar se o gerente está certo.
Resposta: Os dados mostram evidência de que o gerente não está certo na sua afirmação a um
nível de significância de 5%.
45
7.10) Dois pesquisadores selecionaram amostras de uma mesma cidade com o objetivo
de estimar o número de pessoas que correspondem aos grupos classificados segundo o
salário familiar por mês: A, B, C (os intervalos em reais são os mesmos para cada
grupo). Os resultados obtidos foram:
7.12) Determinado veículo utilitário está sofrendo pesadas críticas de seus proprietários,
com relação à grande freqüência de defeitos no pneu traseiro esquerdo. Preocupado com
sua imagem, e procurando defender-se de eventuais pedido de indenização, o fabricante
do veículo resolveu coletar informações sobre 152 ocorrências de defeitos,
classificando-as por posição do pneu. Os resultados estão na tabela a seguir. Usando
nível de significância de 5%, há razão para acreditar que a probabilidade de defeito é
diferente para algumas posições?
46
Capítulo 8 - AÁLISE DE VARIÂCIA
Assumimos que uma amostra aleatória simples de tamanho ni tenha sido selecionada de
cada uma das k populações ou tratamentos.
∑c b )²
¡d) ¡ (C` ¡ a
]
MSTR =
Sendo,
•
• k = número de tratamentos.
O numerador SSTR = ∑]¡g 4¡ (e` ¡ − fb)² é chamado de soma dos quadrados devido aos
tratamentos e é denotado por SSTR (Sum of Squares due to Treatments). O
denominador, (k – 1) representa os graus de liberdade associados à SSTR. Então temos:
UUhi
]
MSTR =
Sendo a hipótese nula Ho verdadeira, o MSTR fornece uma estimativa sem viés da
variância da população σ².
47
8.2 - Estimativa dos Tratamentos – Dentro da variância da população
∑c
¡d)(¡ )
¡²
j
MSE =
Sendo:
Onde o numerador SSE = ∑]¡g(4¡ −1)3¡ ² é a soma dos quadrados devido aos erros
(Sum of Squares due to Error). O denominador de MSE (N – k) corresponde aos graus
de liberdade associados ao SSE.
Teste F
48
8.4 - Tabela AOVA
Faça uma ANOVA e verifique se há evidência de que existe diferença real entre as
resistências médias dos três tipos de cimentos, num nível de significância de 5%.
Solução
E ainda, nA = nB = nC = 5
,= 1 , 1,
A média global dos tratamentos: fb =
= 15,1
49
SSE =∑]¡g(4¡ −1)3¡ ² = (5-1)7,7 + (5-1)23,7 + (5-1)19,3 = 202,8
gl do numerador: ν1 = (k - 1) = 2
gl do denominador: ν2 = (N – k) = 12
Conclusão: Como F = 11,3 > Fα, rejeita-se Ho ao nível de significância de 5%, ou seja, a
ANOVA apóia a conclusão de que as médias de resistência à compressão dos três tipos
de cimento não são iguais.
Exercícios
8.1) Quinze pessoas que participaram de treinamento são colocadas, de forma aleatória,
sob três diferentes tipos de avaliação. Os graus obtidos no teste de conclusão do método
de instrução são apresentados na tabela abaixo, juntamente com o grau médio de
desempenho associado a cada tipo de ensino. Usar procedimento da análise da variância
para testar a hipótese nula de que as três médias amostrais foram obtidas da mesma
população, a um nível de significância de 5%.
Resposta: Aceita Ho
50
Processo 1 Processo 2
6,1 9,1
7,1 8,2
7,8 8,6
6,9 6,9
7,6 7,5
8,2 7,9
Tabela 8.5 – Valores da resistência à tração
Resposta: Os valores da resistência à tração dos corpos de prova de plástico preparados por dois
processos diferentes são iguais a um nível de significância de 5%.
8.3) Três turmas da Estatística II são ministradas por três professores. As notas finais da
matéria são dadas na tabela seguinte:
Professor
A 7,5 9,0 8,0 4,5 8,0 7,5 6,5 6,0 4,5 9,5 3,5
B 9,0 8,0 5,0 9,0 5,0 8,5 7,5 7,5 3,0 8,0 6,0 7,5 9,5 8,0
C 7,0 8,0 5,5 9,0 7,0 7,0 8,5 4,0 6,0 7,0 5,5 1,5
Tabela 8.6 – Notas finais de Estatística II
Resposta: Não existe diferença significativa entre as notas médias dadas pelos 3 professores a
um nível de significância de 5%.
8.4) Cinco observações foram selecionadas de três populações. Os dados obtidos foram
os seguintes:
51
Resposta: (a) SSTR = 570, MSTR = 285; (b) SSE = 66, MSE = 5,5; (c) Fc = 51,82. Rejeita-se a
hipótese nula de que as médias das três populações sejam iguais
8.5) A fim de testar se o tempo médio necessário para misturar um lote de matérias é o
mesmo para máquinas produzidas por três diferentes fabricantes, a Jacob Chemical
Company obteve os seguintes resultados sobre o tempo (em minutos) necessário para
misturar os materiais. Use esses dados para testar se o tempo médio populacional para
misturar um lote de materiais difere em relação aos três fabricantes. Use α = 0,05.
Resposta: Fc = 10,63. Rejeita-se a hipótese nula de que o tempo médio necessário para misturar
um lote de materiais seja o mesmo para cada fabricante.
8.6) Nova York, Boston e o Vale do Silício na Califórnia estão entre as regiões que
apresentam os maiores salários no setor de tecnologia nos Estados Unidos. Os dados
amostrais seguintes apresentam os salários anuais individuais expressos em milhares de
dólares:
Nova York Boston Vale do Silício
82 85 82
79 80 91
72 74 94
89 78 88
79 75 85
85 80
86
74
52
Resposta: Fc = 4,99. Rejeita-se a hipótese nula de que as médias entre as três localidades sejam
iguais. A localidade com média de salário mais elevada é o Vale do Silício.
8.7) Os dados referentes às quantidades de cálcio (parte média por milhão) de água
medidas em três locais ao longo do rio São Francisco estão apresentados na tabela
abaixo:
Local 1 42 37 41 39 43 41
Local 2 37 40 39 38 41 39
Local 3 32 28 34 32 30 33
Tabela 8.11 – Quantidade de cálcio na água
Supondo que esses dados constituem amostras aleatórias de três populações normais
com o mesmo desvio padrão, efetue uma análise de variância para testar, ao nível de α =
0,01 de significância se as diferenças entre as médias amostrais são significantes.
Resposta: Fc = 4,06. Aceita-se a hipótese nula de que as médias são iguais, num nível de
significância de 0,01.
53
Capítulo 9 - REGRESSÃO LIEAR
O Método dos Mínimos Quadrados serve para ajustar uma linha de regressão
Y = a + bX
p qb
∑ no – J a
∑ a² ap ²
Sendo b =
e a = rb − sfb
Uma vez que tenha sido formulada a equação de regressão, pode-se utiliza-la para
estimar o valor da variável dependente, dado o valor da variável independente.
t ∑ o 1 u ∑ no – J qb²
∑ q² qb ²
r2 =
r = (sinal de b) √v²
54
Exercícios
Estudante amostrado 1 2 3 4 5 6 7 8
Horas de estudo, X 20 16 34 23 27 32 18 22
Grau no exame, Y 64 61 84 70 88 92 72 77
Tabela 9.1- Números de horas de estudo fora da classe, Grau obtido no exame
Pede-se: (a) Determinar a equação de regressão para predizer o grau no exame, dado o
número de horas de estudo, e traçar a linha de regressão no diagrama de dispersão.
(b) Utilizar a equação de regressão para estimar o grau no exame obtido por um
estudante que dedicou 30 horas de estudo fora de classe.
9.2) Suponha que um analista toma uma amostra aleatória de 10 carregamentos recentes
por caminhão feitos por uma companhia e anota a distância em quilômentros e o tempo
de entrega ao meio-dia mais próximo. Os dados são verificados na tabela:
Carregamento 1 2 3 4 5 6 7 8 9 10
amostrado
Distância em km, 825 215 1070 550 480 920 1350 325 670 1215
X
Tempo de entrega 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0
em dias, Y
Tabela 9.2 – Distância, Tempo de entrega
9.3)
Idade 56 42 72 36 63 47 55 49 38 42 68 60
Pressão 147 125 160 118 149 128 150 145 115 140 152 155
Tabela 9.3 – Idade, Pressão sanguínea
55
a) O coeficiente de correlação entre X e Y.
b) A reta de regressão linear de Y em X.
c) A pressão sanguínea de uma mulher de 45 anos de idade.
d) Calcule r² e interprete.
Resposta: (a) r = 0,8961; (b) Y = 80,7777 + 1,1380X; (c) X = 45, Y = 131,988; (d) r² =0,8029
9.5) A altura usualmente funciona como elemento que permite boa previsão do peso
para pessoas da mesma idade e sexo. Na lista a seguir são mostrados a idade e o peso de
14 homens de idade entre 19 e 26 anos:
Peso (kg) 83,9 99 63,8 71,3 65,3 79,6 70,3 69,2 56,4 66,2 88,7 59,7 64,6 78,8
Altura (cm) 185 180 173 168 175 183 184 174 164 169 205 161 177 174
Tabela 9.5 – Peso, Altura
56
d) Obtenha a equação da reta correspondente. Utilizando a equação obtida, estime
o peso de um jovem medindo respectivamente 192 e 150 cm.
Resposta: (b) r = 0,69; (c) X altura, Y peso; (d) Reta de regressão: Y = -60,6216 + 0,7547X. Para
X = 192, temos Y = 84,2718 e para X = 150, temos Y = 52,5764
a) Com esses dados desenvolva uma equação de regressão estimada que possa ser
usada para prever o custo total de determinado volume de produção.
b) Calcule o coeficiente de determinação.
c) O programa de produção da empresa mostra que 500 unidades devem ser
produzidas no próximo mês. Qual é o custo total estimado para essa operação?
Resposta: (a) Y = 1247,24 + 7,60X; (b) r² = 0,9587; (c) Para X = 500, temos Y = 5047,24
57
9.7) Certa empresa, estudando a variação da demanda de seu produto em relação à
variação de preço de venda, obteve a tabela:
Resposta: (a) r = -0,90; (b) Y = -1,87X + 386,78; (c) r² = 0,81; (d) Para X =60, temos Y = 274,58
58
Apêndice
59
Apêndice
60
Apêndice
61
Apêndice
62
Apêndice
63
Apêndice
64
Apêndice
Tabela 4 Distribuição F
65
Apêndice
Tabela 4 Distribuição F
66
BIBLIOGRAFIA
• Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística
para os cursos de Economia, Administração, Ciências Contábeis. Editora Atlas.
• Barbetta, P. A., Reis, M. M., Bornia, A.C. (2010). Estatística para Cursos de
Engenharia e Informática. Editora Atlas.
67