Anda di halaman 1dari 67

UNIVERSIDADE FEDERAL FLUMINENSE

PÓLO UNIVERSITÁRIO DE VOLTA REDONDA


DEPARTAMENTO DE ENGENHARIA DE PRODUÇÃO

Estatística II

CAROLINA CONDÉ MARQUES

ORIENTADORA: ELIANE DA SILVA CHRISTO

Volta Redonda
2010
Í DICE

Capítulo 1 Inferência Estatística .................................................................................. 2

Capítulo 2 Distribuição de Amostragem da Média .................................................... 3

Capítulo 3 Estimador ou Estatística ............................................................................ 6

Capítulo 4 Estimação Pontual ...................................................................................... 6

Capítulo 5 Estimação Intervalar .................................................................................. 7

Intervalo de Confiança para Média quando a Variância é conhecida, IC para Média


quando a Variância é desconhecida, IC para Proporção Populacional, Determinação do
tamanho necessário da Amostra para estimar a Média, Determinação do tamanho
necessário da Amostra para estimar a Proporção, IC para Variância Populacional, IC
para Diferença de duas Médias, IC para Diferença de duas Proporções, Exercícios

Capítulo 6 Teste de Hipótese .......................................................................................22

Teste da Média Populacional para Variância conhecida, Teste da Média Populacional


para Variância desconhecida, Teste da Proporção Populacional, Teste da Igualdade de
Variâncias, Teste da Variância (usando Distribuição Quiquadrado), Teste da Diferença
entre duas Médias usando Distribuição Normal Padronizada e usando Distribuição t de
Student, Exercícios

Capítulo 7 Teste Quiquadrado ....................................................................................37

Teste de Aderência, Teste de Independência, Teste de Homogeneidade, Exercícios

Capítulo 8 Análise de Variância – A OVA ...............................................................46

Estimativa dos Tratamentos entre a Variância da População, Estimativa dos


Tratamentos dentro da Variância da População, Comparando Estimativas da Variância,
Tabela ANOVA, Exercícios

Capítulo 9 Regressão Linear .......................................................................................51

Método dos Mínimos Quadrados, Coeficiente de Determinação, Coeficiente de


Correlação, Exercícios

Apêndices........................................................................................................................58

Tabela da Distribuição Normal-Padrão, Tabela da Distribuição t, Tabela da Distribuição


Quiquadrado, Tabela da Distribuição F

Bibliografia ....................................................................................................................66

2
Capítulo 1 - I FERÊ CIA ESTATÍSTICA

Aprendendo o desconhecido a partir do conhecido

A Estatística Inferencial compreende as técnicas por meio das quais são tomadas
decisões sobre uma população, decisões baseadas unicamente na observação de uma
amostra. Devido ao fato de que tais decisões são tomadas em condições de incerteza,
requer-se, na estatística inferencial, o uso de conceitos de probabilidade.

- Parâmetros da população: medidas características da população

- Estatísticas da amostra: medidas características de uma amostra

Em estudos anteriores foram apresentados vários modelos probabilísticos utilizados em


problemas reais como a distribuição normal, binomial por exemplo.

Estes modelos probabilísticos dependem de grandezas que foram consideradas


conhecidas, os parâmetros. No modelo normal os parâmetros são a média e a variância
enquanto no modelo binomial o parâmetro é a probabilidade de sucesso.

Nos problemas reais estes parâmetros devem ser determinados antes da construção do
modelo. Como os parâmetros muitas vezes não são observáveis (por exemplo, se a
população for muito grande exigindo um trabalho exaustivo e de custo elevado, ou se os
ensaios forem destrutivos) as informações sobre os mesmos podem ser obtidas através
de valores das variáveis em questão, uma vez que estes são observáveis.

Cada um dos valores possíveis de uma variável é denominado observação da mesma,


estatística.

Portanto, a solução é tentar obter os parâmetros a partir de uma amostra de n (n < N)


observações das variáveis. Pode-se assim, obter possíveis valores do parâmetro e
verificar hipóteses se os mesmos são verdadeiros ou não. Ao contrário da população, as
observações são variáveis aleatórias e variam de amostra para outra. Assim, pode-se
falar de população das médias amostrais ou distribuição das médias amostrais.

Resumo

Inferência estatística: tirar conclusões a respeito da população, baseando-se em uma


amostra da mesma.

3
Capítulo 2 - DISTRIBUIÇÃO DE AMOSTRAGEM DA MÉDIA

Parâmetro
(medida que descreve certa Simbologia Fórmula para o cálculo
característica dos elementos
da população)
n
X 1 + X 2 + ... + X n 1
Média µ X =

=

∑X
i =1
i


1
Variância σ2 ∑ ( X i − µ )2
 i =1
1 
Desvio-padrão σ ∑ ( X i − µ )2
 i =1
Tabela 2.1 – Distribuição de Amostragem da Média (Parâmetro)

Estatística
(medida que descreve certa Simbologia Fórmula para o cálculo
característica dos elementos
da amostra)
X 1 + X 2 + ... + X n 1 n
Média X = ∑ Xi
n n i =1
n
1
Variância S2 ∑
n − 1 i =1
( X i − X )2

1 n
Desvio-padrão S ∑ ( X i − X )2
n − 1 i =1
Tabela 2.2 - Distribuição de Amostragem da Média (Estatística)

A distribuição de amostragem da média é a distribuição de probabilidade para os


possíveis valores da média da amostra X baseados em um particular tamanho da
amostra.

Para qualquer tamanho dado n de amostra tomada de uma população com média µ , o
valor da amostra X irá variar de amostra para amostra.

A distribuição de amostragem da média é descrita através da determinação do valor


esperado E( X ), ou média da distribuição e através do desvio padrão da distribuição das
médias σ , usualmente chamado de erro padrão da média. Em geral, o valor esperado e
o erro padrão da média são descritos como:

σ
E( X ) = µ ; σ x= √

4
Exemplo: Suponha que a média de uma população bastante grande seja µ = 50,0 e o
desvio padrão σ = 12,0. Determinamos a distribuição de amostragem das médias das
amostras de tamanho n = 36, em termos de valor esperado da seguinte forma:

E( X ) = µ = 50,0

σ , ,
σ x= √
=
√
= 
= 2,0

Observações:

1) Ao fazer amostras de uma população finita (amostragem sem reposição), deve-se


incluir um fator de correção finita na fórmula do erro padrão da média:

σ x = σ

√ 

2) Se o desvio padrão da população for desconhecido, o erro padrão da média pode


ser estimado, usando-se o desvio padrão da amostra como um estimador do
desvio padrão da população:

√
sx =

A fórmula para o erro padrão estimado da média quando se inclui o fator de


correção finita é:


√ 
sx =

O erro padrão da média fornece a base principal para a inferência estatística no que diz
respeito a uma população com média desconhecida. Um teorema em estatística que
conduz o uso do erro padrão da média é o seguinte:

Teorema do Limite Central: À medida que se aumenta o tamanho da amostra, a


distribuição de amostragem da média se aproxima da forma da distribuição normal,
qualquer que seja a forma da distribuição da população. Na prática, a distribuição de
amostragem da média pode ser considerada como aproximadamente normal sempre que
o tamanho da amostra for n ≥ 30.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 127

5
Seja X uma população de média µ a variância σ ² ,ou seja, N( µ ; σ ²). Seja (x1, x2, ...,
xn) uma amostra aleatória então x1, x2, ..., xn são independentes. Então:

σ²
µ = E( X ) = µ ; σ x =
x √

σ²
Então se X ~ N( µ ; σ ²) , temos X ~ N( µ ;
√
)

X µ
Variável ormal Padronizada: Zx =
σ
√

Exemplo: Um auditor toma uma amostra aleatória de tamanho n = 36 de uma


população de 1000 contas a receber. Não se conhece o desvio padrão da população, mas
o desvio padrão da amostra é S = $ 43,00. Se o verdadeiro valor da média da população
de contas a receber é µ = $ 260,00, qual a probabilidade de que a média da amostra
seja menor ou igual a $ 250,00?

Solução

a distribuição de amostragem é descrita pela média e pelo erro padrão:

E( X ) = µ = $ 260,00

 
√ √ 
Sx = = = = 7,17

ota: S é usado como estimador de σ já que n = 36 (> 30)

X µ , , ,


, ,
Zx =  = = = - 1,39
√

Portanto, P ( X ≤ 250,00) = P(Z ≤ -1,39)

E P(Z ≤ -1,39) = 0,5000 - P(-1,39 ≤ Z ≤ 0) = 0,5000 – 0,4177 = 0,0823

Logo, a probabilidade de que a média seja menor ou igual a $ 250,00 é igual a 8,23%.

6
Capítulo 3 - ESTIMADOR OU ESTATÍSTICA

Dada uma amostra aleatória, estimador ou estatística é qualquer variável aleatória


função dos elementos amostrais. Observe:

θ : Parâmetro

θ : estimador ou estatística (ex: X , S, Sx , ...)

Estimativa: é o valor numérico de um estimador.

Qualidade de um estimador:

Sejam os estimadores θ1 e θ2 de um mesmo parâmetro. Qual o melhor estimador?

Para resolver esse problema leva-se em consideração alguns conceitos sobre qualidade
de um estimador, já que nunca pode-se conhecer o valor do parâmetro θ e sendo assim
não se pode afirmar que θ1 é “mais correto” que θ2 , ou vice versa.

1) ESTIMADOR JUSTO ou NÃO VIESADO


Diz-se que θ é justo se o seu valor esperado for θ
E(θ) = θ
Exemplo: E( X ) = µ

2) ESTIMADOR EFICIENTE
Variância mínima
Um estimador θ1 será mais eficiente que θ2 se e somente se:
σ ²( θ1) < σ ²( θ2)

Capítulo 4 - ESTIMAÇÃO PO TUAL

Na estimação por ponto calcula-se um único valor (estimativa) para o parâmetro


populacional. Assim, temos:

X 1 + X 2 + ... + X n 1 n
X= = ∑ X i é uma estimativa pontual de µ
n n i =1

1 n
S² = ∑ ( X i − X ) 2 é uma estimativa pontual de σ ², ou seja S² é um estimador de
n − 1 i =1
qualidade de σ ².

7
Capítulo 5 - ESTIMAÇÃO I TERVALAR

Os métodos de estimação por intervalo que serão estudados são baseados no


pressuposto de que possa ser usada a distribuição normal de probabilidade. Tal
pressuposição é garantida sempre que:

A) População normalmente distribuída e σ conhecido, mesmo que n < 30


B) n ≥ 30 (Teorema do Limite Central), independente de σ ser conhecido ou não.

Um Intervalo de Confiança para a média é um intervalo estimado, construído com


respeito à média da amostra, pelo qual pode ser especificada a probabilidade de o
intervalo incluir o valor da média da população. O grau de confiança associado a um
intervalo de confiança indica a percentagem de tais intervalos que incluiriam o
parâmetro que se está estimando.

X ± Zx σ x ou X ± ZxSx

1 - α grau de confiança

α grau de significância

5.1 - Intervalo de Confiança para Média populacional µ quando a Variância σ² é


conhecida

Neste caso sabe-se da distribuição amostral da média que a média amostral X tem
distribuição normal µ e desvio padrão 
√
X µ
Assim a variável associada a X é a normal padronizada Zx = 
√

E o intervalo de confiança:

P ( X - Zα/2 σ < µ < X + Zα/2 σ ) = 1 - α


√ √

8
Exemplo: Para uma dada semana, foi tomada uma amostra aleatória de 30 empregados
horistas selecionados de um grande número de empregados de uma fábrica, a qual
apresentou um salário médio de X = $ 180,00 com um desvio padrão da população de
σ = $ 14,00. Estime o salário médio para todos os empregados horistas da fábrica
admitindo-se um grau de confiança de 95%.

Solução

1 −  = 0,95
  = 0,05 "
/2 = 0,025

Logo, obtemos da tabela da Distribuição Normal – Padrão (Apêndice) Zα/2 = 1,96.

Temos então, X ± Zα/2 σ x = X ± 1,96 σ x

P ( X - Zα/2 σ < µ < X + Zα/2 σ ) = 1 - α


√ √

P ( 180,00 – 1,96, < µ < 180,00 + 1,96, ) = 0,95


√ √

P (180,00 – 1,96(2,56) < µ < 180,00 + 1,96(2,56) ) = 0,95

P ( 174,98 < µ < 185,02 ) = 0,95

Conclusão: podemos dizer que o nível do salário médio para todos os empregados está
entre $ 174,98 e $ 185,02, com um grau de confiança de 95% nesta estimativa.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 129

5.2 - Intervalo de Confiança para Média populacional µ quando a Variância σ²


é desconhecida

Neste caso deve-se estimar a variância populacional σ ². Então S2, a variância amostral,
é um estimador de qualidade de σ ²

S² =  Σ ( X – X )²

Sendo o tamanho da amostra menos que 30, ou seja n ≤ 30, define-se a variável
X µ
padronizada tx = #
√

Esta variável tem uma distribuição de probabilidade t de Student com ν = n – 1 graus


de liberdade.

9
ota: quanto maior o grau de liberdade, mais a distribuição se aproxima da distribuição
normal.

E temos o intervalo de confiança:

P ( X - tα/2 $ < µ < X + tα/2 $ )=1-α


√ √

Exemplo: A vida média de operação para uma amostra de n = 10 lâmpadas é X = 4000


horas com o desvio padrão da amostra S = 200 horas. Supõe-se que o tempo de
operação das lâmpadas, em geral, tenha distribuição aproximadamente normal . Estime
a vida média de operação para a população de lâmpadas da qual foi extraída a amostra,
usando um intervalo de confiança de 95%.

Solução

1 −  = 0,95
  = 0,05 " ; graus de liberdade g.l. ν = n – 1 = 10 - 1 = 9
/2 = 0,025

Logo, obtemos da tabela da Distribuição t (Apêndice), o valor de tα/2 = 2,262.

ota: como desconhecemos o desvio padrão da população σ , sabendo apenas o desvio


padrão amostral S e n < 30, usamos a variável t de Student.

Temos então, X ± tα/2 Sx = X ± 2,262 Sx

P ( X - tα/2 $ < µ < X + tα/2 $ )=1-α


√ √

P (4000 – 2,262  < µ < 4000 + 2,262  ) = 0,95


√ √

P ( 4000 – 2,26(63,24) < µ < 4000 + 2,26(63,24) ) = 0,95

P (3857 < µ < 4142 ) = 0,95

Conclusão: a vida média para a população de lâmpadas está no intervalo de 3857 à 4142
horas.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 130

10
Resumo

Estimação por Intervalo da Média da População

População Tamanho da amostra σ conhecido σ desconhecido

Normalmente Grande (n ≥ 30) X ± Zα/2 σ x X ± Zα/2Sx *


distribuída

Pequeno (n < 30) X ± Zα/2 σ x X ± tα/2Sx

Tabela 5.1 – Estimação por Intervalo da Média da População

* Z é utilizado como uma aproximação de t.

5.3 - Intervalo de Confiança para a Proporção populacional

A distribuição de probabilidade aplicável à proporções é a distribuição de probabilidade


binomial. Contudo, a construção de um intervalo de confiança para uma proporção
populacional desconhecida, usando a distribuição binomial, acarreta cálculos
extenuantes. Assim, utiliza-se a distribuição normal como aproximação da binomial
para a construção de intervalos de confiança para as proporções.

Suponha uma certa população com proporção p de objetos defeituosos. Neste caso, o
estimador não tendencioso de p é a proporção amostral f. Para grandes amostras (n ≥
30), a proporção amostral f tem distribuição aproximadamente normal e a variável
normal padronizada é:
% &
Zx =
'()*')

%( %)
Sendo o erro padrão estimado da proporção é: sf =


Desse modo, o intervalo de confiança fica sendo:

%( %) %( %)
P (f - Zα/2
≤ p ≤ f + Zα/2

 
)=1-α

Exemplo: Um administrador de uma universidade coleta dados sobre uma amostra


aleatória de âmbito nacional de 230 alunos de curso de Engenharia e encontra que 54 de

11
tais estudantes têm diploma técnico. Usando um intervalo de confiança de 90%, estimar
a proporção nacional de estudantes que possuem diploma técnico.

Solução

1 −  = 0,90
  = 0,10 " ; logo Zα/2 = 1,65
/2 = 0,05

Temos então, f ± Zα/2 sf = f ± 1,65 sf



f= = 0,235

Ou seja, a proporção amostral de alunos que têm diploma técnico é igual a 23,5%.

%( %) (,)(,)
Sendo o erro padrão sf =
=

 
= 0,028

Temos o intervalo de confiança associado:

P ( 0,235 – (1,65)(0,028) ≤ p ≤ 0,235 + (1,65)(0,028) ) = 0,90

P ( 0,235 – 0,046 ≤ p ≤ 0,235 + 0,046 ) = 0,90

P ( 0,189 ≤ p ≤ 0,281 ) = 0,90

Conclusão: a proporção de estudantes no país que estudam Engenharia e já possuem


diploma técnico está no intervalo entre 18,9% à 28,1%.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 149

5.4 - Determinação do Tamanho necessário da Amostra para estimar a Média

Suponhamos que se conhece o tamanho desejado do intervalo de confiança bem como o


grau de confiança a ele associado. Se σ é conhecido, sendo baseado no uso da
distribuição normal:

X µ
Zα/2 = 
√

Então, o tamanho necessário da amostra é:

n = ,² σ ²

12
Onde: Z é o valor usado para o grau de confiança específico (Tabela da Distribuição
Normal Padrão – Apêndice)
σ é o desvio padrão da população

e = X − µ é o fator de erro permitido no intervalo

No caso da amostragem sem reposição de uma população finita de tamanho N, tem-se


que:

X µ
 .*

Zα/2 =
√ .*)

E sendo e = X − µ o erro de estimativa, explicitando-se n, tem-se que:

/²²
n = ( )0²1/²²

ota: Ao determinar o tamanho da amostra, qualquer resultado fracionário é sempre


arredondado.

Exemplo: Um analista do departamento pessoal deseja estimar o número médio de


horas de treinamento anual para os funcionários da empresa, com um fator de erro de
3,0 horas (para mais e para menos) e com 90% de confiança. Baseado em dados de
outras divisões, ele estima o desvio padrão das horas de treinamento em σ = 20,00
horas. Qual o tamanho mínimo necessário da amostra?

Solução

n = ,² σ ² = ,² ,² = 121


0² ²

Conclusão: o tamanho mínimo da amostra deve ser 121 horas de treinamento.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 129

13
5.5 - Determinação do Tamanho necessário da Amostra para estimar a Proporção

Considere uma população com uma proporção p de objetos que apresentam certas
características de interesse. Para um intervalo de confiança de 100(1-α)% construído a
partir de uma grande amostra (n ≥ 30) extraída com uma proporção f de objetos com a
característica considerada, extraída com reposição, tem-se que:
% &
Zα/2 =
'()*')

onde f – p = e é o erro de estimativa.

Explicitando-se n, tem-se: n = /² %( %)


Exemplo: Com objetivo de estimar a proporção de itens defeituosos numa produção,


um Engenheiro de Produção deseja extrair uma amostra de itens. Uma amostra piloto de
40 itens apresentou 4 defeituosos. Qual deve ser o tamanho da amostra definitiva para
que o erro de estimação seja no máximo 3% a um nível de confiança de 95%?

Solução

f =  = 0,1; e = 0,03

1 −  = 0,95
  = 0,05 " ; logo Zα/2 = 1,96
/2 = 0,025

n = /² %( %) = ,2² ,( ,) = 384,16


0² ,²
Conclusão: o tamanho da amostra deve ser 385.

5.6 - Intervalo de Confiança para Variância populacional

Se uma variável aleatória x admite distribuição normal de probabilidades com média µ e


variância σ²

3² (4 − 1)

14
Tem distribuição Quiquadrado χ²(n – 1)

O Intervalo de Confiança escrito em função da variável χ²(n – 1) assume a forma:

P( χ²(1 – α/2) ≤ χ² ≤ χ²(α/2) ) = 1 – α

Substituindo-se o valor do χ² no intervalo, obtém-se:


² ( )
P( χ²1 – α/2 ≤ ² ≤ χ²α/2 ) = 1 – α

P(  ≤ ² ≤  )=1–α
6² ( 7/) 3² (4−1) 6²(7/)

3² (4−1)
P( ≤ σ² ≤ 3² (4−1) ) = 1 – α
6²( 7/) 6²(7/)

Exemplo: Uma máquina produz uma grande quantidade de peças e o número de peças
defeituosas da produção se distribui normalmente com variância σ²(x) = 16. Com o
objetivo de diminuir a variabilidade do processo, foi providenciada uma reforma na
máquina. Uma amostra aleatória de 51 peças produzidas após a reforma forneceu
variância 14. Construa um intervalo de confiança de 98% para a nova variância
populacional.

Solução

n = 51 peças, logo gl (grau de liberdade) = n – 1 = 50

Variância amostral s² = 14

1 – α = 98% ; α = 0,02 ; α/2 = 0,01

Da Tabela de Distribuição Quiquadrado (Apêndice), temos:

χ²(1 – α/2) = χ²(0,99) = 76,2

χ² (α/2) = χ²(0,01) = 29,7

Teremos então o seguinte intervalo de confiança para a variância:

3² (4−1)
P( ≤ σ² ≤ 3² (4−1) ) = 1 – α
6²( 7/) 6²(7/)

P ( 14(51 – 1) ≤ σ² ≤ 14(51 – 1) ) = 0,98


, 2,
P ( 9,186 ≤ σ² ≤ 23,569) = 0,98

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 149

15
5.7 Intervalo de Confiança para Diferença de duas Médias

Consideramos duas populações normais, ou seja, N (µ1 ; σ²1) e N (µ2 ; σ²2)


independentes e com σ²1 e σ²2 conhecidas. Assim, ao selecionarmos amostras das duas
populações de tamanho n1 e n2, pelo Teorema do Limite Central, sabemos:

X 1 ~ N( µ1; ₁² ) e X ₂ ~ N( µ₂; ₂² )


₁ ₂

Logo, X ₁ - X ₂ ~ (µ₁ - µ₂; ₁² - ₂² )


₁ ₂
Assim, o Intervalo de confiança:

P( ( X ₁ - X ₂) - Zα/2
₁² ₂² < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2
₁² ₂²
+ +
)=1–α
₁ ₂ ₁ ₂

Observação: Caso σ₁² e σ₂² não sejam conhecidos, e a amostra n < 30, devemos
aproximar o valor da variância populacional pela variância amostral s₁² e s₂² e substituir
a variável Normal Padronizada, Z, pela variável t de Student.

Exemplo: Duas populações normais independentes, com distribuições x1 e x2,


apresentam σ(x1) = 5 e σ(x2) = 2. Uma amostra aleatória de 12 elementos da primeira
população apresentou x1 = 34. Uma amostra aleatória de 8 elementos da segunda
população apresentou x2 = 9,4. Calcule o intervalo de confiança de 98% para a
diferença µ₁ - µ₂.

Solução

P( ( X ₁ - X ₂) - Zα/2
₁² ₂² < (µ₁ - µ₂) < ( X ₁ - X ₂) + Zα/2
₁² ₂²
+ +
)=1–α
₁ ₂ ₁ ₂

P [ (34 – 9,4) – Zα/2


² ² < (µ₁ - µ₂) < (34 – 9,4) + Zα/2
² ²
+ +
] = 0,98
 =  =
1 −  = 0,98
  = 0,02 " ; logo, temos Zα/2 = 2,325
/2 = 0,01

P [ 24,6 – 2,325(1,607) < (µ₁ - µ₂) < 24,6 + 2,325(1,607) ] = 0,98

Assim, o intervalo de confiança para a diferença µ₁ - µ₂ será:

P [ 20,864 < (µ₁ - µ₂) < 28,336 ] = 0,98

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.140, 141

16
5.8 Intervalo de Confiança para a diferença entre duas Proporções

A distribuição amostral da proporção em duas populações pode ser amostrada,


considerando-se amostras de tamanho n1 da primeira população e amostras de tamanho
n2 da segunda população. Obtém-se:

µ (f₁) = p₁ µ (f₂) = p₂

σ²(f₁) = %₁?₁ σ²(f₂) = %₂?₂


₁ ₂

q₁ = (1- f₁) q₂ = (1- f₂)

Se x = f₁ - f₂ , então temos:

µ (x) = µ (f₁) - µ (f₂) = p₁ - p₂ e

σ²(x) = σ²(f₁) + σ²(f₂) = %₁?₁ + %₂?₂ , portanto σ(x) =


f₁q₁
+
f₂q₂
₁ ₂ n₁ n₂
Aplicando-se a mudança de variável de x para Z:

C D
Z =  = (E₁ E₂) (F₁ F₂)

G₁H₁ G₂H₂
1
₁ ₂

Logo, o Intervalo de Confiança:

P [ (f₁ - f₂) - Zα/2


E₁I₁ E₂I₂ < p₁ - p₂ < (f₁ - f₂) + Zα/2
E₁I₁ E₂I₂
+ +
]=1–α
J₁ J₂ J₁ J₂

Exemplo: Duas máquinas produzem o mesmo tipo de peça, que são misturadas para
embalagem posterior. Uma amostra de 40 peças da primeira máquina apresentou 1 peça
defeituosa, enquanto uma amostra de 36 peças da segunda máquina apresentou 2 peças
defeituosas. Calcule, ao nível de 98%, um intervalo de confiança para a diferença das
proporções de peças defeituosas na produção dessas máquinas.

Solução

f₁ =  = 0,025 f₂ =  = 0,055
 
q₁ = (1 – f₁) = 0,975 q₂ = (1- f₂) = 0,945

n₁ = 40 n₂ = 36

17
1 −  = 0,98
  = 0,02 " ; logo, temos Zα/2 = 2,325
/2 = 0,01

Portanto, o intervalo de confiança será:

P [ (f₁ - f₂) - Zα/2


E₁I₁ E₂I₂ < (p₁ - p₂) < (f₁ - f₂) + Zα/2
E₁I₁ E₂I₂
+ +
]=1–α
J₁ J₂ J₁ J₂
P [ - 0,03 – 2,325 (0,0453) < (p₁ - p₂) < - 0,03 + 2, 325 (0,0453) ] = 0,98

P [ - 0,135 < (p₁ - p₂) < 0,0753 ] = 0,98

Conclusão: A diferença das proporções de peças defeituosas na produção dessas


máquinas varia de -13,5% à 7,53%.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.145

Exercícios

5.1) Deseja-se estimar a média do valor de vendas, por estabelecimento varejista,


durante o último ano, de um determinado produto. O número de estabelecimentos
varejistas é bastante grande. Determinar o intervalo de confiança de 95% dado que os
valores de venda,são considerados normalmente distribuídos, sendo X = $ 3425, σ = $
200, e n = 25.

Resposta: $3346,60 à $3503,40

5.2) O diâmetro médio de uma amostra de n = 12 bastões cilíndricos incluídos em um


carregamento é de 2,350 mm com desvio padrão de 0,050mm. A distribuição dos
diâmetros de todos os bastões incluídos no carregamento é aproximadamente normal.
Determinar o intervalo de confiança de 99% para estimar o diâmetro médio de todos os
bastões incluídos no carregamento.

Resposta: 2,307 à 2,393 mm

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 140

5.3) Procurando dimensionar a ajuda de custo para seus 50 vendedores, uma empresa
acompanhou os gastos de 15 vendedores e verificou despesa média de 20 u.m. Se a
empresa acredita que o desvio padrão para o gasto é 2 u.m., determine um intervalo de
confiança de 98% para o gasto médio dos vendedores desta empresa.

18
Resposta: 18,98 à 21,02 u.m.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 114

5.4) Uma amostra de 5 elementos selecionados de uma população normal de 200


elementos apresentou os valores: 120, 98, 106, 145, 92. Calcule o intervalo de confiança
de 95% para a média da população.

Resposta: 85,94 à 138,46

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 121

5.5) Uma empresa de pesquisa de mercado faz contato com uma amostra de 100
homens em uma grande comunidade e verifica que uma proporção de 0,40 na amostra
prefere lâminas de barbear da marca YY em vez de qualquer outra marca. Determine o
intervalo de confiança de 95% para proporção de todos os homens na comunidade que
preferem a lâmina de barbear YY.

Resposta: 0,30 à 0,50; ou 30% à 50%

5.6) Para uma amostra de 30 empregados de uma grande empresa, o salário médio
horário foi X ₁ = $ 7,50 com s₁ = $ 1,00. Em uma segunda grande empresa, o salário
médio horário para uma amostra de 40 empregados foi X ₂ = $ 7,05 com s₂ = $ 1,20.
Estimar a diferença dos salários médios horários das duas empresas, usando um
intervalo de confiança de 90%.

Resposta: $ 0,02 à $ 0,88 por hora

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 152

5.7) Um pequeno fabricante comprou um lote de 200 pequenas peças eletrônicas de um


saldo de estoques de uma grande firma. Para uma amostra aleatória de 50 destas peças,
constatou-se que 5 eram defeituosas. Estimar a proporção de todas as peças que são
defeituosas no carregamento, utilizando um intervalo de confiança de 95%.

Resposta: 0,03 à 0,17; ou 3% à 17%

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 152

19
5.8) Um guarda de trânsito vistoriou 200 carros em um bairro de certa cidade e
constatou que 25 motoristas não estavam usando o cinto de segurança no momento da
vistoria. Determine um intervalo de confiança de 95% para a proporção de motoristas
que usam regularmente o cinto de segurança neste bairro.

Resposta: 0,8292 à 0,9208; ou 82,92% à 9,08%

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 132

5.9) O departamento de controle de qualidade amostrou aleatoriamente 60 lâmpadas


produzidas antes e depois de um ajuste nas máquinas de sua linha de produção, obtendo
antes do ajuste 4 defeituosas e depois 3 defeituosas. Ao nível de confiança de 95%,
pode-se afirmar que a diferença das proporções de lâmpadas defeituosas produzidas
após o ajuste antes do ajuste apresentam diferença significativa?

Resposta: Não. (- 0,100 < p₁ - p₂ < 0,067)

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 146

5.10) Para um produto particular, a média de vendas por estabelecimento no último ano,
em uma amostra de n = 10 estabelecimentos foi X = $ 3425 com s = $ 200. Supõe-se
que as vendas por estabelecimento sejam normalmente distribuídas. Estimar (a)
variância e (b) o desvio padrão das vendas deste produto em todos os estabelecimentos,
no ultimo ano, utilizando um intervalo de confiança de 90%.

Resposta: (a) 21278 < σ² < 108271 ; (b) 145,9 < σ < 329,0

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 153, 154

5.11) Deseja-se conhecer a permanência média de pacientes em um hospital, a fim de


estudar uma possível obra de ampliação do mesmo. Dispõe-se de dados referentes à
permanência expressos em dias de 600 pacientes, obtendo-se os seguintes resultados X
= 12,3 dias, s = 8 dias. Pede-se: (a) Encontre o intervalo de confiança de 95% para a
permanência média. (b) Qual a probabilidade de risco de µ > 13?

Resposta: (a) 11,6599 à 12,9401 dias; (b) 0,01618; ou 1,62%

5.12) Em um parque existe uma população muito grande de esquilos. De uma amostra
aleatória de 40 destes esquilos achou-se que 4 estão infectados com o bacilo da peste.

20
Pede-se: (a) Determine um intervalo de confiança de 95% para a verdadeira proporção
de esquilos infectados na população. (b) de que tamanho deveria ser tomada a amostra
para estimar a dita proporção com um erro não maior que 5% com um nível de
confiança de 99%?

Resposta: (a) 0,007 à 0,192; ou 0,7% à 19,2%; (b) 238

5.13) As caixas de cereal produzidos em uma fábrica devem ter um conteúdo de 16 o.


Um inspetor tomou uma amostra que forneceu os seguintes pesos em o:

15,7; 15,7; 16,3; 15,8; 16,1; 15,9; 16,2; 15,9; 15,8; 15,66

Diga se é razoável que o inspetor, utilizando um coeficiente de confiança de 95%


ordene que o fabricante seja multado.

Resposta: 15,746 a 16,065 o. O inspetor não deve multar o fabricante já que o valor esperado
está dentro do intervalo de confiança das amostras analisadas.

5.14) Uma amostra de 800 eleitores indicou uma preferência de 25% para um
determinado candidato. Pede-se: (a) Determine um intervalo de 98% de confiança para
a proporção de todos os eleitores que têm preferência por esse candidato. (b) determine
o tamanho necessário da amostra para se obter um intervalo de confiança de 98% para a
proporção na população com uma amplitude de ± 2%.

Resposta: (a) 0,214 à 0,286; ou 21,4% à 28,6% (b) 2537

5.15) Uma fundição produz blocos para motor de caminhões. Os blocos têm furos para
as camisas e deseja-se verificar qual é o diâmetro médio no processo do furo. A empresa
retirou uma amostra de 36 blocos e mediu os diâmetros de 36 furos (1 a cada bloco). A
amostra acusou média de 98,0 mm e desvio padrão de 4,0 mm. Construa um intervalo
de confiança de 99%. Se o processo deveria ter média de 100 mm, há evidência (com o
mesmo nível de confiança) de que a média do processo não está no valor ideal?
Explique.

Resposta: 96,2828 a 99,7171 mm. A média está por baixo do valor ideal com uma confiança de
99%.

5.16) Duas máquinas são usadas para encher garrafas de plástico com detergente para
lavagem de pratos. Os desvios-padrão do volume de enchimento são conhecidos como
sendo σ 1 = 0,10 onça fluida e σ 2 = 0,15 onça fluida para as duas máquinas,
respectivamente. Duas amostras aleatórias de n1 = 12 garrafas da máquina 1 e n2 = 10
garrafas da máquina 2 são selecionadas. Os volumes médios de enchimento nas
amostras são X 1 = 30,87 onças fluidas e X 2 = 30,68 onças fluidas. Suponha

21
normalidade. Construa um intervalo bilateral de confiança de 90% para a diferença nas
médias do volume de enchimento. Interprete esse intervalo.

Resposta: 0,099 < (µ₁ - µ₂) < 0,281

5.17) Uma amostra aleatória de dez recém nascidos em uma maternidade deu os
seguintes valores de peso, em quilogramas, no momento do nascimento:

2,8; 3,2; 4,1; 3,5; 3,4; 3,0; 3,2; 3,2; 2,7; 2,3

Suponha que o peso de recém nascidos é uma variável aleatória normal X.


(a) Supondo que o desvio padrão de X seja conhecido e igual a 0,5 kg, determine
um intervalo de confiança de 95% para o valo da média dos pesos de recém
nascidos nessa maternidade.
(a) Se o desvio padrão de X é um valor desconhecido, determine um intervalo de
confiança de 95% para esse valor médio.
(b) Repita os itens (a) e (b) para um intervalo de confiança de 99%.
(c) Compare os intervalos obtidos nos itens anteriores e verifique se o intervalo
aumenta ou diminui (i) quando o desvio padrão é desconhecido e (ii) quando o
nível de confiança aumenta.

Resposta: (a) 2,8201 à 3,4399 kg ; (b) 2,7723 à 3,4877 Kg ; (c) 2,72 à 3,53 Kg ; 2,62 à 3,63
Kg; (d) O IC aumenta quando o desvio padrão é desconhecido e também quando o nível de
confiança aumenta.

5.18) Os seguintes números são as notas de 15 estudantes do curso de Estatística II:

6,5; 4,0; 5,0; 6,0; 7,5; 3,5; 8,0; 4,5; 7,0; 5,5; 4,0; 5,5; 8,5; 6,5; 5,5

Supondo que a população de notas está normalmente distribuída, construa um intervalo


de confiança de 95% para a variância σ² e desvio padrão σ.

Resposta: 1,2187 < σ² < 5,6542; 1,1040 < σ < 2,3779

22
Capítulo 6 - TESTE DE HIPÓTESE

Quando quisermos avaliar um parâmetro populacional, sobre o qual não possuímos


nenhuma informação com respeito a seu valor, não resta outra alternativa a não ser
estimá-lo através do intervalo de confiança.

No entanto, se tivermos alguma informação com respeito ao valor do parâmetro que


desejamos avaliar, podemos testar esta informação no sentido de aceita-la como
verdadeira ou rejeitá-la.

- Ho Hipótese nula: informação à respeito do valor do parâmetro que queremos avaliar

- Ha Hipótese alternativa: afirmação à respeito do valor do parâmetro que aceitamos


como verdadeiro caso Ho seja rejeitada.

Portanto, o Teste de Hipótese é uma regra de decisão que permite aceitar ou rejeitar
como verdadeira uma hipótese nula Ho, com base na evidência amostral

Isto significa que utilizaremos uma amostra desta população para verificar se a amostra
confirma ou não o valor do parâmetro informado pela hipótese Ho.

Na realização de um teste de hipótese, dois erros podem ser cometidos:

ERRO TIPO I: é aquele que se comete ao rejeitar uma hipótese que é correta. A
probabilidade desse erro é simbolizada por α e é definido pelo nível de significância
exigido no teste.

ERRO TIPO II: é o erro que se comete ao aceitar uma hipótese que é incorreta. A
probabilidade desse erro é simbolizada por β.

A medida que diminui α o β é aumentado e vice-versa, por isso é difícil controlar os


dois erros simultaneamente. Na prática, é comum usar apenas α e teremos os testes de
significância.

Construção de um Teste de Hipótese

a) Formular as hipóteses Ho e Ha
b) Escolher a variável teste
c) Arbitrar o nível de significância α
d) Determinar as regiões de aceitação e rejeição de Ho
e) Conclusão: aceitar ou rejeitar Ho

23
6.1 - Teste da Média Populacional para σ² conhecida

No caso de um teste da média de uma população, com a variância conhecida, as


hipóteses são:

Ho: µ = µo

Ha: µ ≠ µo (Teste bilateral)

µ < µo (Teste unilateral esquerdo)

µ > µo (Teste unilateral direito)

A variável teste é a normal padronizada:

X µ
Zx =  com reposição
√

X µ
Zx=  K* sem reposição

√ K*)

Exemplo: Uma amostra aleatória de 40 elementos retirados de uma população normal


com desvio padrão σ = 3 apresentou um valor médio igual à X = 60. Teste, ao nível de
significância de 5%, a hipótese de que a média populacional seja igual a 59.

Solução

Hipóteses Ho: µ = 59

Ha: µ > 59

Utilizamos a variável Normal Padronizada Z, já que o desvio padrão é conhecido.


Assim, calculando Zc, temos:

X µ  2
Zc =  = L = 2,108
√ √MN

Ao nível de 5% de significância, ou seja, sendo α = 0,05 , obtemos na tabela da


Distribuição Normal – Padrão (Apêndice), o valor de Zα = 1,64.

24
Definimos assim uma região de aceitação (RA) e uma região crítica (RC) para a
hipótese nula, Ho:

Figura 6.1 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 159

Conclusão: o valor de Zc = 2,108 > Zα = 1,64 , está na região crítica para a hipótese
nula, Ho. Portanto, ao nível de significância de 5%, rejeita-se Ho, ou seja, a média
populacional é superior a 59.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 159, 160

6.2 - Teste da Média Populacional para σ² desconhecida

A distribuição t de Student é apropriada para o uso como estatística de teste de hipótese


quando a amostra é pequena (n < 30), a população está normalmente distribuída e σ é
desconhecido.

As hipóteses são:

Ho: µ = µo

Ha: µ ≠ µo (Teste bilateral)

µ < µo (Teste unilateral esquerdo)

µ > µo (Teste unilateral direito)

A variável teste padronizada:

X µ
tx = O com reposição
√

X µ
tx =
O K* sem reposição

√ K*)

com ν = n – 1 graus de liberdade.

25
Exemplo: Uma amostra de 12 elementos retirados ao acaso de uma população normal

apresentou X = 100 e Sx = 5. Teste ao nível de significância de 5%, a hipótese de que a


média populacional seja 102.

Solução

Hipóteses Ho: µ = 102

Ha: µ < 102

Utilizamos a variável t já que a amostra é pequena (n = 12), a população é normalmente


distribuída e o desvio padrão é desconhecido. Assim, calculando tc, temos:

X µ  
tc = O = P = - 1,39
√ √)Q

Ao nível de 5% de significância, ou seja, sendo α = 0,05 , obtemos da tabela de


Distribuição t de Student (Apêndice), o valor de tα = - 1,79.

Definimos, portanto, as regiões de aceitação (RA) e região crítica (RC) para a hipótese
nula Ho:

Figura 6.2 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 160

Conclusão: o valor de tc = - 1,39 > tα = - 1,79, está na região de aceitação para a


hipótese Ho. Portanto, ao nível de significância de 5%, aceita-se Ho, ou seja, aceita-se a
hipótese de que a média populacional seja 102 .

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 160

26
6.3 - Teste da Proporção Populacional

As hipóteses são:

Ho: p = p0

Ha: p ≠ p0 (Teste bilateral)

p < po (Teste unilateral esquerdo)

p > po (Teste unilateral direito)

onde p0 é o valor de p sob a hipótese Ho.

Sob a hipótese nula a proporção amostral f, no caso de grandes amostras (n ≥ 30) tem
%( %)
distribuição aproximadamente normal com média µ e desvio padrão sf =


A estatística teste é a variável normal padronizada associada a f:


% &
Zx = com reposição
'()*')

Exemplo: Uma máquina está regulada quando produz 3% de peças defeituosas. Uma
amostra aleatória de 80 peças selecionadas ao acaso apresentou 3 peças defeituosas.
Teste ao nível de 2% a hipótese de que a máquina está regulada.

Solução

A hipótese a ser testada é que a máquina está regulada, ou seja p = 0,03.

A probabilidade obtida a partir das amostras é:



=
f= = 0,0375

Hipóteses Ho: p = 0,03

Ha: p > 0,03

Calculamos o valor da variável teste Zc:


% & , ,
Zc = = = 0,393
'()*') N,NL(N,RS)

 TN

Ao nível de significância de 2%, obtemos da tabela da Distribuição Normal – Padrão o


valor de Zα = 2,055.

27
Definimos, assim, uma região de aceitação (RA) e uma região crítica (RC) para a
hipótese nula, Ho:

Figura 6.3 - Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 164

Conclusão: O valor Zc = 0,393 situa-se à esquerda do valor de Zα = 2,055 obtido na


tabela. Portanto está na região de aceitação da hipótese nula. Assim, aceita-se Ho, ou
seja, p = 0,03, ao nível de significância de 2% a máquina está regulada.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p. 163, 164

6.4 - Teste de Igualdade de Variâncias

Em muitas aplicações deseja-se verificar se duas populações têm variâncias iguais


(populações homocedásticas) ou variâncias diferentes (populações heterocedásticas).

Suponha que uma variável normalmente distribuída, tenha variância σ1² numa
população 1 e σ2² em outra população 2.

ota: Por uma questão de referência, considera-se índice 1 para a maior variância e
índice 2 para a menor.

Em algumas aplicações deseja-se saber se σ1² > σ2².

As hipóteses são Ho: σ1² = σ2² (Homocedasticidade)

Ha: σ1² > σ2² (Heterocedasticidade)

A distribuição F é a distribuição de probabilidade apropriada para a razão das variâncias


de duas amostras tomadas independentemente de populações normalmente distribuídas.

Portanto, teste se baseia na razão de variâncias amostrais: Fc = U₁²


U₂²
com (n₁ - 1) graus de liberdade no numerador e (n₂ - 1) graus de liberdade no
denominador, para uma amostra de tamanho n₁ da população 1 e n₂ da população 2 e
sendo S12 e S22 as estimativas de σ1² e σ2² respectivamente.

28
A hipótese Ho será rejeitada num nível de significância α se Fc > Fα,(n1 - 1),(n2 - 2) e aceita
caso contrário.

*sendo Fc o valor calculado através das variâncias amostrais e Fα,(n1 - 1),(n2 - 2) o valor
obtido da tabela da Distribuição F (Apêndice).

Exemplo: É projetado um novo processo de moldagem para reduzir a variabilidade dos


diâmetro de fundição. Para uma amostra de n1 = 10 fundições com o processo antigo,
teve-se s1 = 5,8 mm. Para uma amostra de n2 = 8 fundições com o novo processo, teve-
se s2 = 4,2 mm. Considerando-se α = 5%, pode-se afirmar que a variação do processo
antigo é maior que no novo processo?

Solução

Processo antigo: n1 = 10; s1 = 5,8 mm; s12 = 33,64

Novo processo: n2 = 8; s2 = 4,2 mm; s22 = 17,64

Hipóteses Ho: σ1² = σ2²

Ha: σ1² > σ2²

Variável Teste: Fc = ₁² = , = 1,91


₂² ,
Regra de decisão α = 5%

gl 1: ν1 = n1 – 1 = 10 – 1 = 9; gl2: ν2 = n2 – 1 = 8 – 1 = 7

logo, Ftabelado = 3,68

Conclusão: Fc = 1,91 < Ftabelado= 3,68, portanto aceita-se Ho. Ou seja, a um nível de
significância de 5%, não existe diferença na variabilidade dos dois processos.

6.5 - Teste da Variância (usando a Distribuição Quiquadrado)

Para uma população normalmente distribuída, a razão


² ( )

segue uma distribuição de probabilidade χ², existindo uma Distribuição Quiquadrado


diferente de acordo com (n – 1) graus de liberdade.

29
Portanto, a estatística usada para testar um valor hipotético da variância da população

² ( )
χ² = ²

Exemplo: A média da vida útil para uma amostra de n = 10 lâmpadas é x = 4000 horas,
com um desvio padrão de s = 200 horas. Supõe-se que a vida útil das lâmpadas, em
geral, seja normalmente distribuída. Suponha que, antes de ser coletada a amostra, foi
feita a hipótese de que o desvio padrão não era maior do que σ = 150. Com base nos
resultados amostrais, teste tal hipótese ao nível de significância de 1%.

Solução

Hipóteses Ho: σ² ≤ 22500 (σ² = 150²)

Ha: σ² > 22500


² ( ) ² ( )
Variável teste χ² = ² ²
= = 16

Da tabela da Distribuição Quiquadrado, obtemos o valor de χ²(α = 1% ; gl = 10- 1 = 9) = 21,67.

Conclusão: Como χ²calculado =16 < χ²tabelado = 21,67, aceita-se Ho, ao nível de
significância de 1%. Ou seja, o desvio padrão não é maior que σ = 150.

6.6 - Teste da Diferença entre duas Médias (usando Distribuição ormal -


Padronizada)

O melhor estimador para µ1 e µ2 é X 1 e X 2, respectivamente.

V X  X W ( µ µ)
A distribuição amostral de X 1 e X 2 é normal e Zc =

₁²1₂²
₁ ₂
As hipóteses são Ho: µ1 = µ2

Ha: µ1 ≠ µ2

30
Figura 6.4 Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia,
Administração, Ciências Contábeis. p. 139

O teste da diferença entre duas médias é, portanto, um teste bilateral e assim temos uma
região de aceitação (- Zα/2 < Zc < Zα/2) e duas regiões críticas ( Zc < - Zα/2 e Zc > Zα/2).
Tomamos a decisão comparando-se esses valores de Zc e Zα/2.

Exemplo: A média de salários semanais de uma amostra de n1 = 30 empregados em


uma grande indústria é X 1 = 180,00 , com desvio padrão amostral de s1 = 14,00. Para
uma outra grande empresa, uma amostra de n2 = 40 empregados apresentou média X 2 =
170,00 , com desvio padrão de s2 = 10,00. Teste a hipótese de que não existe diferença
entre os valores dos salários semanais médios nas duas firmas, usando nível de
significância de 5%.

Solução

Hipóteses Ho: µ1 = µ2

H a: µ1 ≠ µ2

Sendo, X 1 = 180,00 X 2 = 170,00

s1 = 14,00 s2 = 10,00

n1 = 30 n2 = 40

Nota: como n1 e n2 são suficientemente grandes, o desvio padrão amostral se aproxima


do desvio padrão populacional.

V X  X W
Zc = = =  = 3,327

₁²1₂²
)M²1 )N²
₁ ₂ LN MN

α = 5%, logo temos da tabela Normal – Padrão (Apêndice): Zα/2 = 1,96

Conclusão: Como Zc = 3,327 > Zα/2, rejeita-se Ho num nível de significância de 5%. Ou
seja, as duas firmas apresentam diferença entre os valores médios dos salários semanais.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 176

31
6.7 - Teste da Diferença entre duas Médias (usando Distribuição t de Student)

No caso anterior, se σ² não for conhecido ou os tamanhos das amostras (n1 e n2) for
menor que 30, use aproximação de σ²(x) por s²(x), utilizando a distribuição t de Student.

X X ₁ X ₂Y (µ₁ µ₂)
tc =

O₁²1O₂²
₁ ₂
Assim como no caso anterior, sendo este um teste bilateral, temos uma região de
aceitação (- tα/2 < tc < tα/2) e duas regiões críticas ( tc < - tα/2 e tc > tα/2). Tomamos a
decisão comparando-se esses valores de tc e tα/2.

Exemplo: Para uma amostra aleatória de n1 = 10 lâmpadas, a vida útil média foi
X 1 = 4000 horas, com s1 = 200. Para outra marca de lâmpadas, cuja vida útil também
supõe-se ser normalmente distribuída, uma amostra n2 = 8, apresentou média X 2 =
4300 horas, e desvio padrão amostral s2 = 250. Teste a hipótese de que não existe
diferença entre a média de vida útil das duas marcas de lâmpadas, usando nível de
significância de 1%.

Solução

Hipóteses Ho: µ1 = µ2

Ha: µ1 ≠ µ2

Sendo, X 1 = 4000 X 2 = 4300

s1 = 200 s2 = 250

n1 = 10 n2 = 8

VX X W  



QNN² QPN²
= = - 2,76

1 T
tc =

O₁²1O₂² )N
₁ ₂
A tabela da Distribuição t (Apêndice) nos fornece t (α/2 = 0,005 ; gl = 16) = 2,921

Obs: graus de liberdade gl = n1 + n2 – 2 = 10 + 8 -2 =16

Conclusão: Como tc encontra-se na região de aceitação (- tα/2 < tc = - 2,76 < tα/2).
Conclui-se que, aceita-se Ho, ao nível de significância de 1%. Ou seja, a média da vida
útil das duas marcas de lâmpadas são iguais.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 177

32
Exercícios

6.1) O fabricante de um novo automóvel compacto afirma que o consumo médio de


gasolina é de 35 milhas por galão, em estrada. Em 40 provas, o carro fez uma média de
34,5 milhas por galão com um desvio padrão de 2,3 milhas por galão. Pode-se afirmar
que o fabricante está mentindo, ao nível de significância de 5%?

Resposta: Não se pode afirmar que o fabricante está mentindo. Aceita-se Ho

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 173

6.2) O valor médio de vendas por estabelecimento varejista, durante o último ano, de
um particular produto, foi de X = $ 3425 para uma amostra de n = 25 estabelecimentos.
Com base em dados de vendas de outros produtos similares, supõe-se que a distribuição
das vendas seja normal e que o valor do desvio padrão da população seja σ = $ 200. Foi
afirmado que o verdadeiro valor de vendas por estabelecimento é no mínimo de $ 3500.
Testar esta afirmação ao nível de significância de (a) 5% e (b) 1%.

Resposta: (a) Rejeita Ho; (b) Aceita Ho

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 172

6.3) Uma população normal apresenta historicamente o valor médio de 60 unidades.


Um analista, duvidando que este valor persista na atualidade, levantou uma amostra
aleatória de 20 elementos, obtendo valor médio de 55 unidades com desvio padrão de 2
unidades. Teste ao nível de significância de 5% a hipótese de que a média histórica é
verdadeira.

Resposta: Rejeita-se Ho

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.161

6.4) Um projeto de investimento está sendo avaliado pelo método pay-back. Uma
simulação envolvendo vários cenários futuros forneceu os seguintes tempos de retorno
do investimento (em anos): 2,8; 4,3; 3,7; 6,4; 3,2; 4,1; 4,4; 4,6; 5,2; 3,9. Teste ao
nível de 10% a hipótese de que o tempo médio de retorno seja de 4 anos.

Resposta: Aceita-se Ho

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.162

33
6.5) A proporção de mulheres que ocupam cargo administrativo nas empresas é
tradicionalmente de 15%. Um levantamento efetuado entre 200 administradores revelou
que 40 eram mulheres. Teste ao nível de significância de 5% a hipótese de que a
proporção de mulheres que ocupam cargo administrativo não tenha aumentado.

Resposta: Rejeita-se Ho, a proporção de mulheres aumentou.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.165

6.6) Uma agência de viagens tem um tradicional plano de férias que é oferecido a todos
os possíveis clientes que procuram a agência. O índice de respostas positivas é
historicamente 20%. Este ano, uma amostra aleatória de 50 potenciais clientes mostrou
que 15 adquiriram o plano de férias. Teste ao nível de 6% a hipótese de que o percentual
de respostas positivas não tenha aumentado este ano.

Resposta: Rejeita-se Ho, o número de respostas favoráveis aumentou.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.166

6.7) Deseja-se testar a diferença entre duas médias da renda de duas comunidades. Para
uma amostra de n₁ = 30 famílias na primeira comunidade, a renda média anual é $15500
com desvio padrão amostral de s₁ = 1800. Para uma amostra de n₂ = 40 famílias na
segunda comunidade, a renda média anual é $14600 e s₂ = 2400. Teste a hipótese ao
nível de significância de 1%.

Resposta: Aceita-se Ho, as duas comunidades apresentam montante médio de renda iguais.

6.8) Com objetivo de testar a eficiência de dois métodos de aprendizagem, eles foram
aplicados durante um ano em duas escolas da mesma organização. Ao final do curso,
selecionou-se uma amostra aleatória de 10 alunos de cada escola e a mesma tarefa foi
proposta a estes alunos. No primeiro grupo, o tempo médio para concluir a tarefa foi
2h46min, enquanto no segundo grupo a média foi de 2h31min, com desvio padrão de
23min e 16min respectivamente. Supondo que a distribuição do tempo de realização das
tarefas são normais, é possível afirmar que o segundo método é mais eficiente que o
primeiro ao nível de significância de 5%?

Resposta: Aceita-se Ho. Os métodos têm a mesma eficiência.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.172

34
6.9) Um órgão de defesa do consumidor testa regulamente o peso de botijões de gás
para uso doméstico. Eles devem apresentar um peso médio líquido de 13kg, com desvio
padrão não superior a 250g. Uma amostra aleatória realizada no depósito de uma
companhia engarrafadora de gás revelou entre 26 botijões um desvio padrão de 305g.
Testar a hipótese de os botijões estarem dentro das especificações, contra a alternativa
de os botijões estarem fora de especificação, ao nível de 5%.

Resposta: Aceita-se Ho. Ao nível de significância de 5%, o produto está dentro da especificação.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.182, 183

6.10) Uma amostra aleatória de 20 elementos selecionados de uma população normal


apresentou s²(x) = 1,3. Teste ao nível de significância de 5% a hipótese σ²(x) = 4, contra
a alternativa σ²(x) < 4.

Resposta: Rejeita Ho, a variância da população é menor que 4.

Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística para os cursos de Economia, Administração,
Ciências Contábeis. p.180

6.11) O peso dos camundongos em um laboratório é uma variável que se distribui


normalmente com média 25,0 g e desvio padrão igual a 0,8 g. Uma alimentação
balanceada é dada aos camundongos durante certo período. Supõe-se que a alimentação
não muda a variância dos pesos. Uma amostra de 25 camundongos é selecionada e
verifica-se que o peso médio dessa amostra é igual a 25,2 g. testar a hipótese de que
houve aumento do peso médio ao nível de significância de 5%.

Resposta: Aceita Ho, os pesos se mantiveram igual a um nível de significância de 5%.

6.12) O rótulo de uma garrafa indica que ela contém 1,5 litros de um refrigerante. Um
órgão de fiscalização deseja testar esta afirmação e multar o fabricante se constatar que
o valor médio da quantidade de refrigerante for inferior a 1,5 litros. Com esta finalidade,
o órgão faz uma amostra aleatória de 30 garrafas e obtém uma média amostral de 1,482
litros e um desvio padrão amostral de 0,025 litros. Verificar se a afirmação do fabricante
pode ser rejeitada ao nível de 10% e de 5%.

Resposta: Rejeita-se a afirmação do fabricante a um nível de significância de 10% e de 5%.

6.13) O fabricante de uma droga medicinal reivindicou que ela era 90% eficaz em curar
uma alergia, em um período de 8 horas. Se a droga é aplicada a 200 doentes curando a
170 deles, pode-se considerar correta a reivindicação do fabricante?
35
Resposta: Rejeita Ho, a afirmação do fabricante não é correta a um nível de significância de 5%.

6.14) Acredita-se que duas marcas de cigarros, a e b, são semelhantes quanto ao


conteúdo de nicotina. Um laboratório fez 5 determinações do conteúdo de nicotina(em
miligramas) para cada marca, com os seguintes resultados:

Marca A: 31; 35; 28; 34; 33

Marca B: 27; 26; 30; 28;25

Com base nestas observações, pode-se manter a hipótese de que as duas marcas
apresentam igual conteúdo de nicotina? Considere que a variância populacional é igual
a variância amostral.

Resposta: Rejeita Ho, as duas marcas não apresentam o mesmo conteúdo de nicotina a um nível
de 5%.

6.15) Examinaram-se duas classes constituídas de 40 e de 50 alunos, respectivamente.


Na primeira, o grau médio foi 74, com desvio padrão 8, enquanto, na segunda, a média
foi 78, com desvio padrão 7. Há uma diferença significativa entre os aproveitamentos
das duas classes, no nível de significância de (a) 5% e (b) 1%?

Resposta: (a) Rejeita Ho, há diferença significativa entre os aproveitamentos das duas classes
com um nível de significância de 5% e a segunda classe é, provavelmente, melhor. (b) Não há
diferença significativa entre as classes num nível de significância de 1%.

6.16) Para testar o efeito de um novo medicamento no tratamento da diabete ele é


ministrado a 9 pacientes cujos conteúdos de açúcar no sangue, em jejum, forma
determinados antes e depois de algum tempo de iniciado o tratamento. Obteve-se os
seguintes resultados, em mg/ 100ml:

Paciente 1 2 3 4 5 6 7 8 9
Antes 120 110 118 128 126 124 132 139 125
Depois 116 112 114 120 130 123 124 130 118
Tabela 6.1 – Pacientes antes e depois do tratamento

Pode-se concluir, com base nesta experiência, a um nível de significância de 5%, que o
medicamento é eficaz na redução do açúcar no sangue?

Resposta: Rejeita Ho, as médias de açúcar são diferentes antes e depois, a um nível de
significância de 5%. Conclui-se que o medicamento é eficaz na redução do açúcar no sangue.

36
6.17) Uma máquina que empacota bolsas de café automaticamente está regulada para
empacotar bolsas cujos pesos estão distribuídos normalmente com média µ e variância
400. A máquina foi regulada para µ = 500 gramas. Decide-se escolher uma amostra de
16 bolsas a cada 30 minutos com o objetivo de verificar se a produção está controlada
ou não , isto é, se µ = 500 gramas ou não. Se uma dessas amostras tem média 492
gramas, deve-se deter a produção para verificar se a máquina está corretamente
regulada?

Resposta: Aceita Ho, a produção não seria interrompida. Conclui-se que a máquina esteja
corretamente regulada.

6.18) Criou-se dois grupos de animais, com 50 animais em cada grupo, com duas dietas
diferentes. Ao final de 5 meses o peso médio do grupo 1 foi 149,2 gramas, com um
desvio padrão de 8 gramas; o segundo grupo apresentou um peso médio de 152,3
gramas, com desvio padrão de 10 gramas. Devemos aceitar a hipótese de que uma dieta
é melhor que a outra?

Resposta: A segunda dieta é melhor que a primeira, a um nível de significância de 5%.

37
Capítulo 7 - TESTE QUIQUADRADO

O Teste Quiquadrado como um procedimento de Teste de Hipótese

Os procedimentos correspondem a três testes que utilizam a Distribuição Quiquadrado


e se relacionam todos com a comparação de freqüências, obtidas em amostras, de certas
categorias, com freqüências esperadas baseadas, em cada caso, em hipóteses
particulares. Deste modo, os procedimentos são Testes de Hipótese e, portanto, possuem
relação com a análise dos resultados de uma amostra.

- Teste de Aderência

- Teste de Independência

- Teste de Homogeneidade

7.1 - Teste de Aderência

O teste de Aderência é um teste não paramétrico que é utilizado para verificar se uma
variável apresenta determinada distribuição de probabilidade (Distribuição Normal,
Binomial, Poison).

As hipóteses são:

Ho: os resultados ocorrem com as freqüências previstas pelo modelo probabilístico.

Ha: os resultados ocorrem com freqüências diferentes das previstas pelo modelo.

Sendo observada uma amostra de n valores da variável em estudo, a variável teste é o


valor quiquadrado para testar a diferença entre padrões obtidos e esperados de
freqüência:

Z (%[ %0)²
%0
χ²c =

onde fo e fe são as freqüências observadas e esperadas, respectivamente.

Obtemos χ²crítico da tabela da Distribuição do Quiquadrado (Apêndice) observando o


nível de significância α e os graus de liberdade, ν = k - m - 1, sendo k = número de
categorias dos dados e m = número dos valores de parâmetros estimados com base na
amostra.

Regra de decisão: A hipótese Ho é rejeitada num nível de significância α se χ²calculado >


χ²crítico e aceita caso contrário.

Exemplo: Um distribuidor regional de sistemas de ar condicionado dividiu sua região


em quatro territórios. A um presumível comprador da agência de distribuição informou-
38
se que as instalações do sistema estariam mais ou menos igualmente distribuídas entre
os quatro territórios. O presumível comprador toma uma amostra aleatória de 40
instalações realizadas no ano anterior, com base nos arquivos da companhia, e verifica
que a quantidade instalada em cada uma das quatro áreas é a apresentada na primeira
linha da tabela (fo), enquanto a hipótese de que as instalações estão distribuídas de igual
maneira, é dada na segunda linha, a distribuição uniforme esperada (fe).

Território
A B C D Total
Freqüência observada fo 6 12 14 8 40
Freqüência esperada fe 10 10 10 10 40
Tabela 7.1 – Instalações do sistema nos diferentes territórios

Pode-se afirmar que as freqüências estão igualmente distribuídas entre os quatro


territórios a um nível de significância de 5%?

Solução

Hipóteses

Ho: a quantidade de instalações está igualmente distribuída entre os quatro territórios;

Ha: a quantidade de instalações não está igualmente distribuída entre os quatro


territórios.

Calcula-se o valor do quiquadrado:


Z (%[ %0)² ( )² ( )² ( )² (= )² 
%0    
χ c² = = + + + =  = 4,0

Sendo o nível de significância proposto, α = 5%, e calculando-se os graus de liberdade,


obtemos da tabela da Distribuição do Quiquadrado (apêndice) o valor de χ²crítico.

gl: ν = k – m – 1 = 4 – 0 – 1 = 3

ota: a hipótese nula é de que as frequências são igualmente distribuídas, nenhuma


estimação de parâmetro é envolvida, e m = 0.

χ2crítico (ν = 3; α = 0,05) = 7,81

Conclusão: Como χ²calculado = 4,0 < 7,81, aceita-se Ho num nível de significância de 5%.
Ou seja, pode-se afirmar que as freqüências estão igualmente distribuídas entre os
quatro territórios.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 195, 196, 197

39
7.2 - Teste de Independência

Os Testes de Independência envolvem duas variáveis, e o que se testa é a hipótese de


que as duas variáveis são estatisticamente independentes. A independência implica que
o conhecimento da categoria na qual se classifica uma observação com respeito a uma
variável não afeta a probabilidade de estar em uma das diversas categorias das outras
variáveis.

As hipóteses são: Ho: as duas variáveis são independentes

Ha: as duas variáveis não são dependentes

Como intervêm duas variáveis, as freqüências observadas são colocadas em uma Tabela
de Contingência. As dimensões de tal tabela são definidas pela expressão r x k, onde r
indica o número de linhas e k indica o número de colunas.

A variável teste será:


Z (%[ %0)²
%0
χ c² =

sendo fo e fe são as freqüências observadas e esperadas, respectivamente.


Σ\Σ]

onde a freqüência esperada é equivalente à fe =

ota: recomenda-se fazer uma tabela de contingência para frequências esperadas

Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto,


encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado (Apêndice).

Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² e


aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade.

Exemplo: A tabela seguinte apresenta a reação dos estudantes à expansão do programa


de atletismo do colégio, segundo o nível do curso, em que a “divisão inferior” indica
estudante de primeiro ou segundo ano e “divisão superior” indica estudante de terceiro
ou de ultimo ano.

Reação Nível do Curso Total


Divisão inferior Divisão superior
A favor 20 19 39
Contra 10 16 26
Total 30 35 65
Tabela 7.2 – Frequência observada da reação dos estudantes à expansão do programa de atletismo

Testar a hipótese de que o nível do curso e a reação à expansão do programa de


atletismo são variáveis independentes, utilizando nível de significância de 5%.
40
Solução

Ho: o nível do curso e a reação à expansão do programa de atletismo são independentes.

Ha: o nível do curso e a reação à expansão do programa de atletismo não são


independentes.
Σ\Σ]

Calculando-se a freqüência esperada através de fe =

(2)()

por exemplo: fe = = 18, e assim consecutivamente, constrói-se a tabela da
freqüência esperada:

Reação Nível do Curso Total


Divisão inferior Divisão superior
A favor 18 21 39
Contra 12 14 26
Total 30 35 65
Tabela 7.3 – Frequência esperada da reação dos estudantes à expansão do programa de atletismo

Calcula-se então o valor do quiquadrado:


Z (%[ %0)² ( =)² (2 )² ( )² ( )²
%0 =   
χ²calculado = = + + + = 1,03

Sendo o nível de significância α = 5%, e graus de liberdade: ν = (r – 1)(k – 1)


= (2 – 1)(2 – 1) = 1; obtemos da tabela da Distribuição do Quiquadrado (Apêndice), o
valor de χ²crítico

χ²crítico = ( ν = 1; α = 0,05) = 3,84

Conclusão: Portanto, sendo χ²calculado = 1,03 < 3,84, à um nível de significância de 5%,
aceita-se Ho. Ou seja, as duas variáveis, nível do curso e reação à expansão do programa
de atletismo, são independentes.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 211, 212

7.3 - Teste de Homogeneidade

O Teste de Homogeneidade corresponde ao teste das diferenças entre K proporções


amostrais. O teste quiquadrado pode ser utilizado para testar a diferença entre K
proporções amostrais, utilizando para a análise das freqüências uma estrutura tabular de
2 x K. A hipótese nula é a de que não existe diferença entre as diversas proporções
populacionais (ou, que as diferentes proporções amostrais poderiam ter sido extraídas,
ao acaso, da mesma população).

41
Observe as hipóteses:

Ho: π1 = π2 = π3 = ... = πk (sendo π a probabilidade de cada proporção amostral)

Ha: nem todas as probabilidades são iguais

As informações são contidas na Tabela de Contingência. As dimensões de tal tabela são


definidas pela expressão r x k, onde r indica o número de linhas e k indica o numero de
colunas.

A variável teste será:


Z (%[ %0)²
%0
χ² =

Σ\Σ]

onde a freqüência esperada é equivalente à fe = , e n é o total geral, ou seja, o
total do somatório de todas as linhas da tabela de contingência (que por sua vez, é igual
ao somatório de todas as colunas).

ota: recomenda-se fazer uma tabela de contingência para frequências esperadas

Com ν = (r – 1)(k – 1) graus de liberdade e o nível de significância α proposto,


encontramos o valor de χcrítico² na tabela da Distribuição do Quiquadrado (Apêndice)

Regra de decisão: Rejeita-se Ho, ao nível de significância α se χcalculado² > χcrítico² e


aceita-se caso contrário para (r – 1)(k – 1) graus de liberdade.

Exemplo: Foi realizada uma pesquisa de opinião dentre os votantes de 4 municípios


para comparar as proporções de votantes a favor do candidato A para o governo do
estado. Foi selecionada uma amostra aleatória de 300 pessoas em cada município,
obtendo-se os resultados apresentados na tabela a seguir:

Municípios
Eleitores 1 2 3 4 Total
a favor de A 126 103 109 98 436
outro candidato 174 197 191 202 764
Total 300 300 300 300 1200
Tabela 7.4 – Frequência observada da pesquisa de opinião dentre os votantes de cada município

Considerando os dados da amostra pode-se dizer que há evidência de que a proporção


de votantes a favor do candidato A nos 4 municípios, num nível de significância de 5%,
é diferente?

42
Solução

Hipóteses: Ho: π1 = π2 = π3 = π4 (sendo π a proporção de votantes no candidato A em


cada município)

Ha: nem todas as cidades tem a mesma proporção de votantes no cadidato A


Σ\Σ]

Calculando-se a freqüência esperada através de fe =

()()

por exemplo: fe = = 109, e assim consecutivamente, constrói-se a tabela da
freqüência esperada:

Municípios
Eleitores 1 2 3 4 Total
a favor de A 109 109 109 109 436
outro candidato 191 191 191 191 764
Total 300 300 300 300 1200
Tabela 7.5 – Frequência esperada da pesquisa de opinião dentre os votantes de cada município

Calcula-se então o valor do quiquadrado:


Z (%[ %0)² ( 2)² ( 2)² (2 2)² (2= 2)²
%0 2 2 2 2
χ²calculado = = + + + +
( 2)² (2 2)² (2 2)² ( 2)²
2 2 2 2
+ + + = 6,43

Sendo o nível de significância proposto α = 5% e os graus de liberdade:


ν = (r – 1)(k – 1) = (2 – 1)(4 – 1) = 3

χ²crítico (α = 0,05; ν = 3) = 7,81

Conclusão: Portanto, sendo χ²calculado = 6,43 < 7,81, aceita-se Ho, num nível de
significância de 5%. Ou seja, a proporção de votantes no candidato A é a mesma para os
quatro municípios.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 213, 214

Exercícios

7.1) Em 200 lançamentos de uma moeda, foram observadas 115 caras e 85 coroas. Teste
a hipótese de que a moeda é legal utilizando um nível de significância de (a) 5% e (b)
1%.

Resposta: Rejeita-se a hipótese de que a moeda é legal a um nível de significância de 5%. Não
se tem o mesmo resultado a um nível de significância de 1%.

43
7.2) A tabela abaixo apresenta as freqüências observadas, ao lançar-se um dado 120
vezes. Testar a hipótese de o dado ser honesto.

Face 1 2 3 4 5 6
Freqüência observada 25 17 15 23 24 16
Tabela 7.5 – Frequência observada no lançamento de um dado

Resposta: Aceita Ho, o dado é honesto a um nível de significância de 5%.

7.3) Historicamente, um fabricante de televisores vende 40% de aparelhos com telas


pequenas, 40% com telas médias e 20% de aparelhos com telas grandes. Com o fim de
estabelecer programas apropriados de produção para o próximo mês, toma uma amostra
aleatória de 100 vendas durante o atual período e encontra que 55 dos televisores
adquiridos eram pequenos, 35 do tamanho médio e 10 grandes. Teste a hipótese de que
o padrão histórico de vendas prevalece, usando nível de significância de 1%.

Resposta: χc² = 11,25. Rejeita-se Ho.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 197

7.4) Em geral, 20% dos clientes em potencial visitados pelo vendedor de uma firma
fazem uma compra. Durante o período de testes, um novo vendedor faz 30 visitas à
possíveis clientes e realiza três vendas. Teste a hipótese nula de que este padrão de
vendas não difere do padrão histórico, usando nível de significância de 5%

Resposta: χc² = 1,30. Aceita-se Ho.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 198

7.5) Foi realizado um estudo sobre os clientes de determinada loja e comparou-se a


relação entre duas variáveis, idade e sexo. Dada a tabela abaixo, com a freqüência
observada, teste a hipótese de independência entre as duas variáveis ao nível de
significância de 1%.

Idade Sexo Total


Masculino Feminino
Menos de 30 60 50 110
30 e mais 80 10 90
Total 140 60 200
Tabela 7.6 – Frequência observada de idade e sexo de clientes

Resposta: χc² = 27,8. Rejeita-se a hipótese nula de independência a um nível de significância de


1%.

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 199, 20

44
7.6) Um gerente de um departamento de pessoal estima que uma proporção de π = 0,40
dos empregados de uma grande empresa participará de um novo programa de
investimento em ações. São feitos contatos com uma amostra aleatória de n = 50
empregados, sendo que 10 deles indicam sua intenção de participar. Teste , através do
uso do quiquadrado o valor hipotético da proporção da população, ao nível de
significância de 5%

Resposta: Rejeita-se Ho

7.7) Nas experiências que Mendel realizou com ervilhas, ele observou 315 redondas e
amarelas, 108 redondas e verdes, 101 enrugadas e amarelas e 32 enrugadas e verdes. De
acordo com a sua teoria da hereditariedade, os números deveriam estar na proporção
9:3:3:1. Há evidência para se duvidar de sua teoria, ao nível de significância de (a) 1% e
(b) 5%?

Resposta: (a) Aceita Ho; (b) Aceita Ho

7.8) Em um determinado dia, o gerente de um supermercado observou o número de


clientes que escolheram cada um dos 8 caixas disponíveis na saída. Os resultados estão
dados na tabela a seguir:

CAIXA I II III IV V VI VII VIII TOTAL


Freqüência 80 100 130 145 120 110 60 55 800
Tabela 7.7 – Frequência observada da escolha entre os caixas de um supermercado

Diga se o gerente pode afirmar que existe preferência por um dos caixas num nível de
significância igual a 0,05.

Resposta: Rejeita Ho, existe evidência de que há preferência por um dos caixas.

7.9) Uma amostra de peças forneceu a seguinte tabela de contingência sobre a qualidade
da peça por linha de produção. O gerente afirma que a qualidade da peça independe da
linha de produção, realize um teste de hipótese para verificar se o gerente está certo.

Linha Qualidade Qualidade


Aceitável Defeituosa
Primeira 368 32
Segunda 285 15
Terceira 176 24
Tabela 7.8 – Frequência observada da qualidade da peça por linha de produção

Resposta: Os dados mostram evidência de que o gerente não está certo na sua afirmação a um
nível de significância de 5%.

45
7.10) Dois pesquisadores selecionaram amostras de uma mesma cidade com o objetivo
de estimar o número de pessoas que correspondem aos grupos classificados segundo o
salário familiar por mês: A, B, C (os intervalos em reais são os mesmos para cada
grupo). Os resultados obtidos foram:

Pesquisador Grupo Total


A B C
P1 20 100 150 270
P2 30 80 150 260
Total 50 180 300 530
Tabela 7.9 – Frequência observada do número de pessoas em cada grupo de salário familiar

Os dados apresentam evidência de que as amostras de um dos pesquisadores são


suspeitas?

Resposta: Pode-se dizer que, a um nível de significância de 5% os dois pesquisadores


selecionaram as amostras corretamente.

7.11) Ao fazer um certo cruzamento, um geneticista esperava uma segregação de 4 A


para 1 B. Em uma amostra ao acaso de 500 ele observou 380 A e 120 B. Os dados
verificam a relação esperada? Use nível de significância de 1%.

Resposta: A um nível de significância de 1% os dados verificam a relação esperada.

7.12) Determinado veículo utilitário está sofrendo pesadas críticas de seus proprietários,
com relação à grande freqüência de defeitos no pneu traseiro esquerdo. Preocupado com
sua imagem, e procurando defender-se de eventuais pedido de indenização, o fabricante
do veículo resolveu coletar informações sobre 152 ocorrências de defeitos,
classificando-as por posição do pneu. Os resultados estão na tabela a seguir. Usando
nível de significância de 5%, há razão para acreditar que a probabilidade de defeito é
diferente para algumas posições?

Posição do pneu Dianteiro Dianteiro Traseiro Traseiro Total


esquerdo direito esquerdo direito
Freqüência 35 32 57 28 152
Tabela 7.10 – Frequência observada de defeitos por posição de pneu

Resposta: Há uma evidência de que as freqüências de ocorrência dos defeitos dependem da


posição do pneu a um nível de significância de 5%

46
Capítulo 8 - A ÁLISE DE VARIÂ CIA

A Análise de Variância ou AOVA é empregada para testar a igualdade entre k médias


de uma mesma população.

ota: Utilizada para médias amostrais obtidas de populações normalmente distribuídas.


Todavia, descobriu-se que o procedimento de teste não é grandemente afetado por
violações da hipótese de normalidade, quando as populações são unimodais e os
tamanhos das amostras são aproximadamente iguais.

Assumimos que uma amostra aleatória simples de tamanho ni tenha sido selecionada de
cada uma das k populações ou tratamentos.

8.1 - Estimativa dos Tratamentos – Entre a variância da população

A estimativa dos tratamentos entre a variância da população σ² é chamada de quadrado


da média devido ao tratamento, e é denotada por MSTR (Mean Square due to
Treatments):

∑c b )²
¡d) ¡ (C` ¡ a
] 
MSTR =

Sendo,

• ni = número de observações para o tratamento i;


e` ¡ = média da amostra para o tratamento i;
fb = média global dos tratamentos;


• k = número de tratamentos.

O numerador SSTR = ∑]¡g 4¡ (e` ¡ − fb)² é chamado de soma dos quadrados devido aos
tratamentos e é denotado por SSTR (Sum of Squares due to Treatments). O
denominador, (k – 1) representa os graus de liberdade associados à SSTR. Então temos:
UUhi
] 
MSTR =

Sendo a hipótese nula Ho verdadeira, o MSTR fornece uma estimativa sem viés da
variância da população σ².

47
8.2 - Estimativa dos Tratamentos – Dentro da variância da população

Esta estimativa de tratamentos dentro da variância da população σ² é chamada de


quadrado da média devido aos erros e é denotada por MSE (Mean Square due to Error).
A fórmula para MSE é:

∑c
¡d)(¡ ) ¡²
j
MSE =

Sendo:

• ni = número de observações para o tratamento i;


• si2 = variância da amostra para o tratamento i;
•  = número total de observações;
• k = número de tratamentos.

Onde o numerador SSE = ∑]¡g(4¡ −1)3¡ ² é a soma dos quadrados devido aos erros
(Sum of Squares due to Error). O denominador de MSE (N – k) corresponde aos graus
de liberdade associados ao SSE.

Hipóteses Ho: µ1 = µ2 = µ3 = ... = µk

Ha: Nem todas as médias são iguais

8.3 - Comparando as estimativas da Variância

Teste F

Considere que Ho seja verdadeira. O MSTR e MSE fornecem duas estimativas


independentes, sem viés, de σ². Para populações normais, a distribuição amostral da
razão de duas estimativas independentes de σ² segue uma distribuição F. Portanto, se a
hipótese nula é verdadeira, a distribuição amostral de MSTR/MSE é uma distribuição F
com os graus de liberdade iguais a (k – 1) para numerador e ( – k) para denominador.
kUhi
kUl
Variável teste: Fc =

Sendo o nível de significância α dado, e os graus de liberdade: ѵ₁ = (k – 1) do


numerador e ѵ₂ = ( – k) do denominador, obtemos da tabela de Distribuição F
(Apêndice) o valor de Fα

Regra de Decisão: Rejeitar Ho se Fc > Fα.

48
8.4 - Tabela A OVA

Os resultados dos cálculos precedentes podem ser exibidos convenientemente em uma


tabela denominada Tabela de Análise de Variância. A soma dos quadrados associados à
fonte de variação denominada “total” é chamada de soma total dos quadrados (SST)
onde:

SST = SSTR + SSE

Fonte de Graus de Soma dos Quadrado F


variação liberdade quadrados médio
Tratamento k-1 SSTR MSTR MSTR
Erro N-k SSE MSE MSE
Total N-1 SST
Tabela 8.1 – Tabela de Análise de Variância

Exemplo: Com o objetivo de comparar três tipos de cimento em termos da resistência à


compressão do concreto, foi realizado um experimento completamente aleatorizado,
com cinco corpos de prova de cada tipo de cimento. Os resultados forma o seguintes:

Cimento Resistência à compressão


A 9 12 10 8 15
B 20 21 23 17 30
C 10 9 12 20 11
Tabela 8.2 – Resistência à compressão do concreto nos três tipos de cimento

Faça uma ANOVA e verifique se há evidência de que existe diferença real entre as
resistências médias dos três tipos de cimentos, num nível de significância de 5%.

Solução

e` A = 10,8; sA = 2,77; sA2 = 7,7

e` B = 22,2; sB = 4,87; sB2 = 23,7

e` C = 12,4; sC = 4,4; sC2 = 19,3

E ainda, nA = nB = nC = 5
,= 1 , 1,
A média global dos tratamentos: fb =

= 15,1

SSTR = ∑]¡g 4¡ (e` ¡ − fb)² = 5(10,8-15,1)² + 5(22,2-15,1)² + 5(12,4-15,1)²

= 92,4 + 252,1 + 36,4 = 380,9


UUhi =,2
m   
MSTR = = = 190,5

49
SSE =∑]¡g(4¡ −1)3¡ ² = (5-1)7,7 + (5-1)23,7 + (5-1)19,3 = 202,8

UUl ,= ,=


]   
MSE = = = = 16,9

Calculando o valor da variável teste:


kUhi 2,
kUl ,2
Fc = = = 11,3

gl do numerador: ν1 = (k - 1) = 2

gl do denominador: ν2 = (N – k) = 12

sendo α = 0,05, temos Fα = 3,89

Conclusão: Como F = 11,3 > Fα, rejeita-se Ho ao nível de significância de 5%, ou seja, a
ANOVA apóia a conclusão de que as médias de resistência à compressão dos três tipos
de cimento não são iguais.

Exercícios

8.1) Quinze pessoas que participaram de treinamento são colocadas, de forma aleatória,
sob três diferentes tipos de avaliação. Os graus obtidos no teste de conclusão do método
de instrução são apresentados na tabela abaixo, juntamente com o grau médio de
desempenho associado a cada tipo de ensino. Usar procedimento da análise da variância
para testar a hipótese nula de que as três médias amostrais foram obtidas da mesma
população, a um nível de significância de 5%.

Método da Graus de prova Total de Média


instrução graus dos graus
A 86 79 81 70 84 400 80
B 90 76 88 82 89 425 85
C 82 68 73 71 81 375 75
Tabela 8.3 – Graus obtidos no teste de conclusão dos três métodos de intrução

Resposta: Aceita Ho

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. p. 222

8.2) Os valores da resistência à tração (Mpa) de corpos de prova de plástico preparados


por dois processos diferentes são:

50
Processo 1 Processo 2
6,1 9,1
7,1 8,2
7,8 8,6
6,9 6,9
7,6 7,5
8,2 7,9
Tabela 8.5 – Valores da resistência à tração

Os dados apresentam evidência suficiente para concluir que as elasticidades médias


(populacionais) para os dois processos são iguais? Use a ANOVA.

Resposta: Os valores da resistência à tração dos corpos de prova de plástico preparados por dois
processos diferentes são iguais a um nível de significância de 5%.

8.3) Três turmas da Estatística II são ministradas por três professores. As notas finais da
matéria são dadas na tabela seguinte:

Professor
A 7,5 9,0 8,0 4,5 8,0 7,5 6,5 6,0 4,5 9,5 3,5
B 9,0 8,0 5,0 9,0 5,0 8,5 7,5 7,5 3,0 8,0 6,0 7,5 9,5 8,0
C 7,0 8,0 5,5 9,0 7,0 7,0 8,5 4,0 6,0 7,0 5,5 1,5
Tabela 8.6 – Notas finais de Estatística II

Resposta: Não existe diferença significativa entre as notas médias dadas pelos 3 professores a
um nível de significância de 5%.

8.4) Cinco observações foram selecionadas de três populações. Os dados obtidos foram
os seguintes:

Observação Amostra 1 Amostra 2 Amostra 3


1 32 44 33
2 30 43 36
3 30 44 35
4 26 46 36
5 32 48 40
Média da amostra 30 45 36
Variância da amostra 6,0 4,0 6,5
Tabela 8.8 – Observações obtidas de três populações

a) Calcule a estimativa de σ² entre os tratamentos.


b) Calcule a estimativa de σ² dentro dos tratamentos.
c) Com o nível de significância α = 0,05, podemos rejeitar a hipótese nula de que
as médias das três populações são iguais? Explique.
d) Crie a tabela ANOVA para esse problema.

51
Resposta: (a) SSTR = 570, MSTR = 285; (b) SSE = 66, MSE = 5,5; (c) Fc = 51,82. Rejeita-se a
hipótese nula de que as médias das três populações sejam iguais

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 383

8.5) A fim de testar se o tempo médio necessário para misturar um lote de matérias é o
mesmo para máquinas produzidas por três diferentes fabricantes, a Jacob Chemical
Company obteve os seguintes resultados sobre o tempo (em minutos) necessário para
misturar os materiais. Use esses dados para testar se o tempo médio populacional para
misturar um lote de materiais difere em relação aos três fabricantes. Use α = 0,05.

Fabricante 1 Fabricante 2 Fabricante 3


20 28 20
26 26 19
24 31 23
22 27 22
Tabela 8.9 – Tempo médio amostral de cada fabricante

Resposta: Fc = 10,63. Rejeita-se a hipótese nula de que o tempo médio necessário para misturar
um lote de materiais seja o mesmo para cada fabricante.

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 384

8.6) Nova York, Boston e o Vale do Silício na Califórnia estão entre as regiões que
apresentam os maiores salários no setor de tecnologia nos Estados Unidos. Os dados
amostrais seguintes apresentam os salários anuais individuais expressos em milhares de
dólares:
Nova York Boston Vale do Silício
82 85 82
79 80 91
72 74 94
89 78 88
79 75 85
85 80
86
74

Tabela 8.10 – Salários anuais em cada região

Use α = 0,05, teste as diferenças de significância entre a média populacional de salários


no setor de tecnologia correspondentes a essas três localidades. Se existe diferença, qual
localidade parece ter a média de salário mais elevada para o setor de tecnologia?

52
Resposta: Fc = 4,99. Rejeita-se a hipótese nula de que as médias entre as três localidades sejam
iguais. A localidade com média de salário mais elevada é o Vale do Silício.

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 384

8.7) Os dados referentes às quantidades de cálcio (parte média por milhão) de água
medidas em três locais ao longo do rio São Francisco estão apresentados na tabela
abaixo:

Local 1 42 37 41 39 43 41
Local 2 37 40 39 38 41 39
Local 3 32 28 34 32 30 33
Tabela 8.11 – Quantidade de cálcio na água

Efetue uma análise de variância para testar, ao nível de significância de 0,01, se as


diferenças entre as médias obtidas nos três locais são significativas.

Resposta: Fc = 36,71. Rejeita-se a hipótese nula de que as médias sejam iguais.

8.8) Um técnico de laboratório quer comparar a resistência à ruptura de três marcas de


fios, e inicialmente, tinha planejado repetir cada medição seis vezes. Entretanto, não
dispondo de tempo suficiente, ele limita sua análise aos seguintes resultados (em
quilogramas):

Fio 1 18,0 16,4 15,7 19,6 16,5 18,2


Fio 2 21,1 17,8 18,6 20,8 17,9 19,0
Fio 3 16,5 17,8 16,1
Tabela 8.12 – Resistência à ruptura nas três marcas de fios

Supondo que esses dados constituem amostras aleatórias de três populações normais
com o mesmo desvio padrão, efetue uma análise de variância para testar, ao nível de α =
0,01 de significância se as diferenças entre as médias amostrais são significantes.

Resposta: Fc = 4,06. Aceita-se a hipótese nula de que as médias são iguais, num nível de
significância de 0,01.

53
Capítulo 9 - REGRESSÃO LI EAR

O objetivo principal da Análise de Regressão Linear é predizer o valor de uma variável


(a variável dependente), dado que seja conhecido o valor de uma variável associada (a
variável independente). A equação de regressão é a fórmula algébrica pela qual se
determina o valor previsto da variável dependente.

9.1 - Método dos Mínimos Quadrados

O Método dos Mínimos Quadrados serve para ajustar uma linha de regressão

Y = a + bX

p qb
∑ no – J a
∑ a²  ap ²
Sendo b =

e a = rb − sfb

Uma vez que tenha sido formulada a equação de regressão, pode-se utiliza-la para
estimar o valor da variável dependente, dado o valor da variável independente.

9.2 - Coeficiente de Determinação

O coeficiente de determinação indica a proporção da variância na variável dependente


que é estatisticamente explicada pela equação de regressão (isto é, pelo conhecimento
da variável independente associada a X).

t ∑ o 1 u ∑ no – J qb²
∑ q²  qb ²
r2 =

9.3 - Coeficiente de Correlação

O sinal de coeficiente de correlação indica a direção da relação entre X e Y, enquanto o


valor absoluto do coeficiente indica a extensão da relação.

r = (sinal de b) √v²

54
Exercícios

9.1) A tabela abaixo apresenta dados de amostra referentes ao número de horas de


estudo fora de classe para determinados alunos de um curso de Estatística de três
semanas, bem como os graus obtidos em um exame aplicado no fim do curso.

Estudante amostrado 1 2 3 4 5 6 7 8
Horas de estudo, X 20 16 34 23 27 32 18 22
Grau no exame, Y 64 61 84 70 88 92 72 77
Tabela 9.1- Números de horas de estudo fora da classe, Grau obtido no exame

Pede-se: (a) Determinar a equação de regressão para predizer o grau no exame, dado o
número de horas de estudo, e traçar a linha de regressão no diagrama de dispersão.

(b) Utilizar a equação de regressão para estimar o grau no exame obtido por um
estudante que dedicou 30 horas de estudo fora de classe.

Resposta: (a) Y = 40 + 1,5X ; (b) Yx = 85

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 312

9.2) Suponha que um analista toma uma amostra aleatória de 10 carregamentos recentes
por caminhão feitos por uma companhia e anota a distância em quilômentros e o tempo
de entrega ao meio-dia mais próximo. Os dados são verificados na tabela:

Carregamento 1 2 3 4 5 6 7 8 9 10
amostrado
Distância em km, 825 215 1070 550 480 920 1350 325 670 1215
X
Tempo de entrega 3,5 1,0 4,0 2,0 1,0 3,0 4,5 1,5 3,0 5,0
em dias, Y
Tabela 9.2 – Distância, Tempo de entrega

Desenhe o diagrama de dispersão para os dados acima e obtenha a equação da reta


correspondente.

Resposta: Y = 0,11 + 0,0036X

Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração. P. 307

9.3)

Idade 56 42 72 36 63 47 55 49 38 42 68 60
Pressão 147 125 160 118 149 128 150 145 115 140 152 155
Tabela 9.3 – Idade, Pressão sanguínea

A tabela mostra idade e pressão sanguínea, correspondentes a uma amostra de 12


mulheres. Determine:

55
a) O coeficiente de correlação entre X e Y.
b) A reta de regressão linear de Y em X.
c) A pressão sanguínea de uma mulher de 45 anos de idade.
d) Calcule r² e interprete.

Resposta: (a) r = 0,8961; (b) Y = 80,7777 + 1,1380X; (c) X = 45, Y = 131,988; (d) r² =0,8029

9.4) Um gerente de vendas reuniu os seguintes dados considerando os anos de


experiência e as vendas anuais:

Vendedor Anos de Experiência Vendas anuais ($1000)


1 1 80
2 3 97
3 4 92
4 4 102
5 6 103
6 8 111
7 10 119
8 10 123
9 11 117
10 13 136
Tabela 9.4 – Anos de experiência, Vendas anuais

a) Desenhe o diagrama de dispersão para os dados acima, com os anos de


experiência como a variável independente.
b) Determine a equação da reta de regressão linear e use essa equação para prever
as vendas anuais para um vendedor com nove anos de experiência.

Resposta: Y = 80 + 4X; Para X = 9, temos Y = 116

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 438

9.5) A altura usualmente funciona como elemento que permite boa previsão do peso
para pessoas da mesma idade e sexo. Na lista a seguir são mostrados a idade e o peso de
14 homens de idade entre 19 e 26 anos:

Peso (kg) 83,9 99 63,8 71,3 65,3 79,6 70,3 69,2 56,4 66,2 88,7 59,7 64,6 78,8
Altura (cm) 185 180 173 168 175 183 184 174 164 169 205 161 177 174
Tabela 9.5 – Peso, Altura

a) Desenhe o diagrama de dispersão para os dados acima.


b) Calcule o coeficiente de correlação correspondente.
c) Suponha que queremos obter um modelo de regressão linear para estimar o peso
de um homem nesta faixa etária. Qual a variável independente deste modelo?

56
d) Obtenha a equação da reta correspondente. Utilizando a equação obtida, estime
o peso de um jovem medindo respectivamente 192 e 150 cm.

Resposta: (b) r = 0,69; (c) X altura, Y peso; (d) Reta de regressão: Y = -60,6216 + 0,7547X. Para
X = 192, temos Y = 84,2718 e para X = 150, temos Y = 52,5764

9.6) Uma importante aplicação da análise de regressão na contabilidade é a estimação


do custo. Ao coletar dados sobre volume e custo e usar o método dos mínimos
quadrados para desenvolver uma regressão estimada relacionando volume e custo, um
contador pode estimar o custo associado a um volume de manufatura em particular.
Considere a seguinte amostra de volumes de produção e os dados de custos totais
referente a uma operação de manufatura:

Volume de produção Custos totais (R$)


(unidades)
400 4000
450 5000
550 5400
600 5900
700 6400
750 7000
Tabela 9.6 – Volume de produção, Custos totais

a) Com esses dados desenvolva uma equação de regressão estimada que possa ser
usada para prever o custo total de determinado volume de produção.
b) Calcule o coeficiente de determinação.
c) O programa de produção da empresa mostra que 500 unidades devem ser
produzidas no próximo mês. Qual é o custo total estimado para essa operação?

Resposta: (a) Y = 1247,24 + 7,60X; (b) r² = 0,9587; (c) Para X = 500, temos Y = 5047,24

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 446

57
9.7) Certa empresa, estudando a variação da demanda de seu produto em relação à
variação de preço de venda, obteve a tabela:

Preço (X) Demanda (Y)


38 350
42 325
50 297
56 270
59 256
63 246
70 238
80 223
95 215
110 208

Tabela 9.7 - Preço, Demanda

a) Determine o coeficiente de correlação.


b) Estabeleça a equação da reta ajustada.
c) Verifique a qualidade da reta ajustada.
d) Estime o valor da demanda para um preço de X = 60.
e) Monte a tabela ANOVA.

Resposta: (a) r = -0,90; (b) Y = -1,87X + 386,78; (c) r² = 0,81; (d) Para X =60, temos Y = 274,58

58
Apêndice

Tabela 1 Distribuição Normal - Padrão

59
Apêndice

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 532

60
Apêndice

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 533

61
Apêndice

Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e Economia. p. 534

62
Apêndice

63
Apêndice

64
Apêndice

Tabela 4 Distribuição F

65
Apêndice

Tabela 4 Distribuição F

66
BIBLIOGRAFIA

• Anderson, Sweeney e Williams (2002). Estatística aplicada à Administração e


Economia. Editora Pioneira Thomson Learning

• Kazmier, Leonard J. (2004). Estatística aplicada à Economia e Administração.


Editora Pearson Education do Brasil.

• Da Silva, E.M., Da Silva, E.M., Gonçalves, V., Murolo, A.C. (1997). Estatística
para os cursos de Economia, Administração, Ciências Contábeis. Editora Atlas.

• Barbetta, P. A., Reis, M. M., Bornia, A.C. (2010). Estatística para Cursos de
Engenharia e Informática. Editora Atlas.

• Christo, Eliane da Silva. Notas de aula e lista de exercício de Estatística II

• Meza, Lídia Ângulo. Lista de exercícios de Estatística II

67

Anda mungkin juga menyukai