Estimação de Intervalos de Confiança

206
ESTIMAÇÃO POR INTERVALO (INTERVALOS DE

CONFIANÇA)
Cada um dos métodos de estimação pontual permite associar

a cada parâmetro populacional um estimador. Ora a cada
estimador estão associadas tantas estimativas diferentes
quantas as amostras utilizadas para o seu cálculo. De um
modo geral nenhuma destas estimativas irá coincidir com o
valor do parâmetro da população e não é possível obter
qualquer informação relativa ao seu rigor. Esta
impossibilidade de associar a uma dada estimativa o
respectivo grau de confiança, constitui a grande limitação
dos métodos de estimação pontual. Este problema é
ultrapassado recorrendo à estimação por intervalo.
Admita-se então que temos uma população X ~ N µ, σ 2 e ( )

que é seleccionada uma amostra aleatória de dimensão n.
Para essa amostra é calculada a respectiva média amostral
cujo valor é x . O objectivo é definir um intervalo que com
uma dada probabilidade 1 - α (p.ex: 95%, 99%), inclua o
verdadeiro valor do parâmetro µ da população.
Sabemos que:
 σ 2 
X ~ N  µ,  ⇒ Z = X − µ ~ N ( 0,1 )
 n  σ/ n

defina-se agora z ( α / 2 ) como o valor da v.a. Z que verifica

P [ Z > z ( α / 2 ) ] = α / 2 . Então P [ Z < − z ( α / 2 ) ] = α / 2 e
portanto P [ − z ( α / 2 ) < Z < z ( α / 2 ) ] = 1 − α .
207
Então:
 X−µ 
P  −z(α / 2 )< < z(α / 2 ) = 1 − α
 σ/ n 
que se pode escrever como:
 σ σ 
P  µ − z ( α / 2 )⋅ < X < µ + z ( α / 2 )⋅  =1− α
 n n 
ou como:
 σ σ 
P  X − z ( α / 2 )⋅ < µ < X + z ( α / 2 )⋅  =1− α
 n n 
De acordo com a expressão anterior o intervalo:
 σ σ 
 X − z ( α / 2 )⋅ , X + z ( α / 2 )⋅
 n n 
incluirá o valor de µ com probabilidade 1 - α .

208
Este intervalo designa-se por intervalo de confiança para o

valor esperado a (1 - α).100%. Os extremos deste intervalo
são os limites de confiança a (1 - α).100%. O valor de
σ
z ( α / 2 )⋅ , que representa a semiamplitude do intervalo
n
de confiança, corresponde ao erro máximo que, com a
confiança especificada, se pode cometer na estimativa de µ.
NOTA:
• O valor de α representa, em média, a proporção de

vezes em que o intervalo de confiança não contém o
parâmetro que se pretende estimar.
• Outro aspecto a salientar prende-se com a simetria do

intervalo de confiança relativamente ao valor do
estimador pontual X .
209
Para quaisquer valores α1 e α 2 não simétricos que

satisfaçam:
α1 + α 2 = α
os intervalos
 σ σ 
 X − z ( α )⋅ , X + z ( α )⋅
n 
1 2
 n
são todos eles intervalos de confiança de µ a (1-

α).100% , porém com amplitudes diferentes.
Sempre que a estatística a partir da qual se definem

os intervalos de confiança, apresentar uma
distribuição unimodal simétrica, o intervalo
simétrico em relação à estatística ( α1 = α 2 = α / 2 ) é
o de menor amplitude e portanto aquele que deve
ser calculado.
As excepções a esta regra são situações em que o

objectivo é definir intervalos de confiança
unilaterais (ilimitados superiormente ou ilimitados
inferiormente).
210
ESPECIFICAÇÃO DE INTERVALOS DE CONFIANÇA
A especificação de um intervalo de confiança para um

parâmetro implica conhecer:
• Um estimador do parâmetro em causa
• A distribuição desse estimador
• Uma estimativa pontual do parâmetro
INTERVALOS DE CONFIANÇA PARA O VALOR

ESPERADO (µ)
I ) Amostra de grande dimensão. População qualquer.
De acordo com o teorema do limite central temos que, neste

caso:
 σ 2 
X ~ N  µ,  ⇒ Z = X − µ ~ N ( 0,1 )
 n  σ/ n

Em geral o desvio padrão da população, σ, é desconhecido,

sendo estimado através do desvio padrão amostral, S:
⋅ ∑ ( Xi − X )
1 n 2
S=
n − 1 i =1
( S: estimador desvio padrão amostral; s: estimativas)

211
Uma vez que se admitiu que a amostra é de elevada

dimensão, o erro de estimação é desprezável e podemos
admitir que:
S≈σ (constante)
e portanto:
X−µ X−µ
Z= ≈ ~ N ( 0,1 )
S/ n σ/ n
Então o intervalo de confiança para o valor esperado µ a (1-

α).100% é dado por:
 S 
 X − z ( α / 2 ) ⋅
S
, X + z ( α / 2 ) ⋅
 n n 
II ) Amostra de pequena dimensão. População Normal.
Neste caso já não é válido considerar que:
S≈σ (constante)
e portanto também já não é válido admitir que:
X−µ X −µ
≈
S/ n σ/ n
212
Então, para definir o intervalo de confiança é necessário

determinar a distribuição da v.a. :
X −µ
S/ n
Notemos que:
X −µ
X−µ N ( 0,1 )
= σ/ n ~
S/ n S/ σ χ 2n −1
n −1
X−µ
e como e S / σ são v.a. independentes, resulta da
σ/ n
definição da distribuição t de Student que:
X−µ
~ t n −1
S/ n
sendo portanto o intervalo de confiança para o valor esperado

µ a (1-α).100% dado por:
 S 
 X − t n −1 ( α / 2 ) ⋅ n , X + t n −1 ( α / 2 ) ⋅ n 
S
 
213
INTERVALOS DE
CONFIANÇA PARA A
PROPORÇÃO BINOMIAL ( P = Y )
n
Vimos já anteriormente que P = Y era um estimador para a

n
proporção binomial p e que, sob determinadas condições, a
distribuição de P = Y é dada por:
n
 p ⋅ (1 − p ) 
P = Y ~ N  p, 
n  n 
e portanto os limites do intervalo de confiança para P = Y

n
são dados por:
Y ± z ( α / 2 )⋅ p ⋅ (1 − p ) Y
= ± z ( α / 2 )⋅ σ
n n n
Uma vez que o valor de σ depende do parâmetro

desconhecido p, poderá para amostras de elevada dimensão,
ser substituído por um qualquer valor do seu estimador
P = Y resultando em:
n
Y / n ⋅ (1 − Y / n ) Y ⋅( n − Y )
σ= =
n n3
e portanto:
214
Y−p
n ~ N ( 0,1 )
Y ⋅( n − Y )
n3
sendo o intervalo de confiança para a proporção binomial p a

(1-α).100% dado por:
Y Y ⋅( n − Y ) Y + z ( α / 2 ) ⋅ Y ⋅( n − Y ) 
 − z ( α / 2 ) ⋅ 3
, 3 
 n n n n 
INTERVALOS DE CONFIANÇA PARA A VARIÂNCIA

DE UMA POPULAÇÃO NORMAL ( σ 2 )
Vimos já que se de uma população Normal, N µ, σ 2 , forem ( )

seleccionadas amostras aleatórias de dimensão n com
variância amostral S2 , então a v.a. :
S2
( n − 1 )⋅ 2 ~ χ2n −1
σ
Consideremos agora dois valores χ 2n −1 ( )

A
e (χ )
2
n −1 B tais
que:
[( )
P χ 2n −1
A
(
< χ 2n −1 < χ 2n −1 ) ]= 1 − α
B
215
Substituindo na equação anterior ( χ 2n −1 ) S2

por ( n − 1 )⋅ 2
σ
obtém-se:
(
 2
) S2 
(
P  χ n −1 < ( n − 1 )⋅ 2 < χ n −1  = 1 − α
 A σ
2
B

)
ou:
 
 1 σ 2
1 
> >  =1− α
( ) (χ )
P
 χ n −1 A
2
( n − 1 )⋅ S2 2
n −1 B 
a que podemos ainda dar outro aspecto:
 
 ( n − 1 )⋅ S ( n − 1 )⋅ S  = 1 − α
2 2
> σ2 >
( ) ( )
P 
 χ n −1 A χ 2n −1
2
B 
ou finalmente:
 
 ( n − 1 )⋅ S ( n − 1 )⋅ S  = 1 − α
2 2
< σ2 <
( ) ( )
P 
 χ n −1 B χ n −1
2 2
A 
216
O intervalo de confiança para a variância σ 2 a (1-α).100% é

dado por:
 
 ( n − 1 )⋅ S ( n − 1 )⋅ S 
2 2
( ) ( )
 , 
 χ n −1 B χ n −1
2 2
A 
Neste caso a distribuição não é simétrica existindo portanto a

dificuldade de definir os valores χ 2n −1 ( )
e χ 2n −1
A
que( )
B
conduzem ao intervalo de confiança de menor amplitude. Por
razões de simplicidade é habitual escolher:
(χ )
2
n −1 B = χ 2n −1 ( α / 2 )
(χ )
2
n −1 A = χ 2n −1 ( 1 − α / 2 )
e assim a expressão final para o intervalo de confiança é:
 2 
 ( n − 1 )⋅ S , ( n − 1 )⋅ S 
2
 2 
χ
 n −1 ( α / 2 ) χ 2
n −1 ( 1 − α / 2 ) 
217
INTERVALOS DE CONFIANÇA PARA A RAZÃO

ENTRE VARIÂNCIAS DE POPULAÇÕES NORMAIS
Admita-se que σ 2A e σ 2B correspondem às variâncias de duas

populações Normais A e B. Considere-se também que, com
base em amostras independentes de dimensão n A e n B
respectivamente, se obtêm os estimadores para aquelas
variâncias, isto é S2A e S2B . Então:
S2A
( nA − 1 ) ⋅ ~ χ 2n A −1
σ 2A
e
S2B
( nB − 1 ) ⋅ ~ χ 2n B −1
σB
2
resultando que:
S2A / σ 2A χ 2n A −1 / ( n A −1 )
~
S2B / σ 2B χ 2n B −1 / ( n B −1 )
Atendendo à definição da distribuição F temos então que:
S2A / σ 2A
~ Fn A −1 , n B −1
S2B / σ 2B
uma vez que se admite que as variáveis S2A e S2B são

independentes (pois são obtidas a partir de amostras
independentes).
218
Considerem-se agora dois valores desta distribuição

Fn A −1, n B −1 (α / 2 ) e Fn A −1, n B −1 ( 1− α / 2 ) tais que:
[ ]
P Fn A −1 , n B −1 ( 1− α / 2 ) < Fn A −1 , n B −1 < Fn A −1, n B −1 (α / 2 ) = 1 − α
e portanto:
 S2A / σ 2A 
P Fn A −1 , n B −1 ( 1 − α / 2 ) < 2 2 < Fn A −1 , n B −1 (α / 2 ) = 1 − α
 SB / σ B 
ou ainda:
 1 σ 2A / σ 2B 1 
P > 2 2 >  =1− α
 Fn A −1, n B −1 (1 − α / 2 ) SA / SB Fn A −1, n B −1 (α / 2 )
ou de outro modo:
 1 S2A σ 2A 1 S2A 
P ⋅ 2 > 2 > ⋅ 2  =1− α
 Fn A −1, n B −1 (1 − α / 2 ) SB σ B Fn A −1, n B −1 (α / 2 ) SB 
e finalmente:
 1 S2A σ 2A 1 S2A 
P ⋅ 2 < 2 < ⋅ 2  =1− α
 Fn A −1, n B −1 (α / 2 ) SB σ B Fn A −1, n B −1 (1 − α / 2 ) SB 
219
O intervalo de confiança a (1-α).100% para a razão entre as

variâncias das duas populações normais σ 2A / σ 2B é então:
 1 S2A 1 S2A 
 ⋅ 2 , ⋅ 2
F
 n A −1, n B −1 (α / 2 ) SB Fn A −1, n B −1 (1 − α / 2 ) SB 
INTERVALOS DE CONFIANÇA PARA A DIFERENÇA

ENTRE OS VALORES ESPERADOS DE DUAS
POPULAÇÕES ( µ A − µ B )
I) Amostras independentes de grandes dimensões, populações

quaisquer
Sejam µ A e µ B os valores esperados das populações A e B e

σ 2A e σ 2B as suas variâncias. Considere que a partir destas
populações se obtêm amostras independentes de dimensão
N A e N B com base nas quais se determinam os estimadores
dos valores esperados, X A e X B , e das variâncias, S2A e
S2B .
Uma vez que estamos a tratar com amostras de elevada

dimensão, podemos considerar que:
S2A ≈ σ 2A e S2B ≈ σ 2B
220
por outro lado, o teorema do limite central permite-nos

afirmar que, quaisquer que sejam as formas das distribuições
de A e B teremos:
 σ 2   S 2 
XA ~ N  µA , A  ≈ N  µA , A 
 n A   n A 
 
e
 σ 2   S 2 
XB ~ N  µB , B  ≈ N  µB , B 
 n B   n B 
 
Uma vez que se admitiu que as amostras são independentes,

a diferença X A − X B é a também uma v.a. com distribuição
Normal e portanto:
 σ 2
σ 2   S 2
S 2 
XA − XB ~ N  µA − µB , A + B  ≈ N  µA − µB , A + B 
 nA nB   nA nB 
   
isto é:
Z=
( XA − XB ) − ( µA − µB ) ~ N ( 0,1 )
S2A S2B
+
nA nB
Então o intervalo de confiança a (1-α).100% para a diferença

dos valores esperados µ A − µ B é dado por:
221
 S2A S2B S2A S2B 

( X A − X B ) − z ( α / 2 ) ⋅ + , ( XA − XB ) + z ( α / 2 ) ⋅ +
 nA nB nA nB 
 
Se se admitir que as variâncias das duas populações são

iguais:
σ 2A = σ B
2
= σ2
então:
  2 2   
X A − X B ~ N  µ A − µ B ,  σ + σ   = N  µ A − µ B , σ 2  1 + 1  
   
  nA nB     nA nB  
neste caso é possível refinar a expressão obtida para o

intervalo de confiança, estimando a variância comum σ 2 , das
duas populações A e B, a partir de:
S = 2 (n A − 1)⋅S2A + (n B − 1)⋅S2B
nA + nB − 2
e substituindo nessa expressão S2A e S2B por S2 . Então se as

variâncias das populações forem iguais a expressão para o
intervalo de confiança é:
 
( X A − X B ) − z ( α / 2 ) ⋅ S ⋅
1 + 1 ,( X − X ) + z( α / 2 )⋅S⋅ 1 + 1
A B 
 nA nB nA nB 
222
I) Amostras independentes de pequenas dimensões, populações

quaisquer
Uma vez que agora já não é válido considerar:
S2A ≈ σ 2A e S2B ≈ σ 2B
também deixa de ser válido admitir que tem distribuição

N(0,1) a v.a.:
( XA − XB ) − ( µA − µB )
S2A S2B
+
nA nB
Seguindo um procedimento análogo ao já utilizado no caso

de se trabalhar apenas com uma amostra, temos que:
( XA − XB ) − ( µA − µB )
( XA − XB ) − ( µA − µB ) = σ 2A / n A + σ 2B / n B
S2A S2B S2A / n A + S2B / n B
+
nA nB σ 2A / n A + σ 2B / n B
N (0,1)
= ~ t gl
χgl
2
/ gl
isto é, aquela variável segue uma distribuição t de Student

com gl graus de liberdade.
223
Para definir o valor de gl temos duas situações possíveis, que

correspondem a podermos ou não admitir como válido que as
variâncias das duas populações são iguais:
gl = n A + n B − 2 se σ 2A = σ B
2
= σ2
2
 S2A S2B 
 + 
 nA nB 
gl =   σ 2A ≠ σ 2B
(S ) + (S )
2 2
se
2 2
A / n A B / n B
nA − 1 nB − 1
No primeiro caso o número de graus de liberdade

corresponde ao número de graus de liberdade com que a
variância comum das duas populações é estimada.
No segundo caso se o valor de gl não der um inteiro, deve-se

utilizar o inteiro imediatamente inferior já que conduz à
definição de um intervalo com uma confiança maior do que a
especificada inicialmente.
Se as variâncias das populações forem iguais podemos

também aqui estimar a variância comum pela fórmula usada
anteriormente, isto é:
S =
2 (n A − 1)⋅S2A + (n B − 1)⋅S2B
nA + nB − 2
224
Então o intervalo de confiança a (1-α).100% para a diferença

dos valores esperados das duas populações, µ A − µ B , é dado
por:
σ 2A = σ B
2
= σ2
 
( µ A − µ B ) ∈  ( X A − X B ) ± t ( α / 2 )⋅S ⋅ 1 + 1 
 nA nB 
σ 2A ≠ σ 2B
 S2A S2B 
( µA − µB ) ∈  ( X A − X B ) ± t ( α / 2 )⋅ + 
 nA nB 

INTERVALOS DE CONFIANÇA PARA A DIFERENÇA

ENTRE PROPORÇÕES BINOMIAIS pA − pB
(AMOSTRAS INDEPENDENTES DE GRANDES
DIMENSÕES)
Sejam duas populações A e B constituídas por elementos de

dois tipos. Seja p A a proporção de elementos de um dos dois
tipos na população A e p B o valor correspondente para a
população B. Seleccionadas independentemente duas
225
YA
amostras, seja um estimador de p A baseado numa
nA
Y
amostra de dimensão n A e B o estimador de p B baseado
nB
numa amostra de dimensão n B .
Estando satisfeitas as condições para aproximarmos as

YA YB
distribuições de e por distribuições Normais
nA nB
(populações infinitas ou amostragem com reposição
verificando-se ainda que n ≥ 20 e n.p > 7 ; no caso de
amostragem sem reposição é também necessário garantir que
a dimensão da população é grande face à dimensão da
amostra) e uma vez que as amostras são independentes temos
que:
YA YB  p ⋅ (1 − pA ) pB ⋅ (1 − pB ) 
− ~ N  µ A − µ B , A + 
nA nB  nA nB 
Então seguindo um procedimento idêntico ao utilizado

anteriormente temos que o intervalo de confiança a (1-
α).100% para a diferença entre as proporções binomiais,
p A − p B , é dado por:
( pA − pB ) ∈
Y  Y ⋅ ( n A − YA ) YB ⋅ ( n B − YB )
 ± z (α / 2 )⋅ A
Y
∈  A − B 3
+
 nA nB  nA n 3B
226
DIMENSIONAMENTO DE AMOSTRAS
Até agora admitimos que a dimensão das amostras utilizadas

para o cálculo das estimativas pontuais estava já especificada
previamente.
Contudo o problema de dimensionamento das amostras é
muito importante já que:
• Se a amostra for excessivamente grande face aos

objectivos que se pretendem atingir, estaremos a
desperdiçar recursos na recolha e tratamento da
informação.
• Se a dimensão da amostra não for suficiente para a

partir dela se extraírem conclusões válidas, estaremos a
cometer um erro.
A dimensão das amostras a considerar aumentará à medida

que aumentem os seguintes “parâmetros” (isoladamente ou
em simultâneo):
i) a precisão do intervalo de confiança (que varia na

razão inversa da respectiva amplitude).
ii) o grau de confiança do intervalo, isto é, a

probabilidade de este vir a incluir o verdadeiro valor
do parâmetro populacional.

Estimação de Intervalos de Confiança

Diunggah oleh

Informasi Dokumen

Hak Cipta

Format Tersedia

Bagikan dokumen Ini

Bagikan atau Tanam Dokumen

Opsi Berbagi

Apakah menurut Anda dokumen ini bermanfaat?

Apakah konten ini tidak pantas?

Hak Cipta:

Format Tersedia

Estimação de Intervalos de Confiança

Diunggah oleh

Hak Cipta:

Format Tersedia

206

ESTIMAÇÃO POR INTERVALO (INTERVALOS DE

Cada um dos métodos de estimação pontual permite associar

Admita-se então que temos uma população X ~ N µ, σ 2 e ( )

defina-se agora z ( α / 2 ) como o valor da v.a. Z que verifica

que se pode escrever como:

De acordo com a expressão anterior o intervalo:

incluirá o valor de µ com probabilidade 1 - α .

Este intervalo designa-se por intervalo de confiança para o

• O valor de α representa, em média, a proporção de

• Outro aspecto a salientar prende-se com a simetria do

Para quaisquer valores α1 e α 2 não simétricos que

são todos eles intervalos de confiança de µ a (1-

Sempre que a estatística a partir da qual se definem

As excepções a esta regra são situações em que o

ESPECIFICAÇÃO DE INTERVALOS DE CONFIANÇA

A especificação de um intervalo de confiança para um

• Um estimador do parâmetro em causa

• A distribuição desse estimador

• Uma estimativa pontual do parâmetro

INTERVALOS DE CONFIANÇA PARA O VALOR

I ) Amostra de grande dimensão. População qualquer.

De acordo com o teorema do limite central temos que, neste

Em geral o desvio padrão da população, σ, é desconhecido,

( S: estimador desvio padrão amostral; s: estimativas)

Uma vez que se admitiu que a amostra é de elevada

Então o intervalo de confiança para o valor esperado µ a (1-

II ) Amostra de pequena dimensão. População Normal.

Neste caso já não é válido considerar que:

e portanto também já não é válido admitir que:

Então, para definir o intervalo de confiança é necessário

sendo portanto o intervalo de confiança para o valor esperado

Vimos já anteriormente que P = Y era um estimador para a

e portanto os limites do intervalo de confiança para P = Y

Uma vez que o valor de σ depende do parâmetro

sendo o intervalo de confiança para a proporção binomial p a

INTERVALOS DE CONFIANÇA PARA A VARIÂNCIA

Vimos já que se de uma população Normal, N µ, σ 2 , forem ( )

Consideremos agora dois valores χ 2n −1 ( )

Substituindo na equação anterior ( χ 2n −1 ) S2

a que podemos ainda dar outro aspecto:

O intervalo de confiança para a variância σ 2 a (1-α).100% é

Neste caso a distribuição não é simétrica existindo portanto a

e assim a expressão final para o intervalo de confiança é:

INTERVALOS DE CONFIANÇA PARA A RAZÃO

Admita-se que σ 2A e σ 2B correspondem às variâncias de duas

Atendendo à definição da distribuição F temos então que:

uma vez que se admite que as variáveis S2A e S2B são

Considerem-se agora dois valores desta distribuição

O intervalo de confiança a (1-α).100% para a razão entre as

INTERVALOS DE CONFIANÇA PARA A DIFERENÇA

I) Amostras independentes de grandes dimensões, populações

Sejam µ A e µ B os valores esperados das populações A e B e

Uma vez que estamos a tratar com amostras de elevada

por outro lado, o teorema do limite central permite-nos

Uma vez que se admitiu que as amostras são independentes,

Então o intervalo de confiança a (1-α).100% para a diferença

 S2A S2B S2A S2B 

Se se admitir que as variâncias das duas populações são

neste caso é possível refinar a expressão obtida para o

e substituindo nessa expressão S2A e S2B por S2 . Então se as

I) Amostras independentes de pequenas dimensões, populações

Uma vez que agora já não é válido considerar:

também deixa de ser válido admitir que tem distribuição