Anda di halaman 1dari 13

Aula 9 Intervalo de confiana para a mdia da N(; 2), 2 desconhecida

Nesta aula voc completar seu estudo bsico sobre intervalos de confiana, analisando o problema de
estimao da mdia de uma populao normal quando no se conhece a varincia desta populao. Voc ver que,
neste caso, necessrio estimar essa varincia e isso introduz mais uma fonte de variabilidade nas nossas
estimativas: com uma nica amostra, temos que estimar a mdia e a varincia da populao. O procedimento
simples e anlogo aos casos anteriores; o que muda a distribuio amostral do estimador X . Em vez de usarmos a
distribuio normal para determinar os valores crticos, usaremos a distribuio t de Student.
Objetivos:
Voc ver os seguintes conceitos:
estimao da varincia de uma populao;
distribuio t-Student;
distribuio amostral da mdia de uma populao normal com varincia desconhecida;
intervalo de confiana para a mdia de uma populao normal com varincia desconhecida.
Idias bsicas
Considere uma populao descrita por uma varivel aleatria normal com mdia e varincia 2: X
N(; 2). Nosso interesse estimar a mdia a partir de uma amostra aleatria simples X1, X2, . . . ,Xn. Como j
visto, a distribuio amostral de X normal com mdia e varincia 2/ n , ou seja

Assim, se o valor de conhecido, resulta que

e esse resultado foi utilizado na construo do intervalo de confiana para a mdia de uma populao normal com
varincia conhecida, fornecendo o seguinte intervalo:

Suponhamos, agora, que a varincia 2 no seja conhecida. Neste caso, temos que estim-la com os dados
amostrais. Vimos, atravs de um exemplo numrico, que

um estimador no-viesado de 2. Isso significa que


se calculssemos o valor de S2 para cada uma das possveis amostras aleatrias simples de tamanho n, a mdia
desses valores seria igual a 2. Dessa forma, S2 um bom estimador de 2 e podemos us-lo como uma
estimativa pontual de 2. Como o desvio padro a raiz quadrada da varincia, natural perguntar: S um bom
estimador de , ou seja, S um estimador no-viesado de ? A resposta NO, mas, para grandes amostras, o
vis pequeno, de modo que, em geral, usa-se S como estimador de .
Sendo assim, natural pensarmos em substituir o valor de por S na expresso

e utilizarmos a estatstica

na construo de intervalos de

Pgina 1 de 13

confiana para . Isso exatamente o que faremos, mas, ao introduzirmos S no lugar de , a distribuio amostral
de T deixa de ser normal e passa a ser uma distribuio t de Student.
A distribuio t de Student (ou simplesmente distribuio t) foi obtida por William Gosset (1876-1937), que
trabalhava na Cervejaria Guinness na Irlanda. Como a cervejaria no permitia a publicao de resultados de pesquisa
obtidos por seus funcionrios, Gosset publicou, sob o pseudnimo de Student, o artigo The Probable Error of a
Mean na revista Biometrika (vol. 6, no. 1).
A distribuio t de Student
A distribuio t de Student uma distribuio contnua, cuja funo de densidade de probabilidade dada
por

Essa expresso, certamente, assustadora! Mas eis uma boa notcia: no precisaremos dela para calcular
probabilidades! No entanto, interessante notar duas caractersticas bsicas dessa expresso: o argumento x da
funo aparece elevado ao quadrado e a expresso de f(x) depende de um parmetro representado pela letra grega
ni: .
Da primeira observao resulta o fato de que f(x) simtrica em torno de zero, ou seja, f(x) = f(x).
O parmetro chamado graus de liberdade (s vezes abreviado por gl) e est associado ao nmero de
parcelas independentes em uma soma.
Para entender esse conceito, considere o seguinte exemplo: se conhecemos a mdia de um conjunto de n
dados, podemos atribuir valores livremente a apenas n1 desses dados, ou seja, conhecida a mdia e conhecidos
n1 dos valores, o n-simo valor fica automaticamente determinado. Suponha n = 10 e x = 80; se conhecemos os
valores de x1, . . . , x9 o valor de x10 obtido pela expresso
Dizemos, ento, que h 9 graus de
liberdade.
Cada nmero de graus de liberdade d origem a uma distribuio t diferente. No entanto, pela simetria da
curva, todas as distribuies t tm mdia 0. Alm disso, o grfico da funo de densidade da t tambm tem forma de
sino, como a distribuio normal.
Na Figura 9.1 ilustram-se diferentes distribuies t ( = 1, 2, 10, 30) e, a ttulo de comparao, em cada
grfico acrescenta-se tambm a densidade normal padro. Nos dois grficos superiores ( = 1, 2) fica mais ntido o
fato de a distribuio t ter maior disperso (consequncia do fato de substituirmos pela sua estimativa s). Nos
dois grficos inferiores ( = 10, 30), o que chama a ateno a quase coincidncia da densidade t com a densidade
N(0; 1).
Esse um resultado importante: medida que aumenta o nmero de graus de liberdade, a distribuio t de

Student aproxima-se da N(0; 1). A varincia da distribuio t com graus de liberdade igual a
( > 2) e
2
podemos ver que essa varincia converge a 1, que a varincia da N(0; 1), quando .
Vamos representar por t() a distribuio t de Student com graus de liberdade.

Pgina 2 de 13

Figura 9.1: Comparao da distribuio t de Student com a N(0; 1).


Tabela da t-Student
Ao contrrio da distribuio normal, no existe uma relao entre as diferentes distribuies t; assim, seria
necessria uma tabela para cada valor de . Os programas computacionais de estatstica calculam probabilidades
associadas a qualquer distribuio t. Mas nos livros didticos comum apresentar uma tabela da distribuio t que
envolve os valores crticos. O motivo para isso que a maioria das aplicaes da distribuio t envolve a construo
de intervalos de confiana ou de testes de hipteses, assunto das prximas aulas. Nessas aplicaes, nosso interesse
est no valor crtico associado a um nvel de significncia que, como visto, o valor da abscissa que deixa

Pgina 3 de 13

probabilidade (rea) acima dela. Vamos representar por t; o valor crtico da distribuio t(). Veja a Figura
9.2.

Figura 9.2: Ilustrao do valor crtico t; da distribuio t().


Ao final desta aula apresentamos a Tabela 9.2, que uma apresentao usual dos valores crticos da
distribuio t. Nesta tabela, cada linha corresponde a um nmero diferente de graus de liberdade e cada coluna
corresponde a uma rea na cauda superior. No corpo da tabela temos a abscissa t que deixa a rea acima
dela, ou seja:
Pr(t(n) > t ) =
Exemplos
Vamos ver, agora, alguns exemplos de utilizao da Tabela 9.2.
1. Na distribuio t(15) encontre a abscissa t15;0,05.
2. Na distribuio t(23) encontre a abscissa t tal que Pr(|t(23)| > t) = 0, 05.
3. Na distribuio t(12) encontre a abscissa t tal que Pr(|t(12)| t) = 0, 90.
Soluo
1. Como o nmero de graus de liberdade 15, temos de nos concentrar na linha correspondente a gl = 15. A abscissa
t0,05 deixa rea 0,05 acima dela; logo, t15;0,05 = 1, 753.
2. Usando as propriedades da funo mdulo, temos a seguinte equivalncia:
Pr(|t(23)| > t) = 0, 05 Pr(t(23) < t) + Pr(t(23) > t) = 0, 05
Pela simetria da densidade t, Pr(t(23) < t) = Pr(t(23) > t). Substituindo:
Pr(t(23) > t) + Pr(t(23) > t) = 0, 05 Pr(t(23) > t) = 0, 025 t = 2, 069
Esse ltimo valor foi encontrado na Tabela 9.2, consultando-se a linha correspondente a 23 graus de
liberdade e coluna correspondente rea superior de 0,025. Veja a Figura 9.3(a).
3. Das propriedades da funo mdulo e da simetria da densidade t resultam as seguintes equivalncias (veja a
Figura 9.3(b)):
Pr(|t(12)| t) = 0, 90 Pr(t t(12) t) = 0, 90 Pr(t t(12) < 0) + Pr(0 t(12) t) = 0, 90
2 Pr(0 t(12) t) = 0, 90 Pr(0 t(12) t) = 0, 45 Pr(t(12) > t) = 0, 05 t = 1, 782

Pgina 4 de 13

Figura 9.3: Soluo dos Exemplos 2 e 3.


Atividade 1
Utilize a Tabela 9.2 e as propriedades da funo de densidade t -Student para encontrar a abscissa t que
satisfaa as condies pedidas:
1. Pr(t(18) > t) = 0, 10; 2. Pr(t(8) < t) = 0, 90; 3. Pr(t(27) < t) = 0, 005; 4. Pr(|t(30)| > t) = 0, 02; 5. Pr(|t(24)| t) = 0, 80
Intervalo de confiana para a mdia de uma populao normal com varincia desconhecida
O intervalo de confiana para a mdia de uma populao normal com varincia desconhecida obtido com
base no seguinte resultado:
Se X1, X2, . . . ,Xn uma amostra aleatria simples de uma populao X N (; 2) , ento

O nmero de graus de liberdade = n 1 resulta do fato de que, na soma que define S2, h apenas n 1
parcelas independentes, ou seja, dados S2 e n 1 das parcelas (Xi X)2, a nsima parcela fica automaticamente
determinada.
Usando a simetria da densidade t, temos o seguinte resultado:

Veja a Figura 9.4.

Figura 9.4: Valores crticos da t -Student para construo do intervalo de confiana da mdia de uma normal com
varincia desconhecida. Como o resultado (9.3) vale para qualquer distribuio t, usando o resultado (9.2) obtemos:

Pgina 5 de 13

Essa ltima expresso o intervalo de confiana para a mdia de uma populao normal com varincia
desconhecida.
Intervalo de confiana para a mdia da N(; 2) 2 desconhecida
Seja X1, X2, . . . ,Xn uma amostra aleatria simples de uma populao X N (; 2) . O intervalo de
confiana para de nvel de confiana 1

onde tn1;

/2

o valor crtico da distribuio t -Student com n1 graus de liberdade que deixa rea /2 acima dele.

Margem de erro
Note, mais uma vez, a forma do intervalo de confiana:

, onde a margem de erro , agora, definida em

termos do valor crtico da distribuio t e do erro padro estimado de X :

Onde:
Amostras grandes
Vimos que, para populaes normais, a distribuio exata da estatstica
Mas
vimos tambm que, quando o nmero de graus de liberdade grande, a diferena entre as distribuies t e N(0; 1)
tornam-se desprezveis.
Por outro lado, se a populao no normal, mas tem mdia e varincia 2, o teorema central do limite nos diz

que a distribuio de
se aproxima de uma N(0; 1) medida que n . Pode-se mostrar que esse
resultado continua valendo se substitumos por seu estimador S. A concluso dessas duas observaes a
seguinte:
Dada uma amostra aleatria simples X1,X2, . . . ,X onde uma populao X com mdia e varincia 2, ento

para n suficientemente grande. Nesse caso, o intervalo de confiana aproximado de


nvel de confiana 1 para

Exemplos
1. De uma populao normal com mdia e varincia desconhecidas, extrai-se uma amostra de tamanho 15 obtendose x = 12 e s2 = 49. Obtenha um intervalo de confiana para a verdadeira mdia populacional, utilizando o nvel de
confiana de 95%.
Soluo
Os seguintes requisitos para o IC para so satisfeitos: a populao normal e a amostra pequena. Dessa forma,
temos que usar a distribui o t com n 1 = 14 graus de liberdade. Como o nvel de confiana de 95%, em cada
cauda da distribuio temos que ter 2,5%. Assim, devemos procurar a abscissa t14;0,025 procurando na linha
correspondente a 14 graus de liberdade e na coluna correspondente rea de 0,025. Encontramos t14;0,025= 2,145

Pgina 6 de 13

A margem de erro
[8,1231; 15, 8769]

e o intervalo de confiana [12 3, 8769; 12 + 3, 8769] =

2. A seguinte amostra foi extrada de uma populao normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa o intervalo de
confiana para a mdia populacional, com nvel de significncia de 10%.
Soluo
Como antes, temos uma amostra pequena de uma populao normal; logo, temos que usar a distribuio t-Student.
Como n = 9, gl = n 1 = 8. A mdia amostral

e a varincia amostral

Como o nvel de significncia = 10%, o nvel de confiana 1 = 90%. Em cauda da distribuio t(8) temos
que ter rea igual a 5%. Assim, temos que procurar na linha correspondente a 8 graus de liberdade a abscissa

relativa rea superior de 0,05. Obtemos t8;0,05=1,860. A margem de erro


e o intervalo de confiana [8, 6667 1, 395; 8, 6667 + 1, 395] = [7, 2717; 10, 0617]
3. A partir de uma amostra aleatria simples de tamanho n = 100, os seguintes valores foram obtidos: x = 12, 36 e
S2 = 132, 56. Obtenha um intervalo de confiana de nvel de confiana 90% para a mdia populacional .
Soluo
Como o tamanho amostral grande, podemos usar a aproximao normal. Como 1 = 0, 90, em cada cauda
temos que ter 5% e,assim, devemos procurar no corpo da tabela da distribuio normal o valor mais prximo de
0,45. Resulta que z0,05 = 1, 64,o que nos d a seguinte margem de erro:

O intervalo de confiana de 90% de confiana [12.36 1.8882 ; 12.36 + 1.8882] = [10.472 ; 14.248]
Resumo comparativo
Para finalizar a parte relativa construo de intervalos de confiana que veremos neste curso, vamos
resumir os resultados vistos nas ltimas aulas. importante notar que existem procedimentos para construo de
intervalos de confiana para outros parmetros, tal como a varincia de uma populao normal. O procedimento
anlogo; o que muda a distribuio amostral.

Pgina 7 de 13

IC para a mdia de populaes normais


O contexto bsico analisado o seguinte: de uma populao normal extrai-se uma amostra aleatria simples
X1,X2, . . . ,Xn com o objetivo de se obter uma estimativa intervalar para a mdia . Foram consideradas duas
situaes: (i) 2 conhecida e (ii) 2 desconhecida. Em ambos os casos, a expresso para o intervalo de confiana de
nvel de confiana 1

com a margem de erro

assumindo a forma geral

onde /2 representa o valor crtico de alguma distribuio e EP( X ) o erro padro da mdia amostral.

2 conhecida

2 desconhecida

Quando n > 31, pode-se usar z/2 no lugar de tn1; /2.


IC para uma proporo
O contexto bsico considerado foi o seguinte: de uma populao representada por uma varivel aleatria X
Bern(p) extrai-se uma amostra aleatria simples X1, X2, . . . ,Xn com o objetivo de se estimar a proporo
populacional p dos elementos que possuem determinada caracterstica de interesse. Se a amostra suficientemente
grande (em geral, n > 30), o intervalo de confiana para p tem a forma
a forma geral

com a margem de erro assumindo

com

p
Aqui, 0 uma estimativa prvia da proporo populacional p ou a prpria proporo amostral p obtida a
partir da amostra.
Intervalo de confiana para a mdia de populaes no normais

amostra grande

Dada uma aas de tamanho grande de uma populao qualquer com mdia , o intervalo de confiana de nvel
de confiana aproximado 1

Esses resultados esto resumidos na Tabela 9.1 e na Figura 9.5.

Pgina 8 de 13

Figura 9.5: Resumo de Intervalo de Confiana.

Pgina 9 de 13

Exerccios
1. Para uma distribuio t de Student com 12 graus de liberdade, encontre a probabilidade (rea) de cada uma das
seguintes regies (esboce um grfico para auxiliar na soluo do exerccio):
(a) esquerda de 1, 782;
(b) direita de 1, 356;
(c) direita de 2, 681;
(d) entre 1, 083 e 3, 055;
(e) entre 1, 356 e 2, 179.
2. Encontre os seguintes valores crticos da distribuio t de Student:
(a) t15;0,05
(b) t18;0,90
(c) t25;0,975
3. Os tempos gastos por quinze funcionrios em uma das tarefas de um programa de treinamento esto listados
abaixo. razovel supor, nesse caso, que essa seja uma amostra aleatria simples de uma populao normal, ou
seja, razovel supor que a populao de todos os tempos de funcionrios submetidos a esse treinamento seja
aproximadamente normal. Obtenha o intervalo de confiana de nvel de confiana de 95% para o tempo mdio
populacional.
52
44
55
44
45
59
50
54
62
46
54
58
60
62
63
4. Uma amostra aleatria simples de uma populao normal apresenta as seguintes caractersticas:

Construa um intervalo de confiana de nvel de confiana de 98% para a mdia da populao.


5. Em uma fbrica, uma amostra de 30 parafusos apresentou os seguintes dimetros (em mm):
10 13 14 11 13 14 11 13 14 15
12 14 15 13 14 12 12 11 15 16
13 15 14 14 15 15 16 12 10 15
Supondo que os dimetros sejam aproximadamente normais, obtenha um intervalo de confiana para o dimetro
mdio de todos os parafusos produzidos nessa fbrica, usando o nvel de significncia de 2%. Para facilitar a soluo
do exerccio, voc pode usar os seguintes resultados:

6. Repita o exerccio anterior com os seguintes dados de uma amostra de 100 parafusos:

Soluo dos Exerccios


1. Temos que usar a Tabela 9.2, concentrando-nos na linha correspondente a 12 graus de liberdade. Os valores
dados podem ser encontrados no corpo da tabela nesta linha.
(a) direita de 1, 782 temos uma rea de 0, 05; logo, esquerda de 1, 782 a rea de 0, 95.
(b) A rea abaixo de 1, 356 igual rea acima de 1, 356, que de 0, 10. Logo, esquerda de 1, 356 temos uma
rea de 0, 10 e direita de 1, 356 temos uma rea de 0, 90.
(c) direita de 2, 681 a rea 0, 01.
(d) direita de 1, 083 a rea 0, 15; direita de 3, 055 a rea de 0, 005. Logo, a rea entre 1, 083 e 3, 055 0, 15
0, 005 = 0, 145.
Pgina 10 de 13

(e) Como visto no item (b), a rea direita de 1, 356 0, 90. A rea direita de 2, 179 0, 025. Logo, a rea entre
1, 356 e 2, 179 0, 90 0, 025 = 0, 875.
2. (a) t15;0,05 = 1, 753
(b) O primeiro fato a observar que t18;0,90 tem que ser negativo, pois direita dele a rea de 0, 90 > 0, 50. Se
direita a rea 0,90, a rea esquerda 0,10. Pela simetria da curva, t18;0,90 = t18;0,10.Veja a Figura 9.6. Resulta
que
t18;0,90= t18;0,10= 1, 33

Figura 9.6: Grfico da funo p(1 p) para 0 p 1.


(c) Analogamente encontra-se que t25;0,975 = 2, 060
3. Contexto: populao normal e amostra pequena; distribuio envolvida:
t-Student n = 15 1 = 0, 95 t14;0,025 = 2, 145

O intervalo de confiana [53, 8667 3, 7788; 53, 8667 + 3, 7788] = [50, 088; 57, 6455]
4. Contexto:populao normal e amostra pequena; distribuio envolvida: t-Student t24;0,01 = 2, 492

5. Contexto: populao normal e amostra pequena; distribuio envolvida: t-Student


= 2% t29;0,01 = 2, 462

O intervalo de confiana substituir a prxima equao

Pgina 11 de 13

6. Como n grande, podemos usar a abscissa da distribuio normal z0,01 = 2, 33 (o valor exato t99;0,01 = 2,
3646),

Bibliografia
[1] ANDERSON, David R.; SWEENEY, Dennis J.; WILLIAMS, Thomas A. Estatstica Aplicada Administrao e
Economia. So Paulo: Pioneira Thomson Learning, 2002
[2] MOORE, David S.; McCabe, George P.; DUCKWORTH, William M.; SCLOVE, Stanley L. A Prtica da Estatstica
Empresarial Como Usar Dados para Tomar Decises. Rio de Janeiro: LTC Editora, 2006
[3] MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatstica Bsica, 5a Edio. So Paulo: Saraiva, 2006
[4] TRIOLA, Mario F. Introduo Estatstica, 9a. Edio. Rio de Janeiro: LTC Editora, 2005
[5] FARIAS, Ana M.; Mtodos Estatsticos I. Rio de Janeiro. Fundao CECIERJ, 2009.

Pgina 12 de 13

Obs.: Para n > 35, use a tabela da distribuio normal padronizada N(0;1)

Pgina 13 de 13