Anda di halaman 1dari 13

Estatstica 2

1.1 Introduo a Intervalos de Confiana


Prof. Gustavo B. Araujo
- Bibliografia:
Anderson, Sweeney e Williams caps. 5 a 8
Morettin e Bussab caps. 3, 7, 10 e 11

Relao entre Populao e Amostra


Pergunta central: quem deve ser estudado?
- Populao: o conjunto de todos os elementos ou resultados sob
investigao.
Se for fcil obter informaes sobre a populao, nosso problema
est resolvido. Se no for, precisamos estimar o resultado populacional atravs
de uma amostra.

- Amostra: uma parte da populao.


queremos que a amostra represente to bem a populao quanto
possvel.
=> PROBLEMA: diferentes amostras nos daro diferentes resultados.
Qual o correto?
no h necessariamente um resultado correto o que h so bons
procedimentos de pesquisa e a probabilidade do resultado se aproximar mais
ou menos do resultado populacional.

Entre os bons procedimentos de pesquisa est o procedimento de


seleo amostral por amostragem aleatria.
- Amostragem aleatria: os indivduos que compem a amostra so
sorteados aleatoriamente da populao de interesse.
por que a amostragem aleatria um bom procedimento ?
Porque nossa populao apresenta uma determinada distribuio de
valores para a varivel de interesse. Assim, quando selecionamos indivduos
aleatoriamente, a probabilidade de selecionarmos um indivduo com
determinada caracterstica igual probabilidade de encontrarmos aquela
caracterstica na populao. Isso faz com que, em amostras suficientemente
grandes, a distribuio amostral se aproxime da distribuio populacional, o
que faz com que o valor amostral se aproxime do valor populacional.

(parnteses)
- valores populacionais: parmetros.
- valores amostrais: estatsticas/estimativas.
no entanto, a grande questo ainda permanece: como avaliar o grau
de incerteza presente nos valores amostrais encontrados ?
ou seja: se coletei apenas uma amostra, mesmo vinda de amostragem
aleatria, como garantir que o valor encontrado se aproxima do parmetro
populacional ?
no podemos garantir. Mas, se soubermos a distribuio amostral da
estatstica de interesse (a mdia amostral, por exemplo), podemos dizer qual a
probabilidade de darmos azar e encontrarmos um valor to afastado do
parmetro populacional quanto o que achamos.

o bom que sabemos qual a distribuio amostral de estatsticas


como a mdia amostral graas ao chamado Teorema do Limite Central.
=> Teorema do Limite Central:
para amostras aleatrias simples, retiradas de uma populao com
mdia e varincia finita G2, a distribuio da mdia de X aproxima-se,
conforme n aumenta, de uma distribuio normal com mdia e varincia
.
ou seja, a distribuio amostral da mdia amostral : X ~ N( ,

).

Se uma estatstica apresenta distribuio amostral normal, possvel


dizer, ento, qual a probabilidade de termos obtido o resultado amostral que
obtivemos (porque sabemos calcular probabilidades sob a curva de uma
normal padro).

=> Padronizao:
se X ~ N( ,

X ~ N(0 ,

)
~ N(0,1)

- como se quisssemos ver quo distante a mdia amostral estaria da


mdia populacional (X ); depois, dividimos essa distncia pelo desvio
padro, para achar a quantos desvios padro essa distncia corresponde.
assim, no possvel dizer se o resultado correto. Podemos
apenas dizer se o resultado um resultado provvel e o grau de confiana que
temos nele. Mas como podemos fazer isto ?

Se conhecssemos , bastaria padronizar para achar a probabilidade de


encontrar o resultado que achamos, dado o valor de e o tamanho da amostra.
Mas no conhecemos . Ainda assim, podemos calcular a probabilidade de
que o valor amostral encontre-se a tantos desvios padro do valor populacional.
Ex:

Interpretao:
Se coletssemos 100 amostras de tamanho n e construssemos intervalos de
confiana do tipo
para cada X encontrado, esperaramos
que o parmetro de interesse, , estivesse contido em aproximadamente 98 desses
intervalos.
Resumindo:
Se pegarmos uma amostra de tamanho n, selecionada aleatoriamente, e
calcularmos sua mdia X, admitindo-se ainda conhecido o desvio padro G e
optando-se por determinado nvel de confiana (por ex. 95 %), podemos construir o
intervalo:
IC(;0,95) =
este intervalo pode ou no conter o parmetro , mas temos 95 % de
confiana de que contenha.

At o momento estamos trabalhando com uma simplificao: estamos


supondo que a varincia populacional conhecida.
Mas se no conhecemos a mdia populacional, provavelmente no
conhecemos tambm a varincia (ou o desvio padro).
se a varincia populacional G2 no conhecida, podemos substituir
por
, onde s2 a varincia amostral (e s o desvio padro amostral).
- para n grande, em geral maior do que 100, o intervalo de confiana
calculado com essa modificao ainda poder ser baseado, por aproximao, na
distribuio normal.
- j para n no muito grande, a distribuio normal no dever ser
usada e ter de ser substituda pela distribuio t de Student.

- Exemplos:
1) A mdia de altura dos alunos da FECAP em 2004 era de 170 cm, com
desvio padro igual a 4 cm (foram medidos 100 alunos). Com o intuito de saber
se essa mdia se alterou aps 10 anos, selecionamos 64 alunos aleatoriamente,
os medimos e obtivemos a mdia de 172 cm. Vamos considerar que o desvio
padro no se alterou nesses 10 anos.
a) Calcule um intervalo de confiana de 95% para a nova mdia.
b) Voc diria, ao nvel de confiana de 95%, que a mdia de altura de
2015 diferente (maior) do que a de 2004? Por que?

- Exemplos:
2) Dois candidatos disputam o segundo turno de uma eleio. O candidato A
teve 180 intenes de voto numa pesquisa com 400 eleitores. O candidato B teve 160
intenes de voto. Os demais se declararam indecisos ou com inteno de anular o
voto.
a) Calcule um intervalo de confiana de 95% para cada candidato.
b) Dados os intervalos calculados, devemos concluir que os candidatos esto
em empate tcnico? Por que?
Obs: lembrando que podemos calcular a varincia de uma proporo amostral da
seguinte maneira:

Anda mungkin juga menyukai