Anda di halaman 1dari 10

1

INFERNCIA ESTATSTICA: estimativas por pontos e intervalos de confiana


Fabiano Sousa Lira1
Ronaldo Silva2
RESUMO

O universo matemtico bastante amplo, sua aplicabilidade na realidade concreta tambm, em


um vasto nmero de elementos que compem uma populao (de unidades at bilhares deles)
a capacidade de anlise se restringe a uma pequena parte deles, denominada amostra, da qual
pode-se fazer um estudo matemtico descritivo dos dados desta amostra que englobam desde
medidas de tendncia central at de disperso. Este campo de estudo fica a cargo da estatstica
descritiva, que aliada ao conhecimento de probabilidade dos eventos em um espao amostral,
que culminam numa distribuio probabilstica contnua ou amostral, possibilitam a
compreenso da populao a partir de amostras suas, as quais permitem inferncias originadas
de dados numricos estimados que podem ser frutos de amostras pontuais ou de um intervalo
de amostras. Isto tudo, um campo de estudo da estatstica inferencial sob a tica das
estimativas por pontos e intervalos de confiana.
Palavras-chave: Estatstica. Estimativa por Ponto. Inferncia. Intervalo de Confiana.

1 INTRODUO

de fundamental importncia a contribuio da Estatstica dentro da realidade dos


indivduos, a partir dela, dados de uma populao grande podem ser estimados por meio de uma
amostra da mesma. Em vista de tal importncia, foi feito um levantamento bibliogrfico tendo
como tica o estudo da inferncia estatstica.
O presente trabalho tem como objetivo o estudo da inferncia estatstica onde foi feito
uso de uma pesquisa bibliogrfica, tendo como finalidade a explanao dos tpicos: estimativas
por ponto e intervalos de confiana.

Graduando do V perodo do Curso de Licenciatura em Fsica do Instituto Federal de Educao, Cincias e


Tecnologia do Maranho - Campus Imperatriz fabianolira.01@gmail.com.
2
Graduando do V perodo do Curso de Licenciatura em Fsica do Instituto Federal de Educao, Cincias e
Tecnologia do Maranho - Campus Imperatriz lanor.silva@gmail.com.

2 ESTIMADORES, ESTIMATIVAS E PARMETROS

Quando necessrio estudar uma determinada caracterstica de uma populao, a


partir de amostras com determinados tamanhos (n), preciso definir uma varivel que indique
a caracterstica que ser estudada da populao (X). Para anlise desta varivel em estudo existe
um parmetro populacional () que constante em uma dada populao, porm tal parmetro
quando inserido num contexto de anlise amostral especificado por meio de um estimador ()
que varivel para cada amostra e oferece um valor aproximado para o parmetro (), sendo
considerado um parmetro amostral.
Estes estimadores podem ser: o desvio padro amostral (S); a varincia amostral (S2);
a mdia amostral ( ). Sendo que os respectivos parmetros populacionais constantes so: o
desvio padro populacional (); a varincia populacional (2); a mdia populacional (); entre
outros.
Os valores numricos dos estimadores amostrais so denominados de estimativas;
sendo assim, infere-se que:

combinao dos elementos da amostra, construda com a finalidade de representar,


ou estimar, um parmetro de interesse na populao, denominamos estimador. Em
geral, denotamos os estimadores por smbolos com acento circunflexo: , , , etc.
Aos valores numricos assumidos pelos estimadores denominamos estimativas
pontuais ou simplesmente estimativas. Notamos que um estimador, digamos , uma
funo das variveis aleatrias constituintes da amostra, isto , = f (X1, X2, ...). Logo
o estimador tambm uma varivel aleatria. (MAGALHES, 2010, p. 224).

Sendo os estimadores variveis amostrais, implica-se portanto que, eles sero os


valores que determinaro os parmetros populacionais, quer dizer, a distribuio de
probabilidade dos estimadores amostrais indica em uma certa faixa de confiana a incluso do
parmetro populacional.

3 TIPOS DE ESTIMATIVAS

3.1 Estimativa por ponto

No instante em que os dados amostrais so utilizados para calcular uma medida de


tendncia central ou de disperso, e este valor tomado como uma aproximao estimada da
medida da populao, se est realizando uma estimativa por ponto. Assim, o valor de , por

exemplo, uma estimativa por ponto da mdia populacional . Uma situao exemplificativa
configura-se quando de uma amostra aleatria de 200 alunos calcula-se como sendo 5, a nota
mdia amostral, e atribui-se aos 10 mil alunos a mesma mdia; ou seja, ampliou-se uma
caracterstica tpica da amostra (ponto da populao) para toda a populao, portanto, tal
estimativa pontual.

3.2 Estimativa por intervalo de confiana

Este tipo de estimativa baseia-se na presena do parmetro populacional contido no


interior de um intervalo numrico obtido a partir de elementos amostrais, dos quais, espera-se
que o parmetro mencionado esteja inserido com um dado nvel de confiana ou probabilidade
(1 )%; tal ndice ou nvel de confiana geralmente superior a 90%. Alm do mais, quanto
menor a amplitude do intervalo de confiana mais precisa a inferncia realizada quanto ao
parmetro amostral.
Um exemplo de intervalo de confiana quando se afirma com 95% de nvel de
confiana que a altura mdia dos moradores de um municpio X est entre 1,60 e 1,64 metros,
sempre recomendado considerar a probabilidade de erro, pois indicar a chance da amostra
no conter o parmetro populacional indicado.

4 INTERVALO DE CONFIANA PARA A MDIA POPULACIONAL QUANDO A


VARINCIA CONHECIDA
Como j foi mencionado o estimador de , reconhecendo que a destruio de
probabilidade dada, para populaes infinitas, por (Eq. 1):

( ;

(1)

E para populaes finitas por (Eq. 2):

( ;

(1))

(2)

Nas equaes acima, os termos ainda no mencionados, N o nmero de elementos


da populao e denota a distribuio de probabilidade, neste caso, da mdia amostral. Deste
modo, considerando populaes infinitas, a varivel normal padronizada de Zi dado por (Eq.
3):

Zi =

(3)

Ao ser fixado o nvel de confiana (1 ) obtm-se a seguinte distribuio normal de


probabilidade (Fig. 1).
Figura 1 Distribuio da probabilidade correspondente a Zi

Fonte: (MARTINS, 2010)

A partir da anlise do grfico contido na Figura 1 notrio que a faixa em que a


varivel normal padronizada est inserida, ou seja, o intervalo de confiana onde provavelmente
a mdia populacional () est inserida limita-se, regio intermediria no hachurada,
matematicamente tem-se (Eq. 4):

( ) = 1
2

(4)

Substituindo o valor de Zi dado pela Equao 3 na Equao 4 e simplificando a


inequao assim obtida, pode-se encontrar um intervalo no qual a mdia populacional est
inerida com (1 ) nvel de confiana como demonstrado na seguinte equao (Eq. 5):

)= 1

(5)

A Equao 5 vlida para populaes infinitas caso a populao seja finita utiliza-se
est outra frmula (Eq. 6):

(
2

+
2

)= 1

(6)

5 INTERVALO DE CONFIANA (IC) PARA MDIA POPULACIONAL QUANDO A


MDIA POPULACIONAL DESCONHECIDA

Se houver amostras pequenas e o valor do desvio padro populacional () for


desconhecido, pode-se construir um intervalo de confiana para mdia desde que a populao
de onde a amostra aleatria foi extrada tenha distribuio normal. Como o desconhecido,
preciso substitu-lo pelo S (desvio padro amostral) que, diferente do , no constante, mas
uma varivel aleatria. Portanto, obtm-se uma distribuio de probabilidade t de Student
anloga presente na Equao 3, porm, com uma substituio de Zi por t e de por S, adquirese assim uma equao com duas variveis aleatrias ( ) (Eq. 7).

ti =

(7)

Feita a anlise da referida equao e fixando um nvel de confiana e (1 ) tem-se


como resultado a seguinte distribuio t de Student (Fig. 2):
Figura 2 Distribuio t de Student para

Fonte: (MARTINS, 2010)

De forma similar ao caso anterior, o valor de ti estar compreendido entre as duas reas
hachuradas com um percentual de confiana equivalente (1 ). Matematicamente esta
situao pode ser expressa da forma probabilstica (Eq. 8):

( ) = 1
2

(8)

Quando se substitui o valor de ti dado pela Equao 7 na Equao 8 e simplifica-se


inequao assim obtida recai numa inequao que indica o intervalo de confiana no qual a
mdia populacional est inserida quando o valor da varincia populacional desconhecida e
sabido somente o valor da varincia amostral. Tal intervalo apresenta um nvel de confiana
(1 ) e uma distribuio de probabilidade t de Student dada por (Eq. 9):

(
2

+
2

)=1

(9)

Nesta equao a varivel t possui (n 1) graus de liberdade; porm, vlida para


populaes infinitas, considerando populaes finitas a frmula aplicada ser (Eq. 10):

(
2

+
2

)=1

(10)

6 INTERVALO DE CONFIANA PARA VARINCIA


O estimador da varincia populacional 2 a varincia amostral S2, a qual tem
distribuio Qui-Quadrado, exceto em casos constantes, apresentado (n 1) graus de liberdade,
quer dizer, sua distribuio da seguinte maneira (Eq. 11):

2
1

(1) 2
2

(11)

Considerando que a populao tenha uma distribuio normal, esta pode ser
representada do seguinte aspecto (Fig. 3):

7
Figura 3 Distribuio de probabilidade Qui-Quadrado para 2

Fonte: (MARTINS, 2010)

De maneira similar ao raciocnio utilizado para a distribuio normal padronizada


podemos inferir o seguinte intervalo de confiana (Eq. 12):
2
2
2
(
1

)= 1

(12)

Substituindo o valor de Qui-Quadrado dado pela Equao 11 na Equao 12 e isolando


o 2 no termo intermedirio da inequao tem-se como resultado (Eq. 13):
(1) 2

(1) 2
2

)= 1

(13)

7 INTERVALO DE CONFINAA PARA O DESVIO PADRO ()

Reconhecendo que a distribuio de probabilidade populacional da qual a amostra foi


extrada seja normal, possvel obter um intervalo de confiana para o desvio padro
populacional () o qual dado pela raiz quadrada do intervalo de confiana da varincia
populacional como mostrado (Eq. 14):

(1) 2

(1) 2
2

)=1

(14)

8 INTERVALO DE CONFIANA PARA PROPORO

sabido que em amostras suficientemente grandes (n > 30) a distribuio amostral da


frequncia (f) equivale ao estimador de proporo populacional ( ) o qual indica a verdadeira
proporo de sucessos, sendo igual razo entre o nmero de sucessos na amostra (x) e o
tamanho da amostra (n) com distribuio aproximadamente norma, quer dizer, a mdia
populacional das frequncias tem o mesmo valor de p e o desvio padro destas (()) ser dado
pela seguinte expresso (Eq. 15):

() =

(1)

(15)

Desta expresso implica-se, para grandes amostras (Eq. 16) e (Eq. 17):

( ;

(1)

(16)

(17)

(1)

Estipulando o nvel de confiana de (1 ) obtm-se a seguinte distribuio de


probabilidade (Fig. 4):
Figura 4 Distribuio de probabilidade normal para proporo

Fonte: (MARTINS, 2010)

Com a anlise desta distribuio perceptvel que o intervalo de confiana desta


dado pela Equao 4 mencionada; substituindo o valor de Zi dado pela Equao 17 e isolando
o valor de p no termo intermedirio da inequao, considerando nos demais termos este
equivalendo a f o intervalo de confiana para a proporo populacional de determinado evento
ser obtido de acordo com a expresso (Eq. 18):

(1)

(
2

(1)

)=1

(18)

A equao acima vlida para populaes infinitas caso as populaes sejam finitas a
frmula anterior dever ser expressa como segue (Eq. 19):

(1)

(1)

( 1) +
2

( 1)) = 1

(19)

Uma regra prtica para se testar a hiptese de uma amostra grande, verificar se o
intervalo seguinte no contm o 0 ou 1 (Eq. 20):

= 2

(1)

(20)

9 CONSIDERAES FINAIS

Com base no que foi mostrado, perceptvel que, a Estatstica Descritiva e a


Probabilidade, so alicerces tericos de estudo para a Estatstica Inferencial, a partir de uma
varivel populacional, estipula-se um parmetro populacional que estudado por meio de
estimadores amostrais variveis, quer dizer, as caractersticas descritivas da populao so
oriundas de mdias e anlises probabilsticas das caractersticas amostrais.
O conhecimento acerca da Estatstica Inferencial presente neste artigo, no esgota todo
seu estudo, foi realizada uma abordagem grfica e matemtica das mesmas com a preocupao
de compreender a essncia do assunto mesmo desconhecendo a origem das frmulas. Portanto,
o contedo deste artigo serve como base fundamental para estudos mais aprofundados.

10

STATISTICAL INFERENCE: estimates for points and confidence intervals


ABSTRACT
The mathematical universe is quite broad, its applicability in the concrete reality also in a large
number of elements that make up a population (units by billiards them) analysis capability is
limited to a small part of them, called sample, which can- make a descriptive mathematical
study of data from this sample that range from measures of central tendency to scatter. This
field of study is the responsibility of descriptive statistics, which combined with the events of
the likelihood of knowledge in a sample space, culminating in a continuous probability
distribution or sample, enable understanding of the population from their samples, which allow
inferences arising from estimated numerical data that can be fruits point sample or a sample
interval. All this is a field of study of inferential statistics from the perspective of the estimates
for points and confidence intervals.
Keywords: Statistics. Estimated by Point. Inference. Confidence Interval.

REFERNCIAS

MAGALHES, Marcos Nascimento. Noes de Probabilidade e Estatstica. So Paulo:


Editora da Universidade de So Paulo, 2010.

MARTINS, Gilberto de Andrade. Estatstica geral e aplicada. So Paulo: Atlas, 2010.