Anda di halaman 1dari 43

;.Yr~~..

,',
) ~~~ " ' ,
'o
" j
,
.' ..~
,: I
.' . ,
,i
, :- v .••. t
"

l'

,"

,'Pnl'tc:: J:
,(Principios B~siccs)
.. ' .

~
9 '.,-.<' •

:{ ..
, (:
.. ','

' '

itj ; ..
'. í •
'I ~.t• i

. ' :,"
........

',.,
. '.~
"

, ,.
.1:' ',;.
"
!
, "

"

BUBEH ],UJiI:US
.' 'Professor Adjunto
(
;. .... ,

v .• ' "
, , Denartarnsnto de Estatlsti~a
DFI1GS'
. - ~.
- .
..... :-.: ..

'," . '.~ '.

I .l;:
r--'
.- •..
"; ..;'

r---\
,-.l " ./
'.\

~\ ------ ---~-~~
~\ {., "
,. I
~\
~" . I

-. /Ó

'"',
---"
..:
A
r>.

~
r>.

r>.

r>.
, 'I

~ FACULrJi.JJE DE AGJ~m\Oln:A
~
Unl'/cl'sidac!c F8d8)~e.l c1G r1io Gl."ün:1G do Sul
r>.

r>.

\ 197 7
r>.
\ t-
\ , . (
f\

r>. \
r>.

Ir
.. /' ..
'\
EJ,ET.:EHTOS DE ESTATÍS'l'ICA APLICADA
'\

'\
.. ,

'\

<,
Profo Ruben'Markus
"\

+-,

"\

1.'Medidas descritivas e tabela defrequ~ncias


t),

'\
1.1. E~tatistica e seus ob je t Lvo s
~'\

,
A extensão do campo da Estai{stica dificülta a cua definiçio. Já ,
foi definida como sendo a "MateI;}átic~ aplicada aos dados de observa- -r-,

Ç508". Q,uando orientada para a área da investigaçao, dent;t'o'


do chamado ,
"método cient{fico", pode a Estatistica ser definida como a "ciência '\

que se ocu~a da experimentQç;o no que diz respeito ~ sua planif~caç~o, "\

~ ~".
a sua execuçao e a analise dos seus resultados". '\

O conhecimento dos principio~ da Estatística ~ uma real neces9id~ - "">,

de para a condução da pesq~isa cient{fica e se cunstitui num instruroen '\

+-,
t o de trabalho imprescindível em ex pe r racrrt açsio -agronômica
í e biológica
'\
eI;}geral. O desenvolvimentp moderno das técnicas estatísticas foi esti,
-"""\

mu'l.a do p)~eCifiamel1te
pela necessidade de uma metodologia apropriada nes
,
~es camp08 de pesquisa.
'\
Mais especificamerite, a Estatística se ocupa do:
1) - coleta e r-e sumo de dados de observ8,ções j ,
2) :18lilleamento~de experimentos e 1eyantamentosj -"""\

3) - medição da variação dos dados experimentais e de levantamen- +-,

tos; "\

4) - cstimaç~o dos pargroetros de populaç~es e determinaçio da pr~ ,


cisio das estimativ~s; ;:.J,
5) - testes de hjpótescs e~ relaçao a parâmetrosj '~

6) - estudo da r e Laç a o entre dU3.8 ou ma.i.s variávc:is." ,.\1"""


,
A Estatística preocupa-se com doi5tipos de conjuntos de dados: a """

1.'>opul~ç3:'()
(Ol.l un'í ve re ó ) e a amo st ra , Se bem que o objetivo 'básico da "\

Est&t{stica' é o de obter inforwaçõe~ sobre a popUlação,


"""
raramente est~
da-se todos os elemento3 dcssa populaç~o, como no CaSO dos CCP3CS.
,
"""
, Sendo a popula,~&'omuito grande, o tra'balho tÓl'ne,-seexaustivo e
'\
oneroso. Na prática tra'bn,lhõ.-se'
com uma parte da população, ,a'a!:10st:t'CI.,
,
':l.TI: conjunto deci.ados COr:1 me no r rtú:::2..TC' r\c e Leme n t.os qúü o.. população na
-"""\

qual esta00S in~eressado~. Os conjulltos de valeres obtidos em levant~-


'\

'\

'\

'\
.> -'

'\
.......,


2
El,?nto8 }XIT ~i.moctravemou
--~-::..:~
em cXD0.rimcnton. na o e a ae nc í.a.Lmorrt e amo s t.r-a s ,
.As informações con t í.d aa numa amostra pod em aer generalizadas para a 1'.2.
pulaç~o. Este processo d~nomina-se infer6ncia ~stat{Dtica~
'"\ :
A j.nferêncja estatística ou 'a. Esta tI c.tica Induti va é 8. parte da
,
;
r--, , Ent~tística que fo~ncce os m~todos que permitem conclus;es sobre a po-
~,. pulaç~o, partindo da amostra.
,
i
Estatfstica Descritivf!. fornec:e os métodos estatistlcos relaciona-
dOQ com a coletd, 8..o=denaçio, a sumarizaç~o e a de8criç~o de conjun-
. , tos de d ad o s •
Osprinb{pios da Estat!stici, quando devidamente usados na condu-
.-' .
ça o de um trabalho cj.ênt{fico, determinam urna investigaçao mais ,efici-
.i

en t e , Há af í r ma çoe a mo ae n't Ldo de que "tudo pode ser provado" pela ED-
tat{stica. Esta afirmativa é erranea. Nao é~oss{vel provar nada pela
Est8.th,ticao As, afirmaçóes que resul tam da investigaçao cient{fj.ca são
apGn.:=:.s inferências. O investigador raciocina para o caso geral, com 'b a
.~
..
se em apenas uns poucos CaSOS particulares t diante <ta iml)Ossibilidade
prática de observar todos os casos poss{veis. Ccmo semprG existe Xll:..-
~ ... ,ri3'2-.~.Q.
entre os casos observados, as Lnf'e r êric.i.aa se r a o de caráter in-
.•......•...•.• " ..., -cer t o, fi. Llediçãó dessa Lncer t e za é um dos principais objetivos da Esta
\

t{st.ica.

1.2. Dados de observaç~o e sua sumarizaçã'6


I

i
!
I
I Os dadcs de observac~es ou dados estat{~ticos constituem a mat~-
~" I ria frima para ~ trabalho estatístico. Representam qualquer registro
.J nUlli<'5rico
de informaçoes.
! OS,dados de observaç~es tem sua origon, seja por modic~o ou por
I
~ I
contasem,no estudo de a t r í.bu t o s ou características de plantas, ani-
~ II, :nais ou ob j e t o s , Se referem por exemplo, à a I t ur a de pés él.e milho, PTQ
..
-->;

!
du~~o de parcelas do trigo, aumento de pe~o de leitZos, ri~mero de insa
II
.v

r->

'tos mortos por insetioida, ;iúmero de ovos de he Lruí.n tos em ovinos, grau

~,
i
I
í
de ata~ue da ferrugem no trigo, temporatura de indiv{dubs enfermos, n~
'-. J
me r o de po ç as nanuf a t ur-adaa defei tuosaG,étc.
,I
'"
r--" Qualquer que seja o seum~todo de 0btcn~~o, atrav~B de censos, 18

j
r:». vant~~entoD por amootragem ou experimentos, 08 dados de observaç~Qs
consistem, gernlmcnte,de con5hntos deoo~Ganiz2dos de dados num;rico3.
'"\ I Para que COses dados tcriharna1eum valor inforsutivo ac~rca do
1
'"\ 1 atributo sob invcstisaç~0, 61es dcver~o sofrerco~venient0 sumarizaçao
I
...., • ..../ . .:"i
'"\
para po aa i, bili tUj,,'H cx t ra ç ao da l nformaçao d,~:;OJJ1ClQ.,.-
'"\

'\
,
I
j
'Quando 08 dad oa numéricõã-r~;:~
\ ").-
\
t--"",
rjll.D\eJ.N)'ij,f~ /',
' ... l ••• •
orGan~~Jrn-se
, . :") \-:
'.

'j
\

'\ I


.,:f!

~;
freQuência,em que as observações'Gão ~lassificadast em sub-grupos ou
classes, e contadas. Pelo exame de uma tabela de frequências pode-se
facilmente reconhecer a forma de diGt~ibuição dos dados.
, ,
Uma analise mais completa dos dados de observações, no entanto,
requer geralmente uma represéntação mais concisa desses dados, através
de medidas descritivas ou sínteses. As medidas descritivas básicas são
as medidas de tendência central (média, mediana, mod~) e as medidas de
dispersão' ou variação (amplitude, variância, desvio padrão).

1.3. Representação simbólica em Estatística .r.

Os procedimentos e as fórmulas usadas em Estatística tem sua des-


crição simplifi~ada pelo uso do simbolismo matemático.
Quando os dados consistem de medições de algum atributo num certo
número de indivíduos ou {tens, como o peso de leitões, o atributo de
interesse, considerado uma variável, é representado, pelo símbolo Y. Pa
ra diferenciar entre as mediçoes feitas entre diferentes indivíduos ou
{tens, adiciona-se Y. Assim, Yl poderá ser o peso do
um sub-{ndice a

•. a (Y 1 = 23 kg) j Y 2 é o peso do se-


primeiro lei tão colocado muna ba.Lariç
gundo (Y2 = 18 kg)j ete.
Em geral, ~J valor qualquer observado é por Yi, em
representado
que o sub-{ndice i representa o número de ordem da observação_ Quando
- ,

há ~ observações no grupo, i será igual a 1, 2, 3, •••, n.


DRdo um grupo de n observações, Y1' Y2, Y3' •••, Yn, a sua soma é
representada por
n
l: Y
i := Y
1
+ Y2 + Y + • _. + Yn,
3
i=l
em que L: indica a operaçao de~somar e ~ é o {ndice do somatório o
"""""

qual dever~ ab~anger as observaç5es I a E- ~


-r-,
't
Quando não há dúvida que o somatório deverá abranger todos os da- t-

dos numéricos do grupo, a riot açao do ao ma tório poderá ser simplificada


<,

pa:ra

1: J.
Yi ou, s í.mpl e sme n te,
1 Yi·

,
A soma dos qÜadrad_os de n,ouservaçõt!s e d3.da por:

EY~ :::
y2 y2 y2 +
1+ 2 + 3
... y2.
n
Quanrt0.E.é uma constnnter a difE'r0n.ça'(Yi - c) representa o de::;- "\
~ de uma observação qua Lque r- i do bruPO em reLaç ao a essa constante. """"\
r~-
,.---, •
4
,.---,
A soma dos Quadrndos dos desvios é representada por:
"
rr-. ~,. ( )2 ( ')2 . 2 . 2
,.---,
~ Yi - c = Yl - c + (Y2 ~ c) + (Y
3 - d) + ••• +

Restá operação z-e conhec emoa a.e segu.intes etapas:


~
.----."
1) - subtração da constante c de cada Yj
r--,
2) - elevaçio ao ~uadrado de cada uma das diferen9as obtidas em
, 1) ;
.----."

""-. 3~ - soma dos quadrados obtidos em 2).


-r<. Deve-se 'ter o cuidado de nio confundir a soma dos ouadrados
, das
~ observações, com o .92;ladraclo
da sorna das observações.
.----." A soma dos quadrado3 elos desvios, em que a constante c é a média
'-, (1) dos dados em análise, é uma das operaço2s fundamentais em Estatí~
,.-.,
t ca , Tal a sua importância
í que a ax pr-e ssao I «. - y)2 é denominada
r--,
simplesmente "Soma dos Quadrados ll
, com símbolo SQ..
r"
-----..
1.4. Medidas de tendgncia central - M~dia aritm~tica

r=.
Quando e e trabalha com dad oo numéricos observa-se que a maioria
rr>;

rr-;
qos valores observados se agrupa em torno de um valor central. Este fe
nômano e designado por tendência central. Indica que.algum valor cen-
tral ~ característico dos dados e que o mesmo pode ser usado para des-
crever o conjunto de dados e representá-Ia. ~ geralmente o valor mais
comum. H~ tr6s medidas de'tend6ncia central: m~dia aritmética, mediana
" .

e moda.
A E.:.édia
?-1'i tmética é s.imbolizada·por Y (Y barra) e consiste em 80
,
mar todr.s a s observaçoes Y.J. do conjunto e dividir a soma pe-Lo numero n
ele.observaçcés no conjunto:

n n
Por exemplo, um grupo de 5 v~cas da'raça Holandesà, forneceu os
, seguintes d ad os de pr od uçao Y: 18, 26, 12, 14 e -20 kgjdia de lei te •. ,
(
A média e:
r--,

18 + 26 + 12 + 14 + 20 90
('
Y ,., c: 18 kg.
r>:
5 5
~ Um desvio da r:édin é (jefinido COClO sendo a d i.f'e
renç a algébrica e~
r=,
tre a observaç~o, e a média: Yi - Y. Uma das propried&Jes interessanteG
r---
da m6dia ~ que a som~ dos desvios e igual a zero:
r--,

r>.

~
»r>;

'"'
,.....,

r>.

Iii
"~"'\r
.~.

~
5
~
A demonstração é a so~~intel
L (Yi - Y) c (Yl - y) + (y~ - 'f) + ••• + (Yn - y) \
"

"
'"'
n '"'
~
Para o exemplo anterior temos:
L: (Yi - Y). = (18 - 18) + (26.-- 18).+ .(12 ;;':'18) + (14--'.18) + (20 18) '"'
"\

c O + 8 +(-6) + (-4) + 2 = 10 + (-10) c O ""'

Média ponderada - Em certos problemassao atribuidos pesos (w) di


~
ferentes a certos valores da vari~vel Y, ou certos valores da vari~vel
'"'
Y ocorrem com maior frequência (f) que·outros. Nestes casos calcula-se '\

a média ponderada:
'"'
~
Y c: ou
\

~\

Moda e mediana serão discutidos na seçao 1.13. ~'\

~
1.5. Medidas de variaç~o \

"

'A média, a mediana ou a moda descrevem apenas uma das caracter{s-


"
ticas dos valores numéricos de um conjunto de observações, o dá tendên "\

eia central. Nada informam, porém, sobre um outro aspecto, ~ue é o ~

grau de variação ou dispersão dos valores ob se r-vad os , Em qua.Lque r gru- "\

'\
po de dados estatisticos os valores numéricos não serão idênticos,
·mas apresentarão desvios de grandeza vari~vel, em relação à medida de
'\

\
tendência central.
\
As medidas de variaç~o 8ervem para descrever a distância com ~ue
~
os valores mais ou menos extremos podem ser acha~os do valor central.
~
É fG:cildemonstrar que a média por si só é insuficiente para des-
"\
.Crever 8.de~uadamente um grupo dê dados. Dois g:!:'upospodem ter a mesma "\

média) IDas diferir muito na magnitude da variação dos dados de observa "
-
çoes. '\

Sejam os três grupos: (a) 5, 5, 5; (b) 4, 5, 6; (c) 0, 5, 10. To- -,


dos t~m fi mesma média 5, mas nso h; variação em (a) e a variaçao em .\

(c) é maior do que Gm (b). '\

Obtem-se uma descrição mais completa dos üados ~uando se aplica, \

além de uma medida de tendência central, uma medida de d spe r-s ao , .ou
í "\

variação. Tais mediclas são n.pmpJitude, a variância e o desvjo padr~o. ~


~.
Amplitude - A am,Plitude é a diferença entre o valor maior \
"\

"\

'\

'"\

~
r/-,;:

~
..
.6
~
e o valor DGnOr de um conjunto de·dado~. É a mais simples das medidas
,~
de variação. Por exemplo: a amplitude de variação é'o em (a), 2 em (b)
é',
e 10 em (c). Para o'gruP9 de dados daseçio 1.4, a amplit~de Ae vari~
~
ç~o das produções de leite é 26 ~ 12 ~ 14 kg.
De um modo geral, não é'a amplitude uma medida satisfatória da va
-----
~ rinção. As 'razões são as seguintes s
r=. 1) Seu cálculo ,utiliza apenas duasobservaçôes extremas, n~o sen-
r<; do avaliada. a variaçao dos valores intermediários.
2) Seu valor tende a crescer com o aumento do número de observa-
çoes do conjunto. Em conjuntos grandes há' maior oportunidacle
par-a a manifestação de va.lores extremos. De s t a forma, a amlüi':"
tude não oferece co~parações válidas da variação de dois ou
mais conjuntos que diferem substancialmente quanto ao número
total de dados de observaç~es.
Devido a facilidade de cálculo e por ser razoavelmente está'vel ~
ra conjuntos pequenos de observações, a amplitude é.usada com frequBn-
eia em operações industriais que dizem respeito ao controle estat{sti-
co de qualidade, por exemplo, s,
de peças manuf'a+ur-aô.a
r' Soma dos quadrados - Asom~ dos quadrados refere-se ~ soma dos
quadrados dosde~vios da média. Em 1.4 foi verificado que a somaalgé-
brics. dos desvios é igual a zero, o que limita o uso da simples soma
dos d~svios sob o ponto de vista da Estat{stica.
Est~ limitação é superada, elevando cada desvio ao quadrado: to~
dos os quadrados ter~o valor positivo. A soma' dos quadrados é,poj.s, a
soma dos quadrados dos desvios das observaçoes da respectiva m~dia. ~
simbolizada por:
SQ.= (Y
I
- y)2 + (Y2- '1)2 + ••• + (Yn - 1)2 >-: (Yi _ y)2
t evidente que a soma dos quadrados dos desvio~ ~ uma medida de
dispers;o; Se os valores observados s~o id@nticos, a soma dos quadra-
,
dos sera O. Se os valores ferem muito semelhante~t a soma dos quadra-
, •
dOB sera pequena; mas se os valores se dispersarem sobre urna amplitud8

/'
.muito an:pla, a soma dos quadrados terá uma. grandeza correspondente.

,
A soma dos quadrados é utiiizada em m~itos processos de comp~ta-
~~o estatística, especialmenie chamada an;lise da vari5ncia. Como
~ ll~
. -----
"" medida da variabilidade de um grupo de dados, o seu uso .limitado,
-----, pois nuo leva em consideraçao ci n~mero de observaçoes do mesmo.
~ Vari~ncia - A vari5ncia ; o guadrado D~dio dos desvios, isto é, a
~ soma dos quadrados dividida pelo n~m~ro de observaç~cs n do c~njunto
r"">;
menos uma , O sfmbo í o usado para a varlârlcia:{.s ~,;ena;o:-da'leu.Lada por
,.."
,......,

'"\

.~

..--.,
~
,.

n-l .n-l <,

A variância é talvez a mais importante das estatísticas usadas na


---
descrição da variabilidade de con jun t os nuraéz-Lc oe ,
\
Para o exemplo da'seçao 1.4, a variância é ....,

2
·22 2 2
s c
(18-18) +~6-10) + (12-18) + (14-18) + (20-18)2 "'
5 - 1
,
»

(0)2 + (8)2 (_4)2 (2)2 "'


c
+ (_6)2 + +
4 ,
a O + 64 + 36 + 16 + 4 = 120 IC 30 •.
'\

4 4
<,

o denominador n-1 da variância é denominado .•.


gr~a_u_s
__d..:;.e--"lc..:i:;..:b:;..:e;:..:
....,
comumente simbolizado por GL. O princípio dos graus ~e liberdade
-....,
constantemente usado na metodologia estatística. Pode Aer conceituado
.dediferentes maneir.as. Considerando um conjunto de n observações e fi
'xando-se uma média para esse grupo, existe a liberdade de escolher os
valores numéricos de n-l observações; o valor da última observação es-
tará fixado para atender ao requisito de ser a soma dos desvios da mé-
dia igual a zero. No caso específico do cálculo da variância, ~iz-se
que os ~ graus de liberdade originalmente disponíveis no conjunto so-
freram uma redução de ~ma' unidade, porque uma estatística, f, j~ foi
calculada dos dados do grupo e aplicada na determinação da variância.
Quando se estuda a variabilidade de dados experimentais pela cha-
ma da ana'1 13e
. ~ varlanc1a,
ua . ~. , bo 1o s 2, e su bS t'1 t U1 do por Q!Kd, que
o Slm í .
Slg-

nifica quad.rado médio. Calcula-se Q,M >= SQjGL, isto é, o quadrado médio
é igual a fleuma dos quadrados" dividida pelos "gr.aus de Lí.be r da de!' ,
Desvio ~adrão - O desvio padrão é uma das mais úteis medidas da
variação de um conjunto de dados. ·A van t agcra que apresenta sobre a va-
riância é a de permitir uma interpretaçâo direta da variaçao do g~~po,
pois o desvio padrão é expresso nas mesmas unidades de mediçao (kg,
em, etc.) que a.s empregadas na tomada elas observaç~es. É representado
,
por ~ e e calculado por:

S c:

n - 1

O desvio padrao é, portanto, a raiz quadrada da vartâncin. Para o


exemplo das seçoes anteriores:
--.j
---.J,"
.- -,
r">; .•.
,-'\ 8

-<.
a c V-:;;"" 5 ,5 kg'
" Para os dados de medição, especialmente em grandes conjuntos,
~
(n;>30), o desvio padrão fornece. os. limites prováveis deritro"dos quain
r>;

se situam certas proporções das ·observacõ'es•.Assim


~ verifica-se que ccr
.-;
~a de 68% das observações do conjunto estarão entre os limites Y + D;

~ 95% das observaçoes entre Y ~2Si a, praticamente, 100% das observaçocs


/" entre Y .±.3s ,

1.6. Cá~cu10 da soma dos qu~drados

Â. parte ma í.a trabalhosa do cálculo do desvio -padrao ou da var ân- í

eia é achar 8, sQma dos q'J.adrados, SQ.. A tarefa geraJ.mente simplifica-


~. se ~sando a equaçao:

2
s = --------------------
n - 1
. em que o numerador aparece. transformado; Este m~todo ~ particularmente
b~m adaptado ao trabalho com calculadoras e e.quase que exclusivamente
.." -.'-
usado nos laborat6rios de Estat{stica. Na falta de uma 6alculadora,
usa-se uma tabela de quadrados dos números.
O termo .
L y~~ é a soma dos quadrados das' observações individuaiD
(nao confundir com SQ.) e ( LYi)2/n é o .fator de correqao, FC.
Aplicando-se esta equaçao ao exemplo anterior:
~ 2 222 2 2
~Yi 18 + 26 + 12 + 14 + 20 = l740~
2
FC = (90) /5 = 1620;
·s~ c 1740 - 1620 = 120;

s2 ~ SQ.jGL == 120/4 e- 30.


:.
Demonstra-se a igualdade dos dois numeradores usados no cálculo
't
da variância da forma seguinte:

r>.

r=-.

r--.

/">:
, \

r'<;

'./ '

'"
,-\'

,~

/\
"

9
1.7. Codificação de dados

Os cá~culos podem ser freque,ntemeIjte facilitados pelá corlificação;


~os casos mais simples subtrai-se uma constante de cada observação, ou
o.ivide-se cada obae rvaçao por umacoíAt~nte. Na decod;.ficaçiio das esta
t!sticas calculadas usando este artifício, devem ser observadas as se-
guintes regras:
, , 1Q -' Quando num conjunto numérico a s observações sao diminuidas
(ou aUmentadas) por uma constante, a média dever~ ser corri-
gida somando (ou subtraindo) a constante. A variância não so
ire transformação.
Exemplo: Um conjunto consiste dos seguintes dad.os: 13, 11,
10, 12, 9. Para calcular Y e ~2, subtrai-se '10 de
cada dado: 3, 1, O, 2, -1.

L---- Yc
- ~ 3 + 1 + °5 + 2 + (-1)
- 5
5__
~ 1 j
I

y = yc + 10 11;
2 2 2 2
3 + 1 + 0 + 2 + (_1)2 15 5
'5 - 1 4
, 10 2
:= - = 2,5 = ~
4
QUando num conjunto nunérico &S observações são divididas
(ou mul tiplicadas) por uma constante, a mê'dia obt ida dever~
,,\
ser multiplicada (ou di~idida) pela'constante. A vari~ncia
obtida deverá ser multiplicada (ou diVidida) peJo ql1adrado
da constante.
-"
Exemplo: Um conjun,to consiste dos seguintes dadoa e 10,15,
-,
15, 10, 25 • Para ca 1 cular Y- e 2
8, d lVl
'd
í
e-se por 5 ;
.-"
2,.3t 3, 2, 5.
..•
Y 2 + 3 + 3 + 2 + 5 _12. =' 3 j

c c 5 - 5 ~
y c (5) (1 ) (5) (3)' c 15; '"'"

c ......,

2 2 .z - (15.15~
2
B
2
o
c
2
2
+ ,2 + 3 +' 2 .+..2
5 - 1
.. 51 - 45, ::1,5;
4
'\

......,

.......,

'\

1.8 Coeficiento de variação , '

'\

'\

11 a Estat{stica usada quando ne de se ja comparar a variaç'ão de c0!2. '\

1
"'"'"'

'\

~
10
juntos de observações que diferem na média ou são medidas em diferentes
unidades de
-
mediçao. O coeficiente
,..., ,
.-
de v~r~açao e o desvio padrao
- cx~
'presso como uma fraç~o ou porceritagem da m~dia:

100 (3
C c:

Para o exemplo -
das seçoes anteriores:
C (100) (5,5) - 30 '6d
c: 18 -, 7°·
O coeficiente de variação é uma medida relativa de variabilidade.
~-independente da unidade de :nediç~o usada, sendo o seu valor o mesmo,
ainda que se use, por exemplo, gramas ou quilogramas na medição do pe-
so. Também são compar~veis os coeficientes de variação da produçao de
feno de alfafa e da produção de milho. Anim~is experimentais
possuem coeficientes de variação característicos e estes podem ser com
parados apesar da diversidade de atributos medidos.
Tem aplicações na pesquisa para comparar a precisão de diferentes
experimentos. Entretanto, a qualif:i.caçao.de um coeficiente como alto
,
ou baixo requer familiaridade com o material que e objeto da pesquisa.

1.9. Tabela de frequências

Quando o conjunto de observações a descrever consiste de um núme-


ro relativamente grande de dados, recomenda-se em geral, agrupá-Ios nu
ma tabela de frequênciasou distribuic~o de frequ&ncias. oi dados s~o
-distribuídos em classes pré-estabelecidas, reGistrando-se a freouência,
isto é, o número de casos ou dados que correspondem a cada classe.
A distr:i.buição de freQuências é, portanto, o arranjo tabular de
dados por classes, juntamente com as frequências correspondentes. Des-
ta maneira, a massa de dados originais toma uma forma mais simplifica-
da.
As estatísticas, como a média e o desvio padrão, podem entã'o ser
calculados da tabela de frequ~ncias com menon trabalho do que dos vala
res originais. As tabelas de frequencias servem de base, também, para
r~presentaçoes grif:i.cas.
O trabalho inicial na organização de uma tabela de frequências
consiste na e3colha das classes. Com dados de contagem o problema ~,
em geral,de soluçio simples. Por exemplo, no reeistro do n~mero de
azos obtidon no lançamento t ânoo de cinco dado a , as clasoes_ ~\rao:
niI::ul -
0, 1, 2, 3, 4, e 5. Quando o n~mero ~e classes possíveiS par~ dadoB de
contagem é. ox ce ss vo, pode-se
í reunir duas- ou ra-a.is
r-- ~~l~às~~
(', , \ ~ . só':
,-~ ~i.:.~~,
f \, •

I
11
POJo'à (13.<:0:'; de ro(,05. ç~e o ur.; 01;;:; eu' d.cvc:l'~~ ser _er.ü'olhi<lo.n d 8 'um mo "'1

domdo8 ou mcno o urbitrJrio. li o e c o l.ha UC1;cllde ele: ~'a,t;o:cCB tül!) COf:lQ o ")

número total de' obn'3I'v;:ç:ões, a arnp l.L tud c c1a va r í.a çao , €\. precis;o r:)qu~ "

'rid~ no c51culo das estatísticQs' e o ~rnu de cOnde~GRç~O desejado. ~a-


\
ra obtermos lM~y.il!la pr cc i.ca o no ~:iic~lo de: c~;t.o.t{st~CQ,D ela tabc:l0. dc ,
fre{l\)ê~'1Gias resultante, o intervalo do urna classe
,<.

n~o deveria !)ur como ,


regra, ~aiorfto quê ~/4 do desvio padrao. ,
: ':SeGuind~-3e cstritacente csta.re~rat por6m, 03 dados
....
nao ficam,
'\
',;
........,
auí íac '\rezeo; adcCJ,.uc.ur:.mente cond.(),n~éldos IJ<\TrJ. rqn'cs0ntação Gràfica. B
,1
aursc n t m- 'o Ln t ervc Lo de c La o sc a paro. 1/3 ou
'profel'í'ycl'- rLcnsGsc&oOS,
,
i/2:dodesvio :p8dr~6 8 igno~ar a perda do preci8Bo' no ~~lcuio dns ehta .,
tíaticnü <
\
~ O desvio padrao :n~o ~ conhecido~o momento da ol'canizaçio da tab~
'1
Ia de fr€quanci~9. PotlGr~, no entanto, ser cBti~ado da relnçao que e- '\

xiste crrt r-e a amp1i i'.ude U,:- V3'r:l2..ç'.<:1.0 e o d c sv i o IJUCJ.TD.O •. Ila 'fabcJ.n 1.1 \

figu1'am uIgumaG c.essar,; l'CJ.UÇOCf;, út e í.s lia (:HtiBat;:i.v~l do desvio paôr ao , \

,
......."
Tabela 1.1. VaJ.orcA da rc~açno amplitude!doDvio pudt;o
.. . ~,
HQ ele, HQ de .......,
AClp1itur.loí::,
obscrvu<;õen obscrvaçõo8 ""'

......."
20, '3,7 200 5~5
""'

' .. 30 . 4,1 300 5,8


\
50 4,5 400' 5,9
-,
70 1).,8 500 6 j 1,
.' '\

100 5,0 700 6',3 .......,

150 1.000 6,5 -,


---------- .--,

,.
,-,
e a d.i í.er en a entre ç os Li.m i tos ~......,

infe~ioi da classs. ~ tamb~ill chamado de amplitude, tamanho ou compri,· ( -, "


" msn+o .c1e c Las se , \

o .~.~.. nt~?A C)flS~ ou .E0nJ:.,.o l:i.mitc3 ,


-\
.de U:7'a classe,
\", .......,
Após a cluGsificaç~o do cpnju~to de observaç~cs9 'todos os dados
dentro d c um intetv,'.J.o de c La s cc aSSU1:J.c;m' 6 v a Lo r do centro' U0 c las oc ,
....,
O c on jun t o de va Lor o s o:r5.,sina:i.3 fica, po r t.an t o , aubo t it n i d'o por um co~ "....•.
juhto novo, uais condcnorido. 00 contro de cl~s~e e aS ~~~poctivac frc-
A. • .' ••
1
q,UE:nClD,8 G:..lO u!:;:1,do!, no cri I c \1.1.0 cl.'d3 e s J,;(1tL; ti C,,8 . d e cc r i ti VD..8. FOl'nCCCi:1

tari\k~:n os c Lo me n 'G(\ a }~in'l1 a ore" ni 7,,\ ç a o du &l'itf:io Go fJ C o mo o bJ, f1~~j'f;1I!..:~ t o",


\

1
+-,
12
"
~plo: Numa fazenda 'foram .r-e g í.s t.r
ado s os pesos 'de 84·"novilhos
na fase final da engorda. A Tabela 1.2 reproduz a d í.s t r'Lbuf.çao 'de fre-
quência8 obtidas com,esses dados. Os pesos mínimo e máximo verificados'
foram, respectivamente, 331 e 476 kg. A amplitude de variaçaototal é'
416 - 331 : 145 kg. Na,Tabela 1.1, para n ~ 84, a rel~çao amplitude/
desvio padr-ao é aproximadamente igual a 5,o. Estima-se o d.eav í.o pad rao
em 145/5,0 29 kg. Optou-se por 1/2 do desvio padráo para a amplitude
da classe~ ° valor 29/2 '"14,5 foi aproximado para o número inteiro'{m
par ma~~ próximo, 15.'A vantagem de um número ímpar e~ vez de par está,
em que no caso de um intervalo ímpar o centro de classe será um número
inteiro.
. -.,":;..!},",
° lim{te illferior da primei;a.classe foi determinado subtrain
do-sê'~:[Ó':;'5'
da ob ser-vaça o menor: 331 - 0,5 '"330,5. Na oz-ganã aaçao d'aa
demais classes acrescentou-se consecutivamente o intervalo l5; a últi-
ma classe dever~ incluir a observaçao maior.
A decimal 0,5 acrescentada aos limites das classes nao tem rela- -
çao com exatidão das peSagens. É um artifIcio usado pura garantira
corr~ta classificação dos dados. Se os limItes das classes fossem
330 - 345, 345 - 360, etc., haveria dúvida na classificação, por exem-
plo, de um animal pe?ando 345 kg; poderia ser classificado na primeira
ou na ·segunda classe.
\

Tabela 1.2. Tabela de frequ~ncias do peso de 84 novilhos \

Classes Centro de Frequência


(kg) classe (kg)

330,5 345,5 338 1


345,5 360,5 353 3
360,5 - 375,5 368 12
375,5 390,5 383 19
390,5 405,5 398 18
,,,",
405,5 - 420,5 413 13- •
.----.
420,5 - 435,5 428 9

r>.
435,5 450,5 443 5
450,5 - 465,5 458 2
-----
r--.,
465,5 - 400,5 473 2

" Total 84

r---

r>:
° passo seguinte é a
f',
nas respectivas clascest
r--,

,~
".....,

I
..... ,
e '.
.. ....J.~ I .~..'" ~.~.•

I .'
..
ob~er~aç~o faz-se uma narca ae lado do intervalo de. classe correspon- "1

dente. Terminado o pr-o ceaao ,.inscreve:-se na coluna 11 Frequênd.a"· o núm0 , ------,

ro de marcas que ocorreram em cada classe •.A frequênciàObtida é acha -""I

mada frequência absoluta. -,


A distribuição final das frequências pelas diferentes classes, ob ~
I
\
, ";tidas no caSo dos novilhos; é t{pica.paraos dados de mediç~o. S~o re-
'.,\ ,. .
\
'\j1ativamente raras ~s ocorr~ncia~ d~'~alor~s nas classes extrcmas=s~o
--."
.)mai,o frequentes as observações de valor intermediário. ". ,
---.."
i
1.10. Cálcuto da média e do desvio padrão de urna tabela de fre- '\

qup.n,cl$.s '\

~
são usadas as seguintes equações gerais: +-,

'\
2 \' 2
'Y =: c s
2
= _L.
rt
~~~----~l--~~~~
fy ( L fr) /n ~
n n - ~
------
~m que! e, a fTcquenci~
'" C~ urna 01a336, Y o C01'1t.r o do. c Lu eee ,
V ..
'
[iít:!Stli8.
.,
.1.- fy e a SOlnA, dos produtos f vezes Y, para cada classe, c n é a frc- +-,
quência total. A repr.esentação corret~ de f e de Y se~ia í.~ e Y'~f 30.n-· ----.,
do o {ndice i c'~~~ero ~e cr~cm ~a cla~se (i ~ ~, 2, 3, ..••
f k), haven
do Js. classes. "
.A codificação dos valores Y facilita os cálculos (Proce~so Abre~
"
'\

viado). Su.bstitui:'se os centros de classe 'y por um valor codificado Y , ,


·c
dado pela série dos nÚmeros ,<., -3; -2 I -1, Of 1 f 2 f 3 f ••• , faze!'~d.o -"
~
coincidir o zero com a classe mais central, geralmente a de maior fre-
<,
2
quência. Calcula-se entio as estat{sticas Yc e 8
c
, em que o índice ~
-,
denota que 8io estat{8tic~8 codifi.cada~. A3 2~tat{sticas descodifica-
'\
dau süo obtiuas usando as seguintes relações: .\
.%l..,

2 2 2

e B 1> (a ) e '\

C
~
, ",..._ ..•.. _- ..
em que a e o "ÇL1\tJ..V clü.3se a qual foi '\

atribu1do o v~lor zero na codificação. '\


"\

Na Tabela 1.3 estão relacionados 08 cálculos para o exemplo dos


\
84 novilhos da seç~o anterior:
\

--")

\
,.
'\
-""I

\
"'\

\
J---..
)"'.~':": !,;J:'",
.

Tabela 1.3. C~lcut6 Ja m~dia e do desvio padr~oda Tabela 1.2

Centro de Y Fre.quência fY
o o iy2
.classe (r) (r) c

338 -4 :_1 -4 16
353 -3 3 -9 27
368 -2 ,12 -24 48
;83 -1 19 -19 19
398 O 18 O o
413 1 13 13 13
428 2 \
9 18 36 l

r-o
443 :; 5 15 45
458 4 2 8 32
473 5 2 10 50

Totais 84 8 206

(n) ([iY o ) (L fy2)c


- ' 8 2 286 _ (8)2/84)
Y c = ---84. : 0,095; s
C 84-1
::
3,436

f = (15) (O~095) + 398 :: 399,4 kg

2
.8 ::(15)2 (3,436) ='773,10

8 :: V773,10 27,8 kg

1.11. Frequências relativas e frequências relativas acumuladas

Na Tabela 1.4 constam as frequ&ncias relativas e as frequências


acumuladas da TabelaL2, referente ao p~so de 84 novilhos.
A frequ8ncia relativa de uma classe ~ a f~~qu~ncia absoluta de~sa , .

classe dividida pela frequência total, ou nÚmero total de observaçQes.


~ .Infor6a sobre a proporç~o de ob~crvaç~ea em cada cla~se.
A. ~uênd,a relativa acumulada indica a frequência relativa de
~ valores menores que um determinado limite superior de classe. g a soma
~,
das frequências relativas at~ esse ponto.
~
.Ambas as modalidades de frequência, em vez de serem expressas so-
.~
breu unidade, como no caso da tabela, podem ser expressas em porcent~
--.,
,...., gemo
,'

.--....
,..-..., r-; r·~··
i- •• 1--,;-;,-------,---:-:-,
',) I,
'-) I
~
,- i:::;; i') '; •• I
'"
L
, "

I
",
i'fi,'

15 , -"
Tabela 1.4. Frequências relativas e relativas acumulados da
Tabelo. 1.2
-.,

Classe Freqúência Frequencia re1a- ,


(kg) relativa tiva.acumulada "\

330,5 - 345,5 '0,012 9,012


0,048
,
:545,5 - 360,5 0~036
"\
360,5 - 375,5 0,143 0,191
315,5 - 390,5 0,226 0,411 I" "'\

390,5 405,5 0,214 0,631


.." '"

405,5 420,5 0,155 0,186


"
420,5 435,5 0,107 0,893 ,
'435,5 - 450,5 0,059 0,952 "
450,5 465,5 0,024 Oj976 \

0,024 1,000
""\

465,5 480,5
~
Total 1,000
'\

A frequência relativa quando expressa em fração decimal,refere-se '\

a um indiv{duo do conjunto estudado. Este' caso é si~ônimo de ~obabi-


"
lidade. Diz-se que um novilho tirado ao acaso do conjunto de 84 novi- '""

lhos, tem peso entre 420,5 e 435,5 kg com uma probabilidade de 0,107. "-

A frequência relativa em termos de porcentagem refere'-se ~ormalmente """

ao intervalo de uma classe. Por exemplo, 10,7% de todos os novilhos do """

conjunto observado tem peso entre 420,5 e 435,5 kg.


No oaso dos novilhos, verifica-se que a maior frequência relativa
oorresponde aos pesos intermediários. são raros os animais de peso ex-
tremo, seja de peso alto ou baixo. A frequência relativa de a~imais e~
tre 390,5 e 405,5 kg é de 21,-4%.Do total de animais, 63,1% tem peso
inferior a 405,5 kG.
Conforme foi mencionado na seção 1.5, aproximadamente 68% dos pe-
soo individuais d~veriam estar incluidos numa anplitude definida pela ,
média mais ou menos o desvio padrão, ou seja: 399,4 .2:. 2'r,e kg e 95% na
amplitude 399,4+(2) (27,8)kg. Estas' amplitudes são 371,6 a 427,2 kg e
343,8 a 455 kg, respectivamente. ,É fácil verificar que eotes limites
'f ""
de fato incluem, respectivamente, 68,070 e 94,910 dos 84 pesos indiviJ.u-
aís ,

1.12. Representação gráfica

Apesa~ da tabela de f~equ5ncias ~cr efetiva na apresdntaç;o dos


aspectos mais sali::mtes de um grupo de dados numéricos, n~o'há dúvida
que uma representação pictórica do~ mesmos tem impacto maior. Gráficon,
, . ~-,' ,-' :.- ~ ..• ,".

;'--, baseados nas distribuições de frequências, d~monstram as principais c~ .'


racteristicas dos d.ados de observações de uma forma fr..cilmente·compre-
ens{veL
O pistor;rama é uma das I:Uodalidti'des
de representação gráfica dc
uma distribuiçâo de frequências. É construido elevando retângulos 80-
,
bre os intervalos de classe, de tal forma que as areas dos retângulos
são propo!cionais às frequências das classcs. Quando os intervalos de
classe são igua.is1 a altura dos ret~ngulos é proporcional à frequência.
Os valores do atributo em ccnsideraç~o são apresentados na escala hori
zontal. A Figura 1.1. é o histograma da Tabela 1. 2. As frequências se
distribuem groese Lr ame n t e na f'o rma de um sino. Isto é t{pico .de muitas
distribuiç~es de frequências de dados de observaç~es obtidos no campo
da Biologia.

-} . i
. '-'-'" ---.--_. , -._ ..- .. _--....;.: .• "'- ._: :_-_ ...• .:. - -- ...:-.!.-
. , ,
01'1
\'
:; t • !
i'-
. , [
'. - •- • 10.. j.

., ,I:... :." --:,.; I" .


.. . 010]1
- .--- ... - ~
o
..•... - t _.
...--- -..- :~ ! .
..I, i,
. i . !
. . .. " .. '_.-.'
, ..~
(ô. I· .\
,.. -'1 . i

> O./r. I
;'
4-
. m
ti)
'. .
1
~
. l -

ec
.'\)
<.> 0.10
s:
-'Ç~

::5
er-" , ._- ., ... -~ !
<:;:)

u,1../
0.051

~.

, .

o ~\r-l!---r-'---.--L..~-1---,_...l--..,.-.l--.--. J---,--'---.-J-.-T--''---t---'-
. <>31> J~ 3G.8 ~r3 ,a9g 4-1;; 42g 1t/~?J 4Sf! lt73

;-----. . 1 Centros 'de ç..1a-S5c·) f?.S


Figura i.l Histogra~a dás frequências relativas
""' . dos peno~ de 84 no~ilhos

Um segundo método (f.l'éífico


para a representação de urna distribuição
de f re quênc í.a e é o do pol{gono de freouênci'n.s. Obtém-se unindo os pon-

1'.
tos centrais das bases superiores dos re t~.ngul@s.;âe r u~- h;i~~;~-~~i-pó.~ I
. ,..., r-:J r; /"~.~.: r-- ...... """ o', .I
I "'" '1 • .....,; '-j :,:j (;: \_. I

~ .\ I I

I
) .
..
- } '\ J '. ,I
• L .•


,'i:

""1

l7
linhas retas. Os valores registradoo na abcisSa n~o devem Ocr conoide- "
."\

rados individualmente. As alturas dos pontos que estno ligados para


formar o pol{gono r-epr-e eerit.am frequ'ências das classes nas' qua í.s foram "
--,
agrupados os dados e não dos valores individuais. A Figura 1.2 é o po-
'\
l:{gono de frequências da distribuição de pesos dos novill),os. ,
.~
!," l: '.'j : .. . ;-'," . ····1··..... '1

.1·...
, ~
·i·
.1, .
I .J'

~. O,U
" "'"

'-
I :
-!- ''':. , ....i .).
""
.tf) '\
~
c:t 0./5" '\

rt -r-,
'''0
~ "'"\

<~
'.~ 0.10 -">,

. ,~
J:: ---,

c.os
"
'"

,. , ·0 -,
..
. . ' ..
<,
'. Centros d e. c!Q.s~e. nj I
t """\

---..
Figura 1.2 Poligono de frequências relativas dos
pesos de 84 novilhos
"\

""""\

.-,
""

Uma distribuição cumulativa de frequênciapode ser representada


graficamente por D~a ogíva. Para construir uma ogiva, representa-se 08 -e--,
limi tes supe r or-e s dC15c Laa ses na horizontal
í e faz-se a a I tura dos pon-·· ""'\

tos proporcionais ~ frequ~ncia acumulada at~ esseslim{tes. Estes pon- ,~



tos são então unidos por linhas retas. Ao contrário do pol{gono de fre '\
A -, 1 .,. t_'\
quencias, a interpolaçao e perm1ss~ve com ogivas. Por exemplo, na Fi-
3, a frequ&ncia
gura 1.• de animais com peso'inferior a 400 kg é de 0,5 \
'"\
ou 50%, aproxiMada~ente.
'\
Note-se que nos três gráficos' anteriores adotou-se a frequência
.relativa nas orden~das. Deuendendo
~ da fin~lidade
. dos grif1~o9, pode-
--
'\
riam ser us~d2s frequ~ncia3 absolutas.
'1
-")
-,
'\

'"'"

')

'\
~:·~+:-i.D
'.. I·· ."

:.. i ..
"~.:.;_0-1
. I .
"i
'i o.e
~.: '1"-"--'"
.~ ~.7
'-
o
-t-
(11

~.
e,b
·~"J-~.·-:.;":~:-~r.j::
i· : .
~r~'..i....~f.T~~;~T~T~:-;[.~·::
::T --o

.) .... i-.·~"l .: :i: . ~>1


ç,l I -, _ ~. .' 1 . . l " ". I :..;.

O,S I .; . "
0:(0 . !
'~ I. I .. "0 .,'--:-::' • i "" ·1','. I
s:- D,Jt
_!.._._;'.,:.~ ~~_
;. ',: • I

._.i ...••... : '., . __...i .. __ ., .• ~._.: __ •• f_ .. ~.L.__ 1 . __ ,_,_,."" ...


~"":j I
()- _.0 ;.
D.3 .. I

."
~
,.......,. 0,2 .: ···t" .
I

: ::'1" '..
;
.......•.
°11 .. .
.. , .

O
.310 360 410 4So 4~o.
, .!'
~.
~. F1gura 1.3. Og í.va das f'r-e quânc La s relativas acumu-
•......... ladas dos pesos de 84 novilhos
r>.

r-". 1.13~ Moda e Mediana


-r-,

»<:
são duas medidas às vezes usadas em 'lugar da média para determinar
r=;
a tendência central de um conjunto de observações.

"'- A moda. (Mo) 'de um conjunto


; ,
de obs.ervações é definida como o valor
de frequência máxima, so'existir algum. Assim, para o conjunto de dados
3, 4, 4, 4, 5, 5, 6, 6, 7, 8, 9,a moda é 4.
A mediana (Me)'de um conj~nto de observações é definida como a ob-
servação elo 'meio, se existe alguma, após o arranjo das observações em
. '
orden.de grandeza. Para o exemplo acima a mediana é 5. Se há um nÚmero
par de observaçoes, a mediana será a média das.duas observaçoes cen-
trais. Se um d~s5 fosse om~tido do ex~mplo precedente, a mediana seria
,
5,5.
A~od~ nem sempre existe e nem sempre é única. Quando sao poucos
os valcfés observados acontece,. ~uito fiequenternente, que n~o h~ valo-
res repetidos, como que nenhum sati~faz a condiç~o~de moda. Se os pe-
sos (em kg)correspondentes a 9 adultos fossem 82, 65~ 59, 74, 78, 60,
67, 71, 73, estes nove dados nao possuem uma moda •
. Por outro lado, a distribuiç~o de pesos 69, 81, 57, 63, 73, 68,
63, 71, 71, 71, 83, 65i ~7, 63, ~ossui duas modas: 63 kg e 71 kg. Nes-
te caso a distrib~içao ~ bimodnl. Ser~ unimodal no caso ~e apresentar
uma s6 moda e multimodal se apresentar v~rias modas.
"-..-.
~.
- ~;)_._~
\-(~\·-'~.]~j--L'--~~I\
\.. i .. '~' /.,
[:..~
,) ') f} .~\. i:'(3 S () ;.~ .. , (,...,

\ ->, r '. ",.1 , ••..


," , .: ..... \
.19
No caso de dados. agrupados em tabelas de frequências, a moda é
.caâ cuf. ada por:
~ . ..
·f .•
.L

Mo = L + a
fI + f2

em que L é o limíte inferior da classe em que está a moda, a é o inter


vala da classe, fI e f2 sao, respectivamente, as frequências das clas-
ses adj~centes a classe da moda.
Para o exemplo dos novilhos, Tabela 1.2,
12
Mo a 3 75 ,5 + 15 12 + 18
== 381,5 kg

A mediana tem interpretação muito simples quando as observações


são diferentes uma da outra, porque ela é tal que o número de observa-
çóes com vaJ.ores maiores é igual ao número de observaç~es com valores
menores do que a mediana.
Contud09 quando há valores repetidos, a sua interpretaç;o não é
a~8im tio simples. No caso 'd~s notas 2, 2, 5, 5, 5, 5, 7, 7, 8, 8, de
um grupo de alunos, a mediana seria a nota 5e, no entanto, só existem
duas notas menores do que 5 e há quatro maiores do que 5.
A meaiana é menos utilizada que a média aritm;tica; Casos existem,
.entretanto, emqu~ o emprego da mediana faz-se necess~rio, especialmen
I"
·te no caso em. que ocorrem valores aberrantes. Por exemplo, se o numero
de ovos de helmintos em uma. grama de fezes de 7 ovinos f'o sse 240, -370,
410, 520, 630, 680 e 829, a mediana seria 5~0, e a média 52~~ Mas~ no
caso de 240, 370, 410, 520, 630, 680, 10.000 ovos, ~ Valor da mediana
manter-5e-ia o mesmo, enquanto que a média aritmética passaria a ser
1.836 ovos/gramE:l_ Valores aberrantes tem, pois, muito menor influência
sobre a mediana do que a média aritmética. No caso em pauta, a mediana /'\

representa melhor o conjunto que a média. ~


No caso da distribuiçã~ dos pesos de novilhos (Tabela 1.2), ~
1'--.
84/2 == 42 valores deverão ser maiores que a mediana. As observações de •
ordem 42 e 43 estâo contidas na quinta classe, para a .qual o limite in
f!~
feriorL é 390,5, com uma frequência
f o. igual a 18. A frequência acu-
. .
mulada até esse l~_mite é 35; desconta-se i :-= 42 - 35 c 1 ob aer-va ce s ç

na quinta classe at~ atingir a mediana. ° intervalo de classe a ; 15.


'\

Portanto a mediana é: "


"""\

Me = L + a fd = 390, 5 + (15) fa 396,3 kg ,


"

-----
m
~
." .
\

---
"' --'
r,'
2. Distribuiç~~s te6ri~as de fiequ@ncias

2.1. Popu1açio e ~mostra

Antes ele subme+'er um conjunto de dados 'de observações a uma análi


09 estat{ntica, deve-se inquirir se os dados representam.todos os da-
., ~
dos poss~veie, ou se sao uma parte apenas de' um corpo maior de dados.
O todo é denominado população ou universo e a parte dotódo é a amos-
r-'. tra.
~ Do ponto ele vista estatlstico, uma população ou, conforme outra
designação ~s vezes empregada, um universo, é a totalidade dos elemen- ,
.i

tos que tem uma ou mais caracterlsticas em comum. População humana, bo


vina, ovina, etc. são concepçõ-es comuns de população. Sob o ponto de
vista estatlstico, porém, int~ressam os valores ~uméricos individuais
relativos a um atributo dessas populações. Por exemplo, peso de crian-
ças com 10 anos de idade em Porto Alegre; produç~o em kg/ha das lavou-
ras de milho do município de Estrela; taxa de engorda de leitões da ra
ça Duroc-Jersey, e t c , Os vàlores individuais da po pu La ao variam e, se.
ç

bem que n;o necessariamente, sao por oonvenção em n~mero infinito. S~o
mais frequentes na populaçao os valores de grandeza intermediária; os
valores extremos s;o ra~6s. Quando todos os v~lore; da populaç~o s~o
oonhecidos, é possível descrev@-la cem exatidao •
...
.Amostra é a parte da população que é selecionada e usada com o
objetivo de obter inform~ç~es sobre a populaç~o. Um nutricionista que
estuda uma nova raç~o, usando um grupo de 30 pintos (amostra), em ge-
ral não está: particularmente interessado no aumento de peso daquele
.... ,
gr~po limitado, maS sim no efeito que a nova raça o tera sobre um con-
junto bem maior dE pintos daquela raça (populaç~o), represe~~ado pela
amoD~ra estudada. A informação referente ao poder germinativo de um
carregament.o (polmlação) de same n tas, é obtida .através do teste de ge]Z.
minaçao de um punhado de sementes (amostra), extra{das do carr9gamento.
Na impossibilidade material de estudar toda a populaç~o, examina-
..."">,
8e uma amostra. Os dados de observação registrados na amostra fornecem
informações sobre a população. O processo pelo qual se obtém infor!lla-
ções sobre a população, através da amostra, J chamado infer~ncia esta-
t{stica.
Uma ano st.ra deve ser representativ8 do. população sobre a qual se
deseja informaç~es. S~o as amostras classificaias de diferentes manei-
ra, mas -esaenc La Lmc n t e são do tipo a~.eatório ou sistemé~\ico, ou uma
oo~binação desses t~pos.

I -·~--IrJ-!~---'.~.1
• .1.
r) ;:::J ':..s S o f< '-o '
I
21
Amostra aleatória ou probabil1stk..a e aque. Ia na qual todos .oa ele-
-
"
"")

mentos da população tem uma oportunidade iGUal e independente de p~rti "")

,cipar. Em situação ideal, todos 'o~ 'elementos da 'população são numera- ""\

dos. ProcEide-se, então; ao sorteio um a um dos elementos 'até atingir o ~


tamanho. ou o número de observações requerido pela amostra. O sorteio é '\
feito usualnente com o 'emprego de uma tabela de númcr~3 aleatór.ios ,"'"\

,(Apgndice ~.l). Neste tipo de amostragem supõe-se que haja reposição '\
"")

dos elemen~os sorteados, estando sujeitos a novo sorteio. .?


J ' , , -r-,
Uma amostra sistematica, como o nome indica, é uma amostra sele-
,
cionada de acordo com um sistema. Por exemplo, o exame de cada décima - "\
planta de uma lavoura de milho. Os elementos são tomados geralmente a
\
intervalos fixos, sendo apenas o primeiro aleatório. A fim de obter "

uma amostra de 10% de uma lavoura de 1.000 p lan t aa , sorteia-se um nÚm~ "\

ro entre 1 alO. Sej8. 7 este número. Inicia-se então pelo exame' da "\

planta número 7 e, após, consecutivamente, cada décima planta: 17, 27, "\

37, etc., nendo a última planta a de nÚmero 997. ~


Em muitos casos uma amostra sistemá~ica pOderá representar melhor "\

uma população <lue uma amostra aleatória. Mas, quando na população hou-:- ."\

'""
ver um tipo de variação periódica e houver coincidência de intervalo
-,
entre os elementos da amostra e a amplitude dessa variação, a amostra
<,
sistemática pOderá estar seriamente viciada.
"\

~
2.2. Variáveis ale~tórias e sua distri~uição teórica +-,

~
A seleção aleatória de um elemento ou de uma observação numérica "\
,., proporClonara
de uma populaçao ." um numero qualquer d e resulta d os poss~-
'
''",
vei~, e não se conhece de antemão qual o e Le men t o ou valor que ser~ ob
tido. ~
'"
Seja Y ~ valor numérico de um elemento tirado ao acaso da popula- -",
,.." .- ,.., IV . ~\
çao. Como os pos~lveis valores que Y pod~ tomar uao sao todos 9S mes- •
'\
mos, Y é uma quantidade variável ou uma vélriável aleatória.
!I!\
Dada.uma variável aleatória Y, há na população'uma distribuição
~,
para os valores Y que é, sob vários aspectos, seme1.hante à distribui-
\
ção observada numa tabela de frequências, como a dos pc aos de novilhos /\
da se9~0 1.9. Se em vez de 84 novilhos que deram origem aDhistograma '~1

da Fig~ra 1.1, tivéssemos 1.000J poder{amos UGar um maior número de ~\


classes para cobrir a mesma amplitude, oendo os intervalos de classe ~
bem menores. Obter-se-ia um histocr8ma semelhante ao da Figura
", ,
2.1a. '"\

Aumentand0 0 nrl~cro de novilhos indefinidamente e usando-se intervalos -\


-"\

cada vez menores at~ Se torn8.rem infinitBmente pequenos, o histogra-


'\
'1
'\
· '"o f .~• • • _ •

r: •

2. Distribuiç~~s té6ri~as de ficquGncias

2.1. Popu1ação-e amostra

Antes de subme+'er um conjunto de dados ·de observações a uma anúli


89 estatlotica, deve-se inquirir se os dados representam todos os da-
.,
dos poss~veis,
~ .
ou se sao uma parte apenas de um corpo maior de dados.
O todo ~ d~nominado população ou universo e a parte do t6do ~ a amos-
tra.
Do ponto de vista estatístico, uma população ou, conforme outra
designação ~s vezes empregada, um universo, é a totalidade dos elemen-
tos que tem uma ou mais características em comum. Populaçio humana, b~
vina, ovina, etc. são concepções comuns de população. Sob o ponto de
vista estatístico, porém, interessam os valores ~uméricos individuais
relativos a um atributo dessas populações. Por exemp~o, peso de crian-
ças com 10 anos de idade em Porto Alegre; produção em kg/ha das lavou-
ras de milho do município de Estrela; taxa de engorda de leitões da ra
ça Duroc-Jersey, etc. Os vãlores individuais da população variam e, se
bem que u;o necessariamente, sao por oonvenção em n~mero infinito. S~o
mais frequentes na poyulaçao os valores de grandeza intermediária; os
valores extr~mos s~o ra~6s. Quando todos os valores da populaç~o s~o
conhecidos, é poss{vel descrevê-Ia com exatidao •
.~Amostra ~ aparte da populaç~o que é selecionada e usada com o
objetivo de obter inform~ç~es sobre a populaç~o. U~ nutricionista que
estuda uma nova raç~o, usando um grupo de 30 pintos (amostra), em ge-
ral nio est~ particularmente interessado no aumento de peso daquele
.., ,
gr~po limitado, mas sim no efeito que a nova raçao tera sobre um con-
junto bem maior dE pintos daquela raça (população), represe~tado pela
amos~ra estudada. A.informação referente ao poder germinàtivo de um
car-regamen t.o (polmlação) de sementes, é obtida. a tra vés do teste de ge.r.
,
minaç~o de um punhado de sementes (amostra), extra{das ~o carregamento.
Na impossibilidade material de estudar toda a populaç~o, examina-
..'\ se uma amostra. Os dados de observação registrados na amostra fornecem
informações sobre a populaçao. O processo pelo qual se obtém infor~a-
çõen sobre a população, através da amostra, J chamado infer~ncia esta-
t{s.tica.
Uma ano st ra deve ser T'~pre8entativ8 da população sobre a qual se
deseja inform3ç~es. S~o as amostras classificuias de diferentes manei-
ra, mas -essenc i aLme n t e são do tipo aJeatório ou sistemát,ico, ou uma
co~binação desses t~pos.
_._---- ._---------,
>- () r-v I r, J~
'-... !' I !J
.J. r.J r, .-~
i ... ''-..J-
<J ,
\...

I

21 ."
Amostra aleatória ou Probabilística ê aquela na qual todos .os ele- --,
mentos da população tem uma oportunidade i~al e independente de parti --,
.cipar. Em situação ideal, todos ·o~ elementos da'população são numera- ~
dos. Proc~.de-se, então; ao sorteio um a um dos e Leme n to a 'até atingir o .---."

tamanho. ou o número de observações requeridó pela amostra. O sorteio é \


feito usual~ente com o 'emprego de uma tabela de númer~3 aleatórios '\

.\
,(Ap~ndice 3.1). Neste tipo de amostragem
I'
supõe-se

que haja repos~ção
"'\

dos elemen~os sorteados, estando sujeitos a novo sorteio.


J
Urna amostra
.
sistematicB,
,
como o nome indica, é uma amostra 'sele-
j
--,
\
cionada de acordo com um sistema. Por exemplo, o exame de cada décima
'\
planta de uma lavoura de milho. Os elementos são tomados geralmente a
intervalos fixos, sendo apenas o primeiro aleatório. A fim de obter "
--:\
uma amostra de 10% de uma lavou.ra de 1.000 plantas, sorteia-se um nÚm~ '\

ro entre 1 a 10. Seja 7 este número. Inicia-se então pelo exame da


planta número 7 e, após, consecutivamente, cada décima planta: 17, 27,
'"
'\

37, etc., nendo a última planta a de nÚmero 997. ~


Em muitos casos uma amostra sistemá~ica poderá representar melhor ~,
uma população que uma amostra aleatória. Mas, quando na população hou~ .~

ver um tipo de variação periódica e houver coincidência de intervalo


~,
-r-,
entre os elementos da amostra e a amplitude dessa variação, a amostra
---.,
sistemática pOderá estar seriamente viciada.

--,"
2.2. Variáveis~... ale~tórias e sua distri~uição teórica ~\

~
A seleção aleatória de um elemento ou de uma observação numérica
'"
de uma populaçao ."
pr opor-c aonar a um numero qualquer de resulta d os '
1)OS81- -,
veif;l,e não se conhece de antemão qual o elemento ou valor que será ob "
\

tido. ~

Seja Y o valor numérico de um elemento tirado .ao acaso da popula- ~ \

~\
ção. Como os pos~{veis valores que"Y pod~ tomar~ão s~o todos 9s mes- ••
. ,
mos, Y é uma quantidade variável ou uma vé1T'i~velaleatória.
~\
Dada.uma variúvel aleatória Y, há na população'l1ma distribuição
-,
para os valores Y que é, sob vários aspectos, seme~nante à distribui-
.---."
ção observada numa tabela ele frequências, C0r:10 a dos pesos de novilhos -\
da Se9&0 L9. Se em vez de 84 novilhos que deram origem ao histoljrama ~,

da Fig~ra 1.1, tivéssemos 1.000, poder{amos usar um maior número de -\

classes para cobrir a mesma amplitude, sendo os intervalos de classe -r--,

bem menores. Obter-se-ia um histocr8ma semelhante ao da Figura


lI·
2.1a. '\

Aumentand0 0 nrlccro de llovilhos inde~inidamente e usando-se intervalos -\


cada vez menores at~ se tornarem infinitamente pequenos, o histogra- '\
"\

'1

\
- . ~~.
A,

ma tomaria a forma de' uma curva contínua, como a da Figura 2.1b • Esta
curva contínua representa a distribuiç~o te6rica do peso de novilhos •
. A distri b'uiçào de' frequências teóricas ou da população de uma va-
riável aleã,tória é a :forma limite da'distribuiçao de frequências de
uma. ~mostra '(histograma), quando o tamanho da amostra cresce sem limi-
te.
Nota-se que no histograma e na distribuição teórica da Figura 2.1,
a ordenada ~ dada em frcqu6ncia relativa. Nestas condiç~cs, a'distri-
bu í ç ao ·te6rica sera: uma distribuição de probabilidades. Isto porque, a
soma das frequências relativas ou a área compreendida entre'a abcissa
e a curva será igual à unidade. A área sob a curva entre dois valores
quaisquer de Y, ~ e !,é a frequ6ncin reiativa te~rica dos valores de L
entre a e b. É também a probabilidade de que um valor aleatório de Y
tenha um valor entre a , P '(a L
e b, isto e, _ YL
~ b)•
'--,
----,
. i ,,. :
~ . I
,..
I.

~ !, . f(Y) I
.
o"o.j
','~".';'"

i
'"'" ' -- --;."
.~: -.... __ .•_~.. i~_ ~_ . :-.--...
.
'-"~."
. ..
.~

11 1.'
-""'--
':>

- o,tS" I, r..
I
o' .
ro
~
~
.l . I:,, . '.
.---..
te t.,., .
j
/"'3
s:
,~
0.10 ... .
~;? - ; ; _- ..
<::>- l!
~.-..)
c... , O.OS j< .. ,
. ~ " j:'" .: .
I.

I
o '-"\.,.--1--L--t-'-...l-J.-I-l.--'---!.-j-1.-l....J.-j--l---'--l-f-Ji---L-L..l-_ i: o
331>. ~6B Jq8 42t l.ffi8 I

~,

.Figura 2.10.. Dã s t rc.buã çao dos pe- Figura 2.:Lb. Dd st r í.bu.i


ao teórica ç

sos de 1.000 novilhos dos pesos de novilhos

.,
Devemos fazer uma diotinçao entre duas classes gerais de vur1a-
veio aleat~rias: variáveis contúl'Ju$ e v~riúveis discretas.
Variivel cont{nuH ~ aquela que pode tomar qualquer valor dentro de
U1Íl intervalo. Os dados c on t fnuo s se originam, em geral, da medição de
/'-.,
um atributo dos elementos da amostra, numa escala cont{nua, tal como o
'" comprir::ento, peso, temperatura,pressào, etc. O peso de um le~tâo pod~
" r~ ser 2l~2 kg ou 21,24 ke, depchdc~do da precisao da medida. ~ uma va
1\
riável corrt fnua ; ,_.

I§e tr~;~~c~~S\~?:~I~~a1
r>
Vori~vel di8cret~ ~ aquela que
r-«

I '. .
,..-., .

r-;
• ,- '\ f ~, ")


23 \

nas de valores. Os valores de uma varlável discreta são obtidOS, geral '"1

mente, por contagem dos elementos da amostra que possuem o atributo em 1


estudo. Por exemplo,·n~oero de filhos'por família.Cl, 2,3, •••), núm~
2 '1
ro de nernatóides e~ parcelas de 1 m de solo, etc. são números intei-
'1
ros.·
'1
Quando o tamanho da amostra é grande, a distribuição de frequên-
'\
eias de uma amostra é, em geral, ,uma boa aproximação da distribuição
')
de frequências da população. Por exemplo, a forma do histograrua, asse- ~
+-,

me Iha-ese à f.orma da população conhecida por curva normal. Em muitos ca "\

~
soa, porém, especialmente nu expe r í.men tação agronômica e biológica, as "-1
......,
amostras não são suficientemente grandes para determinar com precisao
a distribuição da populaçao. Contudo, a informação contica na amostra, -1
mesmo pequena, aliada à experiência prévia adquirida com O mesmo mate- +-,

rial', permite comumente pressupor ou convencionar a forma geral de dis


,
'\
tribuição de frequências da populaçao.
...,
As distribuições, teóricas são -mod e Lo a ma tom<Ít í.cos , Consti tucm. a
"\

base par-a boa parte da teoria ee t a t s t í.ca usada pe Lo s biologistas


í e ,
pesquisadores em geral. Os dados dn observações ~o campo da Biologia ""

quando são de medição ou cont{nuos seguem,em geral, a distribuição nor- "\

mal, cujo gráfiCO tem a forma de sino. <,

Para as variáveis discretas, o modelo teórico é comumente a dis- ,


tribuição.binomial. Uma forma especial da binornial, encontrada freque~ "\

temente, ~a diDtribuiç~o de Poisson.


"\

O conhecimento da d s ur-Lbu.í çao


í teórica de freq,uêhcia de uma variá 1

vel tem importantes consequências práticas. Isto porque são diferentes


,
""

os métodos de análise para os dados de observações que seguem diferen-


........,
tes distribuições teóricas.
-r-,

..
"

2.3. Parâmetros e estat{sticas ,~.,


'1
Estat{stica é uma medida descritiva dos dad o e de .observação da a- 11<,

mostra. Assim, a média I, a varj,ância 8


2
e o,desvio padrão~, são est2:. ,
t{sticas. Uma estat{stica é uma v~Tiável, no sentido de que torn~ valo- -'\

res diferentes para diferentes amostras de uma mesma'população.


Parâmetro ou valor populacional é uma medida descritiva da popu- ---
lação. Étma constante da popul3ção que' está sendo considerada. É uma 1

constante taobém da di3tribuição te0rica de frequências que serve de


,
, . . ,.., ""\

.modelo a populaçao. ,-
~\
Geralmente sao usadas letras gregas para representar os parâmc-
tros, ao passo que as letras latinas correspondentes desisnam as eota

li
~"

e 24
'-'\
t{Gtican. Desta forma /.1 é a media 't' r-aca
'par-amo .' e v/\
2
e vnr :':
aao , respc.s
" tivamente, a variâncin. e o desvio padrão parãmétric?s.
"\
As estat{sticas calculadas d oe tva.Lor-ea de uma ·amo.stra são estima-
r>; ,
~,
tivas dos parâmetros. Servem para fazer inferências ou descrever a po-
-">,
pulação da qual foi tomada a amostra. Portanto:
-\

Medida Estatística da Parâmetro da


r>; Descritiva amostra po~lação
Média . .................
~ y • •• estima • •••••
-r-. Variância ............... s
'">
<-
·.. estima ·..... a~
.r--,
Desvio padrão ........... e • •• estima • •••••
o:
~
.~

2.1. Distribuiç~o Normal


/,

A maioria dos dados de observações obtidas através de medições e


expr e esa e em unidades convencionais como gramas, centÚI18tros, QC, eto.,
seguem a distri 1mição normal. Sob o ponto de vista gr~fico, a distri-
buição normal -.5 uma curva, "corn forma muito semelhante a do sino, simé··
trIca em jelaç~o~o centro, onde coincidem a média, a mediana e a moda.
~ a chamada curva normal ou curva de Gauss (Figura 2~2). Serve de mode
·10 teórico para um grande número de variáveis contInuas, e ape cLaLment s
no. canpo da Biologia.
A curva nornal é definida por dois parâmetros: a médiajl da varif
vel Y e o desvio padrão (T, como medida de dispersão dos, valores de Y
em torno da média. Os valores da variável Y são representados no eixo
horizontal; a altura da 'curva é a frequência de' observações dentro de
/'

r~.
intervalos da variável Y. A ~éClia de Y é /J.., , a projeção. sobre o e í.xo

/~
Y do ponto de frequ~ncia máxima da curva. As extremidades da·curva, em
ambos os lados, não tocam o eixo Y, embora dele se aproximem cada vez
~ mais. A variável Y tem recorrido i nfini to, variando de - ()) a + m.
~, Â área compreendida .entre a curva e o eixo y tem por valor a uni~
»<;
aade, já que as ordenadas represen{am freq~ncias relativas. A frequ6n-
-, o a relativa
í acumul.ada entre os valores Y "" - ()) e Y = + m~ é ·igual a
~
r-
1 ou 100%. A valores Y menores e maiores do que 10, corresponde 0,5 ou
5~~ da área ou frequêncin. r-oLat í.va ,
-\

/",
° desvio padrão é a e s ca LaJ.ou vun dade de medida da variável.
í Qua!l.

r>.
do se mede a distâncin. r para. a esquerda e n mesma distância à direi-

r>.
.ta de jl , ã ot.o é, quando se marca no eixo Y os porrt oc fl - ú e
fL + tT I Lnc'Luf.mou 0,6827 ou aproximadamente 68% da área total' eob a

'~
~
curva. Similarmente, os pontos f - 2Õ e If-~ 2.r;;:; .-, ~nclU;eIií-l0,,74-5------1
r>.

I
I
r>; i)'-/:' j ,- -: I ~:.' •. '! .• L,., "~
,-, • ,_? 1 J _j I :', \.~

~
, •
",
!
\V ~ I,) \
I'·\; I,
\ "J ,
_ I
25
ou aproximadamente 95% da área.
\
Numa popu laçao com média fi z:: 40 e desvio padrao.ti g 5 (Figura 2.2), ---,
68% das observaçoesestarüo comprecndidus no intervalo"5 a 4~, e 95% ~
no intervalo 30 a 50. É claro, também, que valores de Y maiores que 50 "

ou menores que 30 tem uma frequ&ncia relativa igual a 0,05 ou 5%. Diz- \

se que 5% dss observações cae:n fora do intervalo?.:t.·2 {j" • "


......"

\
i'
-----

..
"
'"

---.,

0,68
ou
68%

50 x (.p.= 40, tr=5)


I
2 Z Curva normal uadrão
(fc- = 0, «"" ;: I )

Figura 2.2. Distribuição normal da variável Y e distribuiçao normal --,


padrão da variável Z. ~
--..,

-,
Em Estat{stica,
parv..frequência
o termo probabilidade
relativa. Diz-se que uma.observaçao
é uma express~o
aleatória
alternativa
de uma
,.~ •--.,.
populaçao normal tem uma :probabilidade aproximadamente igual a 0,-95 de
que se ja um dos valores Y do intervalo I-'- .±. 2C- • Ou, que a ob serva ao ç
fi"

~
tem uma probabilidade Etproximadamente igual a 0,05 de que tenha um va-
lar Y fora deste intervalo. Probabilidade refere-se
.
a observaçao indi-
'\

,
vidual, enquanto que frequê~cia relativa é usada em conexão com um in
-..,
tervalo da distribuiç;o. Assim, uma observação aleatória 't~IDa probabi
'\
lidade P de pertencer a um certo intervalo, enquanto que neste interva
'\
10 a proporçao de cbservaçocs é dada pela frequência relativa.
,.
A f~mília de distribuições normais é bastEtnte nu~erOBa. Em reali- -,"
dade há u~a distribuiçao nor~al para 'cada par de valores atribuidos a ~
'\
"\

'\
«<

- ,

r-\ _i Jk (3, ti. Dd í'ar-cnçun em/'- dcolooo.m o. curvo. par-a fÁ direi tu ou para o. 0E.,
quo r dn uolrre o o xo Y. Um valor 01 to í do 0- tem por ofei to entender a
curva Dobro uma amp'lí, tu'uo maior (3, o m c ompcnnaç e o , o..chatú-ln,·
jú que
iodao no cur va o devem' tor o. moama área. Ao contrário, com um valor bai
xodc or n curva 00 torna aGuda e alta no centro.
Ao frcquêucias rolo.ti van ou areo.o de qualquer distri buiçõ.o normal
~\

podcr~o ocr determinadas a partir do. cquaç~o:


-L lY - M<t.
r(Y) <= 1 _. c , 2 .. - [TI
. '(T V 2'i'r
em que f(r) é a funçào de frequências de r, s e nd o esta uma 'variável
a Le a t.orLa con tf nuaj /J. e O- são os par âmc t roo da d at.r í í.bud çao j

7f r= 3,1416 e e (b3.sC dos 10(1"ari


t mo s ne por í.ano s) é igual a 2f 'fis3 *
A solução do problemas com esta equaçao, especialmente a intcgro.-
çâo -par a determinar as frequências relativao em cada caso, evid.entemc_i2
+e , é um pr-oce nso penoso. Nao é pr at.LcaveL, igualmente, reunir em tab~
las os valores de todas as di8trib~iç~es nor~ais possíveis. Podg-se,
entretanto, selecionar urna delas , tabular as áreas ou probabiliclaclcn
para diferentes valores' da variável e u~ar esta tahela~.com as convcr--
cooo apropriadaD, para qualquer outra distribuiç~o normal. Est~ distri
b~iç~o ~nica ~ chamada distrib~iç~o nor~al példr~o.

2.5; Emprego da d í.o t r t bu í.ç ao normal padr~o

~ A distrihuiç~o normal padr~o resulta da transformaç~o da vari~vel


Y de uma .distribuição no rma I qualquer, numa outra variá ve 1 depignad2.
-<. Z, pela relação

z c
(Y - I E_ )
.U
Desta forma, quaiquer ~iDtribuiçãb normal pode ser transformada
na nor~al p~dr;of pela' ~adronizaçã~ (ou redução) da respectiva variá-
~""
. ve l , aub t rad.ndo sua'média e . d~ v i d i nd o a diferença pelo seu de s vi.oj!a'~
-r--,
d:rão. _I,. distribuição r esuI t an t e é a normal D[1c1r~oou adistrihlÜç~o
----,. "
/'- .
de Z, para a qual jl c: O e crc: 1 (FiGura 2.2).
-"
A distribuiç~o de Z, dadas as respectivas ;rcas acumulada~ (Tabe-
'"\

la 2.1),'tem aplicação, entre outras, na.cleterminaç3o da probabilidade

r>.
ou da freqnência re La t i vn teórica de observnçõcncirr.Lrrt er-vaLo s o ape cL-

~
fioados da vari~vel Y.
'"""'i
r>. (1 r, ,
',../ I \

~ t» ,., _l'
I I" .
...--"\
--
r::"", .i:
...-,

.;
,- J. ~
- 27
"
f fJ.'abúlü. 2.1 - ÀrcnD ou froquênciao
Illnl padrão
rclativD.Q .u c umu I adl.lD da curva nol'--
\

0. __ -

---- ....... •.....•......•


,
·z
"\

'Exeo. Z Área Z Área Z "


Al'(!Ct
"-_ •.. ~------- .. --.~ .... ,........ .....,

-3,0 ;.0013 '-1,6 '! 0548# O .5000 lr6 -• 9'r::!


'I.J-· -'\
•,1 .00,.6 O 0,1 ' )., 6Ljj
-2r9 ;'.C019 -1,5 ',,5390 .950 "\

-2,0 ~"0026 -1,4 ~.• OGOa


~ O~2 .5793 1,7 ; 95)/1 ,
." .•6179 1,0 <,
-2,7 :•0035 -1,) J .0960 0,3 .9641 .f'
I'~ ( "
-2,6 ;.0047 -1,2 .1151 O, .1 655,1 1,9 J. ~71.J "
r
,
·~2, 576 .005 -1,1 .1351 O ,-s .6915 1,960 Cl7 r'
<./,) ~,
«<:

-2,5 . r,. OOG2 -1,0 I .1587 0;6 .7257 2,0 ,9Tr'? ""\

-2,4 .0082 -0,9 ,1041 0,676' .75C 2,1 ~9021 . '\

-2ç3 .0107 -0,8 .2119 0,7 .7500 2,2 .9D61 ,


-2,2 .0139 -0,7 .2420 0,0 .7881 2,3 .9093 '\

•.
2,1 .0179 -0,676 .250 0,9 .8159 2,4 .99J.D ~
•.•2fO .0228' -0,6 .2743 1,0 .8413 2,5 .99;8
1,.1 -r-,
-1,960 ,025 -0,5 .3085 .0643 2,576 .995
-1,9 .0287 -0,4 .3446 1,2 r
.8849 2,6 . < 9953 "'
.-1,{3 .0359 -0~3 .3021 11) .9032 2J7 .9965 -r-,
-1 f 7 .0446 -0,2 .4207 1,4- .9192 . 2,8 ~9974
'.
.•1(-645 .050 -0,1 .4602 1,5 .9332 2 1 (}
,/ .9981
"
3,0 .9907
~.__ .. - --- _.
.. -_._-- - -,
_ .. - ., .

",
""

Exemplo: Suponhamos que O peso dcs 04 novilhos da se9~~ 1.9 csti


''\

noirnalrnente distribuído, com m~dia 400 kg e desvio padr~o 28 kg.


~
a) Calcular a probabilidade de um novilllo tirado ao acaso de um reba- -r-,
nho ter um peso maior do que 450 kg< .,~

400)/20 = 1,0;
Z = (450 ---- "
área acumulada. até Z ~ 1,8 é d e. 0,9641 j por t an t c , a proba bilidac1 e P ""'\

de se obter um animal com peso mado r do que 450 kC; é


1 0,9641 0,0359. p c
.,
""'\
b) Calcular fi frequ~ncia relativa te6rica ncumulnda at~ 9 limite 375,5
.-.,
kg.
'\
z~ (375,5 - 400)/20 ~ - 0,875; "\

úrea ac umu lada até Z '" .·0,875, (; do 0,19101


por :l.l1t()rpolu~~no valor
, '
"""

que c0rrespondo ~ früqu&ncia relativa nGu~lulnda 01191, cülculada na


'rabeIa 1.4. ~

• '\
.' ,

~.

o) Calcular'a frequ~ncia relativa·te5rica para o intervalo 375,5,a


,.-." . . I

Para yc 375,5
Z r- -0,875
a área acumul ada é 0,1910; .
--\
Para'y == 390,5
""\
Z :: -0,34
r>

a área. acumulada é 0,3669 0,1910 = 0,1759.


, "
Este valor. e comparavel a frequ&ncia relativa calculada na Tabel~
'"

1.4, igual a 0,226, para o mesmo intervalo.


->, ° cálculo das frequências teóricas correspond.entes às classes de
'\ uma tabela de frequ~ncias (exemplo c), tem por objetivo determinar o
desvio entre aS ,-frequêncian teóricas e aS frequên<?ias obnervadas. Tes-
tes especiais permitem avaliar a significância desses desvios. Desvios
exagerados '.
indicam que as frequências observadas na amostra não' seguem
uma distribuição normal. De fato, certas distribuiçqes não coincidem
COIDs41 normal, seja por assimetria ou outras anormalidades (curtose).

f' • 2.6. Distribuiç~es amostrais

Dada uma amostra de uma população especificada, as estat{sticas


.calculadas para descrever a amostra são variáveis aleatórias, pois de-
pe\dem dos valores numéricos con.tidos na ~mostra. A média da amostrf:,t
po~ exemplo, ; a média aritmética de um grupo' de observaç~es aleató-
rias e seu valor depende dos elementos que foram selecionados. para
constituirem a amo~tra. Uma amostra diferente teri, em geral, uma m~-
dia diferente.
Como a m~dia e outras estatísticas s;o variiveis aleat6rias, deve
r;o .as mesrnas possuir d í.s t r 1mições ã teóricas de. frequências ~ consi$ti]l
do de todos os valo~es possíveis da estatística em quest~o, em corres-
-<:

r'-.
pond~nci~ i todas amostras possíveis do mesmo tamanho que podem ser ti
.,
·raelas da populaçaooriginal ou paterna. Téiis <listribuiçoes saO chama-
'",
/'.- .
das dist~ibuiq6es amostrais.
r--
o estudo de usa distribuição amostral é 'de muita importância na
,-, determinaç~~ das propriedades da estat{stica que lhe deu origem. Estas
.--.. .propriedades poder~am ser verificadas de ~uas maneiras. Urn~ 6 aquela
'"" e?pregada pelo matemitico, particularmente o especializado no ramo de
probabilidades, que chega aos resultados deseja~os pela lcieica do sim-
~ bolismo; é o processo que dá origem às cquaçóes c tabel~n usadas nas
/~

r>;
aplicaç~es da Estatística. ---.::-1'
C r'; i-:~~-;l-r.~·-·
l"
. ,", . , C) I'

,.-.,
.J
~") "I'
I . ..)
"' r:
-Ór
i: •...") .,.)
-, : \
<; r'')
CJ

ao:
r-"\
:'.! ".l !
",
I~,
L

V ;~

I
29 "\
A segunda maneira de verifica!' as. propriedades de uma' es t a t f ot.Lca '""\

é efetuar uma extensa amostra5em.,~ste processo não exige preparo mat~ "'"

'm~tico,
rentes
permitindoi mes~o assim,
da teoria matem~tica.
compfovar
Denbmina-se
muitos dos re~ultados
experimento de amostragem.
dcco~
~
"'
'\
Para estudos desse tipo~ empregam-se conjuntos ou tabelas de vaIo
""\
res num~ricos que repr~sentam urna populaç~o finita com distribuiç~o
normal, sendo conhecidos, neste caso, os parâmetros f~ e tr. Dessas
'\

'\
tabelas (Apêndice 3.• 2) tornam-se amostras aleatórias, de tamanho previ~ to

mente especificado, calculando-se de cada amostra a estatística que i~


'\

teressa estudar. Os valores achados são classificados numa tabela de .-..,


frequências, determinando-se a sua frequência rela,tiva , sua, m~dia e \

desvio padrão. Dependendo do número de amostras, que não deverá ser pe '\

queno, as deter~inações feitas reproduzirão com fidelidade os valores ---


esperados pela ~eoria matem~tica. -r-,

2.7. Distribuição amostral da média


~
+-,
Se'ja uma populaç~o (paterna) limitada a 3 valores Y:, 2, 4 e 6. A
'\
•.
média dessa po pu l aç ao e /-l = 4; O desvio padrão é () = 8/3. Aqui, co
'"
mo nao se trata de amos~ra, mas todos os valores da populaçao foram in -....
dos no cilculo, o denominador da variância é n 3 e nào GL ~ 3 - 1=2.
são em número de 9 as diferentes amostras aleatórias e independe~ "-
'\

,tes, com restituiçao, que podem ser extraídas dessa popula9~0: 2, 2; \


2, 4; 2, 6; 4, 2; 4, 4; 4, ~; 6, 2; 6, 4; 6, '6. Calculando-se as médias ;."
dessas amostras, obtém-se 1L1Ila
nova populaQ2.o (filial) composta de 9 roê "

dias: 2, 3, 4, 3, ,4, 5, 4, 5, 6. Na Tabela seguinte encontra-se a dis- <,

,"'-
tribuiç~o de amostragem ou de frequência destas médias:'
\

,-
y Frequência Frequência relativa 't

""1
2 I 1/9 ~'\

3 2 2/9 -.,

4 3 3/9' "
.",
5 2 2/9
6 I . 1/9 -"

'1
Totais 9 1
"

". 1
Adotando método de cilculo para tabelas de frequências, a média \
+-,
da distrib.uição ser~:

,
"
rt1~)l t!c:J:
~.~
. ,:.. ~:

. ,JL. '1. = 1 ( 2) + 2 (3) 9 + ....e-, •• +.1 C 6) :: 4.= fl ;


e o desvio padrão:
lJy'~ Jr- - - _-o-' -4-) 2-+-2-(-3 -:"-4§-2-+---+- -'- - -.--4 )-2, .
1 C2 1 C6

= J 1: :: Vi fl71 :: ee ,

Esta amontragem demonstra que.:


1C) A média dás médias de todas as amostras poss{veis de mesmo ta
manho, tiradas ele uma mesma população de valores Y, é igual à
média desta população:
/.1.'1 = fi-

-r-,
2Q) o desvio padrão das médias dBssas amostras é igual ao desvio

~
padrão da populaçã'o original de valores Y, dividido pela raiz
quadrada do número de observações da amostra:
~ (J.-y
~
.~ , É de se notar, na Tabela acima, que a maioria das médias tem va-
lor igual ou próximo do parâmetro fé = 4. Em outras palavras, a maior
pa.rte das amostras tende a estimar a média param~trica com boa apro-
xi~açãoo É reduzida a prob~bilidade de urna estimativa med{ocre do va-
lor da po·pulação. Isto justifica uma rela tiva confiança nas inferên-
cias baseadas nos dados de ob ser-vaçce s de urna amo e t ra,
A confiança a ser ~epositada numa amostra, naturalmente '.cresce
com o aumento d.o tamanho desta' amostra. Na poput açao que está em consi
. -
der-aç ao , a probabilidade .de se obter uma estimativa extrema da média,
por exemplo o valor 2, é de 1/3, com uma amostra de ~ observaçaoj
com uma amostra de du~ observações, a probabilidade desta estimativa
..'~ já fica reduzida para 1/9 •
O estudo da formada distribuiçao amostral da média exige uma a-
mostrage~ mais extensa, a partir de uma populaç~o mais ampla que a usa
da na demonstraç~o aci~a. Verifica-se, então, que a média de uma amos-
.tra de t ananho E. tem. uma distri Duição normal com média /~ e variância
~2/n. Portanto,
.u se for aplicada a transfor~açao-- de padronizaçao da
seção 2.5, teremos a variável a1eatóri~:

Z a=

cu j a di st:..'
i bu lção tem média zero e var í.ânc í.a ~. Por cen segu í,n te, pod~
rá ser usada a tabela de áreas da
norma
1 d -
Ipa,~
.. - -----1 -.. 1
rao ,)Jara c~ cy.?r--:1':;)r--O..bJ:lbi
i -: f
~.
.
.J • ')

)
r- ,
/ \
r,'
\.J (1 r~
.-) I
-~..
,) i C.'
I
'J.
I
I ,..,< " i'\oi 1.'.\ ri .(
-!. . ,I ,.,'
,3
,

31
1idades relacionadas com & ,média da'amostra, após a sua padronização
pela equação acima. -)

Por exemplo, sabendo-se que ~ c 50 kg e 0-= lO'kg para uma pop~ -,


1ação, qual é a. probabilidade de que a média Y de uma amostra de n = 16 ~
observações dessa'população, desvia de ~ em mais de 5 kg? Interessa --"'\

neste caso achar a frequência relativa teórica de amostras com menos -",

~e 50 -';5 ::"45kg ou com mais de 50 +I 5 ?5 kg. ,


......,

Z := 45 - 50 =
-5 = -2 ; ••
10/ ifl6 2,5 ~
p (1 < 45) ::P (z < -':'2)= 0,0228. "o
.....,

.
Por s~me,,:r:l.a,
... ,""

P (1) 55) ::P (z,. 2) ""0,0228.


-,
.....,

Portantc, a probabilidade de que a média de uma amostra de n c 16


dessa população tenha uma média menor do que 45 kg ou maior do que 55 "

kg é de 2(0,0228)= 0,0456. Em outras palavras, as médias de apenas 5%


das amostras ou a média de apenas uma amostra em 20, aproximadamente, ~
cair~ fora do intervalo 45 0

a 55 kg, po~ obra do acaso.


.....,

2.8. Distribuição de t
"
-,
A distribuiçã'o de t ou distribuição do "STUDENT" foi introduzida ~
~
na metodologia estat{stica para lidar com pequenas amostras.
~
~, portanto, de uso bastante comum, já que nos trabalhos de expe-
-r-,

rimentaçao a amostra é em g€ral constituida de um pequeno número de


--..
observações. A distribuiçao de t tem aplicaçoes no cálculo de interva-
-,
lcs de coni"iança para a médi'a aritmé7.ica e em testes de hipóteses ou ,---.,
de significância para médias. A quantidade t é uma variável~ dada pela
•.. '""

equaçaol ,
t :c
y -
I
/-l .i~
't

o
s-
y
\t."
A distribuição teórica de !, fornece a probabilidade ou a frequê~
~
ciarelativa de c.esvios Y -}L-.- .-"

A distribuiçao de!, originalmente calculada por processos matemá


""'"

ticos, pode ser aproximada por experimentos de amostragem de uma popu-


la.ção normal de valores Y, da qual se conhece a média ;t- . Pa ra cada '\
a.mostra, sempre ,de mesmo tarnanho,calcula-se n m~dia i e a vari~ncia -r-,
,2 "
S t obtendo-se 1pela equaçeo acima. A distribujç;o de frequ~ncias dos ~\
,.
valores! obtidos desta forma, para ~rn grande n~~ero de amostras, ser~
...,
semelhante à dintribuiçao teórica de frequências de 1, parcialmente re "\

"\
.produzida na Tabela 2~2.
1
"\
!~.\- ,.,'
.i··
,
r---,.4 -

..... Tabel"a 2.2 - Distribuição (resumida) de t

Grá.us -p io b a b i 1 i d a ~ e
de .. ""
liberdade 0,10 0,01
J. 12,706-
'6,314 63,657
2 2,920 4,303 9,925
3 2,353 3,182 5,841
4 2,132 2,776 4,604
5 2,015 2,571 4,032
6 1,943 2,447 3,707
7 1,895 2,365 3,499
8 1,860 2,306 3,355
9 1,833 2,262 3,250
10 1,812 2,228 ;',169
11 1,796 2,201 3,106
12 1,782 2,179 3,055
13 1,1';1 2,160 3,012
14 1,761 2,145 ""2,977
r , 15 1,753 2,131 2,947
20 1,725 2,086 2,845
25 1,708" 2,060 2,787
30 1,697 2,042 2,750
-00 . 1_,64 1,96 2,58
Valores de t, ignorando o sinal, maiores
que os d~dos no corpo da tabela tem a
probabilidade indicndn

A diferença fundamental entre as variáveis! e Z, está nos respe~


.."
ti vos denominadores. A quantidade U inrpoe restriçoes ao uso de Z,
pois se trata de um parâmetro geralmente de sconh-acLd o ou que deve ser 't

-estimado de uma amostra relativamente grande. No deDominador de t en-


tr~ o desvio padrao ~t calculado da amostra, ainda que esta tenhacuci
----- - pequeno n~ero de observações.
Por outro lado, a-distribuiçao de t nâ'o é descrita por uma distri
buiç"ã'oúnica, como. no caso de Z, mas por .uma família de di~tribuiç~es.
Uma curva de t é identificada pelos graus de liberdade (n - 1) da amo!?.
t r-a, As curvas de t assemelham-se
- à curva nor raa.I padrão. S'ao sirnétri-
- .
cas em relaçã'o à ordenada de frequência méÍx.i:na.
Diferem entre s{ ape-
nas pela difcrcnt~ dintribuiç~o das frequ~ncia9 relntivad~ A varieçao
. r,_-·_······;-~-~~ - ~-,:-··_,--"~I·-:f--:-·_--c--=-I
I

/
I ':" I ,. I, I ',-, : ..J .', L ")
:~::; ~-.) ·-1 ~_.~ r• -:..'. r) ')
I I \ ,--,", t L ... ; -._ f\. G
de t ci maior com amoJtras pequenas do que cpm amostras grandes. Uma
curva de i para n - 1 c I ou n - l·a 2 graus de liberdade, em que ~ é
o ndmero de observaç5es da 'amostra,' : por isso. mais ach~tada ~UD uma
'\
de 20 graus de liberdade. Quando.n tende par~ o infinito, o desvio pa-
'.'""'1
drão !l tenderá para {T ; consequentemente, t aproxima-se de ~. Com a-
"'"\

mostras de 30 graus de liberdade, a distribuiç~o de t ~ pratic~mente a


"'\
mesma que a de Z. Para .!l infinito, teZ.
'\
A Figura 2.3 i~ustra a distribuiçao teórica de ! para 9 graus de fi
"'"\

liberdade. Os valores de i est;o r~presentados na abcissa. A ~rea som_O "


~
breada em ambos os lados da curv~., correspondem a valores maiores que '"'
t = 2,262, ~ direita, e valores menores que t = -2,262, ~ eaquerda. Em ',,",

...,
amqos os casos a frequência relativa é de 0,025 ou 2,5% da frequência
.

total. "
.Se somarmos essas duas árean, temos uma f r eq uânc La relativa igual
-r-,

a 0,05 ou 5%. Ignorando agora o sinal + ou - de !, isto é se conside~~


rarmos e pena a .o seu valor absoluto Itl, a pr-oba bd Lí.dade r (Itl> 2,262)
-,
será igual a 0,05. Da mesma forma, P (ltl~ 3,250) 0,01 na distribui
'\
ção.de i para 9 graus de liberdade.

r •
Os valores t ~ 2,262 e t ='3,250, sao chamados - pontos porcentuais "
-,
da distribuição de 9 GL~ pois delimitam ~reas de frequên6ia relativa -r-,

5% e 1% nos extremos dessa distribuição.


-r-,

"'\

-""\

•..•...

<,

-"
I
"
.,
!'~

Zon~ de Zona de ~-...,


rejeição reDcição
0,025 0,95 ( 0,025 '"
ou r: ou
2 , 5,'"
.... .';
:/ '.,Ht------ -' - ou r1'I;'//
l% ../'j 2,5% -->00"

"~I' -r : 9r...',·; ' ///~ //1


II/.II/':~!:...' / __
-2, -.... -.--7;----- -- 2,262 t
-e-,

.....,

""

Figura 2.3. de 1
Curva da distribuição de frcQ.uências 'tjE'Çórican 1
para 9 eraus de liberdade; com os pontos porcentuais "'"\

5% '\

-")

"
."'~;"~ . ~ \ .c : ',:,-{;' '-.;;.,

: ~

" De uma.maneira geral, designando por alfa ( c( ) a frequência re-


~ lativa ou probabilidade de valores I ti, os pontos porcentuais da tabe-
/~ .Ia de i -
sao pôntos tais que

P (I ti> ta)
\
:= e(

isto é, a probabilidade'de um valor calculado e absoluto de t ser maim'


aue te( da tabela, é 0(, Na Tabela 2.2 os valores de o( são as probabi

r-,.
lidadei 0,10, 0,05, 0,01, Os ponto~ te( coirespondentes sao denominados,
respec~ivamentet pontos 10%, 5% e· 1% de t
- . ,
Comumente, na representaçao d8 um i teorico, indicam-se ainda os
graus de liberdade (n-I) da distriouição a que pertence, adotando o si~
b01ismo t(n _ 1)'
Exemplificando,

3,250.

Quando se 1 ida com t est.es de hipóteses, ou de significância·, as


probabilidades mais empregadas são o( = 0,05 e o( = 0,01. As áreas que
correspondem a essas probabilidades numa distribuição. teórica como a
- ,., r.t... - ,..,
de i, sao·chamadas.regio~s crl~lcas ouregioes de rejei9ao. Valores de
1, calculados de amostras, poderão caiy dentro da região crítica, quan
do ..\ti> -« t. ou poderão cair fora da região cr{ tica, quando I t \ .< te('
A probabilidade de um valor i cair dentro da região crítica, por cau-
SaS aleat6rias apenas, ~ muito baixa. A probabilidade dente acontecim~
to é dada pela frequência c( • Diz-se que um i ca.LcuIad o tem P < 0,05
quando cai na região cr{tica"5% e P (0,01 quando 6ai na região cr{ti-
. 1-1
oa 70.

-.1----- ... --_.


r,
U
n
\
I .:. < i (-
,') [I!

, .. /

I
r::
I
.\.:., ./'•.....
... )
\ r,
'.j
J
....(

~-----------------------------------
'''-J

I
35 '\

~;. Estimaçao '1


"""

3.1. Estimaç~o é €stimadoreo


,
-r-,

Quarido ~e coleciona da~os atrav;s de um experimento ou de um l~va~ -"


'\
tamento, o objetivo ;, geralmente, obter as informações necessárias pa-
'\
ra concluir algo sobre o objéto sob investigação. Baseado em amostras,
1
pretende-se inferir algo sobre as populações das quais se supoe que os »
'"'I

dados dispon{veis n.ão uma amostra~ As inferências tomam a forma de: '\
'~

';
1) estimação de alguns dos parâmetros da distribuição populacio- \

nal; \

2) decis;o quanto ~ aceitação ou a rejeiçao de hipotese sobre va- '\

lores param;tricos. \

Estimação ~ o procedimento usado para obter informações sobre os :,

parâmetros. Por exemplo, a estimação dos parâmetros /{. e ú2 dé uma ~

distribuição normal. ~s valo~es amostrais utilizados para os fins de


~"\

estimação são chamados estimadores. Por exemplo, a,média ou a mediana


na es t í.maçao de J1- • O valor num~r.ico obtido no cálculo de um estima-
'\

, \
dor, para urna dada amostra, e a estimati~a.
~
Quando interessa esti~ar o parâmetro por meio de um único valor a --...
mo~tra1, emp~ega-ge a chamada estiDação Dor ponto. Na estimação Dor in- -r-,

tervalo p~ra um parâmetro, determina-se u~ intervalo representado por \

dois limites, máximo e m{nimo, dentro do qual está contido o parâmetro -"\

desconhecido com uma segurança (ou confiança) especificada. ~


Cada parâmetro a ser estireado, poder; ter diferentes tipos de es- ~

timadores. Interessa, evidentemente, escolher o "melhorll entimador. "'"'


Qualifica-se a esta designaç~o o estilli~dorque:
-,
'\
1) n~o ~ vióiado (ausSncia de vi~s ou tend€nciosidade);
\
2) tem consistência;
3) tem vari~ncia mínima (ou efici&ncia). •
Diz-se que um estimador n~o é viciado quando a m;dia das estirnati ":,
vas. obtidas de todas as amostras poss{veis de urna população é igual ao
par-âme t ro , Isto send o verdadeiro pura qua Lque r tamanho !2. da amostra, o
"
estimador é dito consistente. O esti~ador te~ variância m{nima quando ''--.,

<,
aé estimativas do parâcetro apresentam ufun dispers~o mEnor do que a de
qualquer outro estimador •• 1
poss~ve. <
'\

Quando se faz amostragcm de uma população narmalt tanto a média Y ,'\

~
como a mediana. ?,:e proporcionam, ambaa , es tiroativa s nao v,;i.ciadas
ela mé- \

d~a fi.. • Entretanto, enquanto a variâncin da r::édiaY ~ (/2/n, a da me


'\
diana l1e ; de 1,57 (J2/n, sendo mc nor a. var ânc t a da média.
ã

1
-...


Dois estimadores podem ser comparados, examinando-se a sua efici-
~ncia relativa. Diz-se que a efici~ncia da ~ediaria relativamente ~ m~-
dia é de:

, 2 x 100
1,57{f. / n
Do ponto de vista prático, isto significa que a variância dos dois
estimadores será igual, usando-se para a média uma amostra com 64% do
~,

tamanho da que seria tomada se fosse usada a mediana.

3.2. Estimativa dos parâmetros de distribuiç~es normais


~
'" Sejam, YI, Y2, Yy •• "Y ' os elementos numa amostra aleatória de
n
~ tamanho E, de uma população da qual não se conhecem a média e a, variâ~
cia~ O melhor estimador da m~dia da pbpulação fC é a média da amostra.

" Y.
y •• 6' l. •
n
Dem.osntra-se que a.média da amostra, assim calculada, é o melhor
estiT:i9.dor
da média paramétrica. Não tem v{cio, é consistente e possui!!,.
do variância m{nima é o estimador mais eficiente.
, 1"T"'2 ~ A

Para estimar a variância u da populaçao, adota-se a variancia


da amostra:

2
8
n - 1
A divisão é feita pelos graus de liberdade n - 1, em vez de n,
'2 -
pois a div-is&o por E.. produziria uma estima ti va viciada de (J • O e~t1:.
mador com o denominador E é algo mais eficiente, especia1mente com a-
mostras pequenas, até 30 observaç~es. Mesmo assim, adota-se s2, com de
nominador n - 1 por ser o estimador não viciado.g denominado o melhor
2'
e s t Lmado r nuo viciado de rr . " ". .

. Quando se faz infer~ncias baseadas nos estimadores e geralmente


necessirio obtertamb~m estimativas das vari~nciDs dOS estimadores. No
caso da rn6dia da amostra, sabe-se que sua variEncia ~

(seçao 2.7)
2
Para estimar esta variância, substitui-ne (/"2 por 8 ,

2 8
2
s y- ::: •
n

drâ'o
37 '\

"\
s cr e B-
y =
~
o desvio padrão da média, Sy f é tnmbém conhecido- por erro padrão "1

da média. '\

-"\

Exemplo: Dez novilhos de sobre-ano pastejaram um potreiro de cor-


--- "\
nichão-falarisf pelo espaço de 60 dias, determinando-se QS seguintes
aumentos de pesos individuais, em kg: 1
"'"

45, 93, 109, 48, 61, 35, 80, 57, 79, 63. •• +-;

Para estes dados:


'\

n :: 10; Y s: 61'; ~
\

"'"
2
~(Yi - y)2 = 4174; s = 530,4; s == 23,0.
Na pressupos1çao
. ...,
de que ganhos de peso observados constituem uma amos-
---..,

---'-\

tra aleatória de uma populaçao cujos elementos consistem dos ganhos da -,


peso em 60 dias de todo gado similar, pastejando da mesma forma, pode- -------.
, , -v
se afirmar que a melhor estimativa da media da populaçao de aumento de \

peso é 67 kg,por animal. ~


As melhores estimativas da variância e do desvio padrão dos aumen r>.

tos de peso são, respectivamente, 530,4 e 23,0 kg. -,


'"",
Mesmo com uma ~nica amostra da populaç~o, pode-se estimar parâme-
----...,
tros da ~opulaçã~ de médias de todas as amostras poss{veis que poderi-
r:\
am ser selecionadas. A média da distribuição amostral da média é idên-
-------.
tica à média da população,parental, para a qual já foi obtida a melhor
~-\

estimativa, 67 kg. Como a variância das médias de amostras é '\

~~
-'\

2
e como jú foi obtida a melhor estimativa de tr , a estimativa da vari -,
ância da média da amostra é \

, 2 2 '\

B y- c:
8
=
530,4
10 ~ 53,04.
n ~\

"
o desvio padrão, ou erro padrao, da média é "

<1»_"",

'",
8- c •• 7,3 kg;:
Y -\
, J ~
Frequentemente as estimativas da media e do respectivo desvio pWfl3.o -,
62:'0 comb ínadua na expre s sao: '\

\
Y + 8y• '\

Diz-se que a m~dia verdadeira de ganho de peso dOS novilhos é es- \


,,-
timada em ''1

67 + 7,3 kg. '\

'\

~
'\
" j -'i

.,,--... ..

3.3. Intervalo de confiança para am~aia de uma distribuiç~o nor-


mal

As estimativas consideradas'até agora são estimativas por ponto e


donsistem da valores num6ricds simplés. S~o as melhores estimativas doo
parâmetros visados.
Entretanto, n~o se pode associar a essas estimativas nenhuma infor
maçao quartto ~ confiança a ser nelas depositada como estimativas doa
parâ~etros* Emsituaçoes nas quais se requer uma informação com respei
to à confiança das estimativas, s;o usadas as chamadas estimativas por
-~ ~ntervnlo, calculando-se dois valbres limites, em ~ez de um ~a10~ rini-
" c o , Desta forma é po así.veL especificar a confiança que se temem que o
~
i?tervalo, isto e, a amplitude dimensionada pelos dois valores limites,·
inclua o par~metro que esti em estima~io. As es~imativas por intervalo
sao chamad~s de intervalos de confiança (Ie).
Dependendo da segurança re~uerida, determina-s0 intervalos com
confiança de 95% ou 99%, designados, respectivamente, Ie 95% e Ie 99%.
Em ~mbos os casos calcula-se o limite inferior LI e o limite superior
Li. A diferença i~ - LI s er a mais ampla no ca s'o do rc 99%, da{ a
maior confiança que temos nesse intervalo, quanto à inclusão do param~
tro estimado.
Q.uand;'·não é conhecida a variância da população, usa-se
.,
a varl.a-
ve I t para a determinação do intervalo de- confiança. Afirma-se, com
urna confiança 100 (1 - c( )%, que O parâmetro f está inclu{do no inter
vaIo limitado pelos limites de confiança

Os valores t são tirados da Tabela de 1, com « 0,05 para IC 95%


. e c( ;: 0,01 para IC 99%.
A refer5ncia ao intervalo sempre é feita em termos de confiança.
Não é correto afirmar, por exemplo, que o parâmetro;V tem uma probabl.
lidado 0f95 ou 0,99 de encontrar-se entre ·os limites estimados •.Sendo
um vulorfixo,jt não tem probabIlidade: está ou não está no intervalo
estimado.
~enplo - Para testar o ef.eito de um estimul~nte, determinou-se a
p"lBnç~o dê ~5 pnc{allt09t nntüG' o dopois ao nd~inistrur o oDtimulantc.
o au~ellto n~dio de pulsaç~es foi de 16 unidades por minut~ com um des-
vio padr~o de 6. Qual é o intervalo de confianç~ 95% para o aumento m~
dio verdadeirod~ pulsações? ,-

Y c 16; e c 6; -_.~
,j r ,
'.' " ':.i· ~
r_- c : .••.
Apêndice 3.1 .
Tabela, parcial de nGmeros ileat~rio6 para tomada de amostras

6 4 2 4 6 3 663 9 6 5 4 064 9 7 363 1 7 4 O 7 2 4 8 4 14,


2 6 5 3 4 4 2 4 O 4 O 5 4 81 7 6 5 5 7 4 4 O 7 4 O 1 9 5 1 1 5
O 5' 8 4 O O 5 1 7 8 6 3 5 5 3 2 1 8 1 1 6 9 2 9 9 l' 7 O 8 6 2 2
7 4 8 7 6 9 3 7 6 7 3 5 5 101 335 1 8 3 O 4 1 7 057 250
3 O 8 7 5 4 4 7 3 5 O 18 8 1 3 2 5 7 3 8 6 7 2 9 1 6 9 1 ,3 8 9
.3 1 4 3 9 6 1 5 8 9 1 7 7 5 5 4 8 1 3 6 2 4 4 8 7 7 2 4 7 6 6 9
6 6 8 9 6 1 5 O O 1 2 ,4 O O 6 6 O 5, 8 7 1 35 6 7 6 7 O 8 7 9 1
9 194 5 7 797 9 9 7 331 O O 6 9 O 4 8 1 1 5 2 5 O 2 4 1 3
113 O 8 7 118 14 7 5 2 9 3 8 O 5 5 2 8 4 249 4 1 4 4 4 4'
O 4 2 6 2 ~,O 2 5 4 3 7 5 7 3 2 1 5 9 4 4 53 5 78 3 7 1, O 5 6
9 9 7 1 9 5 3 7 9 1 2 6 9 2 7 9 2 6 4 8 5'3 4 4 2 6 1 O 4 9 O 8
1 1 3 9 639 8 1 4 2 6 9 2 1 7 5 7 6 1 9 105 016 3 O 2 O 3
4 2 5 8 3 7 O 6 2 4 5 2 7 2. 6 O 5 7 5 8 9 8 1 3 3 7 2 9 O 5 9 6
4 O 1 7 9 8 5 9 9 7 1 6 4 1 6 8 8 4 5 36 7 5 86 2 O 3 4 9 9 6
8 3 2 O 7 6 1 2 9 3 9 6 2 6 7 4 2 4 1 4 O 48 3 4 O 2 5 27 O 6
6'. 8 2 4 5 9 6 3~ O 4 2 5 2 7 O 8 1 4 7 t. 1 7 5 2 9 5 4 O 5 5 fi 1
4 O 5 5 3 7 9 O O 8·9 ,5 5 2 5 O 2 4 2 2 7 2 3 4 8 ~ 4 5 O 7 5 O

Apêndice 3.2
Aumdnto de p~so em kg, num ,perLodo de 75 dias, de 100 leitões
N9 pêso N9 pêso N9 pêso N9 pêso N9 pêso
00 59 20
--------~---------------------------------------
4S 40 50 60 68 80 51".
01 48 21 61 41 73 61 56" 81 51
02' 53 22 50 42 46' 62 55 82 69
03 50 23 50 43 54 63 50 ,,83 58
04 57 24 54 44 46 64 44 84 60
05 43, 25 36 45 50 65 55 85 58
06 54 ,26 59 ' 46 41 66 38 86 50
07 4727 53 47 62 67 48 87 53
08 32 28 65 48 31 68 50 . 88 52
09 40 29 3~ 49 67 69' 56 89 53
10 48 30 47 50 45 70 49 ,90 53
11 71 31 57 51 59 71 39" 91 52
12 61 32 34 52 44 72 60 92 49
13 64 33 37 53 37 73 , 46 93 39·
14 ' 63 34 55 54 47 74 50 94 40"
15 63 35 66 55 61 75 46 95 27
16 41 36 62 56 23' 76 49 96 42
17 38 37 44 57 62 77 56 97 " 33
18 50 38 51 58 3 e' 78 49 98 42
19 45 39 41 59 51 79 39 ' 99 43

Média ::50 kg
(f)


41 '"""""'

4. Testes de hipóteses ou ele cignificância


"\

-r-,
4.1. Hipótese estatlstica --,

'"'
Uma seeunda categoria de problemas, relacionados com a inferência '\

estatística, ~ a dos t~stes de hip~teses estat{sticas~ ou testes de -"\

-r-,
eignificância. O assunto é de máxima importância na conduçao de qual-
.

quer investigaçao
••.N

cientlfica.
,.
,
"\
Hipótese estatística ~ a especificaç~o do valor do parimet~o de
~,
uma população ou do relacionamento dos parâmetros de diferentes popul~ ".
"""""\

93eB. As amostres de dados de observa~5cs dever~o confirmar ou n~o,as


''""\

hipóteses formuladas sobre as respectivas populaç5es. ,


Para a escolha de uma hipótese, segue-se a s~guin~e orientaç~o:
11
"""'
1) F~equentemente uma hipótese razoável pode ser formulada, com \

base no conhecimento que se tem da área de pesquisa e através


de um raciocínio lógico. Por ex~mplo, um geneticista, baseado """""\

-r-,
na teoria mendeliana, espera uma segregação na proporção de
311 num dos seris cruzamentos; os dados de 60ntagens na amostra '"'
deverãó confirmar as proporções paramétricas. A hipót~se só se
,
ri aceita quando a amostra confirmar a propo!ção.
_"
2) Quando Se comparam os resultados obtidos em dois conjuutos sub
metidos a tratamentos diferentes, formula-se nc rma.Lrnen
t e a hi-

pótese de que não há diferença entre aS médias das populações~


das quais, pr-esumí.ve Lme n t e , os dois c-onjuntos são amostras. É
.
a chamada hin6tese de nulidade. As estimativas das m~dias cal-
culadas para os dois conjuntos, poderão não confirmar a hipót~
SO, A hip6tese neste caso seri rejeitada, decidindo que os con ""\

juntos ou os tratamentos a eles aplicados são difer8ntcs. """"\

""""\
Qualquer que seja a hipótese formulada, as informaç5es colhidas
na amostra deverão permitir uma decisão sobre ~ mesma. A decisão é to- •
~
rrada aplicando-se um teste de hip6tese ou de sienificância. Trata-se
.:Q....,

de uma regra ect.at e t í.ca que permite


í uma decisão em relação a hip6tese.
~,
A decisão é expressa em uma das duas alternativas seguintes: """""\

1) aceitar a hipótese; '"

2) rejeitar a hip6tese. ,
Uma das hipóteses estat{sticas mais sinples é representada simbo- '\

licamente por lIo: fi- =: }A-o· """""\

A hipót~se estipula ~ue a média fi de una populaçã~.~ igual a uma '""\

constante especificada 11 • O f,{mbolo n significa hip6tese ele nu l d a-


. '. r·o o
í "\

~: em realidade~ = jJ---o'é o mesmo que!'-


;:... - /-L-o '" O. A hip.ótese '\

'\

"'
+-,