Anda di halaman 1dari 30

SUMRIO

1. GENERALIDADES ........................................................................................................... 03
1.1. Introduo ..................................................................................................................... 03
1.2. Diviso da estatstica .................................................................................................... 03
1.3. Mensurao .................................................................................................................. 04
1.3.1. Introduo .......................................................................................................... 04
1.3.2. Formas de mensurao ...................................................................................... 05
2. PEQUENOS CONJUNTOS DE DADOS NO-AGRUPADOS (n 30)...................... 06
2.1. Introduo ..................................................................................................................... 06
2.2. Medidas de posio ou tendncia central ..................................................................... 07
2.2.1. As mdias ........................................................................................................... 07
2.2.2. A mediana .......................................................................................................... 09
2.2.3. A moda ............................................................................................................... 09
2.3. Medidas de variabilidade ou disperso ........................................................................ 09
2.3.1. A amplitude ........................................................................................................ 09
2.3.2. O desvio mdio (absoluto) ................................................................................. 09
2.3.3. A varincia ......................................................................................................... 10
2.3.4. O desvio-padro ................................................................................................. 11
2.3.5. A varincia relativa ............................................................................................ 11
2.3.6. O coeficiente de variao ................................................................................... 11
3. DISTRIBUIES DE FREQNCIAS PARA DADOS AGRUPADOS.(n > 30)........ 12
3.1. Introduo ..................................................................................................................... 12
3.2. Distribuies por ponto ou valores .............................................................................. 12
3.3. Distribuies por classes ou intervalos ........................................................................ 12
3.4. Elementos de uma distribuio de freqncias ............................................................ 13
3.4.1. A freqncia relativa ou percentual ................................................................... 13
3.4.2. A freqncia acumulada simples ou absoluta .................................................... 14
3.4.3. A freqncia acumulada relativa ou percentual ................................................. 14
3.4.4. Outros elementos ................................................................................................ 14
3.5. Apresentao de uma distribuio de freqncias ....................................................... 15
3.5.1. Distribuio de freqncias por pontos ou valores ............................................ 15
3.5.2. Distribuio de freqncias por classes ou intervalos ........................................ 15
3.6. Resumo de uma distribuio de freqncias ................................................................ 17
3.6.1. Medidas de posio ou tendncia central ........................................................... 17
3.6.2. Medidas de variabilidade ou disperso para dados agrupados............................ 19
3. 6.3. Medidas de assimetria ....................................................................................... 21
3.6.4. Medidas de curtose ............................................................................................. 21
3.7. Propriedades das medidas ............................................................................................ 22
3.7.1. Medidas de posio ............................................................................................ 22
3.7.2. Medidas de disperso ......................................................................................... 22
4. EXERCCIOS .................................................................................................................... 23
5. RESPOSTAS DOS EXERCCIOS ................................................................................... 28

2
1. GENERALIDADES

1.1. INTRODUO
Por onde quer que se olhe ou escute uma coleo de nmeros so normalmente enunciados
como estatsticas. Estes nmeros referem-se aos mais diversos campos de atividades: esportes,
economia, finanas, engenharias, etc. Assim tem-se por exemplo:
O nmero de carros vendidos no pas aumentou em 30%.
A taxa de desemprego atinge, hoje, 10%.
As aes da Petrobrs subiram R$ 1,5, hoje.
Resultados do Carnaval no trnsito: 145 mortos, 2430 feridos.
Um nmero denominado uma estatstica (singular). No fechamento da bolsa as aes da
Vale do Rio Doce foram cotadas a R$ 45,50. As vendas de uma empresa no ms constituem uma
estatstica. J uma coleo de nmeros ou fatos denominado de estatsticas (plural). Por
exemplo, as vendas da empresa Picunhas totalizaram: 2,5 milhes em janeiro, 2,7 em fevereiro e
3,1 em maro. No entanto o termo Estatstica tem um sentido muito mais amplo, do que apenas
nmeros ou coleo de nmeros. A Estatstica pode ser definida como:
A cincia de coletar, organizar, resumir, apresentar, analisar e interpretar dados
numricos com o objetivo de tomar melhores decises.
Assim como advogados possuem "regras de evidncia" e contabilistas possuem "prticas
comumente aceitas", pessoas que tratam com dados numricos seguem alguns procedimentos
padres. Alguns destes mtodos sero vistos no que se denomina de estatstica descritiva.

1.2. DIVISO DA ESTATSTICA


A Estatstica que lida com a organizao, resumo e apresentao de dados numricos
denominada de Estatstica Descritiva. Assim pode-se definir a Estatstica Descritiva como sendo:
Os procedimentos usados para organizar, resumir e apresentar dados numricos.
Conjuntos de dados desorganizados so de pouco ou nenhum valor. Para que os dados se
transformem em informao necessrio organiz-los, resumi-los e apresent-los. O resumo de
conjuntos de dados feito atravs das medidas e a organizao e apresentao atravs das
distribuies de freqncias e dos grficos ou diagramas.

Estatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade
no possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte
do conjunto. Os principais motivos para se trabalhar com uma parte do conjunto ao invs do
conjunto inteiro so:
-impossibilidade de se trabalhar com o conjunto inteiro;
-experimentos destrutivos;
-custo elevado.
O conjunto de todos os elementos que se deseja estudar denominado de populao. Note-
se que o termo populao usado num sentido amplo e no significa, em geral, conjunto de
pessoas. Pode-se definir uma populao como sendo:
Uma coleo de todos os possveis elementos, objetos ou medidas de interesse.
Assim, so exemplos de populaes:
1. O conjunto das rendas de todos os habitantes de Porto Alegre;
3
2. O conjunto de todas as notas dos alunos de Mtodos Estatsticos I;
3. O conjunto das alturas de todos os alunos da Universidade; etc.

Um levantamento efetuado sobre toda uma populao dito de levantamento


censitrio ou simplesmente censo.

Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral,
muito difcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e
demanda um tempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da
populao denominadas de amostras. Uma amostra pode ser caracterizada como:
Uma poro (ou parte ou subconjunto) de uma populao de interesse.
Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na
Agricultura, Engenharia, Negcios, Marketing, Governo, Poltica, etc., como se pode ver plos
seguintes exemplos:
Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado
de eleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies.
Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de
tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens
defeituosos.
O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc.
Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos
programas para fixar valores da propaganda ou ento modificar ou eliminar programas com
audincia insatisfatria.
Bilogos marcam pssaros, peixes, animais, etc. para tentar prever e estudar seus hbitos.
O processo de escolha de uma amostra da populao denominado de amostragem.
Riscos da amostragem. O processo de amostragem envolve riscos, pois toma-se decises
sobre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser
utilizada para fornecer uma idia do risco envolvido, ou seja, do erro que se comete ao utilizar uma
amostra ao invs de toda a populao, desde que, claro, a amostra seja selecionada atravs de
critrios probabilsticos, isto , ao acaso.
Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial como:
A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em
amostras probabilsticas desta mesma populao.

1.3. MENSURAO
1.3.1. INTRODUO

O processo de selecionar o modelo matemtico ou estatstico a ser utilizado com uma dada
tcnica de pesquisa ou procedimento operacional envolve algumas decises importantes. A tomada
de deciso do modelo matemtico ou estatstico a ser aplicado costuma ser precedida pela
mensurao do fenmeno envolvido. E uma primeira dificuldade surge na necessidade de se
definir o que mensurao. Se o termo se referir somente aqueles tipos de medidas comumente
utilizados em cincias tais como a fsica (por exemplo: medidas de comprimento, massa ou
tempo) no haver muitos problemas na escolha do sistema matemtico. Mas se o conceito de
medida for amplo o suficiente para incluir certos procedimentos de categorizao normalmente
utilizados em Cincias Sociais, ento o problema torna-se mais complexo. Pode-se distinguir entre
diversos nveis de mensurao e para cada um existem diferentes modelos estatsticos apropriados.

4
1.3.2. FORMAS DE MENSURAO

Existem quatro formas de mensurao ou tipos ou nveis de medidas ou ainda escalas


que so conhecidas como: nominal, ordinal, intervalar e razo.
Nvel nominal. A operao bsica e mais simples em qualquer cincia a de classificao.
Na classificao tenta-se separar conjuntos de elementos com respeito a certas categorias, tomando
decises sobre quais elementos so mais parecidos e quais so diferentes. O objetivo colocar os
elementos em categorias to homogneas quanto possvel quando comparados com as diferenas
existentes entre as categorias.
Os termos nvel nominal de medida ou escala nominal so utilizadas para se referir a
queles dados que s podem ser classificados em categorias. Se bem que no sentido estrito no
existe na realidade uma medida ou escala envolvida. Existe apenas uma contagem. Variveis que
podem ser colocadas nesta categoria so, por exemplo, a classificao das pessoas quanto religio,
sexo, estado civil, etc. No existe uma ordem particular entre as categorias ou grupos e alm
disso duas categorias quaisquer so mutuamente excludentes, isto , uma pessoa no pode ser ao
mesmo tempo catlico e protestante. Ainda, as categorias so exaustivas, significando que um
membro da populao deve aparecer em uma e somente uma das categorias. Observe o Quadro 1.1
abaixo.
Quadro 1.1 Exemplo de varivel nominal
Estado civil Nmero de pessoas
Casado 360
Solteiro 250
Vivo 40
Divorciado 50
Total 700
Deve-se ser salientado que as classes ou categorias podem ser rotuladas com nmeros, mas
isto no significa as operaes aritmticas com estes nmeros tenham algum significado em
particular. Neste caso os nmeros exercem a mesma funo dos nomes, isto , identificar a
categoria.
Nvel ordinal. O nvel ordinal o tipo nominal em que se pode ordenar as categorias. A
nica diferena entre os dois nveis a relao de ordem que se pode estabelecer entre as categorias.
No entanto, no possvel afirmar o quanto uma categoria maior do que a anterior, isto , no se
pode afirmar o quanto uma categoria possui da caracterstica. A avaliao atravs de conceitos
feita por uma escala ordinal. Veja um exemplo no Quadro 1.2 abaixo.

Quadro 1.2 Exemplo de varivel em escala ordinal


Conceitos Nmeros de alunos
A 4
B 6
C 15
D 3
E 2
Total 30
No se pode afirmar neste caso que quem tirou A teve um nmero de acertos duas vezes
maior que quem tirou C. A nica coisa que se sabe que quem tem A acertou mais questes do
quem tem B e este de quem tem C e assim por diante. As famlias podem ser classificadas de
acordo com seu estatus scio econmico em: alta, mdia alta, mdia, mdia baixa, baixa. No
possvel entretanto afirmar que a diferena entre a alta e a mdia alta seja a mesma que entre a
mdia e a mdia baixa.
Nvel intervalar. No sentido estrito da palavra o termo mensurao pode ser utilizado para
se referir as situaes em que se pode, no somente ordenar objetos com respeito ao grau de que
5
eles possuem certa caracterstica, mas tambm indicar a exata distncia entre eles. Isto possvel
atravs de uma escala denominada de "escala de intervalos".
A escala de medida intervalar uma escala ordinal em que a distncia entre as
categorias, ao contrrio da ordinal, sempre a mesma. Ou seja, ela possui todas as caractersticas
da escala ordinal mais o fator de que a distncia entre as diversas categorias (ou valores) sempre
constante. As escalas de medir temperaturas como a Fahrenheit e a Celsius so exemplos de escalas
de intervalo. No entanto, no se pode afirmar que uma temperatura de 40 graus duas vezes mais
quente que uma de 20 graus, embora se possa dizer que a diferena entre 20 graus e 40 graus a
mesma que entre 75 graus e 95 graus. Isto porque este tipo de escala no possui um zero
absoluto. Ou seja, o valor zero na escala apenas um ponto de referncia e no significa a ausncia
de calor. Escores padronizados so tambm exemplos deste tipo de nvel de medida.
Torna-se evidente que uma escala de intervalo requer o estabelecimento de algum tipo de
unidade fsica a qual todos concordem, isto , um padro, e, que seja replicvel, isto , possa ser
aplicada muitas vezes e fornecendo sempre os mesmos resultados. Comprimento medido em
termos de cm ou metros, tempo em segundos, temperatura em graus centgrados ou Fahrenheit,
renda em dlares ou reais. Por outro lado no existem tais unidades para inteligncia, autoritarismo
ou prestgio que sejam unnimes entre todos os cientistas sociais e que possam ser assumidas
constantes de uma situao para outra.
Nvel de razo. Este o mais alto nvel de medida. caracterizado por apresentar todas as
caractersticas da escala intervalar mais um zero absoluto. Aqui o zero pode ser entendido como
a ausncia da caracterstica e as comparaes de valor (razo) tem sentido. Um exemplo de varivel
deste tipo o peso. Um valor igual a zero significa ausncia de peso e um valor de 20 kgf duas
vezes mais pesado que um de 10 kgf.

2. PEQUENOS CONJUNTOS DE DADOS NO-AGRUPADOS (n 30)


2.1. INTRODUO
Para se analisar um conjunto de valores necessrio primeiramente, para fins de
notao, distinguir se este conjunto resultado de um censo ou de uma amostragem.
A Estatstica Descritiva pode ser estudada considerando os conjuntos de valores analisados
como sendo amostras ou ento populaes. Como o caso mais comum a obteno de amostras a
notao apresentada ser feita considerando os valores como resultados de amostragens. No
entanto, convm ficar atento, com a bibliografia, pois dependendo do autor a orientao pode ser
outra. A diferena, considerada do ponto de vista da descrio dos dados, apenas notacional.
Assim o tamanho de uma populao (quando finita) representado, normalmente por "N",
enquanto que o tamanho de uma amostra representado por "n". Afora algumas excees os
valores calculados na amostra so representados por letras latinas enquanto que os
correspondentes na populao o so pelas mesmas letras s que gregas.
Para facilitar o estudo da Estatstica Descritiva os conjuntos de valores sero
considerados como pequenos e grandes. Assim se um conjunto tiver 30 ou menos valores a
anlise ser feita sem o agrupamento. Caso o conjunto tenha mais do que 30 valores ento
primeiramente ser feito o agrupamento de acordo com o tipo de varivel considerada. O valor 30
apenas um ponto de referncia escolhido arbitrariamente e dependendo da situao pode-se
considerar o agrupamento com mais ou menos valores envolvidos.
Um conjunto de dados, de qualquer tamanho, pode ser resumido de acordo com as
seguintes medidas:
Medidas de tendncia central ou posio
Medidas de disperso ou variabilidade.
Medidas de assimetria.
Medidas de achatamento ou curtose.
6
2.2. MEDIDAS DE POSIO OU TENDNCIA CENTRAL
Um conjunto de valores (amostra) ser representado por: x1, x2,..., xn, onde "n" o nmero
de elementos do conjunto, isto , o tamanho da amostra.

2.2.1. AS MDIAS

(a) A mdia aritmtica

A mdia aritmtica do conjunto x1, x2,..., xn representada por x e calculada por:


n
x1 + x 2 + ... + x n x
x= = i
n i =1 n

Obs.: Se o conjunto x1, x2,..., xN representa toda a populao, a mdia aritmtica


populacional, notada por , calculada por:
N
x1 + x 2 + ... + x N x
= = i
N i =1 N

(b) A mdia geomtrica

A mdia geomtrica dos valores positivos: x1, x2,..., xn, representada por mg e calculada
por:
n
m g = n x1x 2 ...x n = n x i
i =1

(c) A mdia harmnica

A mdia harmnica dos valores positivos x1, x2,..., xn representada por mh e calculada por:
1 n n
mh = = =
1 1 1 1 1 1 n
1
+
x1 x 2
+ ... +
xn
+
x1 x 2
+ ... +
xn x
i =1 i
n

Observando a expresso do clculo da mdia harmnica pode-se verificar que ela


definida como sendo: O inverso da mdia aritmtica dos inversos.

Exemplo:
Calcular as mdias dos seguintes conjuntos de dados:
(a) {1, 9} (b) {4, 6} (c) {1/2, 4/5, 3/2, 7/4}
Para o conjunto em (a) tem-se:
x= mg= mh =

Para o conjunto em (b) tem-se:


x= mg= mh =

7
Para o conjunto em (c) tem-se:
x= mg=

mh =
Relao entre as trs mdias
As trs mdias mantm a seguinte relao entre elas, desde que os valores sejam positivos e
diferentes entre si.
x > mg > mh

(d) A mdia quadrtica


A mdia quadrtica dos valores positivos: x1, x2,..., xn, representada por mq, calculada por:

mq =
x12 + x 22 + ... + x 2n
= x 2
i 1 n 2
= xi
n n n i=1

(e) A mdia aritmtica ponderada


A mdia aritmtica ponderada do conjunto x1, x2,..., xk, com pesos w1, w2,..., wk,
representada por map e calculada por:
k

x w + x 2 w 2 + ... + x k w k x w i i
ma p = 1 1 = i =1
k
w1 + w 2 + ... + w k
w
i =1
i

(f) A mdia geomtrica ponderada


A mdia geomtrica ponderada do conjunto x1, x2,..., xk, com pesos w1, w2,..., wk,
representada por mgp e calculada por:
k
wi w w wk
mg p = i =1
x1 1 x 2 2 ...x k

(g) A mdia harmnica ponderada


A mdia harmnica ponderada do conjunto x1, x2,..., xk, com pesos w1, w2,..., wk,
representada por mhp e calculada por:
k

w i
mh p = i =1
k
wi
x
i =1 i

Exemplo:
A mdia da primeira prova de Mtodos Estatsticos I foi de 6,0 e foi realizada por 55 alunos.
Na segunda prova compareceram 50 alunos que tiveram uma mdia de 6,5. A terceira prova
realizada por 40 alunos teve mdia de 5,5. Qual a mdia aritmtica geral das 3 provas?

8
2.2.2. A MEDIANA
A mediana de um conjunto ordenado de valores, anotada por me, definida como sendo o
valor que separa o conjunto em dois subconjuntos do mesmo tamanho. Assim se "n" (nmero de
elementos) mpar a mediana o valor central do conjunto. Caso contrrio a mediana a mdia
aritmtica dos valores centrais do conjunto. Tem-se:

m e = x (n +1)/2 , se " n" mpar e m e = [x n/2 + x (n/2) +1 ] 2 , se " n" par

Exemplo:
Para o conjunto: {15, 18, 21, 32, 45, 46, 49}
A mediana : me =
Ou seja, a mediana o quarto valor na seqncia ordenada de elementos. Se o conjunto
acima fosse: {15, 18, 21, 32, 45, 46}
Ento a mediana seria: me =

2.2.3. A MODA
A moda de um conjunto de valores, anotada por mo, definida como sendo "o valor (ou os
valores) do conjunto que mais se repete".
Convm lembrar que a moda ao contrrio da mediana e da mdia pode no ser nica, isto ,
um conjunto pode ser bimodal, trimodal, etc. ou mesmo amodal (sem moda). Se a moda existir
ser representada por mo.
Exemplo:
Dado o conjunto: {1, 2, 2, 3, 3, 4, 4, 4, 7, 9, 15}
A moda ser: mo =
Pois este valor se repete 3 vezes no conjunto e qualquer outro se repete duas ou menos
vezes.

2.3. MEDIDAS DE VARIABILIDADE OU DISPERSO


2.3.1. A AMPLITUDE
A mais simples das medidas de disperso a amplitude, anotada por "h", e definida como
sendo a diferena entre os valores extremos do conjunto, isto :

h = xmx xmn
Exemplo:
A amplitude do conjunto: {5, 4, 0, 3, 8, 10}, vale: h =

2.3.2. O DESVIO MDIO (ABSOLUTO)


A amplitude uma medida simples e fcil de calcular. Tem a virtude de dar uma idia da
variabilidade do conjunto. No entanto ela no leva em considerao todos os valores do conjunto
como seria desejvel.
Assim prefere-se, em geral, trabalhar com medidas que utilizam toda a informao
disponvel. Uma destas medidas o desvio mdio absoluto ou simplesmente desvio mdio. O
desvio mdio representado por "dma" e definido como sendo "a mdia das distncias que os
9
valores do conjunto se encontram da mdia".

xi x
dma = [ x 1 x + x 2 x + ... + x n x ] n =
n
Exemplo:
Calcular o dma do conjunto: {7, 4, 0, 3, 8, 10}
A mdia x =
Ento o desvio mdio ser: dma =

2.3.3. A VARINCIA
O desvio mdio apesar de intuitivamente fcil de interpretar e simples de calcular no
muito utilizado em Estatstica. O que de fato a medida de disperso usual a varincia e
principalmente sua raiz quadrada que denominada de desvio-padro. A varincia populacional,
anotada por 2 = V(X) = Var(X), definida como sendo "a mdia dos quadrados dos desvios em
relao mdia aritmtica". Por desvio entende-se a diferena entre um valor do conjunto e a
mdia aritmtica.

(x1 ) 2 + ... + (x N ) 2 N
(x i ) 2
2
= = , quando x1, x2,..., xN representa uma populao.
N i =1 N

Obs.: Se o conjunto x1, x2,..., xn representa uma amostra, a varincia amostral, notada por
s2, calculada por:
n
(x i x) 2
2
s =
i=1
n 1

Nem sempre esta expresso anterior para 2 a mais indicada para ser utilizada. Quando a
mdia populacional um valor decimal no exato ela no muito prtica, uma vez que entrar no
clculo "N" vezes aumentando os erros de arredondamento que ocorrem. Neste caso melhor se
valer de uma expresso alternativa que pode ser derivada da expresso acima desenvolvendo o
quadrado dentro do somatrio e fazendo algumas simplificaes.
Trabalhando inicialmente apenas com o numerador da frmula acima vem:

(x ) = (x i2 2x i + 2 ) = x i2 2 x i + 2
2
i

N
xi N N
Observando que = tem-se que: x i = N e ainda que: 2
= N 2 vem:
i =1 N i =1 i =1

(x ) = x 2N + N = x N
2 2 2 2 2 2
i i i

Dividindo este resultado por "N" e simplificando a segunda parcela encontra-se a expresso
alternativa para a varincia populacional, a qual dada por:

x i2
2 = 2
N
Obs.: Se o conjunto x1, x2,..., xn representa uma amostra, a forma alternativa para a
varincia amostral representada por:

x i2 n x 2 x 12 + x 22 + ... + x 2n n x 2
s2 = n 1
=
n 1
10
Estas so expresses alternativas para o clculo das varincias populacionais e amostrais
e em muitas situaes so mais vantajosas de serem usadas. No caso da varincia populacional
pode ser caracterizada como sendo: "a mdia dos quadrados menos o quadrado da mdia".

2.3.4. O DESVIO-PADRO
A varincia por ser um quadrado no permite comparaes com a unidade que se est
trabalhando. Para se ter uma medida de variabilidade com a mesma unidade do conjunto utiliza-se a
raiz quadrada da varincia, que denominada de desvio-padro. Assim o desvio-padro
populacional dado por:

(x i ) 2 x i2
= N = N 2
Obs.: O desvio-padro amostral representado por:

s=
(x i x) 2
=
x 2
i nx2
=
x12 + x 22 + ... + x 2n n x 2
n 1 n 1 n 1

Exemplo:
Calcular a varincia e o desvio-padro do conjunto {7, 4, 0, 3, 8, 10}, considerando: a) que
o conjunto representa uma populao; b) que o conjunto representa uma amostra.

A mdia : = x=

Ento varincia ser: 2 = s2 =

E o desvio-padro: = s=

2.3.5. A VARINCIA RELATIVA

A varincia relativa, representada por 2 (ou g2) o quociente entre a varincia e o


quadrado da mdia. Isto :

2 s2
2 = ou g 2 =
2 x2

2.3.6. O COEFICIENTE DE VARIAO

O coeficiente de variao a raiz quadrada da varincia relativa. Isto :

= / ou g = s/ x

Exemplo:

Calcular a varincia relativa e o coeficiente de variao do conjunto {7, 4, 0, 3, 8, 10}

Ento a varincia relativa ser: 2 = g2=

E o coeficiente de variao ser: = g=


11
3. DISTRIBUIES DE FREQNCIAS PARA DADOS AGRUPADOS

3.1. INTRODUO

Para se trabalhar com grandes conjuntos de dados (n > 30) necessrio inicialmente
agrupar estes dados. O agrupamento feito em tabelas, denominadas de distribuies de
freqncias. Para se construir uma distribuio de freqncias comum fazer a distino entre dois
tipos de variveis. A varivel (ou conjunto) discreta (valores que so resultados de contagem)
e a varivel (ou conjunto) contnua (valores que so resultados de uma mensurao). Em geral
variveis discretas so agrupadas em distribuies por ponto ou valores e variveis contnuas
em distribuies por classes ou intervalos. A separao no rgida e depende basicamente dos
dados considerados. Poder ser necessrio usar uma distribuio por classes ou intervalos mesmo
quando a varivel discreta.

3.2. DISTRIBUIES POR PONTO OU VALORES.


Considere-se um conjunto de valores resultados de uma contagem. Poderia ser, por
exemplo, o nmero de irmos dos alunos da turma de Mtodos Estatsticos I.

Nmero de irmos dos alunos da turma de Mtodos Estatsticos I


0 1 1 6 3 1 3 1 1 0
4 5 1 1 1 0 2 2 4 1
3 1 2 1 1 1 1 5 5 6
4 1 1 0 2 1 4 3 2 2
1 0 2 1 1 2 3 0 1 0

Esta coleo de valores no constitui informao mas pode ser transformada em informao
mediante sua representao em uma distribuio de freqncias por pontos ou valores. Para tal,
coloca-se o conjunto em uma tabela em que a coluna da esquerda representada pelos diferentes
nmeros ordenados (os pontos ou valores), notados por xi, e a coluna da direita pelo nmero de
vezes que cada valor se repetiu (as freqncias simples), notadas por fi. Para o exemplo, na Tab. 03,
tem-se:

Tabela 03 - Distribuio de freqncias por ponto ou valores do nmero de irmos dos alunos da
turma de Mtodos Estatsticos I
N de irmos (xi) N de alunos (fi) fri Fi
0 7
1 21
2 8 0,16 36
3 5 0,10 41
4 4 0,08 45
5 3 0,06 48
6 2 0,04 50
Total 50 1 --

3.3. DISTRIBUIES POR CLASSES OU INTERVALOS


Considere-se um conjunto de valores resultados de uma mensurao (medida). Poderia
ser, por exemplo, a idade dos alunos da turma de Mtodos Estatsticos I.

12
Idade (em meses) dos alunos da turma de Mtodos Estatsticos I
230 234 276 245 345 240 270 310 368 369
334 268 288 336 299 236 239 355 330 247
287 344 300 244 303 248 251 265 246 266
240 320 308 299 312 324 289 320 264 275
252 298 315 255 274 264 263 230 303 281

Este conjunto de valores, obviamente no pode ser apresentado da mesma forma que o
anterior, pois quase no h repeties. Neste caso necessrio construir uma tabela denominada de
"distribuio de freqncias por classes ou intervalos". Evidentemente haver perda de
informao neste processo, mas o ganho obtido pela condensao dos dados compensa.
O procedimento para construir esta distribuio envolve os seguintes passos (algoritmo):

-Determinar a amplitude dos dados: h = xmax xmn


-Decidir sobre o nmero de classes "k" a ser utilizado. Recomenda-se um nmero de
classes entre 5 e 15. Para que a deciso no seja totalmente arbitrria, o nmero de classes pode ser
calculado utilizando a raiz quadrada do nmero de valores, ou seja, k n
-Determinar a amplitude de cada classe. Sempre que possvel manter todas as amplitudes
iguais. Para tanto deve-se dividir a amplitude dos dados "h" pelo nmero de classes "k",
arredondando para mais, ou seja, h i h / k.
-Contar o nmero de valores pertencentes a cada classe. Em geral, utiliza-se a
simbologia ( | ), para indicar um intervalo fechado esquerda e aberto direita. Tambm poderia
ser utilizado o intervalo aberto esquerda e fechado direita ( | ), aberto de ambos os lados ( )
ou ainda fechado de ambos os lados ( || ).

Um exemplo de uma distribuio de freqncias por classes ou intervalos apresentado na


Tab. 04.

Tabela 04 - Idades dos alunos da turma de Mtodos Estatsticos I


Idades N de alunos (fi) fri Fri
230 | 250 12
250 | 270 9
270 | 290 8 0,16 0,58
290 | 310 7 0,14 0,72
310 | 330 6 0,12 0,84
330 | 350 5 0,10 0,94
350 | 370 3 0,06 1
Total 50 1 --

3.4. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIAS


Alm da freqncia simples ou absoluta pode-se definir ainda:

3.4.1. A FREQNCIA RELATIVA OU PERCENTUAL

A freqncia relativa simples ou percentual definida como sendo o quociente entre a


freqncia simples "fi" e o total de dados "n".

fri = fi / n
13
Exemplo:
Na Tab. 03 tem-se:
fr3 = = 0,16 = 16%, significando que 16% dos alunos da turma possuem 2 irmos.
Na Tab. 04 tem-se:
fr2 = = 0,18 = 18%, significando que 18% dos alunos possuem idades maiores ou
iguais a 250 meses porm menores do que 270 meses.

3.4.2. A FREQNCIA ACUMULADA SIMPLES OU ABSOLUTA.

A freqncia acumulada simples ou absoluta da linha "i" definida como sendo a soma das
freqncias simples ou absolutas at a linha "i".
Fi = f1 + f2 + ... + fi

Exemplo:
Na Tab. 03 tem-se:
F4 = f1 + f2 + f3 + f4 =
F4 = 41, significa que 41 alunos da turma possuem at 3 irmos.

3.4.3. A FREQNCIA ACUMULADA RELATIVA OU PERCENTUAL

A freqncia acumulada relativa ou percentual da linha "i" definida como sendo a soma
das freqncia relativas ou percentuais at a linha "i ".
Fri = frl + fr2 + ... + fri , ou ento, como sendo o quociente da freqncia acumulada simples
pelo total de dados.
Fri = Fi / n

Exemplo:
Na Tab. 04 tem-se:
Fr2 =
Fr2 = 42%, isto , 42% dos alunos possuem idades menores do que 270 meses.

3.4.4. OUTROS ELEMENTOS

(i) Na Tab. 03 os valores da coluna da esquerda so denominados de pontos ou valores.


Cada um deles representado por xi, onde "i" varia de 1 at k, sendo "k" o nmero de linhas da
tabela.
(ii) Na Tab. 04 os valores da coluna da esquerda so denominados de classes ou intervalos.
As classes, tambm, variam de 1 at k.
(iii) Limite inferior da classe "i". Anota-se por lii
Na Tab. 04 o limite inferior da terceira classe : .......
(iv) Limite superior da classe "i". Anota-se por lsi. Na Tab. 04 o limite superior da quinta
classe : .......
(v) Amplitude da classe "i". Anota-se por hi e calculada como a diferena entre os limites
superior ou inferior da classe "i". Assim hi = lsi lii
Na Tab. 04 a amplitude da classe quatro : h4 =
(vi) Ponto mdio da classe. Como no possvel trabalhar com classes necessrio
escolher um representante da classe. Este representante denominado de ponto mdio da classe.
representado por xi e calculado por: xi = (lii + lsi) / 2 ou ento xi = lii + hi / 2.
Na Tab. 04 o ponto mdio da terceira classe : x3 =
Logo, x3 = 280 meses.
14
Exemplo:

Na Tab. 05, abaixo, esto ilustrados os clculos das freqncias relativas percentuais, da
freqncia acumulada simples e da freqncia acumulada percentual correspondentes da Tab. 03.
Tabela 05 - Exemplos de freqncias
N de irmos (xi) N de alunos(fi) fri (%) Fi Fri (%)
0 7 14 7 14
1 21 42 28 56
2 8 16 36 72
3 5 10 41 82
4 4 8 45 90
5 3 6 48 96
6 2 4 50 100
Total 50 100 --- ---

3.5. APRESENTAO DE UMA DISTRIBUIO DE FREQNCIAS


3.5.1. DISTRIBUIO DE FREQNCIAS POR PONTOS OU VALORES.

Uma distribuio de freqncias por pontos ou valores apresentada graficamente atravs


de um diagrama de linhas ou colunas, onde a varivel xi representada no eixo das abcissas
(horizontal) e as freqncias (que podem ser de qualquer tipo) no eixo das ordenadas (vertical).
Utilizando os dados da Tab. 03, construir um diagrama de colunas e de linhas simples na Fig. 01.

Figura 01 - Diagramas de colunas e de linhas simples da varivel "nmero de irmos dos alunos
da turma de Mtodos Estatsticos I".

3.5.2. DISTRIBUIO DE FREQNCIAS POR CLASSES OU INTERVALOS

Uma distribuio de freqncias por classes ou intervalos apresentada graficamente


atravs de um diagrama denominado de HISTOGRAMA. Um histograma um grfico de retngulos
justapostos onde a base de cada retngulo a amplitude de cada classe e a altura
proporcional a freqncia (simples ou relativa) de modo que a rea de cada retngulo seja
igual a freqncia considerada. Desta forma a altura de cada retngulo ser igual a: fi / hi ou ento
fri / hi. Veja-se o clculo das alturas na Tab. 06 e o exemplo na Fig. 02. Tambm pode ser construdo
um histograma utilizando-se as freqncias acumuladas. Neste caso o diagrama resultante

15
denominado de OGIVA. Se os pontos mdios de cada classe de um histograma forem unidos
atravs de segmentos de retas teremos ento um diagrama denominado de POLGONO DE
FREQNCIAS. A Fig. 03 apresenta as ogivas simples e percentual correspondentes Tab. 06.

Tabela 06 - Clculo das ordenadas do histograma


Idades N de alunos (fi) fi/hi fri fri/hi Fi Fri (%)
230 | 250 12
250 | 270 9
270 | 290 8 0,40 0,16 0,008 29 58
290 | 310 7 0,35 0,14 0,007 36 72
310 | 330 6 0,30 0,12 0,006 42 84
330 | 350 5 0,25 0,10 0,005 47 94
350 | 370 3 0,15 0,06 0,003 50 100
Total 50 ---- 1,00 ---- ---- ----

Figura 02 - Histogramas de freqncia simples e de freqncia relativa da varivel "idades dos


alunos da turma de Mtodos Estatsticos I".

Figura 03 Ogivas simples e percentual da varivel "idades dos alunos da turma de Mtodos
Estatsticos I".

16
3.6. RESUMO DE UMA DISTRIBUIO DE FREQNCIAS
3.6.1. MEDIDAS DE POSIO OU TENDNCIA CENTRAL

(i) A mdia aritmtica


A mdia aritmtica amostral de uma distribuio de freqncias por pontos ou valores ou
ainda por classes ou intervalos dada por:
n
fi x i
x = (f1 x 1 + f 2 x 2 + ... + f n x n ) (f1 + f 2 + ... + f n ) =
i =1 n

Obs.: A mdia aritmtica populacional dada por:


N
fi x i
=
i =1 N

Exemplo:
A mdia da distribuio da Tab. 03, utilizando a Tab. 07 para fazer os clculos ser:

Tabela 07 - Clculo da mdia de uma distribuio por pontos ou valores


N de irmos N de alunos (fi) fixi
0 7 0
1 21 21
2 8 16
3 5 15
4 4 16
5 3 15
6 2 12
Total 50 95
=

Ou seja, o nmero mdio de irmos da turma de Mtodos Estatsticos I de 1,90.


J para a Tab. 04 necessrio primeiro obter os valores dos pontos mdios de cada classe
ou intervalo. Fazendo os clculos na Tab. 08, vem:

Tabela 08 - Clculo da mdia de uma distribuio por classes


Idades N de alunos (fi) xi fixi
230 | 250 12 240 2880
250 | 270 9 260 2340
270 | 290 8 280 2240
290 | 310 7 300 2100
310 | 330 6 320 1920
330 | 350 5 340 1700
350 | 370 3 360 1080
Total 50 --- 14260
Deste modo a mdia das idades ser:
=
17
(ii) A mediana

(a) A mediana de uma distribuio de valores ou pontos obtida da mesma forma que
para dados no-agrupados, isto :

m e = x (n +1)/2 , se " n" mpar e m e = [x n/2 + x (n/2) +1 ] 2 , se " n" par

Obs.: Neste caso deve-se trabalhar como se o conjunto no estivesse agrupado.

Exemplo:
Para os valores da Tab. 03 a mediana : me =
Ento, me = 1, pois da oitava posio at a vigsima oitava posio todos os valores so
iguais a um, e a mediana a mdia entre os valores que se encontra na vigsima quinta e vigsima
sexta posio.
(b) A mediana de uma distribuio de freqncias por classes ou intervalos dada pela
seguinte expresso:

n 2 Fi 1
m e = li i + h i , onde
fi
lii = limite inferior da classe mediana, isto , a classe que contm o ou os valores centrais;
hi = amplitude da classe mediana;
fi = freqncia simples da classe mediana;
Fi-1 = freqncia acumulada simples da classe anterior classe mediana.

Exemplo:
Considerando que a classe mediana, na Tab. 04, a que contm os valores x25 e x26, isto , a
terceira classe, vem:
me=

(iii) A moda
(a) A moda de uma distribuio de valores ou pontos obtida da mesma forma que para
dados no-agrupados, ou seja, observando o valor ou os valores que mais se repetem.
mo = valor da linha com maior freqncia (se existir apenas uma).

Exemplo:

Para os valores da Tab. 03 a moda :


mo = 1, pois este valor com uma freqncia de 21 o que mais se repete.

(b) A moda de uma distribuio de freqncias por classes ou intervalos dada pelas
seguintes expresses:

f i +1
m o = li i + h i , denominada de moda de King, ou
f i1 + f i +1

f i f i 1
m o = li i + h i , denominada de moda de Kzuber, onde:
2f i f i 1 f i +1

18
lii = limite inferior da classe modal, isto , a classe de maior freqncia;
hi = amplitude da classe modal;
fi = freqncia simples da classe modal;
fi-l = freqncia simples da classe anterior classe modal;
fi+1 = freqncia simples da classe superior classe modal.

Exemplo:
Considerando que a classe de maior freqncia, a classe modal, na Tab. 04, a primeira,
vem:
mo=

mo=

(iv) Relao entre as trs medidas de posio

Karl Pearson estabeleceu a seguinte relao aproximada entre as trs medidas de posio:

x m o 3(x m e )

Ou seja, em uma distribuio de freqncias diferena entre a mdia e a moda


aproximadamente 3 vezes maior do que a diferena entre a mdia e a mediana.

3.6.2. MEDIDAS DE VARIABILIDADE OU DISPERSO PARA DADOS AGRUPADOS

(a) A amplitude
A amplitude de uma distribuio de freqncias definida como sendo a diferena entre os
valores extremos da distribuio, isto :
h = xmx xmn, para a distribuio por pontos ou valores e
h = lsk li1, para a distribuio por classes ou intervalos.

Exemplo:
A amplitude da distribuio da Tab. 03 : h =

J a amplitude da distribuio da Tab. 04 vale: h =

(b) O desvio mdio (absoluto)

O desvio mdio absoluto de uma distribuio de freqncias dado por:

fi x i x
dma = [f1 x 1 x + f 2 x 2 x + ... + f n x n x ] n =
n

Exemplo:
O dma da distribuio da Tab. 03 utilizando a Tab. 09 para os clculos, vale:

19
Tabela 09 - Clculo dos desvio mdio absoluto e varicia
N de irmos N de alunos fi x i f i (x i ) 2 f i x i2
(xi) (fi)
0 7 = 13,30
1 21 = 18,90
2 8 8|2 1,90| = 0,80 0,08 32
3 5 5|3 1,90| = 5,50 6,05 45
4 4 4|4 1,90| = 8,40 17,64 64
5 3 3|5 1,90| = 9,30 28,83 75
6 2 2|6 1,90| = 8,20 33,62 72
Total 50 64,40 128,50 309
dma =

(c) A varincia
A varincia populacional de uma distribuio de freqncias pode ser avaliada por
qualquer uma das expresses abaixo.
N
f i (x i )2 N
f x2
[
2 = f1 (x1 )2 + f 2 (x 2 )2 + ... + f N (x N )2 ] N=
N
= i i 2
i =1 i =1 N

Obs.: A varincia amostral de uma distribuio de freqncias calculada pelas


expresses seguintes:
n
f i (x i x) 2 n
f i x i2 nx 2 f1 x12 + f 2 x 22 + ... + f n x 2n nx 2
s =
2
= =
i =1 n 1 i =1 n 1 n 1

(d) O desvio-padro
O desvios-padres de uma distribuio de freqncias determinado extraindo-se a raiz
quadrada das respectivas varincias. Assim, os desvios-padres so dados por:

f i (x i ) 2
N N
f i x i2 n f i (x i x) 2 n f i x i2 nx 2
= = 2 ; s= =
i =1 N i =1 N i =1 n 1 i =1 n 1

Exemplo:
A varincia e o desvio-padro populacionais da distribuio da Tab. 04, utilizando a Tab.
10 para os clculos valem:
Tabela 10 - Ilustrao do clculo da varincia e dma
Idades N de alunos (fi) xi fi xi f i x i2 fi x i
230 | 250 12
250 | 270 9
270 | 290 8 280 2240 627200 41,6
290 | 310 7 300 2100 630000 103,6
310 | 330 6 320 1920 614400 208,8
330 | 350 5 340 1700 578000 274,0
350 | 370 3 360 1080 388800 224,4
Total 50 ---- 14260 4138000 1621,60

20
N
f i x i2
A varincia populacional da distribuio ser: 2 = 2 =
i =1 N

N
f i x i2
O desvio-padro populacional vale: =
i =1 N
2 =

A varincia relativa populacional: 2 = 2 2 =

O coeficiente de variao populacional vale: = =

3.6.3. MEDIDAS DE ASSIMETRIA


A assimetria de um conjunto de dados, agrupados ou no, pode ser avaliada atravs da
seguinte relao devida a Karl Pearson:

( m e ) (x m e )
a1 = 3 ou a 1 = 3
s

a)Se a 1 = 0 , ento a distribuio (ou conjunto) dito simtrico.


Se uma distribuio de freqncias simtrica ento as 3
medidas de posio coincidem, isto :
= m e = m o ou x = m e = m o

b)Se a 1 > 0 , ento a assimetria positiva significando que o


grfico da distribuio tem uma cauda alongada direita.
Se a distribuio positivamente assimtrica, ento:
> m e > m o ou x > m e > m o

c)Se a 1 < 0 a1 < 0, ento a assimetria negativa significando que


a cauda do grfico ser alongada esquerda.
Se a distribuio negativamente assimtrica, ento:
< m e < m o ou x < m e < m o

3.6.4. MEDIDAS DE CURTOSE


Denomina-se curtose o grau de achatamento da distribuio.
a)Distribuio mesocrtica: Distribuio nem achatada nem delgada.

b)Distribuio leptocrtica: Distribuio delgada.

c)Distribuio platicrtica: Distribuio achatada.

21
3.7. PROPRIEDADES DAS MEDIDAS
3.7.1. MEDIDAS DE POSIO
(i) Se todos os valores de um conjunto de dados forem somados a uma constante ento
as medidas de posio aumentam desta constante. Em smbolos. Dado um conjunto de dados x e
somando a este conjunto uma constante "c". Ento para y = x + c, tem-se:
y = x+c

O mesmo acontece com a mediana e a moda.


(ii) Se todos os valores de um conjunto de dados forem multiplicados a uma constante
ento as medidas de posio ficam multiplicadas por esta constante. Em smbolos. Se um
conjunto de dados x for multiplicado por uma constante "c". Ento para y = cx, tem-se:
y = cx

O mesmo acontece com a mediana e a moda.

3.7.2. MEDIDAS DE DISPERSO

(i) Se todos os valores de um conjunto de dados forem somados a uma constante ento
as medidas de disperso no se alteram. Em smbolos. Dado um conjunto de dados x e somando
a este conjunto uma constante "c". Ento para y = x + c, tem-se:
sy = sx
O mesmo vale para a varincia e para o dma.
O coeficiente de variao e a varincia relativa so excees, pois so medidas derivadas,
que combinam uma medida de posio a mdia no denominador que se altera e uma medida de
disperso o desvio-padro ou a varincia no numerador que no se altera.

(ii) Se todos os valores de um conjunto de dados forem multiplicados a uma constante


ento as medidas de disperso ficam multiplicadas por esta constante, sendo que a varincia
fica multiplicada pelo quadrado desta constante. Em smbolos. Se um conjunto de dados x for
multiplicado por uma constante "c". Ento para y = cx, tem-se:
sy = csx
O mesmo vale para a o dma.
J a varincia que um quadrado fica multiplicada pelo quadrado da constante.

O coeficiente de variao e a varincia relativa so excees, pois so medidas derivadas,


que combinam uma medida de posio, a mdia no denominador que se altera, e uma medida de
disperso, o desvio-padro ou a varincia no numerador, que tambm se altera. Como tanto o
numerador quanto o denominador se alteram na mesma proporo, ento a razo entre as duas
alteraes passar a ser um. Assim, tanto a varincia relativa quanto o coeficiente de variao
so indiferentes a uma multiplicao do conjunto de valores por uma constante.

22
4. EXERCICIOS
1. Identifique os tipos de escalas utilizadas para cada uma das seguintes caractersticas das unidades
de observao, retiradas de uma tabela do Guia do Usurio do aplicativo Microsoft Excel: ms,
tipo de produto, vendedor, regio do pas, unidades vendidas e total de vendas.

2. possvel encontrar a seguinte srie de desvios tomados em relao a mdia aritmtica: 4, -3, 2, -
7 e 5? Justifique.

3. Dados dois grupos de pessoas, o grupo A com 10 elementos e o grupo B com 40 elementos. Se o
peso mdio do grupo A for de 80 kg e o do grupo B for de 70 kg ento verdade que o peso
mdio dos dois grupos considerados em conjunto de 75 kg? Justifique.

4. Um concurso realizado simultaneamente nos locais A, B e C, apresentou as mdias: 70, 65 e 45,


obtidos por 30,40 e 30 candidatos, nessa ordem. Qual foi a mdia geral do concurso?

5. Para um dado concurso, 60% dos candidatos eram do sexo masculino e obtiveram uma mdia de
70 pontos em determinada prova. Sabendo-se que a mdia geral dos candidatos (independente de
sexo) foi de 64 pontos, qual foi a mdia dos candidatos do sexo feminino?

6. Determinar a moda dos seguintes conjuntos:


(6.1) 1, 6, 9, 3, 2, 7, 4 e 11
(6.2) 6, 5, 5, 7, 5, 6, 5, 6, 3,4 e 5
(6.3) 8, 4, 4, 4, 4, 6, 9, 10, 10, 15, 10, 16 e 10
(6.4) 23, 28, 35, 17, 28, 35, 18, 18, 17, 18, 18, 18, 28, 28 e 18

7. Determinar a mediana dos seguintes conjuntos:


(7.1) {9, 14, 2, 8, 7, 14, 3, 21, 1}
(7.2) {0,02; 0,25; 0,47; 0,01; -0,30; -0.5}
(7.3) {1/2, 3/4, 4/7, 5/4, -2/3, -4/5, -1/5, 3/8}

8. Para os conjuntos abaixo, determinar com aproximao centesimal, as seguintes medidas:


(a) A amplitude (b) O desvio mdio (c) A varincia (d) O desvio-padro (e) O coeficiente de
variao.
(8.1) {0,04; 0,18; 0,45; 1,29; 2,35}
(8.2) {-7/4, -1/3, 3/5, 7/20, 1, 4/3}

9. Dados os seguintes conjuntos de valores:


(a) {1, 3, 7, 9, 10}; (b) {20, 60, 140, 180, 200}; (c) {10, 50, 130, 170, 190}
Calculando a mdia e o desvio-padro do conjunto em (a), determinar, atravs das propriedades,
a mdia e o desvio-padro dos conjuntos em (b) e (c).

10. Quarenta alunos da UFPel foram questionados quanto ao nmero de livros lidos no ano anterior.
Foram registrados os seguintes valores:
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
(10.1) Organize os dados em uma tabela adequada.
(10.2) Qual o percentual de alunos que leram menos do que 3 livros.
(10.3) Qual o percentual de alunos que leram 4 ou mais livros.
(10.4) Classifique a varivel e o tipo de distribuio utilizada.

11. O conjunto de dados abaixo representa uma amostra de 40 elementos:


23
3,67 1,82 3,73 4,10 4,30 1,28 8,14 2,43 4,17 2,88
5,36 3,96 6,54 5,84 7,35 3,63 2,93 2,82 8,45 4,15
5,28 5,41 7,77 4,65 1,88 2,12 4,26 2,78 5,54 6,00
0,90 5,09 4,07 8,67 0,90 6,67 8,96 4,00 2,00 2,01
(11.1) Agrupe os dados em uma distribuio de freqncias, considerando o limite inferior
igual a zero, o superior igual a 10 e utilizando cinco classes de mesma amplitude.
(11.2) Construa um histograma de freqncias relativas.
(11.3) Una os pontos mdios de cada retngulo, obtendo o polgono de freqncias relativas e
classifique o conjunto quanto assimetria.
12. A tabela registra simultaneamente 200 aluguis de imveis urbanos e 100 de imveis rurais.
(12.1) Calcule e interprete fr2 para cada caso.
(12.2) Calcule e interprete F3 para cada caso.
(12.3) Calcule e interprete Fr4 Fr2 para cada caso.
13. O histograma abaixo representa os salrios, em unidades monetrias (u.m.) dos 100 empregados
de uma empresa:
(13.1) Que percentual de empregados recebem 8 u.m. ou mais?
(13.2) Quantos empregados recebem de 4 a 16 u.m.?
(13.3) Quantos empregados recebem menos que 4 u.m. ou mais que 12 u.m.?

Aluguis Zona Urbana Zona Rural


1 | 3 10 30
3 | 5 40 50
5 | 7 80 15
7 | 9 50 05
9 | 11 20 00
Total 200 100

fri/hi

0,09
0,08
0,07
0,06
0,05
0,04
0,03
0,02
0,01

0 4 8 12 16 20 u.m.

14. Um livro com 50 pginas apresentou um nmero de erros de impresso por pgina conforme
tabela:
(14.1) Qual o nmero mdio de erros por pgina?
(14.2) Qual o nmero mediano de erros por pgina?
(14.3) Qual o nmero modal de erros por pgina?

24
(14.4) Qual o desvio-padro do nmero de erros por pgina?
Erros N de pginas
0 25
1 20
2 3
3 1
4 1
Total 50
15. Durante certo perodo de tempo o rendimento de 10 aes foram os que a tabela registra.
(15.1) Calcule o rendimento mdio.
(15.2) Calcule o rendimento mediano.
(15.3) Calcule o rendimento modal.
(15.4) Calcule o desvio padro do rendimento.
(15.5) Calcule o coeficiente de variao do rendimento.
Ao 1 2 3 4 5 6 7 8 9 10
Taxa (%) 2,59 2,64 2,60 2,62 2,57 2,55 2,61 2,50 2,63 2,64
16. Uma regio metropolitana tem 50 quarteires com os seguintes nmeros de casas por
quarteiro:
2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 23 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97
(16.1) Construa, com os dados, uma distribuio de freqncias por intervalos fazendo com que
as classes tenham amplitude igual a 14.
(16.2) Calcule o nmero mdio de casas por quarteiro.
(16.3) Determine o nmero mediano de casas por quarteiro.
(16.4) Calcule a varincia do nmero de casas por quarteiro.
(16.5) Calcule, plos dois processos, o nmero modal de casas por quarteiro.
17. De um levantamento feito entre 100 famlias resultou a tabela ao lado. Determine:
(17.1) O nmero mdio de filhos.
(17.2) O nmero mediano de filhos.
(17.3) O nmero modal de filhos.
(17.4) O desvio-padro do nmero de filhos.
N de filhos 0 1 2 3 4 5 Total
N de famlias 18 23 28 21 7 3 100
18. As informaes abaixo dizem respeito a distribuio de trs variveis. Indique, justificando,
qual delas tem mdia mais representativa.
Distribuio A Distribuio B Distribuio C
n = 200 n = 50 x =8
f i x i = 5000 f i x i = 500 f i x i = 3200
f xi
2
i = 130000 f xi
2
i = 5450 f xi
2
i = 32000

19. Identifique, justificando, qual a varivel mais homognea.

Distribuio A Distribuio B
n = 100 x = 50
25
f xi i = 5000 f x = 10000
i i

f x f (x x) = 7200
2 2
i i = 256400 i i

20. Uma varivel x tem mdia igual a 10 e varincia igual a 16. Calcule a mdia e a varincia da
varivel dada por y = (3x + 5) / 2
21. Uma varivel x tem mdia igual a 5 e desvio-padro igual a 3. Calcule o coeficiente de variao
da varivel y = 4x + 4
22. Uma varivel x tem mdia igual a 6 e coeficiente de variao igual a 0,50. Calcule o coeficiente
de variao da varivel y = (5x 2) / 2
23. Os operrios de um setor industrial tm, em uma poca 1, um salrio mdio de 5 salrios
mnimos (s.m.) e desvio-padro de 2 s.m. Um acordo coletivo prev, para uma poca 2, um
aumento linear de 60%, mais uma parte fixa correspondente a 70% de um salrio mnimo.
Calcule a mdia e o desvio-padro dos salrios na poca 2.
24. Uma varivel x assume valores no intervalo [10; 30].
(23.1) Sabendo que x tem uma distribuio assimtrica positiva voc diria que a mdia de x :
20, menor que 20 ou maior que 20. Justifique.
(23.2) E se x tiver uma distribuio simtrica?
25. O que se pode dizer se fosse dada a informao de que o salrio mediano de um conjunto de
profissionais de 6 s.m.?
26. Um a comunidade A tem 100 motoristas profissionais cujo salrio mdio de 5 s.m. A
comunidade B, com 300 desses profissionais, remunera-os com uma mdia de 4 s.m.
(26.1) correto afirmar que A remunera melhor seus motoristas profissionais que B?
(26.2) Diante das informaes disponveis h garantia que os 100 salrios individuais de A so
maiores que os 300 de B? Por qu?

27. Abaixo voc encontra duas distribuies que refletem os comportamentos de x e y (tamanhos de
famlias) em duas comunidades, sendo que uma de base cultural alem e outra italiana. Utilize
tais informaes para uma anlise que indique qual das duas comunidades tem famlias
maiores.

x f y f
2 25 3 48
3 30 4 51
4 48 5 48
5 111 6 41
6 98 7 32
7 88 8 14
9 6
28. O departamento de pessoal de uma certa firma fez um levantamento dos salrios dos 120
funcionrios do setor administrativo, obtendo os resultados da tabela:
(28.1) Determine o salrio mdio dos funcionrios
(28.2) Determinar a varincia e o desvio-padro dos salrios.
(28.3) Determinar o salrio mediano.
(28.4) Determinar o salrio modal plos critrios de King e Kzuber.
(28.5) Se for dado um aumento de 20% para todos os funcionrios, qual ser o novo salrio
mdio e o novo desvio-padro dos salrios?

26
(28.6) Se for dado um abono de 0,5 s.m. a todos os funcionrios como fica a mdia e o desvio-
padro dos salrios?

Faixa salarial (s.m.) % de funcionrios


1 | 3 0,25
3 | 5 0,40
5 | 7 0,20
7 | 10 0,15
Total 1,00
29. O que acontece com a mdia e o desvio padro de um conjunto de dados quando:
(29.1) Cada valor multiplicado por 2.
(29.2) Soma-se o valor 10 a cada valor.
(29.3) Subtrai-se a mdia de cada valor.
(29.4) De cada valor subtrai-se a mdia e em seguida divide-se pelo desvio-padro
30. A mdia aritmtica entre dois valores igual a 5 e a mdia geomtrica igual a 4. Qual a mdia
harmnica entre estes dois valores?

27
5. RESPOSTAS DOS EXERCCIOS
1. Ms (qualitativa ordinal); Tipo de produto (qualitativa nominal); Vendedor (qualitativa nominal);
Regio do pas (qualitativa ordinal); Unidades vendidas (quantitativa discreta); Total de vendas
(quantitativa contnua).
2. No, pois a soma dos desvios diferente de zero.
3. No, pois o clculo deve ser realizado atravs da mdia ponderada e no da mdia aritmtica
simples.
4. 60,50
5. 55
6. (6.1) Amodal; (6.2) 5; (6.3) 4 e 10; (6.4) 18
7. (7.1) 8; (7.2) 0,02; (7.3) 7/l6
8. (8.1) (a) 2,31; (b) 0,77; (c) 0,74; (d) 0,86; (e) 99,90%
(8.2) (a) 37/12 = 3,08; (b) 149/180 = 0,83; (c) 1,03; (d) 1,02; (e) 508,01 %
9. Observe que o conjunto em (b) igual ao conjunto em (a) multiplicado por 20 e o conjunto em
(c) igual ao conjunto em (a) multiplicado por 20 e subtrado de 10 unidades.
10. (10.1)
N de livros 0 1 2 3 4 5 6 8 Total
N de alunos 7 9 8 7 4 2 2 1 40
(10.2) 24/40 = 60%
(10.3) 9/40 = 22,5%
(10.4) Distribuio por ponto ou valores

11. (11.1)
Varivel Freqncias fi/hi fri fri/hi
0 | 2 5 2,5 0,125 0,0625
2 | 4 12 6 0,3 0,15
4 | 6 14 7 0,35 0,175
6 | 8 5 2,5 0,125 0,0625
8 | 10 4 2 0,1 0,05
Total 40 20 1,0 ----

(11.2)

28
(11.3) Assimtrica positiva

12. (12.1) Zona urbana: fr2 = 0,20 20% dos aluguis observados esto entre 3 e 5.
Zona rural: fr2 = 0,50 50% dos aluguis investigados ente entre 3 e 5.
(12.2) Zona urbana: F3 = 130 130 aluguis investigados so menores do que 7.
Zona rural: F3 = 95 95 aluguis investigados so menores do que 7.
(12.3) Zona urbana: Fr4 - Fr2 = 0,90 - 0,25 = 0,65 = 65% dos aluguis esto entre 5 e 9.
Zona rural: Fr4 - Fr2 = 1,00 - 0,80 = 0,20 = 20% dos aluguis esto entre 5 e 9.
13. (13.1) 64%; (13.2) 76; (13.3) 56
14. (14.1) 0,66 erro; (14.2) 0,50 erro; (14.3) Zero erro; (14.4) 0,84 erro
15. (15.1) 2,60%; (15.2) 2,60%; (15.3) 2,64%; (15.4) 0,04%; (15.5) 1,63%
16. (16.1)
N de casas por quarteiro N de quarteires
02 | 16 8
16 | 30 16
30 | 44 4
44 | 58 6
58 | 72 9
72 | 86 3
86 | 100 4
Total 50
(16.2) 41,76 casas; (16.3) 33,50 casas; (16.4) 686,86 casas; (16.5) 20,67 e 21,60 casas
17. (17.1) 1,85 filhos; (17.2) 2 filhos; (17.3) 2 filhos; (17.4) 1,30 filhos
18. a varivel A cujo coeficiente de variao 0,20, o menor dentre as 3.
19. a varivel B cujo coeficiente de variao 0,12, o menor dentre as 2.
20. x = 17,50; s 2 = 36
21. g = 50%
22. g = 0,5357 = 53,57%
23. x = 8,70 s.m.; s = 3,20 s.m.
24. (24.1) Deve ser maior que 20.
(24.2) Seria 20, pois 20 o centro da distribuio.
25. Que 50% dos profissionais recebem at 6 s.m.
26. (26.1) Sim, em mdia.
(26.2) No.

29
27. A comparao pretendida deve ser feita pelas mdias. As famlias de base cultural alem tm,
em mdia, 5,23 membros, enquanto que as de base italiana tm 5,10. Ento as de base alem
tm o hbito de ter famlias maiores.
28. (28.1) 4,58 s.m.
(28.2) 4,51 e 2,12 s.m.
(28.3) 4,25 s.m.
(28.4) 3,89 s.m. e 3,86 s.m.
(28.5) 5,49 e 2,55 s.m.
(28.6) 5,08 e 2,12 s.m.
29. (29.1) A mdia e o desvio-padro ficam multiplicados por 2.
(29.2) A mdia fica somada de 10 e o desvio-padro no se altera.
(29.3) A mdia fica igual a zero e o desvio-padro no se altera.
(29.4) A mdia fica igual a zero e o desvio-padro fica igual a um.
30. 3,2

30