Anda di halaman 1dari 157

ESTATSTICA BSICA

Professor: Narcelio de Arajo Pereira


narcelioap@yahoo.com.br

2014
SUMRIO

INTRODUO ............................................................................................ 03

UNIDADE 1: A NATUREZA DA ESTATSTICA ................................... 05

UNIDADE 2: POPULAO E AMOSTRA ............................................. 12

UNIDADE 3: SRIES ESTATSTICAS.................................................... 20

UNIDADE 4: GRFICOS ........................................................................... 32

UNIDADE 5: DISTRIBUIO DE FREQUENCIA ................................ 45

UNIDADE 6: MEDIDAS DE POSIO ................................................... 64

UNIDADE 7: MEDIDAS DE DISPERSO OU VARIABILIDADE....... 92

UNIDADE 8: PROBABILIDADE ............................................................ 105

UNIDADE 9: DISTRIBUIO BINOMIAL E NORMAL ................... 116

UNIDADE 10: CORRELAO E REGRESSO .................................. 139

REFERENCIAS ......................................................................................... 154

ANEXOS ..................................................................................................... 155

2
INTRODUO

Na antiguidade os povos j registravam o nmero de habitantes, nascimentos,


bitos. Faziam "estatsticas". Na idade mdia as informaes eram tabuladas
com finalidades tributrias e blicas.
No sculo XVI surgem as primeiras anlises sistemticas, as primeiras tabelas
e os nmeros relativos.
No sculo XVIII a estatstica com feio cientfica batizada por
GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as
primeiras representaes grficas e os clculos de probabilidades. A estatstica
deixa de ser uma simples tabulao de dados numricos para se tornar "O
estudo de como se chegar a concluso sobre uma populao, partindo da
observao de partes dessa populao (amostra)".
Ao longo do sculo XX, os mtodos estatsticos foram desenvolvidos como
uma mistura de cincia, tecnologia e lgica para a soluo e investigao de
problemas em vrias reas do conhecimento humano (Stigler, 1986). Ela foi
reconhecida como um campo da cincia neste perodo, mas sua histria tem
incio bem anterior a 1900.

A estatstica moderna uma tecnologia quantitativa para a cincia


experimental e observacional que permite avaliar e estudar as incertezas e os
seus efeitos no planejamento e interpretao de experincias e de observaes
de fenmenos da natureza e da sociedade.

A estatstica no uma caixa-preta, nem bola de cristal, nem mgica.


Tampouco um conjunto de tcnicas teis para algumas reas isoladas ou
restritas da cincia. Por exemplo, ao contrrio do que alguns imaginam, a
estatstica no um ramo da matemtica onde se investigam os processos de
obteno, organizao e anlise de dados sobre uma determinada populao.
A estatstica tambm no se limita a um conjunto de elementos numricos
relativos a um fato social, nem a nmeros, tabelas e grficos usados para o
resumo, organizao e apresentao dos dados de uma pesquisa, embora este
seja um aspecto da estatstica que pode ser facilmente percebido no cotidiano
(basta abrir os jornais e revistas para ver o "bombardeio" de estatsticas). Ela
uma cincia multidisciplinar: um mesmo programa de computador que
permite a anlise estatstica de dados de um fsico poderia tambm ser usado
por um economista, agrnomo, qumico, gelogo, matemtico, bilogo,
socilogo, psiclogo e cientista poltico. Mesmo que as interpretaes dessas
anlises sejam diferentes por causa das diferenas entre as reas do

3
conhecimento, os conceitos empregados, as limitaes das tcnicas e as
consequncias dessas interpretaes so essencialmente as mesmas.

Segundo Rao (1999), a estatstica uma cincia que estuda e pesquisa sobre: o
levantamento de dados com a mxima quantidade de informao possvel para
um dado custo; o processamento de dados para a quantificao da quantidade
de incerteza existente na resposta para um determinado problema; a tomada de
decises sob condies de incerteza, sob o menor risco possvel. Finalmente, a
estatstica tem sido utilizada na pesquisa cientfica, para a otimizao de
recursos econmicos, para o aumento da qualidade e produtividade, na
otimizao em anlise de decises, em questes judiciais, previses e em
muitas outras reas.

4
I - A NATUREZA DA ESTATSTICA

PANORAMA HISTRICO

Todas as cincias tm suas razes na histria do homem.


A Matemtica, que considerada a cincia que une clareza do raciocnio a
sntese da linguagem, originou-se do convvio social, das trocas, da
contagem, com carter prtico, utilitrio, emprico.
A estatstica, ramo da matemtica aplicada, teve origem semelhante.
Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de
nascimentos, de bitos, faziam estimativas das riquezas individual e social,
distriburam equitativamente terras ao povo, cobravam impostos e realizavam
inquritos quantitativos por processos que, hoje, chamaramos de
"estatsticas".
Na idade mdia colhiam-se informaes, geralmente com finalidades
tributrias ou blicas.
A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas
de fatos sociais, como batizados, casamentos, funerais, originando as
primeiras tbuas e tabelas e os primeiros nmeros relativos.
No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio
verdadeiramente cientfica. Godofredo Achenwall batizou a nova cincia (ou
mtodo) com o nome de Estatstica, determinando o seu objetivo com as
cincias.
As tabelas tornam-se mais completas, surgiram as representaes grficas e o
clculo das probabilidades, e a estatstica deixa de ser uma simples
catalogao de dados numricos para se tornar o estudo de como se chegar a
concluso sobre uma populao, partindo da observao de partes dessa
populao (amostra).
Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois
extremos divergentes e igualmente errneos quanto a validade das concluses
estatsticas: ou cr em sua infalibilidade ou afirma que elas nada provam. Os
que assim pensam ignoram os objetivos, o campo e o rigor do mtodo
estatstico; ignoram a Estatstica, quer terica quer prtica, ou a conhecem
muito superficialmente.
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e,
com seus processos e tcnicas, tm contribudo para a organizao dos
negcios e recursos do mundo moderno.

5
MTODO ESTATSTICO

O Mtodo Cientfico

Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso
e, outros, por necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e
do estudo. Se bem que muito desse conhecimento possa ter sido observado
inicialmente por acaso, a verdade que desenvolvemos processos cientficos
para seu estudo e para adquirirmos tais conhecimentos. Podemos ento dizer
que:

Mtodo: um conjunto de meios dispostos convenientemente para se


chegar a um fim que se deseja, ou seja, um meio mais eficaz para
atingir determinada meta.

Dos mtodos cientficos, vamos destacar o Mtodo experimental e o Mtodo


estatstico.
O Mtodo Experimental - o mtodo preferido pela fsica, Qumica, etc.

Mtodo experimental: consiste em manter constantes todas as causas


(fatores), menos uma, e variar esta causa de modo que o pesquisador
possa descobrir seus efeitos, caso existam.

O Mtodo Estatstico

Muitas vezes temos necessidade de descobrir fatos em um campo em que o


mtodo experimental no se aplica (nas cincias sociais), j que os vrios
fatores que afetam o fenmeno em estudo no podem permanecer constantes
enquanto fazemos variar a causa que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinao das causas que definem o preo
de uma mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer
variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu
preo.
Contudo, seria necessrio que no houvesse alterao nos outros fatores.
Assim, deveria existir, no momento da pesquisa, uma uniformidade dos
salrios, o gosto dos consumidores deveria permanecer constante, seria
necessria a fixao do nvel geral dos preos das outras necessidades etc.
Mas isso tudo impossvel.

6
Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos
preciso, denominado mtodo estatstico.

Mtodo estatstico: diante da impossibilidade de manter as causas


constantes, admitem todas essas causas presentes variando-as,
registrando essas variaes e procurando determinar, no resultado final,
que influncias cabem a cada uma delas.

A ESTATSTICA

Exprimindo por meio de nmeros as observaes que se fazem de elementos


com, pelo menos, uma caracterstica comum (por exemplo: os alunos do sexo
masculino de uma comunidade), obtemos os chamados dados referentes a
esses elementos.
Podemos dizer, ento, que:
A Estatstica uma parte da matemtica aplicada que fornece mtodos para a
coleta, organizao, descrio, anlise e interpretao de dados e para a
utilizao dos mesmos na tomada de decises.

A Estatstica Descritiva se encarrega de fazer a coleta, organizao e


descrio dos dados.

A Estatstica Indutiva ou Inferencial se encarrega de fazer a anlise e


interpretao dos dados.

Em geral, as pessoas, quando se referem ao termo estatstica, o fazem no


sentido da organizao e descrio dos dados (estatstica do Ministrio da
educao, estatsticas dos acidentes de trfego etc.), desconhecendo que o
aspecto essencial da Estatstica o de proporcionar mtodos inferenciais,
que permitam concluses que transcendam os dados obtidos inicialmente.
Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o
diagnstico de uma empresa (por exemplo, de uma escola), o conhecimento de
seus problemas (condies de funcionamento, produtividade), a formulao de
solues apropriadas e um planejamento objetivo de ao.

7
Fases do Mtodo estatstico:

Podemos distinguir no mtodo estatstico as seguintes fases:

1 Coleta de Dados

Aps cuidadoso planejamento e a devida determinao das caractersticas


mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos
incio coleta dos dados numricos necessrios sua descrio.

A coleta de dados pode ser direta ou indireta.

1.1 Direta:

Quando ela feita sobre elementos informativos de registro obrigatrio


(nascimentos, casamentos e bitos, importao e exportao de mercadorias),
elementos pertinentes aos pronturios dos alunos de uma escola ou, ainda,
quando os dados so coletados pelo prprio pesquisador atravs de inquritos
e questionrios, como o caso das notas de verificao e de exames, do censo
demogrfico, etc.

A coleta direta de dados pode ser classificada relativamente ao fator tempo


em:

Contnua (registro): quando feita continuamente, tal como a de


nascimentos, bitos e a frequncia dos alunos s aulas;
Peridica: quando feita em intervalos constantes de tempo, como os
censos (de 10 em 10 anos) e as avaliaes peridicas; recenseamento
demogrfico, censo industrial;
Ocasional: quando feita extemporaneamente, a fim de atender a uma
conjuntura ou a uma emergncia, como no caso de epidemias que
assolam ou dizimam rebanhos inteiros.

1.2 Indireta:

Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento


de outros fenmenos relacionados com o fenmeno estudado. Como por
exemplo, podemos citar a pesquisa sobre mortalidade infantil, que feita
atravs de dados colhidos por uma coleta direta.

8
2 Crtica dos Dados

Obtidos os dados, eles devem ser cuidadosamente criticados, procura de


possveis falhas e imperfeies, a fim de no incorrermos em erros grosseiros
ou de certo vulto, que possam influir sensivelmente nos resultados.

A crtica dos dados se divide em: externa e interna

Crtica externa quando visa s causas dos erros por parte do


informante, por distrao ou m interpretao das perguntas que lhe
foram feitas.

Crtica interna quando visa observar os elementos originais dos dados


da coleta.

3 Apurao dos Dados

Nada mais do que a soma e o processamento dos dados obtidos e a


disposio mediante critrios de classificao. Resumo dos dados atravs de
sua contagem e agrupamento. a condensao e tabulao de dados. Pode ser
manual, eletromecnica ou eletrnica.

4 Exposio ou Apresentao dos Dados

Por mais diversa que seja a finalidade que se tenha em vista, os dados devem
ser apresentados sob forma de tabelas (unidade 3) e grficos (unidade 4), pois
tornam mais fcil o exame daquilo que est sendo objeto de tratamento
estatstico e ulterior obteno de medidas de posio (unidade 6) e medidas de
disperso (unidade 7).

5 Anlise dos Resultados

Como j dissemos, o objetivo ltimo da estatstica tirar concluses sobre o


todo (populao) a partir de informaes fornecidas por parte representativa
do todo (amostra). Assim, realizadas as etapas anteriores (estatstica
descritiva), fazemos uma anlise dos resultados obtidos, atravs dos mtodos
da Estatstica Indutiva ou Inferencial, que tem por base a induo ou
inferncia, e tiramos desses resultados concluses e previses.

9
A ESTATSTICA NAS EMPRESAS

No mundo atual, a empresa uma das vigas-mestras da economia dos povos.


A direo de uma empresa, de qualquer tipo, incluindo as estatais e
governamentais, exige de seu administrador a importante tarefa de tomar
decises, e o conhecimento e o uso da estatstica facilitaro seu trplice
trabalho de organizar, dirigir e controlar a empresa.

Por meio de sondagem, de coleta de dados e de recenseamento de opinies,


podemos conhecer a realidade geogrfica e social, os recursos naturais,
humanos e financeiros disponveis, as expectativas da comunidade sobre a
empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de
serem alcanados a curto, mdio ou longo prazo.

A estatstica ajudar em tal trabalho, como tambm na seleo e organizao


da estratgia a ser adotada no empreendimento e, ainda, na escolha das
tcnicas de verificao e avaliao da quantidade e da qualidade do produto e
mesmo dos possveis lucros e/ou perdas.

Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado


para evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e
do material e, ainda, para controle eficiente do trabalho.

O esquema do planejamento o plano, que pode ser resumido, com auxlio da


estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos
clculos matemtico-estatsticos que lhes deram origens.

O homem de hoje, em suas mltiplas atividades, lana mo de processos e


tcnicas estatsticas, e s estudando-os evitaremos o erro das generalizaes
apressadas a respeito de tabelas e grficos apresentados em jornais, revistas e
televiso, frequentemente cometido quando se conhece apenas por cima um
pouco de Estatstica.

10
EXERCCIOS

1. Complete:
O mtodo experimental o mais usado por cincias como: _______________.

2. As cincias humanas e sociais, para obter os dados que buscam, lanam


mo de que mtodo?

3. O que Estatstica?

4. Cite as fases do mtodo estatstico.

5. Para voc, o que coletar dados?

6. Para que serve a crtica dos dados?

7. O que apurar dados?

8. Como podem ser apresentados ou expostos os dados?

9. As concluses, as inferncias pertencem a que parte da Estatstica?

10. Cite trs ou mais atividades do planejamento empresarial em que a


Estatstica se faz necessria.

11. O mtodo estatstico tem como um de seus fins:

a) Estudar os fenmenos estatsticos.


b) Estudar qualidades concretas dos indivduos que formam grupos.
c) Determinar qualidades abstratas dos indivduos que formam grupos.
d) Determinar qualidades abstratas de grupos de indivduos.
e) Estudar fenmenos numricos.

11
II POPULAO E AMOSTRA

1 VARIVEL

A cada fenmeno corresponde um nmero de resultados possveis. Assim, por


exemplo:
- para um fenmeno sexo so dois os resultados possveis:
masculino e feminino;
- para o fenmeno nmero de filhos h um nmero de
resultados possveis expressos atravs dos nmeros naturais: 0,1,2,3,....,n;
- para o fenmeno estatura temos uma situao diferente, pois
os resultados podem tomar um nmero infinito de valores numricos dentro de
um determinado intervalo.

Varivel: , convencionalmente, o conjunto de resultados possveis de


um fenmeno.

Uma varivel pode ser: qualitativa ou quantitativa

Qualitativa: quando seus valores so expressos por atributos; ex.: sexo


(masculino ou feminino), cor da pele (branca, preta, amarela, vermelha,
parda) etc.;

Quantitativa: quando seus valores so expressos em nmeros; ex.:


salrios dos operrios, idade, altura, etc. Divide-se em discreta e
contnua:

Discreta ou descontnua: seus valores so expressos geralmente


atravs de nmeros inteiros no negativos. Resulta normalmente
de contagens.
Ex.: nmero de alunos de uma escola que pode assumir qualquer
um dos valores do conjunto N = {1, 2, 3, ..., 58,...}, mas nunca
valores como 2,5 ou 3,78 ou 4,325 etc.

Contnua: resulta normalmente de uma mensurao, e a escala


numrica de seus possveis valores corresponde ao conjunto R
dos nmeros reais, ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites. Ex.: peso dos alunos de uma
escola, pois um aluno tanto pode pesar 72 kg, como 72,5 kg,
como 72,54 kg, dependendo da preciso da medida.

12
De modo geral, as medies do origem a variveis contnuas e as contagens
ou enumeraes, a variveis discretas.

Designamos as variveis por letras latinas, em geral, as ltimas: x, y, z.

Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possveis de um dado


fenmeno. Fazendo uso da letra x para indicar a varivel relativa ao fenmeno
considerado, temos:
x {2, 3, 5, 8}

Exerccio resolvido:

1. Classifique as variveis em qualitativas e quantitativas (contnuas ou


discretas):
a) Cor dos olhos Qualitativa
b) ndice de liquidez nas indstrias Cearenses Quantitativa contnua
c) Produo de caf no Brasil Quantitativa contnua
d) Nmero de defeitos em aparelhos de TV Quantitativa discreta
e) Comprimento dos pregos produzidos por uma empresa Quantitativa
contnua
f) O ponto obtido em cada jogada de um dado quantitativa discreta

Resolva:

1. Classifique as variveis em qualitativas e quantitativas (contnuas ou


discretas):
a) Cor dos cabelos
b) Nmero de filhos
c) Nmero de peas produzidas por hora
d) Dimetro de uma pea
e) Nmero de volumes de uma biblioteca
f) produo de algodo em um ano

2 POPULAO E AMOSTRA

Dois conceitos devem estar bem claros: o de populao e o de amostra, pois


deles que so extrados os dados que do origem s diversas relaes
estatsticas, como a mdia, o desvio-padro, etc., e que, em ltima anlise,
possibilitam descreve-las sob os mais diversos aspectos.

13
Populao: coleo completa de todos os elementos que so objeto de um
estudo; conjunto de entes portadores de, pelo menos, uma caracterstica
comum. A populao estatstica tambm conhecida como universo
estatstico.
Exemplo: pessoas que possuem automvel.

Amostras: so subconjuntos finitos representativos de uma dada populao.


Exemplo: pessoas que possuem automvel da marca Fiat.

Censo: exame de todos os elementos da populao.

A amostra deve ser representativa da populao da qual foi extrada, ser


parecida com ela (quantitativa e quantitativamente), devendo obedecer a dois
princpios bsicos:

Deve ser suficientemente grande;


Seus constituintes devem ter sido selecionados ao acaso.

3 AMOSTRAGEM

Conceito: uma tcnica especial para recolher amostras que garante,


tanto quanto possvel, o acaso na escolha.

Dessa forma, cada elemento da populao passa a ter a mesma chance de ser
escolhido, o que garante amostra o carter de representatividade, e isto
muito importante, pois, como vimos, nossas concluses relativas populao
vo estar baseadas nos resultados obtidos nas amostras dessa populao.

Daremos, a seguir, trs das principais tcnicas de amostragem.

3.1 Amostragem casual ou aleatria simples

Esta tcnica de amostragem equivalente a um sorteio lotrico:


Na prtica, a amostragem casual ou aleatria simples pode ser realizada
numerando-se a populao de 1 a n e sorteando-se, a seguir, por meio de um
dispositivo aleatrio qualquer, K nmeros dessa sequncia, os quais
correspondero aos elementos pertencentes amostra.

Exemplo: Vamos obter uma amostra representativa para a pesquisa da estatura


de noventa alunos de uma escola:

14
Numeramos os alunos de 01 a 90 (populao);
Colocamos os noventa nmeros, em pedaos iguais de um mesmo
papel, dentro de uma caixa. Agitamos sempre a caixa para misturar bem
os pedaos de papel e retiramos, um a um, 9 nmeros que representaro
a amostra. Neste caso, 10% desta populao.

Quando o nmero de elementos da amostra grande, esse tipo de sorteio


torna-se muito trabalhoso. A fim de facilit-lo, foi elaborada uma tabela
Tabela de Nmeros Aleatrios -, construda de modo que os dez algarismos
(de 0 a 9) so distribudos ao acaso nas linhas e colunas (ver anexo).
Para obtermos os elementos da amostra usando a tabela, sorteamos um
algarismo qualquer da mesma, a partir do qual iremos considerar nmeros de
dois, trs ou mais algarismos, conforme nossa necessidade. Os nmeros assim
obtidos iro indicar os elementos da amostra.
A leitura da tabela pode ser feita horizontalmente (da direita para esquerda ou
vice versa), verticalmente (de cima para baixo ou vice versa), diagonalmente
(no sentido ascendente ou descendente) ou formando o desenho de uma letra
qualquer. A opo, porm, deve ser feita antes de iniciado o processo.
Assim, para o nosso exemplo, considerando a 18 linha, tomamos os nmeros
de dois algarismos (tantos algarismos quantos formam o maior nmero da
populao), obtendo:
61 02 01 81 73 92 60 66 73 58 53 34

Evidentemente, o numeral 92 ser desprezado, pois no consta da populao,


como ser tambm abandonado um numeral que j tenha aparecido. Temos,
ento:
61 02 01 81 73 60 66 58 53

Medindo as alturas dos alunos correspondentes aos nmeros sorteados,


obteremos uma amostra das estaturas dos noventa alunos.

3.2 Amostragem proporcional estratificada

Muitas vezes a populao se divide em subpopulaes estratos

Como provvel, que a varivel em estudo apresente, de estrato em estrato,


um comportamento heterogneo e, dentro de cada estrato, um comportamento
homogneo, convm que o sorteio dos elementos da amostra leve em
considerao tais estratos.

15
exatamente isso que fazemos quando empregamos a amostragem
proporcional estratificada, que, alm de considerar a existncia de estratos,
obtm elementos da amostra proporcional ao nmero de elementos desses
estratos.

Exemplo: Vamos obter uma amostra proporcional estratificada, de 10 % do


exemplo anterior, supondo que dos 90 alunos, temos 54 meninos e 36
meninas.
So, portanto dois estratos, (sexo masculino e sexo feminino). Temos:
a)
SEXO POPULAO 10 % AMOSTRA
10 x 54 = 5,4
MASCULINO 54 5
100
10 x 36 = 3,6
FEMININO 36 4
100
10 x 90 = 9
TOTAL 90 9
100

b) Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem


meninos e de 55 a 90, meninas. Tomando na Tabela de Nmeros
Aleatrios a primeira e a segunda colunas da esquerda, de cima para
baixo, obtemos os seguintes nmeros:

57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Temos ento;
28 22 53 18 03 para os meninos;
57 90 80 56 para as meninas.

Resolva:

1. Pesquise o peso de seus colegas de classe (incluindo o seu) e retire uma


amostra de 30% da populao.
Sugesto: Use a tabela de Tabela de Nmeros Aleatrios (5 e 6 colunas, de
baixo para cima).

2. Pesquise a estatura de seus colegas de classe (incluindo o seu) e retire uma


amostra de 15% da populao.
Sugesto: Use a tabela de Tabela de Nmeros Aleatrios (25 linha, da
esquerda para a direita).

16
3 Em uma escola existem 250 alunos, sendo 35 na 1 srie, 32 na 2, 30 na
3, 28 na 4, 35 na 5, 32 na 6, 31 na 7 e 27 na 8. Obtenha uma amostra de 40
alunos e preencha o quadro a seguir.

3.3 Amostragem sistemtica

Quando os elementos da populao j se acham ordenados, no h


necessidade de construir o sistema de referncia. So exemplos os pronturios
mdicos de um hospital, os nmeros de uma rua, uma linha de produo, etc.
Nestes casos, a seleo dos elementos que constituiro a amostra pode ser
feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem
denominamos sistemtica.

Assim, no caso de uma linha de produo, podemos, a cada dez itens


produzidos, retirar um para pertencer a uma amostra da produo diria. Neste
caso, estaramos fixando o tamanho da amostra em 10% da populao.

Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma
amostra formada por 20 casas para uma pesquisa de opinio.
Neste caso, podemos usar o seguinte procedimento:

Como 500/20 = 25, escolhemos por sorteio casual um nmero de 01 a


25;
Este nmero indicar a primeira casa da amostra, vamos supor a casa de
nmero 6;
Os demais elementos da amostra seriam considerados de 25 em 25;
Assim, as demais casas da amostra seriam as casas de nmeros 31
(6+25), 56 (31+25), 81 (56+25), etc.

17
EXERCCIOS

1 Uma escola abriga 124 alunos. Obtenha uma amostra representativa


correspondendo a 15% da populao.
Sugesto: Use a 8, 9 e 10 colunas, a partir da 1 linha, da Tabela de
Nmeros Aleatrios (de cima para baixo).

2 Em uma escola h oitenta alunos. Obtenha uma amostra de doze alunos.


Sugesto: Use a Tabela de Nmeros Aleatrios (escolha a linha e a coluna).

3 Identifique o tipo de amostragem utilizada em cada situao: simples ao


acaso, sistemtica ou estratificada.
a) Dentre 240 pessoas escaladas para um sorteio de jri, 120 so brancas, 80
so negras e 40 so morenas.
b) Um administrador hospitalar faz uma pesquisa com as pessoas que esto na
fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a
cada 10 pessoas da fila.
c) O sorteio de um livro dentre os 40 alunos de Estatstica de uma turma do
IFCE.

4 Uma empresa tem 3.414 colaboradores repartidos nos seguintes


departamentos: Administrao (914), Transporte (348), Produo (1401) e
Outros (751). Deseja-se extrair uma amostra entre os colaboradores para
verificar o grau de satisfao em relao qualidade da refeio servida no
refeitrio. Retire uma amostra de:
a) 10% colaboradores?
b) 854 colaboradores desta empresa.

5 O diretor de uma escola, na qual esto matriculados 280 meninos e 320


meninas, desejoso de conhecer as condies de vida extraescolar de seus
alunos e no dispondo de tempo para entrevistar todas as famlias, resolveu
fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha,
para esse diretor, os elementos componentes da amostra.

6 Mostre como seria possvel retirar uma amostra de 32 elementos de uma


populao ordenada por 2432 elementos. Na ordenao geral, qual dos
elementos abaixo seria escolhido para pertencer amostra, sabendo-se que o
elemento de ordem 1420 a ela pertence?
1648; 290; 725; 2025; 1120.

18
7 Uma populao se encontra dividida em quatro estratos, com tamanhos
N1 90 , N 2 120 , N 3 60 e N 4 480 . Ao se realizar uma amostragem
estratificada proporcional, doze elementos da amostra foram retirados do
primeiro estrato. Qual o nmero de elementos da amostra de cada estrato?

8 Uma cidade X apresenta o seguinte quadro relativo s suas escolas de


ensino fundamental:

N DE ESTUDANTES
ESCOLAS
MASCULINO FEMININO
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 876 955

Obtenha uma amostra proporcional estratificada de 120 estudantes.

19
III - SRIES ESTATSTICAS

TABELAS

Um dos objetivos da estatstica sintetizar os valores que uma ou mais


variveis podem assumir, para que tenhamos uma viso global da variao
dessa ou dessas variveis. Depois dos dados organizados, faz-se necessrio
que essas informaes sejam apresentadas em formato de tabelas, pois iro
nos fornecer rpidas e seguras informaes a respeito das variveis em estudo,
permitindo-nos determinaes administrativas e pedaggicas mais coerentes e
cientficas.
TABELA: um quadro que resume um conjunto de dados dispostos
segundo linhas e colunas de maneira sistemtica.
Uma tabela compe-se de: corpo, cabealho, coluna indicadora, linhas, casa
ou clula e ttulo. Deste modo, uma tabela deve apresentar o seguinte esquema
de representao:
1. Corpo: conjunto de linhas e colunas que contm informaes
sobre a varivel em estudo;
2. Cabealho: parte superior da tabela que especifica o contedo
das colunas;
3. Coluna indicadora: parte da tabela que especifica o contedo
das linhas;
4. Linhas: retas imaginrias que facilitam a leitura, no sentido
horizontal, de dados que se inscrevem nos seus cruzamentos com
as colunas;
5. Casa ou clula: cruzamento de uma coluna com uma linha,
destinado a um s nmero (nunca deve ficar em branco);
6. Ttulo: designao do fato observado, local e poca, localizado
no topo da tabela.
H ainda que se considerar os elementos complementares, que so a fonte, as
notas e as chamadas, colocadas, de preferncia, no seu rodap.
Rodap: espao reservado, em seguida ao fecho da tabela, para insero de
notas de natureza informativa;

20
Fonte: entidade responsvel pelo levantamento dos dados ou pela elaborao
da tabela;
Notas: so informaes de natureza geral, destinada a conceituar ou esclarecer
o contedo das tabelas, ou indicar a metodologia adotada;
Chamadas: informaes de natureza especfica sobre determinada parte da
tabela, destinada a conceituar ou esclarecer dados.

De acordo com as normas da Fundao IBGE, nas casas ou clulas da tabela


devemos colocar:
Um trao horizontal (-) quando o valor zero, no s quanto natureza
das coisas, como quanto ao resultado do inqurito;
Trs pontos (...) quando no temos a informao;
Zero (0) quando o valor muito pequeno para ser expresso pela
unidade utilizada. Se os valores so expressos em numerais decimais,
precisamos acrescentar parte decimal um nmero correspondente de
zeros (0,0; 0,00; 0,000; .....);
Um ponto de interrogao (?) quando temos dvida quanto exatido
de determinado valor.
Obs.: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.

21
Ex.: Levantamento Epidemiolgico no Estado do Rio de Janeiro 2010

Especificao N de Casos N de bitos


Sarampo (1) 115 15
Varola ... 10
Clera - -
Meningite 35 5
Total 150 30
Fonte: Departamento Nacional de Endemias Rurais
Nota: As atividades da campanha de vacinao abrangeram as reas de maior
incidncia.
(1) inclusive a rea urbana.

SRIES ESTATSTICAS
Denominamos sries estatsticas toda tabela que apresenta a distribuio de
um conjunto de dados estatsticos em funo da poca, do local ou da espcie.
Da, podemos inferir que numa srie estatstica observamos a existncia de
trs elementos ou fatores: o tempo, o espao e a espcie.
Dividem-se em sries homgradas e conjugadas.
Sries Homgradas: so aquelas em que a varivel descrita apresenta
variao discreta ou descontnua. Podem ser do tipo temporal,
geogrfica ou especfica.
a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O
local e a espcie (fenmeno) so elementos fixos. Esta srie tambm
chamada de histrica, cronolgica, marcha ou evolutiva.
Frango Preos Mdios em So Paulo 2003 a 2008
ANOS PREO (R$)
2003 2,56
2004 2,64
2005 2,67
2006 2,53
2007 3,20
2008 3,64

22
b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A
poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial,
territorial ou de localizao.
Durao Mdia dos Estudos Superiores - 1994
PASES N DE ANOS
Itlia 7,5
Alemanha 7,0
Frana 7,0
Holanda 5,9
Inglaterra Menos de 4
Fonte: Revista Veja.
c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm
chamada de srie categrica.
Rebanhos Brasileiros - 2006
ESPCIES QUANTIDADE
Bovinos 205.886.244
Bubalinos 1.156.870
Aves 821.541.630
Sunos 35.173.824
Ovinos 16.019.170
Caprinos 10.401.449
Fonte: IBGE.

Sries conjugadas: Tambm chamadas de tabelas de dupla entrada. So


apropriadas apresentao de duas ou mais sries de maneira
conjugada, havendo duas ordens de classificao: uma horizontal e
outra vertical. O exemplo abaixo de uma srie geogrfico-temporal.
Terminais Telefnicos em Servio
1991 - 93
FILIAIS 1991 1992 1993
Norte 342.938 375.658 403.494
Nordeste 1.287.813 1.379.101 1.486.649
Sudeste 6.234.501 6.729.467 7.231.634
Sul 1.497.315 1.608.989 1.746.232
Centro-Oeste 713.357 778.925 884.822
Fonte: Ministrio das Comunicaes.

23
Resolva:

1 Classifique as sries

24
2 Procure exemplos de sries estatsticas em jornais e revistas e copie-os,
classificando essas sries.

3 - Considere a srie abaixo:


Vendas de Automveis no 1 bimestre de 2009 em So Paulo
VENDAS
MARCA
(mil und.)
FIAT 17
VW 23
GM 12
TOTAL 52
a) Classifique a srie;
b) Represente esta srie atravs de grfico de setores.
4 Considere a srie abaixo:
Vendas no Ano de 2008 (em mil unidades)
FILIAIS JAN FEV MAR
SO PAULO 10 15 7
FORTALEZA 8 5 4
RIO DE JANEIRO 12 13 10
TOTAL 30 33 21
a) Classifique a srie;
b) Represente esta srie atravs de grfico de colunas;
c) Represente esta srie atravs de grfico de barras;
5 Verificou-se, em 1993, o seguinte movimento de importao de
mercadorias: 14.839.804 t, oriundas da Arbia Saudita, no valor de US$
1.469.000; 10.547.889 t, dos Estados Unidos, no valor de US$ 6.034.946.000;
e 561.024 t, do Japo, no valor de US$ 1.518.843.000. Confeccione a srie
correspondente e classifique-a, sabendo que os dados acima foram fornecidos
pelo Ministrio da Fazenda.

25
6-

Complete-a com uma coluna de percentagens com uma casa decimal e faa a
compensao, se necessrio.

DADOS ABSOLUTOS E DADOS RELATIVOS

Dados absolutos: so dados resultantes da coleta direta da fonte, sem


outra manipulao seno a contagem ou medida.

A leitura dos dados absolutos sempre enfadonha e inexpressiva; embora


esses dados traduzam um resultado exato e fiel, no tm a virtude de ressaltar
de imediato as suas concluses numricas. Da o uso imprescindvel que faz a
Estatstica dos dados relativos.

Dados relativos: so os resultados de comparaes por quocientes


(razes) que se estabelecem entre dados absolutos e tm por finalidade
realar ou facilitar as comparaes entre quantidades.

Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices,


coeficientes e taxas.

26
1 Percentagens

Considere a srie:

MATRCULAS NAS ESCOLAS DA CIDADE A 2011


GRAU N. DE ALUNOS
Fundamental 19286
Ensino mdio 1681
Superior 234
TOTAL 21201
Dados fictcios.

Calculemos as percentagens dos alunos da cada grau:

Fundamental 19286 x 100 = 90,96 = 91,0


21201

Ensino mdio 1681 x 100 = 7,92 = 7,9


21201

Superior 234 x 100 = 1,10 = 1,1


21201
Com esses dados, podemos formar uma nova coluna na srie em estudo:

MATRCULAS NAS ESCOLAS DA CIDADE A 2011


GRAU N. DE ALUNOS %
Fundamental 19286 91,0
Ensino mdio 1681 7,9
Superior 234 1,1
TOTAL 21201 100
Dados fictcios.

Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A,
91 esto no ensino fundamental, 8 aproximadamente esto no ensino mdio e
1 aproximadamente est matriculado no ensino superior.

O emprego da porcentagem de grande valia quando nosso intuito destacar


a participao da parte no todo.

27
NOTAS:

Do mesmo modo que tomamos 100 para base de comparao, tambm


podemos tomar outro nmero qualquer, entre os quais destacamos o
nmero 1. claro que, supondo o total igual a 1, os dados relativos das
parcelas sero todos menores que 1.
Em geral, quando usamos 100 para base, os dados so arredondados at
a primeira casa decimal; e quando tomamos 1 por base, so
arredondados at a terceira casa decimal.

Resolva:

1 - Complete a tabela abaixo

DADOS RELATIVOS
ESCOLAS N. DE ALUNOS
POR 1 POR 100
A 175 0,098 9,8
B 222
C 202
D 362
E 280
F 540
TOTAL 1781 1,000 100,0

2 ndices

Os ndices so razes entre duas grandezas tais que uma no inclui a outra.

So exemplos de ndices:

ndice ceflico = dimetro transversal do crnio x 100


dimetro longitudinal do crnio

Quociente intelectual = idade mental x 100


idade cronolgica

28
Densidade demogrfica = populao total
Superfcie (rea)

ndice econmicos:

Produo per capta = valor total da produo


populao

Consumo per capta = consumo do bem


populao

Renda per capta = renda____


populao

Receita per capta = receita__


populao

3 Coeficientes

Os coeficientes so razes entre o nmero de ocorrncias e o nmero total


(nmero de ocorrncias e nmero de no-ocorrncias).

So exemplos de coeficientes:

Coeficiente de natalidade = nmero de nascimentos


populao total
Coeficiente de mortalidade = nmero de bitos__
populao total

Coeficiente educacionais:

Coeficiente de evaso escolar = n. de alunos evadidos__


n. inicial de matrculas

Coeficiente de aproveitamento escolar = n. de alunos aprovados


n. final de matrculas

Coeficiente de recuperao escolar = n. de alunos recuperados_


n. de alunos em recuperao

29
4 Taxas
As taxas so os coeficientes multiplicados por uma potncia de 10 (10, 100,
1000 etc.) para tornar o resultado mais inteligvel.

So exemplos de taxas:

Taxa de natalidade = Coeficiente de natalidade X 1000


Taxa de mortalidade = Coeficiente de mortalidade X 1000
Taxa de evaso escolar = Coeficiente de evaso escolar X 100

Exerccio Resolvido:
1 O estado A apresentou 733.986 matriculados na 1 srie, no incio do ano
de 2012, e 683.816 no fim do ano. O Estado B apresentou, respectivamente,
436.127 e 412.457 matriculados. Qual o Estado que apresentou maior evaso
escolar?
A: TEE = (733.986 683.816) x 100 = 6,8%
733.986

B: TEE = (436.127 412.457) x 100 = 5,4%


436.127

O Estado que apresentou maior evaso escolar foi A.

EXERCCIOS
1 Considere a srie estatstica:

SRIES ALUNOS MATRIC. %


1 546
2 328
3 280
4 120
TOTAL 1274
Complete-a, determinando as percentagens com uma casa decimal e fazendo
a compensao, se necessrio.

30
2 Uma escola apresentava, no final do ano, o seguinte quadro:

MATRICULAS
SRIES
MARO NOVEMBRO
1 480 475
2 458 456
3 436 430
4 420 420
TOTAL 1794 1781

a. Calcule a taxa de evaso por srie


b. Calcule a taxa de evaso da escola

3 Considerando que Minas Gerais, em 1992, apresentou (dados fornecidos


pelo IBGE):
Populao: 15.957,6 mil habitantes;
Superfcie: 586.624 Km2;
Nascimentos: 292.036;
bitos: 99.281.

Calcule:
a. o ndice da densidade demogrfica;
b. a taxa de natalidade;
c. a taxa de mortalidade.

31
IV - GRFICOS ESTATSTICOS

1- Conceito:
O grfico um mtodo de representao de dados estatsticos em forma
visual, por meio de figuras geomtricas. Devem corresponder, mas nunca
substituir as tabelas estatsticas.
uma forma de apresentao dos dados estatsticos, cujo objetivo o de
produzir, no investigador ou no pblico em geral, uma impresso mais rpida
e viva do fenmeno em estudo, j que os grficos falam mais compreenso
que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de
tal modo que cada elemento da srie seja representado por uma figura
proporcional.
A representao grfica deve obedecer a certos requisitos fundamentais como:
Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, assim como traos desnecessrios que possam levar o
observador a uma anlise morosa ou com erros. Deve proporcionar que
o observador analise rapidamente o fenmeno apresentado;

Clareza deve proporcionar que o observador tenha uma correta leitura


dos valores representativos do fenmeno;

Veracidade deve expressar a verdade sobre o fenmeno em estudo.

Uso indevido de Grficos: Podem trazer uma ideia falsa dos dados que esto
sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade,
de um problema de construo de escalas.

32
2 - Classificao dos grficos:
Os principais grficos so os Diagramas, Estereogramas, Pictogramas e
Cartogramas.
2.1 - Diagramas:
So grficos geomtricos dispostos, no mximo, em duas dimenses; para sua
construo, em geral, fazemos uso do sistema cartesiano. So os mais usados
na representao de sries estatsticas. Eles podem ser em linhas, em barras
horizontais, em barras verticais (colunas), e em setores.

Grficos em linhas ou lineares


O grfico em linha constitui uma aplicao do processo de representao das
funes num sistema de coordenadas cartesianas.
Como sabemos, nesse sistema fazemos uso de duas retas perpendiculares; as
retas so os eixos coordenados e o ponto de interseco, a origem. O eixo
horizontal denominado eixo das abscissas (ou eixo dos x) e o vertical, eixo
das ordenadas (ou eixo dos y). Para exemplificar considere a srie:

Determinamos, graficamente, todos os pontos da srie, usando as


coordenadas, ligamos todos esses pontos, dois a dois, por segmentos de reta, o
que ir nos dar uma poligonal, que o grfico em linha ou em curva
correspondente a srie do exemplo.

33
So frequentemente usados para representao de sries cronolgicas com um
grande nmero de perodos de tempo. As linhas so mais eficientes do que as
colunas, quando existem intensas flutuaes nas sries ou quando h
necessidade de se representarem vrias sries em um mesmo grfico.
Quando representamos, em um mesmo sistema de coordenadas, a variao de
dois fenmenos, a parte interna da figura formada pelos grficos desses
fenmenos denominada de rea de excesso.

Grficos em colunas ou barras


a representao de uma srie por meio de retngulos, dispostos
verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retngulos tm a mesma base e as alturas so
proporcionais aos respectivos dados.
Quando em barras, os retngulos tm a mesma altura e os comprimentos so
proporcionais aos respectivos dados.

34
Exemplo: Grfico em colunas

35
Exemplo: Grfico em barras

NOTAS:
Quando as legendas no so breves usa-se de preferncia os grficos em
barras horizontais;
A ordem a ser observada a cronolgica, se a srie for histrica, e a
decrescente, se for geogrfica ou categrica;
A distncia entre as colunas (ou barras), por questes estticas, no
dever ser menor que a metade nem maior que os dois teros da largura
(ou da altura) dos retngulos.

36
Grficos em barras ou colunas mltiplas

Eles diferem dos grficos em barras ou colunas convencionais apenas pelo


fato de apresentar cada barra ou coluna segmentada em partes componentes.
Servem para representar comparativamente dois ou mais atributos.

Grficos em setores
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total.
O total representado pelo crculo, que fica dividido em tantos setores quantas
so as partes.
Os setores so tais que suas reas so respectivamente proporcionais aos
dados da srie. Obtemos cada setor por meio de uma regra de trs simples e
direta, lembrando que o total da srie corresponde a 360.

37
O grfico em setores s deve ser empregado quando h, no mximo, sete
dados.
Obs.: As sries temporais geralmente no so representadas por este tipo de
grfico.

38
2.2 - Estereogramas:
So grficos geomtricos dispostos em trs dimenses, pois representam
volume. So usados nas representaes grficas das tabelas de dupla entrada.
Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a
pequena preciso que oferecem.
2.3 - Pictogramas:
So construdos a partir de figuras representativas da intensidade do
fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do
pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser
auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma
viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo
abaixo:

39
2.4 - Cartogramas: So ilustraes relativas a cartas geogrficas (mapas). O
objetivo desse grfico o de figurar os dados estatsticos diretamente
relacionados com reas geogrficas ou polticas.
Distinguimos duas aplicaes:
a. representar os dados absolutos (populao) neste caso,
lanamos mo, em geral, dos pontos, em nmero proporcional
aos dados.
b. representar dados relativos (densidade) - neste caso, lanamos
mo, em geral, de hachuras ou cores.

40
41
EXERCCIOS
1 Represente a srie abaixo usando o grfico em linha:
COMRCIO EXTERIOR
BRASIL 1984 -93
QUANTIDADE (1000t)
ANOS
EXPORTAO IMPORTAO
84 141.737 53.988
85 146.351 48.870
86 133.832 60.597
87 142.378 61.975
88 169.666 58.095
89 177.033 57.293
90 168.095 57.184
91 165.974 63.278
92 167.295 68.059
93 182.561 77.813
Fonte: Min. Indstria, Comrcio e Turismo.

2 Represente as tabelas usando o grfico em colunas:


a) ENTREGA DE GASOLINA PARA CONSUMO BRASIL
1988 -91
ANOS VOLUME (1000m3)
88 9.267,7
89 9.723,1
90 10.121,3
91 12.345,4
Fonte: IBGE.

b) PRODUO BRASILEIRA DE PETRLEO


1991 -93
ANOS QUANT. (1000m3)
91 36.180,4
92 36.410,5
93 37.164,3
Fonte: Petrobrs.

42
3 Represente as tabelas usando o grfico em barras:
a) PRODUO DE OVOS NO BRASIL - 1992
QUANT.
REGIES
(1000dzias)
Norte 57.297
Nordeste 414.804
Sudeste 984.659
Sul 615.978
Centro-Oeste 126.345
Fonte: IBGE.

b) PRODUO DE VECULOS DE AUTOPROPUSO


BRASIL 1993
TIPOS QUANTIDADE
Automveis 1.100.278
Comerciais leves 224.387
Comerciais pesados 66.771
Fonte: ANFAVEA.

4 Represente as tabelas usando o grfico de setores:


a) REA TERRESTRE BRASIL 1992
REGIES RELATIVA (%)
Norte 45,25
Nordeste 18,28
Sudeste 10,85
Sul 6,76
Centro-Oeste 18,86
Fonte: IBGE.

b) PRODUO BRASILEIRA DE FERRO-GUSA -1993


ESTADO PRODUO (1000t)
Minas Gerais 12.888
Esprito Santo 3.174
Rio de Janeiro 5.008
So Paulo 2.912
Fonte: Instituo Brasileiro de Siderurgia.

43
5 Represente as tabelas usando o grfico em colunas mltiplas:
PROPORO DOS DOMICLIOS
POR CONDIO DE OCUPAO
BRASIL 1990 -91
NATUREZA
ANOS
PRPRIOS (%) ALUGADOS (%) CEDIDOS (%)
90 62,7 22,9 14,4
91 70,3 16,5 13,2
Fonte: IBGE.

44
V - DISTRIBUIO DE FREQUENCIA

Vamos considerar, neste captulo, em particular, a forma pela qual podemos


descrever os dados estatsticos resultantes de variveis quantitativas, como o
caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de
pessoas, salrios recebidos pelos operrios de uma fbrica, etc.
1 Tabela Primitiva e Rol
Considere a estatura de quarenta alunos, que compem uma amostra dos
alunos do IFCE, resultando a seguinte tabela de valores:
ESTATURAS DE 40 ALUNOS DO IFCE
166 160 161 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

A esse tipo de tabela, onde os elementos no foram numericamente


organizados, denominamos de tabela primitiva, ou seja, Tabela primitiva ou
dados brutos uma tabela ou relao de elementos que no foram
numericamente organizados.
Assim, conhecidos os valores de uma varivel, difcil formarmos uma ideia
exata do comportamento do grupo como um todo, a partir de dados no
ordenados. Em razo disso, pouca informao se consegue obter
inspecionando os dados anotados. Mesmo uma informao to simples como a
de saber o valor mximo e mnimo requer certo exame dos dados da tabela.
ROL: a tabela ou relao obtida aps a ordenao dos dados, em ordem
crescente ou decrescente.
Para o exemplo acima temos:
ESTATURAS DE 40 ALUNOS DO IFCE
150 151 152 153 154 155 155 155 155 156
156 156 157 158 158 160 160 160 160 160
161 161 161 161 162 162 163 163 164 164
164 165 166 167 168 168 169 170 172 173

45
Essa classificao dos dados proporciona algumas vantagens concretas com
relao sua forma original:
- possvel visualizar de forma ampla as variaes de consumo;
- os valores extremos so percebidos de imediato;
- possvel observar a tendncia de concentrao dos valores.

Agora, podemos saber, com relativa facilidade, qual a menor estatura (150
cm) e qual a maior (173 cm); que a amplitude de variao foi de 173 150 =
23 cm; e, ainda, a ordem que um valor particular ocupa no grupo. Com um
exame mais acurado, vemos que h uma concentrao das estaturas em algum
valor entre 160 cm e 165 cm e, mais ainda, que h poucos valores abaixo de
155 cm e acima de 170 cm.

Apesar de o rol propiciar ao analista mais informaes e com menor esforo


de concentrao do que os dados brutos, ainda assim persiste o problema de a
anlise ter que se basear nas 40 observaes. O problema se agravar quando
o nmero de dados for muito grande.

2 Distribuio de Frequncia
um tipo de tabela que condensa uma coleo de dados conforme as
frequncias (repeties de seus valores).
No exemplo que trabalhamos, a varivel em questo, estatura, ser observada
e estudada muito mais facilmente quando dispusermos valores ordenados em
uma coluna e colocarmos, ao lado de cada valor, o nmero de vezes que
aparece repetido. Logo podemos definir o termo frequncia.
Frequncia: a quantidade que fica relacionada a um determinado valor da
varivel.
Distribuio de frequncia sem intervalos de classe: a simples
condensao dos dados conforme as repeties de seus valores.
Veja para o nosso exemplo:

46
VARIVEL FREQUENCIA
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
TOTAL 40

Para um ROL de tamanho razovel esta distribuio de frequncia


inconveniente, j que exige muito espao.
Assim, se um dos intervalos for, por exemplo, 154 |---- 158, em vez de
dizermos que a estatura de um aluno de 154 cm; de quatro alunos, 155 cm;
de trs alunos, 156 cm; e de um aluno, 157 cm, diremos que nove alunos tm
estaturas entre 154 cm, inclusive, e 158 cm.
Deste modo, estaremos agrupando os valores da varivel em intervalos, sendo
que, em Estatstica, preferimos chamar de intervalos de classes.
Distribuio de frequncia com intervalos de classe: Quando o tamanho da
amostra elevado mais racional efetuar o agrupamento dos valores em
vrios intervalos de classe.

47
ESTATURAS DE 40 ALUNOS DO IFCE
CLASSES FREQUENCIAS
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40

Ao agruparmos os valores da varivel em classes, ganhamos em simplicidade,


mas perdemos em pormenores. Assim, na tabela de distribuio de frequncia
sem classes, podemos verificar, facilmente, que quatro alunos tm 161 cm de
altura e que no existe nenhum aluno com 171 cm de altura. J na distribuio
de frequncia com classes no podemos ver se algum aluno tem a estatura de
159 cm. No entanto, sabemos, com segurana, que onze alunos tm estatura
compreendida entre 158 e 162 cm.
Nota: Quando os dados esto organizados em uma distribuio de frequncia,
so comumente denominados dados agrupados.

Foram vistas as seguintes formas de apresentao dos dados:

ROL (dados isolados);


Agrupamento simples (sem classes);
Agrupamentos em classes.

Mas h ainda outra tcnica alternativa de apresentao e organizao de


dados: o Diagrama de Ramos e Folhas. A obteno do diagrama rpida e
fcil. No diagrama de ramos e folhas, cada dado separado em duas partes:
Ramo: a parte da esquerda e Folhas: a parte da direita. Em seguida as
folhas so colocadas em seus respectivos ramos.
Veja exemplo: Vamos considerar o nmero de alunos presentes em 20
palestras.

68 82 75 43 59 80 69 60 73 54
51 93 70 32 63 61 76 87 65 71

Como todos os dados possuem dois algarismos, podemos dividir cada dado
em algarismo da dezena e da unidade. Portanto, o algarismo da dezena ser o

48
ramo e a unidade ser a folha. Vamos usar o dado 68 como exemplo:
6 8
ramo folha

Colocamos todos os ramos distintos em uma coluna, ou seja, verticalmente um


abaixo do outro, em ordem crescente, e traamos uma linha vertical, como
representado abaixo nas etapas (a, b, c, d) da construo do diagrama de ramos
e folhas. Em (a) colocamos apenas os ramos distintos; em (b) colocamos a
primeira folha (8) do dado 68; em (c) colocamos a folha correspondente ao
dado 82 e, finalmente em (d) apresentamos o resultado final do diagrama com
todos os dados.

3 3 3 3 2
4 4 4 4 3
5 5 5 5 9 4 1
6 6 8 6 8 6 8 9 0 3 1 5
7 7 7 7 5 3 0 6 1
8 8 8 2 8 2 0 7
9 9 9 9 3
(a) (b) (c) (d)

Observe que o nmero de folhas deve ser igual ao nmero de dados.

3 Elementos de uma Distribuio de Frequncia com Intervalos de Classe:


Os valores exemplificados a seguir so referentes a Distribuio de
frequncias com das estaturas de 40 alunos do IFCE.

3.1 Classe

Classe de frequncia ou, simplesmente, classes so os intervalos de variao


da varivel.

As classes so representadas simbolicamente por i, sendo i = 1, 2, 3, ..., k.


(onde K o nmero total de classes da distribuio).
No exemplo, a distribuio formada por seis classes, ento temos k = 6 e o
intervalo de classe 154 |---- 158 define a 2 classe, ou seja, i = 2.

49
3.2 Limites de classe

Limites de classe so os extremos de cada classe.

O menor nmero o limite inferior da classe (li) e o maior nmero, limite


superior da classe (Li).
Na terceira classe, por exemplo, temos: 158 |---- 162, l3 = 158 e L3 = 162.
Nota: Os intervalos de classe devem ser escritos, de acordo com a Resoluo
886/66 do IBGE, em termos de desta quantidade at menos aquela,
empregando, para isso, o smbolo |---- (incluso de li e excluso de Li). Assim,
o indivduo com uma estatura de 158 cm est incluso na terceira classe (i = 3)
e no na segunda.
O quarto intervalo 162 |---- 166, por exemplo, pode ser tambm ser
representado desta maneira: [162,166[.

3.3 Amplitude do intervalo de classe

Amplitude do intervalo de classe ou, simplesmente, intervalo de classe a


medida do intervalo que define a classe.

Ela obtida atravs da diferena entre o limite superior e inferior da classe e


simbolizada por hi. Assim:
hi = Li - li

Na distribuio de frequncia com classes o hi ser igual em todas as classes,


como mostrado a seguir:
h1 = 154 - 150 = 4
h2 = 158 - 154 = 4

.......

h6 = 174 - 170 = 4

50
3.4 Amplitude total da distribuio

Amplitude total da distribuio (AT) a diferena entre o limite superior da


ltima classe (limite superior mximo) e o limite inferior da primeira classe
(limite inferior mnimo).
AT = Lmax - lmin.

No exemplo, temos AT = 174 150 = 24 cm


Nota: evidente que, se as classes possuem o mesmo intervalo, verificamos a
relao:
AT = k Temos: 24 = 6
hi 4

3.5 Amplitude amostral

Amplitude amostral (AA) a diferena entre o valor mximo e o valor mnimo


da amostra (obtidos atravs do ROL).
AA = Xmax - Xmin

Em nosso exemplo AA = 173 - 150 = 23 cm.


Obs.: AT sempre ser maior que AA.
3.6 Ponto mdio da classe

Ponto mdio da classe (xi) , como o prprio nome indica, o ponto que divide
o intervalo de classe em duas partes iguais.

Para obtermos o ponto mdio de uma classe, calculamos a semi-soma dos


limites da classe (mdia aritmtica):
x i = l i + Li
2

No intervalo da 2 classe 154 |---- 158 o ponto mdio x2 calculado:


x2 = (l2 + L2)/2 = (154 + 158)/2 = 156 cm

51
Obs.: O ponto mdio da classe o valor que a representa para efeito de
clculos de medidas de posio e disperso ou variabilidade.
3.7 Frequncia simples ou absoluta

Frequncia simples ou frequncia absoluta ou simplesmente, frequncia de


uma classe ou de um valor individual o nmero de observaes
correspondentes a essa classe ou a esse valor.

A frequncia simples simbolizada por fi (lemos f ndice i ou frequncia da


classe i).
Assim, considerando o exemplo abaixo, temos:
ESTATURAS DE 40 ALUNOS DO IFCE
ESTATURA (cm) FREQUNCIA
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
TOTAL 40

f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.
A soma das frequncias sempre igual ao total de elementos da amostra.
Atividade 1: As notas obtidas por 50 alunos de uma classe foram:
1; 2; 3; 4; 5; 0; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9;
2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9.
a) Complete a distribuio de frequncia abaixo:
i Notas xi fi
1 0 |---- 2
2 2 |---- 4
3 4 |---- 6
4 6 |---- 8
5 8 |---- 10
Total 50

52
b) Agora, responda:

1. Qual a amplitude amostral?


2. Qual a amplitude da distribuio?
3. Qual o nmero de classes da distribuio?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo de classe?
7. Qual a frequncia da terceira classe?

c) Complete:

1. h3 = .......
2. n = ........
3. l1 = ........
4. L3 = ........
5. x2 = ........
6. f5 = ........

4 Tipos de Frequncias

Frequncia simples ou absolutas (fi) so os valores que realmente


representam o nmero de dados de cada classe.

A soma das frequncias simples igual ao nmero total de dados da


distribuio.
fi = n
Frequncias relativas (fri) ou fi (%) so os valores das razes entre as
frequncias absolutas de cada classe e a frequncia total da distribuio.

A soma das frequncias relativas igual a 1 ou 100 %.


Logo, para o exemplo da pgina 36 a frequncia da terceira classe :
fr3 = f3/n ; fr3 = 11/40 = 0,275 ou 27,5%
Nota: O propsito das frequncias relativas o de permitir a anlise ou
facilitar as comparaes.

53
Frequncia acumulada de uma classe (Fi) o total das frequncias de todos
os valores inferiores ao limite superior do intervalo de uma determinada
classe:
Fk = f1 + f2 + f3 + ...... + fK

Assim, no exemplo, a frequncia acumulada correspondente terceira classe


:
F3 = f1 + f2 + f3 = 4 + 9 + 11 = 24
O que significa existirem 24 alunos com estatura inferior a 162 cm (limite
superior do intervalo da terceira classe).

Frequncia acumulada relativa (Fri) ou Fi (%) de uma classe a frequncia


acumulada da classe, dividida pela frequncia total da distribuio.
Fri = Fi / fi

Assim, no exemplo, para a terceira classe, temos:


Fr3 = F3 / fi = 24/40 = 0,600 ou 60,0%

Atividade 2: Complete o quadro com as frequncias que se pede.

CLASSE xi fi Fi fi (%) Fi (%)


50 |---- 54 52 4
54 |---- 58 56 9
58 |---- 62 60 11
62 |---- 66 64 8
66 |---- 70 68 5
70 |---- 74 72 3
Total -- 40 -- 100 --

Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia


Acumulada; fri (%) = frequncia percentual e Fri (%) = frequncia percentual
acumulada.

54
5 - Mtodo Prtico para Construo de uma Distribuio de Frequncias com
Classes:
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA. Para o exemplo da pgina 45, temos:
AA = 173 - 150 = 23
3 - Calcule o nmero de classes atravs da:
a) Regra de Sturges: i = 1 + 3,3.log n
n i = n de classes
3 ---- 5 3
6 ---- 11 4
12 ---- 22 5
23 ---- 46 6
47 ---- 90 7
91 ---- 181 8
182---- 362 9
b) Raiz quadrada de n. (usa-se somente a parte inteira do nmero quando a
raiz no for exata).
Obs.: Qualquer regra para determinao do n de classes da tabela no nos
leva a uma deciso final; esta vai depender na realidade de um julgamento
pessoal, que deve estar ligado natureza dos dados.
No nosso exemplo: n = 40 dados, ento, a regra de Sturges sugere a adoo
de 6 classes e pela regra da raiz quadrada tambm o uso de 6 classes.
Dependendo do n, o nmero de classes pode ser diferente quando usamos os
dois mtodos. Por exemplo, para n igual a 100 teremos 8 classes pela regra de
Sturges e 10 classes para a regra da raiz de n.
4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe
h > AA / i.
No nosso exemplo: AA / i = 23/6 = 3,83. Obs.: Como h > AA / i um valor
ligeiramente superior para haver folga na ltima classe. Utilizaremos ento
h = 4.

55
5 - Temos ento o menor n da amostra, o n de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes
com frequncia = 0 (zero).
No nosso exemplo: o menor n da amostra = 150 + h = 154, logo a primeira
classe ser representada por 150 |---- 154. As classes seguintes respeitaro o
mesmo procedimento.
O primeiro elemento da classe seguinte sempre ser formado pelo ltimo
elemento da classe anterior.
Resolva:
1. Complete a distribuio abaixo, determinando as frequncias simples:

xi fi Fi
2 2
3 9
4 21
5 29
6 34
Total 34 --

EXERCCIOS
1 - Suponha que o ponto mdio das classes de uma distribuio de frequncia
de umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e
82%.
a) Encontre a amplitude da classe;
b) Os limites de cada classe.

2 - Imagine que em uma regio durante um dia de inverno foram medidas 150
temperaturas mnimas (em oC) em pontos prximos. Suponha que estas
temperaturas variaram entre 5,18 C a 7,44 C. Determine um conjunto de
intervalos de classe que seja razovel para esse conjunto de dados.

3 Conhecidas as notas de 50 alunos, obtenha uma distribuio de frequncia


tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.
84 - 68 - 33 - 52 - 47 - 73 - 68 - 61 - 73 - 77 - 74 - 71 - 81 - 91 - 65 - 55 - 57 -
35 - 85 - 88 - 59 - 80 - 41 - 50 - 53 - 65 - 76 - 85 - 73 - 60 - 67 - 41 - 78 - 56 -
94 - 35 - 45 - 55 - 64 - 74 - 65 - 94 - 66 - 48 - 39 - 69 - 89 - 98 - 42 - 54.

56
4 Os resultados do lanamento de um dado 50 vezes foram os seguintes:
6, 5, 2, 6, 4, 3, 6, 2, 6, 5, 1, 6, 3, 3, 5, 1, 3, 6, 3, 4, 5, 4, 3, 1, 3, 5, 4, 4, 2, 6, 2,
2, 5, 2, 5, 1, 3, 6, 5, 1, 5, 6, 2, 4, 6, 1, 5, 2, 4, 3.
Forme uma distribuio de frequncia sem intervalos de classes.

5 Considere os dados da quantidade de gordura no leite (em %), n = 49


3,66 - 3,66 - 3,72 - 3,74 - 3,74 - 3,77 - 3,81 - 3,88 - 3,89 - 3,91 - 3,96 - 3,96 -
3,97 - 3,97 - 4,00 - 4,00 - 4,02 - 4,03 - 4,05 - 4,06 - 4,08 - 4,10 - 4,10 - 4,15 -
4,16 - 4,20 - 4,20 - 4,23 4,24 - 4,25 - 4,27 - 4,28 - 4,29 - 4,32 - 4,32 - 4,33 -
4,38 - 4,38 - 4,38 - 4,40 - 4,41 - 4,42 - 4,49 - 4,60 - 4,67 - 4,70 - 4,71 - 4,81 -
4,82.
Use os dados da amostra para fazer uma Distribuio de frequncias com
classes, calculando as frequncias simples e acumuladas, absolutas e relativas.

6 - Na Tabela, identifique a amplitude dos intervalos de classe e os pontos


mdios de cada classe.
Classes Frequncia (fi)
[0 6[ 39
[6 12[ 41
[12 18[ 38
[18 24[ 40
[24 30[ 42
Total 200
Construa a tabela de frequncias relativas, percentual e acumulada.

7 - A tabela abaixo apresenta a distribuio de frequncia dos salrios mensais


em reais, de 65 empregados da companhia P & R.

N. de
Salrios (R$)
Empregados
5.000 |--- 6.000 8
6.000 |--- 7.000 10
7.000 |--- 8.000 16
8.000 |--- 9.000 14
9.000 |--- 10.000 10
10.000 |--- 11.000 5
11.000 |--- 12.000 2
Total 65

57
Determinar:
a) O limite inferior da 6 classe;
b) O limite superior da 4 classe;
c) O ponto mdio da 3 classe;
d) A amplitude do 5 intervalo de classe;
e) A frequncia da 3 classe;
f) A frequncia relativa da 3 classe;
g) O intervalo de classe que tem a maior frequncia;
h) A percentagem de empregados que ganham menos de R$ 8.000,00 por ms;
i) A percentagem de empregados que ganham menos de R$ 10.000,00 e pelo
menos R$ 6.000,00 por ms;

8- A distribuio abaixo indica o nmero de acidentes ocorridos com 70


motoristas de uma empresa de nibus:
N ACIDENTES 0 1 2 3 4 5 6 7
N MOTORISTAS 20 10 16 9 6 5 3 1
Determine:
a) O nmero de motoristas que no sofreram nenhum acidente;
b) O nmero de motoristas que sofreram pelo menos quatro acidentes;
c) O nmero de motoristas que sofreram menos de trs acidentes;
d) O nmero de motoristas que sofreram no mnimo trs e no mximo
cinco acidentes;
e) A percentagem dos motoristas que sofreram no mximo dois acidentes.

9 A tabela abaixo apresenta a distribuio de frequncia das reas de 400


lotes:
REAS (m2) 300 |-- 400 |-- 500 |-- 600 |-- 700 |-- 800 |-- 900 |-- 1000 |-- 1100 |-- 1200

N DE LOTES 14 46 58 76 68 62 48 22 6
Com referncia a esta tabela, determine:
a) a amplitude total;
b) o limite superior da quinta classe;
c) o limite inferior da oitava classe;
d) o ponto mdio da stima classe;
e) a amplitude do intervalo da segunda classe;
f) a frequncia da quarta classe;

58
g) a frequncia relativa da sexta classe;
h) a frequncia acumulada da quinta classe;
i) o nmero de lotes cuja rea no atinge 700 m2;
j) o nmero de lotes cuja rea atinge e ultrapassa 800 m2;
k) a percentagem dos lotes cuja rea no atinge 600 m2;
l) a percentagem dos lotes cuja rea seja maior ou igual a 900 m2;
m) a percentagem dos lotes cuja rea de 500 m2, no mnimo, mas inferior
a 1000 m2;
n) a classe do 72 lote;
o) At que classe esto includos 60% dos lotes.

6 - Representao Grfica de uma Distribuio


Uma distribuio de frequncia pode ser representada graficamente pelo
Histograma, pelo Polgono de frequncia e pelo Polgono de frequncia
acumulada (alguns autores denominam de ogiva de Galton).
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de
eixos coordenados cartesianos ortogonais. Na linha horizontal (eixo das
abscissas) colocamos os valores da varivel e na linha vertical (eixo das
ordenadas), as frequncias.

6.1 - Histograma

O Histograma formado por um conjunto de retngulos justapostos, cujas


bases se localizam sobre o eixo horizontal, de tal modo que seus pontos
mdios coincidam com os pontos mdios dos intervalos de classe.

As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.


As alturas dos retngulos devem ser proporcionais s frequncias das classes,
sendo a amplitude dos intervalos igual. Isso nos permite tomar as alturas
numericamente iguais s frequncias.

A rea de um histograma proporcional soma das frequncias simples ou


absolutas.
No caso de usarmos as frequncias relativas, obtemos um grfico de rea
unitria.
Para o exemplo a seguir, temos o seguinte histograma:

59
ESTATURAS DE 40 ALUNOS NA ESCOLA A

ESTATURA (cm) FREQUNCIA


150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
TOTAL 40

6.2 Polgono de Frequncia

O Polgono de frequncia um grfico em linha, sendo as frequncias


marcadas sobre perpendiculares ao eixo horizontal, levantadas pelos pontos
mdios dos intervalos de classe.

Para realmente obtermos um polgono (linha fechada), devemos completar a


figura, ligando os extremos da linha obtida aos pontos mdios da classe
anterior primeira e da posterior ltima, da distribuio.
Para o exemplo anterior temos o seguinte Polgono de frequncia:

60
6.3 Polgono de Frequncia Acumulada

O Polgono de frequncia acumulada traado marcando-se as frequncias


acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos
correspondentes aos limites superiores dos intervalos de classe.

Para o exemplo em estudo temos o seguinte Polgono de frequncia


acumulada:

Uma distribuio de frequncia sem intervalos de classe representada


graficamente por um diagrama onde cada valor da varivel representado por

61
um segmento de reta varivel e de comprimento proporcional respectiva
frequncia.

Atividade 3: Complete o quadro com as frequncias que se pede e com base


nele construa o histograma, polgono de frequncia e polgono de frequncia
acumulada.

CLASSE xi fi Fi fi (%) Fi (%)


50 |--- 54 52 4
54 |--- 58 56 9
58 |--- 62 60 11
62 |--- 66 64 8
66 |--- 70 68 5
70 |--- 74 72 3
Total -- 40 -- 100 --

Sendo xi = ponto mdio de classe; fi = frequncia simples; Fi = frequncia


Acumulada; fi (%) = frequncia percentual; Fi (%) = frequncia percentual
acumulada.

EXERCCIOS

1 Considerando as distribuies de frequncia seguintes, confeccione, para


cada uma o Histograma, o Polgono de frequncia simples e o Polgono de
frequncia acumulada.
a)

PESOS
i fi
(Kg)
1 40 |--- 44 2
2 44 |--- 48 5
3 48 |--- 52 9
4 52 |--- 56 6
5 56 |--- 60 4
Total 26

62
b)
SALRIOS
i fi
(R$)
1 500 |--- 700 8
2 700 |--- 900 20
3 900 |--- 1100 7
4 1100 |--- 1300 5
5 1300 |--- 1500 2
6 1500 |--- 1700 1
7 1700 |--- 1900 1
Total 44

2 Examinando o histograma abaixo, que corresponde s notas relativas


aplicao de um teste de inteligncia a um grupo de alunos, responda:

(a) Qual o intervalo de classe que tem maior frequncia?


(b) Qual a amplitude total da distribuio?
(c) Qual o nmero total de alunos?
(d) Qual a frequncia do intervalo de classe 110 |---120?
(e) Quais so os intervalos de classes tais que a frequncia de um o
dobro da frequncia do outro?
(f) Quantos alunos receberam notas de teste entre 90 (inclusive) e 110?
(g) Qual o percentual de alunos que esto no intervalo 100 |---130?
(h) Quantos alunos receberam nota no-inferior a 100?

63
VI - MEDIDAS DE POSIO

1 Introduo
O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma varivel pode
assumir. Dessa forma, podemos localizar a maior concentrao de valores de
uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final,
ou ainda, se h uma distribuio por igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos
que se expressam atravs de nmeros, que nos permitam traduzir essas
tendncias. Esses conceitos so denominados elementos tpicos da
distribuio e so as:
a. medidas de posio;
b. medidas de variabilidade ou disperso;
c. medidas de assimetria;
d. medidas de curtose.
Dentre os elementos tpicos, destacamos, neste captulo, as medidas de
posio - estatsticas que representam uma srie de dados orientando-nos
quanto posio da distribuio em relao ao eixo horizontal do grfico da
curva de frequncia.
As medidas de posies mais importantes so as medidas de tendncia
central ou promdias, que recebem tal denominao pelo fato de os dados
observados tenderem, em geral, a se agruparem em torno dos valores centrais.
Dentre as medidas de tendncia central, destacamos:
a. a mdia aritmtica;
b. a moda;
c. a mediana.
Outras promdias menos usadas so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.

64
2 Mdia Aritmtica ( )
Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em
nossos estudos iremos nos limitar a mais importante: a mdia aritmtica.

Mdia Aritmtica o quociente entre a soma dos valores da varivel pelo


nmero deles.

onde xi so os valores da varivel e n o nmero de valores.


2.1 Dados no - agrupados
Quando desejamos conhecer a mdia dos dados no-agrupados em tabelas de
frequncias, determinamos a mdia aritmtica simples.
Exemplo: Sabendo-se que a venda diria de arroz tipo A, durante uma semana,
foi de 10, 14, 13, 15, 16, 18 e 12 kg, temos, para venda mdia diria na
semana de:

.= (10+14+13+15+16+18+12) / 7 = 14 kg

Logo: .= 14 Kg
s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados
que ela representa. o que acontece quando temos os valores 2, 4, 6 e 8, para
os quais a mdia 5. Esse ser o nmero representativo dessa srie de valores,
embora no esteja representado nos dados originais. Neste caso, costumamos
dizer que a mdia no tem existncia concreta.
2.2 Desvio em relao mdia

Denominamos Desvio em relao mdia a diferena entre cada elemento de


um conjunto de valores e a mdia aritmtica.

Designando o desvio por di, temos:.di = Xi -

65
No exemplo anterior temos sete desvios:...
d1 = 10 - 14 = -4;
d2 = 14 - 14 = 0;
d3 = 13 - 14 = -1;
d4 = 15 - 14 = 1;
d5 = 16 - 14 = 2;
d6 = 18 - 14 = 4;
d7 = 12 - 14 = -2.
2.3 -.Propriedades da mdia
1 propriedade: A soma algbrica dos desvios em relao mdia nula.
Ou seja:

No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos
os valores de uma varivel, a mdia do conjunto fica aumentada (ou
diminuda) dessa constante.

Se no exemplo anterior, somarmos a constante 2 a cada um dos valores da


varivel temos:
Y = (12+16+15+17+18+20+14) / 7 = 112/7 = 16 kg

Ou seja, Y = .+ 2 = 14 +2 = 16 kg

3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de


uma varivel por uma constante (c), a mdia do conjunto fica
multiplicada (ou dividida) por essa constante.

66
Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da
varivel temos:
Y = (30+42+39+45+48+54+36) / 7 = 294/7 = 42 kg

Ou seja, Y = x 3 = 14 x 3 = 42 kg.
2.4 Dados Agrupados
A mdia aritmtica sem intervalos de classe
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando
para varivel o nmero de filhos do sexo masculino. Calcularemos a
quantidade mdia de meninos por famlia:
N de meninos Frequncia (fi)
0 2
1 6
2 10
3 12
4 4
Total 34

Neste caso, como as frequncias so nmeros indicadores da intensidade de


cada valor da varivel, elas funcionam como fatores de ponderao, o que nos
leva a calcular a mdia aritmtica ponderada, dada pela frmula:

O modo mais prtico de obteno da mdia ponderada abrir, na tabela, uma


coluna correspondente aos produtos xifi:

67
xi fi x i . fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
34 78
Temos, xifi = 78 e f i = 34
Logo xifi / f i = 78 / 34 = 2,3
Portanto a mdia de 2,3 meninos por famlia
Nota:
- Sendo x uma varivel discreta, como interpretar o resultado obtido, 2
meninos e 3 dcimos de menino?
O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de
famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma
leve superioridade numrica em relao ao nmero de meninos.
Resolva:
1 Calcule a mdia aritmtica da distribuio:
xi 1 2 3 4 5 6
fi 2 4 6 8 3 1

A mdia aritmtica com intervalos de classe


Neste caso, convencionamos que todos os valores includos em um
determinado intervalo de classe coincidem com o seu ponto mdio, e
determinamos a mdia aritmtica ponderada por meio da frmula:

Onde xi o ponto mdio da classe.

68
Exemplo: Considere a distribuio de frequncia relativo a estaturas, em cm,
de 40 bebs. Calcular a estatura mdia dos bebs conforme a tabela abaixo.

i Estaturas (cm) fi
1 50 |---- 54 4
2 54 |---- 58 9
3 58 |---- 62 11
4 62 |---- 66 8
5 66 |---- 70 5
6 70 |---- 74 3
40

Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna
para os pontos mdios (xi) e outra para os produtos xifi:

i Estaturas (cm) fi xi xi.fi


1 50 |---- 54 4 52 208
2 54 |---- 58 9 56 504
3 58 |---- 62 11 60 660
4 62 |---- 66 8 64 512
5 66 |---- 70 5 68 340
6 70 |---- 74 3 72 216
40 2.440

Temos, xifi = 2440 e f i = 40; Logo xifi / f i = 2440 / 40 = 61


Portanto, a estatura mdia dos bebs de 61 cm.

2.5 Emprego da mdia


A mdia utilizada quando:
a. desejamos obter a medida de posio que possui a maior estabilidade;
b. houver necessidade de um tratamento algbrico ulterior.

69
Resolva:
1 Calcule a media da distribuio de frequncia:
CUSTO (R$) 450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150

fi 8 10 11 16 13 5 1

3 Moda

Denominamos Moda o valor que ocorre com maior frequncia em uma srie
de valores.

Mo o smbolo da moda.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa
fbrica.
3.1 Dados no - agrupados
Quando lidamos com dados no-agrupados, a moda facilmente reconhecida:
basta, de acordo com definio, procurar o valor que mais se repete.
Exemplo: Na srie de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor
aparea mais vezes que outros.
Exemplo: {3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A srie bimodal.
3.2 Dados agrupados
Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda:
basta fixar o valor da varivel de maior frequncia.

70
Exemplo: Qual a temperatura mais comum medida no ms abaixo:
Temperaturas ( C) Frequncia
0 3
1 9
2 12
3 6
Resp.: 2 C a temperatura modal, pois a de maior frequncia (12 vezes).
Com intervalos de classe
A classe que apresenta a maior frequncia denominada classe modal. Pela
definio, podemos afirmar que a moda, neste caso, o valor dominante que
est compreendido entre os limites da classe modal.
O mtodo mais simples para o clculo da moda consiste em tomar o ponto
mdio da classe modal. Damos a esse valor a denominao de moda bruta.

Onde: l* = limite inferior da classe modal;


L*= limite superior da classe modal.
Exemplo: Calcule a estatura modal conforme a tabela abaixo.
Classes (cm) Frequncia
54 |---- 58 9
58 |---- 62 11
62 |---- 66 8
66 |---- 70 5
Resposta: A classe modal 58 |---- 62, pois a de maior frequncia.
l* = 58 e L* = 62
Mo = (58+62) / 2 = 60 cm (este valor estimado, pois no conhecemos o
valor real da moda).

71
H, para o clculo da moda, outros mtodos mais elaborados, como, por
exemplo, o que faz uso da frmula de Czuber:

Na qual:
l* o limite inferior da classe modal;
h* a amplitude da classe modal;
D1 = f* - f (ant.);
D2 = f* - f (post.);
Sendo:
f* a frequncia simples da classe modal;
f (ant.) a frequncia simples da classe anterior classe modal;
f (post.) a frequncia simples da classe posterior classe modal.

Exemplo: Considere a distribuio a seguir


Classes fi
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40
Temos:
D1 = 11 9 = 2 e D2 = 11 8 = 3;
Mo = 158 + 2 x 4 = 159,6 cm
2+3

72
3.3 Emprego da moda
A moda utilizada quando:
a. desejamos obter uma medida rpida e aproximada de posio;
b. quando a medida de posio deva ser o valor mais tpico da
distribuio.
Resolva:
1 Calcule a moda da distribuio de frequncia:
Classes fi
450 |---- 550 8
550 |---- 650 10
650 |---- 750 11
750 |---- 850 16
850 |---- 950 13
950 |---- 1050 5
1050 |---- 1150 1
Total 64

4 Mediana

A Mediana de um conjunto de valores, dispostos segundo uma ordem


(crescente ou decrescente), o valor situado de tal forma no conjunto que o
separa em dois subconjuntos de mesmo nmero de elementos.

Smbolo da mediana: Md
4.1 Dados no-agrupados
Dada uma srie de valores como, por exemplo:
{5, 2, 6, 13, 9, 15, 10}
De acordo com a definio de mediana, o primeiro passo a ser dado o da
ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}

73
Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de
elementos direita e esquerda. Neste caso o valor que divide a srie acima
em duas partes iguais o 9, logo a Md = 9.
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por
definio, qualquer dos nmeros compreendidos entre os dois valores centrais
da srie. Convencionou-se utilizar o ponto mdio.
.Mtodo prtico para o clculo da Mediana
a) Se a srie dada tiver nmero mpar de termos:
O valor mediano ser o termo de ordem dado pela frmula:
(n+1)/2

Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5}


1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5}
n = 9, logo (n + 1)/2 dado por (9 + 1) / 2 = 5, ou seja, o 5 elemento da srie
ordenada ser a mediana.
A mediana ser o 5 elemento = 2
b) Se a srie dada tiver nmero par de termos:
O valor mediano ser dado pela frmula:
. [( n/2 ) +( n/2+ 1 )] / 2
Obs.: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valor
correspondente.

Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}


1 - ordenar a srie {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
n = 10, logo a frmula ficar: [(10/2) + (10/2 + 1)] / 2
[(5 + 6)] / 2, ser na realidade (5 termo + 6 termo) / 2
Temos: 5 termo = 2 e 6 termo = 3
A mediana ser = (2 + 3) / 2, ou seja, Md = 2,5. A mediana no exemplo ser a
mdia aritmtica do 5 e 6 termos da srie.

74
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver
coincidncia da mediana com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, haver ou
no coincidncia da mediana com um dos elementos da srie. A
mediana ser sempre a mdia aritmtica dos 2 elementos centrais da
srie.
Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o
mesmo valor.
A mediana depende da posio e no dos valores dos elementos na srie
ordenada. Essa uma das diferenas marcantes entre mediana e mdia
(que se deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em {5, 7, 10, 13, 15}; a mdia = 10 e a mediana = 10
Em {5, 7, 10, 13, 65}; a mdia = 20 e a mediana = 10
Isto , a mdia do segundo conjunto de valores maior do que a do primeiro,
por influncia dos valores extremos, ao passo que a mediana permanece a
mesma.

4.2 Dados agrupados


Se os dados se agrupam em uma distribuio de frequncia, o clculo da
mediana se processa de modo muito semelhante quele dos dados no-
agrupados, implicando, porm, a determinao prvia das frequncias
acumuladas. Ainda aqui, temos que determinar um valor tal que divida a
distribuio em dois grupos que contenham o mesmo nmero de elementos.
Sem intervalos de classe
Neste caso, o bastante identificar a frequncia acumulada imediatamente
superior metade da soma das frequncias. A mediana ser aquele valor da
varivel que corresponde a tal frequncia acumulada.
- Quando o somatrio das frequncias for mpar o valor mediano ser o termo
de ordem dado pela frmula:

75
Exemplo considere a distribuio abaixo:
Varivel (xi) fi Fi
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 --

Como o somatrio das frequncias fi = 35, a frmula para calcular a mediana


ser: (35+1) / 2 = 18 termo.
Pela distribuio temos a mediana igual ao valor da varivel correspondente
ao 18 termo, ou seja, igual a 3.
- Quando o somatrio das frequncias for par o valor mediano ser o termo de
ordem dado pela frmula:

Exemplo - Calcule Mediana da tabela abaixo:

xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 --
Aplicando frmula acima teremos:
[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5
Logo, o valor da mediana para esta distribuio ser igual a 15,5.

76
Resolva:
1 Calcule a mediana da distribuio:
xi 2 4 6 8 10
fi 3 7 12 8 4

Com intervalos de classe


Neste caso, o problema consiste em determinar o ponto do intervalo em que
est compreendida a mediana.
Para tanto, temos inicialmente que determinar a classe na qual se acha a
mediana classe mediana.
Devemos seguir os seguintes passos:

Exemplo: Considere a distribuio a seguir


Classes fi Fi
50 |---- 54 4 4
54 |---- 58 9 13
58 |---- 62 11 24
62 |---- 66 8 32
66 |---- 70 5 37
70 |---- 74 3 40
Total 40 --

77
Temos: = 40 / 2 =.20
Logo,.a classe mediana ser a terceira classe, ou seja, 58 |---- 62 e com base
nesta classe temos ainda:
l* = 58........... F(ant) = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula acima, obtemos:
Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54
Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da
distribuio.
NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a
mediana ser o limite superior da classe correspondente.
Exemplo: Considere a distribuio a seguir

i Classes fi Fi
1 0 |---- 10 1 1
2 10 |---- 20 3 4
3 20 |---- 30 9 13
4 30 |---- 40 7 20
5 40 |---- 50 4 24
6 50 |---- 60 2 26
Total 26 --

Temos: = 26 / 2 =.13
Logo,.Md = L* = 30

4.3 - Emprego da Mediana


A mediana usada quando:
a. desejamos obter o ponto que divide a distribuio em duas partes iguais;
b. h valores extremos que afetam de maneira acentuada a mdia
aritmtica;
c. a varivel em estudo salrio.

78
Resolva:
1 Calcule a mediana da distribuio de frequncia:
CUSTO (R$) 450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150

fi 8 10 11 16 13 5 1

5 Posio Relativa da Mdia, Moda e Mediana


Quando uma distribuio simtrica, as trs medidas coincidem. Porm, a
assimetria torna-as diferentes e essa diferena tanto maior quanto maior a
assimetria. Assim, em uma distribuio em forma de sino, temos:
Media = Mediana = Moda, no caso da curva simtrica;
Moda < Mediana < Media, no caso da curva assimtrica positiva;
Media < Mediana < Moda, no caso da curva assimtrica negativa;

79
6 As Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio
central. No entanto, ela apresenta uma caracterstica, to importante quanto a
primeira: ela separa a srie em dois grupos que apresentam o mesmo
nmero de valores.
Assim, alm das medidas de posio que estudamos, h outras que,
consideradas individualmente, no so medidas de tendncia central, mas
esto ligadas mediana relativamente sua segunda caracterstica, j que se
baseiam em posio na srie. Essas medidas os quartis, os percentis e os
decis so, juntamente com a mediana, conhecidas pelo nome genrico de
separatrizes.
6.1 Os quartis

Denominamos quartis os valores de uma srie que a divide em quatro


partes iguais.

H, portanto, trs quartis:


a. O primeiro quartil (Q1) valor situado de tal modo na srie que uma
quarta parte (25%) dos dados menor que ele e as trs quartas partes
restantes (75%) so maiores.
b. O segundo quartil (Q2) evidentemente, valor que coincide com a
mediana (Q2 = Md).
c. O terceiro quartil (Q3) valor situado de tal modo na srie que as trs
quartas partes (75%) dos termos so menores que ele e uma quarta parte
restante (25%) maior.
Quando os dados so agrupados, para determinar os quartis usamos a
mesma tcnica do clculo da mediana, bastando substituir, na frmula da
mediana, por:

80
Sendo K o nmero de ordem do quartil. Assim temos:

Exemplo:

Classes fi Fi
150 |---- 154 4 4
154 |---- 158 9 13 (Q1)
158 |---- 162 11 24
162 |---- 166 8 32 (Q3)
166 |---- 170 5 37
170 |---- 174 3 40
Total 40 --

81
Resolva:

1. Complete os esquemas para o clculo do primeiro e do terceiro quartis da


distribuio de frequncia:

82
6.2 Os Decis

Denominamos decis os nove valores que separam uma srie em 10 partes


iguais.

Indicamos:
D1, D2, D3, ............, D9
evidente que:
D5= Q2 = Md

O clculo de um decil segue a mesma tcnica do clculo da mediana, porm, a


frmula ser substituda por:

10

Sendo K o nmero de ordem do decil. Assim temos:

10
D1

10
D3

83
Exemplo: Calcule o stimo decil

Classes fi Fi
150 |---- 154 4 4
154 |---- 158 9 13
158 |---- 162 11 24
162 |---- 166 8 32 (D7)
166 |---- 170 5 37
170 |---- 174 3 40
Total 40 --

Stimo Decil:
7 x fi/10 = 7 x 40/10 = 28 (28 termo)

D7 = 162 + (28 -24).4


8
D7 = 162 + 2 = 164

6.3 Os Percentis

Denominamos percentis os noventa e nove valores que separam uma srie


em 100 partes iguais.

Indicamos:
P1, P2, P3, ............, P99
evidente que:
P50= D5= Q2 = Md, P25= Q1, P75= Q3
O clculo de um percentil segue a mesma tcnica do clculo da mediana,
porm, a frmula ser substituda por:

84
Sendo K o nmero de ordem do percentil. Assim para o 27 percentil, temos:

Exemplo:
Considerando a distribuio de frequncia, temos para o oitavo percentil:

Classes fi Fi
150 |---- 154 4 4 (P8)
154 |---- 158 9 13
158 |---- 162 11 24
162 |---- 166 8 32
166 |---- 170 5 37
170 |---- 174 3 40
Total 40 --

85
Resolva:

1. Complete o esquema para o clculo do vigsimo percentil da distribuio:

86
EXERCCIOS
1 Com relao s propriedades da mdia aritmtica, moda e mediana,
marque V ou F nas sentenas abaixo.
( ) Multiplicando-se todos os elementos de uma srie por 5, sua mdia
permanece inalterada.
( ) A mediana de uma srie disposta em ordem crescente o termo que a
divide em trs partes iguais.
( ) A moda o valor da varivel que possui maior frequncia.
( ) A mediana de uma srie de 46 elementos a mdia dos valores do 23 e
do 24 termos desta srie, quando ela estiver disposta em ordem crescente.
( ) A mediana de uma srie de 33 elementos o valor do 17 termo desta
srie, quando ela estiver disposta em ordem decrescente.
( ) Dividindo-se todos os nmeros de uma srie com cinco elementos por 2,
sua mediana ficar multiplicada por 2.

2 - A mdia da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) NRA

3 - A mediana da srie {21, 13, 8, 15, 30, 12, 17, 3, 26, 10, 25, 16} igual a:
( ) 15 ( ) 12 ( ) 16 ( ) 14 ( ) 15,5

4 - A moda da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) NRA

5 Um supermercado tem 200 empegados, sendo 150 mulheres e 50 homens.


A media salarial das mulheres de 3 salrios mnimos e dos homens de 5
salrios mnimos. A mdia salarial dos empregados deste supermercado, em
salrios mnimos, :
a) 3,1 b) 3,2 c) 3,3 d) 3,4 e) 3,5

6 Sabe-se que a mdia aritmtica de 5 nmeros inteiros distintos,


estritamente positivos, 16. O maior valor que um desses nmeros pode
assumir :
a) 16 b) 20 c) 50 d) 70 e) 100

87
7 A mdia aritmtica dos elementos de um conjunto de 28 nmeros 27. Se
retirarmos desse conjunto trs nmeros, de valores 25, 28 e 30, a mdia
aritmtica dos elementos do novo conjunto :
a) 25,48 b) 26,38 c) 28,04 d) 26,62 e) 26,92

8 A distribuio de idades dos alunos de uma sala dada pelo grfico


abaixo.

Qual das alternativas representa melhor a mdia aritmtica das idades dos
alunos:
a) 16 anos e 10 meses b) 17 anos e 1 ms c) 17 anos e 5 meses d) 17 anos e 4
meses e) 18 anos e 2 meses

9 - Considere a distribuio de frequncias:

Classes Frequncias
02 |- 04 3
04 |- 06 k
06 |- 08 1001
08 |- 10 3k-12
10 |- 12 3
Total

Determine o valor de k para que a mdia, a moda e a mediana possuam


valores iguais.

88
10 - Considere a tabela de distribuio de frequncia a seguir, calcule a mdia,
a moda e a mediana das encomendas devolvidas em 35 correios de Fortaleza
no ms de abril de 2005:
N. DE
(fi)
CHEQUES
36 |---- 40 6
40 |---- 44 9
44 |---- 48 4
48 |---- 52 8
52 |---- 56 5
56 |---- 60 3
Total 35

11 Seja a tabela a seguir:

FREQUENCIAS
IDADE
ACUMULADAS
11 10
12 15
13 25
14 40
15 50

A mdia aritmtica vale:


a) 13,2 b) 14,2 c) 14,0 d) 14,5 e) 13,6
A moda e a mediana valem?

12 A produo diria de parafusos da Indstria Asterx Ltda. de 20 lotes,


cada um contendo 100.000 unidades. Ao escolher uma amostra de oito lotes,
o controle de qualidade verificou o nmero seguinte de parafusos com defeitos
em cada lote:

Amostra 1 2 3 4 5 6 7 8
Defeitos 300 550 480 980 1050 350 450 870
Pede-se:
a) Calcular a mdia diria de parafusos com defeitos;
b) Projetar o nmero total de parafusos com defeitos em um dia de
trabalho.

89
13 - Calcule a mdia, moda e a mediana das distribuies de frequncia
abaixo:

14 - Calcule o primeiro e o terceiro quartis de cada uma das distribuies de


frequncia do exerccio treze.

15 - Calcule o quarto e o nono decil de cada uma das distribuies de


frequncia do exerccio treze.

16 - Calcule o 1, o 10, o 15, o 23 e o 90 percentis da distribuio do item


b do exerccio treze.

90
17 - Uma pesquisa contemplando uma amostra de 54 estagirios da Empresa
Produtos Bons Ltda., revelou os salrios apresentados na tabela seguinte.
Faa a distribuio de frequncia com classes e baseado nela calcule:

497 497 499 500 498 502 501 504 537


505 506 508 508 507 503 508 508 520
510 511 511 511 517 519 511 512 534
512 513 513 513 521 527 514 516 526
518 520 520 523 531 530 524 524 535
525 526 528 529 501 528 530 532 536

a) O salrio mdio;
b) O salrio modal;
c) O salrio mediano;
d) Q3; D8; P73.

91
VII MEDIDAS DE DISPERSO OU VARIABILIDADE

1 Disperso ou variabilidade
Vimos anteriormente que um conjunto de valores pode ser convenientemente
sintetizado, por meio de procedimentos matemticos, em poucos valores
representativos mdia aritmtica, moda e mediana. Tais valores podem
servir de comparao para dar a posio de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j
convenientemente simplificados, necessrio ter-se uma ideia retrospectiva de
como se apresentavam esses mesmos dados nas tabelas.
Assim, no o bastante dar uma das medidas de posio para caracterizar
perfeitamente um conjunto de valores. Vemos, ento, que a mdia ainda que
considerada como um nmero que tem a faculdade de representar uma srie de
valores no pode, por si mesma, destacar o grau de homogeneidade que
existe entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de valores das variveis x, y e z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:
mdia da varivel x = 70;
mdia da varivel y = 70;
mdia da varivel z = 70;
Vemos ento que os trs conjuntos apresentam a mesma mdia aritmtica: 70.
Entretanto, fcil notar que o conjunto X mais homogneo que os
conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por
sua vez, mais homogneo que o conjunto Z, pois h menor diversificao
entre cada um de seus valores e a mdia representativa.
Chamando de disperso ou variabilidade a maior ou menor diversificao
dos valores de uma varivel em torno de um valor de tendncia central tomado
como ponto de comparao, podemos dizer que o conjunto X apresenta

92
disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso
ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior
ou menor disperso ou variabilidade entre esses valores e a sua medida de
posio, a Estatstica recorre s medidas de disperso ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, o Desvio-padro, a
Varincia e o Coeficiente de variao.

2 Amplitude Total
2.1 Dados no-agrupados

A Amplitude total a diferena entre o maior e o menor valor observado:


AT = X (max) - X (min)

Exemplo: para os valores: 40, 45, 48, 52, 54, 62 e 70


Temos: AT = 70 40 = 30, logo AT = 30.
Quando dizemos que a amplitude total dos valores 30, estamos afirmando
alguma coisa do grau de sua concentrao. evidente que, quanto maior a
amplitude total, maior a disperso ou variabilidade dos valores da varivel.
Relativamente aos trs conjuntos de valores (X, Y e Z) mencionados no incio
deste captulo, temos:
ATX = 70 70 = 0, (disperso nula)
ATY = 72 68 = 4
ATZ = 160 5 = 155
2.2 Dados agrupados
2.2.1 Sem intervalos de classe
Neste caso, ainda temos:

AT = X (max) - X (min)

93
Exemplo:
Considerando a tabela abaixo:

Xi fi
0 2
1 6
2 12
3 7
4 3
Total 30
Temos: AT = 4 0 = 4, logo AT = 4.

2.2.2 Com intervalos de classe


Neste caso, a amplitude total a diferena entre o limite superior da ltima
classe e o limite inferior da primeira classe:

AT = L (max) - l (min)

Exemplo:
Considerando a distribuio de frequncia abaixo:

Classes fi
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40
Temos:
AT = 174 150 = 24, logo: AT = 24 cm.
A amplitude total tem o inconveniente de s levar em conta os dois valores
extremos da srie, descuidando do conjunto de valores intermedirios, o que
quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao
aproximada da disperso ou variabilidade.

94
3 Varincia e Desvio-padro
3.1 Introduo:
A varincia e o desvio-padro levam em considerao a totalidade dos valores
da varivel em estudo, o que faz delas ndices de variabilidade bastante
estveis e, por isso mesmo, os mais geralmente empregados.
A varincia uma medida que tem pouca utilidade como estatstica descritiva,
porm extremamente importante na inferncia estatstica e em combinaes
de amostras.

A varincia baseia-se nos desvios em torno da mdia aritmtica, porm


determinando mdia aritmtica dos quadrados dos desvios. Assim,
representando a varincia por s2, temos:

Quando se tratar de uma amostra devemos usar no denominador n 1.


Sendo a varincia calculada a partir dos quadrados dos desvios, ela um
nmero em unidade quadrada em relao varivel em questo, o que, sob o
ponto de vista prtico inconveniente.

Por isso mesmo, imaginou-se uma nova medida que tem utilidade e
interpretaes prticas, denominada desvio-padro, definida como a raiz
quadrada da varincia e representada por S.

Quando se tratar de uma amostra devemos usar no denominador n 1.

95
NOTA:
Tanto o desvio-padro como a varincia so usados como medidas de
disperso ou variabilidade. O uso de uma ou de outra depender da
finalidade que se tenha em vista.
Outra frmula bastante utilizada para calcular o desvio-padro de uma
populao :

3.2 Propriedades do desvio-padro


O desvio padro uma medida que s pode assumir valores no negativos e
quanto maior for o seu valor, maior ser a disperso dos dados.
Algumas propriedades do desvio padro, que resultam imediatamente da
definio, so:
Somando-se (ou subtraindo-se) uma constante a todos os valores de
uma varivel, o desvio padro no se altera.
yi = xi c sy = sx
Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por
uma constante (diferente de zero), o desvio padro fica multiplicado
(ou dividido) por essa constante.
yi = xi . c sy = sx . c
O desvio padro sempre no negativo e ser tanto maior, quanto mais
variabilidade houver entre os dados.
Se s = 0, ento no existe variabilidade, isto , os dados so todos
iguais.
Essas propriedades nos permitem introduzir, no clculo do desvio padro
simplificaes teis.
Para o clculo do desvio-padro, consideremos os seguintes casos:

96
3.3 Dados no-agrupados
Devemos empregar uma das duas frmulas mostradas para clculo do desvio-
padro.
Exemplo: Calcular o desvio padro da populao representada por:
Populao = {10, 6, 1, 3, 5}
xi
10 5 5 25
6 5 1 1
1 5 -4 16
3 5 -2 4
5 5 0 0
-- -- = 46

Usando a frmula:

Sabemos que n = 5 e que / n = 46 / 5 = 9,2.


Logo, a raiz quadrada de 9,2 o desvio padro, S = 3,03
Obs.: Podemos tambm calcular utilizando a outra frmula possvel.
Quando nosso interesse no se restringe descrio dos dados, mas, partindo
da amostra, visamos tirar inferncias vlidas para a respectiva populao,
convm efetuar uma modificao, que consiste em usar o divisor (n 1) em
lugar de n. A frmula ficar ento:

Exemplo: Se os dados 10, 6, 1, 3 e 5 representassem uma amostra o desvio


padro amostral seria a raiz quadrada de 46 / (5 -1) = 3,39

97
Resolva:
1 - Calcule o desvio padro, dados os valores da varivel: 8, 10, 11, 15, 16, 18.
2 - Comprove a primeira propriedade do desvio padro somando 5 a cada
valor da varivel do exerccio 1.
3 Comprove a segunda propriedade do desvio padro multiplicando por 2
cada valor da varivel do exerccio 1.
3.4 Dados agrupados
Quando os dados esto agrupados (temos a presena de frequncias) a frmula
do clculo do desvio padro para uma populao ficar:

Quando se trata de uma amostra devemos usar a seguinte frmula:

Podemos tambm calcular o desvio-padro populacional pela seguinte


frmula:

Exemplo: Calcule o desvio padro populacional da tabela abaixo:


xi fi x i . fi . fi
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 -- Somatrio 32,70

98
Sabemos que fi = 30 e . f i / n = 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 o desvio padro, ou seja, s = 1,044.
Se considerarmos os dados como sendo de uma amostra o desvio padro seria:
A raiz quadrada de 32,7 / (30 -1) = 1,062.
Obs.: Nas tabelas de frequncias com intervalos de classe a frmula a ser
utilizada a mesma do exemplo anterior.
No exemplo anterior a varincia igual a:
a) Para a populao
S2 = (1,044)2 = 1,09
b) Para a amostra:
S2 = (1,062)2 = 1,13

3.5 Entendendo o significado do desvio-padro:


Em termos simples, desvio-padro um modo de representar a disperso dos
dados ao redor da mdia. Se os dados obedecerem a uma distribuio normal,
todos estaro compreendidos por uma curva em forma de sino; eles se
distribuiro simetricamente ao redor da mdia.
O quadro a seguir mostra os dados contidos entre desvio-padro para ambos
os lados da mdia.

Mdia + ou ( ) desvio- % da populao includa Grosseiramente


padro
1 68,3 2/3 da populao
1,96 95,0
2 95,5 95 % da populao
2,58 99,0
3 99,7 100 % da populao

99
1 - Aproximadamente 68% dos dados esto no intervalo

2 - Aproximadamente 95% dos dados esto no intervalo

100
4 Coeficiente de Variao

O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro
de duas unidades pode ser considerado pequeno para uma srie de valores cujo
valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode
ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade
dos dados limita o seu emprego quando desejamos comparar duas ou mais
sries de valores, relativamente sua disperso ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a
disperso ou variabilidade dos dados em termos relativos a seu valor mdio,
medida essa denominada coeficiente de variao (CV):

Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivduos:
Varivel S

Estatura 175 cm 5,0 cm


Peso 68 Kg 2,0 Kg
Temos:
CVE = (5/175) x 100 = 2,85%
CVP = (2/68) x 100 = 2,94%
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso
que as estaturas.

101
EXERCCIOS
1 Com relao s propriedades do desvio-padro, coloque V ou F nas
sentenas abaixo:
( ) O desvio padro pode assumir qualquer valor numrico.
( ) O desvio - padro representa o grau de variabilidade de um conjunto de
dados, ou seja, quanto maior o valor do desvio-padro mais compactos so
seus dados.
( ) Quando o valor do desvio-padro zero, todos os valores do conjunto de
dados so iguais, no h variao entre eles.
( ) Quando multiplicarmos uma constante a um conjunto de dados, podemos
afirmar que seu desvio-padro fica multiplicado por essa constante, assim
como sua mdia.
( ) Quando somamos uma constante K a um conjunto de dados, podemos
afirmar que seu desvio-padro e sua mdia permanecem inalterados.
( ) Para calcularmos o desvio-padro e a varincia para uma populao e para
uma amostra, devemos proceder da mesma maneira.
2 Considere o conjunto de A = {3, 5, 6, 8}, que tem mdia igual a 5,5 e
desvio-padro igual a 2,08. Sobre o conjunto B = {9, 15, 18, 24} podemos
afirmar que:
( ) Sua mdia e seu desvio-padro no se alteram.
( ) A mdia permanece a mesma e seu desvio-padro fica multiplicado por 3.
( ) Seu desvio-padro o mesmo e a mdia fica multiplicada por 3.
( ) Tanto a mdia como o desvio-padro ficam multiplicados por 3.
( ) Nada podemos afirmar em relao a mdia e seu desvio-padro.

3 - Considere os seguintes conjuntos de nmeros:


A = {10, 20, 30, 40, 50} B = {100, 200, 300, 400, 500}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?

4 - Dados os conjuntos de nmeros:


A = {220, 230, 240, 250, 260} B = {20, 30, 40, 50, 60}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?

102
5- Dados os conjuntos de nmeros:
A = {-2, -1, 0, 1, 2 } B = {220, 225, 230, 235, 240}
Podemos afirmar, de acordo com as propriedades do desvio padro, que o
desvio padro de B igual:
a) ao desvio padro de A;
b) ao desvio padro de A, multiplicado pela constante 5;
c) ao desvio padro de A, multiplicado pela constante 5, e esse resultado
somado a 230;
d) ao desvio padro de A mais a constante 230.

6 Calcule a amplitude total dos conjuntos de dados:


a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) -10, -6, 2, 3, 7, 9, 10

7 Considere a populao A = {1, 3, 7, 9, 6} calcule seu desvio-padro e a


varincia.

8 Considere a amostra B = {2, 5, 6, 13, 7, 8} calcule sua mdia, o desvio-


padro e a varincia.

9 - Considere a distribuio de frequncia transcrita a seguir como de uma


populao. Calcule seu desvio-padro e sua varincia.

PESO (kg) fi
41 3
43 1
50 2
54 1
57 1
60 2
TOTAL 10

103
10 - Considere a seguinte amostra, faa a distribuio de frequncia por
classes e calcule o desvio-padro e a varincia.
A = (45, 43, 41, 42, 68, 42, 43, 42, 44, 41, 50, 46, 50, 46, 51, 60, 62, 54, 55,
52,64, 58, 57, 58, 67, 60, 51, 70, 65, 61).

11 - O grfico a seguir indica a massa de uma populao de objetos.


Acrescentando-se ao grupo n objetos de massa igual a 4 kg cada, sabe-se que a
media no se altera, mas o desvio padro se reduz metade do que era. Nessas
condies, calcule o valor de n.

12 - Medidas as estaturas de 1017 indivduos, obtivemos media igual a 162,2


cm e desvio padro de 8,01 cm. O peso mdio desses indivduos 52 kg, com
um desvio padro de 2,3 kg. Esses indivduos apresentam maior variabilidade
em estatura ou peso?
13 - Um grupo de cem estudantes tem uma estatura mdia de 163,8 cm, com
um coeficiente de variao de 3,3%. Qual o desvio padro desse grupo?
14 Uma distribuio apresenta as seguintes estatsticas: s = 1,5 e CV = 2,9%.
Determinar a mdia da distribuio.

104
VIII - PROBABILIDADE
1 - Introduo
Neste captulo, presumiremos que a populao conhecida e calcularemos as
chances de obter vrias amostras desta populao. Assim, mostraremos que a
probabilidade o reverso da estatstica: na probabilidade usaremos a
informao da populao para inferir a natureza provvel da amostra.
Sendo assim, as situaes marcadas pela possibilidade de ocorrncia de mais
de um resultado possvel costumam ser analisadas em estatstica com o auxlio
das probabilidades. A probabilidade estuda o risco e o acaso em eventos
futuros, determinando se provvel ou no o seu acontecimento.
O clculo das probabilidades pertence ao campo da Matemtica, entretanto a
maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou
probabilstica. O conhecimento dos aspectos fundamentais do clculo da
probabilidade uma necessidade essencial para o estudo da Estatstica
Indutiva ou Inferencial.
Para estudar probabilidades, necessrio definir alguns conceitos e
terminologias usuais, como os relativos a experimento aleatrio, espao
amostral e eventos.

2 - Experimento Aleatrio
Suponha que uma moeda foi jogada uma vez e deu cara. O resultado que
vemos e registramos chamado de observao, ou medio, e o processo de
realizar uma observao chamado de experimento. Baseado neste exemplo,
enunciamos a definio de experimentos aleatrios:
So fenmenos que, mesmo repetidos vrias vezes sob condies
semelhantes, apresentam resultados imprevisveis. O resultado final depende
do acaso.

Como exemplos de experimentos aleatrios, podem ser citados:


E1: Joga-se um dado e observa-se o nmero mostrado na face de cima.
E2: Joga-se uma moeda trs vezes e observa-se o nmero de caras obtido.
E3: Em uma linha de produo, fabricam-se peas em srie e conta-se o
nmero de peas defeituosas produzidas em um perodo de 24 horas.

105
importante destacar que os experimentos mencionados possuem algumas
caractersticas em comum:
a) Cada experimento poder ser repetido indefinidamente sob
condies essencialmente inalteradas;
b) Muito embora no seja possvel afirmar que resultado particular
ocorrer, pode-se descrever o conjunto de todos os possveis
resultados do experimento;
c) Quando o experimento for executado repetidamente, os resultados
individuais parecero ocorrer de forma acidental. Porm, quando o
experimento for repetido um grande nmero de vezes, uma
configurao definida ou uma regularidade surgir.

3 - Espao Amostral
Um conjunto de resultados totais pode ser obtido ao ser realizada uma
experincia aleatria, embora um e somente um resultado possa ser obtido por
vez. Logo, por espao amostral, entende-se:

Ao conjunto de resultados possveis de um experimento aleatrio damos o


nome de espao amostral ou conjunto universo, representado por S.

.
Considerando os quatros experimentos aleatrios citados no item anterior, o
espao amostral para cada um deles pode ser descrito, respectivamente, por:
S1: {1; 2; 3; 4; 5; 6}
S2: {0; 1; 2; 3}
S3: {0; 1; 2; 3; .........; N}

Cada elemento do espao amostral que corresponde a um resultado recebe o


nome de ponto amostral. No primeiro exemplo: o nmero 1 pertence ao
espao amostral {1}.

4 - Eventos

Quando o espao amostral for finito ou infinito numervel, todo subconjunto


poder ser considerado um evento. No entanto, se o espao amostral for
infinito no numervel, surgir uma dificuldade terica na identificao e
apresentao de eventos. Logo, podemos definir evento como:

Qualquer subconjunto do espao amostral S de um experimento aleatrio.

106
Em relao aos quatro experimentos aleatrios apresentados inicialmente,
podem ser citados, respectivamente, como os eventos abaixo:
A1: {2; 4; 6}; isto , um nmero par ocorre.
A2: {2}; isto , duas caras ocorrem.
A3: {0}; isto , todas as peas so perfeitas.

Se considerarmos S como espao amostral e A como evento, qualquer que


seja A, se A est contido em S, ento A um evento de S. Em particular:
Se A = S, A chamado de evento certo.
Se A est contido em S e A um conjunto unitrio, A chamado de
evento elementar.
Se A = , A chamado de evento impossvel.

Nos itens anteriores aprendemos as definies e exemplos de experimento


aleatrio, espao amostral e eventos. No item a seguir, usaremos estas
definies para enunciar o conceito de probabilidade.

5 - Probabilidade
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos
admitir que todos os elementos de S tenham a mesma chance de acontecer, ou
seja, que S um conjunto equiprovvel.

Aplicar probabilidade significa us-la em situaes em que no se pode prever


um resultado futuro. Os resultados so incertos, regidos pelo acaso. Observe
os exemplos a seguir:
1- No lanamento de uma moeda qual a probabilidade de obter cara em um
evento A?
S = {ca, co} = 2 A = {ca} = 1 P (A) = 1/2 = 0,5 = 50%

107
2 - No lanamento de um dado qual a probabilidade de obter um nmero par
em um evento A?
S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%
3 - No lanamento de um dado qual a probabilidade de obter um nmero
menor ou igual a 6 em um evento A?
S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%
Obs.: a probabilidade de todo evento certo igual a 1 ou 100%.
4 - No lanamento de um dado qual a probabilidade de obter um nmero
maior que 6 em um evento A?
S = {1,2,3,4,5,6} = 6 A={ }=0 P (A) = 0/6 = 0 = 0%
Obs.: a probabilidade de todo evento impossvel igual a 0 ou 0%

6 - Eventos Complementares
Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que
ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso),
para um mesmo evento existe sempre a relao:

p+q=1

Obs.: Em uma distribuio de probabilidades o somatrio das probabilidades


atribudas a cada evento elementar igual a 1, logo temos:
p1 + p2 + p3 + ... + pn = 1.
Exemplos:

1 Qual a probabilidade de no tirar o n 4 no lanamento de um dado?


Soluo: sabemos que a probabilidade de tirar o n 4 no lanamento aleatrio
de um dado p = 1/6 ou 16,67%. Logo, a probabilidade de no tirar q = 1 - p
ou q = 1 - 1/6 = 5/6 ou 83,33%.

2 - Calcular a probabilidade de um piloto vencer uma dada corrida, onde as


suas "chances", segundo os especialistas, so de "3 para 2". Calcule tambm a
probabilidade dele perder.

108
Soluo: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde
2. Ento p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder).

3 - Qual a probabilidade de tirar um nmero maior ou igual a dois no


lanamento de um dado?
Soluo: sabemos que neste evento s exclumos a possibilidade do resultado
do lanamento ser o n 1 e a probabilidade de tir-lo no lanamento de um
dado p = 1/6. Logo, a probabilidade do resultado obtido neste lanamento
ser maior ou igual a 2 q = 1 p, logo q = 1 - 1/6 = 5/6 ou 83,33%.

Aprendemos a distinguir eventos complementares, e que a probabilidade de


um evento acontecer somado probabilidade deste mesmo evento no
acontecer (complementar) sempre igual a 1 ou 100%. A seguir vamos definir
eventos independentes e calcular a probabilidade deles acontecerem.

7 - Eventos Independentes
Dizemos que dois eventos so independentes quando a realizao ou a no-
realizao de um dos eventos no afeta a probabilidade da realizao do outro
e vice-versa. Por exemplo, quando lanamos dois dados, o resultado obtido em
um deles independe do resultado obtido no outro.
Se dois eventos so independentes, a probabilidade de que eles se realizem
simultaneamente igual ao produto das probabilidades de realizao dos dois
eventos.
Assim, se p1 a probabilidade de realizao do primeiro evento e p2 a
probabilidade de realizao do segundo evento, a probabilidade de que tais
eventos se realizem simultaneamente dada por:

p = p1 x p2

Esta regra tambm conhecida como Teorema do produto, que se aplica nas
operaes multiplicativas de probabilidades. Operaes multiplicativas
geralmente envolvem a conjuno e, e so representadas pelo smbolo de
interseco .

Fique atento aos exemplos de eventos independentes abaixo:

109
1 Ao lanarmos dois dados, qual a probabilidade de obtermos o nmero 1 no
primeiro e o nmero 5 no segundo dado?
Soluo:
A probabilidade de obtermos 1 no primeiro dado : p1 = 1/6
A probabilidade de obtermos 5 no segundo dado : p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no
segundo :
p = 1/6 x 1/6 = 1/36 ou 2,78%

2 Qual a probabilidade da extrao de uma bola vermelha e uma bola branca


(nesta ordem) de uma urna com 6 bolas vermelhas e 4 bolas brancas, supondo
a reposio da primeira bola extrada antes da extrao da segunda bola?
Soluo:
A probabilidade de obtermos uma bola de cor vermelha na primeira extrao
: p1 = 6/10
A probabilidade de obtermos uma bola de cor branca na segunda extrao :
p2 = 4/10
Logo, a probabilidade da extrao das duas bolas:
p = 6/10 x 4/10 = 24/100 = 0,24 ou 24%

Aprendemos o que so eventos independentes e como calcular a probabilidade


desses eventos acontecerem. A seguir vamos definir eventos mutuamente
exclusivos e calcular a probabilidade deles acontecerem.

8 - Eventos Mutuamente Exclusivos


Dizemos que dois ou mais eventos so mutuamente exclusivos quando a
realizao de um dos eventos exclui a realizao do(s) outro(s).
Assim, quando lanamos uma moeda, o evento tirar cara e o evento tirar
coroa so mutuamente exclusivos, j que, ao se realizar um deles, o outro no
se realiza.
Se dois eventos so mutuamente exclusivos, a probabilidade de que um ou
outro se realize igual soma das probabilidades de que cada um deles se
realize:
p = p1 + p2
Esta regra tambm conhecida como Teorema da soma, que se aplica nas
operaes aditivas de probabilidades. Operaes aditivas geralmente
envolvem a expresso ou e so representadas pelo smbolo de unio U.

110
Veja os exemplos apresentados a seguir, em que os eventos so classificados
como mutuamente exclusivos ou excludentes.

a) Extrair uma carta vermelha e extrair uma carta de paus de um


baralho. Como paus um naipe preto, os eventos so mutuamente
excludentes;

b) Extrair uma carta vermelha e extrair uma carta preta de um baralho.


Como no possvel que uma carta seja das duas cores ao mesmo tempo, os
eventos so mutuamente excludentes;

c) Extrair cara e extrair coroa do lance de uma moeda. Como no


possvel que uma face seja cara e coroa ao mesmo tempo, os eventos so
mutuamente excludentes;

d) Extrair face par e extrair o nmero cinco do lance de um dado. Como


cinco um nmero mpar, os eventos so mutuamente excludentes.

Fique atento ao clculo da probabilidade de eventos mutuamente excludentes:


1 Ao lanarmos um dado, qual a probabilidade de obtermos o nmero 3 ou o
nmero 5?
Soluo:
A probabilidade de obtermos o nmero 3 : p1 = 1/6
A probabilidade de obtermos o nmero 5 : p2 = 1/6
Logo, a probabilidade de obtermos o nmero 3 ou o nmero 5 :
p = 1/6 + 1/6 = 2/6 = 1/3 ou 33,33%

2 Ao lanarmos uma moeda, qual a probabilidade de obtermos cara ou


coroa?
Soluo:
A probabilidade de obtermos cara : p1 = 1/2
A probabilidade de obtermos coroa : p2 = 1/2
Logo, a probabilidade de obtermos cara ou coroa :
p = 1/2 + 1/2 = 2/2 = 1 ou 100% (evento certo)

3 Qual a probabilidade da extrao de uma bola vermelha ou branca de uma


urna que contm 6 bolas vermelhas, 4 bolas brancas e 5 pretas?
Soluo:
A probabilidade de obtermos uma bola vermelha : p1 = 6/15

111
A probabilidade de obtermos uma bola branca : p2 = 4/15
Logo, a probabilidade da extrao de uma bola vermelha ou branca :
p = 4/15 + 6/15 = 10/15 ou 66,67%

Exerccios Resolvidos

1 Qual a probabilidade de sair o s de ouros quando retirarmos uma carta de


um baralho de 52 cartas?
Resposta: Como s h um s de ouros, o nmero de elementos do evento 1;
logo: p = 1/52 ou 1,92%.

2 Qual a probabilidade de sair um rei quando retirarmos uma carta de um


baralho de 52 cartas?
Resposta: Como h quatro reis no baralho, o nmero de elementos do evento
4; logo: p = 4/52 = 1/13 ou 7,69%.

3 Em um lote de 12 peas, 4 so defeituosas. Sendo retirada uma pea ao


acaso, calcule:
a. A probabilidade dessa pea ser defeituosa
Resposta: Temos p = 4/12 = 1/3 ou 33,33%.
b. A probabilidade dessa pea no ser defeituosa
Resposta: Temos p = 1 - 1/3 = 2/3 ou 66,67%.

4 No lanamento de dois dados, calcule a probabilidade de se obter soma


igual a 5.
Resposta: O evento formado pelos elementos (1,4), (2,3), (3,2) e (4,1). Como
o nmero de elementos de S 36, temos: p = 4/36 = 1/9 ou 11,11%.

5 De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do


primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do
primeiro baralho ser um rei e a do segundo ser o 5 de paus?
Resposta: Como h quatro reis no baralho, o nmero de elementos do evento
4; logo: p1 = 4/52 = 1/13 e p2 = 1/52. Como esses dois acontecimentos so
independentes e simultneos, vem: p = 1/13 x 1/52 = 1/676 ou 0,15%.

6 Uma urna A contm: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B


contm: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contm: 2 bolas
brancas, 3 pretas e 4 verdes. Uma bola retirada de cada urna. Qual a

112
probabilidade de as bolas retiradas da primeira, segunda e terceira urnas
serem, respectivamente, branca, preta e verde?
Resposta: Temos: p1 = 3/9 = 1/3; p2 = 2/8= 1/4 e p3 = 4/9. Como esses trs
acontecimentos so independentes e simultneos, vem: p = 1/3 x 1/4 x 4/9 =
1/27 ou 3,70%.

7 De um baralho de 52 cartas retiram-se, ao acaso, duas cartas sem


reposio. Qual a probabilidade de a primeira carta ser o s de paus e a
segunda ser o rei de paus?
Resposta: A probabilidade de sair o s de paus na primeira carta p 1 = 1/52.
Aps a retirada da primeira carta, restam 51 cartas no baralho, j que a
carta retirada no foi reposta. Assim, a probabilidade de a segunda carta ser
o rei de paus p2 = 1/51. Como esses dois eventos so independentes, temos:
p = 1/52 x 1/51= 1/2652 ou 0,04%.

8 Qual a probabilidade de sair uma figura quando retiramos uma carta de um


baralho de 52 cartas?
Resposta: Temos pR = 4/52 = 1/13, pD = 1/13 pV = 1/13. Como esses eventos
so mutuamente exclusivos, vem: p = 1/13 + 1/13 + 1/13 = 3/13 ou 23,08%.

9 Qual a probabilidade de sair uma carta de copas ou de ouros quando


retiramos uma carta de um baralho de 52 cartas?
Resposta: Temos pC = 13/52 = 1/4, pO = 1/4. Como esses eventos so
mutuamente exclusivos, vem: p = 1/4 + 1/4 = 1/2 ou 50%.

10 No lanamento de um dado, qual a probabilidade de se obter um nmero


no-inferior a 5?
Resposta: A probabilidade de se ter um nmero no-inferior a 5 a
probabilidade de se obter 5 ou 6. Assim, p = 1/6 + 1/6 = 1/3 ou 33,33%.

11 So dados dois baralhos de 52 cartas. Tiramos, ao mesmo tempo, uma


carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de
tirarmos uma dama e um rei, no necessariamente nesta ordem?
Resposta: A probabilidade de tirarmos uma dama do primeiro baralho p =
4/52 = 1/13 e um rei do segundo p = 4/52 = 1/13, de acordo com o
problema: p1 = 1/13 x 1/13= 1/169.
A probabilidade de tirarmos um rei do primeiro baralho e uma dama do
segundo : p2 = 1/13 x 1/13= 1/169.
Como esses dois eventos so mutuamente exclusivos, temos: p = 1/169 +
1/169= 2/169 ou 1,18%.

113
12 Dois dados so lanados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
Resposta: A soma dever ser ento 10, 11 ou 12. Para que a soma seja 10, a
probabilidade (4,6); (5,5) e (6,4), logo: p = 3/36. Para que a soma seja 11,
a probabilidade (5,6) e (6,5), logo: p = 2/36. Para que a soma seja 12, a
probabilidade (6,6), logo: p = 1/36.
Como esses trs eventos so mutuamente exclusivos, temos: p = 3/36 + 2/36
+ 1/36 = 6/36 = 1/6 ou 16,67%.

EXERCCIOS

1- No lanamento de um dado temos S = {1, 2, 3, 4, 5, 6}. Formule os eventos


definidos pelas sentenas: (a) Obter um nmero par; (b) Obter um nmero
menor ou igual a 6; (c) Obter o nmero 4; (d) Obter um nmero maior que 6.

2 Construa o espao amostral do evento lance de um dado honesto. Em


relao ao espao amostral, calcule: (a) a probabilidade de ocorrer face cinco;
(b) a probabilidade de no ocorrer face trs.

3 Determine o espao amostral do evento extrao de uma carta de um


baralho honesto. Calcule a probabilidade de: (a) extrair uma carta de copas;
(b) extrair um rei; (c) extrair um valete de paus.

4 Um grupo de 20 pessoas formado por 12 homens e 8 mulheres. Em


relao ao sorteio de um elemento deste grupo, calcule: (a) a probabilidade de
ser homem; (b) a probabilidade de ser mulher.

5 Uma bola retirada ao acaso de uma urna que contm 12 bolas pretas, 16
verdes e 8 rosas. Calcule a probabilidade de: (a) no ser verde; (b) no ser
preta; (c) ser rosa.

6 Em um lote de 12 peas, quatro so defeituosas. Sendo retiradas


aleatoriamente duas peas, calcule: (a) a probabilidade de ambas serem
defeituosas; (b) a probabilidade de ambas no serem defeituosas; (c) a
probabilidade de ao menos uma ser defeituosa.

7 Uma moeda lanada trs vezes. Calcule a probabilidade de obtermos: (a)


trs caras; (b) duas caras e uma coroa; (c) uma cara somente; (d) nenhuma
cara; (e) pelo menos uma cara; (f) no mximo uma cara.

114
8 Uma urna contm 50 bolas idnticas. Sendo as bolas numeradas de 1 a 50,
determine a probabilidade de, em uma extrao ao acaso: (a) obtermos a bola
de nmero 27; (b) obtermos uma bola de nmero par; (c) obtermos uma bola
de nmero maior que 20; (d) obtermos uma bola de nmero menor ou igual a
20.

9 Um par de dados atirado. Encontre a probabilidade de que a soma seja


10 ou maior que 10 se: (a) um 5 aparece no primeiro dado; (b) um 5 aparece
pelo menos em um dos dados.

10 Um lote formado por dez peas boas, quatro com defeitos e duas com
defeitos graves. Uma pea escolhida ao acaso. Calcule a probabilidade de
que: (a) ela no tenha defeitos graves; (b) ela no tenha defeitos; (c) ela se boa
ou tenha defeitos graves.

11 Considere o mesmo lote do problema anterior. Retiram-se duas peas ao


acaso. Calcule a probabilidade de que: (a) ambas sejam perfeitas; (b) pelo
menos uma seja perfeita; (c) nenhuma tenha defeitos graves; (d) nenhuma seja
perfeita.

115
IX DISTRIBUIES BINOMIAL E NORMAL

Neste captulo apresentaremos dois modelos tericos de distribuio de


probabilidade, aos quais um experimento aleatrio estudado possa ser
adaptado, o que permitir a soluo de grande nmero de problemas prticos.

1 - Varivel Aleatria

Suponhamos um espao amostral S e que cada ponto amostral seja atribudo


um nmero. Fica, ento, definida uma funo chamada varivel aleatria,
indicada por uma letra maiscula, sendo seus valores indicados por letras
minsculas.

Assim, se o espao amostral relativo ao lanamento de duas moedas S =


{(Ca, Ca), (Ca, Co), (Co, Ca), (Co, Co)} e se X representa o nmero de
caras que aparecem, a cada ponto amostral podemos associar um nmero
para X, de acordo com a tabela abaixo:

PONTO
X
AMOSTRAL
(Ca, Ca) 2
(Ca, Co) 1
(Co, Ca) 1
(Co, Co) 0

2 Distribuio de Probabilidade
Consideremos a distribuio de frequncias relativa ao nmero de acidentes
dirios em um estacionamento:

N DE
FREQUENCIAS
ACIDENTES
0 22
1 5
2 2
3 1
TOTAL 30

116
Em um dia, a probabilidade de:
- no ocorrer acidente : p = 22/30 = 0,73 ou 73%
- ocorrer um acidente : p = 5/30 = 0,17 ou 17%
- ocorrerem dois acidentes : p = 2/30 = 0,07 ou 7%
- ocorrerem trs acidentes : p = 1/30 = 0,03 ou 3%
Podemos, ento, escrever:

N DE
PROBABILIDADES
ACIDENTES
0 0,73
1 0,17
2 0,07
3 0,03
TOTAL 1,00
Essa tabela denominada distribuio de probabilidade.

Seja X uma varivel aleatria que pode assumir os valores x 1, x2, x3, ....., xn. A
cada valor xi correspondem a probabilidade pi de ocorrncia de tais pontos no
espao amostral.
Assim, temos:
pi = 1
Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem
uma distribuio de probabilidade.

Assim, voltando a tabela inicial. Temos:

117
Logo, podemos escrever:

N DE CARAS (X) P(X)


0 1/4
1 2/4
2 1/4
1

Ao definir a distribuio de probabilidade, estabelecemos uma


correspondncia unvoca entre os valores da varivel aleatria X e os valores
da varivel P. Esta correspondncia define uma funo; os valores xi (i = 1, 2,
3, ...., n) formam o domnio da funo e os valores de pi (i = 1, 2, 3, ...., n), o
seu conjunto imagem.
Essa funo, assim definida, denominada funo probabilidade e
representada por:

f(x) = P(X = xi)

A funo P(X = xi) determina a distribuio de probabilidade de varivel


aleatria X.
Assim, ao lanarmos um dado, a varivel aleatria X, definida por pontos de
um dado, pode tomar os valores 1, 2, 3, ........., 6.
Como a cada um destes valores est associada uma e uma s probabilidade de
realizao e P(xi) = 1, fica definida uma funo de probabilidade, da qual
resulta a seguinte distribuio de probabilidade:

X P(X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
1

118
3 Distribuio Binomial
Eventos binomiais so marcados pela existncia de duas categorias,
mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes
significa que uma categoria implica a possibilidade da no-ocorrncia
simultnea da outra categoria. Por coletivamente exaustivas entende-se que a
unio de ambos os eventos resulta no espao amostral.
Exemplos de eventos binomiais podem ser fornecidos por meio de nmeros
pares e mpares no lanamento de um dado honesto, e por meio da extrao de
cartas vermelhas e pretas de um baralho.
Geralmente, em anlises estatsticas, os exemplos mais comuns de eventos
binomiais so aqueles que estabelecem situaes de sucesso e fracasso.
Situaes de sucesso correspondem quilo que se deseja estudar. Situaes de
fracasso correspondem ao complemento. Ou seja, quilo que no se deseja
estudar.
Vamos, neste item, considerar experimentos que satisfaam as seguintes
condies:
a. O experimento deve ser repetido, nas mesmas condies, um nmero
finito de vezes (n).
b. As provas repetidas devem ser independentes, isto , o resultado de uma
no deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possveis resultados: sucesso
e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a
probabilidade q (q = 1 p) do insucesso manter-se-o constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k
sucessos em n tentativas.
O experimento obteno de caras em cinco lanamentos sucessivos e
independentes de uma moeda satisfaz essas condies. Sabemos que, quando
da realizao de um experimento qualquer em uma nica tentativa, se a
probabilidade de realizao de um evento (sucesso) p, a probabilidade de
no-realizao desse mesmo evento (insucesso) 1 p = q.

119
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas
provas dada pela funo:

Na qual:
P (X = k) a probabilidade de que o evento se realize k vezes em n provas;
p a probabilidade de que o evento se realize em uma s prova sucesso;
q a probabilidade de que o evento no se realize no decurso dessa
insucesso;

Essa funo, denominada lei binomial, define a distribuio binomial.

Exerccios Resolvidos
1 Uma moeda lanada 5 vezes seguidas e independentes. Calcule a
probabilidade de serem obtidas 3 caras nessas 5 provas.

120
2 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A ganhar 4 jogos.

3 Uma moeda honesta, que apresenta a mesma probabilidade de cara ou


coroa, jogada quatro vezes. Deseja-se calcular a probabilidade de sair cara:
(a) uma vez; (b) trs vezes, (c) pelo menos uma vez.
Neste caso, sabe-se que n igual a 4 (nmero de lances da moeda); a
probabilidade de sair cara igual a meio, ou p = 0,50. A probabilidade de sair
coroa tambm igual a meio, ou q = 1 p = 1 0,50 = 0,50.
A varivel x varia para cada situao:
(a) Para calcular a probabilidade de ocorrer apenas uma cara, x = 1.
P(x = 1) = C4,1(0,50)1(0,50)4-1 = 0,25 ou 25%
(b) Para calcular a probabilidade de ocorrerem trs caras, x = 3.
P(x = 3) = C4,3(0,50)3(0,50)4-3 = 0,25 ou 25%
(c) Pelo menos uma vez implica na aceitao do nmero de caras igual a 1,
2, 3 ou 4, ou na probabilidade de x = 1, ou x = 2, ou x = 3, ou x = 4. Ou,
de forma mais fcil, pelo menos uma vez implica na aceitao de
qualquer resultado menos o resultado x = 0.
P(x 1) = P(x = 1) + P(x = 2) + P(x = 3) + P(x = 4) = 1 - P(x = 0)
P(x 1) = 1 - C4,0(0,50)0(0,50)4-0 = 1 - 0,0625 = 0,9375 ou 93,75%

121
4 A probabilidade de uma duplicata ser paga em dia de 70%. Escolhemos
ao acaso seis duplicatas para uma auditoria. Deseja-se calcular a probabilidade
de: (a) todas serem pagas em atraso; (b) Apenas uma ser paga em dia; (c)
todas serem pagas em dia.
Soluo: para resolver este problema podemos considerar como evento
sucesso i) duplicata paga em dia; ii) duplicata paga em atraso. Considerando a
primeira opo temos:
(a) Para calcular a probabilidade de todas serem pagas em atraso, ou
nenhuma ser paga em dia, temos x = 0.
P(x = 0) = C6,0(0,70)0(0,30)6-0 = 0,0007 ou 0,07%
(b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia,
temos x = 1.
P(x = 1) = C6,1(0,70)1(0,30)6-1 = 0,01 ou 1%
(c) Para calcular a probabilidade de todas as duplicatas serem pagas em
dia, temos x = 6.
P(x = 6) = C6,6(0,70)6(0,30)6-6 = 0,118 ou 11,8%

EXERCCIOS

1 Determine a probabilidade de obtermos exatamente 3 caras em 6 lances de


uma moeda.
2- Uma moeda lanada 20 vezes. Qual a probabilidade de sarem 8 caras?
3 Jogando-se um dado trs vezes, determine a probabilidade de se obter um
mltiplo de 3 duas vezes.
4 Numa criao de coelhos, 40% so machos. Qual a probabilidade de que
nasam pelo menos 2 coelhos machos num dia em que nasceram 20 coelhos?
5 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A:
a. Ganhar dois ou trs jogos;
b. Ganhar pelo menos um jogo.

122
6 A probabilidade de um atirador acertar o alvo em um nico tiro 2/3. Se
ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros?
7 Seis parafusos so escolhidos ao acaso da produo de certa mquina, que
apresenta 10% de peas defeituosas. Qual a probabilidade de serem
defeituosos dois deles?
8 Uma prova tipo teste tem 50 questes independentes. Cada questo tem 5
alternativas. Apenas uma das alternativas a correta. Se um aluno resolve a
prova respondendo a esmo as questes, qual a probabilidade de tirar nota 5?
9 Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com
reposio. Qual a probabilidade de que:
a. 2 sejam pretas?
b. Pelo menos 3 sejam pretas?
c. 10 sejam brancas?
10 A probabilidade de um arqueiro acertar o alvo com uma nica flecha
0,20. Lana 30 flechas no alvo. Qual a probabilidade de que:
a. Exatamente 4 acertem o alvo?
b. Pelo menos 3 acertem o alvo?
11 Considere 10 tentativas independentes de um experimento. Cada
tentativa admite sucesso com probabilidade 0,05. Seja X o nmero de
sucessos, calcular P (1< x 4).
12 Uma urna tem 10 bolas brancas e 40 pretas. Qual a probabilidade de que
em 30 bolas retiradas com reposio ocorram no mximo 2 brancas?
13 A probabilidade de um atirador acertar no alvo num nico tiro 1/4. O
atirador atira 20 vezes no alvo. Qual a probabilidade de acertar:
a. Exatamente 5 vezes?
b. Pelo menos 3 vezes?
c. Nenhuma vez?
d. No mximo 4 vezes?
14 Uma urna contm 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com
reposio. Qual a probabilidade de que:
a. No mximo 2 sejam brancas?
b. 3 sejam brancas?

123
15 A probabilidade de uma mquina produzir uma pea defeituosa, num dia,
de 0,1. Qual a probabilidade de que em 20 peas produzidas pela mquina
num dia, ocorram 3 defeituosas?
16 Estima-se que cerca de 30% dos frangos congelados contenham
suficiente nmero de bactrias salmonelas causadoras de doenas, se forem
assados inadequadamente. Um consumidor compra 12 frangos congelados.
Qual a probabilidade do consumidor ter mais de 6 frangos contaminados?

17 Acredita-se que 20% dos moradores das proximidades de uma grande


indstria siderrgica tem alergia aos poluentes lanados ao ar. Admitindo que
este percentual de alrgicos real (correto), calcule a probabilidade de que
pelo menos 4 moradores tenham alergia entre 13 selecionados ao acaso.

18 - Trs em cada quatro alunos de uma universidade fizeram cursinho antes


de prestar vestibular. Se 16 alunos so selecionados ao acaso, qual a
probabilidade de que:
(a) Pelo menos 12 tenham feito cursinho?
(b) No mximo 13 tenham feito cursinho?
(c) Exatamente 12 tenham feito cursinho?

19 - Admita que, respectivamente, 90% e 80% dos indivduos das populaes


A e B sejam alfabetizados. Se 12 pessoas da populao A e 10 da populao B
forem selecionadas ao acaso, qual a probabilidade de que pelo menos uma
no seja alfabetizada?
20 Uma pesquisa, com 420 casais que possuem cinco filhos, constatou que a
probabilidade de nascimento de meninos de 58%. Nestas 420 famlias com
cinco crianas cada uma, quantas se esperaria que tivessem:
a) Nenhuma menina;
b) Trs meninos;
c) Quatro meninos.
21 As pacientes diagnosticadas com certa doena tm 80% de chance de
serem curadas. Para um grupo de doze pacientes nessas condies, calcule a
probabilidade de:
a) Oito ficarem completamente curadas;
b) Entre trs (inclusive) e cinco (inclusive) no serem curadas;
c) No mais do que duas permanecerem com a doena.

124
22 Um vendedor de seguros vende aplices a 5 homens, todos da mesma
idade e de boa sade. De acordo com as tabelas atuariais, a probabilidade de
um homem, dessa idade particular, estar vivo daqui a 30 anos de 2/3.
Determinar a probabilidade de estarem ainda vivos daqui a 30 anos:
a) Todos os cinco homens;
b) Pelo menos 3;
c) Apenas 2;
d) Pelo menos 1.
23 Uma recente pesquisa detectou que 90% dos fumantes de uma regio
afirmaram desejar parar com seu vcio. Em uma amostra formada por dez
pessoas:
a) Qual a probabilidade de a maioria querer parar de fumar?
b) Qual a probabilidade de todos quererem parar de fumar?

24 Uma empresa comercial calcula que 5% de suas vendas no so


recebidas, em funo do recebimento de cheques sem fundos. Ao se analisar
uma amostra formada por oito vendas, qual a probabilidade de: (a) todas
serem pagas normalmente? (b) uma ou duas vendas, apenas, serem pagas? (c)
pelo menos trs vendas serem pagas normalmente? (d) todas as vendas no
serem pagas?

25 Existem treze jogos na Loteria Esportiva. Em cada um dos jogos,


determinado time pode ganhar ou empatar ou perder. Calcule a probabilidade
de um jogador que nada sabe sobre os times: (a) acertar todos os jogos; (b)
acertar pelo menos um jogo; (c) acertar pelo menos doze jogos. Use o maior
nmero de casas decimais nas respostas.

125
4 Distribuio Normal
Entre as distribuies tericas de varivel aleatria contnua, uma das mais
empregadas a distribuio normal. Consiste em uma distribuio contnua
de probabilidades, onde a apresentao da distribuio de frequncias f(x) de
uma varivel qualitativa x costuma apresentar-se em forma de sino e simtrica
em relao mdia.
O estudo da distribuio normal recebeu contribuies de matemticos
importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que
medies repetidas de uma mesma grandeza, como o dimetro de uma esfera
ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porm,
a apresentao das frequncias dos inmeros nmeros coletados sempre
resultava em uma curiosa curva em forma de sino. Das observaes surgiu o
nome curva normal dos erros.
Muitas das variveis analisadas na pesquisa socioeconmica correspondem
distribuio normal ou dela se aproximam.
O aspecto grfico da distribuio normal o da figura abaixo:

Os conceitos associados distribuio Normal so simples. Em torno da


mdia, valor central, registra-se alta concentrao de frequncias ou
probabilidade maior de ocorrncia. medida que nos afastamos da mdia, as
frequncias so reduzidas. A probabilidade de encontrarmos valores mais
distantes da mdia diminui. Quanto mais longe da mdia e dos valores
centrais, menores as frequncias e as probabilidades.

126
Para uma perfeita compreenso da distribuio normal, observe a figura e
procure visualizar as seguintes propriedades:

1) A varivel aleatria X pode assumir todo e qualquer valor real.


2) A representao grfica da distribuio normal uma curva em forma de
sino, que recebe o nome de curva normal ou de Gauss ou de Moivre.

3) A distribuio simtrica em torno da mdia ( )


4) A rea total limitada pela curva e pelo eixo das abscissas igual a 1 ou
percentagem de 100%, j que essa rea corresponde probabilidade de a
varivel aleatria X assumir qualquer valor real.
5) A curva normal assinttica em relao ao eixo das abscissas, isto ,
aproxima-se indefinidamente do eixo das abscissas sem, contudo, alcan-lo.

6) Como a curva simtrica em torno de , a probabilidade de ocorrer valor


maior do que a mdia igual probabilidade de ocorrer valor menor do que a
mdia, isto , ambas as probabilidades so iguais a 0,5 ou 50%. Escrevemos:
P(X > ) = P(X < ) = 0,5 ou 50%.

Quando temos em mos uma varivel aleatria com distribuio normal,


nosso principal interesse obter a probabilidade de essa varivel aleatria
assumir um valor em um determinado intervalo. Vejamos como proceder, por
meio de um exemplo concreto.
A distribuio Normal de varivel aleatria X depende dos parmetros da
media e do desvio padro, proveniente da varincia. Ento, pode ser tambm
representada desta maneira: X: N ( , S2), ou seja, X segue uma distribuio
Normal de media e varincia S2.
Exemplo: Seja X a varivel aleatria que representa os dimetros dos
parafusos produzidos por certa mquina. Vamos supor que essa varivel tenha
distribuio normal com mdia = 2 cm e desvio padro s = 0,04 cm.
Queremos conhecer a probabilidade de um parafuso tirado ao acaso ter um
dimetro com valor entre 2 e 2,05 cm.

127
fcil notar que essa probabilidade, indicada por: P(2< X < 2,05) corresponde
rea hachurada na figura:

O clculo direto dessa probabilidade exige um conhecimento de Matemtica


mais avanado do que aquele que dispomos no curso de ensino mdio.
Entretanto, podemos contornar facilmente esse problema. Basta aceitar, sem
demonstrao, que, se X uma varivel aleatria com distribuio normal de
mdia e desvio padro s, e ento a varivel z dada por:

tem distribuio normal reduzida, isto , tem distribuio normal de mdia


0 e desvio padro 1.
As probabilidades associadas distribuio normal padronizada so
encontradas em tabelas, no havendo necessidade de serem calculadas.
Em anexo, apresentada uma tabela de distribuio normal reduzida, que nos
d a probabilidade de Z tomar qualquer valor entre a mdia 0 e um dado valor
z, isto :
P(0 < Z < z)
Temos, ento, que se X uma varivel aleatria com distribuio normal de
mdia e desvio padro s, podemos escrever:

P( < X < x) = P(0 < Z < z), com

128
Voltemos, ento, ao nosso problema.
Queremos calcular P(2< X < 2,05). Para obter essa probabilidade, precisamos,
em primeiro lugar, calcular o valor de z que corresponde a varivel x = 2,05,
j que para x = 2 z = 0, pois = 2. Temos ento:
Z = 2,05 2 / 0,04 = 1,25
donde:
P(2 < X < 2,05) = P(0 < Z < 1,25)
Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25. Observe a
forma de entrada na tabela:
Na primeira coluna encontramos o valor 1,2 (nmero inteiro + 1 casa
decimal). Em seguida, encontramos, na primeira linha, o valor 5 (2 casa
decimal), que corresponde ao ltimo algarismo do nmero 1,25. Na
interseco da linha e coluna correspondentes encontramos o valor 0,3944, o
que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
Assim, a probabilidade de um parafuso fabricado por essa mquina apresentar
um dimetro entre a mdia = 2 e o valor x = 2,05 0,3944.
Escrevemos, ento:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.

129
Exerccios Resolvidos
1 Com base na tabela Z determine as probabilidades:
a. P(-1,25 < Z < 0)
A probabilidade procurada corresponde parte hachurada da figura:

Sabemos que: P(0 < Z < 1,25) = 0,3944


Pela simetria da curva, temos:
P(-1,25 < Z < 0) = P(0 < Z < 1,25) = 0,3944ou 39,44%.
b. P(-0,5 < Z < 1,48)
A probabilidade procurada corresponde parte hachurada da figura:

Temos que:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)
Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306
Obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21%

130
c. P(0,8 < Z < 1,23)
A probabilidade procurada corresponde parte hachurada da figura:

Temos que:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)
Como:
P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881
Obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26%

d. P(Z > 0,6)


A probabilidade procurada corresponde parte hachurada da figura:

Temos que:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)
Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258
Obtemos:
P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42%

131
e. P(Z < 0,92)
A probabilidade procurada corresponde parte hachurada da figura:

Temos que:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)
Como:
P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212,
Obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%.

2 Os salrios semanais dos operrios industriais so distribudos


normalmente, em torno da mdia de R$ 500,00, com desvio padro de R$
40,00. Calcule a probabilidade de um operrio escolhido ao acaso ter um
salrio semanal situado entre R$ 490,00 e R$ 520,00.
Devemos inicialmente, determinar os valores Z1 e Z2 da varivel de
distribuio normal reduzida.
Assim,
Z1 = 490 500 = - 0,25 e Z2 = 520 500 = 0,5
40 40
Como:
P(490 < X < 520) = P(- 0,25 < Z < 0,5) = P(- 0,25 < Z < 0) +
P( 0 < Z < 0,5)= 0,0987 + 0,1915 = 0,2902
, pois, de se esperar que, em mdia, 29,02% dos operrios tenham
salrios entre R$ 490,00 e R$ 520,00, ou seja, a probabilidade de um
operrio escolhido ao acaso ter salrio entre R$ 490,00 e R$ 520,00
de 29,02%.

132
EXERCCIOS
1 Sendo Z uma varivel com distribuio normal reduzida, baseado na
tabela Z calcule:
a. P(0 < Z < 1,44)
b. P(-0,85 < Z < 0)
c. P(- 1,48 < Z < 2,05)
d. P(0,72 < Z < 1,89)
e. P(Z > - 2,03)
f. P(Z > 1,08)
g. P(Z < - 0,66)
h. P(Z < 0,60)

2 Use a tabela Z para encontrar as seguintes probabilidades:


a. P (Z > 0,34)
b. P (Z < 1,85)
c. P (Z < - 1,24)
d. P (1,56 < Z < 2,37)
e. P (-0,37 < Z < 3,4)
f. P (Z > 1,08)
g. P (Z < - 0,66)
h. P (Z < -2,30 ou Z > 1,29)

3 seja X: N (100,25). Calcular


a. P (100 X 106)
b. P (89 X 107)
c. P (112 X 116)
d. P (X 108)
e. P (X 90)

4 Um teste padronizado de escolaridade tem distribuio normal com mdia


aritmtica de 100 e desvio padro de 10. Determine a probabilidade de um
indivduo submetido a esse teste e escolhido ao acaso ter nota:
a. Maior que 120
b. Maior que 80
c. Entre 85 e 115
d. Maior que 100
e. At qual nota apresenta 83,40% de probabilidade de acontecer

133
5 No exerccio anterior, qual a nota que apresenta 93,70% de probabilidade
de um aluno tirar acima dela?
6 As alturas de 20000 alunos de um colgio tm distribuio
aproximadamente normal, com media 1,64 m e desvio padro 0,16 m. Pede-se:
a) Qual o nmero esperado de alunos com altura superior a 1,52 m?
b) Qual o intervalo simtrico em torno da media, que conter 78% das
alturas dos alunos?
c) Qual a altura esperada, no qual 15036 alunos estejam abaixo dela?

7 Os pesos de 600 estudantes so normalmente distribudos com mdia


aritmtica de 65,3 kg e desvio padro de 5,5 kg. Determine o nmero de
estudantes que pesam:
a. Entre 60 e 70 kg
b. Mais que 63,2 kg
c. Menos que 68 kg

8 A durao de um componente eletrnico tem mdia de 850 dias e desvio


padro de 40 dias. Sabendo que a durao normalmente distribuda, calcule a
probabilidade de um componente escolhido ao acaso durar:
a. Entre 700 e 1.000 dias
b. Mais de 800 dias
c. Menos de 750 dias
9 Sendo X: N (50,16), determinar X, tal que:
a. P (X X) = 0,05
b. P (X X) = 0,99

10 Um fabricante de baterias sabe, por experincia passada, que as baterias


de sua fabricao tm vida mdia de 600 dias e desvio padro de 100 dias,
sendo que a durao tem aproximadamente distribuio Normal. O fabricante
oferece uma garantia de 312 dias, isto , troca as baterias que apresentarem
falhas nesse perodo. A fbrica produz mensalmente 10.000 baterias. Quantas
baterias ele dever trocar mensalmente pelo uso da garantia?

134
11 Uma fbrica de carros sabe que os motores de sua fabricao tm durao
normal com mdia de 150.000 km e desvio padro de 5.000 km. Qual a
probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa
firma, tenha um motor que dure:
a. Menos de 170.000 km?
b. Entre 140.000 e 165.000 km?
c. Se a fbrica substitui o motor que apresenta durao inferior garantia,
qual deve ser esta garantia para que a porcentagem de motores
substitudos seja inferior a 0,2%?

12 As pontuaes de QI seguem uma distribuio normal com uma


pontuao mdia de 100 e desvio padro de 15, isto , X ~ N (100,225).
Encontre a porcentagem de pessoas que se espera possuir uma pontuao de
QI:
a. De menos de 70?
b. Entre 80 e 120?
c. De mais de 50?
13 Os salrios dos diretores das empresas de So Paulo distribuem-se
normalmente com mdia de R$ 8.000,00 e desvio padro de R$ 500,00. Qual
a percentagem de diretores que recebem:
a. Menos de R$ 6.470,00?
b. Entre R$ 8.920,00 e R$ 9.380,00?
14 A quantidade de leo contida em cada lata fabricada por uma indstria
tem peso distribudo normalmente, com mdia de 990 g e desvio padro igual
a 10 g. Uma lata rejeitada no comrcio se tiver peso menor que 976 g.
a. Qual a probabilidade de que em 10 latas observadas, uma seja rejeitada?
b. Nas condies do item a, qual a probabilidade de que em 20 latas
observadas, 3 sejam rejeitadas?
15 Foi feito um estudo sobre a altura dos alunos da IFCE. Observou-se que
ela se distribui normalmente com mdia de 1,72 m e desvio padro de 5 cm.
Qual a porcentagem dos alunos com altura:
a. Entre 1,57 e 1,87 m?
b. Acima de 1,90 m?

135
16 Um estudo das modificaes dos preos, no atacado, de produtos
industrializados, mostrou que h distribuio normal com mdia de 50% e
desvio padro de 10%. Qual a porcentagem dos artigos que:
a. Sofreram aumentos superiores a 75%?
b. Sofreram aumentos entre 30% e 80%?
17 O volume de correspondncia recebido por uma firma quinzenalmente
tem distribuio normal com mdia de 4000 cartas e desvio padro de 200
cartas. Qual a percentagem de quinzenas em que a firma recebe:
a. Entre 3600 e 4250 cartas?
b. Mais de 4636 cartas?
c. Menos de 3400 cartas?

18 Numa fbrica foram instaladas 1000 lmpadas novas. Sabe-se que a


durao mdia das lmpadas de 800 horas e desvio padro de 100 horas,
com distribuio normal. Determinar a quantidade de lmpadas que duraro:
a. Menos de 500 horas?
b. Mais de 700 horas?
c. Entre 516 e 684 horas?

19 Suponha que o tempo necessrio para atendimento de clientes em uma


central de atendimento telefnico siga uma distribuio normal de mdia de 8
minutos e desvio padro de 2 minutos.
(a) Qual a probabilidade de que um atendimento dure menos de 5
minutos?
(b) E mais do que 9,5 minutos?
(c) E entre 7 e 10 minutos?
(d) 75% das chamadas telefnicas requerem pelo menos quanto tempo de
atendimento?
20 - Uma enchedora automtica de refrigerantes est regulada para que o
volume mdio de lquido em cada garrafa seja de 1000 cm3 e desvio padro de
10 cm3. Admita que o volume siga uma distribuio normal.
a) Qual a porcentagem de garrafas em que o volume de lquido menor
que 990 cm3?
b) Qual a porcentagem de garrafas em que o volume de lquido no se
desvia da mdia em mais do que dois desvios padres?
c) Se 10 garrafas so selecionadas ao acaso, qual a probabilidade de que,
no mximo, 4 tenham volume de lquido superior a 1002 cm3?

136
21 Suponha que as notas em certa disciplina esto normalmente distribudas
com mdia 5,0 e desvio padro 1,5:
a) determine o percentual de estudantes com nota superior a 8,0;
b) se a nota mnima para obter aprovao e 3,0, determine o percentual de
estudantes reprovados;
c) explique por que a probabilidade de um estudante dessa populao obter
nota acima de 9,8 praticamente zero.
22 Um fabricante de mquinas de lavar sabe, por longa experincia, que a
durao tem durao de suas mquinas tem distribuio normal com mdia de
1000 dias e desvio padro de 200 dias. O fabricante oferece uma garantia de 1
ano (365 dias) para o produto. Produz mensalmente 2000 mquinas. Quantas
mquinas ele espera trocar mensalmente pelo uso da garantia dada?

23 Um fabricante de produtos alimentcios vende um de seus produtos em


latas de 900 g de contedo lquido. Para embalar o produto, adquiriu uma
mquina que permite obter o peso desejado, com distribuio normal e desvio
padro de 10 g. O IPM (Instituto de Pesos e Medidas) exige que no mximo
5% das latas contenham menos do que o peso lquido nominal. Responda:
a) Se a mquina for regulada para 910 g, poder satisfazer esta exigncia
do IPM?
b) Qual dever ser a regulagem da mquina para que a exigncia do IPM
seja satisfeita?
c) Feita esta nova regulagem (item b), as latas so remetidas ao comrcio.
O IPM examina, ento, uma amostra de 20 latas em um supermercado.
Qual a probabilidade de encontrar pelo menos trs com o peso inferior ao
especificado na embalagem?
24 Um teste de aptido feito por pilotos de elite em treinamento inicial
requer que uma srie de operaes seja realizada em uma rpida sucesso.
Suponha que o tempo para completar o teste seja distribudo normalmente
com mdia de 80 minutos e desvio padro de 30 minutos. Para passar no teste,
o candidato deve complet-lo em menos de 70 minutos. Pede-se:
a) Se 200 candidatos fazem o teste, quantos so esperados passar no teste?
b) Se os 5% melhores candidatos sero alocados para aeronaves maiores,
quo rpido deve ser o candidato para que obtenha essa posio?

137
25 A distribuio dos pesos de porcos numa suinocultura pode muito bem
ser representada por uma distribuio normal, com mdia de 128,72 kg e
desvio padro de 32,46 kg. Um matadouro comprar 5000 porcos e pretende
classific-los de acordo com o peso, do seguinte modo: 18% dos mais leves
como pequenos, os 50% seguintes como mdios, os 22% seguintes como
grandes e os 10% mais pesados como extras. Quais os limites de peso para
cada classificao?
26 Um pesquisador verificou que em uma cidade do interior de So Paulo o
peso dos homens tem distribuio aproximadamente normal com mdia de 85
kg e desvio padro de 20 kg, enquanto o das mulheres tambm apresenta-se
normalmente distribudo, com mdia de 60 kg e desvio padro de 8 kg. Pede-
se: (a) sorteando-se um homem, qual a probabilidade de ele ter peso acima de
75 kg? (b) sorteando-se uma mulher, qual a probabilidade de ela ter peso
acima de 65 kg? (c) qual a probabilidade de uma pessoa ter peso acima de 65
kg, sendo ela sorteada de um grupo em que o nmero de mulheres o triplo
do de homens?

27 Antes de uma importante prova de Estatstica, o professor verificou que o


tempo dedicado aos estudos de reviso dos seus alunos seguia uma
distribuio aproximadamente normal, de media 12 horas e desvio padro de
1,5 hora. Pede-se:
a) Determinar o tempo de estudo que superado por 98,5% dos alunos?
b) Determinar a faixa em torno do valor mdio que contenha 90% dos
valores do tempo dedicados aos estudos.

28 Para ser aprovado em um exame de seletivo um candidato deve obter


nota superior a 8,2 em matemtica e superior a 9,5 em portugus. Sabendo que
as notas seguem uma distribuio normal, com media e varincia apresentados
na tabela seguinte, calcule quantos alunos de um grupo de 950 devem ser
aprovados neste processo seletivo.

PROVA MEDIA VARIANCIA


PORTUGUES 7,3 7,29
MATEMTICA 6,1 3,24

138
X CORRELAO E REGRESSO

1 - Introduo
Nos captulos anteriores, nossa preocupao era descrever a distribuio de
valores de uma varivel. Com esse objetivo, aprendemos a calcular medidas
de tendncia central e variabilidade.
Quando, porm, consideramos observaes de duas ou mais variveis, surge
um novo problema: as relaes que podem existir entre as variveis
estudadas. Nesse caso, as medidas estudadas no so suficientes.
Assim, quando consideramos variveis como peso e altura de um grupo de
pessoas, uso do cigarro e incidncia de cncer, vocabulrio e compreenso da
leitura, dominncia e submisso, procuramos verificar se existe alguma
relao entre as variveis de cada um dos pares e qual o grau dessa relao.
Para isso, necessrio o conhecimento de novas medidas.
Sendo a relao entre as variveis de natureza quantitativa, a correlao o
instrumento adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma
funo matemtica. A regresso o instrumento adequado para a
determinao dos parmetros dessa funo.
2 Correlao
2.1 Relao funcional e relao estatstica
Como sabemos, o permetro e o lado de um quadrado esto relacionados. A
relao que os liga perfeitamente definida e pode ser expressa por meio de
uma sentena matemtica:
2p = 4l,
onde 2p o permetro e l o lado do quadrado.
Atribuindo-se, ento, um valor qualquer a l, possvel determinar exatamente
o valor de 2p.
Consideremos, agora, a relao que existe entre o peso e a estatura de um
grupo de pessoas. evidente que essa relao no do mesmo tipo da
anterior; ela bem menos precisa. Assim, pode acontecer que a estaturas
diferentes correspondam pesos iguais ou que a estaturas iguais correspondam
pesos diferentes. Porm, em media, quanto maior a estatura, maior o peso.

139
As relaes do tipo permetro-lado so conhecidas como relaes funcionais
e as do tipo peso-estatura, como relaes estatsticas.

Quando duas variveis esto ligadas por uma relao estatstica, dizemos
que existe correlao entre elas.

2.2 Diagrama de disperso


Consideremos uma amostra aleatria, formada por dez dos 98 alunos de uma
classe da faculdade A e pelas notas obtidas por eles em Matemtica e
Estatstica:
Tabela 1- Notas de Matemtica e Estatstica da Faculdade A
Notas
Ns
Matemtica (xi) Estatstica (yi)
01 5,0 6,0
08 8,0 9,0
24 7,0 8,0
38 10,0 10,0
44 6,0 5,0
58 7,0 7,0
59 9,0 8,0
72 3,0 4,0
80 8,0 6,0
92 2,0 2,0
Representando, em um sistema coordenado cartesiano ortogonal, os pares
ordenados (xi,yi), obtemos uma nuvem de pontos que denominamos diagrama
de disperso. Esse diagrama nos fornece uma ideia grosseira, porm til, da
correlao existente:

140
2.3 Correlao linear
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximar
de uma reta. Dizemos, ento, que a correlao de forma elptica tem como
imagem uma reta, sendo, por isso, denominada correlao linear.
possvel verificar que a cada correlao est associada como imagem uma
relao funcional. Por esse motivo, as relaes funcionais so chamadas
relaes perfeitas.

Como a correlao em estudo tem como imagem uma reta ascendente, ela
chamada correlao linear positiva.
Assim, uma correlao :
Linear positiva se os pontos do diagrama tm como imagem uma
reta ascendente;
Linear negativa se os pontos do diagrama tm como imagem uma
reta descendente;
No-linear se os pontos tm como imagem uma curva.
Se os pontos apresentam-se dispersos, no oferecendo uma imagem
definida, conclumos que no h relao alguma entre as variveis em estudo.

141
Temos, ento:

2.4 Coeficiente de correlao linear


O instrumento empregado para a medida da correlao linear o coeficiente
de correlao. Esse coeficiente deve indicar o grau de intensidade da
correlao entre duas variveis e, ainda, o sentido dessa correlao (positivo
ou negativo).
Faremos uso do coeficiente de correlao de Pearson, que dado por:

onde n o nmero de observaes.


Os valores limites do coeficiente r so -1 e +1, isto , o valor de r pertence ao
intervalo [-1,+1].

142
Assim:
Se a correlao entre duas variveis perfeita e positiva, ento r = +1;
Se a correlao perfeita e negativa, ento r = -1;
Se no h correlao entre as variveis, ento r = 0.
Logicamente:
Se r = +1, h uma correlao perfeita e positiva entre as variveis;
Se r = -1, h uma correlao perfeita e negativa entre as variveis;
Se r = 0, ou no h correlao entre as variveis, ou a relao que
porventura exista no linear.
NOTAS:

Para que uma relao possa ser descrita por meio do coeficiente de
correlao de Pearson imprescindvel que ela se aproxime de uma funo
linear. Uma maneira prtica de verificarmos a linearidade da relao a
inspeo do diagrama de disperso: se a elipse apresenta salincias ou
reentrncias muito acentuadas, provavelmente trata-se de correlao
curvilnea.

Para podermos tirar algumas concluses significativas sobre o


comportamento simultneo das variveis analisadas, necessrio que:
0,6 | r | 1 (forte correlao entre as variveis).
Se 0,3 | r | < 0,6, h uma correlao relativamente fraca entre as variveis.
Se 0 < | r | < 0,3, a correlao muita fraca e, praticamente, nada podemos
concluir sobre a relao entre as variveis em estudo.
Vamos, ento, calcular o coeficiente de correlao relativo Tabela 1. O
modo mais prtico para obtermos r abrir, na tabela, colunas correspondentes
aos valores de xiyi, xi2 e yi2. Assim, temos a tabela a seguir:

143
Tabela 2 Clculo dos valores de xiyi, xi2 e yi2 (n = 10)

Matemtica Estatstica xiyi x i2 y i2


(xi) (yi)
5,0 6,0 30 25 36
8,0 9,0 72 64 81
7,0 8,0 56 49 64
10,0 10,0 100 100 100
6,0 5,0 30 36 25
7,0 7,0 49 49 49
9,0 8,0 72 81 64
3,0 4,0 12 9 16
8,0 6,0 48 64 36
2,0 2,0 4 4 4
= 65 = 65 = 473 = 481 = 475

Logo:

Da:
r = 0,91.
Resultado que indica uma correlao linear positiva altamente significativa
entre as duas variveis.

144
Resolva:

1. Complete o esquema de clculo do coeficiente de correlao para os valores


das variveis xi e yi:

145
3 Regresso
3.1 Ajustamento da reta
Sempre que desejamos estudar determinada varivel em funo de outra,
fazemos uma anlise de regresso.
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs
de um modelo matemtico, a relao entre as duas variveis, partindo de n
observaes das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de
varivel dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta relao entre essas variveis, ou seja,
vamos obter uma funo definida por:
Y = aX + b
onde a e b so os parmetros.
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada,
embora no perfeita, como, por exemplo, as que formam a tabela 2.
Da, temos:
Tabela 3 Valores das variveis xi e yi.
xi 5 8 7 10 6 7 9 3 8 2
yi 6 9 8 10 5 7 8 4 6 2
cujo diagrama de disperso dado por:

146
Podemos concluir, pela forma do diagrama, que se trata de uma correlao
retilnea, de modo a permitir o ajustamento de uma reta, imagem da funo
definida por:
Y = aX + b
Vamos, ento, calcular os valores dos parmetros a e b com a ajuda das
frmulas:

onde,

NOTA:

Como estamos fazendo uso de uma amostra para obtermos os valores dos
parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de
regresso. Sendo assim, escrevemos:

147
Formemos, ento, a tabela de valores:
Tabela 4 Clculo dos valores de xiyi e xi2 (n = 10).
(xi) (yi) xiyi x i2
5,0 6,0 30 25
8,0 9,0 72 64
7,0 8,0 56 49
10,0 10,0 100 100
6,0 5,0 30 36
7,0 7,0 49 49
9,0 8,0 72 81
3,0 4,0 12 9
8,0 6,0 48 64
2,0 2,0 4 4
= 65 = 65 = 473 = 481
Temos, assim:
a = 10x473 65x65 = 4730 4225 = 505 = 0,8632
10x481 (65)2 4810 4225 585

148
Assim, temos:

3.2 Interpolao e extrapolao


Voltando tabela 1, vemos que 4,0 no figura entre as notas de Matemtica.
Entretanto, podemos estimar a nota correspondente em Estatstica fazendo X =
4,0 na equao:

O mesmo acontece com a nota 1,0. Repetindo o procedimento, temos:

Como a nota 4,0 pertence ao intervalo [2,10], dizemos que foi feita uma
interpolao; e como a nota 1,0 no pertence ao intervalo [2,10], dizemos que
foi uma extrapolao.
NOTA:
Uma norma fundamental no uso das equaes de regresso a de nunca extrapolar,
exceto quando consideraes tericas ou experimentais demonstrem a possibilidade
de extrapolao.

149
Resolva:

1. Complete o esquema para o ajustamento de uma reta aos dados:

xi 2 4 6 8 10 12 14
yi 30 25 22 18 15 11 10

150
EXERCCIOS

1 Um grupo de pessoas fez uma avaliao do peso aparente de alguns


objetos. Com o peso real e a media dos pesos aparentes, dados pelo grupo,
obteve-se a tabela:

PESO REAL 18 30 42 62 73 97 120


PESO APARENTE 10 23 33 60 91 98 159
Calcule o ndice de correlao.

2 Considere os resultados de dois testes, X e Y, obtidos por um grupo de


alunos da escola A:

xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
a) Verifique, pelo diagrama, se existe correlao retilnea;
b) Em caso afirmativo, calcule o coeficiente de correlao;
c) Escreva, em poucas linhas, as concluses a que chegou sobre a relao
entre as variveis.
3 A tabela abaixo apresenta a produo de uma indstria:

ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988
QUANTIDADES (t) 34 36 36 38 41 42 43 44 46
Calcule:
a) O coeficiente de correlao;
Sugesto: para simplificar os clculos, use para o tempo uma varivel
auxiliar, por exemplo:
xi = xi - 1984
b) A reta ajustada;
c) A produo estimada para o ano de 1989.

151
4 A tabela abaixo apresenta valores que mostram como o comprimento de
uma barra de ao varia conforme a temperatura:

TEMPERATURA (C) 10 15 20 25 30
COMPRIMENTO (mm) 1003 1005 1010 1011 1014

Determine:
a) O coeficiente de correlao;
b) A reta ajustada a essa correlao;
c) O valor estimado do comprimento da barra para a temperatura de 18C;
d) O valor estimado do comprimento da barra para a temperatura de 35C;

5 A variao do valor da Unidade de Preos ao Consumidor - UPC,


relativamente a alguns meses de 2009, deu origem tabela:

MESES mai jun jul ago Set out nov


VALORES (R$) 10,32 10,32 11,34 11,34 11,34 12,22 12,22
Calcule:
a) O grau de correlao de correlao;
b) Estabelea a equao de regresso de Y sobre X;
c) Estime o valor da UPC para o ms de dezembro.
Sugesto: substitua os meses, respectivamente, por 1, 2, 3, ....., 7.

6 A partir da tabela:

xi 1 2 3 4 5 6
yi 70 50 40 30 20 10
a) Calcule o coeficiente de correlao;
b) Determine a reta ajustada;
c) Estime o valor de Y para X = 0.

152
7 Certa empresa, estudando a variao da demanda de seu produto em
relao variao de preo de venda, obteve a tabela:

PREO (xi) 38 42 50 56 59 63 70 80 95 110


DEMANDA (yi) 350 325 297 270 256 246 238 223 215 208
a) Determine o coeficiente de correlao;
b) Estabelea a equao da reta ajustada;
c) Estime o valor de Y para X = 60 e X = 120.

8 Pretendendo-se estudar a relao entre as variveis consumo de energia


eltrica (xi) e volume de produo nas empresas industriais (yi), fez-se uma
amostragem que inclui vinte empresas, computando-se os seguintes valores:

xi =11,34; yi = 20,72; xi2 = 12,16; yi2 =84,96; xiyi = 22,13

Determine:
a) O clculo do coeficiente de correlao;
b) A equao de regresso de Y para X;
c) A equao de regresso de X para Y.

153
REFERENCIAS

Bruni, Adriano Leal. Estatstica aplicada gesto empresarial. 1.ed. So


Paulo: Editora Atlas, 2007.

Crespo, Antonio Arnot. Estatstica fcil. 17.ed. So Paulo: Saraiva, 2002.

Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatstica. 4.ed.


So Paulo: Editora Atlas, 2003.

Morettin, Pedro A. Estatstica bsica. 5.ed. So Paulo: Saraiva, 2002.

Pinheiro, Joo Ismael D. Estatstica bsica: a arte de trabalhar com dados.


Rio de Janeiro: Elsevier, 2009.

Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonalves; Valter; Murolo,
Afrnio Carlos. Estatstica: Para os cursos de economia, Administrao e
Cincias Contbeis - 1. 3.ed. So Paulo: Editora Atlas, 1999.

Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatstica bsica. 2.ed. So


Paulo: Editora Atlas, 1985.

154
ANEXOS:
Tabela de Nmeros Aleatrios;
Tabela de Distribuio Normal.

155
TABELA DE NMEROS ALEATRIOS

C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29
L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4
L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2
L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0
L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4
L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0
L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1
L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2
L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3
L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6
L10 6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0
L11 4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9
L12 3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3
L13 2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2
L14 0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3
L15 9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5
L16 7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0
L17 8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9
L18 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8
L19 5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5
L20 3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4
L21 8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1
L22 1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2
L23 2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3
L24 4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4
L25 5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5
L26 2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8
L27 1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0
L28 0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8
L29 9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1

156
157