Anda di halaman 1dari 52

1

Curso:
Disciplina: Estatstica
Professor (a): Mariana Damasceno
Aluno (a):___________________________________________________


1 REVISO DE TPICOS DA MATEMTICA


1.1 Regras de Clculo Somatrio:

Usa-se a letra maiscula grega (Sigma) para denotar uma soma.
Ex
1
: Despesas (X) no ms com salrios de trs funcionrios $400,00; $410,00; $440,00:
3
a) X
i
= X
1
+ X
2
+ X
3
= 400,00 + 410,00 + 440,00
i=1
3
X
i
= $1.250,00
i=1
3
b)X
i
2
= X
1
2
+ X
2
2
+ X
3
2
= (400,00)
2
+ (410,00)
2
+ (440,00)
2
= 160.000 + 168.100 + 193.600
i=1

3
X
i
2
= 521.600,00
i=1

3

c)(X
i
)
2
= (1.250,00)
2
= 1.562.500,00
i=1



EX
2
: Produo de Computadores no perodo de 1 a 11 de Janeiro de 2007 da Fbrica P&W:
I X
i

1 8
2 2
3 3
4 6
5 7
6 8
7 9
8 4
9 5
10 4
11 1
Total 57

2
2
a) X
i
= X
1
+ X
2
= 8 + 2 = 10
i=1
4
b) X
i
= X
2
+ X
3
+ X
4
= 2+ 3 + 6 = 11
i=2
11
c) X
i
= X
7
+ X
8
+ X
9
+ X
10
+ X
11
= 9 + 4 + 5 + 4 + 1 = 23
i=7

d) X
i
= X
1
+ X
2
+ X
3
+ X
4
+ X
5
+ X
6
+ X
7
+ X
8
+ X
9
+ X
10
+ X
11
= 8 + 2 + 3 + ........+ 1 = 57

EX
3
: Relao Horas Trabalhadas com Salrio de cada Funcionrio da Empresa Power:
Funcionrio
(i)
Horas Trabalhadas
(f
i
)
Salrio Horrio
(X
i
)
1 1 $2
2 5 $3
3 7 $2
4 3 $4
5 3 $3

I f
i
X
i
X
i
2
f
i
X
i
f
i
X
i
2

1 1 2 4 2 4
2 5 3 9 15 45
3 7 2 4 14 28
4 3 4 16 12 48
5 3 3 9 9 27
f
i
= 19 X
i
= 14 X
i
2
= 42 f
i
X
i
= 52 f
i
X
i
2
= 152

(f
i
X
i
)
2
= (52)
2
= 2704

1.2 Relao do Clculo Somatrio com Constante:

a) CX = CX


Ex: 2X = 2X

= 2(57) = 114
ou = 2(8) + 2(2) + 2(3) + ......+ 2(1) = 2(8 + 2 + 3 + .....+1) = 2(57) = 114

n
b) C
i
= n . C
i=1


6

Ex: 5
i
= 6(5) ou 5 + 5 + 5 + 5 + 5 + 5 = 30

i=1


1.3 Relao do Clculo Somatrio com Variveis:

A soma de uma soma (ou diferena) de duas variveis igual soma (ou diferena) das
somaes individuais das duas variveis.

3

n n n
a) (X
i
2
+ Yi) = (X
i
2
) + Y
i

i=1 i=1 i=1


n n n
b) (X
i
- Y
i
) = X
i
- Y
i

i=1 i=1 i=1


Ex:
I X Y (X - Y)
1 8 5 3 (X Y) = 9
2 3 2 1
3 4 0 4 X - Y = 20 11 = 9
4 5 4 1
20 11 9

1.4 Arredondamento de Nmeros/Dados:
a) Nmeros com terminao acima de cinco Arredonda-se para o nmero imediatamente
superior.
Ex: 72,8 73
b) Nmeros com terminao abaixo de cinco Arredonda-se para o nmero imediatamente
inferior.
Ex: 72,814 72,81
c) Nmeros com terminao em cinco Usa-se, na prtica, aproximar para o nmero par que
precede o 5.
72,76 72,465 72,47
= =



= 72,46

183,57 183,575 183,58
= =



= 183,58

O arredondamento de nmeros reduz o mnimo de erros acumulados

III) Notao Cientfica:
Ex
1
: 10
1
= 10; 10
2
= 10x10 = 100; 10
5
= 10x10x10x10x10 = 100.000

Ex
2
: 10
0
= 1; 10
-1
= 0,1; 10
-2
= 0,01; 10
-5
= 0,00001

Ex
3
: 864.000.000 = 8,64 x 10
8
; 0,00003416 = 3,416 x 10
-5



4
No Clculo:
a) (10
p
).(10
q
) = 10
p+q

b) 10
p
= 10
p-q

10q

Ex
1
: (10
3
).(10
2
) = 1.000 x 100 = 100.000 = 10
5


Ex
2
: 10
6
= 1.000.000 = 100 = 10
2

10
4
10.000

Ex
3
: (4.000.000).(0,0000000002) = (4 x 10
6
).(2 x 10
-10
)
= (4).(2) x (10
6
).(10
-10
) = 8 x 10
6-10
= 8 x 10
-4
= 0,0008





































5
2 CONCEITOS TERICOS DA ESTATSTICA

2.1 Objetivos da Estatstica
Observamos a atuao da Estatstica diariamente em nossas vidas, como: o resultado
metereolgico do tempo; quanto tempo leva-se da casa ao trabalho; o resultado provvel das
eleies; a mdia final da turma; um fabricante (de lmpadas) quer testar quantas funcionaro;....
A Estatstica est interessada nos mtodos cientficos para coleta, organizao, resumo,
apresentao e anlise de dados, bem como na obteno de concluses vlidas e na tomada de
decises razoveis baseadas em tais anlises.

2.2 reas da Estatstica
2.2.1 Estatstica Descritiva: Utiliza nmeros para descrever fatos. Exs: O ndice ou mdia
industrial DOW-JONES, a Taxa de desemprego, o Custo de vida, o ndice pluviomtrico,
a Quilometragem mdia por litro de combustvel, as Mdias dos Estudantes,.....
2.2.2 Estatstica Probabilstica: Analisa situaes que envolvem o acaso. Exs: Jogo de cartas
e de dados, Jogos Esportivos, a Deciso de um fabricante de brinquedos para empreender
uma grande campanha de propaganda visando a aumentar sua participao no mercado, a
Deciso de parar de imunizar pessoas com menos de vinte anos contra determinada
doena, a Deciso de se arriscar a atravessar uma rua no meio do quarteiro. Todas
utilizam a probabilidade consistente ou inconsistente.
2.2.3 Estatstica da Inferncia: Diz respeito anlise e interpretao de dados amostrais.
No preciso comer o bolo todo para saber se ele est bom.
Colocar a ponta do dedo na gua para saber se ela est quente.
Provar uma roupa nova na loja.
Assistir um programa de TV, por alguns minutos.
Folear um novo livro.
Uma Fbrica frequentemente produz um pequeno nmero de peas (lote piloto) antes de se
lanar fabricao em grande escala.
Muitas firmas mantm milhares de itens em estoque. Utilizando tcnicas de amostragem, pode-
se estimar o valor do inventrio, sem proceder a contagem dos itens um a um.
Produtos novos so testados nos mercados de cidades-chaves para aquilatar sua aceitao em
geral.
Testar a qualidade do produto (Ex: Cintos de segurana).

Consequncia: A Amostragem reduz o custo da Pesquisa.








A Pode ser finito (EX: Populao constituda pelo n de parafusos produzidos por uma
fbrica em um dia). Ou pode ser infinito [Ex: Todos os resultados possveis (Cara ou Coroa) em
sucessivos lances de uma moeda].
B Parte representativa da populao. Concluses importantes podem ser inferidas de sua
anlise. Chamando-se estatstica indutiva ou inferncia estatstica.

A
B
A Populao ou Universo
B Amostra

B A
6
Os trs ramos da Estatstica utilizam o mtodo cientfico, que consiste de cinco etapas
bsicas:
1. Definir cuidadosamente o problema;
2. Formular um plano para coleta de dados adequados;
3. Reunir os dados;
4. Analisar e interpretar os dados;
5. Relatar as concluses de maneira que sejam facilmente entendidas por quem as for usar na
tomada de decises.

2.3 O Uso de Modelos em Estatstica

Um modelo uma verso simplificada de algum problema ou situao da vida real
destinado a ilustrar certos aspectos do problema sem levar em conta todos os detalhes.

Exs: * Um globo para representar a terra
* Folhetos/Propagandas so usados para vender produtos
* Recibo de uma Caixa registradora
* Mostrurios
* R$ 17,50
* Rgua de Clculo
* Y = 3X
* Grficos e Mapas (criar imagem mental)
* Tabelas e Equaes (auxlio na resoluo do problema)

2.4 Variveis: Simbologia (X, Y, H, x, b)

Dados Estatsticos que se obtm mediante um processo que envolve a observao ou
outra mensurao de itens:
Renda Anual de uma famlia
Escores de testes
Quantidade de insumo para produzir uma unidade do bem X
Resistncia ruptura de fibras de nilon
Porcentagem de lcool na gasolina

2.4.1 Tipos de Variveis
2.4.1.1 Variveis Quantitativas: Tanto os dados discretos como os contnuos se dizem
quantitativos, porque so inerentemente numricos.
a) Variveis Contnuas: Podem assumir qualquer valor num intervalo contnuo ou pode assumir
teoricamente qualquer valor entre dois dados.
Ex. A altura H de um indivduo que pode ser 1,65 metros; 1,662 metros ou 1,6722 metros
conforme a preciso da medida.

b) Variveis Discretas: Assume valores inteiros. Os dados discretos so o resultado da
contagem do nmero de itens.
Ex. O nmero de crianas, em uma famlia, que pode assumir qualquer um dos valores 0, 1, 2,
3,.... Mas no pose ser 2,5 ou 3,842.

Em geral, as medies do origem a dados contnuos, enquanto as enumeraes ou
contagens resultam em dados discretos.

7
2.4.1.2 Variveis Qualitativas: Envolvem variveis que no so numricas, mas que devem ser
convertidas a valores numricos antes de serem processadas estatisticamente.
Ex. A cor C de um arco-ris uma varivel, que pode ser vermelho, azul, anil,..., possvel
substituir essas variveis por quantidades numricas. Por exemplo, 1 ao vermelho, 2 ao laranja,
etc.
a) Os dados nominais: Surgem quando se definem categorias e se conta o nmero de
observaes pertencentes a cada categoria. Ex: Categorias como sexo (masculino ou
feminino); cor dos olhos (azuis, castanhos, verdes, pretos); campo de estudo (medicina,
direito, administrao); desempenho (excelente, bom, mau).

b) Os dados por posto: Consistem de valores relativos atribudos para denotar ordem: primeiro,
segundo, terceiro,...

TIPOS DE DADOS
Populaes Contnuo Discreto Nominal Por Posto
Alunos do 2
Grau
Idades, Pesos N na Classe Menino/Menina 2 Grau
Automveis Km/h N de defeitos
por Carro
Cores Mais Barato
Vendas de
Imveis
Valor $ N de Ofertas Acima do Preo Muito
Dispendioso




























8
3 SRIES ESTATSTICAS E SUA REPRESENTAO TABULAR E GRFICA

3.1 Srie Estatstica

um conjunto de dados consecutivos, descritos segundo diversas modalidades.

Ex
1
. Consumo de leite do tipo KWM, no perodo janeiro a maio de 2008, na cidade de Fortaleza.
Varivel: Consumo de leite
Dados: O Consumo (em litros) em cada ms do perodo.

Ex
2
. Vendas de carro dos modelos Gol e Golf, nas cidades de Fortaleza e Natal, no ms de julho
de 2008.
Varivel: Vendas de carro
Dados: Nmero de Gols e o nmero de Golfs vendidos na cidade de Fortaleza e Natal

Ex
3
. Total de pessoas aprovadas no vestibular da FIC, no ms de janeiro de 2008, na cidade de
Fortaleza.
Varivel: Nmero de pessoas aprovadas no vestibular.
Dados: apenas um dado, conseqentemente uma informao e no uma srie estatstica.


3.2 Tipos de Sries Estatsticas

Temporal ou Cronolgica ou Histrica ou Evolutiva

Nesta srie, os dados variam apenas em funo do tempo.
Ex. Alunos inscritos para o concurso da Receita Federal, na cidade de Fortaleza, no perodo de
janeiro a julho de 2008.

Especfica ou Categrica

Nesta srie, os dados correspondem s especificaes da varivel.
Ex. Alunos inscritos no concurso da Receita Federal, segundo o sexo, na cidade de Fortaleza, no
ms de julho de 2008.

Geogrfica

Nesta srie, os dados variam somente em funo da localidade.
Ex. Alunos inscritos para o concurso da Receita Federal, nas cidades de Fortaleza e Natal, no
ms de julho de 2008.

Distribuio de Freqncia (principal srie estatstica)

Nesta srie, os dados de uma determinada varivel devem ser dispostos em intervalos de
classe. Pois por intermdio de uma distribuio de freqncia, que se conhece a proximidade
da distribuio de uma varivel com a Normal. Possibilitando, com isso, conhecer o grau de
representatividade das medidas de tendncia central, que so os indicadores (informaes), que
representam um conjunto de dados.
9
Ex. Alunos inscritos para o concurso da Receita Federal, na cidade de Fortaleza, no ms de junho
de 2008, segundo a faixa etria.

Mista

Nesta srie, os dados podem variar em mais de uma classificao j apresentada
anteriormente (Temporal/Especfica/Geogrfica/Distribuio de Freqncia).
Ex. Alunos inscritos para o concurso da Receita Federal, na cidade de Fortaleza e Natal, no
perodo de janeiro a julho de 2008.

3.3 Representao Tabular

um arranjo sistemtico de dados, dispostos em colunas e linhas para fins
comparativos.
Ex. Os dados abaixo so referentes ao consumo de leite, por litro, dos tipos A e B, na cidade de
Fortaleza, no perodo de janeiro a abril de 2008, segundo um levantamento direto realizado pela
Fbrica de Leite KWM.

Ttulo, Cabealho e Corpo (Elementos de Uma Tabela):

TABELA 1: Consumo de Leite (em litros), Segundo os Tipos
(1)
A e B, Fortaleza, janeiro-
abril/08

Meses Leite Tipo A Leite Tipo B
Janeiro 2.000 5.000
Fevereiro 1.000 6.000
Maro 1.500 5.000
Abril 1.800 4.500
Total 6.300 20.500
Fonte: Pesquisa Direta Fbrica KWM.
Nota (1): O leite do tipo A puro, enquanto que o do tipo B apresenta uma mistura de 30% com gua.

Ttulo: a indicao que precede a Tabela e que contm a definio do seu contedo, da
abrangncia geogrfica e temporal dos dados numricos.
Obs: Os meses podem ser abreviados da seguinte forma: Jan, Fev, Mar, Abr, Maio, Jun, Jul,
Ago, Set, Out, Nov e Dez.

Alguns Casos para apresentao do perodo de uma Srie Temporal:

2006-2008. Apresenta dados numricos para os anos de 2006, 2007 e 2008
outubro/07-maro/08. Apresenta dados numricos para os meses de outubro, novembro e
dezembro de 2007 e janeiro, fevereiro e maro de 2008.
2005/2008. Dados numricos para os anos de 2005 e 2008, no sendo apresentados dados os
anos intermedirios.
2006,2007,2008. Dados numricos para sries temporais no consecutivas que contenham um
nmero reduzido de pontos.

10
Cabealho: a parte superior da Tabela que especifica o contedo das colunas. Acrescente-se
ainda que a indicao da expresso quantitativa ou metereolgica dos dados numricos deve ser
feita com smbolos ou palavras, entre parnteses, no cabealho.
Ex. m ou (metro); t ou (tonelada); R$ ou (Real)

Corpo: o espao reservado para a apresentao dos dados ou das informaes, situando-se
sempre abaixo do cabealho.

Fonte: a indicao da entidade responsvel pelo fornecimento dos dados. Recomenda-se
escrever neste item da Tabela a forma de coleta dos dados, ou seja, se pesquisa direta ou indireta.

Nota: So informaes esclarecedoras colocadas no rodap da Tabela, em geral abaixo da fonte.
As notas devem ser numeradas de acordo com as chamadas que forem necessrias, podendo esta
numerao ser colocada no ttulo, no cabealho ou mesmo na nota respectiva.

3.4 Organizao de Dados:

Os dados podem ser assinalados segundo a ordem alfabtica, cronolgica, geogrfica ou
de acordo com a magnitude. Sendo que nenhum espao pode ser deixado em branco, devendo
sempre existir um nmero ou sinal. Para tanto, veja alguns smbolos utilizados.

3.4.1 Smbolos de uma Tabela

Dado numrico igual a zero: -
No se aplicam dados numricos: - -
O dado existe, no entanto, no est disponvel: - - -
Dado numrico omitido para evitar individualizao: X
Dado numrico positivo igual a zero resultante de arredondamento: 0.0: 0.00: 0.000
Dado numrico negativo igual a zero resultante de arredondamento: -0.0: -0.00: -0.000

Especificamente no que se refere forma apropriada de arredondar dados, por questes
de preciso recomendvel utilizar duas casas decimais.



3.5 Representao Grfica

uma representao visual de uma srie estatstica, que tem como objetivo central
ilustrar a sua tendncia.

Srie Temporal: Utilizar grfico de linha.
Srie Especfica: Utilizar grfico de barra ou coluna.
Srie Geogrfica: Utilizar grfico de setor.
Srie Distribuio de Freqncia: Neste caso, existem trs grficos, que podem ser adotados, que
no simplesmente identificam o tipo de tendncia e sim, tambm, o grau de aproximao da
distribuio em questo com a distribuio normal. Esses grficos so: Histograma: Polgono de
Freqncia e a Curva de Freqncia.



11
GRFICO 1: Consumo de Leite (em litros), Segundo os Tipos A e B, Fortaleza, janeiro-abril/08

0
1.000
2.000
3.000
4.000
5.000
6.000
7.000
Janeiro Fevereiro Maro Abril
Meses
L
i
t
r
o
s
Leite Tipo A
Leite Tipo B
Fonte: Pesquisa Direta Fbrica KWM
Escala: 1cm : 650 litros

3.5.1 Elementos que compem um grfico

Ttulo: Sobre este elemento, o leitor poder observar as mesmas orientaes dadas, no tocante
elaborao de tabelas.

Legenda: A legenda um elemento de um grfico utilizado para identificar as variveis
apresentadas. A sua aplicao faz-se necessria quando se trabalha com especificaes de uma
varivel. Por exemplo: Supondo-se que o exerccio em questo tratasse do nmero de litros de
leite A e B. Neste caso, em um grfico de linha, seria necessrio apresentar duas linhas, ou seja,
uma cheia e uma pontilhada que iro identificar, respectivamente, cada tipo de leite.

Corpo: Sobre este elemento, o leitor poder observar as mesmas orientaes dadas, no tocante
elaborao de tabelas.

Fonte: Sobre este elemento, o leitor poder observar as mesmas orientaes dadas, no tocante
elaborao de tabelas.

Escala: A escala em um grfico demonstra a dimenso adotada para a organizao dos pontos e a
sua posio em geral situa-se abaixo da fonte.

Adota-se a seguinte correspondncia, por exemplo:

10 cm vai equivaler a 6.500 litros.

Partindo-se desta referncia, para cada ms ser determinado um tamanho em Y
equivalente ao respectivo nmero de litros de leite. Para tanto, deve-se aplicar uma regra de trs,
da seguinte forma:


12
10 cm 6.500 litros
X 2.000 litros
X= 3,08 cm

Este processo dever ser repetido para cada ms, resultando assim nos seguintes
valores:

Tipo A e Tipo B
Janeiro 3,08 7,69
Fevereiro 1,54 9,23
Maro 2,61 7,69
Abril 2,77 6,92

A partir desses valores, para cada ms descrito no eixo X, plotam-se os pontos no
eixo cartesiano, em seguida, com a ligao desses pontos, tem-se a curva representativa desta
srie estatstica.
Ainda sobre a escala, adotando-se a referncia inicial de 10 cm para 6.500 litros e
partindo-se para uma identificao mais especfica do nmero de litros de leite correspondente a
cada cm, deve-se proceder o seguinte clculo:


10 cm 6.500 litros
1 cm X
X= 650

Com este valor tem-se a seguinte escala:
1 cm : 650 litros























13
4 DISTRIBUIO DE FREQNCIA

Quando se resumem grandes massas de dados brutos, costuma-se freqentemente
distribu-los em classes ou categorias e determinar o nmero de indivduos pertencentes a cada
uma das classes, denominado frequncia da classe. Um arranjo tabular dos dados por classe,
juntamente com as freqncias correspondentes, denominado distribuio de freqncia ou
tabela de freqncia.

* Dados Brutos So aqueles que ainda no foram numericamente organizados. Um exemplo
o conjunto das idades de 34 estudantes, coletado de forma direta e aleatria, da disciplina de
Estatstica da Faculdade FA7, no perodo 2006.1.

Ex: 24, 22, 21, 19, 34, 22, 25, 18, ........

* Rol um arranjo de dados numricos brutos em ordem crescente ou decrescente de
grandeza.
Construo do Rol:
18 19 19 19 20 21 21 21 21 21 22 22
22 22 22 22 22 23 23 23 23 24 24 24
25 25 25 26 26 27 27 34 34 39

Distribuio de Freqncia das Idades
Classes f
i

18,00 22,20 17
22,21 26,41 12
26,42 30,62 02
30,63 34,83 02
34,84 39,04 01
Total 34

* Intervalos e Limites de Classe Um smbolo que define uma classe, como 18,0 22,2 da
Tabela, chama-se intervalo de classe. Os nmeros extremos: 18,0 e 22,2 so denominados limites
de classe; o nmero menor, 18,00 o limite inferior da classe e o maior, 22,2 o limite superior
da classe.
Um intervalo de classe que, ao menos teoricamente, no tem limite superior ou inferior
indicado, denominado intervalo de classe aberto. Por exemplo, ao referir-se a grupos de idade
de indivduos, o intervalo de classe 65 anos ou mais um intervalo de classe aberto.
Simbologia:
2 4: o dois participa do intervalo, o quatro no.
2 4: o dois no participa do intervalo, o quatro sim.
24: o dois e o quatro participam do intervalo.
2 4: o dois e o quatro no participam do intervalo.

* Limites Reais de Classe Se um exemplo com dados coletados das idades dos estudantes, e
estas so arredondadas no intervalo de classe 22,21 26,41 inclui, teoricamente, todas as
medidas compreendidas entre 22,205 ...... at 26,414. Esses nmeros, indicados abreviadamente
pelos nmeros 22,205 e 26,414 so denominados os limites reais ou os verdadeiros da classe; o
menor, 22,205 o limite inferior real e o maior, 26,414, o limite superior real da classe.

14
* Amplitude Total uma medida absoluta de variabilidade. No caso especfico da
distribuio de freqncia das idades, o seu valor ser:

A
total
= Valor
mximo
Valor
mnimo
= 39 18 = 21

* Nmero de Classes Teoricamente, recomenda-se que seja adotado um nmero mnimo de
cinco classes e um mximo de vinte. Para estabelecer este nmero, em funo do total de
observaes, existem dois processos distintos, quais sejam:

1) N ou N

; onde N o nmero de observaes:




= 34 = 5.8310

2) 1 + 3,3.LogN, onde N o nmero de observaes:

= 1 + 3,3Log34 = 1 + 3,3.(1,5315) = 6,0539

Log 34 = Ln 34 = 3,5264 = 1,5315
Ln 10 2,3026

Considerando-se o primeiro processo, estima-se para o exemplo em questo, um total de,
aproximadamente, seis classes.

* Amplitude do intervalo de classe a diferena entre os limites superior e inferior dessa
classe, e tambm referida como a amplitude, o tamanho ou comprimento da classe.

Amplitude de Classe = Amplitude Total
Nmero de classes
= 39 18 = 3,50
6
No necessariamente uma distribuio de freqncia precisa apresentar uma nica
amplitude de classe, s vezes, quando no possvel organizar um conjunto de dados em um
nmero de 5 a 20 classes, o analista poder estabelecer classes de amplitudes diferentes,
preocupando-se, no entanto, em manter a composio estrutural da distribuio.
Aps a definio da amplitude de classe, parte-se para a construo da distribuio de
freqncia absoluta igual a zero.

Distribuio de Freqncia das Idades
Classes f
i

18,00 21,50 10
21,51 25,01 17
25,02 28,52 04
28,53 32,03 - -
32,04 35,54 02
35,55 39,05 01
Total 34

15
Observe que o quarto intervalo de classe no apresenta uma freqncia diferente de zero,
conseqentemente, repete-se o processo diminuindo para 5 classes e recalculando a amplitude de
classe, que passa a assumir um valor igual a 4,2. E a distribuio de freqncia configura-se da
forma apresentada no incio deste texto.

Distribuio de Freqncia das Idades
Classes f
i
f
i,A
f
i,R
f
i,R,A

18,0022,20 17 17 50,01 50,01
22,2126,41 12 29 35,29 85,30
26,4230,62 02 31 5,88 91,18
30,6334,83 02 33 5,88 97,06
34,84 39,04 01 34 2,94 100,00
Total 34 -- 100,00 --

* Freqncia Absoluta Simples (f
i
) Indica o nmero de casos existentes em um intervalo
especfico. Tomando-se como referncia o exemplo, na segunda classe existem 12 alunos, com
idade entre 22,21 e 26,41.
* Freqncia Absoluta Simples Acumulada (f
i,A
) Indica o nmero de casos acumulados at o
limite superior de um intervalo de classe. No segundo intervalo, o nmero 29 informa a
quantidade de alunos, com idade entre 18 e 26,41 anos.
* Freqncia Relativa Simples (f
i,R
) Indica o valor relativo da participao do nmero de
casos em um intervalo especfico. Para a distribuio das idades, verifica-se na segunda faixa
que 35,29% dos alunos tm idade entre 22,21 e 26,41 anos.
* Freqncia Relativa Acumulada (f
i,R,A
) Mostra a participao do nmero de casos
registrados at o limite superior de um intervalo especfico. Para a segunda classe, confirma-se,
no exemplo, que 85,30% dos alunos tm idade entre 18 e 26,41 anos.
* Histograma: Polgonos de Freqncia e Curva de Freqncia So duas representaes
Grficas de Distribuio de Freqncia.
(1) Um Polgono de freqncia consiste em um conjunto de retngulos que tem:
(a) As bases sobre um eixo horizontal (eixo do X) com centro no ponto mdio e as larguras
iguais s amplitudes dos intervalos das classes.
(b) As reas proporcionais s freqncias das classes.
Se todos os intervalos tiverem a mesma amplitude, as alturas dos retngulos sero
proporcionais s freqncias das classes, ento, costuma-se tomar as alturas numericamente
iguais a essas freqncias. Se os intervalos de classe no tiverem a mesma amplitude, essas
alturas devero ser ajustadas.
Espao para desenhar os grficos





16
(2) Uma Curva de freqncia um grfico de linha em que as frequncias so locadas sobre
perpendiculares levantadas nos pontos mdios.
Costuma-se acrescentar segmentos PQ e RS, que vo ter pontos mdios imediatamente
inferior e superior s primeira e ltima classes da distribuio, respectivamente, cujas
freqncias so nulas. Nesse caso, a soma das reas dos retngulos do histograma igual a rea
total limitada pelo polgono de freqncia e o eixo do X.
Tipos de Curvas de Freqncia:
Espao para desenhar os grficos












(a) Simtrica ou em forma de sino Caracteriza-se pelo fato de as observaes eqidistantes do
ponto central mximo terem a mesma freqncia. Ex: Curva Normal.
(b) Assimtrica Positiva (desviada para a direita) A cauda da curva do lado da ordenada
mxima (direito) mais longa que a esquerda.
(c) Assimtrica Negativa (desviada para a esquerda) A cauda da curva do lado da ordenada
mxima (esquerda) mais longa que a direita.
(d) e (e) Na curva em foram de j, ou j invertido, o ponto de ordenada mxima ocorre em uma
das extremidades.
(f) Uma curva em forma de U tem ordenadas mximas em ambas as extremidades.
(g) Uma curva de freqncia bimodal tem dois mximos.
(h) Uma curva de freqncia multimodal tem mais de dois mximos.

* Distribuio de Freqncia Acumulada Ogivas Um grfico que apresente a freqncia
acumulada abaixo de qualquer limite superior de classe, locada em relao a esse limite,
denominado polgono de freqncia acumulada ou ogiva.
Distribuio de Freqncia Acumulada das Idades
Idade (anos) Nmero de Estudantes
Abaixo de 18,00 0
Abaixo de 22,20 17
Abaixo de 26,41 29
Abaixo de 30,62 31
Abaixo de 34,83 33
Abaixo de 39,04 34
Espao para desenhar o Grfico





17
5 MEDIDAS DE TENDNCIA CENTRAL
Simples
Aritmtica Ponderada
A) Mdias P/ Dados Agrupados
Geomtrica
B) Mediana
C) Moda

5.1 Mdia Aritmtica Simples:
um valor obtido atravs do quociente entre a soma dos valores em um conjunto de dados
e o nmero total de valores.
Simbologia:
Valor mdio de uma populao, denominado de parmetro.
_
X Valor mdio de uma amostra, denominado de estimativa.

Expresso da mdia aritmtica simples:
Populao Amostra
_
= X
i
x = x
i

N n

Onde X
i
= cada observao; N e n = total de observaes
Ex: Salrios dos funcionrios da Empresa HYZ.
545,00 545,00 560,00 580,00 590,00 600,00 662,00 681,00 734,00 770,00 788,00
829,00 873,00 950,00 1.055,00 1.055,00 1.129,00 1.398,00 1.425,00 1.535,00
1.743,00 1.920,00 2.104,00 2.367,00 2.843,00 3.220,00 3.448,00 3.517,00 3.663,00
3.864,00 3.920,00 3.968,00 4.170,00 4.405,00 4.622,00 4.783,00 5.820,00
37
Populao: = X
i
/ N = X
1
+ X
2
+ ......... + X
37
= 77.681,00 = 2.099,49

i=1
37 37
_
15

Amostra: x = x
i
/n

= x
5
+ x
6
+ ....... + x
15
= 13.539,00 = 1.230,82

i=5
11 11



18
5.2 Mdia Aritmtica Ponderada
A mdia aritmtica ponderada uma estatstica que deve ser adotada, quando se pretende
extrair um nmero representativo de um conjunto de dados, onde os mesmos tm pesos
diferentes. A expresso analtica desta estatstica definida por:

p
= w
i
X
i

w
i


Onde: w
i
= peso de cada observao
X
i
= valor de cada observao
Ex: Um professor informa classe que haver dois exames de uma hora, valendo cada um 30%
do total de pontos do curso, e um exame final valendo 40%. Assim, um estudante que obtm 8,0
no primeiro exame, 9,0 no segundo, e 9,6 no exame final, ter uma mdia final de 8,94:
Exame Nota Peso
N 1 8,0 0,30
N 2 9,0 0,30
Final 9,6 0,40
Total = 1,00

p
= 0,30.(8,0) + 0,30.(9,0) + 0,40.(9,6)
p
= 8,94
0,30 + 0,30 + 0,40

(Simples): = X
i
= 8,0 + 9,0 + 9,6 = 266 = 8,87
N 3 3

5.3 Mdia Aritmtica para Dados Agrupados
Quando os dados so apresentados em uma distribuio de freqncia, todos os valores
includos num certo intervalo de classe so considerados coincidentes com o ponto mdio do
intervalo.
_
X = A + ( f u)C
N

Onde:
A = Qualquer ponto mdio admitido ou arbitrado.
f
j
= Freqncia de classe correspondente.
u
j
= Pode ser nmeros inteiros positivos ou negativos, ou zero, isto , 0, 1, 2, 3, ......
u
j
= d
j
= X
j
A
C C
19
X
j
= Ponto mdio da classe j.
d
j
= Desvio de X
j
com relao a A
C = Amplitude de classe.
N = Nmero de observaes.
Ex: Mdia Aritmtica para Dados Agrupados dos Salrios dos Funcionrios da Empresa HYZ.

Classes Fi
545,00 1.600,00 20
1.600,00 2.655,00 04
2.655,00 3.710,00 05
3.710,00 4.765,00 06
4.765,00 5.820,00 02
Total : 37
u
1
= d
1
= X
1
A = 1.072,50 1.072,50 = 0 = 0
C C 1.055,00 1.055,00

u
2
= d
2
= X
2
A = 2.127,50 1.072,50 = 1.055,00 = 1
C C 1.055,00 1.055,00

u
3
= d
3
= X
3
A = 3.182,50 1.072,50 = 2.110,00 = 2
C C 1.055,00 1.055,00

u
4
= d
4
= X
4
A = 4.237,50 1.072,50 = 3.165,00 = 3
C C 1.055,00 1.055,00

u
5
= d
5
= X
5
A = 5.292,50 1.072,50 = 4.220,00 = 4
C C 1.055,00 1.055,00

__
X = 1.072,50 + (f
1
.u
1
+ f
2
.u
2
+ f
3
.u
3
+ f
4
.u
4
+ f
5
.u
5
+ f
6
.u
6
). 1.055,00
37
__
X = 1.072,50+ [20.(0) + 4.(1) + 5.(2) + 6.(3) + 2.(4) ]. 1.055,00
37
__
X = 1.072,50 + (0 + 4 + 10 + 18 + 8). 1.055,00
37
__
X = 1.072,50 + (40). 1.055,00
37
20
__
X = 1.072,50 + (42.200,00)
37
__ __
X = 1.072,50 + 1.140,54 X = 2.213,04

5.4 Mdia Geomtrica
A mdia geomtrica G de um conjunto de N nmeros X
1,
X
2,
X
3,
...., X
n
a raiz de ordem
N do produto desses nmeros, devendo ser utilizada quando se dispem de dados que
apresentam um crescimento geomtrico.
N
G =
Ex1: A mdia geomtrica dos nmeros 2, 4 e 8:
3
G =
3
G =
G = 4
Ex2: Determinar: (a) a mdia geomtrica; (b) a mdia aritmtica simples dos nmeros 3, 5, 6, 6,
7, 10, 12. Admita que os nmeros sejam exatos.

(a) Mdia Geomtrica
7
G =
7
G =
G = 6,43
Ou Log G = (1/7).Log 453.600 = (1/7) (5,6567) = 0,8081
G = 6,43
Todo nmero positivo pode ser expresso por N = 10
p
: p o logaritmo de N
Ento: Log G = 0,8081
G = 10
0,8081
G = 6,43

(b) Mdia Aritmtica Simples: = 3 + 5 + 6 + 6 + 7 + 10 + 12 = 7
7
X1 . X2 . X3 ....Xn
2 . 4 . 8
64
3x5x6x6x7x10x12
453.600
21
Isso mostra que a mdia geomtrica de um conjunto de nmeros positivos desiguais
menor do que a mdia aritmtica simples.
5.5 Mediana
I) Para um Conjunto Simples:
A mediana de um conjunto de nmeros, ordenados em ordem de grandeza (isto , em um
Rol), o valor mdio ou a mdia aritmtica dos valores centrais.
Ex
1
: O conjunto de nmeros 3, 4, 4, 5, 6, 8, 8, 8, 10 tem como mediana 6. Ou seja, 50% dos
nmeros desse conjunto tem valor mximo igual a 6.
Outro mtodo:
Posio da Mediana = n/2 + 0,5 = 9/2 + 0,5 = 4,5 + 0,5 = 5 (5 posio)
Valor da Mediana = 6
Ex
2
: O conjunto de nmeros 5, 5, 7, 9, 11, 12, 15, 18 tem como mediana (9 + 11) = 10. Ou
seja, 50% do nmeros desse conjunto tem valor mximo igual a 10.
Outro mtodo:
Posio da Mediana = n/2 + 0,5 = 8/2 + 0,5 = 4 + 0,5 = 4,5 (4,5 posio)
Valor da Mediana = (9 + 11) = 10

II) Para Dados Agrupados:
Mediana = L
1
+ [ N/2 (f)
1
].C
f
mediana

Onde:
L
1
= limite inferior da classe mediana
N = nmero de observaes total
(f)
1
= soma de todas as classes abaixo da classe mediana
f
mediana
= freqncia da classe mediana

C = amplitude do intervalo da classe mediana

Ex: Mediana da Distribuio de Freqncia dos Salrios dos Funcionrios da Empresa HYZ.
Admite-se que os pesos, na distribuio de freqncia, se distribuem continuamente. Nesse
caso, a mediana o peso para qual a metade da freqncia total (37/2 = 18,5) fica situada abaixo
e a outra acima dele. Assim, a mediana situa-se na 1 classe que , portanto, a classe mediana.
Ento:
L
1
= 545,00
N = 37
22
(f)
1
= 0
f
mediana
= 20
C = 1.055,00

Mediana = L
1
+ [ N/2 (f)
1
].C
f
mediana


Mediana = 545,00 + [37/2 0]x 1.055,00
20
Mediana = 545,00 + [18,5]x 1.055,00
20
Mediana = 545,00 + 19.517,50 = 545,00 + 975,88 = 1.520,88
20


5.6 Moda
I) Para um Conjunto Simples:
A moda de um conjunto de nmeros o valor que ocorre com a maior freqncia, isto ,
o valor mais comum. A moda pode no existir e, mesmo que exista, pode no ser nica.
Ex
1
: O conjunto de nmeros 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tem moda 9. (Conjunto
Unimodal);
Ex
2
: O conjunto de nmeros 3, 5, 8, 10, 12, 15, 16 no tem moda. (Conjunto Amodal);
Ex
3
: O conjunto de nmeros 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 tem duas modas, 4 e 7. (Conjunto Bimodal);
Ex
4
: O conjunto de nmeros 2, 3, 3, 4, 5, 5, 7, 8, 8, 9, tem trs modas, 3, 5 e 8. (Conjunto
Plurimodal).

OBS: No implica dizer que o valor mais freqente do conjunto ou a moda deste represente a
verdadeira situao do evento.
Ex: Notas dos alunos em uma prova
N = {1,00; 1,10; 1,50; 2,00; 2,50; 2,60; 2,70; 2,80; 10,00; 10,00}
Moda de N = 10 No traduz com clareza o verdadeiro desempenho da turma.
Soluo: Usar uma medida de participao, como a mediana, o quartil, o decil ou o percentil.
a) Posio da Mediana = n/2 + 0,5 = 10/2 + 0,5 = 5,5
Valor da Mediana = 2,50 + 2,60 = 2,55: 50% dos alunos no obtiveram nota superior a 2,55
2
b) Quartil:
Posio do Quartil = n/4 + 0,5 = 10/4 + 0,5 = 3
Valor do Quartil = 1,50: 25% dos alunos no obtiveram nota superior a 1,50
23
c) Decil:
Posio do Decil = n/10 + 0,5 = 10/10 + 0,5 = 1,5
Valor do Decil = (1,00 + 1,10)/2 = 1,05: 10% dos alunos no obtiveram nota superior a 1,05

d) Percentil:
Posio do Percentil = n/100 + 0,5 = 10/100 + 0,5 = 0.6
Valor do Percentil = No Existe

II) Para Dados Agrupados:
A moda ser o valor (ou valores) de X correspondente ao ponto de ordenada mxima
(ou pontos) da curva de freqncia.
Moda = L1 + (
1
) . C

1
+
2

Onde:
L
1
= limite inferior da classe modal (isto , a que contm a moda);

1
= excesso da freqncia modal sobre a da classe imediatamente inferior;

2
= excesso da freqncia modal sobre a da classe imediatamente superior;
C = amplitude do intervalo da classe modal.
Ex: Moda da Distribuio de Freqncia dos Salrios dos Funcionrios da Empresa HYZ.
L
1
= 545,00

1
= 20 0 = 20

2
= 20 4 = 16
C = 1.055,00

Moda = 545,00 + ( 20 ) x 1.055,00
20 + 16
Moda = 545,00 + 20 x 1.055,00
36
Moda = 545,00 + 586,11 = 1.131,11







24
6 MEDIDAS DE DISPERSO OU VARIAO
Representa o grau aos quais os dados numricos tendem a dispersar-se em torno de um
valor mdio. Ou seja, as medidas de disperso indicam se os valores esto relativamente
prximos uns dos outros, ou separados. So elas:

6.1 Amplitude Total ou Intervalo
6.2 Desvio Mdio
6.3 Desvio Padro
6.4 Varincia
6.5 Coeficiente de Variao

Ex: (a) _._._......._____________________________
Pouca Disperso

(b) ___.______._______.________._______._______
Grande Disperso

6.1 Amplitude Total ou Intervalo:
Pode ser expresso de duas maneiras:
a) A diferena entre o maior e o menor valor
b) Do maior ao menor valor do grupo
Tabela 1
Intervalo
Nmeros Diferena Do Menor ao Maior
1, 5, 7, 13 13 1= 12 De 1 a 13
14, 3 17, 4, 8, 73, 36, 48 73 3 = 70 De 3 a 73
3,2; 4,7; 5,6; 2,1; 1,9; 10,3 10,3 1,9 = 8,4 De 1,9 a 10,3

6.2 Desvio Mdio Absoluto:
O Desvio Mdio de um conjunto de N nmeros X
1
, X
2
, ....., X
n
definido por:
n


X
j
X
j=1

DM =
_________________
N
25



Onde: X = Mdia Aritmtica Simples
X
j =
Cada nmero do conjunto


X
j
X = Valor Absoluto do desvio de X
j
em relao a X

Obs: O valor absoluto de nmero ele prprio, sem o sinal que lhe associado, e indicado por
meio de duas linhas verticais que o enquadram ou mdulo. Assim, -4 = 4; -3 = 3; -0,84
= 0,84.
Portanto, o Desvio Mdio Absoluto de um conjunto de nmeros a mdia dos desvios
dos valores a contar da mdia, ignorando-se o sinal de diferena.
Ex: Determine o Desvio Mdio para o conjunto de valores:
A={ 1, 2, 3, 4, 5}
Mdia Aritmtica :
= X
i
= 1 + 2 + 3 + 4 + 5 = 15 = 3
N 5 5
_ _
Xi X Xi X Xi - X
1 3 -2 2
2 3 -1 1
3 3 0 0
4 3 1 1
5 3 2 2
0 6



Desvio Mdio = X
j
X = 6 = 1,2
N
Se x
1
, x
2
, ....., x
n
ocorrem com as freqncias f
1
, f
2
, ......, f
n
, respectivamente, o desvio
mdio poder ser indicado da seguinte forma:
n


f
j
X
j
X
j=1

DM =
_________________
N

Onde: X
j
= Ponto Mdio de cada classe



X = Mdia Aritmtica p/ Dados Agrupados
f
j
= Freqncia de cada classe


26
Ex: Desvio Mdio dos Salrios dos funcionrios da Empresa HYZ.
Classes fi
545,00 1.600,00 20
1.600,00 2.655,00 04
2.655,00 3.710,00 05
3.710,00 4.765,00 06
4.765,00 5.820,00 02
Total : 37

DM = f
1
X
1
- X + f
2
X
2
- X + f
3
X
3
- X + f
4
X
4
- X + f
5
X
5
- X
N

DM = [201.072,50 2.213,04 + 42.127,50 2.213,04 + 53.182,50 2.213,04 +
64.237,50 2.213,04 + 25.292,50 2.213,04] / 37

DM = [20-1.140,54 + 4-85,54 + 5969,46 + 62.024,46 + 23.079,46] / 37

DM = 22.810,80 + 342,16 + 4.847,30 + 12.146,76 + 6.158,92
37

DM = 46.305,94 = 1.251,51

6.3 Desvio Padro
O Desvio Padro de um conjunto de N nmeros X
1
, X
2
, ....., X
n
a raiz mdia
quadrtica dos desvios, em relao mdia ou, como muitas vezes denominada, o desvio da
raiz mdia quadrtica.

Para Populao:

n


(X
j
X )
2

j=1

=
_________________
N



27
Para Amostra:

n


(X
j
X )
2

j=1

S =
_________________
n - 1

Ex: Calcule o Desvio Padro do Conjunto: 20, 5, 10, 15, 25.
Mdia Aritmtica: = 20 + 5 + 10 + 15 + 25 = 75 = 15
5 5

= [(20 15)
2
+ (5 15)
2
+ (10 15)
2
+ (15 15)
2
+ (25 15)
2
/5]
1/2
= [(5)
2
+ (-10)
2
+ (-5)
2
+ (0)
2
+ (10)
2
/5]
1/2
= [25 + 100 + 25 + 0 + 100 /5]
1/2

= [250/5]
1/2

= [50]
1/2

= 7,1
Se X
1
, X
2
, ....., X
n
ocorrerem com as freqncias f
1
, f
2
, ......, f
n
, respectivamente, o
desvio padro pode ser definido por:

n


f
j
(X
j
X )
2

j=1

=
_________________
N
Onde: X
j
= Ponto Mdio de cada classe



X = Mdia Aritmtica p/ Dados Agrupados
f
j
= Freqncia de cada classe

Ex: Desvio Padro dos Salrios dos funcionrios da Empresa HYZ.
={[f
1
(X
1
X)
2
+f
2
(X
2
X)
2
+ f
3
(X
3
X)
2
+ f
4
(X
4
X)
2
+ f
5
(X
5
X)
2
+ f
6
(X
6
X)
2
]/N }
1/2


= {[20(1.072,50 2.213,04)
2
+ 4(2.127,50 2.213,04)
2
+ 5(3.182,50 2.213,04)
2
+
6(4.237,50 2.213,04)
2
+ 2(5.292,50 2.213,04)
2
] / 37}
1/2


28
= {[20(-1.140,54)
2
+ 4(-85,54)
2
+ 5(969,46)
2
+ 6(2.024,46)
2
+ 2(3.079,46)
2
] / 37}
1/2


= {26.016.628,83 + 29.268,37 + 4.699.263,40 + 24.590.629,75 + 1.905.939,38 }
1/2

37

= {57.241.729,73 }
1/2
= 1.243,81
37

6.4 Varincia
A Varincia de um conjunto de dados definida como o quadrado do desvio padro.
Para Populao:
n


(X
j
X )
2

j=1

2
=
_________________
N
Para Amostra:

n


(X
j
X )
2

j=1

S
2
=
_________________
n - 1

Ex: Calcule a Varincia do conjunto: 2, 4, 6, 8, 10
Mdia Aritmtica:
= X
i
= 2 + 4 + 6 + 8 + 10 = 30 = 6
N 5 5

Xi X Xi X Xi - X
2 6 -4 16
4 6 -2 4
6 6 0 0
8 6 2 4
10 6 4 16
0 40

2
= (X
i
X)
2
= 40 = 8
N 5

Se X
1
, X
2
, ....., X
n
ocorrerem com as freqncias f
1
, f
2
, ......, f
n
, respectivamente, o
desvio padro pode ser definido por:
29
n


f
j
(X
j
X )
2

j=1

2
=
_________________
N

Onde: X
j
= Ponto Mdio de cada classe



X = Mdia Aritmtica p/ Dados Agrupados
f
j
= Freqncia de cada classe
Ex: Varincia dos Salrios dos funcionrios da Empresa HYZ.

2
= (1.243,81)
2

2
= 1.547.063,3

6.5 Disperso Absoluta e Relativa
A variao ou disperso real, determinada a partir do desvio padro, da varincia, ou
qualquer outra medida de disperso, denominada disperso absoluta. Entretanto, uma variao
ou disperso de 10 cm, na medida de uma distncia de 1.000 m, inteiramente diferente, quanto
ao efeito, da mesma variao de 10 cm em uma distncia de 20 m. A medida desse efeito
proporcionada pela disperso relativa, definida por:

Disperso Relativa = Disperso Absoluta
Mdia

Varincia Relativa = Varincia Absoluta
Mdia

Desvio Padro Relativo = Desvio Padro Absoluto ou Coeficiente de Variao
Mdia

Assim, o Coeficiente de Variao um indicador utilizado para medir o grau de
representatividade da mdia de uma distribuio. E isto possvel, na medida em que essa
estatstica possibilita identificar quanto por cento do valor da mdia disperso.

Ex: Uma indstria de dispositivos eletrnicos tem dois tipos de produtos, A e B. Os produtos tm
as duraes mdias de X
A
= 1.495 hs e X
B
= 1.875 hs, respectivamente, e os desvios padres de
S
A
= 280 hs e S
B
= 310 hs. Qual produto que tem maior: (a) disperso absoluta; (b) disperso
relativa?
30

(a) O dispositivo B tem maior disperso absoluta.
(b) Coeficiente de Variao de A = S
A
= 280 = 18,7%
X
A
1495
Coeficiente de Variao de B = S
B
= 310 = 16,5%
X
B
1875

Ento, o produto A tem maior disperso ou variao relativa.






































31
7 MEDIDAS DE ASSIMETRIA

Assimetria o grau de desvio, ou afastamento da simetria, de uma distribuio. Se a curva
de freqncia de uma distribuio tem uma "cauda" mais longa direita da ordenada mxima
que esquerda, diz-se que uma distribuio desviada para a direita, ou que possui assimetria
positiva. Se o inverso que ocorre, diz-se que ela desviada para a esquerda, ou de assimetria
negativa.
Para distribuies assimtricas, a mdia tende a situar-se do mesmo lado da moda (cauda
mais longa). Por isso, uma medida de assimetria proporcionada pela diferena entre a mdia e
a moda. Ela pode ser tomada sem dimenso, mediante sua diviso pelo desvio padro, o que
resulta na definio:


onde a moda e a mediana.


Evidentemente qualquer distribuio simtrica tem assimetria nula. Exemplo: distribuio
normal, conforme curva B da figura acima.
Assimetria negativa significa valores concentrados esquerda (curva A). Em geral, a
mdia menor que a mediana.
Assimetria positiva significa valores concentrados direita (curva C). Em geral, a mdia
maior que a mediana.
x - = 0 assimetria nula ou distribuio simtrica
x - < 0 assimetria negativa ou esquerda
x - > 0 assimetria positiva ou direita


32
8 REGRESSO LIENAR

49
Previses Baseadas em Regresses
( ) ( )( )
( ) ( )
b
n XY X Y
n X X
=



2
2

2
0

Y = a + bX
Y
X
( )
a
Y b X
n
=



Uma equao linear possui o seguinte formato:
Y = a + b X
Y = Varivel Dependente;
a = Intercepto no eixo dos Y;
b = Coeficiente angular;
X = varivel Independente;
n = nmero de perodos observados.
Exemplo: Uma cadeia de fastfood verificou que as vendas mensais de refeies em suas casas
esto relacionadas ao nmero de alunos matriculados em escolas situadas num raio de 2
quilmetros em torno da casa. A empresa pretende instalar uma nova casa numa regio onde o
nmero de alunos de 13750. Qual a previso da demanda para esta nova casa?




( ) ( )( )
( ) ( )
b
n XY X Y
n X X
=



2
2
=
( )
13 5224 86 14310 450
13 1663 14310
2


=
, , ,71
,37 ,
2,99

( )
a
Y b X
n
=


=
450 2 14310
13
,71 ,99 ,
= 1,757

33





























Y = + = 1 757 2 99 13 75 42 869 , , , , ou seja 42869 refeies

34
8 PROBABILIDADE
Essa tcnica estatstica, independente de qual seja a sua aplicao, possibilita no
afirmar o que vai acontecer e, sim, o que pode ocorrer.
A probabilidade utilizada para exprimir a chance de ocorrncia de determinado
evento, levando-se em considerao o acaso.
Exemplo1: Ao lanar um dado no se pode afirmar que vai ocorrer a face 3, no entanto,
possvel precisar as possibilidades de ocorrer a referida face.
Exemplo2: A previso da procura de um novo produto.
Exemplo3: O clculo dos custos de produo.
Exemplo4: A compra de aplices de seguros.
Exemplo5: A previso da safra de soja.
Exemplo6: A contratao de um novo empregado.
Exemplo7: O preparo de um oramento.
Exemplo8: A avaliao do impacto de uma reduo de impostos sobre a inflao.
8.1 Abordagem Matemtica
Teoria dos Conjuntos:
Um conjunto uma coleo de objetos ou itens que possuem caracterstica (s) comum
(ns).
Exemplo1: Os habitantes do bairro Benfica
Exemplo2: Os rios da Amaznia
Exemplo3: As farmcias de Fortaleza.
Exemplo4: Uma remessa de computadores.
Exemplo5: Uma classe de estudantes.
Exemplo6: Conjunto de nmeros pares (2, 4, 6, 8, .....)
Exemplo7: Conjunto dos nmeros naturais (0, 1, 2, 3, ....)

8.1.1 Conjuntos Disjuntos
So dois ou mais conjuntos que no apresentam elementos comuns.
Ex: A={1, 2, 3} e B={4, 6}
Diagrama de Venn:




35
N de Elementos da Unio desses Conjs.= n (A U B) = n (A) + n (B)
n (A U B) = 3 + 2 = 5
8.1.2 Conjuntos No-Disjuntos
So conjuntos que apresentam elementos comuns.
Ex: A={1, 3, 6, 8} e B={6, 8, 10, 12}
Diagrama de Venn:




N de Elementos da Unio desses Conj.= n (A U B) = n (A) + n (B) n (A B)
N (A U B) = 4 + 4 2 = 6

c) Conjuntos Disjuntos (p/ 3 Conjuntos)
Ex: A = {1, 2, 3}; B = {4, 5, 6}; C = {8, 9, 10}
N de Elementos da Unio desses Conjs.= n (A U B U C) = n (A) + n (B) + n (C)
n (A U B U C) = 3 + 3 + 3 = 9

d) Conjuntos No-Disjuntos (p/ 3 Conjuntos)
Ex: Ex: A = {1, 2, 3}; B = {3, 4, 5}; C = {3, 6, 7}
N de Elementos da Unio desses Conjs.= n (A U B U C) = n (A) + n (B) + n (C)
n (A B) n (A C) n (B C) + n (A B C)
n (A U B U C) = 3 + 3 + 3 1 1 1 + 1 = 7
8.2 Conceitos Fundamentais Utilizados no Estudo das Probabilidades:
8.2.1 A Probabilidade de um Evento:
O Evento pode ser chuva, lucro, cara, rendimento de pelo menos 6%, terminar o
curso, notas, etc.
A probabilidade de um Evento A, denota P(A), um nmero de 0 a 1 que indica a
chance de ocorrncia do Evento A.
8.2.2 Experimento:
Em probabilidade existe o que se chama de experimento, o que na verdade se constitui
em uma experincia qualquer: por exemplo, lanar um dado.
Todos os resultados de um experimento denominam-se na teoria das probabilidades de
Espao Amostral, que corresponde a um determinado conjunto.
36
As possveis combinaes de resultados de um conjunto qualquer, que conhecido
como subconjunto em probabilidade, denominam-se de Evento.
8.2.3 Complemento de um Evento:
Todos os outros resultados no Espao Amostral que no estejam definidos no Evento.
8.2.4 Eventos Mutuamente Excludentes:
No tm elementos em comum, ou no se podem ocorrer simultaneamente.
Ex: Obter a nota 9 em matemtica e obter a nota 10 em matemtica

8.2.5 Eventos Coletivamente Exaustivos: Nenhum outro resultado possvel para o experimento
em causa.
Ex1: As faces de um dado

Exemplo: Lana-se um dado.
Experimento: Lanar um dado
Espao Amostral: = {1, 2, 3, 4, 5, 6}
Evento: Ocorrer a face 3
Complemento de um evento: C = {1, 2, 4, 5, 6}

Diagrama de Venn:
*Espao Amostral



*Os eventos A e A so complementares



*Os eventos A e B so mutuamente excludentes



*Os eventos A e B so coletivamente Exaustivos


37
8.3 Expresso da Probabilidade
O clculo de uma probabilidade se d por intermdio do quociente entre o nmero de
casos favorveis e o nmero de casos possveis; onde os casos favorveis so referentes ao que
se deseja que acontea e, os possveis, todos os elementos do espao amostral.
Probabilidade do Evento A = P (A) = Casos Favorveis
Casos Possveis

Ex: Lanar um dado e ocorrer uma face par.
P (A) = 3/6 = = 50%
8.4 Propriedades da Probabilidade

0 P(A) 1, para todo evento A.
P(S) = 1
P() = 0
P(A
C
) = 1 P(A)
Se A
1
, A
2
, , A
K
so eventos mutuamente exclusivos, ento:
P(A
1
A
2
... A
K
) = P(A
1
) + P(A
2
) + ... + P(A
K
)
8.5 Teorema da Soma
Se A e B so dois eventos quaisquer, onde A B , ento:
P(A B) = P(A) + P(B) - P(A B)
Mas, se os eventos A e B forem mutuamente excludentes, onde A B = , ento:
P(A B) = P(A) + P(B)
8.6 Probabilidade Condicional
O estabelecimento de uma probabilidade est, em geral, diretamente relacionado com
o estado da informao disponvel. muito freqente o caso em que o estado da informao
modificado pela ocorrncia de algum outro evento relacionado com o experimento em questo.
Suponha que se deseja a probabilidade de um evento A, sendo P(A) a probabilidade desse evento
atribuda apenas com o conhecimento da mecnica do experimento correspondente. Se,
entretanto, recebermos a informao de que um outro evento B ocorreu, essa modificao do
estado de informao poder levar-nos a reavaliar a probabilidade do evento A por um novo
valor que denotaremos por P(A/B), probabilidade de A condicionada ocorrncia do evento B.
Dados dois eventos A e B, a probabilidade condicionada do evento A quando B tiver
ocorrido, ser:


38
P(A/B) = P(A B); com P(B) 0
P(B)
EXERCCIO:
Dois dados so lanados, consideremos os eventos:
a) A= (X
1
,X
2
) / X
1
+X
2
=10` B= (X
1
,X
2
) / X
1
> X
2
`
Calcule: P(A), P(B), P(A/B), P(B/A)

b) C= (X
1
,X
2
) / X
1
+X
2
=9` D= (X
1
,X
2
) / X
1
=1`
Calcule: P(C), P(D), P(C/D), P(D/C)

8.7 Teorema do Produto
A partir da definio de probabilidade condicional, podemos enunciar o teorema do
produto:
P(A/B) = P(A B) P(B/A) = P(B A);
P(B) P(A)
Como: P(A B) = P(B).P(A/B)
P(B A) = P(A).P(B/A)

e P(A B) = P(B A); ento:
P(B).P(A/B) = P(A).P(B/A) = P(A B)
OBS
1
: Para trs eventos, temos:
P(A B C) = P(A).P(B/A).P(C/A B)
EXERCCIO:
Em um lote de 12 peas, 04 so defeituosas. Duas peas so retiradas ao acaso uma aps outra
sem reposio. Qual a probabilidade de ambas serem boas?

8.8 Independncia Estatstica
Um evento A considerado independente de outro evento B, Se:
P(A) = P(A/B)
Considerando o teorema do produto, se A e B so independentes:
P(A B) = P(A). P(B),
Generalizando, temos:
P(A
1
A
2
... A
n
) = P(A
1
).P(A
2
) ... P(A
n
)
DEMONSTRAO:
P(B/A) = P(A B) = P(B).P(A/B) = P(B).P(A) = P(B)
P(A) P(A) P(A)

OBS
1
: Do mesmo modo, P(B/A
c
) = P(B)
39
OBS
2
: Seramos tentados a dizer que A e B so independentes se P(A) = P(A/B) e P(B) =
P(B/A), isso apropriado, mas para a igualdade fazer sentido P(A) 0 e P(B) 0. Desde
que isso ocorra, verificamos que as probabilidades absolutas sero iguais s
probabilidades condicionadas.
EXERCCIO:
Usando o espao amostral do lanamento de dois dados, podemos exemplificar a afirmao de
que a independncia estatstica est relacionada com o estado de informao de que se dispe.
Sejam os eventos:
A = dar o mesmo ponto nos dois dados;
B = dar ponto 1 no primeiro dado;
C = soma dos dois pontos inferior a 6.
Calcule: P(A); P(B); P(A/B); P(B/A); P(A/C); P(B/C)
Responda:
a) A e B so independentes?
b) A e C so independentes?
c) B e C so independentes?
8.9 Regras de Probabilidade (Resumo)
Muitas aplicaes da estatstica exigem a determinao da probabilidade de
combinaes de eventos. H duas categorias de combinaes.
Tem-se dois Eventos A e B:
8.9.1 Determinar a ocorrncia dos dois eventos ao mesmo tempo ambos.
a) Sendo esses eventos Independentes.
P (A e B) = P(A) x P(B)
Ex1: Lanar dois dados, o resultado do primeiro independe do resultado do segundo.
Ex2: Relao entre o sexo masculino e feminino com o grau do Q.I.
Ex3: Lanar duas moedas no-viciadas. Qual a probabilidade de ambas darem caras?
P (Cara) =
P (Cara e Cara) = x = = 0,25= 25%
Ex4: Um tero dos eleitores de certa comunidade constitudo de mulheres, e 40% dos eleitores
votaram na ltima eleio presidencial. Supondo que esses dois eventos sejam independentes,
determine a probabilidade de escolher aleatoriamente um eleitor da lista geral, que seja mulher e
tenha votado na ltima eleio presidencial.
P(mulher que votou na ltima eleio) = 1/3 x (0,40) = 0,1333 = 13,33%

40
Obs: Nos eventos independentes: P(A/B) = P(A) e P(B/A) = P(B)

b) Sendo esses eventos Dependentes.
P (A e B) = P(A) x P(B/A)
Ou
P (A e B) = P(B) x P(A/B)
Ex: Suponhamos duas urnas com fichas. A primeira contm 8 vermelhas e 2 brancas. A segunda
contm 5 vermelhas e 5 brancas. Isto :
Urna/Cor Vermelho Branco Total
Y 8 2 10
Z 5 5 10
Qual a probabilidade de extrair uma ficha vermelha da urna z?
P (Urna Z) = P(Vermelha/Urna Z) = 5/10
P (Urna Z e Ficha Vermelha) = P (Urna Z) x P (Vermelha/Urna Z)
= x 5/10 = 5/20 = = 0,25 = 25%
8.9.2 Probabilidade de ocorrncia de ao Menos um dos dois Eventos Um ou Outro.
a) Sendo esses eventos Mutuamente Excludentes.
P (A ou B) = P(A) + P(B)
Ex1: Se retiro a ficha vermelha automaticamente exclui a ficha branca. Suas probabilidades
condicionais so zero.
P (vermelha/branca) = 0
P (branca/vermelha) = 0
Ex2: Probabilidade de aparecer cinco ou seis numa jogada de um dado equilibrado.
P (Cinco ou Seis) = P(Cinco) + P(Seis) = 1/6 + 1/6 = 2/6 = 1/3 = 0,3333 = 33,33%
Ex3: Probabilidade de extrao de uma carta de copas ou uma carta de paus de um baralho de 52
cartas.
P (Copas os Paus) = P (Copas) + P (Paus) = 13/52 + 13/52 = 26/52 = = 0,50 = 50%

b) Sendo esses eventos No-Mutuamente Excludentes.
P (A ou B) = P(A) + P(B) P (A B)
Ex: Suponhamos a probabilidade de extrao de uma carta de copas ou um dez de um baralho
de 52 cartas.
P (Copas) = 13/52; P(Dez) = 4/52; P(Dez de Copas) = 1/52
P (Copas ou Dez) = 13/52 + 4/52 1/52 = 16/52 = 0,3077 = 30,77%
41
8.10 Lei da Probabilidade Total
Sejam A
1,
A
2
, ..., A
n
eventos mutuamente exclusivos e exaustivos e B um evento
qualquer em S. Esses eventos podem ser representados num diagrama de Venn, em que supomos
que a rea correspondente a cada evento numericamente igual sua probabilidade.


Figura 2.1 Diagrama de Venn

A coleo de eventos A
1,
A
2
, ..., A
n
define uma distribuio de probabilidade,
significando que um e somente um desses eventos ir ocorrer com probabilidades P(A
1
)
,
P(A
2
),
..., P(A
n
), cuja soma unitria.
Vemos que:
U
n
i
i
B A B
1
) (
=
=

Sendo as interseces mutuamente exclusivas e sabendo que:
P(A
1
A
2
... A
n
) = P(A
1
) + P(A
2
) + ... + P(A
n
)
Temos que:

=
=
n
i
i
B A P B P
1
) ( ) (
(1)
Aplicando o Teorema do Produto, escreve-se:

=
=
n
i
i i
A B P A P B P
1
) / ( ). ( ) (
(2)
Fazendo n=2, podemos considerar A
1
= A e A
2
= A
c

P(B) = P(A). P(B/A) + P(A
c
). P(B/A
c
) (3)
OBS
1
: (1), (2) ou (3) exprimem a chamada Lei da Probabilidade Total.
42
OBS
2
: Vemos em (2) que a Lei da Probabilidade Total podemos obter P(B) conhecidas todas
P(B/A
i
) e todas P(A
i
).
Deve-se notar que o diagrama de Venn apresentado acima est dividido em 2n partes.
Sua representao tabular seria:

Tabela de Distribuio Bidimensional
B B
C
Total
A
1
P(A
1
B) P(A
1
B
c
) P(A
1
)
A
2
P(A
2
B) P(A
2
B
c
) P(A
2
)

A
n
P(A
n
B) P(A
n
B
c
) P(A
n
)
Total P(B) P(B
c
) 1,0

Generalizao: O experimento conduz a diversos resultados B
1
, B
2
, ..., B
m
, logo, a probabilidade
do corpo da tabela seria: P(A
i
B
j
).
8.11 Teorema de Bayes
Observando o problema anterior por outro ngulo: se P(A
1
), P(A
2
), ... , P(A
n
)
constituem uma distribuio de probabilidade, elas tambm constituiro uma distribuio de
probabilidade sob outro estado de informao. Assim, se soubermos que o evento B ocorreu,
P(A
1
/B), P(A
2
/B), ... + P(A
n
/B) constituiro a distribuio de probabilidade dos A
i
s
condicionados a ocorrncia do evento B.
Na tomada de deciso chama-se:
P(A
i
): probabilidade a priori (prvias);
P(A
i
/B): probabilidade a posteriori (posteriores)

Para obter P(A
k
/B), tem-se:

=
n
i
i
k k
k
B A P
B A P
B P
B A P
B A P
1
) (
) (
) (
) (
) / (
ou ainda:
) / ( . ) (
) / ( . ) (
) / (
1
i
n
i
i
k k
k
A B P A P
A B P A P
B A P

=
=
A equao acima chamada teorema de Bayes, pois este permite calcular o resultado de
um primeiro estgio dado o segundo estgio. A importncia do teorema de Bayes se revela
quando consideramos as probabilidades P(A
i
)s como sendo representativas de certo grau inicial
de informao que se modifica to logo chegue ao conhecimento do decisor a ocorrncia do
evento B. Esta informao alterar P(A
k
) resultando em P(A
k
/B).
43
Generalizando o teorema de Bayes, tem-se:

) / ( . ) (
) / ( . ) (
) / (
1
i j
n
i
i
i j i
j i
A B P A P
A B P A P
B A P

=
=
Exerccio: Sejam quatro urnas com bolas coloridas, contendo 10 bolas cada uma. A tabela abaixo
discrimina a composio das urnas.
Cor da Bola
Vermelha Branca Azul Totais
A 1 6 3 10
B 6 2 2 10
C 8 1 1 10
D 0 6 4 10

Escolheu-se arbitrariamente uma das urnas e extraiu-se uma bola. Se a bola vermelha, qual a
probabilidade de ter sido extrada da urna B?
A generalizao leva-nos a concluir que a inferncia estatstica pode assumir
caractersticas dinmicas, renovando-se continuamente. No prximo captulo ser abordado
outro instrumental, mais completo e moderno, para a tomada de deciso, a programao linear.




















44
9 DISTRIBUIES DE PROBABILIDADE
Testa-se o experimento por muitas vezes para analisar o comportamento de seus
eventos, onde a mesma chance de aparecer como resultado inerente a todos.
Se admitirmos que os mesmos fatores (fora que jogada, corrente de ar, ngulo que
atinge a mesa, n de jogadas) atuam da mesma maneira, ou de maneira anloga, em observaes
repetidas grande nmeros de vezes, constatamos que existe uma possibilidade de predio a
longo prazo. Em outras palavras, certos resultados podem ser mais provveis que outros, e isso
se tornaria visvel num grande n de observaes.
Assim, uma Distribuio de Probabilidade uma distribuio de freqncia para os
resultados de um espao amostral, isto , para os resultados de uma varivel aleatria. As
freqncias so relativas, ou probabilidades. Desta forma, as probabilidades indicam a
percentagem de vezes que, em grande nmero de observaes, podemos esperar a ocorrncia dos
vrios resultados de uma varivel aleatria.
Varivel Aleatria:
uma funo com valores numricos, cujo valor determinado por fatores de chance.
Podem ser Discretas ou Contnuas.
Ex1: N de Coroas numa jogada
Ex2: N de clientes que entram numa grande loja no espao de 20 minutos: 0, 1, 2, 3, ....
Ex3: Altura dos estudantes numa sala de aula de uma Universidade: 1,53 m, ....., 2,10 m
Obs: Ex1 e Ex2 so variveis aleatrias discretas, e o Ex3 varivel aleatria contnua.
Varivel Aleatria Discreta Possui valores que possam ser contados. Nmeros
inteiros.
Varivel Aleatria Contnua Quando pode tomar qualquer valor de determinado
intervalo. Nmeros fracionados.
9.1 Distribuies de Probabilidades Descontnuas
As distribuies descontnuas de probabilidades envolvem variveis aleatrias relativas
a dados que podem ser contados, como o nmero de ocorrncia por amostra, ou o nmero de
ocorrncias por unidade num intervalo de tempo, de rea, ou de distncia.
9.1.1 Distribuio Binomial:
Usa-se o termo binomial para designar situaes em que os resultados de uma
varivel aleatria podem ser grupados em duas classes ou categorias. Os dados so, pois,
nominais. As categorias devem ser mutuamente excludentes, de modo a deixar perfeitamente
45
claro a qual categoria pertence determinada observao; e as classes devem ser coletivamente
exaustivas, de forma que nenhum outro resultado fora delas possvel.
Ex1: Respostas a um teste do tipo V ou F.
Ex2: Produtos manufaturados classificados como perfeitos ou defeituosos.
Ex3: Alunos de uma escola vacinados ou no vacinados.
( ) [ ] ( ) [ ]
x n x
falha P sucesso P
x
n
P(x)

|
|

\
|
=
( ) ( ) [ ] ( ) [ ]
x n
falha P sucesso P
x)! (n x!
n!
x P
x


|
|

\
|

=
Onde:
|
|

\
|
x
n
o nmero de maneiras de obter x sucesso e
n x falhas em n provas.
Ex1:
N X p
( )
x n x
p 1 p
x
n

|
|

\
|

5 3 0,30
( )
2 3
70 , 0 30 , 0
3
5
|
|

\
|

8 6 0,11
( )
2 6
89 , 0 11 , 0
6
8
|
|

\
|


Ex2: A probabilidade de obter exatamente 2 caras em 6 lances de uma moeda no-viciada?




9.1.2 Distribuio de Poisson:
A distribuio de Poisson til para descrever as probabilidades do nmero de
ocorrncia num campo ou intervalo contnuo (em geral tempo ou espao). Eis alguns exemplos
de variveis que podem ter como modelo a distribuio de Poisson: defeitos por cm
2
, acidentes
por dia, clientes por hora, chamadas telefnicas por minuto, vacas por acre, etc. Note-se que a
unidade de medida (tempo, rea) contnua, mas a varivel aleatria discreta (nmero de
ocorrncias). Alm disso, as falhas no so contveis. No possvel contar os acidentes que no
46
ocorreram, nem tampouco o nmero de chamadas que no foram feitas, nem o nmero de
defeitos por centmetro quadrado que no ocorreram.
( )
( )
x!
t
x P
x t

e

Onde: x o n de ocorrncias; e a base dos logaritmos naturais (a Tabela F contm alguns
valores de e
-
; a taxa mdia por unidade; e t o n de unidades. A quantidade t
representa o nmero mdio de ocorrncias no intervalo t. Assim, =t. A frmula pode ser
escrita de forma mais simples substituindo t por :
( )
( )
x!
x P
x

e

Ex: Um processo mecnico produz tecido para tapetes com uma mdia de dois defeitos por jarda.
Determine a probabilidade de uma jarda quadrada ter exatamente um defeito, admitindo que o
processo possa ser bem aproximado por uma distribuio de Poisson.




9.2 Distribuies de Probabilidade Contnuas:
Quando uma varivel aleatria discreta apresenta um grande nmero de resultados
possveis, ou quando a varivel aleatria em questo contnua, no se podem usar distribuies
discretas como a de Poisson ou a binomial para obter probabilidades. Uma varivel discreta com
muitos resultados possveis exigiria uma tabela por demais extensa ou um esforo monumental
na utilizao de uma frmula para obteno de probabilidades. Como uma varivel contnua
inclui, em seus resultados, valores tanto inteiros como no-inteiros, no pode ser adequadamente
descrita por uma distribuio discreta.




Caractersticas:
1. A curva Normal tem forma de sino.
2. simtrica em relao a mdia.
3. Prolonga-se de - a + .
47
4. Cada distribuio normal fica completamente especificada por sua mdia e seu desvio
padro; h uma distribuio normal distinta para cada combinao da mdia e desvio
padro.
5. A rea total sob a curva norma considerada como 100%.
6. A rea sob a curva entre dois pontos a probabilidade de uma varivel normalmente
distribuda tomar um valor entre esses pontos.
7. Como h um nmero ilimitado de valores no intervalo - a + , a probabilidade de uma
varivel aleatria distribuda normalmente tomar exatamente determinado valor
aproximadamente zero. Assim, as probabilidades se referem sempre a intervalos de
valores.
8. A rea sob a curva entre a mdia e um ponto arbitrrio funo do nmero de desvios
padres entre a mdia e aquele ponto.

( )
(
(

\
|
= =
|

\
|

2 x
2
1
x
2
1
exp
2
1
2
1
x f
2

e

9.2.1 A Distribuio Normal Padronizada:
A distribuio normal constitui, na realidade, uma famlia infinitamente grande de
distribuies, uma para cada combinao possvel da mdia e desvio padro. Conseqentemente,
seria intil procurar elaborar tabelas que atendessem a todas as necessidades. Alm disso, a
expresso da distribuio normal no conveniente para tal objetivo, em vista de sua
complexidade.
A implicao que o problema de lidar com uma famlia infinita de distribuies
normais pode ser completamente evitado desde que queiramos trabalhar com valores relativos,
ao invs de com valores reais. Isto equivale a tomar a mdia como ponto de referncia (origem) e
o desvio padro como medida de afastamento a contar daquele ponto (unidade de medida). Esta
nova escala comumente conhecida como escala Z.
Ex:
Onde:
Z = n de desvios padres a contar da mdia
X = valor arbitrrio
= a mdia da distribuio normal
= o desvio padro
48
10 TCNICAS DE CONTAGEM
Descobrir o nmero de resultados possveis de um Experimento.
10.1 Regra da Multiplicao: O produto do nmero de escolhas para uma sequncia de decises.
Ex1: Tenho sete cavalos, e h premiao para os trs primeiros lugares (1, 2 e 3). Quantos
arranjos posso fazer com essas probabilidades?
1 Lugar 2 Lugar 3 Lugar
7 x 6 x 5 = 210 resultados possveis
10.2 Arranjo: Nmero de grupamentos em que interfere a ordem.
A
n,x
= n!
(n x)!
Ex1: n de arranjos de 3 lugares para 7 cavalos:
A
7,3
= 7! = 7 x 6 x 5 x 4! = 210
(7 3)! 4!
10.3 Permutao com repetio (ou distinguveis): Alguns itens so idnticos, e a ordem
importante.
n
1
, n
2
,..., n
k

P
n

= n! / (n
1
!) . (n
2
!) . ......(n
k
!)
Ex1: Quantas permutaes distintas de 3 letras podemos formar com as letras R R R R U U U N?
H 8 letras: 4 Rs, 3 Us e 1 N
4,3,1
P
8

= 8! / (4!) . (3!) .(1!) = 8 x 7 x 6 x 5 x 4! = 1680 = 280
4! x 3 x 2 x 1 x 1 6

10.4 Permutao sem repetio (a ordem tambm importa):
P
n
= n!
Ex1: Suponhamos que haja quatro times de futebol num torneio. De quantas maneiras pode
apresentar-se o resultado final do campeonato?
1 Lugar 2 Lugar 3 Lugar 4 Lugar
4 x 3 x 2 x 1 = 24
ou
P
4
= 4! = 4 x 3 x 2 x 1 = 24
e) Combinao: A ordem no importa para denotar o nmero de grupamentos distintos possveis.
C
n,x
= n! / x! (n x)!
49
Ex1: Quantos comits distintos, de 3 pessoas cada um, podemos formar com um grupo de 10
pessoas?
C
10,3
= 10! / 3! (10 3)! = 10 x 9 x 8 x 7! = 720 = 120
7! (3 x 2 ) 6
Ex2: De quantas maneiras podemos formar um comit de 1 mulher e 2 homens, de um total de 4
mulheres e 6 homens?
(C
n,x
) . (C
n,x
) = (4!/3!.1!) x (6!/4!.2!) = 4 x 15 = 60
ou
4M e 6H
M x H x H
























50
11 AMOSTRAGEM
Quando se deseja colher informaes sobre um ou mais aspectos de um grupo grande
e numeroso, verifica-se muitas vezes ser praticamente impossvel fazer um levantamento do
todo. Da a necessidade de investigar apenas uma parte dessa populao ou universo. O
problema da amostragem , portanto, escolher uma parte, ou amostra, de tal forma que ela seja a
mais representativa possvel do todo e a partir dos resultados obtidos, relativos a esta parte, poder
inferir, o mais legitimamente possvel os resultados da populao total, se essa fosse verificada
em uma pesquisa censitria.
Desta forma, a finalidade da amostragem permitir fazer inferncias sobre uma
populao aps inspeo de apenas parte dela. Fatores como custo, tempo, ensaios destrutivos
(Ex. lmpadas, munio e dispositivo de segurana) e populaes infinitas tornam a amostragem
prefervel a um estudo completo (censo) da populao.
Exemplo
1
: Muitas firmas mantm milhares de itens em estoque. Utilizando tcnicas de
amostragem, pode-se estimar o valor do inventrio, sem proceder contagem dos
itens um a um;
Exemplo
2
: Uma fbrica freqentemente produz um pequeno nmero de peas (lote piloto) antes
de se lanar fabricao em grande escala;
Exemplo
3
: Produtos novos so testados nos mercados de cidades-chaves para aquilatar sua
aceitao em geral;
Exemplo
4
: Testar a qualidade do produto, por exemplo, cintos de segurana.

Para avanar no estudo de amostragem faz-se necessrio apresentar alguns conceitos:
a) Populao: o conjunto de elementos que apresentam pelo menos uma caracterstica em
comum. Sendo N o nmero total de elementos da populao, temos:
X
N
= X
1
; X
2
; ...; X
N
.
b) Amostra: uma poro ou parcela selecionada da populao, um subconjunto do
universo. Sendo n o nmero total de elementos da amostra, temos:
x
n
= x
1
; x
2
; ...; x
n
.
c) Amostras No-casuais: O pesquisador simplesmente inclui os elementos convenientes na
amostra, dela excluindo os inconvenientes, ou seja, no se considera o fator do acaso. Por
exemplo: Impe-se quotas para determinar a amostra. Tem-se uma populao de alunos de
uma dada universidade, onde 42% fossem mulheres e 58%, de homens. Usando este
mtodo, os entrevistadores recebem a incumbncia de localizar uma quota de estudantes de
tal forma que somente 42% da amostra consista de mulheres e 58%, de homens. As
mesmas porcentagens que configuram na populao so reproduzidas na amostra. Se o
tamanho global da amostra fosse 200, ento 84 moas e 116 rapazes deveriam ser
selecionados.
d) Amostras Casuais ou Aleatrias: Proporciona a cada membro da populao igual
oportunidade de fazer parte da amostra. Essa caracterstica da amostragem casual implica
que todos os sujeitos da populao devem ser identificados antes da extrao da amostra,
exigncia geralmente preenchida mediante a obteno (elaborao) de uma lista que
contenha todos os sujeitos da populao. As amostras aleatrias podem ser obtidas atravs:
51
(i) Um processo de mistura, como o embaralhamento de cartas;
(ii) Pela utilizao de um processo mecnico (computadores ou dispositivos
eletrnicos);
(iii) Utilizando-se uma tabela de nmeros aleatrios para proceder seleo de
uma lista.

A populao de uma pesquisa depende do assunto a ser investigado e a amostra, que
realmente ser submetida verificao, obtida por uma tcnica especfica de amostragem.
Naturalmente, espera-se que a amostra represente a populao de que foi extrada.
Potencialmente, este objetivo atingido quando a amostragem aleatria. Para populaes
discretas, o termo aleatrio significa que cada item da populao tem a mesma chance de ser
includo na amostra; no caso de populaes contnuas, significa que a probabilidade de incluir
qualquer valor de um dado intervalo de valores igual proporo da populao com valores
naquele intervalo. As amostras aleatrias podem ser obtidas (a) atravs de um processo de
mistura, como o embaralhamento de cartas, (b) pela utilizao de um processo mecnico
(computadores ou dispositivos eletrnicos), (c) utilizando-se uma tabela de nmeros aleatrios
para proceder seleo de uma lista.
Em certas condies, podem ser mais eficientes variantes da amostragem aleatria
simples, tais como amostragem (d) sistemtica (peridica), (e) estratificada (subgrupos
homogneos), (f) amostragem por conglomerados.

(d) Escolhe-se o k-simo item da lista (onde k igual tamanho da populao pelo tamanho da
amostra).
Ex: Se N = 200 e n = 10, K= 200 = 20
10
Significa isto que ser escolhido um item em cada seqncia de 20.

(e) A amostragem estratificada pressupe a diviso da populao em subgrupos (estratos) de
itens similares, procedendo-se ento amostragem em cada subgrupos. A lgica do processo
que, dispondo os itens da populao em subgrupos homogneos, a variabilidade menor que a
da populao global, o que leva necessidade de um menor tamanho da amostra.
(f) A amostragem por conglomerado pressupe a disposio dos itens de uma populao em
subgrupos heterogneos representativos da populao global. Idealmente, cada conglomerado
pode ser encarado como uma minipopulao. Na verdade, se a formao dos conglomerados foi
perfeita, cada conglomerado sendo exatamente semelhante a outro (e, assim, semelhante
populao bsica) bastaria examinar apenas um conglomerado para fazer inferncias sobre a
populao.
52
A principal vantagem da amostragem aleatria que se pode determinar o grau de
variabilidade amostral, o que essencial na inferncia estatstica. A amostragem no-
probabilstica falta esta caracterstica, muito embora possa ser utilizada por outras razes.

TIPO DESCRIO VANTAGENS DESVANTAGENS
a) Aleatria
Simples
Atribuir a cada elemento
da populao um
nmero nico:
selecionar a amostra
aleatoriamente.
1.Requer um conhecimento
mnimo e antecipado da
populao; 2. Livra de
possveis erros de
classificao; 3. Facilita a
anlise dos dados e o clculo
dos erros.
1. O conhecimento da populao
que o pesquisador possa ter
desprezado; 2. Para a mesma
extenso da amostra, os erros so
mais amplos que na amostragem
estratificada.
b) Sistemtica
Escolhe-se o k-simo
item da lista (onde k
igual tamanho da
populao pelo tamanho
da amostra. Se N= 200 e
n=10, k=200/10=20),
significa isto que ser
escolhido um item em
cada seqncia de 20.
1. D como efeito a
estratificao e, portanto
reduz a variabilidade, em
comparao com A, se a
populao ordenada com
respeito a propriedade
relevante; 2. Simplifica a
colheita de amostra; permite
verificao fcil.
1. Se o intervalo de amostragem
se relaciona a uma ordenao
peridica da populao, pode ser
introduzida variabilidade
crescente; 2. Se h efeito de
estratificao, as estimativas de
erro tendem a ser altas.
c) Conglomerado
Pressupe a disposio
dos itens de uma
populao em sub-
grupos heterogneos
representativos da
populao global.
1. Oferece listas de
amostragem, identificao e
numerao necessrias apenas
para elementos das unidades
de amostragem selecionadas;
2. Diminuem os custos de
viagem se as unidades de
amostragem so definidas
geograficamente, pois os itens
esto fisicamente prximos
uns dos outros
1. Os erros tendem a ser maiores
do que em A ou B, para a mesma
extenso da amostra; 2. Os erros
crescem com o decrscimo do
nmero de unidades de
amostragem escolhidas.
d) Estratificada
Proporcional
Escolher de cada
unidade de amostragem,
amostra aleatria
proporcional extenso
da unidade de
amostragem.
1. Assegura
representatividade com
respeito propriedade que d
a base para classificar as
unidades; garante, pois,
menor variabilidade A ou B;
2. Decresce a possibilidade de
deixar incluir elementos da
populao por causa do
processo classificatrio; 3.
Podem ser avaliadas as
caractersticas de cada estrato
e, pois feitas comparaes.
1. Sob pena de aumentar o erro,
requer informao apurada acerca
da proporo de populao em
cada estrato; 2. Se h listas
estratificadas disponveis,
prepar-las pode ser dispendioso;
possibilidade de classificao
errnea e, pois de aumento da
variabilidade.