Probabilidade e
Estatstica
UnisulVirtual
Palhoa, 2016
Crditos
Universidade do Sul de Santa Catarina Unisul
Reitor
Fabiano Ceretta
Fabiano Ceretta
Unidade de Articulao Acadmica (UnA) Cincias Sociais, Direito, Negcios e Servios
Moacir Heerdt
Roberto Iunskovski
Mrcia Loch
Probabilidade e
Estatstica
Livro didtico
3a Edio
Designer instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher
Eliete de Oliveira Costa
UnisulVirtual
Palhoa, 2016
Copyright
UnisulVirtual 2016
Livro Digital
Professor conteudista
Luiz Arthur Dornelles Jnior
Revisor
Contextuar
ISNB
978-85-506-0036-9
Designer instrucional
Karla Leonora Dahse Nunes
Sabrina Bleicher (2 edio)
Eliete de Oliveira Costa (3 edio)
e-ISBN
978-85-506-0037-6
D75
Sumrio
Introduo |7
Captulo 1
Estatstica descritiva|9
Captulo 2
Captulo 3
Probabilidade|91
Captulo 4
Captulo 5
Consideraes Finais|177
Referncias|179
Sobre os Professores Conteudistas |181
Respostas e comentrios das atividades de autoavaliao|183
Anexos|216
Introduo
Bons estudos!
Professor Luiz Arthur Dornelles Jr.
Captulo 1
Estatstica descritiva
Seo 1
Introduo Estatstica
A cada dia, nossa sociedade torna-se mais complexa. Convivemos com os
indicadores econmicos, com a inflao, com a reforma da previdncia, com o
controle de qualidade, enfim, deparamo-nos constantemente com situaes e
informaes sempre mais complexas.
No que se refere gesto das organizaes, a situao no diferente. Para se
administrar uma empresa, seja pblica ou privada, necessitamos de ferramentas
para poder acompanhar a evoluo da sociedade e, assim, analisar situaes
e informaes, bem como dar suporte s nossas decises. Assim como no
setor pblico, a Estatstica uma tima forma para prever e estudar as variveis
econmicas, tais como juros, inflao, dentre outros.
Por isso, dizemos que a Estatstica um conjunto de ferramentas, as quais,
quando bem empregadas, podem ser de grande utilidade para a gesto de
empresas e no setor pblico em geral. Hoje em dia, sem a Estatstica, no
seramos capazes de avaliar a variao de preos, da inflao, de consumo, nem
fazer controle de qualidade, pesquisa eleitoral etc.
Para conhecer Estatstica, importante que voc compreenda, antes, o
significado da palavra e o seu conceito. A palavra Estatstica origina-se do
latim, e o seu radical status, significa estado. Sendo assim, a palavra Estatstica
significa o estudo do estado. Para entender o conceito de estudo do estado,
acompanhe as seguintes definies sobre Estatstica:
A Estatstica uma coleo de mtodos para planejar
experimentos, obter dados e organiz-los e, deles, extrair
concluses. (TRIOLA, 1999, p. 2).
Captulo 1
A Estatstica est interessada nos mtodos cientficos para a
coleta, a organizao, o resumo, a apresentao e a anlise
de dados, bem como na obteno de concluses vlidas e
na tomada de decises razoveis, baseadas em tais anlises.
(SPIEGEL, 1994, p. 1).
Estatstica um conjunto de mtodos e processos
quantitativos que serve para estudar e medir os fenmenos
coletivos. (SILVA, 1999, p. 11).
Em termos gerais, convm destacar que a Estatstica est dividida em duas partes:
Estatstica descritiva: aplicada quando voc depara-se com uma
quantidade muito grande de dados, e difcil tirar concluses sobre o
fenmeno. A Estatstica descritiva usada para reduzir as informaes
at o ponto em que se possa interpretar tal fenmeno. O objetivo da
Estatstica descritiva observar fenmenos de mesma natureza, coletar,
organizar, classificar, apresentar, interpretar e analisar dados referentes
ao fenmeno por meio de grficos e tabelas, alm de calcular medidas
de tendncia que permitam descrever o fenmeno.
Estatstica indutiva: aplicada quando impossvel realizar levantamentos
com a totalidade dos objetos de uma pesquisa, seja por tempo, ou por
economia etc., somente uma parcela desses elementos utilizada para
realizar as observaes. Partindo, nesse caso, de uma parcela desses
elementos, a Estatstica indutiva chega a concluses e realiza previses
sobre elementos em questo (mtodo que se fundamenta na teoria da
probabilidade associada a uma margem de incerteza).
Para a obteno de resultados confiveis, que reflitam a realidade dos fatos, necessrio
realizar uma pesquisa, cuidadosamente planejada, com mtodos adequados.
O mtodo um conjunto de meios dispostos convenientemente para se chegar a um fim
que se demarcou. O mtodo estatstico, diante da impossibilidade de manter as causas
constantes, admite as causas presentes, variando-as, registrando essas variaes e
procurando determinar, no resultado final, que influncias cabem a cada uma delas.
10
Probabilidade e Estatstica
Alguns passos precisam ser seguidos para que seja aplicado o mtodo estatstico
e, assim, realizada uma boa pesquisa. Para voc entender quais so esses
passos, acompanhe, a seguir, as principais fases.
a. Definio do problema: a primeira fase do trabalho estatstico
consiste em uma definio ou formulao correta do problema a ser
estudado. Nesta fase, voc precisa definir:
O que ser pesquisado? Definir o tema e os objetivos de
pesquisa.
Em que setor geogrfico? O pblico-alvo a ser planejado.
Como ser a amostra? Incluir o clculo da amostra e as
tcnicas de coletas de dados.
b. Planejamento: consiste em determinar o procedimento necessrio
para levantar informaes sobre o assunto objeto do estudo. Voc
dever definir como sero coletados os dados de pesquisa, j que
isso pode ser feito de vrias formas.
Observao direta: caracteriza-se quando o pesquisador
somente faz observaes para coletar os dados necessrios
para a pesquisa.
Entrevista oral: caracteriza-se por estabelecer perguntas
orais a um indivduo ou grupo de indivduos. As entrevistas
podem ser classificadas em estruturadas e no estruturadas;
entrevistas estruturadas so aquelas em que o pesquisador
estabelece um roteiro prvio de perguntas. Nas entrevistas
no estruturadas, o pesquisador, por meio de uma conversa
amigvel, busca levantar dados que possam ser utilizados em
anlise qualitativa, selecionando-se os aspectos mais relevantes
do problema de pesquisa. (RAUEN, 2006).
Entrevista escrita ou questionrio: questionrio uma lista
de indagaes escritas, as quais devem ser respondidas por
escrito pelo informante. Sua vantagem a possibilidade de se
indagarem muitas pessoas ao mesmo tempo. Para entrevistar
uma sala de universitrios, basta distribuir as folhas, para
que todos respondam simultaneamente (entrevista de grupo)
(RAUEN, 2006). O questionrio uma forma muito utilizada
na coleta de dados, mas exige ser: completo (responder
tudo), concreto (perguntas claras e objetivas), secreto (sem
identificao) e discreto (perguntas bem formuladas).
11
Captulo 1
preciso planejar o trabalho a ser realizado, tendo em vista o objetivo que se
pretende atingir.
c. Coleta de dados: compreende a coleta das informaes
propriamente ditas. Formalmente, a coleta de dados refere-se
obteno, reunio e ao registro sistemtico de dados com um
objetivo determinado.
d. Apurao dos dados: consiste em reunir os dados por meio de sua
contagem e seu agrupamento.
e. Apresentao dos dados: os dados estatsticos podem ser mais
facilmente compreendidos quando apresentados por meio de uma
representao grfica, o que permite uma visualizao instantnea
de todos os dados.
f. Anlise e interpretao de dados: nesta etapa, o interesse maior
reside em tirar concluses que auxiliam o pesquisador a atingir seu
objetivo, ou seja, encontrar a resposta para a sua pergunta.
Populao
Produo de
dados
Amostra
Estudo da amostra:
- tabelas
- grficos
- medidas
Caractersticas
populacionais
Estatstica
Indutiva
Caractersticas
amostrais
12
Probabilidade e Estatstica
Populao e amostra
Quando voc prepara um alimento, pode provar (observar) uma pequena poro.
Nesse procedimento, voc est fazendo o processo de amostragem, ou seja,
extraindo do todo (populao) uma parte (amostra), com o propsito de inferir
(avaliar) a qualidade de todo o alimento. A partir do exemplo, podemos distinguir
dois importantes conceitos da Estatstica descritiva: populao e amostra.
Populao o conjunto total de elementos com, pelo menos, uma caracterstica em
comum, cujo comportamento interessa estudar.
13
Captulo 1
A amostra precisa ser representativa, ou seja, possuir as mesmas caractersticas
da populao.
A representao do tamanho da amostra dada por n = nmero de elementos
da amostra.
1 - O censo era considerado uma pesquisa desatualizada pela demora da publicao dos dados, mas a
tecnologia veio para diminuir em muito esse tempo de publicao. No ano de 2010, constatamos que os dados
foram publicados com mais rapidez do que nas dcadas anteriores. Acesse o site do Instituto Brasileiro de
Geografia e Estatstica (IBGE) e consulte informaes da sua cidade e do seu estado: <www.ibge.gov.br>.
14
Probabilidade e Estatstica
Estimativa: o valor assumido por certa Estatstica (exemplo: 60%
o valor de estimativa do referido parmetro).
Amostragem
Como exposto neste captulo, as pesquisas so realizadas por meio de estudo
dos elementos que compem uma amostra extrada da populao que se
pretende analisar.
A populao o conjunto de indivduos ou objetos que apresentam, em comum,
determinadas caractersticas definidas para o estudo. Amostra um subconjunto
da populao. O estudo de todos os elementos da populao possibilita
conhecimento preciso das variveis que esto sendo pesquisadas; todavia, nem
sempre possvel obter as informaes de todos os elementos da populao.
Limitaes de tempo, custo e as vantagens do uso das tcnicas Estatsticas
justificam o uso de planos amostrais. A representatividade da amostra depender
do seu tamanho (quanto maior, melhor). O investigador procurar acercar-se de
cuidados, visando obteno de uma amostra significativa, ou seja, que de fato
represente toda a populao da melhor maneira possvel. (FONSECA, 1996).
Observe, a seguir, mais alguns conceitos do processo estatstico, relacionados
amostragem:
Estatstica: caracterstica descritiva dos elementos da amostra
(percentagem, mdia etc.).
Erro amostral: a mxima diferena que o investigador/pesquisador
admite entre a mdia da populao e a mdia da amostra. Em
pesquisa, admite-se o uso do erro amostral entre 1% a 10%. Observe,
por exemplo, as pesquisas eleitorais, a maioria destas efetuada com
erro amostral de 2%. Isso significa que pode variar de 2% a +2%.
Quando se diz que dois candidatos esto com empate tcnico, isso
quer dizer que, somando ou diminuindo 2%, eles esto empatados.
Exemplo
O candidato A est com 48% da preferncia dos votos, e o candidato B est com
52% da preferncia dos votos. O candidato A tem 48%; diminuindo os 2% = 46;
com 48% mais 2% = 50%. Ou seja, varia de 46% a 50%. J, o candidato B tem
52% menos 2% = 50%; com 52% mais 2% = 54%. Logo, considerando-se o erro
amostral, os candidatos esto empatados tecnicamente, com 50% cada.
15
Captulo 1
Nvel de confiana: expresso em percentual e representa quantas
vezes o percentual real da populao encontra-se dentro do
intervalo de confiana. O nvel de confiana de 95% significa que
voc tem 95% de certeza. A maioria dos pesquisadores usa o nvel
de confiana de 95%.
Variveis
Variveis so conjuntos de caractersticas que podem ser observados e/ou medidos
em cada elemento da populao ou amostra, sob as mesmas condies.
Ao analisar uma determinada experincia, um fato ou um elemento, voc pode
verificar que todos eles assumem diferentes caractersticas ou valores.
Exemplo: ao analisar um determinado setor de uma empresa, voc pode verificar,
entre seus funcionrios, algumas caractersticas (variveis) como sexo, idade,
salrio, assiduidade etc.
Essas caractersticas variam de elemento para elemento, por isso so chamadas
de variveis.
As variveis so classificadas em dois tipos:
Qualitativas: representam a informao que identifica alguma
qualidade, categoria ou caracterstica, no suscetvel de medida (no
numrica), mas de classificao, assumindo vrias modalidades.
Exemplo:
Estado civil: casado, solteiro, vivo, divorciado.
Sexo: masculino e feminino.
Escolaridade: 1 grau, 2 grau, 3 grau.
16
Probabilidade e Estatstica
As variveis qualitativas esto divididas em:
Nominais: so dados caracterizados por rtulos ou categorias.
Por exemplo, sexo, estado civil, cor dos olhos etc.
Ordinais: so dados caracterizados por uma ordem, mas no
podem ser diferenciados por valor numrico. Por exemplo: nvel
de escolaridade (1, 2 e 3 graus), intensidade da luz (muito
forte, forte, mdia, suave, muito suave).
Quantitativas: representam a informao resultante de
caractersticas suscetveis de serem medidas, apresentam-se com
diferentes intensidades.
Exemplo:
Idade: 19 anos, 20 anos, 35 anos.
Nmero de nascidos vivos: 10, 15, 22, 12, 14.
Peso: 55 kg, 66 kg, 71 kg.
17
Captulo 1
Dados
Dados estatsticos so medidas da presena de um determinado conjunto de
valores de uma varivel em uma populao ou amostra. Os tipos de dados
estatsticos so:
dados primrios: quando so observados e/ou levantados pelo
prprio pesquisador ou pela organizao que os tenha recolhido;
dados secundrios: quando so observados e/ou levantados por
outra organizao ou pesquisador.
Alm dessa classificao, os dados tambm pode ser absolutos e relativos. Nesta
seo, vamos aprender a transformar dados absolutos em dados relativos, mas,
antes disso, vamos conhecer suas definies.
Dados absolutos so dados estatsticos resultantes da coleta direta
da fonte, sem outra manipulao a no ser a contagem ou medida.
A leitura dos dados absolutos sempre enfadonha e inexpressiva.
Embora, esses dados traduzam um resultado exato e fiel, no tm a
virtude de ressaltar de imediato as suas concluses numricas.
18
Probabilidade e Estatstica
Seo 2
Distribuio de frequncia
Com a posse dos dados de forma desorganizada, um primeiro passo seria
organiz-los em tabelas para que possibilitem uma primeira anlise, alm de
servirem para uma srie de interpretaes. Voc poder aprender como se
organizam dados brutos e como pode ser analisada a distribuio de frequncias.
Antes de qualquer coisa, voc precisa saber o que so dados brutos e dados agrupados.
Dados brutos
Dados brutos so sequncias de valores numricos ou no, os quais no sofreram
qualquer tratamento estatstico, nem foram organizados, obtidos diretamente da
observao de um fenmeno.
Legenda do quadro:
I Investimentos imobilirios;
19
Captulo 1
Repare que, neste caso, foram pesquisados 56 clientes e foram anotadas as
respostas na ordem das entrevistas.
20
Probabilidade e Estatstica
Quadro 1.3 Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remdios
23,25
27,43
17,76
33,33
33,05
16,08
34,49
23,74
32,63
20,58
18,50
16,69
16,43
20,08
19,00
16,13
21,36
26,60
22,49
22,77
23,05
33,55
22,73
24,89
24,11
34,83
21,73
31,53
35,13
34,36
20,80
16,84
29,55
34,76
31,72
24,89
21,65
22,65
30,43
30,93
17,25
17,05
19,67
22,79
25,30
23,08
25,77
35,03
16,59
15,90
20,30
33,86
17,76
30,93
20,81
29,05
Dados agrupados
Dados agrupados so sequncias de valores numricos, ou no, os quais se
encontram j organizados, ou por semelhana (qualitativas), ou por ordenao
numrica (quantitativas), em tabelas.
21
Captulo 1
Repare que os dados esto organizados por tipo de investimento.
Agora, voc vai escrever, em uma coluna, cada uma das opes verificadas. Contar
o nmero de vezes em que cada tipo aparece e marcar com traos, ao lado, para
representar as aparies. Em seguida, conte o nmero de traos para obter o nmero
de vezes que cada opo aparece. Observe o quadro da contagem dos dados.
I
= 14
= 10
= 22
= 10
Tipo de investimento
Nmero de clientes
Imobilirio
14
Mercado de aes
10
Poupana
22
10
Total
56
22
Probabilidade e Estatstica
Quadro 1.5 Levantamento sobre o nmero de defeitos por pea de uma fbrica de rolamentos
Repare que foram organizados conforme uma ordem numrica crescente (de
0 a 6). A organizao dos dados na forma de lista em ordem crescente ou
decrescente chamada de Rol.
Depois de criar o Rol de dados, escreva, em uma coluna, cada um dos valores
observados. Conte o nmero de vezes em que cada tipo aparece e marque com
traos, ao lado, para representar as aparies. Aps terminar, conte o nmero
de traos para obter o nmero de vezes em que cada valor aparece. Observe o
quadro da contagem dos dados.
Quadro 1.6 Contagem do nmero de elementos X
33
23
Captulo 1
Tabela 1.3 Nmero de defeitos por peas analisadas do lote
Valores que a
varivel pode
assumir
33
1
Total (fi) 56
Frequncia
simples
Frequncia
total
2 - Para a varivel quantitativa contnua, utilizam-se intervalos na tabela para representar a srie de dados.
Esses intervalos denominam-se intervalos de classes.
24
Probabilidade e Estatstica
Para comear, novamente, voc deve organizar os dados em ordem crescente (Rol).
Quadro 1.7 Levantamento sobre o volume de vendas mensal de 56 representantes de uma empresa
que fabrica remdios
15,90
16,08
16,13
16,43
16,59
16,69
16,84
17,05
17,25
17,76
17,76
18,50
19,00
19,67
20,08
20,30
20,58
20,80
20,81
21,36
21,65
21,73
22,49
22,65
22,73
22,77
22,79
23,05
23,08
23,25
23,74
24,11
24,89
24,89
25,30
25,77
26,60
27,43
29,05
29,55
30,43
30,93
30,93
31,53
31,72
32,63
33,05
33,33
33,55
33,86
34,36
34,49
34,76
34,83
35,03
35,13
k= n;
n;
25
Captulo 1
Agora, vamos analisar as amplitudes e os limites de classe para determinar o
tamanho dos intervalos.
a. Amplitude total da distribuio (AT): a diferena entre o maior
valor e o menor valor observado.
L (mx.) = Limite mximo (maior valor);
l (mn.) = Limite mnimo (menor valor).
Nesta etapa, conveniente que o resultado seja arredondado para cima, a fim de que
no haja perda de informao, sempre, em qualquer caso, arredondar para cima.
b. Amplitude de um intervalo de classe (h): tambm chamada de
tamanho do intervalo de classe, obtida da seguinte forma.
h=
No exemplo:
AT
k
26
Probabilidade e Estatstica
Caso no seja satisfeita essa condio, ser necessrio fazer um ajuste,
aumentando o tamanho do intervalo.
Ento, resumindo, segundo o exemplo dado, a tabela ter:
sete intervalos;
cada um com o tamanho de 2,80.
c. Limites de classes: so os extremos de cada classe. O limite
inferior da classe (Li) o menor nmero do intervalo. O limite
superior (Ls) o maior nmero do intervalo.
15,90
Observe que os intervalos so escritos dessa forma: 15,90 |--- 18,70. O que
isso significa?
27
Captulo 1
A representao indica um intervalo fechado esquerda e, aberto direita
[15,90; 18,70), ou seja, os valores deste intervalo chegam perto de 18,70, mas no
exatamente o valor 18,70 est no prximo intervalo: 18,70 |--- 21,50; o valor 21,50
no est neste intervalo, e sim no intervalo: 21,50 |---24,30. E assim por diante.
Agora, a vez de partir para a construo da tabela, sem esquecer-se de seus
componentes. Primeiro, monte a tabela e escreva os intervalos.
Tabela 1.5 Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remdios outubro/2010
Classe
15,90
16,08
16,13
16,43
16,59
16,69
16,84
17,05
17,25
17,76
17,76
18,50
19,00
19,67
20,08
20,30
20,58
20,80
20,81
21,36
21,65
21,73
22,49
22,65
22,73
22,77
22,79
23,05
23,08
23,25
23,74
24,11
24,89
24,89
25,30
25,77
26,60
27,43
29,05
29,55
30,43
30,93
30,93
31,53
31,72
32,63
33,05
33,33
33,55
33,86
34,36
34,49
34,76
34,83
35,03
35,13
28
Probabilidade e Estatstica
Tabela 1.6 Volume de vendas mensal, em milhares de reais, dos representantes de uma empresa que
fabrica remdios outubro/2010
Classe
Volume de vendas
(em mil reais)
No de
representantes (fi)
12
12
10
Contagem
56
Total (fi)
Fonte: Elaborao do autor (2010).
Intervalo de
classes
No de representantes (fi)
12
12
10
Total (fi)
56
Frequncia
simples
Frequncia
total
29
Captulo 1
Tipos de frequncia
A Estatstica tem como uma de suas finalidades facilitar a anlise e a leitura dos
dados, e, justamente, para isso, um dos mtodos utilizados trabalhar com tipos
de frequncia. O nmero de vezes que o X aparece no Rol de dados representa
a fi, frequncia simples, e, a partir dessa frequncia simples, podemos calcular a
fa (frequncia acumulada), a fr (frequncia relativa) e a fp (frequncia percentual).
Esses tipos de frequncia sero apresentados a seguir.
Frequncia acumulada
Na tabela, na coluna da frequncia acumulada, voc dever escrever o valor
acumulado das frequncias, ou seja, para comear, repita a frequncia simples
da primeira linha e, nas linhas seguintes, some a frequncia simples frequncia
acumulada anterior.
Esse processo dever chegar at a frequncia total
fa = fa(ant) + fi
Sendo:
fa: frequncia acumulada;
fa(ant.): frequncia crescente da classe anterior;
fi: frequncia simples da classe.
30
Probabilidade e Estatstica
Tabela 1.8 Volume de vendas.
Volume de vendas (em
mil reais)
No de
representantes (fi)
fa
12
12
20
12
32
37
40
46
10
56
Total (fi)
56
Repetir a
primeira fi
31
Captulo 1
fr =
fi
n
Sendo:
fr: frequncia relativa da classe;
fi: frequncia simples da classe;
n: nmero total de observaes (pode-se usar n ou
).
Neste caso, deve-se calcular a frequncia com quatro casas decimais visando ao
prximo passo.
Tabela 1.9 Volume de vendas
Volume de vendas (em
mil reais)
No de
representantes (fi)
fr
12
0,2143
0,1429
12
0,2143
0,0893
0,0536
0,1071
10
0,1786
Total (fi)
56
1,00
fr =
= 0,2143
fr =
= 0,0893
Lembre-se: use sempre quatro casas decimais para arredondar a frequncia relativa.
32
Probabilidade e Estatstica
fp = fr . 100
Sendo:
fp: frequncia percentual;
fr: frequncia relativa.
Tabela 1.10 Volume de vendas
Volume de vendas
(em mil reais)
No de
representantes (fi)
fr
fp (%)
12
0,2143
21,43
0,1429
14,29
12
0,2143
21,43
0,0893
8,93
0,0893.100 = 8,93
0,0536
5,36
0,0536.100 = 5,36
0,1071
10,71
0,1071.100 = 10,71
10
0,1786
17,86
Total (fi)
56
1,00
100,00
0,2143.100 = 21,43
0,1429.100 = 14,29
0,2143.100 = 21,43
0,1786.100 = 17,86
33
Captulo 1
E vem aquela pergunta: O que representa, do total, os representantes que
venderam de 32,70 a 35,50 mil reais? Voc poderia responder diretamente, sem
clculos: 17,86%.
E, se perguntarem: Quantos representantes venderam de 24,3 a 27,1 mil reais ou
mais? Voc responderia: 8,93%.
Observe que, nesse exemplo, o volume de vendas questionado sempre um
intervalo. Antes de acompanhar os outros tipos de frequncia, entenda o que
ponto mdio de uma classe.
Ponto mdio de uma classe so os valores da varivel que se encontram
exatamente na metade do intervalo de cada classe.
Para calcular o ponto mdio, usa-se a mdia aritmtica simples dos limites de
cada intervalo.
PM =
Ls + Li
2
Sendo:
PM: ponto mdio;
Ls: limite superior do intervalo;
Li: limite inferior de cada intervalo.
A tabela, a seguir, indica o clculo do ponto mdio para o exemplo que estamos
estudando.
Tabela 1.11 Volume de vendas.
Volume de vendas
(em mil reais)
No de
representantes (fi)
PM
12
17,3
20,1
12
22,9
25,7
28,5
31,3
10
34,1
Total (fi)
56
34
PM =
PM =
PM =
PM =
Probabilidade e Estatstica
Lembre-se deste conceito, o ponto mdio ser usado para outros clculos que
voc ir realizar mais adiante, tais como mdia e desvio padro.
Seo 3
Representao grfica
O grfico constitui outra maneira de se apresentarem os dados estatsticos. Eles
tm a finalidade de mostrar com clareza, veracidade e rapidez os dados que
esto sendo estudados. Alm disso, os grficos propiciam uma noo muito boa
de como algum fenmeno comporta-se.
Por meio de formas geomtricas, os grficos mostram, por rea ou volume, as
diferenas entre as opes de cada varivel.
Tome cuidado ao interpretar um grfico. Assim como os grficos podem dar
informaes rpidas e precisas, sua manipulao pode distorcer a realidade,
provocando tendenciosidade nas informaes.
180
160
140
120
100
80
60
40
20
2000
1990
1980
1970
1960
1950
1940
1920
1900
1890
Anos
35
Captulo 1
Grfico 1.2 Censo demogrfico Brasil 1890 2000
180
Populao (em milhes)
160
140
120
100
80
60
40
20
0
1890
1900
1920
1940
1950
1960
Anos
1970
1980
1990
2000
36
Probabilidade e Estatstica
Para a construo de grficos, voc dever observar alguns itens que se fazem
necessrios neles:
todo grfico deve ter ttulo e fonte (no rodap), para que o leitor no
tenha a necessidade de voltar ao texto para saber do que se trata;
a escala do eixo horizontal deve ser escrita abaixo deste e dever
crescer da esquerda para a direita;
a escala do eixo vertical deve ser escrita esquerda deste e crescer
de baixo para cima;
cada eixo deve ser identificado com o que est sendo medido ou
representado;
no necessrio colocar linhas de grade (que saem das marcas das
escalas horizontais e verticais), pois estas so opcionais.
Eixo vertical
Aqui, a escala
fica a esquerda
160
140
120
100
80
60
Linha de grade
40
20
0
1890
Ttulo e
Fonte
1900
1920
1940
1950
1960
Anos
1970
1980
1990
2000
Eixo horizontal
Aqui, a escala
fica abaixo
37
Captulo 1
Uma planilha eletrnica utiliza tabelas para a realizao de clculos e permite,
tambm, a criao de vrios tipos de grficos, o que facilita a representao e
anlise de dados estatsticos.
Os principais tipos de grficos so os diagramas, os cartogramas e os pictogramas.
Diagramas
Os diagramas so grficos geomtricos de, no mximo, duas dimenses; para
sua construo, em geral, fazemos uso do sistema cartesiano (eixo X e Y). Os
principais diagramas so os grficos de linhas, colunas, barras, setores ou pizza e
o grfico polar. Veja cada um desses tipos.
Grfico de colunas
usado para apresentar sries temporais, geogrficas e especficas. Formado
por retngulos dispostos verticalmente, de mesma largura (arbitrria), com altura
proporcional s grandezas (variveis) do fenmeno a ser representado.
Todos os retngulos tm base comum no eixo de x e, no eixo de y, os valores das
variveis estudadas. Observe os exemplos na Tabela 2.10 e nos Grficos 2.6 e 2.7.
Tabela 1.12 Mortalidade Infantil, na regio Sul e Sudeste, 2004
Estado
SC
17,2
RS
14,3
PR
20,0
SP
16,5
RJ
20,9
ES
20,1
MG
21,8
38
Probabilidade e Estatstica
Grfico 1.4 Mortalidade Infantil, na regio Sul e Sudeste, 2004
25
20
15
10
5
0
SC
RS
PR
SP
RJ
ES
MG
Grfico 1.5 Porcentagem de mulheres, com filhos antes dos 20 anos, 2000
50
47
45
40
35
Percentual (%)
35
29
30
25
19
20
15
10
5
0
frica
Amrica do Norte
Amrica Latina
sia
39
Captulo 1
Grfico de barras
Segue as mesmas normas do grfico de colunas, porm os retngulos ocupam
posio horizontal e, por isso, tero base comum no eixo y. tambm mais
indicado para sries geogrficas e especficas.
Grfico de linhas
comum, para quem trabalha na rea de administrao e negcios, observar o
comportamento de uma varivel ao longo do tempo. Por exemplo, um executivo
que acompanha a cotao diria das aes da sua empresa, um gerente que
acompanha o volume semanal de vendas de sua loja ou um engenheiro de
produo que acompanha caractersticas de qualidade do produto que fabrica.
Ano
Exportao
Importao
2005
118.309
73.545
2006
137.807
91.350
2007
160.649
120.610
2008
197.953
173.148
2009
152.252
127.637
40
Probabilidade e Estatstica
Valores
Grfico 1.6 Balana comercial brasileira (Valores em US$ milhes), 2005 a 2009
200.000
180.000
160.000
140.000
120.000
100.000
80.000
60.000
40.000
20.000
0
Exportao
Importao
.2005
.2006
.2007
.2008
.2009
Ano
Grfico polar
o grfico mais indicado quando temos necessidade de representar variaes
cclicas, ou seja, que se repetem em perodos predeterminados. O grfico polar
mais utilizado em estudos climticos (para sries temporais).
Cartograma
O cartograma a representao sobre um mapa. Este grfico empregado
quando o objetivo o de figurar os dados estatsticos diretamente relacionados
com reas geogrficas ou polticas.
Pictogramas
Pictogramas so construdos a partir de figuras ou conjunto de figuras
representativas da intensidade ou das modalidades do fenmeno.
So mais utilizados em jornais, revistas, cartazes e propagandas, ou seja, quando se
deseja dar um efeito mais atrativo ou chamar a ateno, sem nenhum rigor cientfico.
41
Captulo 1
Histograma
Este grfico muito semelhante ao de colunas, ou seja, formado por um
conjunto de retngulos justapostos, de maneira que a altura de cada retngulo
seja proporcional frequncia simples da classe por ele representada.
construdo no sistema de eixos cartesianos. No eixo horizontal, so marcados
os valores ou intervalos das classes assumidos pela varivel. No eixo vertical,
so marcadas as frequncias simples, que serviro para marcar a altura dos
retngulos, indicando, assim, o nmero de observaes (ocorrncias) de cada
valor ou classe da varivel.
Como a altura de cada retngulo proporcional frequncia simples, a rea de
cada retngulo tambm . Considerando isso, a soma das reas dos retngulos
tambm proporcional frequncia total.
Para construir um histograma:
desenhe os eixos vertical e horizontal;
faa as escalas em cada um dos eixos no horizontal, os intervalos
de classe; e, no vertical, a frequncia;
desenhe os retngulos que representam cada intervalo com a
mesma largura de cada intervalo e com a altura proporcional s
frequncias dos intervalos;
no se esquea de escrever o ttulo e a fonte.
42
Probabilidade e Estatstica
Tabela 1.14 Quantidade de xido de enxofre
Quantidade de xido de
enxofre
N de meses (fi)
10
11
20
13
3
70
Total
Fonte: Elaborao do autor (2010).
Grfico 1.7 Emisso de xido de enxofre nos ltimos 70 meses (em toneladas)
25
20
No meses
20
15
13
10
10
11
7
5
5
43
Captulo 1
Polgono de frequncias
Unindo por linhas retas os pontos mdios das bases superiores dos retngulos
do histograma, obtm-se outra representao dos dados, denominada
polgono de frequncias.
Voc pode observar que a rea do histograma igual rea abaixo do polgono
de frequncias, ou seja, os retngulos que ficam fora so compensados pelos
tringulos que esto adicionados por dentro.
Grfico 1.8 Emisso de xido de enxofre (em toneladas)
25
20
No meses
20
15
13
10
10
11
7
5
5
17,3 |--- 21,0 21,0 |--- 24,7 24,7 |--- 28,4 28,4 |---32,1
44
Probabilidade e Estatstica
Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
1. Analise os conceitos de censo e estimao e descreva a principal diferena
entre os termos.
2. Ao escolher os elementos de uma amostra, o que voc deve considerar para
que ela seja representativa? Por qu?
3. Como voc pde acompanhar, existem dois tipos de variveis: a qualitativa,
que est dividida em nominal e ordinria, e a quantitativa, que est dividida em
contnua e discreta. Identifique, no seu dia a dia, pelo menos um exemplo de cada
uma dessas variveis e escreva-as no quadro a seguir.
Varivel
Exemplo
Qualitativa nominal
Qualitativa ordinal
Quantitativa discreta
Quantitativa contnua
45
Captulo 1
5. Classifique cada uma das variveis a seguir em qualitativa nominal ou ordinal
e em quantitativa discreta ou contnua.
Descrio da varivel
Saldo em conta corrente em R$:
Idade do cliente:
Sexo do cliente:
Classe econmica:
Estado civil:
Nmero de defeitos do produto:
Consumo de energia em kWh:
Nmero de filhos:
Comprimento da pea:
Tempo de espera em caixa eletrnico
(em minutos):
Nome de pas exportador de petrleo:
Grau de satisfao no atendimento
em uma loja comercial:
Nmero de alunos de uma
universidade:
46
Classificao
Probabilidade e Estatstica
6. Um relatrio recente distinguiu em seis tipos os principais motivos de tenso
(estresse). A pesquisa realizada para provar isso resultou nos dados a seguir
(dados fictcios).
MP
MC
DO
DG
MF
DM
MF
MP
DG
MC
MC
MF
MF
MC
MC
MF
MC
MP
DO
MP
MP
MP
DM
MP
DO
MP
DM
DG
DM
MC
MF
MF
MF
MF
MF
DO
MP
DG
MP
DG
MF
MC
MF
MP
DO
DO
DO
DM
MF
MC
MF
DM
MC
MC
DG
DO
MF
DG
MF
MC
47
Captulo 1
8. Os dados a seguir representam a renda de uma amostra de famlias de um
bairro de classe baixa de Florianpolis, em reais (dados fictcios). Construa
a tabela de distribuio de frequncias. Usar k = 6 (nmero de intervalos).
Sugesto: ao calcular o h (tamanho de cada intervalo), arredonde para um nmero
inteiro. Exemplo: 3,84 4
115
121
117
124
122
116
123
118
123
119
123
126
128
122
112
125
124
126
125
121
129
127
128
129
113
115
116
124
119
118
126
129
116
127
123
121
Nmero de
acidentados
Nmero de
meses
Total (fi)
36
48
fa
fr
fp (%)
Probabilidade e Estatstica
Complete a tabela com as frequncias acumulada, relativa e percentual. Depois,
responda as perguntas.
a. Em quantos meses a empresa teve um nmero de funcionrios
acidentados menor do que 6? ______
b. Em quantos meses a empresa teve um nmero de funcionrios
acidentados maior ou igual a 5? ______
c. Qual foi o percentual de meses em que a empresa verificou 5
funcionrios acidentados? ______
d. Qual foi o percentual de meses em que a empresa verificou 7
funcionrios acidentados? ______
Nmero de ratos
7 |--- 12
12 |--- 17
17 |--- 22
17
22 |--- 27
27|--- 32
32 |--- 37
49
Captulo 2
Seo 1
Medidas de posio
Neste captulo, voc vai obter mais ferramentas de estatstica descritiva para auxililo a compreender e a utilizar a Estatstica no seu dia a dia profissional. O objetivo
aqui estudar medidas importantes e bastante utilizadas nos mtodos estatsticos.
O clculo de medidas como a mdia, a moda e a mediana, e os conceitos
apresentados neste captulo, so de grande valia no seu cotidiano profissional,
pois fornecero dados que sero pertinentes para o entendimento de algum fato
ou acontecimento. Chamamos essas medidas de medidas de posio.
Contudo, conhecer as interpretaes dessas medidas no basta por si s.
Por meio delas, podemos chegar a algumas concluses, mas estas no so
suficientes, por isso, voc vai estudar, tambm, medidas que iro auxili-lo na
avaliao do comportamento das sries de dados com relao sua mdia.
Chamamos essas medidas de medidas de disperso.
Muitas vezes voc ir deparar-se com uma massa de dados grande o bastante
para que a leitura e a anlise tornem-se muito difceis. Ento, como fazer para
tirar informaes relevantes e resumir os dados de forma eficaz nesses casos?
Usando medidas estatsticas. Neste captulo, vamos ver algumas delas.
As medidas de posio, assim chamadas pela posio que elas ocupam na srie
estatstica, quando bem utilizadas e interpretadas, podem ser teis, no s por
elas mesmas, mas tambm auxiliando o clculo de outras medidas.
51
Captulo 2
Alm de tudo, elas facilitam o estudo de grandes volumes de dados, pois as
medidas de posio podem resumir as informaes, dando a voc uma noo do
comportamento do todo. As medidas de posio esto divididas da seguinte maneira:
a. Medidas de tendncia central: so valores da varivel que tendem
a estar no centro da srie, por isso o nome. Referem-se ao valor da
varivel que est, seno no centro, perto dele. Est dividia em trs
tipos: mdia, mediana e moda.
b. Separatrizes: so valores da varivel que dividem a srie ordenada de
dados em partes que contm a mesma quantidade de observaes.
Vrios tipos de mdias podem ser calculados para uma massa de dados. A mais
importante a mdia aritmtica, que voc ir estudar nesta seo.
A mdia aritmtica a soma de todos os elementos de uma srie de dados,
dividida pelo nmero de elementos que compe essa srie. Veja a seguir
como represent-la.
52
Probabilidade e Estatstica
Notao:
= mdia dos dados de uma amostra.
= mdia dos dados de uma populao (em que = 12 letra do alfabeto grego,
l-se como mi).
Em que:
n = nmero de valores da srie (ou tamanho da amostra);
xi = valores da srie.
53
Captulo 2
A soma de todos os valores multiplicados por sua frequncia simples dividida
pela soma das frequncias (frequncia total).
Em que:
n = nmero de valores da srie (ou tamanho da amostra);
xi = valores da srie;
No de filhos (xi)
No de famlias (fi)
xi . fi
16
16
11
22
2 x 11 = 22
27
16
3 x 9 = 27
14
Total (fi)
56
92
0 x 14 = 0
1 x 16 = 16
xi.fi = 92
Somar as frequncias simples
Passo 1: some a coluna das frequncias simples (fi) para obter fi (frequncia total).
fi = 56
Passo 2: multiplique cada xi por sua correspondente fi e escreva o resultado na
coluna xi.fi.
54
Probabilidade e Estatstica
xi.fi = 92
Passo 4: divida o resultado do passo 3 (xi.fi) pelo resultado do passo 1 (fi).
Como interpretar esses dados? O valor mdio da srie 1,64, ou seja, a mdia
de filhos por famlia de 1,64 filhos. Analisando dessa maneira, pode parecer um
absurdo, mas voc pode concluir que a mdia de filhos por famlia de 1 a 2 filhos.
Ou de, aproximadamente, dois filhos, arredondando para cima.
Em que:
n = nmero de valores da srie (ou tamanho da amostra);
PM = ponto mdio do intervalo;
55
Captulo 2
Veja o exemplo a seguir para compreender melhor.
Calcule a mdia dos dados representados como na tabela abaixo.
Tabela 2.2 Quantidade emitida de xido de enxofre (SO), em toneladas, pelas fbricas do distrito
industrial de Florianpolis
Qtde. de SO
(em ton.)
No de meses
PM
PM.fi
12
17,3
207,6
20,1
160,8
12
22,9
274,8
22,9 x 12 = 274,8
25,7
128,5
25,7 x 5 = 128,5
28,5
85,5
31,3
187,8
10
34,1
341
Total (fi)
56
(fi)
1386
17,3 x 12 = 207,6
20,1 x 8 = 160,8
xi.fi = 1386
Passo 1: some a coluna das frequncias simples (fi) para obter fi (frequncia total).
fi = 56
Passo 2: calcule o ponto mdio de cada intervalo.
PMi.fi = 1386
Passo 5: divida o resultado do passo 4 (PM.fi) pelo resultado do passo 1 (fi).
= 1386/56=24,75
Como interpretar o resultado? A quantidade mdia de xido de enxofre emitida,
em 56 meses, foi de 24,75 toneladas.
56
Probabilidade e Estatstica
b. Mediana
A mediana um valor que divide a srie de dados em duas partes iguais, ou seja,
o valor observado que est no meio da srie.
Notao:
Me = Mediana (tambm usado md).
Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) mpar.
Calcular a mediana da srie X: 5, 30, 27, 9, 15, 19, 24, 20, 31.
Passo 1: ordene os valores de forma crescente
57
Captulo 2
15
19
20
24
27
30
31
Como interpretar esses dados? 50% dos valores da srie so menores ou iguais
a 20, e 50% dos valores da srie so maiores ou iguais a 20.
Veja, passo a passo, como calcular a mediana para dados brutos quando o
(n) par.
Para voc encontrar a mediana, preciso calcular o ponto mdio dos dois valores
que ocupam as posies calculadas.
Calcular a mediana da srie X: 5, 30, 27, 9, 15, 19, 24, 20.
Passo 1: ordene os nmeros de forma crescente
15
19
19,5
20
24
27
30
Como interpretar esses dados? 50% dos valores da srie so menores do que
19,5, e 50% dos valores da srie so valores maiores do que 19,5.
58
Probabilidade e Estatstica
Voc viu como se encontra a mediana para dados brutos? Assim como voc
estudou na mdia, aqui, tambm para efeito de clculo, voc usar diferente
tratamento quando se tratar de dados agrupados com intervalos (varivel
contnua) e dados agrupados sem intervalos (varivel discreta).
Nmero de
alunos
fac
18
18
21
19
17
38
20
46
21
50
Total
50
Idade (anos)
17
1a a 3a posio
4a a 21a posio
59
Captulo 2
Assim:
Mediana = 19 anos.
Interpretao
50% dos alunos da srie possuem idade inferior ou igual a 19 anos; e
50% dos alunos da srie possuem idade igual ou superior a 19 anos.
Em que:
Li = Limite inferior da classe que contm a mediana;
n = nmero de elementos da srie;
Todas as medidas calculadas para uma varivel contnua sero valores aproximados
para essas medidas, uma vez que, ao agruparmos os dados segundo uma varivel
contnua, h perda de informaes referentes identidade dos dados. (SILVA, 1999).
Exemplo: a tabela a seguir revela o consumo de energia eltrica em 250 residncias
de famlias da classe mdia, com dois filhos. Calcule e interprete o valor mediano.
60
Probabilidade e Estatstica
Tabela 2.4 Consumo de energia eltrica em residncias
Consumo (kWh)
No de famlias
0 |-- 50
50 |-- 100
15
32
47
50
80
24
Total
250
Consumo (kWh)
No de famlias
fac
0 |-- 50
50 |-- 100
15
17
32
49
47
96
50
146
80
226
24
250
Total
250
Observando a coluna com a fa, verificamos que a posio 960 vai at 200 kWh,
assim a 125a e 126a a posio seguinte, que vai at a posio 146a. Essa a
classe da mediana que vai de 200 at 250 kWh.
61
Captulo 2
Agora, vamos identificar os dados para aplicar na frmula:
Li = 200 (limite inferior da classe da mediana);
n = 250 (nmero da amostra);
Interpretao
50% das famlias consumiram valor igual ou inferior a 229 kWh; e
50% das famlias consumiram valor igual ou superior a 229 kWh.
c) Moda
A moda um valor que mais se repete em uma srie de dados, ou seja, o valor
com maior frequncia.
Notao:
Mo = Moda.
62
Probabilidade e Estatstica
a. Moda para dados brutos
Agora, voc vai encontrar a moda para dados que no foram organizados em
tabelas, ou seja, que esto conforme foram coletados, brutos. A moda ser o
valor que mais se repete no conjunto de dados.
Veja os exemplos.
Exemplo 1: X: 15, 16, 19, 20, 20, 22, 22, 22, 25, 26, 28.
O elemento que mais se repete o 22, ento, Mo = 22. Observe que o nmero
20 repete-se, mas no mais do que o 22. Para esse caso, no qual a Mo = 22,
afirma-se que a srie unimodal.
Exemplo 2: X: 15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
Os elementos que mais se repetem so o 20 e o 22, ento Mo1 = 20 e Mo2 =
22. Para esse caso, no qual temos duas modas na srie, afirma-se que a srie
bimodal. Acima de duas modas, mais comum chamarmos a srie de polimodal.
Exemplo 3: X: 20, 20, 22, 22, 25, 25, 28, 28.
Na srie anterior, no temos um elemento que mais se repete, pois todos tm a
mesma frequncia. Nesse caso, afirma-se que a srie amodal.
Voc viu como se encontra a moda para dados brutos. Assim como voc estudou
na mdia, aqui, tambm para efeito de clculo, voc usar diferente tratamento
quando se tratar de dados agrupados com intervalos (varivel contnua) e dados
agrupados sem intervalos (varivel discreta).
b. Moda para dados agrupados
Vimos que, para calcular a moda em uma srie com dados no agrupados em
classe (varivel contnua), necessrio observar somente o termo que mais
aparece, ou seja, a frequncia mais alta.
Veja o exemplo na tabela a seguir.
Tabela 2.6 Idade de 50 alunos de uma universidade
Idade (anos)
Nmero de alunos
17
18
18
19
17
20
21
Total
50
63
Captulo 2
Para identificarmos a mdia, precisamos observar a maior frequncia, que,
neste caso, 18. Logo, a idade que corresponde a maior frequncia 18,
ento a moda = 18 anos.
Para uma distribuio de frequncia com os dados agrupados em classe (varivel
continua), pela prpria complexidade como as variveis apresentam-se, teremos
que fazer uso de uma frmula, para podermos identificar a moda.
Um breve histrico da moda para dados agrupados. No incio, o clculo da moda
fazia-se pelo ponto mdio da classe modal: tratava-se de uma forma bem simples
e rudimentar de calcular. Depois, percebeu-se que esse mtodo apresentava
falhas. At que surgiu o matemtico de nome King, o qual props um segundo
modelo, que levou o seu nome, e, durante um perodo longo, passou-se a uslo. Mesmo assim, apesar do avano, percebia-se ainda no ser modelo o ideal.
A partir do processo de Czuber, quando se necessita calcular a moda de uma
distribuio de Frequncia, emprega-se esse modelo. Muitos livros ainda trazem
ambos os modelos: King e Czuber.
Aqui, vamos estudar a Moda Czuber, a qual leva em considerao as variaes
das frequncias das classes anterior e posterior em relao frequncia modal.
Em que,
Li = Limite inferior da classe modal;
64
Probabilidade e Estatstica
Tabela 2.7 Valor do salrio base de 25 funcionrios de uma empresa
Salrios (R$)
No de funcionrios
10
Total
25
Vizinha imediatamente
anterior
Classe modal
Vizinha imediatamente
posterior
65
Captulo 2
Interpretao
A moda R$ 1.488,89, ou seja, esse o salrio que mais se repete.
Entre mdia, mediana ou moda, qual utilizar? No h uma resposta simples e objetiva
para determinar a medida que seja mais representativa. A seguir, voc encontrar um
resumo das vantagens e desvantagens de cada medida de tendncia central.
Quadro 2.1 Resumo das vantagens e desvantagens de cada medida de tendncia central
Frequncia
Existncia
Leva em
conta todos
os valores?
Afetada
pelos
valores
extremos?
Vantagens e
desvantagens
Sim.
Usada em toda
Estatstica;
funciona bem
com muitos
mtodos
estatsticos.
Medida
Definio
Mdia
Soma de
todos os
valores
divididos pelo
nmero de
valores.
Mais usada.
Existe
sempre.
Mediana
Valor que
divide a srie
na metade.
Usada
comumente.
Existe
sempre.
No.
No.
Costuma
ser uma boa
escolha se h
alguns valores
extremos.
Moda
Valor que
mais se
repete (maior
frequncia).
Usada s
vezes.
Pode no
existir ou,
ainda, pode
haver mais
de uma.
No.
No.
Apropriada para
dados ao nvel
nominal.
Sim.
Separatrizes
Na maioria dos casos, o pesquisador tem interesse em conhecer outros aspectos
relativos ao conjunto de valores, alm de um valor central ou valor tpico. Algumas
informaes relevantes podem ser obtidas por meio do conjunto de medidas:
mdia, extremos, quarts, decs, percents etc. Veja, a seguir, mais detalhes e
exemplos de como calcular as separatrizes.
a. Quarts: divide uma srie ordenada em quatro partes iguais, ou seja,
em partes de 25% cada.
66
Probabilidade e Estatstica
b. Decs: divide uma srie ordenada em 10 partes iguais, ou seja, em
partes de 10% cada.
Note que a mediana tambm uma separatriz. Voc saberia dizer com quais
separatrizes podemos compar-la? Veja:
Q2 = D5 = P50 = Me
Todas essas medidas dividem a srie de dados pela metade.
50% dos valores so maiores do que Q2 = D5 = P50 = Me; e
50% dos valores so menores do que Q2 = D5 = P50 = Me.
Separatrizes para dados brutos
O procedimento bastante semelhante ao da mediana. Preste ateno nas
explicaes a seguir: aps a ordenao crescente dos dados (rol), determinamos
o seu nmero de elementos (n).
Veja o exemplo passo a passo.
Calcular Q1 para a srie de dados X: 22, 15, 20, 22, 28, 20, 20, 22, 25, 26, 16.
Passo 1: ordene de forma crescente (rol)
15, 16, 20, 20, 20, 22, 22, 22, 25, 26, 28.
67
Captulo 2
10
11
15
16
20
20
20
22
22
22
25
26
28
15
16
20
20
20
Nesse caso, a mediana (dessa nova srie de dados) ser o primeiro quartil. s
repetir o mesmo processo feito nos passos 2 e 3.
Passo 4: o nmero de elementos 5 (n = 5, mpar).
Passo 5: Pos = 3, ou seja, Q1 ocupa a 3 posio.
15
16
20
20
20
Observe que o elemento que ocupa a terceira posio o 20, ento Q1 = 20.
Como interpretar esses dados? 25% dos dados observados so menores ou
iguais a 20. J 75% dos valores observados, so maiores ou iguais a 20.
68
Probabilidade e Estatstica
Observe que podem ser usadas, tambm, para calcular a posio do primeiro quartil
e do terceiro, respectivamente, as seguintes frmulas:
Para o primeiro quartil
(n = 11).
10
11
15
16
20
20
20
22
22
22
25
26
28
Observe que o elemento que ocupa a nona posio o 25, ento Q3 = 25.
Percentis
Observao: para calcular a posio dos percentis use a seguinte frmula.
Para o primeiro quartil
= posio da separatriz;
69
Captulo 2
Continuando com o mesmo exemplo, calcule o sexagsimo percentil.
Passo 1: o nmero de elementos 11 (n = 11) e o i = 60.
= 7,2, ou seja,
Passo 2:
entre a 7 e a 8 posies.
10
11
15
16
20
20
20
22
22
22
25
26
28
Passo 3: para calcular o sexagsimo percentil, voc deve encontrar o valor que fica
entre os valores que ocupam a 7 e a 8 posies.
Valor que ocupa a 7 posio = 22.
Valor que ocupa a 8 posio = 22.
Ento,
= 22.
Decs
Se voc notar, poder comparar os decs com alguns percentis.
Decs
Percentis
10
20
30
40
50
60
70
80
90
70
Probabilidade e Estatstica
para o primeiro decil, 10% dos valores observados so menores e
90% dos valores observados so maiores;
para o segundo decil, 20% dos valores observados so menores e
80% dos valores observados so maiores;
para o terceiro decil, 30% dos valores observados so menores e
70% dos valores observados so maiores etc.
Continuando com o mesmo exemplo, calcule o terceiro decil. Note que ele igual
ao trigsimo percentil (D3 = P30)! Ser a mesma coisa que calcular P30.
Passo 1: o nmero de elementos 11 (n = 11) e o i = 30.
Passo 2: PD3 = PP30 = 3,6, ou seja, D3 est entre a 3 e a 4 posies.
PD3
10
11
15
16
20
D3
20
20
22
22
22
25
26
28
Passo 3: para calcular o terceiro decil, voc deve encontrar o valor que fica entre os
valores que ocupam a 3 e a 4 posies.
Valor que ocupa a 3 posio = 20.
Valor que ocupa a 4 posio = 20.
Ento, D3 = 20.
Como interpretar esses dados? 30% dos dados observados so menores ou
iguais a 20. E 70% dos valores observados so maiores ou iguais a 20.
Assim como voc estudou na mdia, aqui, tambm para efeito de clculo, voc
usar diferente tratamento quando se tratar de dados agrupados com intervalos
(varivel contnua) e dados agrupados sem intervalos (varivel discreta). No
entanto, para a finalidade deste estudo, no ser includo.
71
Captulo 2
Seo 2
Medidas de disperso
Para compreender melhor o que so as medidas de disperso, acompanhe o
exemplo a seguir.
A realizao de testes em trs grupos de pessoas resultou nos escores
descritos na sequncia.
Tabela 2.8 Escores (em pontos) obtidos por pessoa (10 pessoas) e divididos em grupos
Grupos
Total
Grupo 1:
60
Grupo 2:
10
60
Grupo 3:
60
Se voc calcular a mdia dos escores para cada grupo, obter os seguintes resultados.
Para o grupo 1:
ou seja, 6 pontos o escore mdio;
Para o grupo 2:
ou seja, 6 pontos o escore mdio;
Para o grupo 3:
ou seja, 6 pontos o escore mdio.
Observe que os escores mdios dos trs grupos so iguais. E agora, como
diferenciar um grupo do outro? Olhando somente para os dados, voc pode tirar
algumas concluses: no grupo 1, as pessoas tm o mesmo escore; no grupo 2,
os escores so diversificados; e, no grupo 3, existe uma pequena diversificao,
ou seja, os escores esto bem prximos da mdia.
72
Probabilidade e Estatstica
Pode-se afirmar, quanto disperso das sries anteriores, que:
grupo 1: no uma srie em que os dados apresentam disperso
com relao mdia, ou seja, os dados esto totalmente
concentrados na mdia;
grupo 2: uma srie de dados em que os valores observados esto
bastante dispersos, ou seja, apresenta muitos valores distantes da
mdia. Podemos dizer que uma srie dispersa;
grupo 3: h uma pequena diferena de alguns dados com relao
mdia, ou seja, apresenta uma pequena disperso com relao
mdia, os dados esto concentrados em torno da mdia.
O desvio padro a raiz quadrada da varincia, pois assim ca mais fcil analisar e
comparar com a mdia; se usssemos a varincia, as unidades seriam ao quadrado,
enquanto que o desvio padro apresentaria a mesma unidade de medida que a mdia.
73
Captulo 2
Quadro 2.2 Representao do desvio padro
Populao
(x)
(x)
Amostra
S2 (x)
varincia
s (x)
desvio padro
varincia
desvio padro
Medidas
Populao
Amostra
Varincia
Desvio padro
Fonte: Elaborao do autor (2006).
74
Probabilidade e Estatstica
Daremos continuidade ao exemplo, para calcular a varincia e o desvio padro.
Acompanhe a resoluo passo a passo.
Passo 3: calcular a mdia dos quadrados dos desvios, ou seja, a varincia. Aqui,
voc vai calcular para a populao e para a amostra.
Caso sejam dados de uma populao:
Ento:
Caso sejam dados de uma amostra:
Ento:
75
Captulo 2
Interpretao dos dados Para dados de uma populao, a variabilidade das
notas de 0,79 pontos. Para dados de uma amostra, a variabilidade das notas
de 0,91 pontos. Ou seja, a mdia 7,20 e para a amostra de notas poderia chegar
a 7,20-0,91 = 6,29 e 7,20 +0,91 = 8,11.
Medidas
Populao
Amostra
Varincia
Desvio padro
Fonte: Elaborao do autor (2006).
76
Probabilidade e Estatstica
Tabela 2.9 Remunerao de funcionrios
N de salriosmnimos (xi)
N de
funcionrios (fi)
xi.fi
(x
29
29
157,4381
28
56
49,5292
20
60
2,1780
18
72
8,0820
16
80
44,4560
15
90
106,9335
63
121,1607
135
450
489,7757
fi
xi.fi
)2.fi
(1-3,33)2.29 = 157,4381
S (x
i
)2.fi
Passo 1: inicie por somar a coluna das frequncias simples (fi) para obter fi
(frequncia total); fi = 135.
Passo 2: calcule a mdia: multiplique cada xi por sua correspondente fi e escreva
na coluna xi. fi, some os valores calculados e escreva esse resultado no final da
coluna e divida pelo resultado do passo 1 ( fi).
77
Captulo 2
. fi = 489,7757
Neste passo, usa-se quatro casas decimais, deixando para arredondar para duas
casas somente o resultado.
Passo 4: calcule a varincia.
Caso sejam dados de uma populao:
Na varincia, sero usadas quatro casas decimais, pois ainda ser necessrio extrair
a raiz quadrada para chegar ao desvio padro.
Caso sejam dados de uma amostra:
78
Probabilidade e Estatstica
Observe as frmulas que so utilizadas para calcular esse tipo de dados.
Quadro 2.5 Frmulas para o clculo de medidas de disperso com dados agrupados com intervalos
Medidas
Populao
Amostra
Varincia
Desvio padro
Fonte: Elaborao do autor (2010).
N de
representantes (fi)
PM
PM.fi
12
17,3
207,6
666,0300
20,1
160,8
172,9800
12
22,9
274,8
41,0700
25,7
128,5
4,5125
28,5
85,5
42,1875
31,3
187,8
257,4150
10
34,1
341,0
874,2250
Total (fi)
56
1.386
2.058,4200
fi
PMi . fi
(PMi
)2.fi
S (PMi
)2.fi
79
Captulo 2
Passo 1: primeiro, some a coluna das frequncias simples (fi) para obter fi
(frequncia total); fi = 56.
Passo 2: calcule a mdia; nesse caso, calcule o ponto mdio de cada intervalo,
Passo 3: calcule a soma dos quadrados dos desvios e multiplique por fi, esta
coluna vai ser utilizada na parte de cima da frmula da varincia,
17,3 24,75 = (7,45)2 = 55,5025 . 12 = 666,0300
20,1 24,75 = (4,65)2 = 21,6225 . 8 = 172,9800
22,9 24,75 = (1,85)2 = 3,4225 . 12 = 41,0700
25,7 24,75 = (0,95)2 = 0,9025 . 5 = 4,5125
28,5 24,75 = (3,75)2 = 14,0625 . 3 = 42,1875
31,3 24,75 = (6,55)2 = 42,9025 . 6 = 257,4150
34,1 24,75 = (9,35)2 = 87,4225 . 10 = 874,2250
Some os valores :
. fi .= 2.058,4200.
80
. fi .
Probabilidade e Estatstica
S=0
7
6
S=0,8
S=1,2
f=3,0
3
2
1
1
81
Captulo 2
Outra utilizao do desvio padro
Muitas sries, quando representadas por seu polgono de frequncias, com certo
ajuste nas curvas, apresentam um formato semelhante a um sino, uma curva
simtrica (observando que a mdia, a moda e a mediana esto posicionadas ao
centro), como mostra o grfico a seguir.
Grfico 2.1 Grfico da curva normal
x
Fonte: Elaborao do autor (2006).
Para sries de dados que apresentam esse tipo de representao, podese trabalhar com a rea abaixo do polgono. A rea abaixo proporcional
frequncia total. Essa curva chamada de Curva Normal ou Curvas de Gauss,
e suas principais caractersticas so:
a curva caracteriza-se por ter a forma de um sino;
a curva normal simtrica com relao mdia;
a rea limitada pela curva e pelo eixo das abscissas 1 ou 100%;
a curva assinttica, isto , aproxima-se indefinidamente do eixo
das abscissas sem toc-lo;
a curva normal unimodal, ou seja, possui um s pico ou ponto de
frequncia mxima, ponto este que coincide com a moda, a mdia
e a mediana.
Como relacionar a curva com o desvio padro? Veja a curva a seguir.
Grfico 2.2 Grfico da curva normal
34,13%
2,15%
13,59%
82
34,13%
13,59%
2,15%
Probabilidade e Estatstica
Exemplo: em uma srie em que = 80 e o (x)=3, pode-se interpretar esses
valores da seguinte forma:
os valores da srie esto concentrados em torno da mdia, que de
80 unidades;
o intervalo [ (x); + (x)] contm, aproximadamente, 68,26% dos
elementos da srie, ou seja, o intervalo [77;83];
o intervalo [ 2(x); + 2(x)] contm, aproximadamente, 95,44%
dos elementos da srie, isto , o intervalo [74;86];
o intervalo [ 3(x); + 3(x)] contm, aproximadamente, 99,74%
dos elementos da srie, ou seja, o intervalo [71;89].
Coeficiente de variao
Sries de dados com mdias iguais
Acompanhe o exemplo: considere dois grupos de pessoas, nos quais foram
feitos levantamentos de suas rendas. Os resultados desse levantamento foram
os seguintes:
Tabela 2.11 Resultado do levantamento de renda de uma populao
Grupo 1
Grupo 2
83
Captulo 2
Para comparar duas sries de dados usando medidas de disperso absolutas
(varincia e desvio padro) necessrio que as mdias sejam iguais, caso
contrrio, usamos uma medida de disperso relativa que veremos nesta seo.
Para a populao
Para a amostra
Grupo 1
Grupo 2
Mdia: = 95 reais
84
Probabilidade e Estatstica
note que as mdias so diferentes;
o desvio padro do grupo 1 9,8; e, o do grupo 2 7,5; portanto,
o grupo que apresenta maior disperso absoluta quanto ao nvel de
renda o grupo 1;
como as mdias so diferentes, devemos calcular o coeficiente de
variao, pois, simplesmente pela disperso absoluta, no podemos
afirmar nada (se fossem iguais, bastaria a disperso absoluta).
Para o grupo 1:
Para o grupo 2:
85
Captulo 2
Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
1. Uma empresa procurou estudar a ocorrncia de uso de drogas lcitas
bebidas alcolicas por seus empregados, tendo, para isso, realizado um
levantamento sobre o nmero de dias por semana que cada um dos empregados
costuma beber. Calcule e interprete a mdia. Os dados correspondentes so:
Consumo de bebidas alcolicas por semana pelos funcionrios
No de dias (xi)
No de func. (fi)
10
16
14
Total (fi)
64
xi . fi
Renda (R$)
No de famlias (fi)
Total (fi)
86
36
PM
PM.fi
Probabilidade e Estatstica
3. Nos itens a seguir, esto dois conjuntos de dados. Calcule a mediana para
cada um deles e interprete seus resultados.
a. Conjunto 1
15
19
13
21
16
17
15
12
13
b. Conjunto 2
17
18
14
14
15
15
16
16
13
4. Nas opes a seguir, esto trs conjuntos de dados. Encontre a moda para
cada um deles e interprete seus resultados.
a. Conjunto 01
7
b. Conjunto 02
5
c. Conjunto 03
5
87
Captulo 2
5. Em um grupo de pacientes acometidos de fobias, foi levantado o tempo
para tratamento, em anos, conforme tabela abaixo. Calcule o Q3, o D9 e o P35 e
interprete seus resultados.
88
Probabilidade e Estatstica
Consumo de bebidas alcolicas por semana pelos funcionrios
N de dias (xi)
N de
funcionrios (fi)
10
16
14
64
xi . fi
(x
)2.fi
Idade (xi)
N de estudantes (fi)
17
18
20
19
22
20
10
21
63
xi . fi
(xi )2.fi
89
Captulo 2
10. Os dados abaixo representam a renda de uma amostra de famlias de um
bairro de classe baixa de Florianpolis, em reais. (dados fictcios). Calcule a
varincia e o desvio padro, considerando como sendo dados de uma amostra.
Renda de famlias de um bairro de classe baixa de Florianpolis
Renda (R$)
No de famlias (fi)
Total (fi)
36
PM
PM.fi
(PMi
)2.fi
11. Analise cada caso, comparando quanto disperso dos dados, e responda
as perguntas:
a. Qual das sries apresenta maior disperso absoluta (comparar os
desvios padro)?
b. Qual das sries apresenta maior disperso relativa (comparar os
coeficientes de variao)?
c. Conclua qual das sries realmente apresenta maior disperso (no
se esquea de que o coeficiente de variao mais eficaz para
determinar a disperso de uma srie).
11.1
Srie A
Srie B
Srie A
Srie B
= 64; (x) = 12
= 96; (x) = 18
11.2
90
Captulo 3
Probabilidade
Seo 1
Principais conceitos
A partir de agora, voc iniciar o estudo da Estatstica Indutiva, que tem como
base o estudo de probabilidades.
Talvez voc deva estar perguntando-se: probabilidade? O que ? Tenho certeza
de que muitas vezes voc j pensou em possibilidades de algo acontecer. Ser
que vai chover? Ser que serei escolhido para participar de um grupo? Ser que
vou encontrar meu amigo hoje? etc.
Muitas vezes, no podemos prever acontecimentos como esses, ou seja, podem
acontecer ou no. Voc at poderia associar isso tudo sorte ou ao azar, enfim,
ao acaso. E aqui que o estudo de probabilidade entra. Tentar formular e calcular
modelos matemticos que definam essas situaes e possibilitem a voc tomar
suas decises e, assim, conduzir sua vida, suas experincias e seus caminhos;
esse um dos principais objetivos desta unidade.
Nesta unidade, voc tambm conhecer como possvel expressar em
nmeros algumas situaes com a finalidade de possibilitar um melhor
tratamento matemtico a elas. Sero apresentados os tipos de distribuies de
probabilidades e como se calcula probabilidade usando a distribuio discreta e a
distribuio contnua de probabilidades.
Vamos comear com os conceitos de fenmenos, o que um espao amostral
e o que so eventos. Esses so alguns dos conceitos mais importantes que so
utilizados na probabilidade. O objetivo que voc compreenda como aplicar
esses conhecimentos no seu dia a dia.
91
Captulo 3
92
Probabilidade e Estatstica
Espao amostral
Observe que quando se trabalha com experimentos que admitem mais de um
resultado, torna-se interessante definir o conjunto de todos esses resultados;
nesse caso, voc pode chamar esse conjunto de espao amostral. O smbolo
para representar o conjunto do espao amostral S (letra maiscula).
Espao amostral o conjunto de todos os possveis resultados de um
experimento (fenmeno) aleatrio.
Veja, a seguir, exemplos sobre o espao amostral.
Ao verificar os exemplos, lembre-se de que o nmero de elementos do conjunto
do espao amostral representado por n(S):
Exemplo 1: voc pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades. Pode-se construir o seguinte conjunto.
dado normal.
S = {C1, C2, P1, P2, P3}: observe que so todas as possibilidades entre as
pessoas do grupo.
93
Captulo 3
Exemplo 3: um psiclogo trabalha com um grupo de pessoas e estuda os
distrbios do sono. O grupo composto por sete pessoas, das quais cinco
apresentam distrbios e duas no apresentam distrbios (veja legenda).
Dn Pessoa nmero n com distrbio;
Pn Pessoa nmero n sem distrbio.
Exemplo:
D1 pessoa nmero 1 com distrbio;
P1 pessoa nmero 1 sem distrbio.
Pode-se construir o seguinte conjunto:
S = {D1, D2, D3, D4, D5, P1, P2}: observe que so todas as possibilidades entre
as pessoas do grupo.
S = {______________________________________}
Agora, compare se o seu conjunto do espao amostral est igual ao seguinte
conjunto do espao amostral.
S = {P1, P2, P3, L1, L2, C1, C2, C3, R1}: observe que so todas as possibilidades
94
Probabilidade e Estatstica
Eventos
Quando voc tiver que estudar algum experimento aleatrio, dever identificar
as diferentes variaes de resultados possveis dentro do espao amostral.
Voc pode chamar de evento cada uma dessas variaes, ou seja, cada uma
dessas partes (subconjuntos) do espao amostral um evento. O smbolo para
representar o subconjunto de um evento A (letra maiscula).
Um evento qualquer subconjunto do espao amostral determinado pelo
experimento (fenmeno) aleatrio em estudo.
Ao verificar os exemplos, lembre-se de que o nmero de elementos de evento
representado por n(A):
n(A) = nmero de elementos de A.
Usando os exemplos citados anteriormente, voc pode observar:
Exemplo 1: voc pode usar o dado 2, citado no exemplo anterior, e estudar todas
as possibilidades.
Pode-se construir o seguinte evento:
A: sair um nmero par na face superior.
A = {2, 4, 6}: observe que so todas as possibilidades de pontos pares de dado normal.
95
Captulo 3
Tipos de eventos
Existem trs tipos de eventos, os quais so:
Evento simples: formado por apenas um elemento do espao amostral.
96
Exemplo: D: ser uma pessoa com cabelos ruivos. (Veja o exemplo 4).
D = {R1} n(D) = 1
Probabilidade e Estatstica
Evento composto: formado por dois ou mais elementos do
espao amostral.
F = { } n(F) = 0
S
A
97
Captulo 3
Interseo de eventos
S
A
Complemento de um evento
S
A
A'
98
Probabilidade e Estatstica
Subtrao de eventos
Voc pode dizer que A menos B se, e somente se, ocorre A e no ocorre B.
Figura 3.4 Representao em diagrama da subtrao de eventos
S
A
Eventos excludentes
Dois ou mais eventos so ditos excludentes (mutuamente exclusivos) se a
realizao de um dos eventos excluir a realizao do outro, ou de outros eventos.
Figura 3.5 Representao em diagrama da subtrao de eventos
A
C
Se, quando A ocorrer, exclui ocorrerem os outros, isso quer dizer que no h
interseco entre eles! A e B so mutuamente exclusivos, e B e C no so
mutuamente exclusivos.
Agora que voc j estudou os conceitos mais importantes utilizados na
probabilidade, hora de saber os conceitos de probabilidade propriamente ditos
e como so feitos os seus clculos!
99
Captulo 3
Seo 2
Clculo de probabilidade
Nesta seo, vamos estudar os conceitos de probabilidade e a forma de fazer
seus clculos! Acompanhe as duas definies mais importantes dentro do
estudo de probabilidades. So elas: a definio clssica de probabilidade e a
frequncia relativa.
Veja, ento, separadamente, cada uma dessas definies.
Probabilidade clssica
Antes de conhecer como calcular a probabilidade clssica, saiba como ela possvel.
A probabilidade de ocorrer um determinado resultado na realizao de um
experimento igual ao quociente entre o nmero de casos favorveis ao sucesso
(nmero de elementos do evento A) e o nmero de casos possveis (nmero de
elementos do espao amostral S).
Observe a frmula a seguir.
Probabilidade de um evento A ocorrer:
= p = sucesso.
= q = fracasso.
100
Probabilidade e Estatstica
Compreenda passo a passo.
Legenda
Estado civil:
S: moradores do condomnio
A: moradores casados
B: moradores divorciados
Para o evento B:
101
Captulo 3
Exemplo 2: em um levantamento realizado com um grupo de 118 chefes de
famlias com diferentes vnculos de trabalho, obteve-se os seguintes resultados
(dados fictcios).
Figura 3.6 Resultado do levantamento
Evento A
Evento C
Evento B
Espao
amostral
No de
pessoas
29
24
20
Comercirio
17
Temporrio
17
Comrcio informal
Total
11
118
n(A)
n(C)
n(B)
Tamanho do espao
amostral - n(S)
102
Probabilidade e Estatstica
Passo 3: usar a frmula da probabilidade.
Obs: aps efetuar a diviso, s multiplicar o resultado por 100 para obter a
probabilidade na forma percentual.
Para o evento A
Para o evento B
Para o evento C
103
Captulo 3
Para o evento D
Para o evento E
Para o evento F
Tipos de vnculo
No de pessoas
Probabilidade
29
0,2458
24
0,2034
20
0,1695
Comercirio
17
0,1441
Temporrio
17
0,1441
Comrcio informal
11
0,0932
118
1*
Total
* Repare que a soma 1 ou 100%
Fonte: Elaborao do autor (2006).
Frequncia Relativa
104
Probabilidade e Estatstica
Na verdade, a frequncia relativa calculada quando voc deparar-se com
situaes em que o clculo da probabilidade de um evento no possvel. Nesse
caso, s possvel o clculo de uma aproximao, a qual, por sua vez, consiste em
analisar o experimento e, com os resultados obtidos, calcular a frequncia relativa.
importante que voc saiba que essa aproximao para o clculo de probabilidade
s ser considervel caso haja um nmero bastante grande de tentativas de
execuo do experimento. Como fazer isso? Veja os exemplos a seguir.
105
Captulo 3
Algumas consideraes.
Seo 3
Distribuio de probabilidades
A varivel aleatria uma ferramenta na anlise estatstica que possibilita a
atribuio de nmeros para resultados de experimentos, adequando, assim, o
problema para um melhor tratamento matemtico. Dentro da Estatstica, ela
considerada uma funo que associa os nmeros aos eventos de um espao
amostral. Voc poder entender melhor se comear analisando um exemplo.
106
Probabilidade e Estatstica
Tabela 3.2 Organizao dos resultados e valores
Resultados
1 lanamento
Resultados
2 lanamento
Valor VA
KK
KC
CK
CC
Voc pode observar que existe apenas uma possibilidade para cada situao e o total
de possibilidades 4; ento, o clculo da probabilidade d-se da seguinte forma.
Valor VA
KK
KC
CK
CC
Probabilidade
/4
/4
/4
/4
Duas possibilidades
de sair uma cara
107
Captulo 3
Tabela 3.4 Agrupamento de resultados
No de caras (Valor v.a)
Probabilidade
/4
/2
/4
Ao agrupar os
resultados da varivel
aleatria (uma cara -1),
voc deve somar as
probabilidade:
Varivel aleatria
discreta
Distribuio discreta
de probabilidade
Varivel aleatria
contnua
Distribuio contnua
de probabilidade
108
Probabilidade e Estatstica
Como voc pde observar, cada tipo de varivel gera um tipo de distribuio de
probabilidade. Em resumo, os tipos de distribuio de probabilidades so:
distribuio discreta de probabilidades; e
distribuio contnua de probabilidades.
1. Para o bom andamento de seu estudo, importante que voc entenda bem a diferena entre as duas
variveis, a discreta e a contnua!
109
Captulo 3
Diante do exposto, importante salientar que:
a distribuio binomial s aplicvel caso ocorram os dois casos
citados anteriormente;
os termos sucesso e fracasso so usados se o resultado esperado
ocorre ou no, ou seja, depende do objetivo de seu estudo.
A: errar a questo;
S: todas as opes (a, b, c, d, e).
110
Probabilidade e Estatstica
Veja, a seguir, passo a passo.
Passo 1: identificar os elementos do espao amostral e do evento solicitado.
B: acertar a questo;
S: todas as opes (a, b, c, d, e).
111
Captulo 3
Sendo:
Notao: n! (fatorial)
A: errar a questo;
Passo 2: calcular a probabilidade de acertar (no caso, fracasso) para cada questo.
Voc pode calcular de dois modos.
1. Primeiro modo de clculo:
B: acertar a questo;
S: todas as opes (a, b, c, d, e);
112
Probabilidade e Estatstica
113
Captulo 3
A distribuio normal.
Como voc estudou anteriormente, quando se utiliza uma varivel aleatria
contnua, pode-se atribuir probabilidade a essa varivel. Conforme a seo anterior,
os processos definidos a partir de contagens conduzem aos modelos que envolvem
variveis aleatrias discretas, enquanto que os processos definidos a partir de
medidas conduzem aos modelos que envolvem variveis aleatrias contnuas.
Figura 3.8 Tipos de distribuies de probabilidade
Contagens
Varivel aleatria
discreta
Medidas
Varivel aleatria
contnua
114
Probabilidade e Estatstica
Tabela 3.6 Tempo, em minutos, para as entregas urbanas da empresa X
N de entregas (fi)
10
14
10
Total (fi)
50
Histograma
Grfico 3.2 Tempo, em minutos, para as entregas urbanas da empresa X
16
No de entregas
14
12
10
8
6
4
2
0
15,9 |-- 18,7 18,7 |-- 21,5 21,5 |-- 24,3 24,3 |-- 27,1 27,1 |-- 29,9 29,9 |-- 32,7 32,7 |-- 35,5
Tempo em minutos
Fonte: Elaborao do autor (2011).
115
Captulo 3
Como a altura de cada retngulo proporcional frequncia simples, a rea de
cada retngulo tambm . Considerando isso, a soma das reas dos retngulos
tambm proporcional frequncia total.
Continuando com a recordao, veja, agora, o polgono de frequncias. Para
construir um polgono de frequncia de dados, s unir, por linhas, os pontos
mdios das bases superiores dos retngulos do histograma.
Acompanhe o exemplo a seguir.
Grfico 3.3 Tempo, em minutos, para as entregas urbanas da empresa X
16
No de entregas
14
12
Polgono de
Frequncia
Estes tringulos
compensam os
que ficam fora
do polgono
10
8
6
4
2
,5
35
,7
|-,7
32
29
,9
|--
32
,9
27
,1
|--
27
|-,3
24
|-,5
21
29
,1
,3
24
,5
21
|-,7
18
15
,9
|--
18
,7
Tempo em minutos
Fonte: Elaborao do autor (2011).
Voc pde observar que a rea do histograma igual rea abaixo do polgono
de frequncias, ou seja, os tringulos que ficam fora so compensados por
aqueles que esto adicionados por dentro.
O grfico expressa os tempos que a empresa levou para realizar 100% das
entregas de um determinado perodo.
Voc observou que o polgono de frequncias tem um formato especial? Sim, ele tem
o formato de um sino. Essa curva chamada de curva normal ou curva de GaussLaplace e tem algumas caractersticas bem especiais. Conhea-a no tpico a seguir.
116
Probabilidade e Estatstica
X = Me = Mo
117
Captulo 3
A distribuio normal de probabilidade usa como base a curva normal.
Sabendo que a rea abaixo do polgono (curva) representa proporcionalmente
a frequncia total da srie, e com o uso da mdia e do desvio padro tem-se
condies de realizar o estudo de concentrao dos dados em torno da mdia.
Com relao rea abaixo da curva, analise o grfico a seguir.
Grfico 3.5 Distribuio normal, com percentuais em referncia ao desvio padro
3 4 ,1 3 %
1 3 ,5 9 %
0 ,5 o u 5 0 %
2 ,1 5 %
X
Fonte: Adaptado de Triola (1999, p.43).
118
Probabilidade e Estatstica
Grfico 3.6 Distribuio normal, com percentuais em referncia ao desvio padro
9 9 ,7 4 %
9 5 ,4 4 %
6 8 ,2 6 %
3 4 ,1 3 %
3 4 ,1 3 %
1 3 ,5 9 %
1 3 ,5 9 %
2 ,1 5 %
71
2 ,1 5 %
74
77
=80
83
86
89
119
Captulo 3
f
P (a < x < b )
120
Probabilidade e Estatstica
Clculo da varivel padronizada.
Em que:
X1 = valor da varivel aleatria (limite do intervalo);
= mdia;
= desvio padro.
Acompanhe os exemplos a seguir para compreender como realizar o clculo.
Exemplo 1: a rea a ser calculada est no intervalo que vai da mdia at x1.
Nesse caso, s necessrio o clculo de um limite do intervalo.
Grfico 3.8 e 3.9 Padronizao de uma distribuio normal
P( < x< x1)
x1
z1
121
Captulo 3
Em que:
X1 e X2 = valores da varivel aleatria (limites do intervalo);
= mdia;
= desvio padro.
Grficos 3.10 e 3.11 Padronizao de uma distribuio normal
P(x1< x< x2)
x1
x2
z1
z2
rea
0
2. Com o valor de Z calculado, basta encontrar o valor na tabela (ver tabela no final deste livro didtico).
122
Probabilidade e Estatstica
Observe os exemplos a seguir com ateno.
Exemplo 1: em um levantamento executado por uma empresa de entregas, resultou
que o tempo mdio para a realizao das entregas era de 21 minutos e o desvio
padro foi de 7 minutos. Ao escolher, ao acaso, uma das entregas realizadas, qual a
probabilidade de o tempo para realiz-la estar entre 21 e 28 minutos?
Calculando passo a passo.
Passo 1: identificar todos os elementos que compem o problema.
mdia: = 21;
rea
=21
x=28
rea
0
z=1
123
Captulo 3
Z
0,0
0,l
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
1,1
1,2
1,3
0,00
0,0000
0,0398
0,0793
0,1179
0,1554
0,1915
0,2257
0,2580
0,2881
0,3159
0,3413
0,3643
0,3849
0,4032
0,01
0,0040
0,0438
0,0832
0,1217
0,1591
0,1950
0,2291
0,2611
0,2910
0,3186
0,3438
0,3665
0,3869
0,4049
0,02
0,0080
0,0478
0,0871
0,1255
0,1628
0,1985
0,2324
0,2642
0,2939
0,3212
0,3461
0,3686
0,3888
0,4066
124
Probabilidade e Estatstica
Note que obrigatoriamente voc deve utilizar o valor de Z com duas casas
decimais, por conta da formatao da tabela Z.
rea
x2=17,52
=24
x1=29,7
rea
z=-1,08
z=0,95
125
Captulo 3
no cruzamento da coluna na qual est o 0,08 e da linha na qual est
o 1,0, voc encontrar um nmero (no caso, 0,3599). Esse nmero
a rea entre Z1 e 0.
Tabela 3.7 Tabela de valores normais Z
Cruzando a
linha com a
coluna.
Procurar 1,0
Procurar 0,08
Cruzando a
linha com a
coluna.
Z
0,0
0,l
0,2
...
0,8
0,9
1,0
1,1
1,2
0,00
0,0000
0,0398
0,0793
...
0,2881
0,3159
0,3413
0,3643
0,3849
0,01
0,0040
0,0438
0,0832
...
0,2910
0,3186
0,3438
0,3665
0,3869
...
...
...
...
...
...
...
...
...
...
0,07
0,0279
0,0675
0,1064
...
0,3078
0,3340
0,3577
0,3790
0,3980
0,08
0,0319
0,0714
0,1103
...
0,3106
0,3365
0,3599
0,3810
0,3997
0,00
0,0000
0,0398
...
0,2580
0,2881
0,3159
0,3413
0,3643
...
...
...
...
...
...
...
...
...
126
0,04
0,0160
0,0557
...
0,2704
0,2995
0,3264
0,3508
0,3729
0,05
0,0199
0,0596
...
0,2734
0,3023
0,3289
0,3531
0,3749
Probabilidade e Estatstica
Passo 5: responder e interpretar.
Como voc tem duas reas, o prximo passo somar. Veja o grfico a seguir.
Grfico 3.17 Soma das reas determinadas pela padronizao
127
Captulo 3
Passo 3: identificar, no grfico, qual a rea que voc deseja encontrar.
Grficos 3.18 e 3.19 Padronizao de uma distribuio normal.
rea
=24
x1=29,7
z=0,95
rea
Procurar 0,9
Procurar 0,05
Cruzando a
linha com a
coluna.
Z
0,0
0,l
...
0,7
0,8
0,9
1,0
1,1
128
0,00
0,0000
0,0398
...
0,2580
0,2881
0,3159
0,3413
0,3643
...
...
...
...
...
...
...
...
...
0,04
0,0160
0,0557
...
0,2704
0,2995
0,3264
0,3508
0,3729
0,05
0,0199
0,0596
...
0,2734
0,3023
0,3289
0,3531
0,3749
Probabilidade e Estatstica
Passo 5: interpretar e responder.
Como a rea dada pela tabela sempre entre zero e Z, como calcular a rea de
Z para cima?
Voc lembra que a curva normal simtrica e que, de cada lado, tem 50% da
rea total. Ento, se a metade tem 50%, ou 0,5, e voc diminuir dessa rea a rea
encontrada, restar a rea que voc quer encontrar. Veja o grfico a seguir.
Grfico 3.20 Determinar a rea limitada abaixo pelo valor padronizado e sem limite acima
0,3289
0,5-0,3289
z=0,95
0,3413
ou
34,13%
0,5
ou
50%
129
Captulo 3
Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
Casado(a)
Desquitado(a)
ou separado(a)
judicialmente
Divorciado(a)
Vivo(a)
Solteiro(a)
Total
130
Captulo 4
Seo 1
Principais conceitos
Neste captulo, voc conhecer com mais detalhes o que amostra e poder
aumentar seus conhecimentos sobre como escolher, calcular e para que usar
amostras em pesquisas e levantamentos de dados. Voc ter a oportunidade de
verificar como importante o estudo da amostragem, uma vez que uma das
ferramentas essenciais que pode apoiar suas decises.
Voc tambm conhecer como proceder para calcular o erro padro de uma estimativa.
Voc j deve ter visto, nos jornais ou na televiso, quando anunciam resultados
de uma pesquisa eleitoral, informarem que os resultados tm uma margem de
erro. Isto ocorre devido ao fato do uso da amostragem, ou seja, quando uma
pesquisa baseia-se apenas em uma parcela da populao.
Como no possvel executar a pesquisa com a totalidade dessa populao, os
resultados no so exatos, necessitando, assim, do clculo da margem de erro.
Dessa forma, voc vai entender como se procede para encontrar esse erro.
Sero usados alguns termos que so fundamentais no entendimento dos clculos
e da interpretao. Sendo assim, antes de saber como se calcula o erro de uma
estimativa, muito importante que voc aprenda alguns conceitos importantes.
A amostragem est intimamente ligada aos estudos de Estatstica descritiva
e probabilidades. Alm de estarem ligados, so dependentes uns dos outros.
Veja a figura a seguir.
131
Captulo 4
Figura 4.1 Relaes dos estudos estatsticos
Amostragem
Estatstica descritiva
Probabilidade
Como feita essa relao entre os trs? Com o estudo deste captulo, voc vai
poder compreender melhor. Conhea, a seguir, alguns conceitos importantes
para o estudo da amostragem.
Populao
Populao o conjunto total de elementos com, pelo menos, uma caracterstica
em comum, cujo comportamento interessa estudar.
Notao:
Amostra
Amostra o conjunto de elementos ou observaes, recolhidos a partir de um
subconjunto da populao, que se estuda com o objetivo de tirar concluses
para a populao de onde foi recolhida.
Notao:
132
Probabilidade e Estatstica
quando no se tem informaes sobre a populao: se o pesquisador
no tem acesso s medidas, como desvio padro, percentuais etc.
quando se tem informaes sobre a populao: se o pesquisador
tem acesso s medidas, como desvio padro, percentuais etc.
Quando no se tem informaes sobre a populao.
Nesse caso, necessria a especificao do erro amostral pretendido
pelo pesquisador. Sugeridas por Barbetta (2002), as formas de clculo
do tamanho da amostra, quando voc no tem acesso a informaes da
populao, so as que seguem.
a. Quando no se conhece o tamanho da populao.
Tamanho da amostra:
n0 =
1
.
E2
Em que:
n=
N .n0
.
N + n0
Em que:
133
Captulo 4
a. O pesquisador no conhece o nmero total de estudantes do
Ensino Fundamental da cidade.
Calculando passo a passo.
Passo 1: identificar os elementos da frmula.
n0 =
1
1
1
=
=
= 625
2
2
0,0016
(E)
(0,04)
n0 = 625 estudantes.
n0 =
1
1
1
=
=
= 625
( E ) 2 (0,04) 2 0,0016
n0 = 625 estudantes.
n=
N .n0
27000.625 16875000
=
=
= 610,86
N + n0 27000 + 625
27625
Probabilidade e Estatstica
c. Quando se tem informaes sobre a populao.
Neste caso, alm da margem de erro tolervel, seriam necessrias informaes
como desvio padro, percentual dos indivduos que apresentam as caractersticas
estudadas etc. Essas informaes poderiam ser obtidas de pesquisas anteriores
ou, at mesmo, de uma pr-pesquisa. Nesta ltima, seria preciso uma
amostragem prvia para realizar os levantamentos necessrios. Embora, no seja
de nosso interesse aprofundar o estudo sobre este assunto, a seguir esto as
frmulas para se calcular o tamanho da amostra para os dois casos existentes,
para estimar a proporo (percentual) e a mdia populacional.
Quadro 4.1 Tamanho da amostra, proporo (percentual) e mdia populacional
Para a estimativa da mdia populacional
Para amostragem com reposio
(populao infinita)
Z .(x)
n= e
Z . pq
e2
n=
(populao infinita)
(populao infinita)
n=
Z2. 2 (x)N
2
e (N-1)+Z2.2 (x)
n=
N
Z2 . pq
2
e (N-1)+Z2. pq
Onde:
Onde:
n = tamanho da amostra;
N = tamanho da populao;
e = erro amostral;
n = tamanho da amostra;
N = tamanho da populao;
e = erro amostral;
p = percentual de elementos com a
= desvio padro;
caracterstica estudada;
135
Captulo 4
Em resumo, o processo de amostragem bem semelhante. Para que a prova de
comida seja representativa, voc teve, antes, que mexer bem, tornando, assim,
uma mistura homognea. Se for bem misturada, qualquer amostra que voc colha,
em qualquer lugar da panela, dar uma boa noo de como o todo (a comida) est.
Em pesquisas, o processo bem semelhante!
Voc lembra-se da pesquisa de intenes de voto? Em poca de campanha
eleitoral, quando um instituto de pesquisa faz uma pesquisa, ele tem que
selecionar eleitores que representem as mais diversas camadas sociais, regies,
raas etc., tornando, assim, a amostra representativa da populao.
Voc saberia dizer se os dados levantados, com base em alguns poucos
elementos, podem trazer informaes precisas acerca de uma populao inteira?
De certa forma, sim! Voc no ter informaes exatas da populao usando uma
amostra, mas, sim, uma aproximao bastante precisa. importante salientar
que, por no haver pesquisado a totalidade dos elementos, voc levado a
concluir que os dados nunca representaro um reflexo exato da populao.
Exemplos bem conhecidos so as pesquisas eleitorais divulgadas pelos meios
de comunicao. Veja.
Grfico 4.1 Exemplo dos dados de uma pesquisa eleitoral
35%
26%
37%
24%
39%
26%
A
B
C
15%
11%
10%
Agosto
11%
Setembro
9%
7%
Outubro
Probabilidade e Estatstica
De fato, existe uma margem de erro. Esse erro, relatado na notcia, gera um
intervalo, ou seja, as intenes de votos para o candidato A podem variar de 37%
a 41%. Por se tratar de uma pesquisa feita por amostragem, voc no pode dizer
que o candidato ter realmente 39% das intenes de votos.
Quais so as informaes que a amostragem pode fornecer?
Como voc j viu em Estatstica, esses intervalos so divididos em dois tipos, de
acordo com a varivel estudada. Vale relembrar.
Figura 4.2 Varivel aleatria discreta e intervalo de produo; varivel aleatria contnua e intervalo da mdia
Varivel aleatria
discreta
Varivel aleatria
contnua
Intervalo de proporo
(percentual)
Intervalo da mdia
Nvel de confiana
O nvel de confiana a probabilidade de o intervalo conter o parmetro
estimado, ou seja, pode-se entender que o valor ou percentual da populao
que voc est tentando estimar tem a probabilidade de estar em um intervalo
que seria o definido pelo erro.
Intervalo de confiana
Intervalo de confiana aquele que contm o parmetro estudado com
determinada probabilidade (nvel de confiana), ou seja, citando o exemplo da
pesquisa eleitoral, o intervalo calculado com o erro. Veja os valores no exemplo
citado nesta seo: ... as intenes de voto para o candidato A podem variar de
37% a 41%. Esse o intervalo de confiana.
137
Captulo 4
Curva normal
Voc poderia perguntar-se, a partir do que foi apresentado, qual relao pode
estabelecer-se entre o nvel de confiana e o intervalo de confiana. Como o nvel
de confiana a probabilidade de a estimativa estar correta e essa probabilidade
determina um intervalo (o intervalo de confiana), possvel usar a curva normal
para identificar a ambos. Veja a figura a seguir
Figura 4.3 Curva normal
Nvel de
confiana
%
Intervalo de confiana
Fonte: Elaborado pelo autor (2006).
Exemplo 1
Nvel de confiana: NC = 95%. Encontrar o valor de z na tabela.
Calculando passo a passo.
Passo 1: dividir o NC por dois. Antes disso, no se esquea de usar o valor do
nvel de confiana na forma decimal, ou seja, dividido por 100.
NC =
95
= 0,95
100
0,95
= 0,475
2
138
Probabilidade e Estatstica
Tabela 4.1 Tabela de valores normais
Exemplo 2
Nvel de Confiana: NC = 90%. Encontrar o valor de z na tabela.
Calculando passo a passo.
Passo 1: dividir o NC por dois. Para tanto, sempre usar o valor do nvel de
confiana na forma decimal, ou seja, dividido por 100.
NC =
90
= 0,90
100
0,90
= 0,45
2
139
Captulo 4
Passo 2: procurar esse valor na tabela e encontrar o z correspondente. O valor
referente rea entre zero e z, localizado na regio central da tabela. Veja a
figura a seguir.
Tabela 4.2 Tabela de valores normais
140
Probabilidade e Estatstica
Seo 2
Estimativas para a proporo populacional
Antes de comear a calcular o erro da estimativa, conhea algumas notaes:
p=
33
= 0,33
100
q = 1 p = 1 0,33 = 0,67
Amostra
Percentual de votantes em Tho = 30%;
30
= 0,30
100
q = 1 p = 1 0,30 = 0,70
p =
novamente o percentual:
novamente o percentual:
q = 0,70.100 = 70%
141
Captulo 4
Observao: note que a diferena, alm dos valores, est em identificar o
percentual da amostra com o acento circunflexo (chapu).
A seguir, veja um exemplo mais elaborado.
Exemplo 2: em uma determinada populao, foi retirada uma amostra de 200
votantes antes da eleio e verificou-se que 60 eleitores votariam no candidato Tho.
Aps a realizao da eleio, verificou-se que o total de votantes (da populao) era
de 3000 eleitores e que 990 votaram no referido candidato. Ento, voc deve indicar
os percentuais de sucesso e fracasso tanto para a populao quanto para a amostra
de votantes e no votantes em relao ao candidato mencionado.
Quadro 4.3 Populao e amostra
Populao
Amostra
candidato.
p=
990
= 0,33
3000
candidato.
p =
60
= 0,30
200
p = 0,33
p = 0,30
q = 1 p = 1 0,33 = 0,67
q = 1 p = 1 0,30 = 0,70
novamente o percentual:
novamente o percentual:
q = 0,7.100 = 70%
142
Probabilidade e Estatstica
e = .
p q
n
Em que:
e = erro da estimativa;
z = limite do intervalo definido pelo nvel de confiana;
P( p e < p < p + e) = NC
Em que:
NC = nvel de confiana.
143
Captulo 4
Calculando passo a passo.
Passo 1: calcular e procurar o z na tabela. Dividir o NC por dois. Para tanto,
no se esquea de usar o valor do nvel de confiana na forma decimal, ou seja,
dividido por 100.
NC =
95
= 0,95
100
0,95
= 0,475
2
Como vimos anteriormente, o z para o nvel de confiana de 95% sempre ser 1,96.
Passo 2: discriminar cada elemento da frmula de clculo do erro e aplic-la ao
caso em anlise.
e = .
p q
n
Em que:
e = erro da estimativa;
35
p = 35% ou
= 0,35 (percentual da amostra de eleitores que votam no candidato);
100
q = 1 0,35 = 0,65 (percentual da amostra dos eleitores que no votam no candidato);
n = 300 (tamanho da amostra).
Clculo do erro
e = .
p q
0,35.0,65
0,2275
= 1,96.
=
= 1,96.
300
300
n
144
Probabilidade e Estatstica
Passo 4: calcular o intervalo da estimativa. Neste passo, o clculo pode ser efetuado
na forma percentual ou decimal. Interpretando os resultados obtidos, tem-se que as
intenes de votos para o candidato referido devem ficar entre 29,60% e 40,40%.
Segundo as notaes da Estatstica, esse intervalo escreve-se da seguinte forma.
ou
29,60%.
ou
145
Captulo 4
Calculando passo a passo
Passo 1: como no foi indicado o percentual de alunos da amostra que foram
reprovados, voc deve, em primeiro lugar, calcular esse percentual.
Clculo do percentual
p =
1500
= 0,60
2500
p = 1 0,60 = 0,40
Voc pode manter o resultado na forma decimal, pois o clculo do erro tambm
feito assim.
e = .
p q
n
Em que:
p = 60% ou
60
= 0,60 (percentual da amostra de alunos reprovados);
100
146
Probabilidade e Estatstica
Clculo do erro
e = .
p q
0,60.0,40
0,24
= 1,645.
= 1,645. 0,000096
= 1,645.
n
2500
2500
P(0,5840 < p < 0,6160) = 0,90 ou P(58,40% < p < 61,60%) = 90%.
Que leitura voc pode fazer?
147
Captulo 4
Seo 3
Estimativas para mdia populacional
Ao realizar uma pesquisa por amostragem, alm de calcular percentuais, voc
pode obter algumas mdias como, por exemplo, a mdia das alturas, das idades,
dos pesos etc. O processo semelhante, ou seja, calcula-se o erro e o intervalo.
O que muda a forma de clculo do erro. Isso vale para as sries de dados
amostrais que podem ser aproximados por uma distribuio normal.
Para calcular o erro de uma estimativa da mdia populacional, voc vai precisar
da mdia de uma amostra e do desvio padro. Este pode ser obtido com base na
prpria populao, se for possvel, ou na amostra. O desvio padro da amostra
pode ser usado como uma aproximao.
Veja, a seguir, a frmula para o clculo do erro.
e = .
S ( x)
n
Em que:
e = erro da estimativa;
P ( x e < < x + e) = NC
Em que:
x = mdia da amostra;
= mdia da populao (o que voc vai estimar);
NC = nvel de confiana.
148
Probabilidade e Estatstica
Veja os exemplos a seguir.
Exemplo 1: em sondagem realizada com base nos alunos do curso de Matemtica
das quintas sries de uma determinada escola, o resultado geral apresentou uma
mdia de 6,7, com um desvio padro de 1,2. Com esse tipo de informao, pode-se
realizar uma srie de anlises. A partir desses dados, calcule uma estimativa (erro
e intervalo), considerando essa srie com uma distribuio normal para a mdia
populacional a um nvel de confiana de 95%, e que a amostra foi de 35 alunos.
e = .
S ( x)
n
Em que:
Clculo do erro
e = .
S ( x)
n
= 1,96.
1,2
35
= 1,96.
1,2
= 1,96.0,20284 = 0,3976 ou 0,40.
5,91607978
149
Captulo 4
Interpretando os resultados obtidos, tem-se que a mdia das notas da totalidade
dos alunos est compreendida entre 6,30 e 7,10 pontos, aproximadamente.
Segundo as notaes de Estatstica, escreve-se esse intervalo da seguinte forma.
O intervalo da estimativa para a mdia das notas da totalidade dos alunos est
compreendido entre 6,30 e 7,10 pontos, aproximadamente, com um nvel de
confiana de 95%.
Exemplo 2: em uma pesquisa realizada com diversas turmas de uma escola,
os alunos levaram 39 minutos, em mdia, para terminar uma avaliao de
Matemtica. O tamanho da amostra era de 100 estudantes. O desvio padro
dessa amostra foi de 18 minutos. Com base em um nvel de confiana de 90%,
qual seria a estimativa para a mdia populacional da escola e a sua interpretao?
e = .
S ( x)
n
Em que:
150
Probabilidade e Estatstica
Clculo do erro
e = .
S ( x)
n
= 1,645.
18
100
= 1,645.
18
= 1,645.1,8 = 2,961 ou
10
2,96.
x e = 39 2,96 = 36,04
x + e = 39 + 2,96 = 41,96
Interpretando os resultados obtidos, tem-se que o tempo mdio para a realizao
da avaliao est compreendido entre 36,04 e 41,96 minutos, aproximadamente.
Segundo as notaes de Estatstica, escreve-se esse intervalo da seguinte forma.
151
Captulo 4
Seo 4
Anlise de varincia ANOVA
Como comparar as caractersticas de vrias amostras
Logo aps calcular a estimativa de uma mdia populacional, podemos ter outro
desafio: definir se as mdias de vrias populaes so mesmo semelhantes ou
existem diferenas que superam os prprios problemas do processo de amostragem.
Isso porque, muitas vezes, amostras de diferentes populaes so selecionadas
com a finalidade de se avaliarem possveis diferenas entre as distribuies
populacionais de alguma caracterstica de interesse.
Podemos citar alguns exemplos dessas situaes.
Exemplos
Seleo de lotes de parafusos fabricados em diferentes empresas
com diferentes equipamentos, para avaliar se a distribuio
(populacional) do valor mdio do dimetro da cabea dos parafusos
produzidos varia com a marca do equipamento usado na fabricao.
Para curar certa doena, existem quatro tratamentos possveis: A, B, C e
D. Pretende-se saber se existem diferenas significativas nos tratamentos,
no que diz respeito ao tempo necessrio para eliminar a doena.
Em muitos casos, uma anlise descritiva dos dados indica que modelos
gaussianos ou normais so compatveis com suas distribuies. Em outras
palavras, sob o ponto de vista estatstico, podemos considerar as k amostras
disponveis como provenientes de populaes normais com mdias 1, 2, ..., k.
Se no existirem razes contrrias, podemos tambm supor que as amostras so
independentes. Adicionalmente, a anlise descritiva muitas vezes sugere que as k
populaes tm a mesma varincia 2 (desconhecida).
O problema proposto pode, ento, ser encarado como um teste da hiptese de
que as mdias so iguais: H: 1 = 2 = ... = k. E, nessas situaes, a tcnica
para resolver problemas desse tipo (e muitos outros semelhantes) chamada de
anlise de varincia de um fator.
152
Probabilidade e Estatstica
Considerando que existem k populaes de interesse, nas quais se estuda uma
caracterstica comum X1, X2, ..., Xk, so as variveis aleatrias que representam
tais caracterstica nas populaes 1, 2, ..., k, respectivamente. Assim, a hiptese
a testar : 1 = 2 = ... = k.
Nesse problema, as k populaes podem ser vistas como k nveis de um mesmo
fator. E, assim, a questo saber se o fator exerce alguma influncia na variao
da caracterstica em estudo (a mdia, neste caso).
Caso o problema apresente somente um fator, estaremos trabalhando com
anlise de varincia de um fator, conhecido como ANOVA de um nico fator.
Claro que tambm existe ANOVA de mltiplos fatores, mas esse tema no ser
abordado neste estudo.
Analisando o problema com um exemplo.
Exemplo: o Sr. Fernando Fernandes dono de uma Indstria Metal-Mecnica
e pretende comprar trs fbricas de parafusos para suprimentos da sua prpria
indstria. Para isso, precisa analisar o volume de fabricao das fbricas a
comprar, j que ele precisa que as trs tenham produes semelhantes de
parafusos para prover regularmente sua indstria.
Para isso, o Sr. Fernando Fernandes seleciona aleatoriamente cinco semanas do
semestre, nas quais observa o volume de fabricao semanal de cada fbrica (ou
seja, as trs amostras so independentes).
Os dados amostrais esto registrados na seguinte tabela.
Tabela 4.3 Dados amostrais
Semanas
Fbrica 1
Fbrica 2
Fbrica 3
Semana 1
47
55
54
Semana 2
53
54
50
Semana 3
49
58
51
Semana 4
50
61
51
Semana 5
46
52
49
x1 = 49
x2 = 56
x3 = 51
xi (mdias amostrais)
= 52
153
Captulo 4
A mdia da fbrica 1 dada pela soma das semanas e dividida por 5, ou seja,
145/5= 49. Para a fbrica 2,280/5 = 56 e para a fbrica 255/5 = 51, note que a
mdia das mdias das trs fbricas a soma das mdia (ltima linha da tabela)
dividida por 3.
Neste exemplo, existe apenas um fator de interesse, o fator fbrica, que
apresenta trs nveis ou grupos: fbrica 1, fbrica 2 e fbrica 3. Assim, cada nvel
do fator define uma populao de mdia i.
Assim, o que o Sr. Fernando Fernandes pretende saber se as mdias dos trs nveis,
ou populaes, so iguais, isto , pretende-se saber se a hiptese certa ou no.
H: 1 = 2 = 3
(Hiptese de igualdade na fabricao mdia das trs fbricas).
Ento, a questo a responder : sero as mdias amostrais
x1 = 49, x2 = 56,
H: 1 = 2 = 3
Ou, em outras palavras, a hiptese est afirmando que no h diferena entre o
volume mdio de fabricao das trs fbricas.
Lembre-se: como toda hiptese, as pesquisas (testes em nosso caso) podero
confirm-la ou neg-la!
Pressupostos para resolver a questo
A aplicao da anlise de varincia pressupe a verificao das seguintes condies:
as amostras devem ser aleatrias e independentes;
as amostras devem ser extradas de populaes normais;
as populaes devem ter varincias iguais.
154
Probabilidade e Estatstica
Como se sups que todas as populaes so normais e tm varincias iguais,
isto , o mesmo que extrair todas as amostras de uma nica populao (de
uma nica fbrica).
Grfico 4.2 Distribuio populacional quando 1 = 2 = 3 =
A hiptese H falsa
As diferenas observadas entre as mdias amostrais so demasiado grandes para
serem devidas unicamente a flutuaes amostrais.
Aqui, as mdias das populaes no so iguais, ou seja, pelo menos duas
fbricas tm volumes de produo mdia diferentes. As amostras recolhidas
provm de populaes diferentes.
Grfico 4.3 Distribuio populacional quando 1 2 3
3 1
Teste ANOVA
155
Captulo 4
Ento, a Estatstica de teste mede a razo entre a variao entre grupos e a
variao dentro dos grupos.
Por exemplo, para n = 3 (trs grupos) e m = 5 (cinco amostras por grupo), resultam em:
GLn = 3 1 = 2 (graus de liberdade do numerador, 2 = K);
156
Probabilidade e Estatstica
Agora, temos que calcular o valor de F para nosso experimento, e, se o valor do F
calculado for maior do que o valor de F tabelado (PC), a hiptese dever ser rejeitada.
Dessa forma, para calcular nosso valor de F amostral, devemos utilizar uma
tabela de layout para organizar nossos clculos.
A tabela, chamada de Tabela ANOVA, tem a seguinte estrutura tradicional.
Tabela 4.5 Tabela ANOVA
variao dentro dos grupos (populaes), , por vezes, designada por variao
residual, pois atribuda a flutuaes dentro da mesma populao, portanto no
pode ser explicada pelas possveis diferenas entre os grupos (populaes).
Tambm temos que:
157
Captulo 4
e, tambm, que
(K 1) + (N K) = N 1.
Ento, para nosso exemplo da compra das fbricas por parte do Sr. Fernando
Fernandes, vamos ver o que podemos concluir ao nvel de significncia de 0.05,
ou seja, a um nvel de confiana NC = 95%.
Clculo de SSE
SSE=30+50+14=94
Clculo de SSA
O SSa a diferena entre a mdia de cada fbrica menos a mdia das mdias
elevada ao quadrado e multiplicada pelo n, no caso 5 de cinco semanas.
158
Probabilidade e Estatstica
Assim, a tabela ANOVA resulta, numericamente, para o exemplo, nos seguintes valores.
Tabela 4.6 Tabela ANOVA
E, como resultando que 8,3 > 3,89, ento a hiptese (H: 1 = 2 = 3) rejeitada
ao nvel de significncia de 0,05, ou nvel de confiana de 95%; isto , existem
diferenas significativas entre as mdias amostrais das vendas, e h, portanto,
evidncia de que existem pelo menos duas lojas com volumes mdios de
produo diferentes entre elas.
Em outras palavras, o fator fbrica exerce uma influncia significativa sobre o volume
mdio da produo de parafusos: tem, ao menos, uma fbrica que est produzindo
bem menos ou bem mais do que as outras, desequilibrando o suprimento constante
de parafusos de que a indstria de Fernando Fernandes precisa.
159
Captulo 4
Atividades de Autoavaliao
1. Esto listadas, a seguir, uma srie de estudos e a margem de erro que o
pesquisador ir adotar como tolervel, bem como o tamanho da populao-alvo
desse estudo. Calcule o tamanho da amostra necessria para realizar as pesquisas,
considerando que o pesquisador no tem acesso ao tamanho da populao e que
o pesquisador tem acesso ao tamanho da populao (calcular para os dois casos).
Tabela 1 Tipos de estudos, margem de erro e tamanho da populao e da amostra
Erro
tolervel
Tamanho da
populao
0,03
5600
0,04
9400
0,06
125.000
0,09
250
0,05
4.000
0,02
80.000.000
Tema do estudo
Tamanho da
amostra
160
Probabilidade e Estatstica
Com os dados da matria, mostre os clculos que foram feitos para se chegar ao
erro de 2,74 pontos percentuais, e encontre o intervalo da estimativa.
3. Uma amostragem com 250 alunos foi feita em escolas, e, entre outras
perguntas, questionou-se sobre o peso dos alunos da quinta-srie. O peso
mdio dos alunos entrevistados foi de 29,3 Kg, e apresentou um desvio padro
de 3,4 Kg. Usando um nvel de confiana de 95%, calcule uma estimativa para a
totalidade (populao) de alunos da quinta-srie.
Mquina 2
Mquina 3
10
12
10
11
Soma
32
67
38
161
Captulo 4
A hiptese a testar : H: 1 = 2 = 3, ou seja: aceita-se que no h diferena entre
os nveis de produo relativamente ao volume mdio de peas que podem fabricar.
Assim, para resolver o problema, calcule o ponto crtico pelo mdio do estatstico
F da tabela da distribuio para um nvel de significncia de 5%. Verifique se
aceita ou rejeita a hiptese de trabalho e crie a tabela ANOVA.
162
Captulo 5
Seo 1
Correlao linear simples
Os mtodos que voc estudou at o momento so eficazes para analisar e interpretar
somente uma varivel de cada vez. Se eles servem para a anlise de uma varivel,
como analisar e comparar duas variveis simultaneamente? Para compreender como
solucionar tal situao, voc ir conhecer a correlao linear simples.
A correlao uma ferramenta destinada ao estudo da relao entre duas
variveis quantitativas, alm de fornecer a intensidade dessa relao.
Para voc estudar como usar a correlao linear simples, importante que voc
conhea o que diagrama de disperso e o coeficiente de correlao linear de
Pearson. Conhea melhor esses assuntos a seguir.
Diagrama de disperso
O diagrama de disperso ajuda a definir a correlao entre duas variveis
quantitativas de modo grfico. Em outras palavras, a relao entre duas variveis,
X e Y, pode ser vista em um diagrama, no qual so marcados os pontos
correspondentes aos pares ordenados gerados pela relao XY, e (x,y) so
esses pares ordenados. Dessa forma, constri-se um diagrama de disperso.
Quanto mais esses pontos esto prximos reta imaginria gerada pela nuvem
de pontos, mais forte ser a correlao. Observe o grfico a seguir e acompanhe
os exemplos apresentados.
No grfico abaixo, os pares ordenados so gerados pela relao entre a altura
das pessoas em centmetros e o peso em quilos.
163
Captulo 5
Grfico 5.1 Diagrama de disperso
rxy =
n. x. y [( x )(
. y )]
[n x
][
( x ) . n y 2 ( y )
Em que:
r = resultado do coeficiente de correlao linear de Pearson;
n = nmero de observaes;
164
Probabilidade e Estatstica
Quadro 5.1 Resultados possveis do valor de x
Valor de r
r prximo de 0
r=0
r prximo de 1
r = 1
r prximo de +1
r = +1
Tipos de correlaes
Segundo os resultados de r, as correlaes podem assumir diferentes tipos, os
quais voc pode acompanhar detalhadamente a seguir.
a) Correlao linear positiva
Neste caso, o coeficiente de Pearson estar entre 0 e 1 intervalo (0,1).
prximo de 1, forte, porm no igual a 1, perto de 1, estamos falando em algo
acima de 0,8. Note que os pontos esto perto da reta de regresso, porm no
esto exatamente em cima da reta.
Grfico 5.2 Correlao linear positiva: altura e peso
165
Captulo 5
b) Correlao linear perfeita positiva
Neste caso, o coeficiente de Pearson r ser igual a +1, neste caso, os pontos
esto perfeitamente alinhados em cima da reta.
Grfico 5.3 Correlao linear perfeita positiva: altura e peso
Probabilidade e Estatstica
d) Correlao linear perfeita negativa
10
11
12
13
14
15
16
167
Captulo 5
168
Probabilidade e Estatstica
Passo 3: calcule os elementos da quarta coluna (x2), elevando ao quadrado, cada
um dos elementos da coluna x.
(160)2 = 25600
(155)2 = 24025
(152)2 = 23104
....
(177)2=31329
Em seguida, some todos eles e escreva o total na ltima linha, para obter, assim, a
Passo 4: calcule os elementos da quinta coluna (y2), elevando, ao quadrado, cada
um dos elementos da coluna y.
(61)2 = 3721
(56)2 = 3136
(55)2 = 3025
....
(77)2 = 5929
Em seguida, some todos eles e escreva o total na ltima linha, para obter, assim, o
Passo 5: calcule o coeficiente de correlao utilizando a frmula vista anteriormente.
169
Captulo 5
2.
170
Probabilidade e Estatstica
Interpretao do resultado final do coeciente de correlao: o coeficiente de
correlao resultou em um nmero positivo e prximo de 1 (r = 0,98), sendo
assim, a correlao entre a altura dos alunos e o peso positiva (significativa), ou
seja, quanto maior a altura do aluno, maior ser seu peso, e, quanto menor for a
sua altura, menor ser o seu peso.
Seo 2
Anlise de regresso linear
Para fazer a anlise da regresso, nos casos em que possvel estabelecer uma
correlao entre duas variveis, voc ter que usar essa relao para prever
valores para uma delas (sempre a varivel que for adotada como Y), mas isso s
ser possvel quando for conhecido o valor da outra varivel, no caso, a varivel
X. E essa previso s tem significado caso a fora da correlao seja significativa
ou perfeita (quando r est prximo ou igual a +1 ou 1). Essa fora d-se pela
proximidade dos pontos do diagrama de disperso reta de regresso.
A reta de regresso obtida pela aproximao dos pontos do diagrama.
Para encontrar uma equao que auxilie a prever os valores de Y, usa-se o
Mtodo dos Mnimos Quadrados, o qual voc conhecer a seguir.
A escolha da varivel que ser o Y est relacionada varivel que o pesquisador
deseja estimar. No exemplo anterior, se a inteno a de estimar o peso dos
alunos, ento o Y deve ser a varivel peso. Caso a necessidade fosse a de
estimar a altura dos alunos, a varivel Y passaria a ser a altura.
171
Captulo 5
Em que:
= valor predito de y (a ser estimado);
172
Probabilidade e Estatstica
Calculando passo a passo.
Para o item a:
Considerando que a tabela a mesma do exemplo da Seo 1 (clculo do coeficiente
de correlao), no ser necessrio calcular as colunas nem os totais (veja a tabela).
Equao da reta de regresso
Passo 1: sendo assim, voc pode comear calculando a inclinao da reta (a).
Inclinao da reta (a):
173
Captulo 5
Passo 2: calcule a interseco com o eixo y, item (b).
Interseco do eixo y (b):
a = 0,72;
b = 53,76;
Para o item b:
Fazer a previso para um aluno que mede 175 cm. Voc deve usar 175 como X = 175.
Substituir o valor de X na equao de regresso.
Como interpretar? A previso para o peso deste aluno que mede 175 cm de 72,24 Kg.
174
Probabilidade e Estatstica
Atividades de autoavaliao
Ao final de cada unidade, voc realizar atividades de autoavaliao. O gabarito
est disponvel no final do livro didtico, mas se esforce para resolver as
atividades sem a ajuda do gabarito, pois, assim, voc estar promovendo (e
estimulando) a sua aprendizagem.
1. Uma turma da oitava srie realizou avaliaes em duas disciplinas,
Matemtica e Biologia; as notas obtidas esto na tabela abaixo. Usando estes
dados, calcule o que se pede.
Aluno
Nota Matemtica
Nota Biologia
X.Y
X2
Y2
9,5
3,4
32,3
90,3
11,6
9,0
5,4
48,6
81,0
29,2
8,5
6,0
51,0
72,3
36,0
8,0
6,0
48,0
64,0
36,0
8,0
5,0
40,0
64,0
25,0
7,5
7,0
52,5
56,3
49,0
7,5
9,0
67,5
56,3
81,0
6,0
7,5
45,0
36,0
56,3
5,0
8,0
40,0
25,0
64,0
10
4,0
8,0
32,0
16,0
64,0
Totais
73,0
65,3
456,9
561,0
452,0
175
Consideraes Finais
Muitas vezes deparamos-nos com situaes em que temos que lidar com
muitos dados e no sabemos como vamos lidar com eles. O contedo e as
atividades apresentados nesta unidade de aprendizagem tm como objetivo
desenvolver habilidades e proporcionar ferramentas para os profissionais que
lidam com esse tipo de situao.
Desde a apresentao de relatrios e trabalhos cientficos a pesquisas, controle,
testes, projees e previses, a Estatstica est sempre presente. Afinal, no dia
a dia, lidamos com uma grande quantidade de informaes, ento pergunto: de
que vale ter tanta informao se no sabemos o que fazer com ela? Espera-se
que todo o conhecimento que voc adquiriu nesta unidade de aprendizagem seja
suporte para as suas anlises, opinies e decises.
177
Referncias
180
181
182
Exemplos
Qualitativa nominal
Nacionalidade
Qualitativa ordinal
Quantitativa discreta
Nmero de filhos
Quantitativa contnua
183
CLASSIFICAO
Quantitativa contnua
Idade do cliente
Quantitativa contnua
Sexo do cliente
Qualitativa nominal
Classe econmica
Qualitativa ordinal
Estado civil
Qualitativa nominal
Quantitativa discreta
Quantitativa contnua
Nmero de filhos
Quantitativa discreta
Comprimento da pea
Quantitativa contnua
Quantitativa contnua
Quantitativa nominal
Qualitativa nominal
Quantitativa discreta
6. Montagem da tabela.
Principais motivos de tenso
(estresse)
N de clientes
Morte de um filho
16
Morte do cnjuge
12
11
Divrcio
Doena grave
Demisso
Total
60
184
7. Montagem da tabela.
Acidentes de trabalho nos ltimos 36 meses
N de acidentes
N de meses
Total
36
8. Montagem da tabela.
Renda das famlias de um bairro de classe baixa de Florianpolis
N de pacientes
Total
36
185
9. Completando a tabela.
Nmero de operrios acidentados em cada ms
N de
acidentados
N de meses
fa
Fr
fp (%)
0,1111
11,11
0,1389
13,89
18
0,2500
25,00
25
0,1944
19,44
30
0,1389
13,89
36
0,1667
16,67
Total (fi)
36
1,0000
100,0
a. 18 meses (9+5+4);
b. 27 meses (9+7+5+6);
c. 25% dos meses;
d. 13,89% dos meses.
186
Captulo 2
1. Em primeiro lugar, construa a tabela.
Consumo de bebidas alcolicas por semana pelos funcionrios.
Nmero de dias
(xi)
Nmero de
funcionrios (fi)
xi.fi
10
16
16
14
28
24
20
20
24
21
Total (fi)
64
153
Em segundo lugar, calcule a mdia, dividindo a soma da coluna xi.fi pela soma da
coluna fi. O resultado a mdia.
187
Renda (R$)
Nmero de famlias
PM
PM.fi
113,5
227
116,5
699
119,5
478
122,5
1102,5
125,5
1004
128,5
899,5
Total (fi)
36
4410
Em segundo lugar, divida o resultado da soma (PM.fi) pela soma dos nmeros
da coluna fi.
3. a) Conjunto 1
Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente
(Rol) e, na linha de baixo, as posies.
12
13
13
15
15
16
17
19
21
188
13
13
15
15
16
17
19
21
b) Conjunto 2
Primeiro passo: escrever, na tabela, os dados organizados em ordem crescente
(Rol) e, na linha de baixo, as posies.
14
14
15
15
16
16
17
18
14
15
15
Me
16
16
17
18
189
4. a) Conjunto 1
Organizando os dados.
1
b) Conjunto 2
Organizando os dados.
2
c) Conjunto 3
Organizando os dados.
1
A srie no tem moda, pois no tem nenhum dado que se repita mais do que os outros.
Interpretao moda: uma srie amodal, ou seja, no tem valor(es) mais frequente(s).
190
Nome da disciplina
5. Primeiro passo: escrever, na tabela, os dados organizados em ordem
crescente (Rol) e, na linha de baixo, as posies.
2
10
11
12
191
192
Passo 3: calcular a mdia dos quadrados dos desvios. Aqui, voc vai calcular
para a populao (varincia).
Varincia
193
(x2
(x3
(x4
(x5
Passo 3: calcular a mdia dos quadrados dos desvios. Aqui, voc vai calcular
para a amostra (varincia).
Varincia
194
N de dias (xi)
N de
funcionrios (fi)
xi.fi
(xi ) 2.fi
10
57,10
16
16
30,88
14
28
2,10
24
2,96
20
12,95
20
27,24
24
52,12
21
63,75
64
153
249,10
195
9. Mais uma vez, vamos calcular passo a passo. Comparando com a anterior,
a diferena est em que aquela era para amostra, enquanto que esta para a
populao. Sugesto: use as colunas para facilitar os clculos.
196
Idade (xi)
N de estudantes
(fi)
xi.fi
(xi )2.fi
17
85
17,4845
18
20
360
15,1380
19
22
418
0,3718
20
10
200
12,769
21
126
27,2214
63
1189
72,9847
Passo 1: devemos somar a coluna das frequncias simples (fi) para obter fi
(frequncia total).
fi = 63
Passo 2: calcular a mdia, multiplicar cada xi por sua correspondente fi e escrever
na coluna xi.fi; somar os valores calculados e escrever no final da coluna esse
resultado, que o xi.fi, dividir o resultado pelo resultado do passo 1 (fi).
197
10. Quando voc tiver que calcular o desvio padro para uma tabela com
intervalos, use o mesmo processo, apenas substituindo o xi pelo ponto mdio.
Renda de famlias de um bairro de classe baixa de Florianpolis
Renda (R$)
N de famlias
(fi)
PM
PM.fi
(PMi )2.fi
113,5
227
162
116,5
699
216
478
36
125,5
1102,2
128,5
1004
72
899,5
252
Total (fi)
36
4410
738
119,5
122,5
198
199
11.
11.1
a) A mais dispersa em termos absolutos a srie B (maior desvio padro).
b) Voc tem que calcular o coeficiente de variao.
Para a srie A.
Para a srie B.
11.2
a) A mais dispersa em termos absolutos a srie B (maior desvio padro).
b) Voc tem que calcular o coeficiente de variao.
Para a srie A.
Para a srie B.
200
Captulo 3
1.
Passo 1: para comear, voc deve identificar o evento e o espao amostral.
A: jovens sofriam com o autoritarismo dos pais.
S: adolescentes.
2.
Passo 1: para comear, voc deve identificar os eventos e o espao amostral.
A: casado(a);
B: solteiro(a);
C: divorciado(a);
S: total pesquisado.
n(S) = 665.541.
201
0,5018 ou 50,18%.
0,0252 ou 2,52%.
3.
a) Calcule Z (varivel padronizada) para x = 116, x = 136, para x = 131 e para
x = 141 pontos.
Passo 1: identificar todos os elementos que compe o problema.
a mdia: = 126;
o desvio padro: (x) = 10;
os limites do intervalo: X = 116; X = 136; X = 131; X = 141.
Z = 1
Para X = 136.
Z=1
202
Para X = 131.
Z = 0,5
Para X = 141.
Z = 1,5
203
c) Qual a probabilidade de se escolher uma pessoa com escore entre 126 e 131
pontos? Note que 126 a mdia. Esse fica mais fcil.
Passo 1: identificar, no grfico, o intervalo e a rea que voc deve calcular (usar o
z calculado no item anterior, para x = 131, o z = 0,5)
204
205
Captulo 4
1.
a) Estudo socioeconmico com estudantes da Unisul.
Passo 1: identificar os elementos da frmula.
n0 = tamanho aproximado da amostra;
E = erro amostral tolervel = 0,03;
N = tamanho da populao = 5600.
206
n0 = 625 crianas.
Um tamanho aproximado para a amostra seria de 625 crianas. Observe que
o pesquisador teve acesso informao de que a populao seria de 9400
crianas, ento voc deve passar para o passo seguinte.
207
2.
Passo 1: como j foi indicado o percentual de eleitores que votam no candidato,
s falta calcular o percentual dos eleitores que no votam no candidato ( )
Voc pode deixar na forma decimal, pois, para calcular o erro, usado dessa forma.
Em que:
e = erro da estimativa;
z = 1,645.
p = 26,4% ou
Clculo do erro
=1,645.
ou 2,74%.
208
ou
3.
Passo 1: identificar o z para o NC de 95%, z=1,96.
Em que:
e = o que voc quer calcular (erro da estimativa);
z = 1,96;
S(x) = 3,4 (desvio padro da amostra);
n = 250 (tamanho da amostra).
Clculo do erro
209
4.
Passo 1:
Clculo dos graus de liberdade para definio do ponto crtico:
GLn = 3 1 = 2 (graus de liberdade do numerador, isto porque so 3 mquinas, ou
seja, K=3);
GLm = 18 3 = 15 (graus de liberdade do denominador).
o resultado de N menos K, N composto por 5 peas na mquina 1, mais 7
peas da mquina 2, mais 6 peas da mquina 3.
Agora, procurando na tabela de F para 5% de nvel de significncia, entrando na coluna
da esquerda com GLm = 15 e na fila superior com GLn=2, resulta: F (5%,2,15) = 3,68.
Clculo do SSE
Mquina 1
(8-6,40)^2+(6-6,40)^2+(5-6,40)^2+(6-6,40)^2+(7-6,40)^2 = 5,20
210
Mquina 2
(10-9,57)^2+(8-9,57)^2+(12-9,57)^2+(7-9,57)^2+(9-9,57)^2+(10-9,57)^2+(11-9,57)^2=17,68
Mquina 3
(7-6,33)^2+(5-6,33)^2+(8-6,33)^2+(6-6,33)^2+(7-6,33)^2+(5-6,33)^2=7,34
Clculo do SSA
SSA = 5(6,40-7,43)^2 + 7(9,57-7,43)^2 + 6(6,33-7,43)^2 = 44,62
Clculo do MSE
MSE = 30,22/15 = 2,01
Clculo do MSA
MSA = 44,62/2 = 22,31
211
Graus de
liberdade
Varincia
Razo F
Entre grupos
SSA =44,62
MSA = 22,31
11,01
Residual
SSE = 30,22
15
MSE = 2,01
Total
SSE = 74,84
17
Fonte de variao
Captulo 5
1. a)
Passo 1: como as colunas j esto calculadas, voc pode comear identificando
os elementos da frmula.
212
b)
Passo 1: para a equao da reta, conforme mostrada abaixo, voc pode comear
calculando a inclinao da reta (a).
Equao da reta de regresso
b+a.X
213
214
215
Anexos
Tabela 3.7 - Tabela de reas da distribuio padronizada.
216
217