Anda di halaman 1dari 120

G RADUAÇAO

Administração

ESTATÍSTICA
Cesar Pandolfi
Keller Göttsche Gomes da Silva
Renate Grings Sebastiani
ESTATÍSTICA
CÉSAR PANDOLFI
KELLER GÖTTSCHE GOMES DA SILVA
RENATE GRINGS SEBASTIANI
Reitor
Me. Adriano Pistore

Gerente de Educação a Distância


Esp. André Antonio Gomes da Silva

Conselho Editorial da FSG


Esp. André Antonio Gomes da Silva
Dra. Delzimar da Costa Lima
Me. Fabio Beltrami
Me. Fabio Teodoro Tolfo Ribas
Dra. Patricia Kelly Wilmsem Dalla Santa Spada
Me. Rafael de Lucena Perini
Me. Rodrigo Flores Sartori
Ma. Rosemari Pedrotti de Avila

Revisão
Dra. Letícia Baron Bortoluzzi
Adaptação
Me. Edson do Nascimento Bassotti
Autores do livro
Me. Cesar Pandolfi
Esp. Keller Göttsche Gomes da Silva
Ma. Renate Grings Sebastiani
Sobre os autores
Cesar Pandolfi – Mestre em Engenharia da Produção / UFRGS. Especialista em Estatística Aplicada /
UCS. Bacharel em Engenharia Mecânica / UCS.
Keller Göttsche Gomes da Silva – Especialista em Matemática e Estatística / UFLA-FAEPE/MG.
Licenciada em Matemática / Universidade de Guarulhos/SP.
Renate Grings Sebastiani – Mestre em Educação – Ciências e Matemática / PUCRS. Especialista em
Estatística Aplicada / UCS. Licenciada em Física / UNISINOS.

Produção editorial e revisão gráfica: Núcleo de Educação a Distância – NEAD


Todos os direitos reservados ao Centro Universitário da Serra Gaúcha – FSG
Vedada a reprodução parcial ou total sem citação da fonte.

P189e Pandolfi, Cesar


Estatística / Cesar Pandolfi, Keller Göttsche Gomes da Silva, Renate
Grings Sebastiani . -- Caxias do Sul: NEAD/FSG, 2015.

1. Estatística 2. Gráficos estatísticos 3. Probabilidade 4. Amostragem


5. Estimação I. Silva, Keller Göttsche Gomes da II. Sebastiani, Renate
Grings III. Título
CDU 658.3
Ficha catalográfica elaborada pela Bibliotecária
Christiane da Silva dos Santos CRB 10/1865
SUMÁRIO
Sumário
Apresentação.......................................................................................................................................7
Apresentação
Conheça a estrutura do seu livro ..................................................................................................9
7
Unidade 1 - Introdução à Estatística e Gráficos Estatísticos .............................................11
Conheça a estrutura do seu livro
Unidade
9 2 - Medidas de tendência central,de posição e de variação e Distribuições de
frequências
Unidade 1 -......................................................................................................................................31
11
Unidade
Unidade32- Probabilidade
- 31 e Distribuições de Probabilidade ............................................ 65
Unidade
Unidade43- Amostragem
- 49 e Estimação .................................................................................... 95
Gabaritos..........................................................................................................................................115
Unidade 4 - 67
Unidade 5 - 83
Unidade 6 - 95
Unidade 7 - 107
Unidade 8 - 117
APRESENTAÇÃO
Prezado aluno, seja bem-vindo ao ensino a distância da Faculdade da Serra
Gaúcha.
Inicialmente é interessante apresentar o conceito de Educação a Distância
no Brasil, definido oficialmente no Decreto nº 5.622 de 19 de dezembro de 2005
(BRASIL, 2005), o qual caracteriza-se como modalidade educacional na qual a
mediação didático-pedagógica nos processos de ensino e aprendizagem ocorre com
a utilização de meios e tecnologias de informação e comunicação com estudantes
e professores desenvolvendo atividades educativas em lugares ou tempos diversos.
Nessa perspectiva, podemos dizer que a educação a distância utiliza-se de
ferramentas e recursos tecnológicos com o objetivo de encurtar distâncias entre o
professor e o aluno no processo de ensino e aprendizagem.
Por isso, para o ensino a distância, você necessita desenvolver e exercitar
algumas competências e habilidades próprias da modalidade, ou seja, aprender a
ler, interpretar, sintetizar e estudar de modo autônomo. Assim como, ter uma certa
fluência digital, disciplina para o estudo e auto organização.
Você está prestes a começar a leitura do seu Manual Didático que se
refere ao conteúdo de Estatística. Esse manual irá propor para você um roteiro de
estudo guiado com base de fundamento teórico nos principais autores da área, com
orientações pertinentes ao conteúdo, assim como, seguindo por problematizações,
exemplos práticos, glossários, sínteses, atividades e sugestões para aprofundar a
temática.
Este livro foi organizado com o propósito de auxiliar você no entendimento
dos conceitos básicos estatísticos. Também tem o intuito de facilitar a apresentação e
aprendizado da Estatística como material de apoio didático à disciplina de Estatística,
apresentada aos alunos dos diversos cursos da FSG.
O estudo da Estatística não é uma tarefa fácil, principalmente no início, quando
são apresentados muitos conceitos novos que exigem habilidade de raciocínio. Uma
boa base teórica é importante e necessária para que o estudo, nas diversas unidades
do livro, seja prazeroso e não muito sofrido. Dessa forma, em todas as unidades são
apresentadas bibliografias complementares disponíveis na biblioteca para consulta.

Então vamos começar?


CONHEÇA A ESTRUTURA DO
SEU LIVRO
O livro apresenta para você alguns recursos que buscam auxiliar na
organização do seu processo de aprendizagem, para facilitar a leitura e o estudo dos
conteúdos de forma mais integrada e dinâmica.
Estrutura do seu Livro

CONTEÚDO

OBJETIVOS

DESENVOLVIMENTO

SÍNTESE

QUESTÕES PARA
REVISÃO

PARA SABER MAIS


UNIDADE DE ENSINO 1

INTRODUÇÃO À ESTATÍSTICA
E
GRÁFICOS ESTATÍSTICOS
CONTEÚDOS DA UNIDADE
Nesta Unidade, você encontrará os conceitos iniciais de Estatística
e os principais tipos de gráficos mais utilizados na Estatística:

1. Definição de Estatística;
2. Fases do método Estatístico;
3. Diferença entre população e amostra;
4. Tipos de variáveis;
5. Tipos de dados estatísticos;
6. Gráfico de linhas;
7. Gráfico de colunas;
8. Gráfico de colunas empilhadas;
9. Gráfico de barras;
10. Gráfico de setores (pizza);
11. Gráfico de frequência;
12. Histograma; e,
13. Gráfico de frequência acumulada.

OBJETIVOS DA UNIDADE
Os objetivos da Unidade são que você possa refletir e analisar
a conceitualização Estatística no mundo acadêmico a partir da leitura
e atividades que fundamentam as definições referentes à Estatística,
população e amostra, variáveis e dados estatísticos e consiga ler e
interpretar gráficos, a partir do levantamento de dados de pesquisas
realizadas em campo.

PARA QUE SERVE A ESTATÍSTICA?


A utilização da Estatística é cada vez mais acentuada em qualquer atividade
profissional da vida moderna, isso se deve às inúmeras aplicações que podem ser
realizadas a partir dela. Sejam elas da análise de pequenos conjuntos de dados do
dia a dia até aplicações específicas das empresas.
São várias as razões para o desenvolvimento acentuado do objetivo da
Estatística e da necessidade de estudá-la nesses últimos cinquenta anos. Uma
delas é a abordagem crescentemente quantitativa utilizada em todas as ciências,
na Administração e em muitas outras atividades que afetam diretamente nossas
vidas. Isso inclui o uso de técnicas matemáticas na avaliação de controles de
poluição; no planejamento de inventários; na análise de problemas de tráfego;
no estudo dos efeitos de vários remédios; na avaliação de técnicas de ensino; na
análise do comportamento competitivo de administradores e governos; no estudo
de dietas e longevidade, assim por diante.
Nossa capacidade de lidar com informações numéricas aumentou
enormemente com o advento de poderosos computadores. Muitos tipos de
computadores são também econômicos, possibilitando sua execução por pequenas
empresas, estudantes de universidade e até mesmo de cursos secundários, de
trabalhos sofisticados.
A outra razão é que a quantidade de dados coletados, processados e
apresentados ao público, por uma razão ou outra, aumentou além de qualquer limite
imaginável; julgar que parte constitui boa Estatística e que parte é má Estatística fica
a critério do leitor.
Para exercer vigilância, torna-se necessário um número cada vez maior de
pessoas que participem da coleta dos dados, da sua análise e, o que é igualmente
importante, de todo o planejamento preliminar. Sem este último, é difícil imaginar
os erros que poderão ocorrer na compilação dos dados estatísticos. Os resultados
de custosas pesquisas podem tornar-se inúteis, se as questões são ambíguas ou
formuladas incorretamente, se são endereçadas a pessoas erradas, no lugar errado e
em momento inadequado.

ONDE SE PODE UTILIZAR A ESTATÍSTICA?


Como já mencionado, são inúmeras as utilizações da Estatística, pode-se
citar algumas aplicações:

a) indústrias realizam pesquisa entre os consumidores para o lançamento


de um novo produto;
b) as pesquisas eleitorais fornecem elementos para que os candidatos
direcionem a campanha;
c) emissoras de TV utilizam pesquisas que mostram a preferência dos
espectadores para organizar sua programação; e,
d) a pesquisa do desempenho dos atletas ou das equipes em uma partida ou
em um campeonato interfere no planejamento dos treinamentos.

PODEMOS DIZER QUE A ESTATÍSTICA É?


Um conjunto de métodos científicos para coleta, organização, resumo,
análise e apresentação de dados, bem como a obtenção de conclusões válidas, que
deem suporte à tomada de decisões baseada em tais análises.
Em sentido mais restrito, o termo estatístico é usado para designar um
resultado extraído dos dados, como, por exemplo, a média ou desvio padrão.
Logo, de forma geral, a Estatística é uma parte da Matemática Aplicada que
fornece métodos para a coleta, a descrição, a organização, a análise e a interpretação
de dados. Todo seu estudo tem o objetivo, entre outros, a tomada de decisões.
Podemos dividir a Estatística em três áreas: Estatística Descritiva, Probabilidade e
Inferência Estatística.
A Estatística Descritiva pode ser definida como um conjunto de técnicas
destinadas a descrever e resumir dados, a fim de que possamos tirar conclusões
a respeito de características de interesse (será abordada nas Unidades 1 e 2 deste
livro).

13
A Probabilidade pode ser pensada como a teoria matemática utilizada para
estudar a incerteza oriunda de fenômenos que envolvem o acaso. Jogos de dados e
de cartas, ou o lançamento de uma moeda para o ar enquadram-se na categoria do
acaso (será abordado na Unidade 3 deste livro).
A Inferência Estatística é o estudo de técnicas que possibilitam a extrapolação,
a um grande conjunto de dados, das informações e conclusões obtidas a partir de
subconjuntos de valores, usualmente de dimensões muito menores (seu estudo se
inicia na Unidade 4 deste livro).

PARA UM LEVANTAMENTO DE DADOS QUAIS SÃO AS FASES DO


MÉTODO ESTATÍSTICO?
O trabalho estatístico é um método científico, que consiste nas sete etapas:

1. Definição do problema a ser investigado: O primeiro passo é determinar


o problema da pesquisa, ou seja, o que se deseja investigar traçando os
seus objetivos. Consiste em:

a) formular de forma correta o problema;


b) examinar outros levantamentos realizados no mesmo campo
(revisão da literatura); e,
c) saber exatamente o que se pretende pesquisar definindo o problema
corretamente (variáveis, população, hipóteses, etc.).

2. Planejamento da pesquisa: É nesta fase que será escolhido o tipo de


levantamento a ser utilizado e determinar o procedimento necessário
para resolver o problema:

a) como levantar informações;


b) tipos de levantamentos: por censo (completo) e por amostragem
(parcial); e,
c) cronograma, custos, etc.

3. Coleta de dados: A coleta de dados pode ser direta ou indireta. A coleta direta
é feita sobre elementos informativos de registro obrigatório (nascimentos,
casamentos, óbitos, importação e exportação de mercadorias) ou, por
meio de inquéritos e questionários. A coleta é indireta quando inferida dos
elementos conhecidos. Como, por exemplo, pesquisa sobre mortalidade
infantil, que é feita por meio de dados colhidos por uma coleta direta. A
coleta de dados pode ser: Contínua, quando feita continuamente, tal como
a de nascimentos e óbitos, a frequência dos alunos às aulas; Periódica,
quando feita em intervalos constantes de tempo, como os censos (de 10
em 10 anos), as avaliações mensais dos alunos; ou Ocasional, quando
feita extemporaneamente, a fim de atender a uma conjuntura ou a uma
emergência, como no caso de epidemias.

14
4. Crítica dos dados: Obtidos os dados eles devem ser cuidadosamente
criticados, à procura de possíveis falhas, imperfeições e erros.

5. Apuração dos dados: Nada mais é que a soma e o processamento dos


dados obtidos.

6. Apresentação dos dados: Os dados devem ser apresentados em tabelas


ou gráficos, tornando-se mais fácil o exame do que está sendo objeto de
estudo.

7. Análise dos resultados: O objetivo último da Estatística é tirar conclusões


sobre o todo (população), a partir de informações de parte representativa
do todo (amostra).

QUAL A DIFERENÇA ENTRE POPULAÇÃO E AMOSTRA?


A Estatística não se interessa em concluir a respeito de indivíduos
isoladamente observados, mas sim de grupos ou conjuntos, porque seu objetivo é
o estudo da chamada população. População consiste na totalidade de unidades de
observação (usualmente pessoas, objetos ou eventos) a partir das quais se deseja
tomar uma decisão. Também é chamada de universo. Se a população é pequena,
é razoável observar toda ela. Todavia, examinar a população inteira nem sempre é
viável. É possível entrevistar e anotar o que pensam 44 pessoas que estejam em
uma reunião, mas não ouvir e registrar, em tempo razoável, a opinião de todos os
torcedores da partida final de um campeonato de futebol em um grande estádio.
Por esses motivos, o estudo estatístico inicia-se com a coleta de parte de
uma população, denominada amostra, constituída de um número finito de unidades
de observação e que devem ter as mesmas características da população.

Figura 1: Caracterização Gráfica da População e Amostra


Fonte: Elaborado pelos Autores (2014)

15
O QUE SÃO VARIÁVEIS NA ESTATÍSTICA?
Uma variável é representada por um símbolo como X, Y, H, Z, e pode assumir
qualquer valor de um conjunto de valor. O conjunto de valores possíveis é chamado
de domínio da variável. Se a variável pode assumir apenas um valor é chamada de
constante. Na estatística, podemos ter as variáveis qualitativas e quantitativas.

Quadro 1: Variáveis Qualitativas e Quantitativas


Fonte: Elaborado pelos Autores (2014)

COMO PODEM SER CLASSIFICADOS OS DADOS ESTATÍSTICOS?


Na Estatística, podemos ter dados absolutos ou dados relativos. Os dados
estatísticos resultantes da coleta direta da fonte, sem outra manipulação, senão a
contagem ou medida, são chamados dados absolutos.
Dados relativos são o resultado de comparações por quociente (razões)
que se estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades.
Vamos considerar o Quadro a seguir e calcular as porcentagens dos alunos
relativas a cada dado.

Quadro 2: Dados Absolutos e Relativos


Fonte: Elaborada pelos Autores (2014)

16
ESTUDO DE CASO
Neste tópico, estaremos relatando algumas situações de aplicação dos
conceitos trabalhados nesta Unidade. E para fixação desses conceitos, o livro, em
suas diferentes unidades, estará trabalhando vários estudos de caso aplicados.

1ª situação problema:

Imagine que a prefeitura de uma metrópole quer tomar uma medida


administrativa que afeta os lojistas: Metade (0,5) deles é a favor e metade (0,5) é
contra, mas ninguém conhece essas proporções. Você toma então uma amostra de
dois lojistas para afirmar a proporção de lojistas favoráveis. Na sua amostra, podem
ser favoráveis à medida:

a) nenhum dos dois;


b) somente um deles;
c) os dois.

As estimativas da proporção de lojistas favoráveis à medida seriam:

a) 0;
b) 0,5;
c) 1.

2ª situação problema:

Vamos considerar o quadro a seguir e calcular as porcentagens dos alunos


relativas a cada dado.

Quadro 3: Dados Absolutos e Relativos


Fonte: Elaborada pelos Autores (2014)

Para o cálculo da porcentagem, observamos que para o Ensino Fundamental


basta dividir os 19.286 alunos pelo total de alunos matriculados e multiplicar por 100:

17
GRÁFICOS ESTATÍSTICOS
Para que servem os gráficos na Estatística?

Você já deve ter visto em uma pesquisa, o gráfico na Estatística é uma


maneira de apresentar os dados, que foram coletados, de forma clara e objetiva,
produzindo uma leitura rápida e precisa do fenômeno que está sendo estudado ou
analisado.
Seu objetivo é explanar e esclarecer aos leitores leigos o entendimento e o
resultado dos dados pesquisados para que estes venham a interagir ou analisar a
pesquisa realizada.

O que um gráfico estatístico deve conter?

Todo gráfico estatístico deve conter um título, legendas e a fonte de onde


foram retirados os dados.

Quais os tipos de gráficos mais utilizados na Estatística?

Na Estatística, existe uma infinidade de gráficos que podem ser utilizados


para descrever um fenômeno. Porém, para o nosso estudo, estaremos elencando os
principais gráficos que são de mais fácil compreensão. Dessa forma, os principais
gráficos são:

Gráfico de linhas

O gráfico de linhas, como o próprio nome diz, é o gráfico que apresenta linhas
de crescimento ou decrescimento ao longo de um período de tempo ou situação.
Observe que o Gráfico 1 descreve esta situação:

Gráfico 1: Número total de atendimentos por semestre no PAPIIS/FSG


Fonte: Programa de Atendimento Psicopedagógico do Instituto Integrado da
FSG (PAPIIS/FSG) – 2013

18
Gráfico de colunas

O gráfico de colunas é o gráfico que apresenta colunas em seu formato,


descrevendo os níveis de altura dos dados, conforme se observa no Gráfico 2, sobre
a preferência de tipos de lanches rápidos na hora do intervalo para os alunos do
segundo ano do Ensino Médio de uma escola.

Gráfico 2: Preferência no tipo de lanches rápidos para o intervalo


Fonte: Exemplo hipotético elaborado pelos Autores (2014)

Gráfico de colunas empilhadas

O gráfico de colunas empilhadas pode descrever, por exemplo, a comparação


entre o percentual de atendimentos realizados pela manhã, à tarde no Programa de
Atendimento Psicopedagógico do Instituto Integrado da Faculdade da Serra Gaúcha
(PAPIIS/FSG) nos cinco semestres que se passaram, conforme se observa a seguir
no Gráfico 3.

Gráfico 3: Percentuais semestrais em relação ao número total de atendimentos


por turno e sua média
Fonte: Programa de Atendimento Psicopedagógico do Instituto Integrado da
FSG (PAPIIS/FSG) – 2013

19
Gráfico de barras

O gráfico de barras é o gráfico de colunas colocado na forma horizontal. É um


gráfico de fácil compreensão de um fenômeno estudado, conforme se vê no Gráfico
4 logo a seguir.

Gráfico 4: Tempo de decomposição do lixo


Fonte: Almanaque Abril – Brasil 2001

Gráfico de setores (pizza)

O gráfico de setores também é conhecido como gráfico de Pizza. O gráfico de


Pizza é utilizado para representar poucos setores dos dados pesquisados de forma
percentual e/ou discreta.
O Gráfico 5 descreve esta situação.

Gráfico 5: Número de homens e mulheres presentes em sala de aula


Fonte: Turma de Estatística – ADM 114 – FSG - Curso de Administração – 2013/2

20
Gráfico de Frequência

O gráfico de frequência é o gráfico que descreve a contagem repetida ou não


dos dados em uma determinada variável. Essa contagem é chamada de frequência.
Geralmente esse gráfico é utilizado para perceber qual dado se repete com maior
frequência, conforme se observa no Gráfico 6.

Gráfico 6: Frequência das idades dos alunos


Fonte: Turma de Estatística – ADM 114 – FSG - Curso de Administração – 2013/2

Histograma
O Histograma é o gráfico de colunas justapostas, ou seja, é o gráfico em que
as colunas são colocadas lado a lado. Este gráfico é utilizado para variável contínua
de dados, isto é, em que a variável apresenta determinado intervalo numérico, como,
por exemplo, a faixa etária de um grupo de alunos.
O Gráfico 7 descreve essa situação.

Gráfico7: Faixa etária dos alunos de Estatística


Fonte: Turma de Estatística – ADM 114 – FSG - Curso de Administração – 2013/2
Gráfico de frequência acumulada
O gráfico de frequência acumulada descreve a frequência acumulada dos
dados de uma determinada variável. Por meio deste gráfico podemos tirar conclusões
do tipo: quantos dados estão abaixo ou acima de determinado valor?
Entendemos melhor este tipo de gráfico, observando o Gráfico 8 a seguir.

Gráfico 8: Frequência acumulada das idades dos alunos da turma


de Estatística
Fonte: Turma de Estatística/ADM 114 - FSG - Administração - 2013/2

Neste tipo de gráfico, percebemos que, por exemplo, existem 36 pessoas até
29 anos, ou seja, apenas seis pessoas se encontram acima de 29 anos.

ESTUDO DE CASO
Neste tópico, vamos analisar e interpretar o Gráfico 9, que descreve o
percentual de vendas de produtos realizadas em uma empresa durante uma semana
nos turnos matutino (de manhã) e vespertino (de tarde).

Gráfico 9: Vendas realizadas durante uma semana


Fonte: Elaborado pelos Autores (2014)
É fácil para você perceber que o Gráfico 9 descreve os valores de vendas,
em Reais, em cada dia da semana, isto é, de segunda a sexta-feira. Porém, existem
informações de porcentagens presentes neste gráfico. A primeira pergunta que
poderíamos fazer seria: Quais foram os valores de vendas realizadas de manhã e de
tarde na segunda-feira? A resposta é encontrada, calculando-se 60% de 120 mil reais
ou 40% de 120 mil reais. Dessa forma, o cálculo que faríamos, seria:

Se pela manhã foram vendidos 72 mil reais em produtos da empresa, então à


tarde foram vendidos 48 mil reais, pois:

Tarde=Total de vendas do dia-Manhã


Tarde=120 000 -72.000
Tarde=48 000 reais

Assim, as vendas realizadas pela manhã e à tarde na segunda-feira,


respectivamente, foram 72 mil reais e 48 mil reais, em produtos.
Para os outros dias seguintes da semana, procederíamos com os mesmos
cálculos e poderíamos colocar estes dados em uma tabela para melhor visualizarmos
os valores de vendas em cada dia da semana.
A Tabela 1 apresenta os cálculos já efetuados. Dessa forma, temos:
Tabela 1: Valores de vendas (em R$) durante a semana.

Fonte: Elaborado pelos Autores (2014)

Se você acrescentar uma última linha na Tabela 1, encontrará os valores do


total de vendas pela manhã e à tarde, concluindo, assim, o total de vendas em uma
semana, conforme se observa na Tabela 2.

23
Tabela 2: Valores de vendas (em R$) durante a semana

Fonte: Elaborado pelos Autores (2014)

As vendas realizadas por dia na Tabela 2 podem ser bem mais visualizadas
construindo um gráfico de Barras, conforme o Gráfico 10. Dessa forma, temos:

Gráfico 10: Quadro geral de vendas realizadas durante a semana


Fonte: Elaborado pelos Autores (2014)

No Gráfico 10, estão descritas todas as vendas realizadas durante a semana,


bem como os valores de venda total por turno e geral.
Neste estudo de caso, fica claro perceber a importância de se fazer a leitura e
interpretação de um gráfico, pois do Gráfico 9 foi possível construir uma Tabela 2 que
se refere aos valores de vendas por dia e geral, bem como a construção do Gráfico 10,
com informações gerais de vendas em Reais.
A partir deste momento, você está apto para fazer leitura e interpretação de
gráficos, além de calcular porcentagens sobre determinados valores numéricos.

24
RESUMINDO
Nesta Unidade, você percebeu que foram apresentados os principais
conceitos de Estatística que servirão para as unidades posteriores. Foram trabalhados
os conceitos da Estatística, diferença entre população e amostra, fases do método
estatístico, tipos de variáveis e tipos de dados estatísticos.
Também foram apresentados os principais tipos de gráficos, que são: linhas
, colunas, colunas empilhadas, barras, setores (pizza), frequência, histograma e o de
frequência acumulada.
Entendendo assim, suas leituras e interpretações, além de cálculos que
podem ser efetuados.

ATIVIDADES PARA REVISÃO


Nesta parte da Unidade, você deverá ser capaz de responder às perguntas
propostas para reforçar seu aprendizado dos conceitos estatísticos.

1. Conceitue Estatística e onde pode ser usada? ___________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

2. Para um bom levantamento de dados quais são as fases a serem seguidas? _______
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

3. Diferencie população de amostra: ________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

25
4. Por que os estatísticos estudam amostras e não populações?______________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

5. Para os seguintes tipos de variáveis, indicar se são discretas (D) ou contínuas (C):

a)(____) Peso do conteúdo de pacote de farinha


b)(____) Diâmetro de um rolamento
c)(____) Número de artigos defeituosos produzidos por uma determinada máquina
d)(____) Número de indivíduos de uma determinada região geográfica, que recebem
seguro-desemprego
e)(____) Número de pessoas de uma residência
f)(____) Número médio diário de clientes potenciais visitados por um vendedor
durante o último mês.
g)(____) A altura (h) de um indivíduo
h)(____) Temperaturas registradas a cada hora
i)(____) Vida média de lâmpadas
j)(____) Comprimento de 1000 parafusos
k)(____) O número de livros de uma biblioteca

6. Indique um exemplo de variável contínua e um exemplo de variável discreta com as


quais você lida no seu dia a dia._________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

7. Diferencie Dados Absolutos e Dados Relativos: E aponte para o exercício 8 qual


coluna corresponde aos dados absolutos e qual aos dados relativos.________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

26
8. Calcule o Percentual de alunos por escola.

9. Leia um texto de jornal e escreva se há uma relação com o conteúdo estudado: _______
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

10. Uma pesquisa foi realizada com 380 pessoas, conforme releva o Gráfico11.

Gráfico 11: Total de peças pesquisadas


Fonte: Elaborado pelos Autores (2014)

Qual é o número de pessoas do gênero masculino e do gênero feminino,


respectivamente?
a)(____) 30 e 70
b)(____) 70 e 30
c)(____) 266 e 114
d)(____) 114 e 266
e)(____) 170 e 170

27
11. O Gráfico 12 descreve o número de funcionários em uma Empresa. Por exemplo:
existem 10 funcionários com até três anos de empresa.

Gráfico 12: Número de funcionários


Fonte: Elaborado pelos Autores (2014)
Com base nessas informações, responda:

a) Qual o número de funcionários com até cinco anos de empresa? _________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) Qual o número total de funcionários nesta empresa?_______________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c) Qual o número de funcionários acima de cinco anos de empresa? _______________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

d) Posso dizer que cinco funcionários têm mais de seis anos de experiência? ______________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

12. Qual foi o número total de alunos pesquisados no Gráfico 2 da página 20? _______________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

28
13. Calcule o percentual de alunos que preferem comer pizza na hora do intervalo do
Gráfico 2 da página 20. ________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

14. Em qual momento do Gráfico 1 da página 19 houve decréscimo no número de


atendimentos?

a)(____) De 2010/2 a 2011/1


b)(____) De 2011/1 a 2011/2
c)(____) E 2011/2 a 2012/1
d)(____) De 2012/1 a 2012/2

15. Em relação ao Gráfico 1 da página 19, você pode dizer que houve um aumento no
número de atendimentos de 2011/1 a 2011/2 aproximadamente de:

a)(____) 50%
b)(____) 100%
c)(____) 150%
d)(____) 200%

16. O Gráfico 6 da página 24 descreve a frequência das idades dos alunos da disciplina
Estatística do Curso de Administração 2013/2. Em relação aos dados informados
neste gráfico, qual é a idade que mais prevalece nesta turma? _________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

17. Segundo informações do Almanaque Abril de 2001, no Gráfico 4 da página 22,


quantos meses demora para se decompor o papel?

a)(____) 2 meses e meio


b)(____) 3 meses
c)(____) 25 meses
d)(____) 4 meses
e)(____) 0,25 meses

29
18. Observando o Gráfico 7 da página 25, podemos dizer que a menor e a maior
frequência da faixa de idades, respectivamente, são:

a)(____) 18 a 20 anos e 21 a 23 anos


b)(____) 33 a 35 anos e 21 a 23 anos
c)(____) 21 a 23 anos e 33 a 35 anos
d)(____) 21 a 23 anos e 36 a 38 anos
e)(____) 33 a 35 anos e 36 a 38 anos

PARA SABER MAIS


Caro (a) Acadêmico (a).
Você poderá consultar sites ou vídeos no YouTube que demonstrarão como
gerar gráficos no Excel. O site do Oficce Microsoft pode ser também uma boa opção.
O site do Instituto Brasileiro de Geografia e Estatística (IBGE) será de grande
valia para futuras consultas para pesquisa. Seguem os links.

IBGE. Instituto Brasileiro de Geografia e Estatística. Disponível em: <http://www.ibge.


gov.br/>. Acesso em: 04 de jul. 2014.
OFFICE. MICROSOFT. Excel help criar um gráfico do inicio ao fim. Disponível em:
<http://office.microsoft.com/pt-br/excel-help/criar-um-grafico-do-inicio-ao-fim-
HP010342356.aspx>. Acesso em: 04 de jul. de 2014.
YOUTUBE. Disponível em: <www.youtube.com.br>. Acesso em 04 de jul. de 2014.

REFERÊNCIAS DA UNIDADE
CRESPO, Antonio A. Estatística Fácil. São Paulo: Saraiva, 2002.
BRAULE, Ricardo. Estatística aplicada com excel: para cursos de Administração e
Economia. Rio de Janeiro: Campus, 2001.
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 5. ed. São Paulo: Saraiva,
2004.
FREUND, John E. Estatística Aplicada: economia, administração e contabilidade. 11.
ed. Porto Alegre: Bookman, 2006.
KAZMIER, Leonard J. Estatística Aplicada à Administração e Economia. 4. ed. Porto
Alegre: Bookman, 2007.
STEVENSON, William J. Estatística Aplicada à Administração. São Paulo: Harbra, 2001.
TRIOLA, Mario F., Introdução à Estatística. 7. ed. Rio de Janeiro: LTC, 1999.

30
UNIDADE DE ENSINO 2

MEDIDAS DE TENDÊNCIA
CENTRAL, DE POSIÇÃO E DE
VARIAÇÃO
E
DISTRIBUIÇÕES DE
FREQUÊNCIAS
CONTEÚDOS DA UNIDADE
Nesta unidade, serão abordados os seguintes tópicos primordiais da
Estatística Descritiva. Será abordada também a organização e apresentação
de grandes conjuntos de dados:

1. Medidas de tendência central: média aritmética, média ponderada, moda


e mediana;
2. Medida de posição: quartil;
3. Medida de variação: desvio padrão; e,
4. O coeficiente de variação.
5. Distribuição de frequências para variáveis;
6. Elementos de uma distribuição de frequências;
7. Apresentação tabular e gráfica de uma distribuição de frequências; e,
8. Determinação de medidas de posição e variabilidade.

OBJETIVOS DA UNIDADE
Calcular as medidas de tendência central, de posição e de variação
para uma variável discreta e o coeficiente de variação.
Organizar dados estatísticos a partir da análise de grandes
conjuntos, agrupando-os de forma a obter informações a respeito de sua
distribuição. Refletir sobre a forma da distribuição de um conjunto de dados,
calculando medidas de posição e variabilidade de dados agrupados em uma
distribuição de frequências.

MEDIDAS DE TENDÊNCIA CENTRAL, DE POSIÇÃO E DE


VARIAÇÃO
O que é uma medida de tendência central e quais são as medidas de
tendência central na Estatística?
Uma medida de tendência central é a medida que apresenta valor central em
uma série de dados fornecidos ou pesquisados. Dessa forma, as medidas de tendência
central na Estatística são: média aritmética, média ponderada, mediana e moda.
A seguir, descreveremos cada medida central em uma série de dados
fornecidos:

a) média aritmética
A média aritmética é a soma de todos os valores dos dados divido pelo
número total de dados. Assim, se a série de dados for (x1, x2, x3,…, xn), a média
aritmética é calculada por:
Em que: Σx é a soma de todos os valores dos dados, chamada de somatório
de x; n é o número total de dados; e x̅ é a média aritmética.

b) média ponderada
A média ponderada é a média aritmética com alguns ou todos os dados
repetidos. Assim, se a série de dados for (x1, x2, x2, x2,…, xn, xn), a média ponderada
é calculada por:

Em que: f é a frequência dos dados repetidos de x1, x2 e xn; Σ[f∙x] é o


somatório da frequência dos x dados; Σf é o somatório das frequências; e x̅ f é a
média ponderada.

c) mediana
A mediana é encontrada colocando a série de dados em ordem crescente ou
decrescente. Dessa maneira, a série de dados fornecidos pode ser par ou ímpar, ou
seja, pode ser fornecido, por exemplo, 10 dados ou 11 dados.
Para n dados fornecidos, a mediana é calculada por:

Md = X[(n⁄2)+(1⁄2)]

Em que Md é a mediana e n é o número de dados fornecidos.

Para 10 dados fornecidos, ou seja, n=10, a série de dados será (x1, x2, x3, x4,
x5, x6, x7, x8, x9, x10).
Assim, a mediana destes 10 dados será:

Em que X5,5 é a mediana, ou seja, é o valor central entre o 5º e o 6º dado, isto


é, é a média aritmética entre x5 e x6. Alguns interpretam, também, que é a quinta
posição e meia.
Para 11 dados fornecidos, ou seja, n=11, a série de dados será (x1, x2, x3, x4,
x5, x6, x7, x8, x9, x10, x11).
Assim, a mediana destes 11 dados é calculada por:

Md=X[(11⁄2)+(1⁄2)] =X6

Em que X6 é a mediana, ou seja, é o valor central, que é o 6º dado.

d) moda
A moda é também uma medida de tendência central. Porém, a moda não se
calcula, mas se observa.

33
A moda é o valor que mais se repete numa série de dados fornecidos ou
pesquisados, ou seja, a moda é o valor que ocorre com maior frequência. Por exemplo:
Considere a série de dados (x1, x2, x2, x2, x3, x3, x4, x5). A moda é o valor mais
frequente entre os dados fornecidos. Dessa forma, a moda é o valor x2, pois repete
três vezes o seu valor.
Se houver mais valores que se repetem com a mesma frequência, a moda
será chamada de bimodal ou trimodal.
É raro acontecer que uma série de dados tenha mais do que três modas.

Para que servem as medidas de tendência central?


Todas as medidas de tendência central servem para caracterizar os valores
centrais em uma série de dados.
É importante salientarmos que, quando é fornecida uma série de dados muito
discrepantes, ou seja, com alguns valores muito altos ou baixos, a melhor medida
central de se analisar é a mediana e não a média.

O que é uma medida de posição?


A medida de posição é a medida que se encontra fora da medida central.
Assim, a medida de posição que mais utilizamos na Estatística é o quartil.
O quartil é a medida de posição que é encontrada no primeiro um quarto de
uma série de dados e no terceiro três quartos da mesma série de dados, desde que
estes dados sejam colocados em ordem crescente.
Assim, o 1º quartil (Q1) e o 3º quartil (Q3) são calculados das seguintes
maneiras:

Q1=X[(n⁄4)+(3⁄4)] e Q3=X[(3 n⁄4)+(1⁄4)]

Em que n é o número total de dados da série.


Dessa forma, se uma série de dados tiver 10 dados (n=10), a série será (x1,
x2, x3, x4, x5, x6, x7, x8, x9, x10). Assim, o 1º e 3º quartil serão calculados da seguinte
maneira:

Q1=X[(10⁄4)+(3⁄4)] =X3,25 (3ª posição e um quarto da 3ª posição)


Q3=X[(3 (∙10)⁄4)+(1⁄4)] =X7,75 (7ª posição e três quarto da 7ª posição)

E se a série de dados tiver 11 dados (n=11), a série será (x1, x2, x3, x4, x5, x6,
x7, x8, x9, x10, x11). Assim, o 1º e o 3º quartil serão calculados da seguinte maneira:

Q1=X[(11⁄4)+(3⁄4)] =X3,5 (3ª posição e meia)


Q3=X[(3 (∙11)⁄4)+(1⁄4)] =X8,5 (8ª posição e meia)

A mediana é considerada uma medida de posição, pois a mediana é o segundo


quartil de uma série de dados. Observando as fórmulas da mediana e do segundo
quartil, percebemos que são equivalentes.

34
Para que serve a medida de posição?
A medida de posição quartil serve para medir os 25% e 75% da série de dados
colocados na ordem crescente, ou seja, serve para medir o valor mediano da primeira
metade da série de dados e para medir o valor mediano da segunda metade da série
de dados.

O que é medida de variação e qual a medida de variação mais utilizada na


Estatística Descritiva?
A medida de variação é uma medida de dispersão em relação à média da
série de dados.
A medida de dispersão mais utilizada na Estatística Descritiva é o desvio
padrão.
O desvio padrão pode ser calculado sobre todos os dados de uma série,
chamado de desvio padrão da população, ou o desvio padrão pode ser calculado
sobre parte dos dados de uma população, chamado de desvio padrão da amostra.
Assim, sendo conhecida determinada série de dados (x1, x2, x3,…, xN), o
desvio padrão de uma população é calculado por:

Em que σ é o desvio padrão da população, μ é a média da série de dados, N


é o número total de dados da população e (x-μ) é a diferença entre cada dado da série
e a média da série de dados.
E o desvio padrão de uma amostra de uma determinada série de dados
(x1,x2,x3,…,xn) é calculado por:

Em que s é o desvio padrão da amostra, x̅ é a média da série de dados, n é o


número total de dados da amostra e (x-x̅ ) é a diferença entre cada dado da série e a
média da série de dados.

Para que serve a medida de variação na Estatística Descritiva?


A medida de variação como o desvio padrão serve para apontar se a série de
dados tem valores dispersivos entre si ou não.
Se a série de dados tiver valores muito próximos entre si, então o desvio
padrão terá valor baixo, porém se a série de dados tiver valores menos próximos entre
si, ou seja, valores mais dispersivos, então o desvio padrão terá valor mais alto.
Dessa forma, percebemos que quanto maior for o desvio padrão, maior será a
dispersão entre a série de dados.

35
O que é coeficiente de variação?
Coeficiente de variação é o valor que mede a dispersão do desvio padrão em
relação à média, de uma série de dados, de forma percentual. Assim, os coeficientes
de variação da população e da amostra são calculados, respectivamente, por:

Para que serve o coeficiente de variação?


O coeficiente de variação serve para comparar, em percentuais, quanto o
desvio padrão dispersa em relação à média de uma série de dados.
É importante saber que se você tiver duas séries de dados com médias
diferentes entre estas séries, o coeficiente de variação de cada série revelará qual série
é mais homogênea, ou seja, qual série de dados apresenta menos dispersibilidade
entre seus dados.
No tópico a seguir, estaremos aplicando todos os conteúdos abordados até
aqui.

ESTUDO DE CASO
Neste tópico, analisaremos dois gráficos, calculando as medidas de
tendência central (média, mediana e moda), de posição (quartil), de variação (desvio
padrão) e o coeficiente de variação.
Observe as duas situações-problema a seguir para melhor compreensão das
medidas da Estatística Descritiva.
1ª situação-problema
O Gráfico 13 descreve o salário de um vendedor durante os seis primeiros
meses de um ano e sua média salarial.

Gráfico 13: Salários e média salarial de um vendedor


Fonte: Elaborado pelos autores (2014)

36
Observe os salários acima como sendo dados de uma população. Assim, em
relação a estes dados, identificaremos a moda salarial, calculando:
1º. a média salarial;
2º. o salário mediano;
3º. o primeiro salário quartil;
4º. o terceiro salário quartil;
5º. o desvio padrão dos salários; e,
6º. o coeficiente de variação salarial.

A moda salarial é o valor do salário que mais se repete. Dessa forma, a moda
salarial é 3300 reais, pois aparece duas vezes.
1º. Para calcularmos a média salarial, fazemos:

2º. Para calcularmos o salário mediano, precisamos colocar os dados em


ordem crescente, assim, encontraremos o salário mediano por meio da fórmula
Md=X[(n⁄2)+(1⁄2)] . Lembre-se que a mediana é o segundo quartil. Desse modo, fazemos:

3º. Para encontrarmos o primeiro quartil salarial, também necessitamos


colocar os salários em ordem crescente, conforme se observa no segundo item.
Assim, fazemos:

Q1= X[(6⁄4)+(3⁄4)] = X2,25=x2+(x3 - x2 )× 0,25


Q1= 2700 + (2800 - 2700)× 0,25
Q1= 2700+100×0,25
Q1= 2700+25
Q1 = 2725 reais
4º. Para encontrarmos o terceiro quartil salarial, também necessitamos
colocar os salários em ordem crescente, conforme se observa no segundo item.
Dessa maneira, fazemos:

37
Q3=X[(3∙6⁄4)+(1⁄4)] =X4,75=x4+(x5-x4 )×0,75
Q3=3000+(3300-3000)×0,75
Q3=3000+300×0,75
Q3=3000+225
Q3=3225 reais
5º. Para calcularmos o desvio padrão dos salários, faremos uso da fórmula já
explicitada anteriormente que é:

Porém, podemos fazer uso da Tabela 3, que nos auxiliará a calcular o desvio
padrão. Lembre-se que (x-μ) é a diferença entre o salário observado (x) em cada mês
e a média salarial (μ) durante os primeiros seis meses do ano. Logo, essa diferença é
chamada de desvio médio.
Tabela 3: Cálculos para o desvio padrão

Fonte: Elaborado pelos Autores (2014)

Aplicando na fórmula do desvio padrão, obtemos:

6º. Para calcularmos o coeficiente de variação salarial, faremos uso da


fórmula já explicitada anteriormente que é:

38
Dessa forma, o desvio padrão dispersa, aproximadamente, em 9,33% em
relação à média.
Resumindo, temos o Quadro 4:

Quadro 4: Medidas da Estatística Descritiva


Fonte: Elaborado pelos Autores (2014)

2ª situação-problema:
O Gráfico 14 descreve o salário de um vendedor durante os seis primeiros
meses de um ano e sua média salarial.

Gráfico 14: Salários e média salarial de um vendedor


Fonte: Elaborado pelos Autores (2014)

Os salários acima, como você pode ver, são dados de uma população. Assim,
em relação a estes dados, identificaremos a moda salarial e estaremos calculando:

1º. a média salarial;


2º. o salário mediano;
3º. o primeiro salário quartil;
4º. o terceiro salário quartil;
5º. o desvio padrão dos salários; e,
6º. o coeficiente de variação salarial.

39
A moda salarial é o valor do salário que mais se repete. Dessa forma, a moda
salarial é 3300 reais, pois aparece três vezes.

1º. Para calcularmos a média salarial, fazemos:

2º. Para calcularmos o salário mediano, precisamos colocar os dados em


ordem crescente, assim, encontraremos o salário mediano por meio da fórmula
Md=X[(n⁄2)+(1⁄2)] . Lembre-se que a mediana é o segundo quartil. Dessa forma, fazemos:

(2600 - 2700 - 2800 - 3000 - 3300 - 3300 - 3300)


(x1 - x2 - x3 - x4 - x5 - x6 - x7 )
Md=X[(7⁄2)+(1⁄2)] =X4 = 4º salário
Md=3000 reais

3º. Para encontrarmos o primeiro quartil salarial, também necessitamos


colocar os salários em ordem crescente, conforme se observa no segundo item.
Dessa forma, fazemos:

4º. Para encontrarmos o terceiro quartil salarial, também necessitamos


colocar os salários em ordem crescente, conforme se observa no segundo item.
Dessa forma, fazemos:

5º. Para calcularmos o desvio padrão dos salários, faremos uso da fórmula já
explicitada anteriormente que é:

Porém, podemos fazer uso da Tabela 4, que nos auxiliará a calcular o desvio
padrão. Lembre-se que (x-μ) é a diferença entre o salário observado (x) em cada mês
e a média salarial (μ) durante os primeiros seis meses do ano. Logo, essa diferença é
chamada de desvio médio.

40
Tabela 4: Cálculos para o desvio padrão

Fonte: Elaborado pelos Autores (2014)

Aplicando na fórmula do desvio padrão, obtemos:

6º. Para calcularmos o coeficiente de variação salarial, faremos uso da


fórmula já explicitada anteriormente que é:

Portanto, o desvio padrão dispersa, aproximadamente, em 9,43% em relação


à média.
Resumindo, temos o Quadro 5:

Quadro 5: Medidas da Estatística Descritiva


Fonte: Elaborado pelos Autores (2014)

Por meio dessas duas situações-problema, conseguimos ver a aplicação das


medidas da Estatística Descritiva.

41
DISTRIBUIÇÕES DE FREQUÊNCIA
Por que é necessário construir distribuições de frequências para as variáveis?
Conforme estudado nas unidades anteriores, cada variável estatística irá
fornecer uma quantidade de dados que podem ser utilizados para tomar decisões em
situações que envolvem incerteza. Se o conjunto tiver 30 ou mais valores, geralmente
ele é classificado como um grande conjunto de dados. Sendo assim, para transformar
esses dados em informação útil, é necessário reduzir sua quantidade, agrupando-os
em uma tabela denominada distribuição de frequências.
Geralmente os dados coletados são digitados em um software estatístico ou
em uma planilha, obtendo assim um banco de dados, em que cada coluna corresponde
a uma variável observada e cada linha a um elemento da amostra ou da população
pesquisada. Os dados dispostos dessa forma, ou seja, na ordem em que foram
obtidos, são denominados dados brutos. A Figura 2 apresenta um banco de dados e
mostra algumas características observadas em uma amostra de 80 colaboradores de
uma empresa.

Figura 2: Exemplo de um banco de dados


Fonte: Elaborado pelos Autores (2014)

Este conjunto de dados é extenso e não permite ter uma ideia geral sobre a
distribuição dos resultados obtidos. Assim, se é de interesse conhecer a distribuição
dos colaboradores em relação à variável “Grau de instrução”, seria necessário realizar
uma contagem, que levaria certo tempo. Em vista disso, quando se tem um conjunto
como este, os dados devem ser agrupados de forma a obter a informação mais
rapidamente.
O agrupamento pode ser feito de duas formas:
1º. Quando a variável for qualitativa ou quantitativa discreta, o conjunto de
dados geralmente apresenta um número bastante grande de repetições,
sendo indicado o agrupamento por uma distribuição de frequências por
valores.
2º. Quando a variável for quantitativa contínua ou se o conjunto de dados
apresenta poucas repetições de valores, o agrupamento é feito em uma
distribuição de frequências por classes de valores.
Como construir e apresentar uma distribuição de frequências?
Para construir a distribuição de frequências, você deve colocar na primeira
coluna da tabela a variável observada e todas as categorias, valores ou classes obtidas.
Na coluna seguinte, registra-se o número de vezes que cada opção foi encontrada.
42
Este valor é denominado de frequência absoluta simples e denotado por fi.
A Tabela 7 mostra a distribuição de frequências da variável qualitativa ordinal
“Grau de instrução” que tem como possíveis resultados: Ensino Fundamental; Ensino
Médio; e, Ensino Superior.
Tabela 7: Distribuição de frequências da variável “Grau de instrução” da
amostra de 80 colaboradores de uma empresa

Fonte: Elaborado pelos Autores (2014)

OBSERVAÇÃO: O índice “i” da notação da frequência foi utilizado para indicar a


linha que está sendo considerada. Por exemplo: f3 indica que é a frequência absoluta
simples da terceira linha.
Além da frequência absoluta simples, é usual apresentar a distribuição
de frequência relativa simples, que é denotada por fri. Estes valores são obtidos
dividindo cada frequência absoluta simples pelo total de observações:

A frequência relativa pode ser apresentada tanto na forma decimal, quanto


na forma percentual. Considerando os dados da Tabela 7 a frequência relativa simples
da terceira linha é dada por:

Este resultado pode ser interpretado como a proporção de colaboradores


que contam com Ensino Superior em relação ao total de colaboradores pesquisados.
Podemos dizer que 12,5% dos colaboradores contam com Ensino Superior.
Para as variáveis quantitativas e qualitativas ordinais, pode-se também
apresentar uma tabela com as frequências acumuladas.
A frequência absoluta acumulada, denotada por Fi, é obtida pela soma das
frequências absolutas simples, ou seja, o primeiro valor da frequência absoluta
acumulada é igual ao da frequência absoluta simples. O segundo valor da frequência
absoluta acumulada é igual à soma do primeiro e do segundo valor da frequência
absoluta simples, assim por diante, até o último valor: Fi = f1 + f2 + ... + fn.
A frequência relativa acumulada, denotada por Fri, é a soma das frequências
relativas simples, ou seja, o primeiro valor da frequência relativa acumulada é igual
ao da frequência relativa simples. O segundo valor da frequência relativa acumulada
é igual à soma do primeiro e do segundo valor da frequência relativa simples, assim

43
por diante, até o último valor: Fri = fr1+ fr2+ ...+ frn. A frequência relativa acumulada
também pode ser obtida por meio do quociente da frequência absoluta acumulada
pelo total de dados: Fri = Fi/n
Para os dados da Tabela 7:

F2 = f1 + f2 = 31 + 39 = 70
Fr2 = F2 ⁄n = 70 ⁄80 = 0,875 = 87,5%

Para escolher a forma como os dados serão agrupados é preciso observar:


o tipo de variável; os resultados obtidos para esta variável, isto é, se no conjunto de
dados há muitas ou poucas repetições de valores; e quais os tipos de frequências que
podem ser calculadas.
A variável quantitativa discreta “número de dependentes” do banco de dados
mostrado na Figura 2, tem como possíveis resultados os valores discretos: 0, 1, 2, 3,
4 e 5. Cada opção tem um número razoável de repetições, por isso a distribuição de
frequências por valores é indicada para este conjunto de dados. A Tabela 8 apresenta
a distribuição de frequências completa para esta variável.
Tabela 8: Distribuição de frequências por valores da variável “Número de dependentes”
da amostra de 80 colaboradores de uma empresa

Fonte: Elaborado pelos Autores (2014)

Observa-se na Tabela 8 que a primeira coluna apresenta a variável estudada


“Número de dependentes” e os possíveis valores que ela pode assumir. A segunda
coluna apresenta a frequência com que cada opção de resposta foi observada.
Para esta variável, podem ser também determinadas as frequências acumuladas,
conforme mostram a quarta e a quinta coluna. Dessa forma, a tabela de distribuição
de frequências fornece a informação sobre a distribuição dos colaboradores em
relação ao número de dependentes.
No entanto, para o conjunto de dados da variável quantitativa contínua “Tempo
de serviço” mostrada no banco de dados da Figura 2, é indicado o agrupamento em
uma distribuição de frequências por classes, como mostra a Tabela 9.

44
Tabela 9: Distribuição de frequências por classes da variável “Tempo de
serviço” da amostra de 80 colaboradores de uma empresa

Fonte: Elaborado pelos Autores (2014)

Observa-se na Tabela 9 que a primeira coluna apresenta a variável estudada


“Tempo de serviço (anos)” e as classes que foram construídas. A segunda e a terceira
coluna apresentam a frequência simples absoluta e relativa, respectivamente, de
cada classe. Geralmente, utiliza-se a notação |--- para indicar que o valor do limite
superior da classe deve ser contabilizado na classe seguinte.
Para definir o número de classes e a amplitude de cada classe, pode-se
utilizar a seguinte regra:
Calcular a amplitude dos dados: h = xmáx - xmin.
Determinar o número de classes: k = √n. O número de classes a ser utilizado
não necessariamente precisa seguir esta regra. Alguns autores sugerem utilizar entre
5 e 15 classes, outros de 5 a 10 classes com a mesma amplitude.
Calcular a amplitude de cada classe: hi≅h/k.
Após a determinação das classes, conta-se o número de valores pertencentes
a cada uma.
Uma distribuição de frequências também pode ser representada
graficamente. Esta forma de apresentação permite uma análise mais rápida da
distribuição dos dados.
A Figura 3 mostra a distribuição de frequências da Tabela 7 representada por
meio de um gráfico de colunas.

Figura 3: Gráfico de colunas para a variável “Grau de instrução” da


amostra de 80 colaboradores de uma empresa
Fonte: Elaborado pelos Autores (2014)

45
Esta distribuição também poderia ser representada por um gráfico de setores
(Figura 4). Este gráfico é recomendado para representar variáveis qualitativas que
não têm muitas categorias de respostas. Geralmente, é apresentada a frequência
relativa em percentual, mostrando quanto cada categoria representa em relação ao
total.

Figura 4: Gráfico de setores para a variável “Grau de instrução”


da amostra de 80 colaboradores de uma empresa
Fonte: Elaborado pelos Autores (2014)

A forma gráfica de se representar uma distribuição de frequências por


classes é denominada de histograma. O histograma (Figura 5) é um gráfico de
colunas justapostas, no qual a largura de cada coluna representa a amplitude da
classe correspondente e, a altura das colunas representa a densidade de frequência.
A densidade de frequência significa a razão entre a frequência (absoluta simples ou
relativa simples) e a amplitude das classes: .
Muitos autores utilizam a frequência simples absoluta ou relativa para
construir o histograma, em vez da densidade de frequência. O propósito de se optar
pela densidade de frequência é pelo fato de introduzir uma ideia que será abordada
na Unidade 6. A área total do histograma deve ser igual a 1 ou 100% por isso, é
conveniente usar no eixo vertical a densidade de frequência (fri/hi).

Figura 5: Histograma da variável “Tempo de serviço” da amostra de


80 colaboradores de uma empresa
Fonte: Elaborado pelos Autores (2014)
Analisando o histograma da Figura 5, observamos que a área de cada
retângulo será igual à frequência relativa da classe considerada. Por exemplo, a área
do primeiro retângulo é igual a: 0,2×2 = 0,4=40%, que é a frequência relativa da
primeira classe. Assim, o somatório das áreas de todos os retângulos deve ser igual
a 1 ou 100%. A partir do histograma também se podem tirar conclusões a respeito da
forma da distribuição dos dados. O histograma da Figura 5 sugere uma distribuição
assimétrica.

Como calcular medidas de posição e de variabilidade a partir de uma distribuição


de frequências?

A partir da distribuição de frequências da variável também é possível obter


medidas utilizadas para resumir o conjunto de dados. A seguir, apresenta-se o cálculo
da média, da variância, do desvio padrão e dos quartis.

1. A média de uma distribuição de frequências é obtida por meio da expressão:

Para calcular a média você deve primeiramente multiplicar cada valor da


variável pela sua frequência absoluta. Após dividir o somatório destes produtos pelo
somatório das frequências, ou seja, pelo número de elementos da amostra.

2. A variância de uma distribuição de frequências é obtida por meio da


expressão:

3. O desvio padrão é determinado extraindo-se a raiz quadrada da variância:

4. Os quartis, que são medidas de posição, podem ser facilmente obtidos


a partir da distribuição de frequências, por meio da frequência relativa acumulada.
A partir da determinação dos quartis, pode-se traçar um diagrama denominado
Boxplot ou diagrama em caixa. Este gráfico fornece informações sobre a variabilidade
e simetria do conjunto de dados. Para construí-lo, além das medidas de posição
calculadas anteriormente, precisa-se conhecer os valores mínimo e máximo do
conjunto. O procedimento para calcular os quartis e traçar o diagrama Boxplot será
mostrado no tópico estudo de caso desta unidade.

47
ESTUDO DE CASO
1ª situação-problema: Os dados apresentados no Quadro 6 referem-se
à variável “Número de irmãos” de uma amostra de 50 alunos do Ensino Médio de
um colégio. Organize estes dados em uma distribuição de frequências adequada,
representando-a na forma tabular e gráfica.

Quadro 6: Número de irmãos de uma amostra de alunos


Fonte: Elaborado pelos Autores (2014)

Solução: Nesta situação-problema, a variável apresentada é quantitativa


discreta, conforme mostra o Quadro 6, ela pode assumir os seguintes valores: 0, 1,
2, 3, 4, 5 e 6. É conveniente agrupar estes dados em uma distribuição de frequências
por valores. Nesse caso, também podemos calcular todos os tipos de frequências
abordadas nesta Unidade. A Tabela 10 mostra a distribuição de frequência completa
da variável “Número de irmãos”.
Tabela 10: Distribuição de frequência completa da variável “Número de irmãos”

Fonte: Elaborado pelos Autores (2014)

Observando os dados agrupados na Tabela 10, podemos facilmente concluir,


por exemplo, que: 14% (fr3) dos alunos têm 2 irmãos; que a maioria dos alunos, ou
seja, 18 (f2) alunos contam com apenas 1 irmão; que 62% (Fr3) têm até 2 irmãos; e
que 32 (F4) alunos têm até 3 irmãos.
Essa distribuição de frequências pode ser apresentada por meio de um
gráfico de colunas (Figura 6).

48
Figura 6: Gráfico de colunas da variável “Número de irmãos”
Fonte: Elaborado pelos Autores (2014)

Observando o gráfico, podemos rapidamente concluir sobre a distribuição


dos alunos em relação ao número de irmãos.

2ª situação-problema: Determinar a média, a variância e o desvio padrão


da variável quantitativa discreta “Número de dependentes” da distribuição de
frequências da Tabela 8.
Solução: Para calcular a média por meio da tabela de distribuição de
frequências, acrescentamos uma coluna para auxiliar na obtenção dos produtos
(fi . xi) e o seu somatório, conforme mostra a Tabela 11.
Tabela 11: Demonstração do cálculo da média de uma distribuição
de frequências

Fonte: Elaborado pelos Autores (2014)

Utilizando o resultado da terceira coluna da Tabela 11, a média é dada por:

Logo, o número médio de dependentes dos colaboradores da empresa é 1,63


dependentes.

49
Para determinar a variância e o desvio padrão, acrescentamos uma coluna
para auxiliar na obtenção dos produtos da frequência absoluta pelo quadrado da
diferença entre cada valor da variável e a média (fi .(xi-x̅ )2) e o seu somatório,
conforme mostra a Tabela 12.
Tabela 12: Demonstração do cálculo da variância de uma distribuição de frequência

Fonte: Elaborado pelos Autores (2014)

Assim, utilizando o resultado da terceira coluna da Tabela 12, a variância é


dada por:

E o desvio padrão é igual a:

Interpretação dos resultados: o número médio de dependentes dos


colaboradores da empresa é 1,63 dependentes, com uma variabilidade em torno da
média de 1,35 dependentes.

3ª situação-problema: Os dados apresentados no Quadro 7 se referem à


variável “Estatura (m)” de uma amostra de 50 alunos do Ensino Médio de um colégio.
Organize estes dados em uma distribuição de frequências adequada, representando-a
na forma tabular e gráfica.

Quadro 7: Número de irmãos de uma turma de alunos


Fonte: Elaborado pelos Autores (2014)

50
Solução: Nessa situação-problema a variável apresentada é quantitativa
contínua, sendo conveniente agrupar estes dados em uma distribuição de frequências
por classes. Nesse caso, também se pode calcular todos os tipos de frequências
abordadas nesta unidade, mas como estes cálculos já foram demonstrados, iremos
apenas apresentar a frequência simples absoluta e relativa.
Procedimento adotado para a obtenção das classes:

1º. Cálculo da amplitude dos dados:

h = xmáx - xmin= 1,89m-1,55m=0,34m

2º. Cálculo do número de classes:

k ≅ √n ≅√50≅7,071

3º. Cálculo da amplitude de cada classe:

hi ≅ h/k ≅ 0,34⁄7,071 ≅ 0,048m

Assim, serão construídas 7 classes de mesma amplitude igual a 0,05 m.

Construção das classes:


O limite inferior da primeira classe pode ser igual ao valor mínimo 1,55 m.
O limite superior desta classe é obtido somando-se o limite inferior e a amplitude da
classe, isto é, 1,55 + 0,05 = 1,60. O valor obtido para o limite superior da primeira
classe será igual ao limite inferior da segunda classe. Somando-se novamente a
amplitude da classe ao limite inferior, obtém-se o limite superior da segunda classe.
Você deve fazer estes cálculos sucessivamente até obter todas as classes.
A Tabela 13 mostra a distribuição de frequências obtida para a variável
“Estatura (m)” na forma tabular.
Tabela 13: Distribuição de frequência da variável “Estatura”

Fonte: Elaborado pelos Autores (2014)

Graficamente esta distribuição pode ser representada por meio de um

51
histograma. Para construir o histograma, primeiro calculamos as densidades de
frequências ( fri /hi ), conforme mostra a última coluna da Tabela 14.
Tabela 14: Demonstração do cálculo das densidades de frequências

Fonte: Elaborado pelos Autores (2014)

Após podemos traçar o gráfico colocando no eixo horizontal as classes e no


eixo vertical as densidades de frequência, conforme mostra a Figura 7.

Figura 7: Histograma da variável “Estatura (m)”


Fonte: Elaborado pelos Autores (2014)

Observando o histograma, podemos considerar que esta distribuição é


aproximadamente simétrica. Também você pode observar que a soma das áreas de
todos os retângulos é igual a 1 ou 100%.

52
4ª situação-problema: Determinar a média, a variância e o desvio padrão da
variável quantitativa contínua “Estatura (m)” da distribuição de frequências da Tabela 14.
​ Observação: Para dados agrupados em uma distribuição de frequências por
classes ou intervalos, o algoritmo para o cálculo da média, da variância e do desvio
padrão é o mesmo que o utilizado para dados agrupados por ponto ou valores. Porém,
para os valores de xi são tomados os pontos médios de cada um dos intervalos da
distribuição. Ou seja, xi=(li+ls), sendo li é o limite inferior da classe e ls é o limite
superior. 2
Solução: Para calcular a estatura média dos alunos, determina-se o ponto
médio de cada uma das classes, conforme mostra a terceira coluna da Tabela 15.
Após, multiplicam-se as frequências pelos pontos médios e somam os produtos
(quarta coluna da Tabela 15). A média é determinada aplicando-se o algoritmo:

Assim, a estatura média dos alunos pesquisados é de 1,72 m.

Tabela 15: Demonstração do cálculo da média, da variância e do desvio padrão de uma distribuição de
frequências por classes
Fonte: Elaborado pelos Autores (2014)

A variância é determinada utilizando o resultado da quinta coluna da Tabela


15, e aplicando o algoritmo obtém-se:

E o desvio padrão é igual a:

53
Interpretação dos resultados: a estatura média dos alunos pesquisados é
de 1,72 m, com uma variabilidade em torno da média de 0,08 m.
5ª situação-problema: Para a distribuição de frequências da Tabela 16,
calcular os quartis: Q1, Q2 (mediana) e Q3 e construir o diagrama Boxplot.
Solução: Para localizar as posições dos quartis, determinam-se as
frequências relativas acumuladas. A Tabela 16 mostra o procedimento para a
determinação dos quartis.

Tabela 16: Determinação dos quartis de uma distribuição de frequências por


classes
Fonte: Elaborado pelos Autores (2014)

Na última coluna da Tabela 16, que mostra as frequências acumuladas, podem


ser identificadas as classes que contêm os quartis. Seus valores são determinados
por meio da interpolação, pois os dados estão agrupados em classes.

Determinação do primeiro quartil (Q1):


Sabemos que o primeiro quartil é o valor que divide o conjunto de dados
de maneira que 25% dos valores são menores ou iguais a ele, logo a terceira classe
(1,65 |-- 1,70) é a que contém este valor. Portanto:

Determinação do segundo quartil (Q2) ou mediana:


Como você já observou anteriormente, a mediana é o valor que divide o
conjunto de dados de maneira que 50% dos valores são menores ou iguais a ela, logo
a quarta classe (1,70 |-- 1,75) é a que contém este valor. Portanto:

54
Determinação do terceiro quartil (Q3):
O terceiro quartil é o valor que divide o conjunto de dados de maneira que 75%
dos valores são menores ou iguais a ele, logo a quinta classe (1,75 |-- 1,80) é a que
contém este valor. Portanto:

Interpretação dos resultados: pode-se concluir que até 25% dos alunos têm
1,66 m de altura ou menos; até 50% dos alunos têm 1,72 m de altura ou menos; e 75%
dos alunos têm 1,78 m de altura ou menos.
Para traçar o diagrama Boxplot, é necessário conhecer cinco valores: Mínimo,
Q1, Q2 ou Md, Q3 e Máximo. Para esta situação-problema: Mín. = 1,55 m; Q1 =
1,66 m; Md = 1,72 m; Q3 = 1,78 m; Máx. = 1,89 m. A Figura 8 mostra o Boxplot, que
permite visualizar a forma como os dados estão distribuídos.

Figura 8: Boxplot da variável “Estatura (m)” da amostra de 50 estudantes


Fonte: Elaborado pelos Autores (2014)

No diagrama da Figura 8, cada intervalo contém 25% dos dados, ou seja, a


mesma quantidade de dados. Porém, observa-se que os comprimentos das linhas
dos intervalos são diferentes, indicando que: nos intervalos que apresentam
um comprimento maior existe uma maior dispersão dos dados, enquanto que,
nos intervalos que têm linhas de comprimentos menores os dados estão mais
concentrados.
Outra conclusão que pode ser obtida por meio da análise da Figura 8 é em
relação à simetria do conjunto de dados. Observa-se que estes dados têm uma dis-
tribuição simétrica, conforme já foi concluído pela análise do histograma da Figura 7.

55
RESUMINDO
Nesta Unidade, estudamos as seguintes medidas da Estatística Descritiva:

a) média aritmética;
b) média ponderada;
c) mediana;
d) moda;
e) desvio padrão; e,
f) o coeficiente de variação.

Também, estudamos como organizar os dados obtidos para as variáveis


em distribuições de frequências, que podem ser apresentadas na forma tabular ou
gráfica. Foram apresentados os tipos de frequências que podem ser calculadas e
como determinar medidas de posição e variabilidade a partir das distribuições de
frequências das variáveis.

ATIVIDADES PARA REVISÃO


Nesta parte da unidade, vamos propor situações-problema para a aplicação
dos cálculos estatísticos de medidas de tendência central, de posição e de variação,
bem como o coeficiente de variação.

Situação-problema I:

Uma microempresa tem oito funcionários, conforme é descrito no Gráfico 15.

Gráfico 15: Salário, em reais, dos funcionários de uma microempresa


Fonte: Elaborado pelos Autores (2014)

Com base nos dados do Gráfico 15, faça o que se pede:

56
1. Qual é a média salarial desta microempresa? ____________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

2. Encontre a moda salarial. ________________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

3. Qual é o salário mediano? _______________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

4. Encontre o primeiro salário quartil. _______________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

5. Encontre o terceiro salário quartil. _____________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

6. Calcule o desvio padrão, fazendo uso da Tabela 5.


Tabela 5: Cálculos para o desvio padrão

Fonte: Elaborada pelos autores (2014)

57
7. Calcule o coeficiente de variação salarial desta microempresa. _____________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
Situação problema II:

Determinada empresa conta com dois setores de produção, constituída de


cinco funcionários em cada setor, conforme a Tabela 6.
Tabela 6: Cálculos para o desvio padrão

Fonte: Elaborado pelos Autores (2014)

8. Em relação aos dados da Tabela 6, calcule a média de idade, o desvio padrão e o


coeficiente de variação em cada setor. __________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

9. Em relação aos dados do exercício anterior, qual é o setor da empresa que


apresentam as idades de forma mais homogênea? _____________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
10. (ENADE/2003) A Tintas Brasil Ltda. está estudando uma forma de nivelar sua
produção durante o ano. O Departamento de Marketing fez uma pesquisa de mercado
e descobriu que o setor de tintas é altamente sazonal (muitas famílias resolvem
pintar suas residências no 4º trimestre, devido ao período de festas). O gráfico abaixo
mostra as previsões de vendas para o próximo ano.
58
Gráfico 16: Previsões de vendas para o próximo ano
Fonte: Enade (2003)

De quantos milhares de galões deve ser o nível de produção trimestral da


empresa para nivelar sua produção?
a)(____) 100
b)(____) 75
c)(____) 55
d)(____) 50
e)(____) 40
11. No Quadro 8, estão listados os pesos (em kgf) de uma amostra aleatória de 45
adolescentes com idade entre 14 e 17 anos de um determinado colégio. Construa
uma distribuição de frequências adequada para estes dados e represente-a na forma
tabular e gráfica.

Quadro 8: Pesos (em kgf) de uma amostra de adolescentes


Fonte: Elaborado pelos Autores (2014)

12. Considere a Tabela 17 que apresenta a distribuição do número de filhos de uma


amostra de 50 mulheres que trabalham no setor de produção de uma indústria.

Tabela 17: Distribuição de frequência da variável “Número de filhos”


Fonte: Elaborado pelos Autores (2014)

59
a) calcule a frequência simples relativa e as frequências acumuladas (absoluta e
relativa).

b) interprete as frequências: f2; fr3; F3; Fr2. ______________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c) represente graficamente esta distribuição de frequências.

d) calcule e interprete a média e o desvio padrão. _____________________________________________________________


_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

e) calcule o número mediano de filhos e interprete o valor encontrado. __________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

60
13. Considerando os dados da Tabela 9, responda às seguintes questões:
a) qual é o percentual de colaboradores que trabalham há menos de dois anos na
empresa? _____________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
b) qual é o percentual de colaboradores que trabalham há seis anos ou mais na
empresa? _______________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
c) qual é a média e o desvio padrão desta distribuição de frequências? Interprete os
resultados obtidos. ______________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
d) construa um diagrama Boxplot e conclua a respeito da distribuição dos dados.
(Dados: Mín. = 0,5 anos e Máx. = 9,5 anos). ___________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
14. O histograma da Figura 9 mostra a distribuição dos salários de uma amostra de
100 colaboradores de uma empresa.

Figura 9: Histograma da variável “Salário (s.m.)”


Fonte: Elaborado pelos Autores (2014)

61
Com base nos dados do histograma:
a) calcule e interprete o salário médio e o desvio padrão. ___________________________________________________
_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________

b) calcule e interprete o salário mediano. _______________________________________________________________________________


_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
c) determine e interprete o intervalo compreendido entre o primeiro e o terceiro
quartil. ____________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
d) represente os dados por um diagrama Boxplot, considerando o valor mínimo igual
a 1 s. m. e o máximo 9,5 s.m. _____________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________

REFERÊNCIAS DA UNIDADE
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 7. ed. São Paulo: Saraiva,
2011.
CRESPO, Antonio A. Estatística Fácil. São Paulo: Saraiva, 2002.
FREUND, John E. Estatística Aplicada: economia, administração e contabilidade. 11.
ed. Porto Alegre: Bookman, 2006.
KAZMIER, Leonard J. Estatística Aplicada à Administração e Economia. 4. ed. Porto
Alegre: Bookman, 2007.

62
LAPPONI, Juan C. Estatística usando Excel. 5. ed. Rio de Janeiro: Elsevier, 2005.
TRIOLA, Mário. Introdução à Estatística. 11. ed. Rio de Janeiro: LTC, 2013.

PARA SABER MAIS


Caro (a) Acadêmico (a).
Você poderá consultar sites ou vídeos no YouTube que demostrarão como
calcular as medidas de tendência central, de posição e de variação no Excel. O site
do Oficce Microsoft pode ser também uma boa opção. O site do Instituto Brasileiro de
Geografia e Estatística (IBGE) será de grande valia para futuras consultas à pesquisa.
Seguem os links.

IBGE. Instituto Brasileiro de Geografia e Estatística. Disponível em: <http://www.ibge.


gov.br/>. Acesso em: 04 de jul. 2014.
OFFICE. MICROSOFT. Calcular a média de um grupo de números. Disponível em:
<http://office.microsoft.com/pt-br/excel-help/calcular-a-media-de-um-grupo-de-
numeros-HP010070496.aspx. >. Acesso em: 04 de jul. de 2014.
YOUTUBE. Disponível em: <www.youtube.com.br>. Acesso em 04 de jul. de 2014.

63
UNIDADE DE ENSINO 3

PROBABILIDADE
E
DISTRIBUIÇÕES DE
PROBABILIDADE
CONTEÚDOS DA UNIDADE
Nesta unidade, serão abordados os conceitos iniciais da teoria
da probabilidade e as principais Distribuições de Probabilidade, com foco
principal na Distribuição de Probabilidade Normal.
1. Espaço amostral e eventos;
2. Probabilidade de eventos;
3. Probabilidade condicional;
4. Independência de eventos;
5. Principais distribuições de probabilidade para variáveis discretas e
contínuas;
6. Curva Normal; e,
7. Curva Normal padronizada.

OBJETIVOS DA UNIDADE
Ponderar sobre os fenômenos aleatórios que ocorrem no cotidiano e
apresentar os fundamentos da teoria da probabilidade, por meio da definição
dos conceitos básicos utilizados para construir os modelos probabilísticos,
que descrevem tais fenômenos.
Refletir e analisar a conceitualização de Distribuições de
Probabilidade. Entender o que é uma Distribuição de Probabilidade, calcular
a probabilidade a partir de uma distribuição e estabelecer probabilidades a
partir da curva normal padronizada.

PARA QUE ESTUDAR A TEORIA DA PROBABILIDADE?


No cotidiano ocorrem inúmeros fenômenos para os quais não podemos
aplicar equações matemáticas e obter resultados exatos. Por exemplo, não podemos
calcular a temperatura máxima que vai ocorrer em um dia de verão, em virtude de não
termos o controle, ou por não conhecermos todas as variáveis que influenciam nesse
fato. Tais acontecimentos, que são regidos pelo acaso e denominados de fenômenos
aleatórios, apresentam resultados imprevisíveis.
Dessa forma, um fenômeno climático é um fenômeno aleatório, assim como
também, um jogo de loteria. Porém este último, por ter sido desenvolvido pelo homem,
recebe a denominação de experimento aleatório.
Devido à frequência com que ocorrem, os fenômenos (experimentos)
aleatórios merecem ser estudados, para que seja possível fazer previsões sobre os
possíveis resultados. A teoria da probabilidade fornece ferramentas para estudar os
fenômenos não determinísticos, por meio da construção modelos probabilísticos. A
resposta obtida aplicando um modelo probabilístico será sempre uma probabilidade
em vez de um valor preciso que seria fornecido por uma equação matemática.
O conhecimento da teoria da probabilidade também é fundamental para o
estudo da Estatística Indutiva, também dita Inferência Estatística.
QUAIS SÃO OS CONCEITOS FUNDAMENTAIS DA TEORIA DA
PROBABILIDADE?
Para qualquer fenômeno ou experimento aleatório, podemos, de alguma
maneira, registrar todas as possibilidades, ou seja, todos os possíveis resultados
que podem ocorrer. Este conjunto que engloba todas as possíveis ocorrências de um
fenômeno ou experimento aleatório é denominado de espaço amostral. O Quadro 9
apresenta alguns exemplos de fenômenos aleatórios e seus respectivos espaços
amostrais.

Quadro 9: Exemplos de fenômenos aleatórios e espaços amostrais


Fonte: Elaborado pelos Autores (2014)

Os exemplos apresentados mostram que o espaço amostral pode ser um


conjunto finito ou infinito. Por exemplo, o espaço amostral S = {C, K} é finito e conta
com dois elementos. A notação utilizada para representar o número de elementos
desse conjunto é a seguinte: n(S) = 2.
O segundo conceito que será desenvolvido é a ideia de evento. Para um dado
espaço amostral, podemos definir subconjuntos que na teoria da probabilidade são
denominados de eventos. Os elementos do espaço amostral, ou grupos de elementos,
são eventos do espaço amostral. O próprio espaço amostral e o subconjunto vazio
também são eventos.
Por exemplo, no experimento aleatório de lançar um dado e observar a face
voltada para cima, os possíveis resultados que podem ocorrer, ou seja, o espaço
amostral é igual a: S = {1, 2, 3, 4, 5, 6}. O Quadro 10 apresenta alguns eventos que
poderiam ser listados:

Quadro 10: Exemplos de eventos


Fonte: Elaborado pelos Autores (2014)

67
Os eventos “C” e “D” recebem as denominações de “evento impossível” e
“evento certo”, respectivamente. O evento “C” é representado por conjunto vazio, pois
não existe a face maior que seis em um dado, logo este evento não tem a possibilidade
de ocorrer. O evento “D” é o próprio espaço amostral sendo, portanto, denominado
de evento certo pelo fato de envolver todos os possíveis resultados. Dessa forma, ao
lançar um dado obrigatoriamente uma das faces vai ocorrer.
O terceiro conceito que será abordado é a definição de probabilidade de
um evento. A probabilidade é uma medida, ou seja, é um número que é atribuído
ao conjunto (evento) e que informa sobre a sua possibilidade de ocorrência. A
probabilidade é sempre um número que varia entre 0 e 1, podendo ser expressa em
forma decimal ou percentual.
Como calcular a probabilidade de um evento?
Três definições de probabilidade serão apresentadas a seguir.

1º. Definição clássica


Segundo a definição clássica, para atribuir um número, ou seja, uma
probabilidade a um evento E, define-se uma fração sendo o numerador o “número de
casos favoráveis” e o denominador o “número de casos possíveis”:

Essa definição é bastante utilizada, mas há algumas restrições: o espaço


amostral deve ser finito e todos os eventos devem ser equiprováveis, isto é, todos os
eventos devem ter a mesma probabilidade de ocorrer. Para o experimento aleatório
de lançar um dado equilibrado e observar a face voltada para cima, a probabilidade de
obter face 4, por exemplo, pode ser calculada aplicando-se o conceito clássico. Nesse
caso:

Pois o espaço amostral dispõe de seis elementos e o evento E = {4} dispõe


de um elemento.
2º. Definição frequencial
Segundo a definição frequencial, a probabilidade é definida com base na
frequência relativa do evento E que representa a razão entre o número de vezes que
o evento ocorre (n(E)) e o número de vezes que a experiência é repetida (n):

Quando o experimento é repetido um número razoável de vezes, pode-se


avaliar a probabilidade do evento “E” por meio de sua frequência relativa. Assim,
por exemplo, vamos considerar que 120 pessoas de um bairro foram selecionadas ao
68
acaso para verificar o hábito da prática de atividades físicas. Constatou-se que das 120
pessoas, 30 não praticavam nenhum tipo de atividade física. Utilizando o conceito
frequencial de probabilidade, diríamos que ao selecionar uma pessoa ao acaso deste
bairro, a probabilidade desta pessoa não praticar atividade física é de:

3º. Definição axiomática

Finalmente, a definição axiomática reúne as ideias já apresentadas


anteriormente, procurando superar as limitações impostadas pelas definição clássica
e frequencial. Assim, a probabilidade foi definida por meio de regras básicas, a partir
das ideias de frequência relativa. As propriedades da frequência relativa serviram de
base para o estabelecimento de três axiomas, que são conceitos fundamentais ou
propriedades da probabilidade:

1º) 0 ≤ P(S) ≤ 1): a probabilidade de um evento qualquer “E” é sempre o


número entre 0 e 1.

2º) P(S)=1: a probabilidade de ocorrência do espaço amostral é 1, pois é o


conjunto de todas as possíveis ocorrências, logo uma deve ocorrer. Por
exemplo, no lançamento de um dado a probabilidade de obter uma das seis
faces é 1 ou 100%.

3º) P(A∪B)=P(A)+P(B), se 𝐴∩𝐵=∅: a probabilidade da união de dois


eventos é a soma das probabilidades se eles não apresentarem nenhum
elemento em comum, ou seja, se eles forem mutuamente excludentes
(ou mutuamente exclusivos). A Figura 10 ilustra dois eventos A e B
mutuamente excludentes, isto é, eventos que não têm nenhum elemento
em comum (𝐴∩𝐵=∅).

Figura 10: Ilustração de eventos mutuamente excludentes


Fonte: Elaborada pelos Autores (2014)

Considerando o experimento aleatório de retirar ao acaso uma carta de um


baralho completo de 52 cartas. Sejam os eventos A = {a carta retirada é um Ás} e B
= {a carta retirada é um Rei}. A probabilidade de retirar um Ás ou um Rei é dada por:

69
Logo, a probabilidade de retirar um Ás ou um Rei é 0,1538 ou 15,38%, pois os
eventos A e B são eventos mutuamente excludentes.
A partir desses três axiomas podem ser estabelecidas outras propriedades,
ou teoremas:

1ª. P(∅)= 0: a probabilidade de um conjunto vazio é igual a zero, isto é, o


evento vazio não ocorre.

2ª. ou , se A e são eventos com-


plementares (ver Figura 11): a probabilidade do evento complementar de
A, ou seja, a probabilidade do evento A não ocorrer é igual a um menos a
probabilidade do evento A. Considerando o lançamento de um dado a pro-
babilidade de obter face par é 0,50 (50%) e a probabilidade de sair face
ímpar são os restantes 0,50 (50%) de modo que a soma seja igual a um
(100%).

Figura 11: Ilustração de eventos complementares


Fonte: Elaborada pelos Autores (2014)

3ª. 𝑃(𝐴−𝐵)=𝑃(𝐴)−P(A∩𝐵), se A e B são dois eventos quaisquer de S:


a probabilidade da diferença entre os eventos A e B (ver Figura 12) é a
probabilidade de somente o evento A ocorrer, isto é, do evento B não
ocorrer, sendo igual à diferença entre a probabilidade do evento A e a
probabilidade da intersecção entre os eventos A e B.

Figura 12: Ilustração da diferença entre dois eventos


Fonte: Elaborada pelos Autores (2014)
70
4ª. 𝑃(𝐴∪𝐵) = 𝑃(𝐴) + 𝑃(𝐵) − P(A∩𝐵), se A e B são dois eventos
quaisquer de S: a probabilidade da união de dois eventos é igual a soma
da probabilidade do evento A mais a probabilidade do evento B. Porém, se
eles não forem mutuamente excludentes, isto é, se eles apresentarem
elementos em comum (A∩𝐵 ≠ 0), deve-se subtrair a probabilidade da
interseção entre os dois eventos. A Figura 13 mostra dois eventos que não
são mutuamente excludentes.

Figura 13: Ilustração da intersecção entre dois eventos


Fonte: Elaborada pelos Autores (2014).

Considerando o experimento aleatório de retirar ao acaso uma carta de um


baralho completo de 52 cartas. Sejam os eventos A = {a carta retirada é um Ás} e B =
{a carta retirada é uma carta no naipe Espadas}. A probabilidade de retirar um Ás ou
uma carta no naipe Espadas é dada por:

Logo, a probabilidade de retirar um Ás ou uma carta no naipe Espadas é


0,3077 ou 30,77%. Como os eventos A e B contam com um elemento em comum (Ás
no naipe de Espadas), a probabilidade de ocorrência desse evento deve ser subtraída
para que não seja computada duas vezes.
A probabilidade da união entre dois ou mais eventos é também denominada
probabilidade da soma. Esta propriedade é utilizada quando se deseja calcular a
probabilidade de ocorrência de pelo menos um dos eventos, isto é, do evento A ocorrer
ou o evento B ocorrer.
As definições de probabilidade apresentadas permitem calcular a
probabilidade de eventos em muitas situações. Porém, existem alguns casos em que
de fato teremos alguma dificuldade para calcular a probabilidade. Em virtude disso,
precisamos ainda definir o conceito de probabilidade condicionada.

O QUE VEM A SER PROBABILIDADE CONDICIONAL?


Sejam A e B dois eventos de um espaço amostral S, se é informada que o
evento A ocorreu, pode-se definir a probabilidade de B condicionada ao evento A.
A notação utilizada para representar a probabilidade condicionada é a seguinte:
71
𝑃(B|A) e lê-se “probabilidade de B dado A”, ou “probabilidade de B condicionada a A”,
e é calculada por:

A definição mostra que, quando avaliamos a probabilidade do evento B, dado


que o evento A ocorreu, o espaço amostral passa a ser o evento A. Assim, pode-se
dizer que fica definido um novo espaço amostral, reduzido ao evento A.
Consideremos o experimento aleatório de lançar um dado equilibrado e
observar a face voltada para cima. O espaço amostral relacionado ao experimento é:
S = {1, 2, 3, 4, 5, 6}.
Sejam os eventos:

A = {ocorrer o número 5} → A = {5}; e


B = {ocorrer um número ímpar} → B = {1, 3, 5}.
A probabilidade de ocorrência desses eventos pode ser calculada:

𝑃(𝐴) = 1/6 e 𝑃(B) = 3/6 = 1/2

Supondo que, realizado o experimento, seja dada a informação que ocorreu


face ímpar. Qual é a probabilidade do evento A, dado que ocorreu face ímpar?
Agora, a probabilidade da ocorrência de A muda, pois somente poderá ter
ocorrido o evento A se o resultado do experimento for a face 5. O espaço amostral passa
a ser B e a probabilidade de ter ocorrido 5 é 1/3 , que é a probabilidade condicional de A
dado B. Usando a definição de probabilidade condicional tem-se:

A partir da definição de probabilidade condicional, obtém-se uma importante


igualdade, denominada de Teorema do Produto:

P(A∩𝐵) = P(A).P(B|A)

Esta igualdade pode ser utilizada quando se deseja determinar a probabilidade


de dois eventos ocorrerem simultaneamente.

QUANDO DOIS EVENTOS SÃO INDEPENDENTES?


A probabilidade condicional é necessária para definir um conceito importante
e bastante útil que é conceito de independência entre eventos, que será abordado por
meio de uma situação simples apresentada a seguir.
Seja o experimento de lançar duas vezes uma moeda, com faces indicadas
por cara (C) e coroa (K), e observar a face voltada para cima. O espaço amostral
relacionado ao experimento é: S = {CC, CK, KC, KK}.
Sejam os eventos:

72
A = {sair face cara no 1º lançamento} → A = {CC, CK}; e
B = {sair face coroa no 2º lançamento} → B = {CK, KK}.
A∩B = {CK}

A probabilidade de ocorrência desses eventos é igual a:

P(A) = 2/4 = 1/2


P(𝐵) = 2/4 = 1/2
P(A∩𝐵) = 1/4

Realizado o primeiro lançamento, ocorreu a face cara. Pede-se: Qual é a


probabilidade do evento B, dado que A ocorreu? Sabe-se que o resultado do primeiro
lançamento não tem nenhuma influência sobre o resultado do segundo lançamento.
Ou seja, P(𝐵|A) = P(B)=1/2. A Figura 14 ilustra a situação apresentada.

Figura 14: Ilustração da situação apresentada


Fonte: Elaborada pelos Autores (2014)

Dessa forma, usando a probabilidade condicional, pode-se definir que um


evento B é independente de um evento A quando P(𝐵|A) = P(B), ou seja, quando
satisfaz a igualdade apresentada a seguir:

P(A∩𝐵) = P(A).P(B)

Assim, conclui-se que os eventos A e B são eventos independentes, pois


satisfaz a igualdade:

ESTUDO DE CASO
Neste tópico, estaremos analisando quatro situações-problema que envolvem
a aplicação dos conceitos teóricos estudados nesta Unidade. Os dados utilizados nas
situações problema foram retirados de um artigo da Revista Brasileira de Ginecologia
e Obstetrícia, referente a um estudo realizado por Carvalho et al. (2004). Nesse
estudo, foram aplicados dois testes, em uma amostra de 298 gestantes, para detectar
73
a infecção por HIV: primeiro o teste rápido e após a confirmação pelos testes ELISA e
Western blot (considerados padrão ouro). A Tabela 18 mostra os resultados obtidos.
Tabela 18: Teste rápido para detecção do HIV em parturientes e confirmação com teste ELISA e Western
blot

Fonte: Carvalho et al. (2004)

1ª situação-problema: Com base nos dados da Tabela 18, considere que um


dos 298 resultados de testes rápidos seja selecionado ao acaso, qual é a probabilidade
de que seja um resultado positivo?

Solução: A probabilidade de selecionar um resultado positivo dentre os 298


resultados do teste rápido é determinada da seguinte forma:

- identifica-se o número de casos possíveis que corresponde ao número de


elementos do espaço amostral, ou seja, os 298 exames: 𝑛(𝑆)=298.
- identifica-se o número de casos favoráveis que corresponde ao número
de elementos do evento “selecionar um resultado positivo”, ou seja, os 16
resultados positivos: 𝑛(𝐸)=16.
- determina-se a probabilidade do evento 𝐸:

Logo, a probabilidade do teste selecionado ao acaso apresentar resultado


positivo é 0,0537 ou 5,37%.
Nessa situação-problema, foi utilizada a definição clássica de probabilidade,
pois cada resultado de teste rápido tem a mesma probabilidade de ser selecionado.

2ª situação-problema: Com base nos dados da Tabela 18, considere que duas
das 298 mulheres sejam selecionadas ao acaso e sem reposição. Pede-se:

a) Qual é a probabilidade de as duas mulheres apresentarem resultados


positivos no teste rápido?
b) Qual é a probabilidade de a primeira mulher selecionada apresentar
resultado positivo no teste rápido e a segunda mulher um resultado
negativo?

74
Solução: Vamos inicialmente definir os eventos:

1𝑀+ = {1ª mulher selecionada tem resultado positivo}


1𝑀 − = {1ª mulher selecionada tem resultado negativo}
2𝑀+ = {2ª mulher selecionada tem resultado positivo}
2𝑀 − = {2ª mulher selecionada tem resultado negativo}

Agora vamos determinar as probabilidades referentes à 1ª e à 2ª seleção:


Na 1ª seleção, dentre as 298 mulheres, temos 16 com resultados positivos e
282 mulheres com resultados negativos para o teste rápido, assim:

𝑃(1𝑀+) = 16/298
𝑃(1𝑀−) = 282/298

Para a 2ª seleção, como a primeira mulher selecionada não participa mais


do sorteio, restam 297 mulheres, portanto, a probabilidade se altera em relação à
primeira seleção:

𝑃(2𝑀+ |1𝑀+) = 15/297


𝑃(2𝑀− |1𝑀+) = 282/297
𝑃(2𝑀+ |1𝑀−) = 16/298
𝑃(2𝑀− |1𝑀−) = 282/298

Finalmente, podemos calcular:


a) a probabilidade de as duas mulheres selecionadas apresentarem
resultados positivos no teste rápido, isto é, da 1ª mulher apresentar resultado positivo
𝐸 da 2ª também apresentar resultado positivo:

b) a probabilidade de a 1ª mulher selecionada apresentar resultado positivo


no teste rápido 𝐸 a 2ª mulher um resultado negativo:

Nessa situação-problema, foi apresentado um exemplo de cálculo de


probabilidade quando dois de eventos são dependentes. Ilustra o conceito de
probabilidade condicional, pois o segundo evento deve levar em consideração a
ocorrência do primeiro pelo fato de a seleção ser sem reposição.

3ª situação-problema: Vamos considerar a 2ª situação-problema, porém a


seleção é realizada com reposição da primeira mulher selecionada. Pede-se:

a) Qual é a probabilidade de as duas mulheres apresentarem resultados


positivos no teste rápido?

75
b) Qual é a probabilidade de a primeira mulher selecionada apresentar
resultado positivo no teste rápido e a segunda mulher um resultado
negativo?

Solução: Podemos considerar os mesmos eventos definidos na 2ª situação-


problema e determinar as probabilidades referentes à 1ª e à 2ª seleção:
Na 1ª seleção temos:

𝑃(1𝑀+) = 16/298 e 𝑃(1𝑀−) = 282/298

Para a 2ª seleção, como a seleção é realizada com reposição, todas as


mulheres participam do 2º sorteio, portanto, as probabilidades não se alteram em
relação à primeira seleção:

𝑃(2𝑀+) = 16/298 e 𝑃(2𝑀−) = 282/298

Assim, podemos calcular:

a) a probabilidade de as duas mulheres selecionadas apresentarem


resultados positivos no teste rápido, isto é, da 1ª mulher apresentar
resultado positivo E da 2ª também apresentar resultado positivo:

b) a probabilidade de a 1ª mulher selecionada apresentar resultado positivo


no teste rápido E a 2ª mulher um resultado negativo:

Nessa situação-problema, foi apresentado um exemplo de cálculo de


probabilidade quando dois de eventos são independentes. A probabilidade de
ocorrência do segundo evento não depende da ocorrência do primeiro pelo fato de a
seleção ser com reposição.

4ª situação-problema: Considerando os dados da Tabela 18, se uma mulher


dentre as 298 mulheres for escolhida ao acaso, determine:

a) a probabilidade de que ela tenha a infecção por HIV confirmada pelos


testes considerados padrão ouro, dado que o resultado do teste rápido foi
positivo?
b) a probabilidade de que ela tenha resultado positivo no teste rápido, dado
que a infecção por HIV foi confirmada pelos testes considerados padrão
ouro?

Solução A: O que desejamos calcular nesta situação é a probabilidade de


selecionar uma mulher com a infecção por HIV confirmada, dado que o resultado do

76
teste rápido foi positivo, isto é, P (Confirmação HIV positivo | resultado teste rápido
positivo).
Na Tabela 18, observamos que 16 mulheres obtiveram resultado positivo no
teste rápido. Dentre estas, 12 mulheres tiveram a infecção por HIV confirmada. Assim,
concluímos que:

Designando por A o evento “Confirmação HIV positivo” e por B “resultado teste


rápido positivo”, podemos também obter o resultado anterior aplicando a definição
formal de probabilidade condicional:

O resultado obtido pode ser interpretado da seguinte maneira: uma mulher


com um resultado positivo no teste rápido tem 0,75 ou 75% de probabilidade de ter a
infecção confirmada pelos testes considerados padrão ouro.

Solução B: O que queremos calcular nesta situação é a probabilidade de


selecionar uma mulher com o resultado do teste rápido positivo dado que a infecção
por HIV foi confirmada, isto é, P (resultado teste rápido positivo | Confirmação HIV
positivo).
Na Tabela 18, observamos que 12 mulheres obtiveram a infecção por
HIV confirmada e todas elas obtiveram resultado positivo no teste rápido. Assim,
concluímos que:

Podemos também obter o resultado anterior, aplicando a definição formal de


probabilidade condicional:

O resultado expressa que uma mulher com o resultado confirmado como


HIV positivo tem 100% de probabilidade de ter tido um resultado positivo no teste
rápido. Isso indica que todas as mulheres com o resultado confirmado foram também
identificadas pelo teste rápido como positivo.
Essa 4ª situação-problema ilustra a aplicação do conceito de probabilidade
condicional, além de mostrar uma aplicação importante da teoria da probabilidade
na análise da confiabilidade de resultados de testes aplicados na área da saúde
para diagnosticar doenças. Também foi possível mostrar a diferença entre as
probabilidades dos eventos 𝑃(A|𝐵) e 𝑃(𝐵|A).

77
QUAIS SÃO OS TIPOS DE DISTRIBUIÇÃO DE PROBABILIDADE?
Uma distribuição de probabilidade é uma distribuição de frequência para
os resultados de um espaço amostral (isto é, para os resultados de uma variável
aleatória). Há dois tipos de distribuição de probabilidade:
a) Distribuições Contínuas: Quando a variável que está sendo medida é
expressa em uma escala contínua, como no caso de uma característica
dimensional.
As distribuições contínuas mais importantes são:
1. Distribuição Exponencial;
2. Distribuição de Weibull;
3. Distribuição Normal.
b) Distribuições Discretas: Quando a variável que está sendo medida só pode
assumir certos valores, como, por exemplo os valores inteiros 0,1,2, etc.
As distribuições discretas mais importantes são:
1. Distribuição Binomial
2. Distribuição de Poisson
Quando uma variável aleatória discreta apresenta um grande número de
resultados possíveis, ou quando a variável aleatória em questão é contínua, não
se podem usar distribuições discretas como a de Poisson ou a binomial para obter
probabilidades. Uma variável discreta com muitos resultados possíveis exigiria
uma tabela por demais extensa ou um esforço muito grande na utilização de uma
fórmula para obtenção de probabilidades. Como uma variável contínua inclui, em seus
resultados, valores tanto inteiros como não inteiros, não pode ser adequadamente
descrita por uma distribuição discreta.
O ponteiro da Figura 15 ilustra o conceito de variável contínua. Uma vez
que tenha sido posto a girar, o ponteiro pode parar em qualquer posição ao longo
do círculo. Não se pode esperar que venha a parar exatamente num dos valores do
círculo. Mesmo levando-se em conta as limitações na mensuração feita ao longo
do círculo, ainda assim há um número extremamente grande de pontos de paradas
possíveis.

Figura 15: Ilustração da situação apresentada


Fonte: Elaborada pelos Autores (2014)
Dessa forma, o objeto de nosso estudo nesta Unidade será a distribuição
normal, pois é a mais importante das distribuições estatísticas, as razões de sua
importância serão descritas a seguir.

PARA QUE SERVE A DISTRIBUIÇÃO NORMAL?


A distribuição normal ocupa posição de destaque tanto na estatística teórica
como na aplicada, por várias razões: uma delas é que, com bastante frequência, elas
representam, com boa aproximação, as distribuições de frequência observadas de
muitos fenômenos naturais e físicos. Outra razão é que as normais servem como
aproximação de probabilidades binomiais, quando n (número de amostras ou
número de repetições de um experimento) é muito grande. Todavia, o motivo mais
importante do destaque da distribuição normal é que as distribuições tanto de médias
como das proporções em grandes amostras tendem a ser distribuídas normalmente,
o que tem relevante implicação na amostragem.
As curvas normais apresentam algumas características bastante especiais
em termos de sua forma, de como se especificam e de como são utilizadas para a
obtenção de probabilidades.
Observando o gráfico de uma distribuição normal se assemelha muito a um
sino. É suave, unimodal, e simétrico em relação à sua média (curva simétrica). Menos
óbvio é o fato de que a curva se prolonga indefinidamente em qualquer das direções,
a partir da média, conforme mostra a Figura 16.

Figura 16: Curva Normal Típica


Fonte: Elaborada pelos Autores (2014)

Outra característica importante é que uma distribuição normal fica


completamente especificada por dois parâmetros: sua média e seu desvio padrão.
Em outras palavras, existe uma única distribuição normal para cada combinação de
uma média e um desvio padrão. Diferentes combinações de média e desvio padrão
originam curvas normais distintas. Como as médias e desvios padrões são medidos
em escala contínua, segue-se que o número de distribuições normais é ilimitado,
conforme mostra a Figura 17.

Figura 17: Número de combinações de média e desvio padrão é ilimitado


Fonte: Elaborada pelos Autores (2014)
79
A área total sob qualquer curva normal representa 100% da probabilidade
associada à variável. Além disso, como a curva é simétrica em relação à sua média,
a probabilidade de observar um valor inferior à média é 50%, como o é também a
probabilidade de observar um valor acima da média. A probabilidade de predizer
exatamente um valor é “0”, pois a escala de mensuração é contínua. Logo, a
probabilidade de observar um valor exatamente igual à média é zero.
A probabilidade de uma variável aleatória tomar um valor entre dois pontos
quaisquer é igual à área sob a curva normal entre aqueles pontos.

Figura 18: P(a < x < b) = área sob a curva entre a e b


Fonte: Elaborada pelos Autores (2014)

Uma consequência importante do fato de uma curva normal poder ser


completamente especificada por sua média e seu desvio padrão é que a área sob a
curva entre um ponto qualquer e a média é função somente do número de desvios
padrões que aquele ponto está distante da média. Esta é a chave que nos permite
calcular probabilidades para a curva normal.
As probabilidades, então, são calculadas a partir das curvas de frequência?
Como, em geral, os dados coletados pertencem a uma amostra extraída de
uma população, podemos imaginar as amostras tornando-se cada vez mais amplas
e a amplitude das classes ficando cada vez menor, o que nos permite concluir que a
linha poligonal (contorno do polígono de frequência) tende a se transformar numa
curva - a curva de frequência - mostrando a verdadeira natureza da distribuição
da população. Considere a amostra da estatura de 80 pessoas extraídas de uma
população, conforme a Tabela 20 de frequência descrita abaixo:
Tabela 20: Estatura de 80 pessoas

Fonte: Elaborada pelos Autores (2014)

80
O polígono de frequência estudado na Unidade 6 (Figura 19) pode ser
entendido como uma curva normal.

Figura 19: Exemplo de curva de frequência


Fonte: Elaborada pelos Autores (2014)

Podemos dizer, então, que, enquanto o polígono de frequência nos dá a


imagem real do fenômeno estudado, a curva de frequência nos “dá” a imagem
tendencial.

E COMO SE CARACTERIZAM AS CURVAS DE FREQUÊNCIA?


Caracterizam-se pelo fato de apresentarem um valor máximo em torno da
região central. São muitos os fenômenos que oferecem distribuições em forma de
sino: a estatura de adultos, o peso de adultos, a inteligência medida em testes.
As curvas em forma de sino podem ser simétricas ou assimétricas.

SIMÉTRICA: Esta curva caracteriza-se por apresentar o valor máximo no ponto


central e os pontos equidistantes desse ponto terem a mesma frequência.

ASSIMÉTRICA: Na prática, não encontramos distribuições perfeitamente


simétricas. Assim, as curvas correspondentes a tais distribuições
apresentam a cauda de um lado mais alongada que do outro. Se a cauda
mais alongada fica à direita, a curva é chamada assimétrica positiva. Se a
cauda se alonga à esquerda, a curva é assimétrica negativa.

81
Figura 20: Exemplo do formato de curvas simétricas e assimétricas
Fonte: Elaborada pelos Autores (2014)

O desvio padrão estudado nas Unidades anteriores é a medida de dispersão


mais utilizada em casos de distribuições simétricas. Graficamente, como visto, as
distribuições desse tipo se aproximam de uma curva conhecida como curva normal
ou curva de Gauss.
O desvio padrão tomado com os sinais + e - (+s e -s ) define em torno da
média aritmética uma amplitude (2s) chamada de zona de normalidade.

No intervalo ocorre 68,26% dos casos;


No intervalo ocorre 95,44% dos casos; e,
No intervalo ocorre 99,73 % dos casos.
Mas, você não concorda que observando a Figura 20 existem várias curvas com o
mesmo formato? Então como calcular essa Probabilidade?

A distribuição normal constitui, na realidade, uma “família” infinitamente


grande de distribuições – uma para cada combinação possível de média e desvio
padrão. Consequentemente, seria inútil procurar elaborar tabelas que atendessem
a todas as necessidades. Além disso, a expressão da distribuição normal não é
conveniente para tal objetivo, em vista da sua complexidade:

Sendo o perfil de uma curva normal determinado pelo desvio padrão, pode-
se reduzir qualquer curva normal a uma curva normal padrão. A variável “x” da
distribuição normal é transformada numa variável “z”, que constitui uma distribuição
normal padrão ou reduzida.

82
Podemos resumir este processo, convertendo a diferença entre a média
e algum outro valor da distribuição para uma diferença relativa, exprimindo-a em
termos do número de desvios padrões a contar da média. Assim, a distribuição
normal padrão ou reduzida fica algebricamente escrita como:

Em que:
= número de desvios padrões a contar da média
= valor arbitrário
= média da distribuição
= desvio padrão

Para entendermos essa transformação consideremos, por exemplo, uma


distribuição normal com média igual a 100 e desvio padrão igual a 10, conforme
mostra a Figura 21. Podemos converter essa escala efetiva numa escala relativa,
substituindo os valores efetivos por “números de desvios padrões a contar da média
da distribuição”.

Figura 21: Comparação entre escala real e padronizada


Fonte: Elaborada pelos Autores (2014)

Dessa forma, o valor 90 está a -10 abaixo da média; ou desvio padrão;


120 está + 20 acima da média, ou desvios padrões, etc., assim também 95 está
-0,5 desvio padrão abaixo da média e 107 está a +0,7 desvio padrão acima da média.
Assim, uma vez que se pode transformar qualquer média e desvio padrão
em: a média igual a zero (0) e o desvio padrão igual a um (1) constantes, as áreas
sob a curva normal padrão podem ser calculadas e tabeladas, pois dependem
exclusivamente do valor da variável Z.
Nessa tabela (Anexo final da Unidade), a primeira coluna e a primeira linha
informam o valor de z, sendo que a coluna dos valores de z, com primeiro dígito
decimal e a linha, com o segundo dígito decimal. Nas intersecções da coluna com
linha, encontramos a área sob a curva, que é a probabilidade da variável situar-se
entre zero (0) e o valor de z procurado (Figura 22).
83
Figura 22: Área sob uma curva normal em escala padronizada
Fonte: Elaborada pelos Autores (2014)

OBSERVAÇÃO
1. A distribuição normal é simétrica em torno de sua média, a metade
esquerda da área sob a curva é a imagem reflexa da metade direita. Dessa
forma, por exemplo, a área sob a curva normal padronizada entre 0 e z= 1
é igual à área sob a curva padronizada entre z= -1 e 0.
2. A tabela fornecida apresenta a área (probabilidade) do centro até o ponto
em que estamos calculando. Nas referências indicadas no final da Unidade
poderão ser encontradas outras tabelas que fornecem, por exemplo, a área
à direita e à esquerda do ponto (z).

ESTUDO DE CASO
Neste tópico, estaremos analisando alguns casos de utilização da Curva
Normal para reforçar o entendimento do conteúdo.
1ª situação-problema: (Exemplo)
A partir do exemplo descrito no texto:
Qual é a probabilidade de se escolher ou de se obter um valor entre 100 e 120
unidades?

Para calcular a probabilidade de Z no intervalo de 0 a 2, é necessário consultar


a tabela de distribuição normal reduzida, fornecida anexa. Portanto, a probabilidade de
84
se escolher um valor qualquer entre 100 e 120 unidades é de:
𝑃(100<𝑋<120)=𝑃(0<𝑍<2)=0,4772=47,72%

2ª situação-problema:
Seja X a variável aleatória que representa os diâmetros dos parafusos
produzidos por certa máquina. Vamos supor que essa variável tenha distribuição
normal com média = 2 cm e desvio padrão = 0,04 cm. Qual é a probabilidade de
um parafuso fabricado por essa máquina apresentar um diâmetro entre 2 e 2,05
centímetros?
Solução:
Em termos gráficos:

𝑃(2<𝑋<2,05)=𝑃(0<𝑍<𝑧)= ?

Calculando o número de desvios padrão:

Portanto, a probabilidade de um parafuso apresentar diâmetro entre 2 e 2,05


centímetros é:

𝑃(2<𝑋<2,05)=𝑃(0<𝑍<1,25)=0,3944=39,44%

3ª situação-problema:
Os salários semanais dos operários industriais são distribuídos normalmente,
em torno da média de 500 reais, com desvio padrão de 40 reais. Calcule a probabilidade
de um operário ter um salário semanal situado entre 490 e 520 reais?

85
Em termos gráficos:

Calculando:

Devemos, inicialmente, determinar os valores da variável de distribuição


normal reduzida:

A probabilidade procurada é:
𝑃(490<𝑋<520)=𝑃(−0,25<𝑍<0,5)
=𝑃(−0,25<𝑍<0)+𝑃(−0,25<𝑍<0,5)
= 0,987+0,1915
=0,2902
=29,02%

É de se esperar que, em média, 29,02% dos operários tenham salários entre 490 e
520 reais.

RESUMINDO
Nesta Unidade, foram apresentados os principais conceitos da teoria da
probabilidade e da Distribuições de probabilidade, com enfoque na Distribuição
Normal. Dessa forma, aprendemos:

a) Espaço amostral.
b) Evento.
86
c) Cálculo da probabilidade de um evento, por meio da definição clássica e
frequencial e pela aplicação das propriedades da probabilidade.
d) Probabilidade condicional, a partir da qual se obteve uma importante
igualdade que é o teorema do produto.
e)Principais distribuições de probabilidade para variáveis discretas e
contínuas;
f)Distribuição Normal;
g)Cálculo de probabilidade a partir da distribuição normal padronizada.

ATIVIDADES PARA REVISÃO


1. Um casal planeja ter 3 filhos. Determine:
a) O espaço amostral desse fenômeno aleatório.___________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) A probabilidade de o casal ter três meninos, supondo que os resultados listados no


item “a” têm a mesma probabilidade de ocorrência. __________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c) A probabilidade de o casal ter um menino e duas meninas. __________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
87
2. Tem-se uma caixa contendo um lote de 50 peças. Sabe-se que no lote há quatro
peças defeituosas. Retirando-se ao acaso uma peça da caixa, qual é a probabilidade
de essa peça ser defeituosa? ____________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

3. Um estudante calculou a probabilidade de um evento A e encontrou o seguinte


resultado: 𝑃(A)=1,03. Esse resultado pode representar o valor de uma
probabilidade? Justifique sua resposta. ________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

4. Em uma turma da disciplina de Probabilidade e Estatística, a probabilidade de


escolher um aluno ao acaso e ele ser praticante regular de alguma atividade física é
de 0,35. Qual é a probabilidade de escolher ao acaso um aluno dessa turma e ele não
ser praticante regular de alguma atividade física? _______________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

5. Uma instituição de ensino tem duas bolsas de estudos para turma que tem 100
alunos matriculados. Segundo a cidade onde residem, 12 estudantes são de Antônio
Prado, 44 de Caxias do Sul, 16 de Farroupilha e 28 de Flores da Cunha. Ao escolher dois
alunos dessa turma ao acaso e sem reposição, qual é a probabilidade:
a) De que sejam escolhidos dois alunos que residem em Caxias do Sul? ____________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) De que seja escolhido um aluno residente em Farroupilha e outro em Flores da


Cunha? ___________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
88
c) De que sejam escolhidos dois alunos residentes em Antônio Prado ou dois alunos
residentes em Farroupilha? ________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

d) De que os dois alunos escolhidos não residam na mesma cidade. _______________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
6. O quadro funcional de uma empresa apresenta a composição, conforme mostra a
Tabela 19:
Tabela 19: Composição do quadro funcional de uma empresa, segundo a idade e o gênero

Fonte: Elaborado pelos Autores (2014)

Escolhendo-se ao acaso um colaborador desta empresa, determine a


probabilidade de:
a) ser uma mulher; _______________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) ter menos que 20 anos; ________________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c) ter mais que 20 anos; _____________________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

d) ser homem e ter entre 30 e 40 anos; ________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

e) ser homem ou ter entre 30 e 40 anos. ______________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

89
7. Tem-se uma caixa contendo um lote de 24 peças das quais sete apresentam defeito
e 17 são peças de boa qualidade. Retiram-se duas peças da caixa ao acaso, sem
reposição da peça após a primeira retirada. Pede-se:
a) Qual é a probabilidade de as duas peças apresentarem defeito? ___________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________

b) Qual é a probabilidade de a 1ª peça extraída da caixa ser de boa qualidade e a 2ª


peça ser defeituosa? ___________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________
_________________________________________________________________________________________________________________________________________________________

8. Repita o exercício 7 considerando que as duas peças são retiradas da caixa ao


acaso, com reposição da peça após a primeira retirada. ___________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

9. Uma variável x de distribuição normal tem média 30 e desvio padrão 4. Qual a


probabilidade de 28 < x < 35?_____________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

10. Suponha que a renda média de uma comunidade possa ser razoavelmente
aproximada por uma distribuição normal, com média de R$ 150,00 e desvio padrão
R$ 30,00.
a) Qual a porcentagem da população que terá renda superior a R$ 186,00? __________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

90
b) Numa amostra de 50 assalariados, quantos podemos esperar que tenham menos
de R$ 105,00 de renda? _____________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

11. Os peixes pescados por uma traineira têm peso médio de 4,5 kg e desvio padrão
de 0,5 kg. Qual a porcentagem de peixes que pesam menos de 4 kg? _____________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

12. Se os diâmetros de 400 peças produzidas por uma máquina, num dia, têm
distribuição com média 50,2mm e desvio padrão 0,15mm. Qual o número provável
de peças com mais de 50,5mm de diâmetro? ______________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

13. Numa prova final de Estatística, as notas dos alunos tiveram uma distribuição
normal com média 6 e desvio padrão 1,5. Sendo 5 a nota mínima de aprovação, qual a
proporção de alunos reprovados? ____________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

14. A experiência tem mostrado que a duração média das lâmpadas de retroprojetores
é 70 horas com desvio padrão 8 horas. Qual a probabilidade de determinada lâmpada
durar mais de 82 horas? _____________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

91
15. Os salários dos operários industriais são distribuídos normalmente, em torno da
média de R$ 500,00, com desvio padrão de R$ 40,00. Calcule a probabilidade de um
operário ter um salário semanal situado entre R$ 490 e R$520. _______________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

16. A duração de um certo componente eletrônico tem média de 850 dias e desvio
padrão de 40 dias. Sabendo que a duração é normalmente distribuída, calcule a
probabilidade de esse componente durar:
a)Entre 700 e 1000 dias; ____________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b)Mais que 800 dias; ___________________________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c)Menos que 750 dias. ________________________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

17. Se o tempo necessário para montar uma mesa de computador é uma variável
aleatória normal com s = 55 minutos e s = 12 minutos, quais são as probabilidades de
a mesa ser montada em:

a) Menos de 45 minutos; ____________________________________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) Em um tempo entre 45 e 60 minutos; _________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c) Em um tempo entre 45 e 75 minutos. _________________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

92
REFERÊNCIAS DA UNIDADE
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 5. ed. São Paulo: Saraiva,
2004.

BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 7. ed. São Paulo: Saraiva,
2011.

CARVALHO, Rui Lara de. et al. Teste rápido para diagnóstico da infecção pelo HIV em
parturientes. In: Revista Brasileira de Ginecologia e Obstetrícia. Rio de Janeiro, RJ,
vol. 26, Nº 4, Maio 2004. Disponível em: <http://www.scielo.br/scielo.php?script=sci_
arttext&pid=S0100-72032004000400010>. Acesso em: 25 maio 2014.
DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. 6. ed. Trad.
Norte-Americana. São Paulo: Pioneira Thomson Learning, 2006.
DOWNING, Douglas; CLARK, Jeffery. Estatística aplicada. 2. ed. São Paulo: Saraiva,
2002.
FREUD, John E. Estatística aplicada. 11. ed. Porto Alegre: Bookman, 2006.
LOPES, Paulo Afonso. Probabilidades e estatística: conceitos, modelos, aplicações
em excel. Rio de Janeiro: Reichmann e Affonso Editores, 1999.
SPIEGEL, M. Probabilidade e estatística. São Paulo: Ed. Makron Books, 2001.
STEVENSON, William J. Estatística aplicada à administração. São Paulo: HARBRA,
2001.

TRIOLA, Mário. Introdução à Estatística. 11. ed. Rio de Janeiro: LTC, 2013

PARA SABER MAIS


Caro (a) Acadêmico (a).
O site do Instituto Brasileiro de Geografia e Estatística (IBGE) será de grande
valia para futuras consultas para pesquisa:

IBGE. Instituto Brasileiro de Geografia e Estatística. Disponível em: <http://www.


ibge.gov.br/>. Acesso em 09 de jul. 2014

93
TABELA DE DISTRIBUIÇÃO NORMAL REDUZIDA

94
UNIDADE DE ENSINO 4

AMOSTRAGEM
E
ESTIMAÇÃO
CONTEÚDOS DA UNIDADE
Nesta Unidade, estaremos estudando os seguintes tópicos
relacionados à amostragem e estimação:
1. O que é amostragem?
2. Quais são os tipos de amostragem?
3. Qual é o tamanho de uma amostra?
4. Estimação por ponto.
5. Estimação por intervalo de confiança para a proporção populacional.

OBJETIVOS DA UNIDADE
Entender o que é amostragem e saber quais são os principais tipos
de amostragem existentes, além de calcular o tamanho de uma amostra,
sendo estabelecido o erro amostral tolerável.
Compreender o que é estimação por ponto e por intervalo de
confiança e saber calcular as principais estimativas por ponto, além de
determinar e interpretar um intervalo de confiança para o parâmetro
proporção.

O QUE É AMOSTRAGEM?
Amostragem é a maneira pela qual o pesquisador seleciona alguns elementos
da população para estudar suas características. Esses elementos selecionados
constituem-se a amostra da população. Por meio dessa amostra podem ser estudados
a média, a mediana, o desvio padrão, a frequência e a proporção dos dados contidos
nessa amostra.
O objetivo de se trabalhar com os dados da amostra de uma população é fazer
inferência sobre esta população, ou seja, é fazer deduções ou conclusões sobre as
características dessa população.
As características observadas na população (como média, mediana, desvio
padrão, etc.) são chamadas de parâmetros da população e as características
observadas na amostra são chamadas de estatísticas da amostra.
A função das estatísticas de uma amostra é estimar quantitativa e
qualitativamente os dados de uma população. Dessa maneira, as estatísticas de uma
amostra são também chamadas de estimadores.

Lembre-se: o objetivo da Estatística é tirar conclusão do todo (população) a


partir da amostra.

Para se tirar conclusões de uma população-alvo em estudo, é necessário


conhecer três tipos de amostragem existentes que podem ser retiradas de uma
população.
QUAIS SÃO OS TIPOS DE AMOSTRAGEM?
Os três principais tipos de amostragem são:

1. Amostragem aleatória simples;


2. Amostragem sistemática; e,
3. Amostragem estratificada.

1. Amostragem aleatória simples

Este tipo de amostragem consiste em escolher, de forma aleatória, alguns


dos elementos da população-alvo em estudo.
Os elementos de uma população a serem escolhidos devem ter igual chance
de escolha para fazer parte dessa amostra. Por exemplo: Digamos que desejássemos
obter 60 amostras (n = 60) de uma população de 150 alunos (N = 150).
Poderíamos, então, numerar os 150 alunos em pequenos pedaços de papel de 1 a 150
e colocar esses papéis em uma caixa, sacudi-la e sortear um dos 150 papéis dentro
da caixa. Esse processo seria feito por mais 59 vezes (sem retornar o papel sorteado),
assim, obteríamos 60 amostras, com igual chance de sorteio para cada amostra.
Esse tipo de amostragem é probabilístico, pois cada elemento a ser
selecionado tem igual chance de fazer parte da amostra.

2. Amostragem sistemática

Este tipo de amostragem acontece quando os elementos da população já


se encontram ordenados, não havendo necessidade de se construir um sistema de
referência.
Os exemplos mais comuns desse tipo de amostragem são: a linha de
produção de um determinado produto, as casas ordenadas nas ruas, os apartamentos
ordenados em um prédio, etc.
A seleção dos elementos que constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador. Por exemplo: Se quisermos retirar uma amostra
de 300 funcionários (n = 300) de uma empresa de um total (população) de 1200
funcionários (N = 1200), fazemos a seleção dos elementos de forma sistemática
por meio do cálculo de . Isto é, dentre os quatro primeiros funcionários
listados, apenas um será escolhido aleatoriamente (por sorteio). Se o terceiro
funcionário for escolhido aleatoriamente, então a amostragem dos funcionários será
o 3º, 7º, 11º, “...”, 1191º, 1195º e 1199º funcionário, obtendo, assim, 300 funcionários
como amostra.

3. Amostragem estratificada

Este tipo de amostragem é utilizado quando existe uma divisão natural da


população em subgrupos. Esses subgrupos da população são chamados de estratos.

97
Alguns exemplos deste tipo de amostragem são:

a) Separação da população por gênero: estrato masculino e estrato feminino;


b) Separação da população por nível de instrução: estrato de pessoas com
Ensino Médio, estrato de pessoas com Ensino Superior e estrato de
pessoas com ensino de Pós-Graduação; e,
c) Separação dos funcionários de uma empresa: estrado do setor administra-
tivo e estrato do setor de produção.

Por meio desse tipo de amostragem, é que fazemos estudos sobre os estratos
da população, comparando as suas características peculiares ou não.
Dessa forma, o pesquisador deverá identificar qual será a melhor
estratificação que se realizará sobre a população-alvo em estudo.

QUAL O TAMANHO DE UMA AMOSTRA?


Quando falamos em escolher qual o melhor tipo de amostragem a ser
escolhida para a pesquisa, recaímos num ponto muito importante da Estatística
Inferencial, que é o tamanho da amostra.
Nem sempre conseguimos pesquisar todos os elementos de uma população,
mas podemos tomar uma parte dos elementos desta população, chamada amostra.
Mas fica uma pergunta: Qual deve ser o tamanho da amostra sobre uma população a
ser pesquisada?
O tamanho da amostra é importante pelo fato de dar confiabilidade à pesquisa,
ou seja, se o tamanho da amostra for pequeno, não revelará a característica da
população. Porém, se o tamanho da amostra for o suficiente, revelará a característica
da população por inferência (por dedução), com certo erro amostral.
Segundo Barbetta (2005, p.52), o erro amostral é a diferença entre o valor
que a estatística da amostra pode acusar e o verdadeiro valor do parâmetro da
população que se deseja estimar.
O mesmo autor define:
Para determinar o tamanho da amostra, o pesquisador precisa especificar o
erro amostral tolerável, ou seja, o quanto ele admite errar na avaliação dos
parâmetros de interesse. Por exemplo, na divulgação de pesquisas eleitorais,
é comum encontrarmos no relatório algo como: a presente pesquisa tolera
em erro de 2%. Isto quer dizer que, quando a pesquisa aponta determinado
candidato com 20% de preferência do eleitorado, está afirmando, na verdade,
que a preferência por este candidato é um valor do intervalo de 18% a 22% (ou
seja, 20% ≠ 2%).

Para calcular o tamanho inicial da amostra de uma população, aplicamos a


seguinte fórmula:

Em que, 𝑛0 é a primeira aproximação para o tamanho da amostra e 𝐸0 é o


erro amostral tolerável que o pesquisador deseja tolerar (ou errar) em sua amostra.

98
Se o tamanho da população for conhecido, podemos corrigir o cálculo anterior
por:

Em que, 𝑛 é o tamanho da população conhecida e 𝑁 é o tamanho da amostra


corrigida (BARBETTA, 2005).
Podemos, por exemplo, querer calcular o tamanho da amostra de uma
população de 800 funcionários de uma empresa para a aplicação de certo questionário
para pesquisa. Considerando o erro amostral tolerável de 2%, perguntamos: Qual deve
ser o tamanho da amostra desta população de 800 funcionários? A resposta é dada
fazendo os seguintes cálculos:

Serão necessários 607 funcionários como amostra para revelar as


características do quadro funcional da empresa, com 95% de confiança.
Às vezes, não se tem conhecimento do tamanho da população ou a população
é inacessível. Caso isso ocorrer, aplicamos apenas a fórmula , pois essa
fórmula descreve o tamanho máximo da amostra a ser utilizada.
Os Gráficos 17 e 18 descrevem o tamanho máximo da amostra em relação ao
tamanho da população.

Gráfico 17: Tamanho máximo da amostra (n) com erro amostral tolerável de 2%
Fonte: Elaborado pelos Autores (2014)

99
Se o erro amostral tolerável pelo pesquisador for de 2% e este pesquisador
não tiver conhecimento do tamanho da população, o tamanho máximo da amostra
será de 2500 pessoas ou respondentes, pois .

Gráfico 18: Tamanho máximo da amostra (n) com erro amostral tolerável de 5%
Fonte: Elaborado pelos Autores (2014)

Se o erro amostral tolerável pelo pesquisador for de 5% e este pesquisador


não tiver conhecimento do tamanho da população, o tamanho máximo da amostra
será de 400 pessoas ou respondentes, pois .
Como vimos, é importante saber calcular o tamanho de da amostra de uma
população antes de realizarmos um tipo de pesquisa, bem como saber qual tipo de
amostragem a ser usada.

ESTUDO DE CASO
Neste tópico, estaremos analisando como foi calculado o tamanho da
amostra de cada estrato em um Trabalho de Conclusão de Curso (TCC) de Psicologia da
Faculdade da Serra Gaúcha (FSG), pela acadêmica Simone Letícia Lourenço Fregadolli.
O principal objetivo deste TCC era verificar em qual momento do curso os
alunos de Psicologia tinham ou não feito o chamado Tratamento Pessoal. Para a
pesquisa ser realizada, tinha-se o conhecimento do número total de acadêmicos
matriculados neste curso, em 2013, segundo semestre, que eram de 588 alunos.
Como o Curso de Psicologia tem 10 semestres, achou-se por bem, pela
pesquisadora, estratificar a população a ser pesquisada, conforme se observa no
Gráfico 19.

100
Gráfico 19: Estratos dos acadêmicos do Curso de Psicologia
Fonte: FSG/curso de Psicologia – 2013/2

Pela falta de tempo para realizar a pesquisa e a tabulação e levantamento de


seus dados, optou-se em colher amostras de cada estrato do curso, considerando o
erro amostral tolerável de 5%.
Dessa forma, foram realizados os seguintes cálculos:

𝐸0=0,05

Para 𝑁1º=253 temos:

Para 𝑁2º=217 temos:

Para 𝑁3º=118 temos:

Por meio do cálculo do tamanho da amostra de cada estrato do curso, foi


possível realizar a pesquisa em tempo hábil, demonstrando em qual momento do
curso, os acadêmicos realizavam o Tratamento Pessoal, conforme se verifica no
Gráfico 20.

101
Gráfico 20: Atualmente você está realizando tratamento pessoal?
Fonte: FSG/Curso de Psicologia – 2013/2

O Gráfico 20 revelou que nos primeiros semestres do curso os acadêmicos


do Curso de Psicologia não tinham ou não estavam fazendo algum tipo de Tratamento
Pessoal.
Dessa maneira, percebemos que sem a Inferência Estatística não se saberia
o tamanho da amostra em cada estrato. Logo, a pesquisa não seria realizada. Vemos,
nesse estudo de caso, como é importante calcular o tamanho de uma amostra, bem
como qual tipo de amostragem pelo pesquisador.

O QUE É ESTIMAÇÃO?
Como discutimos nas unidades anteriores, nem sempre é possível pesquisar
uma população toda por diversos motivos. Geralmente, se realiza o processo de
amostragem, estendendo os resultados obtidos na amostra para a população de onde
os dados foram extraídos.
A inferência é a parte da Estatística que tem por objetivo fazer generalizações
sobre uma população com base em valores amostrais. A inferência pode ser feita
estimando os parâmetros por ponto e por intervalo.
A estimação por ponto é feita a partir de um único valor, enquanto que
a estimação por intervalo fornece um intervalo de valores em torno do valor da
estimativa pontual. Na estimação por ponto o objetivo, é utilizar a informação amostral
para se calcular um valor que seria, em certo sentido, nossa melhor avaliação quanto
ao valor, de fato, do parâmetro em questão.
Na estimativa por intervalo, usa-se a mesma informação com o propósito de
se produzir um intervalo que contenha o valor verdadeiro do parâmetro com algum
nível de probabilidade.
Os conhecimentos que serão construídos nesta Unidade podem ser úteis, por
exemplo, para interpretar uma pesquisa de opinião.

102
QUAIS SÃO OS PRINCIPAIS ESTIMADORES?
Uma estimativa pontual é um único valor utilizado para estimar um
parâmetro populacional. A média amostral é a melhor estimativa pontual da média
populacional μ; a proporção amostral p é a melhor estimativa pontual da proporção
populacional π; e a variância amostral s² é a melhor estimativa pontual da variância
populacional σ².
O Quadro 11 traz os principais estimadores para calcular as estimativas por
ponto e, também os respectivos parâmetros:

Quadro 11: Principais estimadores e parâmetros


Fonte: Elaborado pelos Autores (2014)

POR QUE CONSTRUIR UM INTERVALO DE CONFIANÇA?


Por meio da estimativa pontual não obtemos nenhuma informação sobre a
possível magnitude do erro que estamos cometendo. Por isso, surge a necessidade
de construir intervalos de confiança.
Para uma dada população podemos retirar um determinado número de
amostras diferentes para um tamanho de amostra n. Cada amostra possível tem
um valor como estimativa e cada estimativa fornecerá um intervalo diferente para o
parâmetro.
Como extraímos uma amostra, iremos construir um único intervalo. Portanto,
este intervalo pode ou não conter o verdadeiro valor do parâmetro. Por isso, associa-
se um nível de confiança ao intervalo de confiança, por exemplo, 0,95 ou 95%. O nível
de confiança pode ser interpretado como a probabilidade de que o intervalo realmente
contenha o parâmetro populacional, supondo que o processo de estimação seja
repetido um grande número de vezes.
O nível de confiança normalmente é representado por “1−𝛼” (Figura 23),
sendo 𝛼 a probabilidade de erro.
103
Figura 23: Ilustração do nível de confiança
Fonte: Elaborada pelos Autores (2014)

COMO DETERMINAR UM INTERVALO DE CONFIANÇA PARA A


PROPORÇÃO POPULACIONAL?
Para construir essa faixa de valores que, com certa confiança, acreditamos
conter o parâmetro populacional, neste caso a proporção populacional, vamos
determinar a margem de erro.
Para o caso da proporção populacional, a margem de erro é dada por:

em que:

a) 𝑧𝛼/2 é o valor da distribuição normal padrão cuja área à direita é igual a α/2.
b) p é a estimativa por ponto da proporção populacional π.
c) n é o tamanho da amostra.

OBSERVAÇÃO: Se o tamanho N da população é finito, deve ser usado o fator de


correção , sempre que . Assim, a margem de erro será
dada por:

Para encontrar os limites inferior e superior do intervalo de confiança,


subtraímos e somamos a margem de erro da estimativa pontual da proporção obtida
na amostra, ou seja:

Assim, o intervalo de confiança para a proporção populacional (π) é centrado


na proporção amostral (Figura 24):

104
Figura 24: Ilustração do intervalo de confiança para π
Fonte: Elaborada pelos Autores (2014)

A Figura 24 mostra um intervalo de confiança centrado em um valor amostral


(p), obtido de uma amostra extraída da população. Este intervalo pode ou não conter
o parâmetro e, podemos dizer que, existe uma probabilidade “1−𝛼” de que o intervalo
contenha o parâmetro π. Se construíssemos uma grande quantidade de intervalos
de confiança a partir da seleção de amostras de mesmo tamanho (n), “1−𝛼” dos
intervalos conteriam o parâmetro π.
Por exemplo, se construíssemos uma grande quantidade de intervalos
de confiança de 95%, a partir de diversas amostras, então 95% desses intervalos
conteriam o verdadeiro valor da proporção populacional π e, 5% dos intervalos não o
conteriam.

ESTUDO DE CASO
Neste tópico, estaremos apresentando duas situações-problema para
ilustrar os conteúdos abordados neste capítulo.

1ª situação-problema:
Determinar o valor de 𝑧𝛼/2 para um nível de confiança de 95%.
Solução:
Para encontrar o valor de 𝑧𝛼/2 de qualquer nível de confiança podemos usar
este procedimento.
Um nível de confiança de 95% corresponde a 𝛼=0,05, logo a área em cada
cauda da curva normal é 𝛼/2=0,025. Lembrando que a tabela da distribuição
normal reduzida, fornecida na Unidade 6, apresenta a área (probabilidade) do centro
até o ponto em que estamos calculando, procuramos no corpo dessa tabela o valor da
área de 0,4750. O valor encontrado é igual a 𝑧𝛼/2 =1,96.

2ª situação-problema:
Considerando o estudo de caso apresentado na Unidade 7, vamos utilizar os
dados apresentados no Gráfico 20 e construir um intervalo de confiança de 95% para
a proporção populacional de acadêmicos do primeiro estrato (1º ao 3º semestre) que
realizavam o Tratamento Pessoal. Sabemos que nesse estrato forma pesquisados
155 acadêmicos.
Solução:
Verificamos no Gráfico 20 que a estimativa pontual para a proporção de

105
acadêmicos do 1º ao 3º semestre que realizavam o Tratamento Pessoal é p=0,21
ou 21%.
Calculamos então a margem de erro:

Subtraímos e somamos este valor da estimativa pontual:

[0,21 - 0,040; 0,21 + 0,040]

Ou seja:

[0,170; 0,250] ou [17,0%; 25,0%]

Interpretando o resultado:
Estamos 95% confiantes em que o intervalo de 0,170 a 0,250 realmente
contenha o verdadeiro valor da proporção populacional π, isto é, a verdadeira
porcentagem dos acadêmicos do 1º ao 3º semestre que realizavam o Tratamento
Pessoal. Isto significa que, se selecionássemos muitas diferentes amostras de
tamanho 155 e construíssemos os intervalos de confiança correspondentes, 95%
deles realmente conteriam o valor da proporção populacional π.

RESUMINDO
Nesta Unidade aprendemos:

a) O que é amostragem;
b) Quais os tipos de amostragem;
c) Qual o tamanho de uma amostra;
d) O que é estimação por ponto e por intervalo de confiança;
e) Calcular as principais estimativas por ponto; e,
f) Construir e interpretar um intervalo de confiança para a proporção
populacional.

ATIVIDADES PARA REVISÃO


Nesta parte da Unidade, estaremos propondo situações-problema para
calcular o tamanho de uma amostra, sendo conhecido ou não o tamanho da população,
bem como a identificação do tipo de amostragem abordada.
1. O Gráfico 21 descreve o nível de formação dos funcionários de uma empresa.

Gráfico 21: Nível de formação dos funcionários de uma empresa


Fonte: Elaborado pelos Autores (2014)

Considerando 2% de erro amostral tolerável, calcule o tamanho da amostra para cada


estrato do gráfico. ________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

2. O Gráfico 22 descreve o gênero de pessoas em uma empresa. Ao todo são 500


funcionários empregados nesta empresa.

Gráfico 22: Gênero da pesquisa


Fonte: Elaborado pelos Autores (2014)

107
Pretende-se realizar uma pesquisa por meio de um questionário. Como não
é possível entrevistar todos os funcionários, será necessário calcular o tamanho da
amostra para cada gênero. Considerando o erro amostral tolerável de 10%, qual deve
ser o tamanho da amostra para cada gênero dessa empresa? __________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

3. Em relação ao exercício anterior, identifique o tipo de amostragem utilizado:

a)(____) Amostragem Sistemática.


b)(____) Amostragem Estratificada.
c)(____) Amostragem Aleatória Simples.

4. Qual deve ser o tamanho da amostra de um quadro de 2000 funcionários em uma


empresa, considerando o erro amostral tolerável de 5%? ____________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

5. Em relação ao exercício anterior, pretende-se utilizar a amostragem sistemática


para selecionar quais funcionários farão parte da amostra. Considerando que o 5º
funcionário foi escolhido por sorteio dentre os seis primeiros funcionários, qual a
sequência de funcionários que deverão fazer parte da amostra?

a)(____) 6º, 12º, 18º, 24º,..., 1992º; 1998º.


b)(____) 5º, 11º, 17º, 23º,..., 1991º; 1997º.
c)(____) 4º, 10º, 16º, 22º,...,1990º; 1996º.
d)(____) 1º, 7º, 18º, 24º,...,1993º;1999º.

6. Calcule o tamanho de uma amostra aleatória simples com 1% de erro amostral


tolerável. _________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

108
7. Deseja-se fazer uma pesquisa em uma cidade com 200 mil habitantes. Considerando
o erro amostral tolerável de 1%, qual deve ser o tamanho da amostra para a pesquisa?
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

8. Deseja-se também fazer uma pesquisa em outra cidade com 300 mil habitantes.
Considerando o erro amostral tolerável de 1%, qual deve ser o tamanho da amostra
para a pesquisa? __________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

9. Que conclusão se tira do tamanho das amostras dos dois últimos exercícios? _________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

10. O que é uma estimativa pontual de um parâmetro populacional?


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

11. Por que é necessário construir intervalos de confiança?


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

109
12. Uma amostra aleatória simples sem reposição com foi observada em uma área
de uma cidade contendo 14.848 residências. O número de pessoas por residência na
amostra observada foi: 5, 6, 3, 3, 2, 3, 3, 3, 4, 4, 3, 2, 7, 4, 3, 5, 4, 4, 3, 3, 4, 3, 3, 1, 2,
4, 3, 4, 2, 4. Encontre uma estimativa por ponto do número médio de pessoas por
residência na população. ____________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

13. Uma pesquisa foi conduzida com o objetivo de se estudar o índice de ausência ao
trabalho em uma determinada empresa. Da população de 36.000 colaboradores foi
selecionada uma amostra aleatória simples sem reposição de 1.000. Na amostra foi
registrado o número de faltas não justificadas num período de 6 meses. Os resultados
obtidos foram:

a) Calcule a estimativa por ponto da média populacional fornecida por essa amostra.
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) Calcule a estimativa do desvio padrão das faltas de todos os colaboradores dessa


empresa. ________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

110
14. Considere o seguinte conjunto de dados referentes à velocidade de uma amostra
de 120 carros andando em uma autoestrada.
Determine estimativas da:

a) Velocidade média. ____________________________________________________________________________________________________________________


_________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

b) Variabilidade da velocidade (desvio padrão). _____________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

c) Proporção de carros acima dos 100 km/h. _________________________________________________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

6. Determinar o valor de 𝑧𝛼/2 para um nível de confiança de 99%. _____________________________________


__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

111
7. Considerando ainda o estudo de caso apresentado na Unidade 7, vamos utilizar os
dados apresentados no Gráfico 20 e construir um intervalo de confiança de 99% para
a proporção populacional de acadêmicos do primeiro estrato (1º ao 3º semestre) que
realizavam o Tratamento Pessoal. Compare este intervalo com aquele determinado
na 2ª situação-problema e escreva um pequeno texto explicando as diferenças
encontradas. __________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

8. Supondo que a pesquisadora tenha entrevistado 200 acadêmicos em vez de


155. Construir um intervalo de 95% de confiança para a proporção populacional de
acadêmicos do primeiro estrato (1º ao 3º semestre) que realizavam o Tratamento
Pessoal. Compare este intervalo com aquele determinado na 2ª situação-problema e
escreva um pequeno texto explicando as diferenças encontradas. __________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

9. Considerando ainda o estudo de caso apresentado na Unidade 7, construir um


intervalo de confiança de 95% e 99% para a proporção populacional de acadêmicos
do segundo e do terceiro estrato que realizavam o Tratamento Pessoal. __________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________
__________________________________________________________________________________________________________________________________________________________

REFERÊNCIAS DA UNIDADE
BUSSAB, Wilton O.; MORETTIN, Pedro A. Estatística Básica. 7. ed. São Paulo: Saraiva,
2011.
BARBETTA, Pedro Alberto. Estatística Aplicada às Ciências Sociais. 5. ed. 3 reimp.
Florianópolis: Editora da UFSC, 2005.
FREGADOLLI, Simone L. L. O significado do tratamento pessoal na formação do
psicólogo. Caxias do Sul: FSG, 2013. Trabalho de Conclusão de Curso (Graduação em
Psicologia). Faculdade da Serra Gaúcha, 2013.
KAZMIER, Leonard J. Estatística Aplicada à Administração e Economia. 4. ed. Porto
Alegre: Bookman, 2007.
TRIOLA, Mário. Introdução à Estatística. 11. ed. Rio de Janeiro: LTC, 2013.

112
PARA SABER MAIS
Caro(a) Acadêmico(a).
Você poderá estar consultando os capítulos 3 e 9 do livro Estatísticas
Aplicadas às Ciências Sociais (vide referência) para aprofundamento do assunto
em amostragens.
Já para aprofundamento do assunto sobre intervalos de confiança para
outros parâmetros, como exemplo, a média, você poderá consultar o capítulo 7 do
livro Introdução à Estatística (vide referência)

Vejam também os seguintes links para ver outra forma de calcular o tamanho
de uma amostra:

YOUTUBE. João Marcos vídeo estatística 8 tamanho da amostra N desconhecido


300913. Disponível em <www.youtube.com/watch?v=OoOOjgR_9XM >. Acesso em:
09 de jul. 2014.

YOUTUBE. Calculo Tamanho Amostra Proporção. Disponível em: <http://www.


youtube.com/watch?v= 8GFkRy Cv9z0 >. Acesso em: 09 de jul. 2014.

113
GABARITOS
UNIDADE 1
1. Resposta no texto
2. Resposta no texto
3. Resposta no texto
4. Resposta no texto
5. a) C;
b) C;
c) D;
d) D;
e) D;
f) C;
g) C;
h) C;
i) C;
j) C;
k) D.
6. Resposta Pessoal
7. Dados Absolutos = Coluna de número de alunos
Dados Relativos = Coluna da Porcentagem
8. Respectivamente; 9,83%; 12,46%; 11,34%; 20,33%; 15,72%; 30,32%.
9. Resposta pessoal
10. D
11.a)23
b)30
c)7
d)Sim
12. 40
13. 40%
14. C
15. B
16. 23 anos
17. B
18. B

UNIDADE 2
1. 2975 reais
2. 2800 reais
3. 2850 reais
4. 2800 reais
5. 3125 reais

116
6. 253,72 reais
7. 8,53%
8.

9. Setor A, pois o coeficiente de variação é o menor que o setor B.


10. C
11. Resposta pessoal
12. a) Resposta pessoal
b) Resposta pessoal
c) Resposta pessoal
d) 1,68 e 1,08;
e) 2
13. a) 40%;
b) 15%;
c) 3,3 e 2,4;
14. a) O salário médio dos colaboradores é de 3,72 s. m. com uma variabilidade em
torno da média de 2,47 s. m.;
b) 50% dos colaboradores recebem 3,22 s. m. ou menos;
c)50% dos colaboradores recebem entre 1,79 s. m. e 5,17 s. m.

UNIDADE 3
1. a) S = {(MMM), (MFM), (MMF), (FMM), (FMF), (FFM), (MFF), (FFF)};
b) 1/8;
c) 3/8
2. 0,08
3. Não, pois a probabilidade de um evento é sempre um número que varia entre 0 e 1.
4. 0,65
5. a) 0,1911;
b) 0,0905;
c) 0,0376;
d) 0,6949
6. a) 0,6186;
b) 0,1959;
c) 0,8041;
d) 0,0928;
e) 0,5464
7. a) 0,076;

117
b) 0,2156;
8. a) 0,0851;
b) 0,2066

UNIDADE 6
9. 0,5859
10. a)11,51% (P=0,0668) 3 pessoas
11. 15,87%
12. (P=0,0228); 9 peças
13. 25,14%
14. 0,0668
15. 0,2902
16. a) 0,9998
b) 0,8944
c) 0,0062
17. a) 0,2033
b) 0,4595
c) 0,7492

UNIDADE 4
1.

2.

3. B
4. 334 funcionários
5. B
6. 10 mil respondentes
7. 9524 respondentes
8. 9678 respondentes
9. As duas últimas são próximas, pois quanto maior o tamanho da população as
amostras tenderão a 10 mil respondentes.
10. Resposta no texto
11. Resposta no texto
12. 3,47
13. a) 1,296;
118
b) 1,548
14. a) 96,71 km/h;
b) 6,89 km/k;
c) 0,35
15. 2,575
16. [0,157; 0,263]
17. [0,184; 0,236]
18.

119