Anda di halaman 1dari 86

Estatística

Aplicada
TECNOLOGIA EM
HOTELARIA

Ministério da Educação - MEC


Coordenação de Aperfeiçoamento
de Pessoal de Nível Superior
Universidade Aberta do Brasil
Instituto Federal de Educação,
Ciência e Tecnologia do Ceará
MINISTÉRIO DA EDUCAÇÃO
Universidade Aberta do Brasil
Instituto Federal de Educação, Ciência e Tecnologia do Ceará
Diretoria de Educação a Distância

Tecnologia em Hotelaria

Estatística Aplicada

Luciana de Lima

Fortaleza, CE
2009
Créditos
Presidente Davi Jucimon Monteiro
Luis Inácio Lula da Silva Diemano Bruno Lima Nóbrega
Ministro da Educação Germano José Barros Pinheiro
Fernando Haddad Hommel Almeida de Barros Lima
José Albério Beserra
Secretário da SEED
José Stelio Sampaio Bastos Neto
Carlos Eduardo Bielschowsky
Larissa Miranda Cunha
Diretor de Educação a Distância Marco Augusto M. Oliveira Júnior
Celso Costa Navar de Medeiros Mendonça e Nascimento
Reitor do IFCE Roland Gabriel Nogueira Molina
Cláudio Ricardo Gomes de Lima Equipe Web
Pró-Reitor de Ensino Aline Mariana Bispo de Lima
Gilmar Lopes Ribeiro Benghson da Silveira Dantas
Diretora de EAD/IFCE e Fabrice Marc Joye
Coordenadora UAB/IFCE Igor Flávio Simões de Sousa
Cassandra Ribeiro Joye Luiz Alfredo Pereira Lima
Lucas do Amaral Saboya
Vice-Coordenadora UAB
Marcos do Nascimento Portela
Régia Talina Silva Araujo
Ricardo Werlang
Coordenador do Curso de Samantha Onofre Lóssio
Tecnologia em Hotelaria Tibério Bezerra Soares
José Solon Sales e Silva Thuan Saraiva Nabuco
Coordenador do Curso de Revisão de Conteúdo
Licenciatura em Matemática Narcelio Araújo Pereira
Zelalber Gondim Guimarães
Revisão Textual
Elaboração do conteúdo Aurea Suely Zavam
Luciana de Lima Nukácia Meyre Araujo de Almeida
Colaborador Revisão Web
Regina Santos Young Débora Liberato Arruda Hissa
Equipe Pedagógica e Design Instrucional Saulo Garcia
Ana Claúdia Uchôa Araújo Logística
Andrea Maria Rocha Rodrigues Francisco Roberto Dias de Aguiar
Cristiane Borges Braga Virgínia Ferreira Moreira
Eliana Moreira de Oliveira
Secretários
Gina Maria Porto de Aguiar Vieira
Breno Giovanni Silva Araújo
Jane Fontes Guedes
Francisca Venâncio da Silva
Jivago Silva Araújo
Lívia Maria de Lima Santiago Auxiliar
Luciana Andrade Rodrigues Bernardo Matias de Carvalho
Maria Vanda Silvino da Silva Carla Anaíle Moreira de Oliveira
Marília Maia Moreira Maria Tatiana Gomes da Silva
Regina Santos Young Wagner Souto Fernandes
Zuila Sâmea Vieira de Araújo
Equipe Arte, Criação e Produção Visual
Benghson da Silveira Dantas
Catalogação na Fonte: Etelvina Marques (CRB 3 – Nº 615)

L732e Lima, Luciana de


Estatística aplicada / Luciana de Lima; Coordenação Cassandra
Ribeiro Joye. - Fortaleza: UAB/IFCE, 2009.
84p. : il. ; 27cm.

ISBN 978-85-475-0017-7

1. DISTRIBUIÇÃO DE FREQUÊNCIA. 2. GRÁFICOS. 3. MEDIDAS


DE TENDÊNCIA CENTRAL E DISPERSÃO. 4. ESTATÍSTICA I. Joye,
Cassandra Ribeiro. (Coord.). II. Centro Federal de Educação Tecnológica
do Ceará - CEFETCE. III Universidade Aberta do Brasil - UAB. IV. Título.

CDD - 519.5
Apresentação 6
Referências 85
Currículo 86
SUMÁRIO
INTRODUÇÃO O surgimento da Estatística e a utilização
das planilhas eletrônicas 7
Tópico 1 A evolução da estatística 8
Tópico 2 As planilhas eletrônicas e a estatística 11

AULA 1 Conceitos básicos e distribuições de


frequência 18
Tópico 1 Conceitos básicos 19
Tópico 2 Distribuição de frequência 23

AULA 2 Representação Gráfica 35


Tópico 1 Diagramas, gráficos polares e outros 36
Tópico 2 Histograma e polígonos de frequência 45

AULA 3 Medidas de posição: tendência central 51


Tópico 1 Médias aritméticas: simples e ponderada 52
Tópico 2 Mediana 58
Tópico 3 Moda 64

AULA 4 Medidas separatrizes e Medidas de


dispersão 70
Tópico 1 Medidas separatrizes: Quartil 71
Tópico 2 Medidas de dispersão 78
APRESENTAÇÃO
Caro(a) aluno(a):

O estudo da Estatística, de forma geral, possibilita que dados coletados em pesquisas sejam
transformados em informações úteis para que decisões possam ser tomadas, seja qual for a
área de atuação profissional.

Com o aumento do movimento turístico nas últimas décadas, sobretudo no Ceará, o estudo
estatístico, por meio da coleta, organização e análise de dados, possibilita ao profissional do
turismo tomar decisões coerentes e realizar projeções adequadas para empreendimentos de
pequeno, médio ou grande porte.

Nesse sentido, nosso material didático contempla, inicialmente, uma pequena evolução
histórica da Estatística. Em seguida, apresenta os primeiros conceitos: população, amostra,
variável, para chegar à forma de desenvolvimento da coleta de dados, e à representação
gráfica e análise dos dados coletados, recorrendo, para tanto, ao estudo das medidas de
posição e de dispersão.

É importante ressaltar que a utilização de planilha eletrônica será necessária durante o curso.
É por este motivo que o material desenvolvido para a aula presencial contempla a utilização
de fórmulas e gráficos, obtidos a partir dessa ferramenta tecnológica.

Aproveitem o material o máximo possível, desenvolvendo não só as tarefas solicitadas, mas,


também, as atividades de aprofundamento.

Sucesso a todos e bons estudos.

6 Estatística Aplicada APRESENTAÇÃO


O surgimento da Estatística
INTRODUÇÃO e a utilização das planilhas
eletrônicas

Nesta aula, você saberá como a Estatística surgiu e se firmou como ciência,
acompanhamento a retomada da evolução histórica desse campo do saber.
Aprenderá como utilizar as planilhas eletrônicas para o desenvolvimento de
fórmulas matemáticas, tabelas e gráficos.

O uso da planilha eletrônica será necessário durante todo nosso curso. Por este
motivo, a aprendizagem adequada dessa ferramenta é de suma importância para
que você possa acompanhar as aulas com segurança e tranquilidade.

Objetivos

• Conhecer como a Estatística se desenvolveu ao longo da história


• Desenvolver fórmulas, tabelas e gráficos utilizando planilhas eletrônicas

7
TÓPICO 1 A evolução da Estatística
O bjetivo
• Apresentar a evolução histórica da Estatística

N este tópico, serão apresentados alguns aspectos importantes da


história da Estatística, desde seus primórdios até o momento em
que foi reconhecida como ciência, quando deixou de apresentar
apenas caráter descritivo.
A palavra estatística se origina do termo status em latim, que significa
estado. Foi introduzida pela primeira vez na Alemanha em 1748. Antigamente, o
Estado se beneficiava da coleta e da apresentação de dados quantitativos. Por este
motivo, seu nome faz menção ao Estado como coletor e organizador dos dados de
sua população.
De acordo com a Empresa Brasileira de Pesquisa Agropecuária –
Embrapa (MEMÓRIA, 2004), a Estatística apresenta hoje um significado
ainda maior. Caracteriza-se por apresentar um conjunto de métodos
apropriados ao tratamento de dados numéricos que podem ser afetados
por diferentes causas. Os métodos utilizados se baseiam em conteúdos
matemáticos em todos os aspectos que permeiam o estudo estatístico:
coleta, apresentação, análise e interpretação de dados quantitativos.
Mesmo tendo sua importância reconhecida, a Estatística, assim
como outras áreas do conhecimento, também é alvo de piadas (o que não
invalida a sua cientificidade), como a que vemos representada na Figura 1.
Figura 1 – Charge sobre
Apesar de apresentar nomenclatura própria a partir do século Estatística
XVIII, a estatística tem sido utilizada desde os primórdios da civilização
humana. Os governos interessados em obter informações sobre suas riquezas e
sobre sua população encomendavam estudos numéricos com fins puramente

8 Estatística Aplicada INTRODUÇÃO TÓPICO 1


militares e tributários. Imperadores chineses, faraós egípcios, civilizações maias,
incas e astecas, utilizaram-se dos conhecimentos estatísticos. O império romano
também utilizou os métodos estatísticos para contabilizar os registros de batismos,
casamentos e óbitos que ocorriam no século XVI.
Ainda hoje utilizamos essa vertente estatística. O recenseamento realizado
pela Fundação IBGE nos revela dados de suma importância, dados sobre a
distribuição socioeconômica de nosso país caracterizando-o em diversos aspectos.
Durante a Idade Média, esse conhecimento foi puramente descritivo.
Era formada por duas escolas: a alemã e a dos matemáticos sociais. A
escola alemã, formada por Achenwall (1719-1772), considerado o pai da
Estatística, tratava esse conhecimento de forma meramente descritiva. A
escola dos matemáticos sociais se preocupava em buscar regularidades em
fenômenos, confundindo-se geralmente com aspectos demográficos de
enumeração e organização.
Figura 2 – Gottfried Os estudos realizados pelos alemães no século XVIII garantiram
Achenwall (1719-1772)
à Estatística uma sistematização que não existia até então. Os dados,
porém, continuaram a ser tratados de forma descritiva, assim como o eram desde
a antiguidade.
A Estatística só foi considerada como uma disciplina independente das
demais no início do século XX, período que marca
o início da Estatística Moderna. Desde então esse
conhecimento tem se difundido de tal forma que a
ciência em geral a utiliza com o intuito de produzir
pesquisas que possam ser analisadas com cautela
e precisão.
Ainda que a Estatística disponha de várias
medidas que a ajudam na obtenção e consequente Figura 3 – Charge sobre a
contribuição da Estatística
análise de dados, o senso comum costuma satirizar
os cálculos estatísticos, como vemos em mais uma charge, reproduzida na figura 3.
Com mais essa charge podemos perceber que o lado bem-humorado como,
muitas vezes, a Estatística é vista revela, na realidade, que essa ciência está, de uma
forma ou de outra, presente no nosso dia-a-dia.
Veremos a seguir como podemos utilizar as planilhas eletrônicas para
trabalhar com aspectos matemáticos e estatísticos diante do desenvolvimento de
fórmulas, tabelas e gráficos.

9
TÓPICO 2
As planilhas eletrônicas e a
Estatística
O bjetivo
• Desenvolver fórmulas, tabelas e gráficos utilizando
uma planilha eletrônica

A planilha eletrônica auxilia bastante o desenvolvimento de cálculos


matemáticos. Ela pode ser utilizada como uma calculadora com
diversas fórmulas pré-estabelecidas. Além disso, ela permite o
desenvolvimento de novas fórmulas quando
as existentes não forem suficientes para que
objetivos traçados possam ser atingidos.
atenção! Um grande diferencial da planilha
A planilha eletrônica é formada por células. Isso eletrônica está no desenvolvimento de tabelas e
mesmo, células. Elas são os espaços nos quais gráficos.
inserimos os dados que desejamos. Na figura 4, Você pode construir tabelas facilmente,
você pode observar que uma dessas células está desenvolver seus cálculos, e, ao final, construir
sendo utilizada. gráficos com a utilização de todos os dados
Para nomeá-la, utilizamos dois recursos: as selecionados ou apenas uma parte deles.
colunas e as linhas. Observe que as colunas são Veremos, a seguir, como construir
formadas pelas letras do alfabeto e as linhas são fórmulas, tabelas e gráficos utilizando a planilha
determinadas por números naturais. eletrônica.

OPERAÇÕES BÁSICAS
Segundo Moraz (2006), para que desenvolva cálculos matemáticos, a planilha
precisa reconhecê-los como fórmulas matemáticas. Desse modo, cada fórmula deve
seguir uma sintaxe hierárquica de acordo com os requisitos utilizados na própria
matemática e que aprendemos desde o Ensino Fundamental.

10 Estatística Aplicada
A prioridade é dada para as potências e raízes, seguidas das multiplicações
e divisões e, por último, as adições e subtrações. Vale lembrar que essa hierarquia
pode ser redefinida com o uso dos parênteses.
As regras gerais para o desenvolvimento de cálculos matemáticos são as
seguintes:
a) todas as fórmulas devem ser iniciadas com o sinal de igual (=);
b) não devem ser inseridos espaços entre os elementos da fórmula;
c) as operações são representadas por operadores.

Os operadores utilizados são os apresentados no quadro a seguir (Quadro 1).


Operação Operadores
Adição +
Subtração -
Multiplicação *
Divisão /
Potenciação ^
Raiz quadrada Raiz (número)
Quadro 1— Distribuição, por operação,
dos operadores utilizados em planilhas eletrônicas

Exemplos:
20 + 15 - 5.2
1. Para calcular a expressão , devemos escolher uma célula
10
qualquer da planilha eletrônica e digitar: “=(20+15-5*2)/10”. Inserindo a fórmula
corretamente na planilha, obteremos como resposta 2,5.
2. Para calcular a expressão 32 + 42 , devemos escolher uma célula
qualquer da planilha eletrônica e digitar: “=raiz(3^2+4^2)”. Inserindo a fórmula
corretamente na planilha, obteremos como resposta o número 5.

Agora é a sua vez. Observe os exercícios propostos abaixo, escreva uma


fórmula matemática para cada um e aplique-a na planilha eletrônica. Aproveite
para conferir os resultados.

Exercícios:
1. Um grupo de 15 turistas comprou um pacote para visitar Fortaleza durante
10 dias. O valor total do pacote pago pelo grupo foi de R$ 13.500,00. Quantos reais
cada turista pagou por dia? R.: R$ 90,00.

INTRODUÇÃO TÓPICO 2 11
2. A sorveteria Gostosão cobra R$2,50 um sorvete de casquinha com 1 bola
e R$ 4,00 um sorvete de 2 bolas, para qualquer sabor. Um grupo de 10 turistas foi
à sorveteria Gostosão e comprou cada um o seu sorvete. Sabendo-se que 6 pessoas
compraram sorvete de 1 bola, 3 pessoas compraram sorvete de 2 bolas e 1 pessoa
não comprou sorvete, quanto gastaram no total? R.: R$ 27,00.
3. O hotel Brasil pretende decorar seu salão de festas para o Reveillon. Para
isto precisa confeccionar 50 toalhas quadradas, cujo lado mede 30 cm. Calcule
quantos metros quadrados de tecido serão necessários para a confecção das toalhas.
R.: 4,50 m².

Agora que você já sabe como utilizar a planilha eletrônica para desenvolver
cálculos matemáticos básicos, você vai aprender como construir tabelas aplicando
o conhecimento adquirido.

TABELAS
Um dos aspectos bastante utilizados em planilhas eletrônicas é o
desenvolvimento de tabelas. Isso se dá devido ao fato de a planilha apresentar uma
estrutura cartesiana, dividindo o plano em linhas e colunas.
Construir tabelas de dados utilizando uma planilha eletrônica é muito
simples. Basta você definir os elementos que constituem as linhas e as colunas
nomeando-os adequadamente nas células da planilha como se fossem os cabeçalhos
da tabela. Em seguida, você insere os dados numéricos nas respectivas células. Veja
o exemplo a seguir.

Exemplo:
Suponha que o hotel Brasil tenha como objetivo organizar seu orçamento
em relação à compra de alimentos básicos para o café da manhã consumidos pelos
hóspedes tomando como base uma tabela orçamentária de 2007, mês a mês (tabela
1).
Orçamento Pão Leite Café Queijo Margarina Frutas
2007 (unidade) (litros) (kg) (kg) (unidade) (unidade)
Janeiro 100 200 2 5 100 50
Fevereiro 150 300 3 7 150 75
Março 80 160 2 4 80 40
Abril 70 140 2 4 70 35
Maio 60 120 1 3 60 30

12 Estatística Aplicada
Junho 50 100 1 2 50 25
Julho 100 200 2 5 100 50
Agosto 80 160 2 4 80 40
Setembro 50 100 1 2 50 25
Outubro 30 60 1 1 30 15
Novembro 50 100 1 2 50 25
Dezembro 100 200 2 5 100 50
Total 920 1840 20 44 920 460

Tabela 1 – Quantidade de alimentos consumidos no café da manhã pelos


hóspedes do hotel Brasil em 2007

Observe no exemplo acima que, ao final da última linha da tabela, foi


calculada a soma dos alimentos consumidos mês a mês informando-nos o quanto
aquele alimento foi consumido durante o ano. Essa informação poderá auxiliar nas
próximas compras, não só do ano de 2008, mas também dos próximos anos.
Para calcular o total de qualquer alimento consumido, você não precisa fazer
muito esforço. Basta você utilizar a função pré-programada da planilha eletrônica
intitulada “SOMA”. Vamos supor que você queira calcular o total de café consumido
durante o ano de 2007. Siga os seguintes passos:
a) posicione-se na célula da linha Total e da coluna Café;
b) digite a seguinte informação “=SOMA ∑ ”;
c) observe que a planilha seleciona automaticamente para você o que será
calculado com a seguinte sintaxe: “=SOMA(célula inicial:célula final)”.
d) Confirme apertando o ”enter”.

Dessa forma você não precisa perder tempo desenvolvendo pequenos


cálculos. A planilha eletrônica já faz isso por você. Agora é sua vez. Observe o
exercício abaixo e tente realizá-lo utilizando a planilha eletrônica.

Exercício:
Tomando o exemplo acima como base, construa uma tabela orçamentária para
o hotel Brasil, mês a mês, em relação aos produtos de limpeza que o hotel precisa
adquirir para manter todos os quartos e ambientes limpos. Considere o hotel como
sendo de médio porte. Para mensurar, faça estimativas e utilize seus conhecimentos
já adquiridos na área da hotelaria. Ah! Lembre-se de calcular o total dos materiais
utilizados.
Além das tabelas, os gráficos também podem ser desenvolvidos por meio
de planilhas eletrônicas. Veremos a seguir como construí-los a partir de tabelas
conhecidas.

INTRODUÇÃO TÓPICO 2 13
GRÁFICOS
De acordo com Moraz (2006, p. 96) “uma planilha é interpretada com
maior clareza quando os dados mais importantes são destacados com ferramentas
de formatação”. Os gráficos são, portanto, um fator de relevância para os dados
apresentados no formato de tabelas.
Existem situações nas quais as tabelas são repletas de palavras, dados e
números, dificultando a compreensão e a análise da informação. Os gráficos têm
como objetivo facilitar a compreensão dessas informações.
Veremos a seguir como construir elementos gráficos utilizando planilhas
eletrônicas a fim de que você possa complementar as informações fornecidas pelas
tabelas desenvolvidas.
Geralmente, as planilhas eletrônicas vêm com um assistente de construção de
gráficos automático. Para construí-los adequadamente, siga os passos apresentados
abaixo:
1. Selecione com o cursor a tabela de dados;
2. Clique sobre o botão Assistente de gráficos, localizado na barra de
ferramentas;
3. Escolha o tipo de gráfico que você gostaria de desenvolver. Neste caso,
existe uma variedade deles: colunas, barras, linha, setor, entre outros. Feita a
escolha, clique em Avançar;
4. Veja a visualização prévia do gráfico desenvolvido que é exibida. Se
considerar que as informações não estão corretas, você pode modificar a série de
linha para coluna ou vice-versa ou cancelar o processo. Caso esteja tudo correto,
você pode clicar em Avançar;
5. Agora é a vez de inserir o título do gráfico e os rótulos para os eixos x
(horizontal) e y (vertical). Completada essa fase, clique em Avançar;
6. Clique em Concluir e você terá seu gráfico pronto para ser utilizado. É
importante perceber que qualquer alteração na tabela base também modificará o
gráfico de dados vinculado a essa tabela.
Vejamos um exemplo tomando como base a situação apresentada no exemplo
do tópico de tabelas.

Exemplo:
A tabela utilizada para a construção do gráfico precisou ser simplificada para
facilitar a confecção do gráfico. Observe que foram utilizados apenas dois tipos de

14 Estatística Aplicada
alimentos que apresentam as mesmas unidades de comparação. O rótulo de cada
coluna também foi alterado, bem como o título da tabela.
Pão Frutas
Janeiro 100 50
Fevereiro 150 75
Março 80 40
Abril 70 35
Maio 60 30
Junho 50 25
Julho 100 50
Agosto 80 40
Setembro 50 25
Outubro 30 15
Novembro 50 25
Dezembro 100 50
Tabela 2 – Quantidade de pão e frutas consumidos no café da
manhã pelos hóspedes do hotel Brasil em 2007

Realizando todos os passos apresentados anteriormente, o gráfico construído


se apresenta da seguinte forma:

Gráfico 1 – Gráfico de colunas baseado nos dados do tabela 2

O gráfico escolhido foi o de colunas. Você pode, dessa forma, comparar, mês
a mês, como ocorreu o consumo de pão e frutas no café da manhã no ano de 2007.
O “Alimentos consumidos pelos hóspedes do hotel Brasil em 2007” é
considerado o título do gráfico, e, “Unidade” e “Mês” são os rótulos utilizados
para os eixos y e x respectivamente.
Agora é a sua vez. Você vai construir um gráfico simples utilizando
informações retiradas de uma tabela de dados. Veja a proposta a seguir.

INTRODUÇÃO TÓPICO 2 15
Exercício:
Uma empresa de pesquisa colheu a opinião de 1.200 pessoas e, posteriormente,
elaborou um relatório especificando a preferência sobre qual região brasileira essas
pessoas gostariam de conhecer. Os valores constam no quadro abaixo.

Região brasileira Número de pessoas


Centro-Oeste 140
Sul 170
Norte 190
Sudeste 320
Nordeste 380
Total 1.200
Tabela 3 – Preferência de escolha das Regiões brasileiras

Construa um gráfico de sua preferência para representar os dados da tabela.


Lembre-se de seguir os passos apresentados neste tópico para construir seu gráfico
adequadamente.

Nesta aula você conheceu um pouco da história da Estatística e de sua


importância para o universo científico. Conheceu também as planilhas eletrônicas
e como podem ser utilizadas para o desenvolvimento de fórmulas matemáticas,
tabelas e gráficos. Nas próximas aulas, você estudará os conceitos básicos da
Estatística, bem como o desenvolvimento das tabelas mais utilizadas nessa área do
conhecimento.

16 Estatística Aplicada
AULA 1 Conceitos básicos
e distribuições de
frequência
Nesta aula estudaremos os conceitos básicos de Estatística. A compreensão
desses conceitos permitirá que você compreenda a importância de se desenvolver
um bom projeto de pesquisa a partir da definição da população, da amostra e
das variáveis a serem utilizadas. Além disso, você aprenderá a organizar os dados
coletados em tabelas específicas e a iniciar suas análises preliminares sobre o
estudo estatístico a ser desenvolvido.

Objetivos

• Desenvolver e aplicar os conceitos básicos de Estatística


• Organizar e analisar informações utilizando tabelas de distribuição de
frequência

AULA 1 17
TÓPICO 1
Conceitos básicos

O bjetivos
• Definir os conceitos de população e amostra
• Definir o conceito de variável
• Classificar variáveis

N este tópico estudaremos os conceitos básicos da Estatística,


sem os quais seria inviável sua aplicação. Para compreendê-
los, é necessário estar atento a acontecimentos do cotidiano e
à possibilidade de visualizar e compreender o fenômeno turístico em diferentes
situações. Os conceitos básicos para a compreensão do conteúdo são os conceitos
de População, Amostra e Variáveis.
De acordo com Tiboni (2003, p. 15), população é “o conjunto da totalidade
de indivíduos que apresentam uma característica comum, cujo comportamento se
quer analisar”. A população seria, portanto, um conjunto que forma o universo de
estudo.
Se você quisesse pesquisar, por exemplo, a nacionalidade dos turistas
brasileiros, o que você acharia de consultar todos os turistas que chegam ao Brasil,
seja por terra, água ou ar? Seria difícil ter esse controle absoluto, não é verdade?
Para realizarmos estudos nessa perspectiva, devemos fazer uso do que
chamamos de amostra. Para Tiboni (2003, p. 15), amostra “é um subconjunto finito
de uma população”. Ela é utilizada quando a população apresenta muitos elementos
e seu estudo se torna inviável.

18 Estatística Aplicada
Poderíamos, então, diante da população
de turistas estrangeiros que visitam o Brasil,
escolher uma amostra que pudesse viabilizar o at e n ç ão!
estudo a ser realizado. Dessa forma, poderíamos O trabalho da Estatística é voltado principalmente
reduzir nossa população ao escolher apenas para as pesquisas com amostras, muito mais do
cinco dos principais aeroportos brasileiros que que para aquelas que envolveriam populações
recebem turistas estrangeiros. Teríamos, assim, completas. A compreensão dessa especificidade é
uma amostra dessa população composta por um de fundamental importância para a utilização dos
número menor de elementos a serem analisados. recursos dessa ciência.

Somente as amostras não são suficientes


para definir uma investigação a partir de análises
estatísticas. É necessário que sejam definidas as variáveis do estudo. Para Tiboni
(2003, p. 15), variáveis “são as características que podem ser observadas (ou
medidas) em cada elemento da população”.
No caso da população de turistas estrangeiros, poderíamos definir variáveis
como: idade, estado civil, nacionalidade, sexo, frequência de visitas ao Brasil,
escolha da capital brasileira, entre outros. Cada uma delas representa uma
característica a ser observada e estudada. A escolha dessas variáveis dependeria
muito do tipo de estudo que você desejasse desenvolver.
Sua pergunta poderia ser: Que tipo de turista estrangeiro frequenta o
litoral cearense? Você poderia classificá-lo em relação ao sexo. Sua resposta seria
dada em função dos tipos sexuais masculino ou feminino. Você poderia também
classificá-lo em relação ao local de origem. Neste caso, você poderia delimitar os
continentes: Europa, África, Ásia, América e Oceania. De qualquer maneira, para
que seja possível o estudo estatístico de uma amostra, você precisa definir o que vai
investigar e quais são as variáveis a serem analisadas.
As variáveis podem ser qualitativas e quantitativas. No caso da situação
citada acima, sexo, estado civil, nacionalidade, escolha da capital brasileira são
variáveis qualitativas, pois são valores expressos por um atributo. O que se
caracterizaria como variável quantitativa? A idade e a frequência de visitas ao
Brasil, por exemplo. A maioria dos valores expressos por números é representada
por variáveis quantitativas.
As variáveis qualitativas se classificam em nominais e ordinais. O estado
civil, por exemplo, é uma variável qualitativa nominal, porque, ao dizer que
uma pessoa é casada, solteira ou divorciada, não existe uma ordem de classificação.

AULA 1 TÓPICO 1 19
Porém, ao definir a variável qualitativa nível de instrução, trabalhamos com os
resultados: ensino fundamental, médio e superior dentro de uma ordenação de
resultados baseados no número de anos de escolaridade do indivíduo. Dessa
forma, diferentemente da variável nominal, a variável ordinal apresenta como
característica a ordenação dos resultados.
As variáveis quantitativas podem ser classificadas em variável contínua
e variável discreta. A frequência de visitas do turista estrangeiro ao Brasil se
classifica como uma variável quantitativa discreta, porque você diz que o turista
visitou um determinado lugar 1 vez, 2 vezes, 3 vezes ou mais. Faz sentido dizer que
esse turista visitou Fortaleza 2,5 vezes? O que isso significa? Ou ele visitou 2 vezes
ou 3 vezes, não existe meio termo. Tiboni (2003, p. 16) afirma que uma variável
discreta é aquela que “assume apenas os valores
de um conjunto enumerável”. Bussab e Morettin
(2004, p. 10) complementam o conceito de
atenção!
variáveis quantitativas discretas ao dizerem que
• O conjunto dos números naturais é representado
“resultam, freqüentemente, de uma contagem”.
por N = {0, 1, 2, 3, 4, 5, ...}.
As variáveis discretas representam valores que
• O conjunto dos números inteiros é representado
são elementos do conjunto dos números naturais
por Z ={..., -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, ...}
ou conjunto dos números inteiros.
• O conjunto dos números reais é representado
Quantos reais um turista gasta com
por  ={..., -5, ..., -4, ..., -3, ..., -2, ..., -1, ..., 0,
..., 1, ..., 2, ..., 3, ..., 4, ..., 5, ...}. alimentação em uma viagem de 10 dias à
• As frações, por exemplo, ½ , ¾ , Fortaleza pode ser representado por uma variável
os números decimais, 0,25, 1,2333..., e, os quantitativa contínua. O turista pode gastar em
números irracionais, 2, p, 34, 5678... são média R$ 52,00 ou um pouco mais, R$ 52,35.
exemplos de números reais que não são naturais Entre o intervalo de R$ 52,00 e R$ 52,35 existem
nem inteiros. várias possibilidades de valores. Faz sentido
• O conjunto dos números racionais é representado dizer que esse turista gastou em média R$ 99,99
por Q e são todos os números que podem ser em alimentação, por exemplo? Diferentemente do
escritos na forma de uma fração, ou seja, na forma caso da variável discreta, esse valor faz sentido
a
, em que a e b são números inteiros e b ¹ 0 . nessa situação de variável contínua. Tiboni
b
Exemplos:
(2003, p. 16) afirma que uma variável contínua é
3 4 aquela que “assume inúmeros valores entre dois
; ;- 3;8;0,5;
10 5
limites”. As variáveis contínuas representam
Veja:
valores que são elementos do conjunto dos
-6 16 5
-3 = ;8 = ;0,5 = . números reais com exceção dos números naturais
2 2 10
e inteiros.

20 Estatística Aplicada
Exercício resolvido:
Está sendo realizado um estudo estatístico sobre os funcionários de hotéis
cinco estrelas do Ceará no qual são definidas as seguintes variáveis:
a) o grau de instrução;
b) a idade;
c) a naturalidade;
d) o número de línguas faladas; e
e) o salário mensal bruto.
Classifique essas variáveis em qualitativas (nominais ou ordinais) ou
quantitativas (discretas ou contínuas).

Solução:
a) O grau de instrução pode ser: fundamental, médio ou superior. Isso
significa que esses dados não são numéricos, caracterizando-o como variável
qualitativa. Como existe uma hierarquia entre os resultados, essa variável é ordinal.
b) A idade é uma variável que representa dados numéricos, por isso é
considerada uma variável quantitativa. Ela se classifica como variável discreta
porque a idade é representada por números naturais.
c) A naturalidade é uma variável qualitativa nominal, porque os dados por
ela representados não são numéricos e não dependem de uma ordem predefinida.
O funcionário pode ter nascido em Fortaleza, Caucaia, Quixeramobim, Limoeiro do
Norte, ou em qualquer outra cidade, sem necessidade de representação hierárquica
entre elas.
d) O número de línguas faladas é uma variável quantitativa discreta. Ela
representa números naturais, pois não é possível o profissional falar 2,3 línguas,
por exemplo. Ou ele fala uma determinada língua ou ele não fala, não existe meio
termo.
e) O salário mensal bruto é uma variável quantitativa contínua, geralmente
ela representa números decimais.

Agora que você já estudou população, amostra e variáveis, ou seja, já conhece


os conceitos básicos da Estatística, você está preparado para organizar os dados
coletados de uma amostra em tabelas especiais, as distribuições de frequência. Elas
nos ajudam a reconhecer o comportamento das variáveis a serem analisadas.

AULA 1 TÓPICO 1 21
TÓPICO 2
Distribuição de frequências

O bjetivos
• Conceituar distribuição de frequências
• Classificar as distribuições de frequências em absoluta,
relativa, absoluta acumulada e relativa acumulada
• Construir tabelas de distribuição de frequências

P ara que você possa compreender melhor o processo de análise de


dados estatísticos, é necessário que compreenda como os dados
coletados nas amostras são agrupados e organizados. Você já deve ter
percebido a necessidade da definição prévia das variáveis de estudo. São elas que
representam as características dos dados coletados. Para conhecer o comportamento
dessa variável, seja ela qualitativa ou quantitativa, é preciso analisar com que
frequência os dados estão distribuídos dentro dessa variável. É justamente esse
aspecto que estudaremos neste tópico.

FREQUÊNCIA ABSOLUTA
Os dados originais coletados e que não estão numericamente organizados
são considerados por Tiboni (2003) dados brutos. Quando você os organiza em
ordem crescente ou decrescente você transforma seus dados brutos em um “rol”
de informações.

Exemplo 1:
As idades de 10 jovens que viajam para Guaramiranga nas férias de julho são:
16, 15, 12, 17, 18, 15, 13, 17, 16, 15. Esses dados, desorganizados, são considerados
“dados brutos”.

22 Estatística Aplicada
Ao organizá-los, você tem o seguinte “rol” de informações em relação às
idades dos jovens: 12, 13, 15, 15, 15, 16, 16, 17, 17, 18.
É a partir do rol que você pode construir a distribuição de frequência dos
dados coletados.
De acordo com Tiboni (2003, p. 65), uma frequência é “a quantidade de vezes
que um mesmo valor de um dado é repetido”. Assim, no exemplo 1, a frequência
do número 12 é 1, enquanto a frequência do 15 é 3. Isso significa que, dos 10
alunos que viajam para Guaramiranga nas férias, 1 tem 12 anos, 3 têm 15 anos.
Para facilitar a visualização das repetições ocorridas para todas as idades,
faz-se necessária a construção de uma tabela que apresente a concentração de
jovens em cada faixa etária. Essa tabela é denominada “distribuição de frequência
absoluta”.

Exemplo 2:
Vejamos como ficaria a distribuição de frequência das idades dos 10 jovens
que viajam para Guaramiranga.
Frequência
Idade
Absoluta
12 1
13 1
14 0
15 3
16 2
17 2
18 1
Total 10
Tabela 1 - Distribuição da variável idade por frequência absoluta

Observe que a soma de todas as frequência resulta no total da amostra, 10


jovens.
Todos os tipos de variáveis podem ter uma tabela de distribuição de
frequências. No exemplo acima, foi construída uma tabela para a variável idade, uma
variável quantitativa discreta. Como seria então uma distribuição de frequências
para variáveis qualitativas? Vejamos o exemplo a seguir.

Exemplo 3:
Suponha que dos 10 jovens citados anteriormente, 4 estejam cursando
o ensino fundamental enquanto o restante cursa o ensino médio. Como seria a
distribuição de frequência para a variável grau de instrução?

AULA 1 TÓPICO 2 23
Frequência
Grau de instrução
Absoluta
Ensino fundamental 4
Ensino médio 6
Total 10
Tabela 2 – Distribuição da variável grau de instrução por frequência absoluta

Considerando que a variável grau de instrução é uma variável qualitativa


ordinal, podemos verificar como é a distribuição para esse tipo de variável.

Exemplo 4:
Suponha que esses jovens de férias busquem em Guaramiranga um local
para a prática de esportes radicais. Suponha também que a cidade ofereça apenas
quatro modalidades desses esportes: escalada, caminhada, “mountain bike” e pára-
quedismo. Veja como fica a distribuição de frequência para a variável esportes
radicais.
Frequência
Esportes radicais
Absoluta
Caminhada 5
Escalada 3
Mountain bike 2
Pára-quedismo 0
Total 10
Tabela 3 – Distribuição das modalidades de esporte
radical por preferência em frequência absoluta

É possível perceber, com essa distribuição,


sa iba mais !
que a modalidade mais escolhida foi a caminhada.
Para determinar a quantidade de classes (k), você Neste caso, a variável esportes radicais é
pode utilizar as seguintes regras, considerando n classificada como uma variável qualitativa
o número total de elementos da amostra: nominal e também pode ter desenvolvida uma
- Regra de Surges (Regra do logaritmo) distribuição de frequência.
k = 1 + 3,3log (n)
- Regra da potência de 2
k = menor valor inteiro tal que 2k ³ n Vejamos agora um exemplo no qual a
- Regra da raiz quadrada distribuição de frequência um a um pode não
k= n auxiliar na compreensão dos dados coletados.
- Regra sugerida por Bussab e Morettin (2004)
5 a 15 classes com amplitudes iguais

24 Estatística Aplicada
Exemplo 5:
Para a prática dos esportes radicais citados no exemplo 4, é necessária a
aquisição de roupas especializadas a serem ajustadas de acordo com a altura de
cada jovem. Foram, então, obtidos os seguintes resultados:
1,55m; 1,60m; 1,57m; 1,62m; 1,67m; 1,78m; 1,72m; 1,77m; 1,79m; 1,82m
Veja como ficaria a distribuição de frequência para a variável altura.
Altura Frequência
(m) Absoluta
1,55 1
1,57 1
1,60 1
1,62 1
1,67 1
1,72 1
1,77 1
1,78 1
1,79 1
1,82 1
Total 10
Tabela 4 – Distribuição da altura por frequência absoluta

O que nos revela esse tipo de distribuição?


Apenas que não existem integrantes nesse grupo
que tenham a mesma altura. Imagine que, se
tivéssemos 50 pessoas, cada qual com uma at e n ç ão!
altura diferente, ficaríamos com uma tabela de
As distribuições de frequência que apresentam
50 linhas. Você acha que seria fácil analisá-la?
classes são denominadas de distribuição de
Os estatísticos encontraram uma maneira mais
frequência com intervalos de classe.
simples de representar dados dessa natureza
agrupando-os no que chamamos de classe.
Dessa forma, classes são “agrupamentos
de valores num intervalo de abrangência” (TIBONI, 2003, p. 67).
Como escolher a melhor classe? Existem fórmulas matemáticas que auxiliam
na determinação da quantidade de classes a serem utilizadas. Muitas vezes, apenas
o bom senso é indicado para a determinação do intervalo de classes a ser utilizado.
Você deve levar em consideração que a nova representação deve contemplar
a forma como os valores se distribuem dentro da amostra coletada. Os dados não
podem estar tão dispersos quanto no tabela 4, mas, também, não podem estar
totalmente agrupados, com apenas 2 classes, sem representar adequadamente as
características dos dados coletados.

AULA 1 TÓPICO 2 25
Quando se utilizam classes numa distribuição de frequência, é necessário
determinar:
• os limites dessa classe;
• a amplitude do intervalo de classe;
• o ponto médio de cada classe.
Os limites de uma classe são representados pelos valores extremos de cada
classe, ou seja, seu limite inferior e superior. A amplitude do intervalo de classe
geralmente é calculada pela diferença entre os limites superior e inferior da classe.
O ponto médio é um ponto que apresenta distâncias iguais em relação a seus
extremos. Para obtê-lo, basta proceder da seguinte maneira:
a) Calcule a amplitude do intervalo de classe;
b) Divida o resultado por 2;
c) Acrescente o valor obtido ao limite inferior da classe.
No caso do exemplo 5, podemos utilizar 4 classes com amplitude de 0,10m,
ou seja, poderíamos agrupar os dados nos seguintes intervalos: [1,50; 1,60), [1,60;
1,70), [1,70; 1,80) e [1,80; 1,90). Teríamos, assim, uma distribuição de frequência
absoluta com intervalos de classe (cf. tabela 5).
Frequência
Classes Altura (m)
Absoluta
1ª 1,50  1,60 2
2ª 1,60  1,70 3
3ª 1,70  1,80 4
4ª 1,80  1,90 1
Total 10
Tabela 5 – Distribuição de classes por intervalo
de altura e frequência absoluta

No caso da 1ª classe, os valores 1,50 e 1,60


representam, respectivamente, o limite inferior
e o limite superior. Seu ponto médio seria
gu arde bem is so ! calculado da seguinte maneira:
a) Cálculo da amplitude da 1ª classe: 1,60
A escolha da distribuição com intervalos de classe
– 1,50 = 0,10
ou sem esses intervalos depende da quantidade 0,10
b) Dividindo por 2: = 0,05
de informação que você precisa analisar. Pode 2
c) Acréscimo do valor obtido ao limite
depender também do tipo de variável com a qual
inferior da classe: 0,05 + 1,50 = 1,55
você trabalha.
Geralmente na distribuição de frequência de
O valor obtido para o ponto médio da 1ª

variáveis quantitativas contínuas, os dados são


classe é 1,55 m. O ponto médio da classe é muito

distribuídos em intervalos de classe.


utilizado no estudo das medidas de posição e
de dispersão que estudaremos nas aulas 3 e 4. É

26 Estatística Aplicada
importante que você compreenda o conceito e os procedimentos necessários para
o desenvolvimento adequado das distribuições de frequência.

Exercício:
Definir os limites inferiores e superiores e seus respectivos pontos médios
para as outras classes (2ª, 3ª e 4ª) da distribuição da tabela 5.

A organização dos dados de forma absoluta nem sempre revela como a


variável se comporta dentro do contexto geral da situação abordada. Estudaremos
a seguir um tipo de frequência que pode resolver esse problema: a frequência
relativa.

FREQUÊNCIA RELATIVA
O estudo desse tipo de frequência é fundamental para que você possa
estabelecer valores a serem facilmente comparados.
A frequência relativa é definida como “a razão entre a frequência simples
e a frequência total” (TIBONI, 2003, p. 76). Podemos defini-la matematicamente da
seguinte forma:
Vejamos como podemos ampliar a capacidade de análise dos dados obtidos
utilizando a situação apresentada nos exemplos anteriores.

Exemplo 6:
f
fr =
n
fr → frequência relativa
f → frequência absoluta
n → nº de elementos da amostra

Considere novamente a distribuição de frequência das idades dos 10 jovens


que viajam para Guaramiranga.
Frequência Frequência
Idade
Absoluta Relativa
1 100
12 1 x100 = = 10%
10 10
1 100
13 1 x100 = = 10%
10 10

AULA 1 TÓPICO 2 27
0 0
14 0 x100 = = 0%
10 10
3 300
15 3 x100 = = 30%
10 10
2 200
16 2 x100 = = 20%
10 10
2 200
17 2 x100 = = 20%
10 10
1 100
18 1 x100 = = 10%
10 10
Total 10 100%

Tabela 6 – Distribuição da variável idade por frequência (absoluta e relativa)

É possível observar, com a inserção da frequência relativa, que:


• metade do grupo é formada por alunos entre 12 e 15 anos;
• apenas 10% do grupo têm direito à carteira de motorista;
• 90% do grupo precisam de autorização dos pais para viajar.

É por meio do estudo da frequência relativa que você consegue compreender


os dados de forma universal e observá-los dentro de contextos diferenciados,
ampliando, dessa forma, sua capacidade de análise.
Como seria o cálculo e a análise da frequência relativa para dados agrupados
em classes? Vejamos como esse conceito se aplica na situação apresentada
anteriormente.

Exemplo 7:
Segue no tabela 7 a distribuição de frequência da altura dos jovens que
viajam para Guaramiranga nas férias.
Frequência Frequência
Classes Altura (m)
Absoluta Relativa
2 200
1ª 1,50  1,60 2 x100 = = 20%
10 10
3 300
2ª 1,60  1,70 3 x100 = = 30%
10 10
4 400
3ª 1,70  1,80 4 x100 = = 40%
10 10
1 100
4ª 1,80  1,90 1 x100 = = 10%
10 10
Total 10 100%

Tabela 7 – Distribuição de classes por altura e frequência (absoluta e relativa)

28 Estatística Aplicada
É possível observar, com a inserção da frequência relativa, que:
• 70% dos jovens apresentam estatura entre 1,60m e 1,80m;
• apenas 10% do grupo têm estatura superior a 1,80m e, portanto, são
considerados altos em comparação à estatura dos brasileiros.

O que aconteceria se precisássemos calcular, no exemplo 6, quantos jovens


apresentam idade entre 12 e 16 anos? Certamente você efetuaria os cálculos da
seguinte forma: 1 + 1 + 0 + 3 + 2 = 7 pessoas. Porém, em estatística, geralmente
trabalhamos com grandes volumes de informação.
Essa simples operação de adição poderia
se tornar muito complexa e atrasar o andamento
de seu trabalho, inviabilizando os prazos
g u a r d e be m isso!
estipulados inicialmente se você precisasse, por A frequência relativa geralmente é apresentada
exemplo, somar mais de 100 parcelas. Como na forma de porcentagem.
contornar essa situação? Podemos utilizar A soma de todos os valores da frequência absoluta
as frequência acumuladas a partir dos dados deve ser igual à quantidade da amostra.
obtidos na frequência absoluta ou na frequência A soma de todos os valores da frequência relativa
relativa. deve ser igual a 100%.

FREQUÊNCIA ACUMULADA
Para obter uma frequência acumulada a partir de uma frequência absoluta,
basta adicionar a cada frequência absoluta os valores das frequência anteriores.
Vejamos a aplicação desse procedimento utilizando a situação apresentada
anteriormente.

Exemplo 8:
Considerando a distribuição de frequência absoluta em relação à variável
idade, podemos desenvolver a frequência acumulada conforme o tabela 8.
Frequência
Frequência
Idade Absoluta
Absoluta
Acumulada
12 1 1

13 1 1+1=2

14 0 2+0=2

15 3 2+3=5

16 2 5+2=7

AULA 1 TÓPICO 2 29
17 2 7+2=9

18 1 9 + 1 = 10

Total 10

Tabela 8 – Distribuição da variável idade por frequência


(absoluta e absoluta acumulada)

Caso haja necessidade de se conhecer


quantos alunos estão entre 12 e 16 anos, basta
atenção ! observar a frequência acumulada que você
encontrará o número 7. Você não precisa fazer
Você acredita que o total obtido na frequência
cálculos em todas as situações, a tabela já fornece
absoluta e o resultado obtido com a
essas informações para você.
última frequência absoluta acumulada são
Já que é possível calcular a frequência
coincidentemente iguais? Na realidade, esse
acumulada a partir da frequência absoluta,
fenômeno sempre acontece. Observe que, no
então também será possível calcular a frequê-
cálculo do total na frequência absoluta, todos
ncia acumulada a partir da frequência relativa?
os valores são somados de uma única vez. Na
Claro que sim. Os resultados obtidos com o
frequência acumulada, você vai observando os
cálculo da frequência acumulada relativa são
incrementos passo a passo, obtendo o mesmo
muito importantes para que você conheça bem
resultado ao final do cálculo.
o comportamento das variáveis e assim perceba
o momento em que os resultados representam a
maioria ou a minoria da amostra.

Exemplo 9:
Vamos considerar a distribuição de frequência relativa para a variável altura
e desenvolver a distribuição de frequência relativa acumulada.
Frequência
Frequência Frequência
Classes Altura (m) Relativa
Absoluta Relativa
Acumulada
1ª 1,50  1,60 2 20% 20%
2ª 1,60  1,70 3 30% 20% + 30% = 50%
3ª 1,70  1,80 4 40% 50% + 40% = 90%
4ª 1,80  1,90 1 10% 90% + 10% = 100%
Total 10 100%
Tabela 9 – Distribuição de classes por altura e frequência
(absoluta, relativa e relativa acumulada)

Com as informações obtidas no desenvolvimento da frequência relativa


acumulada, facilmente você percebe que metade da turma (50%) apresenta altura

30 Estatística Aplicada
entre 1,50m e 1,70m. É possível ainda constatar que a grande maioria do grupo
(90%) apresenta estatura baixa ou mediana em relação aos parâmetros brasileiros.
Cada distribuição de frequência apresenta uma característica importante
que auxilia na organização dos dados coletados e nas análises iniciais do estudo
estatístico em desenvolvimento. Para que você possa desenvolver uma distribuição
de frequê-ncias mais completa possível, é necessário que em sua tabela constem as
quatro frequência estudadas nesta aula:
• a distribuição de frequência absoluta;
• a distribuição de frequência absoluta acumulada:
• a distribuição de frequência relativa;
• a distribuição de frequência relativa acumulada.

Exercício resolvido:
(TIBONI, 2003, p.77 – adaptado) Numa agência de viagens X, foi feita uma
pesquisa sobre o salário recebido. Foram consultados 130 trabalhadores e obtidos
os seguintes resultados:

Número de Trabalhadores
Classes
salários mínimos (frequência absoluta)
1ª 1 3 18
2ª 3 5 24
3ª 5 7 21
4ª 7 9 19
5ª 9  11 15
6ª 11  13 14
7ª 13  15 11
8ª 15  17 5
9ª 17  19 3
Total 130
Quadro 1: Pesquisa sobre salário

Responda:
a) De forma absoluta, qual é a quantidade de salários mínimos recebida pela
maior quantidade de trabalhadores? E a de menor quantidade?
b) Quantos são os trabalhadores que ganham entre 1 e 13 salários mínimos?
c) Qual é a porcentagem de trabalhadores que ganham entre 17 e 19 salários
mínimos? O que isso pode representar?
d) Qual é o intervalo de salários mínimos recebidos pela maioria (75%) dos
trabalhadores?

AULA 1 TÓPICO 2 31
Solução:
Para que essas respostas sejam dadas, é necessária a confecção da distribuição
de frequência considerando as frequência absolutas, relativas e acumuladas.
Número Trabalhadores Frequência Frequência
Frequência
de salários (frequência absoluta relativa
relativa
mínimos absoluta) acumulada acumulada
1 3 18 18 13,8% 13,8%
13,8% + 18,5% =
3 5 24 18 + 24 = 42 18,5%
32,3%
32,3% + 16,2% =
5 7 21 42 + 21 = 63 16,2%
48,5%
48,5% + 14,6% =
7 9 19 63 + 19 = 82 14,6%
63,1%
63,1% + 11,5% =
9  11 15 82 + 15 = 97 11,5%
74,6%
74,6% + 10,8% =
11  13 14 97 + 14 = 111 10,8%
85,4%
111 + 11 = 85,4% + 8,5% =
13  15 11 8,5%
122 93,9%
93,9% + 3,8% =
15  17 5 122 + 5 = 127 3,8%
97,7%
97,7% + 2,3% =
17  19 3 127 + 3 = 130 2,3%
100%
Total 130 100%
Quadro 2: Distribuição de frequências da pesquisa sobre salário

a) De acordo com a frequência absoluta, 24 trabalhadores (maior quantidade


absoluta) recebem entre 3 e 5 salários mínimos. São 3 os trabalhadores (menor
quantidade absoluta) que recebem entre 17 e 19 salários mínimos.
b) Neste caso, basta observar a frequência acumulada na 6ª classe, entre 11 e
13. São 111 trabalhadores que ganham entre 1 e 13 salários mínimos.
c) Apenas 2,3% dos trabalhadores ganham entre 17 e 19 salários mínimos.
d) Basta observar a frequência relativa acumulada, 63,1%(maioria) dos
trabalhadores recebem entre 1 e 9 salários mínimos.
Neste tópico foram apresentadas formas diferentes de organização de dados
para diferentes tipos de informação. É importante você perceber que as distribuições
de frequência podem ser utilizadas não só para variáveis quantitativas, mas,
também, para variáveis qualitativas. Ao utilizar esse tipo de distribuição, você
pode organizar melhor os dados coletados e compará-los com a finalidade de iniciar
seu processo de análise.

32 Estatística Aplicada
g u a r d e be m isso!
Veja um resumo esquemático dos assuntos abordados nesta aula:

Figura 1 – Conceitos básicos da Estatística

Figura 2 – Distribuição de frequência

AULA 1 TÓPICO 2 33
AULA 2 Representação
gráfica

Os gráficos são utilizados em Estatística com a finalidade de representar os dados


organizados, permitindo ao leitor ou pesquisador uma visão abrangente do estudo
realizado. É possível, portanto, rapidamente e de forma resumida, informar como
uma variável se comporta dentro da amostra.

São muitos os gráficos utilizados em Estatística. Serão abordados nesta aula


apenas os mais simples e os frequentemente utilizados para análises superficiais
do evento estudado. Dentre eles encontram-se os diagramas, os gráficos polares,
os pictogramas, os histogramas e os polígonos de frequência. Cada um pode ser
construído considerando-se o tipo de variável utilizada e o que se quer demonstrar
sobre os dados coletados.

Objetivos

• Compreender como são construídos gráficos estatísticos


• Analisar gráficos estatísticos

34 Estatística Aplicada
TÓPICO 1 Diagramas, gráficos
polares e outros
O bjetivos
• Definir diagramas, gráficos polares, pictogramas e cartogramas
• Classificar diagramas, gráficos polares, pictogramas e
cartogramas
• Analisar diagramas, gráficos polares, pictogramas e cartogramas

D e acordo com Tiboni (2003, p. 43), os diagramas são “gráficos


dispostos num universo máximo de duas dimensões”. Isso
significa que, a princípio, os diagramas são gráficos construídos
no plano cartesiano para relacionar duas variáveis.
Se você quiser estudar, por exemplo, o aumento de turistas estrangeiros
no Brasil, será necessário trabalhar com duas variáveis: o número de turistas e o
tempo, em anos. Veja o gráfico a seguir.

Gráfico 1 – Número de turistas estrangeiros no Brasil – 2004 a 2007

AULA 2 TÓPICO 1 35
Observando o eixo x (eixo das abscissas – eixo horizontal), você verifica
que ele é composto pelos anos de 2004 a 2007, ou seja, são os dados relacionados
à variável tempo. No eixo y (eixo das ordenadas – eixo vertical), você observa os
valores de 0 a 7 milhões, representados pela variável número de turistas.
Ao relacionar os elementos do eixo x com os elementos do eixo y, tem-se uma
nova informação. É possível determinar a cada ano quantos turistas estrangeiros
visitaram o Brasil. Assim, em 2004, sabe-se que 2 milhões de turistas estrangeiros
estiveram em nosso país. É perceptível também que houve um aumento do número
de turistas estrangeiros no Brasil. Passou, nesse período, de 2 milhões para 6,1
milhões de pessoas, em 2007, ou seja, 4,1 milhões de pessoas a mais em nosso
território.
É por meio desse tipo de representação que
você percebe rapidamente o comportamento de
atenção ! uma variável em relação à outra e pode avançar
em suas primeiras inferências e percepções sobre
Os diagramas geralmente são utilizados para
representação de variáveis qualitativas, nominais o evento estudado.
ou ordinais, e variáveis quantitativas discretas, Os diagramas podem ser classificados, de
com distribuições sem intervalos de classe. acordo com Tiboni (2003), da seguinte forma:
• Gráfico em colunas ou em barras;
• Gráfico em setores;
A autora cita, ainda, outros tipos de gráfico que também podem ser utilizados
para a representação de variáveis qualitativas. São eles:
• Gráfico Polar ou Radar;
• Pictogramas;
• Cartogramas.
Veremos a seguir as definições mais importantes e comumente utilizadas e
em quais contextos esses diagramas podem ser inseridos.

GRÁFICO EM LINHAS
O gráfico em linha (Gráfico 1) constitui uma aplicação do processo de
representação das funções num sistema de coordenadas cartesianas.
São frequentemente usados para representação de séries cronológicas com
um grande número de períodos de tempo. As linhas são mais eficientes do que as
colunas, quando existem intensas flutuações nas séries ou quando há necessidade
de se representarem várias séries em um mesmo gráfico.

36 Estatística Aplicada
GRÁFICO EM COLUNAS OU EM BARRAS
Os gráficos em colunas ou em barras são representados por retângulos.
No primeiro caso, o maior comprimento dos retângulos se encontra na posição
vertical. No segundo caso, o maior comprimento dos retângulos é representado na
posição horizontal.
Os gráficos permitem que o leitor tenha uma rápida visualização do
fenômeno estudado por meio de uma comparação entre a variável e suas respectivas
frequências.
Os retângulos apresentam características importantes e suas dimensões se
relacionam diretamente com os resultados obtidos no estudo das frequências da
variável determinada. Todos os retângulos devem apresentar a mesma largura,
enquanto sua altura deve ser proporcional às frequências apresentadas no gráfico.
Vejamos como isso acontece.

Exemplo:
Vamos estudar a quantidade de brasileiros que saem de viagem para o
exterior. Observe a distribuição de frequência representada no quadro abaixo:

Número de brasileiros
Ano
(em milhões)
5,2 2000
5,6 2001
4,5 2002
3,9 2003
3,5 2004
3,1 2005

Quadro 1: Número de brasileiros que saem em viagem


ao exterior – 2000 a 2005

Vejamos agora, como esses dados ficam representados no gráfico em colunas.

Gráfico 2 - Número de brasileiros que viajam


para o exterior – 2000 a 2005

AULA 2 TÓPICO 1 37
É importante você perceber que duas variáveis estão se relacionando,
a variável tempo e a variável número de brasileiros. Cada coluna representa a
quantidade de brasileiros que viajam para o exterior em um determinado ano
específico dentro de um limite que varia entre 2000 e 2005.
O que você pode concluir ao observar o gráfico? Primeiramente, o ano de
2001 foi o ano no qual os brasileiros mais viajaram para o exterior. A explicação
desse fenômeno não é apresentada no gráfico. Se você quiser compreender melhor
o que aconteceu nesse ano, será necessário fazer novas investigações estatísticas ou
outros tipos de investigação.
Você pode observar também que, após o ano de 2001, houve uma queda nas
viagens dos brasileiros ao exterior, e continuou nesse ritmo até o ano de 2005.
O que mais você consegue visualizar nesse gráfico (Gráfico 2)? Outras
observações ficam como exercício.
Como seria a configuração do gráfico em barras para essa mesma situação?
Certamente, poucas modificações precisam ser realizadas. Vejamos.

Gráfico 3 – Número de brasileiros que viajam para o exterior - 2000 a 2005

Observe que os retângulos modificaram sua posição. Você tem a impressão


que os retângulos estão na horizontal. Na realidade, a altura do retângulo ficou
constante, enquanto que sua largura apresentou diferentes valores. As variáveis
representadas pelos eixos x e y também sofreram uma inversão. No eixo y, tem-se,
neste momento, a representação da variável tempo; enquanto no eixo x, tem-se a
representação da variável número de brasileiros.
Qual das duas representações é a melhor para ser utilizada? Essa resposta
depende de vários aspectos. Um deles diz respeito à quantidade de informações
que você precisa apresentar no gráfico e o tamanho do papel de que dispõe. Outro
aspecto relevante é a melhor disposição da informação para o leitor diante dos
resultados obtidos. Algumas vezes, as colunas demonstram melhor os dados; em
outras, a representação no formato de barras é mais indicada.

38 Estatística Aplicada
Exercício:
Procure em jornais e revistas representações de informações no formato de
gráficos. Faça um levantamento das situações nas quais os gráficos em coluna são
utilizados. Faça o mesmo para os gráficos em barras.
Qual deles foi mais utilizado? Em quais situações o gráfico em colunas foi
mais útil? E o gráfico em barras?

Tão utilizados quanto os gráficos em barras e em colunas são os gráficos


em setores, especialmente na representação das frequências relativas. Este assunto
será abordado a seguir.

GRÁFICO EM SETORES
O gráfico em setores é comumente utilizado no formato circular ou de “pizza”
para representar “a composição, usualmente em porcentagem, de partes de um
todo” (BUSSAB; MORETTIN, 2004, p. 16).
O tamanho do raio do círculo você mesmo pode escolher. A escolha pode
depender também do local de apresentação. Caso você utilize apresentação em
slides, é necessário desenvolver um gráfico maior. Caso você apresente-o no papel,
ele pode ser menor. Geralmente, esse tipo de representação é utilizado para a
apresentação das frequências relativas de variáveis qualitativas.
Suponha que tenha sido realizada uma pesquisa sobre as opções de
hospedagem de turistas brasileiros quando visitam o Ceará. Veja o quadro 2
representativo das distribuições de frequência absoluta e relativa da variável local
de hospedagem.
Número de turistas
Local de hospedagem Frequência relativa
brasileiros
Hotéis 300 30%
Pousadas 500 50%
Casa de Amigos 150 15%
Outros 50 5%
Total 1.000 100%
Quadro 2— Distribuição das frequências absoluta e relativa por local de hospedagem

A representação gráfica dessa distribuição se encontra no gráfico 4 a seguir.


A área pintada do gráfico é proporcional às frequências da variável escolhida para
ser estudada. Observe que a área pintada relacionada à quantidade de pessoas que
escolheu “Pousadas” como hospedagem equivale à metade do círculo, o que seria
de se esperar já que essa quantidade equivale a 50% das pessoas entrevistadas.
Observe as demais situações e verifique essa relação entre a área pintada
do círculo e os dados obtidos com a frequência relativa. Veja que quanto maior a
porcentagem, maior a área.

AULA 2 TÓPICO 1 39
Gráfico 4 – Percentual de turistas brasileiros que freqüentam o
Ceará por local de hospedagem

Existem softwares que calculam a área


colorida automaticamente. Entretanto, se você
estiver numa situação na qual não poderá fazer
atenção ! uso do computador e necessitar desenvolver um
gráfico de setores, como você deve proceder?
Em relação ao exemplo da “regra de três” está se
É muito simples! Tudo se baseia na antiga e
usando 360°, pois trata-se do valor de graus que
conhecida “regra de três”. Para saber exatamente
possui esta circunferência.
que parte do gráfico você precisa pintar para
caracterizar, por exemplo, a quantidade de
pessoas que escolheu como hospedagem os hotéis do Ceará, você deve realizar os
seguintes cálculos:

1.000 ® 360 0 1.000 x = 300.360 0


300 ® x 108.000
x = = 1080
1.000

Você deve ter percebido que o número 1.000 representa o total de pessoas
entrevistadas, os turistas brasileiros que visitam o Ceará. E o que significa esse
360º? Você deve lembrar, das aulas de Geometria, que uma circunferência se
subdivide em 360 partes, cada qual com 1 grau. Pode-se, então, fazer corresponder
o total de pessoas, que é 1.000, com o total de graus que existe numa circunferência
que é 360º.
Como você quer saber quantos graus equivale ao número de pessoas que
escolheu hotel como opção de hospedagem, então a correspondência acontece entre
300 e um número desconhecido que denominei de x. Procedendo com os cálculos,
descobrimos que o ângulo do círculo correspondente a 300 pessoas equivale a 108º.
O que fazer agora? Trace uma circunferência, o mais correto possível. Em
seguida, escolha um raio qualquer e utilize o transferidor para medir o ângulo de

40 Estatística Aplicada
108º. Trace um novo raio e pinte o espaço interno entre os dois raios determinados.
Tente realizar essa tarefa no papel, como exercício. A figura 1 ilustra o passo
a passo para a construção de um gráfico de setores manualmente.

Figura 1 – Sequência da confecção manual do gráfico em setores

Como você pode perceber, o gráfico em setores é bastante útil na interpretação


dos dados e também muito utilizado na apresentação de resultados de pesquisa
em revistas e jornais. É importante salientar que, caso você tenha mais de sete
informações para representar em um gráfico, opte por outro formato. Tiboni (2003)
afirma que esse tipo de gráfico é melhor compreendido quando são representados
menos do que sete dados.

GRÁFICO POLAR
De acordo com Martins e Donaire (2006), os gráficos polares são utilizados
para representar séries cronológicas com certas características de periodicidade. É
possível ainda, de acordo com Tiboni (2003), comparar os valores da série com os
valores de sua média aritmética.
É possível, com a análise desse tipo de gráfico, conhecer a variação da
quantidade de turistas estrangeiros no Ceará durante um ano, identificando a
situação mês a mês, ou semana a semana. A variação da frequência mensal dos
funcionários de um hotel também pode ser explorada pelo gráfico polar ou radar.
Suponha que entre os meses de novembro de 2007 a fevereiro de 2008, os
típicos meses de férias escolares dos brasileiros, mais de 10.000 turistas tenham
visitado as praias de Caucaia: Icaraí, Tabuba, Cumbuco, entre outras. Observe a
distribuição de frequências absolutas que caracteriza essa visitação no quadro a
seguir.
Mês Número de turistas
Novembro 5.000
Dezembro 7.000

AULA 2 TÓPICO 1 41
Janeiro 9.000
Fevereiro 8.000
Março 2.000

Quadro 3— Distribuição da frequência absoluta de turistas brasileiros


que visitam o Ceará, por mês, do período das férias escolares

Verifique que a variável “número de turistas” está sendo analisada de acordo


com uma ordem cronológica determinada pela variável “mês”, por um período
determinado de novembro a março.
Com a observação dos dados representados no quadro, podemos perceber que
o mês de janeiro foi o mais procurado pelos turistas brasileiros. Com a observação
do gráfico polar, esses dados propõem uma compreensão diferenciada da situação.
Observe o gráfico 5.

Gráfico 5 – Gráfico polar do número de turistas brasileiros no Ceará – 2007/2008

É possível compreender mais rapidamente que a tendência dos turistas


brasileiros ao procurar as praias cearenses acontece com maior intensidade entre
os meses de dezembro a fevereiro. O turista pode, com esses dados, decidir visitar
as praias cearenses em meses mais movimentados ou pouco movimentados apenas
observando o gráfico polar.
Além dos gráficos e tabelas vistos, existem outras formas de representação
gráfica. Apresentamos, entre elas, os cartogramas e os pictogramas.
Os cartogramas são “ilustrações relativas a cartas geográficas, em que as
representações são feitas diretamente sobre o desenho de uma área geográfica”
(TIBONI, 2003, p. 51).

42 Estatística Aplicada
Figura 2 – Exemplo de Cartograma
Fonte: Martins; Donnaire, 2006, p. 96

Os pictogramas são “representações gráficas ilustradas por figuras”.


(TIBONI, 2003, p. 52).

Figura 3 – Exemplos de Pictogramas


Fonte: Martins; Donaire, 2006, p. 95

Neste tópico você aprendeu sobre os gráficos utilizados para representação


de dados cujas variáveis se classificam como qualitativas ou quantitativas discretas.
Você adquiriu, portanto, alguns conhecimentos básicos para escolher um ou
outro gráfico de forma justificada. Estudaremos no próximo tópico, gráficos que
representam as variáveis quantitativas contínuas.

GLOSSÁRIO
Plano cartesiano – plano cujos pontos são localizados por meio de um sistema de
coordenadas cartesianas (IMENES & LELLIS, 1998, p. 235).
Coordenada cartesiana – são dois números que
indicam a localização de um ponto no plano cartesiano.
(IMENES & LELLIS, 1998, p. 81)
No quadro, o ponto P tem coordenadas 1 e 3:
A coordenada 1 dá a posição em relação ao eixo x, eixo
horizontal, e é denominada de abscissa.
A coordenada 3 dá a posição em relação ao eixo y, eixo
vertical, e é denominada de ordenada.

AULA 2 TÓPICO 1 43
TÓPICO 2
Histograma e polígonos de
frequência
O bjetivos
• Definir histogramas e polígonos de frequência
• Analisar histogramas e polígonos de frequência

N este tópico são apresentados os gráficos que representam variáveis


quantitativas contínuas. Os histogramas e polígonos de frequência
são comumente utilizados para este fim.
Em interpretações gráficas e análises estatísticas, esse tipo de representação
gráfica é uma das mais utilizadas, sobretudo quando a distribuição de frequência é
desenvolvida a partir da determinação de classes.
A construção dos polígonos de frequência pressupõe a construção prévia dos
histogramas. Por este motivo, fique atento ao conceito de histograma e como ele
deve ser desenvolvido. A compreensão dos polígonos de frequência será facilitada
se você tiver uma boa compreensão sobre o assunto.

HISTOGRAMA
Tiboni (2003) afirma que um histograma é um diagrama em colunas, ou seja,
um gráfico formado por retângulos verticais, um ao lado do outro. Um histograma
também pode ser definido como um gráfico formado por retângulos justapostos.
Assim, ao construir o histograma, cada retângulo deverá ter área proporcional à
frequência relativa (ou à frequência absoluta, o que é indiferente) correspondente.
No caso em que os intervalos são de tamanhos (amplitudes) iguais, as alturas dos
retângulos serão iguais às frequências relativas (ou iguais às frequências absolutas)
dos intervalos correspondentes. Neste momento, você pode estar se perguntando:
Qual é a diferença então entre um gráfico em colunas e um histograma?

44 Estatística Aplicada
A diferença é que no gráfico em colunas você representa dados de variáveis
qualitativas ou quantitativas discretas, enquanto no histograma os dados são
representados por variáveis quantitativas contínuas. No exemplo citado no item
1.2 do tópico 1, para cada ano apresentado, você dispunha de uma quantidade de
pessoas que viajam para o exterior.
Com o histograma, você pode analisar dados de variáveis contínuas. Observe,
na tabela a seguir, a distribuição de frequência das idades de 100 pessoas que se
hospedaram no Hotel “Ceará da Luz” no mês de dezembro de 2007.
Idades Quantidade de pessoas
16  18 10
18  20 20
20  22 25
22  24 15
24  26 25
26  28 5
Total 100
Tabela 1 – Distribuição de frequência da variável quantidade de pessoas
em relação à variável idade

Observe que a variável “idade” representa dados numéricos contínuos. A


distribuição é realizada em seis classes com amplitude 2, ou seja, contamos as
idades das pessoas de 2 em 2 anos. O histograma dessa distribuição de frequência
apresenta-se no gráfico a seguir.

Gráfico 6 – Histograma da variável quantidade


de pessoas em relação à variável idade

É possível observar rapidamente que a menor concentração de pessoas


acontece entre os 26 e 28 anos e as maiores concentrações, entre 20 e 22 anos, 24
e 26 anos. Além disso, as colunas não ficam espaçadas entre si. Num histograma,
o lado de um retângulo é o mesmo lado do próximo retângulo, até que todas as
colunas tenham sido utilizadas para a representação dos dados. Existe, portanto,

AULA 2 TÓPICO 2 45
uma justaposição dos retângulos.
Desenvolvendo uma observação mais apurada, constata-se que a base de
cada retângulo corresponde à amplitude de classe da distribuição de frequência. A
altura de cada retângulo é determinada pela frequência de cada classe, ou seja, pela
quantidade de pessoas para cada intervalo de idade.
É possível, também, por meio da análise do histograma, visualizar a
frequência relativa da variável idade, de tal forma que, em um mesmo gráfico,
fiquem determinados tanto a frequência absoluta, quanto a frequência relativa
dessa variável. Observe o gráfico seguinte.
Gráfico 7 – Histograma de distribuição de frequência absoluta e relativa
da variável quantidade de pessoas em relação à variável idade

Os histogramas, quando analisados isoladamente, fornecem informações


básicas a respeito dos dados coletados. Porém, eles possibilitam que uma nova
ferramenta seja incorporada: o polígono de frequência. Com essas duas ferramentas
gráficas, a análise dos dados se torna mais eficaz para que maiores informações
sejam incorporadas ao estudo realizado.

POLÍGONOS DE FREQUÊNCIA
Um polígono de frequência é um gráfico representado pela união de várias
linhas retas. Essas linhas são obtidas pela união dos pontos médios da parte superior
de cada retângulo do histograma. Observe o gráfico a seguir, desenvolvido a partir
dos dados do gráfico representado no gráfico 8.

46 Estatística Aplicada
Gráfico 8 – Polígono de frequência do histograma representado
no gráfico 6 do tópico anterior

Com a observação do polígono de frequência, você pode observar que o


Ceará atrai visitantes mais jovens, pois a concentração maior de turistas recai
sobre a faixa etária que antecede os 23 anos. Sem a utilização desse recurso essa
informação não seria tão visível.
É possível também construir um polígono de frequência acumulada, o que
ainda não tínhamos realizado. A base do retângulo continua se referindo às classes
da distribuição. A área do retângulo passa a determinar a frequência acumulada da
variável em estudo, e não mais a frequência absoluta. Observe no gráfico seguinte
como ficaria a situação do exemplo anterior.

Gráfico 9 – Polígono de frequência acumulada do histograma


representado na Figura 11

Observe que, neste tipo de gráfico, você pode visualizar como acontece o
crescimento da variável idade. A maior inclinação da linha reta aconteceu entre os
20 e 22 anos. Isso significa que o maior crescimento aconteceu nessa faixa etária.
O mesmo não aconteceu entre os 26 e 28 anos, denotando o menor incremento de
pessoas dessa faixa etária.

AULA 2 TÓPICO 2 47
Para o tratamento da informação e sua
representação gráfica, é necessário que se
você s abia?
realizem as escolhas de forma adequada e
O nome dado ao polígono de frequência coerente. Os tipos de variáveis estudados na aula
acumulada é OGIVA DE GALTON. 1 são determinantes nessa escolha. Histrogramas
Galton (1822-1911) foi um cientista inglês, primo e polígonos de frequência absoluta ou acumulada
de Charles Darwin, que estudou a hereditariedade são geralmente utilizados para representação
e a inteligência humana. Desenvolveu estudos não de variáveis quantitativas contínuas. Porém,
só relativos aos aspectos biológicos, mas, também, existem autores que afirmam que esse fato não
aos aspectos matemáticos, entre eles os processos é absoluto.
estatísticos que viriam a auxiliar seus estudos na Para quem vai desenvolver uma análise ou
área da Biologia. um estudo superficial sobre dados estatísticos,
essas informações são úteis e ajudam a inseri-
lo no contexto dessa ciência. Para quem deseja
se aprofundar nos estudos estatísticos, é necessário buscar informações mais
detalhadas em diversas fontes.
Veja um resumo esquemático dos assuntos abordados nesta aula:

Figura 4 – Resumo das representações gráficas em Estatística

48 Estatística Aplicada
Na próxima aula, estudaremos alguns instrumentos de análise que auxiliam
no aprofundamento da compreensão do fenômeno estudado. São eles: média,
mediana, moda e quantis.

AULA 2 TÓPICO 2 49
AULA 3
Medidas de posição:
tendência central

Como vimos nas aulas anteriores, as tabelas de frequência e os gráficos fornecem


muitas informações acerca do comportamento de uma variável em estudo. Bussab
e Morettin (2004) complementam que esses recursos estratégicos revelam muito
mais informações do que a tabela original de dados.

Em algumas situações, existe a necessidade de uma redução maior dos dados


coletados. Para que essa redução aconteça de forma coerente, é necessário que
sejam estabelecidos valores representativos de todos os dados obtidos.

As médias aritmética e ponderada, a mediana e a moda geralmente são utilizadas


como valores representantes de uma amostra de dados coletados. Nesta aula,
estudaremos esses novos conceitos e suas aplicações em pesquisas que tenham
como objeto de estudo o turismo e a hotelaria.

Objetivos

• Conhecer as medidas de posição que retratam a tendência de distribuições


de variáveis qualitativas e quantitativas
• Calcular as medidas de posição: média, mediana e moda

50 Estatística Aplicada
TÓPICO 1
Médias aritméticas: simples e
ponderada
O bjetivos
• Conceituar média aritmética
• Desenvolver os cálculos de médias aritméticas simples e
ponderadas
• Reconhecer as situações nas quais as médias aritméticas simples
e ponderadas devem ser aplicada

N este tópico apresentaremos as médias mais conhecidas,


geralmente estudadas na escola básica, as médias aritméticas
simples e ponderada. Apesar de serem bastante conhecidas, elas
serão aplicadas em diferentes contextos, envolvendo ainda os conceitos de variável
e distribuição de frequência apresentados na aula 1. O importante é você perceber
que um conhecimento antigo pode ser utilizado de uma forma diferente, agregando
novos conhecimentos.

MÉDIA ARITMÉTICA SIMPLES


A média aritmética simples é utilizada quando os dados não estão
agrupados. Diante de uma série de valores numéricos, não existe uma variação
muito grande entre o menor e o maior número.
Essa média é calculada “por meio da divisão entre a soma dos valores pelo
número total de valores” (TIBONI, 2003, p. 104), de acordo com a fórmula abaixo:
___ x1 + x2 + x3 + ... + x n
X=
n
___
X representa a média aritmética simples, x1 , x2 , x3 ,..., xn representam
os valores qualquer da série numérica utilizada e n o número de valores que essa
série contém. Vejamos um exemplo.

AULA 3 TÓPICO 1 51
Suponha que os lucros de um hotel, durante o primeiro semestre deste ano,
tenham acontecido de acordo com o que mostra o tabela 1 abaixo. Qual seria a
média aritmética dos lucros nesse período?
Meses Lucros
Janeiro R$ 15.000,00
Fevereiro R$ 14.900,00
Março R$ 14.800,00
Abril R$ 15.500,00
Maio R$ 13.900,00
Junho R$ 14.200,00
Tabela 1 – Lucros do hotel durante o primeiro semestre do ano

Para encontrar o valor da média aritmética, é necessário proceder da seguinte


maneira, utilizando a fórmula apresentada anteriormente.
___ 15.000, 00 + 14.900, 00 + 14.800, 0 + 15.500, 00 + 13.900, 00 + 14.2000, 00
X=
6
___ 88.300, 00
X= = 14.716, 67
6
Perceba que o valor obtido na média, R$ 14.716,67, não pertence ao grupo
de valores que constituem a série numérica representativa da variável lucro. Esse
resultado apresenta apenas um resumo dos dados obtidos.
Como a soma dos lucros foi dividida igualmente em 6 partes, o valor de
14.716,67 poderia ser substituído pelos valores de cada mês. A média, neste caso,
continuaria sendo a mesma.
Observe também que a distância entre o valor mínimo e o valor máximo não
apresenta uma diferença grande. Essa distância pode ser calculada como 15.500,00
– 13.900,00 = 1.600,00, um valor bem pequeno em relação ao menor dos valores
da variável lucro.
A média aritmética simples é, portanto, recomendada neste caso, pois, como
vimos, os dados não estão representados por grupos, isto é, não são agrupados.
Como proceder então quando os dados estiverem agrupados ou quando
estiverem apresentados em intervalos de classe? Autores como Tiboni (2003),
Martins e Donaire (2006) consideram que a média aritmética ponderada, nestes
casos, é a mais indicada.

MÉDIA ARITMÉTICA PONDERADA


Esse tipo de média é calculado de maneira semelhante àquele utilizado para
o cálculo da média aritmética simples. Os dados, porém, encontram-se ponderados,
ou seja, não são considerados todos com pesos iguais.

52 Estatística Aplicada
Tanto no caso dos dados agrupados, quanto nos dados apresentados com
intervalos de classe, essa ponderação se caracteriza pelo número de repetições de
cada valor apresentado, ou seja, pela sua frequência absoluta. Assim, a fórmula
para o cálculo da média aritmética ponderada se apresenta da seguinte maneira:
___ x1 . f1 + x 2 . f 2 + x3 . f 3 + ... + x n . f n
X =
f1 + f 2 + f 3 + ... + f n
___
Na fórmula acima, X representa a média aritmética ponderada,
x1 , x2 , x3 ,..., xn representam os valores qualquer da série numérica utilizada e
f1 , f 2 , f 3 ,..., f n representam as respectivas frequências desses valores. Vejamos
um exemplo.
Numa pesquisa realizada por uma empresa turística, foram entrevistadas
200 famílias, que expressaram sua opinião em relação ao número de refeições que
deveriam estar inclusas na diária dos hotéis e pousadas. Observe o tabela 2.
Número de refeições Frequência
1 30
2 80
3 55
4 20
5 15
Tabela 2 – Distribuição da preferência por número de
refeições em hotéis ou pousadas

O cálculo da média aritmética ponderada, ou apenas, média ponderada é


apresentado da seguinte forma:
___ 1.30 + 2.80 + 3.55 + 4.20 + 5.15 30 + 160 + 165 + 80 + 75
X= =
30 + 80 + 55 + 20 + 15 200
___ 510
X= = 2, 55
200
É importante perceber que não podem ser consideradas 2,55 refeições. Neste
caso, por uma questão de arredondamento, o resultado passa a ser 3 refeições. Isso
significa que a tendência das famílias é escolher hotéis ou pousadas que ofereçam
três refeições inclusas no pagamento da diária.
Quando são utilizados dados agrupados com intervalos de classe, a média
aritmética ponderada é calculada da mesma maneira. Por outro lado, existe uma
especificidade a ser considerada. Vejamos o exemplo a seguir.
Considere que, para a construção de um hotel, seja necessário conhecer a
estatura de seus futuros hóspedes. É realizada, portanto, uma pesquisa com 250
turistas, cujos resultados são apresentados no tabela 3.

AULA 3 TÓPICO 1 53
Classe Estatura Frequência
1 150  155 10
2 155  160 20
3 160  165 50
4 165  170 60
5 170  175 50
6 175  180 40
7 180  185 15
8 185  190 5
Tabela 3 – Estatura dos turistas por classe e frequência

Como proceder o cálculo da média se não é possível determinar um único


valor para as estaturas dos turistas em cada classe? A resposta é muito simples.
Basta que você utilize como parâmetro o ponto médio de cada classe. Isso significa
que, antes de realizar o cálculo da média ponderada, você deverá determinar a
média aritmética simples para cada classe.
No caso da 1ª classe, o ponto médio será determinado da seguinte maneira:
155 - 150 5
ponto médio = 150 + = 150 + = 150 + 2,5 = 152,5
2 2
Vejamos o mesmo procedimento para a 2ª classe:
160 - 155 5
ponto médio = 155 + = 155 + = 155 + 2,5 = 157,5
2 2

Deixaremos como exercício o cálculo dos pontos médios das demais classes.
O tabela 4, a seguir, demonstra os resultados do tabela 3 acrescidos dos pontos
médios de cada classe.
Classe Estaturas Frequência Ponto médio
1 150  155 10 152,5
2 155  160 20 157,5
3 160  165 50 162,5
4 165  170 60 167,5
5 170  175 50 172,5
6 175  180 40 177,5
7 180  185 15 182,5
8 185  190 5 187,5

Tabela 4 – Distribuição da frequência e do ponto


médio por classe de estatura dos turistas

Agora podemos calcular a média ponderada utilizando os pontos médios


como parâmetros de cálculo.

54 Estatística Aplicada
___ 10 ×152, 5 + 20 ×157, 5 + 50 ×162, 5 + 60 ×167, 5 + 50 ×172, 5 + 40 ×177, 5 + 15×182, 5 + 5×187, 5
X=
10 + 20 + 50 + 60 + 50 + 40 + 15

___ 1525 + 3150 + 8125 + 10050 + 8625 + 7100 + 2737, 5 + 937, 5 42250
X= = = 169
250 2550

Chegamos, assim, ao seguinte resultado: em média, os turistas apresentam


estatura de 169 cm ou 1,69 m. Dessa forma, o hotel pode ser projetado de acordo
com essa informação. É claro que, acomodações para pessoas mais altas e mais baixas
devem ser consideradas, bem como para as pessoas que apresentam necessidades
especiais. Conhecer a estatura média do futuro hóspede pode auxiliar em escolhas
mais gerais e abrangentes do negócio que se pretende desenvolver.
Nesses dois casos anteriores, a ponderação é necessária e relevante para o
estudo da situação proposta. Realizar média aritmética simples da estatura dos
turistas, futuros hóspedes, poderia não ser produtivo para esse caso, pois os
resultados poderiam não se apresentar condizentes com a realidade.
As médias aritméticas, sejam elas simples ou ponderadas, nem sempre
retratam a realidade de forma adequada. Existem situações em que os dados não
são apresentados de maneira tão uniforme e linear como nos exemplos acima
citados. Nesses casos, então, o recomendável seria a aplicação da média geométrica
ou da média harmônica.
A média geométrica deve ser utilizada, de acordo com Martins e Donaire
(2006), em situações nas quais os dados se caracterizam segundo uma progressão
geométrica. Períodos inflacionários, em que os preços dos produtos aumentam em
larga escala em curtos intervalos de tempo, podem ser bem caracterizados pela
média geométrica.
O cálculo da média geométrica ponderada, o mais indicado nesses casos, e
___
___
é desenvolvido da seguinte maneira: X g = n x1f 1 .x 2f 2 .x3f 3 ... x nfn . X g representa
a média geométrica ponderada, representam os valores da distribuição,

x1 , x2 , x3 ,..., xn representam as frequências relativas a cada valor da distribuição


e n o número de elementos que contém essa distribuição.
A média harmônica deve ser utilizada, ainda de acordo com Martins e Donaire
(2006), para valores inversamente proporcionais. O tempo médio de escoamento de
estoques, o custo de bens comprados com um valor fixo são exemplos de situações

AULA 3 TÓPICO 1 55
cujos valores se relacionam entre si de forma inversa. No caso do escoamento de
estoques, quanto maior o tempo, menor o estoque.
Para calcular uma média harmônica, neste caso ponderada, é necessário
utilizar a fórmula:
___
n
Xh =
f1 f 2 f 3 f
+ + + ... + n
x1 x2 x3 xn
___
X h representa a média harmônica ponderada, representam os valores da
distribuição, x1 , x2 , x3 ,..., xn representam as frequências relativas a cada valor
f1 , f 2 , f 3 ,..., f n da distribuição e n o número de elementos que contém essa
distribuição.

Estudamos neste tópico os conceitos e procedimentos de cálculo de médias


aplicáveis em situações nas quais as variáveis são quantitativas contínuas ou
discretas. Há, ainda, o caso das variáveis qualitativas, nas quais é necessária a
média para calcular uma medida de tendência central. Nestes casos, a mediana e a
moda podem ser utilizadas. Vamos conhecer essas duas modalidades de medida de
posição nos próximos tópicos.

56 Estatística Aplicada
TÓPICO 2
Mediana

O bjetivos
• Conceituar mediana
• Calcular a mediana de dados agrupados e não
agrupados

N este tópico estudaremos o conceito de mediana, em quais


contextos podemos utilizá-la e como deve ser calculada.
A mediana é também uma medida de posição considerada
como medida separatriz. Para Tiboni (2003), a mediana tem essa denominação
porque divide o conjunto de dados em duas partes, cada qual com números iguais
de elementos.
Geralmente essa medida de posição é utilizada em séries numéricas nas quais
valores grandes e pequenos coexistem na mesma série, diferentemente das médias
aritméticas que precisam ser utilizadas em situações em que os dados numéricos
sejam mais próximos uns dos outros.
A mediana pode ser bastante útil para os dados turísticos, porque, ainda de
acordo com Tiboni (2003), as séries numéricas apresentam extremos abertos, ou
seja, valores ainda desconhecidos. A autora cita o gasto turístico como um estudo
no qual é possível a utilização da mediana.
Bussab e Morettin (2004) colaboram apontando um aspecto importante para
a utilização da mediana, o caso do estudo de variáveis qualitativas. Nesse tipo
de situação, as médias não podem ser utilizadas. As medianas, porém, só podem
auxiliar no tratamento desses dados, se as variáveis em estudo forem ordinais,
quando puderem ser classificadas dentro de uma ordem estabelecida, conforme
abordado na aula 1.

AULA 3 TÓPICO 2 57
Existem três formas de calcular a mediana, considerando:
• dados não agrupados;
• dados agrupados sem intervalos de classe; e
• dados agrupados com intervalos de classe.
Vejamos os procedimentos para cada situação.

CÁLCULO DA MEDIANA: DADOS NÃO AGRUPADOS


Se a série numérica tiver um número ímpar de termos, a mediana é
determinada pelo termo de ordem n + 1 , na qual n é o número de termos que
2
contém a série numérica.
Se a série numérica tiver um número par de termos, a mediana é determinada
n n
pela média aritmética entre os termos de ordem e +1 .
2 2
Vejamos um exemplo.
O time de basquete masculino, mais altos hóspedes do hotel Brasil, é formado
por 5 integrantes com as seguintes estaturas: 1,95 m; 1,93 m; 1,90 m; 1,85 m;
1,87 m. A mediana da altura dos jogadores do time é calculada de acordo com os
seguintes passos:
1º ) Ordene os números em ordem crescente ou decrescente:
1,85 1,87 1,90 1,93 1,95
2º ) Como a seqüência numérica contém um número ímpar de termos, igual a
5 +1 6
5. A mediana será o termo de ordem igual a = =3
2 2
3º) Localize na seqüência 1,85 1,87 1,90 1,93 1,95 o 3º termo. A mediana
é igual a 1,90 m.
Observe se no 1º) passo tivéssemos colocado em ordem decrescente
chegaríamos ao mesmo valor da mediana.
Você não ficou curioso(a) para saber qual seria a média aritmética dessa série
numérica? Então, vamos calcular!
___ 1,85 + 1,87 + 1,90 + 1,93 + 1,95 9,5
X= = = 1,90m
5 5

Repare que a média e a mediana, neste caso, foram exatamente iguais. Esse
fato ilustra um aspecto muito importante. Como não existe uma discrepância grande
entre o menor e o maior valor da sequência e os dados se comportam de maneira
uniforme, o fato da mediana e da média terem praticamente o mesmo resultado já
era esperado.

58 Estatística Aplicada
Suponha agora que o time formado precise jogar vôlei. Os cinco integrantes
não resolverão o problema sozinhos, é necessário convocar mais um jogador. O
jogador convocado tem 1,88 m de altura. Qual seria o novo valor da mediana?
Vamos utilizar os mesmos passos:
1º ) Ordene os números em ordem crescente ou decrescente:
1,85 1,87 1,88 1,90 1,93 1,95
2º ) Agora, a sequência numérica contém um número par de termos, igual
a 6. Então a mediana será determinada pela média aritmética entre os termos de
6 6
ordem e + 1 , ou seja, será a média aritmética entre o 3º termo e o 4º termo.
2 2
3º) Localize na seqüência 1,85 1,87 1,88 1,90 1,93 1,95 o 3º e o 4º termo.
Você encontrará 1,88 m e 1,90 m.
4º) Calcule a média aritmética de 1,88 e 1,90. A mediana será igual a
1,88 + 1,90 3,78
= = 1,89m .
2 2
Com a inserção de um novo componente no grupo, a mediana se modificou.
Passou de 1,90m para 1,89m. É importante você compreender que a mediana
realmente é uma medida separatriz. Na situação do time de basquete, as pessoas
cujas alturas são menores do que 1,90m são considerados os baixos do time, ao
passo que, as alturas maiores do que 1,90m são os altos do time. Essas posições
são decisivas para a melhor posição do atleta na quadra para que o time seja o
vencedor do jogo.

CÁLCULO DA MEDIANA: DADOS AGRUPADOS SEM INTERVALOS DE


CLASSE
Neste caso, é necessário calcular primeiramente a localização da mediana
na série numérica da seguinte forma: f1 + f2 + f3 + ... + fn , na qual f1 a fn são as
2
frequência dos dados obtidos.
Localizada a mediana, é necessário ainda verificar o valor numérico que
corresponde a essa posição. Você encontra, então, o valor da mediana.
Suponha que no hotel Brasil existam, à disposição dos hóspedes, quartos
simples, duplos, triplos e para quatro pessoas. Feita uma pesquisa com 120
hóspedes sobre a preferência em relação aos tipos de quartos geralmente escolhidos,
constatou-se a preferência por acomodações para duas pessoas, conforme mostra o
tabela seguinte.

AULA 3 TÓPICO 2 59
Tipos de quartos Frequência
Simples 30
Duplo 41
Triplo 36
Quádruplo 13
Tabela 5 – Distribuição da frequência por tipo de acomodação

Para calcular a mediana, é preciso seguir os seguintes passos:


1º ) Calcule a localização da mediana na série numérica:
30 + 41 + 36 + 13 120
= = 60 . A mediana se localiza então na 60ª posição.
2 2
2º ) Localize a mediana na série. Para realizar essa localização, a frequência
absoluta não ajuda muito. Neste caso, trabalhar com a frequência acumulada facilita
a localização. Veja, então.

Tipos de Frequência
Frequência
quartos Acumulada
Simples 30 30
Duplo 41+30 71
Triplo 36+71 107
Quádruplo 13+107 120
Tabela 6 – Frequência (absoluta e acumulada) por tipo de quarto

De acordo com a análise da frequência acumulada, as ordens correspondentes


aos quartos duplos estão entre a 31ª e a 71ª. Dessa forma, a 60ª ordem se localiza
nesse intervalo. Portanto, o tipo do quarto que corresponde à 60ª ordem é o quarto
duplo.
Observe que pegamos o 60º termo porque o total de números é par (n=120).
Caso tivéssemos um valor de n ímpar, para calcular a mediana teríamos que fazer a
média dos termos (n/2) e (n/2 +1).
Observe que, neste caso, não houve a necessidade de ordenar os valores das
frequências absolutas como fizemos na situação do tópico 2.1. Por outro lado, a
inserção da frequência acumulada se tornou necessária para facilitar a observação
da ordem, minimizando possíveis erros.

CÁLCULO DA MEDIANA: DADOS AGRUPADOS COM INTERVALOS DE


CLASSE
Os dados com esse tipo de agrupamento são mais comuns e bastante utilizados
na estatística do turismo e hotelaria.

60 Estatística Aplicada
Primeiramente, divide-se a distribuição numérica em duas partes iguais
calculando-se n , independentemente de n ser par ou ímpar. Lembre-se de que
2
os dados agrupados com intervalos de classe geralmente apresentam variáveis
contínuas.
Em seguida, é necessário localizar a classe que contém a mediana por meio
da observação da frequência acumulada, como vimos anteriormente no tópico 2.2.
n 
 −∑ f  .h
A mediana é calculada, então, pela fórmula: Me = l + 
2  , na
f
qual Me é a mediana, l é o limite inferior da classe que contém a mediana, n é o
número total de elementos da série numérica, f é a frequência da classe que contém

a mediana, h é a amplitude da classe da mediana e ∑f é a soma de todas as


frequências anteriores à classe da mediana (MARTINS; DONAIRE, 2006).
Vejamos mais um exemplo que possa esclarecer possíveis dúvidas.
Considere um estudo realizado no hotel Brasil com 200 hóspedes sobre seus
gastos diários com alimentação.
Gastos com
Frequência
Classes alimentação/ Frequência
Acumulada
dia
1 40  50 15 15
2 50  60 40 55
3 60  70 50 105
4 70  80 95 210
Tabela 7 – Frequência (absoluta e acumulada) dos gastos diários
com alimentação por classes

Para calcular a mediana, é necessário proceder da seguinte maneira:


200
1º) Calcule a ordem da mediana: = 100 . Isso significa que a mediana
2
está na 100ª posição.
2º) Identifique a classe que contém a mediana observando a frequência
acumulada. É possível concluir que a mediana localiza-se na 3ª classe, pois esta
classe contém do 56º termo ao 105º termo (50 números).
3º) Determine as variáveis a serem aplicadas na fórmula.
l = 60, pois representa o limite inferior da classe da mediana;
f = 50, pois representa a frequência da 34ª classe;
h = 10, pois representa a amplitude da 4ª classe;

∑f = 55, pois representa a soma de todas as frequência que antecedem


a 3ª classe.

AULA 3 TÓPICO 2 61
n 
 − ∑ f  .h
4º) Aplique os resultados encontrados na fórmula Me = l +  2  .
f
Veja:

 200 
 − 55  .10
Me =60 + 
2  =60 +
(100 − 55) .10 =60 + ( 45) .10 =60 + 9, 0 =69, 0
50 50 50
A mediana, por ser uma medida de posição separatriz, dividiu, neste caso, os
tipos de hóspedes em relação à alimentação. Os que gastam menos de R$ 69,00são
aqueles que gastam pouco com alimentação, enquanto os que estão incluídos na
classe que registra valores superiores são os que mais gastam com alimentação.

Você conheceu neste tópico como trabalhar


com a mediana. Observe que a mediana além
atenção! de ser uma medida de posição também é uma

Quando n/2 coincidir com a frequência acumulada medida separatriz, dividindo a série numérica
de uma classe, o valor da mediana é igual ao limite em duas partes iguais. Estudaremos a seguir
superior desta classe. mais uma medida de posição: a moda.

62 Estatística Aplicada
TÓPICO 3 Moda
O bjetivos
• Conceituar moda
• Calcular a moda de dados agrupados e não agrupados

N este tópico estudaremos o conceito de moda, em quais contextos


podemos utilizá-la e como deve ser calculada.
A moda, apesar de ser uma medida de posição, não se
caracteriza como uma medida separatriz. De acordo com Martins e Donaire (2006,
p. 147), a moda “é o valor mais frequente de uma distribuição”. Tiboni (2003)
acrescenta que esse valor é denominado de valor modal.
Geralmente a moda é utilizada para o cálculo da medida de posição de forma
rápida e aproximada. Essa medida também é utilizada em distribuições nas quais o
valor mais frequente é o mais importante da distribuição. Bussab e Morettin (2004)
afirmam que a moda é muito útil para a determinação da medida de posição de
variáveis qualitativas nominais, ou seja, variáveis não numéricas que não podem
ser ordenadas.
Semelhantemente à mediana, o cálculo da moda ocorre de formas diferentes,
dependendo da situação em estudo. Dessa forma, o cálculo da moda pode ocorrer
para:
• dados não agrupados;
• dados agrupados sem intervalos de classe; e
• dados agrupados com intervalos de classe.
Vejamos os procedimentos para cada situação.

AULA 3 TÓPICO 3 63
CÁLCULO DA MODA: DADOS NÃO AGRUPADOS
Determinar a moda nessa situação é bem fácil e simples. Basta organizar os
dados e verificar o valor que apresenta o maior número de repetições. Vejamos um
exemplo.
Considere que, numa excursão para Ubajara, tenham comparecido 15 jovens
com idade entre 15 e 20 anos. Os dados coletados apresentaram os seguintes
resultados:
15 15 16 16 16 17 17 17 17 18 18 19 19 19 20
O valor do maior número de repetições é 17. Isso significa, portanto, que a
moda dessa distribuição é 17.
Se você calcular a mediana nessa situação, perceberá que ela também é igual
a 17. E a média aritmética, será também 17? Neste caso, é necessário proceder com
os cálculos adequadamente, da seguinte maneira:
___ 15 + 15 + 16 + 16 + 16 + 17 + 17 + 17 + 17 + 18 + 18 + 19 + 19 + 19 + 20 259
X= = = 17,27
15 15
Apesar de a média não ter sido exatamente 17, considera-se, por aproximação,
que a média das idades seja de 17 anos. Esse resultado já era esperado devido ao
comportamento uniforme da distribuição, sem grandes distorções.
É necessário estar atento, no caso do cálculo da moda, ao maior número de
repetições de um determinado valor na distribuição dos dados.
Suponha agora que mais um integrante
tenha se juntado ao grupo de jovens
excursionistas. A distribuição passa a ter 16
valores. Sabendo-se que esse jovem, recém-
você s abia?
ingresso ao grupo, tem 16 anos, qual seria o
Além das séries modais, aquelas que apresentam
valor da moda dessa nova distribuição?
apenas uma moda, e das séries multimodais,
Tanto o 17 quanto o 16 apresentam 4
aquelas que apresentam mais de uma moda,
repetições. Isso significa que essa sequência
existem também, séries numéricas que não
numérica relativa às idades dos jovens
apresentam modas. Esse tipo de série é
excursionistas apresenta duas modas, e, de
denominada de série amodal (Tiboni, 2003).
Na série 10, 20, 30, 40, 50, 60, não existem valores
acordo com Tiboni (2003), é uma distribuição

repetidos, e, consequentemente não existe bimodal (duas modas). Essa característica é


moda, embora a mediana e a média possam ser intrínseca da moda. No caso da mediana e da
calculadas. média, o cálculo é realizado para que se encontre
apenas um valor que caracterize a distribuição
estudada.

64 Estatística Aplicada
CÁLCULO DA MODA: DADOS AGRUPADOS SEM INTERVALOS DE CLASSE
Neste caso, o cálculo da moda é realizado também de maneira simples e
rápida. Basta você observar o valor que apresenta a maior frequência absoluta.
Vejamos um exemplo.
Numa entrevista com 500 candidatos para emprego no hotel Brasil, foi feito
um levantamento com os entrevistados sobre o tempo de experiência, em anos, no
trabalho com hotelaria. Observe, no tabela 8, os resultados obtidos:
Experiência (anos) Frequência
Menos de 1 ano 100
1 150
2 100
3 70
4 50
5 20
Mais de 5 anos 10
Tabela 8 – Frequência dos anos de experiência em hotelaria

Para calcular a moda dessa distribuição, observe, na coluna da frequência,


qual é o maior valor obtido. Você pode perceber que é 150. Isso significa que a
moda da distribuição é igual a 1, pois este valor corresponde à frequência de 150.
Pode-se concluir que a maior concentração dos entrevistados é de pessoas com
pouca experiência na área da hotelaria.
A escolha da moda, da mediana ou da média, também depende do objetivo
em relação ao estudo realizado. Neste exemplo, você poderia ter utilizado a
mediana para determinar com maior precisão a quantidade de pessoas com pouca
experiência na área da hotelaria. Poderia também ter utilizado a média ponderada
para caracterizar o grupo de entrevistados como experiente ou inexperiente na
área em estudo. Lembre-se: suas escolhas dependem dos seus objetivos.

CÁLCULO DA MODA: DADOS AGRUPADOS COM INTERVALOS DE CLASSE


A classe que apresenta a maior frequência é denominada classe modal. Pela
definição, podemos afirmar que a moda, neste caso, é o valor dominante que está
compreendido entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste em tomar o ponto
médio da classe modal. Damos a esse valor a denominação de moda bruta.
l* + L*
Mo =
2

AULA 3 TÓPICO 3 65
Onde: l* = limite inferior da classe modal;
L*= limite superior da classe modal.
Veja o exemplo: Para a distribuição da Tabela 9, calcule a moda.

Classe Estaturas Frequência Ponto médio

1 150  155 10 152,5

2 155  160 20 157,5

3 160  165 50 162,5

4 165  170 60 167,5

5 170  175 50 172,5

6 175  180 40 177,5

7 180  185 15 182,5

8 185  190 5 187,5

Tabela 9 – Distribuição da frequência e do ponto médio por classe de estatura dos turistas

A classe modal é 165 |---- 170, pois é a de maior frequência (f = 60).


l* = 165 e L* = 170
Mo = (165+170) / 2 = 167,5 cm.

Assim como no caso da mediana, para calcular a moda para dados agrupados
em classes, é necessário utilizar uma fórmula, denominada de fórmula de Czuber:
 d1 
Mo = l +   .h
 d1 + d 2 
Mo é a moda que caracteriza os dados agrupados em classes, l é o limite
inferior da classe modal, d1 é a diferença entre a frequência da classe modal e a
frequência da classe anterior à classe modal, d2 é a diferença entre a frequência da
classe modal e a frequência da classe posterior à classe modal, e h é a amplitude da
classe modal.
Vamos aplicá-la num exemplo para facilitar a compreensão. Considere que o
hotel Brasil queira fazer uma pesquisa sobre o peso dos hóspedes para elaborar um
cardápio mais equilibrado e personalizado. Para isto, escolheu os 100 hóspedes mais
fiéis, que têm por costume procurar o hotel Brasil para se hospedarem. Observe, na
tabela 10, como ficou a distribuição:

66 Estatística Aplicada
Classes Peso (kg) Frequência
1 50  70 10
2 70  90 20
3 90  110 50
4 110  130 20
Total Total 100
Tabela 10 – Frequência do peso dos hóspedes por agrupamento

Para calcular a moda dessa distribuição, siga os passos:


1º) Determine a classe modal: a 3ª classe é a que apresenta a maior frequência
(50 pessoas);
2º) Determine o limite inferior da classe modal: l = 90, pois a 3ª classe varia
de 90 a 110;
3º) Determine a diferença entre a frequência da classe modal e a frequência
da classe anterior à classe modal: d1 = 50 – 20 = 30, pois 50 é a frequência da 3ª
classe, enquanto 20 é a frequência da 2ª classe;
4º) Determine a diferença entre a frequência da classe modal e a frequência
da classe posterior à classe modal: d2 = 50 – 20 = 30, pois 50 é a frequência da 3ª
classe, enquanto 20 é a frequência da 4ª classe;
5º) Determine a amplitude da classe modal: h = 110 – 90 = 20, pois o menor
valor da classe é 90 e o maior valor é 110.
 d1 
6º) Aplique os valores obtidos na fórmula Mo = l +   .h :
d
 1 + d 2 
Você concluiu que a moda dessa distribuição é igual a 100, ou seja, o peso
que apresenta maior frequência entre os hóspedes mais fiéis do hotel Brasil é igual
a 100 kg. O gerente do hotel tem agora mais informações para tomar suas decisões
em relação aos alimentos preparados e a serem servidos aos hóspedes.
Observe que, para este exemplo, o valor da moda calculado pela fórmula de
Czuber (Mo=100) é o mesmo do valor da moda bruta Mo = (90+110)/2 = 100. Isso
não é obrigatório ocorrer para todas as distribuições
Você aprendeu nesta aula algumas formas de calcular medidas de posição. A
média, a mediana e a moda são as mais utilizadas, embora sejam as mais simples e em
situações mais específicas não sejam as mais recomendadas. Você pode encontrar,
em estudos mais profundos e amplos, variadas formas de calcular uma medida de
posição mais adequada a determinados estudos.
Por outro lado, de nada adianta seguir em frente, tentar se aprofundar sem

AULA 3 TÓPICO 3 67
esses conhecimentos básicos. Buscar compreender novas medidas de posição sem
saber as diferenças e semelhanças entre média, mediana e moda pode dificultar a
compreensão. Estude e utilize os conhecimentos compartilhados; eles são úteis e
certamente ajudarão na compreensão de novos conhecimentos, como os que serão
apresentados na aula 4.

guarde bem is s o !
Veja um resumo esquemático dos assuntos abordados nesta aula:

Figura 1 – Resumo das Medidas de Posição

68 Estatística Aplicada
AULA 4 Medidas separatrizes e
medidas de dispersão

Além da mediana estudada na aula 3, aprenderemos que quartis, decis e percentis


também são considerados medidas separatrizes. Elas podem auxiliar na análise
dos dados, pois são capazes de dividir a série numérica em diversas partes de
tamanhos iguais, possibilitando um detalhamento maior das informações obtidas.

Estudaremos também o desvio médio, a variância e o desvio padrão, caracterizados


como medidas de dispersão. Essas medidas auxiliam na validação das medidas
de tendência central de uma série de dados. É possível, por exemplo, verificar se
a média calculada realmente representa os valores da série numérica.

Objetivos

• Conceituar medidas separatrizes


• Calcular as medidas separatrizes: quartis, decis e percentis
• Calcular as medidas de dispersão: desvio médio, variância e desvio padrão

AULA 4 69
TÓPICO 1 Medidas separatrizes:
quartil
O bjetivos
• Conceituar medidas separatrizes
• Desenvolver os cálculos dos quartis, decis e percentis
• Reconhecer as situações nas quais os quartis devem ser
aplicados

N este tópico apresentaremos uma nova medida representativa


de uma série de dados: os quartis. São medidas separatrizes
que dividem as séries numéricas em partes iguais, ou seja, que
contenham as mesmas quantidades de elementos cada uma. Elas recebem nomes
diferentes dependendo do número de partes em que a série é dividida. São eles:
• Mediana – medida que divide a série em duas partes iguais;
• Quartil – medidas que dividem a série em quatro partes iguais;
• Decil – medidas que dividem a série em dez partes iguais;
• Percentil – medidas que dividem a série em cem partes iguais.
De acordo com Bussab e Morettin (2004), os quartis são utilizados quando as
medidas de tendência central são afetadas exageradamente por valores extremos.
Além disso, os quartis podem auxiliar na compreensão da simetria ou assimetria da
distribuição dos dados.
Estudaremos a seguir os quartis, decis e percentis, buscando enfatizar suas
relações. A mediana já foi estudada na aula 3.

70 Estatística Aplicada
QUARTIL
Sabe-se que a mediana, além de ser medida de tendência central, também
é uma medida separatriz. Ela divide a série numérica em duas partes iguais. Os
quartis apresentam características semelhantes às da mediana. Dividem a série
numérica em quatro partes iguais.
Sendo assim, a série apresenta três elementos separatrizes:
• 1º quartil – corresponde aos primeiros 25% dos elementos da série;
• 2º quartil – equivale ao valor da mediana;
• 3º quartil – corresponde aos últimos 25% dos elementos da série.
As técnicas utilizadas para calcular os quartis são semelhantes àquelas
utilizadas para calcular a mediana.
Para localizar a mediana numa série numérica, é necessário desenvolver o
seguinte cálculo:
f1 + f 2 + f 3 + ... + f n , em que f a fn são as frequências dos
dados obtidos.
2
Para localizar os quartis, utiliza-se uma fórmula semelhante para cada
( f 1 + f 2 + f 3 + ... + f n )
quartil: k . . O valor de k varia de acordo com a posição
4
do quartil a ser calculado. Assim, se você quiser conhecer o valor do 2º quartil,
deverá atribuir o número 2 à variável k. Conclui-se, portanto, que a variável k
poderá ter apenas os valores 1, 2 e 3. Observe também que o divisor passa a ser
o número 4, justamente porque neste momento você está dividindo sua série de
dados em quatro partes iguais. Vamos aplicar esses conhecimentos num exemplo
prático.
Considere que, para a construção de um hotel, seja necessário conhecer as
estaturas de seus futuros hóspedes. É realizada, portanto, uma pesquisa com 200
turistas; os resultados estão apresentados no tabela 1.
Classe Estaturas Frequência
1 150  155 10
2 155  160 20
3 160  165 40
4 165  170 50
5 170  175 40
6 175  180 20
7 180  185 15
8 185  190 5
Tabela 1 – Distribuição da frequência por classe de estatura dos turistas

AULA 4 TÓPICO 1 71
200
Para localizar o 1º quartil, basta calcular 1. = 50 . No caso do 2º quartil,
4
200
o valor de k passa a ser 2. = 100 . O 3º quartil torna o valor de k igual a 3, e
4
200
pode-se calcular da seguinte forma: 3. = 150 .
4

É importante salientar que a localização do quartil não determina


imediatamente o valor desse quartil. Para que esses valores sejam encontrados, é
necessário utilizar a seguinte fórmula:
 n 
 k. − ∑ f  .h
4
Qk= lQ +  
fQ
Q k representa o valor do quartil, lQ representa o limite inferior da classe
desse quartil, n é a quantidade de elementos da amostra, k é a posição do quartil
a ser calculado, f Q é a frequência simples da classe que contém o quartil, h é a
amplitude da classe que contém o quartil e å f é a soma de todas as frequência
anteriores à classe do quartil considerado (MARTINS; DONAIRE, 2006).
Aplicando-a no exemplo anterior, podemos calcular o valor do 1º quartil
seguindo os passos:
1º ) Calcule a localização do 1º quartil na série numérica:
Você já fez isso anteriormente. O valor do 1º quartil está na 50ª posição.
2º ) Localize o 1º quartil na série. Para realizar essa localização, você já sabe
que a utilização da frequência acumulada é fundamental.
Frequência
Classe Estaturas Frequência
Acumulada
1 150  155 10 10
2 155  160 20 30
3 160  165 40 70
4 165  170 50 120
atenção! 5 170  175 40 160
6 175  180 20 180
O 2° quartil se localiza na 4ª classe e o 3° quartil se 7 180  185 15 195
localiza na 5ª classe. 8 185  190 5 200
Tabela 2 – Distribuição da frequência – absoluta e
acumulada – por classe de estatura

De acordo com a análise da frequência acumulada, o 1º quartil se localiza na


3ª classe.

72 Estatística Aplicada
3º) Determine as variáveis a serem aplicadas na fórmula.
lQ = 160, pois representa o limite inferior da classe do 1º quartil;
fQ = 40, pois representa a frequência da 3ª classe;
n = 200, pois foram consultados 200 turistas;
h = 5, pois representa a amplitude da 3ª classe;
k = 1, pois estamos calculando o 1º quartil;
å f = 30, pois representa a soma de todas as frequências que antecedem a
3ª classe.
 n 
 k. − ∑ f  .h
4
4º) Aplique os resultados encontrados na fórmula Qk= lQ +   .
fQ
.
200
1. - 30 .5
4 20.5
Q1 = 160 + = 160 + = 160 + 2,5 = 162,5
40 40

Concluímos, então, que 25% dos hóspedes apresentam estatura entre 1,50 m
e 1,62 m. São, portanto, os mais baixos hóspedes do hotel. Para fazer uma análise
mais detalhada, é necessário continuar com o cálculo dos quartis determinando
as próximas posições separatrizes. Os passos são os mesmos, o que muda são os
valores atribuídos às variáveis.
Para o cálculo do 2º e 3º quartis, temos respectivamente:
 200 
 2. − 70  .5
Q2= 165 + 
4  = 165 + 30.5= 165 + 3= 168, 0
50 50
 200 
 3. − 120  .5
Q3 =170 + 
4  =170 + 30.5 =170 + 3, 75 =173, 75
40 40
Podemos dizer que os mais altos hóspedes do hotel apresentam estaturas
entre 1,74 m aproximadamente e 1,90 m. Os de estatura mediana encontram-se
entre 1,61 m e 1,74 m. Você pode perceber que existe um detalhamento maior
da análise dos dados do que no caso do estudo da mediana. Anteriormente foi
possível calcular os mais baixos e os mais altos. Com a utilização dos quartis, é
possível encontrar também as alturas médias dos hóspedes do hotel Brasil.
Maiores detalhamentos são possíveis de serem realizados. O estudo dos
decis e dos percentis pode auxiliar em um maior aprofundamento dos dados com a
finalidade de diminuir as discrepâncias nos resultados obtidos.

AULA 4 TÓPICO 1 73
DECIL E PERCENTIL
Os decis, por serem também medidas separatrizes, dividem a série numérica
em dez (10) partes iguais, diferentemente dos quartis, que a dividem em quatro
(4) partes iguais, e da mediana, que a divide em apenas duas (2) partes iguais. Os
percentis, por sua vez, dividem a série numérica em cem (100) partes iguais.
As fórmulas utilizadas para o cálculo de cada decil e de cada percentil são
semelhantes àquelas apresentadas para o cálculo dos quartis no tópico anterior.
Observe a fórmula para o cálculo de um determinado decil.
 n 
 k . − ∑ f  .h
10
D=k lD +  
fD
D k representa o valor do decil, lD representa o limite inferior da classe
desse decil, n é a quantidade de elementos da amostra, k é a posição do decil a ser
calculado, f D é a frequência simples da classe que contém o decil, h é a amplitude
da classe que contém o decil e ∑ f é a soma de todas as frequências anteriores à
classe do decil considerado (MARTINS; DONAIRE, 2006).
Se você observar com cuidado, verificará que as fórmulas para o cálculo
dos quartis e decis são praticamente as mesmas. São poucas as modificações. Na
realidade, a interpretação dos resultados é que realmente fica alterada. Vejamos
uma situação prática.
Considere o exemplo apresentado no tópico 1.1, no qual foi apresentada uma
tabela com os dados das estatura de 200 turistas. Utilizaremos diretamente o tabela
2, que contém a distribuição simples e acumulada da variável em estudo.
Para calcular, por exemplo, o 1º decil, é necessário desenvolver os seguintes
passos:
200
1º ) Calcule a localização do 1º decil na série numérica: 1. = 20 . O valor
10
do 1º decil está na 20ª posição.
2º ) Localize o 1º decil na série. De acordo com a análise da frequência
acumulada, o 1º decil se localiza na 2ª classe.
3º) Determine as variáveis a serem aplicadas na fórmula.
lD = 155, pois representa o limite inferior da classe do 1º decil;
f D = 20, pois representa a frequência da 2ª classe;
n = 200, porque foram consultados 200 turistas;
h = 5, pois representa a amplitude da 2ª classe;
k = 1, pois estamos calculando o 1º decil;
∑f = 10, pois representa a soma de todas as frequências que antecedem
a 2ª classe.

74 Estatística Aplicada
 n 
 k. − ∑ f  .h
10
4º) Aplique os resultados encontrados na fórmula D=
k lD +   .
fD
 200 
1. − 10  .5
D1 =155 + 
10  =155 + 10.5 =155 + 2,50 =157,50 .
20 20
Concluímos, então, que 10% dos hóspedes apresentam estatura entre 1,50 m
e 1,57 m. Você deve ter percebido que, no caso dos decis, para calcular todos eles,
é necessário utilizar a fórmula apresentada mais 8 vezes. Isso significa que, no caso
dos decis, você tem a sua disposição 9 medidas separatrizes.
Vale ressaltar que o cálculo dos decis, dos quartis e até mesmo da mediana
nem sempre pode ser útil na tomada de decisões. Eles devem ser utilizados
somente em situações que requeiram um nível de detalhamento maior do estudo
desenvolvido. O cálculo dos demais decis fica como exercício.
No caso dos percentis, a idéia continua a mesma. A diferença é que você terá
um nível ainda maior de detalhes a serem analisados. Raramente os profissionais
da estatística calculam todos os 99 percentis de uma série de dados. Escolhem-se
os mais representativos, e desenvolve-se o cálculo específico para cada situação.
Observe as pequenas alterações que ocorrem na fórmula que permite o
cálculo de um determinado percentil.
 n 
 k. −∑ f  .h
 100 
Pk= lP +
fP
Pk representa o valor do percentil de ordem k, lP representa o limite inferior
da classe desse percentil, n é o número de elementos da amostra, k é a posição
do percentil a ser calculado, f P é a frequência simples da classe que contém o
percentil, h é a amplitude da classe que contém o percentil e ∑f é a soma
de todas as frequências anteriores à classe do percentil considerado (MARTINS;
DONAIRE, 2006). Novamente, foram poucas as mudanças, não é verdade? Vamos
aplicar a fórmula do percentil em um exemplo prático.
Utilizando-se, mais uma vez, a distribuição representada no quadro 2,
podemos pensar em calcular o 51º percentil. Descobriremos, com esse resultado,
qual seria a altura da maior parte dos turistas, pois 50% + 1% representaria a
maioria. Para isto, você deve seguir os mesmos passos utilizados no cálculo dos
quartis e dos decis:
1º ) Calcule a localização do 51º percentil na série numérica:
200
51. = 51.2 = 102 .O valor do 51º decil está na 102ª posição;
100

AULA 4 TÓPICO 1 75
2º) Localize o 51º decil na série. De acordo com a análise da frequência
acumulada, 51º decil se localiza na 102ª classe;
3º) Determine as variáveis a serem aplicadas na fórmula:
lP = 165, pois representa o limite inferior da classe do 51º percentil;
f P = 50, pois representa a frequência da 4ª classe;
n = 200, porque foram consultados 200 turistas;
h = 5, pois representa a amplitude da 4ª classe;
k = 51, pois estamos calculando o 51º percentil;
å f = 70, pois representa a soma de todas as frequências que antecedem a
4ª classe.
 n 
 k. −∑ f  .h
 100 
4º) Aplique os resultados encontrados na fórmula. Pk= lP +
200 fP
 
 51. − 70  .5
Pk = 165 + 
100  = 165 + 32.5 = 165 + 3, 2 = 168, 2 .
50 50
Concluímos, então, que 51% dos hóspedes apresentam estatura entre 1,50 m
e 1,65 m. Isso significa que a maioria dos turistas tem estatura entre baixa e média
de acordo com os parâmetros brasileiros. Dessa forma, o grupo responsável pela
construção do hotel pode utilizar esses parâmetros para projetá-lo de forma mais
personalizada.
Neste tópico, nós finalizamos os estudos das medidas de posição. Junto com
a aula 3, estudamos as medidas de tendência central, tais como média, mediana e
moda, bem como as medidas separatrizes, mediana, quartis, decis e percentis. Veja
que a mediana é uma medida de posição especial e apresenta as características das
medidas de posição e das medidas separatrizes.
Depois de calcular uma medida de tendência central, por exemplo, a média
para uma determinada distribuição de dados, como saber se essa média é realmente
representa os dados coletados? Nem sempre a média é a melhor medida para uma
distribuição. Para averiguar se ela é uma medida adequada para os dados coletados,
estudaremos as medidas de dispersão apresentadas no próximo tópico.

76 Estatística Aplicada
TÓPICO 2
Medidas de dispersão

O bjetivos
• Conceituar o desvio médio, a variância e o desvio padrão de
distribuição de variáveis
• Calcular o desvio médio, a variância e o desvio padrão de
distribuição de variáveis

D e acordo com Tiboni (2003) as medidas de dispersão, também


denominadas de medidas de variabilidade são utilizadas para
verificar se as medidas de posição são representativas para os
dados que representam.
Vejamos a seguinte situação adaptada de Bussab e Morettin (2004). Suponha
que 4 alunos se submeteram a um teste composto por 5 disciplinas diferentes e
obtiveram as seguintes pontuações:
Aluno Disciplina A Disciplina B Disciplina C Disciplina D Disciplina E
X 3 4 5 6 7
Y 1 3 5 7 9
Z 5 5 5 5 5
W 3 5 5 6 6
Tabela 3 – Distribuição das notas por disciplina e aluno

Quando calculamos a média das notas por aluno, obtemos os seguintes


resultados:

Aluno Média
3 + 4 + 5 + 6 + 7 25
X = =5
5 5
1 + 3 + 5 + 7 + 9 25
Y = =5
5 5
5 + 5 + 5 + 5 + 5 25
Z = =5
5 5
3 + 5 + 5 + 6 + 6 25
W = =5
5 5
Tabela 4 – Média por aluno

AULA 4 TÓPICO 2 77
Como você pode perceber, a média é a mesma para os 4 alunos, embora o
comportamento dos resultados nos testes tenha sido diferente. A média, neste caso,
não revela como se dá a concentração dos dados coletados. É somente com o estudo
das medidas de dispersão que podemos compreender a concentração dos dados
em torno da média, com o objetivo de saber se esses dados apresentam grande ou
pequena concentração.
Em Estatística, existem algumas medidas de dispersão comumente utilizadas.
São elas:
• Amplitude total;
• Intervalo interquartílico;
• Desvio médio;
• Desvio padrão e Variância;
• Coeficiente de variação;
• Escores reduzidos.
Estudaremos, neste tópico, apenas o desvio médio, a variância e o desvio
padrão por serem os mais básicos e utilizados no meio estatístico.

DESVIO MÉDIO
De acordo com Martins e Donaire (2006), o desvio médio mede a dispersão
entre os valores da distribuição e a média dos dados coletados.
Vamos supor que o gerente do hotel Brasil queira conhecer o dia da semana
mais movimentado do hotel para o deslocamento adequado dos funcionários em
suas respectivas funções. Foi pesquisado o check in de 441 hóspedes durante 1 mês
e chegou-se aos seguintes resultados:
Dia da semana Número de hóspedes
2ª feira 23
3ª feira 39
4ª feira 42
5ª feira 57
6ª feira 101
Sábado 145
Domingo 34
Total 441
Tabela 5 – Distribuição da frequência absoluta por dia da semana

Calculando a média, obtemos o seguinte resultado:


___ 23 + 39 + 42 + 57 + 101 + 145 + 34 441
X= = = 63
7 7

78 Estatística Aplicada
Isso significa que, em média, o hotel recebe diariamente 63 hóspedes. Sabemos
que esse resultado não representa a realidade de forma literal, pois existem dias em
que o hotel recebe mais hóspedes do que o valor representado pela média; existem
outros dias em que recebe menos hóspedes. Precisamos calcular os desvios de cada
valor dado em relação à média para saber o quão distante está essa média calculada
dos reais valores que representa. Para calculá-los, basta subtrair o valor de cada
frequência do valor da média. Observe a tabela a seguir.

Dia da semana Frequência Desvio Médio


2ª feira 23 23 - 63 = -40
3ª feira 39 39 - 63 = -24
4ª feira 42 42 - 63 = -21
5ª feira 57 57 - 63 = -6
6ª feira 101 101 - 63 = 38
Sábado 145 145 - 63 = 82
Domingo 34 34 - 63 = -29
Total 441 0
Tabela 6 – Distribuição da frequência absoluta e
do desvio por dia da semana

Observe que, ao calcular o desvio médio, obtemos resultados positivos e


negativos, que, ao serem somados, se anulam. É possível perceber que existem
valores da frequência que estão muito próximos da média. Existem outros, porém,
que estão muito distantes. Como a soma de todos os desvios médios é igual a zero,
ela não nos ajuda a compreender o que realmente está acontecendo com os dados
dessa variável.
Em estudos anteriores, os estatísticos também passaram por essa situação
e optaram por utilizar apenas os resultados positivos dos desvios calculados. A
fórmula do cálculo do desvio médio se apresenta da seguinte maneira:
__ __ __
x1 - x .f1 + x2 - x .f2 + ... + x n - x .fn
DM =
n
__
D M representa o desvio médio, x n - x
representa o módulo da diferença entre uma
at e n ç ão!
determinada frequência e a média calculada, f n
representa a frequência de um determinado valor Lembre-se novamente que o símbolo ||
transforma qualquer número negativo em um
para a variável da distribuição, e, n representa o
número positivo.
total de elementos formados pela distribuição.

AULA 4 TÓPICO 2 79
Vamos calcular agora o desvio médio representado na figura.
23 − 63 .23 + 39 − 63 .39 + 42 − 63 .42 + 57 − 63 .57 + 101 − 63 .101 + 145 − 63 .145 + 34 − 63 .34
DM =
441
40.23 + 24.39 + 21.42 + 6.57 + 38.101 + 82.145 + 29.34
DM =
441
920 + 936 + 882 + 342 + 3838 + 11890 + 986
DM =
441
19794
DM = = 44, 8844
441

Isso significa que, em média, cada valor da distribuição está distante da


média aproximadamente 45 unidades. Os dados, portanto, estão muito dispersos, e
a média não seria a melhor medida de posição a ser utilizada.
Os estatísticos encontraram também outra forma de resolver o problema
apresentado anteriormente (tabela 6). Em vez de trabalhar com módulo, optaram
por trabalhar com uma potência par para transformar os números negativos em
positivos. Nasceu, dessa maneira, uma nova medida de dispersão: a variância.

VARIÂNCIA E DESVIO PADRÃO


Existem algumas formas simples de
saiba mais !
resolver o problema da utilização de números
Quando calculamos 3², obtemos como resultado o
negativos. Como vimos anteriormente, pode-
número 9, pois 3.3 = 9.
se utilizar o módulo para essa transformação.
Quando calculamos (-3)², obtemos como resultado
Pode-se também trabalhar com potências pares.
também o número 9, pois (-3).(-3) = 9.
A utilização da potência 2, além de transformar
Dessa maneira, elevar um número a uma potência
números negativos em positivos, facilita o
par (2, 4, 6, 8, 10, ...) sempre traz como resultado
um número positivo.
cálculo.
A variância é, portanto, calculada da
seguinte maneira:
__ __ __
(x - x)2 + (x2 - x)2 + ... + (x n - x)2
s = 1
2

n -1
__
s2 representa a variância, (x n - x) representa o quadrado da diferença
2

entre uma determinada frequência e sua média e n – 1 é o número total da amostra


subtraído de 1 unidade.

80 Estatística Aplicada
Vamos aplicar a fórmula da variância no problema anterior ilustrado pela
tabela 6.

(23 − 63)2 + (39 − 63)2 + ( 42 − 63)2 + (57 − 63)2 + (101 − 63)2 + (145 − 63)2 + (34 − 63)2
σ2 =
441 − 1
1600 + 576 + 441 + 36 + 1444 + 6724 + 841 11662
σ2 = = = 26, 5045
440 440

O resultado que obtivemos com o cálculo


da variância ainda não pode ser analisado. Para
repararmos o problema dos números negativos, at e n ç ão!
tivemos que elevar os valores ao quadrado, não
Se você precisar calcular a variância de uma
foi? Isso significa que 26,5045 representa um população e não de uma amostra é necessário
resultado que está elevado à potência 2. substituir o valor de n – 1 pelo valor de n.
Para eliminar este problema, os estatísticos
desenvolveram uma nova medida de dispersão
denominada desvio padrão. Encontrá-lo é muito simples, basta calcular a raiz
quadrada da variância.
No exemplo apresentado, temos que o desvio padrão é igual a
s = 26,5045 = 5,1483 . Observe que o resultado obtido com o cálculo do desvio
padrão é bastante diferente daquele obtido com o cálculo do desvio médio. Qual
deles é a melhor opção?
Os estatísticos utilizam com maior frequência o desvio padrão. De acordo
com Tiboni (2003), essa é uma medida de dispersão bastante precisa e traz consigo
algumas propriedades que facilitam os cálculos.
Pode-se concluir que, ao calcular o
desvio padrão, a distância entre a média e os
valores da distribuição não é tão grande assim. at e n ç ão!
Porém, um valor em torno de 5 nos informa
Lembre-se que em média o hotel recebe 63
que a concentração dos dados obtidos não é
hóspedes, por isso: x = 63
homogênea, e, portanto, os dados não estão muito
concentrados em torno da média aritmética. De
fato, nesta situação, a média não é a melhor opção de representação dos dados.

AULA 4 TÓPICO 2 81
Vejamos então uma outra situação. Suponha que, com os mesmos 441 hóspedes
do hotel Brasil entrevistados de acordo com a escolha do dia da semana para o check
in no hotel, tenhamos uma nova distribuição de dados conforme a tabela abaixo.
Dia da semana Frequência
2ª feira 55
3ª feira 61
4ª feira 63
5ª feira 67
6ª feira 68
Sábado 71
Domingo 56
Total 441

Tabela 7 – Distribuição de frequência absoluta II da variável dia da semana

Se você calcular a média aritmética neste caso, também obterá 63 hóspedes.


Faça esse cálculo como exercício. E a variância e o desvio padrão, também serão os
mesmos? Vamos verificar.

(55 − 63)2 + (61 − 63)2 + (63 − 63)2 + (67 − 63)2 + (68 − 63)2 + (71 − 63)2 + (556 − 63)2
σ2 =
441 − 1

64 + 4 + 0 + 16 + 25 + 64 + 49 222
σ2 = = = 0, 5045
440 440

Aplicando a__fórmula da__variância __


(x1 - x)2 + (x2 - x)2 + ... + (x n - x)2 , temos:
s =
2

n -1

Observe que o valor desta variância


foi bem menor do que o valor anterior igual a
atenção !
26,5045. Vamos verificar o desvio padrão.
Para se aprofundar mais sobre o assunto medidas
s = 0,5045 = 0,7103 .
separatrizes e medidas de dispersão visite:
De fato, 0,7103 é menor do que 5,1483.
http://www.alea.pt/index.php?option=com_con
Isso significa que, apesar de a média das duas
tent&view=article&id=797&lang=pt
distribuições de freqüência ser a mesma, os
Este é um site bastante interessante. Você tem
dados se comportam de maneiras diferentes.
acesso não só ao conteúdo abordado nesta aula
No 1º caso, concluímos que o desvio padrão em
mas também em outros conteúdos estatísticos.
Vale a pena conferir. torno de 5 caracterizava grande dispersão dos
dados em relação à média. Neste caso atual, como

82 Estatística Aplicada
o desvio padrão é menor do que 1, concluimos que os dados são mais homogêneos
e, portanto, estão mais próximos da média. Podemos dizer, então, que a média,
para este caso, é uma medida representativa dos dados coletados.
Veja um resumo esquemático dos assuntos abordados nesta aula:

Figura 1 – Resumo das Medidas Separatrizes e de Dispersão

Estudamos neste tópico medidas importantes capazes de nos informarem


se a média é uma medida adequada a ser utilizada. Percebemos que, em algumas
situações, a média não é um bom parâmetro para o desenvolvimento de análises
significativas. Mas, lembre-se, para chegar a esta conclusão, é necessário
desenvolver os cálculos de variância e desvio padrão adequadamente.

AULA 4 TÓPICO 2 83
REFERÊNCIAS
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. São Paulo: Saraiva, 2004.
GIOVANNI, José Ruy; BONJORNO, José Roberto. Matemática: versão progressões. São
Paulo: FTD, 2000. 2 v.
IMENES, Luiz Márcio; LELLIS, Marcelo. Microdicionário de Matemática. São Paulo: Scipi-
one, 1998.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de Estatística. São Paulo:
Atlas, 2006.
MEMÓRIA, José Maria Pompeu. Breve história da Estatística. Brasília: EMBRAPA, 2004.
MORAZ, Eduardo. Curso profissional de Excel. São Paulo: Digerati Books, 2006.
TIBONI, Conceição Gentil Rebelo. Estatística básica para o curso de Turismo. São Paulo:
Atlas, 2003.

84 Estatística Aplicada
CURRÍCULO
Luciana de Lima

Possui graduação em Licenciatura Matemática pela Universidade Federal do Ceará - UFC


(1994), especialização em Psicopedagogia pela Universidade Estadual Vale do Acaraú -
UVA (2003), especialização em Tecnologia com ênfase em Telemática pelo Centro Federal
Tecnológico do Ceará - CEFETCE (2006) e mestrado em Educação pela Universidade
Estadual do Ceará - UECE (2008). Atualmente é professora do Instituto UFC Virtual. Tem
experiência na área de Educação Matemática, atuando principalmente nos seguintes temas:
Aprendizagem Significativa, Formação de Professores, Educação a Distância, Ambientes
Virtuais de Aprendizagem e Informática Educativa.

CURRÍCULO 85
86 Estatística Aplicada

Anda mungkin juga menyukai