Aplicada
TECNOLOGIA EM
HOTELARIA
Tecnologia em Hotelaria
Estatística Aplicada
Luciana de Lima
Fortaleza, CE
2009
Créditos
Presidente Davi Jucimon Monteiro
Luis Inácio Lula da Silva Diemano Bruno Lima Nóbrega
Ministro da Educação Germano José Barros Pinheiro
Fernando Haddad Hommel Almeida de Barros Lima
José Albério Beserra
Secretário da SEED
José Stelio Sampaio Bastos Neto
Carlos Eduardo Bielschowsky
Larissa Miranda Cunha
Diretor de Educação a Distância Marco Augusto M. Oliveira Júnior
Celso Costa Navar de Medeiros Mendonça e Nascimento
Reitor do IFCE Roland Gabriel Nogueira Molina
Cláudio Ricardo Gomes de Lima Equipe Web
Pró-Reitor de Ensino Aline Mariana Bispo de Lima
Gilmar Lopes Ribeiro Benghson da Silveira Dantas
Diretora de EAD/IFCE e Fabrice Marc Joye
Coordenadora UAB/IFCE Igor Flávio Simões de Sousa
Cassandra Ribeiro Joye Luiz Alfredo Pereira Lima
Lucas do Amaral Saboya
Vice-Coordenadora UAB
Marcos do Nascimento Portela
Régia Talina Silva Araujo
Ricardo Werlang
Coordenador do Curso de Samantha Onofre Lóssio
Tecnologia em Hotelaria Tibério Bezerra Soares
José Solon Sales e Silva Thuan Saraiva Nabuco
Coordenador do Curso de Revisão de Conteúdo
Licenciatura em Matemática Narcelio Araújo Pereira
Zelalber Gondim Guimarães
Revisão Textual
Elaboração do conteúdo Aurea Suely Zavam
Luciana de Lima Nukácia Meyre Araujo de Almeida
Colaborador Revisão Web
Regina Santos Young Débora Liberato Arruda Hissa
Equipe Pedagógica e Design Instrucional Saulo Garcia
Ana Claúdia Uchôa Araújo Logística
Andrea Maria Rocha Rodrigues Francisco Roberto Dias de Aguiar
Cristiane Borges Braga Virgínia Ferreira Moreira
Eliana Moreira de Oliveira
Secretários
Gina Maria Porto de Aguiar Vieira
Breno Giovanni Silva Araújo
Jane Fontes Guedes
Francisca Venâncio da Silva
Jivago Silva Araújo
Lívia Maria de Lima Santiago Auxiliar
Luciana Andrade Rodrigues Bernardo Matias de Carvalho
Maria Vanda Silvino da Silva Carla Anaíle Moreira de Oliveira
Marília Maia Moreira Maria Tatiana Gomes da Silva
Regina Santos Young Wagner Souto Fernandes
Zuila Sâmea Vieira de Araújo
Equipe Arte, Criação e Produção Visual
Benghson da Silveira Dantas
Catalogação na Fonte: Etelvina Marques (CRB 3 – Nº 615)
ISBN 978-85-475-0017-7
CDD - 519.5
Apresentação 6
Referências 85
Currículo 86
SUMÁRIO
INTRODUÇÃO O surgimento da Estatística e a utilização
das planilhas eletrônicas 7
Tópico 1 A evolução da estatística 8
Tópico 2 As planilhas eletrônicas e a estatística 11
O estudo da Estatística, de forma geral, possibilita que dados coletados em pesquisas sejam
transformados em informações úteis para que decisões possam ser tomadas, seja qual for a
área de atuação profissional.
Com o aumento do movimento turístico nas últimas décadas, sobretudo no Ceará, o estudo
estatístico, por meio da coleta, organização e análise de dados, possibilita ao profissional do
turismo tomar decisões coerentes e realizar projeções adequadas para empreendimentos de
pequeno, médio ou grande porte.
Nesse sentido, nosso material didático contempla, inicialmente, uma pequena evolução
histórica da Estatística. Em seguida, apresenta os primeiros conceitos: população, amostra,
variável, para chegar à forma de desenvolvimento da coleta de dados, e à representação
gráfica e análise dos dados coletados, recorrendo, para tanto, ao estudo das medidas de
posição e de dispersão.
É importante ressaltar que a utilização de planilha eletrônica será necessária durante o curso.
É por este motivo que o material desenvolvido para a aula presencial contempla a utilização
de fórmulas e gráficos, obtidos a partir dessa ferramenta tecnológica.
Nesta aula, você saberá como a Estatística surgiu e se firmou como ciência,
acompanhamento a retomada da evolução histórica desse campo do saber.
Aprenderá como utilizar as planilhas eletrônicas para o desenvolvimento de
fórmulas matemáticas, tabelas e gráficos.
O uso da planilha eletrônica será necessário durante todo nosso curso. Por este
motivo, a aprendizagem adequada dessa ferramenta é de suma importância para
que você possa acompanhar as aulas com segurança e tranquilidade.
Objetivos
7
TÓPICO 1 A evolução da Estatística
O bjetivo
• Apresentar a evolução histórica da Estatística
9
TÓPICO 2
As planilhas eletrônicas e a
Estatística
O bjetivo
• Desenvolver fórmulas, tabelas e gráficos utilizando
uma planilha eletrônica
OPERAÇÕES BÁSICAS
Segundo Moraz (2006), para que desenvolva cálculos matemáticos, a planilha
precisa reconhecê-los como fórmulas matemáticas. Desse modo, cada fórmula deve
seguir uma sintaxe hierárquica de acordo com os requisitos utilizados na própria
matemática e que aprendemos desde o Ensino Fundamental.
10 Estatística Aplicada
A prioridade é dada para as potências e raízes, seguidas das multiplicações
e divisões e, por último, as adições e subtrações. Vale lembrar que essa hierarquia
pode ser redefinida com o uso dos parênteses.
As regras gerais para o desenvolvimento de cálculos matemáticos são as
seguintes:
a) todas as fórmulas devem ser iniciadas com o sinal de igual (=);
b) não devem ser inseridos espaços entre os elementos da fórmula;
c) as operações são representadas por operadores.
Exemplos:
20 + 15 - 5.2
1. Para calcular a expressão , devemos escolher uma célula
10
qualquer da planilha eletrônica e digitar: “=(20+15-5*2)/10”. Inserindo a fórmula
corretamente na planilha, obteremos como resposta 2,5.
2. Para calcular a expressão 32 + 42 , devemos escolher uma célula
qualquer da planilha eletrônica e digitar: “=raiz(3^2+4^2)”. Inserindo a fórmula
corretamente na planilha, obteremos como resposta o número 5.
Exercícios:
1. Um grupo de 15 turistas comprou um pacote para visitar Fortaleza durante
10 dias. O valor total do pacote pago pelo grupo foi de R$ 13.500,00. Quantos reais
cada turista pagou por dia? R.: R$ 90,00.
INTRODUÇÃO TÓPICO 2 11
2. A sorveteria Gostosão cobra R$2,50 um sorvete de casquinha com 1 bola
e R$ 4,00 um sorvete de 2 bolas, para qualquer sabor. Um grupo de 10 turistas foi
à sorveteria Gostosão e comprou cada um o seu sorvete. Sabendo-se que 6 pessoas
compraram sorvete de 1 bola, 3 pessoas compraram sorvete de 2 bolas e 1 pessoa
não comprou sorvete, quanto gastaram no total? R.: R$ 27,00.
3. O hotel Brasil pretende decorar seu salão de festas para o Reveillon. Para
isto precisa confeccionar 50 toalhas quadradas, cujo lado mede 30 cm. Calcule
quantos metros quadrados de tecido serão necessários para a confecção das toalhas.
R.: 4,50 m².
Agora que você já sabe como utilizar a planilha eletrônica para desenvolver
cálculos matemáticos básicos, você vai aprender como construir tabelas aplicando
o conhecimento adquirido.
TABELAS
Um dos aspectos bastante utilizados em planilhas eletrônicas é o
desenvolvimento de tabelas. Isso se dá devido ao fato de a planilha apresentar uma
estrutura cartesiana, dividindo o plano em linhas e colunas.
Construir tabelas de dados utilizando uma planilha eletrônica é muito
simples. Basta você definir os elementos que constituem as linhas e as colunas
nomeando-os adequadamente nas células da planilha como se fossem os cabeçalhos
da tabela. Em seguida, você insere os dados numéricos nas respectivas células. Veja
o exemplo a seguir.
Exemplo:
Suponha que o hotel Brasil tenha como objetivo organizar seu orçamento
em relação à compra de alimentos básicos para o café da manhã consumidos pelos
hóspedes tomando como base uma tabela orçamentária de 2007, mês a mês (tabela
1).
Orçamento Pão Leite Café Queijo Margarina Frutas
2007 (unidade) (litros) (kg) (kg) (unidade) (unidade)
Janeiro 100 200 2 5 100 50
Fevereiro 150 300 3 7 150 75
Março 80 160 2 4 80 40
Abril 70 140 2 4 70 35
Maio 60 120 1 3 60 30
12 Estatística Aplicada
Junho 50 100 1 2 50 25
Julho 100 200 2 5 100 50
Agosto 80 160 2 4 80 40
Setembro 50 100 1 2 50 25
Outubro 30 60 1 1 30 15
Novembro 50 100 1 2 50 25
Dezembro 100 200 2 5 100 50
Total 920 1840 20 44 920 460
Exercício:
Tomando o exemplo acima como base, construa uma tabela orçamentária para
o hotel Brasil, mês a mês, em relação aos produtos de limpeza que o hotel precisa
adquirir para manter todos os quartos e ambientes limpos. Considere o hotel como
sendo de médio porte. Para mensurar, faça estimativas e utilize seus conhecimentos
já adquiridos na área da hotelaria. Ah! Lembre-se de calcular o total dos materiais
utilizados.
Além das tabelas, os gráficos também podem ser desenvolvidos por meio
de planilhas eletrônicas. Veremos a seguir como construí-los a partir de tabelas
conhecidas.
INTRODUÇÃO TÓPICO 2 13
GRÁFICOS
De acordo com Moraz (2006, p. 96) “uma planilha é interpretada com
maior clareza quando os dados mais importantes são destacados com ferramentas
de formatação”. Os gráficos são, portanto, um fator de relevância para os dados
apresentados no formato de tabelas.
Existem situações nas quais as tabelas são repletas de palavras, dados e
números, dificultando a compreensão e a análise da informação. Os gráficos têm
como objetivo facilitar a compreensão dessas informações.
Veremos a seguir como construir elementos gráficos utilizando planilhas
eletrônicas a fim de que você possa complementar as informações fornecidas pelas
tabelas desenvolvidas.
Geralmente, as planilhas eletrônicas vêm com um assistente de construção de
gráficos automático. Para construí-los adequadamente, siga os passos apresentados
abaixo:
1. Selecione com o cursor a tabela de dados;
2. Clique sobre o botão Assistente de gráficos, localizado na barra de
ferramentas;
3. Escolha o tipo de gráfico que você gostaria de desenvolver. Neste caso,
existe uma variedade deles: colunas, barras, linha, setor, entre outros. Feita a
escolha, clique em Avançar;
4. Veja a visualização prévia do gráfico desenvolvido que é exibida. Se
considerar que as informações não estão corretas, você pode modificar a série de
linha para coluna ou vice-versa ou cancelar o processo. Caso esteja tudo correto,
você pode clicar em Avançar;
5. Agora é a vez de inserir o título do gráfico e os rótulos para os eixos x
(horizontal) e y (vertical). Completada essa fase, clique em Avançar;
6. Clique em Concluir e você terá seu gráfico pronto para ser utilizado. É
importante perceber que qualquer alteração na tabela base também modificará o
gráfico de dados vinculado a essa tabela.
Vejamos um exemplo tomando como base a situação apresentada no exemplo
do tópico de tabelas.
Exemplo:
A tabela utilizada para a construção do gráfico precisou ser simplificada para
facilitar a confecção do gráfico. Observe que foram utilizados apenas dois tipos de
14 Estatística Aplicada
alimentos que apresentam as mesmas unidades de comparação. O rótulo de cada
coluna também foi alterado, bem como o título da tabela.
Pão Frutas
Janeiro 100 50
Fevereiro 150 75
Março 80 40
Abril 70 35
Maio 60 30
Junho 50 25
Julho 100 50
Agosto 80 40
Setembro 50 25
Outubro 30 15
Novembro 50 25
Dezembro 100 50
Tabela 2 – Quantidade de pão e frutas consumidos no café da
manhã pelos hóspedes do hotel Brasil em 2007
O gráfico escolhido foi o de colunas. Você pode, dessa forma, comparar, mês
a mês, como ocorreu o consumo de pão e frutas no café da manhã no ano de 2007.
O “Alimentos consumidos pelos hóspedes do hotel Brasil em 2007” é
considerado o título do gráfico, e, “Unidade” e “Mês” são os rótulos utilizados
para os eixos y e x respectivamente.
Agora é a sua vez. Você vai construir um gráfico simples utilizando
informações retiradas de uma tabela de dados. Veja a proposta a seguir.
INTRODUÇÃO TÓPICO 2 15
Exercício:
Uma empresa de pesquisa colheu a opinião de 1.200 pessoas e, posteriormente,
elaborou um relatório especificando a preferência sobre qual região brasileira essas
pessoas gostariam de conhecer. Os valores constam no quadro abaixo.
16 Estatística Aplicada
AULA 1 Conceitos básicos
e distribuições de
frequência
Nesta aula estudaremos os conceitos básicos de Estatística. A compreensão
desses conceitos permitirá que você compreenda a importância de se desenvolver
um bom projeto de pesquisa a partir da definição da população, da amostra e
das variáveis a serem utilizadas. Além disso, você aprenderá a organizar os dados
coletados em tabelas específicas e a iniciar suas análises preliminares sobre o
estudo estatístico a ser desenvolvido.
Objetivos
AULA 1 17
TÓPICO 1
Conceitos básicos
O bjetivos
• Definir os conceitos de população e amostra
• Definir o conceito de variável
• Classificar variáveis
18 Estatística Aplicada
Poderíamos, então, diante da população
de turistas estrangeiros que visitam o Brasil,
escolher uma amostra que pudesse viabilizar o at e n ç ão!
estudo a ser realizado. Dessa forma, poderíamos O trabalho da Estatística é voltado principalmente
reduzir nossa população ao escolher apenas para as pesquisas com amostras, muito mais do
cinco dos principais aeroportos brasileiros que que para aquelas que envolveriam populações
recebem turistas estrangeiros. Teríamos, assim, completas. A compreensão dessa especificidade é
uma amostra dessa população composta por um de fundamental importância para a utilização dos
número menor de elementos a serem analisados. recursos dessa ciência.
AULA 1 TÓPICO 1 19
Porém, ao definir a variável qualitativa nível de instrução, trabalhamos com os
resultados: ensino fundamental, médio e superior dentro de uma ordenação de
resultados baseados no número de anos de escolaridade do indivíduo. Dessa
forma, diferentemente da variável nominal, a variável ordinal apresenta como
característica a ordenação dos resultados.
As variáveis quantitativas podem ser classificadas em variável contínua
e variável discreta. A frequência de visitas do turista estrangeiro ao Brasil se
classifica como uma variável quantitativa discreta, porque você diz que o turista
visitou um determinado lugar 1 vez, 2 vezes, 3 vezes ou mais. Faz sentido dizer que
esse turista visitou Fortaleza 2,5 vezes? O que isso significa? Ou ele visitou 2 vezes
ou 3 vezes, não existe meio termo. Tiboni (2003, p. 16) afirma que uma variável
discreta é aquela que “assume apenas os valores
de um conjunto enumerável”. Bussab e Morettin
(2004, p. 10) complementam o conceito de
atenção!
variáveis quantitativas discretas ao dizerem que
• O conjunto dos números naturais é representado
“resultam, freqüentemente, de uma contagem”.
por N = {0, 1, 2, 3, 4, 5, ...}.
As variáveis discretas representam valores que
• O conjunto dos números inteiros é representado
são elementos do conjunto dos números naturais
por Z ={..., -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, ...}
ou conjunto dos números inteiros.
• O conjunto dos números reais é representado
Quantos reais um turista gasta com
por  ={..., -5, ..., -4, ..., -3, ..., -2, ..., -1, ..., 0,
..., 1, ..., 2, ..., 3, ..., 4, ..., 5, ...}. alimentação em uma viagem de 10 dias à
• As frações, por exemplo, ½ , ¾ , Fortaleza pode ser representado por uma variável
os números decimais, 0,25, 1,2333..., e, os quantitativa contínua. O turista pode gastar em
números irracionais, 2, p, 34, 5678... são média R$ 52,00 ou um pouco mais, R$ 52,35.
exemplos de números reais que não são naturais Entre o intervalo de R$ 52,00 e R$ 52,35 existem
nem inteiros. várias possibilidades de valores. Faz sentido
• O conjunto dos números racionais é representado dizer que esse turista gastou em média R$ 99,99
por Q e são todos os números que podem ser em alimentação, por exemplo? Diferentemente do
escritos na forma de uma fração, ou seja, na forma caso da variável discreta, esse valor faz sentido
a
, em que a e b são números inteiros e b ¹ 0 . nessa situação de variável contínua. Tiboni
b
Exemplos:
(2003, p. 16) afirma que uma variável contínua é
3 4 aquela que “assume inúmeros valores entre dois
; ;- 3;8;0,5;
10 5
limites”. As variáveis contínuas representam
Veja:
valores que são elementos do conjunto dos
-6 16 5
-3 = ;8 = ;0,5 = . números reais com exceção dos números naturais
2 2 10
e inteiros.
20 Estatística Aplicada
Exercício resolvido:
Está sendo realizado um estudo estatístico sobre os funcionários de hotéis
cinco estrelas do Ceará no qual são definidas as seguintes variáveis:
a) o grau de instrução;
b) a idade;
c) a naturalidade;
d) o número de línguas faladas; e
e) o salário mensal bruto.
Classifique essas variáveis em qualitativas (nominais ou ordinais) ou
quantitativas (discretas ou contínuas).
Solução:
a) O grau de instrução pode ser: fundamental, médio ou superior. Isso
significa que esses dados não são numéricos, caracterizando-o como variável
qualitativa. Como existe uma hierarquia entre os resultados, essa variável é ordinal.
b) A idade é uma variável que representa dados numéricos, por isso é
considerada uma variável quantitativa. Ela se classifica como variável discreta
porque a idade é representada por números naturais.
c) A naturalidade é uma variável qualitativa nominal, porque os dados por
ela representados não são numéricos e não dependem de uma ordem predefinida.
O funcionário pode ter nascido em Fortaleza, Caucaia, Quixeramobim, Limoeiro do
Norte, ou em qualquer outra cidade, sem necessidade de representação hierárquica
entre elas.
d) O número de línguas faladas é uma variável quantitativa discreta. Ela
representa números naturais, pois não é possível o profissional falar 2,3 línguas,
por exemplo. Ou ele fala uma determinada língua ou ele não fala, não existe meio
termo.
e) O salário mensal bruto é uma variável quantitativa contínua, geralmente
ela representa números decimais.
AULA 1 TÓPICO 1 21
TÓPICO 2
Distribuição de frequências
O bjetivos
• Conceituar distribuição de frequências
• Classificar as distribuições de frequências em absoluta,
relativa, absoluta acumulada e relativa acumulada
• Construir tabelas de distribuição de frequências
FREQUÊNCIA ABSOLUTA
Os dados originais coletados e que não estão numericamente organizados
são considerados por Tiboni (2003) dados brutos. Quando você os organiza em
ordem crescente ou decrescente você transforma seus dados brutos em um “rol”
de informações.
Exemplo 1:
As idades de 10 jovens que viajam para Guaramiranga nas férias de julho são:
16, 15, 12, 17, 18, 15, 13, 17, 16, 15. Esses dados, desorganizados, são considerados
“dados brutos”.
22 Estatística Aplicada
Ao organizá-los, você tem o seguinte “rol” de informações em relação às
idades dos jovens: 12, 13, 15, 15, 15, 16, 16, 17, 17, 18.
É a partir do rol que você pode construir a distribuição de frequência dos
dados coletados.
De acordo com Tiboni (2003, p. 65), uma frequência é “a quantidade de vezes
que um mesmo valor de um dado é repetido”. Assim, no exemplo 1, a frequência
do número 12 é 1, enquanto a frequência do 15 é 3. Isso significa que, dos 10
alunos que viajam para Guaramiranga nas férias, 1 tem 12 anos, 3 têm 15 anos.
Para facilitar a visualização das repetições ocorridas para todas as idades,
faz-se necessária a construção de uma tabela que apresente a concentração de
jovens em cada faixa etária. Essa tabela é denominada “distribuição de frequência
absoluta”.
Exemplo 2:
Vejamos como ficaria a distribuição de frequência das idades dos 10 jovens
que viajam para Guaramiranga.
Frequência
Idade
Absoluta
12 1
13 1
14 0
15 3
16 2
17 2
18 1
Total 10
Tabela 1 - Distribuição da variável idade por frequência absoluta
Exemplo 3:
Suponha que dos 10 jovens citados anteriormente, 4 estejam cursando
o ensino fundamental enquanto o restante cursa o ensino médio. Como seria a
distribuição de frequência para a variável grau de instrução?
AULA 1 TÓPICO 2 23
Frequência
Grau de instrução
Absoluta
Ensino fundamental 4
Ensino médio 6
Total 10
Tabela 2 – Distribuição da variável grau de instrução por frequência absoluta
Exemplo 4:
Suponha que esses jovens de férias busquem em Guaramiranga um local
para a prática de esportes radicais. Suponha também que a cidade ofereça apenas
quatro modalidades desses esportes: escalada, caminhada, “mountain bike” e pára-
quedismo. Veja como fica a distribuição de frequência para a variável esportes
radicais.
Frequência
Esportes radicais
Absoluta
Caminhada 5
Escalada 3
Mountain bike 2
Pára-quedismo 0
Total 10
Tabela 3 – Distribuição das modalidades de esporte
radical por preferência em frequência absoluta
24 Estatística Aplicada
Exemplo 5:
Para a prática dos esportes radicais citados no exemplo 4, é necessária a
aquisição de roupas especializadas a serem ajustadas de acordo com a altura de
cada jovem. Foram, então, obtidos os seguintes resultados:
1,55m; 1,60m; 1,57m; 1,62m; 1,67m; 1,78m; 1,72m; 1,77m; 1,79m; 1,82m
Veja como ficaria a distribuição de frequência para a variável altura.
Altura Frequência
(m) Absoluta
1,55 1
1,57 1
1,60 1
1,62 1
1,67 1
1,72 1
1,77 1
1,78 1
1,79 1
1,82 1
Total 10
Tabela 4 – Distribuição da altura por frequência absoluta
AULA 1 TÓPICO 2 25
Quando se utilizam classes numa distribuição de frequência, é necessário
determinar:
• os limites dessa classe;
• a amplitude do intervalo de classe;
• o ponto médio de cada classe.
Os limites de uma classe são representados pelos valores extremos de cada
classe, ou seja, seu limite inferior e superior. A amplitude do intervalo de classe
geralmente é calculada pela diferença entre os limites superior e inferior da classe.
O ponto médio é um ponto que apresenta distâncias iguais em relação a seus
extremos. Para obtê-lo, basta proceder da seguinte maneira:
a) Calcule a amplitude do intervalo de classe;
b) Divida o resultado por 2;
c) Acrescente o valor obtido ao limite inferior da classe.
No caso do exemplo 5, podemos utilizar 4 classes com amplitude de 0,10m,
ou seja, poderíamos agrupar os dados nos seguintes intervalos: [1,50; 1,60), [1,60;
1,70), [1,70; 1,80) e [1,80; 1,90). Teríamos, assim, uma distribuição de frequência
absoluta com intervalos de classe (cf. tabela 5).
Frequência
Classes Altura (m)
Absoluta
1ª 1,50 1,60 2
2ª 1,60 1,70 3
3ª 1,70 1,80 4
4ª 1,80 1,90 1
Total 10
Tabela 5 – Distribuição de classes por intervalo
de altura e frequência absoluta
26 Estatística Aplicada
importante que você compreenda o conceito e os procedimentos necessários para
o desenvolvimento adequado das distribuições de frequência.
Exercício:
Definir os limites inferiores e superiores e seus respectivos pontos médios
para as outras classes (2ª, 3ª e 4ª) da distribuição da tabela 5.
FREQUÊNCIA RELATIVA
O estudo desse tipo de frequência é fundamental para que você possa
estabelecer valores a serem facilmente comparados.
A frequência relativa é definida como “a razão entre a frequência simples
e a frequência total” (TIBONI, 2003, p. 76). Podemos defini-la matematicamente da
seguinte forma:
Vejamos como podemos ampliar a capacidade de análise dos dados obtidos
utilizando a situação apresentada nos exemplos anteriores.
Exemplo 6:
f
fr =
n
fr → frequência relativa
f → frequência absoluta
n → nº de elementos da amostra
AULA 1 TÓPICO 2 27
0 0
14 0 x100 = = 0%
10 10
3 300
15 3 x100 = = 30%
10 10
2 200
16 2 x100 = = 20%
10 10
2 200
17 2 x100 = = 20%
10 10
1 100
18 1 x100 = = 10%
10 10
Total 10 100%
Exemplo 7:
Segue no tabela 7 a distribuição de frequência da altura dos jovens que
viajam para Guaramiranga nas férias.
Frequência Frequência
Classes Altura (m)
Absoluta Relativa
2 200
1ª 1,50 1,60 2 x100 = = 20%
10 10
3 300
2ª 1,60 1,70 3 x100 = = 30%
10 10
4 400
3ª 1,70 1,80 4 x100 = = 40%
10 10
1 100
4ª 1,80 1,90 1 x100 = = 10%
10 10
Total 10 100%
28 Estatística Aplicada
É possível observar, com a inserção da frequência relativa, que:
• 70% dos jovens apresentam estatura entre 1,60m e 1,80m;
• apenas 10% do grupo têm estatura superior a 1,80m e, portanto, são
considerados altos em comparação à estatura dos brasileiros.
FREQUÊNCIA ACUMULADA
Para obter uma frequência acumulada a partir de uma frequência absoluta,
basta adicionar a cada frequência absoluta os valores das frequência anteriores.
Vejamos a aplicação desse procedimento utilizando a situação apresentada
anteriormente.
Exemplo 8:
Considerando a distribuição de frequência absoluta em relação à variável
idade, podemos desenvolver a frequência acumulada conforme o tabela 8.
Frequência
Frequência
Idade Absoluta
Absoluta
Acumulada
12 1 1
13 1 1+1=2
14 0 2+0=2
15 3 2+3=5
16 2 5+2=7
AULA 1 TÓPICO 2 29
17 2 7+2=9
18 1 9 + 1 = 10
Total 10
Exemplo 9:
Vamos considerar a distribuição de frequência relativa para a variável altura
e desenvolver a distribuição de frequência relativa acumulada.
Frequência
Frequência Frequência
Classes Altura (m) Relativa
Absoluta Relativa
Acumulada
1ª 1,50 1,60 2 20% 20%
2ª 1,60 1,70 3 30% 20% + 30% = 50%
3ª 1,70 1,80 4 40% 50% + 40% = 90%
4ª 1,80 1,90 1 10% 90% + 10% = 100%
Total 10 100%
Tabela 9 – Distribuição de classes por altura e frequência
(absoluta, relativa e relativa acumulada)
30 Estatística Aplicada
entre 1,50m e 1,70m. É possível ainda constatar que a grande maioria do grupo
(90%) apresenta estatura baixa ou mediana em relação aos parâmetros brasileiros.
Cada distribuição de frequência apresenta uma característica importante
que auxilia na organização dos dados coletados e nas análises iniciais do estudo
estatístico em desenvolvimento. Para que você possa desenvolver uma distribuição
de frequê-ncias mais completa possível, é necessário que em sua tabela constem as
quatro frequência estudadas nesta aula:
• a distribuição de frequência absoluta;
• a distribuição de frequência absoluta acumulada:
• a distribuição de frequência relativa;
• a distribuição de frequência relativa acumulada.
Exercício resolvido:
(TIBONI, 2003, p.77 – adaptado) Numa agência de viagens X, foi feita uma
pesquisa sobre o salário recebido. Foram consultados 130 trabalhadores e obtidos
os seguintes resultados:
Número de Trabalhadores
Classes
salários mínimos (frequência absoluta)
1ª 1 3 18
2ª 3 5 24
3ª 5 7 21
4ª 7 9 19
5ª 9 11 15
6ª 11 13 14
7ª 13 15 11
8ª 15 17 5
9ª 17 19 3
Total 130
Quadro 1: Pesquisa sobre salário
Responda:
a) De forma absoluta, qual é a quantidade de salários mínimos recebida pela
maior quantidade de trabalhadores? E a de menor quantidade?
b) Quantos são os trabalhadores que ganham entre 1 e 13 salários mínimos?
c) Qual é a porcentagem de trabalhadores que ganham entre 17 e 19 salários
mínimos? O que isso pode representar?
d) Qual é o intervalo de salários mínimos recebidos pela maioria (75%) dos
trabalhadores?
AULA 1 TÓPICO 2 31
Solução:
Para que essas respostas sejam dadas, é necessária a confecção da distribuição
de frequência considerando as frequência absolutas, relativas e acumuladas.
Número Trabalhadores Frequência Frequência
Frequência
de salários (frequência absoluta relativa
relativa
mínimos absoluta) acumulada acumulada
1 3 18 18 13,8% 13,8%
13,8% + 18,5% =
3 5 24 18 + 24 = 42 18,5%
32,3%
32,3% + 16,2% =
5 7 21 42 + 21 = 63 16,2%
48,5%
48,5% + 14,6% =
7 9 19 63 + 19 = 82 14,6%
63,1%
63,1% + 11,5% =
9 11 15 82 + 15 = 97 11,5%
74,6%
74,6% + 10,8% =
11 13 14 97 + 14 = 111 10,8%
85,4%
111 + 11 = 85,4% + 8,5% =
13 15 11 8,5%
122 93,9%
93,9% + 3,8% =
15 17 5 122 + 5 = 127 3,8%
97,7%
97,7% + 2,3% =
17 19 3 127 + 3 = 130 2,3%
100%
Total 130 100%
Quadro 2: Distribuição de frequências da pesquisa sobre salário
32 Estatística Aplicada
g u a r d e be m isso!
Veja um resumo esquemático dos assuntos abordados nesta aula:
AULA 1 TÓPICO 2 33
AULA 2 Representação
gráfica
Objetivos
34 Estatística Aplicada
TÓPICO 1 Diagramas, gráficos
polares e outros
O bjetivos
• Definir diagramas, gráficos polares, pictogramas e cartogramas
• Classificar diagramas, gráficos polares, pictogramas e
cartogramas
• Analisar diagramas, gráficos polares, pictogramas e cartogramas
AULA 2 TÓPICO 1 35
Observando o eixo x (eixo das abscissas – eixo horizontal), você verifica
que ele é composto pelos anos de 2004 a 2007, ou seja, são os dados relacionados
à variável tempo. No eixo y (eixo das ordenadas – eixo vertical), você observa os
valores de 0 a 7 milhões, representados pela variável número de turistas.
Ao relacionar os elementos do eixo x com os elementos do eixo y, tem-se uma
nova informação. É possível determinar a cada ano quantos turistas estrangeiros
visitaram o Brasil. Assim, em 2004, sabe-se que 2 milhões de turistas estrangeiros
estiveram em nosso país. É perceptível também que houve um aumento do número
de turistas estrangeiros no Brasil. Passou, nesse período, de 2 milhões para 6,1
milhões de pessoas, em 2007, ou seja, 4,1 milhões de pessoas a mais em nosso
território.
É por meio desse tipo de representação que
você percebe rapidamente o comportamento de
atenção ! uma variável em relação à outra e pode avançar
em suas primeiras inferências e percepções sobre
Os diagramas geralmente são utilizados para
representação de variáveis qualitativas, nominais o evento estudado.
ou ordinais, e variáveis quantitativas discretas, Os diagramas podem ser classificados, de
com distribuições sem intervalos de classe. acordo com Tiboni (2003), da seguinte forma:
• Gráfico em colunas ou em barras;
• Gráfico em setores;
A autora cita, ainda, outros tipos de gráfico que também podem ser utilizados
para a representação de variáveis qualitativas. São eles:
• Gráfico Polar ou Radar;
• Pictogramas;
• Cartogramas.
Veremos a seguir as definições mais importantes e comumente utilizadas e
em quais contextos esses diagramas podem ser inseridos.
GRÁFICO EM LINHAS
O gráfico em linha (Gráfico 1) constitui uma aplicação do processo de
representação das funções num sistema de coordenadas cartesianas.
São frequentemente usados para representação de séries cronológicas com
um grande número de períodos de tempo. As linhas são mais eficientes do que as
colunas, quando existem intensas flutuações nas séries ou quando há necessidade
de se representarem várias séries em um mesmo gráfico.
36 Estatística Aplicada
GRÁFICO EM COLUNAS OU EM BARRAS
Os gráficos em colunas ou em barras são representados por retângulos.
No primeiro caso, o maior comprimento dos retângulos se encontra na posição
vertical. No segundo caso, o maior comprimento dos retângulos é representado na
posição horizontal.
Os gráficos permitem que o leitor tenha uma rápida visualização do
fenômeno estudado por meio de uma comparação entre a variável e suas respectivas
frequências.
Os retângulos apresentam características importantes e suas dimensões se
relacionam diretamente com os resultados obtidos no estudo das frequências da
variável determinada. Todos os retângulos devem apresentar a mesma largura,
enquanto sua altura deve ser proporcional às frequências apresentadas no gráfico.
Vejamos como isso acontece.
Exemplo:
Vamos estudar a quantidade de brasileiros que saem de viagem para o
exterior. Observe a distribuição de frequência representada no quadro abaixo:
Número de brasileiros
Ano
(em milhões)
5,2 2000
5,6 2001
4,5 2002
3,9 2003
3,5 2004
3,1 2005
AULA 2 TÓPICO 1 37
É importante você perceber que duas variáveis estão se relacionando,
a variável tempo e a variável número de brasileiros. Cada coluna representa a
quantidade de brasileiros que viajam para o exterior em um determinado ano
específico dentro de um limite que varia entre 2000 e 2005.
O que você pode concluir ao observar o gráfico? Primeiramente, o ano de
2001 foi o ano no qual os brasileiros mais viajaram para o exterior. A explicação
desse fenômeno não é apresentada no gráfico. Se você quiser compreender melhor
o que aconteceu nesse ano, será necessário fazer novas investigações estatísticas ou
outros tipos de investigação.
Você pode observar também que, após o ano de 2001, houve uma queda nas
viagens dos brasileiros ao exterior, e continuou nesse ritmo até o ano de 2005.
O que mais você consegue visualizar nesse gráfico (Gráfico 2)? Outras
observações ficam como exercício.
Como seria a configuração do gráfico em barras para essa mesma situação?
Certamente, poucas modificações precisam ser realizadas. Vejamos.
38 Estatística Aplicada
Exercício:
Procure em jornais e revistas representações de informações no formato de
gráficos. Faça um levantamento das situações nas quais os gráficos em coluna são
utilizados. Faça o mesmo para os gráficos em barras.
Qual deles foi mais utilizado? Em quais situações o gráfico em colunas foi
mais útil? E o gráfico em barras?
GRÁFICO EM SETORES
O gráfico em setores é comumente utilizado no formato circular ou de “pizza”
para representar “a composição, usualmente em porcentagem, de partes de um
todo” (BUSSAB; MORETTIN, 2004, p. 16).
O tamanho do raio do círculo você mesmo pode escolher. A escolha pode
depender também do local de apresentação. Caso você utilize apresentação em
slides, é necessário desenvolver um gráfico maior. Caso você apresente-o no papel,
ele pode ser menor. Geralmente, esse tipo de representação é utilizado para a
apresentação das frequências relativas de variáveis qualitativas.
Suponha que tenha sido realizada uma pesquisa sobre as opções de
hospedagem de turistas brasileiros quando visitam o Ceará. Veja o quadro 2
representativo das distribuições de frequência absoluta e relativa da variável local
de hospedagem.
Número de turistas
Local de hospedagem Frequência relativa
brasileiros
Hotéis 300 30%
Pousadas 500 50%
Casa de Amigos 150 15%
Outros 50 5%
Total 1.000 100%
Quadro 2— Distribuição das frequências absoluta e relativa por local de hospedagem
AULA 2 TÓPICO 1 39
Gráfico 4 – Percentual de turistas brasileiros que freqüentam o
Ceará por local de hospedagem
Você deve ter percebido que o número 1.000 representa o total de pessoas
entrevistadas, os turistas brasileiros que visitam o Ceará. E o que significa esse
360º? Você deve lembrar, das aulas de Geometria, que uma circunferência se
subdivide em 360 partes, cada qual com 1 grau. Pode-se, então, fazer corresponder
o total de pessoas, que é 1.000, com o total de graus que existe numa circunferência
que é 360º.
Como você quer saber quantos graus equivale ao número de pessoas que
escolheu hotel como opção de hospedagem, então a correspondência acontece entre
300 e um número desconhecido que denominei de x. Procedendo com os cálculos,
descobrimos que o ângulo do círculo correspondente a 300 pessoas equivale a 108º.
O que fazer agora? Trace uma circunferência, o mais correto possível. Em
seguida, escolha um raio qualquer e utilize o transferidor para medir o ângulo de
40 Estatística Aplicada
108º. Trace um novo raio e pinte o espaço interno entre os dois raios determinados.
Tente realizar essa tarefa no papel, como exercício. A figura 1 ilustra o passo
a passo para a construção de um gráfico de setores manualmente.
GRÁFICO POLAR
De acordo com Martins e Donaire (2006), os gráficos polares são utilizados
para representar séries cronológicas com certas características de periodicidade. É
possível ainda, de acordo com Tiboni (2003), comparar os valores da série com os
valores de sua média aritmética.
É possível, com a análise desse tipo de gráfico, conhecer a variação da
quantidade de turistas estrangeiros no Ceará durante um ano, identificando a
situação mês a mês, ou semana a semana. A variação da frequência mensal dos
funcionários de um hotel também pode ser explorada pelo gráfico polar ou radar.
Suponha que entre os meses de novembro de 2007 a fevereiro de 2008, os
típicos meses de férias escolares dos brasileiros, mais de 10.000 turistas tenham
visitado as praias de Caucaia: Icaraí, Tabuba, Cumbuco, entre outras. Observe a
distribuição de frequências absolutas que caracteriza essa visitação no quadro a
seguir.
Mês Número de turistas
Novembro 5.000
Dezembro 7.000
AULA 2 TÓPICO 1 41
Janeiro 9.000
Fevereiro 8.000
Março 2.000
42 Estatística Aplicada
Figura 2 – Exemplo de Cartograma
Fonte: Martins; Donnaire, 2006, p. 96
GLOSSÁRIO
Plano cartesiano – plano cujos pontos são localizados por meio de um sistema de
coordenadas cartesianas (IMENES & LELLIS, 1998, p. 235).
Coordenada cartesiana – são dois números que
indicam a localização de um ponto no plano cartesiano.
(IMENES & LELLIS, 1998, p. 81)
No quadro, o ponto P tem coordenadas 1 e 3:
A coordenada 1 dá a posição em relação ao eixo x, eixo
horizontal, e é denominada de abscissa.
A coordenada 3 dá a posição em relação ao eixo y, eixo
vertical, e é denominada de ordenada.
AULA 2 TÓPICO 1 43
TÓPICO 2
Histograma e polígonos de
frequência
O bjetivos
• Definir histogramas e polígonos de frequência
• Analisar histogramas e polígonos de frequência
HISTOGRAMA
Tiboni (2003) afirma que um histograma é um diagrama em colunas, ou seja,
um gráfico formado por retângulos verticais, um ao lado do outro. Um histograma
também pode ser definido como um gráfico formado por retângulos justapostos.
Assim, ao construir o histograma, cada retângulo deverá ter área proporcional à
frequência relativa (ou à frequência absoluta, o que é indiferente) correspondente.
No caso em que os intervalos são de tamanhos (amplitudes) iguais, as alturas dos
retângulos serão iguais às frequências relativas (ou iguais às frequências absolutas)
dos intervalos correspondentes. Neste momento, você pode estar se perguntando:
Qual é a diferença então entre um gráfico em colunas e um histograma?
44 Estatística Aplicada
A diferença é que no gráfico em colunas você representa dados de variáveis
qualitativas ou quantitativas discretas, enquanto no histograma os dados são
representados por variáveis quantitativas contínuas. No exemplo citado no item
1.2 do tópico 1, para cada ano apresentado, você dispunha de uma quantidade de
pessoas que viajam para o exterior.
Com o histograma, você pode analisar dados de variáveis contínuas. Observe,
na tabela a seguir, a distribuição de frequência das idades de 100 pessoas que se
hospedaram no Hotel “Ceará da Luz” no mês de dezembro de 2007.
Idades Quantidade de pessoas
16 18 10
18 20 20
20 22 25
22 24 15
24 26 25
26 28 5
Total 100
Tabela 1 – Distribuição de frequência da variável quantidade de pessoas
em relação à variável idade
AULA 2 TÓPICO 2 45
uma justaposição dos retângulos.
Desenvolvendo uma observação mais apurada, constata-se que a base de
cada retângulo corresponde à amplitude de classe da distribuição de frequência. A
altura de cada retângulo é determinada pela frequência de cada classe, ou seja, pela
quantidade de pessoas para cada intervalo de idade.
É possível, também, por meio da análise do histograma, visualizar a
frequência relativa da variável idade, de tal forma que, em um mesmo gráfico,
fiquem determinados tanto a frequência absoluta, quanto a frequência relativa
dessa variável. Observe o gráfico seguinte.
Gráfico 7 – Histograma de distribuição de frequência absoluta e relativa
da variável quantidade de pessoas em relação à variável idade
POLÍGONOS DE FREQUÊNCIA
Um polígono de frequência é um gráfico representado pela união de várias
linhas retas. Essas linhas são obtidas pela união dos pontos médios da parte superior
de cada retângulo do histograma. Observe o gráfico a seguir, desenvolvido a partir
dos dados do gráfico representado no gráfico 8.
46 Estatística Aplicada
Gráfico 8 – Polígono de frequência do histograma representado
no gráfico 6 do tópico anterior
Observe que, neste tipo de gráfico, você pode visualizar como acontece o
crescimento da variável idade. A maior inclinação da linha reta aconteceu entre os
20 e 22 anos. Isso significa que o maior crescimento aconteceu nessa faixa etária.
O mesmo não aconteceu entre os 26 e 28 anos, denotando o menor incremento de
pessoas dessa faixa etária.
AULA 2 TÓPICO 2 47
Para o tratamento da informação e sua
representação gráfica, é necessário que se
você s abia?
realizem as escolhas de forma adequada e
O nome dado ao polígono de frequência coerente. Os tipos de variáveis estudados na aula
acumulada é OGIVA DE GALTON. 1 são determinantes nessa escolha. Histrogramas
Galton (1822-1911) foi um cientista inglês, primo e polígonos de frequência absoluta ou acumulada
de Charles Darwin, que estudou a hereditariedade são geralmente utilizados para representação
e a inteligência humana. Desenvolveu estudos não de variáveis quantitativas contínuas. Porém,
só relativos aos aspectos biológicos, mas, também, existem autores que afirmam que esse fato não
aos aspectos matemáticos, entre eles os processos é absoluto.
estatísticos que viriam a auxiliar seus estudos na Para quem vai desenvolver uma análise ou
área da Biologia. um estudo superficial sobre dados estatísticos,
essas informações são úteis e ajudam a inseri-
lo no contexto dessa ciência. Para quem deseja
se aprofundar nos estudos estatísticos, é necessário buscar informações mais
detalhadas em diversas fontes.
Veja um resumo esquemático dos assuntos abordados nesta aula:
48 Estatística Aplicada
Na próxima aula, estudaremos alguns instrumentos de análise que auxiliam
no aprofundamento da compreensão do fenômeno estudado. São eles: média,
mediana, moda e quantis.
AULA 2 TÓPICO 2 49
AULA 3
Medidas de posição:
tendência central
Objetivos
50 Estatística Aplicada
TÓPICO 1
Médias aritméticas: simples e
ponderada
O bjetivos
• Conceituar média aritmética
• Desenvolver os cálculos de médias aritméticas simples e
ponderadas
• Reconhecer as situações nas quais as médias aritméticas simples
e ponderadas devem ser aplicada
AULA 3 TÓPICO 1 51
Suponha que os lucros de um hotel, durante o primeiro semestre deste ano,
tenham acontecido de acordo com o que mostra o tabela 1 abaixo. Qual seria a
média aritmética dos lucros nesse período?
Meses Lucros
Janeiro R$ 15.000,00
Fevereiro R$ 14.900,00
Março R$ 14.800,00
Abril R$ 15.500,00
Maio R$ 13.900,00
Junho R$ 14.200,00
Tabela 1 – Lucros do hotel durante o primeiro semestre do ano
52 Estatística Aplicada
Tanto no caso dos dados agrupados, quanto nos dados apresentados com
intervalos de classe, essa ponderação se caracteriza pelo número de repetições de
cada valor apresentado, ou seja, pela sua frequência absoluta. Assim, a fórmula
para o cálculo da média aritmética ponderada se apresenta da seguinte maneira:
___ x1 . f1 + x 2 . f 2 + x3 . f 3 + ... + x n . f n
X =
f1 + f 2 + f 3 + ... + f n
___
Na fórmula acima, X representa a média aritmética ponderada,
x1 , x2 , x3 ,..., xn representam os valores qualquer da série numérica utilizada e
f1 , f 2 , f 3 ,..., f n representam as respectivas frequências desses valores. Vejamos
um exemplo.
Numa pesquisa realizada por uma empresa turística, foram entrevistadas
200 famílias, que expressaram sua opinião em relação ao número de refeições que
deveriam estar inclusas na diária dos hotéis e pousadas. Observe o tabela 2.
Número de refeições Frequência
1 30
2 80
3 55
4 20
5 15
Tabela 2 – Distribuição da preferência por número de
refeições em hotéis ou pousadas
AULA 3 TÓPICO 1 53
Classe Estatura Frequência
1 150 155 10
2 155 160 20
3 160 165 50
4 165 170 60
5 170 175 50
6 175 180 40
7 180 185 15
8 185 190 5
Tabela 3 – Estatura dos turistas por classe e frequência
Deixaremos como exercício o cálculo dos pontos médios das demais classes.
O tabela 4, a seguir, demonstra os resultados do tabela 3 acrescidos dos pontos
médios de cada classe.
Classe Estaturas Frequência Ponto médio
1 150 155 10 152,5
2 155 160 20 157,5
3 160 165 50 162,5
4 165 170 60 167,5
5 170 175 50 172,5
6 175 180 40 177,5
7 180 185 15 182,5
8 185 190 5 187,5
54 Estatística Aplicada
___ 10 ×152, 5 + 20 ×157, 5 + 50 ×162, 5 + 60 ×167, 5 + 50 ×172, 5 + 40 ×177, 5 + 15×182, 5 + 5×187, 5
X=
10 + 20 + 50 + 60 + 50 + 40 + 15
___ 1525 + 3150 + 8125 + 10050 + 8625 + 7100 + 2737, 5 + 937, 5 42250
X= = = 169
250 2550
AULA 3 TÓPICO 1 55
cujos valores se relacionam entre si de forma inversa. No caso do escoamento de
estoques, quanto maior o tempo, menor o estoque.
Para calcular uma média harmônica, neste caso ponderada, é necessário
utilizar a fórmula:
___
n
Xh =
f1 f 2 f 3 f
+ + + ... + n
x1 x2 x3 xn
___
X h representa a média harmônica ponderada, representam os valores da
distribuição, x1 , x2 , x3 ,..., xn representam as frequências relativas a cada valor
f1 , f 2 , f 3 ,..., f n da distribuição e n o número de elementos que contém essa
distribuição.
56 Estatística Aplicada
TÓPICO 2
Mediana
O bjetivos
• Conceituar mediana
• Calcular a mediana de dados agrupados e não
agrupados
AULA 3 TÓPICO 2 57
Existem três formas de calcular a mediana, considerando:
• dados não agrupados;
• dados agrupados sem intervalos de classe; e
• dados agrupados com intervalos de classe.
Vejamos os procedimentos para cada situação.
Repare que a média e a mediana, neste caso, foram exatamente iguais. Esse
fato ilustra um aspecto muito importante. Como não existe uma discrepância grande
entre o menor e o maior valor da sequência e os dados se comportam de maneira
uniforme, o fato da mediana e da média terem praticamente o mesmo resultado já
era esperado.
58 Estatística Aplicada
Suponha agora que o time formado precise jogar vôlei. Os cinco integrantes
não resolverão o problema sozinhos, é necessário convocar mais um jogador. O
jogador convocado tem 1,88 m de altura. Qual seria o novo valor da mediana?
Vamos utilizar os mesmos passos:
1º ) Ordene os números em ordem crescente ou decrescente:
1,85 1,87 1,88 1,90 1,93 1,95
2º ) Agora, a sequência numérica contém um número par de termos, igual
a 6. Então a mediana será determinada pela média aritmética entre os termos de
6 6
ordem e + 1 , ou seja, será a média aritmética entre o 3º termo e o 4º termo.
2 2
3º) Localize na seqüência 1,85 1,87 1,88 1,90 1,93 1,95 o 3º e o 4º termo.
Você encontrará 1,88 m e 1,90 m.
4º) Calcule a média aritmética de 1,88 e 1,90. A mediana será igual a
1,88 + 1,90 3,78
= = 1,89m .
2 2
Com a inserção de um novo componente no grupo, a mediana se modificou.
Passou de 1,90m para 1,89m. É importante você compreender que a mediana
realmente é uma medida separatriz. Na situação do time de basquete, as pessoas
cujas alturas são menores do que 1,90m são considerados os baixos do time, ao
passo que, as alturas maiores do que 1,90m são os altos do time. Essas posições
são decisivas para a melhor posição do atleta na quadra para que o time seja o
vencedor do jogo.
AULA 3 TÓPICO 2 59
Tipos de quartos Frequência
Simples 30
Duplo 41
Triplo 36
Quádruplo 13
Tabela 5 – Distribuição da frequência por tipo de acomodação
Tipos de Frequência
Frequência
quartos Acumulada
Simples 30 30
Duplo 41+30 71
Triplo 36+71 107
Quádruplo 13+107 120
Tabela 6 – Frequência (absoluta e acumulada) por tipo de quarto
60 Estatística Aplicada
Primeiramente, divide-se a distribuição numérica em duas partes iguais
calculando-se n , independentemente de n ser par ou ímpar. Lembre-se de que
2
os dados agrupados com intervalos de classe geralmente apresentam variáveis
contínuas.
Em seguida, é necessário localizar a classe que contém a mediana por meio
da observação da frequência acumulada, como vimos anteriormente no tópico 2.2.
n
−∑ f .h
A mediana é calculada, então, pela fórmula: Me = l +
2 , na
f
qual Me é a mediana, l é o limite inferior da classe que contém a mediana, n é o
número total de elementos da série numérica, f é a frequência da classe que contém
AULA 3 TÓPICO 2 61
n
− ∑ f .h
4º) Aplique os resultados encontrados na fórmula Me = l + 2 .
f
Veja:
200
− 55 .10
Me =60 +
2 =60 +
(100 − 55) .10 =60 + ( 45) .10 =60 + 9, 0 =69, 0
50 50 50
A mediana, por ser uma medida de posição separatriz, dividiu, neste caso, os
tipos de hóspedes em relação à alimentação. Os que gastam menos de R$ 69,00são
aqueles que gastam pouco com alimentação, enquanto os que estão incluídos na
classe que registra valores superiores são os que mais gastam com alimentação.
Quando n/2 coincidir com a frequência acumulada medida separatriz, dividindo a série numérica
de uma classe, o valor da mediana é igual ao limite em duas partes iguais. Estudaremos a seguir
superior desta classe. mais uma medida de posição: a moda.
62 Estatística Aplicada
TÓPICO 3 Moda
O bjetivos
• Conceituar moda
• Calcular a moda de dados agrupados e não agrupados
AULA 3 TÓPICO 3 63
CÁLCULO DA MODA: DADOS NÃO AGRUPADOS
Determinar a moda nessa situação é bem fácil e simples. Basta organizar os
dados e verificar o valor que apresenta o maior número de repetições. Vejamos um
exemplo.
Considere que, numa excursão para Ubajara, tenham comparecido 15 jovens
com idade entre 15 e 20 anos. Os dados coletados apresentaram os seguintes
resultados:
15 15 16 16 16 17 17 17 17 18 18 19 19 19 20
O valor do maior número de repetições é 17. Isso significa, portanto, que a
moda dessa distribuição é 17.
Se você calcular a mediana nessa situação, perceberá que ela também é igual
a 17. E a média aritmética, será também 17? Neste caso, é necessário proceder com
os cálculos adequadamente, da seguinte maneira:
___ 15 + 15 + 16 + 16 + 16 + 17 + 17 + 17 + 17 + 18 + 18 + 19 + 19 + 19 + 20 259
X= = = 17,27
15 15
Apesar de a média não ter sido exatamente 17, considera-se, por aproximação,
que a média das idades seja de 17 anos. Esse resultado já era esperado devido ao
comportamento uniforme da distribuição, sem grandes distorções.
É necessário estar atento, no caso do cálculo da moda, ao maior número de
repetições de um determinado valor na distribuição dos dados.
Suponha agora que mais um integrante
tenha se juntado ao grupo de jovens
excursionistas. A distribuição passa a ter 16
valores. Sabendo-se que esse jovem, recém-
você s abia?
ingresso ao grupo, tem 16 anos, qual seria o
Além das séries modais, aquelas que apresentam
valor da moda dessa nova distribuição?
apenas uma moda, e das séries multimodais,
Tanto o 17 quanto o 16 apresentam 4
aquelas que apresentam mais de uma moda,
repetições. Isso significa que essa sequência
existem também, séries numéricas que não
numérica relativa às idades dos jovens
apresentam modas. Esse tipo de série é
excursionistas apresenta duas modas, e, de
denominada de série amodal (Tiboni, 2003).
Na série 10, 20, 30, 40, 50, 60, não existem valores
acordo com Tiboni (2003), é uma distribuição
64 Estatística Aplicada
CÁLCULO DA MODA: DADOS AGRUPADOS SEM INTERVALOS DE CLASSE
Neste caso, o cálculo da moda é realizado também de maneira simples e
rápida. Basta você observar o valor que apresenta a maior frequência absoluta.
Vejamos um exemplo.
Numa entrevista com 500 candidatos para emprego no hotel Brasil, foi feito
um levantamento com os entrevistados sobre o tempo de experiência, em anos, no
trabalho com hotelaria. Observe, no tabela 8, os resultados obtidos:
Experiência (anos) Frequência
Menos de 1 ano 100
1 150
2 100
3 70
4 50
5 20
Mais de 5 anos 10
Tabela 8 – Frequência dos anos de experiência em hotelaria
AULA 3 TÓPICO 3 65
Onde: l* = limite inferior da classe modal;
L*= limite superior da classe modal.
Veja o exemplo: Para a distribuição da Tabela 9, calcule a moda.
Tabela 9 – Distribuição da frequência e do ponto médio por classe de estatura dos turistas
Assim como no caso da mediana, para calcular a moda para dados agrupados
em classes, é necessário utilizar uma fórmula, denominada de fórmula de Czuber:
d1
Mo = l + .h
d1 + d 2
Mo é a moda que caracteriza os dados agrupados em classes, l é o limite
inferior da classe modal, d1 é a diferença entre a frequência da classe modal e a
frequência da classe anterior à classe modal, d2 é a diferença entre a frequência da
classe modal e a frequência da classe posterior à classe modal, e h é a amplitude da
classe modal.
Vamos aplicá-la num exemplo para facilitar a compreensão. Considere que o
hotel Brasil queira fazer uma pesquisa sobre o peso dos hóspedes para elaborar um
cardápio mais equilibrado e personalizado. Para isto, escolheu os 100 hóspedes mais
fiéis, que têm por costume procurar o hotel Brasil para se hospedarem. Observe, na
tabela 10, como ficou a distribuição:
66 Estatística Aplicada
Classes Peso (kg) Frequência
1 50 70 10
2 70 90 20
3 90 110 50
4 110 130 20
Total Total 100
Tabela 10 – Frequência do peso dos hóspedes por agrupamento
AULA 3 TÓPICO 3 67
esses conhecimentos básicos. Buscar compreender novas medidas de posição sem
saber as diferenças e semelhanças entre média, mediana e moda pode dificultar a
compreensão. Estude e utilize os conhecimentos compartilhados; eles são úteis e
certamente ajudarão na compreensão de novos conhecimentos, como os que serão
apresentados na aula 4.
guarde bem is s o !
Veja um resumo esquemático dos assuntos abordados nesta aula:
68 Estatística Aplicada
AULA 4 Medidas separatrizes e
medidas de dispersão
Objetivos
AULA 4 69
TÓPICO 1 Medidas separatrizes:
quartil
O bjetivos
• Conceituar medidas separatrizes
• Desenvolver os cálculos dos quartis, decis e percentis
• Reconhecer as situações nas quais os quartis devem ser
aplicados
70 Estatística Aplicada
QUARTIL
Sabe-se que a mediana, além de ser medida de tendência central, também
é uma medida separatriz. Ela divide a série numérica em duas partes iguais. Os
quartis apresentam características semelhantes às da mediana. Dividem a série
numérica em quatro partes iguais.
Sendo assim, a série apresenta três elementos separatrizes:
• 1º quartil – corresponde aos primeiros 25% dos elementos da série;
• 2º quartil – equivale ao valor da mediana;
• 3º quartil – corresponde aos últimos 25% dos elementos da série.
As técnicas utilizadas para calcular os quartis são semelhantes àquelas
utilizadas para calcular a mediana.
Para localizar a mediana numa série numérica, é necessário desenvolver o
seguinte cálculo:
f1 + f 2 + f 3 + ... + f n , em que f a fn são as frequências dos
dados obtidos.
2
Para localizar os quartis, utiliza-se uma fórmula semelhante para cada
( f 1 + f 2 + f 3 + ... + f n )
quartil: k . . O valor de k varia de acordo com a posição
4
do quartil a ser calculado. Assim, se você quiser conhecer o valor do 2º quartil,
deverá atribuir o número 2 à variável k. Conclui-se, portanto, que a variável k
poderá ter apenas os valores 1, 2 e 3. Observe também que o divisor passa a ser
o número 4, justamente porque neste momento você está dividindo sua série de
dados em quatro partes iguais. Vamos aplicar esses conhecimentos num exemplo
prático.
Considere que, para a construção de um hotel, seja necessário conhecer as
estaturas de seus futuros hóspedes. É realizada, portanto, uma pesquisa com 200
turistas; os resultados estão apresentados no tabela 1.
Classe Estaturas Frequência
1 150 155 10
2 155 160 20
3 160 165 40
4 165 170 50
5 170 175 40
6 175 180 20
7 180 185 15
8 185 190 5
Tabela 1 – Distribuição da frequência por classe de estatura dos turistas
AULA 4 TÓPICO 1 71
200
Para localizar o 1º quartil, basta calcular 1. = 50 . No caso do 2º quartil,
4
200
o valor de k passa a ser 2. = 100 . O 3º quartil torna o valor de k igual a 3, e
4
200
pode-se calcular da seguinte forma: 3. = 150 .
4
72 Estatística Aplicada
3º) Determine as variáveis a serem aplicadas na fórmula.
lQ = 160, pois representa o limite inferior da classe do 1º quartil;
fQ = 40, pois representa a frequência da 3ª classe;
n = 200, pois foram consultados 200 turistas;
h = 5, pois representa a amplitude da 3ª classe;
k = 1, pois estamos calculando o 1º quartil;
å f = 30, pois representa a soma de todas as frequências que antecedem a
3ª classe.
n
k. − ∑ f .h
4
4º) Aplique os resultados encontrados na fórmula Qk= lQ + .
fQ
.
200
1. - 30 .5
4 20.5
Q1 = 160 + = 160 + = 160 + 2,5 = 162,5
40 40
Concluímos, então, que 25% dos hóspedes apresentam estatura entre 1,50 m
e 1,62 m. São, portanto, os mais baixos hóspedes do hotel. Para fazer uma análise
mais detalhada, é necessário continuar com o cálculo dos quartis determinando
as próximas posições separatrizes. Os passos são os mesmos, o que muda são os
valores atribuídos às variáveis.
Para o cálculo do 2º e 3º quartis, temos respectivamente:
200
2. − 70 .5
Q2= 165 +
4 = 165 + 30.5= 165 + 3= 168, 0
50 50
200
3. − 120 .5
Q3 =170 +
4 =170 + 30.5 =170 + 3, 75 =173, 75
40 40
Podemos dizer que os mais altos hóspedes do hotel apresentam estaturas
entre 1,74 m aproximadamente e 1,90 m. Os de estatura mediana encontram-se
entre 1,61 m e 1,74 m. Você pode perceber que existe um detalhamento maior
da análise dos dados do que no caso do estudo da mediana. Anteriormente foi
possível calcular os mais baixos e os mais altos. Com a utilização dos quartis, é
possível encontrar também as alturas médias dos hóspedes do hotel Brasil.
Maiores detalhamentos são possíveis de serem realizados. O estudo dos
decis e dos percentis pode auxiliar em um maior aprofundamento dos dados com a
finalidade de diminuir as discrepâncias nos resultados obtidos.
AULA 4 TÓPICO 1 73
DECIL E PERCENTIL
Os decis, por serem também medidas separatrizes, dividem a série numérica
em dez (10) partes iguais, diferentemente dos quartis, que a dividem em quatro
(4) partes iguais, e da mediana, que a divide em apenas duas (2) partes iguais. Os
percentis, por sua vez, dividem a série numérica em cem (100) partes iguais.
As fórmulas utilizadas para o cálculo de cada decil e de cada percentil são
semelhantes àquelas apresentadas para o cálculo dos quartis no tópico anterior.
Observe a fórmula para o cálculo de um determinado decil.
n
k . − ∑ f .h
10
D=k lD +
fD
D k representa o valor do decil, lD representa o limite inferior da classe
desse decil, n é a quantidade de elementos da amostra, k é a posição do decil a ser
calculado, f D é a frequência simples da classe que contém o decil, h é a amplitude
da classe que contém o decil e ∑ f é a soma de todas as frequências anteriores à
classe do decil considerado (MARTINS; DONAIRE, 2006).
Se você observar com cuidado, verificará que as fórmulas para o cálculo
dos quartis e decis são praticamente as mesmas. São poucas as modificações. Na
realidade, a interpretação dos resultados é que realmente fica alterada. Vejamos
uma situação prática.
Considere o exemplo apresentado no tópico 1.1, no qual foi apresentada uma
tabela com os dados das estatura de 200 turistas. Utilizaremos diretamente o tabela
2, que contém a distribuição simples e acumulada da variável em estudo.
Para calcular, por exemplo, o 1º decil, é necessário desenvolver os seguintes
passos:
200
1º ) Calcule a localização do 1º decil na série numérica: 1. = 20 . O valor
10
do 1º decil está na 20ª posição.
2º ) Localize o 1º decil na série. De acordo com a análise da frequência
acumulada, o 1º decil se localiza na 2ª classe.
3º) Determine as variáveis a serem aplicadas na fórmula.
lD = 155, pois representa o limite inferior da classe do 1º decil;
f D = 20, pois representa a frequência da 2ª classe;
n = 200, porque foram consultados 200 turistas;
h = 5, pois representa a amplitude da 2ª classe;
k = 1, pois estamos calculando o 1º decil;
∑f = 10, pois representa a soma de todas as frequências que antecedem
a 2ª classe.
74 Estatística Aplicada
n
k. − ∑ f .h
10
4º) Aplique os resultados encontrados na fórmula D=
k lD + .
fD
200
1. − 10 .5
D1 =155 +
10 =155 + 10.5 =155 + 2,50 =157,50 .
20 20
Concluímos, então, que 10% dos hóspedes apresentam estatura entre 1,50 m
e 1,57 m. Você deve ter percebido que, no caso dos decis, para calcular todos eles,
é necessário utilizar a fórmula apresentada mais 8 vezes. Isso significa que, no caso
dos decis, você tem a sua disposição 9 medidas separatrizes.
Vale ressaltar que o cálculo dos decis, dos quartis e até mesmo da mediana
nem sempre pode ser útil na tomada de decisões. Eles devem ser utilizados
somente em situações que requeiram um nível de detalhamento maior do estudo
desenvolvido. O cálculo dos demais decis fica como exercício.
No caso dos percentis, a idéia continua a mesma. A diferença é que você terá
um nível ainda maior de detalhes a serem analisados. Raramente os profissionais
da estatística calculam todos os 99 percentis de uma série de dados. Escolhem-se
os mais representativos, e desenvolve-se o cálculo específico para cada situação.
Observe as pequenas alterações que ocorrem na fórmula que permite o
cálculo de um determinado percentil.
n
k. −∑ f .h
100
Pk= lP +
fP
Pk representa o valor do percentil de ordem k, lP representa o limite inferior
da classe desse percentil, n é o número de elementos da amostra, k é a posição
do percentil a ser calculado, f P é a frequência simples da classe que contém o
percentil, h é a amplitude da classe que contém o percentil e ∑f é a soma
de todas as frequências anteriores à classe do percentil considerado (MARTINS;
DONAIRE, 2006). Novamente, foram poucas as mudanças, não é verdade? Vamos
aplicar a fórmula do percentil em um exemplo prático.
Utilizando-se, mais uma vez, a distribuição representada no quadro 2,
podemos pensar em calcular o 51º percentil. Descobriremos, com esse resultado,
qual seria a altura da maior parte dos turistas, pois 50% + 1% representaria a
maioria. Para isto, você deve seguir os mesmos passos utilizados no cálculo dos
quartis e dos decis:
1º ) Calcule a localização do 51º percentil na série numérica:
200
51. = 51.2 = 102 .O valor do 51º decil está na 102ª posição;
100
AULA 4 TÓPICO 1 75
2º) Localize o 51º decil na série. De acordo com a análise da frequência
acumulada, 51º decil se localiza na 102ª classe;
3º) Determine as variáveis a serem aplicadas na fórmula:
lP = 165, pois representa o limite inferior da classe do 51º percentil;
f P = 50, pois representa a frequência da 4ª classe;
n = 200, porque foram consultados 200 turistas;
h = 5, pois representa a amplitude da 4ª classe;
k = 51, pois estamos calculando o 51º percentil;
å f = 70, pois representa a soma de todas as frequências que antecedem a
4ª classe.
n
k. −∑ f .h
100
4º) Aplique os resultados encontrados na fórmula. Pk= lP +
200 fP
51. − 70 .5
Pk = 165 +
100 = 165 + 32.5 = 165 + 3, 2 = 168, 2 .
50 50
Concluímos, então, que 51% dos hóspedes apresentam estatura entre 1,50 m
e 1,65 m. Isso significa que a maioria dos turistas tem estatura entre baixa e média
de acordo com os parâmetros brasileiros. Dessa forma, o grupo responsável pela
construção do hotel pode utilizar esses parâmetros para projetá-lo de forma mais
personalizada.
Neste tópico, nós finalizamos os estudos das medidas de posição. Junto com
a aula 3, estudamos as medidas de tendência central, tais como média, mediana e
moda, bem como as medidas separatrizes, mediana, quartis, decis e percentis. Veja
que a mediana é uma medida de posição especial e apresenta as características das
medidas de posição e das medidas separatrizes.
Depois de calcular uma medida de tendência central, por exemplo, a média
para uma determinada distribuição de dados, como saber se essa média é realmente
representa os dados coletados? Nem sempre a média é a melhor medida para uma
distribuição. Para averiguar se ela é uma medida adequada para os dados coletados,
estudaremos as medidas de dispersão apresentadas no próximo tópico.
76 Estatística Aplicada
TÓPICO 2
Medidas de dispersão
O bjetivos
• Conceituar o desvio médio, a variância e o desvio padrão de
distribuição de variáveis
• Calcular o desvio médio, a variância e o desvio padrão de
distribuição de variáveis
Aluno Média
3 + 4 + 5 + 6 + 7 25
X = =5
5 5
1 + 3 + 5 + 7 + 9 25
Y = =5
5 5
5 + 5 + 5 + 5 + 5 25
Z = =5
5 5
3 + 5 + 5 + 6 + 6 25
W = =5
5 5
Tabela 4 – Média por aluno
AULA 4 TÓPICO 2 77
Como você pode perceber, a média é a mesma para os 4 alunos, embora o
comportamento dos resultados nos testes tenha sido diferente. A média, neste caso,
não revela como se dá a concentração dos dados coletados. É somente com o estudo
das medidas de dispersão que podemos compreender a concentração dos dados
em torno da média, com o objetivo de saber se esses dados apresentam grande ou
pequena concentração.
Em Estatística, existem algumas medidas de dispersão comumente utilizadas.
São elas:
• Amplitude total;
• Intervalo interquartílico;
• Desvio médio;
• Desvio padrão e Variância;
• Coeficiente de variação;
• Escores reduzidos.
Estudaremos, neste tópico, apenas o desvio médio, a variância e o desvio
padrão por serem os mais básicos e utilizados no meio estatístico.
DESVIO MÉDIO
De acordo com Martins e Donaire (2006), o desvio médio mede a dispersão
entre os valores da distribuição e a média dos dados coletados.
Vamos supor que o gerente do hotel Brasil queira conhecer o dia da semana
mais movimentado do hotel para o deslocamento adequado dos funcionários em
suas respectivas funções. Foi pesquisado o check in de 441 hóspedes durante 1 mês
e chegou-se aos seguintes resultados:
Dia da semana Número de hóspedes
2ª feira 23
3ª feira 39
4ª feira 42
5ª feira 57
6ª feira 101
Sábado 145
Domingo 34
Total 441
Tabela 5 – Distribuição da frequência absoluta por dia da semana
78 Estatística Aplicada
Isso significa que, em média, o hotel recebe diariamente 63 hóspedes. Sabemos
que esse resultado não representa a realidade de forma literal, pois existem dias em
que o hotel recebe mais hóspedes do que o valor representado pela média; existem
outros dias em que recebe menos hóspedes. Precisamos calcular os desvios de cada
valor dado em relação à média para saber o quão distante está essa média calculada
dos reais valores que representa. Para calculá-los, basta subtrair o valor de cada
frequência do valor da média. Observe a tabela a seguir.
AULA 4 TÓPICO 2 79
Vamos calcular agora o desvio médio representado na figura.
23 − 63 .23 + 39 − 63 .39 + 42 − 63 .42 + 57 − 63 .57 + 101 − 63 .101 + 145 − 63 .145 + 34 − 63 .34
DM =
441
40.23 + 24.39 + 21.42 + 6.57 + 38.101 + 82.145 + 29.34
DM =
441
920 + 936 + 882 + 342 + 3838 + 11890 + 986
DM =
441
19794
DM = = 44, 8844
441
n -1
__
s2 representa a variância, (x n - x) representa o quadrado da diferença
2
80 Estatística Aplicada
Vamos aplicar a fórmula da variância no problema anterior ilustrado pela
tabela 6.
(23 − 63)2 + (39 − 63)2 + ( 42 − 63)2 + (57 − 63)2 + (101 − 63)2 + (145 − 63)2 + (34 − 63)2
σ2 =
441 − 1
1600 + 576 + 441 + 36 + 1444 + 6724 + 841 11662
σ2 = = = 26, 5045
440 440
AULA 4 TÓPICO 2 81
Vejamos então uma outra situação. Suponha que, com os mesmos 441 hóspedes
do hotel Brasil entrevistados de acordo com a escolha do dia da semana para o check
in no hotel, tenhamos uma nova distribuição de dados conforme a tabela abaixo.
Dia da semana Frequência
2ª feira 55
3ª feira 61
4ª feira 63
5ª feira 67
6ª feira 68
Sábado 71
Domingo 56
Total 441
(55 − 63)2 + (61 − 63)2 + (63 − 63)2 + (67 − 63)2 + (68 − 63)2 + (71 − 63)2 + (556 − 63)2
σ2 =
441 − 1
64 + 4 + 0 + 16 + 25 + 64 + 49 222
σ2 = = = 0, 5045
440 440
n -1
82 Estatística Aplicada
o desvio padrão é menor do que 1, concluimos que os dados são mais homogêneos
e, portanto, estão mais próximos da média. Podemos dizer, então, que a média,
para este caso, é uma medida representativa dos dados coletados.
Veja um resumo esquemático dos assuntos abordados nesta aula:
AULA 4 TÓPICO 2 83
REFERÊNCIAS
BUSSAB, Wilton de O.; MORETTIN, Pedro A. Estatística básica. São Paulo: Saraiva, 2004.
GIOVANNI, José Ruy; BONJORNO, José Roberto. Matemática: versão progressões. São
Paulo: FTD, 2000. 2 v.
IMENES, Luiz Márcio; LELLIS, Marcelo. Microdicionário de Matemática. São Paulo: Scipi-
one, 1998.
MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de Estatística. São Paulo:
Atlas, 2006.
MEMÓRIA, José Maria Pompeu. Breve história da Estatística. Brasília: EMBRAPA, 2004.
MORAZ, Eduardo. Curso profissional de Excel. São Paulo: Digerati Books, 2006.
TIBONI, Conceição Gentil Rebelo. Estatística básica para o curso de Turismo. São Paulo:
Atlas, 2003.
84 Estatística Aplicada
CURRÍCULO
Luciana de Lima
CURRÍCULO 85
86 Estatística Aplicada