Anda di halaman 1dari 37

FACULDADES

INTEGRADAS
JACAREPAGUÁ

APOSTILA DE
ESTATÍSTICA

Curso: Administração

Prof. Rodney Dieguez


Apostila de Estatística 2

SUMÁRIO

1. Estatística 04
1.1 Definição de Estatística 04
1.2 Definição de Estatística 04
1.3 Fase do Método Estatístico 05
1.3.1 Coleta de Dados 05
1.3.2 Crítica dos Dados 06
1.3.3 Apresentação dos Dados 06
1.3.4 Análise dos Resultados 06

2. Amostragem 07
2.1 Tipos de Variáveis 07
2.2 População 08
2.3 Amostra 08
2.4 Técnicas de Amostragem 09
2.4.1. Amostragem Probabilística 09
2.4.2. Amostragem Não Probabilística 10

3. Estatística Descritiva: Gráficos Estatísticos 11


3.1 Gráficos Estatísticos 11
3.2 Dicas para a Apresentação dos Dados 13

4. Estatística Descritiva: Distribuição de Freqüências 14


4.1 Freqüência Absoluta 14
4.2 Freqüência Acumulada 14
4.3 Freqüência Relativa 14
4.4 Freqüência Acumulada Relativa 15
4.5 Distribuição de Freqüências e Histograma para Dados sem Intervalos de Classe 15
4.5.1 Histograma 15
4.5.2 Ogiva 16
4.6 Distribuição de Freqüências e Histograma para Dados com Intervalos de Classe 16
4.6.1 Histograma 19
4.6.2 Polígono de Freqüência 19

5. Estatística Descritiva: Medidas de Tendência Central 20


5.1 Média 20
5.1.1 Dados Brutos ou Rol 20
5.1.2 Dados Agrupados sem Intervalos de Classe 20
5.1.3 Dados Agrupados com Intervalos de Classe 21
5.2 Mediana 22
5.2.1 Dados Brutos ou Rol 22
5.2.2 Dados Agrupados sem Intervalos de Classe 23
5.2.3 Dados Agrupados com Intervalos de Classe 24
5.3 Moda 25
5.3.1 Dados Brutos ou Rol 25
5.3.2 Dados Agrupados sem Intervalos de Classe 26
5.3.3 Dados Agrupados com Intervalos de Classe 26
5.4 Utilização das Medidas de Tendência Central 27

6. Estatística Descritiva: Medidas de Dispersão 28


6.1 Variância e Desvio Padrão 28
6.1.1 Dados Brutos ou Rol 28
6.1.2 Dados Agrupados sem Intervalos de Classe 29

Prof. Rodney Dieguez


Apostila de Estatística 3

6.1.3 Dados Agrupados com Intervalos de Classe 30


6.2 Coeficiente de Variação 31

7. Exercícios 32
7.1 Capítulo 3 32
7.2 Capítulo 4 33
7.3 Capítulo 5 35
7.4 Capítulo 6 36

8. Referências Bibliográficas 38

Prof. Rodney Dieguez


Apostila de Estatística 4

1. Estatística
1.1. Introdução

Os métodos estatísticos são usados hoje em quase todos os campos de


investigação científica, já que eles capacitam-nos a responder a um vasto número de
questões, tais como as listadas abaixo:

1) Como os cientistas avaliam a validade de novas teorias?


2) Como os pesquisadores médicos testam a eficiência de novas drogas?
3) Como os demógrafos prevêem o tamanho da população do mundo em qualquer
tempo futuro?
4) Como pode um economista verificar se a mudança atual no Índice de Preços ao
Consumidor é a continuação de uma tendência secular, ou simplesmente um desvio
aleatório?
5) Como é possível para alguém predizer o resultado de uma eleição entrevistando
apenas algumas centenas de eleitores?
Estes são poucos exemplos nos quais a aplicação da estatística é necessária.
Por isso, a estatística tornou-se uma ferramenta cotidiana para todos os tipos de
profissionais que entram em contato com dados quantitativos ou tiram conclusões a
partir destes.

1.2. Definição de Estatística

“Estatística” é uma parte da Matemática Aplicada que fornece métodos para a


coleta, organização, descrição, análise e interpretação de dados. Ela é dividida em:

Estatística Descritiva: parte da Estatística que apenas coleta, descreve, organiza


e apresenta os dados. Nela não são tiradas conclusões.

Prof. Rodney Dieguez


Apostila de Estatística 5

Estatística Indutiva ou Inferência: analisa os dados e obtêm-se as conclusões.

1.3. Fases do Método Estatístico

Tabelas
Coleta de Crítica dos Apresentação
Análises
dados dados dos dados Gráficos

1.3.1. Coleta de Dados

Após a definição do problema a ser estudado e o estabelecimento do


planejamento da pesquisa (forma pela qual os dados serão coletados; cronograma das
atividades, custos envolvidos; exame das informações disponíveis; delineamento da
amostra etc.), o passo seguinte é a coleta de dados, que consiste na busca ou
compilação dos dados das variáveis, componentes do fenômeno a ser estudado.
A coleta de dados pode ser direta ou indireta.
- coleta direta: quando os dados são obtidos na fonte originária. Os valores
assim compilados são chamados de dados primários, como, por exemplo,
nascimentos, casamentos e óbitos, registrados no Cartório de Registro Civil;
opiniões obtidas em pesquisas de opinião pública; ou ainda, quando os dados
são coletados pelo próprio pesquisador.
A coleta direta pode ser classificada relativamente ao fator tempo em:
• contínua – quando feita continuamente, como por exemplo, nascimentos
e óbitos, freqüência dos alunos às aulas;
• periódica – quando feita em intervalos constantes de tempo, como os
censos (de 10 em 10 anos);
• ocasional – quando feita sem época preestabelecida.

- coleta indireta: quando os dados obtidos provêm da coleta direta. Os valores


assim compilados são denominados de dados secundários, como, por
exemplo, o cálculo do tempo de vida média, obtido pela pesquisa, nas tabelas
demográficas publicadas pela Fundação Instituto Brasileiro de Geografia e
Estatística, se constitui em uma coleta indireta.

Prof. Rodney Dieguez


Apostila de Estatística 6

1.3.2. Crítica dos Dados

Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de


possíveis falhas e imperfeições, eliminando os erros capazes de provocar futuros
enganos de apresentação e análise.

1.3.3. Apresentação dos Dados

Após a crítica, os dados devem ser apresentados sob forma adequada (tabelas
ou gráficos), para o melhor entendimento do fenômeno que está sendo estudado.

1.3.4. Análise dos Resultados

Realizadas as fases anteriores, faz-se uma análise dos resultados obtidos,


através dos métodos da Estatística Indutiva ou Inferência, e tiram-se as conclusões e
previsões.

Prof. Rodney Dieguez


Apostila de Estatística 7

2. Amostragem

2.1. Tipos de Variáveis

Variável é o conjunto de resultados possíveis de um fenômeno. Por exemplo:


- Para o fenômeno “sexo” são dois os resultados possíveis: sexo
masculino e sexo feminino;
- Para o fenômeno “número de filhos” há um número de resultados
possíveis expressos através dos números naturais: 0, 1, 2, 3, ... n;
- Para o fenômeno “estatura” temos uma situação diferente, pois os
resultados podem tomar um número infinito de valores numéricos
dentro de um determinado intervalo.
As variáveis podem ser:

Variáveis quantitativas - refere-se a quantidades e pode ser medidas em uma escala


numérica. Exemplos: idade de pessoas, preço de produtos, peso de recém nascidos.
Elas subdividem-se em dois grupos:
- Variáveis quantitativas discretas: são aquelas que assumem apenas valores
inteiros. Normalmente refere-se a contagens. Por exemplo: número de vendas
diárias em uma empresa, número de pessoas por família, quantidade de
doentes por hospital.

- Variáveis quantitativas contínuas: são aquelas que assumem valores dentro


de um intervalo real. Normalmente refere-se a medidas. Exemplos dessas
variáveis são: o “peso” das pessoas, a renda familiar, o consumo mensal de
energia elétrica, o preço de um produto agrícola.

Variáveis Qualitativas - refere-se a dados não numéricos. Exemplos dessas variáveis


são o sexo das pessoas, a cor, o grau de instrução. Elas subdividem-se também em
dois grupos:

Prof. Rodney Dieguez


Apostila de Estatística 8

- Variáveis qualitativas ordinais: são aquelas que definem um


ordenamento ou uma hierarquia. Exemplos são o grau de instrução, a
classificação de um estudante no curso de estatística, as posições das
100 empresas mais lucrativas, etc.
- Variáveis qualitativas nominais: por sua vez não definem qualquer
ordenamento ou hierarquia. São exemplos destas a cor, o sexo, o local
de nascimento, etc.

Exercício: Classifique as variáveis em qualitativas (nominal ou ordinal) ou quantitativas


(contínuas ou discretas):
a) Universo: alunos de uma escola
Variável: cor dos cabelos Classificação: ________________________
b) Universo: casais residentes em uma cidade
Variável: número de filhos Classificação: ________________________
c) Universo: as jogadas de um dado
Variável: o ponto obtido em cada jogada Classificação: ___________________
d) Universo: peças produzidas por uma máquina
Variável: nº de peças produzidas/hora Classificação: ___________________
e) Universo: peças produzidas por uma máquina
Variável: diâmetro externo Classificação: ___________________
f) Universo: funcionários de uma empresa
Variável: grau de instrução Classificação:
________________________

2.2. População

É um conjunto de indivíduos ou de objetos que tem pelo menos uma


característica comum. A população pode ser finita ou infinita. Na prática, quando uma
população é finita, com um número grande de elementos, considera-se como
população infinita. Exemplo: alunos de uma escola.

Prof. Rodney Dieguez


Apostila de Estatística 9

2.3. Amostra

É uma pequena parte selecionada de uma população que se pretende estudar.


Fazemos uma amostragem quando:
- O número de elementos da população é muito grande;
- Quando queremos economizar tempo e dinheiro.
A amostra é escolhida através de técnicas adequadas que garantam o acaso na
escolha.

2.4. Técnicas de Amostragem

Amostragem é o processo de obtenção de amostras de uma população. Existem


dois tipos de amostragem: probabilística e não probabilística.

2.4.1. Amostragem Probabilística: É uma amostra selecionada de tal forma que cada
item ou pessoa na população estudada têm uma probabilidade (não nula) conhecida de
ser incluída na amostra. Pode-se destacar três:

Amostragem Casual Simples ou Aleatória


Definição: É aquela em que todo elemento da população tem igual probabilidade de
pertencer à amostra e todas as amostras possíveis têm igual probabilidade de ocorrer.
Exemplo: Os elementos da amostra são sorteados entre todos os elementos da
população por algum dispositivo adequado (Tabela de números aleatórios).

Amostragem Sistemática
Definição: É aquela em que os elementos da população se apresentam ordenados e a
retirada é realizada através de um sistema preestabelecido.
Exemplo: Numa lista telefônica, sorteia-se um entre os 100 primeiros assinantes e a
partir deste retira-se outro a cada 100.

Prof. Rodney Dieguez


Apostila de Estatística 10

Amostragem Estratificada
Definição: É um processo de amostragem usado quando as populações são
heterogêneas. Divide-se a população em sub-populações denominados estratos. Após
a determinação dos estratos, seleciona-se uma amostra aleatória de cada um dos
estratos. Tipos de variáveis que podem ser usadas em estratificação: idade, classes
sociais, sexo, profissão, salário, procedência, etc.

Exemplo: Numa pesquisa de renda média familiar podemos dividir uma cidade nos
seguintes estratos: bairros de classe A, bairros de classe B, bairros de classe C, etc. e
em seguida retirar um número proporcional de elementos de cada estrato para formar a
amostra estratificada.

2.4.2. Amostragem não-probabilística: É uma amostra selecionada onde cada item


ou pessoa na população estudada tem probabilidade desconhecida de pertencer à
amostra.

Amostragem com inacessibilidade a toda a população.


Definição: É aquela na qual a população não se encontra toda disponível para formar
a amostragem.
Exemplo: A população de peças fabricadas por uma máquina. Uma parte das peças
dessa população, ainda não foram fabricadas, portanto, não estão disponíveis para
serem retiradas no processo de amostragem.

Amostragem a esmo ou sem norma


Definição: É aquela na qual o pesquisador, para simplificar o processo, procura ser
aleatório sem, no entanto, realizar propriamente o sorteio usando algum dispositivo
aleatório confiável.
Exemplo: A extração de uma amostra de 100 parafusos de uma caixa contendo10000,
evidentemente não se faz através de sorteio por ser extremamente trabalhoso, faz-se
então através de retiradas a esmo.

Prof. Rodney Dieguez


Apostila de Estatística 11

Amostragem intencional
Definição: É aquela em que o pesquisador deliberadamente escolhe certos elementos
para pertencer à amostra, por julgar tais elementos bem representativos da população.
Exemplo: Muitas amostragens de pesquisa de opinião são obtidas dessa maneira, por
motivo de tempo e custo.

3. Estatística Descritiva: Gráficos Estatísticos

3.1. Gráficos Estatísticos

A representação gráfica das séries estatísticas tem por finalidade dar uma idéia,
a mais imediata possível, dos resultados obtidos, permitindo chegar a conclusões
sobre a evolução do fenômeno ou sobre como se relacionam os valores da série. A
escolha do gráfico mais apropriado ficará a critério do analista.
Contudo, os elementos simplicidade, clareza e veracidade devem ser
considerados quando da elaboração de um gráfico.
Os principais tipos de gráficos.

a) Gráfico em Colunas ou em Barras: esses dois tipos de gráficos são


geralmente utilizados para comparar diferentes valores da mesma variável.

Prof. Rodney Dieguez


Apostila de Estatística 12

b) Gráficos em Setores: É a representação gráfica de uma série estatística, em


um círculo, por meio de setores. É utilizado principalmente quando se pretende
comparar cada valor da série com o total. Para construí-lo, divide-se o círculo
em setores, cujas áreas serão proporcionais aos valores da série. Essa divisão
poderá ser obtida pela solução da regra de três.

Total _____ 360 o

Parte _____ x o

Prof. Rodney Dieguez


Apostila de Estatística 13

c) Gráfico em Curvas ou Linear: é utilizado para representar o crescimento ou o


decrescimento da variável. Exemplo:
Gráfico Linear
500

400

300
VENDAS

200

100

0
1991 1992 1993 1994 1995 1996 1997
Anos

3.2. Dicas para a Apresentação dos Dados

Dados

Dados Dados
Qualitativos Quantitativos

Métodos Métodos Métodos Métodos


Tabulares Gráficos Tabulares Gráficos

Distribuições de Gráficos de Distribuições de


Histograma
freqüências barras e pizza freqüências

Prof. Rodney Dieguez


Apostila de Estatística 14

4. Estatística Descritiva: Distribuição de Freqüências

Um estudo completo das distribuições de freqüências é imprescindível devido que


este é o tipo de tabela mais importante para a Estatística Descritiva. A seguir são
descritos os procedimentos usuais na construção dessas tabelas. Primeiramente
vamos ver alguns conceitos fundamentais.

a) Dados brutos: O conjunto dos dados numéricos obtidos após a crítica dos valores
coletados. Os seguintes valores poderiam ser os dados brutos: 24, 23, 22, 28, 35,
21, 23, 33.

b) Rol: É o arranjo dos dados brutos em ordem de freqüência crescente ou


decrescente. Os dados brutos anteriores ficariam assim: 21, 22, 23, 23, 24, 28, 33,
35.

c) Amplitude Total ou "range" (R). É a diferença entre o maior e o menor valor


observado. No exemplo, R = 35 - 21 = 14.

4.1 Freqüência Absoluta (fi)

É o número de vezes que o elemento aparece na amostra, ou o número de


elementos pertencentes a uma classe.

4.2 Freqüência Acumulada (fac)

É a soma da freqüência absoluta da classe com a freqüência absoluta das classes


anteriores.

4.3 Freqüência Relativa (fr)

Prof. Rodney Dieguez


Apostila de Estatística 15

A freqüência relativa é o valor da freqüência absoluta dividido pelo número total de

fi
observações: fr = .
n
4.4 Freqüência Acumulada Relativa (far)
A freqüência acumulada relativa é o valor da freqüência acumulada dividido pelo

f ac
número total de observações: far = .
n

4.5 Distribuição de Freqüências e Histograma para Dados sem Intervalo de Classe

Utilizamos esse tipo de distribuição quando o número de elementos distintos da


amostra for pequeno.
Exemplo: Considere o seguinte conjunto de dados: 21, 21, 21, 22, 22, 23, 23, 24,
25, 25, 25, 25, 26, 26, 26, 28, 30. Construa uma distribuição com todas as freqüências.
X fi fac fr far
21
22
23
24
25
26
28
30

4.5.1 Histograma

Histograma é uma representação gráfica de uma tabela de distribuição de


freqüências. Desenhamos um par de eixos cartesianos e no eixo horizontal (abcissas)
colocamos os valores da variável em estudo e no eixo vertical (ordenadas) colocamos
os valores das freqüências. O histograma tanto pode ser representado para as
freqüências absolutas como para as freqüências relativas.

Prof. Rodney Dieguez


Apostila de Estatística 16

4.5.2. Ogiva

Ogiva é uma representação gráfica de uma tabela de distribuição de freqüências


acumuladas.

4.6. Distribuição de Freqüência e Histograma para Dados com Intervalo de Classe

Quando o número de elementos distintos da amostra for grande, os dados


devem ser tabulados em intervalos de classes. Exemplo: Dado o conjunto de dados
abaixo, construa sua distribuição de freqüências.

47 43 50 50 50 46 45 48
51 48 48 44 41 45 44 46
43 43 45 47 43 42 45 44
48 45 45 57 47 45 46 43
51 40 52 47 52 46 53 49

Alguns passos devem ser seguidos para a tabulação de freqüências de dados.


1. Definir o número de classes. O número de classes não deve ser muito baixo nem
muito alto. Um número de classes pequeno gera amplitudes de classes grandes o
que pode causar distorções na visualização do histograma. Um número de classes
grande gera amplitude de classes muito reduzidas. Foram definidas regras práticas
para a determinação do número de classes, sendo que este deve variar entre 5 e 20
(5 para um número muito reduzido de observações e 20 para um número muito
elevado). Se n representa o número de observações (na amostra ou na população,
conforme for o caso) o número aproximado de classes pode ser calculado por
Número de Classes(k), k = n arredondando os resultados. No caso do nosso

exemplo temos n = 40 e k= 40 = 6,32 então o número de classes será 6.

Prof. Rodney Dieguez


Apostila de Estatística 17

2. Calcular a amplitude das classes(h). A amplitude será obtida conhecendo-se o


número de classes(k) e amplitude total(AT) dos dados. A amplitude total dos dados é
o resultado da subtração valor máximo - valor mínimo da série de dados. A
amplitude de classe será:
AT
h=
k
Em geral, o valor do resultado é também arredondado para um número inteiro
mais adequado. No nosso exemplo temos:

57 - 40
h= = 2,8 ≅ 3
6

3. Preparar a tabela com os limites de cada classe. Na tabela abaixo apresentamos


para os dados do nosso exemplo os limites inferior(L inf) e superior (Lsup) de cada uma
das 6 classes de freqüência.
Classe Limite inferior Limite Superior
1
2
3
4
5
6

Para a construção da distribuição de freqüências usamos a simbologia de intervalos


abertos e fechados. Exemplo: 40 |------ 43 significa que pertencem ao intervalo todos os
valores de 40 a 42.

Prof. Rodney Dieguez


Apostila de Estatística 18

4. Tabular os dados por classe de freqüência. De acordo com nosso exemplo,


teremos:
Classe fi fac fr far
40 |--- 43
43 |--- 46
46 |--- 49
49 |--- 52
52 |--- 55
55 |--- 58
Total

4.6.1 Histograma

4.6.2. Polígono de Freqüência

Prof. Rodney Dieguez


Apostila de Estatística 19

5. Estatística Descritiva: Medidas de Tendência Central (ou


de Posição)

No estudo de uma série estatística é conveniente o cálculo de algumas medidas


que a caracterizem. Essas medidas, quando bem interpretadas, podem fornecer
informações muito valiosas com respeito a séries estatísticas. Elas são chamadas de
medidas de tendência central e são usadas para indicar um valor que tende a
representar melhor um conjunto de dados. Geralmente localiza-se no centro ou em
torno do centro de uma série, onde maior parte dos dados tende a se concentrar.
Quando o cálculo dessas medidas é feito a partir de uma amostra, elas recebem o
nome de estimativas e quando é feito a partir de uma população, recebem o nome de
parâmetros. As principais medidas de tendência central são: média, mediana e moda.

5.1. Média:

5.1.1. Dados Brutos ou Rol

A média é definida como a soma das observações dividida pelo número de


observações. Ela é dada por:
n N
∑ xi para amostra
∑ xi para população
i =1 i =1
X= µ=
n N
n
Para facilitar, usaremos ∑ xi = ∑ xi
i =1

Exemplo: Calcule a média da variável x: 2,4,6,8.

X= 5

Prof. Rodney Dieguez


Apostila de Estatística 20

5.1.2. Dados Agrupados sem Intervalos de Classe

A média para dados agrupados sem intervalo de classe é obtida por:

∑ x i f i para amostra µ=∑ i i


xf
X= para população
∑ fi ∑f i

onde ∑ f i = n ou N

Exemplo: Determinar a média da distribuição:


xi fi xifi
2 1 2
5 4 20
6 3 18
8 2 16
∑ 10 56

Então: X=
∑x f
i i
= X=
56
= 5,6
∑f i 10

5.1.3. Dados Agrupados com Intervalos de Classe

Para o cálculo da média para dados agrupados com intervalos de classe, é


necessário calcular o ponto médio de cada classe. A média é obtida por:

X=
∑ Pm f i µ=∑ m i
P f
para amostra para população
∑ fi ∑ fi

onde: Pm é o ponto médio de cada classe.

Prof. Rodney Dieguez


Apostila de Estatística 21

O ponto médio de cada classe é definido por:

L inf + L sup
Pm =
2

Exemplo: Calcular a média da distribuição:


classes fi Pm Pmfi
0 |------ 2 1 1 1
2 |------ 4 10 3 10
4 |------ 6 8 5 40
6 |------ 8 1 7 7
∑ 20 58

Então: X= ∑ Pm f i = X = 58 = 2,9
∑ fi 20

5.2. Mediana (Md):

A mediana é um valor real que separa o rol em duas partes deixando à sua
esquerda o mesmo número de elementos que a sua direita. Portanto, a mediana é um
valor que ocupa a posição central em uma série. Ela é denotada por: Md.

5.2.1 Dados Brutos ou Rol

Inicialmente devemos ordenar os elementos, em seguida determinarmos o


número n de elementos.

Se n é ímpar: a mediana é o termo central, ou seja, o termo que ocupa a posição

 n +1
 = posição .
o

 2 
Exemplo: Determinar a mediana do conjunto: x: 2, 20, 12, 23, 20, 8, 12.
Ordenando os termos: 2, 8, 12, 12, 20, 20 ,23.

 7 + 1 o
Como n=7 (ímpar), então a posição do termo central é  =4 .
 2 
Portanto, a mediana é o quarto elemento do Rol: Md = 12 .

Prof. Rodney Dieguez


Apostila de Estatística 22

Se n é par: a mediana será a média aritmética dos dois termos centrais, ou seja, os

o o
n n 
termos que ocupam as posições   e  + 1
2 2 
Exemplo: Determinar a mediana da série: x: 7, 21, 13, 15, 10, 8, 9, 13.
Ordenando os termos: 7, 8, 9, 10, 13, 13, 15, 21.

8
 =4 e
o
Como n=8 (par), então a posição dos dois termos centrais são
 2

8  o
 + 1 = 5
2 
Então, a mediana será a média do terceiro e quarto elemento do Rol.

A mediana será: Md = 11,5

5.2.2. Dados Agrupados sem Intervalos de Classe

Basta verificar se o número de elementos é par ou ímpar e aplicar o mesmo


raciocínio do caso anterior. Para facilitar a localização dos termos centrais calcula-se a
freqüência acumulada da série.
Exemplo: Determinar a mediana da distribuição:
xi fi
2 1
5 4
6 3
8 1

Solução: O número de elementos é: n=∑fi=9 (ímpar). Então, o termo central será

o o
 n + 1  9 + 1
aquele que ocupará a posição   =  = 5º. Para encontrar o quinto
 2   2 
elemento da distribuição, construímos uma nova coluna na tabela e determinamos as
freqüências acumuladas.

Prof. Rodney Dieguez


Apostila de Estatística 23

xi fi fac
2 1 1
5 4 5
6 3 8
8 1 9
∑ 9

Observando a freqüência acumulada, nós temos o nº 2 que ocupa a 1ª posição,


o nº 5 que ocupa as posições 2ª, 3ª, 4ª e 5ª. Então, a mediana será: Md =

5.2.3. Dados Agrupados com Intervalos de classe

Neste caso, o cálculo da mediana é feito através da fórmula:

 n / 2 − fant 
Md = l md +   . h
 f md 
onde: lmd = limite inferior da classe mediana. A classe mediana é obtida através de n/2;
fant = freqüência acumulada da classe anterior a classe mediana;
fmd = freqüência absoluta da classe mediana;
h = amplitude da classe (h=Lsup – linf)

Exemplo: Determinar a mediana da distribuição:


classes fi
2 |------ 4 2
4 |------ 6 9
6 |------ 8 8
8 |------ 10 1

Solução: O número de elementos é 20, então a classe mediana será: n/2 = 20/2=10º.
Identifica-se a classe mediana através da freqüência acumulada, ou seja, qual classe
está o 10º elemento. Observando a freqüência acumulada, temos o 10º elemento na 2ª
classe.

classes fi fac
2 |------ 4 2 2
4 |------ 6 9 11
6 |------ 8 8 19
8 |------ 10 1 20

Prof. Rodney Dieguez


Apostila de Estatística 24

∑ 20

lmd = 4 fant= 2 fmd = 9 h= 2


Aplicando a fórmula, temos:
Md = 5,78

5.3. Moda (Mo)

É o valor de maior freqüência em um conjunto de dados. Ela é denotada por Mo.

5.3.1. Dados Brutos ou Rol

Verifica-se qual o elemento que tem maior freqüência.


Exemplos: Determinar a moda dos conjuntos de dados:

a) x: 2, 8, 3, 5, 4, 5, 3, 5, 5, 1.
O elemento de maior freqüência é 5. Portanto, Mo = . É uma seqüência
unimodal, pois só temos uma moda.

b) X: 6, 10, 5, 6, 10, 2.
Este conjunto de dados apresenta o elemento 6 e 10 como elementos de maior
freqüência. Portanto, Mo = e Mo = . Por isso é chamada de bimodal.

Quando não houver elementos que se destaque pela maior freqüência, dizemos
que a série é amodal.
Exemplo: x: 3, 3, 3, 4, 4, 4.
Não há moda, pois os elementos têm a mesma freqüência.

5.3.2. Dados Agrupados sem intervalos de classe

Neste caso, verificamos o elemento de maior freqüência absoluta. Exemplo:


Determinar a moda da distribuição abaixo:
xi fi
2 1

Prof. Rodney Dieguez


Apostila de Estatística 25

5 4
6 3
8 1
∑ 9
Observamos que a maior freqüência absoluta é o número 4, que corresponde ao
elemento 5 da distribuição. Portanto, a moda é Mo = 5

5.3.3. Dados Agrupados com intervalos de classe


Neste caso, verificamos a classe que tem maior freqüência absoluta e aplicamos
a fórmula.

∆1
M O = l mo + ⋅h
∆1 + ∆ 2

onde: lmo = limite inferior da classe modal


∆1 = diferença entre a freqüência absoluta da classe modal e a da classe anterior
∆2 = diferença entre a freqüência absoluta da classe modal e a da classe
posterior
h = amplitude da classe
Exemplo: Determinar a moda da distribuição abaixo:
classes fi
0 |------ 2 2
2 |------ 4 2
4 |------ 6 4
6 |------ 8 2
∑ 10
Solução: A classe modal é aquela que tem maior freqüência absoluta, então a classe
modal é a 3ª classe. Encontrando os valores, temos:
lmo = 4 ∆1 = 4 – 2= 2 ∆2 = 4 – 2 = 2 h= 2
Aplicando a fórmula, temos:

∆1
M O = l mo + ⋅h
∆1 + ∆ 2

MO = 5

5.4. Utilização das Medidas de Tendência Central


Prof. Rodney Dieguez
Apostila de Estatística 26

Na maioria das situações, não necessitamos calcular as três medidas de


tendência central. Normalmente precisamos de apenas uma das medidas para
caracterizar o centro da série.
A medida ideal em cada caso é aquela que melhor representa a maioria dos
dados da série.
Quando houver forte concentração de dados na área central da série, devemos
optar pela Média.
Quando houver forte concentração de dados no início e no final da série,
devemos optar pela Mediana.
A Moda deve ser a opção como medida de tendência central apenas em séries
que apresentam um elemento típico, isto é, um valor cuja freqüência é muito superior à
freqüência dos outros elementos da série.

Prof. Rodney Dieguez


Apostila de Estatística 27

6. Estatística Descritiva: Medidas de Dispersão

As medidas de dispersão são medidas que mostram o grau de dispersão ou de


concentração em torno da média. As medidas de dispersão mais utilizadas são:
variância, desvio padrão e coeficiente de variação.

6.1 Variância e Desvio Padrão

A variância é uma média aritmética calculada a partir dos quadrados dos desvios
obtidos entre os elementos da série e a sua média.
Quando o conjunto de dados representa uma população a variância é denotada
por σ2(x) e o desvio padrão correspondente por σ(x).
Quando o conjunto de dados representa uma amostra a variância é denotada
por s2(x) e o desvio padrão correspondente por s(x).

6.1.1 Dados Brutos ou Rol

A variância é dada por:

2
s = ∑ (x i − X)2
, para a amostra;
n −1

σ =2∑ (x i − µ )2
, para a população.
N
O desvio padrão é a raiz quadrada positiva da variância.

s = s 2 , para a amostra;

σ = σ 2 , para a população.

Exemplo: Determine a variância e o desvio padrão da série: X: 2, 4, 6, 8, representativa


de uma amostra.

Prof. Rodney Dieguez


Apostila de Estatística 28

∑ xifi
Solução: Primeiro, calculamos a média: X = =
∑ fi

xi fi xifi (xi - µ)2 fi(xi - µ)2


2 1 2 9 9
4 1 4 1 1
6 1 6 1 1
8 1 8 9 9
∑ 4 20 20

σ 2
=
∑(x i − µ ) 2 . fi
=
20
=5
N 4

6.1.2. Dados Agrupados sem Intervalos de Classe

Neste caso, a variância é dada por:

2
s = ∑ fi (xi − X)2
, para a amostra;
n −1

σ =
2 ∑ fi (xi − µ )2
, para a população.
N
O desvio padrão é a raiz quadrada positiva da variância.

s = s 2 , para a amostra;

σ = σ 2 , para a população.

Prof. Rodney Dieguez


Apostila de Estatística 29

Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa


de uma população.
xi fi xifi (xi - µ)2 fi(xi - µ)2
2 3
3 5
4 8
5 4
∑ 20

µ=∑ i i =
xf
Primeiro, calculamos a média:
∑ fi
Como estamos trabalhando com uma população a variância é dada por:

2
σ = ∑ fi (xi − µ )2
=
N
O desvio padrão será:

σ= =

6.1.3. Dados Agrupados com Intervalos de Classe

A variância para dados agrupados com intervalos de classe é dada por:

2
s = ∑ f i ( Pm − X ) 2
, para a amostra;
n −1

σ =
2 ∑ f i ( Pm − µ ) 2
, para a população.
N

O desvio padrão é dado por:

s = s 2 , para a amostra;

σ = σ 2 , para a população.

Prof. Rodney Dieguez


Apostila de Estatística 30

Exemplo: Calcule a variância e o desvio padrão da série abaixo, representativa


de uma população:
classes fi Pm Pmfi ( Pm − µ ) 2 f i ( Pm − µ ) 2
0 |------ 2 1
2 |------ 4 10
4 |------ 6 8
6 |------ 8 1
∑ 20

Primeiramente calculamos o ponto médio de cada classe e em seguida a média:

X= ∑ Pm f i =
∑ fi
Como estamos trabalhando com uma população a variância é dada por:

2
σ = ∑ f i ( Pm − µ ) 2
=
N
O desvio padrão será:

σ= =

6.2. Coeficiente de Variação (CV)

É uma medida relativa de dispersão, útil para a comparação em termos relativos


do grau de concentração em torno da média. Ele é expresso em porcentagem.

σ
CV = ⋅ 100 para população
µ

s
CV = .100 para amostra
X
Se: CV ≤ 15% ⇒ Baixa dispersão – Homogênea, estável, regular.
15% < CV< 30% ⇒ Média dispersão.
CV ≥ 30% ⇒ Alta dispersão – Heterogênea.

7. Exercícios:

Prof. Rodney Dieguez


Apostila de Estatística 31

7.1. Capítulo 3
1. Um estudo sobre o problema do desemprego na Grande São Paulo, no período
1985-1996, realizado pelo SEADE-DIEESE, apresentou o seguinte gráfico sobre a
taxa de desemprego:

Médias anuais da taxa de desemprego total


Grande São Paulo 1985-1996

16%
15%
Taxa de de se mpre go

14%
13%
12%
11%
10%
9%
8%
7%
6%
85 86 87 88 89 90 91 92 93 94 95 96 97

Ano

Pela análise do gráfico, é correto afirmar que, no período considerado:


a) a maior taxa de desemprego foi de 14%;
b) a taxa de desemprego no ano de 1995 foi a menor do período;
c) a partir de 1992, a taxa de desemprego foi decrescente;
d) no período 1985-1996, a taxa de desemprego esteve entre 8% e 16%.

2. Uma pesquisa de opinião foi realizada para avaliar os níveis de audiência de alguns
canais de televisão, entre 20h e 21h, durante determinada noite. Os resultados
obtidos estão representados no gráfico de barras a seguir:

Prof. Rodney Dieguez


Apostila de Estatística 32

120

100

80

60

40

20

0
TvA TvB TvC TvD Nenhum Canal

I. O número de residências pesquisadas foi, aproximadamente de:


a) 100 b) 135 c) 200 d) 220
II. O número de entrevistados que declararam estar assistindo a TvB é
aproximadamente igual a:
a) 30 pessoas b) 20 pessoas d) 18 pessoas d) 22 pessoas

7.2. Capítulo 4
1. Considere os resultados finais, numa determinada disciplina, obtidos por 20
estudantes de uma dada Universidade: 9, 14, 12, 8, 14, 12, 16, 16, 8, 14,11, 12, 14,
11, 11, 18, 14, 18, 15, 15. Construa uma distribuição de freqüências para esses
dados.

2. Admita que foi realizado um inquérito a um grupo de compradores de 30 carros


novos para determinar quantas reparações ou substituições de peças foram feitas
durante o primeiro ano de utilização dos carros, tendo-se obtido os seguintes
resultados: 1, 4, 1, 2, 2, 3, 3, 2, 1, 2, 3, 2, 3, 1, 0, 1, 2, 0, 4, 3, 2, 1, 2, 4, 2, 1, 3, 1, 0,
1. Apresente os dados numa tabela de distribuição de freqüências.

3. Os seguintes dados representam as contribuições fiscais, durante um ano, de 40


pessoas escolhidas aleatoriamente:

Prof. Rodney Dieguez


Apostila de Estatística 33

Agrupe os dados numa distribuição de freqüências.

4. A listagem seguinte refere-se aos montantes de 40 empréstimos pessoais de uma


companhia financeira, em milhares de reais.

900 1000 300 2000


500 550 1100 1000
450 950 300 2000
1900 600 1600 450
1200 750 1500 750
1250 1300 1000 850
2500 850 1800 600
550 350 900 3000
1650 1400 500 350
1200 700 650 1500

Construa a distribuição de freqüências para os dados da tabela começando a primeira


classe no limite inferior de 300 mil reais e usando a amplitude de 400 mil reais para os
intervalos de classe.

5. A distribuição abaixo se refere a uma amostra da taxa de juros praticadas em 25


países:
Taxa de juros (%) Nº de países
1,0 |----- 2,4 4
2,4 |----- 3,8 3
3,8 |----- 5,2 6
5,2 |----- 6,6 10
6,6 |----- 8,0 2
Pede-se:
a) Determine as freqüências acumuladas, relativas (em %) e acumuladas relativas
(em %);
b) Complete as seguintes frases:
b1) O limite inferior da classe 2 é _________;
b2) O limite superior da classe 5 é ________;
b3) O ponto médio da classe 3 é __________;

b4) O ponto médio da classe 4 é __________;

Prof. Rodney Dieguez


Apostila de Estatística 34

b5) Em 92% dos países a taxa de juros é inferior a _________.


b6) Em _______% dos países a taxa de juros é superior ou igual a 3,8%.
b7) Em _______% dos paises a taxa de juros é ≥ 5,2% e < 6,6%.
b8) O número de países que possuem taxa juros ≥ 6,6% e < 8,0% são _____.

7.3. Capítulo 5
1. O Serviço de Recursos Humanos da Roth Young fez uma pesquisa sobre os
salários anuais para gerentes assistentes de lojas de departamentos Os dados são
mostrados na tabela abaixo (dados em mil dólares): (amostra)

Salário (US$) fi
1000 | 1200 2
1200 | 1400 6
1400 | 1600 10
1600 | 1800 5
1800 | 2000 2
Pede-se:
a) Calcule as freqüências acumuladas, relativas e as acumuladas relativas;
b) O limite superior da classe1?(R: 1200)
c) O limite inferior da classe 3? (R:1400)
d) O ponto médio da classe 2/(R:1300)
e) Qual a porcentagem de salários anuais menor que US$ 1200? (R: 8%)
f) Qual a porcentagem de salários anuais maior que US$ 1600? (R: 28%)
g) Qual o salário anual médio? (R: US$ 1492)
h) Qual o salário mediano? (R: US$ 1490)
i) Qual o salário modal? (R: US$ 1488,89)

2. A tabela abaixo representa o número de faltas anuais dos funcionários de uma


empresa: (população)
Nº faltas 0 1 2 3 4 5 6 7 8
Nº empregados 20 42 53 125 84 40 14 3 2

Determine:
a) a distribuição de freqüências;
b) a porcentagem de empregados que tiveram um número de faltas anuais ≤ 2? (R:
30%)

Prof. Rodney Dieguez


Apostila de Estatística 35

c) a porcentagem de empregados que tiveram um número de faltas anuais ≤ 3?(R:


62,5%)
d) a porcentagem de empregados que tiveram um número de faltas anuais ≥ 5? (R:
15%)
e) a porcentagem de empregados que tiveram um número de faltas anuais ≥ 4? (R:
37,3%)
f) a média (R: 3,1)
g) a mediana e a moda (R: Md= 3; Mo= 3)

3. Uma companhia afirma que o índice médio de nicotina dos cigarros que fabrica está
dentro do limite estabelecido pelas organizações mundiais de combate ao câncer.
Um laboratório que estuda os males do cigarro à saúde realiza uma análise,
utilizando uma amostra de 7 cigarros dessa companhia e obtém as seguintes
quantidades de nicotina (em mg):

25 24 23 22 29 23 23

Sabendo que o índice médio de nicotina recomendado por essas organizações deve
variar entre 21mg/cigarro e 22mg/cigarro, responda:
a) Qual é o índice médio de nicotina encontrado na amostra; (R: 24 mg/cig)
b) Qual é o índice modal de nicotina encontrado na amostra; (R: Mo=23mg/cig)
c) Qual é o índice mediano de nicotina encontrado na amostra; (R: Md=23 mg/cig)
d) Na sua opinião, o fabricante está obedecendo ao índice médio de nicotina
recomendado pelas organizações internacionais? Justifique a sua resposta!

7.4. Capítulo 6

1. Amostras de solo resultaram na seguinte distribuição para os valores de pH de um


solo latossol vermelho-amarelo.

Classe de pH Freqüência
4,5 |------ 5,5 6
5,5 |------ 6,5 3
6,5 |------ 7,5 4
7,5 |------ 8,5 7

Prof. Rodney Dieguez


Apostila de Estatística 36

8,5 |------ 9,5 4


Pede-se:
a) O pH médio; (R.7)
b) O pH mediano; (7,25)
c) O pH modal; (R. 8)
d) A variância, o desvio padrão e o coeficiente de variação.

2. O transporte público e o automóvel são dois meios de transportes que uma pessoa
pode usar para ir ao trabalho diariamente. Amostras de tempo para cada meio de
transporte estão registradas a seguir. Os tempos estão em minutos.

Transporte público 28 29 32 37 33 25 29 32 41 34
Automóvel 29 31 33 32 34 30 31 32 35 33

Qual o meio de transporte deve ser o preferido pelas pessoas? Justifique. (R: o
automóvel, pois tem a menor variabilidade)

3. Abaixo se tem o peso (kg) e altura (cm) de uma amostra de 6 pessoas.


Peso (kg) 79 83 57 58 67 70
Altura (cm) 170 179 165 156 165 179
Pede-se:
a) Calcule o peso médio e a altura média; (69kg; 169 cm)
b) Quem é mais variável, o peso ou a altura? Justifique sua resposta.( o peso,
pois seu CV é maior)

Prof. Rodney Dieguez


Apostila de Estatística 37

8. Referências Bibliográficas
ANDERSON, D. R., SWEENEY, D. J., WILLIAMS, T. A. Estatística Aplicada à
Administração e Economia. 1. ed. São Paulo: Thomson Learning, 2002.

LARSON, R; FARBER, B. Estatística Aplicada. 2 ed. São Paulo: Prentice Hall, 2004.

SILVA, E. M. et al. Estatística para os cursos de Economia, Administração e


Ciências Contábeis. v. 1e 2; 3. ed. São Paulo: Atlas, 1999.

VIEIRA, S. Princípios de Estatística. São Paulo: Thomson Learning, 2000.

Prof. Rodney Dieguez

Anda mungkin juga menyukai