Anda di halaman 1dari 56

Universidade Federal de Mato Grosso

Notas de Aula - Disciplina: Estatstica I


Profa Eveliny - 2016 - Curso: Estatstica
Sumrio
1 Introduo 3
1.1 Fases do Trabalho Estatstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Ramificaes da Estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Estatstica Descritiva 5
2.1 Classificao de variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Tipos de sries estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Anlise de Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.1 Distribuio de Frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.2 Representao Grfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Anlise de Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.1 Distribuio de Frequncias - Varivel Discreta. . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4.2 Representao Grfica - Varivel Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4.3 Distribuio de Frequncias - Varivel Contnua. . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.4 Representao Grfica - Varivel Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

3 Somatrio 20

4 Medidas de Posio ou Tendncia Central 21


4.1 Mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.1.1 Propriedades da mdia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.1.2 Exerccios: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.2 Mediana (Md) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3 Moda (Mo) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.4 Comparao entre Mdia, Mediana e Moda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
4.5 Simetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.6 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

5 Separatrizes 30
5.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Decis e Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

6 Medidas de Disperso 32
6.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.2 Amplitude Interquartlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.3 Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.4 Coeficiente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

7 Momentos, Assimetria e Curtose 37


7.1 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
7.2 Assimetria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
7.3 Curtose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

8 Box Plot ou Desenho Esquemtico 42

9 Tabelas Bidimensionais e Medidas de Associao 44


9.1 Medidas de Associao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
9.2 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

1
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

10 Correlao e Regresso Linear Simples 48


10.1 Anlise de Correlao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
10.1.1 Diagrama de Disperso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
10.1.2 Coeficiente de Correlao Linear de Pearson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
10.2 Regresso Linear Simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
10.2.1 Coeficiente de Determinao - R2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
10.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

2
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

1 Introduo
O surgimento da palavra Estatstica deriva da palavra latina statisticum collegium que significa conselho de Es-
tado. H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China e Egito e at mesmo o 4o livro do
Velho Testamento faz referncia a uma instruo dada a Moiss, para que fizesse um levantamento dos homens de Israel
que estivessem aptos para guerrear. Usualmente, estas informaes eram utilizadas para a taxao de impostos ou para
o alistamento militar. O Imperador Csar Augusto, por exemplo, ordenou que se fizesse o Censo de todo o Imprio Ro-
mano. Contudo, mesmo que a prtica de coletar dados sobre colheitas, composio da populao humana ou de animais,
impostos, etc., fosse conhecida pelos egpcios, hebreus, caldeus e gregos, e se atribuam a Aristteles cento e oitenta descri-
es de Estados, apenas no sculo XVII a Estatstica passou a ser considerada disciplina autnoma, tendo como objetivo
bsico descrio dos bens do Estado. A palavra Estatstica foi cunhada pelo acadmico alemo Gottfried Achenwall
(1719-1772), que foi um notvel continuador dos estudos de Hermann Conrig (1606- 1681). Gottfried determinou os ob-
jetivos da Estatstica e suas relaes com as demais cincias. Com a Escola Alem as tabelas tornaram-se mais completas,
surgiram as representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser simples catalogao de
dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da
observao de partes desse todo (amostras). Atualmente, os estudos estatsticos tm avanado rapidamente e, com seus
processos e tcnicas, tm contribudo para a organizao dos negcios e recursos do mundo moderno.

(Fonte: http://www.ifba.edu.br/dca/Corpo_Docente/MAT/ICCL/APOSTILA_DE_ESTAT_STICA.pdf)
mundo moderno.
A Estatstica uma cincia cujo campo de aplicao estende-se a diversas reas do conhecimento humano. Em
funo da facilidade que o uso dos computadores nos proporciona, muitos pesquisadores consideram-se aptos a fazerem
anlises e inferncias estatsticas sem um conhecimento mais aprofundado dos conceitos e teorias. Tal prtica, em geral,
resulta em interpretaes equivocadas e muitas vezes errneas.
No desenvolvimento cientfico e em nosso prprio dia-a-dia, estamos sempre fazendo observaes de fenmenos,
gerando dados. Quando as pessoas ouvem a palavra estatstica, imaginam logo taxas de acidente, ndices de mortali-
dade, litros por quilmetro etc. Os agrnomos esto frequentemente analisando o efeito de agrotxicos na agricultura,
os engenheiros analisam dados de propriedades de materiais e todos ns, ao lermos jornais e revistas, estamos vendo
resultados estatsticos provenientes do censo demogrfico, de pesquisas eleitorais etc.
Entende-se a Estatstica como um conjunto de tcnicas que permite, de forma sistemtica, organizar, descre-
ver, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento.
Denomina-se por dados um (ou mais) conjunto de valores, numricos ou no.
As variveis so o foco principal da pesquisa em cincias. Uma varivel simplesmente algo que pode variar,
isto , pode assumir valores ou categorias diferentes. Alguns exemplos de variveis so gnero (sexo), velocidade de
digitao, nmero de sintomas registrados de uma doena, nvel de ansiedade, nmero de gols em uma partida de futebol,
cores favoritas etc. Estes so exemplos de itens que se pode medir e registrar e que variam de uma situao ou pessoa para
outra.
As anlises estatsticas dependem da forma como os dados so coletados e o planejamento estatstico da pesquisa
indica o esquema sob o qual os dados sero obtidos. Portanto, o planejamento da pesquisa e a anlise estatstica dos
dados esto intimamente ligados. Dessa forma, o pesquisador deve possuir um razovel conhecimento de estatstica para
desenvolver suas pesquisas ou, ento, consultar um estatstico para auxili-lo. Esta consulta deve ser feita antes do incio
da pesquisa, ainda durante a fase de elaborao do projeto. 1

1.1 Fases do Trabalho Estatstico


O Trabalho Estatstico pode ser descrito pelas etapas a seguir:
Definio do problema - Consiste na:
formulao correta do problema;
examinar outros levantamentos realizados no mesmo campo (reviso da literatura);
saber exatamente o que se pretende pesquisar definindo o problema corretamente (variveis, populao, hip-
teses, etc.)
Planejamento -Determinar o procedimento necessrio para resolver o problema:
Como levantar informaes;
1 ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

3
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial).


Cronograma, Custos, etc.
Coleta de dados - Consiste na obteno dos dados referentes ao trabalho que desejamos fazer;
A coleta pode ser: Direta - diretamente da fonte ou Indireta - feita atravs de outras fontes.
Os dados podem ser obtidos pela prpria pessoa (primrios) ou se baseia no registro de terceiros (secundrios).
Apurao dos dados - Consiste em resumir os dados, atravs de uma contagem e agrupamento. um trabalho de
coordenao e de tabulao.
Apresentao dos dados - a fase em que vamos mostrar os resultados obtidos na coleta e na organizao. Esta
apresentao pode ser:
Tabular (apresentao numrica)
Grfica (apresentao geomtrica)
Anlise e interpretao dos dados - a fase mais importante e tambm a mais delicada. Tirar concluses que
auxiliam o pesquisador a resolver seu problema.

1.2 Ramificaes da Estatstica


1. Estatstica Descritiva
Compreende a organizao, o resumo e, em geral, a simplificao de informaes que podem ser muito complexas.
A finalidade tornar as coisas mais fceis de entender, de relatar e de discutir. A mdia industrial Dow-Jones, a
taxa de desemprego, o custo de vida, o ndice pluviomtrico, tudo isto se enquadra nessa categoria. A estatstica
descritiva vai resumir as informaes atravs do uso de certas medidas-sntese, que tornem possvel a interpretao
de resultados. No sentido mais amplo, suas funes so:
coleta de dados;
organizao e classificao destes dados;
apresentao atravs de grficos e tabelas;
clculo de coeficientes (estatsticos), que permitem descrever resumidamente os fenmenos.
2. Probabilidade
til para analisar situaes que envolvem o acaso. Exemplo de situaes que enquadram-se na categoria do acaso:
Jogos de dados e de cartas ou Lanamento de uma moeda para o ar. A maioria dos jogos esportivos influenciada
pelo acaso at certo ponto.
3. Inferncia
Refere-se a anlise e interpretao de dados amostrais. Utilizando uma amostra possvel fazer inferncia para a
toda populao. Um exemplo do uso da inferncia no nosso dia-a-dia que no precisamos beber toda a sopa para
saber se est ou no salgada. A idia bsica da amostragem efetuar determinada mensurao sobre uma parcela
pequena, mas tpica, de determinada populao e utilizar essa informao para fazer inferncia sobre a populao
toda.
Firmas comerciais e entidades governamentais recorrem a amostragem por vrias razes. O custo usualmente um
fator relevante. Coligir dados e analisar resultados custa dinheiro e, em geral, quanto maior o nmero de dados
coligidos, maior o custo. A amostragem reduz a quantidade de dados a coligir e analisar, diminuindo assim os
custos. 2
Em estatstica utilizaremos extensivamente os termos populao e amostra. Assim, definiremos esses termos no
contexto da estatstica:
Populao: conjunto dos elementos (valores, pessoas, medidas) que possuem pelo menos uma caracterstica em
comum. Podem ser tanto seres animados ou inanimados;
Amostra: um subconjunto de elementos extrados de uma populao;
Censo: uma coleo de dados relativos a todos os elementos de uma populao;
Estatstica: a medida numrica que descreve uma caracterstica da amostra;
Parmetro: a medida numrica que descreve uma caracterstica da populao;
2 TRIOLA, Mrio. Introduo Estatstica. 7a ed. Editora LTC. 1999

4
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

2 Estatstica Descritiva
Os mtodos estatsticos envolvem a anlise e a interpretao de nmeros, tais como renda anual, vendas men-
sais, escores de testes, no de peas defeituosas etc. Tais nmeros so designados por dados. Para interpretar os dados
corretamente, em geral preciso primeiro organizar e sumarizar os nmeros. 3

2.1 Classificao de variveis


Os dados estatsticos se obtm mediante um processo que envolve a observao ou outra mensurao de itens tais
como renda anual numa comunidade, escores de testes, quantidade de caf por xcara servida por uma mquina automtica
etc. Tais itens chamam-se variveis, porque originam valores que tendem a exibir certo grau de variabilidade quando se
fazem mensuraes sucessivas.
Antes da escolha da anlise descritiva apropriada necessria a classificao da varivel de interesse, pois a
adequao da tcnica est diretamente relacionada ao tipo de varivel em questo.
De acordo com a estrutura numrica as variveis podem ser classificadas em:
Qualitativas - se os resultados das observaes sero expressos atravs de categorias, que se distinguem por alguma
caracterstica no-numrica. Ex: Sexo, Nvel de escolaridade, Cor da pele, Estado civil, Tipo sanguneo.
Quantitativas - se os resultados das observaes sero expressos sempre atravs de nmeros, que representam
contagens ou medidas. Ex: Idade, Altura, Peso, Nmero de nascidos vivos, Populao.
As variveis qualitativas podem ser classificadas, por sua vez, em:
1. Nominal - caracteriza-se por dados que consistem apenas em nomes, rtulos ou categorias. Os dados no podem
ser dispostos segundo um esquema ordenado. Ex: Estado civil (casado, solteiro, vivo etc.).
2. Ordinal - envolve dados que podem ser dispostos em alguma ordem, mas as diferenas entre os valores dos dados
no podem ser determinadas ou no tem sentido. Ex: Nvel de escolaridade (fundamental, mdio, superior etc.).
Em relao s variveis quantitativas, estas podem ser classificadas em:
1. Discreta - s pode assumir valores pertencentes a um conjunto finito ou enumervel. Ex: Nmero de alunos
presentes s aulas de determinado professor; nmero de mortos em um surto de determinada doena. Geralmente,
seus valores so resultados de um processo de contagem, razo pela qual seus valores so expressos atravs de
nmeros inteiros no-negativos.
2. Contnua - pode assumir qualquer valor pertencente a um determinado intervalo do conjunto dos Reais. Ex: Estatura
e peso dos alunos do curso de estatstica; temperatura mxima diria de Cuiab. Pode-se dizer que a varivel
contnua resulta normalmente de mensuraes.

2.1.1 Exerccios
1. O que voc entende por Estatstica?
2. Quais as ramificaes da Estatstica? Defina e explique as funes de cada uma.
3. Por que motivo devemos saber como classificar as variveis a serem estudadas?
4. De acordo com a estrutura numrica como podem ser classificadas as variveis? Explique cada uma.
5. Em um estudo estatstico a caracterstica de interesse pode ser qualitativa (nominal ou ordinal) ou quantitativa
(discreta ou contnua). Classifique as variveis nos exemplos que se seguem:
a) populao: moradores de certa cidade
varivel: cor dos olhos (pretos, castanhos, azuis, verdes)
b) populao: casais residentes em certa cidade
varivel 1: nmero de filhos
varivel 2: classe econmica
c) populao: candidatos ao vestibular
varivel 1: renda familiar
varivel 2: sexo (masculino, feminino)
varivel 3: nmero de pessoas na famlia
3 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.

5
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

d) populao: sabonetes de certa marca


varivel: peso lquido
e) populao: aparelhos produzidos por uma linha de montagem
varivel: nmero de defeitos por unidade
f) No de inscries no seguro social;
g) No de passageiros no nibus da linha Rio - SP;
h) Escolaridade;
i) Peso mdio dos recm - nascidos;
j) Cada cigarro Camel tem 16,13 mg de alcatro;

2.2 Tipos de sries estatsticas


Srie estatstica uma sucesso de dados estatsticos que medem a intensidade do fenmeno, segundo suas caracte-
rsticas qualitativas ou quantitativas. As sries estatsticas sero classificadas de acordo com a variao de trs elementos:
tempo, local e o fenmeno. 4 So elas:
Srie Histrica - aquela em que o elemento que serve como base de classificao a frao do tempo, como o
dia, o ms, o ano, o sculo, etc. Ex: Valores do PIB no Brasil no perodo de 1982 a 1986. cidade de Salvador-Ba.
Elemento varivel: poca
Elementos Fixos: Local e Fenmeno

Tabela 1: Valores do PIB no Brasil no perodo de 1982 a 1986.


Anos PIB
1982 779,94
1983 760,20
1984 803,53
1985 869,90
1986 941,26
Fonte: Morettin; Bussab-Estatstica Bsica.

Srie Geogrfica - aquela que apresenta como elemento varivel somente o local (fator geogrfico). Ex: Casos de
dengue nos municpios de Sinop, Rondonpolis e Cuiab no ano de 2002.
Elemento varivel: Local
Elementos Fixos: poca e Fenmeno

Tabela 2: Casos de dengue nos municpios de Sinop, Rondonpolis e Cuiab no ano de 2002.
Municpios No de casos
Cuiab 32
Rondonpolis 15
Sinop 9
Fonte: Dados fictcios.

Srie Especfica - aquela srie que apresenta como elemento ou carter varivel o fenmeno (ou espcie), perma-
necendo fixos a poca e o local. Ex: Os alunos de uma Faculdade, em determinado ano, classificados segundo o
tipo sanguneo.
Elemento varivel: Fenmeno
Elementos Fixos: Local e poca

Srie Mista - refere-se s sries que so combinaes de outros tipos de sries j estudadas.
Alguns exemplos de sries mistas sero apresentadas a seguir:
1. Srie Geogrfica - Temporal:
4 CRESPO, A.A.; Estatstica Fcil. Editora: Saraiva.

6
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 3: Classificao de alunos de uma Faculdade, em determinado ano, segundo o tipo sanguneo.
Tipo Sanguneo Nmero de alunos
A 96
B 149
AB 132
O 92
Fonte: Dados fictcios.

Tabela 4: Taxa de atividade feminina urbana (em percentual) em trs regies do Brasil. 1981/90.
Regio Ano
1981 1984 1986 1990
Norte 28,9 30,3 34,0 37,1
Nordeste 30,2 32,6 34,3 37,8
Sudeste 34,9 37,2 40,1 40,7
Fonte: Anurio Estatstico do Brasil - 1990

2. Srie Geogrfica - Especifica:

Tabela 5: Consumo em kg, de alguns tipos de alimentos per capita anual em algumas regies metropolitanas do Brasil
- 1988.
Cidades Alimento
Hortalias Carne Pescado
Belo Horizonte 44,5 21,6 1,3
Rio Janeiro 54,3 24,7 4,9
So Paulo 46,7 26,1 2,9
Fonte: Anurio Estatstico do Brasil - 1988

2.2.1 Exerccios
1. A sria Estatstica chamada de Histrica ou Temporal quando:
a) O elemento varivel o tempo. b) O elemento varivel o local. c) No tem elemento varivel.
2. Abaixo encontramos algumas tabelas. Calcule a porcentagem, faa um breve comentrio sobre os resultados e diga
que tipo de srie estatstica cada tabela pertence:

Tabela 6: Matriculas no ensino superior segundo reas de ensino - Brasil - 1975.


reas de ensino Matriculas %
Cincias Biolgicas 32.109
Cincias Exatas e Tecnologicas 65.949
Cincias Agrrias 2.419
Cincias Humanas 148.842
Letras 9.883
Artes 7.464
Duas ou mais reas 16.323
Total
Fonte: Servio de estatstica da educao e da cultura.

7
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 7: reas dos oceanos (em milhes de km2 ).


Oceano rea %
Antrtico 33,8
rtico 23,2
Atlntico 199,4
ndico 137,2
Pacfico 342,7
Total
Fonte: Dados fictcios.

Tabela 8: Faturamento da companhia Beta 1990 - 1997.


Ano Vendas (em U S$ 1.000,00) %
1990 2.181
1991 3.948
1992 5.642
1993 7.550
1994 10.009
1995 11.728
1996 18.873
1997 29.076
Total
Fonte: Departamento de Marketing da Companhia.

2.3 Anlise de Variveis Qualitativas


Quando se estuda uma varivel, o maior interesse do pesquisador conhecer o comportamento dessa varivel,
analisando a ocorrncia de suas possveis realizaes. Nesta seo veremos uma maneira de dispor um conjunto de
realizaes, para se ter uma idia global sobre elas, ou seja, de sua distribuio. Para dados qualitativos a enumerao e
tabulao a forma mais simples de represent-los.

2.3.1 Distribuio de Frequncias


Uma distribuio de frequncia a forma de representao tabular de dados que mostra a frequncia (ou o nmero)
de observaes em cada uma das diversas classes no sobrepostas.
Alguns aspectos importantes devem ser levados em considerao na construo de uma tabela: 5
1. Toda tabela deve ter um ttulo completo, contendo trs questes: o que est sendo estudado?, onde foi feito o
estudo? em que perodo (poca) este estudo foi realizado? O ttulo deve ser colocado na parte superior da tabela.
2. Se a fonte de dados no do prprio autor, ela deve ser indicada abaixo da tabela.
3. As notas e chamadas so utilizadas para fazer esclarecimentos de ordem geral e especfica, respectivamente. Ambas
so numeradas (ou smbolos como o asterisco) e colocadas abaixo da tabela.
4. De preferncia, usar o mesmo nmero de casas decimais para os algarismos.
5. As tabelas no devem ser fechadas lateralmente, mas linhas horizontais devem ser colocadas no incio e no final.
A seguir ser discutido um exemplo, no qual se destaca a forma de representao dos dados qualitativos mais
comuns.
Exemplo: Em uma determinada pesquisa, tem-se interesse em verificar a opinio de estudantes respeito das salas
de cinema da cidade. Uma amostra de 50 estudantes apresentou os seguintes resultados:
Para desenvolver a distribuio de frequncia para estes dados, contamos o nmero de vezes que cada resposta
aparece no conjunto de dados. A resposta Regular a boa aparece 32 vezes e a Muito boa aparece 18 vezes.
Uma distribuio de frequncias mostra o nmero (frequncia) de observaes em cada uma das classes no so-
brepostas. No entanto, comum termos interesse na proporo (f ri ), ou porcentagem (f ri (%)), das observaes em cada
classe que serve para fazermos comparaes entre diferentes categorias independente do tamanho amostrado em cada
uma delas. Para a Tabela 10 temos:
5 ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

8
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 9: Dados de uma amostra de 50 estudantes.


Regular a boa Muito Boa
Regular a boa Regular a boa
Regular a boa Muito Boa
Muito boa Regular a boa
.. ..
. .
Regular a boa Muito Boa
Regular a boa Muito Boa
Regular a boa Muito Boa
Fonte: Daniel Furtado - Estatstica Bsica.

Tabela 10: Distribuio de frequncias da Opinio dos alunos a respeito das salas de cinema na cidade.
Opinio Regular a boa Muito boa
frequncia(fi ) 32 18
frequncia relativa (f ri ) 0,64 0,36
frequncia percentual(f ri (%)) 64 36
Fonte: Tabela 9 - Notas de Aula.

fi : frequncia absoluta ou simples da categoria i;


f ri : frequncia relativa de uma classe: a proporo das observaes que pertencem classe,
f ri = fi /n, onde n o tamanho da amostra;
f ri (%) : frequncia percentual de uma classe a frequncia relativa multiplicada por 100.

Segundo Barbetta et al. (2004), as freqncias relativas em percentual so teis ao se comparar tabelas ou pesquisas
diferentes. Por exemplo, quando amostras (ou populaes) tm nmeros de elementos diferentes, a comparao atravs
das freqncias absolutas pode resultar em afirmaes errneas enquanto que pelas freqncias relativas em percentual
no, pois os percentuais totais so os mesmos.

2.3.2 Representao Grfica


Nesta seo sero apresentados os grficos mais utilizados para a representao das variveis qualitativas.
Um grfico de barras um dispositivo grfico para retratar os dados qualitativos que foram sintetizados em uma
distribuio de frequncia, em uma distribuio de frequncia relativa ou em uma distribuio de frequncia percentual.
Um grfico de barras tm por finalidade comparar grandezas, por meio de retngulos de igual largura, dispostos horizon-
talmente e com alturas proporcionais s grandezas. Devemos deixar uma distncia entre os retngulos. Para as variveis
qualitativas ordinais, devemos respeitar a ordem das categorias, como mostrado na figura a seguir.

Figura 1: Opinio de estudantes respeito das salas de cinema da cidade.

Fonte: Tabela 10 - Notas de Aula.

Para efetuar uma anlise comparativa de vrias distribuies, podemos construir um grfico de barras mltiplo. A
figura a seguir um exemplo de grfico de barras mltiplo.

9
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Figura 2: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies preferenciais.

Fonte: Andrade, D; Ogliari, P. Estatstica para Cincias Agrrias e Biolgicas.

Quando os retngulos so colocados na posio vertical, temos os grficos de colunas. A finalidade desse tipo de
grfico a mesma dos grficos de barras, isto servem para comparar grandezas.

Figura 3: Opinio de estudantes respeito das salas de cinema da cidade.

Fonte: Tabela 10 - Notas de Aula.

Grfico de colunas tridimensional:

Figura 4: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies preferenciais.

Fonte: Andrade, D; Ogliari, P. Estatstica para Cincias Agrrias e Biolgicas.

10
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

O grfico de pizza (ou setores) um dispositivo grfico comumente usado para apresentar as distribuies de
frequncia relativa e de frequncia percentual para dados qualitativos.

Figura 5: Opinio de estudantes respeito das salas de cinema da cidade.

Fonte: Tabela 10 - Notas de Aula.

Para desenhar um grfico de pizza primeiro desenha-se um crculo e ento usa-se as frequncias relativas para
subdividir o crculo em setores ou partes, que correspondem frequncia relativa para cada classe. Por exemplo, como o
crculo tem 360 graus e a categoria Regular a boa tem uma frequncia relativa de 0,64, o setor do grfico rotulado de
Regular a boa consiste em 0, 64 360 = 230.4 graus.
Grfico de linhas : Sua aplicao mais indicada para representaes de sries temporais sendo por tal razo,
conhecidos tambm como grficos de sries cronolgicas. Sua construo feita colocando-se no eixo vertical (y) a
mensurao da varivel em estudo e na abscissa (x), as unidades da varivel numa ordem crescente. Este tipo de grfico
permite representar sries longas, o que auxilia detectar suas flutuaes tanto quanto analisar tendncias. Tambm podem
ser representadas vrias sries em um mesmo grfico.

Figura 6: Nmero de matriculas no curso de engenharia civil da UEM no perodo de 1999 a 2005.

Fonte: Guedes, T.A; Acorsi, C.R.L; Martins, A.B; Janeiro, V. Projeto de Ensino - UEM.

11
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

2.3.3 Exerccios
1. Construa uma tabela para descrever o seguinte grfico:

Figura 7: Composio do rebanho bovino da fazenda capim branco, Araguari - MG - Brasil, 2005.

Fonte: Daniel Furtado - Estatstica Bsica.

2. A equipe de nadadores de Cuiab apresentou-se no Campeonato Brasileiro de Natao de 1987 com 20 nadadores
do estilo borboleta, 30 de costa, 60 estilo craw e 50 estilo peito. Descreva esses dados em uma tabela. Que tipos de
grficos podem melhor representar esses dados. Trace 2 grficos entre todos possveis.

3. A seguir esto tipos de rochas:

SIENITO MONZONITO DIORITO Q-DIORITO


GABRO NORITO MONZONITO SIENITO
Q-DIORITO GABRO DIORITO NORITO
SIENITO Q-DIORITO MONZONITO DIORITO
DIORITO SIENITO SIENITO GABRO
GABRO DIORITO MONZONITO DIORITO
SIENITO DIORITO Q-DIORITO NORITO
GABRO MONZONITO DIORITO DIORITO
DIORITO NORITO DIORITO GABRO
NORITO Q-DIORITO MONZONITO SIENITO
Fonte: Landim, P.M.P; Anlise Estatstica de Dados Geolgicos. Ed.Unesp.

12
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

a) Qual a classificao desses dados? (Qualitativo [O/N] ou Quantitativo [D/C])


b) Resuma esses dados atravs de uma distribuio de freqncia;
c) Construa um grfico de setores e um de barras para os dados;
d) Qual tipo de rocha aparece com maior freqncia?

4. Para adequar os produtos s preferncias dos clientes, uma empresa fez uma pesquisa sobre os provedores e a
qualidade dos servios prestados utilizando uma amostra de 20 clientes, obtendo as seguintes variveis:

Tabela 11: Variveis observadas de 20 clientes de um provedor.


Amostra Sexo Qualidade Amostra Sexo Qualidade
1 feminino Boa 11 feminino Ruim
2 feminino Boa 12 feminino Ruim
3 feminino Boa 13 masculino Boa
4 feminino Boa 14 masculino Boa
5 feminino Boa 15 masculino timo
6 feminino timo 16 masculino Regular
7 feminino timo 17 masculino Regular
8 feminino Regular 18 masculino Ruim
9 feminino Regular 19 masculino Ruim
10 feminino Ruim 20 masculino Ruim

Fonte: Notas de Aula - Profo Anderson Souza - UFMT.

a) Classifique as variveis descritas na tabela;


b) Faa a representao tabular e grfica adequada para cada varivel. Interprete os resultados.

2.4 Anlise de Variveis Quantitativas


Assim como nas variveis qualitativas, a anlise das variveis quantitativas dar-se- por meio de tabelas e grficos,
porm, como se trata de variveis numricas tambm possvel estudar o comportamento destas variveis atravs de
algumas medidas de resumo (mdia, mediana etc) que sero apresentadas neste curso na prxima seo.
A anlise tabular tambm feita com o uso das distribuies de frequncias que constituem-se num caso particular
das sries estatsticas, nas quais todos os elementos so fixos. Na distribuio de frequncias os dados referentes ao
fenmeno so apresentados atravs de gradaes, onde feita a correspondncia entre categorias ou valores possveis e
as frequncias respectivas. Alguns conceitos importantes sero apresentados atravs de um exemplo:
Um novo medicamento para cicatrizao est sendo testado e um experimento feito para estudar o tempo (em dias
completos) de completo fechamento em cortes provenientes de uma cirurgia. Uma amostra em trinta cobaias forneceu os
valores:

17 16 18 17 15 15 16 14 14 16 16 14 17 16 18
17 15 14 17 16 17 15 17 18 16 14 18 15 15 18
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.

1. Dados Brutos - o conjunto dos dados numricos obtidos aps a coleta dos dados.
No exemplo:
Varivel de estudo: Tempo (em dias completos) de completo fechamento em cortes provenientes de uma
cirurgia;
Classificao: A varivel Tempo sozinha classificada como contnua, pois pode assumir qualquer valor
em um intervalo. Como no exemplo s interessa ao pesquisador coletar dias completos, a varivel deixa de
ser contnua e passa a ser discreta.
Dados Brutos:
17 - 16 - 18 - 17 - 15 - 15 - 16 - 14 - 14 - 16 - 16 - 14 - 17 - 16 - 18 - 17 - 15 - 14 - 17 - 16 - 17 - 15 - 17 - 18 -
16 - 14 - 18 - 15 - 15 - 18

13
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Como pode ser observado, os valores esto dispostos de forma desordenada. Em razo disso, pouca informa-
o se consegue obter inspecionando-se os dados anotados. Mesmo uma informao to simples como a de
saber os valores mnimos e mximo requer um certo exame dos dados coletados.

2. Rol - o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente.
Ex: Utilizando os mesmos dados anteriores:
14 - 14 - 14 - 14 - 14 - 15 - 15 - 15 - 15 - 15 - 15 - 16 - 16 - 16 - 16 - 16 - 16 - 16 - 17 - 17 - 17 - 17 - 17 - 17 - 17 -
18 - 18 - 18 - 18 - 18
Apresenta vantagens concretas em relao aos dados brutos. Ele torna possvel visualizar, de forma bem ampla, as
variaes dos dados, uma vez que os valores extremos so percebidos de imediato. Mas, a anlise com este tipo de
disposio comea a se complicar quando o nmero de observaes tende a crescer.
3. Amplitude total (H) - a diferena entre o maior e o menor valor observado da varivel em estudo.
Ex: Utilizando os mesmos dados anteriores:
H = 18 - 14 = 4.
Interpretao: No exemplo, H = 4, representa a diferena entre o tempo de cicatrizao mais lento e o mais rpido,
ou seja, 4 dias. OBS: A amplitude total tambm usada como uma medida de variabilidade dos dados, quanto
maior a amplitude maior a variabilidade do conjunto.

4. Frequncia absoluta simples (fi ) - J apresentada anteriormente, conta o nmero de vezes que o elemento aparece
na amostra ou o nmero de elementos pertencentes a uma classe (ou categoria).
5. Frequncia Acumulada (Fi ) - ndica o nmero de itens de dados observados at aquele dado valor (ou classe). A
frequncia acumulada auxiliar no clculo da mediana e de separatrizes, medidas de posio (ou tendncia central)
que sero apresentadas na prxima seo.

Para condensarmos melhor os dados, aconselhvel a elaborao de distribuies de frequncia. Uma tabela com
distribuio de frequncia uma tabela onde se procura fazer um arranjo dos valores e suas respectivas frequncias, onde a
frequncia de determinado valor ser dado pelo nmero de observaes ou repeties de um valor ou de uma modalidade.
As tabelas de frequncias podem representar tanto valores individuais como valores agrupados em classes.

2.4.1 Distribuio de Frequncias - Varivel Discreta.


uma tabela onde os valores da varivel aparecem individualmente. Esse tipo de distribuio utilizada geral-
mente para representar uma varivel discreta, com pouca variedade de valores.
Exemplo: Utilizando os mesmos dados anteriores, a tabela a seguir representa a distribuio de frequncias refe-
rente aos tempos de cicatrizao (em dias completos) de 30 cobaias.

Tabela 12: Distribuio de frequncias referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Tempos(Xi ) 14 15 16 17 18 Total(n)
fi 5 6 7 7 5 30

Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.

A soma das frequncias absolutas simples (fi ) sempre igual ao nmero total de valores observados, ou seja, n =
Pk
i=1 i , onde k o nmero de valores distintos observados. No exemplo acima temos 5 valores diferentes observados,
f
consequentemente 5 fi0 s.
OBS: Este tipo de tabela no aconselhvel quando se trabalha com variveis que apresentam uma grande quan-
tidade de valores distintos (mesmo sendo dados discretos), uma vez que a tabela poder ficar muito extensa, dificultando,
alm de sua elaborao, as anlises e concluses dos dados pesquisados.

2.4.2 Representao Grfica - Varivel Discreta


Para a representao da varivel discreta so utilizados os grficos de colunas ou barras e o de setores.
Outras formas:

14
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Figura 8: Grfico de colunas referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.

Fonte: Dados da Tabela 12.

Figura 9: Grfico de barras referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.

Fonte: Dados da Tabela 12.

Figura 10: Grfico de setores referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.

Fonte: Dados da Tabela 12.

15
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

2.4.3 Distribuio de Frequncias - Varivel Contnua.


Quando a varivel contnua, como por exemplo: peso, altura, salrio, renda etc. natural que em uma amostra
retirada aparea uma grande diversidade de valores. Devido a esta possibilidade, no recomendado utilizarmos uma
tabela de distribuio de frequncias simples onde aparea diversos valores com frequncias muito pequenas e que no
est de fato desempenhando a sua verdadeira funo que resumir as informaes. Em vez de resumir, uma tabela de
distribuio de frequncias simples para uma varivel contnua com resultados bem diversos ser uma tabela extensa e
difcil de interpretar.
Com o objetivo de resumir os dados originais em uma distribuio de frequncias, utiliza-se os dados agrupados
ou em classes e no mais individual. As classes podem ser definidas como sendo os subintervalos da Amplitude Total de
uma varivel (grupo de valores). Quando a varivel objeto de estudo for contnua geralmente ser conveniente agrupar os
valores observados em classes.
Se, por outro lado, a varivel for discreta e o nmero de valores representativos dessa varivel for muito grande,
recomenda-se o agrupamento dos dados em classes. Da mesma forma, se a varivel for contnua mas os resultados
observados se repetem muito, no apresentando uma grande diversidade, tambm possvel utilizarmos a tabela de
distribuio de frequncias simples no agrupados em classes.
A seguir sero apresentadas as diversas situaes citadas anteriormente.

(A) Varivel Contnua com grande diversidade de valores:


Exemplo: Foram feitas medidas em operrios da construo civil a respeito da taxa de hemoglobina no sangue (em
gramas/ cm3 ):

16,3 15,2 12,3 13,7 14,1 11,1 12,2 11,7 12,5 13,9 12,3 14,4 13,6 12,7 12,6
13,5 12,7 12,3 13,5 15,4 11,3 11,7 12,6 13,4 15,2 13,2 13,0 16,9 15,8 14,7
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.

(B) Varivel Contnua com pouca diversidade de valores:


Exemplo: Uma turma da 6a srie de determinada escola obteve as seguintes notas na disciplina de portugus:

7 6 8 7 5 5 6 4 4 6 6 4 7 6 8
7 5 4 7 6 7 5 7 8 6 4 8 5 5 8
Fonte: Dados fictcios.

(C) Varivel Discreta com grande diversidade de valores:


Exemplo: Idade (em anos completos) dos alunos do curso de estatstica da UFMT, no ano de 2010.

24 - 23 - 22 - 28 - 35 - 21 - 23 - 33 - 34 - 24 - 21 - 25 - 36 - 26 - 22 -
30 - 32 - 25 -26 - 33 - 34 - 21 - 31 - 25 - 31 - 26 - 25 - 35 - 33 - 31
Fonte: Dados fictcios.

Para as 3 situaes citadas em (A), (B) e (C), sero apresentadas as tabulaes.

(A) Devido a grande diversidade de valores nas taxas de hemoglobina no sangue medidas em operrios da construo
civil a melhor forma de tabular os dados agrupando-os em classes. Para construo de tabelas de frequncias para
dados agrupados em classes os 4 conceitos listados a seguir, complementam os 5 primeiros j apresentados:

1. Definio do nmero de classes (k) - importante que a distribuio conte com um nmero adequado de
classes. Se esse nmero for escasso, os dados originais ficaro to comprimidos que pouca informao poder
ser extraida desta tabela. Se, por outro lado, forem utilizadas muitas classes, haver algumas com frequncia
nula ou muito pequena, apresentando uma distribuio irregular e prejudicial a interpretao do fenmeno.
Para determinar o nmero de classes h diversos mtodos. Milone (2004, p.36) apresenta os seguintes critrios
para a determinao do nmero de intervalos, denotado por k:
1. Raiz quadrada: k = n;
2. Regra de Sturges: k = 1 + 3, 3 log n;
3. Regra de Milone: k = 1 + 2 ln n;
Neste curso ser adotado o mtodo a seguir:

16
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica


k = 5, para 20 n 25 e k = n, para n > 25;
Deve-se lembrar que sendo k o nmero de classes, o resultado obtido por cada um dos critrios deve ser
o nmero inteiro mais prximo ao obtido. Milone (2004) acrescenta ainda que, adotando o princpio de
que os agrupamentos devem ter no mnimo cinco e no mximo 20 classes, o critrio da raiz valido para
25 n 400, o do log para 16 n 572.237 e o do ln para 20 n 36.315.
Mesmo tendo outros critrios de determinao do nmero de classes, o que se deve ter em mente que a
escolha depender sobretudo da natureza dos dados e da unidade de medida em que eles se encontram, e no
somente de regras muitas vezes arbitrrias e pouco flexveis. Para facilitar a anlise conveniente que se
mantenham os intervalos de classe sempre constantes. A experincia do pesquisador tambm conta muito
na definio das classes.

No exemplo: k = 30 = 5, 48 = 5 classes;
2. Amplitude do Intervalo de Classe (h) - A amplitude de um intervalo de classe corresponde ao comprimento
desta classe. Numericamente, sua amplitude pode ser definida como a diferena existente entre os limites
superior (ou inferior) de duas classes consecutivas (h = ls li ).
H
h=
k
Ex: Utilizando os mesmos dados anteriores: h = 16,911,1 5 = 5, 8/5 = 1, 16
3. Limites de Classe - Os limites de classe so seus valores extremos. O smbolo ` indica a incluso do
limite inferior do intervalo naquela classe e smbolo a indica a incluso do limite superior do intervalo na-
quela classe. Neste curso adotaremos o smbolo ` na construo das classes, pois ele o mais usual. Para a
construo das classes temos:
li1 : Limite inferior da 1a classe; Usualmente o menor valor da amostra. No exemplo: 11,1.
ls1 : Limite superior da 1a classe; ls1 = li1 + h. No exemplo: 11,1 + 1,16 = 12,26.
li2 : Limite inferior da 2a classe; li2 = ls1 . No exemplo: 12,26.
ls2 : Limite superior da 2a classe; ls2 = li2 + h. No exemplo: 12,26 + 1,16 = 13,42.
Para a n-sima classe:
lin : Limite inferior da na classe; lin = ls(n1) . Ou seja, ser igual ao limite superior da classe imediatamente
anterior.
lsn : Limite superior da na classe; lsn = lin + h.
4. Pontos Mdios ou Centrais da Classe (P mi ) - a mdia aritmtica simples entre o limite superior e o inferior
de uma mesma classe.
Ex: Utilizando os mesmos dados anteriores: P m1 = (11,1 + 12,26)/2 = 11,68.
Para obter os pontos mdios das demais classes, basta acrescentar ao ponto mdio da classe precedente a
amplitude do intervalo de classe. No exemplo anterior: P m2 = h + P m1 = 1, 16 + 11, 68 = 12, 84, e assim
sucessivamente.

Para o Exemplo (A):

Tabela 13: Distribuio de frequncias referente as Taxas de hemoglobina no sangue (em gramas/ cm3 ) de 30 operrios
da construo civil.
Tx Hemoglobina P mi fi f ri f ri (%) Fi
11,10 ` 12,26 11,68 5 0,1667 16,67 5
12,26 ` 13,42 12,84 11 0,3667 36,67 16
13,42 ` 14,58 14,00 7 0,2333 23,33 23
14,58 ` 15,74 15,16 4 0,1333 13,33 27
15,74 ` 16,90 16,32 3 0,1000 10,00 30
Total - 30 1 100 -
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.

Na Tabela 26 temos que na 1a classe sero contados na amostra elementos a partir do 11,10 at o 12,25, na 2a classe
sero contados os elementos a partir do 12,26 at o 13,41 e assim por diante.

2.4.4 Representao Grfica - Varivel Contnua

A representao grfica das distribuies de frequncias para dados em classes feita atravs do histograma e/ou
polgono de frequncias.

17
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

1. Histograma - um grfico formado por um conjunto de retngulos justapostos, de forma que a rea de cada
retngulo seja proporcional frequncia da classe que ele representa.
2. Polgonos de Frequncia - Unindo por linhas retas os pontos mdios das bases superiores dos retngulos do
histograma, obtm-se outra representao dos dados, denominada polgono de frequncia

Figura 11: Histograma e Polgono de frequncias referente as taxas de hemoglobina no sangue de 30 operrios da cons-
truo civil.

Fonte: Dados da Tabela 13.

3. Apresentao Ramo-e-Folha - Apresenta a forma e ordem dos dados. Pode ser utilizado na organizao dos
dados antes de dispor na tabela.
Exemplo: Um dos principais indicadores da poluio do ar nas grandes cidades a concentrao de oznio na
atmosfera. O nvel de concentrao de oznio na atmosfera foi medido em So Paulo durante o inverno de 1998, e
os resultados so apresentados a seguir:

Tabela 14: Concentrao de ozonio na atmosfera em So Paulo, inverno de 1998.


6,6 4,4 5,7 4,5 3,7 3,5 1,4 6,6 6,0 4,2 4,4 5,3 5,6
9,4 7,6 6,2 3,3 5,9 6,8 2,5 5,4 4,4 5,4 4,7 3,5 4,0
3,8 4,7 3,1 6,8 9,4 2,4 3,0 5,6 4,7 6,5 3,0 4,1 3,4
3,4 5,8 7,6 1,4 3,7 6,8 1,7 5,3 4,7 7,4 6,0 6,7 10,9
2,0 3,7 5,7 5,8 3,1 5,5 1,1 5,1 5,6 5,5 1,4 3,9 6,6
5,8 1,6 2,5 8,1 6,6 6,2 7,5 6,2 6,0 5,8 2,8 6,1 4,1

A apresentao ramo-e-folha apresentada a seguir:

1 1 4 4 4 6 7
2 0 4 5 5 8
3 0 0 1 1 3 4 4 5 5 7 7 7 8 9
4 0 1 1 2 4 4 4 5 7 7 7 7
5 1 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9
6 0 0 0 1 2 2 2 5 6 6 6 6 7 8 8 8
7 4 5 6 6
8 1
9 4 4
10 9

Exerccio: A partir do ramo e folha acima, disponha os dados em uma tabela de frequncias.
(B) Agora iremos analisar a situao (B) descrita anteriormente onde a varivel de estudo era Notas dos alunos da 6a
srie na disciplina de portugus. Apesar dos valores apresentados serem inteiros, a varivel Nota pode assumir
qualquer valor em um intervalo, por exemplo: 6,5. Como no exerccio no foi especificado que o professor adotaria
apenas nmeros inteiros, esta varivel classificada como contnua.
PASSO 1 - Calcular a amplitude total (H): H = 8 - 4 = 4; (amplitude pequena)

18
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 15: Distribuio de frequncias referente as notas dos alunos da 6a srie na disciplina de portugus.
Notas(Xi ) 4 5 6 7 8 Total(n)
fi 5 6 7 7 5 30
f ri (%) 16,67 20,00 23,33 23,33 16,67 100
Fonte: Dados fictcios.

PASSO 2 - Dispor os dados em uma tabela de distribuio de frequncias simples;


PASSO 3 - Representao Grfica:

Figura 12: Grfico de setores referente as notas dos alunos da 6a srie na disciplina de portugus.

Fonte: Dados da Tabela 15.

(C) Agora iremos analisar a situao (C) descrita anteriormente, varivel discreta com grande variedade de valores. A
varivel de estudo Idade (em anos completos) dos alunos da UFMT - 2010, como no exemplo j foi especificado
que as idades observadas seriam em anos completos, esta varivel s assume valores inteiros, por isso classificada
como discreta.
PASSO 1 - Rol das observaes:
Ex: Utilizando os mesmos dados anteriores:
21 - 21 - 21 - 22 - 22 - 23 - 23 - 24 - 25 - 25 - 25 - 25 - 26 - 26 - 26 - 28 - 30 - 31 - 31 - 31 -32 - 33 - 33 - 33 - 34 -
34 - 34 - 35 - 35 - 36

PASSO 2 - Clculo da amplitude total (H): H = 36 - 21 = 15 anos; (amplitude alta)


PASSO 3 - Dispor os dados em uma distribuio de frequncias. Apenas por questo de uma melhor visualizao,
primeiramente ser apresentado a distribuio de frequncias simples e posteriormente distribuio em classes.

Tabela 16: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade(Xi ) 21 22 23 24 25 26 28 30 31 32 33 34 35 36 TOTAL(n)
fi 3 2 2 1 4 3 1 1 3 1 3 3 2 1 30
Fonte: Dados hipotticos.

Observando a Tabela 16, podemos perceber a grande diversidade de valores e a extenso da tabela. Por conta desta
tabela no resumir tanto as informaes iremos colocar estes dados em classes.
Na Tabela 17 temos que na 1a classe sero contados na amostra elementos a partir do 21 at o 23,99, na 2a classe
sero contados os elementos a partir do 24 at o 26,99 e assim por diante.
Representao Grfica:

19
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 17: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.

Figura 13: Histograma e Polgono de frequncias referente as idades dos alunos do curso de estatstica da UFMT 2010.

Fonte: Dados da Tabela 17.

2.4.5 Exerccios
1. Em um estudo sobre o potencial de germinao de sementes de algodo dividiu-se uma rea em 48 parcelas com a
mesma rea, tipo de solo, iluminao, etc. Em cada uma destas parcelas foram plantadas 4 sementes e verificou-se
o nmero de sementes que germinaram. Os dados obtidos so apresentados a seguir:

2 0 0 4 3 0 0 1 0 0 1 1 0 0 0 1
2 1 1 1 1 1 1 0 0 0 3 0 0 0 0 0
0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0

a) Especifique a varivel estudada, classificando-a. Justifique a sua resposta.


b) Represente tabularmente e graficamente os dados acima.
c) Qual a proporo de parcelas em que germinaram no mximo 2 sementes?
2. Os dados seguintes representam 20 observaes relativas ao ndice pluviomtrico em determinados municpios do
Estado:

Tabela 18: Milmetros de Chuva


144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158

Para os conjuntos de dados da Tabela 3:


a) Construir a tabela de freqncias constituda pelas freqncias absolutas simples, as freqncias relativas, as
freqncias acumuladas e os Pontos mdios de classes;
b) Construir um histograma e um polgono de freqncias;

3 Somatrio
Nas prximas sees sero vistos alguns coeficientes estatsticos que fazem uso do somatrio. Um somatrio um
operador matemtico que nos permite representar facilmente somas muito grandes ou at infinitas. representado com a

20
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

letra grega sigma , e definido por:


n
X
xi
i=1
em que corresponde a soma dos termos "xi , em que o ndice i varia de 1 a n.
Regras de somatrio:
Somatrio de uma constante
Se k uma constante, ento
n
X
k = k + k + k + ... + k = nk
i=1

Somatrio do produto de uma constante por uma varivel


Se k uma constante e xi uma varivel
n
X n
X
kxi = kx1 + kx2 + kx3 + ... + kxn = k(x1 + x2 + x3 + ... + xn ) = k xi
i=1 i=1

Somatrio de uma soma algbrica


O somatrio de uma soma de variveis igual soma dos somatrios de cada varivel
n
X n
X n
X
(xi + yi ) = xi + yi
i=1 i=1 i=1

Se a e b so constantes e xi uma varivel


n
X n
X n
X n
X
(a + bxi ) = a+ bxi = na + b xi
i=1 i=1 i=1 i=1

Observaes:
n
X n
X n
X
xi yi 6= xi yi
i=1 i=1 i=1
n n
!2
X X
x2i 6= xi
i=1 i=1

Exemplos:
Seja X = {4, 7, 9, 12, 3}, obter:
X5 4
X X 5
xi = 35, 2xi = 64, 3xi = 93
i=1 i=1 i=2
3
X 3
X
Sabendo que xi = 6, x2i = 14, determinar
i=1 i=1
3
X 3
X 3
X
a) (xi + 1) = xi + 1=6+3=9
i=1 i=1 i=1
X3 X3 3
X 3
X 3
X
2
x2i x2i

b) (xi 1) = 2xi + 1 = 2 xi + 1 = 14 12 + 3 = 5.
i=1 i=1 i=1 i=1 i=1

4 Medidas de Posio ou Tendncia Central


Foi visto at agora a sintetizao dos dados sob a forma de tabelas, grficos e distribuies de frequncias. Agora,
vamos aprender o clculo de medidas que possibilitem representar um conjunto de dados relativos observao de deter-
minado fenmeno de forma resumida.
As medidas de tendncia central ou posio so assim denominadas por indicarem um ponto em torno do qual se
concentram os dados. Este ponto tende a ser o centro da distribuio dos dados. Vale a pena chamar a ateno que, para
o clculo dessas medidas, necessrio que a varivel seja quantitativa. 6
As principais medidas de tendncia central so: Mdia, Mediana e Moda.
6 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.

21
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

4.1 Mdia
a medida de tendncia central mais comumente utilizada para descrever resumidamente uma distribuio de
frequncia (centro de massa de um conjunto dados).
Notao:
X chamada mdia amostral e
a mdia populacional.
Observaes:
A mdia afetada por valores extremos;

A mdia bastante utilizada em distribuies simtricas;


No utilizvel em variveis categricas;
A mdia pode ser utlizada para variveis discretas, inclusive com decimais.

(a) Mdia Aritmtica Simples: dada pelo quociente entre a soma dos valores observados e a frequncia total (
o nmero total de observaes). Genericamente, podemos escrever:
n
=
X xi
X
i=1
n

onde n o tamanho da amostra observada e xi o valor genrico da observao.

Exemplo: Em uma pesquisa foram coletados os pesos de recm-nascidos (em kg): 2,7; 3,9; 4,1; 4,3; 5,4;
A mdia aritmtica ser dada por:

= 2, 7 + 3, 9 + 4, 1 + 4, 3 + 5, 4 = 4, 08
X
5

Interpretao: O peso mdio dos recm-nascidos observados de 4,08 quilos.

(b) Mdia para dados em distribuio de frequncias:

Exemplo:

Tabela 19: Idade de pacientes renais (em anos).


Idade (xi ) 26 28 30 32 37 Total
fi 3 10 12 5 19 49
Fonte: Dados fictcios.

A mdia aritmtica ser dada por:


Pk
= i=1 xi fi
X
n
Pk
n= i=1 fi e k o nmero de valores distintos da tabela;
P5
= i=1 xi fi
X
n

= x1 f1 + x2 f2 + x3 f3 + x4 f4 + x5 f5
X
f1 + f2 + f3 + f4 + f5
= 26 3 + 28 10 + 30 12 + 32 5 + 37 19
X
49

X = 32, 26

Interpretao: A idade mdia dos pacientes renais observados foi de aproximadamente 32,26 anos.

22
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 20: Pesos dos alunos do curso de estatstica da UFMT, no ano de 2010.
Pesos(kg) Frequncia (fi ) P mi
59 ` 63 3 61
63 ` 67 5 65
67 ` 71 9 69
71 ` 75 12 73
75 ` 79 11 77
TOTAL 40 -
Fonte: Dados fictcios.

(c) Mdia para dados agrupados em classes:


Pk
= i=1 P mi f i
X
n
Exemplo:

onde P mi o ponto mdio da classe i; P mi = li+ls 2 ,


li + ls = limite inferior da classe + limite superior da classe.
Quando os dados estiverem agrupados em classes a mdia ser calculada da mesma forma apresentada anterior-
mente, a nica alterao ser no xi que para dados agrupados em classes ser substitudo por P mi , ou seja, ponto
mdio da classe i.
A mdia ser dada por:
Pk
= P mi fi i=1
X
n
= 61 3 + 65 5 + 69 9 + 73 12 + 77 11
X
3 + 5 + 9 + 12 + 11
X
= 71, 3

Interpretao: O peso mdio dos alunos do curso de estatstica 2010 da UFMT, foi de 71,3 Kg.

OBS: Perde-se um pouco de preciso na mdia quando estamos trabalhando com dados agrupados em classes.

(d) Mdia aritmtica ponderada:


s vezes, associam-se os nmeros X1 , X2 , , Xk a certos fatores de ponderao ou pesos w1 , w2 , , wk , que depen-
dem do significado ou importncia atribuda aos nmeros. 7 Nesse caso,
P
X = w1 X1 + w2 X2 + + wk Xk = P i wi Xi
w1 + w2 + + wk i wi

tem a denominao de mdia aritmtica ponderada.


Exemplo: Se o exame final, em um curso, tem peso 3 e as provas correntes peso 1, e um estudante tem grau 85 naquele
exame e 70 e 90 nas provas, seu grau mdio :

= (1)(70) + (1)(90) + (3)(85) = 415 = 83.


X
1+1+3 5

4.1.1 Propriedades da mdia


Dentre as principais propriedades da mdia podemos destacar as seguintes:

a) multiplicando-se todos os valores de uma varivel por uma constante, a mdia do conjunto fica multiplicada por
essa constante;
a mdia da amostra.
Seja X = {x1 , x2 , x3 , , xn } uma amostra aleatria de tamanho n, c uma constante e X
7 SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.

23
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

MDIA fica
Se multiplicarmos ou dividirmos todos os valores de uma varivel X pela constante c, o valor de X
multiplicada ou dividida pela constante.
n
X
cxi
i=1
X =
n
n
X
xi
i=1
= c
n
=
cX

b) somando-se ou subtraindo-se uma constante a todos os valores de uma varivel, a mdia do conjunto fica acrescida
ou diminuda dessa constante.
a mdia da amostra.
Seja X = {x1 , x2 , x3 , , xn } uma amostra aleatria de tamanho n, c uma constante e X
Se somarmos ou subtrairmos todos os valores de uma varivel X pela constante c, o valor de X MDIA fica
multiplicada ou dividida pela constante.
n
X
(xi + c)
i=1
X =
n
n
X n
X
xi + c
i=1 i=1
=
n
n
X n
X
xi c
i=1 i=1
= +
n n
= + nc
X
n
= +c
X

4.1.2 Exerccios:
1. Sejam dados referentes a um levantamento onde observou-se o nmero de peas defeituosas em 25 mquinas de
uma empresa.

Tabela 21: Nmero de peas defeituosas em 25 mquinas de uma empresa


3 5 7 1 3
6 5 5 5 3
8 5 2 6 2
4 4 4 3 5
6 2 2 4 5
Fonte: Dados fictcios.

a) Calcule a mdia para os dados brutos. Interprete o resultado;


b) Disponha os dados em uma tabela de frequncias e calcule a mdia. Houve diferena nos resultados? Justifi-
que.
c) Faa uma representao grfica adequada para os dados. Analisando o grfico qual o nmero de peas defei-
tuosas que foi predominante?

2. Utilizando os dados da Tabela a seguir responda:

a) Calcule a mdia para os dados brutos. Interprete o resultado;


b) Disponha os dados em uma tabela de frequncias e calcule a mdia;
c) Faa uma representao grfica adequada para os dados. Interprete.

24
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 22: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num sistema compartilhado (30
observaes).
6,94 7,27 7,46 7,97 8,03 8,37
8,56 8,66 8,88 8,95 9,30 9,33
9,55 9,76 9,80 9,82 9,98 9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
Fonte: Dados fictcios.

4.2 Mediana (Md)


definido como o valor que divide uma srie ordenada de tal forma que pelo menos a metade dos itens sejam
iguais ou maiores do que ela, e que a outra metade dos itens sejam menores do que ela. Colocados em ordem crescente, a
mediana o elemento que ocupa a posio central.
Como a mediana divide os dados ordenados ao meio, ela no sensvel a valores discrepantes. A depender de
como estejam os dados, deve-se diferenciar a forma como encontra-se a mediana.
Observaes:
No utilizvel em variveis categricas;
Pouco afetada por valores discrepantes;
Bastante utilizada para distribuies assimtricas.

1. Determinao da Mediana para Dados Brutos:


Seja x(1) , x(2) , , x(n) o rol das observaes em ordem crescente. A mediana dessas observaes ser dada por:
8

(a) n mpar: M d = X( n+1 ) ;


2

X( n ) +X( n +1)
(b) n par: M d = 2
2
2
;
Exemplos:
(a) n mpar:X = {1, 3, 6, 7, 9}. M d = X( 5+1 ) = X(3) , logo a mediana ser dada pelo 3o elemento, M d = 6.
2
Interpretao da Mediana: Metade das observaes vo at 6 e a outra metade maior (ou igual) que 6.
X( 6 ) +X( 6 +1)
(b) n par:X = {1, 3, 6, 7, 9, 12}. M d = 2 2 2 , logo a mediana ser dada pela mdia entre o 3o elemento
X +X
e o 4o elemento, M d = (3) 2 (4) = 6+7 2 = 6, 5. Interpretao da Mediana: Metade das observaes vai at
6,5 e a outra metade maior (ou igual) que 6,5.

2. Determinao da Mediana para Dados em Distribuio de Frequncias Simples:


Da mesma forma como foi calculado anteriormente, encontra-se mediana usando as expresses (a) ou (b), para n
mpar ou par. Em seguida, acrescenta-se tabela de frequncia uma coluna com as frequncias acumuladas (Fi ).
Com o uso destas frequncias (Fi ) encontra-se a posio da mediana e em seguida o elemento mediano.
Exemplo:

Tabela 23: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade(xi ) 21 22 23 24 25 26 28 30 31 32 33 34 35 36 Total
fi 3 2 2 1 4 3 1 1 3 1 3 3 2 1 30
Fi 3 5 7 8 12 15 16 17 20 21 24 27 29 30 -
Fonte: Dados fictcios.

Soluo:
X( 30 ) +X( 30 +1)
Como n = 30 (par), o elemento mediano ser dada por: Xmd = 2
2
2
;
X(15) +X(16)
Assim, a mediana ser dada pela mdia aritmtica entre o 15o e o 16o elemento, M d = 2 ;
8 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.

25
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Se olharmos as frequncias acumuladas (Fi ) na Tabela 23 veremos que o 15o elemento se encontra na 6a
coluna e o 16o elemento na 7a coluna e as idades correspondentes a cada coluna so:

M d = (26 + 28)/2 = 27;

Interpretao: 50% dos alunos do curso de estatstica de 2010 tem idade igual ou superior a 27 anos;

3. Determinao da Mediana de Dados Agrupados em Classes.


Para dados agrupados, a mediana, pode ser obtida por interpolao. Primeiramente encontramos a classe mediana,
onde n/2 nos fornece a posio do elemento mediano, no se fazendo distino entre nmero par ou mpar de
observaes. Uma vez determinada a classe mediana, a mediana ser calculada atravs da seguinte expresso:
n
Fant

Md = l + h 2
fmd

onde,
l = limite inferior da classe mediana;
h = amplitude do intervalo da classe mediana;
n
2 = posio do elemento mediano;
Fant = frequncia acumulada at a classe anterior classe mediana;
fmd = frequncia absoluta simples da classe mediana.

Exemplo 1:

Tabela 24: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.

A mediana ser dada por:  


15 7
M d = 24 + 3 = 27.
8
Interpretao: 50% dos alunos do curso de estatstica de 2010 tinham idade superior a 27 anos.

Exemplo 2:
Encontre a mediana utilizando os dados da tabela a seguir:

Pesos(kg) Frequncia
59 ` 63 3
63 ` 67 5
67 ` 71 9
71 ` 75 12
75 ` 79 11
TOTAL 40

Soluo 1: Somando-se as trs primeiras frequncias tm-se 3 + 5 + 9 = 17. Logo, para obtermos o 20o peso (n/2)
desejado, so necessrios mais 3 dos 12 casos existentes na 4a classe. Como o 4o intervalo de classe dado por 71 ` 75,
a mediana situa-se a 3/12 da distncia entre 71 e 75 e :
3
M d = 71 + (75 71) = 72.
12
Soluo 2: Utilizando o histograma tambm podemos encontrar a mediana:

26
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Em cada coluna do histograma temos as frequncias das respectivas classes, mais uma vez, somando-se as trs
primeiras frequncias tm-se 3 + 5 + 9 = 17. Logo, para obtermos o 20o peso (n/2) desejado, so necessrios mais 3 dos
12 casos existentes na 4a classe. Assim a mediana ser dada por:

M d 71 75 71
=
3 12
3(75 71)
M d 71 =
12
M d = 1 + 71 = 72.

4.3 Moda (Mo)


A moda outra medida de tendncia central, sendo, no entanto a menos usada. Sua vantagem que pode ser usada
para variveis qualitativas. Genericamente, pode-se definir a moda como o valor mais frequente da distribuio.
Observaes:
Um conjunto de dados pode apresentar mais de uma moda;

A moda pode ser calculada para variveis qualitativas e quantitativas;


Um conjunto de dados sem moda chamado Amodal.

1. Determinao da Moda de Valores No-Tabulados.


Considerando um conjunto ordenado de valores, a moda ser o valor predominante, o valor mais frequente desse
conjunto. Embora seu significado seja o mais simples possvel, nem sempre a moda existe (distribuio amodal) e
nem sempre nica. Se apresentar apenas uma moda diremos que unimodal; se possuir duas modas diremos que
bimodal; se tiver vrias modas (mais que duas) diremos que multimodal. Exemplos:
X = {1, 2, 4, 7, 9}: conjunto Amodal;
X = {1, 2, 2, 4, 7, 9}: conjunto Unimodal, moda = 2;
X = {1, 2, 2, 4, 4, 7, 9}: conjunto Bimodal; moda = 2 e 4;
2. Determinao da Moda para Valores Tabulados.
No caso de dados tabelados no agrupados em classe, a determinao da moda imediata, bastando para isso,
consultar a tabela, localizando o valor que apresenta a maior frequncia. Analisando a Tabela 23, observa-se que a
idade que possui o maior fi a idade 25, com fi = 4. Ou seja, a idade mais frequente entre os estudantes do curso
de estatstica de 2010 25 anos ou a idade mais observada entre os estudantes foi 25 anos.

Para variveis qualitativas, a moda ser a categoria que mais apareceu.


Observando os resultados da Tabela 25, conclui-se que a categoria que foi observada com maior frequncia foi a Regular
a boa, logo essa ser a moda. Interpretao: A maioria dos estudantes considera que as salas de cinema da cidade est
classificada como Regular a boa.

27
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 25: Distribuio de frequncias da Opinio dos alunos a respeito das salas de cinema na cidade.
Opinio Regular a boa Muito boa
frequncia(fi ) 32 18
Fonte: Estatstica Bsica - Daniel Furtado.

Para dados agrupados a moda se localiza na classe de maior freqncia (classe modal) e obtida por meio da
expresso (Moda de Czuber): 9  
1
Mo = l + h
1 + 2
l o limite inferior da classe modal;
h a amplitude da classe modal;
1 a diferena da freqncia da classe modal e a freqncia da classe imediatamente anterior;
2 a diferena da freqncia da classe modal e a freqncia da classe imediatamente posterior.
Exemplo: Utilizando a Tabela 26 temos:

Tabela 26: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.

 
95
M o = 33 + 3
(9 5) + (9 0)
Mo
= 33 + 0, 92
= 34.
Interpretao: A idade mais frequente entre os alunos do curso de estatstica 2010 34 anos.

4.4 Comparao entre Mdia, Mediana e Moda


Mdia
Definio: Soma de todos os valores dividido pelo total de elementos do conjunto.
Vantagens: Centro de massa da distribuio; Possui propriedades matemticas atraentes.
Limitaes: influenciada por valores extremos.
Quando usar:
1. Deseja-se obter a medida de posio que possui a maior estabilidade;
2. Houver necessidade de um tratamento algbrico posterior.
Mediana
Definio: Valor que divide o conjunto em duas partes iguais.
Vantagens: Menos sensvel a valores extremos que a mdia.
Limitaes: Difcil de determinar para grande quantidade de dados.
Quando usar:
1. Deseja-se obter o ponto que divide o conjunto em partes iguais;
2. H valores extremos que afetam de maneira acentuada a mdia;
9 SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.

28
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Moda

Definio: Valor mais freqente.


Vantagens: Valor tpico; Maior quantidade de valores concentrados neste ponto.
Limitaes: Pode no haver moda para certos conjuntos de dados.
Quando usar:
1. Deseja-se obter uma medida rpida e aproximada da posio;
2. A medida de posio deve ser o valor mais tpico da distribuio.

4.5 Simetria
A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos dados.

Distribuio simtrica - X = Md = Mo
Distribuio assimtrica - ocorrem diferenas entre os valores da mdia, mediana e moda. A assimetria pode ser:

direita - X > Md > Mo


esquerda - X < Md < Mo

4.6 Exerccios
1. Para os exerccios (1) e (2) da seo 4.1.2, pginas 24 e 25, calcule:
a) As medidas de posio para os dados brutos, interprete os resultados obtidos;
b) As medidas de posio para os dados tabulados. Houve diferena nos resultados? Justifique.
c) Verifique se as distribuies dos dados so simtricas ou assimtricas ( direita ou esquerda).

2. Em um estudo sobre o potencial de germinao de sementes de algodo dividiu-se uma rea em 48 parcelas com a
mesma rea, tipo de solo, iluminao, etc. Em cada uma destas parcelas foram plantadas 4 sementes e verificou-se
o nmero de sementes que germinaram. Os dados obtidos so apresentados a seguir:

2 0 0 4 3 0 0 1 0 0 1 1 0 0 0 1
2 1 1 1 1 1 1 0 0 0 3 0 0 0 0 0
0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0

Para o conjunto de dados da acima calcule:


a) As medidas de posio para os dados brutos, interprete os resultados obtidos;
b) As medidas de posio para os dados tabulados. Houve diferena nos resultados? Justifique.
c) Verifique se as distribuies dos dados so simtricas ou assimtricas ( direita ou esquerda).
3. Os dados seguintes representam 20 observaes relativas ao ndice pluviomtrico em determinados municpios do
Estado:

144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158

Para o conjunto de dados acima calcule:


a) As medidas de posio para os dados brutos, interprete os resultados obtidos;
b) As medidas de posio para os dados tabulados. Houve diferena nos resultados? Justifique.
c) Verifique se as distribuies dos dados so simtricas ou assimtricas ( direita ou esquerda).

29
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

5 Separatrizes
So as medidas que separam o rol ou a distribuio de frequncias em partes iguais. Vimos que a mediana divide
a distribuio em duas partes iguais quanto ao nmero de elementos de cada parte. Agora vamos estudar outras medidas
que dividem a distribuio em partes iguais, so as chamadas separatrizes. So elas: 10
Quartis - Dividem a amostra em 4 partes iguais;
Decis - Dividem a amostra em 10 partes iguais;
Percentis - Dividem a amostra em 100 partes iguais;

5.1 Quartis
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:

Q1: 1o quartil. Deixa 25% dos elementos antes do seu valor;


Q2: 2o quartil. Deixa 50% dos elementos antes do seu valor. Coincide com a mediana;
Q3: 3o quartil. Deixa 75% dos elementos antes do seu valor. (Consequentemente, 25% dos elementos acima do
seu valor.)
Genericamente, para determinar a ordem ou posio do quartil a ser calculado, usaremos a seguinte expresso:
in
EQi = , i = 1, 2, 3;
4
onde: i = No do quartil a ser calculado; n = No de observaes;

A regra para obteno dos valores dos quartis, a partir da posio encontrada, ser dada por:
quando n impar, o arredondamento deve ser para cima da posio encontrada; e
quando n par , devemos fazer a mdia do valor encontrado e do subsequente.
Exemplo 1: para n mpar- X = {11, 12, 12, 14, 14, 17, 19}, vamos calcular o quartil 1 desse conjunto:
1. Fazer o Rol das observaes em ordem crescente;
2. Encontrar a posio do elemento:
in
EQi =
4
EQ1 = 17
4 = 1, 75o
= 2o elemento,
Q1 = 12. Interpretao: 25% das observaes so menores que 12 ou 75% das observaes so superiores ou
iguais a 12.
Exemplo 2: para n par - X = {11, 12, 12, 14, 14, 17, 19, 19}, vamos calcular o quartil 3 desse conjunto:
1. Fazer o Rol das observaes em ordem crescente;
2. Encontrar a posio do elemento:
in
EQi =
4
38
EQ3 = 4 = 6o . Entre o 6o e 7o elemento,
Q3 = 17+19
2 = 18. Interpretao: 75% das observaes so menores que 18 ou 25% das observaes so superiores
ou iguais a 18.

30
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 27: Idade de pacientes renais (em anos).


Idade (xi ) 26 28 30 32 37 Total
fi 3 10 12 5 19 49
Fi 3 13 25 30 49 -
Fonte: Dados fictcios.

, Exemplo 3: Quando os dados tiverem em uma distribuio de frequncias:


1. Encontrar a posio do elemento:
in
EQi = ;
4
2. Olhar na Fi a posio do elemento e o valor correspondente;

No exemplo, EQ1 = 149 4 = 12, 25o ; Como n mpar arredondaremos para o nmero acima da posio encon-
o
trada, logo ser o 13 elemento;
Olhando na Fi , o 13o elemento corresponde ao valor 28, ou seja, 25% dos pacientes renais observados tm at 28
anos.

Se o n fosse par, farimos a mdia aritmtica do elemento que antecede o EQi e o posterior.
, Exemplo 4:

Tabela 28: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.

Para dados agrupados em classes, encontraremos os quartis de maneira semelhante usada para o clculo da
mediana:  
EQi Fant
Qi = l + h
fqi
onde,
l = limite inferior da classe que contem o quartil desejado;
h = amplitude do intervalo de classe;
EQi = elemento quartlico;
Fant = frequncia acumulada da classe anterior classe quartlica;
fqi = frequncia absoluta simples da classe quartlica.

No exemplo das idades EQ1 = 130 4 = 7, 5o , como os dados esto em classes, olha-se o Fi mais prximo de
EQi , analisando a Tabela acima, temos que a 2a classe ser a classe quartlica pois na 1a classe observamos at 7
elementos e o que passar disso cai na classe seguinte, logo:
 
7, 5 7
Q1 = 24 + 3 = 24, 2.
8

Interpretao: 25% dos estudantes tem at 24,2 anos. O Q1 encontrado aqui diferente do quartil calculado para os
dados originais no tabulados, essa diferena se justifica pois nos dados em classes perdemos um pouco na preciso.

10 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.

31
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

5.2 Decis e Percentis


Genericamente, para determinar a ordem ou posio do Decil a ser calculado, usaremos a seguinte expresso:
in
EDi = , i = 1, 2, 3, , 9;
10

Do mesmo modo, para determinar a ordem ou posio do Percentil a ser calculado, usaremos a seguinte expresso:
in
EDi = , i = 1, 2, 3, , 99;
100

onde: i = No do decil ou percentil a ser calculado; n = No de obs;


A forma de calcular os decis ou percentis idntica a dos quartis, o que muda a forma de encontrar o elemento,
que ao invs de ser dividida por 4 fica dividida por 10 ou 100.
Para dados agrupados em classes, encontraremos os Decis ou os Percentis de maneira semelhante usada para o
clculo dos quartis:  
EDi Fant
Decis : Di = l + h
fdi
 
EPi Fant
P ercentis : Pi = l + h
fpi

No exemplo das idades EP90 = 9030 o


100 = 27 , como os dados esto em classes, olha-se o Fi mais prximo de EPi ,
analisando a Tabela 8, temos que a ltima classe ser a classe do 90o percentil, logo:
 
27 21
P90 = 33 + 3 = 35.
9

Interpretao: 90% dos estudantes tem at 35 anos. O P90 encontrado aqui ser diferente do Percentil achado
usando os dados brutos, essa diferena se justifica pois nos dados em classes perdemos um pouco na preciso.

5.3 Exerccios
1. Para os exerccios (1) e (2) da seo 4.1.2, pginas 24 e 25, calcule Q1 , Q3 e P95 . Interprete os resultados.
2. Para os dados da Tabela 8 calcule Q3 e D8 . Interprete os resultados.
3. Considere os seguintes dados sobre a distribuio de valores de metabolismo basal (cal/dia) em 36 adolescentes:

910 1280 1220 1120 1040 1070 980 1310 1240 1140 1110 1020
1190 1090 1010 1380 1270 1280 1210 1110 1040 1460 1420 1270
960 1300 1240 1130 1070 1080 1000 1360 1260 1180 1200 1100

Para o conjunto de dados acima responda:


a) Construa a tabela de freqncias constituda pelas freqncias absolutas simples, as freqncias relativas, as
freqncias acumuladas e os Pontos mdios de classes;
b) Construir um histograma e um polgono de freqncias;
c) Calcule a mdia, a moda e a mediana para os dados brutos e a seguir para os dados agrupados, compare os
resultados e comente. Interprete cada medida obtida;
d) Calcule Q1, Q3, P68 e D8. Interprete os resultados.

6 Medidas de Disperso
Uma breve reflexo sobre as medidas de tendncia central permite-nos concluir que elas no so suficientes para
caracterizar totalmente uma sequncia numrica. Se observarmos as sequncias:
X : 10, 1, 18, 20, 35, 3, 7, 15, 11, 10.
Y : 12, 13, 13, 14, 12, 14, 12, 14, 13, 13.
Z : 13, 13, 13, 13, 13, 13, 13, 13, 13, 13.

32
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

concluiremos que todas possuem a mesma mdia 13. No entanto so sequncias completamente distintas do ponto de
vista de variabilidade dos dados. Na sequncia Z no h variabilidade dos dados. Na sequncia Y , a mdia 13 representa
bem a srie, mas existem elementos da srie levemente diferenciados da mdia 13. Na sequncia X os elementos esto
bem diferenciados da mdia 13. As medidas de disperso sero usadas para avaliar a representatividade da mdia. 11

6.1 Amplitude Total


A amplitude total de um conjunto de dados a diferena entre o maior e o menor valor observado. A medida de
disperso no leva em considerao os valores intermedirios perdendo a informao de como os dados esto distribudos
e/ou concentrados.
H = Xmax Xmin
Exemplo: Utilizando os dados da Tabela 8, a amplitude total da idade dos alunos do curso de Estatstica 2010 :

H = 36 21 = 15 anos,

isto , as idades dos alunos diferem em torno de 15 anos.

6.2 Amplitude Interquartlica


A amplitude interquartlica a diferena entre o terceiro e o primeiro quartil. Esta medida mais estvel que a
amplitude total por no considerar os valores mais extremos. Esta medida abrange 50% dos dados e til para detectar
valores discrepantes.
dq = Q3 Q1
Exemplo: Utilizando os dados da Tabela 8, a amplitude interquartlica da idade dos alunos do curso de Estatstica da
UFMT :
dq = 33, 5 24, 2 = 9, 3 anos
A amplitude entre o terceiro e primeiro quartil, que envolve 50% (centrais) dos alunos, de 9,3 anos.

6.3 Varincia
a medida de disperso mais usada e mais importante. Mede a concentrao dos dados em torno da mdia. dado
pela soma dos quadrados dos desvios dividido pelo nmero total de observaes. A notao S 2 usada para representar
a varincia amostral.

1. Varincia amostral (S 2 ) para dados no tabulados


n 2
X
Xi X
2
S = , (1)
i=1
n1

desenvolvendo o quadrado do parentses obtem-se:


( n )
2 1 X
2
S = Xi2 nX . (2)
n1 i=1

22,71.
Exemplo: Calcular a varincia do conjunto A = {10, 12, 13, 20, 25, 34, 45}, X=
Na Tabela 29 di chamadado de desvio, a soma do desvio nula. A soma dos desvios ao quadrado dividido por
n 1 resulta na varincia e a raz quadrada da varincia o desvio-padro.
13 e S 2 = 167, 9.
p
Logo, S = 1007, 4/6 =

2. Desvio-Padro (S): a raz quadrada da varincia. Deixa a medida de variabilidade na mesma unidade de medida
dos dados, diferente da varincia. Exemplo: Se calculamos a varincia das alturas de um conjunto de 10 crianas,
essa varincia ter como unidade de medida cm2 e o desvio padro cm, mesma unidade de medida das observaes
coletadas.
11 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.

33
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 29: Clculo da varincia.


Xi di = (Xi X) 2
d2i = (Xi X)
10 -12,71 161,54
12 -10,71 114,70
13 -9,71 94,28
20 -2,71 7,34
25 2,29 5,24
34 11,29 127,46
45 22,29 496,84
Total 0,03 1007,4
Fonte: Dados hipotticos.

3. Varincia de dados tabulados em distribuio de frequncias: Quando os valores vierem dispostos em uma tabela
de frequncias, o clculo da varincia se far atravs da seguinte frmula:
k 2 fi

X
2 Xi X
S = (3)
i=1
n1

Se os dados forem agrupados em classe Xi substitudo por P mi .


k 2
X
P mi X fi
2
S = (4)
i=1
n1

ou desenvolvendo o quadrado do parnteses obtm-se:


( n )
2 1 X
2 2
S = X fi nX . (5)
n 1 i=1 i

Se os dados forem agrupados em classe Xi substitudo por P mi .


( n )
2 1 X
2 2
S = P mi fi nX . (6)
n 1 i=1

Exemplo: Os dados a seguir referem-se as vendas de determinada empresa e produtividade de seus vendedores.

Tabela 30: Distribuio de frequncias referente s vendas de determinada empresa e produtividade de seus vendedores.
Vendas(x 1000 - R$)(xi ) No de vendedores(fi ) xi fi x2i fi
70 1 70 702 1
120 12 1440 1202 12
170 27 4590 1702 27
220 31 6820 2202 31
270 10 2700 2702 10
Total 81 15620 3187400
Fonte: Dados hipotticos.

A mdia para os dados apresentados na tabela acima ser dada por:


P
= xi fi 15620
X = = 192, 84.
n 81
192, 84 (x 1000 - R$).
Logo as vendas mdias dessa empresa foi de =
A varincia ser dada por:
1
S2 3187400 81(192, 84)2

= = 2.190, 39
81 1
O desvio padro ser dada por:
2.190, 39
p
S= = 46, 8

34
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 31: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi P mi fi P m2i fi
21 ` 24 22,5 7 157,5 22, 52 7
24 ` 27 25,5 8 204 25, 52 8
27 ` 30 28,5 1 28,5 28, 52 1
30 ` 33 31,5 5 157,5 31, 52 5
33 ` 36 34,5 9 310,5 34, 52 9
TOTAL - 30 858 25231,5
Fonte: Dados hipotticos.

Apresentando uma variabilidade razoavelmente alta.


Para dados agrupados em classes usaremos o exemplo das idades citado anteriormente.
A mdia para os dados apresentados na tabela acima ser dada por:
P
P mi fi 858
X= = = 28, 6.
n 30
A idade mdia dos alunos de 28,6 anos.
A varincia ser dada por:
1
S2 25231, 5 30(28, 6)2

= = 23, 1
30 1
O desvio padro ser dada por:
23, 1
p
S= = 4, 8
Apresentando uma variabilidade moderada.

Interpretao do desvio-padro (anloga da varincia):

Devemos ter em mente que o desvio-padro mede a variao entre valores. Assim:
Se os valores estiverem prximos uns dos outros, ento o desvio-padro ser pequeno, e consequentemente os dados
sero homogneos.
Se os valores estiverem distantes uns dos outros, ento o desvio-padro ser grande, e consequentemente os dados
sero heterogneos.
A desvantagem do uso da varincia perante o uso do desvio-padro que a unidade de medida utilizada igual ao
quadrado da unidade de medida dos dados. No entanto, por conta da maior facilidade do trato algbrico com funes
quadrticas, a varincia ser a medida de disperso mais utilizada quando tratarmos da inferncia estatstica.

6.4 Coeficiente de Variao


Trata-se de uma medida relativa de disperso, til para comparao em termos relativos do grau de concentrao
em torno da mdia de sries distintas.
dada por:
S
CV = 100 (7)
X
Como o CV uma medida que exprime a variabilidade relativa mdia, usualmente expresso em porcentagem.
Exemplo: Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo de indivduos:

X s
Estaturas 175 cm 5,0 cm
Pesos 68 kg 2,0 kg
Fonte: Dados hipotticos.

Temos:
5
CVE = 100 = 2, 85%
175

35
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

2
CVP = 100 = 2, 94%
68
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que as estaturas.
O Coeficiente de variao pode ser usado em um conjunto de dados para determinar a homogeneidade dos mesmos.
O grau de homogeneidade geralmente determinado pelo prprio pesquisador e depende de que tipo de estudo est sendo
feito. Nesse curso usaremos um grau de at 20% para os dados serem considerados homogneos.

6.5 Exerccios

Tabela 32: Informaes sobre sexo, idade (anos), altura (metro e centmetro), peso (kg), estado civil, nmero de irmos,
transporte, procedncia, relao do trabalho com o curso de Estatstica e meio de informao dos alunos da disciplina
Inferncia Estatstica do curso de Estatstica da UEM - 21/03/2005.
No Sexo Id Altura Peso Est.Civil No ir. Transp. Procedncia Trabalho Inform
1 F 20 1,60 58 Solteiro 1 Prprio Maring No Rel. TV
2 F 26 1,65 59 Solteiro 2 Coletivo Fora do Pr No trab. Revista
3 F 18 1,64 55 Solteiro 2 Prprio Maring No trab. TV
4 F 25 1,73 60 Solteiro 2 Coletivo Outro no Pr No Rel. TV
5 M 35 1,76 83 Casado 6 Coletivo Outro no Pr No Rel. TV
6 F 20 1,62 58 Solteiro 2 Coletivo Outro no Pr No Rel. Rdio
7 F 29 1,72 70 Solteiro 3 Coletivo Maring No trab. TV
8 M 23 1,71 62 Separado 2 Prprio Outro no Pr No Rel. Internet
9 F 20 1,63 63 Solteiro 2 Prprio Maring No trab. TV
10 M 20 1,79 75 Solteiro 2 Prprio Fora do Pr No trab. Internet
11 M 20 1,82 66 Solteiro 1 Prprio Fora do Pr No trab. TV
12 F 30 1,68 46 Solteiro 3 Prprio Outro no Pr Parc.Rel. TV
13 F 18 1,69 64 Solteiro 1 Prprio Maring Parc.Rel. TV
14 M 37 1,82 80 Casado 2 Prprio Maring No Rel. TV
15 M 25 1,83 62 Solteiro 1 Prprio Outro no Pr No Rel. TV
16 F 20 1,63 68 Solteiro 2 Coletivo Maring No trab. TV
17 M 21 1,71 80 Solteiro 2 Coletivo Maring No Rel. Internet
18 M 25 1,80 82 Casado 1 Prprio Outro no Pr No Rel. Internet
19 F 24 1,62 55 Solteiro 2 Prprio Maring No trab. Jornal
20 M 19 1,74 58 Solteiro 2 Prprio Maring Com.Rel. TV
21 F 21 1,55 65 Solteiro 1 Prprio Maring No trab. TV
22 M 22 1,73 62 Solteiro 0 Prprio Maring No trab. Jornal

1. Com base na Tabela (32) responda:

a) Classifique as variveis descritas na tabela;


b) Faa um resumo estatstico para as variveis qualitativas (Representao tabular e grfica adequada);
c) Faa um resumo estatstico para as variveis quantitativas: No de irmos e Peso (Representao tabular e
grfica adequada);
d) Calcule as medidas de Posio e Disperso para as variveis quantitativas: No de irmos e Peso; Interprete os
resultados; (Usar dados originais);
e) Calcule Q1, Q3 e P95 para as variveis quantitativas: No de irmos e Peso (Usar dados originais).
2. Calcule para cada uma das distribuies abaixo as seguintes medidas:

a) de tendncia central: mdia aritmtica, mediana e moda. (Interprete os resultados)


b) de disperso: amplitude total, desvio-padro e varincia. (Interprete os resultados)

i) Pesos de recm-nascidos (em kg): 2.7; 3.9; 4.1; 4.3; 5.4;


ii) Taxas sanguneas de uria (mg/dl): 27; 31; 32; 34; 46; 61;
iii)
iv)

36
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 33: Idade de pacientes renais (em anos).


Idade 26 28 30 32 37 Total
fi 3 10 12 5 19 49

Tabela 34: Nmero de atendimentos em servio mdico por funcionrios de uma empresa.
No de Atendimentos 0 1 2 3 4 Total
fi 24 21 3 51 1 100

Tabela 35: Altura de 140 alunos (em cm).


Estaturas 145`150 150`155 155`160 160`165 165`170 170`175 175`180 180`185
No de alunos 2 10 27 38 27 21 8 7

v)
c) Calcule o primeiro quartil, o quadragsimo centil e o nono decil para o conjunto de dados referente Altura
dos 140 alunos. (Interprete os resultados)

3. Os dados para este exemplo provm de uma jazida de carvo, localizada em Sapopema-PR, na qual foram obtidos
valores para as variveis espessura da camada de carvo, teor de cinzas, teor de enxofre e rendimento para a
obteno de um produto lavrado com 20% de cinzas. Como descrito por Cava (1985) e Landim et al. (1988), esse
depsito situa-se a cerca de 20km a noroeste da Figueira, no nordeste do Estado do Paran, em sedimentos da parte
superior do Membro Triunfo da Formao Rio Bonito.
a) Resuma os dados da varivel Teor de Cinzas em uma tabela de distribuio de freqncias;
b) Para a Tabela construida em (a), faa a representao grfica adequada;
c) Calcule as medidas de tendncia central e disperso para a varivel: Teor de Cinzas (Use os dados tabulados);

7 Momentos, Assimetria e Curtose


7.1 Momentos
Se X1 , X2 , , Xn so n valores assumidos pela varivel X, define-se a quantidade 12
Pn
X1r + X2r + + Xnr xr
Mr = = i=1 i , (8)
n n

denominada momento de ordem r. O primeiro momento, com r = 1, a mdia aritmtica X.
13
Definimos o momento de ordem r centrado em relao a uma constante a como:
Pn
(xi a)r
mr = i=1 . (9)
n
como:
Definimos o momento de ordem r centrado em relao a X
Pn r
a (xi X)
Mr = i=1 , (10)
n
1. Momentos para dados em distribuio de frequncias
Pn
xr fi
Mr = i=1 i , (11)
n
Pn
i=1 (xi a)r fi
mr = . (12)
n
Pn r fi
i=1 (xi X)
Mra = , (13)
n
12 SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.
13 NETO, P.L.O.Costa. Estatstica, 2a Edio, Editora Edgard Blcher Ltda. 2002.

37
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Espessura Cinzas Enxofre Rendimento a 20%


0,8 38,6 15,2 0,81
0,72 22,6 6,1 0,83
0,69 39 7,9 0,67
0,8 37,1 10,1 0,99
0,73 40,8 4,9 0,81
1,19 34,1 7,21 1,32
0,94 25 5,79 1,32
0,96 29,3 7,92 1,12
1,05 33 7,03 1,19
1,32 29,7 7,32 1,37
1,02 33,7 8,1 0,91
1,2 2 6,13 7,4 1,64
1,1 25,41 8,6 1,49
1,18 22,8 6 1,4
1,3 19,1 8,1 2,13
1,55 35,1 7,93 1,75
1,57 16,9 6,31 1,9
1,3 20,5 6,27 1,89
1,18 39,1 5,74 1,32
1,4 38,6 8,68 1,43
1,3 27,5 7,75 1,55
1,5 25,4 6,87 2,03
1,4 24,3 6,9 1,59
1,85 57,4 5,6 1,15
1,2 22 7,46 1,77
1,23 27 5,99 1,57
1,3 32,1 8,07 1,46
1,62 36,8 5,24 1,77
2,09 19,5 5,34 1,21
1,6 47,8 5,93 1,44
1,4 43,1 5,6 1,18
1,41 36,6 8,17 1,48
1,38 39,6 5,12 1,3
1,04 31,1 6,39 1,28
1,31 64,8 5,71 1,09
1,28 43,24 5,4 1,33
0,55 27,2 9,01 0,82
Anlise estatstica de dados geolgicos. Autor: LANDIM, PAULO MILTON BARBOSA.

38
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Para dados agrupados em classe, no lugar de xi coloca-se P mi .


Interessa-nos particularmente saber calcular os momentos centrados de terceira e de quarta ordem. Aplicando-se a
definio e fazendo algumas transformaes, chega-se as expresses:
Pn Pn
x3 x2
m3 = i=1 i 3 x i=1 i + 2 x3 , (14)
n n

Pn Pn Pn
x4i x3i x2i
m4 = i=1
4
x i=1
x2
+ 6 i=1
x4 ,
3 (15)
n n n
Havendo frequncias a considerar, as expresses equivalentes so as seguintes:
Pn Pn
x3 fi x2 fi
m3 = i=1 i 3 x i=1 i + 2 x3 , (16)
n n

Pn Pn Pn
x4i fi x3i fi x2i fi
m4 = i=1
4
x i=1
x2
+ 6 i=1
x4 ,
3 (17)
n n n
Vantagens: timos estimadores para parmetros populacionais, ex: mdia e varincia; Pode ser utilizado tambm
no clculo dos coeficientes de assimetria e curtose.
Desvantagens: pode ser um pouco trabalhoso ou complicado de calcular; s vezes podemos ter mais de um esti-
mador de momentos;

7.2 Assimetria
As medidas de assimetria procuram caracterizar como e quanto a distribuio de frequncias se afastam da condi-
o de simetria. A medida de assimetria um indicador da forma da distribuio dos dados. Ao construir uma distribuio
de freqncias e/ou um histograma, est-se buscando, tambm, identificar visualmente, a forma da distribuio dos dados
que ou no confirmada pelo coeficiente de assimetria de Pearson (A) definido como: 14
mo
x
A= . (18)
sx
Quando |A| < 0, 15, podemos considerar a distribuio como praticamente simtrica. Por outro lado, costuma-se consi-
derar a assimetria como moderada se 0, 15 < |A| < 1, e forte se |A| > 1.
O momento de terceira ordem tambm pode ser usado como medida de assimetria de uma distribuio. Entretanto
mais conveniente a utilizao de uma medida adimencional o que leva a definio do coeficiente de assimetria:
m3
a3 = . (19)
s3
Onde: a3 = 0 indica que a distribuio praticamente simtrica, a3 > 0 indica que a distribuio assimtrica po-
sitiva e a3 < 0 indica que a distribuio assimtrica negativa. Esse coeficiente indica o sentido da assimetria e, sendo
adimencional, pode ser usado para comparar diversos casos.
Uma distribuio classificada como:
Simtrica: se mdia = mediana = moda.

Assimtrica Negativa: se mdia mediana moda. O lado mais longo do polgono de freqncia (cauda da
distribuio) est esquerda do centro.
Assimtrica Positiva: se moda mediana mdia. O lado mais longo do polgono de freqncia est direita do
centro.

14 NETO, P.L.O.Costa. Estatstica, 2a Edio, Editora Edgard Blcher Ltda. 2002.

39
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Figura 14: Representao grfica de uma distribuio simtrica.

Figura 15: Representao grfica de uma distribuio Assimtrica Negativa.

Figura 16: Representao grfica de uma distribuio Assimtrica Positiva.

40
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Resumo dos coeficientes de assimetria:

Indicador da forma da distribuio dos dados;


classificada como: Assimtrica (positiva ou negativa - direita ou esquerda) ou Simtrica.
Coeficiente de Assimetria de Pearson: A = xm sx ; onde: x
o
= mdia, mo = moda e sx = desvio padro. Se |A| < 0, 15,
podemos considerar a distribuio praticamente simtrica. Se 0, 15 < |A| < 1, costuma-se considerar como assimetria
moderada e forte se |A| > 1. A desvantagem do uso do coeficiente de assimetria de pearson que ele no recomendado
em distribuies amodais ou bimodais em diante pois dificulta a interpretao. Quando isto ocorrer pode-se utilizar o co-
eficiente de assimetria baseado no momento de 3a ordem: a3 = m s3 . Se a3 = 0 a distribuio considerada praticamente
3

simtrica, se a3 > 0 simetria positiva e a3 < 0 assimetria negativa. Fazer a anlise de assimetria sempre comparando o
resultado do coeficiente obtido com o grfico (polgono, histograma ou box plot so os mais usuais).

7.3 Curtose
A medida de curtose o grau de achatamento da distribuio, um indicador da forma desta distribuio.
definido como: 15
Q3 Q1
k= . (20)
2(P90 P10 )

A curtose ou achatamento mais uma medida com a finalidade de complementar a caracterizao da disperso em uma
distribuio. Esta medida quantifica a concentrao ou disperso dos valores de um conjunto de dados em relao s
medidas de tendncia central em uma distribuio de freqncias.
Uma distribuio classificada quanto ao grau de achatamento como:

Figura 17: Classificaes de uma distribuio quanto ao grau de achatamento.

Leptocrtica: quando a distribuio apresenta uma curva de freqncia bastante fechada, com os dados fortemente
concentrados em torno de seu centro, K < 0,263.
Mesocrtica: quando os dados esto razoavelmente concentrados em torno de seu centro, K= 0,263

Platicrtica: quando a distribuio apresenta uma curva de freqncia mais aberta, com os dados fracamente con-
centrados em torno de seu centro, K > 0,263.

A caracterizao do achatamento de uma distribuio s tem sentido, em termos prticos, se a distribuio for
aproximadamente simtrica. Entre as possveis medidas de achatamento, tambm temos o coeficiente de curtose, obtido
pelo quociente do momento centrado de quarta ordem pelo quadrado da varincia, ou seja,
m4 m4
a4 = = 2. (21)
s4 m2

Este coeficiente adimencional, sendo menor que trs para as distribuies platicrticas, igual a trs para uma distribuio
mesocrtica e maior que trs para as distribuies leptocrticas.
15 SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.

41
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Resumo: Por curtose entende-se o aplainamento (afilamento ou achatamento) da curva caracterstica do conjunto
ou distribuio. O que a justifica a possibilidade de haver conjuntos e distribuies com idnticas medidas de posio,
de disperso e assimetria.
A curtose mede a divergncia entre a curva considerada e a convencionada como normalmente achatada (tambm se
diz que ela mede a concentrao dos dados em torno do seu centro). curva normalmente achatada d-se o nome de
mesocrtica; mais achatada que ela, platicrtica; menos achatada (ou mais afilada), leptocrtica.

8 Box Plot ou Desenho Esquemtico


O grfico Box Plot (ou desenho esquemtico) uma anlise grfica que utiliza cinco medidas estatsticas: valor
mnimo, valor mximo, mediana, primeiro e terceiro quartil da varivel quantitativa.
Este conjunto de medidas oferece a idia da posio, disperso, assimetria, caudas e dados discrepantes.
A posio central dada pela mediana e a disperso pelo desvio interquartlico dq = Q3 Q2 . As posies relativas
de Q1 , Q2 e Q3 do uma noo da assimetria da distribuio.
Os comprimentos das caudas so dados pelas linhas que vo do retngulo aos valores atpicos. Segundo Triola
(2004), um outlier ou ponto discrepante um valor que se localiza distante de quase todos os outros pontos da
distribuio. A distncia a partir da qual considera-se um valor como discrepante aquela que supera 1, 5dq.
De maneira geral, so considerados outliers todos os valores inferiores Li = Q1 1, 5dq ou os superiores a
Ls = Q3 + 1, 5dq. 16
Resumo do Box-Plot: D uma idia da posio, disperso, assimetria, caudas e dados discrepantes. A posio
central dada pela mediana e a disperso pelo desvio interquartlico (dq ). As posies relativas de Q1 , Q2 , Q3 do uma
noo da assimetria da distribuio. Quando tiver em dvidas em classificar um conjunto de dados como simtrico ou no,
pode tentar comparar o formato do box plot com os resultados dos coeficientes de assimetria e tambm com o formato do
polgono de frequncias (ou com histograma).
Exemplo: A construo do grfico Box Plot pode ser exemplificada utilizando os dados a seguir:
1) Ordenar os dados em seqncia crescente:

18 18 19 20 20 20 20 20 20 21 21
22 23 24 25 25 25 26 29 30 35 37

Determinar as cinco medidas:


1. Mediana:
X n +X n +1 X11 +X12 21+22
Como n par, M d = 2
2
2
= 2 = 2 = 21, 5;
2. Primeiro Quartil:
20+20
Q1 = X 1(n) = X 224
= X5,5 = 2 = 20;
4

3. Terceiro Quartil:
25+25
Q3 = X 3(n) = X 322 = X16,5 = 2 = 25;
4 4

4. Desvio interquartlico:
dq = Q3 Q1 = 25 20 = 5;
5. Limite inferior:
Li = Q1 1, 5dq
Li = 20 1, 5 5 = 12, 5;
6. Limite superior:
Ls = Q3 + 1, 5dq
Ls = 25 + 1, 5x5 = 32, 5;
Construir uma escala com valores (mesma amplitude) que incluam os valores mximo e mnimo dos dados. Construir
uma caixa (retangular) estendendo-se de Q1 a Q3 , e trace uma linha na caixa no valor da mediana.
As figuras a seguir mostraro passo a passo como fazer o box-plot:

Identificar os pontos discrepantes


16 LIMA, A.C.Pedroso; MAGALHES, M.Nascimento. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.

42
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Figura 18: Idade dos alunos do curso de estatstica da UEM.

43
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

No conjunto de dados no existe aluno com idade inferior a 12,5, ou seja, no h aluno com idade considerada
discrepante inferiormente, logo o limite inferior do grfico ser o menor valor da amostra (Xmin ). Entretanto, existem
dois indivduos cujas idades so superiores a 32,5, pontos estes considerados discrepantes neste conjunto de dados: as
idades 35 e 37. Estes pontos so identificados no diagrama de caixas por meio de um pontinho e o limite superio do
grfico ser o Ls calculado.
Note-se que no intervalo interquartlico (dentro do retngulo) existem 50% dos dados, dos quais, 25% esto entre a
linha da mediana e a linha do primeiro quartil e os outros 25% esto entre a linha da mediana e a linha do terceiro quartil.
Cada linha da cauda mais os valores discrepantes contm os 25% restantes da distribuio. A Figura 18 mostra que a
distribuio das idades dos alunos apresenta assimetria positiva, ou seja, dispersam-se para os valores maiores.

9 Tabelas Bidimensionais e Medidas de Associao


muito frequente o interesse em verificar se duas variveis qualitativas apresentam-se associadas, isto , se o
conhecimento de uma varivel ajuda a entender uma outra varivel. Por exemplo, sabendo-se que determinado tipo de
doena est associado com o hbito de fumar, o governo pode promover campanha para alertar a populao. 17
Exemplo:
A Tabela 36 mostra trs distribuies de frequncias, uma para cada regio preferencial (regio indicada para o
cultivo de milho). Dizemos que esta tabela bidimencional, pois apresenta a distribuio de duas variveis: resistncia
ferrugem e regio preferencial.

Tabela 36: Distribuio de frequncias da resistncia ferrugem de hbridos de milho, segundo as regies preferenciais.
Resistencia Regio Preferencial
ferrugem Chapec Campos Novos Iara Total
r 10 3 12 25
mr 6 12 2 20
ms 9 3 3 15
s 7 1 2 10
Total 32 19 19 70
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

Legenda: r - resistente; s - susceptvel; ms - moderadamente susceptvel; mr - moderadamente resistente.


Como os totais das linhas e das colunas (totais marginais) da Tabela 36 so diferentes, isto dificulta a comparao.
Trabalhando com a proporo (frequncia relativa) ou com a frequncia relativa percentual tornamos os resultados com-
parveis. Nesse exemplo, os totais de hbridos por regio foram estabelecidos pelo pesquisador, portanto devemos obter
as porcentagens por regio, conforme apresentado na Tabela 37.

Tabela 37: Distribuio das porcentagens da resistncia ferrugem de hbridos de milho, segundo as regies preferenci-
ais.
Resistencia Regio Preferencial
ferrugem Chapec Campos Novos Iara
r 31,2 15,8 63,2
mr 18,8 63,2 10,5
ms 28,1 15,8 15,8
s 21,9 5,2 10,5
Total 100 100 100
Fonte: Tabela 36.

Algumas observaes com respeito a Tabela 37:


Em Campos Novos a porcentagem de hbridos moderadamente resistentes bem superior as outras duas regies;
Iara apresenta maior porcentagem de hbridos resistentes ferrugem (63,2%), bem superior as outras duas regies;

Percebe-se que em Chapec a distribuio mais homognea nas categorias de resistncia.


Representao Grfica da Tabela 37:

17 ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

44
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Figura 19: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies

Fonte: Tabela 37.

Exerccio Resolvido
Um estudo sobre o tempo de vida de duas amostras de Biomphalaria straminea (Amostra A: 45 indivduos agru-
pados numa bacia e Amostra I: 49 indivduos isolados em copos de vidro), produziu os resultados da Tabela 38 :

Tabela 38: Nmero de indivduos classificados segundo o tempo de vida, em dias, para duas condies de agrupamento.
Tempo de vida Condies de Agrupamento Total
(em dias) Agrupados Isolados
58 a 179 3 6 9
180 a 300 6 19 25
301 a 422 36 24 60
Total 45 49 94
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

a) Dos indivduos submetidos condio de Agrupados, qual a porcentagem de indivduos com tempo de vida entre
301 e 422?
b) Dos indivduos submetidos condio de Isolados, qual a porcentagem de indivduos com tempo de vida de no
mximo 300 dias?

c) Voc concluiria que o tempo de vida est relacionado com a condio de agrupamento? Justifique.

Respostas:

a) De um total de 45 indivduos submetidos condio de Agrupados, a porcentagem dos que apresentaram tempo de
vida entre 301 e 422 : 36/45 = 0,80 ou 0,80 100 = 80%.
b) Do total de 49 indivduos submetidos condio de Isolados, 25 (= 6 + 19) indivduos sobreviveram no mximo
300 dias. Este valor corresponde a (25/49)100 = 51,02%.

c) Sim, pois pode-se verificar que enquanto 80% dos indivduos submetidos condio de Agrupados sobreviveram
entre 301 e 422 dias, somente 48,98% (= 24/49)100 sobreviveram entre 301 e 422 dias na condio de Isolados.

9.1 Medidas de Associao


At agora, vimos como as tabelas bidimencionais (ou tabelas de contigncia) podem ser utilizadas para verificar
uma possvel associao entre duas variveis. Agora iremos aprender como medir a grandeza dessa associao atravs de
medidas estatsticas que indiquem se existe ou no relao entre duas variveis qualitativas e qual a sua magnitude, isto ,
a grandeza da associao. No caso de estarmos trabalhando com variveis quantitativas, elas podem ser categorizadas e
transformadas em variveis qualitativas. Por exemplo, na varivel Rendimento Mdio de hbridos de milho para a regio

45
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

de Chapec, podemos dividir a amostra em trs categorias: menor do que 1500kg/ha (rendimento baixo), maior ou igual
a 1500 e menor ou igual a 3000 (rendimento normal) e maior do que 3000 (rendimento alto). 18
Coeficiente de Contigncia de Pearson
Existem vrias medidas de associao e seu uso depende do tipo e finalidade do estudo. Neste curso usaremos
uma medida de associao comumente utilizada, que o Coeficiente de contingncia de Pearson. Podemos atravs desse
coeficiente, por exemplo, verificar a grandeza da associao entre condies de agrupamento (isolados ou agrupados) e
tempo de vida dos caramujos.
Karl Pearson props o chamado coeficiente de contigncia, representado pela letra C, definido por:
s
2
C= 2
, (22)
+n

onde n o nmero total de observaes e 2 uma estatstica dada por:


s X r
X (f oij f eij )2
2 = , (23)
i=1 j=1
f eij

onde f oij e f eij so as frequncias observadas e esperadas da i-sima linha e j-sima coluna, respectivamente; s e r
so o nmero de linhas e o nmero de colunas da tabela. No exemplo a seguir ser mostrado como obter as frequncias
esperadas f eij .
Este coeficiente nem sempre est entre zero e um, um fator de correo foi proposto para facilitar a interpretao:
C
C = p , (24)
t(t 1)

onde t o mnimo entre o nmero de colunas e de linhas da tabela.


Exemplo: A Tabela 39 refere-se ao nmero de pssaros de uma particular espcie, classificados de acordo com o
local da floresta onde se alimentam, para duas estaes do ano. Um pesquisador levantou a hiptese (no incio do trabalho),

Tabela 39: Distribuio conjunta das variveis local da floresta e estao do ano.
Estao Local da Floresta Total
do ano rvores Arbustos Cho
Primavera 30(50,8%) 20(33,9%) 9(15,3%) 59(100%)
Outono 13(21,3%) 22(36,1%) 26(42,6%) 61(100%)
Total 43(35,8%) 42(35,0%) 35(29,2%) 120(100%)
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

de que os pssaros alimentam-se nestes trs locais da floresta nas mesmas propores na primavera e no outono. Em outras
palavras, o pesquisador formulou a hiptese de que no existe associao entre as duas variveis.

a) Voc concordaria com a hiptese formulada pelo pesquisador? Justifique utilizando porcentagens e o Coeficiente
de Contigncia de Pearson.
b) Faa um grfico de barras mltiplo para representar os dados da Tabela 39.

Obs: Este exerccio ser feito em sala de aula.

9.2 Exerccios
1. Na Tabela 40 esto apresentados resultados de um experimento no qual um pesquisador est procurando verificar se
existe associao entre hbito de crescimento (3 = indeterminado trepador e 4 = indeterminado prostado) e porte (Tr =
trepador, EB = ereto na base e Pr = prostado) na cultura de feijo de vagem.

a) Construa a tabela da distribuio de frequncia conjunta para as variveis hbito de crescimento e porte;
b) Faa um grfico de coluna mltipla para a distribuio de frequncia conjunta do item (a);
c) Para os dados da Tabela 40 podemos considerar que o hbito est associado com o porte? Se houver associao,
qual a grandeza da mesma?

46
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 40: Hbito de crescimento (H) e porte (P) para 50 materiais de feijo de vagem.
H P H P H P H P H P
4 Tr 4 Tr 4 Tr 4 Pr 4 Tr
4 EB 4 Tr 4 Tr 4 Tr 3 Pr
3 Pr 3 Pr 3 Tr 4 Pr 3 Pr
4 Tr 3 Pr 4 Tr 3 Pr 3 Pr
4 Tr 3 Pr 4 Tr 4 Tr 4 Tr
4 Tr 3 EB 4 Tr 3 Pr 4 Tr
3 Pr 4 EB 4 Tr 4 Pr 4 Tr
3 EB 4 EB 4 Tr 3 Pr 4 Tr
4 Tr 4 Tr 3 Pr 4 Tr 3 Pr
4 Tr 4 Tr 4 Tr 4 Tr 4 Tr
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

Tabela 41: Distribuio de frequncias conjunta de plantas segregando para dois caracteres numa prognie da espcie
X.
Ciclo Virescncia Total
Normal Virescente
Tardio 3470 910 4380
Precoce 1030 290 1320
Total 4500 1200 5700
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

2. Os dados da Tabela 41 tm por objetivo verificar se os caracteres ciclo (Tardio e Precoce) e Virescncia (Normal e
Virescente), de uma prognie da espcie X, segregam de forma independentemente.

a) Construa a tabela da distribuio de frequncia relativa percentual conjunta para as variveis Ciclo e Virescncia e
verifique se os dois pares de genes so herdados independentemente ou existe associao;
b) Faa um grfico de coluna mltipla para a distribuio de frequncia conjunta do item (a);

3. Um economista agrcola est estudando fatores que afetam a adoo de uma nova variedade de arroz altamente produ-
tiva. Os resultados esto na Tabela 42.

Tabela 42: Distribuio de frequncias conjunta referente a fatores que podem afetar a adoo de uma nova variedade de
arroz.
Posse Adoo Total
Adota No Adota
Proprietrio 102 26 128
Vrios arrendatrios 42 10 52
nico arrendatrio 5 2 7
Total 149 38 187
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

a) A adoo afetada pela situao de posse de terra?


b) Faa um grfico de coluna (ou barra) mltipla mostrando o comportamento da adoo, segundo a situao de posse
de terra. Interprete os resultados.

4. Foi conduzido um experimento com o objetivo de avaliar o poder germinativo de duas cultivares de cebola: Bola
Precoce - EMPASC 352 e Norte 14. Foram utilizadas para o teste de germinao quatro repeties de 100 sementes,
totalizando 400 sementes para cada cultivar. A varivel em estudo o nmero de sementes que germinaram. Os resultados
esto na tabela 43.

a) Faa um grfico mostrando o comportamento das cultivares com relao germinao das sementes. Interprete os
resultados.
18 ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

47
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 43: Distribuio de frequncias conjunta da Germinao de sementes de duas cultivares de cebola.
Cultivares Germinao Total
Germinaram No germinaram
Bola Precoce 392 8 400
Norte 14 381 19 400
Total 773 27 800
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.

b) Verifique se existe associao entre entre as cultivares e a germinao de sementes. Justifique utilizando porcenta-
gens e o Coeficiente de Contigncia de Pearson.

5. Determinado posto de qualidade de um laticnio retira uma amostra dos pesos dos litros de leite produzidos em um dia,
classificando-os de acordo com seu tipo (B, C, UHT), e condies de peso (dentro ou fora das especificaes). A Tabela
46 mostra a distribuio de frequncias conjunta de 6.850 unidades de leite, disposta numa tabela de contingncia.

Tabela 44: Distribuio de frequncias conjunta do tipo de leite e condio do peso.


Condies do Peso Tipo do Leite Total
B C UHT
Dentro das especificaes 500 4.500 1.500 6.500
Fora das especificaes 30 270 50 350
Total 530 4.770 1.550 6.850
Fonte: Dados extrados da dissertao de mestrado de Luciana S.C.V da Silva - Programa de Ps-graduao em engenharia de produao/ UFSC, 2001.

a) Faa um grfico mostrando o comportamento dos Tipos de leite com relao s Condies de Peso. Interprete os
resultados.
b) Verifique se existe associao entre os Tipos de leite e as Condies de Peso. Justifique utilizando porcentagens e o
Coeficiente de Contigncia de Pearson.
6. Uma metalrgica produz grandes quantidades de parafusos, trabalhando em trs turnos. O setor da qualidade deseja
verificar se o desempenho dos turnos semelhante, o que poderia ser avaliado atravs das propores de peas aprovadas,
direcionadas a retrabalho ou rejeitadas. Como parte do Controle Estatstico de Processos, amostras aleatrias de parafusos
so coletadas de cada turno. Uma dessas amostras, com a classificao das peas est mostrada na tabela a seguir:

Tabela 45: Distribuio de frequncias conjunta da situao das peas e turno.


Situaes das Peas Turno Total
Matutino Vespertino Noturno
Aprovadas 432 456 424 1.312
Retrabalho 185 190 180 555
Rejeitadas 45 48 39 132
Total 530 4.770 1.550 6.850
Fonte: BARBETTA, Pedro A.; REIS, Marcelo M. e BORNIA, Antonio C. Estatstica para cursos de Engenharia e informtica. So Paulo: Editora Atlas S.A., 2004.

a) Faa um grfico mostrando a Situao das peas com relao ao Turno. Interprete os resultados.
b) Verifique se existe associao entre a Situao das peas e o Turno. Justifique utilizando porcentagens e o Coefici-
ente de Contigncia de Pearson.

10 Correlao e Regresso Linear Simples


10.1 Anlise de Correlao
comum na prtica, o interesse em se analisar o comportamento conjunto de duas ou mais variveis quantitativas.
Nesta seo trataremos do estudo de correlao entre duas variveis quantitativas. Suponha que seja de interesse obter
uma medida estatstica que indique se existe ou no relao entre duas variveis e se existe relao qual a sua magnitude
e sinal. Veja alguns exemplos:

48
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Idade e altura das crianas;

Tempo de prtica de esportes e ritmo cardaco;


Tempo de estudo e nota na prova;
Doses de Nitrognio e a produo de milho;
Taxa de desemprego e taxa de criminalidade; e

Expectativa de vida e taxa de analfabetismo.

10.1.1 Diagrama de Disperso


O primeiro passo para verificar a possvel correlao entre duas variveis quantitativas, em termos de um conjunto
de elementos em que se observem essas duas variveis, atravs do diagrama (ou grfico) de disperso, em que os valores
destas variveis so representados por pontos, num sistema cartesiano. Esta representao feita sob forma de pares
ordenados (X, Y), onde X um valor observado de uma varivel e Y o correspondente valor da outra varivel.
Exemplo 1 - Nmeros de anos de servio e nmero de clientes de 10 agentes de uma companhia de seguros:

Tabela 46: Nmeros de anos de servio e No de clientes de 10 agentes de uma companhia de seguros.
Agente Anos de servio (X) No de clientes (Y )
A 2 48
B 4 56
C 5 64
D 6 60
E 8 72
F 2 45
G 3 57
H 7 80
I 6 75
J 3 47

Na Figura 20 esto representados os pares (X, Y ) observados na Tabela 46. Atravs da observao da disposio
dos pontos, conclu-se que h uma dependncia entre as variveis, porque no conjunto medida que aumenta o tempo de
servio, aumenta o nmero de clientes. Temos ento uma correlao positiva.

Figura 20: Grfico de disperso do Tempo de servio versus No de clientes

49
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Exemplo 2 - Numa pesquisa com 10 famlias com renda bruta mensal entre 10 e 60 salrios mnimos, mediu-se:
Y: a % da renda bruta anual gasta com assistncia mdica. X: renda bruta mensal (expressa em no de salrios-mnimos).

Tabela 47: Dados referentes a renda bruta anual gasta com assistncia mdica e No de salrios mnimos por famlia.
Famlia X Y
A 12 7,2
B 16 7,4
C 18 7,0
D 20 6,5
E 28 6,6
F 30 6,7
G 40 6,0
H 48 5,6
I 50 6,0
J 54 5,5

Figura 21: Grfico de disperso da Renda bruta anual e gasto com assistncia mdica.

Observando a Figura 21, nota-se que existe uma dependncia inversa, ou seja, uma correlao negativa, aumen-
tando a renda bruta, diminui a porcentagem da mesma, gasta em assistncia mdica.

Exemplo 3 - Oito indivduos foram submetidos a um teste sobre conhecimento de lngua estrangeira e, em seguida,
mediu-se o tempo gasto por cada um para aprender operar uma determinada mquina. Assim,
X: resultado obtido no teste (mximo 100 pontos)
Y : tempo em minutos necessrio para aprender operar satisfatoriamente a mquina.
Do diagrama de disperso, Figura 22, conclui-se que parece no haver nenhum tipo de dependncia entre as duas
variveis, pois conhecer o resultado do teste no ajuda prever o tempo gasto para aprender a operar a mquina.

10.1.2 Coeficiente de Correlao Linear de Pearson


O coeficiente de correlao linear de Pearson, representado pela letra r, utilizado para quantificar a correlao
entre duas variveis quantitativas. Assume valores no intervalo [-1,+1] e calculado por:
P P P
n( xy) ( x y)
r = Corr(X, Y ) = p P P p P P (25)
n( x2 ) ( x)2 n( y 2 ) ( y)2

onde r = 1 indica uma relao linear negativa perfeita, r = 1 indica uma relao linear positiva perfeita e r = 0 indica
que no h relao linear entre as variveis. Pode haver outro tipo de relao entre X e Y .

50
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Tabela 48: Dados referentes ao resultado de um teste sobre conhecimento em lngua estrangeira e tempo gasto para
aprender a operar uma determinada mquina.
Indivduos X Y
A 45 343
B 52 368
C 61 355
D 70 334
E 74 337
F 76 381
G 80 345
H 90 375

Figura 22: Grfico de disperso do resultado obtido no teste e tempo em minutos necessrio para aprender operar satisfa-
toriamente a mquina.

51
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

P Para obter os somatrios da equao de r procede-se da seguinte maneira:


P xy: Fazem-se os produtos X Y , referente a cada par de observaes e depois efetua-se a soma;
P x: Somam-se os valores da varivel X;
P 2y: Somam-se os valores da varivel Y ;
P 2x : Elevam-se ao quadrado cada valor de X e, depois, efetua-se a soma.
y : Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma.
Exemplo: Considere as seguintes variveis:
Y - consumo de cerveja em um dia (em 100 litros); e
X - temperatura mxima (em o C).
Estas variveis foram observadas em nove localidades com as mesmas caractersticas demogrficas e scio-econmicas.
A seguir, veja a tabela com os dados amostrais.

Tabela 49: Dados referentes a consumo de cerveja em um dia (em 100 litros) e temperatura mxima (em o C).
Temperatura Consumo
16 290
31 374
38 393
39 425
37 406
36 370
36 365
22 320
10 269

Verifique atravs do coeficiente de correlao se existe associao entre as variveis e plote os dados num grfico
de disperso.

10.2 Regresso Linear Simples


A anlise estatstica de um conjunto de dados pode ser realizada atravs de uma variedade de mtodos existentes.
A escolha do mtodo a ser utilizado deve estar de acordo com o tipo de informao disponvel e os objetivos que se deseja
alcanar. Considere as seguintes situaes:

Um estado implementa novas punies severas para motoristas bbados; Qual o efeito disso sobre sobre os
acidentes fatais nas estradas?
Uma diretoria regional de ensino reduz o tamanho de suas turmas do ensino fundamental; qual o efeito disso sobre
as pontuaes dos alunos nos exames nacionais?

Voc conclui com sucesso mais um ano de estudos da universidade; qual o efeito disso sobre seu salrio futuro?

O modelo de regresso linear relaciona uma varivel X, a outra Y . Como Y afetado por X, Y chamada de varivel
dependente e X de varivel independente. Exemplos de Y e X:
Y : consumo X: Renda;
Y : Salrio X: Anos de estudo;
Y : Vendas X: Gastos com propaganda.
O modelo usado com maior freqncia o linear, na forma:

Yi = + Xi + ei , i = 1, , n. (26)

onde:
i) Yi : varivel resposta (dependente) de interesse relativa ao indivduo i;
ii) Xi : varivel explicativa (independente);

iii) ei : erro aleatrio no observvel, aquilo que no possvel "prever"atravs do modelo;


iv) e coeficientes de inclinao e angular da reta, respectivamente. Esses parmetros so desconhecidos e precisam
ser estimados.

52
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Dentre os mtodos de estimao o mais utilizado na anlise de regresso o mtodo dos mnimos quadrados. Isto se deve
em grande parte a simplicidade computacional e matemtica do mesmo, e o que ainda mais importante, est presente
em praticamente todos os pacotes de programas estatsticos disponveis no mercado. Alm disso, o aspecto inferencial
amplamente desenvolvido e divulgado.
, Estimadores de mnimos quadrados para e :

= y x
(27)

P
yi xi n
yx
= P 2 (28)
xi nx2

Interpretao dos parmetros do modelo:


): o valor esperado para Y quando X = 0.
1) Intercepto (
representa o quanto varia a mdia de Y para cada aumento de uma unidade da varivel X.
2) Coeficiente angular ():

10.2.1 Coeficiente de Determinao - R2


O coeficiente de determinao R2 , tambm chamado de lucro relativo, representa o poder explicativo da regresso
e tem por objetivo avaliar a qualidade do ajuste. Seu valor fornece a proporo da variao total da varivel Y explicada
pela varivel X atravs da funo ajustada. Pode-se expressar R2 por:

)2
P
(xi x
R2 = 2 P (29)
(yi y)2

10.3 Exerccios
1. Considere os seguintes dados amostrais obtidos de um estudo da relao entre o nmero de anos que os candidatos
a certo emprego no exterior estudaram alemo no curso secundrio ou na faculdade, e as notas obtidas em um teste de
proficincia naquela lngua:

Indivduo 1 2 3 4 5 6 7 8 9 10
No de Anos (X) 3 4 4 2 5 3 4 5 3 2
Nota do teste (Y ) 57 78 72 58 89 63 73 84 75 48

a) Faa um grfico de disperso dos dados;


b) Estime os coeficientes de regresso do modelo e determine a equao da reta de mnimos quadrados que nos permita
predizer a nota do teste a partir do nmero de anos de estudo em alemo. Interprete os coeficientes do modelo;
c) Qual o lucro relativo (R2 ) que se tem usando o modelo de RLS?
d) Calcule o coeficiente de correlao entre as duas variveis e interprete;

2. Os dados abaixo referem-se ao resduo de cloro em uma piscina em vrios momentos, aps ter sido tratada com
produtos qumicos:

X 0 2 4 6 8 10 12
Y 2,2 1,2 1,5 1,4 1,1 1,1 0,9

onde X representa o No de horas que a piscina foi tratada e


Y representa: Resduos de cloro (partes por milho).
Para
P esses dados,
X = 42, X 2 = 364, Y = 9, 4, Y 2 = 13, 72 e XY = 47, 4.
P P P P
A leitura a zero horas foi feita imediatamente aps completado o tratamento qumico.
a) Ajuste uma reta de mnimos quadrados que nos permita predizer o resduo de cloro em termos do nmero de horas
aps a piscina ter sido tratada com produtos qumicos.
b) Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 5 horas aps ter sido tratada.

53
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

c) Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 8 horas aps ter sido tratada.
Por que razo sua resposta um tanto diferente das 1,1 partes por milho efetivamente observadas ao final de 8
horas?
d) Calcule o coeficiente de correlao entre as duas variveis e interprete;
e) Qual o lucro relativo (R2 ) que se tem usando o modelo de RLS?
3. Em uma certa localidade obtiveram-se os seguintes dados sobre a precipitao pluviomtrica anual (X) e a produo
de algodo em kilos por rea , Y para um perodo de 7 anos.

Ano 1 2 3 4 5 6 7
X 18 159 118 115 22 127 111
Y 520 190 208 213 310 194 160

a) Faa um grfico de disperso para os dados;


b) Determine a equao de mnimos quadrados que nos permita predizer a produo de algodo em kg por rea a partir
dos dados sobre precipitao pluviomtrica anual;
c) Qual o lucro relativo (R2 ) que se tem usando o modelo de RLS?
d) Qual seria a produo de algodo estimada se em um dado ano a precipitao pluviomtrica for 100?
e) Calcule o coeficiente de correlao entre as duas variveis e interprete;
4. Em dada regio de Bocaina - SP, acredita-se que o gado alimentado em determinado pasto tem um ganho de peso maior
que o usual. Estudos de laboratrio detectaram uma substncia no pasto e deseja-se verificar se ela pode ser utilizada
para melhorar o ganho de peso de bovinos. Foram escolhidos 15 bois de mesma raa e idade, e cada animal recebeu uma
determinada concentrao da substncia X (em mg/l). O ganho de peso aps 30 dias, denotado por Y , foi anotado e os
dados foram os seguintes:

X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
Y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 22,5 24,7 23,1

a) Estime a equao de regresso. Interprete os coeficientes do modelo;


b) Verifique se existe correlao entre concentrao da substncia e peso;
c) Para que o gado ganhasse 30 Kg de quanto deveria ser a concentrao da substncia?
5. Os dados amostrais a seguir representam a procura por um produto (em milhares de unidades) e seu preo (em centavos)
cobrado em 6 reas de mercado diferentes:

Preo(X) 18 10 14 11 16 13
Procura(Y) 9 125 57 90 22 79

a) Ajuste uma reta de mnimos quadrados com a qual possamos predizer a procura do produto em termos do seu preo;
b) Interprete os coeficientes do modelo;
c) Calcule o coeficiente de correlao entre as duas variveis e interprete;
6. Os dados a seguir mostram as despesas com propaganda (expressas em percentagem das despesas totais) e o lucro
lquido operacional (expresso em percentagem do total de vendas) em uma amostra de 6 drogarias:
a) Ajuste uma reta de mnimos quadrados que permita predizer o lucro operacional lquido em termos das despesas
com propaganda;
b) Interprete os coeficientes do modelo;
c) Calcule o coeficiente de correlao entre as duas variveis e interprete;
d) Calcule o coeficiente de determinao do modelo e interprete;

54
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Despesas com propaganda Lucro operacional lquido


1,5 3,6
1,0 2,8
2,8 5,4
0,4 1,9
1,3 2,9
2,0 4,3

7. Uma indstria submete seus operrios a um teste de aptido, e trs meses depois mede a produtividade desses operrios.
Os resultados obtidos de uma amostra de 6 operrios, esto na tabela abaixo.

aptido (X) 22 26 15 19 20 18
produtividade (Y ) 48 52 25 40 43 30

a) Determine a reta de regresso que se ajuste aos dados. Interprete os coeficientes obtidos;
b) Se um operrio tira 24 no teste de aptido, qual a sua produtividade esperada, depois de trs meses?

8. A tabela abaixo apresenta dados referentes a idade X e a presso sistlica Y para um grupo de 12 mulheres.

X 56 42 72 36 63 47 55 49 38 42 68 60
Y 147 125 160 118 149 128 150 145 115 140 152 155

a) Determine o coeficiente de correlao;


b) Determine a reta de regresso;
c) Estime a presso de uma mulher de 45 anos.

55
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica

Referncias
[1] ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
[2] BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
[3] BARBETTA, Pedro A.; REIS, Marcelo M. e BORNIA, Antonio C. Estatstica para cursos de Engenharia e inform-
tica. So Paulo: Editora Atlas S.A., 2004.
[4] CRESPO, A.A.; Estatstica Fcil. Editora: Saraiva.
[5] FONSECA, J.S.; MARTINS, G. de A. Curso de estatstica, 4a ed., Editora Atlas, SP., 2010.
[6] JAY L. DEVORE, Probabilidade e Estatstica para Engenharia e Cincias, Editora THOMSON, SP, 2006.

[7] JOHN E. FREUND, Estatstica Aplicada Economia, Administrao e Contabilidade, 11a ed., Editora Artmed Bo-
okman, SP., 2006.
[8] LIMA, A.C.Pedroso; MAGALHES, M.Nascimento. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
[9] MILONE, Giuseppe. Estatstica Geral e Aplicada. So Paulo: Pioneira Thomson Learning, 2004.

[10] MORETTIN, Luiz Gonzaga. Estatstica Bsica. 7a ed. Editora Makron Books. Vols. 1 e 2. 1999.
[11] NETO, P.L.O.Costa. Estatstica, 2a Edio, Editora Edgard Blcher Ltda. 2002.
[12] SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.

[13] STEVENSON, W.J. Estatstica aplicada administrao. Traduo de Alfredo Alves de Farias. Harbra, S.P., 1981.

56

Anda mungkin juga menyukai