2 Estatstica Descritiva 5
2.1 Classificao de variveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.2 Tipos de sries estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.2.1 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.3 Anlise de Variveis Qualitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.1 Distribuio de Frequncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3.2 Representao Grfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.3.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.4 Anlise de Variveis Quantitativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.4.1 Distribuio de Frequncias - Varivel Discreta. . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4.2 Representao Grfica - Varivel Discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.4.3 Distribuio de Frequncias - Varivel Contnua. . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4.4 Representao Grfica - Varivel Contnua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
3 Somatrio 20
5 Separatrizes 30
5.1 Quartis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5.2 Decis e Percentis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
5.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
6 Medidas de Disperso 32
6.1 Amplitude Total . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.2 Amplitude Interquartlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.3 Varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
6.4 Coeficiente de Variao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
6.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
2
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
1 Introduo
O surgimento da palavra Estatstica deriva da palavra latina statisticum collegium que significa conselho de Es-
tado. H indcios de que 3000 anos A.C. j se faziam censos na Babilnia, China e Egito e at mesmo o 4o livro do
Velho Testamento faz referncia a uma instruo dada a Moiss, para que fizesse um levantamento dos homens de Israel
que estivessem aptos para guerrear. Usualmente, estas informaes eram utilizadas para a taxao de impostos ou para
o alistamento militar. O Imperador Csar Augusto, por exemplo, ordenou que se fizesse o Censo de todo o Imprio Ro-
mano. Contudo, mesmo que a prtica de coletar dados sobre colheitas, composio da populao humana ou de animais,
impostos, etc., fosse conhecida pelos egpcios, hebreus, caldeus e gregos, e se atribuam a Aristteles cento e oitenta descri-
es de Estados, apenas no sculo XVII a Estatstica passou a ser considerada disciplina autnoma, tendo como objetivo
bsico descrio dos bens do Estado. A palavra Estatstica foi cunhada pelo acadmico alemo Gottfried Achenwall
(1719-1772), que foi um notvel continuador dos estudos de Hermann Conrig (1606- 1681). Gottfried determinou os ob-
jetivos da Estatstica e suas relaes com as demais cincias. Com a Escola Alem as tabelas tornaram-se mais completas,
surgiram as representaes grficas e o clculo das probabilidades, e a Estatstica deixou de ser simples catalogao de
dados numricos coletivos para se tornar o estudo de como chegar a concluses sobre o todo (populao), partindo da
observao de partes desse todo (amostras). Atualmente, os estudos estatsticos tm avanado rapidamente e, com seus
processos e tcnicas, tm contribudo para a organizao dos negcios e recursos do mundo moderno.
(Fonte: http://www.ifba.edu.br/dca/Corpo_Docente/MAT/ICCL/APOSTILA_DE_ESTAT_STICA.pdf)
mundo moderno.
A Estatstica uma cincia cujo campo de aplicao estende-se a diversas reas do conhecimento humano. Em
funo da facilidade que o uso dos computadores nos proporciona, muitos pesquisadores consideram-se aptos a fazerem
anlises e inferncias estatsticas sem um conhecimento mais aprofundado dos conceitos e teorias. Tal prtica, em geral,
resulta em interpretaes equivocadas e muitas vezes errneas.
No desenvolvimento cientfico e em nosso prprio dia-a-dia, estamos sempre fazendo observaes de fenmenos,
gerando dados. Quando as pessoas ouvem a palavra estatstica, imaginam logo taxas de acidente, ndices de mortali-
dade, litros por quilmetro etc. Os agrnomos esto frequentemente analisando o efeito de agrotxicos na agricultura,
os engenheiros analisam dados de propriedades de materiais e todos ns, ao lermos jornais e revistas, estamos vendo
resultados estatsticos provenientes do censo demogrfico, de pesquisas eleitorais etc.
Entende-se a Estatstica como um conjunto de tcnicas que permite, de forma sistemtica, organizar, descre-
ver, analisar e interpretar dados oriundos de estudos ou experimentos, realizados em qualquer rea do conhecimento.
Denomina-se por dados um (ou mais) conjunto de valores, numricos ou no.
As variveis so o foco principal da pesquisa em cincias. Uma varivel simplesmente algo que pode variar,
isto , pode assumir valores ou categorias diferentes. Alguns exemplos de variveis so gnero (sexo), velocidade de
digitao, nmero de sintomas registrados de uma doena, nvel de ansiedade, nmero de gols em uma partida de futebol,
cores favoritas etc. Estes so exemplos de itens que se pode medir e registrar e que variam de uma situao ou pessoa para
outra.
As anlises estatsticas dependem da forma como os dados so coletados e o planejamento estatstico da pesquisa
indica o esquema sob o qual os dados sero obtidos. Portanto, o planejamento da pesquisa e a anlise estatstica dos
dados esto intimamente ligados. Dessa forma, o pesquisador deve possuir um razovel conhecimento de estatstica para
desenvolver suas pesquisas ou, ento, consultar um estatstico para auxili-lo. Esta consulta deve ser feita antes do incio
da pesquisa, ainda durante a fase de elaborao do projeto. 1
3
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
4
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
2 Estatstica Descritiva
Os mtodos estatsticos envolvem a anlise e a interpretao de nmeros, tais como renda anual, vendas men-
sais, escores de testes, no de peas defeituosas etc. Tais nmeros so designados por dados. Para interpretar os dados
corretamente, em geral preciso primeiro organizar e sumarizar os nmeros. 3
2.1.1 Exerccios
1. O que voc entende por Estatstica?
2. Quais as ramificaes da Estatstica? Defina e explique as funes de cada uma.
3. Por que motivo devemos saber como classificar as variveis a serem estudadas?
4. De acordo com a estrutura numrica como podem ser classificadas as variveis? Explique cada uma.
5. Em um estudo estatstico a caracterstica de interesse pode ser qualitativa (nominal ou ordinal) ou quantitativa
(discreta ou contnua). Classifique as variveis nos exemplos que se seguem:
a) populao: moradores de certa cidade
varivel: cor dos olhos (pretos, castanhos, azuis, verdes)
b) populao: casais residentes em certa cidade
varivel 1: nmero de filhos
varivel 2: classe econmica
c) populao: candidatos ao vestibular
varivel 1: renda familiar
varivel 2: sexo (masculino, feminino)
varivel 3: nmero de pessoas na famlia
3 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
5
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Srie Geogrfica - aquela que apresenta como elemento varivel somente o local (fator geogrfico). Ex: Casos de
dengue nos municpios de Sinop, Rondonpolis e Cuiab no ano de 2002.
Elemento varivel: Local
Elementos Fixos: poca e Fenmeno
Tabela 2: Casos de dengue nos municpios de Sinop, Rondonpolis e Cuiab no ano de 2002.
Municpios No de casos
Cuiab 32
Rondonpolis 15
Sinop 9
Fonte: Dados fictcios.
Srie Especfica - aquela srie que apresenta como elemento ou carter varivel o fenmeno (ou espcie), perma-
necendo fixos a poca e o local. Ex: Os alunos de uma Faculdade, em determinado ano, classificados segundo o
tipo sanguneo.
Elemento varivel: Fenmeno
Elementos Fixos: Local e poca
Srie Mista - refere-se s sries que so combinaes de outros tipos de sries j estudadas.
Alguns exemplos de sries mistas sero apresentadas a seguir:
1. Srie Geogrfica - Temporal:
4 CRESPO, A.A.; Estatstica Fcil. Editora: Saraiva.
6
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 3: Classificao de alunos de uma Faculdade, em determinado ano, segundo o tipo sanguneo.
Tipo Sanguneo Nmero de alunos
A 96
B 149
AB 132
O 92
Fonte: Dados fictcios.
Tabela 4: Taxa de atividade feminina urbana (em percentual) em trs regies do Brasil. 1981/90.
Regio Ano
1981 1984 1986 1990
Norte 28,9 30,3 34,0 37,1
Nordeste 30,2 32,6 34,3 37,8
Sudeste 34,9 37,2 40,1 40,7
Fonte: Anurio Estatstico do Brasil - 1990
Tabela 5: Consumo em kg, de alguns tipos de alimentos per capita anual em algumas regies metropolitanas do Brasil
- 1988.
Cidades Alimento
Hortalias Carne Pescado
Belo Horizonte 44,5 21,6 1,3
Rio Janeiro 54,3 24,7 4,9
So Paulo 46,7 26,1 2,9
Fonte: Anurio Estatstico do Brasil - 1988
2.2.1 Exerccios
1. A sria Estatstica chamada de Histrica ou Temporal quando:
a) O elemento varivel o tempo. b) O elemento varivel o local. c) No tem elemento varivel.
2. Abaixo encontramos algumas tabelas. Calcule a porcentagem, faa um breve comentrio sobre os resultados e diga
que tipo de srie estatstica cada tabela pertence:
7
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
8
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 10: Distribuio de frequncias da Opinio dos alunos a respeito das salas de cinema na cidade.
Opinio Regular a boa Muito boa
frequncia(fi ) 32 18
frequncia relativa (f ri ) 0,64 0,36
frequncia percentual(f ri (%)) 64 36
Fonte: Tabela 9 - Notas de Aula.
Segundo Barbetta et al. (2004), as freqncias relativas em percentual so teis ao se comparar tabelas ou pesquisas
diferentes. Por exemplo, quando amostras (ou populaes) tm nmeros de elementos diferentes, a comparao atravs
das freqncias absolutas pode resultar em afirmaes errneas enquanto que pelas freqncias relativas em percentual
no, pois os percentuais totais so os mesmos.
Para efetuar uma anlise comparativa de vrias distribuies, podemos construir um grfico de barras mltiplo. A
figura a seguir um exemplo de grfico de barras mltiplo.
9
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Figura 2: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies preferenciais.
Quando os retngulos so colocados na posio vertical, temos os grficos de colunas. A finalidade desse tipo de
grfico a mesma dos grficos de barras, isto servem para comparar grandezas.
Figura 4: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies preferenciais.
10
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
O grfico de pizza (ou setores) um dispositivo grfico comumente usado para apresentar as distribuies de
frequncia relativa e de frequncia percentual para dados qualitativos.
Para desenhar um grfico de pizza primeiro desenha-se um crculo e ento usa-se as frequncias relativas para
subdividir o crculo em setores ou partes, que correspondem frequncia relativa para cada classe. Por exemplo, como o
crculo tem 360 graus e a categoria Regular a boa tem uma frequncia relativa de 0,64, o setor do grfico rotulado de
Regular a boa consiste em 0, 64 360 = 230.4 graus.
Grfico de linhas : Sua aplicao mais indicada para representaes de sries temporais sendo por tal razo,
conhecidos tambm como grficos de sries cronolgicas. Sua construo feita colocando-se no eixo vertical (y) a
mensurao da varivel em estudo e na abscissa (x), as unidades da varivel numa ordem crescente. Este tipo de grfico
permite representar sries longas, o que auxilia detectar suas flutuaes tanto quanto analisar tendncias. Tambm podem
ser representadas vrias sries em um mesmo grfico.
Figura 6: Nmero de matriculas no curso de engenharia civil da UEM no perodo de 1999 a 2005.
Fonte: Guedes, T.A; Acorsi, C.R.L; Martins, A.B; Janeiro, V. Projeto de Ensino - UEM.
11
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
2.3.3 Exerccios
1. Construa uma tabela para descrever o seguinte grfico:
Figura 7: Composio do rebanho bovino da fazenda capim branco, Araguari - MG - Brasil, 2005.
2. A equipe de nadadores de Cuiab apresentou-se no Campeonato Brasileiro de Natao de 1987 com 20 nadadores
do estilo borboleta, 30 de costa, 60 estilo craw e 50 estilo peito. Descreva esses dados em uma tabela. Que tipos de
grficos podem melhor representar esses dados. Trace 2 grficos entre todos possveis.
12
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
4. Para adequar os produtos s preferncias dos clientes, uma empresa fez uma pesquisa sobre os provedores e a
qualidade dos servios prestados utilizando uma amostra de 20 clientes, obtendo as seguintes variveis:
17 16 18 17 15 15 16 14 14 16 16 14 17 16 18
17 15 14 17 16 17 15 17 18 16 14 18 15 15 18
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
1. Dados Brutos - o conjunto dos dados numricos obtidos aps a coleta dos dados.
No exemplo:
Varivel de estudo: Tempo (em dias completos) de completo fechamento em cortes provenientes de uma
cirurgia;
Classificao: A varivel Tempo sozinha classificada como contnua, pois pode assumir qualquer valor
em um intervalo. Como no exemplo s interessa ao pesquisador coletar dias completos, a varivel deixa de
ser contnua e passa a ser discreta.
Dados Brutos:
17 - 16 - 18 - 17 - 15 - 15 - 16 - 14 - 14 - 16 - 16 - 14 - 17 - 16 - 18 - 17 - 15 - 14 - 17 - 16 - 17 - 15 - 17 - 18 -
16 - 14 - 18 - 15 - 15 - 18
13
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Como pode ser observado, os valores esto dispostos de forma desordenada. Em razo disso, pouca informa-
o se consegue obter inspecionando-se os dados anotados. Mesmo uma informao to simples como a de
saber os valores mnimos e mximo requer um certo exame dos dados coletados.
2. Rol - o arranjo dos dados brutos em uma determinada ordem crescente ou decrescente.
Ex: Utilizando os mesmos dados anteriores:
14 - 14 - 14 - 14 - 14 - 15 - 15 - 15 - 15 - 15 - 15 - 16 - 16 - 16 - 16 - 16 - 16 - 16 - 17 - 17 - 17 - 17 - 17 - 17 - 17 -
18 - 18 - 18 - 18 - 18
Apresenta vantagens concretas em relao aos dados brutos. Ele torna possvel visualizar, de forma bem ampla, as
variaes dos dados, uma vez que os valores extremos so percebidos de imediato. Mas, a anlise com este tipo de
disposio comea a se complicar quando o nmero de observaes tende a crescer.
3. Amplitude total (H) - a diferena entre o maior e o menor valor observado da varivel em estudo.
Ex: Utilizando os mesmos dados anteriores:
H = 18 - 14 = 4.
Interpretao: No exemplo, H = 4, representa a diferena entre o tempo de cicatrizao mais lento e o mais rpido,
ou seja, 4 dias. OBS: A amplitude total tambm usada como uma medida de variabilidade dos dados, quanto
maior a amplitude maior a variabilidade do conjunto.
4. Frequncia absoluta simples (fi ) - J apresentada anteriormente, conta o nmero de vezes que o elemento aparece
na amostra ou o nmero de elementos pertencentes a uma classe (ou categoria).
5. Frequncia Acumulada (Fi ) - ndica o nmero de itens de dados observados at aquele dado valor (ou classe). A
frequncia acumulada auxiliar no clculo da mediana e de separatrizes, medidas de posio (ou tendncia central)
que sero apresentadas na prxima seo.
Para condensarmos melhor os dados, aconselhvel a elaborao de distribuies de frequncia. Uma tabela com
distribuio de frequncia uma tabela onde se procura fazer um arranjo dos valores e suas respectivas frequncias, onde a
frequncia de determinado valor ser dado pelo nmero de observaes ou repeties de um valor ou de uma modalidade.
As tabelas de frequncias podem representar tanto valores individuais como valores agrupados em classes.
Tabela 12: Distribuio de frequncias referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Tempos(Xi ) 14 15 16 17 18 Total(n)
fi 5 6 7 7 5 30
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
A soma das frequncias absolutas simples (fi ) sempre igual ao nmero total de valores observados, ou seja, n =
Pk
i=1 i , onde k o nmero de valores distintos observados. No exemplo acima temos 5 valores diferentes observados,
f
consequentemente 5 fi0 s.
OBS: Este tipo de tabela no aconselhvel quando se trabalha com variveis que apresentam uma grande quan-
tidade de valores distintos (mesmo sendo dados discretos), uma vez que a tabela poder ficar muito extensa, dificultando,
alm de sua elaborao, as anlises e concluses dos dados pesquisados.
14
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Figura 8: Grfico de colunas referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Figura 9: Grfico de barras referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
Figura 10: Grfico de setores referente aos tempos de cicatrizao (em dias completos) de 30 cobaias.
15
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
16,3 15,2 12,3 13,7 14,1 11,1 12,2 11,7 12,5 13,9 12,3 14,4 13,6 12,7 12,6
13,5 12,7 12,3 13,5 15,4 11,3 11,7 12,6 13,4 15,2 13,2 13,0 16,9 15,8 14,7
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
7 6 8 7 5 5 6 4 4 6 6 4 7 6 8
7 5 4 7 6 7 5 7 8 6 4 8 5 5 8
Fonte: Dados fictcios.
24 - 23 - 22 - 28 - 35 - 21 - 23 - 33 - 34 - 24 - 21 - 25 - 36 - 26 - 22 -
30 - 32 - 25 -26 - 33 - 34 - 21 - 31 - 25 - 31 - 26 - 25 - 35 - 33 - 31
Fonte: Dados fictcios.
(A) Devido a grande diversidade de valores nas taxas de hemoglobina no sangue medidas em operrios da construo
civil a melhor forma de tabular os dados agrupando-os em classes. Para construo de tabelas de frequncias para
dados agrupados em classes os 4 conceitos listados a seguir, complementam os 5 primeiros j apresentados:
1. Definio do nmero de classes (k) - importante que a distribuio conte com um nmero adequado de
classes. Se esse nmero for escasso, os dados originais ficaro to comprimidos que pouca informao poder
ser extraida desta tabela. Se, por outro lado, forem utilizadas muitas classes, haver algumas com frequncia
nula ou muito pequena, apresentando uma distribuio irregular e prejudicial a interpretao do fenmeno.
Para determinar o nmero de classes h diversos mtodos. Milone (2004, p.36) apresenta os seguintes critrios
para a determinao do nmero de intervalos, denotado por k:
1. Raiz quadrada: k = n;
2. Regra de Sturges: k = 1 + 3, 3 log n;
3. Regra de Milone: k = 1 + 2 ln n;
Neste curso ser adotado o mtodo a seguir:
16
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
k = 5, para 20 n 25 e k = n, para n > 25;
Deve-se lembrar que sendo k o nmero de classes, o resultado obtido por cada um dos critrios deve ser
o nmero inteiro mais prximo ao obtido. Milone (2004) acrescenta ainda que, adotando o princpio de
que os agrupamentos devem ter no mnimo cinco e no mximo 20 classes, o critrio da raiz valido para
25 n 400, o do log para 16 n 572.237 e o do ln para 20 n 36.315.
Mesmo tendo outros critrios de determinao do nmero de classes, o que se deve ter em mente que a
escolha depender sobretudo da natureza dos dados e da unidade de medida em que eles se encontram, e no
somente de regras muitas vezes arbitrrias e pouco flexveis. Para facilitar a anlise conveniente que se
mantenham os intervalos de classe sempre constantes. A experincia do pesquisador tambm conta muito
na definio das classes.
No exemplo: k = 30 = 5, 48 = 5 classes;
2. Amplitude do Intervalo de Classe (h) - A amplitude de um intervalo de classe corresponde ao comprimento
desta classe. Numericamente, sua amplitude pode ser definida como a diferena existente entre os limites
superior (ou inferior) de duas classes consecutivas (h = ls li ).
H
h=
k
Ex: Utilizando os mesmos dados anteriores: h = 16,911,1 5 = 5, 8/5 = 1, 16
3. Limites de Classe - Os limites de classe so seus valores extremos. O smbolo ` indica a incluso do
limite inferior do intervalo naquela classe e smbolo a indica a incluso do limite superior do intervalo na-
quela classe. Neste curso adotaremos o smbolo ` na construo das classes, pois ele o mais usual. Para a
construo das classes temos:
li1 : Limite inferior da 1a classe; Usualmente o menor valor da amostra. No exemplo: 11,1.
ls1 : Limite superior da 1a classe; ls1 = li1 + h. No exemplo: 11,1 + 1,16 = 12,26.
li2 : Limite inferior da 2a classe; li2 = ls1 . No exemplo: 12,26.
ls2 : Limite superior da 2a classe; ls2 = li2 + h. No exemplo: 12,26 + 1,16 = 13,42.
Para a n-sima classe:
lin : Limite inferior da na classe; lin = ls(n1) . Ou seja, ser igual ao limite superior da classe imediatamente
anterior.
lsn : Limite superior da na classe; lsn = lin + h.
4. Pontos Mdios ou Centrais da Classe (P mi ) - a mdia aritmtica simples entre o limite superior e o inferior
de uma mesma classe.
Ex: Utilizando os mesmos dados anteriores: P m1 = (11,1 + 12,26)/2 = 11,68.
Para obter os pontos mdios das demais classes, basta acrescentar ao ponto mdio da classe precedente a
amplitude do intervalo de classe. No exemplo anterior: P m2 = h + P m1 = 1, 16 + 11, 68 = 12, 84, e assim
sucessivamente.
Tabela 13: Distribuio de frequncias referente as Taxas de hemoglobina no sangue (em gramas/ cm3 ) de 30 operrios
da construo civil.
Tx Hemoglobina P mi fi f ri f ri (%) Fi
11,10 ` 12,26 11,68 5 0,1667 16,67 5
12,26 ` 13,42 12,84 11 0,3667 36,67 16
13,42 ` 14,58 14,00 7 0,2333 23,33 23
14,58 ` 15,74 15,16 4 0,1333 13,33 27
15,74 ` 16,90 16,32 3 0,1000 10,00 30
Total - 30 1 100 -
Fonte: Lima, A.C.P; Magalhes, M.N. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
Na Tabela 26 temos que na 1a classe sero contados na amostra elementos a partir do 11,10 at o 12,25, na 2a classe
sero contados os elementos a partir do 12,26 at o 13,41 e assim por diante.
A representao grfica das distribuies de frequncias para dados em classes feita atravs do histograma e/ou
polgono de frequncias.
17
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
1. Histograma - um grfico formado por um conjunto de retngulos justapostos, de forma que a rea de cada
retngulo seja proporcional frequncia da classe que ele representa.
2. Polgonos de Frequncia - Unindo por linhas retas os pontos mdios das bases superiores dos retngulos do
histograma, obtm-se outra representao dos dados, denominada polgono de frequncia
Figura 11: Histograma e Polgono de frequncias referente as taxas de hemoglobina no sangue de 30 operrios da cons-
truo civil.
3. Apresentao Ramo-e-Folha - Apresenta a forma e ordem dos dados. Pode ser utilizado na organizao dos
dados antes de dispor na tabela.
Exemplo: Um dos principais indicadores da poluio do ar nas grandes cidades a concentrao de oznio na
atmosfera. O nvel de concentrao de oznio na atmosfera foi medido em So Paulo durante o inverno de 1998, e
os resultados so apresentados a seguir:
1 1 4 4 4 6 7
2 0 4 5 5 8
3 0 0 1 1 3 4 4 5 5 7 7 7 8 9
4 0 1 1 2 4 4 4 5 7 7 7 7
5 1 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9
6 0 0 0 1 2 2 2 5 6 6 6 6 7 8 8 8
7 4 5 6 6
8 1
9 4 4
10 9
Exerccio: A partir do ramo e folha acima, disponha os dados em uma tabela de frequncias.
(B) Agora iremos analisar a situao (B) descrita anteriormente onde a varivel de estudo era Notas dos alunos da 6a
srie na disciplina de portugus. Apesar dos valores apresentados serem inteiros, a varivel Nota pode assumir
qualquer valor em um intervalo, por exemplo: 6,5. Como no exerccio no foi especificado que o professor adotaria
apenas nmeros inteiros, esta varivel classificada como contnua.
PASSO 1 - Calcular a amplitude total (H): H = 8 - 4 = 4; (amplitude pequena)
18
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 15: Distribuio de frequncias referente as notas dos alunos da 6a srie na disciplina de portugus.
Notas(Xi ) 4 5 6 7 8 Total(n)
fi 5 6 7 7 5 30
f ri (%) 16,67 20,00 23,33 23,33 16,67 100
Fonte: Dados fictcios.
Figura 12: Grfico de setores referente as notas dos alunos da 6a srie na disciplina de portugus.
(C) Agora iremos analisar a situao (C) descrita anteriormente, varivel discreta com grande variedade de valores. A
varivel de estudo Idade (em anos completos) dos alunos da UFMT - 2010, como no exemplo j foi especificado
que as idades observadas seriam em anos completos, esta varivel s assume valores inteiros, por isso classificada
como discreta.
PASSO 1 - Rol das observaes:
Ex: Utilizando os mesmos dados anteriores:
21 - 21 - 21 - 22 - 22 - 23 - 23 - 24 - 25 - 25 - 25 - 25 - 26 - 26 - 26 - 28 - 30 - 31 - 31 - 31 -32 - 33 - 33 - 33 - 34 -
34 - 34 - 35 - 35 - 36
Tabela 16: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade(Xi ) 21 22 23 24 25 26 28 30 31 32 33 34 35 36 TOTAL(n)
fi 3 2 2 1 4 3 1 1 3 1 3 3 2 1 30
Fonte: Dados hipotticos.
Observando a Tabela 16, podemos perceber a grande diversidade de valores e a extenso da tabela. Por conta desta
tabela no resumir tanto as informaes iremos colocar estes dados em classes.
Na Tabela 17 temos que na 1a classe sero contados na amostra elementos a partir do 21 at o 23,99, na 2a classe
sero contados os elementos a partir do 24 at o 26,99 e assim por diante.
Representao Grfica:
19
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 17: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.
Figura 13: Histograma e Polgono de frequncias referente as idades dos alunos do curso de estatstica da UFMT 2010.
2.4.5 Exerccios
1. Em um estudo sobre o potencial de germinao de sementes de algodo dividiu-se uma rea em 48 parcelas com a
mesma rea, tipo de solo, iluminao, etc. Em cada uma destas parcelas foram plantadas 4 sementes e verificou-se
o nmero de sementes que germinaram. Os dados obtidos so apresentados a seguir:
2 0 0 4 3 0 0 1 0 0 1 1 0 0 0 1
2 1 1 1 1 1 1 0 0 0 3 0 0 0 0 0
0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0
3 Somatrio
Nas prximas sees sero vistos alguns coeficientes estatsticos que fazem uso do somatrio. Um somatrio um
operador matemtico que nos permite representar facilmente somas muito grandes ou at infinitas. representado com a
20
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Observaes:
n
X n
X n
X
xi yi 6= xi yi
i=1 i=1 i=1
n n
!2
X X
x2i 6= xi
i=1 i=1
Exemplos:
Seja X = {4, 7, 9, 12, 3}, obter:
X5 4
X X 5
xi = 35, 2xi = 64, 3xi = 93
i=1 i=1 i=2
3
X 3
X
Sabendo que xi = 6, x2i = 14, determinar
i=1 i=1
3
X 3
X 3
X
a) (xi + 1) = xi + 1=6+3=9
i=1 i=1 i=1
X3 X3 3
X 3
X 3
X
2
x2i x2i
b) (xi 1) = 2xi + 1 = 2 xi + 1 = 14 12 + 3 = 5.
i=1 i=1 i=1 i=1 i=1
21
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
4.1 Mdia
a medida de tendncia central mais comumente utilizada para descrever resumidamente uma distribuio de
frequncia (centro de massa de um conjunto dados).
Notao:
X chamada mdia amostral e
a mdia populacional.
Observaes:
A mdia afetada por valores extremos;
(a) Mdia Aritmtica Simples: dada pelo quociente entre a soma dos valores observados e a frequncia total (
o nmero total de observaes). Genericamente, podemos escrever:
n
=
X xi
X
i=1
n
Exemplo: Em uma pesquisa foram coletados os pesos de recm-nascidos (em kg): 2,7; 3,9; 4,1; 4,3; 5,4;
A mdia aritmtica ser dada por:
= 2, 7 + 3, 9 + 4, 1 + 4, 3 + 5, 4 = 4, 08
X
5
Exemplo:
= x1 f1 + x2 f2 + x3 f3 + x4 f4 + x5 f5
X
f1 + f2 + f3 + f4 + f5
= 26 3 + 28 10 + 30 12 + 32 5 + 37 19
X
49
X = 32, 26
Interpretao: A idade mdia dos pacientes renais observados foi de aproximadamente 32,26 anos.
22
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 20: Pesos dos alunos do curso de estatstica da UFMT, no ano de 2010.
Pesos(kg) Frequncia (fi ) P mi
59 ` 63 3 61
63 ` 67 5 65
67 ` 71 9 69
71 ` 75 12 73
75 ` 79 11 77
TOTAL 40 -
Fonte: Dados fictcios.
Interpretao: O peso mdio dos alunos do curso de estatstica 2010 da UFMT, foi de 71,3 Kg.
OBS: Perde-se um pouco de preciso na mdia quando estamos trabalhando com dados agrupados em classes.
a) multiplicando-se todos os valores de uma varivel por uma constante, a mdia do conjunto fica multiplicada por
essa constante;
a mdia da amostra.
Seja X = {x1 , x2 , x3 , , xn } uma amostra aleatria de tamanho n, c uma constante e X
7 SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.
23
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
MDIA fica
Se multiplicarmos ou dividirmos todos os valores de uma varivel X pela constante c, o valor de X
multiplicada ou dividida pela constante.
n
X
cxi
i=1
X =
n
n
X
xi
i=1
= c
n
=
cX
b) somando-se ou subtraindo-se uma constante a todos os valores de uma varivel, a mdia do conjunto fica acrescida
ou diminuda dessa constante.
a mdia da amostra.
Seja X = {x1 , x2 , x3 , , xn } uma amostra aleatria de tamanho n, c uma constante e X
Se somarmos ou subtrairmos todos os valores de uma varivel X pela constante c, o valor de X MDIA fica
multiplicada ou dividida pela constante.
n
X
(xi + c)
i=1
X =
n
n
X n
X
xi + c
i=1 i=1
=
n
n
X n
X
xi c
i=1 i=1
= +
n n
= + nc
X
n
= +c
X
4.1.2 Exerccios:
1. Sejam dados referentes a um levantamento onde observou-se o nmero de peas defeituosas em 25 mquinas de
uma empresa.
24
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 22: Dados ordenados, relativos ao tempo em segundos para carga de um aplicativo num sistema compartilhado (30
observaes).
6,94 7,27 7,46 7,97 8,03 8,37
8,56 8,66 8,88 8,95 9,30 9,33
9,55 9,76 9,80 9,82 9,98 9,99
10,14 10,19 10,42 10,44 10,66 10,88
10,88 11,16 11,80 11,88 12,25 12,34
Fonte: Dados fictcios.
X( n ) +X( n +1)
(b) n par: M d = 2
2
2
;
Exemplos:
(a) n mpar:X = {1, 3, 6, 7, 9}. M d = X( 5+1 ) = X(3) , logo a mediana ser dada pelo 3o elemento, M d = 6.
2
Interpretao da Mediana: Metade das observaes vo at 6 e a outra metade maior (ou igual) que 6.
X( 6 ) +X( 6 +1)
(b) n par:X = {1, 3, 6, 7, 9, 12}. M d = 2 2 2 , logo a mediana ser dada pela mdia entre o 3o elemento
X +X
e o 4o elemento, M d = (3) 2 (4) = 6+7 2 = 6, 5. Interpretao da Mediana: Metade das observaes vai at
6,5 e a outra metade maior (ou igual) que 6,5.
Tabela 23: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade(xi ) 21 22 23 24 25 26 28 30 31 32 33 34 35 36 Total
fi 3 2 2 1 4 3 1 1 3 1 3 3 2 1 30
Fi 3 5 7 8 12 15 16 17 20 21 24 27 29 30 -
Fonte: Dados fictcios.
Soluo:
X( 30 ) +X( 30 +1)
Como n = 30 (par), o elemento mediano ser dada por: Xmd = 2
2
2
;
X(15) +X(16)
Assim, a mediana ser dada pela mdia aritmtica entre o 15o e o 16o elemento, M d = 2 ;
8 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
25
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Se olharmos as frequncias acumuladas (Fi ) na Tabela 23 veremos que o 15o elemento se encontra na 6a
coluna e o 16o elemento na 7a coluna e as idades correspondentes a cada coluna so:
Interpretao: 50% dos alunos do curso de estatstica de 2010 tem idade igual ou superior a 27 anos;
onde,
l = limite inferior da classe mediana;
h = amplitude do intervalo da classe mediana;
n
2 = posio do elemento mediano;
Fant = frequncia acumulada at a classe anterior classe mediana;
fmd = frequncia absoluta simples da classe mediana.
Exemplo 1:
Tabela 24: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.
Exemplo 2:
Encontre a mediana utilizando os dados da tabela a seguir:
Pesos(kg) Frequncia
59 ` 63 3
63 ` 67 5
67 ` 71 9
71 ` 75 12
75 ` 79 11
TOTAL 40
Soluo 1: Somando-se as trs primeiras frequncias tm-se 3 + 5 + 9 = 17. Logo, para obtermos o 20o peso (n/2)
desejado, so necessrios mais 3 dos 12 casos existentes na 4a classe. Como o 4o intervalo de classe dado por 71 ` 75,
a mediana situa-se a 3/12 da distncia entre 71 e 75 e :
3
M d = 71 + (75 71) = 72.
12
Soluo 2: Utilizando o histograma tambm podemos encontrar a mediana:
26
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Em cada coluna do histograma temos as frequncias das respectivas classes, mais uma vez, somando-se as trs
primeiras frequncias tm-se 3 + 5 + 9 = 17. Logo, para obtermos o 20o peso (n/2) desejado, so necessrios mais 3 dos
12 casos existentes na 4a classe. Assim a mediana ser dada por:
M d 71 75 71
=
3 12
3(75 71)
M d 71 =
12
M d = 1 + 71 = 72.
27
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 25: Distribuio de frequncias da Opinio dos alunos a respeito das salas de cinema na cidade.
Opinio Regular a boa Muito boa
frequncia(fi ) 32 18
Fonte: Estatstica Bsica - Daniel Furtado.
Para dados agrupados a moda se localiza na classe de maior freqncia (classe modal) e obtida por meio da
expresso (Moda de Czuber): 9
1
Mo = l + h
1 + 2
l o limite inferior da classe modal;
h a amplitude da classe modal;
1 a diferena da freqncia da classe modal e a freqncia da classe imediatamente anterior;
2 a diferena da freqncia da classe modal e a freqncia da classe imediatamente posterior.
Exemplo: Utilizando a Tabela 26 temos:
Tabela 26: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.
95
M o = 33 + 3
(9 5) + (9 0)
Mo
= 33 + 0, 92
= 34.
Interpretao: A idade mais frequente entre os alunos do curso de estatstica 2010 34 anos.
28
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Moda
4.5 Simetria
A determinao das medidas de posio permite discutir sobre a simetria da distribuio dos dados.
Distribuio simtrica - X = Md = Mo
Distribuio assimtrica - ocorrem diferenas entre os valores da mdia, mediana e moda. A assimetria pode ser:
4.6 Exerccios
1. Para os exerccios (1) e (2) da seo 4.1.2, pginas 24 e 25, calcule:
a) As medidas de posio para os dados brutos, interprete os resultados obtidos;
b) As medidas de posio para os dados tabulados. Houve diferena nos resultados? Justifique.
c) Verifique se as distribuies dos dados so simtricas ou assimtricas ( direita ou esquerda).
2. Em um estudo sobre o potencial de germinao de sementes de algodo dividiu-se uma rea em 48 parcelas com a
mesma rea, tipo de solo, iluminao, etc. Em cada uma destas parcelas foram plantadas 4 sementes e verificou-se
o nmero de sementes que germinaram. Os dados obtidos so apresentados a seguir:
2 0 0 4 3 0 0 1 0 0 1 1 0 0 0 1
2 1 1 1 1 1 1 0 0 0 3 0 0 0 0 0
0 0 2 0 0 1 1 2 0 2 0 0 0 0 0 0
144 152 159 160 160 151 157 146 154 145
141 150 142 146 142 141 141 150 143 158
29
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
5 Separatrizes
So as medidas que separam o rol ou a distribuio de frequncias em partes iguais. Vimos que a mediana divide
a distribuio em duas partes iguais quanto ao nmero de elementos de cada parte. Agora vamos estudar outras medidas
que dividem a distribuio em partes iguais, so as chamadas separatrizes. So elas: 10
Quartis - Dividem a amostra em 4 partes iguais;
Decis - Dividem a amostra em 10 partes iguais;
Percentis - Dividem a amostra em 100 partes iguais;
5.1 Quartis
Os quartis dividem um conjunto de dados em quatro partes iguais. Assim:
A regra para obteno dos valores dos quartis, a partir da posio encontrada, ser dada por:
quando n impar, o arredondamento deve ser para cima da posio encontrada; e
quando n par , devemos fazer a mdia do valor encontrado e do subsequente.
Exemplo 1: para n mpar- X = {11, 12, 12, 14, 14, 17, 19}, vamos calcular o quartil 1 desse conjunto:
1. Fazer o Rol das observaes em ordem crescente;
2. Encontrar a posio do elemento:
in
EQi =
4
EQ1 = 17
4 = 1, 75o
= 2o elemento,
Q1 = 12. Interpretao: 25% das observaes so menores que 12 ou 75% das observaes so superiores ou
iguais a 12.
Exemplo 2: para n par - X = {11, 12, 12, 14, 14, 17, 19, 19}, vamos calcular o quartil 3 desse conjunto:
1. Fazer o Rol das observaes em ordem crescente;
2. Encontrar a posio do elemento:
in
EQi =
4
38
EQ3 = 4 = 6o . Entre o 6o e 7o elemento,
Q3 = 17+19
2 = 18. Interpretao: 75% das observaes so menores que 18 ou 25% das observaes so superiores
ou iguais a 18.
30
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
No exemplo, EQ1 = 149 4 = 12, 25o ; Como n mpar arredondaremos para o nmero acima da posio encon-
o
trada, logo ser o 13 elemento;
Olhando na Fi , o 13o elemento corresponde ao valor 28, ou seja, 25% dos pacientes renais observados tm at 28
anos.
Se o n fosse par, farimos a mdia aritmtica do elemento que antecede o EQi e o posterior.
, Exemplo 4:
Tabela 28: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi f ri f ri (%) Fi
21 ` 24 22,5 7 0,23 23 7
24 ` 27 25,5 8 0,27 27 15
27 ` 30 28,5 1 0,03 3 16
30 ` 33 31,5 5 0,17 17 21
33 ` 36 34,5 9 0,30 30 30
TOTAL - 30 1 100 -
Fonte: Dados hipotticos.
Para dados agrupados em classes, encontraremos os quartis de maneira semelhante usada para o clculo da
mediana:
EQi Fant
Qi = l + h
fqi
onde,
l = limite inferior da classe que contem o quartil desejado;
h = amplitude do intervalo de classe;
EQi = elemento quartlico;
Fant = frequncia acumulada da classe anterior classe quartlica;
fqi = frequncia absoluta simples da classe quartlica.
No exemplo das idades EQ1 = 130 4 = 7, 5o , como os dados esto em classes, olha-se o Fi mais prximo de
EQi , analisando a Tabela acima, temos que a 2a classe ser a classe quartlica pois na 1a classe observamos at 7
elementos e o que passar disso cai na classe seguinte, logo:
7, 5 7
Q1 = 24 + 3 = 24, 2.
8
Interpretao: 25% dos estudantes tem at 24,2 anos. O Q1 encontrado aqui diferente do quartil calculado para os
dados originais no tabulados, essa diferena se justifica pois nos dados em classes perdemos um pouco na preciso.
10 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
31
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Do mesmo modo, para determinar a ordem ou posio do Percentil a ser calculado, usaremos a seguinte expresso:
in
EDi = , i = 1, 2, 3, , 99;
100
Interpretao: 90% dos estudantes tem at 35 anos. O P90 encontrado aqui ser diferente do Percentil achado
usando os dados brutos, essa diferena se justifica pois nos dados em classes perdemos um pouco na preciso.
5.3 Exerccios
1. Para os exerccios (1) e (2) da seo 4.1.2, pginas 24 e 25, calcule Q1 , Q3 e P95 . Interprete os resultados.
2. Para os dados da Tabela 8 calcule Q3 e D8 . Interprete os resultados.
3. Considere os seguintes dados sobre a distribuio de valores de metabolismo basal (cal/dia) em 36 adolescentes:
910 1280 1220 1120 1040 1070 980 1310 1240 1140 1110 1020
1190 1090 1010 1380 1270 1280 1210 1110 1040 1460 1420 1270
960 1300 1240 1130 1070 1080 1000 1360 1260 1180 1200 1100
6 Medidas de Disperso
Uma breve reflexo sobre as medidas de tendncia central permite-nos concluir que elas no so suficientes para
caracterizar totalmente uma sequncia numrica. Se observarmos as sequncias:
X : 10, 1, 18, 20, 35, 3, 7, 15, 11, 10.
Y : 12, 13, 13, 14, 12, 14, 12, 14, 13, 13.
Z : 13, 13, 13, 13, 13, 13, 13, 13, 13, 13.
32
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
concluiremos que todas possuem a mesma mdia 13. No entanto so sequncias completamente distintas do ponto de
vista de variabilidade dos dados. Na sequncia Z no h variabilidade dos dados. Na sequncia Y , a mdia 13 representa
bem a srie, mas existem elementos da srie levemente diferenciados da mdia 13. Na sequncia X os elementos esto
bem diferenciados da mdia 13. As medidas de disperso sero usadas para avaliar a representatividade da mdia. 11
H = 36 21 = 15 anos,
6.3 Varincia
a medida de disperso mais usada e mais importante. Mede a concentrao dos dados em torno da mdia. dado
pela soma dos quadrados dos desvios dividido pelo nmero total de observaes. A notao S 2 usada para representar
a varincia amostral.
22,71.
Exemplo: Calcular a varincia do conjunto A = {10, 12, 13, 20, 25, 34, 45}, X=
Na Tabela 29 di chamadado de desvio, a soma do desvio nula. A soma dos desvios ao quadrado dividido por
n 1 resulta na varincia e a raz quadrada da varincia o desvio-padro.
13 e S 2 = 167, 9.
p
Logo, S = 1007, 4/6 =
2. Desvio-Padro (S): a raz quadrada da varincia. Deixa a medida de variabilidade na mesma unidade de medida
dos dados, diferente da varincia. Exemplo: Se calculamos a varincia das alturas de um conjunto de 10 crianas,
essa varincia ter como unidade de medida cm2 e o desvio padro cm, mesma unidade de medida das observaes
coletadas.
11 BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
33
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
3. Varincia de dados tabulados em distribuio de frequncias: Quando os valores vierem dispostos em uma tabela
de frequncias, o clculo da varincia se far atravs da seguinte frmula:
k 2 fi
X
2 Xi X
S = (3)
i=1
n1
Exemplo: Os dados a seguir referem-se as vendas de determinada empresa e produtividade de seus vendedores.
Tabela 30: Distribuio de frequncias referente s vendas de determinada empresa e produtividade de seus vendedores.
Vendas(x 1000 - R$)(xi ) No de vendedores(fi ) xi fi x2i fi
70 1 70 702 1
120 12 1440 1202 12
170 27 4590 1702 27
220 31 6820 2202 31
270 10 2700 2702 10
Total 81 15620 3187400
Fonte: Dados hipotticos.
34
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 31: Idade dos alunos do curso de estatstica da UFMT, no ano de 2010.
Idade P mi fi P mi fi P m2i fi
21 ` 24 22,5 7 157,5 22, 52 7
24 ` 27 25,5 8 204 25, 52 8
27 ` 30 28,5 1 28,5 28, 52 1
30 ` 33 31,5 5 157,5 31, 52 5
33 ` 36 34,5 9 310,5 34, 52 9
TOTAL - 30 858 25231,5
Fonte: Dados hipotticos.
Devemos ter em mente que o desvio-padro mede a variao entre valores. Assim:
Se os valores estiverem prximos uns dos outros, ento o desvio-padro ser pequeno, e consequentemente os dados
sero homogneos.
Se os valores estiverem distantes uns dos outros, ento o desvio-padro ser grande, e consequentemente os dados
sero heterogneos.
A desvantagem do uso da varincia perante o uso do desvio-padro que a unidade de medida utilizada igual ao
quadrado da unidade de medida dos dados. No entanto, por conta da maior facilidade do trato algbrico com funes
quadrticas, a varincia ser a medida de disperso mais utilizada quando tratarmos da inferncia estatstica.
X s
Estaturas 175 cm 5,0 cm
Pesos 68 kg 2,0 kg
Fonte: Dados hipotticos.
Temos:
5
CVE = 100 = 2, 85%
175
35
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
2
CVP = 100 = 2, 94%
68
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que as estaturas.
O Coeficiente de variao pode ser usado em um conjunto de dados para determinar a homogeneidade dos mesmos.
O grau de homogeneidade geralmente determinado pelo prprio pesquisador e depende de que tipo de estudo est sendo
feito. Nesse curso usaremos um grau de at 20% para os dados serem considerados homogneos.
6.5 Exerccios
Tabela 32: Informaes sobre sexo, idade (anos), altura (metro e centmetro), peso (kg), estado civil, nmero de irmos,
transporte, procedncia, relao do trabalho com o curso de Estatstica e meio de informao dos alunos da disciplina
Inferncia Estatstica do curso de Estatstica da UEM - 21/03/2005.
No Sexo Id Altura Peso Est.Civil No ir. Transp. Procedncia Trabalho Inform
1 F 20 1,60 58 Solteiro 1 Prprio Maring No Rel. TV
2 F 26 1,65 59 Solteiro 2 Coletivo Fora do Pr No trab. Revista
3 F 18 1,64 55 Solteiro 2 Prprio Maring No trab. TV
4 F 25 1,73 60 Solteiro 2 Coletivo Outro no Pr No Rel. TV
5 M 35 1,76 83 Casado 6 Coletivo Outro no Pr No Rel. TV
6 F 20 1,62 58 Solteiro 2 Coletivo Outro no Pr No Rel. Rdio
7 F 29 1,72 70 Solteiro 3 Coletivo Maring No trab. TV
8 M 23 1,71 62 Separado 2 Prprio Outro no Pr No Rel. Internet
9 F 20 1,63 63 Solteiro 2 Prprio Maring No trab. TV
10 M 20 1,79 75 Solteiro 2 Prprio Fora do Pr No trab. Internet
11 M 20 1,82 66 Solteiro 1 Prprio Fora do Pr No trab. TV
12 F 30 1,68 46 Solteiro 3 Prprio Outro no Pr Parc.Rel. TV
13 F 18 1,69 64 Solteiro 1 Prprio Maring Parc.Rel. TV
14 M 37 1,82 80 Casado 2 Prprio Maring No Rel. TV
15 M 25 1,83 62 Solteiro 1 Prprio Outro no Pr No Rel. TV
16 F 20 1,63 68 Solteiro 2 Coletivo Maring No trab. TV
17 M 21 1,71 80 Solteiro 2 Coletivo Maring No Rel. Internet
18 M 25 1,80 82 Casado 1 Prprio Outro no Pr No Rel. Internet
19 F 24 1,62 55 Solteiro 2 Prprio Maring No trab. Jornal
20 M 19 1,74 58 Solteiro 2 Prprio Maring Com.Rel. TV
21 F 21 1,55 65 Solteiro 1 Prprio Maring No trab. TV
22 M 22 1,73 62 Solteiro 0 Prprio Maring No trab. Jornal
36
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 34: Nmero de atendimentos em servio mdico por funcionrios de uma empresa.
No de Atendimentos 0 1 2 3 4 Total
fi 24 21 3 51 1 100
v)
c) Calcule o primeiro quartil, o quadragsimo centil e o nono decil para o conjunto de dados referente Altura
dos 140 alunos. (Interprete os resultados)
3. Os dados para este exemplo provm de uma jazida de carvo, localizada em Sapopema-PR, na qual foram obtidos
valores para as variveis espessura da camada de carvo, teor de cinzas, teor de enxofre e rendimento para a
obteno de um produto lavrado com 20% de cinzas. Como descrito por Cava (1985) e Landim et al. (1988), esse
depsito situa-se a cerca de 20km a noroeste da Figueira, no nordeste do Estado do Paran, em sedimentos da parte
superior do Membro Triunfo da Formao Rio Bonito.
a) Resuma os dados da varivel Teor de Cinzas em uma tabela de distribuio de freqncias;
b) Para a Tabela construida em (a), faa a representao grfica adequada;
c) Calcule as medidas de tendncia central e disperso para a varivel: Teor de Cinzas (Use os dados tabulados);
37
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
38
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Pn Pn Pn
x4i x3i x2i
m4 = i=1
4
x i=1
x2
+ 6 i=1
x4 ,
3 (15)
n n n
Havendo frequncias a considerar, as expresses equivalentes so as seguintes:
Pn Pn
x3 fi x2 fi
m3 = i=1 i 3 x i=1 i + 2 x3 , (16)
n n
Pn Pn Pn
x4i fi x3i fi x2i fi
m4 = i=1
4
x i=1
x2
+ 6 i=1
x4 ,
3 (17)
n n n
Vantagens: timos estimadores para parmetros populacionais, ex: mdia e varincia; Pode ser utilizado tambm
no clculo dos coeficientes de assimetria e curtose.
Desvantagens: pode ser um pouco trabalhoso ou complicado de calcular; s vezes podemos ter mais de um esti-
mador de momentos;
7.2 Assimetria
As medidas de assimetria procuram caracterizar como e quanto a distribuio de frequncias se afastam da condi-
o de simetria. A medida de assimetria um indicador da forma da distribuio dos dados. Ao construir uma distribuio
de freqncias e/ou um histograma, est-se buscando, tambm, identificar visualmente, a forma da distribuio dos dados
que ou no confirmada pelo coeficiente de assimetria de Pearson (A) definido como: 14
mo
x
A= . (18)
sx
Quando |A| < 0, 15, podemos considerar a distribuio como praticamente simtrica. Por outro lado, costuma-se consi-
derar a assimetria como moderada se 0, 15 < |A| < 1, e forte se |A| > 1.
O momento de terceira ordem tambm pode ser usado como medida de assimetria de uma distribuio. Entretanto
mais conveniente a utilizao de uma medida adimencional o que leva a definio do coeficiente de assimetria:
m3
a3 = . (19)
s3
Onde: a3 = 0 indica que a distribuio praticamente simtrica, a3 > 0 indica que a distribuio assimtrica po-
sitiva e a3 < 0 indica que a distribuio assimtrica negativa. Esse coeficiente indica o sentido da assimetria e, sendo
adimencional, pode ser usado para comparar diversos casos.
Uma distribuio classificada como:
Simtrica: se mdia = mediana = moda.
Assimtrica Negativa: se mdia mediana moda. O lado mais longo do polgono de freqncia (cauda da
distribuio) est esquerda do centro.
Assimtrica Positiva: se moda mediana mdia. O lado mais longo do polgono de freqncia est direita do
centro.
39
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
40
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
simtrica, se a3 > 0 simetria positiva e a3 < 0 assimetria negativa. Fazer a anlise de assimetria sempre comparando o
resultado do coeficiente obtido com o grfico (polgono, histograma ou box plot so os mais usuais).
7.3 Curtose
A medida de curtose o grau de achatamento da distribuio, um indicador da forma desta distribuio.
definido como: 15
Q3 Q1
k= . (20)
2(P90 P10 )
A curtose ou achatamento mais uma medida com a finalidade de complementar a caracterizao da disperso em uma
distribuio. Esta medida quantifica a concentrao ou disperso dos valores de um conjunto de dados em relao s
medidas de tendncia central em uma distribuio de freqncias.
Uma distribuio classificada quanto ao grau de achatamento como:
Leptocrtica: quando a distribuio apresenta uma curva de freqncia bastante fechada, com os dados fortemente
concentrados em torno de seu centro, K < 0,263.
Mesocrtica: quando os dados esto razoavelmente concentrados em torno de seu centro, K= 0,263
Platicrtica: quando a distribuio apresenta uma curva de freqncia mais aberta, com os dados fracamente con-
centrados em torno de seu centro, K > 0,263.
A caracterizao do achatamento de uma distribuio s tem sentido, em termos prticos, se a distribuio for
aproximadamente simtrica. Entre as possveis medidas de achatamento, tambm temos o coeficiente de curtose, obtido
pelo quociente do momento centrado de quarta ordem pelo quadrado da varincia, ou seja,
m4 m4
a4 = = 2. (21)
s4 m2
Este coeficiente adimencional, sendo menor que trs para as distribuies platicrticas, igual a trs para uma distribuio
mesocrtica e maior que trs para as distribuies leptocrticas.
15 SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.
41
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Resumo: Por curtose entende-se o aplainamento (afilamento ou achatamento) da curva caracterstica do conjunto
ou distribuio. O que a justifica a possibilidade de haver conjuntos e distribuies com idnticas medidas de posio,
de disperso e assimetria.
A curtose mede a divergncia entre a curva considerada e a convencionada como normalmente achatada (tambm se
diz que ela mede a concentrao dos dados em torno do seu centro). curva normalmente achatada d-se o nome de
mesocrtica; mais achatada que ela, platicrtica; menos achatada (ou mais afilada), leptocrtica.
18 18 19 20 20 20 20 20 20 21 21
22 23 24 25 25 25 26 29 30 35 37
3. Terceiro Quartil:
25+25
Q3 = X 3(n) = X 322 = X16,5 = 2 = 25;
4 4
4. Desvio interquartlico:
dq = Q3 Q1 = 25 20 = 5;
5. Limite inferior:
Li = Q1 1, 5dq
Li = 20 1, 5 5 = 12, 5;
6. Limite superior:
Ls = Q3 + 1, 5dq
Ls = 25 + 1, 5x5 = 32, 5;
Construir uma escala com valores (mesma amplitude) que incluam os valores mximo e mnimo dos dados. Construir
uma caixa (retangular) estendendo-se de Q1 a Q3 , e trace uma linha na caixa no valor da mediana.
As figuras a seguir mostraro passo a passo como fazer o box-plot:
42
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
43
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
No conjunto de dados no existe aluno com idade inferior a 12,5, ou seja, no h aluno com idade considerada
discrepante inferiormente, logo o limite inferior do grfico ser o menor valor da amostra (Xmin ). Entretanto, existem
dois indivduos cujas idades so superiores a 32,5, pontos estes considerados discrepantes neste conjunto de dados: as
idades 35 e 37. Estes pontos so identificados no diagrama de caixas por meio de um pontinho e o limite superio do
grfico ser o Ls calculado.
Note-se que no intervalo interquartlico (dentro do retngulo) existem 50% dos dados, dos quais, 25% esto entre a
linha da mediana e a linha do primeiro quartil e os outros 25% esto entre a linha da mediana e a linha do terceiro quartil.
Cada linha da cauda mais os valores discrepantes contm os 25% restantes da distribuio. A Figura 18 mostra que a
distribuio das idades dos alunos apresenta assimetria positiva, ou seja, dispersam-se para os valores maiores.
Tabela 36: Distribuio de frequncias da resistncia ferrugem de hbridos de milho, segundo as regies preferenciais.
Resistencia Regio Preferencial
ferrugem Chapec Campos Novos Iara Total
r 10 3 12 25
mr 6 12 2 20
ms 9 3 3 15
s 7 1 2 10
Total 32 19 19 70
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
Tabela 37: Distribuio das porcentagens da resistncia ferrugem de hbridos de milho, segundo as regies preferenci-
ais.
Resistencia Regio Preferencial
ferrugem Chapec Campos Novos Iara
r 31,2 15,8 63,2
mr 18,8 63,2 10,5
ms 28,1 15,8 15,8
s 21,9 5,2 10,5
Total 100 100 100
Fonte: Tabela 36.
17 ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
44
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Figura 19: Distribuio das porcentagens da resistncia a ferrugem de hbridos de milho para as regies
Exerccio Resolvido
Um estudo sobre o tempo de vida de duas amostras de Biomphalaria straminea (Amostra A: 45 indivduos agru-
pados numa bacia e Amostra I: 49 indivduos isolados em copos de vidro), produziu os resultados da Tabela 38 :
Tabela 38: Nmero de indivduos classificados segundo o tempo de vida, em dias, para duas condies de agrupamento.
Tempo de vida Condies de Agrupamento Total
(em dias) Agrupados Isolados
58 a 179 3 6 9
180 a 300 6 19 25
301 a 422 36 24 60
Total 45 49 94
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
a) Dos indivduos submetidos condio de Agrupados, qual a porcentagem de indivduos com tempo de vida entre
301 e 422?
b) Dos indivduos submetidos condio de Isolados, qual a porcentagem de indivduos com tempo de vida de no
mximo 300 dias?
c) Voc concluiria que o tempo de vida est relacionado com a condio de agrupamento? Justifique.
Respostas:
a) De um total de 45 indivduos submetidos condio de Agrupados, a porcentagem dos que apresentaram tempo de
vida entre 301 e 422 : 36/45 = 0,80 ou 0,80 100 = 80%.
b) Do total de 49 indivduos submetidos condio de Isolados, 25 (= 6 + 19) indivduos sobreviveram no mximo
300 dias. Este valor corresponde a (25/49)100 = 51,02%.
c) Sim, pois pode-se verificar que enquanto 80% dos indivduos submetidos condio de Agrupados sobreviveram
entre 301 e 422 dias, somente 48,98% (= 24/49)100 sobreviveram entre 301 e 422 dias na condio de Isolados.
45
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
de Chapec, podemos dividir a amostra em trs categorias: menor do que 1500kg/ha (rendimento baixo), maior ou igual
a 1500 e menor ou igual a 3000 (rendimento normal) e maior do que 3000 (rendimento alto). 18
Coeficiente de Contigncia de Pearson
Existem vrias medidas de associao e seu uso depende do tipo e finalidade do estudo. Neste curso usaremos
uma medida de associao comumente utilizada, que o Coeficiente de contingncia de Pearson. Podemos atravs desse
coeficiente, por exemplo, verificar a grandeza da associao entre condies de agrupamento (isolados ou agrupados) e
tempo de vida dos caramujos.
Karl Pearson props o chamado coeficiente de contigncia, representado pela letra C, definido por:
s
2
C= 2
, (22)
+n
onde f oij e f eij so as frequncias observadas e esperadas da i-sima linha e j-sima coluna, respectivamente; s e r
so o nmero de linhas e o nmero de colunas da tabela. No exemplo a seguir ser mostrado como obter as frequncias
esperadas f eij .
Este coeficiente nem sempre est entre zero e um, um fator de correo foi proposto para facilitar a interpretao:
C
C = p , (24)
t(t 1)
Tabela 39: Distribuio conjunta das variveis local da floresta e estao do ano.
Estao Local da Floresta Total
do ano rvores Arbustos Cho
Primavera 30(50,8%) 20(33,9%) 9(15,3%) 59(100%)
Outono 13(21,3%) 22(36,1%) 26(42,6%) 61(100%)
Total 43(35,8%) 42(35,0%) 35(29,2%) 120(100%)
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
de que os pssaros alimentam-se nestes trs locais da floresta nas mesmas propores na primavera e no outono. Em outras
palavras, o pesquisador formulou a hiptese de que no existe associao entre as duas variveis.
a) Voc concordaria com a hiptese formulada pelo pesquisador? Justifique utilizando porcentagens e o Coeficiente
de Contigncia de Pearson.
b) Faa um grfico de barras mltiplo para representar os dados da Tabela 39.
9.2 Exerccios
1. Na Tabela 40 esto apresentados resultados de um experimento no qual um pesquisador est procurando verificar se
existe associao entre hbito de crescimento (3 = indeterminado trepador e 4 = indeterminado prostado) e porte (Tr =
trepador, EB = ereto na base e Pr = prostado) na cultura de feijo de vagem.
a) Construa a tabela da distribuio de frequncia conjunta para as variveis hbito de crescimento e porte;
b) Faa um grfico de coluna mltipla para a distribuio de frequncia conjunta do item (a);
c) Para os dados da Tabela 40 podemos considerar que o hbito est associado com o porte? Se houver associao,
qual a grandeza da mesma?
46
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 40: Hbito de crescimento (H) e porte (P) para 50 materiais de feijo de vagem.
H P H P H P H P H P
4 Tr 4 Tr 4 Tr 4 Pr 4 Tr
4 EB 4 Tr 4 Tr 4 Tr 3 Pr
3 Pr 3 Pr 3 Tr 4 Pr 3 Pr
4 Tr 3 Pr 4 Tr 3 Pr 3 Pr
4 Tr 3 Pr 4 Tr 4 Tr 4 Tr
4 Tr 3 EB 4 Tr 3 Pr 4 Tr
3 Pr 4 EB 4 Tr 4 Pr 4 Tr
3 EB 4 EB 4 Tr 3 Pr 4 Tr
4 Tr 4 Tr 3 Pr 4 Tr 3 Pr
4 Tr 4 Tr 4 Tr 4 Tr 4 Tr
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
Tabela 41: Distribuio de frequncias conjunta de plantas segregando para dois caracteres numa prognie da espcie
X.
Ciclo Virescncia Total
Normal Virescente
Tardio 3470 910 4380
Precoce 1030 290 1320
Total 4500 1200 5700
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
2. Os dados da Tabela 41 tm por objetivo verificar se os caracteres ciclo (Tardio e Precoce) e Virescncia (Normal e
Virescente), de uma prognie da espcie X, segregam de forma independentemente.
a) Construa a tabela da distribuio de frequncia relativa percentual conjunta para as variveis Ciclo e Virescncia e
verifique se os dois pares de genes so herdados independentemente ou existe associao;
b) Faa um grfico de coluna mltipla para a distribuio de frequncia conjunta do item (a);
3. Um economista agrcola est estudando fatores que afetam a adoo de uma nova variedade de arroz altamente produ-
tiva. Os resultados esto na Tabela 42.
Tabela 42: Distribuio de frequncias conjunta referente a fatores que podem afetar a adoo de uma nova variedade de
arroz.
Posse Adoo Total
Adota No Adota
Proprietrio 102 26 128
Vrios arrendatrios 42 10 52
nico arrendatrio 5 2 7
Total 149 38 187
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
4. Foi conduzido um experimento com o objetivo de avaliar o poder germinativo de duas cultivares de cebola: Bola
Precoce - EMPASC 352 e Norte 14. Foram utilizadas para o teste de germinao quatro repeties de 100 sementes,
totalizando 400 sementes para cada cultivar. A varivel em estudo o nmero de sementes que germinaram. Os resultados
esto na tabela 43.
a) Faa um grfico mostrando o comportamento das cultivares com relao germinao das sementes. Interprete os
resultados.
18 ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
47
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 43: Distribuio de frequncias conjunta da Germinao de sementes de duas cultivares de cebola.
Cultivares Germinao Total
Germinaram No germinaram
Bola Precoce 392 8 400
Norte 14 381 19 400
Total 773 27 800
Fonte: ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
b) Verifique se existe associao entre entre as cultivares e a germinao de sementes. Justifique utilizando porcenta-
gens e o Coeficiente de Contigncia de Pearson.
5. Determinado posto de qualidade de um laticnio retira uma amostra dos pesos dos litros de leite produzidos em um dia,
classificando-os de acordo com seu tipo (B, C, UHT), e condies de peso (dentro ou fora das especificaes). A Tabela
46 mostra a distribuio de frequncias conjunta de 6.850 unidades de leite, disposta numa tabela de contingncia.
a) Faa um grfico mostrando o comportamento dos Tipos de leite com relao s Condies de Peso. Interprete os
resultados.
b) Verifique se existe associao entre os Tipos de leite e as Condies de Peso. Justifique utilizando porcentagens e o
Coeficiente de Contigncia de Pearson.
6. Uma metalrgica produz grandes quantidades de parafusos, trabalhando em trs turnos. O setor da qualidade deseja
verificar se o desempenho dos turnos semelhante, o que poderia ser avaliado atravs das propores de peas aprovadas,
direcionadas a retrabalho ou rejeitadas. Como parte do Controle Estatstico de Processos, amostras aleatrias de parafusos
so coletadas de cada turno. Uma dessas amostras, com a classificao das peas est mostrada na tabela a seguir:
a) Faa um grfico mostrando a Situao das peas com relao ao Turno. Interprete os resultados.
b) Verifique se existe associao entre a Situao das peas e o Turno. Justifique utilizando porcentagens e o Coefici-
ente de Contigncia de Pearson.
48
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 46: Nmeros de anos de servio e No de clientes de 10 agentes de uma companhia de seguros.
Agente Anos de servio (X) No de clientes (Y )
A 2 48
B 4 56
C 5 64
D 6 60
E 8 72
F 2 45
G 3 57
H 7 80
I 6 75
J 3 47
Na Figura 20 esto representados os pares (X, Y ) observados na Tabela 46. Atravs da observao da disposio
dos pontos, conclu-se que h uma dependncia entre as variveis, porque no conjunto medida que aumenta o tempo de
servio, aumenta o nmero de clientes. Temos ento uma correlao positiva.
49
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Exemplo 2 - Numa pesquisa com 10 famlias com renda bruta mensal entre 10 e 60 salrios mnimos, mediu-se:
Y: a % da renda bruta anual gasta com assistncia mdica. X: renda bruta mensal (expressa em no de salrios-mnimos).
Tabela 47: Dados referentes a renda bruta anual gasta com assistncia mdica e No de salrios mnimos por famlia.
Famlia X Y
A 12 7,2
B 16 7,4
C 18 7,0
D 20 6,5
E 28 6,6
F 30 6,7
G 40 6,0
H 48 5,6
I 50 6,0
J 54 5,5
Figura 21: Grfico de disperso da Renda bruta anual e gasto com assistncia mdica.
Observando a Figura 21, nota-se que existe uma dependncia inversa, ou seja, uma correlao negativa, aumen-
tando a renda bruta, diminui a porcentagem da mesma, gasta em assistncia mdica.
Exemplo 3 - Oito indivduos foram submetidos a um teste sobre conhecimento de lngua estrangeira e, em seguida,
mediu-se o tempo gasto por cada um para aprender operar uma determinada mquina. Assim,
X: resultado obtido no teste (mximo 100 pontos)
Y : tempo em minutos necessrio para aprender operar satisfatoriamente a mquina.
Do diagrama de disperso, Figura 22, conclui-se que parece no haver nenhum tipo de dependncia entre as duas
variveis, pois conhecer o resultado do teste no ajuda prever o tempo gasto para aprender a operar a mquina.
onde r = 1 indica uma relao linear negativa perfeita, r = 1 indica uma relao linear positiva perfeita e r = 0 indica
que no h relao linear entre as variveis. Pode haver outro tipo de relao entre X e Y .
50
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 48: Dados referentes ao resultado de um teste sobre conhecimento em lngua estrangeira e tempo gasto para
aprender a operar uma determinada mquina.
Indivduos X Y
A 45 343
B 52 368
C 61 355
D 70 334
E 74 337
F 76 381
G 80 345
H 90 375
Figura 22: Grfico de disperso do resultado obtido no teste e tempo em minutos necessrio para aprender operar satisfa-
toriamente a mquina.
51
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Tabela 49: Dados referentes a consumo de cerveja em um dia (em 100 litros) e temperatura mxima (em o C).
Temperatura Consumo
16 290
31 374
38 393
39 425
37 406
36 370
36 365
22 320
10 269
Verifique atravs do coeficiente de correlao se existe associao entre as variveis e plote os dados num grfico
de disperso.
Um estado implementa novas punies severas para motoristas bbados; Qual o efeito disso sobre sobre os
acidentes fatais nas estradas?
Uma diretoria regional de ensino reduz o tamanho de suas turmas do ensino fundamental; qual o efeito disso sobre
as pontuaes dos alunos nos exames nacionais?
Voc conclui com sucesso mais um ano de estudos da universidade; qual o efeito disso sobre seu salrio futuro?
O modelo de regresso linear relaciona uma varivel X, a outra Y . Como Y afetado por X, Y chamada de varivel
dependente e X de varivel independente. Exemplos de Y e X:
Y : consumo X: Renda;
Y : Salrio X: Anos de estudo;
Y : Vendas X: Gastos com propaganda.
O modelo usado com maior freqncia o linear, na forma:
Yi = + Xi + ei , i = 1, , n. (26)
onde:
i) Yi : varivel resposta (dependente) de interesse relativa ao indivduo i;
ii) Xi : varivel explicativa (independente);
52
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Dentre os mtodos de estimao o mais utilizado na anlise de regresso o mtodo dos mnimos quadrados. Isto se deve
em grande parte a simplicidade computacional e matemtica do mesmo, e o que ainda mais importante, est presente
em praticamente todos os pacotes de programas estatsticos disponveis no mercado. Alm disso, o aspecto inferencial
amplamente desenvolvido e divulgado.
, Estimadores de mnimos quadrados para e :
= y x
(27)
P
yi xi n
yx
= P 2 (28)
xi nx2
)2
P
(xi x
R2 = 2 P (29)
(yi y)2
10.3 Exerccios
1. Considere os seguintes dados amostrais obtidos de um estudo da relao entre o nmero de anos que os candidatos
a certo emprego no exterior estudaram alemo no curso secundrio ou na faculdade, e as notas obtidas em um teste de
proficincia naquela lngua:
Indivduo 1 2 3 4 5 6 7 8 9 10
No de Anos (X) 3 4 4 2 5 3 4 5 3 2
Nota do teste (Y ) 57 78 72 58 89 63 73 84 75 48
2. Os dados abaixo referem-se ao resduo de cloro em uma piscina em vrios momentos, aps ter sido tratada com
produtos qumicos:
X 0 2 4 6 8 10 12
Y 2,2 1,2 1,5 1,4 1,1 1,1 0,9
53
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
c) Com a equao da reta de mnimos quadrados, estime o resduo de cloro na piscina 8 horas aps ter sido tratada.
Por que razo sua resposta um tanto diferente das 1,1 partes por milho efetivamente observadas ao final de 8
horas?
d) Calcule o coeficiente de correlao entre as duas variveis e interprete;
e) Qual o lucro relativo (R2 ) que se tem usando o modelo de RLS?
3. Em uma certa localidade obtiveram-se os seguintes dados sobre a precipitao pluviomtrica anual (X) e a produo
de algodo em kilos por rea , Y para um perodo de 7 anos.
Ano 1 2 3 4 5 6 7
X 18 159 118 115 22 127 111
Y 520 190 208 213 310 194 160
X 0,2 0,5 0,6 0,7 1,0 1,5 2,0 2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0
Y 9,4 11,4 12,3 10,2 11,9 13,6 14,2 16,2 16,2 17,7 18,8 19,9 22,5 24,7 23,1
Preo(X) 18 10 14 11 16 13
Procura(Y) 9 125 57 90 22 79
a) Ajuste uma reta de mnimos quadrados com a qual possamos predizer a procura do produto em termos do seu preo;
b) Interprete os coeficientes do modelo;
c) Calcule o coeficiente de correlao entre as duas variveis e interprete;
6. Os dados a seguir mostram as despesas com propaganda (expressas em percentagem das despesas totais) e o lucro
lquido operacional (expresso em percentagem do total de vendas) em uma amostra de 6 drogarias:
a) Ajuste uma reta de mnimos quadrados que permita predizer o lucro operacional lquido em termos das despesas
com propaganda;
b) Interprete os coeficientes do modelo;
c) Calcule o coeficiente de correlao entre as duas variveis e interprete;
d) Calcule o coeficiente de determinao do modelo e interprete;
54
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
7. Uma indstria submete seus operrios a um teste de aptido, e trs meses depois mede a produtividade desses operrios.
Os resultados obtidos de uma amostra de 6 operrios, esto na tabela abaixo.
aptido (X) 22 26 15 19 20 18
produtividade (Y ) 48 52 25 40 43 30
a) Determine a reta de regresso que se ajuste aos dados. Interprete os coeficientes obtidos;
b) Se um operrio tira 24 no teste de aptido, qual a sua produtividade esperada, depois de trs meses?
8. A tabela abaixo apresenta dados referentes a idade X e a presso sistlica Y para um grupo de 12 mulheres.
X 56 42 72 36 63 47 55 49 38 42 68 60
Y 147 125 160 118 149 128 150 145 115 140 152 155
55
Universidade Federal de Mato Grosso
Notas de Aula - Disciplina: Estatstica I
Profa Eveliny - 2016 - Curso: Estatstica
Referncias
[1] ANDRANDE, Dalton; OGLIARI, Paulo. Estatstica para Cincias Agrrias e Biolgicas, Editora UFSC. 2007.
[2] BUSSAB, W.O.; MORETTIN, P.A. Estatstica Bsica. 4a ed., Atual Editora, S.P., 2010.
[3] BARBETTA, Pedro A.; REIS, Marcelo M. e BORNIA, Antonio C. Estatstica para cursos de Engenharia e inform-
tica. So Paulo: Editora Atlas S.A., 2004.
[4] CRESPO, A.A.; Estatstica Fcil. Editora: Saraiva.
[5] FONSECA, J.S.; MARTINS, G. de A. Curso de estatstica, 4a ed., Editora Atlas, SP., 2010.
[6] JAY L. DEVORE, Probabilidade e Estatstica para Engenharia e Cincias, Editora THOMSON, SP, 2006.
[7] JOHN E. FREUND, Estatstica Aplicada Economia, Administrao e Contabilidade, 11a ed., Editora Artmed Bo-
okman, SP., 2006.
[8] LIMA, A.C.Pedroso; MAGALHES, M.Nascimento. Noes de Probabilidade e Estatstica. Editora Edusp. 2004.
[9] MILONE, Giuseppe. Estatstica Geral e Aplicada. So Paulo: Pioneira Thomson Learning, 2004.
[10] MORETTIN, Luiz Gonzaga. Estatstica Bsica. 7a ed. Editora Makron Books. Vols. 1 e 2. 1999.
[11] NETO, P.L.O.Costa. Estatstica, 2a Edio, Editora Edgard Blcher Ltda. 2002.
[12] SPIEGEL, Murray R. Estatstica, 3a Edio. Editora Pearson. 1993.
[13] STEVENSON, W.J. Estatstica aplicada administrao. Traduo de Alfredo Alves de Farias. Harbra, S.P., 1981.
56