LIO 13,14,15 Estatstica Somatrios Medidas de tendncia central Mdia, Moda e Mediana
SOMATRIO
11-07-2012
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10
2 2 2 2 2 2 2 2 2
Existe uma forma abreviada de representar esta soma recorrendo a um smbolo, que o de somatrio .Ento podemos transformar a soma acima em
10
K
K =1
10
11-07-2012
K2
K =1
Isto l-se : somatrio de k=1 at 10, de K . A letra k diz-se o ndice da soma e pode ser substituda por outras, tal como i, j, l, m, n, p .
EXEMPLOS:
Medidas de localizao
Mdia Aritmtica Moda e Classe Modal Mediana e Classe Mediana Quartis
11-07-2012 5
Medidas de Posio - So estatsticas que representam uma srie de dados orientando-nos quanto posio da distribuio em relao ao eixo horizontal (eixo das abscissas).
11-07-2012 Formadora : Ana Colao Formadora : Ana Colao
As medidas de posio mais importantes so as medidas de tendncia central, que recebem tal denominao pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendncia central, destacamos: a. a mdia aritmtica; b. a mediana; c. a moda. As outras medidas de posio do as separatrizes, que englobam: a. a prpria mediana; b. os quartis; c. os percentis. 6
Mdia Aritmtica ( X ) - o quociente da diviso da soma dos valores da varivel pelo nmero deles: ( dados no agrupados)
11-07-2012
Sendo:
Exemplo: Sabendo-se que a produo leiteira da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produo mdia da semana:
X = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14
Observao:
11-07-2012 Formadora : Ana Colao Formadora : Ana Colao
Quando o nmero que representativo da mdia no est representado nos dados originais, costumamos dizer que a mdia no tem existncia concreta.
MDIA ARITMTICA
Dados Agrupados: Sem intervalo de classes
11-07-2012
Idade (xi) 0 1 2 3 4
fi 2 6 10 12 4 = 34
fi.xi 0 6 20 36 16 fi.xi = 78
Frmula: X = fi x i fi X = 2,29
9
MDIA ARITMTICA
Dados Agrupados: Com intervalo de classes
11-07-2012
Estaturas (cm) 150 154 154 158 158 162 162 166 166 170 170 174
fi
xi
fi.xi
1 2 3 4 5 6
4 9 11 8 5 3 = 40
Frmula: X = x i fi fi
X = 161
10
Moda (Mo) - Denominamos Moda o valor que ocorre com maior frequncia numa srie de valores. Dados no-agrupados Quando lidamos com valores no-agrupados, a moda facilmente reconhecida: Exemplos: 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 A moda 10
Formadora : Ana Colao Formadora : Ana Colao 11-07-2012
2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9 temos duas modas: 4 e 7 (bimodal) Dados agrupados: Sem intervalo de classes Uma vez agrupados os dados, possvel determinar imediatamente a moda basta fixar o valor da varivel de maior frequncia.
11
MODA - Dados agrupados: Com intervalos de classe A classe com maior frequncia denominada classe modal. Pela definio, podemos afirmar que a moda, neste caso, o valor dominante que est compreendido entre os limites da classe modal. O mtodo mais simples para o clculo da moda consiste em tomar o ponto mdio da classe modal. Damos a esse valor a denominao de moda bruta. Mo = l* + L* 2
11-07-2012
Onde: l* - Limite inferior da classe modal L*- Limite superior da classe modal
12
i
1 2 3 4 5 6
Estaturas (cm) 150 154 154 158 158 162 162 166 166 170 170 174
fi 4 9 11 8 5 3 = 40
Classe modal
13
Mediana (Md) - A mediana outra medida de posio definida como o nmero que se encontra no centro de uma srie de nmeros, estando estes dispostos segundo uma ordem.
11-07-2012
Dados no-agrupados Dada a srie de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9. De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao (crescente ou decrescente) dos valores: 2, 5, 6, 9, 10, 13, 15, 16, 18
Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de elementos direita e esquerda. No nosso exemplo, esse valor o 10, j que, nesta 14 srie, h quatro elementos acima dele e quatro abaixo.
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por definio, qualquer dos nmeros compreendidos entre os dois valores centrais da srie. Convencionou-se utilizar o ponto mdio. Assim, a srie de valores: 2, 6, 7, 10, 12, 13, 18, 21 tem para mediana a mdia aritmtica entre 10 e 12. Logo: Md = 10 + 12 = 11 2
15
EM ALTERNATIVA FAZEMOS :
Calculamos a tabela de frequncias absolutas e relativas acumuladas, e onde aparecer na coluna da frequncia um valor 50% a mediana.
11-07-2012 Formadora : Ana Colao Formadora : Ana Colao
Alunos 0 1 2 3 4
fi 2 6 10 12 4 ? 34
Fi 2 8 18 30 34
fr Fr 5,88% 5,88% 17,65% 23,53% 29,41% 52,94% 35,29% 88,24% 11,76% 100,00% 100,00%
17
fi - F(ant) x h* Md = l* + 2 f* Sendo: l* - limite inferior da classe mediana; F(ant) frequncia acumulada da classe anterior classe mediana; f* - frequncia simples da classe mediana h* - amplitude do intervalo da classe mediana
18
Mediana (Md) - Dados agrupados com intervalo de classes i Estaturas (cm) 150 154 154 158 158 162 162 166 166 170 170 174 fi xi Fii
11-07-2012
1 2 3 4 5 6
A menor freqncia acumulada que supera esse valor 24. Logo a 3 Classe ser a Classe Mediana
Md = 160,55
19
40 - 13 x 4 Md = 158 + 2 11
Medidas Separatrizes - So nmeros que dividem a seqncia ordenada de dados em partes que contm a mesma quantidade de elementos da srie. Desta forma, a mediana que divide a seqncia ordenada em dois grupos, cada um deles contendo 50% dos valores da seqncia, tambm uma medida separatriz. Alm da mediana, as outras medidas separatrizes que destacaremos so: quartis, quintis, decis e percentis.
Formadora : Ana Colao Formadora : Ana Colao
20
11-07-2012
QUARTIS
11-07-2012
Se dividirmos a srie ordenada em quatro partes, cada uma ficar com seus 25% de seus elementos. Os elementos que separam estes grupos so chamados de quartis. Assim, o primeiro quartil, que indicaremos por Q1, separa a sequncia ordenada deixando 25% de seus valores esquerda e 75% de seus valores direita. O segundo quartil, que indicaremos por Q2, separa a sequncia ordenada deixando 50% de seus valores esquerda e 50% de seus valores direita. Note que o Q2 a Mediana da srie. O terceiro quartil Q3 obedece a mesma regra dos anteriores.
21
Dados no-agrupados - Exemplos Dada a srie de valores, Calcule Q1 1, 2, 5, 5, 5, 8, 10, 11, 12, 12, 13, 15. Resoluo :
11-07-2012 Formadora : Ana Colao Formadora : Ana Colao
Este valor indica a posio do Q1 no Rol, isto , o terceiro elemento da lista. Observando o terceiro elemento obtm-se 5. Portanto Q1 = 5. Interpretao: 25% dos valores desta sequncia so valores menores que 5 e 75% dos valores desta sequncia so valores maiores que 5.
22
23
11-07-2012
Dados agrupados sem intervalos de classe Para os quartis temos sempre que achar a frequncia relativa acumulada
11-07-2012
24
25
FIM
26
EXERCCIOS :
27
Medidas de Disperso Caso venhamos fazer uma reflexo sobre as medidas de tendncia central, observaremos que elas no so suficientes para caracterizar totalmente uma sequncia numrica. Desta forma, foi introduzido as medidas de disperso, com intuito de verificar como se comportam essas medidas de tendncia central em relao disperso. As principais medidas de disperso absolutas so: A Varincia e o Desvio Padro.
11-07-2012 Formadora : Ana Colao Formadora : Ana Colao
Varincia uma mdia aritmtica calculada a partir dos quadrados dos desvios obtidos entre os elementos da srie e sua mdia. Notao: Quando a sequncia de dados representa uma Populao a varincia ser denotada por 2(x), e quando se tratar de uma amostra ser denotada por s2(x).
28
Varincia - Dados no-agrupados Se a sequncia representa uma populao, a varincia ser calculada atravs da seguinte frmula:
11-07-2012
2 = ( xi x )2 n
Se a seqncia representa uma populao, a varincia ser calculada atravs da seguinte frmula: 2 = ( xi x )2 fi fi
29
Varincia - Dados agrupados com intervalo de classes Se a sequncia representa uma populao, a varincia ser calculada atravs da seguinte frmula:
11-07-2012
Desvio Padro a raiz quadrada positiva da varincia. Notao: Quando a seqncia de dados representa uma Populao o desvio padro ser denotada por (x), e quando se tratar de uma amostra ser denotado por s(x). Assim, independente de como se apresentarem os dados (agrupados ou no) a frmula do desvio padro ser: = 2
30
Interpretao do desvio padro O desvio padro sem dvida a mais importante das medidas de disperso. fundamental que o interessado consiga relacionar o valor obtido do desvio padro com os dados da srie.
11-07-2012
Quando uma curva de frequncia representativa da srie perfeitamente simtrica como a curva a seguir, podemos afirmar que o intervalo [ x - . x + ] contm aproximadamente 68% dos valores da srie.
Assim como, quando tivermos o intervalo [ x - 2. x + 2] ir conter aproximadamente 95% dos valores da srie. E o intervalo [ x - 3. x + 3] ir conter aproximadamente 99% dos valores da srie. Como podemos ver no grfico a seguir
31
32 www.anvisa.gov.br
Medidas de Disperso Relativa Se uma srie X apresenta x = 10 e (x) = 2 e uma srie Y apresenta y = 100 e (y) = 5 do ponto de vista da disperso absoluta, a srie Y apresenta maior disperso que a srie X. No entanto, se levarmos em considerao as medidas das sries, o desvio padro de Y que 5 em relao a 100 um valor menos significativo que o desvio padro de X que 2 em relao a 10. Isto nos leva a definir as medidas de disperso relativas: coeficiente de variao, o qual ser apresentado atravs da frmula:
Formadora : Ana Colao Formadora : Ana Colao
11-07-2012
CV = (x) x Note que o coeficiente de variao, como uma diviso de elementos de mesma unidade, um nmero puro. Portanto, pode ser expresso em percentual.
33
EXERCCIOS :
34
1- Um produto vendido em trs supermercados por 13,00/kg, 13,20/kg e 13,50/kg. Determine quantos /kg se paga em mdia pelo produto. 2- Uma loja vende cinco produtos bsicos A, B, C, D, E. O lucro por unidade comercializada destes produtos vale respectivamente 200,00, 300,00, 500,00, 1.000,00, 5.000,00. A loja vendeu em determinado ms 20, 30, 20, 10, 5 unidades respectivamente. Qual foi lucro mdio por unidade comercializada por esta loja? 3- Um camio cujo peso vazio 3.000,00 kg ser carregado com 480 caixas de 10 kg cada, 350 caixas de 8 kg cada, 500 caixas de 4 kg cada, 800 caixas de 5 kg cada. O motorista do camio pesa 80 kg e a lona de cobertura pesa 50 kg. (a) Se este camio tem que passar por uma balana For que s permite passagens a camies com peso de 15 toneladas, este mad camio passar pela balana? (b) Qual o peso mdio das ora : caixas Ana carregadas no camio? Cola
o
35
11-07-2012
Idades 17 18 19 20 21
fi
11-07-2012 36
3 18 17 8 4 = 50
Acidentes 0 1 2 3 4
6- O salrio de 40 funcionrios de um escritrio est distribudo segundo o quadro ao lado. Calcule o salrio mdio destes funcionrios.
i
1 2 3 4 5 6
Salrios () 400 500 500 600 600 700 700 800 800 900 900 1000
fi
11-07-2012 37
i
1 2 3 4 5
Aluguer () 0 200 200 400 400 600 600 800 800 1000
fi 30 52 28 7 3 = 120
12 15 8 3 1 1
= 40 7- Uma imobiliria tem o aluguer de residncias particulares, seguindo o For quadro ao lado. Calcule o aluguer mad mdio para estas residncias ora :
Ana Cola o
Exerccios: Moda
a) b) c) d) e)
38
Idades 17 18 19 20 21
fi 3 18 17 8 For 4 mad =
ora : 50 Ana Cola o
Exerccios: Moda
Acidentes 0 1 2 3 4
fi
11-07-2012 39
30 5 3 1 1 = 40
i
1 2 3 4 5 6
Salrios () 400 500 500 600 600 700 700 800 800 900 900 1000
fi 12 15 8 3 1 1 = 40
4- O salrio de 40 funcionrios de um escritrio est distribudo segundo o quadro ao lado. Calcule a moda do salrio destes funcionrios.
For mad ora : Ana Cola o
Exerccios: Moda
5- Uma imobiliria faz alugueres de residncias particulares, seguindo o quadro ao lado. Calcule a moda do aluguer para estas residncias
i
1 2 3 4 5
Aluguel (R$) 0 200 200 400 400 600 600 800 800 1000
fi 30 52 28 7 3
11-07-2012
40
i
1 2 3 4 5 6
Consumo por nota () 0 50 50 100 100 150 150 200 200 250 250 300
fi 10 28 12 2 1 1 = 54
= 120 6- Calcule a moda para a distribuio de valores de 54 multas emitidas na mesma data, selecionadas em uma For esquadra da policia: mad
ora : Ana Cola o
Exerccios: Mediana
a) b) c) d) e)
41
Idades 17 18 19 20 21
fi 3 18 17 8 4 =
Exerccios: Mediana
3- Dado o nmero de acidentes por dia em uma determinada esquina: Calcule a mediana.
Acidentes 0 1 2 3 4
fi
11-07-2012 42
i
1 2 3 4 5 6
Salrios () 400 500 500 600 600 700 700 800 800 900 900 1000
fi 12 15 8 3 1 1 = 40
30 5 3 1 1 = 40
4- O salrio de 40 funcionrios de um escritrio est distribudo segundo o quadro ao lado. Calcule a mediana.
For mad ora : Ana Cola o
Exerccios: Mediana
5- Uma imobiliria gerencia o aluguel de residncias particulares, seguindo o quadro ao lado. Calcule a mediana do aluguel para estas residncias
i
1 2 3 4 5
Aluguel (R$) 0 200 200 400 400 600 600 800 800 1000
fi 30 52 28 7 3
11-07-2012
43
i
1 2 3 4 5 6
Consumo por nota (R$) 0 50 50 100 100 150 150 200 200 250 250 300
fi 10 28 12 2 1 1 = 54
= 120 6- Calcule a mediana para a distribuio de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma For loja de departamentos: mad
ora : Ana Cola o
Exerccios: Separatrizes
1- Se uma srie ordenada possui 180 elementos, d o nmero aproximado de elementos que situam:
11-07-2012
a) Acima do P20; b) Abaixo do K3; c) Acima do Q3; d) Abaixo do P90; e) Entre o P10 e o P90; f) Entre o Q1 e o Q3; g) Entre o Q3 e o P80. 2- Uma imobiliria gerencia o aluguel de residncias particulares, seguindo o quadro ao lado. Calcule: a) Q1; b) K2; c) D3; d) P98.
44
i
1 2 3 4 5
Aluguel (R$) 0 200 200 400 400 600 600 800 800 1000
Exerccios: Separatrizes
i
1 2 3 4 5 6
Consumo por nota (R$) 0 50 50 100 100 150 150 200 200 250 250 300
fi 10 28 12 2 1 1 = 54 3- A distribuio de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. Calcule:
45 11-07-2012
4- Tomando como base op exerccio anterior, o gerente desta loja decidiu premiar a nvel promocional com um brinde dirio, 10% dos fregueses For mad que mais consumirem, nos prximos 30 dias. A partir de qual valor de ora : consumo da nota fiscal os clientes seriam premiados? Ana
Cola o
Exerccios: Separatrizes
11-07-2012
i
1 2 3 4 5 6
5- A tabela ao lado representa a venda de livros didticos em uma editora na primeira semana de maro. Calcule: a) Q1; b) Q3; c) P90; d) P10.
For mad ora : Ana Cola o
46
a) b) c) d) e)
47
2- Calcule a varincia, desvio padro e o coeficiente de variao das idades dos alunos de uma classe:
3 18 17 8 For 4 mad =
ora : 50 Ana Cola o
Acidentes 0 1 2 3 4
fi
11-07-2012 48
30 5 3 1 1 = 40
i
1 2 3 4 5 6
Salrios (R$) 400 500 500 600 600 700 700 800 800 900 900 1000
fi 12 15 8 3 1 1 = 40
4- O salrio de 40 funcionrios de um escritrio est distribudo segundo o quadro ao lado. Calcule a varincia, desvio padro e o coeficiente de For variao . mad
ora : Ana Cola o
5- Uma imobiliria gerencia o aluguel de residncias particulares, seguindo o quadro ao lado. Calcule a varincia, desvio padro e o coeficiente de variao para estas residncias
i
1 2 3 4 5
Aluguel (R$) 0 200 200 400 400 600 600 800 800 1000
fi 30 52 28 7 3
11-07-2012
49
i
1 2 3 4 5 6
Consumo por nota (R$) 0 50 50 100 100 150 150 200 200 250 250 300
fi 10 28 12 2 1 1 = 54
= 120 6- Calcule a varincia, desvio padro e o coeficiente de variao para a distribuio de valores de 54 notas For fiscais emitidas na mesma mad data, selecionadas em uma loja : de ora Ana departamentos:
Cola o
EXEMPLO :
A Diretora da Turma X do 7 ano elaborou, no incio do ano, a planta da sala de aula desta turma. Para facilitar colocou no lugar respetivo, a fotografia de cada aluno e anotou por baixo o seu nome e idade.
50
Ao elaborar a tabela das idades dos alunos, a professora verificou, por exemplo, que havia 2 alunos com 12 anos. Quer isto dizer, que no estudo em causa, o acontecimento ter 12 anos se repete 2 vezes. A este n.2 chama-se frequncia absoluta. A frequncia absoluta do acontecimento ter 13 anos 8, e assim sucessivamente. 51
FREQUNCIA RELATIVA :
a frequncia relativa de um acontecimento o quociente da frequncia absoluta desse acontecimento pelo n. total de elementos em estudo.
52
EXEMPLO :
Idade Frequncia absoluta (n de alunos) Frequncia relativa Frequncia relativa em percentagem
12 13 14 15 Total
2 8 5 3 18
53
FREQUNCIAS ACUMULADAS :
11-07-2012 Formadora Ana Colao Formadora Ana Colao
A soma da frequncia absoluta do elemento considerado com todas as anteriores chamada de frequncia absoluta acumulada e pode ser indicada por Ni. A soma da frequncia relativa do elemento considerado com todos os anteriores chamada de frequncia relativa acumulada e pode ser indicada por Fi.
54
At aqui, vimos os dados em tabelas simples, mas estes dados tambm podem ser agrupados em classes , sobretudo quando se trata de variveis quantitativas continuas ou um grande nmero de dados. Vamos ver um exemplo :
55
11-07-2012
Altura /m
1,80 1,79 1,93 2,00 1,85 1,81 1,98 1,83 2,02 1,91 2,05 1,97 1,94 1,88 2,10 1,95
1,87 2,08
1) Vamos ter que definir o nmero de classes 2) Nas classes os intervalos esquerda so fechados e direita abertos. 3) Valor mnimo e mximo
56
Tabela Original :
11-07-2012
Altura /m
1,80 1,79 1,93 2,00 1,85 1,81 1,98 1,83 2,02 1,91 2,05 1,97 1,94 1,88 2,10 1,95
1,87 2,08
Formadora Ana Colao Formadora Ana Colao
Tabela em Classes:
Altura dos Jogadores
Classes [1,75;1,83[ [1,83;1,91[ [1,91;1,99[ [1,99;2,07[ [2,07;2,15[ ni 3 4 6 3 2 18 fi (%) 16,67% 22,22% 33,33% 16,67% 11,11% 100,00% Ni Fi 3 16,67% 7 38,89% 13 72,22% 16 88,89% 18 100,00%
57
Diagrama de Barras Diagrama de Colunas Diagrama Circular Histograma Pictograma Polgono de Frequncias
58
Dados Qualitativos
11-07-2012 Formadora Ana Colao Formadora Ana Colao
Refrigerante Freq. Absoluta Freq. Relativa Coca-cola 8 33% Coca-cola light 4 17% Pepsi-cola 7 29% Sprite 5 21% 24 100% Total
Dados Qualitativos
11-07-2012
Grfico de Barras
GRFICO 1 - COMPRAS DE REFRIGERANTES POR MARCA Coca-cola light Sprite Pepsi-cola Coca-cola 0 2 4 6 8 10
60
Dados Qualitativos
Grfico de Colunas
GRFICO 1 - COMPRAS DE REFRIGERANTES POR MARCA
10 8 6 4 2 0 Coca-cola Pepsi-cola Sprite Coca-cola light
61
11-07-2012 Formadora Ana Colao Formadora Ana Colao
Dados Qualitativos
Grfico de Circular
GRFICO 1 - COMPRAS DE REFRIGERANTES POR MARCA
17% 33%
11-07-2012 Formadora Ana Colao Formadora Ana Colao
21%
29%
Coca-cola
Pepsi-cola
Sprite
Coca-cola light
62
25
Pictograma
64
65
66
Histograma
11-07-2012
Condensa dados agrupando valores em classes Alturas das barras refletem frequncias absolutas ou relativas (percentuais) Representa uma tabela de Distribuio de Frequncias
67
40 30 20 10 0
5 1 6 ,6 03 7 5 9 8 ,3 62 3 6 8 0 ,0 20 0 7 6 1 ,6 78 7 8 5 3 ,3 36 3 9 3 5 ,0 94 0 10 6, 25 67 11 28, 11 33 11 10, 96 00 91 ,6 7
Classes
68
42
45
Histograma
11-07-2012
Freq. 3 5 2
0 0
69
Histograma
11-07-2012
Freq. 3 5 2
70
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0
Freq. 3 5 2
71
Histograma
11-07-2012
Freq. 3 5 2
Formadora Ana Colao Formadora Ana Colao
72
lim inferior
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15
Freq. 3 5 2
73
lim inferior
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15 25
Freq. 3 5 2
74
lim inferior
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15 25
Freq. 3 5 2
35
75
lim inferior
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15 25 35
Freq. 3 5 2
45
55
76
lim inferior
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15 25 35
Freq. 3 5 2
45
55
77
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15 25 35
Freq. 3 5 2
Barras justapostas
45
55
78
Histograma
11-07-2012
Freq 5 4 3 2 1 0 0 15 25 35 45
Freq. 3 5 2
Formadora Ana Colao Formadora Ana Colao
55
79
Poligono de frequncias
80
81
Fim Obrigada
82