Anda di halaman 1dari 55

APRESENTAO DE DADOS (GRFICOS)

MEDIDAS DE POSIO
Vanssa Brito Fernandes Neves
ESTATSTICA E
PROBABILIDADE APLICADA
COMPUTAO
CARACTERSTICAS IMPORTANTES
DOS DADOS
Centro: Um valor representativo ou mdio, que indica onde
se localiza o meio do conjunto de dados.
Variao: Uma medida de quanto os valores dos dados
variam.
Distribuio: A natureza ou forma da distribuio dos
dados (ex. uniforme, sino, assimtrica).
Outliers ou valores discrepantes: valores amostrais que
se localizam muito longe da grande maioria dos outros
valores amostrais.
Tempo: Caractersticas dos dados que mudam com o tempo.
APRESENTAO GRFICA DE DADOS
Diagrama de Barras
Usado para apresentar variveis qualitativas e
quantitativas discretas.
As barras do diagrama podem ser verticais ou
horizontais.
Variveis qualitativas - ilustrar comparaes entre
categorias.
Variveis quantitativas discretas - barras do diagrama
devem ser verticais.
Taxas de mortalidade pelos cnceres mais comuns, sexo
feminino. Estado de So Paulo, 1992.
0
2
4
6
8
10
12
14
mama estmago clon/reto pulmo colo/tero
Tipo de Cncer

b
i
t
o
s

/

1
0
0
.
0
0
0

h
a
b
i
t
a
n
t
e
s
DIAGRAMA DE BARRAS - EXEMPLOS
Fonte: Fonte: FOSP / Fundao Seade
DIAGRAMA DE BARRAS - EXEMPLOS
Incidncia de efeitos colaterais devido ao uso
de um novo agente anti-hipertensivo
0
5
10
15
20
25
30
1 2 3 4 5
nmero de efeitos colaterais
f
r
e
q

n
c
i
a
APRESENTAO GRFICA DE DADOS
Grfico de setores
Usado para representar variveis qualitativas.
Cada categoria corresponder a uma diviso ou a um setor
de um crculo.
Geralmente utilizado quando se pretende comparar o total
de cada categoria com o conjunto total.
Neste tipo de grfico, um crculo de raio qualquer vai
representar 100% dos dados (360
o
).
Quando usar a freqncia relativa no grfico, colocar o N.
GRFICO DE SETORES - EXEMPLO
Grfico em setores da distribuio da tuberculose (Dawson, 2003,
p.43)
Negros no-
hispnicos
37%
Brancos no-
hipnicos
35%
Asiticos ou
habitantes das ilhas
do Pacfico
11%
Americanos nativos
1%
Hipnicos
16%
APRESENTAO GRFICA DE DADOS
Histograma
Adequado para ilustrar o comportamento de valores agrupados em
classes.
um grfico de colunas composto por vrios retngulos
adjacentes, representando a tabela de freqncia.
As classes so colocadas no eixo horizontal e as freqncias no
eixo vertical.
Na construo devem ser empregadas de 5 a 20 classes.
Interpretao: Centro, variao, forma e outlier. No
apropriado para verificar se h mudanas ao longo do
tempo.
HISTOGRAMA EXEMPLO
Percentual de linfcitos em pacientes com leucemia linfide
Percentual de linfcitos Freqncia
10 |- 12 5
12 |- 14 6
14 |- 16 5
16 |- 18 1
18 |- 20 2
20 |- 22 1
total 20
HISTOGRAMA - EXEMPLO
Percentual de linfcitos em pacientes com leucemia linfide
0
1
2
3
4
5
6
7
11 13 15 17 19 21
percentual de linfcitos
f
r
e
q

n
c
i
a
APRESENTAO GRFICA DE DADOS
Polgono de freqncia
Utilizado na representao de variveis quantitativas
contnuas.
Usa segmentos de reta ligados a pontos localizados
diretamente acima dos valores dos pontos mdios de
classe.
Os segmentos so estendidos direita e esquerda de
forma que o grfico comece e termine no eixo horizontal.
Exemplo: tabela usada para construo do histograma
POLGONO DE FREQNCIA EXEMPLO
Percentual de linfcitos em pacientes com leucemia linfide
0
1
2
3
4
5
6
7
9 11 13 15 17 19 21 23
percentual de linfcitos
f
r
e
q

n
c
i
a
APRESENTAO GRFICA DE DADOS
Ogiva de Galton
um grfico de linha que representa as freqncias
acumuladas.
O grfico se inicia com a fronteira inferior da primeira
classe e termina com a fronteira superior da ltima
classe.
Exemplo: tabela usada para construo do histograma.
OGIVA DE GALTON - EXEMPLO
Percentual de linfcitos em pacientes com leucemia linfide
0
5
10
15
20
25
10 12 14 16 18 20 22
percentual de linfcitos
f
r
e
q

n
c
i
a

a
c
u
m
u
l
a
d
a
APRESENTAO GRFICA DE DADOS
Ramo-e-folha
Representa dados separando cada valor em duas partes: o
ramo (dgito mais a esquerda) e a folha (dgito mais a
direita).
Pode ser expandido ou condensado.
Ao virar o ramo-e-folhas de lado podemos ver a
distribuio dos dados.
Vantagem: os dados originais podem ser recuperados.
Usar de 5 a 20 classes.
RAMO-E-FOLHA EXEMPLO
57 63 66 70 74 81 87 94
59 63 68 71 75 83 88 95
60 63 69 72 75 85 88 101
60 64 69 72 77 86 89 107
62 66 70 73 78 86 91 119
Dimetros abdominais de 40 indivduos
RAMO-E-FOLHA EXEMPLO
Ramo (dezena) Folhas (unidades)
5 7 9
6 0 0 2 3 3 3 4 6 6 8 9 9
7 0 0 1 2 2 3 4 5 5 7 8
8 1 3 5 6 6 7 8 8 9
9 1 4 5
10 1 7
11 9
Dimetros abdominais de 40 indivduos
APRESENTAO GRFICA DE DADOS
Diagrama de disperso
a melhor maneira de visualizar o relacionamento entre
duas variveis.
A representao grfica feita no mesmo sistema de
coordenadas, em que uma das variveis colocada no eixo
x e outra no eixo y.
O grfico de disperso utilizado para interpretar o
relacionamento entre duas variveis (direo, forma e
intensidade do relacionamento).
DIAGRAMA DE DISPERSO - EXEMPLO
ndice de massa corporal (IMC) e percentual de gordura de
10 universitrias. Brasil, 1997
Indivduo IMC Percentual de gordura
1 21,5 29
2 20,7 25
3 21,3 26
4 19,0 23
5 21,2 25
6 18,6 23
7 16,8 18
8 20,7 28
9 30,8 46
10 18,3 22
Fonte: dados fictcios
DIAGRAMA DE DISPERSO - EXEMPLO
Relao entre IMC e percentual de gordura de 10 universitrias.
Brasil, 1997
0
10
20
30
40
50
0 5 10 15 20 25 30 35
IMC
P
e
r
c
e
t
u
a
l

d
e

g
o
r
d
u
r
a
Boxplot aps MP
MEDIDAS DE TENDNCIA CENTRAL
Resume a quantidade de informaes de um conjunto de
dados (agrupados ou no) em um nico e informativo
valor;
De importncia fundamental para a pesquisa e para a
extenso.
Geralmente localizado no centro de uma distribuio
simtrica ou aproximada;
MEDIDAS DE TENDNCIA CENTRAL
As medidas mais usadas so:
Mdia;
Mediana;
Moda.
A mdia a medida de tendncia central mais usada e,
por isso a mais conhecida. Mas em certas circunstncia,
para descrever a tendncia central dos dados melhor
usar outras medidas como a mediana ou a moda.;
MEDIDAS DE TENDNCIA CENTRAL
Mdia
A mdia populacional () deve ser diferenciada da mdia
amostral ( );
As mdias mais utilizadas so:
Mdia Aritmtica: Simples e Ponderada;
Mdia Geomtrica;
Mdia Harmnica.
x
MEDIDAS DE TENDNCIA CENTRAL
Mdia Aritmtica Simples
Conceito familiar e at mesmo intuitivo;
DEFINIO: a soma dos valores de todos os dados do
conjunto dividida pela quantidade desses valores. Logo:
MEDIDAS DE TENDNCIA CENTRAL
Finita al Populacion Mdia para ,
...
2 1 1
N
x x x
N
x
N
N
i
i
+ + +
= =

populao da medida cada =


i
x
populao da dados de quantidade = N
em que:
MEDIDAS DE TENDNCIA CENTRAL
Amostral Mdia para ,
...
2 1 1
n
x x x
n
x
x
n
n
i
i
+ + +
= =

=
em que:
amostra da medida cada =
i
x
amostra da dados de quantidade = n
MEDIDAS DE TENDNCIA CENTRAL
Mdia
Mdia amostral Mdia populacional
n
x
X
n
i
i

=
=
1
N
x
n
i
i

=
=
1

MEDIDAS DE TENDNCIA CENTRAL


Exemplo: Sejam as notas de 5 provas de um aluno de
estatstica obtidas em avaliaes durante o ano de
2008.
para obter a mdia aritmtica simples das notas e
saber se o aluno ficar na final, faremos o seguinte
clculo:
Prova 1 2 3 4 5
Notas 7,0 3,7 4,9 6,6 7,2
9 , 5
5
2 , 7 6 , 6 9 , 4 7 , 3 0 , 7
5 5
5 4 3 2 1
5
1
=
+ + + +
=
+ + + +
= =

=
x x x x x
x
x
i
i
indica que a nota mdia obtida pelo aluno durante o
ano foi 5,9.
MEDIDAS DE TENDNCIA CENTRAL
Mdia Aritmtica Ponderada
Mdia de dados agrupados
Mdia Aritmtica Ponderada a soma do produto dos
valores observados com o seus respectivo peso, dividido
pela soma dos pesos.
MEDIDAS DE TENDNCIA CENTRAL
Ponderada Mdia para ,
...
...
2 1
2 2 1 1
1
1
n
n n
n
i
i
n
i
i i
p
p p p
p x p x p x
p
p x
x
+ + +
+ + +
= =

=
=
em que:
n 2,..., 1, i com observado, valor cada = =
i
x
n 2,..., 1, i com valores, referidos dos pesos = =
i
p
MEDIDAS DE TENDNCIA CENTRAL
Exemplo: Porm, o professor de Estatstica adotou para 2008 os
seguintes pesos para as notas.
para obter a mdia aritmtica ponderada das notas e saber se o
aluno ficar ou no na final, faremos o seguinte clculo:
Prova 1 2 3 4 5
Notas 7,0 3,7 4,9 6,6 7,2
Pesos 1 1 2 3 3
2 , 6
3 3 2 1 1
) 3 ( 2 , 7 ) 3 ( 6 , 6 ) 2 ( 9 , 4 ) 1 ( 7 , 3 ) 1 ( 0 , 7
5 4 3 2 1
5 5 4 4 3 3 2 2 1 1
1
1
=
+ + + +
+ + + +
=
+ + + +
+ + + +
= =

=
=
p p p p p
p x p x p x p x p x
p
p x
x
n
i
i
n
i
i i
p
Com base nos pesos adotados pelo professor, a nota
mdia (ponderada) obtida pelo aluno durante o ano foi
6,2.
MEDIDAS DE TENDNCIA CENTRAL
Mdia Aritmtica Ponderada
Se os dados esto distribudos em classes, isto , esto
apresentados em uma tabela de distribuio de
freqncia, para calcular a mdia multiplique o valor
central de cada classe (ponto mdio) pela respectiva
freqncia, some e divida o total pela soma das
freqncias.
MEDIDAS DE TENDNCIA CENTRAL
agrupados dados de Ponderada Mdia para ,
...
...
2 1
2
2
1
1
1
1
n
n
n
n
i
i
n
i
i
i
f f f
f x f x f x
f
f x
x
+ + +
+ + +
= =

=
=
em que:
2
n 2,..., 1, i com i, classe cada de mdia
LS LI
x
x
i
i
+
=
= =
n 2,..., 1, i com classes, referidas das uma cada de frequncia = =
i
f
MEDIDAS DE TENDNCIA CENTRAL
Exemplo: Distribuio de Frequncia dos pesos ao nascer,
em Kg, de 50 bezerros da raa guzer:
Pesos f
i
[20,0 ; 22,0) 2 21,0
[22,0 ; 24,0) 5 23,0
[24,0 ; 26,0) 12 25,0
[26,0 ; 28,0) 16 27,0
[28,0 ; 30,0) 10 29,0
[30,0 ; 32,0) 4 31,0
[32,0 ; 34,0) 1 33,0
Total 50
i
x
MEDIDAS DE TENDNCIA CENTRAL
7 , 26
50
1336
1 ... 5 2
) 0 , 33 ( 1 ... ) 0 , 23 ( 5 ) 0 , 21 ( 2
1
1
= =
+ + +
+ + +
= =

=
=
n
i
i
n
i
i
i
f
f x
x
A mdia de dados agrupados geralmente diferi da mdia
simples.
MEDIDAS DE TENDNCIA CENTRAL
Propriedades da Mdia
Se for somada ou subtrada uma constante K a cada
elemento da amostra, a mdia tambm ser acrescida
ou subtrada dessa constante;
K x y
i i
+ =
K X Y + =
Se for multiplicada ou dividir cada elemento da
amostra uma constante K, a mdia tambm ser
multiplicada ou dividida por essa constante;
K x y
i i
=
K X Y =
MEDIDAS DE TENDNCIA CENTRAL
Propriedades da Mdia
A soma dos desvios ( ) em relao a mdia
igual a zero para qualquer amostra;
X x d
i
=
0
1
=

=
n
i
d
A soma dos quadrados dos desvios em relao
mdia chamado desvio mnimo, valor
utilizado em otimizaes e regresses.

=
=
n
i
d D
1
2
MEDIDAS DE TENDNCIA CENTRAL
Mediana
o valor que ocupa a posio central do conjunto
dos dados organizados em ordem crescente.
Da definio de mediana, segue-se que essa
medida um valor tal que 50% dos dados so
iguais ou menores do que ela. Para calcular a
mediana os dados devem estar ordenados.
MEDIDAS DE TENDNCIA CENTRAL
A mediana descreve bem os grandes conjuntos
de dados. No caso dos conjuntos com dados
discrepantes, isto , dos conjuntos com um, ou
alguns valores, muito maiores ou muito menores
que os demais a mediana descreve melhor os
dados que a mdia.
MEDIDAS DE TENDNCIA CENTRAL
Mediana
Para calcular a mediana devemos primeiro colocar os
valores em ordem crescente (ou decrescente) e, em
seguida, aplicar um dos dois processos abaixo:
Se o nmero de valores mpar, a mediana o nmero
localizado exatamente no meio da lista.
Se o nmero de valores par, a mediana a mdia dos 2
valores do meio.
MEDIDAS DE TENDNCIA CENTRAL
Para dados no agrupados
Se a quantidade de dados mpar, a mediana o valor
que est no centro da srie.
Se a quantidade de dados par, a mediana a mdia dos
dois valores que esto no centro da srie.
2
2
2
2
+
+
n n
x x
2
1 + n
x
MEDIDAS DE TENDNCIA CENTRAL
agrupados dados para Mediana ,
2
md
md
a
md
c
f
f
n
LI md
(
(
(
(


+ =
em que:
mediana classe da inferior limite =
md
LI
mediana da frequncia =
md
f
mediana da amplitude =
md
c
anterior classe da acumulada frequncia =
a
f
MEDIDAS DE TENDNCIA CENTRAL
Exemplo: Considerando o exemplo dos bezerros da raa
guzer:
Pesos f
i
f
a
[20,0 ; 22,0) 2 2
[22,0 ; 24,0) 5 7
[24,0 ; 26,0) 12 19
[26,0 ; 28,0) 16 35
[28,0 ; 30,0) 10 45
[30,0 ; 32,0) 4 49
[32,0 ; 34,0) 1 50
Total 50
MEDIDAS DE TENDNCIA CENTRAL
kg md 75 , 26 2
16
19
2
50
0 , 26 =
(
(
(
(


+ =
A mediana tem a mesma unidade dos dados.
MEDIDAS DE TENDNCIA CENTRAL
Moda
o valor que ocorre com maior frequncia.
A idia da moda importante, quando existe
uma grande quantidade de dados, em especial,
se os dados esto distribudos.
Se o conjunto de dados relativamente pequeno
(de 20 a 30 observaes), a moda no tem
sentido prtico.
MEDIDAS DE TENDNCIA CENTRAL
Moda (M)
o valor que ocorre mais freqentemente.
Uma distribuio pode ser unimodal, bimodal,
multimodal ou amodal.
Moda
5 5 5 3 1 5 1 4 3 5
1 2 2 2 3 4 5 6 6 6 7 9
1 2 3 6 7 8 9 10
MEDIDAS DE TENDNCIA CENTRAL
agrupados dados para Moda ,
2 1
1
mo mo
c LI mo
(

A + A
A
+ =
em que:
modal classe da inferior limite =
mo
LI
mente respectiva posterior nte imediatame e anterior
nte imediatame a e moda classe da frequncia a entre diferena
2 1
= A A e
modal da amplitude =
mo
c
MEDIDAS DE TENDNCIA CENTRAL
Exemplo: Considerando o exemplo dos bezerros da raa
guzer:
Pesos f
i
f
a
[20,0 ; 22,0) 2 2
[22,0 ; 24,0) 5 7
[24,0 ; 26,0) 12 19
[26,0 ; 28,0) 16 35
[28,0 ; 30,0) 10 45
[30,0 ; 32,0) 4 49
[32,0 ; 34,0) 1 50
Total 50
MEDIDAS DE TENDNCIA CENTRAL
kg mo 8 , 26 2
6 4
4
0 , 26 =
(

+
+ =
A moda tem a mesma unidade dos dados.
MEDIDAS DE TENDNCIA CENTRAL
Comparao entre Mdia, Mediana e Moda
H um momento em que o pesquisador far a
seguinte pergunta: Qual a medida de tendncia central
que representa melhor o conjunto de dados em estudo?
A mdia aritmtica trabalha com todos os elementos do
conjunto de dados, enquanto a mediana utiliza apenas
um ou dois valores. No entanto a mdia sofre influncia
de valores extremos (muito alto ou baixo) induzindo
assim ao erro. uma medida que pode ser calculada
apenas para variveis quantitativas.
MEDIDAS DE TENDNCIA CENTRAL
A mediana uma medida que exige uma ordenao de
categorias, assim ela s pode ser obtida para variveis
qualitativas ordinais ou para as quantitativas, jamais para
variveis qualitativas nominais. Alm disso, a mediana no
influenciada por valores extremos.
A moda uma medida que requer apenas o conhecimento da
freqncia absoluta e pode ser utilizada para qualquer tipo de
varivel, tanto qualitativa, quanto quantitativa.
Geralmente, a mdia e a mediana representam melhor a
tendncia central dos dados.
MEDIDAS DE TENDNCIA CENTRAL
A determinao das medidas de posio permite
discutir sobre a simetria da distribuio dos dados
Distribuio simtrica:
mo md x = =
Distribuio ligeiramente assimtrica:
Ocorre pequenas diferenas entre os valores da mdia,
mediana e moda. Aumentando o nmero de dados, a
distribuio tende para o modelo simtrico.
MEDIDAS DE TENDNCIA CENTRAL
Distribuio assimtrica direita (Assimetria positiva)
mo md x < <
Distribuio assimtrica esquerda (Assimetria
negativa)
mo md x > >
MEDIDAS DE TENDNCIA CENTRAL
ASSIMETRIA
A distribuio de dados assimtrica quando se estende
mais para um lado que para o outro.
Uma distribuio de dados simtrica se a metade
esquerda do seu histograma praticamente uma imagem
espelhada de sua imagem direita.

Anda mungkin juga menyukai