Anda di halaman 1dari 32

Estatstica Descritiva I

Cincias Contbeis - FEA - Noturno


2 Semestre 2013

O que Estatstica
Origem relacionada com a coleta e construo de

tabelas de dados para o governo.


A situao evoluiu: a coleta de dados representa

somente um dos aspectos da Estatstica.


No sculo XIX, o desenvolvimento do clculo de

probabilidade e outras metodologias matemticas,


tais como a tcnica de Mnimos Quadrados, foram
fundamentais para o desenvolvimento da Estatstica.

O que Estatstica
No sculo XX a Estatstica desenvolve-se como uma
rea especfica do conhecimento a partir do
desenvolvimento
da
Inferncia
Estatstica,
metodologia que faz uso da Teoria das
Probabilidades e com ampla aplicao em cincias
experimentais.
A Estatstica hoje consiste em uma metodologia
cientfica para obteno, organizao e anlise de
dados oriundos das mais variadas reas das cincias
experimentais, cujo objetivo principal auxiliar a
tomada de decises em situaes de incerteza.
3

Estatstica
Populao
Caractersticas

Tcnicas de amostragem

Amostra

Anlise
descritiva

Concluses
sobre as
caractersticas
da populao

Inferncia
estatstica

Informaes contidas
nos dados
4

Amostragem
Associada coleta de dados, a tecnologia da
amostragem desenvolveu um conjunto de tcnicas
para obteno de amostras convenientemente
obtidas da populao de interesse.
Exemplos de uso
Pesquisas de mercado;
Pesquisas de opinio pblica;
Ensaios clnicos;
Estudos experimentais.
5

Estatstica Descritiva
Etapa inicial da anlise utilizada para
descrever, organizar e resumir os dados
coletados.

A disponibilidade de uma grande quantidade


de dados e de mtodos computacionais
muito eficientes revigorou esta rea da
Estatstica.

Probabilidade
A teoria das probabilidades auxilia na
modelagem de fenmenos aleatrios, ou
seja, aqueles em que est presente a
incerteza.
uma ferramenta fundamental para a
inferncia estatstica.

Inferncia Estatstica
Conjunto de tcnicas que permite, a partir de
dados amostrais, tirar concluses sobre a
populao de interesse, controlando erros.

Exemplo 1
Numa pesquisa eleitoral, um instituto de
pesquisa tem como objetivo prever o resultado
da eleio, utilizando uma amostra da
populao.

Considere o candidato A
Denote por p a proporo de eleitores na
populao que votaro em A na eleio.
Denote por ^
p
a proporo de eleitores no
levantamento de opinio
que expressam
inteno de voto em A.
Estimao: podemos usar o valor de ^
p para
estimar a proporo p da populao.
10

Pesquisas de Opinio
Em vrios anos de eleies, os institutos de
pesquisa de opinio colhem periodicamente
amostras de eleitores para obter as
estimativas de inteno de voto da populao.
As estimativas so fornecidas com um valor
(estimativa pontual) e uma margem de erro
com a qual construda a
estimativa
intervalar.

Pesquisa Sensus
Os quadros apresentados a seguir referemse inteno de voto para presidente do
Brasil para o primeiro e segundo turnos das
eleies de 2010.
A resposta foi estimulada e nica.
Pergunta realizada: se a eleio para
presidente fosse hoje e os candidatos
fossem estes, em quem o(a) Sr.(Sra) votaria?
12

Inteno de voto para presidente do Brasil, 1 Turno 2010

Pesquisa Sensus, em % do total de votos.


2.000 eleitores - Margem de erro de 2,2% com 95% de confiana.
13

Inteno de voto para presidente do Brasil, 2 Turno 2010

Pesquisa Sensus, em % do total de votos.


2.000 eleitores - Margem de erro de 2,2% com 95% de confiana.
14

Estattica Descritiva
O que fazer com as observaes
que coletamos?

Primeira Etapa:
Resumo dos dados = Estatstica descritiva
15

Varivel aleatria :
qualquer caracterstica associada a uma populao.

Classificao das variveis


NOMINAL

sexo, cor dos olhos

ORDINAL

classe social, grau de instruo

QUALITATIVA

CONTNUA

peso, altura, salrio, idade

QUANTITATIVA
DISCRETA

nmero de filhos, nmero de carros


16

Variveis Quantitativas
MEDIDAS DE POSIO
Mnimo, Mximo, Moda, Mdia, Mediana,
Percentis.

MEDIDAS DE DISPERSO
Amplitude, Intervalo-Interquartil, Varincia,
Desvio Padro, Coeficiente de Variao.

17

Medidas de Posio
Mximo (max): a maior observao.
Mnimo (min): a menor observao.
Moda (mo): o valor (ou atributo) que ocorre
com maior frequncia.

Dados: 4, 5, 4, 6, 5, 8, 4
max = 8

min = 4

mo = 4
18

Mdia
n

x 1 x 2 x 3 ... x n
n

x
i 1

Dados: 2, 5, 3, 7, 8
x

253 7 8
5

5
19

Mediana
A mediana o valor da varivel que
ocupa a posio central de um
conjunto de n dados ordenados.
Posio da mediana: n+1
2
20

Exemplos
Dados: 2, 6, 3, 7, 8

n = 5 (mpar)

Dados ordenados: 2 3 6 7 8

Posio da Mediana

Dados: 4, 8, 2, 1, 9, 6

5+1 = 3 Md = 6
2

n = 6 (par)

Dados ordenados: 1 2 4 6 8 9

Md

6+1 = 3,5
2

Md = (4 + 6) / 2 = 5
21

Percentis
O percentil de ordem p100 (0 < p < 1), em um
conjunto de dados de tamanho n, o valor da varivel
que ocupa a posio p (n + 1) do conjunto de dados
ordenados.

Casos particulares
percentil 50 = mediana ou segundo quartil (Md);
percentil 25 = primeiro quartil (Q1);
percentil 75 = terceiro quartil (Q3);
percentil 10 = primeiro decil.
22

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7

n=10

Posio de Md: 0,5(n+1)= 0,511= 5,5 Md = (3 + 3,1)/2 = 3,05

Posio de Q1: 0,25 (11) = 2,75

Q1=( 2+2,1)/2=2,05

Posio de Q3: 0,75 (11) = 8,25 Q3=(3,7+6,1)/2=4,9


Md = 3,05

Q1 = 2,05

Q3 = 4,9

Dados: 0,9 1,0 1,7 2,9 3,1 5,3 5,5 12,2 12,9 14,0 33,6

n=11
Md = 5,3

Q1 = 1,7

Q3 = 12,9
23

Exemplo2: considere as notas de um teste de 3 grupos de alunos


Grupo 1: 3, 4, 5, 6, 7

Grupo 2: 1, 3, 5, 7, 9

Grupo 3: 5, 5, 5, 5, 5

* * * * *
G1
*

G2
*
*
*
*
*

G3
0

Temos: x1 = x2 = x3 = 5

10

e Md1= Md2= Md3 = 5


24

Medidas de Disperso
Finalidade: encontrar um valor que resuma a
variabilidade de um conjunto de dados.

Amplitude
A = max - min
Para os grupos anteriores, temos:
Grupo 1, A = 4
Grupo 2, A = 8
Grupo 3, A = 0
25

Intervalo-Interquartil
a diferena entre o terceiro quartil e o
primeiro quartil, ou seja, Q3 - Q1.

Dados: 1,9 2,0 2,1 2,5 3,0 3,1 3,3 3,7 6,1 7,7
Q1 = 2,05

Q3= 4,9

Q3 - Q1 = 4,9 - 2,05 = 2,85


26

Varincia
( x1 x ) ( x 2 x ) ... ( x n x )
2

s
2

n 1

i 1

( xi x )
n 1

Desvio padro
Desvio padro s

Varincia

27

Clculo para os grupos


G1: s2 =(3-5)2+(4-5)2+ (5-5)2+ (6-5)2+ (7-5)2

4
s2 = 10/4= 2,5 s = 1,58
G2: s2 = 10 s = 3,16

G3: s2 = 0 s = 0
28

Frmula alternativa
n

s
2

2
i

nX

i 1

( n 1)

Em G1: Xi2 = 9 + 16 + 25 + 36 +49 = 135


s2 = 135 - 5(5)2 = 2,5

4
29

Coeficiente de Variao
- uma medida de disperso relativa;
- elimina o efeito da magnitude dos dados;
- exprime a variabilidade em relao mdia.
CV

100 %

30

Exemplo 3
Altura e peso de alunos
Mdia
Altura
Peso

1,50m
50 kg

Desvio
Padro

Coef. de
Variao

0,05m
3,5kg

3,3%
7%

Concluso: os alunos so, aproximadamente,


duas vezes mais dispersos quanto ao peso do
que quanto altura.
31

Exemplo 4
Altura (em cm) de uma amostra de recmnascidos e de uma amostra de adolescentes
Mdia
Recm-nascidos
Adolescentes

50
160

Desvio
padro
6
16

Coef. de
variao
12%
10%

Concluso: em relao s mdias, as alturas dos


adolescentes e dos recm-nascidos apresentam
variabilidade muito parecidas.
32