Captulo 1
1.1
Populaes e Amostras
Uma populao uma coleo bem definida de objetos.
Dados e Observaes
Dados univariados consistem de observaes em uma simples varivel (multivariados mais de duas variveis).
Quando a informao disponvel para uma populao inteira, ns temos um censo. Um subconjunto da populao uma amostra.
12/03/2012
Ramos da Estatstica
Estatstica Descritiva resumo e descrio de dados coletados. Inferncia Estatstica generalizao de uma amostra para uma populao.
Amostra
1.2
1. Selecione um ou mais dgitos de liderana para serem o caule. Os dgitos direita sero as folhas.
12/03/2012
0 99
1 10556 2 24 Caule: dgitos das dezenas Folha: dgitos das unidades
Grficos de Pontos
Representam dados com pontos. Valores observados:
Tipos de Variveis
Uma varivel discreta se seu conjunto de valores possveis constitui um conjunto finito ou uma sequncia infinita. Uma varivel contnua se seu conjunto de valores possveis consiste de um intervalo inteiro na reta de numerao. 25
10
15
20
12/03/2012
Ex. Alunos de uma pequena faculdade foram perguntados a respeito de quantos cartes de crdito eles portavam. x a varivel que representa o nmero de cartes e os resultados so mostrados abaixo.
x 0 1 2 3 4 5 6 #pessoas Freq Rel. 12 0.08 42 0.28 57 0.38 24 0.16 9 0.06 4 0.03 2 0.01
Distribuio de Frequencia
Histogramas
Resultados de cartes de Crdito:
x
0 1 2 3 4 5 6
Freq. Rel.
0.08 0.28 0.38 0.16 0.06 0.03 0.01
0.4 0.3
xi
Relative Frequency
0.2 0.1 0 0 1 2 3 4 5 6
Number of Cards
12/03/2012
Formatos de Histogramas
Unimodal simtrico
bimodal
Desvio positivo
Desvio negativo
A Mdia
1.3
Medidas de Localizao
x x ... xn x 1 2 n
Mdia Populacional:
xi
i 1
12/03/2012
Mediana
A mediana amostral, x, o valor do meio em um conjunto de dados arranjado na ordem ascendente. Para um nmero par de pontos, a mediana a mdia dos dois pontos do meio. Mediana Populacional :
simtrica
Inclinao positiva
Inclinao negativa
Varincia Amostral
1.4
Varincia uma medida da disperso dos dados. A varincia amostral da amostra x1, x2, xn de n valores de X dada por
s
2
Medidas de Disperso
xi x
n 1
S xx n 1
12/03/2012
Desvio Padro
Desvio Padro uma medida da disperso dos dados usando as mesmas unidades dos dados. O desvio padro amostral a raiz quadrada da varincia amostral:
Frmula para s2
Uma expresso alternativa para o numerador de s2
S xx xi x
xi2
xi
n
s s
Propriedades de s2
Sejam x1, x2,,xn uma amostra qualquer e c uma constante qualquer diferente de zero. 2 1. If y1 x1 c,..., yn xn c, then s 2 sx y
2 2. If y1 cx1,..., yn cxn , then s 2 c 2 sx , y
12/03/2012
Boxplots Outliers
Qualquer observao distante mais que 1.5fs do quarto mais prximo um outlier. Um outlier extremo se estiver a mais de 3fs do quarto mais prximo, caso contrrio moderado.
Quartil inferior Quartil superior
Outliers extremos
Outliers moderados
Mediana