Bioestatística e Epistemologia
da Investigação
Estatística Descritiva
I-1 Introdução à organização e ao processamento
de dados.
I-2 Amostra e população; cuidados a ter na
recolha da amostra.
I-3 Ordenação dos dados. Agrupamento dos
dados. Tabela de frequências.
I-4 Medidas de localização e de dispersão.
I-5 Representação gráfica dos dados: gráfico de
barras, gráfico de sectores, gráfico de caule-e-
folhas, caixa-de-bigodes, histograma.
Dados estatísticos
são observações (como medidas, respostas de inquéritos,
registos de idade, sexo, naturalidade, ...) que foram recolhidas.
Estatística
a informação estatística é constituída por dados, os quais
são organizados, sumariados, apresentados, analizados,
interpretados de modo a retirar conclusões baseadas nos
dados.
População
a colecção completa de todos os elementos
(pessoas, animais, medidas, ...) a serem estudados.
A colecção é completa no sentido de incluir todos
os indivíduos a serem estudados.
Amostra
Um subconjunto da população escolhido
correctamente, de modo a poder ser considerado
como representativo da população.
Parâmetro
uma medida numérica que descreve
alguma característica de uma população.
população
parâmetro
Estatística
uma medida numérica que descreve
alguma característica de uma amostra.
amostra
estatística
Ana M. Abreu - 2006/07
Definições Slide 7
Dados quantitativos
números que representam contagens ou
medidas.
Exemplo: medidas dos modelos!
Dados qualitativos
(ou categorizados ou atributos)
podem ser separados em diferentes
categorias, que se distinguem por alguma
característica não numérica.
Exemplo: sexo (masculino/feminino) dos
doentes.
Dados discretos
surgem quando o número de valores
possíveis é finito ou contável.
0, 1, 2, 3, . . .
Exemplo: O número de ovos que uma
galinha põe.
Ana M. Abreu - 2006/07
Definições Slide 10
Dados contínuos
(ou numéricos) surgem quando o número de valores
possíveis é infinito e corresponde a alguma escala
contínua que contempla uma amplitude de valores sem
interrupções ou saltos.
2 3
escala nominal
caracterizada por dados tais como nomes,
etiquetas ou categorias. Os dados não têm
qualquer relação de ordem (do mais pequeno
para o maior)
escala ordinal
envolve dados que podem ser ordenados, mas
as diferenças entre eles ou não podem ser
calculadas ou não fazem sentido.
escala intervalar
como a escala ordinal, mas onde é possível calcular
diferenças. No entanto, não existe um zero natural (que
pudesse corresponder a ausência da característica).
Nominal - só categorias.
Ordinal - categorias com alguma ordem.
Intervalar - diferenças possíveis mas sem zero
natural.
recolha da amostra
Dimensão da amostra
usar uma amostra com dimensão
suficiente para conseguir captar as
características dos dados e recolhida de forma
apropriada, tal como baseada na aleatoriedade.
Amostra Aleatória
os membros da população são
seleccionados de tal forma que cada membro
tem igual possibilidade de ser escolhido.
Métodos de Amostragem
Aleatória
Sistemática
Por conveniência
Estratificada
Por clusters
Estatística Descritiva
resume ou descreve as características
importantes de um conjunto conhecido de dados
populacionais.
Estatística Inferencial
usa dados amostrais para fazer inferências (ou
generalizações) sobre uma população.
Distribuição de Frequência
lista dos valores dos dados (ou
individuais ou por grupos de intervalos),
juntamente com as correspondentes
frequências ou contagens.
49.5
Pontos
149.5
Médios
249.5
349.5
449.5
100
Amplitude 100
da Classe 100
100
100
frequência da classe
Frequência relativa =
soma de todas as frequências
11/40 = 28%
12/40 = 30%
Frequência total = 40
etc.
Ana M. Abreu - 2006/07
Frequência acumulada Slide 36
Frequências
acumuladas
Acabamos de ver
Características importantes dos dados.
Distribuições de frequências.
Procedimentos para construir as
distribuições de frequência.
Frequências relativas.
Frequências acumuladas.
e de dispersão
x =
n
µ pronuncia-se ‘mu’ e denota a média de todos os valores
da população.
Σx
µ =
N
Ana M. Abreu - 2006/07
Definições Slide 41
Mediana
o valor central quando os dados estão
ordenados.
MEDIANA é 0.73
Ana M. Abreu - 2006/07
Definições Slide 43
Moda
o valor que ocorre com maior frequência.
Simetria
Os dados distribuem-se de forma
simétrica quando a metade esquerda do
histograma correspondente é
sensivelmente um espelho da metade
direita.
Assimetria
Os dados distribuem-se de forma
assimétrica se se prolongam mais para um
dos lados do que para o outro.
Ana M. Abreu - 2006/07
Slide 47
A amplitude de um conjunto de
dados é a diferença entre o
valor mais elevado e o valor
mais pequeno.
valor valor
mais - mais
elevado pequeno
Σ (x - x) 2
S=
n-1
Σx ) - (Σ
n (Σ Σx) 2 2
s=
n (n - 1)
Σ (x - µ) 2
σ = N
Esta fórmula é semelhante à anterior, mas
neste caso é usada a média populacional e a
dimensão da população.
Notação
} s 2
Variância amostral
σ
2
Variância populacional
Amostra População
s σ
CV = •100% CV = •100%
x µ
Q1, Q2, Q3
dividem os valores ordenados em 4 partes iguais
(mínimo)
Q1 Q2 Q3 (máximo)
(mediana)