Anda di halaman 1dari 63

Bioestatstica bsica AULA 2

Contedo: Apresentao de dados (Grficos) Medidas de posio Medidas de disperso

Caractersticas importantes dos dados




Centro: Um valor representativo ou mdio, que indica onde se localiza o meio do conjunto de dados. Variao: Uma medida de quanto os valores dos dados variam. Distribuio: A natureza ou forma da distribuio dos dados (ex. uniforme, sino, assimtrica). Outliers ou valores discrepantes: valores amostrais que se localizam muito longe da grande maioria dos outros valores amostrais. Tempo: Caractersticas mudam com o tempo. dos dados que

Apresentao grfica de dados




Diagrama de Barras


Usado para apresentar variveis qualitativas e quantitativas discretas. As barras do diagrama podem ser verticais ou horizontais. Variveis qualitativas ilustrar comparaes entre categorias. Variveis quantitativas discretas barras do diagrama devem ser verticais.

Diagrama de Barras Exemplos

Fonte: Fonte: Ministrio da Sade (1994)


Taxas de mortalidade pelos cnceres mais comuns, sexo feminino. Estado de So Paulo, 1992.
bitos / 100.000 habitantes 14 12 10 8 6 4 2 0 mama estmago clon/reto Tipo de Cncer pulmo colo/tero

Fonte: Fonte: FOSP / Fundao Seade

Diagrama de Barras Exemplos


Incidncia de efeitos colaterais devido ao uso de um novo agente anti-hipertensivo
30 freqncia 25 20 15 10 5 0 1 2 3 4 5 nmero de efeitos colaterais

Apresentao grfica de dados




Grfico de setores


Usado para qualitativas.

representar

variveis

Cada categoria corresponder a uma diviso ou a um setor de um crculo. Geralmente utilizado quando se pretende comparar o total de cada categoria com o conjunto total. Neste tipo de grfico, um crculo de raio qualquer vai representar 100% dos dados (360o). Quando usar a freqncia relativa no grfico, colocar o N.

Grfico de Setores Exemplo


Grfico em setores da distribuio da tuberculose (Dawson, 2003, p.43)
Hip icos 16% t s Negr s 7 -

er

s 1% s f

t tes

Br 5

Apresentao grfica de dados




Histograma


Adequado para ilustrar o comportamento de valores agrupados em classes. um grfico de colunas composto por vrios ret ngulos adjacentes, representando a tabela de freqncia. As classes so colocadas no eixo horizontal e as freqncias no eixo vertical. Na construo devem ser empregadas de 20 classes. a

Interpretao: Centro, variao, forma e outlier. No apropriado para verificar se h mudanas ao longo do tempo.

Histograma
P r t l

Exemplo
i t

li f it l i li fi

Percentual de linfcitos 10 |- 12 12 |- 14 14 |- 16 16 |- 18 18 |- 20 20 |- 22 total

Freqncia

1 2 1 20

Histograma - Exemplo
Per en u l de lin i o em p ien es om leu emi lin ide

6 freqn i 4 3 2 1 0 11 13 1 1 19 21 per en u l de lin i os

Apresentao grfica de dados




Polgono de freqncia


Utilizado na representao de variveis quantitativas contnuas. Usa segmentos de reta ligados a pontos localizados diretamente acima dos valores dos pontos mdios de classe. Os segmentos so estendidos direita e esquerda de forma que o grfico comece e termine no eixo horizontal. Exemplo: tabela usada para construo do histograma

Polgono de freqncia Exemplo


Per en u l de linf i os em p ien es om leu emi linfide
6 freqn i 4 3 2 1 0 9 11 13 1 1 19 21 23 per en u l de linf i os

Apresentao grfica de dados




Ogiva de Galton


um grfico de linha que representa as freqncias acumuladas. O grfico se inicia com a fronteira inferior da primeira classe e termina com a fronteira superior da ltima classe. Exemplo: tabela usada para construo do histograma

Ogiva de Galton Exemplo


Percen u l de lin ci o em p cien es com leucemi lin ide
25 cumul d freqnci 20 15 10 5 0 10 12 14 16 18 20 22

percen u l de lin ci os

Apresentao grfica de dados




Ramo-e-folha


Representa dados separando cada valor em duas partes: o ramo (dgito mais a esquerda) e a folha (dgito mais a direita). Pode ser expandido ou condensado. Ao virar o ramo-e-folhas de lado podemos ver a distribuio dos dados. Vantagem: os dados originais podem ser recuperados. Usar de 5 a 20 classes.

Ramo-e-folha Exemplo
Dimetros abdominais de 40 indivduos
57 59 60 60 62 63 63 63 64 66 66 68 69 69 70 70 71 72 72 73 74 75 75 77 78 81 83 85 86 86 87 88 88 89 91 94 95 101 107 119

Ramo-e-folha Exemplo
Dimetros abdominais de 40 indivduos
Ramo (dezena) 5 6 7 8 9 10 11 Folhas (unidades) 7 9 0 0 2 3 3 3 4 6 6 8 9 9 0 0 1 2 2 3 4 5 5 7 8 1 3 5 6 6 7 8 8 9 1 4 5 1 7 9

Apresentao grfica de dados




Diagrama de disperso


a melhor maneira de visualizar o relacionamento entre duas variveis. A representao grfica feita no mesmo sistema de coordenadas, em que uma das variveis colocada no eixo x e outra no eixo y. O grfico de disperso utilizado para interpretar o relacionamento entre duas variveis (direo, forma e intensidade do relacionamento).

Diagrama de Disperso - Exemplo


ndi e de ssa r ral (IMC) e er ent al de g rdura de 1 universit rias. Brasil, 1997 Indivduo IMC Percentual de gordura 1 2 3 4 5 6 7 8 9 10 21,5 20,7 21,3 19,0 21,2 18,6 16,8 20,7 30,8 18,3
Fonte: dados fictcios

29 25 26 23 25 23 18 28 46 22

Diagrama de Disperso - Exemplo


Relao entre IM e er ent al e gor Brasil, 1997 ra e 1 niversit rias.

50 ra er et al e gor 40 30 20 10 0 0 5 10 15 IM 20 25 30 35

Boxplot

aps MP

Medidas de centro


Valor no centro ou no meio do conjunto de dados.

Medidas: mdia, mediana, moda e ponto mdio.

Mdia
Mdia amostral
n

Mdia populacional
n

x
X !
i !1

x
Q!
i !1

Mdia - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de centro


Mediana


Para calcular a mediana devemos primeiro colocar os valores em ordem crescente (ou decrescente) e, em seguida, aplicar um dos dois processos abaixo: Se o nmero de valores mpar, a mediana o nmero localizado exatamente no meio da lista. Se o nmero de valores par, a mediana a mdia dos 2 valores do meio.

Mediana - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de centro


Moda (M)


o valor freqentemente.

que

ocorre

mais

Uma distribuio pode ser unimodal, bimodal, multimodal ou amodal.

Moda


5 5 5 3 1 5 1 4 3 5 1 2 2 2 3 4 5 6 6 6 7 9 1 2 3 6 7 8 9 10

Moda - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de centro


Ponto mdio


o valor a meio caminho entre o maior valor e o menor valor da srie.

Ponto mdio exemplo


Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de centro


Mdia de uma distribuio de freqncia


n

xn
X !
i !1 n

i i

n
i !1

Mdia de uma distribuio de freqncia - Exemplo


Per entual de linf it s e acientes c leuce ia linfide Percentual de linfcitos 10 |- 12 12 |- 14 14 |- 16 16 |- 18 18 |- 20 20 |- 22 total Freqncia 5 6 5 1 2 1 20

Assimetria


A distribuio de dados assimtrica quando se estende mais para um lado que para o outro. Uma distribuio de dados simtrica se a metade esquerda do seu histograma praticamente uma imagem espelhada de sua imagem direita.

Separatrizes

Separatrizes


Quartil: Divide a distribuio em 4 partes iguais em um conjunto ordenado de valores. Percentil: Divide a distribuio em 100 partes iguais em um conjunto ordenado de valores. Decil: Divide a distribuio em 10 partes iguais em um conjunto ordenado de valores.

Separatrizes

Separatrizes


Observa :


Intervalo interquartil = Q3 Q1 Intervalo semi-quartil = (Q3 Q1) / 2 Quartil mdio = (Q1 + Q3) / 2 Amplitude de percentis 10-90 = P90 P10

Separatrizes Exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Calcule Q1, Q2, Q3, P10 e D9

Apresentao grfica de dados




Boxplot ou diagrama em caixa ou diagrama de caixa e bigode




Resumo dos cinco nmeros: mnimo, Q1, Q2, Q3 e mximo. um grfico de um conjunto de dados que consiste em uma linha que se estende do valor mnimo at o valor mximo, em uma caixa com linhas traadas em Q1, Q2 e Q3.

Utilizao: comparao conjuntos de dados.

entre

Apresentao grfica de dados




Construo de um diagrama de caixa




Ache o resumo dos cinco nmeros. Construa uma escala com valores que incluam o mximo e o mnimo dos dados. Construa uma caixa retangular estendendo-se de Q1 a Q3, e trace uma linha ns caixa no valor de Q2. Trace linhas estendendo-se da caixa at os valores mnimo e mximo.

Boxplot - Exemplo
Figure 1. Effect of Newly Diagnosed Helicobacter pylori Infection on Thyrotropin Levels in Patients with Multinodular Goiter Treated with Thyroxine. The box plots show levels of thyrotropin in patients who received no treatment with thyroxine, in patients receiving thyroxine treatment (median dose, 1.56 microg per kilogram per day) and in whom a low level of thyrotropin (0.05 to 0.20 mU per liter) was stably achieved, in patients with H. pylori infection (with no change in the dose of thyroxine), and in patients after the eradication of H. pylori infection (median dose, 1.70 microg per kilogram per day).

Medidas de disperso


A disperso fornece uma medida da proximidade da srie de dados em torno de um valor de tendncia central, tomado como comparao. Medidas para avaliar a disperso de um conjunto de dados: Amplitude T tal, Desvi Mdi , Varincia, Padr e C eficiente de Desvi Varia .

Medidas de disperso


Amplitude t tal

AT ! x ( mx )  x ( mn )


maior amplitude disperso.

total

maior

Problema: somente so usados os extremos do conjunto (medida instvel). Elemento auxiliar na anlise p mostra a faixa de variao onde encontramos todos os elementos do conjunto.

Amplitude - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de disperso


Desvi mdi


a mdia aritmtica dos desvios absolutos dos elementos da srie, tomados em relao a mdia.

| d | DM !
N

onde d ! x i  x

Desvio mdio exemplo


Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de disperso


Desvio padro
n n

(x 
i

W!

i!1

(xi  X )2 s!
i!1

n
Utiliza


n 1

Verificao da disperso ou espalhamento de um conjunto de dados; Permite distinguir numericamente conjuntos de dados de mesmo tamanho e mesma mdia, mas que so visivelmente diferentes.

Medidas de disperso


Desvi padr - Interpreta




Uma pergunta que pode surgir se um desvio padro grande ou pequeno; dependendo da ordem de grandeza da varivel. Comparao de sries p menor desvio p padro mais homognea ou menos dispersa.

Desvio padro Exemplo


Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de disperso


Desvio padro de uma distribuio de freqncia

ni ( xi  Q )
!
i !1

ni ( xi  X ) 2 s!
i !1

n
Populao

n 1
Amostra

Desvio padro de uma distribuio de freqncia - Exemplo


Percentual de linfcit s em pacientes c m leucemia linfide Percentual de linfcitos 10 |- 12 12 |- 14 14 |- 16 16 |- 18 18 |- 20 20 |- 22 total Freqncia 5 6 5 1 2 1 20

Medidas de disperso


Varincia
n
n

(xi  Q)2
2

(x  X )
i

i !1

s2 !

i !1

n 1

Medida direta da disperso p conjunto com os dados mais dispersos ter maior vari ncia. Medida em unidade quadrada (exemplo: anos2) p o que dificulta a sua interpretao.

Varincia - exemplo
Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Medidas de disperso


C eficiente de varia


uma medida de disperso relativa (%) que mede a variao do desvio padro em relao mdia aritmtica.

s CV (%) ! 100 v X

Medidas de disperso
Coeficiente de variao
1) Qual a srie mais homognea: a srie A ou a srie ? 2) A srie C ou a srie D? 3) A srie A ou a srie E?
Srie A (t) (cm) C (oC) D (oC) E (t) Mdia 80,8 t 450,0 cm 32,6 oC 30,0 oC 8200 t Desvio padro 10,0 t 10,0 cm 4,2 oC 2,6 oC 700,0 t

Coeficiente de variao - exemplo




Variao de freqncia cardaca com a respirao profunda numa amostra aleatria de 18 pacientes

Identificao do indivduo 1 2 3 4 5 6 7 8 9 10

Variao da freqncia cardaca 19,2 51,9 33,1 86,7 29,1 45,3 14,4 67,1 64,8 15,9

Banco de dados Honolulu




Doenas Cardacas 7.683 casos coletados no Havai em 1969 Tamanho da amostra: 100 Universo: Homens doentes com idade entre 45 e 67 anos. Fator de exposio: fumante Mdia de Idade da populao: 54,36 anos

 

 

Banco de dados Honolulu




Variveis Codificadas:

1) Educatio: nvel de instruo Utilizando similar brasileiro: 1 = nenhuma 2 = primeiro grau incompleto 3 = primeiro grau completo 4 = segundo grau completo 5 = curso tcnico 6 = curso superior 2) Weight : peso em Kg 3) Height : altura em cm 4) Age : idade em anos

Banco de dados Honolulu




Variveis Codificadas:
0 = no 1 = sim

5) Smoking: status de fumante

6) Phisical : atividade fsica


1 = sedentrio 2 = moderada 3 = alta

7) Glucose: nivel de glicose no sangue em miligramas percentuais 8) Cholest: nvel de coleterol srico em miligramas percentuais 10) Pressure: presso sanguinea sistlica em mmHg

Banco de dados Honolulu




Procedimentos - Tabelas (Planilha:


quali. cont. graf.)


Variveis nvel educacional, Fumo e Atividade Fsica construo de tabela usando comando freqncia.

Banco de dados Honolulu




Procedimentos
quali. cont. graf.)


Grficos (Planilha:

Variveis Nvel Educacional, Fumo e Atividade Fsica construo de diagrama de barras (barras e colunas) e diagrama circular.

Banco de dados Honolulu




Procedimentos - Medidas


Calcular padro, presso.

mdia, varincia

mediana, para as

moda, variveis

amplitude total, desvio mdio, desvio massa, estatura, glicose, colesterol e

Uso das funes estatsticas do EXCEL. Uso da ferramenta anlise descritiva do menu Ferramentas.

Banco de dados Honolulu




Procedimentos - Medidas


Uso das funes estatsticas do EXCEL. Inserir p Funo p Estatstica p nome da funo (planilha: medidas)

Banco de dados Honolulu




Procedimentos - Medidas


Nome das funes Medida Mdia Moda Mediana Quartil Percentil Desvio mdio Desvio padro Varincia Funo Mdia Modo Med Quartil Percetil mnimo Desv.mdio Desvpad Var

Amplitude total Mximo

Banco de dados Honolulu




Ferramentas p Anlise de dados Estatstica descritiva (planilha: dados)