Anda di halaman 1dari 5

LABORATRIO DE BIOESTATSTICA AULA PRTICA PROGRAMA: STATA ASSUNTO: ANLISE EXPLORATRIA DE DADOS Pontos bsicos para a escolha da medida

de tendncia central
a. A mediana no leva em conta a magnitude da maioria das observaes, pois se baseia apenas na ordenao dos valores e no na sua expresso numrica. Assim, se perde informao quando se usa a mediana. Neste aspecto a mdia mais poderosa, pois a mediana pouco capaz de sofrer tratamento matemtico. b. A mdia pode ser extremamente influenciada por valores extremos. Se a distribuio for assimtrica, a mdia pode ser muito diferente da mediana.

Como se avalia a assimetria da distribuio


a. Comparando-se a mdia com a mediana. Quando a distribuio for simtrica seus valores sero coincidentes ou prximos. b. Pelo valor da medida de assimetria (skewness). Se o valor for negativo, a distribuio est desviada para a esquerda. Se o valor for positivo, est desviada para a direita. Uma distribuio razoavelmente simtrica tem coeficiente de assimetria variando entre 1 e +1. c. Visualmente no grfico (histograma ou box plot, onde se verifica a presena de valores extremos outliers) e se pode verificar o formato da distribuio, identificando-se assimetria ou curtose. d. Por um teste que avalie a normalidade da distribuio (Kolmogorov-Smirnov ou Shapiro Wilk). Quanto o valor de p nestes testes for menor do que 0.05 a distribuio no normal.

EXERCCIO 1:
1. Na seguinte srie numrica, que expressa a durao da ausncia ao trabalho em dias por motivo de doena, calcule as medidas de tendncia central e disperso e responda s perguntas abaixo. Aps entrar no Stata, clique no boto Data Editor, ou acesse e menu Data e depois Data Editor. Digite os nmeros abaixo. 1 1 2 2 3 3 4 4 4 4 5 6 6 6 6 7 8 10 10 38 80 A. Comparar a mdia com a mediana e calcular o coeficiente de assimetria Comandos pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Summary Statistics e Summary Statistics. Na caixa de dilogo, indique var1. Depois clique em options: display adittional statistics. Clique finalmente em OK para concluir. Comando digitado: summarize var1, detail

a. b. c. d. e. f. g. h. i.

Mdia (Mean)= Mediana (50%)= Percentil 25= Percentil 75= Amplitude interquartil (P75 P25)= Varincia= Desvio-padro (Std. Dev.)= Assimetria (Skewness)= Curtose (Kurtosis)= A mdia est prxima da mediana ? Qual o valor do coeficiente de assimetria? H assimetria ?

B. Desenhar um histograma para visualizar assimetria Comando pelo menu: No menu escolha Graphics, Easy Graphics e depois Histogram. Na caixa de dilogo, indique var1. Na caixa de dilogo options voc pode solicitar: add normal density plot. Clique finalmente em OK para concluir. Comando digitado: histogram var1, normal Observe o histograma e avalie se a distribuio simtrica ou assimtrica. C. Desenhar o box-plot para avaliar se a distribuio assimtrica e detectar valores extremos Comando pelo menu: No menu escolha Graphics, Easy Graphics e depois Box plot. Na caixa de dilogo, indique var1. Clique finalmente em OK para concluir. Comando digitado: graph box var1 H assimetria ? H valores extremos ? D. Teste de normalidade da distribuio Comando pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Distributional Plots & Tests e Shapiro-Wilk normality test. Na caixa de dilogo, indique var1. Clique finalmente em OK para concluir. Comando digitado: swilk var1 Quanto foi o valor de p do teste da normalidade ? Pode se assumir que a distribuio simtrica (normal) ou assimtrica ? E. Construa o grfico de normalidade (normal quantile plot). Se a distribuio for normal os pontos ficam sobre a reta ou bem prximos dela. Comando pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Distributional Plots & Tests e Normal quantile plot. Na caixa de dilogo, indique var1. Clique finalmente em OK para concluir. Comando digitado: qnorm var1 Para a srie de dados anterior, voc utilizaria a mdia ou a mediana como medida de tendncia central ? Por qu ?

EXERCCIO 2:
Repita os mesmos procedimentos para os valores abaixo, que representam o dimetro dos sarcomas removidos das mamas de 20 mulheres: 0,5 5,0 1,2 5,0 2,1 5,0 2,5 6,0 2,5 6,5 3,0 7,0 3,8 8,0 4,0 9,5 4,2 13,0 4,5 5,0

A. Comparar a mdia com a mediana e calcular o coeficiente de assimetria Comandos pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Summary Statistics e Summary Statistics. Na caixa de dilogo, indique var1. Depois clique em options: display adittional statistics. Clique finalmente em OK para concluir. Comando digitado: summarize var1, detail j. k. l. m. n. o. p. q. r. Mdia (Mean)= Mediana (50%)= Percentil 25= Percentil 75= Amplitude interquartil (P75 P25)= Varincia= Desvio-padro (Std. Dev.)= Assimetria (Skewness)= Curtose (Kurtosis)= A mdia est prxima da mediana ? Qual o valor do coeficiente de assimetria? H assimetria ? B. Desenhar um histograma para visualizar assimetria Comando pelo menu: No menu escolha Graphics, Easy Graphics e depois Histogram. Na caixa de dilogo, indique var1. Na caixa de dilogo options voc pode solicitar: add normal density plot. Clique finalmente em OK para concluir. Comando digitado: histogram var1, normal Observe o histograma e avalie se a distribuio simtrica ou assimtrica. C. Desenhar o box-plot para avaliar se a distribuio assimtrica e detectar valores extremos Comando pelo menu: No menu escolha Graphics, Easy Graphics e depois Box plot. Na caixa de dilogo, indique var1. Clique finalmente em OK para concluir. Comando digitado: graph box var1 H assimetria ? H valores extremos ? D. Teste de normalidade da distribuio Comando pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Distributional Plots & Tests e Shapiro-Wilk normality test. Na caixa de dilogo, indique var1. Clique finalmente em OK para concluir. Comando digitado: swilk var1

Quanto foi o valor de p do teste da normalidade ? Pode se assumir que a distribuio simtrica (normal) ou assimtrica ? E. Construa o grfico de normalidade (normal quantile plot). Se a distribuio for normal os pontos ficam sobre a reta ou bem prximos dela. Comando pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Distributional Plots & Tests e Normal quantile plot. Na caixa de dilogo, indique var1. Clique finalmente em OK para concluir. Comando digitado: qnorm var1 Para a srie de dados anterior, voc utilizaria a mdia ou a mediana como medida de tendncia central ? Por qu ?

EXERCCIO 3:
O arquivo espirometria.dta contm dados de 80 pacientes obesos do Hospital Universitrio da UFMA, possveis candidatos ao tratamento com cirurgia baritrica. Avalie, usando os mesmos procedimentos realizados acima, as variveis idade, altura, peso, imc (ndice de massa corporal), cvf e vef1. Estas ltimas duas variveis foram obtidas na espirometria e foram medidas em litros. Abra o arquivo utililizando File, Open ou digitando use espirometria Para cada uma destas variveis, voc utilizaria a mdia ou a mediana como medida de tendncia central ? Por qu ?

TRANSFORMAES
Se a distribuio no for simtrica temos que usar estimativas no paramtricas ou ento transformar os dados. Pode-se avaliar a normalidade da distribuio atravs de testes, como o de Shapiro-Wilk. As principais transformaes usadas em estatstica so: Para distribuies assimtricas direita (cauda direita mais longa): Logaritmo base 10 de x x = log10 x Logaritmo base e de x Raiz quadrada
x = x

x = ln x

Recproca
x = 1 x

Para distribuies assimtricas esquerda (cauda esquerda mais longa): Quadrtica Cbica
x = x 2 x = x 3

O Stata possui um comando automtico que faz vrias transformaes e testa a normalidade das distribuies aps a transformao, tornando mais fcil a tarefa de selecionar a melhor transformao. A varivel imc tem distribuio assimtrica direita. Vamos tentar as transformaes. Comando pelo menu: No menu escolha Statistics, e a seguir clique em Summaries, Tables, & Tests, Distributional Plots & Tests e Ladder of powers. Na caixa de dilogo, indique imc. Clique finalmente em OK para concluir. Comando digitado: ladder imc . ladder imc
Transformation formula chi2(2) P(chi2) -----------------------------------------------------------------cubic imc^3 33.04 0.000 square imc^2 24.78 0.000 raw imc 16.49 0.000 square-root sqrt(imc) 12.61 0.002 log log(imc) 9.11 0.011 reciprocal root 1/sqrt(imc) 6.12 0.047 reciprocal 1/imc 3.66 0.160 reciprocal square 1/(imc^2) 0.63 0.731 reciprocal cubic 1/(imc^3) 0.62 0.733

Note que as trs ltimas transformaes ficaram boas, sendo que as duas ltimas so as melhores (maior valor de P no teste da normalidade). Voc tambm pode usar os comandos gladder imc (Ladder of powers histograms) para ver os histogramas com as variveis transformadas e qladder imc para ver os grficos da normal (Ladder of powers normal quantile plots) com as variveis transformadas.

EXERCCIO 4:
Das variveis do arquivo espirometria que no tiveram distribuio normal, verifique a melhor transformao para normalizar os dados.

Anda mungkin juga menyukai