Anda di halaman 1dari 12

1. O que ensaio clnico no randomizado ?

? Os ensaios clnicos randomizados servem para avaliar a eficcia de procedimentos diagnsticos, tratamentos ou medidas preventivas em sade humana ou animal. So estudos longitudinais, prospectivos, semelhantes aos estudos de coorte. A casualizao na formao do grupo de estudo e do grupo controle permite maior controle de variveis e, por isso, so classificados como estudos experimentais (Figura 1). Tal como nos estudos de coorte possvel medir a incidncia do desfecho, por se saber que este posterior exposio. O grupo em estudo exposto ao tratamento ou medida preventiva alternativa, enquanto que o grupo controle sujeito ao tratamento ou medida preventiva padro (habitual). Na falta destes pode ser utilizado o placebo. Em se tratando de animais o aplicador do fator de exposio no deve ter conhecimento do tipo de tratamento que est aplicando (alternativo ou padro). Em humanos, ambos, aplicador e paciente no devem ter conhecimento sobre o que e a quem esto sendo aplicados os tratamentos ou as medidas preventivas. Os ensaios clnicos oferecem vantagens e desvantagens. Vantagens: Controle, pela casualizao, de fatores de confundimento ; Facilidade na formao do grupo controle; Determinao de incidncias e, conseqentemente, do risco relativo; Considerao simultnea de vrios desfechos clnicos. Desvantagens: Questes ticas; Cooperao dos grupos; Perda de seguimento; Custo elevado; Longa durao. 2. O que amostra paramtrica independente e amostra paramtrica pareada? Testes paramtricos e no-paramtricos. Os testes estatsticos podem ser divididos em dois grandes grupos, conforme fundamentem ou no os seus clculos na premissa de que a distribuio de freqncias dos erros amostrais normal, as varincias so homogneas, os efeitos dos fatores de variao so aditivos e os erros independentes. Se tudo isso ocorrer, muito provvel que a amostra seja aceitavelmente simtrica, ter com certeza apenas um ponto mximo, centrado no intervalo de classe onde est a mdia da distribuio, e o seu histograma de freqncias ter um contorno que seguir aproximadamente o desenho em forma de sino da curva normal. O cumprimento desses requisitos condiciona pois a primeira escolha do pesquisador, uma vez que, se forem preenchidos, ele poder utilizar a estatstica paramtrica, cujos testes so em geral mais poderosos do que os da estatstica no-paramtrica, e conseqentemente devem ter a preferncia do investigador, quando o seu emprego for permitido. O que so testes paramtricos? Os termos paramtrico e no-paramtrico referem-se mdia e ao desvio-padro, que so os parmetros que definem as populaes que apresentam distribuio normal. Essa observao j foi feita e repetida muitas vezes neste texto. Volto a reafirm-la, todavia, porque tenho visto muitas vezes artigos cientficos, alm de trabalhos e teses acadmicas, em que se usaram testes no-paramtricos, mas os resultados eram apresentados em termos de mdia desvio-padro da distribuio, ou ento em termos de mdia erro-padro da mdia, erro este que tambm um valor calculado em funo do desvio-padro da amostra. Os parmetros da curva normal. Ora, de qualquer conjunto de valores numricos pode-se calcular a mdia, porm, desviopadro, somente as curvas normais o possuem, uma vez que, por definio, "desvio-padro o

ponto de inflexo da curva normal" e de mais nenhuma outra. So eles em nmero de dois e simtricos em relao mdia da distribuio. Portanto, curvas assimtricas jamais podem ter desvio-padro porque, mesmo que tenham pontos de inflexo, como os possuem muitas outras curvas matemticas, eles dificilmente seriam simtricos em relao mdia. Enfim, mesmo que distribuies experimentais possam apresentar alguma assimetria, esta deve manter-se dentro de certos limites, aceitveis em termos estatsticos e aceitveis porque atribudos variao casual determinada pelos erros no-controlados de amostragem, ou seja, variao do acaso, tpica das variveis e amostras chamadas aleatrias. Desvio-padro e testes no-paramtricos. Quando um pesquisador utiliza testes no-paramtricos, supe-se que a distribuio de seus dados experimentais no seja normal, ou que ele no tenha elementos suficientes para poder afirmar que seja. Na dvida quanto a essa informao, nada impede que ele opte pelo uso da estatstica no-paramtrica. O que ele no pode fazer, de modo algum, argumentar em termos de desvios ou erros padres, embora possa perfeitamente faz-lo pura e simplesmente em termos de mdias. Qual teste usar, sejam paramtricos ou no-paramtricos? Qualquer que seja pois a opo do pesquisador, a essa altura de sua investigao cientfica ele se acha diante de mais um dilema: qual, dentre os muitos testes estatsticos existentes em ambas as categorias acima citadas, seria o mais apropriado, no caso especfico de seu trabalho, ou do modelo matemtico de seus ensaios? Que elementos desse modelo matemtico condicionariam a opo por um ou outro desses testes? Em geral a resposta est contida no prprio modelo experimental de cada pesquisa. Os detalhes adicionais que devem orientar a escolha do teste so: a) a existncia ou no de vinculao entre dois ou mais fatores de variao; b) o nmero de componentes da amostra, que vo ser comparados. De fato, seja qual for o tipo de estatstica escolhida, paramtrica ou no-paramtrica, h testes especificamente destinados a amostras em que h independncia entre os fatores de variao, e outros para amostras em que existe vinculao ou dependncia entre eles. Da mesma forma, o nmero de comparaes a serem realizadas pelo teste tambm importante, porque h testes elaborados para comparar apenas duas amostras, e h outros destinados a comparaes mltiplas, entendendo-se como mltiplas um nmero de comparaes superior a dois. Num experimento fatorial, por exemplo, em que h fatores colocados nas colunas, nas linhas e nos blocos, o nmero de comparaes fornecido pela multiplicao do nmero de colunas, pelo nmero de linhas e pelo nmero de blocos. Enfim, o produto fatorial semelhante ao usado para calcular o nmero total de dados da amostra, s no entrando no clculo o nmero de repeties. Assim sendo, no caso do experimento fatorial que, a partir de alguns captulos atrs, nos vem servindo de exemplo com 4 colunas, 3 linhas e 2 blocos o nmero de comparaes possveis, incluindo-se nele no s os fatores de variao principais mas tambm todas as interaes possveis entre eles, seria: 4 x 3 x 2 = 24 comparaes. Classificao dos testes estatsticos (GMC verso 7.5): O diagrama abaixo esquematiza as subdivises dos testes estatsticos, listando os mais comumente utilizados na prtica:

Alguns desses testes usam nmeros como varivel, outros usam sinais + e , outros usam valores fixos, como 1 e 0, e outros ainda utilizam freqncias. Esses testes evidentemente esto todos includos no grupo dos testes no-paramtricos, simplesmente porque no usam os parmetros mdia e desvio-padro em seus clculos. A filosofia de cada teste estatstico. Aps a concluso destes conceitos iniciais e dos conhecimentos bsicos que se deve ter sobre os mtodos estatsticos, sero includos neste texto alguns breves comentrios sobre cada um dos testes listados acima. So resumos sobre o que chamei de Filosofia do Teste, e neles procurei dar uma idia geral sobre o que tinha em mente o criador de cada um deles, e a quais modelos matemticos eles se adaptam, bem como em quais circunstncias cada qual poderia ser utilizado. Mas so apenas observaes condensadas, que evidentemente os interessados podero ampliar, pela leitura e pelo estudo mais aprofundado em compndios mais elaborados do que este, sobre a Cincia Estatstica, que os h em grande quantidade. Apresentao dos resultados dos testes. Uma vez realizados os testes adequados, estes do o seu parecer, sob a forma de um valor numrico, apresentado (conforme o teste) como valor de F (anlise de varincia), de t (teste t, de Student), U (Mann-Whitney), Q (teste de Cochran), c (letra grega qui, testes diversos, que usam o chamado qui-quadrado), z (McNemar e Wilcoxon), H (Kruskal-Wallis), ou r (letra grega rho, utilizada nos testes de correlao, que sero focalizados mais adiante, neste texto). No-significncia estatstica (H0). Seja como for, o valor numrico calculado pelo teste deve ser confrontado com valores crticos, que constam em tabelas apropriadas a cada teste. Essas tabelas geralmente associam dois parmetros, que permitem localizar o valor crtico tabelado: nvel de probabilidades (usualmente 5 % [a = 0,05], ou 1 % [a = 0,01]), e o nmero de graus de liberdade das amostras comparadas.

Valores menores que o tabelado indicam que ele no pode ser considerado diferente do que se obteria se as amostras comparadas fossem iguais. Enfim, estaria configurado o que se chama de no-significncia estatstica, ou de aceitao da hiptese zero, ou de nulidade (H0). Significncia estatstica (H1). Porm, se o valor calculado for igual ou maior que o tabelado, aceita-se a chamada hiptese alternativa (H1), ou seja, a hiptese de que as amostras comparadas no podem ser consideradas iguais, pois o valor calculado supera aquele que se deveria esperar, caso fossem iguais, lembrando sempre que a igualdade, em Estatstica, no indica uma identidade. Isso quer dizer que pode eventualmente haver alguma diferena, mas esta no deve ultrapassar determinados limites, dentro dos quais essa diferena decorre apenas da variao natural do acaso, tpica da variao entre as repeties do ensaio. No caso de o valor calculado ser maior do que o valor tabelado, diz-se que h significncia estatstica, que pode ser ao nvel de 5 %, se o valor calculado for maior que o valor tabelado para 5 %, porm menor que o tabelado para 1 %. Ou ao nvel de 1 %, caso o valor calculado seja igual ou maior que o valor tabelado para 1 %. 3. O que significa e como determinado o ndice de Tiffeneau? O ndice de Tiffeneau a medida do VEF1 relativa capacidade vital do indivduo. Sendo assim o VEF1 uma medida interessante, quando relacionada ao volume total a ser respirado. O volume expirado forado no primeiro segundo (VEF1) dividido pela capacidade vital, e multiplicado por 100, dar um percentual que reflete o ndice de Tiffeneau. O ndice de Tiffeneau evidencia um padro obstrutivo quando menor que 75%. Como o ndice de Tiffeneau dado por: (VEF1 / CV) x 100, tem-se a medida do percentual de ar expirado no primeiro segundo. Num indivduo normal, este percentual cerca de 90%; quando houver uma obstruo o percentual dever estar em torno de 75%. 4. O que nvel de significncia e como determinado? Quais so os valores mnimo e mximo que este pode assumir? Em Estatstica, um resultado significante e, portanto, tem significncia estatstica, se for improvvel que tenha ocorrido por acaso (que em estatstica e probabilidade tratado pelo conceito de chance), caso uma determinada hiptese nula seja verdadeira, mas no sendo improvvel caso a hiptese base seja falsa. A expresso teste de significncia foi cunhada por Ronald Fisher.1 Mais concretamente, no teste de hipteses com base em frequncia estatstica, a significncia de um teste est relacionada ao nvel de confiana ao rejeitar hiptese nula quado esta verdadeira (uma deciso conhecida como erro do tipo I). O nvel de significncia de um resultado tambm chamado de e no deve ser confundido com o valor p (p-value). O nvel de significncia no deve ser confundido com probabilidade de significncia, uma vez que no uma probabilidade. Por exemplo, ao fazer um teste com uma mdia, se fosse possvel repetir um nmero muito grande de amostras para calcular a mdia, em aproximadamente 5% dessas amostras, seria rejeitada a hiptese nula quando esta verdadeira. Assim, como em um experimento real, somente coletada uma amostra, espera-se que esta seja uma da 95% onde a hiptese nula realmente falsa. Assim tem-seconfiana no resultado obtido. Como outro exemplo, ao se calcular um intervalo de confiana 95%, equivalente a um erro Tipo I de 5%, tem-se confiana que o intervalo contm o parmetro estimado. No entanto, uma vez que reporta-se um intervalo numrico, o parmetro populacional desconhecido ou est dentro do intervalo ou fora; no existe uma probabilidade desse intervalo conter o parmetro. Outro exemplo: podemos escolher um nvel de significncia de 5%, e calcular um valor crtico de um parmetro (por exemplo a mdia) de modo que a probabilidade de ela exceder esse valor, dada a verdade da hiptese nula, ser 5%. Se o valor estatstico calculado (ou seja, o nvel de 5% de significncia anteriormente escolhido) exceder o valor crtico, ento o resultado significativo "ao nvel de 5%".

Se o nvel de significncia (ex: 5% anteriormente dado) menor, o valor menos provavelmente um extremo em relao ao valor crtico. Deste modo, um resultado que "significante ao nvel de 1%" mais significante do que um resultado que significante "ao nvel de 5%". No entanto, um teste ao nvel de 1% mais susceptvel de padecer doerro do tipo II do que um teste de 5% e por isso ter menos poder estatstico. Ao divisar um teste de hipteses, o tcnico dever tentar maximizar o poder de uma dada significncia, mas ultimamente tem de reconhecer que o melhor resultado que se pode obter um compromisso entre significncia e poder, em outras palavras, entre os erros de tipo I e tipo II. importante ressaltar que os valores p Fisherianos so filosoficamente diferentes dos erros de tipo I de Neyman-Pearson. Esta confuso infelizmente propagada por muitos livros de estatstica.2 5. Qual o significado do valor de p? Qual a diferena de e p? O que "significncia estatstica" (nvel-p) A significncia estatstica de um resultado uma medida estimada do grau em que este resultado "verdadeiro" (no sentido de que seja realmente o que ocorre na populao, ou seja no sentido de "representatividade da populao"). Mais tecnicamente, o valor do nvel-p representa um ndice decrescente da confiabilidade de um resultado. Quanto mais alto o nvel-p, menos se pode acreditar que a relao observada entre as variveis na amostra um indicador confivel da relao entre as respectivas variveis na populao. Especificamente, o nvel-p representa a probabilidade de erro envolvida em aceitar o resultado observado como vlido, isto , como "representativo da populao". Por exemplo, um nvel-p de 0,05 (1/20) indica que h 5% de probabilidade de que a relao entre as variveis, encontrada na amostra, seja um "acaso feliz". Em outras palavras, assumindo que no haja relao entre aquelas variveis na populao, e o experimento de interesse seja repetido vrias vezes, poderia-se esperar que em aproximadamente 20 realizaes do experimento haveria apenas uma em que a relao entre as variveis em questo seria igual ou mais forte do que a que foi observada naquela amostra anterior. Em muitas reas de pesquisa, o nvel-p de 0,05 costumeiramente tratado como um "limite aceitvel" de erro.

Como determinar que um resultado "realmente" significante? No h meio de evitar arbitrariedade na deciso final de qual nvel de significncia ser tratado como realmente "significante". Ou seja, a seleo de um nvel de significncia acima do qual os resultados sero rejeitados como invlidos arbitrria. Na prtica, a deciso final depende usualmente de: se o resultado foi previsto a priori ou apenas a posteriori no curso de muitas anlises e comparaes efetuadas no conjunto de dados; no total de evidncias consistentes do conjunto de dados; e nas "tradies" existentes na rea particular de pesquisa. Tipicamente, em muitas cincias resultados que atingem nvel-p 0,05 so considerados estatisticamente significantes, mas este nvel ainda envolve uma probabilidade de erro razovel (5%). Resultados com um nvel-p 0,01 so comumente considerados estatisticamente significantes, e com nvel-p 0,005 ou nvel-p 0,001 so freqentemente chamados "altamente" significantes. Estas classificaes, porm, so convenes arbitrrias e apenas informalmente baseadas em experincia geral de pesquisa. Uma conseqncia bvia que um resultado considerado significante a 0,05, por exemplo, pode no s-lo a 0,01.

Significncia estatstica e o nmero de anlises realizadas Desnecessrio dizer quanto mais anlises sejam realizadas em um conjunto de dados, mais os resultados atingiro "por acaso" o nvel de significncia convencionado. Por exemplo, ao

calcular correlaes entre dez variveis (45 diferentes coeficientes de correlao), seria razovel esperar encontrar por acaso que cerca de dois (um em cada 20) coeficientes de correlao so significantes ao nvel-p 0,05, mesmo que os valores das variveis sejam totalmente aleatrios, e aquelas variveis no se correlacionem na populao. Alguns mtodos estatsticos que envolvem muitas comparaes, e portanto uma boa chance para tais erros, incluem alguma "correo" ou ajuste para o nmero total de comparaes. Entretanto, muitos mtodos estatsticos (especialmente anlises exploratrias simples de dados) no oferecem nenhum remdio direto para este problema. Cabe ento ao pesquisador avaliar cuidadosamente a confiabilidade de descobertas no esperadas.

6. O que hiptese de nulidade (H0)? O que significa aceitar ou rejeitar H0? Em Estatstica, a hiptese nula, representada por , uma hiptese que apresentada sobre determinados fatos estatsticos e cuja falsidade se tenta provar atravs dum adequado teste de hipteses. Uma hiptese nula geralmente afirma que no existe relao entre dois fenmenos medidos. Por exemplo, em fsica: "o aumento da diferena de potencial no afeta a corrente em um condutor". Em pesquisa farmacolgica: "um tratamento mdico em potencial no tem nenhum efeito". Em pesquisa de mercado: "um aumento de 5% no preo de um determinado produto no afetar adversamente as vendas dele". uma hiptese que se pretende confrontar com os fatos. Muitas vezes uma afirmao quanto a um parmetro que uma propriedade estatstica de uma populao. Quando no possvel ou vivel observar toda a populao, o teste baseado na observao de uma amostra aleatria da populao. Tal parmetro freqentemente a mdia ou o desvio padro. Muitas vezes tal hiptese consiste em afirmar que os parmetros ou caractersticas matemticas de duas ou mais populaes so idnticos. Normalmente a hiptese nula formulada sob a forma duma igualdade, ou seja, uma hiptese simples. Exemplo Se quisermos comparar os resultados nos exames de duas amostras aleatrias de homens e mulheres, a hiptese nula poderia ser "que a mdia do resultado no exame da populao masculina do qual a primeira amostra foi retirada o mesmo que o da amostra de populao feminina, da segunda amostra": em que: H0 = a hiptese nula 1 = a mdia da populao 1, e 2 = a mdia da populao 2. Alternativamente, a hiptese nula pode postular que as duas amostras so retiradas da mesma populao:

Concluses possveis sobre a hiptese nula

Como foi referido, num teste de hipteses tenta provar-se a falsidade da hiptese nula. Assim, apenas duas decises podem ser tomadas: rejeitar a hiptese nula; no rejeitar a hiptese nula.

Saliente-se que no rejeitar a hiptese nula significa apenas que no se conseguiu, atravs dos dados disponveis, demonstrar a sua falsidade, o que difere completamente de provar a sua veracidade. Fazendo uma analogia com os processos judiciais, a hiptese nula que o ru inocente. Durante o julgamento tenta-se provar a falsidade desta hiptese, ou seja, que o ru culpado. Mas no caso de no se conseguir provar a culpa, isso no significa que o ru seja inocente; significa apenas que no foram encontradas provas suficientes. completamente diferente portanto, no rejeitar uma hiptese ou aceitar uma hiptese. O fato de no se poder aceitar a hiptese nula, mas apenas no a rejeitar, tem a ver com os erros que podem ser cometidos ao rejeitar ou no rejeitar a hiptese. Hiptese nula e hiptese alternativa[ Na maioria das vezes, ao mesmo tempo que se formula a hiptese nula, formula-se uma outra hiptese, contraditria primeira, chamada hiptese alternativa, denotada por . A hiptese alternativa, porm, no tem de ser a negao da hiptese nula. Por exemplo, supondo que formulamos a seguinte hiptese nula acerca do valor da mdia duma populao: H0: = Podemos formular as seguintes hipteses alternativas: H1: H1: < H1: > Cada par hiptese nula/hiptese alternativa conduz a um teste de hipteses diferente. Saliente-se que assumir uma diferente hiptese alternativa pode conduzir a uma deciso diferente relativamente hiptese nula. A escolha do par hiptese nula/hiptese alternativa depende do contexto do problema, do parmetro a testar e das concluses a que se pretende chegar, tendo em conta que a hiptese nula sempre formulada sob a forma de igualdade.

7. O que o teste ANOVA One Way e quando utilizado? A anlise estatstica um item crucial para uma boa pesquisa cientfica, pois ela d o alicerce para a discusso dos resultados e tambm credibilidade e confiabilidade nos dados. A anlise de varincia uma parte da estatstica que procura verificar diferenas entre mdias entre mais de dois grupos. As diferenas entre grupos podem ser de origem qualitativa (como tratamentos, classificaes ou agrupamentos) ou quantitativa (nmero de amostragens). A anlise de varincia constitui-se, em outras palavras, de um teste de hipteses com mais de dois grupos distintos. A sigla ANOVA vem do ingls Analysis of variance. Atualmente o mtodo amplamente utilizado na biolgica, engenharia, computao, economia e pesquisas de campo. O teste ANOVA foi criado por R. A. Fischer, e se divide em duas formas, o mtodo com um e dois critrios de avaliao. O teste ANOVA com um critrio de avaliao (one way) procura analisar a diferena simples entre grupos. O teste assume que a variao total da medida resultado da soma da variao entre grupos com a variao dentro do grupo. A partir disso, assumida como hiptese padro a igualdade entre as mdias, e ento realizada a razo entre a mdia total de varincia entre e dentro do grupo. O resultado obtido ento comparado com a tabela de distribuio F, com o respectivo valor de significncia (geralmente 0,05%) e os graus de liberdade entre e dentro dos grupos. Se o valor de F obtido for maior que o definido pela tabela de distribuio ento haver diferena significativa entre os grupos. A partir da possvel utilizar vrios mtodos para determinar qual grupo possui diferena significativa com os outros, por meio do teste de Tukey, Student-Newman-Keuls (SNK), Bonferroni, Dunnet ou Scheff, por exemplo. No caso do teste ANOVA com dois critrios de avaliao (two way), procura-se analisar a diferena entre grupos e tambm em subdivises no grupo. Por exemplo, analisar a diferena de diferentes remdios na populao e adotar tambm diferenas de idades entre os grupos. Neste caso, a hiptese padro ser a mesma, contudo assume-se que a variao total ser resultado da soma da variao entre os grupos, com a variao dos subgrupos e a variao residual entre os

grupos. A partir destas consideraes, o resto da anlise segue o mesmo procedimento do teste one way, inclusive utilizando os diversos testes citados para averiguar quais itens possuem diferenas significativas. O ANOVA basicamente um teste paramtrico, onde se faz necessrio que os dados possuam distribuio normal e que tenham homocedasticidade (igualdade entre varincias). Contudo, em muitos casos os dados coletados em pesquisas cientficas no apresentam estas caractersticas, por isso testes no-paramtricos se tornam necessrios para uma boa avaliao estatstica. O teste ANOVA no-paramtrico (ou teste de Kruskal-Wallis) possui a mesma forma bsica que o anterior, contudo algumas correes so feitas para correo do calculo da significncia e do valor de F. E da mesma forma como a forma paramtrica, possvel realizar anlises tambm em subdivises no grupo. O teste ANOVA, portanto uma ferramenta de fundamental importncia para se analisar com confiabilidade os dados de um experimento. Contudo, deve-se ressaltar que a estatstica inteira de extrema importncia, pois um ramo da matemtica que se preocupa com a anlise de dados, e por isso deveria ser mais estudada tanto no ensino bsico quando no superior. Alm disso, tambm deveria ser mais utilizado no campo da pesquisa cientfica.

8. O que o teste de Tukey e por que se diz que ele complementa o teste ANOVA?

9. O que o teste T-Student Pareado e quando utilizado? O teste t de Student ou somente teste t um teste de hiptese que usa conceitos estatsticos para rejeitar ou no uma hiptese nula quando a estatstica de teste ( ) segue uma distribuio t de Student. Essa premissa normalmente usada quando a estatstica de teste, na verdade, segue uma distribuio normal, mas a varincia da populao 2 desconhecida. Nesse caso, usada a varincia amostral 2 e, com esse ajuste, a estatstica de teste passa a seguir uma distribuio t de Student. Histria A estatstica t foi introduzida em 1908 por William Sealy Gosset, qumico da cervejaria Guinness em Dublin, Irlanda ("student" era seu pseudnimo).1 2 3 Gosset havia sido contratado devido poltica inovadora de CLaude Guinness de recrutar os melhores graduados de Oxford e Cambridge para os cargos de bioqumico e estatstico da indstria Guinness.2 Gosset desenvolveu o Teste t como um modo barato de monitorar a qualidade da cerveja tipo stout. Ele publicou o Teste t na revista acadmica Biometrika em 1908, mas foi forado a usar seu pseudnimo pelo seu empregador, que acreditava que o fato de usar estatstica era um segredo industrial. De fato, a identidade de Gosset no foi reconhecida por seus colegas estatsticos. 4 Conceito

Funo Densidade de Probabilidade para t de Student, indicando o nvel de confiana valor unicaudal para determinado t

e o p-

Funo Densidade de Probabilidade para t de Student, indicando o nvel de confiana e o pvalor bicaudal para determinado t Se forem feitas inmeras amostras de tamanho a partir da mesma populao e se fossem tiradas as mdias de uma varivel dessa populao que possui uma distribuio normal, a distribuio dessas inmeras mdias seguiria umadistribuio t de Student. Por exemplo, imaginemos que a altura das pessoas segue uma distribuio normal. Se selecionarmos diversas amostras aleatrias de 100 pessoas e calculssemos a mdia da altura das pessoas de cada amostra, essa mdia da altura das pessoas seguir uma distribuio t de Student. Perceba que, na distribuio t de Student, valores muito baixos ou muito altos tem menor probabilidade de ocorrer, indicando que menos provvel que a mdia de uma amostra apresente valores muito distantes da mdia da populao. O formato da distribuio t de Student depende do nmero de graus de liberdade. Quanto maior o nmero de graus de liberdade, mais "concentrada" a distribuio. Para valores muito grandes de graus de liberdade, a distribuio t de Student se aproxima da distribuio normal. O Teste t consiste em formular uma hiptese nula e consequentemente uma hiptese alternativa, calcular o valor de conforme a frmula apropriada (abaixo) e aplic-lo funo densidade de probabilidade da distribuio t de Student medindo o tamanho da rea abaixo dessa funo para valores maiores ou iguais a . Essa rea representa a probabilidade da mdia dessa(s) amostra(s) em questo ter(em) apresentado o(s) valor(es) observado(s) ou algo mais extremo. Se a probabilidade desse resultado ter ocorrido for muito pequena, podemos concluir que o resultado observado estatisticamente relevante. Essa probabilidade tambm chamada de pvalor ou valor p. Consequentemente, o nvel de confiana igual a 1 - p-valor. Normalmente usado um "ponto de corte" para o p-valor ou para o nvel de confiana para definir se a hiptese nula deve ser rejeitada ou no. Se o p-valor for menor que esse "ponto de corte", a hiptese nula rejeitada. Caso contrrio, a hiptese nula no rejeitada. comum que sejam usados os "pontos de corte" para p-valor 0,1%, 0,5%, 1%, 2% ou 5%, fazendo com que os nveis de confiana sejam, respectivamente, 99,9%, 99,5%, 99%, 98% ou 95%. Caso seja usado o p-valor 5% como "ponto de corte" e a rea abaixo da funo densidade de probabilidade da distribuio t de Student seja menor do que 5%, pode-se afirmar que a hiptese nula rejeitada com nvel de confiana de 95%. Note que no rejeitar a hiptese nula no a mesma coisa que afirmar que a hiptese alternativa vlida com o mesmo nvel de confiana. Isso seria uma interpretao incorreta do teste. Unicaudal vs. Bicaudal Dependendo da definio da hiptese nula, deve ser usado uma ou duas caudas da distribuio t de Student na avaliao do teste. Por exemplo, se a hiptese nula for e a hiptese alternativa , o teste deve ser feito somente para valores maiores do que e, portanto, ao consultar a funo densidade de probabilidade da distribuio t de Student, deve-se considerar somente a rea superior a , ou seja, somente uma das "caudas" da distribuio. Por outro lado, se a hiptese nula for e, consequentemente, a hiptese alternativa , teramos que avaliar ao mesmo tempo a possibilidade de e

de . Para isso, ao consultar a funo densidade de probabilidade da distribuio t de Student , devem ser consideradas as reas abaixo da curva para valores superiores a e inferiores a , ou seja, as duas "caudas" da distribuio. Como a distribuio simtrica, os tamanhos dessas reas so iguais. Teste t para mdia de uma amostra O teste t para mdia de uma amostra consiste em medir a probabilidade da mdia da amostra em questo ter apresentado o valor observado ou algo mais extremo, dada a mdia da populao . Para fazer isso, estipulamos, por exemplo, que a hiptese nula e que, por consequncia, a hiptese alternativa . Usamos a seguinte frmula para o clculo da estatstica t:

, onde: : Mdia da amostra; : Valor fixo usado para comparao com a mdia da amostra; : Desvio padro amostral; : Tamanho da amostra. Quanto maior , mais confiana temos ao rejeitar a hiptese nula, ou seja, mais certeza temos ao afirmar que no verdadeiro. Note que, na frmula acima, quanto maior , maior ser . Ou seja, quanto maior a distncia dos valores observados ao valor que estamos comparando, mais certeza teremos em afirmar que eles so diferentes. Do mesmo modo, aumenta quando o tamanho da amostra maior ou quando o desvio padro menor. Teoricamente, o desvio padro a ser usado deveria ser o da populao (normalmente identificado com o smbolo ), mas em muitos casos prticos esse valor desconhecido, sendo necessrio aproxim-lo pelo desvio padro amostral :

Exemplo prtico Determinado carro consegue percorrer 15 km a cada litro de combustvel gasto em uma estrada plana e de boas condies, mas essa distncia pode variar devido a diversos fatores. Digamos que a distncia percorrida por litro de combustvel tenha uma distribuio normal com mdia 15 km e desvio padro de 2 km. Suponhamos que seja feita uma modificao no motor desse carro com o objetivo de aumentar a distncia percorrida por litro de combustvel. Depois da modificao, foram realizados 10 testes. Nesses testes, a mdia das distncias percorridas por litro de combustvel foi de 16,6 km. A princpio, como 16,6 km uma distncia superior a 15 km, parece que a modificao no motor aumentou a distncia percorrida por litro de combustvel. Mas, para comprovar esse efeito de forma estatstica, definimos a hiptese nula e calculamos o valor de . Neste caso, temos:

Assim,

Conforme a funo de densidade de probabilidade da distribuio t de Student com 9 (10-1) graus de liberdade, existe 1,61% de probabilidade de valores superiores a 2,53 terem sido obtidos caso a distncia percorrida por litro de combustvel no ter sido alterada. Se estivermos usando nvel de confiana de 95%, rejeitaramos a hiptese nula . Isso pode ser explicado de duas formas: A probabilidade obtida com o t calculado (1,61%) inferior ao "ponto de corte" do pvalor (5%), ou O valor t do "ponto de corte" escolhido (95% de confiana, que corresponde ao t de 1,833), inferior ao t calculado (2,53). Na primeira explicao, necessrio calcular a rea abaixo da funo densidade de probabilidade da distribuio t de Student com 9 graus de liberdade para valores superiores a 2,53 usando algum software estatstico ou planilha de clculo. Na segunda explicao, alm dos softwares estatsticos ou planilhas de clculo, tambm poderia-se chegar no valor 1,833 usando uma tabela de valores para distribuio t de Student, que normalmente constam em livros de estatstica. Perceba que, se usssemos nvel de confiana de 99%, ao invs de 95%, no rejeitaramos a hiptese nula porque: A probabilidade obtida com o t calculado (1,61%) superior ao "ponto de corte" do pvalor (1%), ou O valor t do "ponto de corte" escolhido (99% de confiana, que corresponde ao t de 2,821), superior ao t calculado (2,53). Teste t para mdias de duas amostras Tamanhos iguais, varincias iguais Este teste s deve ser usado quando: o tamanho das amostras (n) dos dois grupos so iguais; Podemos assumir que as duas distribuies possuem a mesma varincia. A estatstica t calculada conforme a frmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste

Tamanhos diferentes, varincias iguais Este teste s deve ser usado quando podemos assumir que as duas distribuies possuem a mesma varincia. A estatstica t calculada conforme a frmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste

Tamanhos diferentes, varincias diferentes Este teste usado quando as amostras possuem varincias diferentes. Para confirmar se as varincias so realmente diferentes, recomendvel realizar um teste de varincias.

A estatstica t calculada conforme a frmula:

,onde

A quantidade de graus de liberdade a ser usado nesse teste :

Essa equao chamada de Equao WelchSatterthwaite. Teste t para coeficiente de regresses O Teste t tambm pode ser usado para testar a significncia de coeficientes de regresses. Em geral esse teste usado para confirmar se a varivel que est sendo usada na regresso est realmente contribuindo para a estimativa.

10. O que significa afirmar que os grupos so estatisticamente diferentes ou estatisticamente iguais?

Anda mungkin juga menyukai