Anda di halaman 1dari 53

UNIVERSIDADE FEDERAL DA BAHIA INSTITUTO DE MATEMTICA DEPARTAMENTO DE ESTATSTICA

NOTAS DE AULA MAT236 MTODOS ESTATSTICOS 3 UNIDADE

Elaborada pelas professoras: Giovana Silva, Lia Moraes, Rosana Castro e Rosemeire Fiaccone

Revisada em 2013.1 pelas professoras: Gecynalda Gomes e Silvia Regina

14. Testes de Aderncia (ou Testes de Bondade de Ajustamento)


No contedo apresentado na apostila anterior foi admitido que a varivel aleatria de interesse tivesse uma determinada distribuio de probabilidade. O problema era relacionado a ter um ou mais parmetros desconhecidos, associado a uma distribuio de probabilidade conhecida (ou aproximada). Entretanto, pode acontecer de termos observaes de uma varivel aleatria e no se ter a menor ideia de sua distribuio de probabilidade. Neste caso, uma das formas iniciais de anlise construir um grfico (colunas, histograma ou boxplot, etc.) com os valores da varivel cuja distribuio na populao desconhecida para tentar entender o comportamento desta varivel. E, em seguida, sugerir um modelo adequado para os dados. O modelo probabilstico proposto pode ser testado atravs do Teste de Aderncia. Os Testes de Aderncia ou Testes de Bondade de Ajustamento uma classe de testes que permitem verificar se uma amostra de valores X1, X2,..., Xn so provenientes de uma varivel aleatria com uma determinada distribuio de probabilidade, como por exemplo, Normal, Exponencial, Poisson ou qualquer outra distribuio. Na literatura, existem vrias maneiras de realizar os Testes de Aderncia, porm neste texto ser apresentado apenas pelo Teste Qui-Quadrado (2).

14.1.

Teste de Qui-Quadrado (2) de Aderncia

O teste de Qui-quadrado de Aderncia utilizado para comparar se as freqncias observadas da varivel de interesse obtida na amostra aleatria diferem muito das freqncias esperadas. Estas, geralmente, sendo especificadas por uma distribuio de probabilidade. Considere n observaes independentes de uma varivel aleatria X com funo de distribuio no especificada. Cada observao classificada em uma das k categorias, de forma que a seguinte tabela de contingncia pode ser construda. Varivel Freqncias Observadas Categorias 1 O1 2 O2 3 O3 ... ... k Ok

Na tabela acima, Oi representa a freqncia observada na clula i, para i= 1, 2, 3,..., k. As hipteses estatsticas a serem testadas so: H0: A varivel X segue o modelo proposto; H1: A varivel X no segue o modelo proposto.
1

A estatstica de teste dada por:



2

em que tem distribuio aproximadamente Qui-Quadrado com graus de liberdade, supondo que a hiptese nula seja verdadeira, e: k: o nmero de categorias; Oi: frequncia observada na i-sima categoria; Ei: frequncia esperada na i-sima categoria, dada por Ei=npi; pi = probabilidade da categoria i, supondo que H0 verdadeira. = k-1 se as frequncias esperadas puderem ser calculadas sem precisar estimar os parmetros da distribuio.
Para um dado nvel de significncia , rejeitar a hiptese nula se > ; , em que ;

( ) ~

> ; ) = . Ou pelo p-valor, rejeitar a hiptese nula se p-valor < . uma constante tal que (

Vale mencionar que a estatstica de teste apresentada acima tem distribuio

aproximadamente Qui-Quadrado e esta aproximao torna-se satisfatria quando as frequncias esperadas so grandes. Para assegurar que esta aproximao seja boa necessrio levar em considerao as seguintes observaes adiante: i. Quando o nmero de categorias for igual a dois (k=2) as frequncias esperadas dentro de cada categoria devem ser iguais ou superiores a 5. ii. Quando k > 2, no deve ter mais de 20% das categorias com frequncias esperadas menores que 5 e nenhuma frequncia esperada igual a zero. iii. Quando as categorias apresentarem pequenas frequncias esperadas elas podem ser combinadas com outras categorias, de tal forma que o sentido do trabalho seja conservado. Quando desejamos testar se uma varivel segue um determinado modelo, mas so desconhecidos um ou mais parmetros da distribuio, devemos primeiro estim-los de forma apropriada. Nestes casos, = k-m-1, em que m o nmero de parmetros que precisam ser estimados.

Exemplo 14.1: (Adaptado de Magalhes & Lima, 2006) Deseja-se verificar a afirmao de que a porcentagem de cinzas contidas em carvo, produzido por uma empresa, segue distribuio Normal. Os dados, apresentados a seguir, representam a quantidade percentual de cinzas encontradas em 250 amostras de carvo analisadas em laboratrio.

Cinzas (em %) 1 2 3 4 5 6 7 8 9 10 9,5 | 10,5 10,5 | 11,5 11,5 | 12,5 12,5| 13,5 13,5| 14,5 14,5| 15,5 15,5| 16,5 16,5| 17,5 17,5| 18,5 18,5| 19,5

Nmero de observaes 2 5 16 42 69 51 32 23 9 1

Qual deciso devemos tomar ao nvel de significncia de 2,5%? Soluo: Como desconhecemos a mdia e a varincia da distribuio Normal que ser testada, precisamos obter suas estimativas a partir da amostra. Os melhores estimadores para os parmetros e 2 so a mdia amostral ( X ) e a varincia amostral (S2), respectivamente. Calculando esses valores temos que X =14,5 e S2=2,7. Seja a varivel aleatria X: porcentagem de cinzas contidas no carvo produzido pela empresa. As hipteses a serem testadas so: H0: X tem distribuio Normal versus H1: X tem outra distribuio.

As diversas faixas que constituem as categorias de valores da varivel X sero enumeradas de 1 a 10. De modo a varrer os valores do intervalo (-,), correspondentes ao modelo Normal, acrescentando s categorias 1 e 10 os valores, respectivamente, menores que 9,5 e maiores que 19,5. Dessa forma, para calcular as frequncias esperadas, procedemos da seguinte forma, por exemplo: para categoria 1, = 250P(X < 10,5) = 250P Z <
10,514,5

Para as categorias de 2 a 9, so calculados de forma anloga. A ltima categoria, = 250P(X > 18,5) = 250P Z >
18,5 14,5

2,7

= 250P(Z < 2,43) = 1,875; = 250P(Z > 2,43) = 1,875

As probabilidades calculadas anteriormente supem que H0 verdadeira, assim foi usada a tabela da Normal Padro.

2,7

As frequncias esperadas so apresentadas na tabela, a seguir, e devem somar 250, o que no foi possvel devido aos arredondamentos efetuados. Categorias 1 2 3 4 5 6 7 8 9 10 Frequncia esperada 1,875 6,825 19,400 39,925 57,275 57,275 39,925 19,400 6,825 1,875

Observamos que exatamente 20% das categorias apresentaram frequncias inferiores a 5, as categorias 1 e 10. Efetuando o clculo da estatstica de teste, temos = (2 1,875) (5 6,825) (1 1,875) + + + = 7,6303 1,875 6,825 1,875

Para determinar a regio crtica, utilizamos a distribuio Qui-Quadrado com 10-1-2=7


. Com auxlio da tabela da Qui-Quadrado, obtemos ; ,% = 16,01.

graus de liberdade, pois perdemos dois graus de liberdade devido estimao dos parmetros e 2
Concluso: Como = 7,6303 < ; ,% = 16,01, logo no rejeitamos a hiptese nula, ou

seja, no existem evidncias para rejeitar a hiptese de que a amostra proveniente de uma varivel aleatria com distribuio normal, ao nvel se significncia de 2,5%.

Na literatura existem outros procedimentos para realizar o Teste de Aderncia, a saber: o Teste Kolmogorov- Smirnov, o Teste de Shapiro-Wilk para Normalidade e o Teste de Lilliefors para Normalidade. Para maiores detalhes sobre estes testes consultar as seguintes referncias: Siegel & Castellan (2006), Campos (1979), Conover (1999) e Hollander & Wolf (1999).

Exerccios 1. O quadro abaixo se refere ao nmero de acidentes sofridos por um grupo de mineiros durante um trabalho numa mina de carvo. O interesse investigar se a distribuio de acidentes segue o modelo Poisson (=1,45). (Use =5%)

N de acidentes N de mineiros

0 35

1 47

2 39

3 20

4 5

5 2

R: Modelo no rejeitado, Regio Crtica [ 11,07; ) e =1,0833.

2. Uma indstria registra, em cada semana, o nmero de dias em que ocorrem acidentes de trabalho. Para uma amostra de 200 semanas, verifique se os dados apresentados a seguir, aderem ao modelo Binomial com parmetros n=5 e p=0,2. (Use =10%). N de dias com acidentes Freqncia 0 64 1 56 2 40 3 24 4 8 5 8

R: Modelo rejeitado, Regio Crtica [7,78; ) e =189,2.

15.

Planejamento e Experimento
A experimentao parte de um processo cientfico que, geralmente, obtm os dados atravs de

um processo de experimento planejado de forma que possam ser analisados atravs de mtodos estatsticos. O pesquisador Sir Ronald Fischer foi quem introduziu os primeiros estudos sobre planejamento e experimentos e os conceitos de anlise de varincia como um mtodo de anlise estatstica de delineamentos experimentais, procedimento amplamente utilizado atualmente. A Anlise de Varincia (ANOVA) um procedimento utilizado para comparar trs ou mais tratamentos. Existem muitas variaes da ANOVA devido aos diferentes tipos de experimentos que podem ser realizados. Aqui, iremos estudar apenas a anlise de varincia com um fator. Vale mencionar que a ANOVA tambm pode ser aplicvel a dados observacionais. Inicialmente, so apresentados alguns conceitos utilizados em planejamento de experimentos e na anlise de varincia.

i) Tratamento: Um tratamento uma condio imposta ou objeto que se deseja medir ou avaliar em um experimento. Geralmente, em um experimento, utilizado mais de um tratamento. Por exemplo, equipamentos de diferentes marcas, diferentes tamanhos de peas, quantidade de lubrificante em uma mquina, temperatura de armazenamento de um alimento, etc. Os tratamentos que podem ser dispostos em uma ordem, como por exemplo, quantidades de lubrificante, nveis de temperatura, so ditos tratamentos quantitativos. J os tratamentos que no
5

podem ser dispostos numa ordem, so ditos tratamentos qualitativos, por exemplo, variedades de plantas, mtodos de preparao de alimento, marcas de equipamentos, entre outros. Geralmente, o interesse avaliar o efeito do tratamento sobre a mdia de uma caracterstica.

ii) Unidade experimental A aplicao do tratamento feita na unidade experimental que fornece os dados para serem avaliados. Por exemplo, um motor, uma pea do motor, uma poro de algum alimento, etc. As unidades experimentais podem ser formadas por grupos ou indivduos, cujo uso depende do fenmeno que se est estudando, da forma como o experimento conduzido e dos recursos disponveis. De modo geral, a escolha da unidade experimental deve ser feita de forma a minimizar o erro experimental e representar satisfatoriamente o processo do sistema.

iii) Repetio Repetio o nmero de vezes que um tratamento aparece no experimento. O nmero de repeties, em um experimento, vai depender tambm dos recursos disponveis, do delineamento do experimento e, tambm, da variabilidade do experimento ou da varivel resposta. Existem vrias metodologias para estimar o nmero satisfatrio de repeties em um experimento. Mas, em funo das possveis limitaes acima, a definio do nmero de repeties, na maioria vezes, depende da experincia do pesquisador sobre o fenmeno em estudo. Alm disso, as metodologias empregadas, para esse clculo, pressupem que uma estimativa do erro experimental seja conhecida.

Exemplo 15.1: Um fabricante de papel usado para a confeco de sacolas de mercearia est interessado em melhorar a fora de resistncia do produto. A engenharia de produo acha que a fora de resistncia uma funo da concentrao de madeira de lei na polpa, e que a amplitude das concentraes da madeira de lei de interesse prtico est entre 5% e 20%. Uma das engenheiras responsveis pelo estudo decide investigar quatro nveis de concentrao de madeira de lei: 5%, 10%, 15% e 20%. Ela decide, tambm, fazer seis repeties de teste de cada nvel de concentrao usando uma usina-piloto. Todos os 24 espcimes so testados em um testador de trao de laboratrio, em ordem aleatria. Os dados desse experimento constam na Tabela 15.1. Esse um exemplo de um experimento de fator nico completamente aleatorizado, com quatro nveis do fator, ou seja, quatro tratamentos. E cada tratamento tem seis observaes ou repeties. importante que se faa a anlise grfica dos dados obtidos atravs de um experimento concentrao de madeira de lei. Esse grfico indica que a mudana na concentrao de madeira
6

de lei tem um efeito na fora de resistncia, ou seja, existem evidncias de que maiores concentraes de madeira de lei produzem maiores foras de resistncias observadas. Alm disso, a variabilidade na fora de resistncia no muda drasticamente com a mudana da concentrao de madeira de lei. Tabela 15.1: Fora de resistncia do papel (psi) Concentrao de madeira de lei
5% 10% 15% 20%

Repetio (ou observao)


1 7 12 14 19 2 8 17 18 25 3 15 13 19 22 4 11 18 17 23 5 9 19 16 18 6 10 15 18 20

Totais Mdias
60 94 102 127 383 10,00 15,67 17,00 21,17 15,96

Fonte: Hines, Montgomery, Goldman e Borror (2006). Probabilidade e Estatstica na Engenharia. 4 ed.

15.1.

Em um experimento, cada observao pode ser decomposta conforme o modelo a seguir: = + + , = 1 , . . . , = 1 , . . . , a observao do i-simo tratamento na j-sima unidade experimental; o efeito do i-simo tratamento; o efeito constante (mdia geral) ;

A Anlise de Varincia

em que:

~(0, ), independentes e identicamente distribudos.


: = = =

o erro associado ao i-simo tratamento na j-sima unidade experimental assumido como:

Em um experimento, existe o interesse em testar se h diferenas entre as mdias dos

tratamentos, o que equivale a testar as hipteses estatsticas:


: para algum e algum tais que .

As k populaes podem ser vistas como k nveis de um mesmo fator. A questo saber se o fator exerce alguma influncia na variao da caracterstica em estudo. Suposies: So necessrias as seguintes suposies quando testamos a hiptese de que trs ou mais amostras provm de populaes com a mesma mdia: i. ii. iii. As amostras so aleatrias e independentes. As populaes tm distribuies normais.
= = = = ). Hiptese de As populaes tm varincias homogneas (

Homocedasticidade.

Note que, se a hiptese nula for verdadeira, todos os tratamentos tero uma mdia comum . A anlise de varincia baseia-se na decomposio da variao total da varivel resposta em partes que podem ser atribudas aos tratamentos (varincia entre) e ao erro experimental (varincia dentro). Essa variao pode ser medida por meio das somas de quadrados definidas para cada um dos seguintes componentes:
total = ,

trat

. = , . =

em que = diferena:

, = e a soma de quadrados dos resduos pode ser obtida pela

tratamentos e a res chamada de variao Dentro que funo das diferenas existentes entre as repeties de um mesmo tratamento.

A trat

res = total trat . tambm chamada de variao Entre, que a variao existente entre os diferentes

Essas somas de quadrados podem ser organizadas em uma tabela, denominada tabela da anlise de varincia, como apresentado na Tabela 15.2. Para testar a hiptese , utiliza-se a estatstica de teste F apresentado na tabela da Anlise

de Varincia. Convm lembrar que esse teste vlido se os pressupostos assumidos para os erros do modelo estiverem satisfeitos. Tabela 15.2: Anlise de varincia Fonte de variao Tratamentos Resduo Total Graus de liberdade 1 1 Soma de quadrados trat res total Quadrados mdios trat res

F calculado trat /res

em que trat = trat /( 1) e res = res /( ).

pressupostos da ANOVA devem ser testados ou avaliados em qualquer anlise.

tratamentos as varincias ( ) devem ser homogneas e ( , ). Por esses motivos, os Se calculado > tabelado , rejeitamos a hiptese de nulidade , ou seja, existem evidncias de

graus de liberdade, supondo que, so variveis aleatrias independentes, em todos os

Pode-se mostrar que o quociente trat /res tem distribuio com ( 1) e ( )

significncia escolhido. Caso contrrio, no rejeitamos a hiptese de nulidade , ou seja, no h evidncias de diferena significativa entre tratamentos, ao nvel de significncia escolhido.

diferena significativa entre pelo menos um par de mdias de tratamentos, ao nvel de Outra maneira de avaliar a significncia da estatstica utilizando o -valor. Se o -valor < , seja, no h evidncias de diferenas significativas entre os tratamentos, ao nvel de significncia

rejeitamos a hiptese de nulidade . Caso contrrio, no rejeitamos a hiptese de nulidade , ou escolhido.

Exemplo 15.2 : Considere o experimento sobre a concentrao de madeira de lei. Podemos usar a anlise de varincia para testar a hiptese de que concentraes de madeira de lei no afetam a fora mdia de resistncia de papel. Os resultados esto resumidos na tabela a seguir: Tabela da anlise de varincia Graus de Soma de Quadrados mdios liberdade quadrados 3 382,79 127,60 130,17 6,51 20 512,96 23 calculado 19,61 -valor

Fonte de variao Tratamentos (Concentrao) Resduo Total

3,59E-06

lei na polpa afeta a maneira significante a resistncia do papel. Chegamos mesma concluso ao observarmos o -valor = 0,00000359 < 0,05 = .

Concluso: Como ,;; = 3,03, rejeitamos e conclumos que a concentrao da madeira de

15.2. Teste de Tuckey

O procedimento seguinte, quando de interesse do pesquisador, o de comparar as mdias de tratamentos utilizando algum teste de comparao de mdias ou contrastes para identificar qual(is) tratamento(s) (so) diferente(s). Aps concluirmos que existe diferena significativa entre tratamentos, por meio do teste ,

podemos estar interessados em avaliar a magnitude destas diferenas utilizando um teste de comparaes mltiplas. O teste de Tukey permite testar qualquer contraste, sempre, entre duas mdias de tratamentos, ou seja, no permite comparar grupos entre si. O teste baseia-se na diferena significante HSD=, denominada de Honestly Significant Difference. Esta diferena, para dados balanceados, dada da seguinte forma: res = (, ) ,

em que, a amplitude total studentizada (tabelada), res o quadrado mdio do resduo, e o liberdade do resduo. Tambm, em um teste de comparaes de mdias, deve-se determinar um nvel de significncia para o teste. Normalmente, utiliza-se o nvel de 5% ou 1% de significncia.

nmero de repeties. O valor de depende do nmero de tratamentos e do nmero de graus de

10

significativo o valor de calculado , no se encontrem diferenas significativas entre contrastes de mdias. Duas mdias, . e . , ( ), so consideradas significantemente diferentes se . . > .

Como o teste de Tukey , de certa forma, independente do teste , possvel que, mesmo sendo

mnimo .

O procedimento de Tuckey tem a propriedade de que o nvel de significncia, em geral, no

Lembrando que = 4, = 6, res = 6,51 e = 20. As mdias dos tratamentos so: . = 10,00 psi, . = 15,67 psi, . = 17,00 psi e . = 21,17 psi. valor , (4,20) = 3,96. Calculando , temos

Exemplo 15.3: Aplicando o teste de Tukey s mdias dos tratamentos do exemplo anterior.

Atravs da tabela da distribuio de amplitude total studentizada, com = 0,05 encontramos o res 6,51 = , (4,20) = 3,96 = 4,12 6

Portanto, conclumos que as duas mdias so significantemente diferentes se . . > 4,12. As diferenas nas mdias dos tratamentos so:

| . | = |10,00 15,67| = 5,67, . | . . | = |10,00 17,00| = 7,00, | . . | = |10,00 21,17| = 11,17, | . | = |15,67 17,00| = 1,33 . | . . | = |15,67 21,17| = 5,50, | . . | = |17,00 21,17| = 4,17. Por essa anlise, vemos diferenas significantes entre todos os pares de mdias, exceto entre os tratamentos 2 e 3. Exerccios:

1) Est sendo estudada a fora de compresso do concreto. Quatro tcnicas de misturas diferentes esto sendo investigadas. Foram coletados os seguintes dados: Tabela: Fora de compresso (psi)
Tcnica de mistura 1 2 3 4 Repetio (ou observao) 1 2 3 4 3129 3000 2865 2890 3200 3300 2975 3150 2800 2900 2985 3050 2600 2700 2600 2765 11

Fonte: Hines, Montgomery, Goldman e Borror (2006). Probabilidade e Estatstica na Engenharia. 4 ed.

b) Use o teste de Tuckey para fazer comparaes entre os pares de mdias.


a)R. Tabela da anlise de varincia Soma de Quadrados quadrados mdios 489740 153908 643648 163247 12826 Fcalculado 12,73

a) Teste a hiptese de que as tcnicas de mistura afetam a fora do concreto. Use = 0,05.

Fonte de variao Tratamentos (Tcnica) Resduo Total

Graus de liberdade 3 12 23

p-valor 0,000489

b)R. 12826 res = , (4,12) = 4,2 = 237,83 4

Existem evidncias de diferenas significantes entre os pares de mdias entre os tratamentos 1 e 4, tratamentos 2 e 4, tratamentos 3 e 4.

16. Homogeneidade das Varincias


Uma importante pressuposio na anlise de varincia a homogeneidade das varincias da varivel de interesse das populaes envolvidas. Para testar a homogeneidade das varincias, utilizam-se das seguintes hipteses estatsticas:
H : = = = = = ;

H : pelo menos uma varincia difere das demais.

respectivamente sendo n = n . O estimador da varincia combinada das k populaes dado por: 1 S = (n 1)S nk
A estatstica de teste sugerida por Bartlett dada por:
( ) )( ) )( ) [(S (S (S ) ] B= S /()

Considere que S , S , , S so as varincias amostrais de tamanho n , n , , n ,

Supondo que a hiptese nula verdadeira, esta estatstica de teste tem distribuio de Bartlett. A tabela com os percentis da distribuio desta estatstica de teste fornece os valores crticos, B (; n), para = 1% e 5%; k = 2, 3, ,10; e valores de n de 3 a 100.

12

ao nvel de significncia , se o valor da estatstica de teste B < B (; n), em que B (; n) o valor crtico que deixa uma rea de tamanho na cauda esquerda da distribuio de Bartlett. significncia , se B < B (; n , n , , n ) em que B (; n , n , , n ) n B (; n ) + n B (; n ) + + n B (; n ) n Quando os tamanhos das amostras so diferentes, a hiptese nula rejeitada, ao nvel de

Para o caso em que os tamanhos das amostras so todas iguais, a hiptese nula rejeitada,

em que todos os B (; n) para tamanhos de amostras n , n , , n so obtidos da tabela da distribuio de Bartlett.

Exemplo 16.1: Use o Exemplo 15.1 para realizar o teste de Bartlett, ou seja, realize o teste de hipteses, ao nvel de significncia de 1%, de que as varincias populacionais para o conjunto de dados sobre a fora de resistncia de papel usado para a confeco de sacolas, com diferentes concentraes madeira de lei, so iguais. Soluo: As hipteses estatsticas a serem testadas so:
H : = = = = ;

Tem-se que n = n = n = n = 6, k=4. As varincias amostrais so:


s = 8,00 s = 7,87 s = 3,20 s = 6,97

H : pelo menos uma varincia difere das demais.

E a varincia combinada
S =

Agora, calcule

5(8,00) + 5(7,87) + 5(3,20) + 5(6,97) 130,17 = = 6,5083 20 20


/()

Concluso: Com auxlio da tabela de Bartlett, obtemos B (0,01; 6), = 0,5430. Como existem evidncia de que as varincias populacionais para dos conjunto de dados sobre a fora de resistncia de papel usado para a confeco de sacolas, com diferentes concentraes madeira de lei, so diferentes, ao nvel de significncia de 1%. Na literatura existem outros procedimentos para realizar o teste de homogeneidade das varincias, a saber: teste de Cochran e Levene. O teste de Bartlett mais eciente para testar a homogeneidade de varincias quando as variveis envolvidas no estudo possuem distribuio
13

[(8,00)() (7,87)() (3,20)() (6,97)() ] B= 6,5083

= 0,9404

B (0,01; 6) = 0,5430 < = 0,9404

no rejeitamos a hiptese nula e conclumos que no

normal (ou aproximadamente normal). Se a hiptese de normalidade for violada, melhor utilizar o teste proposto por Levene.

17. Anlise de Regresso

Frequentemente estamos interessados em estudar como duas ou mais variveis esto associadas. Algumas vezes o interesse apenas medir o grau de associao e outras vezes desejamse obter um modelo matemtico-estatstico que seja capaz de descrever a relao funcional entre as variveis. Para investigar e modelar a relao entre elas, usa-se a Anlise de Regresso. Quando estamos estudando o comportamento de apenas duas variveis x e y que supostamente se relacionam atravs de uma funo linear, devemos considerar a seguinte equao: em que representa um erro aleatrio e pode ser pensado como uma falha da equao linear em se ajustar aos dados exatamente. Este modelo chamado de Modelo de Regresso Linear Simples. Para estimar os parmetros 0 e 1, uma amostra de pares (x,y) deve ser coletada e analisada. A varivel x conhecida como varivel preditora ou independente e y conhecida como varivel resposta ou dependente. Obtemos um modelo mais geral quando a varivel resposta pode ser relacionada a k variveis preditoras, x1, x2, ..., xk e, neste caso, o modelo adequado seria: Este modelo chamado Modelo de Regresso Linear Mltipla.
= + + + + + . = + + ,

Nem sempre um modelo de regresso linear o mais adequado para uma determinada situao. Algumas vezes, devemos modelar a relao entre variveis utilizando funes no lineares ou mesmo fazendo alguma transformao funcional na(s) varivel(s) de modo a obter linearidade. Em todos os casos importante destacar que um modelo de regresso no implica numa relao de causa-e-efeito. Para estabelecer causalidade, a relao entre as variveis preditoras e a resposta deve ter uma base alm do conjunto de dados. Por exemplo, o relacionamento entre variveis pode ser sugerido por consideraes tericas. A Anlise de Regresso pode apenas ajudar a confirmar esta relao.

17.1.

Diagrama de Disperso e Coeficiente de Correlao

Como dissemos anteriormente, para estudar a relao entre duas variveis devemos partir da coleta de uma amostra de pares de observaes. Para isto, necessrio realizar um experimento em
14

que se faz simultaneamente medidas de duas variveis x e y para uma amplitude de diferentes condies experimentais. Sejam (x1,y1), (x2,y2), ... , (xn,yn) os n pares de observaes. Um procedimento para visualizarmos a forma da relao entre as variveis x e y o diagrama de disperso, que nada mais do que a representao dos pares de valores num sistema cartesiano.

Exemplo 17.1: (Werkema, 1996): Uma indstria fabricante de eletrodomsticos da chamada linha branca, tem como objetivo resolver o problema apresentado pelo elevado ndice de refugo da gaveta de legumes de um modelo de refrigerador produzido pela empresa. A observao do problema indicou que a maior parte das gavetas refugadas era considerada defeituosa por apresentarem corte fora de esquadro. Os tcnicos da empresa suspeitaram que a ocorrncia do corte de gavetas fora de esquadro pudesse estar relacionada variao de tenso na rede eltrica, que poderia prejudicar o desempenho do equipamento de corte. Para a verificao da validade desta hiptese, foram coletados dados sobre a tenso na rede eltrica (x) e a variao no corte (y), os quais esto apresentados na tabela abaixo.

Tabela 17.1: Medidas da Tenso na Rede Eltrica (Volts) e Variao no Corte das Gavetas (mm)
Nmero da Medida i
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Tenso na Rede Eltrica (Volts)


222,7 217,7 219,4 220,9 214,4 216,5 213,0 221,7 224,7 215,5 220,0 218,6 223,5 217,0 221,5 218,4 213,6 221,2 219,9 222,2 213,9 216,0 218,1 222,0

Variao no Corte (mm)


15,7 17,0 16,3 16,1 18,6 17,8 19,5 16,0 15,3 18,3 16,3 16,7 15,7 17,4 16,1 16,8 19,3 16,2 16,2 15,9 19,1 18,0 17,0 16,0

15

25 26 27 28 29 30 31 32 33 34 35

224,1 214,9 214,2 223,3 216,7 215,3 223,8 220,6 215,8 217,3 219,2

15,4 18,6 18,7 15,6 17,6 18,5 15,5 16,1 18,2 17,3 16,5

19.5 19.0

Variao no Corte (mm)

18.5 18.0 17.5 17.0 16.5 16.0 15.5 15.0 215 220 225

Tenso (volts)

Figura 17.1. Diagrama de disperso da Tenso e da Variao no Corte Pela Figura 17.1 acima, podemos constatar que existe uma tendncia decrescente, j que maiores valores para a tenso correspondem a menores valores para a variao no corte. Porm, observada esta associao, til quantific-la. Neste caso, podemos utilizar o coeficiente de correlao para quantificar esta associao. Em geral, a letra r usada para representar este coeficiente. Valores de r variam de 1,0 a + 1,0. Um r prximo a + 1,0 corresponde a um diagrama de disperso em que os pontos caem em torno de linha reta com inclinao positiva, e um r prximo a 1,0 corresponde a um diagrama em que os pontos caem em torno de uma linha reta com inclinao negativa. Um r prximo a 0 corresponde a um conjunto de pontos que no mostram nenhuma tendncia, nem crescente, nem decrescente. A Figura 17.2, a seguir, mostra cinco diagramas de disperso de Y e X. Os diagramas das Figuras 17.2(a) e 17.2(b) mostram duas situaes em que os pontos esto em torno de uma reta imaginria ascendente. Valores pequenos de X esto associados a valores pequenos de Y, o mesmo acontecendo para valores grandes. Estes dois casos indicam o que chamamos de correlao linear positiva de Y e X. Porm, os dados em 17.2(b) apresentam uma correlao linear positiva mais forte que em 17.2(a).
16

Figura 17.2. Grficos de Disperso As Figuras 17.2(c) e 17.2(d) mostram que os pontos em X e Y esto em torno de uma reta imaginria descendente, indicando o que chamamos de correlao linear negativa, ou seja, valor de r menor que zero. Observe que em 17.2(d) a correlao igual a -1. Os valores de X e Y na Figura 17.2(e) no sugerem uma associao entre duas variveis, pois valores pequenos ou grandes de X esto associados tanto a valores pequenos quanto a valores
17

grandes de Y. Os pontos do diagrama no se posicionam em torno de uma linha imaginria ascendente ou descendente. O coeficiente de correlao, tambm chamado de Coeficiente de Correlao de Pearson, calculado por:

Ou

observaes para cada varivel e so as mdias de X e Y, respectivamente.

em que xi e yi so os valores observados de X e Y, respectivamente; i=1,2,...,n e n o nmero de

Exemplo 17.2: Calculando o coeficiente de correlao linear para os dados do exemplo 17.1, r = 0,9764 , um valor muito prximo de 1, podemos concluir que existe uma forte correlao negativa entre a tenso na rede eltrica e a variao no corte das gavetas de legumes do refrigerador produzido pela indstria.

Tabela 17.2: Dados para o Clculo do Coeficiente de Correlao para o exemplo 17.1 i
1 2 3 4 5 6 7 8 9 10 11 12

x
222,70 217,70 219,40 220,90 214,40 216,50 213,00 221,70 224,70 215,50 220,00 218,60

y
15,70 17,00 16,30 16,10 18,60 17,80 19,50 16,0 15,3 18,3 16,3 16,7

x2
49595,29 47393,29 48136,36 48796,81 45967,36 46872,25 45369,00 49150,89 50490,09 46440,25 48400,00 47785,96

y2
246,49 289,00 265,69 259,21 345,96 316,84 380,25 256,00 234,09 334,89 265,69 278,89

xy
3496,39 3700,90 3576,22 3556,49 3987,84 3853,70 4153,50 3547,20 3437,91 3943,65 3586,00 3650,62

18

13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Total

223,50 217,00 221,50 218,40 213,60 221,20 219,90 222,20 213,90 216,00 218,10 222,00 224,10 214,90 214,20 223,30 216,70 215,30 223,80 220,60 215,80 217,30 219,20 7657,60

15,7 17,4 16,1 16,8 19,3 16,2 16,2 15,9 19,1 18,0 17,0 16,0 15,4 18,6 18,7 15,6 17,6 18,5 15,5 16,1 18,2 17,3 16,5 595,3

49952,25 47089,00 49062,25 47698,56 45624,96 48929,44 48356,01 49372,84 45753,21 46656,00 47567,61 49284,00 50220,81 46182,01 45881,64 49862,89 46958,89 46354,09 50086,44 48664,36 46569,64 47219,29 48048,64 1675792

246,49 302,76 259,21 282,24 372,49 262,44 262,44 252,81 364,81 324,00 289,00 256,00 237,16 345,96 349,69 243,36 309,76 342,25 240,25 259,21 331,24 299,29 272,25 10178,11

3508,95 3775,80 3566,15 3669,12 4122,48 3583,44 3562,38 3532,98 4085,49 3888,00 3707,70 3552,00 3451,14 3997,14 4005,54 3483,48 3813,92 3983,05 3468,90 3551,66 3927,56 3759,29 3616,80 130103,40

Cuidados com Correlaes

Um dos cuidados que devemos ter quando a correlao interpretada saber que correlao no o mesmo que causalidade (relao de causa e efeito). Isto , quando duas variveis so altamente correlacionadas, no significa, necessariamente, que uma causa a outra. Em alguns casos, podem existir relaes causais, mas no se saber isso pelo coeficiente de correlao. Provar uma relao de causa e efeito muito mais difcil do que somente mostrar um coeficiente de correlao alto. Um outro cuidado que deve ser tomado ao se interpretar correlao associar um diagrama de disperso ao conjunto de dados. Veja o exemplo abaixo.

Exemplo 17.3: Vamos calcular para cada um dos quatro conjuntos de dados abaixo o coeficiente de correlao.
19

Conjunto 1 X 10 8 13 9 11 14 6 4 12 7 5 Y 8,04 6,95 7,58 8,81 8,33 9,96 7,24 4,26 10,84 4,82 5,68

Conjunto 2 X 10 8 13 9 11 14 6 4 12 7 5 Y 9,14 8,14 8,74 8,77 9,26 8,1 6,13 3,1 9,13 7,26 4,74

Conjunto 3 X 10 8 13 9 11 14 6 4 12 7 5 Y 7,46 6,77 12,74 7,11 7,81 8,84 6,08 5,39 8,15 6,42 5,73

Conjunto 4 X 8 8 8 8 8 8 8 19 8 8 8 Y 6,58 5,76 7,71 8,84 8,47 7,04 5,25 12,5 5,56 7,91 6,89

Para cada um deles, temos: r =0,82 (Verifique!). Porm, estes conjuntos de dados apresentam disposies completamente diferentes no diagrama.

Figura 17.3. Diagramas de Disperso.

20

Questes no respondidas pela Correlao


Ao estudarmos a relao entre variao no corte (mm) e tenso (volts) surgem algumas questes importantes tais como: 1) Qual a previso de variao no corte (mm) usando uma tenso especificada em volts? 2) Qual a mdia estimada de variao no corte (mm) para uma especificada tenso em volts? 3) Quais so os limites de confiana para variao no corte (mm) predita? Questes deste tipo podem ser respondidas com uma anlise de regresso dos dados, que o assunto das prximas sees.

Principais Objetivos da Anlise de Regresso


De maneira geral, os modelos de regresso podem ser usados para vrios propsitos, dentre os quais possvel destacar: a) Descrio dos dados b) Estimao dos parmetros c) Predio d) Controle

Descrio dos dados muito comum a utilizao da anlise de regresso para descrever um conjunto de dados. Isto , a construo de um modelo que relacione, por exemplo, o efeito do ar condicionado no consumo de energia eltrica uma maneira muito mais efetiva de conhecer o relacionamento entre estas variveis em comparao a uma tabela ou mesmo um grfico. Estimao dos parmetros No exemplo sobre o consumo de energia eltrica, podemos utilizar a anlise de regresso para conhecermos qual o nmero mdio de kilowatt/hora consumido usando o ar condicionado por uma hora. Predio possvel tambm, utilizar regresso para predizer valores para a varivel resposta. Voltando ao exemplo 17.1, o fabricante pode estar interessado em conhecer quanto ser a variao do corte em (mm) para uma determinada tenso na rede eltrica (volts). Controle A Anlise de Regresso pode ser usada com o objetivo de controlar a varivel resposta. Considere, como exemplo, um engenheiro qumico que est interessado em controlar o rendimento de um processo qumico atravs das variveis temperatura e tempo de reao. Esta equao poder
21

ser utilizada para determinar a natureza dos ajustes a serem realizados nas variveis temperatura e tempo de reao, para que o rendimento possa ser mantido num intervalo pr-estabelecido. importante destacar que, quando o modelo de regresso for empregado com o objetivo de controle, a relao existente entre a varivel de interesse e as variveis utilizadas para seu controle sejam do tipo causa-e-efeito.

17.2.

Regresso Linear Simples por Mnimos Quadrados

Um coeficiente de correlao descreve a associao linear entre variveis porm, para investigar e modelar a relao entre elas, usa-se a Anlise de Regresso. Para se ajustar um modelo de regresso por mnimos quadrados a varivel resposta deve ser quantitativa. O que se deseja, freqentemente, com base em dados amostrais, estimar o valor da varivel y, correspondente ao conhecimento de uma varivel x. Isto pode ser feito mediante a estimativa da funo linear f(x) = y = 0 + 1x. Observe porm, que as linhas que vrias pessoas podem traar para este conjunto de pontos seriam, provavelmente, similares, desde que o grfico tenha um padro bem definido. Porm, elas no seriam idnticas, de forma que os valores preditos para varivel resposta poderiam diferir tambm. Para um conjunto de dados sem um padro bvio no grfico; diferentes pessoas poderiam traar diferentes linhas sobre os dados, permitindo grandes diferenas entre os valores preditos. Usando a Anlise de Regresso, qualquer um obter exatamente a mesma linha reta. Este processo chamado de ajuste de uma reta de regresso. O mtodo usado mais freqentemente para ajustar uma reta usa um princpio chamado de Mnimos Quadrados. Este mtodo ser descrito posteriormente.. Observe a Figura 17. 4 a seguir. O princpio de mnimos quadrados envolve ajustar uma reta passando por pontos de forma que as diferenas verticais entre todos os pontos e a reta so calculadas. Ento, estas diferenas so elevadas ao quadrado para dar aos pontos acima e abaixo da reta a mesma importncia (as diferenas ao quadrado so todas positivas). As diferenas so ento somadas. A melhor reta aquela que minimiza esta soma das diferenas ao quadrado, sendo chamada, de mnimos quadrados.

22

100 90 80 70

CONSUMO

60 50 40 30 20 10 0 2 4 6 8 10 12 14 16

Reta dos mnimos quadrados minimiza os valores ao quadrado de todas as diferenas verticais como estas.

AR

Figura 17.4 Processo de Mnimos Quadrados

J vimos que uma relao linear entre duas variveis pode ser expressa atravs da equao: em que, o intercepto, a inclinao e o erro. Esta equao a que se obteria medindo-se = + + ,

a populao inteira de valores de x e y. Na realidade, apenas uma amostra medida e usa-se esta amostra para estimar a reta. A reta estimada por meio da amostra pela regresso de mnimos quadrados ser denotada por: = + ,

em que e so estimativas de e , respectivamente. O valor o valor predito de

eixo vertical. O valor o incremento em resultante do incremento de uma unidade em x e chamado de inclinao da reta. O mtodo de Mnimos Quadrados baseado na soma dos quadrados dos resduos, , ou seja:

quando x zero e chamado de intercepto da reta desde que ele o local em que a reta intercepta o

fazendo-se tal soma a menor possvel. A soluo deste problema matemtico fornece as seguintes expresses para e :

23

Ou

amostrais destas variveis.

so as respectivas mdias em que yi e xi so os valores observados das variveis Y e X e e

Exemplo 17.4: Vamos ajustar agora um modelo de regresso linear simples com dados do exemplo 17.1.

portanto, o modelo de regresso ajustado expresso por:

Esta equao de regresso mostra que para cada aumento de um volt na tenso na rede eltrica a variao no corte das gavetas diminui, em mdia, 0,36 mm.

= 95,03 0,36 , = 1, 2, , 35. (17.5)

Anlise de Varincia no Modelo de Regresso

24

A Analise de Varincia baseada na partio da variao total da varivel dependente Y que pode ser decomposta em duas partes: uma explicada pelo modelo de regresso ajustado e outra no explicada, conforme mostra a equao abaixo.
) = ( ) + ( ) . (

(17.7)

O termo do lado esquerdo de (17.7) a soma dos quadrados das observaes em relao ao seu valor mdio e representa uma medida da variabilidade total dos dados de Y. Esta soma ser quadrados explicada pelo modelo de regresso, sendo denotada por = (Y Y) explicada em relao variao total SQ . denotada por SQ = (Y Y) . O primeiro termo do lado direito de (17.7) a soma dos

explicada pelo modelo de regresso. O modelo ser melhor ajustado quanto maior for a variao

que no enquanto o segundo termo a soma de quadrados residual SQ = (Y Y )

Simbolicamente, podemos representar a equao (17.7) por:

Anlise de Varincia resumida atravs Tabela 17.3 adiante. Esta tabela pode ser utilizada para testar as seguintes hipteses: H : = 0 versus H : 0.

SQ = + SQ .

erro tem distribuio normal com mdia 0 e varincia 2, pode-se ser mostrado que F tem distribuio de Fisher-Snedecor com 1 e n-2 graus de liberdade. O critrio do teste o seguinte: rejeita-se H0, ao nvel de significncia, se F > F(, 1; n 2), em que F(, 1; n 2) o percentil da distribuio Fisher-Snedecor com 1 e n 2 graus de liberdade, respectivamente. Caso contrrio, a hiptese H0 no deve ser rejeitada. Tabela 17.3: Tabela de Anlise de Varincia para o Modelo de Regresso Linear Simples. Fonte de variao Regresso Residual Total Graus de liberdade 1 n-2 n-1 Soma de quadrados Quadrados mdios = = 1 SQ 2 F

estas hipteses de interesse, ser usando a estatstica F=( )/( ). Supondo que o

Neste teste, no rejeitar H significa que no existe relao linear entre x e y. Para testar

SQ SQ

25

Para uma amostra n pares (X, Y), a soma de quadrados total associada a variabilidade total de Y tem n-1 graus de liberdade e a soma de quadrados de resduo tem n-2 graus de liberdade. Os quadrados mdios so obtidos dividindo as somas de quadrados pelos correspondentes graus de liberdade. As somas de quadrados podem ser obtidas atravs das seguintes expresses dadas adiante. SQ
( ) 2 2 = , =1( ) = =1
2

= ) = . (

( ) )(

[ ] ( )

No caso de regresso linear uma forma de medir a proporo da reduo na variao total = SQ = 1 . SQ SQ

em Y associada com o uso da varivel explicativa X o coeficiente de determinao expresso por:

O valor de R2 varia no intervalo [0; 1]. Desta forma, quanto maior for o coeficiente de determinao, maior ser a reduo na variao total de Y pela introduo da varivel independente X. Entretanto, o coeficiente de determinao dever ser empregado com muita cautela. Por exemplo, quando temos dados envolvendo sries temporais que tendem a se mover na mesma direo, refletindo uma forte tendncia, qualquer modelo que detecte essa tendncia ter um de r2 alto, o que pode ser esprio (no refletir a verdadeira relao linear entre as variveis envolvidas) (Souza, 1998).

A Tabela Anova para o modelo (17.5) Fonte de variao Regresso Residual Total Graus de liberdade 1 33 34 Soma de quadrados 50,3938 2, 5136 52,908 Quadrados mdios 50, 3938 0, 0762 ------calculado 661,33 -valor 2,071E-23

esto indicando a existncia de uma relao linear entre a tenso na rede eltrica e a variabilidade

,;; = 4,139 < Fcalculado = 661,33 rejeitamos a hiptese nula e conclumos que os dados

Concluso: Com auxlio da tabela da F-Snedecor, obtemos F,;; = 4,139. Como

26

no corte das gavetas (mm) produzidas pela fabrica. Chegamos a mesma concluso ao observarmos o p-valor < =0,05. O coeficiente de determinao =
50,3938 52,908

= 0,952 revela que aproximadamente 95,2% da

variabilidade no corte das gavetas produzidas pela fabricadas explicada pela tenso na rede eltrica (atravs do modelo proposto) e que 4,8% so atribudas a outras causas. Outra maneira de verificar a adequao do modelo de regresso linear simples apresentada adiante. Para tal, necessrio supor que o erro tem distribuio normal com mdia 0 e varincia 2. Na Seo adiante ser estudada a anlise de resduo para a verificao desta suposio. O intervalo de confiana para 1 com (1)% de confiana dado por:

Exemplo 17.5: Vamos calcular o IC para com 95% para o modelo de regresso linear simples com os dados do exemplo 17.1.

Baseado neste intervalo pode-se concluir que existe evidncia que 10, com 95% de confiana e, portanto, o modelo de regresso linear adequado.

Predio de Novas Observaes

Suponha que se queira predizer uma nova observao y correspondendo a um nvel especificado da varivel preditora x. Denotando x= x* como sendo este o valor de interesse, ento, y* = b0 + b1 . x* uma estimativa pontual para o novo valor da resposta. Considerando que o erro tem distribuio normal com mdia 0 e varincia 2, o intervalo de predio para y* com (1-)% de confiana dado por:

em que
27

Ou

s o desvio padro do erro e ; o ponto que define uma rea de (/2) na cauda superior da

distribuio t com n-2 graus de liberdade.

Exemplo 17.5: Suponha que se queira predizer a variao no corte (mm) quando a tenso 200 volts. Neste caso, x* = 200 volts, e, portanto, variao predita = 95,03 (0,36 x 200) = 23,03.
O intervalo de 95% confiana : ( = 0,05 ,; = 2,034515 ; n = 35 e s =0,276)

isto significa que voc pode estar confiante 95% que a variao do corte (mm) quando a tenso de 200 volts varia entre 22,3 e 23,7. Observao: Deve-se tomar cuidado quando estender uma reta de regresso ajustada para se fazer predies fora do intervalo de variao dos x, usados para ajustar a reta de regresso. No somente o intervalo de predio comea a se tornar mais largo, tornando as previses de pouca confiana, como o padro da relao entre as variveis pode mudar drasticamente para valores distantes de x. Os dados coletados no do nenhuma indicao sobre a natureza desta mudana.

Diagnsticos Bsicos em Regresso

Como determinar se um modelo representa adequadamente os dados? Como saber se mais termos devem ser adicionados ao modelo? Como identificar outliers, isto , observaes que no so tpicas do restante da massa de dados? Estas so questes que podem ser respondidas examinando-se os resduos do modelo ajustado, isto , as diferenas entre os valores observados e preditos pelo modelo. Para que um modelo de regresso possa ser empregado como base para outros estudos, necessrio que as suposies feitas durante sua construo sejam vlidas. Se algumas destas suposies no se confirmarem, o modelo poder ser inadequado para fazer as inferncias de
28

interesse. Neste caso, deve ser procurado outro modelo mais adequado ou ser empregada outra abordagem para a anlise do problema. As suposies que devem ter sua validade verificada so: O relacionamento entre y e x linear; O erro tem mdia zero; O erro tem varincia constante; Os erros so no correlacionados; O erro tem distribuio normal. Diagnsticos bsicos em regresso e ajuste de modelos so interdependentes. Primeiro um modelo ajustado, e ento se examina o modelo usando diagnsticos. Isso pode levar ao ajuste de um segundo modelo, o qual deve ser examinado por meio da anlise dos resduos. O processo continua at que se encontre um modelo que se ajuste bem aos dados. Note que possvel no se encontrar um modelo que represente adequadamente os dados. Nesta seo sero discutidos mtodos teis para o estudo da adequao do modelo de regresso.

Anlise de Resduos

Um resduo definido por:

i , i = 1,2,...,n ei = yi - y i o correspondente valor estimado por meio do modelo de em que yi o valor observado e y
regresso. conveniente visualizar os resduos como valores observados para o erro que aparecem no modelo. Portanto, razovel esperar que quaisquer desvios das suposies feitas sobre o erro podero ser detectados se for realizada uma anlise de resduos.

i) Grficos dos Resduos (ei) contra os Valores Preditos ( y

Se o modelo tem todos os termos que precisa, ento o grfico dos resduos contra os valores preditos ou contra as variveis independentes deveria parecer como uma distribuio aleatria de pontos sem tendncia (numa faixa horizontal). Se o modelo precisa de outros termos, ento o grfico dos resduos tem um padro que sugere que tipo de termo deveria ser adicionado ao modelo. Alguns padres so mostrados na Figura 17.5(a) seguir.
29

O padro da Figura 17.5(a) representa a situao satisfatria. Nela os resduos esto situados, aproximadamente, em uma faixa horizontal centrada em ei = 0. J os padres b, c e d da Figura 17.5, indicam a presena de inadequaes no modelo. O padro apresentado na Figura 17.5(b), o qual semelhante forma de um funil, indica que

. a varincia do erro no constante. Nesta figura a varincia do erro uma funo crescente de y . No entanto tambm existem situaes em que a varincia do erro aumenta com o decrscimo de y
O padro apresentado na Figura 17.5(c) ocorre quando a varincia dos erros maior para valores intermedirios de y e, portanto, tambm indica que erros no tm varincia constante. A Figura 17.5 (d) indica no linearidade. Este padro pode indicar a necessidade da incluso no modelo de um termo quadrtico em x. Quando detectado que a varincia do erro no constante uma soluo para este problema consiste em realizar transformaes na varincia resposta para estabilizar a varincia.

Figura 17.5: Grficos de Resduos contra Valores Ajustados.

30

Grficos de Resduos (ei) Contra Valores da Varivel Preditora (x)

No caso do modelo de regresso linear simples, um grfico dos resduos contra os valores da varivel preditora fornece o mesmo tipo de informao gerada pelo grfico de resduos contra os valores ajustados. A configurao dos grficos ei versus xi poder corresponder a um dos quatro

i seja padres gerais j apresentados na Figura 17.5, bastando para isso que, nesta Figura, y
substitudo por xi. A interpretao dos padres representados na Figura 17.5, aps a substituio de

i por xi , semelhante j apresentada na seo anterior. y

Grfico de Resduos Contra o Tempo

A validade da suposio de que os erros no so correlacionados pode ser verificada por meio de um grfico de resduos contra o tempo ou ordem de coleta das observaes. A presena de configuraes especiais neste grfico pode indicar que os erros so correlacionados. As duas configuraes apresentadas na Figura 17.6 a seguir indicam a presena de correlao entre os erros, que representam uma sria violao das suposies associadas ao modelo de regresso.

Figura 17.6: Grficos de Resduos contra o Tempo Indicando a Presena de Autocorrelao.

31

Grfico de Probabilidade Normal para os Resduos

A validade da suposio de normalidade pode ser verificada por meio do grfico de probabilidade normal para os resduos. A suposio de normalidade ser considerada vlida se os pontos do grfico estiverem localizados, aproximadamente, ao longo de uma linha reta. Como esta avaliao subjetiva, um teste estatstico pode ser utilizado para complementar esta avaliao.

Exemplo 17.6: Vamos agora examinar os resduos para o modelo linear simples ajustado para a variao no corte. Anlise de Resduos Figura 17.7: Grfico de Probabilidade Normal

.999 .99

Probabilidade

.95 .80 .50 .20 .05 .01 .001 -0.5 -0.4 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 0.4

Resduos

Figura 17.8: Histograma dos resduos

10

Freqncia

0 -0.50 -0.25 0.00 0.25 0.50

Resduos

32

Figura 17.9: Resduos versus valores ajustados

0.5 0.4 0.3 0.2

Resduo

0.1 0.0 -0.1 -0.2 -0.3 -0.4 -0.5 15 16 17 18 19

Valor Ajustado

Figura 17.20: Resduos versus Ordem dos Dados

0.5 0.4 0.3 0.2

Resduo

0.1 0.0 -0.1 -0.2 -0.3 -0.4 -0.5 0 5 10 15 20 25 30 35

Ordem Observada

O primeiro grfico serve para verificar a suposio de normalidade dos resduos. Este grfico parece indicar que os resduos seguem uma distribuio normal. O segundo grfico o histograma dos resduos tambm serve para verificar normalidade. O terceiro grfico apresenta os valores preditos versus resduos. O padro deste grfico semelhante ao apresentado na Figura 17.5 (d), o que indica a necessidade da incluso no modelo de um termo quadrtico em X. O quarto grfico apresenta a ordem em que os valores foram observados versus resduos (foi considerado que as observaes esto listadas no exemplo 17.1 na ordem em que foram observadas). Pode-se notar que a relao entre os valores preditos e a ordem de observao aleatria.

33

Exerccios: 1. Uma indstria produz grandes quantidades de alumina (Al2O3 de elevado teor de pureza) para a fabricao de alumnio metlico. A matria prima para a fabricao da alumina a bauxita, um mineral com cerca de 55% de xido de alumnio (Al2O3). No processo de produo da alumina, o teor da Na2O (xido de sdio) ocludo no produto um fator importante do ponto de vista da qualidade da alumina fabricada. O Na2O uma impureza, e, portanto desejvel que o seu teor na alumina seja o mais baixo possvel. Com o objetivo de minimizar o teor da Na2O ocludo no produto durante a etapa de precipitao, um dos estgios do processo de produo da alumina, a indstria iniciou trabalhos para melhoria. Os tcnicos da empresa sabiam que a razo Al2O3 / NaOH era um dos fatores responsveis pelas s variaes no teor de Na2O da alumina. Nesta razo, o smbolo Al2O3 est representando a massa de xido de alumnio proveniente da bauxita que entra no processo de produo, e o smbolo NaOH se refere massa de hidrxido de sdio, um dos reagentes do processo, cesso, que empregada na fabricao de alumina. Durante a etapa de observao do problema, para se conhecer melhor a relao entre estas duas variveis (varivel resposta: Na2O e varivel preditora: Al2O3 / NaOH), os tcnicos da indstria coletaram os dados os apresentados na tabela abaixo. A partir destes dados, avaliar a relao linear entre essas duas variveis. Tabela: Teor de Na2O ocludo na Alumina em Funo da Razo Al2O3 / NaOH Teor Razo Al2O3 ndice Na2O (%) / NaOH x y
1 2 3 4 5 6 7 8 9 10 11 12 13 0,645 0,643 0,648 0,639 0,641 0,648 0,635 0,646 0,646 0,643 0,641 0,643 0,637 0,46 0,46 0,45 0,44 0,45 0,47 0,42 0,47 0,45 0,44 0,4 0,42 0,42

Valores ajustados Resduos x2 y2 xy

0,416025 0,413449 0,419904 0,408321 0,410881 0,419904 0,403225 0,417316 0,417316 0,413449 0,410881 0,413449 0,405769

0,2116 0,2116 0,2025 0,1936 0,2025 0,2209 0,1764 0,2209 0,2025 0,1936 0,16 0,1764 0,1764

0,2967 0,29578 0,2916 0,28116 0,28845 0,30456 0,2667 0,30362 0,2907 0,28292 0,2564 0,27006 0,26754

0,442743 0,434803 0,454651 0,418925 0,426864 0,454651 0,403047 0,446712 0,446712 0,434803 0,426864 0,434803 0,410986

0,0172575 0,0251966 -0,004651 0,0210750 0,0231358 0,0153487 0,0169533 0,0232879 0,0032879 0,0051966 -0,026864 -0,014803 0,0090142

34

14 15 16 17 18 19 20 21 22 23 24 25 Total

0,635 0,64 0,646 0,636 0,639 0,634 0,636 0,643 0,647 0,637 0,631 0.633 16.012

0,42 0,41 0,43 0,41 0,4 0,39 0,38 0,4 0,43 0,42 0,37 0.41 10.62

0,403225 0,4096 0,417316 0,404496 0,408321 0,401956 0,404496 0,413449 0,418609 0,405769 0,398161 0,400689 10,25598

0,1764 0,1681 0,1849 0,1681 0,16 0,1521 0,1444 0,16 0,1849 0,1764 0,1369 0,1681 4,5292

0,2667 0,2624 0,27778 0,26076 0,2556 0,24726 0,24168 0,2572 0,27821 0,26754 0,23347 0,25953 6,80432

0,403047 0,422895 0,446712 0,407016 0,418925 0,399077 0,407016 0,434803 0,450682 0,410986 0,387168 0.395107

0,0169533 -0,012894 -0,016712 0,0029837 -0,018925 -0,009077 -0,027016 -0,034803 -0,020681 0,0090142 -0,017168 0.0148925

Resp.: r = 0,7321 Teor Na2O (%) = - 2.12 + 3.97 Razo Al2O3 / NaOH Figura: Diagrama de Disperso: Teor de Na2O ocludo na Alumina em Funo da Razo Al2O3 / NaOH
0,5

Na2O

0,4 0,3 0,2 0,1 0 0,63 0,635 0,64 0,645 0,65

Al2O3 / NaOH

35

Residuos Versus Observa es Ordenadas


0.03 0.02 0.01

Resduos

0.00 -0.01 -0.02 -0.03 -0.04 5 10 15 20 25

Ordemdas Observa es

Resduos Versus Valores Ajustados

0.03 0.02 0.01

Resduos

0.00 -0.01 -0.02 -0.03 -0.04 0.385 0.395 0.405 0.415 0.425 0.435 0.445 0.455

Valor Ajustado

9 8 7

Freqncia

6 5 4 3 2 1 0 -0.040 -0.028 -0.016 -0.004 0.008 0.020

Resduos

36

7a LISTA DE EXERCICIOS

1. Um modelo genrico especifica que os animais de certa populao devam ficar classificados em quatro categorias, com probabilidades p1=0,656, p2=p3=0,093 e p4=0,158. Dentre 197 animais, obtivemos as seguintes freqncias observadas: O1=125, O2=18, O3=20 e O4=34. Teste se esses
R: Os dados esto de acordo com o modelo postulado, Regio Crtica [ 11,34; ) e =0,5635.

dados esto de acordo com o modelo genrico postulado. (Use =1%).

2. Aps ser derrotado por um amigo num jogo de dado, voc suspeita que o dado ele deu a voc seja desonesto. Para verificar, voc lana o dado 60 vezes, registrado o nmero de vezes que cada face aparece. Os resultados esto adiante. Face Frequncia 1 11 2 7 3 9 4 15 5 12 6 6

a) Se o dado for honesto, quantas vezes voc esperaria que cada face aparecesse? R:10. b) Para verificar se o dado honesto, qual teste voc usaria? R:Teste de Aderncia c) Teste a hiptese de que o dado honesto. (Use =5%).
desonesto. Regio Crtica [ 11,07; ) e =0,5635. R: No h evidncias de que o dado seja

3. Uma empresa localizada na cidade de So Paulo, produtora de pneumticos, possui uma rede distribuidora por todo o interior do Estado. Realizou um estudo para determinar qual a funo que ligava o preo do produto e a distncia do mercado consumidor da cidade de So Paulo. Os dados so os seguintes: Preo Distncia (Km) 36 50 48 240 50 150 70 350 42 100 58 175 91 485 69 335

a) Calcule o coeficiente de correlao e interprete o resultado. b) Estimar a reta de regresso; Pi = 30,19 + 0,12Di,
[45,88; 30,29] i=1,..., 8.

R.: r = 0,959

c) Calcule um intervalo com confiana de 5% para o preo quando a distncia 250Km.

R.:

d) A empresa tem uma filial no Rio de Janeiro e o preo de venda do pneumtico l produzido, na cidade B, de R$160,00. Sabendo-se que a distncia entre So Paulo e a cidade B de 250 km, pergunta-se qual produto deve ser vendido: o produzido no Rio de Janeiro ou o fabricado em So Paulo.
R.: So Paulo.

37

4. Suponhamos que uma cadeia de supermercados tenha financiado um estudo dos gastos com mercadoria para famlias de 4 pessoas. A investigao se limitou a famlias com renda lquida entre R$8.000 e R$20.000. Obteve-se a seguinte equao:
Yi = -200 + 0,10Xi,

em que: Y = despesa anual estimada com mercadorias e X = renda lquida anual. Suponha que a equao proporcione um ajustamento razoavelmente bom. a) Estime a despesa de uma famlia de quatro com renda de R$15.000.
R.: 1.300,00

b) Um dos vice-presidentes da firma ficou intrigado com o fato de a equao aparentemente sugerir que uma famlia com R$2.000 de renda no gaste nada em mercadorias. Qual a explicao? R. Observe que o intervalo de x no contempla o valor R$ 2.000, ento no recomendado estender a reta
de regresso ajustada para fazer predies fora do intervalo de x.

5. Trs diferentes bancos possuem agncias de mesmo porte em uma avenida movimentada de Salvador, BA. Para testar se essas agncias tm movimento mdio equivalente, foi escolhida uma semana tpica de trabalho e o desempenho, nesses dias, foi registrado. Os dados obtidos, em milhares de reais, esto apresentados nas tabelas a seguir.
1 146,4 199,2 179,5 98,4 263,7 Banco 2 194,3 227,2 203,4 111,8 275 3 173,7 246,5 289,8 127,4 265,6

a) razovel afirmar que as varincias das trs distribuies so homogneas? (Use =1%). R.
para dos conjunto de dados, so diferentes.

Como B (0,01; 5) = 0,4304 < = 0,9938 conclumos que no existem evidncias de que as varincias populacionais,

A partir da anlise de varincia (ANOVA) adiante verifique se as agncias tm movimentos mdios equivalentes. Use =5%. R. No rejeita H0 ao nvel de 5% de significncia.
ANOVA

Fonte de variao
Entre grupos Dentro dos grupos Total

Soma de quadrados
4693,705 47660,38 52354,09

Graus de liberdade
2 12 14

Quadrados mdios
2346,853 3971,699

Fcalculado
0,590894

6. A fim de testar se o tempo mdio necessrio para misturar um lote de materiais o mesmo para mquinas produzidas por trs diferentes fabricantes, a Jacobs Chemical Company obteve os seguintes dados sobre o tempo (em minutos) necessrio para misturar os materiais.
38

a) razovel afirmar que as varincias das trs distribuies do tempo mdio necessrio para misturar um lote de materiais so homogneas? (Use =0,01).
B (0,01; 8) = 0,6282 < = 0,686 .
R.: Sim. No rejeita Ho, pois

c) possvel realizar um teste para verificar se o tempo mdio para misturar um lote de materiais difere em relao aos trs fabricantes.
materiais em cada fbrica diferente. R: O tempo mdio necessrio para misturar um lote de

1 21 14 25 32 31 35 8 21

Fbrica 2 34 28 38 25 26 27 25 27

3 21 17 23 22 28 24 24 20

7. Os dados a seguir do um custo lquido por real de prmio (Y) e o tempo de aplice em meses (X).
X Y 8 1,26 29 1,15 47 0,81 24 1,14 57 0,61 45 0,88 39 0,99 14 1,11 70 0,58 40 0,74 66 0,67 55 0,70

a) Estimar a reta de regresso; Yi=1,35 -0,01Xi,

i=1, 2, 3, ..., 12.

b) Calcule um intervalo de confiana de 95% de confiana para a inclinao 1. Baseado no intervalo, qual a concluso sobre a relao linear entre x e y.
R.: [0,01 2,228
,

c) Construir um IC para o valor de um prmio cuja aplice tem 3 anos; = 5%.


R.:0,99 0,11671 +
(,)

; 0,01 + 2,228

8. Os valores do mdulo de elasticidade (MOE, a razo da fora, isto , fora por rea unitria, para o escoamento, ou seja, deformao por comprimento unitrio, em GPa) e a resistncia reflexo (uma medida da capacidade de resistncia a falhas decorrentes de desdobramento, em MPa) foram determinados para um tipo de amostra de vigas de concreto, gerando os dados a seguir (reproduzidos de um grfico do artigo Effects of Aggregate and Microfilleres on the Flexural Proprties of Concrete, Magazine of Concrete Research, 1997, p.81-98):
39

MOE Resistncia

29,8 5,9

33,2 7,2

33,7 7,3

35,3 6,3

35,5 8,1

36,1 6,8

36,2 7,0

36,3 7,6

37,5 6,8

MOE Resistncia

37,7 6,5

38,8 6,3

39,6 7,9

41,0 9,0

42,8 8,2

42,8 8,7

43,5 7,8

45,6 9,7

46,0 7,4

MOE Resistncia

46,9 7,7

48,0 9,7

49,3 7,8

51,7 7,7

62,6 11,6

69,8 11,3

79,5 11,8

80,0 10,7

a) O valor da resistncia determinado exclusivamente pelo valor do MOE?


R:No, porque h observao com os valores idnticos de MOE com diferentes valores de y.

b) Use os resultados da sada do software Excel a seguir e apresente a equao ajustada do = 3,34 + 0,107x , i = 1, 2, 3, , 26 modelo de regresso. R: y Resumos dos resultados Estatstica de regresso R mltiplo R-Quadrado R-quadrado ajustado Erro padro Observaes ANOVA Fonte de Variao Regresso Resduo Total Graus de Liberdade 1 24 25 Soma de Quadrado 51,7325 18,5214 70,2539 Quadrado Mdio 51,7325 0,77172 Estatstica F 67,035 0,858 0,7364 0,7253 0,8785 26

Interseo MOE

Coeficientes 3,3400 0,1068

Erro padro 0,6163 0,0130

Stat t 5,4200 8,1875

valor-P 0,00001442 0,00000002

c) Calcule o coeficiente de determinao. R: 0,736. 9. Nova York, Boston e o Vale do Silcio na Califrnia esto entre as regies que apresentam os maiores salrios no setor de tecnologia nos Estados Unidos (USA Today, 28 de fevereiro de 2002). Os dados amostrais seguintes apresentam os salrios anuais individuais expressos em milhares de dlares.
40

a) Verifique se existe diferena entre a mdia populacional de salrios do setor de tecnologia correspondente nas trs localidades. Use =5%. R: Existe diferena entre as mdias de salrios nas trs
localidades.

Nova York 82 79 72 89 79 85 86

Boston 85 80 74 78 75 80 79

Vale do Silcio 82 91 94 88 85 81 90

Grupo Nova York Boston Vale do Silcio ANOVA Fonte da variao Tratamento Erro Total

Contagem 7 7 7 Soma de Quadrado 264,86 410,29 675,14

Soma 572 551 611 Graus de Liberdade 2,00 18,00 20,00

Mdia 81,71 78,71 87,29 Quadrado Mdio 132,43 22,79 ----

Varincia 31,90 13,24 23,24

Estatstica F 5,81 ----

valor-P 0,01 ----

F crtico 3,55 ----

10. Realiza-se um estudo para se determinar o efeito da velocidade de corte sobre a durao (em horas) de uma mquina particular. Quatro nveis de velocidade de corte so selecionados para o estudo, com os seguintes resultados: Durabilidade da ferramenta
Velocidade de corte 1 2 3 4 1 41 42 34 36 Repetio (ou observao) 2 3 4 5 43 33 39 36 36 34 45 40 38 34 34 36 37 36 38 35 6 40 39 33 35

a) A velocidade de corte afeta a durabilidade da mquina?. Use = 0,01. R.:A velocidade mdia de corte
no afeta a durabilidade da mquina. b)

Fonte: Hines, Montgomery, Goldman e Borror (2006). Probabilidade e Estatstica na Engenharia. 4 ed.

Voc usaria o Teste de Tukey para fazer comparaes entre os pares de mdias dos nveis de velocidade de corte? R: No usaria o teste, pois no h evidncias de que existam diferenas significativas entre os pares
de mdias.

41

Tabela da anlise de varincia Fonte de variao Tratamentos (Velocidade) Resduo Total Graus de liberdade 3 20 23 Soma de quadrados 80,17 168,33 248,5 Quadrados mdios 26,722 8,417 calculado 3,175 -valor

0,0465

11. O conjunto de dados a seguir consiste de 26 observaes sobre a resistncia fratura do prato de base do ao temperado com nquel a 18% (de Fracture Testing of Weldments, ASTM Special Publ. N 381, 1965, p. 328-356). Um indivduo suspeita que estes dados possam ser ajustados atravs de uma Distribuio Normal. Resistncia 65 | 70 70 | 75 75| 80 80 | 85 85 | 100 Total Nmero de observaes 3 5 10 6 2 26

a) Construa um histograma para os dados acima e verifique se razovel supor que os dados segue uma distribuio normal. Justifique sua resposta. b) Verifique atravs do teste se os dados seguem a distribuio normal. Use =10%. R:Modelo no
rejeitado, Regio Crtica [ 6,251; ) e =1,1. Obs. Unir a primeira e a segunda linha, pois a frequncia esperada da primeira linha foi menor que 5.

12. Teste se os dados abaixo so observaes de uma distribuio normal com mdia =10 e varincia 2=25. Os dados esto apresentados na tabela adiante. (Use =5%) Varivel 1,0 | 6,6 6,6 | 10,0 10,0 | 13,4 13,4 | 22,0 Total
R: Modelo no rejeitado, Regio Crtica [ 7,81; ) e =3,7346.

Nmero de observaes 4 11 9 6 30

13. Uma regresso de y=volume de clcio (g/l) em x=material dissolvido (mg/cm2) foi descrita em um artigo Use of Fly Ash or Silica Feed Acids (Magazine of Concrete Research, 1997, p.
42

a) Interprete o coeficiente estimado 0,144. R.: Estima-se que 0,144 a mudana esperada no contedo de clcio associado com 1mg/cm2 de aumento na quantidade dissolvida de material. b) Interprete o coeficiente de determinao 0,860.
fatores. R.: Aproximadamente, 86% da variabilidade observada no

R2=0,860.

337-344). A questo da reta de regresso estimada foi: = 3,678 + 0,144 , = 1,2,3, , 23. e

volume de clcio pode ser atribuda a quantidade dissolvida de material (atravs do modelo proposto), 14% devido a outros

c) Calcule uma estimativa pontual do volume mdio real de clcio quando a quantidade de material dissolvido for igual a 50 mg/cm2. R.: 10,88.

14. A quantidade de chuva um fator importante na produtividade agrcola. Para medir esse efeito, foram anotadas, para 8 regies diferentes produtora de soja, o ndice pluviomtrico e a produo do ltimo ano. Chuva (mm) Produo (tonelada) 120 40 140 46 122 45 150 37 115 25 190 54 130 33 118 30

Para analisar os dados descritos acima, considere o modelo de regresso linear simples dado por: com ~(0; ) e no correlacionado com para i,j = 1,2,..., n e , desconhecido. Siga os Obtenha o ajuste do modelo de regresso linear simples e apresente as estimativas de , e . Descreva o modelo ajustado matematicamente.
R.: 1,55; 0,27 e 298,04. y = 1,55 + 0,27x , i =

= + + ,

= 1, 2, , ,

passos a seguir.
a)

b) Faa o teste da significncia da regresso via Tabela ANOVA e verifique possvel falta de ajuste. R.: A anlise da Tabela ANOVA indica evidncias da existncia de uma relao linear entre a quantidade de chuva e a
produo agrcola. c)

1,2,3, ,8.

Analise os grficos adiante e faa uma anlise de resduos verificando os possveis padres indesejveis ou presena de observaes com valores extremos. R.: Converse com o seu professor

43

a) Calcule os coeficientes de determinao e correlao. R. 0,52; 0,7246.


b)

Finalize sua anlise concluindo se o modelo ou no adequado para os dados em questo.


R:Converse com o seu professor.

44

Referncias Bibliogrficas
1. CONOVER, W. J. (1999). Practical Nonparametric Statistics. 3rd. ed. New York: Chichester: John Wiley & Sons (Asia). 2. FERNANDES, Gilnio Borges, (2002). Notas de Aula MAT 229- Anlise de Regresso. 3. HINES, W. William, MONTGOMERY, C. Douglas, GOLDSMAN, M. David e BORROR, M. Cannie (2006). Probabilidade e Estatstica na Engenharia. 4 ed., Rio de Janeiro: LTC. 4. HOLLANDER, Myles; WOLFE, Douglas A (1999). Nonparametric Statistical Methods. 2nd. ed. New York: John Wiley & Sons. 5. CAMPOS, Humberto de (1979). Estatstica Experimental Nao-Paramtrica. 3. ed. Piracicaba: Departamento de Matemtica e Estatstica da Escola Superior de Agricultura 'Luiz de Queiroz. 6. MAGALHES, Marcos Nascimento e LIMA, Antnio Carlos P. (2007). Noes de Probabilidade e Estatstica. 6a edio rev. 1a reimpresso, So Paulo, Edusp. 7. MONTGOMERY, Douglas C.; RUNGER, George C.; HUBELE e Norma Faris (2004). Estatstica Aplicada Engenharia. Rio de Janeiro: LTC. 8. MORETTIN, Pedro Alberto e BUSSAB, Wilton de Oliveira (2006). Estatstica Bsica. 5. ed. So Paulo: Saraiva. 9. SIEGEL, Sidney; CASTELLAN, N. John (2006). Estatstica No-paramtrica para Cincias do Comportamento. 2. ed. Porto Alegre, RS. 10. SOUZA, G. S. (1998). Introduo aos Modelos de Regresso Linear e No-Linear. Braslia: Embrapa-SPI / Embrapa-SEA. 11. WERKEMA, Maria Cristina Catarino; AGUIAR, Silvio (1996). Analise de Regresso: Como Entender o Relacionamento Entre as Variveis de um Processo. Belo Horizonte, MG: UFMG. Escola de Engenharia.

45

Distribuio de Qui-Quadradro 2 com os valores crticos de Qui-Quadradro tais que a probabilidade de a varivel aleatria 2 ser maior do que 2c vale , ou seja, Prob(2 2c) = . Graus de Liberdade 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 40 50 60 70 80 90 100 Valores de 0,995 0,00 0,01 0,07 0,21 0,41 0,68 0,99 1,34 1,73 2,16 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43 8,03 8,64 9,26 9,89 10,52 11,16 11,81 12,46 13,12 13,79 20,71 27,99 35,53 43,28 51,17 59,20 67,33 0,99 0,00 0,02 0,11 0,30 0,55 0,87 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,20 10,86 11,52 12,20 12,88 13,56 14,26 14,95 22,16 29,71 37,48 45,44 53,54 61,75 70,06 0,975 0,00 0,05 0,22 0,48 0,83 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,28 10,98 11,69 12,40 13,12 13,84 14,57 15,31 16,05 16,79 24,43 32,36 40,48 48,76 57,15 65,65 74,22 0,95 0,00 0,10 0,35 0,71 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,12 10,85 11,59 12,34 13,09 13,85 14,61 15,38 16,15 16,93 17,71 18,49 26,51 34,76 43,19 51,74 60,39 69,13 77,93 0,50 0,45 1,39 2,37 3,36 4,35 5,35 6,35 7,34 8,34 9,34 10,34 11,34 12,34 13,34 14,34 15,34 16,34 17,34 18,34 19,34 20,34 21,34 22,34 23,34 24,34 25,34 26,34 27,34 28,34 29,34 39,34 49,33 59,33 69,33 79,33 89,33 99,33 0,10 2,71 4,61 6,25 7,78 9,24 10,64 12,02 13,36 14,68 15,99 17,28 18,55 19,81 21,06 22,31 23,54 24,77 25,99 27,20 28,41 29,62 30,81 32,01 33,20 34,38 35,56 36,74 37,92 39,09 40,26 51,81 63,17 74,40 85,53 96,58 107,57 118,50 0,05 3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 38,89 40,11 41,34 42,56 43,77 55,76 67,50 79,08 90,53 101,88 113,15 124,34 0,025 5,02 7,38 9,35 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 41,92 43,19 44,46 45,72 46,98 59,34 71,42 83,30 95,02 106,63 118,14 129,56 0,01 6,63 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,72 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 45,64 46,96 48,28 49,59 50,89 63,69 76,15 88,38 100,43 112,33 124,12 135,81 0,005 7,88 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 48,29 49,64 50,99 52,34 53,67 66,77 79,49 91,95 104,21 116,32 128,30 46 140,17

Distribuio F de Snedecor. =0,01

rea=0,01

F (Valor Tabulado) gl do Numerador gl do Denominador 1 2 3 4 5 6 7 8 9 10 1 4052,18 4999,50 5403,35 5624,58 5763,65 5858,99 5928,36 5981,07 6022,47 6055,85 2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 35 7,42 5,27 4,40 3,91 3,59 3,37 3,20 3,07 2,96 2,88 40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 45 7,23 5,11 4,25 3,77 3,45 3,23 3,07 2,94 2,83 2,74 50 7,17 5,06 4,20 3,72 3,41 3,19 3,02 2,89 2,78 2,70 100 6,90 4,82 3,98 3,51 3,21 2,99 2,82 2,69 2,59 2,50
Tabela Gerada no Excel

47

48

49

50

51

52

Anda mungkin juga menyukai