Anda di halaman 1dari 19

Estatstica I

Parte III Teste Qui-Quadrado


Cap. 12 (Levine et al., 2008)

Profa. Solange Kanso Economia 2012/1

O Teste Qui-Quadrado (2)

At o momento estudamos testes de hipteses para avaliar dados numricos e categricos para uma e duas amostras. Essa parte da matria estende os testes de hipteses para avaliar as diferenas entre propores de populao com base em duas ou mais amostras, bem como a hiptese de independncias nas respostas para duas variveis categricas. O teste que vamos aprender utiliza uma estatstica de teste que aproximada por uma distribuio qui-quadrada (2). Os resultados desse teste 2 so equivalentes aos resultados do teste Z para duas propores. O interesse comparar a contagem de respostas categricas entre dois tipos grupos independentes por meio de uma tabela de contingncia de referncias cruzadas.

O Teste Qui-Quadrado (2)

Exemplo: Comparao entre dois hotis satisfao dos hspedes. Quando os hspedes deixam os hotis feita a seguinte pergunta: Voc escolheria novamente este hotel?

Hotel 1 Praia do Farol = 163 de 227 hspedes disseram que sim, voltariam ao hotel; Hotel 2 Fim da Trilha = 154 de 262 hspedes disseram que sim, voltariam ao hotel; Com nvel de significncia () de 0,05 existem evidncias de uma diferena significativa em termos de satisfao dos hspedes?

O Teste Qui-Quadrado (2)

Varivel da linha Sucessos Insucessos Total 1 x1

Varivel da coluna 2 x2 n2 - x2 n2

Total x n-x n

n1 - x1 n1

No exemplo dos hotis:


Escolheria novamente o hotel? Sim No Total Hotel Praia do Farol 163 64 227 Fim da Trilha 154 108 262 317 172 489 Total

O Teste Qui-Quadrado (2)

Quais so as hipteses? A proporo de hspedes que retornariam ao hotel Praia do Farol diferente da proporo do hotel Fim da Trilha? H0) p1 = p2 H1) p1 p2 Teste 2 para a diferena entre duas propores: Onde, fo a frequncia observada; fe a frequncia esperada; Portanto, nesse exemplo, a estatstica 2 aproxima-se de uma 2 com 1 grau de liberdade (g.l.) g.l. = (nmero de linhas 1) * (nmero de colunas 1) = (2-1) * (2-1) = 1.

2 =

( f o f e )2
fe

O Teste Qui-Quadrado (2)

Para calcular a frequncia esperada (fe) necessrio entender que caso H0, seja verdadeira, a proporo de sucessos nas duas populaes ser igual. Assim, as propores das amostras que se calcula a partir que cada um dos dois grupos seriam diferentes somente em funo ao acaso. Portanto, cada uma delas iria fornecer uma estatstica do parmetro comum da populao p. Uma estatstica que combina essas 2 medidas separadas em uma nica dada por p- (significa que a proporo geral estimada de sucessos para os dois grupos). p- = sucessos; (1 p-) = insucessos.

p=

X1 + X 2 X = n1 + n 2 n

O Teste Qui-Quadrado (2)

Para calcular a frequncia esperada (fe) para cada clula de sucessos voc multiplica pelo tamanho da amostra. Faa o mesmo para os insucessos. Exemplo: p- = (163+154)/(227+262) = 0,6483 (1 p-) = 1 0,6483 = 0,3517 Clculo da frequncia esperada (fe) Praia do Farol SIM: p- * n1 = 0,6483 * 227 = 147,16 Praia do Farol NO: (1 - p-) * n1 = 0,3517 * 227 = 79,84 Fim da Trilha SIM: p- * n2 = 0,6483 * 262 = 169,84 Fim da Trilha NO: (1 - p-) * n2 = 0,3517 * 262 = 92,16

O Teste Qui-Quadrado (2)

Depois de calculada fe , calcule a estatstica do teste 2 e compare com o valor tabelado. Regra de deciso: Se 2 calculado for maior do que 2 tabelado, valor crtico da cauda superior rejeitar H0; Caso contrrio no rejeitar H0; Ateno: caso H0 seja verdadeira, a estatstica do teste 2 calculada deve estar prxima de zero, uma vez que a diferena elevada ao quadrado entre aquilo que efetivamente observado em cada clula, fo, e aquilo que teoricamente esperado, fe, deve ser bastante reduzida. Se H0 for falsa, h diferena entre as propores e espera-se que a estatstica 2 seja grande.

O Teste Qui-Quadrado (2)

Teste 2 para a diferenas entre mais de duas propores


A hiptese nula de que no existem diferenas entre as propores correspondentes s c populaes (c representa o nmero de populaes independentes que esto sendo consideradas). Quais so as hipteses?

H0) p1 = p2 = ... = pc H1) Nem todas as propores so iguais

O mesmo exemplo anterior, mas agora iremos comparar trs hotis.

O Teste Qui-Quadrado (2)

Teste 2 para a diferenas entre mais de duas propores


1) 2) 3) 4) Calcule p- ; Calcule as frequncias observadas;
2 Calcule a estatstica =

( f o f e )2
fe

Compare com o valor tabelado de 2 com (r-1) * (c-1) g.l. (r o nmero de linhas e c o nmero de colunas). Regra de deciso: 2 calculado > 2 tabelado rejeitar H0; caso contrrio no rejeitar.
Escolheria novamente o hotel? Sim No Total Hotel A 128 88 216 B 199 33 232 C 186 66 252 513 187 700 Total

5)

O Teste Qui-Quadrado (2)

Teste 2 para independncia


Anteriormente utilizamos o teste 2 para avaliar as diferenas potenciais entre as propores de populao. Para uma tabela de contingncia que possui r linhas e c colunas, pode-se generalizar o teste 2 como um teste de independncia para duas variveis categricas. H0) As duas variveis categricas so independentes (no existe nenhuma relao entre elas) H1) As duas variveis categricas so dependentes (existe relao entre elas)

A estatstica do teste

2 =

( f o f e )2
fe

O Teste Qui-Quadrado (2)

Teste 2 para independncia


Voc rejeita a hiptese nula no nvel , se o valor calculado da estatstica do teste 2 for maior que o 2 tabelado, o valor crtico da cauda superior, a partir de uma distribuio 2 com (r-1) * (c-1) g.l.

Regra de deciso: Se 2 calculado for maior do que 2 tabelado, valor crtico da cauda superior rejeitar H0; Caso contrrio no rejeitar H0;

O Teste Qui-Quadrado (2)

Teste 2 para independncia O teste de independncia semelhante ao teste 2 para igualdade entre as propores. As estatsticas do teste e a regra de deciso so as mesmas, mas as hipteses e as concluses so diferentes. Na pesquisa sobre a satisfao dos hspedes h evidncias de uma diferena significativa entre os hotis com relao proporo de hspedes que estariam propensos a retornar. De um ponto de vista diferente, poderamos concluir que existe uma relao significativa entre os hotis e a probabilidade de que um hspede venha retornar.

O Teste Qui-Quadrado (2)

Teste 2 para independncia


IMPORTANTE: Existe uma diferena fundamental entre os dois testes. A principal refere-se ao modo como so selecionadas as amostras. 1) Em um teste de igualdade entre as propores, existe um nico fator de interesse, com dois ou mais nveis. Esses nveis representam amostras extradas de populaes independentes. As respostas categricas em cada um dos grupos ou nveis de amostra so classificados em duas categorias, como sucesso e insucesso. O objetivo realizar comparaes e avaliar as diferenas entre propores de sucesso entre os nveis.

O Teste Qui-Quadrado (2)

Teste 2 para independncia


IMPORTANTE: Existe uma diferena fundamental entre os dois testes. 2) No teste de independncia existem dois fatores de interesse, cada um dos quais contm dois ou mais nveis. Voc seleciona uma amostra e as respostas combinadas para as duas variveis categricas so colocadas nas clulas da tabela.

O Teste Qui-Quadrado (2)

Teste 2 para independncia


Exemplo: Suponha que na pesquisa sobre a satisfao dos hspedes nos hotis uma segunda pergunta tenha sido formulada a todos os respondentes que indicariam que no estariam propensos a retornar. A eles foi solicitado que indicassem a principal razo para o no retorno.
Principal razo para no retornar Preo Loc alizao Acomodao O utro Total Hotel A 23 39 13 13 88 B 7 13 5 8 33 C 37 8 13 8 66 67 60 31 29 187 Total

O Teste Qui-Quadrado (2)

Teste 2 para independncia


Tabela de contingncia 4 x 3 (r x c = linhas x colunas). Quais so as hipteses?
H0) No existe relao entre a principal razo para no retornar e o hotel especfico. H1) Existe relao entre a principal razo para no retornar e o hotel especfico

A estatstica do teste

2 =

( f o f e )2
fe

O Teste Qui-Quadrado (2)

Teste 2 para independncia


Para calcular a frequncia esperada (fe) utiliza-se a regra da multiplicao de eventos independentes que vimos na reviso. Por exemplo, sob a hiptese nula de independncia, a probabilidade de respostas esperadas na clula do canto superior esquerdo, que representa o preo como principal razo para no retornar ao hotel A, corresponde ao produto entre as duas probabilidade separadas: P(preo) * P(hotel A) = (67/187) * (88/187) = 0,3583 * 0,4706 = 0,1686 187 * 0,1686 = 31,53

O Teste Qui-Quadrado (2)

Teste 2 para independncia


Generalizando: fe = (total da linha * total da coluna) / (total) Exemplos: f0 (preo e hotel A) = 23 fe (preo e hotel A) = (67 * 88) / 187 = 31,53 f0 (outro e hotel C) = 8 fe (outro e hotel C) = (29 * 66) / 187 = 10,24 Nesse exemplo temos uma distribuio 2 com (r-1)*(c-1) = (4-1)*(3-1) = (3)*(2) = 6 g.l.