Anda di halaman 1dari 51

Homepage

P
agina de Rosto

Estatstica Aplicada em Ci
encias e Engenharia

Indice Geral

JJ

II

A. Rita Gaio
Departamento de Matematica - FCUP

P
agina 1 de 51

argaio@fc.up.pt
Voltar

May 20, 2014

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 2 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

Indice Geral

Homepage

P
agina de Rosto

1 Distribui
c
oes de probabilidade especiais
1.0.1 Distribuic
ao Binomial B(n, p) . . . . .
1.0.2 Distribuic
ao de Poisson: P () . . . . .
1.0.3 Distribuic
ao Normal: N (, 2 ) . . . .
1.0.4 Distribuic
ao 2 de Pearson: 2 () . .
1.0.5 Distribuic
ao t de Student: t() . . . .
1.0.6 Distribuic
ao F de Snedecor: F (1 , 2 )

.
.
.
.
.
.

5
6
7
8
9
10
11

2 Estatsticas Amostrais
2.1 Intervalos de confianca - populac
oes normais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Intervalos de confianca - amostras grandes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Testes de hip
oteses - indicac
oes para resoluc
ao . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13
14
16
18

3 Testes de hip
oteses: uma amostra
3.1 Teste de Kolmogorov-Smirnov para uma amostra . . . . . . .
3.2 Teste de normalidade de Lilliefors . . . . . . . . . . . . . . . .
3.3 Teste de normalidade de Shapiro-Wilk . . . . . . . . . . . . .
3.4 Teste de hip
oteses sobre a media de uma distribuicao normal
( 2 desconhecida) . . . . . . . . . . . . . . . . . . . . . . . . .
3.5 Teste do sinal . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.6 Teste de Wilcoxon . . . . . . . . . . . . . . . . . . . . . . . .
3.7 Teste de hip
oteses sobre uma proporc
ao (populacao infinita) .

19
20
23
24

A. Rita Gaio, DM-FCUP

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .

Indice Geral

JJ

II

P
agina 3 de 51

Voltar

Full Screen

Fechar

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

25
27
29
31
3

Desistir

4 Testes de hip
oteses: duas amostras
4.1 Teste de hip
oteses sobre a diferenca de medias em amostras emparelhadas ( 2 desconhecida) . .
4.2 Teste de Wilcoxon em amostras emparelhadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.3 Teste de hip
oteses sobre a diferenca de medias de duas variaveis normais independentes (variancias
diferentes e desconhecidas) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.4 Teste de hip
oteses sobre a raz
ao de vari
ancias de duas distribuicoes normais . . . . . . . . . . . .
4.5 Teste de Mann-Whitney . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35
36
38

5 Testes de hip
oteses: dados categ
oricos
5.1 Teste de independencia entre dois factores . . . .
5.2 Teste de homogeneidade de proporc
oes . . . . . .
5.3 Teste de hip
oteses de comparac
ao de proporcoes
cord
ancia de McNemar . . . . . . . . . . . . . . .

47
48
49

P
agina de Rosto

50

Indice Geral

. . . . . . . . . .
. . . . . . . . . .
usando amostras
. . . . . . . . . .

. . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . .
emparelhadas - teste de dis. . . . . . . . . . . . . . . . .

40
42
44

Homepage

JJ

II

P
agina 4 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

Chapter 1

Homepage

P
agina de Rosto

Distribui
c
oes de probabilidade especiais
Indice Geral

JJ

II

P
agina 5 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

1.0.1.

Distribuic
ao Binomial B(n, p)

n = # ensaios de Bernoulli (experiencias independentes e


identicamente distribudas) para as quais existem precisamente 2 realizac
oes possveis - sucesso e insucesso
p = probabilidade de sucesso
X B(n, p) se X representa o n
umero de sucessos em n
ensaios

Observa
c
ao: Lembramos que
 
n
n!
=
x
x!(n x)!
Homepage

onde n! = n.(n 1).(n 2) . . . 3.2.1.


Distribuio Binomial B(n, p)

B(x) = P (X x) =

Domnio

0, 1, 2, 3, . . . , n

Px

k=0

b(k)

Media

= np

0.20
0.15

densidade

JJ

II

P
agina 6 de 51

0.00

Funcao de distrib.

Indice Geral

0.10

b(x) = P (X = x)
=probabilidade do sucesso acontecer
x vezes
em n ensaios de Bernoulli

= nx px (1 p)nx 0 < p < 1
x = 0, 1, . . . , n

0.05

Funcao de prob.

0.25

0.30

P
agina de Rosto

10

Moda

p(n + 1) 1 M p(n + 1)

Desvio padr
ao

Coef. Assimetria

np(1 p)

= 12p

np(1p)

Voltar

Instru
c
oes em R:
dbinom(x, size = ..., prob = ...)

Full Screen

pbinom(q, size = ..., prob = ...)


qbinom(p, size = ..., prob = ...)
onde size e prob representam, respectivamente, o n
umero de ensaios de Bernoulli e
a probabilidade de sucesso.

A. Rita Gaio, DM-FCUP

Fechar

Desistir

1.0.2.

Distribuic
ao de Poisson: P ()

A distribuic
ao de Poisson e normalmente usada para modelar dados de contagens1 . Geralmente, trata-se de
contar o n
umero de ocorrencias de um determinado acontecimento, num perodo de tempo (ou num espaco)
especificado, sempre que:
os eventos ocorram independentemente

Homepage

a probabilidade de um evento ocorrer num perodo de tempo (ou num espaco) muito pequeno seja baixa
(i.e., os acontecimentos sejam raros)
P
agina de Rosto

p(x) =

e x
x!

Funcao de distrib.

P (x) =

Px

Domnio

0, 1, 2, 3, . . .

Media

Moda

maior inteiro (= [])

densidade

p(k)

Indice Geral

JJ

II

0.00

0.05

k=0

>0

0.10

Funcao de prob.

0.15

Distribuio de Poisson P()

Desvio padr
ao

Coef. Achatamento

=3+

10

11

12

13

14

15

P
agina 7 de 51

Instru
c
oes em R:

Coef. Assimetria

Voltar

dpois(x, lambda = ...)


1

ppois(q, lambda=...)

Full Screen

qpois(p, lambda=...)
onde lambda representa a media da variavel
aleatoria.

Fechar

Desistir
1 count

data

A. Rita Gaio, DM-FCUP

Distribuic
ao Normal: N (, 2 )

1.0.3.

uma das distribuic


E
oes mais importantes no estudo
das probabilidades e da estatstica.

Densidade

f (x) =

2
2
1 e(x) /(2 )
2

( R,

> 0)

Domnio

< x < +

Media

Mediana

Desvio padr
ao

Amplitude

Coef. Assimetria

=0

Instru
c
oes em R:
dnorm(x, mean = ..., sd = ...)
pnorm(q, mean = ..., sd = ...)
Homepage

qnorm(p, mean = ..., sd = ...)


onde mean e sd representam, respectivamente, a media e o desvio-padrao da variavel.

P
agina de Rosto

Indice Geral

Teorema: Seja Z N (0, 1). Entao MZ (t) existe e


 2
t
M (t) = exp
,
< t < +.
2

Teorema: Seja X uma v.a. seguindo a distribuicao


normal N (, 2 ). Entao MX (t) existe e


2 t2
MX (t) = exp t +
.
2

JJ

II

P
agina 8 de 51

Voltar

f (x)
0.8
X N (0, 1)
Y N (0, 2)
Z N (0, 0.5)

0.4

Full Screen

Fechar

5 4 3 2 1

A. Rita Gaio, DM-FCUP

x
Desistir

1.0.4.

Distribuic
ao 2 de Pearson: 2 ()

Funcao dens. prob.

f (x) =

1
ex/2 x(/2)1
2/2 (/2)

f (x)
X 2 (2)

( > 0)

Domnio

0 < x < +

Y 2 (4)

Media

Z 2 (8)

Desvio padr
ao

Homepage

P
agina de Rosto

Z
Indice Geral

onde

Z
() =

t1 et dt

Instru
c
oes em R:

e designada por func


ao gama. O par
ametro diz-se
o n
umero de graus de liberdade.

dchisq(x, df)

Teorema 1.0.1

qchisq(p, df)

pchisq(q, df)

onde df representa o n
umero de graus de liberdade (degrees of freedom).

(b) U1 , . . . , Uk v.a. independentes,


Uj 2 (j ), j = 1, . . . ,
= U1 + + Uk 2 (1 + + k )

Corol
ario: Seja U 2 (). Entao M (t) existe; para
t < 1/2 tem-se
M (t) = (1 2t)/2 .

Voltar

Full Screen

Fechar

Desistir

a Este

resultado pode ser usado como definic


ao da distribuic
ao 2 ().
A. Rita Gaio, DM-FCUP

II

P
agina 9 de 51

(a) Z1 , . . . , Z v.a. independentes,


Zj N (0, 1), j = 1, . . . ,
= Z12 + + Z2 2 () a

(c) U1 , U2 v.a. independentes


U1 + U2 2 (), U1 2 (1 ), > 1
= U2 2 ( 1 ).

JJ

1.0.5.

Distribuic
ao t de Student: t()
f (x)

Funcao dens. prob.


Media

t(x) =

( +1
2 )

(1
( 2 )

=0

Desvio Padr
ao

onde

Z
() =

x2 +1
2
)

1 < 2 < 3

( > 1)

Homepage

( > 2)
x

P
agina de Rosto

Teorema 1.0.2 Sejam Z e U duas v.a. independentes tais que Z N (0, 1) e U 2 (). Ent
ao

t1 et dt

e a func
ao gama e e chamado o n
umero de graus
de liberdade.
A distribuic
ao t e simetrica em relac
ao `
a media (zero).
Graficamente e bastante parecida com a distribuic
ao
normal: apresenta contudo caudas mais altas e um valor
maximo inferior e menos arredondado (mais afiado)
que o da distribuic
ao normal.

Z
T =p
t().a
U/

Instru
c
oes em R:

X t(2)

II

P
agina 10 de 51

qt(p, df=...)

Y N (0, 1)

JJ

dt(x, df=...)
pt(q, df=...)

f (x)

Indice Geral

Voltar

onde df sao os graus de liberdade da distribuicao.


a Este resultado pode ser usado como defini
ca
o da distribuic
ao t().

Full Screen

Fechar

x
A. Rita Gaio, DM-FCUP

Desistir

10

1.0.6.

Distribuic
ao F de Snedecor: F (1 , 2 )
Teorema 1.0.3

Funcao

f (x)
+
12 2
1

2 22

(
) 1 /2 2 /2 (1 /2)1

2 x
(2 + 1 x)(1 +2 )/2
( ) ( ) 1

dens. prob.

Domnio

0 < x < +

Media

2
2 2

Vari
ancia

Moda



1 2
1

2
2 +2

(2 > 4)

Homepage

U1 /1
= U =
F (1 , 2 )a
U2 /2
(b) U F (1 , 2 ) =

(2 > 2)

222 (1 +2 2)
1 (2 4)(2 2)2

(a) U1 , U2 v.a. independentes


U1 2 (1 ), U2 2 (2 )

1
U

P
agina de Rosto

F (2 , 1 )

(c) Relac
ao entre a distribuic
ao-t e a
distribuic
ao-F :
Y t() = Y 2 F (1, ).

(1 > 2)

Instru
c
oes em R:

onde

Z
() =

Indice Geral

JJ

II

df(x, df1=..., df2=...)

t1 et dt

e a func
ao gama. Os par
ametros (1 , 2 ) dizem-se os
graus de liberdade da distribuic
ao F . Independentemente dos valores de (1 , 2 ), a distribuic
ao e assimetrica
`a direita. f(x)

pf(q, df1=..., df2=...)

P
agina 11 de 51

qf(p, df1=..., df2=...)


Voltar

onde df1 e df2 representam os n


umeros
de graus de liberdade (degrees of freedom).

Full Screen

a Este resultado pode ser usado como


definic
ao da distribuic
ao 2 ().

Fechar

Desistir

x
A. Rita Gaio, DM-FCUP

11

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 12 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

12

Chapter 2

Homepage

P
agina de Rosto

Estatsticas Amostrais
Indice Geral

JJ

II

P
agina 13 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

13

2.1.

Intervalos de confian
ca - populaco
es normais

Par
ametro: Media ( 2 conhecida)
Condi
c
oes de aplica
c
ao:
2

Par
ametro: Variancia 2
Condi
c
oes de aplica
c
ao:

X N (, )

X N (, 2 )

Vari
avel fulcral:

Vari
avel fulcral:
(n 1)S 2
2 (n 1)
2

X
N (0, 1)
/ n
IC a (1 )100%:



X
N1 2 (0, 1), X +
N1 2 (0, 1)
n
n
Par
ametro: Media ( 2 desconhecida)
Condi
c
oes de aplica
c
ao:

Vari
avel fulcral:
X
t(n 1)
S/ n
IC a (1 )100%:


S
S
X t1 2 (n 1), X + t1 2 (n 1) a
n
n
a H
a autores que escrevem tn1,1 para designar o
2

1
-quantil da distribuica
o t(n 1), valor acima desig2
nado por t1 (n 1).

A. Rita Gaio, DM-FCUP

P
agina de Rosto

IC a (1 )100%:

Indice Geral

(n 1)S 2 (n 1)S 2
,
1) 2 (n 1)

21 (n
2

Par
ametro: Diferenca de medias 1 2
(pop. independentes; 12 , 22 conhecidas)

JJ

II

Condi
c
oes de aplica
c
ao:

X N (, 2 )

Homepage

P
agina 14 de 51

X1 N (1 , 12 ), X2 N (2 , 22 )
Vari
avel fulcral:

Voltar

(X 1 X 2 ) (1 2 )
q 2
N (0, 1)
1
22
+
n1
n2

Full Screen

IC a (1 )100%:

Fechar

X 1 X 2 N1 2 (0, 1), X 1 X 2 + N1 2 (0, 1)


onde =

12
n1

22
n2 .


Desistir

14

Par
ametro: Razao de variancias

Par
ametro: Diferenca de medias 1 2
(pop. independentes; 12 , 22 desconhecidas)

22
12

Condi
c
oes de aplica
c
ao:
Condi
c
oes de aplica
c
ao:

X1 N (1 , 12 ), X2 N (2 , 22 )

X1 N (1 , 12 ), X2 N (2 , 22 )

Vari
avel fulcral:

Vari
avel fulcral:
(X 1 X 2 ) (1 2 ) a
q 2
t()
S22
S1
+
n1
n2

2
2

S2
S12
n1 + n2
2
2

=
1
n1 1

S1
n1

1
n2 1

S22
n2

2

Par
ametro: Diferencas de medias 1 2
(amostras emparelhadas)

IC a (1 )100%:
X 1 X 2 S t1 2 (), X 1 X 2 + S t1 2 ()

onde S =

S12
n1

S22
n2 .

P
agina de Rosto

IC a (1 )100%:
 2

S2
S22
F (n1 1, n2 1), 2 F1 2 (n1 1, n2 1)
S12 2
S1

onde e o maior inteiro que n


ao excede


Homepage

S12 22
F (n1 1, n2 1)
S22 12

Condi
c
oes de aplica
c
ao:


Indice Geral

JJ

II

2
D = X1 X2 N (D , D
)
P
agina 15 de 51

Vari
avel fulcral:
(X 1 X 2 ) (1 2 )

t(n 1)
SD / n

Voltar

IC a (1 )100%:
Full Screen


SD
SD
X 1 X 2 t1 2 (n 1), X 1 X 2 + t1 2 (n 1)
n
n
Fechar

Desistir

A. Rita Gaio, DM-FCUP

15

2.2.

Intervalos de confian
ca - amostras grandes
Par
ametro: Diferenca de medias 1 2
(pop. independentes; 12 , 22 finitas)

Par
ametro: Media ( 2 finita)
Vari
avel fulcral:

Vari
avel fulcral:

X a
N (0, 1)
S/ n

Homepage

IC a (1 )100%:


S
S
X N1 2 (0, 1), X + N1 2 (0, 1)
n
n
Par
ametro: Proporc
ao p

Vari
avel fulcral:
pp
q

p(1p)
n

P
agina de Rosto

IC a (1 )100%:
X 1 X 2 S N1 2 (0, 1), X 1 X 2 + S N1 2 (0, 1)
q

Indice Geral

S22
n2 .

JJ

II

Par
ametro: Diferencas de medias 1 2
(amostras emparelhadas)

onde S =

Condi
c
oes de aplica
c
ao:
n 30 e np(1 p) > 5

(X 1 X 2 ) (1 2 ) a
q 2
N (0, 1)
S1
S22
+
n1
n2

S12
n1

Vari
avel fulcral:
a

N (0, 1)

IC a (1 )100%:
!
r
r
p(1 p)
p(1 p)
p
N1 2 , p +
N1 2
n
n
onde N1 2 representa o
distribuic
ao N (0, 1).

P
agina 16 de 51

(X 1 X 2 ) (1 2 ) a

N (0, 1)
SD / n

IC a (1 )100%:


SD
SD
X 1 X 2 N1 2 (0, 1), X 1 X 2 + N1 2 (0, 1)
n
n

Voltar

Full Screen

-quantil da

Fechar

a Caso contr
ario, usa-se a distribuica
o binomial. H
a autores
que consideram np(1 p) 10, ou np > 5 e np(1 p) > 5.

Desistir

A. Rita Gaio, DM-FCUP

16

Par
ametro: Diferenca de proporc
oes p1 p2

Observa
c
ao: Um intervalo de confianca exacto a
(1 )100% para a proporcao p e (p1 , p2 ) onde p1 e
p2 sao tais que:

Condi
c
oes de aplica
c
ao:
n1 , n2 30, n1 p1 (1p1 ) > 5 e n2 p2 (1p2 ) > 5

P (X x|p = p1 ) =

Vari
avel fulcral:
(p p2 ) (p1 p2 ) a
q1
N (0, 1)b
p1 (1p1 )
p2 (1p2 )
+
n1
n2

P (X x|p = p2 ) =

onde p =

p1 (1p1 )
n1

=
2

x 
X
i=0


n i
p (1 p2 )ni
i 2

(aqui X B(n, p) e a v.a. que conta o n


umero de
sucessos na amostra de tamanho n.)

IC a (1 )100%:
p1 p2 p N1 2 (0, 1), p1 p2 + p N1 2 (0, 1)

n  
X n i
p1 (1 p1 )ni
=
i
2
i=x

P
agina de Rosto

Indice Geral


JJ

II

p2 (1p2 )
n2

a Caso contr
ario, usa-se o teste exacto de Fisher que usa a
distribuic
ao hipergeom
etrica.
b Com correc
c
ao de continuidade, a vari
avel fulcral
e


1
1
(p1 p2 ) (p1 p2 ) 2n + 2n
a
1
2
q
N (0, 1)
p1 (1p1 )
p2 (1p2 )
+
n
n
1

Homepage

P
agina 17 de 51

Voltar

Para amostras bastante grandes, a correcca


o de continuidade
e
usualmente ignorada (reparar que esta conduz a uma alterac
ao
da estatstica quase insignificante).

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

17

2.3.

Testes de hip
oteses - indica
c
oes para resoluc
ao

Resolu
c
ao `
a m
ao:
1. indicar o nome do teste
2. identificar a(s) v.a.(s) em causa
3. verificar que todas as condic
oes de aplicac
ao do
teste s
ao satisfeitas
4. formular H0 e H1
5. determinar o valor da estatstica de teste e indicar a sua distribuic
ao
6. identificar a(s) zona(s) de rejeic
ao (escrevendo
o criterio de rejeic
ao ou fazendo a figura correpondente)
7. escrever a conclus
ao do teste de hip
oteses para
o nivel de signific
ancia especificado, (quando
nada e referido, tomar = 0.05)
Extra, s
o feito se pedido no enunciado:
8. calcular o intervalo correspondente (s
o possvel
em algumas situacoes)
9. calcular o valor-p do teste de hip
oteses.

Resolu
c
ao em computador:
1. construir um ficheiro a partir dos dados ou importar o ficheiro em causa (verificando que todas as v.a. estao devidamente classificadas)

Homepage

2. indicar o nome do teste


3. identificar a(s) v.a.(s) em causa

P
agina de Rosto

4. verificar que todas as condicoes de aplicacao do


teste sao satisfeitas

Indice Geral

5. formular H0 e H1
6. identificar o valor da estatstica de teste e do
valor-p a partir do output do software estatstico e passar o resultado para papel.
Por exemplo, o resultado de um teste-t deve ser
escrito na forma
t = 0.873,

df = 14,

JJ

II

P
agina 18 de 51

p = 0.397.

7. escrever a conclusao do teste de hipoteses com


base no valor-p obtido, para o nvel de significancia especificado (quando nada e referido,
tomar = 0.05)

Voltar

Full Screen

Extra, so feito se pedido no enunciado:

A. Rita Gaio, DM-FCUP

8. indicar o intervalo de confianca correspondente


(a partir do output do software)

Fechar

9. confirmar o valor-p do teste, com calculos `a


mao.

Desistir

18

Chapter 3

Homepage

P
agina de Rosto

Testes de hip
oteses: uma amostra
Indice Geral

JJ

II

P
agina 19 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

19

3.1.

Teste de Kolmogorov-Smirnov para uma amostra

Dados: amostra aleat


oria X1 , . . . , Xn de tamanho n de uma
vari
avel aleat
oria X
0.08

H0 : X distribuicao G
H1 : X 6 distribuicao G

0.06
Density

? x(1) < < x(k) valores distintos observados, dispostos


por ordem crescente



b
b

? Di = max G(x
(i) ) G(x(i) ) , G(x(i1) ) G(x(i) )
se X
e uma v.a. contnua;


b

Di = G(x
)

G(x
)
(i)
(i)

65

x(i)
x(1)
x(2)

(i) )
G(x
1
G
2
G

x(k)

k
G

G(x(i) )
G1
G2

Diferencas
D11 D12
D21 D22

A. Rita Gaio, DM-FCUP

Dk1

Dk2

75

80

85

90

95

JJ

II

1.0

P
agina 20 de 51

0.8

Voltar

Fn(x)

0.6

Full Screen

Fechar

65

Gk

70

Glucose

se X
e uma v.a. discreta;
No primeiro caso tem-se a diferenca entre uma funcao
contnua crescente e uma func
ao em escada; no segundo
caso tem-se a diferenca entre duas func
oes em escada.

i
1
2

Indice Geral

0.00

b = func
? G
ao de distribuic
ao emprica associada `a
amostra

Decis
ao: Rejeitar H0 com nvel de signific
ancia se d =
maxi Di > KS1 (n)

P
agina de Rosto

0.04

KS(n)

0.02

1in

xR

0.4

b
D = max | G(x)
G(x) |= max Di

0.2

(teste bilateral)

0.0

Estatstica de teste:

Homepage

70

75

80

85

90

95

Glucose

20

Desistir

Instruc
oes em R:
> ks.test(x, y, ...,
alternative = c("two.sided", "less", "greater"),
exact = NULL)

onde
x e a vari
avel em causa (para a qual se quer
testar uma determinada distruibuic
ao)

Homepage

y e a func
ao distribuic
ao a testar (no caso da
distribuic
ao normal, y=pnorm )

P
agina de Rosto

. . . diz respeito a` especificac


ao dos par
ametros
da distribuic
ao referida em y

Indice Geral

alternative refere-se `
a hip
otese alternativa:
two.sided (por defeito), less ou greater.
exact=NULL e a instruc
ao por defeito que calcula o valor-p. Caso a distribuic
ao exacta n
ao
possa ser usada (situac
ao em que h
a empates,
por exemplo), o valor-p e calculado usando
aproximac
oes por distribuic
oes assimpt
oticas.

JJ

II

P
agina 21 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

21

Quantis da distribui
c
ao KS(n)
Testes unilaterais
p=.90 .95 .975 .99 .995
Testes bilaterais
p=.80 .90 .95 .98 .99
n=1
.900 .950 .975 .990 .995
2
.684 .776 .842 .900 .929
3
.565 .636 .708 .785 .829
.493 .565 .624 .689 .734
4
5
.447 .509 .563 .627 .669
.410 .468 .519 .577 .617
6
.381 .436 .483 .538 .576
7
8
.358 .410 .454 .507 .542
.339 .387 .430 .480 .513
9
.323 .369 .409 .457 .489
10
11
.308 .352 .391 .437 .468
12
.296 .338 .375 .419 .449
13
.285 .325 .361 .404 .432
.275 .314 .349 .390 .418
14
15
.266 .304 .338 .377 .404
.258 .295 .327 .366 .392
16
.250 .286 .318 .355 .381
17
18
.244 .279 .309 .346 .371
19
.237 .271 .301 .337 .361
20
.232 .265 .294 .329 .352
21
.266 .259 .287 .321 .344
22
.221 .253 .281 .314 .337
23
.216 .247 .275 .307 .330
24
.212 .242 .269 .301 .323
25
.208 .238 .264 .295 .317
26
.204 .233 .259 .290 .311
27
.200 .229 .254 .284 .305
28
.197 .225 .250 .279 .300
29
.193 .221 .246 .275 .295
30
.190 .218 .242 .270 .290
31
.187 .214 .338 .266 .285
.184 .211 .234 .262 .281
32
33
.182 .208 .231 .258 .277
34
.179 .205 .227 .254 .273
35
.177 .202 .224 .251 .269
36
.174 .199 .221 .247 .265
37
.172 .196 .218 .244 .262
.170 .194 .215 .241 .258
38
39
.168 .191 .213 .238 .255
40
.165 .189 .210 .235 .252
aproxima
c
ao para n > 40
1.07
1.22
1.36
1.52
1.63

n > 40
n
n
n
n
n

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 22 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

22

3.2.

Teste de normalidade de Lilliefors

Dados: amostra aleat


oria X1 , . . . , Xn de tamanho n
de uma vari
avel aleat
oria contnua X
H0 : X N (, 2 )
H1 : X 6 N (, 2 )

i
1
2

para algum (, 2 )
para qualquer (, 2 )

z(i)
z(1)
z(2)

F (z(i) )
F1
F2

(z(i) )
1
2

Diferencas

D11
D12

D21 D22

z(k)

Fk

Dk1

Dk2

Reduzem-se os dados usando a media e o desviopadr


ao amostrais, formando Z1 , . . . , Zn onde

P
agina de Rosto

Xi
.

Indice Geral
0.08

A estatstica de teste e
L(n)

? Fb representa a func
ao de distribuic
ao emprica
de Z1 , . . . , Zn
? representa a func
ao de distribuic
ao (te
orica)
da distribuic
ao normal reduzida N (0, 1)
? z(1) < < z(k) s
ao os valores distintos observados, dispostos por ordem crescente






? Di = max Fb(z(i) ) (z(i) ) , Fb(z(i1) ) (z(i) )
Observe-se que D coincide com o valor da
estatstica de teste do teste de KolmogorovSmirnov aplicado `
a distribuic
ao normal com
par
ametros iguais aos amostrais.

0.06

Density

1in

II

P
agina 23 de 51

65

70

75

80

85

90

95

Voltar

Glucose

Full Screen

Instrucoes em R:
> library(nortest)
> lillie.test(VariableName)

Fechar

Decis
ao: Rejeitar H0 com nvel de signific
ancia se
d = maxi Di > L1 (n)

Desistir

(existem tabelas disponveis para a distribuic


ao L(n))
A. Rita Gaio, DM-FCUP

JJ

0.02

zR

0.00

D = max | Fb(z) (z) |= max Di

0.04

Zi =

Homepage

23

3.3.

Teste de normalidade de Shapiro-Wilk

Dados: amostra aleat


oria x1 , . . . , xn de tamanho
n de uma vari
avel aleat
oria contnua X seguindo
uma distribuic
ao de probabilidade G.
Pretende-se testar a hip
otese nula de que G e uma
distribuic
ao normal, i.e.
H0 : G = N (, 2 )

Homepage
3

para algum (, 2 )

contra a hip
otese alternativa de que a distribuic
ao
n
ao e normal
H1 : G 6= N (, 2 ) qualquer que seja (, 2 ).

Indice Geral
0

9
,6
84 63
,
84 56
,
84 50
,
84 44
,
84 38
,
84 1
,3
84 25
,
84 19
,
84 13
,
84 06
,
84 00
,
84 4
,9
83 88
,
83 81
,
83

Teste de normalidade de Shapiro-Wilk

P
agina de Rosto

Observac
oes por ordem crescente:
> shapiro.test(x)

Estatstica de Shapiro-Wilk:
n
X
k=1

P
agina 24 de 51

SW(n).

Aqui ak (n) s
ao constantes associadas `
a kesima estatstica de ordem de uma amostra
de n v.a. i.i.d que seguem uma distribuic
ao
normal.
O algoritmo de determinac
ao dessas constantes est
a implementado no R e no SPSS.

Observa
c
ao: O teste de SW envolve calculos demasiado elaborados e morosos para serem efectuados
`a mao.

Voltar

Full Screen

Fechar

Decis
ao:
Rejeitar H0 com nvel de signific
ancia se
W SW(n)1 .
A. Rita Gaio, DM-FCUP

onde x e o vector de valores numericos dos dados.


!2

ak (n)x(k)

II

Instrucoes em R:

x(1) x(n)

1
W =
(n 1) 2

JJ

Desistir

24

3.4.

Teste de hip
oteses sobre a m
edia de uma distribuic
ao normal
2
( desconhecida)

Problema: testar se a media de uma vari


avel aleat
oria X que segue uma distribuic
ao normal N (, 2 ), e
diferente, menor ou maior do que 0 . Para alem do
desconhecimento da media , tambem se desconhece
a vari
ancia 2 .
Dados: amostra aleat
oria X1 , . . . , Xn de tamanho n de X
(i) H0 : = 0 , H1 : 6= 0

(ii) H0 : = 0 , H1 : < 0

(iii) H0 : = 0 , H1 : > 0
Estatstica de teste:
T =

X 0
t(n 1)
S/ n

onde
X=

1
n (X1 + + Xn )

e a media amostral

Pn

1
2 e o desvio
S =
k=1 (Xk X)
n1
padr
ao amostral

Decis
ao: Rejeitar H0 com nvel de significancia se
(i) t > t1/2 (n 1) ou t < t/2 (n 1)
(equivalentementea T 2 F1 (1, n 1))

Homepage

(ii) t t (n 1)

(iii) t t1 (n 1)

P
agina de Rosto

Pelo que foi visto na seccao sobre estatsticas


amostrais:
X N (, 2 ) =
n grande =

S/ n

a
X

S/ n

t(n 1)

N (0, 1).

Pode-se provar b que a quase-simetria da populacao


de base garante que o comportamento do teste nao
se altera grandemente relativamente ao que se passa
com populacoes normais. Para poder aplicar o teste-t
em populacoes nao normais, ha portanto que garantir que a populacao de base nao e desvairadamente
assimetrica.
a Relembre-se
b Efron,

JJ

II

P
agina 25 de 51

Voltar

que Y t() = Y 2 F (1, ).

1969

Full Screen

Por causa da estatstica de teste usada, que


segue uma distribuic
ao t, este teste para a media e muitas vezes designado simplesmente por
teste t.

Fechar

a Na verdade, tem-se H : = , desconhecida,


H1 :
0
0
6= 0 , desconhecida; e analogamente nas situaco
es (ii) e
(iii).

A. Rita Gaio, DM-FCUP

Indice Geral

Desistir

25

Instruc
oes em R:
> t.test(x,
alternative = c("two.sided", "less", "greater"),
mu = 0,
conf.level = 0.95, ...)

onde

Homepage

x e a vari
avel (contnua) em causa
alternative refere-se `
a formulac
ao da hip
otese alternativa: two.sided (por defeito), less ou greater.

P
agina de Rosto

mu=... refere-se `
a formulac
ao da hip
otese nula

Indice Geral

conf.level=... indica o nvel de confianca do intervalo de confianca para a media.

JJ

II

P
agina 26 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

26

3.5.

Teste do sinal

Dados: a.a. de 1 vari


avel contnua, ordinal ou
nominal
funcao sinal, sign, definida por
sign(xi ) = +1,
sign(xi ) = 0,
sign(xi ) = 1,
N = #xi s t.q.

xi > m0
xi = m 0
xi < m0

Homepage

P
agina de Rosto

sign(xi ) 6= 0

P (+) = prob. de obter um sinal +


P () = prob. de obter um sinal
H0 : m = mediana = m0 , i.e., P (+) = P () =

1
2

H1 : m = mediana 6= m0

N = #xi s t.q.
N = #(1)s,

sign(xi ) 6= 0

N+ = #(+1)s

K = v.a. que representa o n


umero de (1)s,
ou

(+1)s, em N observac
oes; K B N, 12
Estatstica de teste: S = min{N , N+ }.

Decis
ao: Rejeitar H0 com nvel de signific
ancia
se
(i) F (N ) e H1 : P (+) > P ()

Obs. i
1
2
..
.

xi
x1
x2
..
.

signi
1
1
..
.

xk

Indice Geral

JJ

II

C
alculo do valor-p:
O valor de prova do teste e calculado de forma usual.
Para as situacoes (i)-(iii) descritas no item Decisao
tem-se

P
agina 27 de 51

Voltar

(i) p = F (N )
(ii) p = F (N+ )

Full Screen

(iii) p = 2 F (S).

(ii) F (N+ ) e H1 : P (+) < P ()

Fechar

(iii) F (S) /2 e H1 : P (+) 6= P ()


onde F (k) = P (K k).
A. Rita Gaio, DM-FCUP

Desistir

27

Instruc
oes em R:
o teste do sinal corresponde essencialmente a um
teste de hip
oteses para o par
ametro p de uma distribuic
ao binomial; no caso de se pretender testar a
mediana, p = 0.5.
> binom.test(x, n, p = 0.5,
alternative = c("two.sided", "less", "greater"))

Homepage

onde
P
agina de Rosto

x e o valor da estatstica de teste S


N e o n
umero de observac
oes da amostra excluindo empates

Indice Geral

p representa a proporc
ao associada ao quantil
a testar; no caso da mediana, p = 0.5.

JJ

II

P
agina 28 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

28

3.6.

Teste de Wilcoxon

Como se viu, o teste do sinal despreza a magnitude das


observac
oes, retendo apenas a sua posic
ao relativamente
ao valor de teste referido na hip
otese nula. Quando a
vari
avel em causa e contnua ou ordinal (com diferencas
quantific
aveis entre os valores), isso pode torna-se ineficiente e reduzir a potencia estatstica do teste.
Dados: Dados: amostra aleat
oria x1 , x2 , . . . , xn
de uma vari
avel contnua ou ordinal (com diferencas quantific
aveis entre os v
arios valores), com
distribuic
ao n
ao muito assimetrica
H0 : P (X > m0 ) = 1/2, H1 : P (X > m0 ) 6= 1/2
Estatstica de teste:
R+ , que segue uma distribuic
ao especfica tabelada.
Caso a amostra seja grande:
T =

N (N +1)
R+
|q
| 12
4
N (N +1)(2N +1)
24

se R 6=
T =

N (N +1)
4

e n
ao existem empates;
|

se R+ 6=
T =0

N (N +1)
4
+

se R =

N (0, 1)

e existem empates;
N (N +1)
.
4

parcela 12 no numerador refere-se a uma correcc


ao de continuidade; pode ou n
ao ser considerada.
aa

Nas formulas anteriores:


? di = xi m0
(i = 1, 2, . . . , n)
N = # di s t.q. di 6= 0
? |d(1) | < < |d(r) | valores distintos dispostos
por ordem crescente com ordens R(1) < <
R(r) , respectivamente (r N ).
Em relacao aos valores iguais (empates),
atribui-se a cada um desses valores um
n
umero de ordem igual `a media das ordens
que lhes caberia.
P
? R+ = di >0 R(i)
(soma dos ranks das diferencas positivas)
? q = # de valores di repetidos (empates)
ti = # de repeticoes por valor repetido

N (0, 1)a

N (N +1)
R
12
4
r
Pq
1
N (N +1)(2N +1)
(t3 ti )
i=1 i
2
24
+

(A distribuica
o de T s
o e assimptoticamente normal se o
n
umero de di s n
ao nulos for 16; caso contr
ario, outros
metodos ter
ao de ser aplicados)

xi
x1
x2
..
.
xn

di
x1 m0
x2 m0
..
.
xn m0

|di |
|x1 m0 |
|x2 m0 |
..
.
|xn m0 |

rank
R(1)
R(2)
..
.
R(r)

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 29 de 51

Voltar

Full Screen

Decisao: Rejeitar H0 com nvel de significancia


se T > N1 2 (0, 1), caso a amostra seja grande
(digamos maior do que 30); se a amostra for pequena, consultar a tabela correspondente.

Fechar

Desistir

A. Rita Gaio, DM-FCUP

29

Instruc
oes em R:
wilcox.test(x,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, exact = NULL,
correct = TRUE, conf.int = FALSE,
conf.level = 0.95, ...)
Homepage

A instruc
ao exact=TRUE usa a estatstica de teste exacta e deve ser usada, essencialmente, nas situac
oes
em que o n
umero de di s n
ao nulos for baixo.
A correcc
ao para a continuidade correct=TRUE e
pouco sentida em amostras grandes.

P
agina de Rosto

Indice Geral

JJ

II

P
agina 30 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

30

3.7.

Teste de hip
oteses sobre uma proporc
ao (populac
ao infinita)

Problema: testar se numa populac


ao infinita dividida em duas classes disjuntas, S e F , a proporc
ao
de elementos da classe S e igual, menor ou maior do
que um dado valor p0 .
Dados: amostra aleat
oria de tamanho n dessa
populac
ao
Suponha-se que o sucesso e pertencer `
a classe S e
seja p a proporc
ao de sucessos. Ent
ao a vari
avel
aleat
oria X que representa o n
umero de sucessos
numa amostra de tamanho n segue uma distribuic
ao
binomial B(n, p):
 
n x
P (X = x) = B(x; n, p) =
p (1 p)nx
x

(ii) H0 : p = p0 ,
(iii) H0 : p = p0 ,

X B(n, p) N (np, np(1 p)).

Homepage

Mais concretamente, procedemos da seguinte forma.


P
agina de Rosto

Estatstica de teste: (sob H0 )


p p0
U=q

p0 (1p0 )
n

Indice Geral

N (0, 1)a

ou, equivalentemente,
U 2 2 (1).
(A aproximac
ao pela distribuica
o normal pode ser melhorada usando uma correcca
o de Yates)

para r = 0, . . . , n.
(i) H0 : p = p0 ,

Se n for grande (n 30) e np(1 p) > 5 (garantindo que


p nao esta nem muito proximo de 0 nem muito proximo
de 1) entao pode usar-se a aproximacao

H1 : p 6= p0

H1 : p > p0
H1 : p < p0

Estatstica de teste:
x = n
umero de sucessos observados
numa amostra de tamanho n.

Decisao: Rejeitar H0 com nvel de significancia se:


(i) u > N1/2 (0, 1) ou u < N/2 (0, 1)
(equivalentemente, u2 21 (1))

II

P
agina 31 de 51

Voltar

(ii) u > N1 (0, 1)


(iii) u < N (0, 1).
a Equivalentemente,

U =

Full Screen
xnp0
np0 (1p0 )

N (0, 1).

Observe-se tamb
em que que p
e a m
edia amostral de n v.a. independentes Xi seguindo B(1, p). Como E(Xi ) = p e Var(Xi ) =
p(1 p), o teorema
do limite
central permite concluir que p =


a
a
p(1p)
1 Pn
q pp
X

N
p,
,
i.e.,
N (0, 1).
i
i=1
n
n
p(1p)
n

A. Rita Gaio, DM-FCUP

JJ

31

Fechar

Desistir

Instruc
oes em R:
prop.test(x, n, p = NULL,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95, correct = TRUE)

onde
x e o n
umero de sucessos observados
n e o tamanho da amostra
p e a proporc
ao p0 definida em H0 (por defeito,
considera-se p = 0.5)
alternative e definida de acordo com a
hip
otese alternativa
conf.level determinada o nvel de confianca do
intervalo de confianca a devolver
correct= TRUE ou FALSE, caso se pretenda
ou n
ao correcc
ao de continuidade, respectivamente.
Nota: Infelizmente, quer o valor-p do teste quer o
valor da proporc
ao de sucessos da distribuic
ao bino
mial s
ao representados na instruc
ao acima por p. E
muito importante saber identificar cada um destes
objectos e n
ao os confundir.

Para amostras de tamanho pequeno ou tais que


np(1 p) < 5, o teste a usar considera directamente a distribui
c
ao binomial B(n, p) (teste
exacto). Para realizar o teste binomial exacto partimos da variavel aleatoria X, definida atras, que conta
o n
umero de sucessos observados numa amostra
com n elementos, seguindo a distribuicao binomial
B(n, p).
(i) H0 : p = p0 ,

H1 : p 6= p0

(ii) H0 : p = p0 ,

Homepage

P
agina de Rosto

H1 : p > p0

(iii) H0 : p = p0 ,

H1 : p < p0

Indice Geral

Representando por
xobs :
xesp :

o n
umero de sucessos observados
na amostra
o n
umero de sucessos esperados
caso a hipotese nula seja verdadeira

JJ

II

tem-se
xobs

= np

xesp

= np0

P
agina 32 de 51

Voltar

Estatstica de teste:

Full Screen

xobs = n
umero de sucessos observados
numa amostra de tamanho n.
O facto de nao existir uma distribuicao para a
estatstica de teste e comum no contexto dos
testes exactos.

A. Rita Gaio, DM-FCUP

32

Fechar

Desistir

Decis
ao: (Metodo 1)

Instrucoes em R: a :

O valor-p apresentado pelo R corresponde


a soma das probabilidades pontuais que s
`
ao
menores ou iguais `
a probabilidade pontual da
frequencia observada de sucessos.
Se tiver de efectuar o teste binomial exacto
para uma proporc
ao em exame, use a f
ormula
de c
alculo do valor-p dada acima, para ter resultados coincidentes com os do output do R.
Decis
ao: (Metodo 2)
Supondo H0 verdadeira, calcular a probabilidade de obter desvios da frequencia esperada
maiores ou iguais ao observado na amostra:
P ( |X xesp | |xobs xesp |

H0 )

Isso e o valor-p do teste.


Por exemplo, na situac
ao em que xobs > xesp ,
a probabilidade anterior e
P (X xobs |H0 )+P (X xesp (xobs xesp )|H0 )

binom.test(x, n, p = 0.5,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95)

onde
Homepage

x e o n
umero de sucessos observados
n e o tamanho da amostra
p e a proporcao p0 definida em H0 (por defeito,
considera-se p = 0.5)
alternative e definida de acordo com a
hipotese alternativa
conf.level determinada o nvel de confianca do
intervalo de confianca a devolver.
aO

software estatstico R permite escolher se o teste que


se quer efectuar
e unilateral ou bilateral; o SPSS s
o efectua
testes bilaterais na situaca
o H0 : p0 = 0.5; em todos os outros
casos, o teste
e unilateral de acordo com a direcc
ao observada
na amostra. Os valores-p s
ao calculados em conformidade com
a unilateralidade ou bilateralidade do teste.

H1 : p < p0 ,

Indice Geral

JJ

II

P
agina 33 de 51

Voltar

Quanto aos testes unilaterais, o valor-p e dado


por
H1 : p > p0 ,

P
agina de Rosto

p = P (X xobs |H0 )

Full Screen

p = P (X xobs |H0 )

Fechar

Desistir

A. Rita Gaio, DM-FCUP

33

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 34 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

34

Chapter 4

Homepage

P
agina de Rosto

Testes de hip
oteses: duas amostras
Indice Geral

JJ

II

P
agina 35 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

35

4.1.

Teste de hip
oteses sobre a diferenca de m
edias em amostras
2
emparelhadas ( desconhecida)

Problema: testar se a diferenca de medias Y X


de duas vari
aveis aleat
orias emparelhadas e igual,
maior ou menor do que um determinado valor 0 .
Para alem das medias X e Y , tambem se desconhece a matriz de covari
ancia das duas vari
aveis
aleat
orias.
Dados: amostra aleat
oria de tamanho n de
um par de vari
aveis aleat
orias emparelhadas
(X, Y ) (as v.a. diferem apenas na vari
avel
em estudo) a tal que a diferenca D = X Y
segue uma distribuic
ao normal.
(i) H0 : Y X = 0 ,

(ii) H0 : Y X = 0 ,

(iii) H0 : Y X = 0 ,

H1 : Y X 6= 0

H1 : Y X > 0

H1 : Y X < 0

A vari
avel aleat
oria D = Y X segue uma dis2
tribuic
ao normal N (D , D
) com par
ametros
D = Y X ,

2
2
D
= X
+ Y2 2X Y .

Estatstica de teste:
T =

D 0
t(n 1)
SD / n

Homepage

onde
Pn
D = n1 k=1 Dk e a media amostral das diferencas entre Y e X
q
Pn
1
2 e o desvio padr
SD = n1
ao
k=1 (Dk D)
amostral das diferencas entre Y e X
Se D = Y X nao seguir uma distribuicao normal
mas o tamanho n das amostras for grande, tem-se
T =

D 0 a
N (0, 1).
SD / n

Decisao: Rejeitar H0 com nvel de significancia se


(i) t t1/2 (n 1) ou t t1/2 (n 1)
(ii) t t1 (n 1)

P
agina de Rosto

Indice Geral

JJ

II

P
agina 36 de 51

Voltar

(iii) t t (n 1)

Faca-se
dk = yk xk ,

Full Screen

k = 1, . . . , n.

a Se os diferentes pares forem observados sob condi


c
oes
diferentes, ent
ao as diferencas Xi Yi podem ter vari
ancias
diferentes e o teste t n
ao pode ser aplicado. Ter
a de ser pensar
num teste n
ao param
etrico adequado (por ex., o teste do sinal
em amostras emparelhadas).

Fechar

Desistir

A. Rita Gaio, DM-FCUP

36

Instruc
oes em R:
## Instru
c~
ao 1
> t.test(dif,
alternative = c("two.sided", "less", "greater"),
mu = 0,
conf.level = 0.95, ...)
Homepage

ou
## Instru
c~
ao 2
> t.test(x, y,
alternative = c("two.sided", "less", "greater"),
mu = 0,
paired = TRUE,
conf.level = 0.95, ...)

P
agina de Rosto

Indice Geral

Na instruc
ao 1:
dif e a vari
avel que representa a diferenca entre as duas v.a. (correspondentes `
as amostras
emparelhadas).

JJ

II

P
agina 37 de 51

Na instruc
ao 2:
x e y representam as v.a. em causa (associadas
a`s amostras emparelhadas)

Voltar

paired=TRUE indica que as amostras s


ao emparelhadas (se nada for indicado, a instruc
ao
assume que as amostras s
ao independentes e
e realizado um outro teste-t, n
ao adequado a`
situac
ao de amostras emparelhadas).

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

37

4.2.

Teste de Wilcoxon em amostras emparelhadas

O teste de Wilcoxon para uma amostra pode ser generalizado para a situac
ao de amostras emparelhadas, de forma
analoga ao que foi feito para o teste t.
Dados:
amostras aleat
orias emparelhadas
x11 , x12 , . . . , x1n e x21 , x22 , . . . , x2n de duas vari
aveis
contnuas ou ordinais em que as diferen
cas
entre os valores sejam quantific
aveis.
A distribuic
ao da diferenca entre as vari
aveis nao
pode ser desvairadamente assimetrica (relativamente `
a media).
H0 : P (X1 > X2 ) = 0.5
H1 : P (X1 > X2 ) 6= 0.5

Grosso modo, o que a hip


otese nula afirma e que
a mediana da diferenca e 0 e portanto que as duas
medianas em causa s
ao iguais

Caso a amostra seja grande:


T =

N (N +1)
R+
| 21
|q
4
N (N +1)(2N +1)
24

se R+ 6=
T =

|R+ N (N4+1) | 12

N (N +1)
4
+

se R =

Homepage

e nao existem empates;

N (N +1)(2N +1) 1
2
24

se R+ 6=
T =0

N (N +1)
4

N (0, 1)a

Pq
(t3 ti )
i=1 i

N (0, 1)

P
agina de Rosto

e existem empates;

Indice Geral

N (N +1)
.
4

(A distribuica
o de T s
o e assimptoticamente normal se o
n
umero de di s n
ao nulos for 16; caso contr
ario, outros
metodos ter
ao de ser aplicados)
ao de
parcela 12 no numerador refere-se a uma correcc
continuidade; pode ou n
ao ser considerada.
aa

Estatstica de teste:

II

P
agina 38 de 51

R+ , que segue uma distribuic


ao especfica tabeladaa .
a Pestana,

JJ

Velosa; p.1116
Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

38

Instrucoes em R:

Aqui:
? di = x1i x2i
(i = 1, 2, . . . , n)
N = # di s t.q. di 6= 0
? |d(1) | < < |d(r) | valores distintos dispostos por ordem crescente com ordens
R(1) < < R(r) , respectivamente (r
N ).
Em relac
ao aos valores iguais (empates),
atribui-se a cada um desses valores um
n
umero de ordem igual `
a media das ordens que lhes caberia.
P
? R+ = di >0 R(i)
(soma dos ranks das diferencas positivas)
? q = # de valores di repetidos (empates)
ti = # de repetic
oes por valor repetido
x1i
x11
x12
..
.
x1n

x2i
x21
x22
..
.
x2n

di
x11 x21
x12 x22
..
.
x1n x2n

|di |
|d1 |
|d2 |
..
.
|dn |

rank
R(1)
R(2)
..
.
R(r)

Decis
ao: Rejeitar H0 com nvel de signific
ancia se T > N1 2 (0, 1) (caso de amostras
grandes).

## Instru
c~
ao 1
wilcox.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = TRUE, exact = NULL,
correct = TRUE, conf.int = FALSE,
conf.level = 0.95, ...)

Homepage

ou
P
agina de Rosto

## Instru
c~
ao 2
wilcox.test(formula, paired=TRUE, ...)
Indice Geral

Quanto `as instrucoes anteriores:


na Instrucao 1, x e y representam as duas
colunas do dataframe que possuem as respostas ao tratamento em cada uma das
populacoes.
na Instrucao 2, a formula a usar devera
ser do tipo

JJ

II

P
agina 39 de 51

var1 var2
onde var1 e o vector de respostas ao tratamento (para ambas as populacoes) e var2
e o factor que identifica a populacao correspondente a cada um dos indivduos.
As variaveis var1 e var2 correspondem a
duas colunas distintas no data frame.

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

39

4.3.

Teste de hip
oteses sobre a diferenca de m
edias de duas vari
aveis
normais independentes (vari
ancias diferentes e desconhecidas)

Problema: testar se a diferenca de medias Y X de


duas populac
oes normais e independentes, e diferente
de, menor do que, ou maior do que, um dado valor 0 a .
(A situac
ao mais comum ocorre quando se quer testar
se as medias das duas populac
oes s
ao diferentes; a tem-se 0 = 0.) Para alem do desconhecimento das medias
2
e Y2 .
tambem se desconhecem as vari
ancias, X
O teste n
ao e v
alido para populac
oes que n
ao sejam independentes. Para amostras grandes e com distribuic
oes
moderadamente assimetricas, o teste e robusto a desvios
da normalidade - e, nessa situac
ao, a estatstica de teste
segue aproximadamente a distribuic
ao normal reduzida.
Dados:
amostras aleat
orias X1 , . . . , XnX e
Y1 , . . . , YnY , de tamanhos nX e nY , respectivamente, de cada uma das populac
oes.
(i) H0 : Y X = 0 ,
(ii)H0 : Y X = 0 ,

(iii)H0 : Y X = 0 ,

H1 : Y X 6= 0

H1 : Y X > 0

H1 : Y X < 0

Estatstica de teste:
(X Y ) 0
T = q 2
' t( )b .
2
SX
SY
nX + nY
a

O teste em causa
e usualmente designado por Teste de
Welch-Satterwaite; podem tamb
em se usadas as designco
es
Teste de Satterwaite-Fisher, Teste de Welch, ou Teste de
Welch-Aspin.
b Em Estat
stica, o problema da determinac
ao da distribuic
ao
exacta desta estatstica de teste
e uma quest
ao em aberto, conhecida como problema de Behrens-Fisher
A. Rita Gaio, DM-FCUP

onde o grau de liberdade e aproximadamente


 2
2
s2Y
sX
+
nX
nY
=
 2 2
 2 2 .
s
s
1
1
X
+ nY 1 nYY
nX 1 nX
Decisao: represente-se por o maior inteiro
que nao excede .

Homepage

P
agina de Rosto

Indice Geral

Rejeitar H0 com nvel de significancia se


(i) t t1/2 () ou t t/2 ()
(equivalentemente, T 2 F1 (1, ))

(ii) t t1 ()

JJ

II

(iii) t t ()

Instrucoes em R:

P
agina 40 de 51

## Instru
c~
ao 1
t.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, conf.level = 0.95, ...)
ou

Voltar

Full Screen

## Instru
c~
ao 2
t.test(formula, data, subset, na.action, ...)

(por defeito, a instrucao t.test da lugar ao teste


de Welch-Satterwaite).
40

Fechar

Desistir

Quanto `
as instruc
oes anteriores:
na Instrucao 1, x e y representam as duas
colunas do dataframe que possuem as respostas ao tratamento em cada uma das
populac
oes.
na Instrucao 2, a f
ormula a usar dever
a
ser do tipo

Observa
c
ao: Assumindo que cada uma das amostras
provem de uma distribuicao normal, tem-se


2
X
X N X ,
nX


Y2
Y N Y ,
.
nY

Homepage

Dado que
var1 var2
onde var1 e o vector de respostas ao tratamento (para ambas as populac
oes) e var2
e o factor que identifica a populac
ao correspondente a cada um dos indivduos.
As vari
aveis var1 e var2 correspondem a
duas colunas distintas no data frame.

P
agina de Rosto

E(X Y )
Var(X Y )

= E(X) E(Y ) = X Y
2
2
= Var(X) + Var(Y ) = X + Y
nX
nY

(a soma na formula das variancias resulta das amostras


serem independentes), vem


2
2
X Y N X Y , X + Y .
nX
nY
O que acontece agora na maior parte das situacoes e
2
que as variancias X
e Y2 das populacoes sao desconhecidas.
Quando as amostras sao pequenas, tem de ser
usar a aproximacao de Welch-Satterwaite, tal
como descrito na estatstica de teste anterior.
Quando as amostras sao grandes, podem substituir-se as variancias populacionais pelas variancias amostrais obtendo uma distribuicao normal
assimptotica:


s2X
s2Y
X Y ' N X Y ,
+
.
nX
nY

A. Rita Gaio, DM-FCUP

41

Indice Geral

JJ

II

P
agina 41 de 51

Voltar

Full Screen

Fechar

Desistir

4.4.

Teste de hip
oteses sobre a raz
ao de vari
ancias de duas distribuic
oes normais

2
Problema: testar se a vari
ancia X
de uma variavel aleat
oria X que segue uma distribuic
ao normal
2
) e igual, maior ou menor do que a vari
anN (X , X
avel aleat
oria Y que segue uma discia Y2 de uma vari
tribuicao normal N (Y , Y2 ). Suponha-se que as variaveis aleat
orias X e Y s
ao independentes, e que para
alem das vari
ancias tambem n
ao se conhecem as medias.

Dados: amostra aleat


oria X1 , . . . , XnX de tamanho nX da vari
avel X e amostra aleat
oria
Y1 , . . . , YnY de tamanho nY da vari
avel Y .
2
(i) H0 : X
= Y2 ,
2
(ii) H0 : X
= Y2 ,

2
H1 : X
6= Y2

2
H1 : X
> Y2

Estatstica de teste:
F =

Para testes unilaterais escolhe-se F > 1 de


acordo com H1 (para obter a regiao de rejeicao
definida abaixo).
Para testes bilaterais, nao e necessaria nenhuma
escolha especial de F ; so e preciso ter atencao
aos graus de liberdade de F , que tem de ser de
acordo com o numerador e o denominador da
fraccao.
Decisao: Rejeitar H0 com nvel de significancia
se
F > F1/2 (nX 1, nY 1)
ou F < F/2 (nX 1, nY 1)
F F1 (nX 1, nY 1)

SX 2
F (nX 1, nY 1)
SY 2

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 42 de 51

onde
X=

1
nX

Voltar

PnX

Xk e a media amostral de X
PnX
2
1
SX = nX 1 k=1 (Xk X)2 e a vari
ancia
amostral de X
PnY
Y = n1Y
e a media amostral de Y
k=1 yk
P
nY
SY 2 = nY11 k=1
(yk Y )2 e a vari
ancia
amostral de Y .
k=1

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

42

Instruc
oes em R:
## Instru
c~
ao 1
var.test(x, y, ratio = 1,
alternative = c("two.sided", "less", "greater"),
conf.level = 0.95, ...)
Homepage

## Instru
c~
ao 2
var.test(formula, data, subset, na.action, ...)

onde

P
agina de Rosto

x e y s
ao vectores numericos
formula refere-se a uma f
ormula do tipo

Indice Geral

var1 var2
onde var1 e a vari
avel contnua em causa e var2
e o factor com duas categorias que separa os
indivduos da amostra em duas populac
oes independentes
data e a matriz ou dataframe de onde provem
os dados (indicac
ao necess
aria s
o quando o
dataframe n
ao est
a na direct
oria de trabalho)

JJ

II

P
agina 43 de 51

subset e um vector (opcional) que especifica as


observac
oes que se pretendem usar.

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

43

4.5.

Teste de Mann-Whitney

Dados:

N1 (N1 +1)
R1
2
2
se N1 , N2
N (U , U )

amostra aleat
oria de tamanho N1 de uma v.a.
X1 ordinala ou contnua

U = N1 N2 +

amostra aleat
oria de tamanho N2 de uma v.a.
X2 ordinal ou contnua (N1 N2 )

onde

X1 independente de X2

(i) H0 : P (X1 > X2 ) = 0.5


H1 : P (X1 > X2 ) 6= 0.5
(ii) H0 : P (X1 > X2 ) = 0.5
H1 : P (X1 > X2 ) > 0.5
(iii) H0 : P (X1 > X2 ) = 0.5
H1 : P (X1 > X2 ) < 0.5
Quando as distribuic
oes s
ao semelhantes a menos de localizac
ao, a interpretac
ao de H0 pode ser feita essencialmente ao nvel da comparac
ao das medianas.
a desde

Estatstica de teste:
'

Homepage

U = N1 N2 /2
2
U
= N1 N2 (N1 + N2 + 1)/12

P
agina de Rosto

R1 e a soma das ordens da amostra 1, depois de os valores das duas amostras terem
sido organizados por ordem crescente.
A escolha da amostra 1 para o calculo da
estatstica e determinada pelo tamanho das
amostras; a amostra 1 e aquela que satisfaz
N1 N2 .

Indice Geral

JJ

II

P
agina 44 de 51

que as diferencas entre os v


arios valores sejam quan-

tific
aveis
Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

44

Decis
ao: Considere-se Z = (U U )/U . Devese rejeitar H0 com nvel de signific
ancia se:
(i) z > N1/2 (0, 1) ou z < N/2 (0, 1)
(ii) z > N1 (0, 1)
(iii) z < N (0, 1)
Observ.
1
2
..
.
N1
..
.
N2
Total

Instrucoes em R:
## Instru
c~
ao 1
wilcox.test(x, y = NULL,
alternative = c("two.sided", "less", "greater"),
mu = 0, paired = FALSE, exact = NULL, correct = TRUE,
conf.int = FALSE, conf.level = 0.95, ...)
Homepage

Ordem da observaca
o
Amostra 1 Amostra 2
R1,1
R2,1
R1,2
R2,2
..
..
.
.
R1,N1
R2,N1
..
.
R2,N2
R1
R2

18,0

## Instru
c~
ao 2
wilcox.test(formula, data, subset, na.action, ...)

Na instrucao 1, a estatstica de teste usada e a


do teste de Mann-Whitney. Nessa instrucao, x
contem os dados de uma amostra e y os dados
da outra amostra (de populacoes independentes);
ambos representam v.a. contnuas.
Na instrucao 2, a estatstica de teste e a diferenca entre a soma de ranks no primeiro grupo e
o seu valor mnimo possvel (obtido quando todos os valores da primeira amostra precedem os
valores da segunda amostra), i.e.,

P
agina de Rosto

Indice Geral

JJ

II

hemoglobina

17,0

W = R1

16,0

P
agina 45 de 51

N1 (N1 + 1)
2

Nao e a estatstica de Wilcoxon (R1 ) mas continua


a dar um resultado equivalente ao teste de Mann
Whitney.

15,0

14,0

Nessa instrucao, a formula a usar deve ser do tipo

Voltar

Full Screen

13,0
controlos

teste

teste

var1 var2

Fechar

onde var1 representa a variavel contnua subjacente ao problema e var2 representa o factor que
identifica cada uma das duas populacoes.
A. Rita Gaio, DM-FCUP

45

Desistir

Homepage

P
agina de Rosto

Indice Geral

JJ

II

P
agina 46 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

46

Chapter 5

Homepage

P
agina de Rosto

Testes de hip
oteses: dados categ
oricos
Indice Geral

JJ

II

P
agina 47 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

47

5.1.

Teste de independ
encia entre dois factores

Um factor e uma v.a. discreta que toma um n


umero
finito de valores.

H0 : factor A independente do factor B,


isto e, pi,j = pi qj i, j e portanto Eij =

Ni Mj
n .

H1 : Os dois factores nao sao independentes.

1 populaca
o, 2 factores (A e B)
R nveis distintos para o factor A
C nveis distintos para o factor B
Oi,j = # indivduos da populaca
o com factor A no
nvel i e factor B no nvel j

Factor A
1
2

R
Total

1
O1,1
O2,1

OR,1
M1

Factor B
2

O1,2

O2,2

OR,2

M2

C
O1,C
O2,C

OR,C
MC

Total
N1
N2

NR
n

Sejam

Estatstica de teste: (tambem designada por X 2 )


P (O E )2
U = i,j i,jEi,j i,j 2 ((R 1)(C 1))
apenas se Ei,j 5,

i, j

P
agina de Rosto
a

(todas as contagens esperadas sao 5 )


Decisao: Rejeitar H0 com nvel de significancia
se u > 21 ((R 1)(C 1))
Observa
c
ao: Por causa da estatstica usada, este teste
e muitas vezes designado por teste 2 de Pearson
(para dados numeraveis).
Instrucoes em R:
onde x e a matriz correspondente `a tabela em causa.

Mj = # ind. observados com factor B no nvel j


P
PC
n= R
i=1 Ni =
j=1 Mj
= # total de indivduos observados

No caso do teste exacto de Fisher, a instrucao em R


e

pi,j = P (A = i B = j) pbi,j = Oi,j /n


P
pi = P (A = i) = C
i = Ni /n
j=1 pi,j p
PR
qj = P (B = j) = i=1 pi,j qj = Mj /n

JJ

II

P
agina 48 de 51

Voltar

> fisher.test(x)

onde x e a matriz correspondente `a tabela em causa.


a Caso contr
ario a estatstica de teste n
ao segue uma distribuic
ao 2 . Nessa situac
ao deve realizar-se um teste exacto
de Fisher.

Ei,j = pij n
= # indivduos esperados na celula (i, j)

A. Rita Gaio, DM-FCUP

Indice Geral

> chisq.test(x, ...)

Ni = # ind. observados com factor A no nvel i

Ent
ao

Homepage

Full Screen

Fechar

Desistir

48

5.2.

Teste de homogeneidade de proporco


es

R populac
oes (grupos)
Grupo
1
2

R
Total

1 factor com C nveis distintos


Oi,j = # elementos da populac
ao i
com factor no nvel j

1
O1,1
O2,1

OR,1
M1

Nvel
2
O1,2
O2,2

OR,2
M2

do factor

C
O1,C
O2,C

OR,C
MC

Total
N1
N2

NR
N

Homepage

P
agina de Rosto

Portanto

Hip
oteses principais:
Ni = # indivduos observados dentro da
populaca
o i (fixado a
` priori pelo plano
de experiencias)
Grupoi Mult(Ni , pi,1 , . . . , pi,C )
Grupoi independente de Grupol ,

i 6= l

Oi,j ' Ni,j Bin(Ni , pi,j )

Indice Geral

Ei,j = E(Ni,j ) = Ni pi,j


V ar(Ni,j ) = Ni pi,j (1 pi,j )
Cov(Ni,j , Ni,k ) = Ni pi,j pi,k

JJ

II

Teste de homogeneidade de propor


c
oes entre os grupos
H0 : p1,j = p2,j = = pR,j , para todo o j

P
agina 49 de 51

H1 : H0 n
ao e verdadeira, i.e. existem i1 , i2 , j tais que pi1 ,j 6= pi2 ,j

Estatstica de teste: U =

i,j

(Oi,j Ei,j )2
Ei,j

onde Ei,j =

2 ((R 1)(C 1))

Voltar

M
Ni Nj

(se Ei,j 5)

Full Screen

Decis
ao: Rejeitar H0 com nvel de signific
ancia se U > 21 ((R 1)(C 1))
Fechar

Instru
c
oes em R:
> chisq.test(x, ...)
Desistir

onde x e a matriz correspondente `


a tabela em causa.
A. Rita Gaio, DM-FCUP

49

5.3.

Teste de hip
oteses de comparac
ao de proporc
oes usando amostras
emparelhadas - teste de discord
ancia de McNemar

Problema: dada uma tabela de contingencia 2 2


associada a observac
oes de um par de v.a. dicot
omicas emparelhadas, pretende-se comparar as frequencias
marginais da tabela, i.e., as respostas a cada uma das
categorias da v.a. de cada uma das amostras. Dado que
as contagens da tabela se referem a pares de respostas
correlacionadas, as proporc
oes marginais s
ao tambem
correlacionadas.
Amostra 2
categoria 1
categoria 2
Total

Amostra 1
categoria 1 categoria 2
n11
n12
n21
n22
n11 + n21
n12 + n22

n11 + n12
n21 + n22
n

A situac
ao mais comum corresponde `
aquela em que as
duas amostras s
ao constitudas pelos mesmos indivduos.

Estatstica de teste:
O n
umero de pares discordantes e
Homepage

n = n12 + n21 .
Seja X a v.a. que representa o n
umero de observacoes na celula (1, 2), a em n pares discordantes.
Sob H0 , espera-se n12 = n21 e portanto


1
.
X B n ,
2

Se n 21 1 21 > 5, i.e., n > 20, pode-se usar a
aproximacao
 
n n
a
,
.
XN
2 4

P
agina de Rosto

Indice Geral

JJ

II

P
agina 50 de 51

Neste caso,

Dados: tabela de contingencia 2 2 associada a


observac
oes de um par de v.a. dicot
omicas emparelhadas

Z=

n12
q

Para cada uma das celulas (i, j) da tabela, seja


pij a correspondente propor
c
ao populacional.
H0 : as proporc
oes marginais s
ao iguais

p11 + p12
p21 + p22

=
=

p11 + p21
p12 + p22

i.e.

p12 = p21 .

n
2

n
4

n12 n21 a
= b
N (0, 1).c
n12 + n21

Voltar

Full Screen
a sob

H0 ,
e irrelevante contar as observac
oes na c
elula (1, 2) ou
na c
elula (2, 1).
b n = n
12 + n21
c equivalentemente,

Z2 =

(n12 n21 )2 a

n12 +n21

H1 : p12 6= p21 .
a significa

irrelevantes.

Desistir

que as discord
ancias observadas s
ao, globalmente,

A. Rita Gaio, DM-FCUP

Fechar

2 (1).

50

Decis
ao: Rejeitar H0 com nvel de signific
ancia
se:
z N1/2 (0, 1)

ou

z N/2 (0, 1)

(equivalentemente, z 2 21 (1)).

Homepage

Instruc
oes em R:

> mcnemar.test(x, y = NULL, correct = TRUE)

P
agina de Rosto

onde
x e a matriz que representa a tabela de
contingencia ou x e um factor

Indice Geral

y e um factor (ou ignorado se x e uma


matriz)

JJ

II

correct=TRUE estabelce a correcc


ao para
a continuidade

P
agina 51 de 51

Voltar

Full Screen

Fechar

Desistir

A. Rita Gaio, DM-FCUP

51

Anda mungkin juga menyukai