F(y) = #
y
j
y
n
.
Nota-se que o valor do salto da fun cao de distribui cao emprica no ponto y
i
e a propor cao
de vezes em que y
i
aparece na amostra. Se denotarmos essa propor cao por f
i
, e se,
por exemplo, estivermos interessados em estimar a media, teremos
=
n
i=1
f
i
y
i
. As
propor coes f
i
podem assumir valores 0, 1/n, 2/n, . . . , 1, satisfazendo
n
i=1
f
i
= 1.
De forma mais ampla, a estatstica de interesse t e uma fun cao simetrica de y
1
, . . . , y
n
,
signicando que t nao e afetada pelo reordenamento dos dados. Isto implica que t depende
apenas dos valores ordenados y
(1)
, . . . , y
(n)
ou, equivalentemente, da fun cao de distribui cao
emprica
F. Freq uentemente isto pode ser expresso simplesmente como t = t(
F), onde
t() e uma fun cao estatstica essencialmente e apenas uma expressao matematica do
algoritmo para computar t a partir de
F. Tal fun cao estatstica e de importancia central
no caso nao-parametrico porque tambem dene a quantidade de interesse atraves de
= t(F). Isto corresponde `a ideia qualitativa de que e uma caracterstica da popula cao
descrita por F. A mesma deni cao de se aplica em problemas parametricos, onde e
usualmente denido como um dos parametros em .
A rela cao entre a estimativa t e
F pode ser geralmente expressa como t = t(
F),
correspondendo `a rela cao = t(F) entre a caracterstica de interesse e a distribui cao. A
fun cao estatstica t() e utilizada para representar a estimativa de baseada nos dados
observados y
1
, . . . , y
n
.
Suponha um modelo parametrico particular para a distribui cao dos dados y
1
, . . . , y
n
.
Usaremos F
(y) e f
(y) para denotar a fun cao de distribui cao e a fun cao densidade, res-
pectivamente. Quando e estimado por
freq uentemente, mas nao invariavelmente,
pela sua estimativa de maxima verossimilhan ca a substitui cao por
no modelo resulta
no modelo ajustado, com fun cao de distribui cao
F(y) = F
b
j
) = 0, i = j. Suponha agora que desejamos um erro-padrao de bootstrap para b
2
(estimativa pontual de
2
). O procedimento para tanto pode ser descrito como segue:
(P1) Com base na amostra original, estime : b =
_
X
X
_
1
X
y. Obtenha os resduos:
e = y Xb.
(P2) Gere uma pseudo-amostra: y
= Xb +
, onde
= (
1
, . . . ,
n
) e obtido de
usando amostragem com reposi cao.
E comum dividir cada
i
por
_
(1 h
i
), onde
h
i
e o i-esimo elemento da diagonal da matriz chapeu H = X(X
X)
1
X
.
(P3) Regresse y
em X, obtendo b
= (X
X)
1
X
.
(P4) Repita (P2) e (P3) B vezes.
(P5) Use B+1 realiza coes de b
2
para obter uma estimativa bootstrap de seu erro-padrao.
Ou seja:
e.p.
boot
(b
2
) =
_
1
B + 1
B
j=0
(b
2,j
b
2
)
2
,
onde b
2
=
1
B+1
B
j=0
b
2,j
.
3
No entanto, quando ha heteroscedasticidade o procedimento acima deve ser modi-
cado. Tal mudan ca ocorrera em (P2), permanecendo os demais passos iguais. Esta
mudan ca e chamada de bootstrap selvagem e e dada por:
(P2) Obtenha
1
, . . . ,
n
de uma popula cao com media zero e variancia um (de forma
independente). Gere y
1
, . . . , y
n
:
y
i
= x
i
b +
i
e
i
1 h
i
, i = 1, . . . , n.
Wu (1986) mostrou que o estimador de V (b) obtido desta forma e consistente e as-
sintoticamente nao-viesado sob homoscedasticidade e sob heteroscedasticidade de forma
desconhecida.
Uma outra abordagem importante e a dos testes bootstrap. Suponha que o modelo e
y
i
=
1
+
2
x
i2
+
3
x
i3
+
i
, i = 1, . . . , n,
e que desejamos testar H
0
:
3
= 1 contra H
1
:
3
= 1. Suponha tambem que suspeitamos
da presen ca de heteroscedasticidade e nao desejamos assumir normalidade. Procedimento:
(P1) Para a amostra original, calcule b = (X
X)
1
X
y, e a estatstica de teste T =
b
3
1/
_
V (b
3
), onde
V (b
3
) e um estimador consistente de V (b
3
) sob heteroscedas-
ticidade.
(P2) Use bootstrap ponderado para gerar y
= (y
1
, . . . , y
n
) e regresse y
em X : b
=
(X
X)
1
X
= b
3
1/
_
V (b
3
). Na gera cao
dos dados imponha a hipotese nula.
(P3) Repita (P2) B vezes.
(P4) Use as B + 1 realiza coes da estatstica de teste para obter uma estimativa do valor
crtico.
Referencias
[1] Efron, B. (1979). Bootstrap methods: another look at the jackknife. The Annals of
Statistics 7: 1-25.
[2] Efron, B. e Tibshirani, R. J. (1993). An Introducion to the Bootstrap. New York:
Chapman e Hall.
[3] Davidson, A. C. e Hinkley, D. V. (1997). Bootstrap Methods e Their Applications. New
York: Cambridge University Press.
4
Comandos no R
# Load add-on packages
library(bootstrap)
# Read the data
x1 <- rnorm(100, mean=2)
x2 <- x1^2
y <- rnorm(100, mean=16)
# Fit linear model
ajuste<-lm(y~x1+x2)
# Result summaries of the model fitting
summary(ajuste)
# res receives residuos of the model fitting
res <- ajuste$res
# Xbeta receives X*beta of the model fitting
Xbeta <- ajuste$fit
# armazenando os valores que serao usados na funcao
xdata<-cbind(x1,x2,Xbeta,res)
# function of bootstrap
theta<-function(x,xdata)
{
x1b<-xdata[,1] # x1 bootstrap
x2b<-xdata[,2] # x2 bootstrap
xbetab<-xdata[,3] # XBeta bootstrap
resb<-xdata[x,4] # residuos
# Obtaining y.boot
y.boot <- xbetab + resb
# Fit linear model
ajuste.boot <- lm(y.boot~x1b+x2b)
# Return of bootstrap
ajuste.boot$coef
}
# aplicando a funcao bootstrap 10 vezes
results<-bootstrap(1:100,10,theta,xdata)
5