e A
. . . . . . . . . . . . . . . . . . . . . . . . 25
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3 O MODELO McDONALD GUMBEL . . . . . . . . . . . . . . . . . . . . . . . . . 31
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 O Modelo McDonald Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Expanses teis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5 Funo geradora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6 Funo quantlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.7 Desvios mdios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.8 Entropia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.9 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.10Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.10.1Aplicao 1: Dados de vazo mnima . . . . . . . . . . . . . . . . . . . . . . . . 45
3.10.2Aplicao 2: Dados de inundaes . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.11Consideraes nais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4 DISTRIBUIO GAMA BURR XII: TEORIA E PRTICA . . . . . . . . . . . . . 51
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
10
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Expanses para a pdf e para a cdf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3 Momentos e Funo Geradora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4 Funo Quantlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5 Desvios Mdios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.6 Conabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.7 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.8 Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.8.1 Aplicao 1: Dados de quebra por tenso . . . . . . . . . . . . . . . . . . . . . . 64
4.8.2 Aplicao 2: Dados de tempo de remisso . . . . . . . . . . . . . . . . . . . . . . 65
4.9 Concluses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5 FAMLIA MARSHALL-OLKIN BINOMINAL NEGATIVA: TEORIA E APLICA-
O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Distribuies especiais MONB-G . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2.1 Distribuio Marshall-Olkin binomial negativa gama (MONBGa) . . . . . . . . . 73
5.2.2 Distribuio Marshall-Olkin binomial negativa Frchet (MONBFr) . . . . . . . . 73
5.2.3 Distribuio Marshall-Olkin binomial negativa log-logstica (MONBLL) . . . . . 74
5.2.4 Distribuio Marshall-Olkin binomial negativa Weibull (MONBW) . . . . . . . . 77
5.3 Expanses teis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.4 Funo quantlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.5 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.6 Desvios mdios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.7 Entropias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.8 Estatsticas de ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.9 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.10Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.11Consideraes nais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6 CONSIDERAES FINAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.1 Concluso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Pesquisas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
APNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
11
RESUMO
Algumas novas distribuies: desenvolvimento e aplicaes
Nos ltimos anos, diversos autores tm concentrado seus esforos na generalizao de dis-
tribuies de probabilidades obtendo, dessa forma, maior exibilidade e, consequentemente,
ganho na anlise de dados e na capacidade de incorporar um grande nmero de sub-modelos
nas distribuies generalizadas. Neste trabalho, sero apresentadas duas novas distribuies de
probabilidade: McGumbel e gama Burr XII; e uma nova famlia de distribuies de probabi-
lidade: Marshall-Olkin binomial negativa. Algumas propriedades das novas distribuies so
apresentadas e o mtodo de mxima verossimilhana foi utilizado para estimar os parmetros
dos modelos propostos.
Palavras-chave: Distribuio Burr XII; Distribuio Gumbel; Distribuio Marshall-Olkin; Ma-
triz de informao observada; Mxima verossimilhana
12
pular pagina
13
ABSTRACT
The new distributions: development and applications
In recent years, several authors have concentrated their efforts on the generalization of pro-
bability distributions obtained in this way more exibility and hence gain in data analysis and
the ability to incorporate a large number of sub-models in the generalized distributions. In this
work, two new probability distributions will be presented: MacDonald Gumbel and gamma
Burr XII; and a new family of probability distributions: negative binomial Marshall-Olkin.
Some properties of the new distributions are presented and the method of maximum likelihood
was used to estimate the parameters of the proposed models.
Keywords: Burr XII distribution; Gumbel distribution; Likelihood maximum; Marshall-Olkin
distribution; Observed information matrix
14
pular pagina
15
1 INTRODUO
Esta tese apresenta duas novas distribuies de probabilidade e uma nova classe de distribui-
es. Cada distribuio ou classe de distribuio apresentada na forma de artigo e, portanto,
cada captulo pode ser lido de forma independente.
Alguns tpicos recorrentes nos captulos posteriores so brevemente apresentados no Cap-
tulo 2.
O Captulo 3 apresenta a nova distribuio McDonald Gumbel com cinco parmetros que
uma extenso da distribuio Gumbel. As aplicaes realizadas neste artigo mostraram que
a nova distribuio pode ser utilizada para selecionar modelos que so casos especiais desta
(BRITO et al., 2014).
A distribuio gama Burr XII introduzida no Captulo 4. Nesta generalizao, adiciona-se
um parmetro extra distribuio Burr XII proposta por Zimmer, Keats e Wang (1998). A nova
distribuio tem suporte nos reais positivos e pode ser utilizada em anlise de sobrevivncia ou
conabilidade. As aplicaes foram realizadas com dados censurados e no-censurados. Vale
ressaltar, que as reas de sobrevivncia e conabilidade, geralmente, apresentam dados censura-
dos. A nova distribuio proposta obteve melhor desempenho do que distribuies conhecidas
na literatura, tais como, Weibull, exponencial e log-logstica (BRITO et al., 2014).
No Captulo 5, uma nova classe de distribuies proposta por Percontini, Cordeiro e Bour-
guignon (2013) utilizada para compor a classe de distribuies Marshall-Olkin binomial nega-
tiva. A aplicao a dados reais mostrou que a nova classe bastante competitiva com modelos
conhecidos e com o mesmo nmero de parmetros (BRITO et al., 2014).
Referncias
BRITO, E. de; PERCONTINI, A.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The
Marshall-Olkin negative binomial family: theory and application. Studia Scientiarum
Mathematicarum Hungarica, Budapest, 2014a. In press.
BRITO, E. de; SILVA, G. O.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The gamma Burr XII
distribution: Theory and practice. Journal of Data Science, Taipei, 2014b. In press.
BRITO, E. de; SILVA, G. O.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The McDonald
Gumbel model. Communications Statistics, Theory and Methods, New York, 2014c. In
press.
PERCONTINI, A.; CORDEIRO, G. M.; BOURGUIGNON, M. The G-negative binomial
family: general properties and applications. Advances and Applications in Statistics, India,
v. 35, p. 127 160, 2013.
16
ZIMMER, W. J.; KEATS, J. B.; WANG, F. K. The Burr XII distribution in reliability analysis.
Journal of Quality Technology, Milwaukee, v. 30, p. 386394, 1998.
17
2 REVISO BIBLIOGRFICA
Nesta seo, sero apresentadas algumas classes de distribuies, as distribuies Gumbel e
Burr XII, a famlia Marshall-Olkin, o mtodo de mxima verossimilhana e alguns critrios
para seleo de modelos. Estes tpicos esto relacionados com as novas distribuies e classes
de distribuies apresentadas nesta tese.
2.1 Anlise de sobrevivncia
Considere um conjunto de dados cuja varivel resposta o tempo at a ocorrncia de um evento
de interesse. Esse tempo denotado por tempo de sobrevivncia ou tempo de falha e o conjunto
de observaes por dados de sobrevivncia (SILVA, 2008).
Os dados de sobrevivncia possuem suporte nos reais positivos, portanto, no razovel as-
sumir que tem distribuio normal, e, geralmente, apresentam assimetria positiva. Alm disso,
para alguns elementos em estudo pode no ser conhecido o tempo de interesse exato, mas ape-
nas que ocorre direita ou esquerda de um certo valor e nesse caso diz-se que a observao
censurada. As censuras ocorrem pois nem sempre possvel esperar que o evento de interesse
ocorra para todos os elementos em teste. A rea da estatstica que analisa esse tipo de dados
denominada de anlise de sobrevivncia (na rea de sade) ou conabilidade (na pesquisa
industrial).
Os tipos de censura so: direita, se o tempo de ocorrncia do evento de interesse est
direita do tempo registrado, esquerda, se o tempo registrado maior que o tempo de falha, e
intervalar, que acontece quando se sabe somente que o evento de interesse ocorreu em um certo
intervalo de tempo. Nesta tese, ser utilizada a censura direita, a mais frequente nos dados de
sobrevivncia.
O tempo de sobrevivncia uma varivel aleatria no-negativa e, em geral, contnua. A
funo taxa de falha (hrf) utilizada para representar o comportamento da varivel tempo de
sobrevivncia. Esta funo tem forma constante, crescente, decrescente ou no-montona, por
exemplo forma de U ou unimodal. Analisando a forma da hrf pode-se denir o modelo proba-
bilstico para o tempo de sobrevivncia.
Diversas novas distribuies generalizadas foram propostas recentemente para analisar da-
dos que possuem taxa de falhas no-montonas, pois as distribuies usuais em anlise de
sobrevivncia possuem taxas de falhas montonas (exponencial, Weibull e gama).
Uma importante funo em anlise de sobrevivncia a funo de sobrevivncia (sf) que
dada por
S(x) = P(X > x) = 1 F(x),
em que F(x) a cdf de uma varivel aleatria no-negativa. A correspondente funo taxa de
18
falha ou de risco dada por
(x) =
f(x)
S(x)
,
em que f(x) = d F(x)/d x. A Figura 2.1 mostra algumas das possveis formas da funo taxa
de falha.
T
a
x
a
d
e
f
a
l
h
a
Decrescente
Crescente
Constante
Banheira
Figura 2.1 Algumas formas da funo taxa de falha
2.2 Distribuio Gumbel
A distribuio Gumbel ou distribuio do valor extremo possui uma grande variedade de apli-
caes que envolvem problemas de engenharia (anlise de inundaes, uxo de rede, conabili-
dade de software, velocidade de ventos, entre outros) e fenmenos naturais (chuvas, velocidade
de ventos e poluio do ar, por exemplo). Kotz e Nadarajah (2000) descrevem dezenas de apli-
caes, tais como, teste de vida acelerado, terremotos e emisses radioativas (para mencionar
apenas algumas).
Ao analisar dados de sobrevivncia, muitas vezes conveniente trabalhar com o logaritmo
dos dados observados. Assim, se os dados tm distribuio Weibull, a distribuio Gumbel
aparece naturalmente quando analisamos o logaritmo das observaes (COLOSIMO; GIOLO,
2006).
De forma geral, a previso probabilstica da ocorrncia de eventos extremos de vital im-
portncia para o planejamento das atividades sujeitas a seus efeitos adversos, e uma das formas
de analisar esses eventos utilizar a distribuio Gumbel.
19
Seja X uma varivel aleatria com distribuio Gumbel, X Gumbel(, ), sua funo
densidade de probabilidade (pdf) dada por
g(x) =
1
exp
{
(x )
exp
[
(x )
]}
(2.1)
e a funo distribuio acumulada (cdf) dada por
G(x) = exp
{
exp
[
(x )
]}
(2.2)
em que x IR, IR e > 0. A moda de X , a mediana ln(ln 2), a mdia
+ e a varincia
2
6
2
em que denota a constante de Euler ( 0, 5772). A distribuio
Gumbel com = 0 e = 1 denominada Gumbel padro. A Figura 2.2 apresenta algumas
possveis formas da fdp (2.1).
2.3 Distribuio Burr XII
O sistema Burr de distribuies foi denido por Burr (1942). A distribuio Burr XII (BXII)
com trs parmetros, considerada em Zimmer, Keats e Wang (1998), uma distribuio comu-
mente encontrada para analisar dados de sobrevivncia e para modelar fenmenos com funes
de risco montonas e unimodais.
Shao (2004) discutiu o mtodo de estimao por mxima verossimilhana para a distribuio
BXII com trs parmetros.
A pdf de uma varivel aleatria X com distribuio Burr XII, X BXII(s, k, c) dada por
g(x) = c k s
c
x
c1
[
1 +
(
x
s
)
c
]
k1
,
e cdf por
G(x) = 1
[
1 +
(
x
s
)
c
]
k
,
em que k > 0 e c > 0 so parmetros de forma e s > 0 um parmetro de escala. O momento
de ordem q de X dado por
q
= E(X
q
) = s
q
k B(k q c
1
, q c
1
+ 1), c k > q. Na Figura
2.3, tm-se algumas formas possveis para a densidade da Burr XII.
2.4 Classes de distribuies generalizadas
Nos ltimos anos, diversos autores tm estudado generalizaes de distribuies. O crescente
interesse em generalizar distribuies ocorreu, principalmente, pelo grande avano computa-
cional. Uma das razes para generalizar uma distribuio conhecida porque a sua forma
generalizada exibiliza a distribuio de tal forma que possa modelar mais satisfatoriamente a
assimetria emdados observados, pois grande parte das generalizaes, envolvema adio de um
ou mais parmetros de forma distribuio base. O precursor em generalizar distribuies con-
tnuas foi Amoroso (1925) (gama generalizada). Recentemente, diversas classe de distribuies
20
x
f
(
x
)
10 5 0 5 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
= 0
= 1.0 (Gumbel padro)
= 2.0
= 3.0
x
f
(
x
)
5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
= 2.0 e
= 5.0 e
= 0.5 e
= 10 e
= 3.0
= 3.0
= 4.0
= 4.0
Figura 2.2 Funo densidade da distribuio Gumbel para alguns parmetros xos
21
x
f
(
x
)
0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
s=5; k=3; c=4
s=1,2; k=8; c=0,8
s=9; k=5; c=3
s=1,2; k=1,4; c=0,8
s=7; k=3; c=2
Figura 2.3 Funo densidade da distribuio Burr XII para alguns parmetros xos
foram propostas, entre elas, a beta-G por Eugene, Lee e Famoye (2002), a Kumaraswamy-G
por Cordeiro e Castro (2011) e a famlia T-X por Alzaatreh, Lee e Famoye (2013).
Algumas das recentes generalizaes utilizadas nesta tese sero apresentadas, brevemente,
a seguir.
2.4.1 Classe de distribuies exponencializadas
A classe de distribuies exponencializadas foi proposta, inicialmente, por Gompertz (1825).
As propriedades e os mtodos de estimao dos parmetros da classe exponencializada (EXP-
G) tm sido estudados por diversos autores, tais como, Mudholkar e Srivastava (1993) (Weibull
exponencializada), Nadarajah (2011) (exponencial exponencializada), Nadarajah (2005) (Pa-
reto exponencializada), entre outros.
Seja G(x) a cdf de uma distribuio base e > 0 um nmero real positivo. Ento, a cdf de
uma varivel X com distribuio EXP-G, X EXP-G(), dada por
F(x) = G(x)
. (2.3)
A pdf associada a (2.3) pode ser escrita como
f(x) = g(x) G(x)
1
, (2.4)
22
em que g(x) = dG(x)/dx a pdf da distribuio base.
A famlia EXP-G, tem como caso especial a distribuio base quando = 1. Diversas
outras formar de generalizar distribuies, utilizamresultados da EXP-G, pois muitas expanses
para as pdf e cdf das novas distribuies so combinaes lineares das pdf e cdf da EXP-G.
Neste trabalho, ser observada a aplicao deste resultado para encontrar diversas propriedades
matemticas das novas distribuies e famlia proposta.
2.4.2 Classe de distribuies Marshall-Olkin
Marshall e Olkin (1997) introduziram um mtodo interessante de adicionar um novo parmetro
a uma distribuio base para obter uma famlia ampla de distribuies. Entretanto, eles no
investigaram propriedades matemticas gerais dessa famlia. Propriedades, tais como, momen-
tos e expanses para a funo densidade, foram apresentadas por Barreto-Souza, Lemonte e
Cordeiro (2013).
Para a cdf G(x) de uma distribuio base, a funo de sobrevivncia (sf) dada por G(x) =
P(X > x) = 1 G(x). A sf da famlia Marshall-Olkin (MO) denida por
F(x) =
p G(x)
1 p G(x)
, (2.5)
em que x IR, p > 0 e p = 1 p. A cdf e a pdf associada a (2.5) so dadas, respectivamente,
por
F(x) =
G(x)
1 p G(x)
(2.6)
e
f(x) =
p g(x)
[1 p G(x)]
2
. (2.7)
Se p = 1, temos que F(x) = G(x). Uma medida de conabilidade importante a taxa de
risco de uma distribuio, (x) = f(x)/F(x). Nanda e Das (2012) interpretaram que Marshall
e Olkin (1997) chamaram p de parmetro de inclinao, pois para p 1 a taxa de risco da
famlia MO inferior taxa de risco da distribuio base e para 0 < p < 1 a taxa de risco da
MO superior a da distribuio base. Diversas distribuies conhecidas foram generalizadas
utilizando a proposta de Marshall e Olkin (1997). Por exemplo, as distribuies MO-Weibull
(MARSHALL; OLKIN, 1997) e MO-beta (JOSE; ANCY; RISTI
C, 2009).
2.4.3 Classe de distribuies gama
A classe de distribuies gama utilizada nesta tese foi proposta por Zografos e Balakrishnan
(2009). Para uma distribuio base com cdf G(x), eles deniram a distribuio gama-G com
cdf dada por
F(x) =
1
(a)
(a, log [1 G(x)]) =
1
(a)
log[1G(x)]
0
t
a1
e
t
dt
23
e pdf por
f(x) =
1
(a)
{log[1 G(x)]}
a1
g(x),
em que a > 0 o parmetro de forma que exibiliza a nova distribuio. A classe gama-G
inclui a distribuio base como caso especial quando a = 1.
Mais recentemente, Nadarajah, Cordeiro e Ortega (2014) estudaram diversas propriedades
matemticas da gama-G, tais como funo quantlica, momentos ordinrios e incompletos, fun-
o geradora de momentos, desvios mdios, curas de Bonferroni e Lorenz, distribuio assint-
tica de valores extremos, entropias de Shannon e Rnyi, conabilidade e algumas propriedades
das estatsticas de ordem. Para demonstrar a aplicabilidade da nova classe, eles utilizaram
dados de falha de componentes mecnicos e estimaram por mxima verossimilhana os par-
metros das distribuies gama log-normal, gama log-logstica e gama Weibull. Diversas novas
distribuies, utilizando a classe gama-G de Zografos e Balakrishnan (2009) foram propostas
recentemente, por exemplo, gama Weibull exponencializada (PINHO; CORDEIRO; NOBRE,
2012), Zografos-Balakrishnan log-Logstica (RAMOS et al., 2013).
2.4.4 Classe de distribuies McDonald
Para qualquer cdf base G(x), Alexander et al. (2012) deniram uma nova famlia de distri-
buies denominadas beta-gerada generalizada ou McDonald-G (McG). A cdf da McG dada
por
F(x) = I
G
c
(x)
(a, b) =
1
B(a, b)
G
c
(x)
0
a1
(1 )
b1
d,
em que I
y
(a, b) = B(a, b)
1
y
0
w
a1
(1 w)
b1
dw a funo razo beta incompleta. E a pdf
correspondente
f(x) =
c
B(a, b)
g(x)G
ac1
(x) [1 G
c
(x)]
b1
,
em que a, b, c > 0, g(x) = dG(x)/dx e B(a, b) =
1
0
t
a1
(1 t)
b1
dt a funo beta.
Os trs parmetros de forma a, b e c tm como funo introduzir assimetria e curtose na
nova distribuio e variar o peso das caldas (TAHIR; NADARAJAH, 2014). Cordeiro, Hashi-
moto e Ortega (2014) mencionaram que os parmetros a e b so parmetros de assimetria e
relativamente controlam o peso nas caudas, mas no no pico da distribuio, mas o parmetro c
controla o pico.
A classe de distribuies McG inclui como casos especiais a distribuio base quando a =
b = c = 1, a classe de distribuies exponencializadas para b = c = 1, a classe de distribuies
estendidas quando a = c = 1, a classe de distribuies beta para c = 1 e quando a = 1 tem-se
a classe de distribuies Kumaraswamy.
Alexander et al. (2012) estudaram diversas propriedades matemticas da McG e zeram
aplicaes mostrando a ecincia dos modelos McDonald Weibull e McDonald normal. Esta
24
uma classe de distribuies recente e que j gerou algumas novas distribuies, tais como:
a distribuio McDonald beta invertida (CORDEIRO; LEMONTE, 2012), a McDonald Burr
XII (GOMES; da-SILVA; CORDEIRO, 2013), a McDonald Weibull modicada (MEROVCI;
ELBATAL, 2013), entre outras.
2.4.5 Classe de distribuies binomial negativa
Novos modelos envolvendo a binomial negativa foram propostos recentemente e aplicados em
anlise de sobrevivncia, por exemplo as distribuies Lindley binomial negativa (ZAMANI;
ISMAIL, 2010) e exponencial binomial negativa (HAJEBI; REZAEI; NADARAJAH, 2013).
Percontini, Cordeiro e Bourguignon (2013) propuseram a famlia binomial negativa genera-
lizada (GNB). Eles encontraram diversas propriedades matemticas da nova famlia que possui
cdf
F(x) =
(1 )
s
{1 [1 G(x)]}
s
[(1 )
s
1]
,
em que s > 0, 0 < < 1, G(x) a cdf base e g(x) = dG(x)/dx. A respectiva pdf dada por
f(x) =
s
[(1 )
s
1]
g(x) {1 [1 G(x)]}
s1
.
Esta generalizao adiciona dois parmetros a distribuio base, proporcionando maior e-
xibilidade a nova distribuio gerada. A distribuio base um caso especial da GNB quando
s = 1 e 0. Percontini, Cordeiro e Bourguignon (2013) utilizaram a Frchet binomial
negativa para demonstrar a exibilidade da nova classe ao analisar dados reais.
2.5 Estimao e inferncia
Neste trabalho, a estimao dos parmetros das distribuies foi feita utilizando-se o mtodo de
mxima verossimilhana. Este mtodo baseado na funo de verossimilhana e fornece uma
abordagem para a obteno de estimativas pontuais e intervalares, alm da construo de testes
de hipteses.
2.5.1 Estimao por mxima verossimilhana
Seja X
1
, . . . , X
n
uma amostra aleatria de observaes no-censuradas de tamanho n, em que
cada X
i
, i = 1, . . . , n, possui distribuio funo densidade f(x; ).
A funo de verossimilhana para o vetor de parmetros expressa por
L() =
n
i=1
f(x
i
; ).
A funo de verossimilhana L() mostra que a contribuio de cada observao no-
censurada a sua funo de densidade, olhada como funo do vetor de parmetros . A
contribuio de cada observao censurada no , contudo, a sua funo de densidade (CO-
LOSIMO; GIOLO, 2006). As observaes censuradas somente nos informam que o tempo de
25
falha maior que o tempo de censura observado e, portanto, que a sua contribuio para L()
a sua funo de sobrevivncia S(x), olhada como funo do vetor de parmetros . Neste caso,
as observaes podem ser divididas em dois conjuntos: F denota o conjunto das observaes
no-censuradas e C denota o conjunto das observaes censuradas.
Considere que os tempos de sobrevivncia e de censura so independentes e que a censura
a direita e no informativa (sua distribuio no depende dos parmetros de interesse). Nesse
contexto, a funo de verossimilhana expressa por
L() =
iC
f(x
i
; )
iF
S(x
i
; ).
Os estimadores de mxima verossimilhana so os valores de que maximizam L()
ou equivalentemente o logaritmo de L(), isto , () = log[L()]. Eles so encontrados
resolvendo-se o sistema de equaes
U() =
L()
= 0. (2.8)
Como, geralmente, esse sistema no linear, torna-se necessrio usar um algoritmo de
otimizao. Por exemplo, um algoritmo Newton-Raphson ou quase Newton (NOCEDAL;
WRIGHT, 2006; PRESS et al., 1992). As estimativas dos parmetros das distribuies apre-
sentadas nesta tese foram obtidas pela maximizao numrica de (). O pacote bbmle do
software estatstico R (R Development Core Team, 2008) foi utilizado para obter as estimativas
de mxima verossimilhanas para os vetores de parmetros das distribuies apresentadas.
A escolha dos valores iniciais muito importante em todos os procedimentos iterativos para
a estimativa dos parmetros. Neste trabalho, utilizaram-se as estimativas de mxima verossimi-
lhana da distribuio base e o mtodo grco para obter os valores iniciais.
Se o tamanho da amostra grande e sob certas condies de regularidade para a funo de
verossimilhana, intervalos de conana e testes de hipteses podem ser obtidos usando o fato
de que a distribuio assinttica para os estimadores de mxima verossimilhana a distribuio
normal com mdia e matriz de covarincia dada pelo inverso da matriz de informao de
Fisher (SEN; SINGER, 1993).
2.5.2 Estatsticas AIC, BIC, CAIC, W
e A
) e Anderson-Darling (A
=
(
1 +
0, 5
n
)
n
j=1
[
u
j
(2 j 1)
2 n
]
2
+
1
2 n
e
A
=
(
1 +
0, 75
n
+
2, 25
n
2
)
{
n
1
n
n
j=1
[(2 j 1) log(u
j
) + (2 n + 1 2 j) log(1 u
j
)]
}
,
em que u
j
= ([y
j
y]/s
y
), y
j
=
1
(v
j
), v
j
= F
(
x
(j)
;
)
, () a funo acumulada
da normal padro e
1
() sua inversa. O modelo com menor valor das estatsticas ser
considerado o modelo mais adequado.
Referncias
AKAIKE, H. A new look at statistical model identication. IEEE Transactions on Automatic
Control, Boston, v.6, p. 716722, 1974.
ALEXANDER, C.; CORDEIRO, G. M.; ORTEGA, E. M. M.; SARABIA, J. M. Generalized
beta-generated distributions. Computational Statistics and Data Analysis, Amsterdan, v. 56,
p. 1880 1897, 2012.
ALZAATREH, A.; LEE, C.; FAMOYE, F. A new method for generating families of continuous
distributions. METRON, Milan, v. 71, p. 6379, 2013.
27
AMOROSO, L. Ricerche intorno alla curva dei redditi. Annali di Matematica Pura ed
Applicata, Heidelberg, v. 2, p. 123159, 1925.
Barreto-Souza, W.; LEMONTE, A. J.; CORDEIRO, G. M. General results for the Marshall and
Olkins family of distributions. Anais da Academia Brasileira de Cincias, Rio de Janeiro,
v. 85, p. 321, 2013.
BOZDOGAN, H. Model selection and Akaikes information criterion (AIC): The general
theory and its analytical extensions. Psychometrika, Williamsburg, v. 52, p. 345370, 1987.
BURNHAM, K. P.; ANDERSON, D. R. Multimodel inference understanding AIC and BIC in
model selection. Sociological Methods & Research, London, v. 33, p. 261304, 2004.
BURR, I. W. Cumulative frequency distribution. Annals of Mathematical Statistics, Chicago,
v. 13, p. 215232, 1942.
CHEN, G.; BALAKRISHNAN, N. A general purpose approximate goodness-of-t test.
Journal of Quality Technology, Milwaukee, v. 27, p. 154161, 1995.
COLOSIMO, E. A.; GIOLO, S. R. Anlise de Sobrevivncia Aplicada. So Paulo: Edgar
Blcher, 2006. 370p.
CORDEIRO, G. M.; CASTRO, M. A new family of generalized distributions. Journal of
Statistical Computation and Simulation, London, v. 81, p. 883898, 2011.
CORDEIRO, G. M.; HASHIMOTO, E. M.; ORTEGA, E. M. M. The McDonald Weibull
model. Statistics, New York, v.48, p. 256278, 2014.
CORDEIRO, G. M.; LEMONTE, A. J. The McDonald inverted beta distribution. Journal of
the Franklin Institute, Philadelphia, v. 349, p. 11741197, 2012.
EUGENE, N.; LEE, C.; FAMOYE, F. Beta-normal distribution and its applications.
Communications in Statistics - Theory and Methods, New York, v. 31, p. 497512, 2002.
GOMES, A. E.; SILVA, C. Q.; CORDEIRO, G. M. Two extended Burr models: Theory and
practice. Communications in Statistics-Theory and Methods, New York, 2013. Disponvel
em: <http://dx.doi.org/10.1080/03610926.2012.762402>. Acesso em: 23 maio 2014
GOMPERTZ, B. On the nature of the function expressive of the law of human mortality, and
on a new mode of determining the value of life contingencies. Philosophical Transactions of
the Royal Society of London, London, v. 115, p. 513583, 1825.
HAJEBI, M.; REZAEI, S.; NADARAJAH, S. An exponential-negative binomial distribution.
REVSTATStatistical Journal, Lisboa, v. 11, p. 191210, 2013.
28
JOSE, K. K.; ANCY, J.; RISTI
1
0
t
a1
(1 t)
b1
dt a funo beta. A
famlia (3.1) denominada de classe de distribuies McDonald. A classe inclui como casos
especiais a famlia beta generalizada (EUGENE; LEE; FAMOYE, 2002) para c = 1 e a famlia
Kumaraswamy generalizada (CORDEIRO; CASTRO, 2011) para a = 1.
A funo distribuio acumulada (cdf) correspondente a (3.1)
F(x) = I
G
c
(x)
(a, b) =
1
B(a, b)
G
c
(x)
0
a1
(1 )
b1
d, (3.2)
em que I
y
(a, b) = B(a, b)
1
y
0
w
a1
(1 w)
b1
dw a funo razo beta incompleta.
A cdf (3.2) pode ser expressa em termos da funo hipergeomtrica como
F(x) =
G
ac
(x)
a B(a, b)
2
F
1
[a, 1 b; a + 1; G
c
(x)] , (3.3)
em que
2
F
1
(a, b; c; x) =
(c)
(a)(b)
j=0
(a + j)(b + j)
(c + j)
x
j
j!
.
As propriedades da cdf F(x) gerada de uma distribuio base G(x) em (3.3), podem, em
princpio, ser obtidas a partir das propriedades bem estabelecidas da funo hipergeomtrica.
Ver Seo 9.1 de Gradshteyn e Ryzhik (2007).
A cdf G(x) pode ser qualquer cdf de varivel contnua e F(x) a cdf da famlia McDonald
generalizada (Mc-G). Se X uma varivel aleatria com funo densidade (3.1), pode-se
33
escrever X Mc-G(a, b, c, ), em que o vetor de parmetros associado a G(x). Uma
grande vantagem dessa classe a sua capacidade de se ajustar a dados reais assimtricos a que
distribuies existentes no se ajustam.
Ao analisar os dados de tempo de vida, muitas vezes conveniente trabalhar com o loga-
ritmo dos tempos observados. Assim, se os dados seguem a distribuio Weibull, a distribuio
Gumbel aparece naturalmente na anlise do logaritmo destas observaes.
Dene-se a distribuio McGu, substituindo G(x) e g(x) em (3.1) como a cdf e pdf da
distribuio Gumbel
G(x) = exp
{
exp
[
(x )
]}
(3.4)
e
g(x) =
1
exp
{
(x )
exp
[
(x )
]}
, (3.5)
respectivamente, em que x, IR e > 0.
Ento, a pdf da McGu dada por
f(x) =
c
B(a, b)
exp
{
(x )
ac exp
[
(x )
]}
(
1 exp
{
c exp
[
(x )
]})
b1
, (3.6)
em que x IR, IR, > 0 e a > 0, b > 0 e c > 0. Deste ponto em diante,
X McGu(a, b, c, , ) indica uma varivel aleatria com funo de densidade (3.6). Algumas
das possveis formas de (3.6) para alguns valores selecionados dos parmetros so exibidos na
Figura 3.1.
A distribuio McGu contm como casos especiais as distribuies Gumbel (Gu) (JOHN-
SON; KOTZ; BALAKRISHNAN, 1995) (para a = b = c = 1), Gumbel exponencializada
(Exp-Gu) (PERSSON; RYDN, 2010) (para b = c = 1), beta Gumbel (BGu) (NADARAJAH;
KOTZ, 2004) para c = 1 e Kumaraswamy Gumbel (KwGu) (CORDEIRO; NADARAJAH;
ORTEGA, 2012) (para a = 1). A distribuio proposta tem dois importantes aspectos: envolve
mais parmetros do que o modelo Gumbel, proporcionando mais exibilidade e os parmetros
adicionais podem controlar a assimetria, os pesos nas caudas e a entropia no centro da distri-
buio gerada. A distribuio McGu um caso especial da famlia T-X (ALZAATREH; LEE;
FAMOYE, 2013), em que W(G(x)) a distribuio Exp-Gu e r(t) a fdp da distribuio beta.
A cdf associada a densidade (3.6) dada por
F(x) = I
exp
{
c exp
[
(x)
]}
(a, b) . (3.7)
A distribuio McGu facilmente simulada pela inverso da cdf (3.7) da seguinte maneira:
se V tem distribuio beta com parmetros a > 0 e b > 0,
X = log
[
c
1
log(V )
]
34
x
f
(
x
)
10 0 10 20
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
McGu(1,0; 1,0; 1,0; 0,0; 1,0)
Gumbel padro
McGu(0,5; 1,0; 1,0; 1,0; 2,0)
Gumbel exponencializada
McGu(1,0; 4,0; 1,0; 5,0; 10,0)
beta Gumbel
McGu(1,0; 5,0; 0,5; 6,0; 5,0)
Kumaraswamy Gumbel
x
f
(
x
)
150 50 0 50 100 150 200 250
0
.
0
0
0
0
.
0
0
4
0
.
0
0
8
0
.
0
1
2
0
.
0
1
6
McGu(0,1; 20,0; 6,0; 130,0; 50,0)
McGu(0,12; 15,0; 2,0; 100,0; 60,0)
McGu(0,3; 20,0; 6,0; 130,0; 50,0)
McGu(2,0; 3,0; 0,5; 100,0; 60,0)
Figura 3.1 Funo densidade da McGu para alguns valores dos parmetros
35
(para c > 0) tem distribuio McGu(a, b, c, , ). Grcos comparando as funes densidades
exatas da McGu e os histogramas de dois conjuntos de dados simulados comn = 200 repeties
para valores selecionados dos parmetros so mostrados na Figura 3.2. Estes grcos indicam
que os valores simulados so consistentes com a distribuio McGu.
A moda de uma distribuio de probabilidade contnua o valor x em que a pdf tem seu
valor mximo. A moda no necessariamente nica, uma vez que a pdf pode ter diversos
valores mximos. A moda de uma varivel aleatria da distribuio McGu pode ser obtida pela
maximizao do logaritmo da equao (3.6), isto
log[f(x)] = log(c)log()log[B(a, b)]
(x )
a c e
(x)
+(b1) log
[
1 e
c e
(x)
]
.
(3.8)
Ao derivar a equao (3.8) em relao a x e igualando a zero, a moda de uma varivel
aleatria da distribuio McGu pode ser obtida como soluo da equao
x
log[f(x)] =
1
+
a c
(x)
c (b 1) e
(x)
c e
(x)
[
1 e
c e
(x)
] = 0. (3.9)
A equao (3.9) no pode ser resolvida analiticamente. Entretanto, a moda pode ser calcu-
lada numericamente, utilizando um programa de anlise estatstica. Observe que se
2
x
2
log[f(x)] =
a c
2
e
(x)
c (b 1) e
(2 x)
{
c e
+ e
x
[
1 e
c e
(x)
]}
2
[
1 e
c e
(x)
]
2
,
menor do que zero, qualquer raiz x de (3.9) uma moda da varivel aleatria x.
3.3 Expanses teis
Algumas expanses para (3.1) e (3.2) podem ser encontradas utilizando o conceito de distri-
buies exponencializadas. Para uma cdf G(x) qualquer, dene-se uma varivel aleatria Y
com distribuio G-exponencializada (de forma abreviadaExp-G) com parmetro de potncia
> 0, diz-se Y Exp-G(, ), em que o vetor de parmetros de G, se a cdf e a pdf so
dadas por
H(y) = G
k=0
w
k
h
(a+k)c
(x), (3.10)
em que h
(a+k)c
(x) denota a pdf da distribuio Exp-Gu(c(a + k), ) dada por
h
(a+k)c
(x) =
(a + k)c
exp
[
(x )
]
exp
{
(a + k)c exp
[
(x )
]}
com os coecientes w
k
dados por
w
k
=
(1)
k
(
b1
k
)
(a + k) B(a, b)
.
Claramente,
k=0
w
k
= 1. Assim, a funo densidade da Mc-Gu pode ser expressa como uma
mistura de funes densidades da Exp-Gu. Consequentemente, algumas de suas propriedades
matemticas podem ser obtidas das propriedades conhecidas da distribuio Exp-Gu. Se b um
inteiro positivo, o ndice k em (3.10) para em b 1. Por integrao de (3.10), obtm-se
F(x) =
k=0
w
k
H
(a+k)c
(x), (3.11)
em que H
(a+k)c
(x) a cdf da distribuio Exp-Gu(c(a + k), ). As equaes (3.10) e (3.11)
so muito apropriadas para obter algumas propriedades estruturais da distribuio McGu. Os
momentos ordinrios, centrais, incompletos e fatoriais e a funo geradora de momentos (mgf)
da distribuio McGu podem ser expressos como uma combinao linear destas quantidades
para a distribuio Exp-Gu. As expanses (3.10) e (3.11) so os principais resultados desta
seo.
3.4 Momentos
A necessidade e a importncia dos momentos em qualquer anlise estatstica especialmente
no trabalho aplicado bvia. Alguns dos mais importantes recursos e caractersticas de uma
distribuio podem ser estudados, usando-se os momentos (por exemplo tendncia, disperso,
assimetria e curtose). O r-simo momento de uma varivel aleatria Exp-Gu (NADARAJAH;
KOTZ, 2004) Z
a
com parmetros a, e
E(Z
r
a
) = a
n
r
j=0
(1)
j
(r + 1)
(r j + 1) j!
(
)
j
{
(
d
)
j
[
(a)
d
(d)
]
}
d=1
.
Da equao (3.10), obtm-se
r
= E(X
r
) =
k=0
w
k
E
[
Z
r
(a+k)c
]
,
38
e, ento,
r
= c
r
r
j=0
k=0
(1)
j+k
(a + b) (r + 1)
(
)
j
(a) (b k) (r j + 1) j! k!
{
(
d
)
j
[(a + k)c]
d
(d)
}
d=1
.(3.12)
Os quatro primeiros momentos ordinrios de X so dados por
E(X) =
k=0
w
k
[ + + (a + k)c],
E(X
2
) =
k=0
w
k
{
6
2
+ 12 +
2
2
+ 6
2
2
+ 12( + ) log[(a + k)c] + 6
2
log
2
[(a + k)c]
}
,
E(X
3
) =
k=0
w
k
2
{
2
3
+ 6
2
+ (
2
+ 6
2
)
2
2
+ 4(3) + 2
3
)
3
+
(
12
2
+ 6
2
2
6
3
2
)
log[(a + k)c]
+ 6
2
( ) log
2
[(a + k)c] 2
3
log
3
[(a + k)c]
}
e
E(X
4
) =
k=0
w
k
20
{
20
4
+ 80
3
40
3
(
2
+ 4(3) + 2
3
)
+ 20
2
(
2
+ 6
2
)
+
(
3
4
+ 20
4
+ 160(3) + 20
2
2
)
4
+ 20
4
(4 + 1) log
4
[(a + k)c]
+ 40
[(
2
+ 4(3) + 2
3
)
2
+ 6
2
)
2
+ 6
2
+ 2
3
]
log[(a + k)c]
+ 20
2
(
2
+ 6
2
2
12 + 6
2
)
log
2
[(a + k)c] 80
3
log
3
[(a + k)c]
}
,
em que denota a constante de Euler e (s) =
n=1
n
s
a funo zeta.
As medidas de varincia, assimetria e curtose podem ser calculadas utilizando as bem co-
nhecidas expresses. Grcos de assimetria e curtose para valores selecionados de a e b como
funo de c para = 100 e = 50 so apresentados na Figura 3.3. Para valores crescentes
do parmetro c, a assimetria aumenta e a curtose inicialmente decresce para um valor mnimo e
depois deste ponto aumenta.
Momentos incompletos so utilizados para medir desigualdades: por exemplo, curvas de
Lorenz e Bonferroni e ndices de Pietra e Gini. O primeiro momento incompleto da varivel
aleatria Z
a
com parmetros a, e ,
Z
a
(t) =
xh
a
(x) dx, dado por
Z
a
(t) = t exp
{
a exp
[
(t )
]}
+ E
i
{
exp
[
(x )
]}
, (3.13)
39
0.0 0.1 0.2 0.3 0.4 0.5 0.6
1
.
0
0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
2
.
5
c
A
s
s
i
m
e
t
r
i
a
a=1.0; b=0.5
a=1,5; b=1,0
a=2,0; b=1,5
a=2,5; b=2,0
0.0 0.1 0.2 0.3 0.4 0.5
5
0
1
0
0
1
5
0
2
0
0
2
5
0
3
0
0
c
C
u
r
t
o
s
e
a=1,0; b=0,5
a=1,5; b=1,0
a=2,0; b=1,5
a=2,5; b=2,0
Figura 3.3 Assimetria e curtose da distribuio McGu como uma funo de c para alguns
valores de a e b com = 100 e = 50
40
em que E
i
=
x
x
1
e
x
dx a funo integral exponencial (para x > 0) e pode ser reescrita
como
E
i
= + log(x) +
k=1
x
k
k k!
.
Das equaes (3.10) e (3.13), obtm-se
X
(t) = t
k=0
w
k
[
exp
{
(a + k)c exp
[
(t )
]}
+ E
i
{
exp
[
(x )
]}]
.(3.14)
3.5 Funo geradora
A funo geradora de momentos (mgf) de uma varivel aleatria uma especicao alternativa
de sua distribuio de probabilidade. Diferenciando M
X
(t) em relao a t e fazendo t = 0
obtm-se o i-simo momento sobre zero.
Aps algumas manipulaes algbricas, pode-se escrever a mgf M(t) = E
(
e
t Z
)
da varivel
aleatria Z
a
, com parmetros a, e , como
M
a
(t) = e
t
a
t
(1 t). (3.15)
Ento, a mgf de X segue de (3.10) e de (3.15) como
M
X
(t) = E
(
e
t X
)
= e
t
(1 t)
k=0
w
k
[(a + k)c]
t
.
3.6 Funo quantlica
Funes quantlicas so utilizadas em grande escala na estatstica de modo geral e muitas vezes
para encontrar representaes em termos de tabelas de referncias para percentis. A funo
quantlica (qf) da distribuio McGu, Q(u) = F
1
(u), pode ser expressa em termos da qf da
distribuio beta. Encontrando a inversa de F(x) = I
(
exp
{
c exp
[
(x)
]})
(a, b) = u, obtm-se
x = Q(u) = log
{
c
1
log [Q
a,b
(u)]
}
, (3.16)
em que Q
a,b
(u) = I
1
u
(a, b) a qf da beta. A seguinte expanso para Q
a,b
(u) pode ser encon-
trada no website wolfram
1
Q
a,b
(u) =
4
i=1
A
i
[a B(a, b) u]
i/a
+ O(u
5/a
),
em que os coecientes so
A
1
= 1, A
2
=
b 1
a + 1
, A
3
=
(b 1)(a
2
+ 3ab a + 5b 4)
2(a + 1)
2
(a + 2)
1
http://functions.wolfram.com/06.23.06.0004.01 - Accessed 26/06/2013.
41
e
A
4
=
(b 1)[a
4
+ (6b 1)a
3
+ (b + 2)(8b 5)a
2
+ (33b
2
30b + 4)a + 6(31b 47) + 18]
3(a + 1)
3
(a + 2)(a + 3)
.
Para y (0, 1), tem-se log[k log(y)] =
j=1
k
j
j
[1 + log(y)]
j
. Utilizando a expanso
binomial, obtm-se
log[k log(y)] =
j=1
j
r=0
k
j
j
(
j
r
)
log(y)
r
. (3.17)
Usando as equaes 1.512 e 0.314 (para uma srie de potncia elevada a um inteiro positivo)
dada por Gradshteyn e Ryzhik (2007), pode-se reescrever (3.17) como
log[k log(y)] =
j=1
j
r=0
t=0
k
j
(
j
r
)
d
t
j
(y 1)
r+t
, (3.18)
em que d
0
= 1, d
m
=
1
m
m
t=1
[t (r + 1) m] a
t
d
mt
para m 1, r natural e a
t
=
(1)
t
t + 1
.
Uma segunda expresso para a qf de X segue de (3.18) como
Q(u) = +
j=1
j
r=0
t=0
(
j
r
)
j c
j
d
t
[Q
a,b
(u) 1]
r+t
.
3.7 Desvios mdios
Aqui, calculam-se as seguintes medidas: desvios mdios e curvas de Lorenz e Bonferroni. Uma
medida da disperso de uma populao dada pelo conjunto de desvios da mdia e da mediana
denidos por
1
(X) = 2
1
F(
1
) 2T
1
(
1
) e
2
(X) =
1
2T
1
(M), respectivamente, em
que
1
= E(X), a mediana M = Q(1/2) de X determinada de (3.16), F(M) e F(
1
) so
obtidos de (3.7) e T
1
(q) =
k=0
w
k
(a + k) c
q
x exp
[
(x )
]
exp
{
exp
[
(x )
]}
(a+k) c
dx.
Fazendo t = exp
[
(x)
]
, obtm-se
T
1
(q) =
k=0
w
k
{ + + log[(a + k) c] + exp[(a + k) c v] log(v) (3.19)
exp(a v) + c [0, (a + k) v]} ,
em que v = e
z
e
t
t
a1
dt a funo gama
incompleta superior. A equao (3.19) o principal resultado desta seo a partir do qual
1
(X)
e
2
(X) so imediatamente determinados.
42
O primeiro momento incompleto T
1
(q) pode ser usado para obter as curvas de Lorenz e
Bonferroni que so ferramentas fundamentais para a anlise de dados em diversas reas como
economia, conabilidade, demograa, seguros e medicina. Para uma dada probabilidade , elas
so denidas por L() = T
1
(q)/
1
e B() = T
1
(q)/(
1
), respectivamente, em que q = Q()
obtida de (3.16). Em economia, se a proporo de unidades cuja renda menor ou igual a
q, L() d a proporo do volume total de renda acumulada com renda menor ou igual a q. De
modo similar, a curva de Bonferroni B() d a razo entre a renda mdia desse grupo e a renda
mdia da populao. A Figura 3.4 apresenta as curvas de Lorenz e Bonferroni para valores
selecionados dos parmetros.
3.8 Entropia
A entropia a medida da incerteza de uma varivel aleatria. Duas medidas de entropia muito
populares so as entropias de Rnyi e de Shannon (RNYI, 1961; SHANNON, 1951). A en-
tropia de Rnyi de uma varivel aleatria X com pdf f() denida como
I
R
() =
1
1
log
{
E[f(X)
1
]
}
=
1
1
log
[
(x) dx
]
,
para > 0 e = 1. A entropia de Rnyi importante em ecologia estatstica como n-
dice de diversidade. A entropia de Shannon de uma varivel aleatria X denida como
E{log[f(X)]}. Este o caso especial da entropia de Rnyi quando 1.
Da equao (3.10), pode-se escrever a entropia de Rnyi de X como
I
R
() =
1
1
log
[
(s)
s1
B(a, b)
s
k=0
(1)
k
(a s + k)
s
(
s b s
k
)
]
.
3.9 Estimao
Adota-se o mtodo de mxima verossimilhana para estimar os parmetros do modelo. O loga-
ritmo da funo de verossimilhana, (), de uma amostra aleatria x
1
, . . . , x
n
de X com pdf
(3.6) dada por
() = n log(c) n log() n log [B(a, b)]
n
i=1
(x
i
)
a c
n
i=1
exp
[
(x
i
)
]
+ (b 1)
n
i=1
log
(
1 exp
{
c exp
[
(x
i
)
]})
. (3.20)
O logaritmo da funo de verossimilhana pode ser maximizado diretamente utilizando o
software R (pacote bbmle) ou por soluo do sistema de equaes no-lineares obtido por
derivar (3.20) em relao aos parmetros do modelo. Esta funo requer valores iniciais e,
neste trabalho, foram utilizados as estimativas de mxima verossimilhana para os parmetros
43
(a)
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
L
(
)
c=0,5
c=1,0
c=15,0
(b)
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
B
(
)
c=0,5
c=1,0
c=15,0
Figura 3.4 (a) Curvas de Lorenz e (b) Bonferroni para a = 2, 0; b = 4, 0; = 10, 0 e = 2, 0
da distribuio Gumbel com a = b = c = 1. Os componentes do vetor escore U() so dados
44
por
U
a
() = n[(a + b) (a)] c
n
i=1
exp
[
(x
i
)
]
,
U
b
() = n[(a + b) (b)] +
n
i=1
log (1 exp {c exp [(x
i
)/]}),
U
c
() =
n
c
a
n
i=1
exp
[
(x
i
)
]
(b 1)
n
i=1
exp[(x
i
)/] exp (c exp [(x
i
)/])
1 exp {c exp [(x
i
)/]}
,
U
() =
n
ac
i=1
exp
(
x
i
)
+
c (b 1)
i=1
exp [(x
i
)/] exp {c exp [(x
i
)/]}
1 exp {c exp [(x
i
)/]}
e
U
() =
n
+
n
i=1
(x
i
)
2
{1 ac exp[(x
i
)/]}
+
c(b 1)
2
n
i=1
(x
i
) exp [(x
i
)/] exp {c exp [(x
i
)/]}
1 exp {c exp [(x
i
)/]}
,
em que (s) = d log (s)/ds a funo digama. Para estimao intervalar e testes de hip-
teses para os parmetros do modelo, a matriz de informao observada requerida. Os 5 5
elementos da matriz de informao observada J() so dados no Apndice APNDICE A - .
Sob certas condies de regularidade, a distribuio normal multivariada N
5
(
0, J(
)
1
)
,
emque J(
) e Anderson-Darling (A
e A
, A
p-valor A
, A
p-valor A
log[1G(x)]
0
t
a1
e
t
dt, (4.4)
respectivamente, parar a > 0, em que g(x) = dG(x)/dx, (a) =
0
t
a1
e
t
dt e (a, z) =
z
0
t
a1
e
t
dt denotam as funes gama e gama incompleta, respectivamente. Algumas de suas
propriedades matemticas foram estudadas por Nadarajah, Cordeiro e Ortega (2014).
Neste artigo, dene-se uma nova distribuio com quatro parmetros, a gama Burr XII (de
forma abreviada GBXII), pela insero de (4.1) na equao (4.4). A distribuio acumulada
da GBXII
F(x; ) =
(
a, k log
[
1 +
(
x
s
)
c
])
(a)
, (4.5)
enquanto sua pdf (para x > 0) pode ser expressa, das equaes (4.1), (4.2) e (4.3), como
f(x; ) =
c k
a
s
c
(a)
x
c1
[
1 +
(
x
s
)
c
]
k1
{
log
[
1 +
(
x
s
)
c
]}
a1
, (4.6)
em que = (a, s, k, c). A partir deste ponto, X GBXII(a, s, k, c) denota uma varivel
aleatria com funo densidade (4.6).
A motivao para introduzir a distribuio GBXII devido grande utilizao da distri-
buio BXII e o fato da generalizao atual proporcionar melhor ajuste a dados em situaes
mais complexas. A importncia de (4.6) que esta possui como casos especiais vrias distri-
buies bem conhecidas. Claramente, a distribuio BXII o modelo base para a = 1. Para
53
s = m
1
e k = 1, a GBXII reduz-se distribuio gama log-logstica (GLL). Para a = 1,
s = m
1
e k = 1, ela produz a distribuio log-logstica (LL), em que a funo de sobrevivn-
cia S(t; m, c) = [1 + (t m)
c
]
1
. Para c = 1 e a = c = 1, tem-se como casos especiais as
distribuies gama Pareto tipo II (GPaII) e Pareto tipo II (PaII), respectivamente. Se k ,
ela idntica distribuio gama Weibull (GW). Se k e adicionalmente a = 1, temos a
distribuio Weibull.
A distribuio GBXII no somente apropriada para modelar adequadamente taxas de fa-
lhas com forma unimodal, mas tambm adequada para testar o ajuste de seus sub-modelos,
tais como, as distribuies logstica e BXII. Algumas formas possveis da funo densidade
(4.6) para selecionados valores dos parmetros, incluindo distribuies bem conhecidas, so
apresentados na Figura 4.1.
A funo taxa de risco (hrf) da GBXII (para x > 0) dada por
(x; ) =
c k
a
s
c
x
c1
[
1 +
(
x
s
)
c
]
k1
{
log
[
1 +
(
x
s
)
c
]}
a1
(a)
(
a, k log
[
1 +
(
x
s
)
c
]) .
Algumas possveis curvas para taxas de risco da GBXII so mostradas na Figura 4.2 para
valores selecionados dos parmetros.
O artigo organizado como segue. Na Seo 4.2, encontram-se expanses para a pdf e a
cdf da distribuio GBXII. Demonstra-se que a funo densidade da GBXII pode ser expressa
como uma combinao linear de densidades BXII. Algumas propriedades matemticas de (4.6)
so apresentadas nas Sees 4.3 a 4.6. Na Seo 4.7, investiga-se estimao por mxima ve-
rossimilhana e determinam-se os elementos da matriz de informao observada. Na Seo
4.8, duas aplicaes para dados reais ilustram a potencialidade do novo modelo. A Seo 4.9
naliza o artigo com algumas concluses.
4.2 Expanses para a pdf e para a cdf
Algumas expanses para (4.5) e (4.6) podem ser encontradas, utilizando o conceito de distri-
buies exponencializadas. Para uma cdf G(x) base, dene-se uma varivel aleatria Y tendo
distribuio G exponencializada (exp-G) com parmetro de potncia > 0. Diz-se que
Y exp-G(, ), em que o vetor de parmetros de G, se suas cdf e pdf so dadas por
H(y) = G
i=0
(
i + 1 a
i
)
i
j=0
(1)
j+i
(
i
j
)
p
j,i
(a 1 j)
G(x)
a+i1
,
em que as constantes p
j,i
(para j 0) podem ser calculadas recursivamente por
p
j,i
= i
1
i
m=1
(1)
m
[m(j + 1) i]
m+ 1
p
j,im
para i = 1, 2, . . . e p
j,0
= 1.
Para uma parmetro real a > 0, dene-se
b
i
= b
i
(a) =
(
i + 1 a
i
)
(a + i)(a 1)
i
j=0
(1)
j+i
p
j,i
(a 1 j)
(
i
j
)
, (4.7)
e, ento, (4.3) pode ser expressa como
f(x) =
i=0
b
i
h
a+i
(x), (4.8)
56
em que h
a+i
(x) denota a funo densidade da exp-G(a + i). Ento, a equao (4.4) pode ser
expressa como
F(x) =
i=0
b
i
H
a+i
(x),
em que H
a+i
(x) denota a cdf de uma exp-G(a +i). Assim, vrias propriedades matemticas da
distribuio gama-G podem ser obtidas pelas propriedades j conhecidas da distribuio exp-G.
As propriedades da GBXII, tais como momentos e funo geradora, podem ser obtidas das
propriedades da distribuio Burr XII exponencializada (EBXII). A distribuio Kumaraswamy
Burr XII (KwBXII), recentemente estudada por Paranaba et al. (2013), tem como caso especial
a distribuio EBXII e, portanto, seus resultados podemser aplicadas para a distribuio GBXII.
A cdf e a pdf da distribuio EBXII (para z > 0) como parmetro de potncia a > 0 so
dadas, respectivamente, por
H
a
(z) =
{
1
[
1 +
(
z
s
)
c
]
k
}
a
e
h
a
(z) = a c k s
c
z
c1
[
1 +
(
z
s
)
c
]
k1
{
1
[
1 +
(
z
s
)
c
]
k
}
a1
. (4.9)
Seja Z EBXII(a, s, k, c) uma varivel aleatria com funo densidade (4.9). Utilizando
a expanso binomial (1 y)
a1
=
i=0
(1)
i
(
a1
i
)
y
i
para |y| < 1 e equaes (4.1) e (4.2), a
pdf (4.9) pode ser reescrita como
h
a
(z) =
l=0
(1)
l
a
(
a1
l
)
(l + 1)
g(z; s, (l + 1)k, c). (4.10)
Aqui, g(x; s, (l + 1)k, c) denota a funo densidade da BXII com parmetro de escala s e
parmetros de forma c e (l + 1)k. A equao (4.10) revela que a funo densidade da EBXII
uma combinao linear de densidades da BXII. Seja w
l
= (1)
l
a
(
a1
l
)
/(l + 1). Utilizando o
programa Mathematica, pode-se vericar que
l=0
w
l
= 1. Se a um inteiro, o ndice l para
em a 1. Integrando (4.10) tem-se
H
a
(z) =
l=0
w
l
G(z; s, (l + 1)k, c).
Combinando (4.8) e (4.10), a funo densidade de X torna-se
f(x) =
l=0
l
g(x; s, (l + 1)k, c), (4.11)
em que o coeciente
l
dado por
l
=
1
l + 1
i=0
b
i
(a + i)
(
a + i 1
l
)
, (4.12)
57
e b
i
dado por (4.7). Integrando (4.11) tem-se
F(x) =
l=0
l
G(x; s, (l + 1)k, c). (4.13)
As equaes (4.11) e (4.13) so os principais resultados desta seo. Assim, algumas pro-
priedades estruturais da GBXII podem ser obtidas das propriedades da BXII.
4.3 Momentos e Funo Geradora
Algumas das mais importantes caractersticas de uma distribuio podem ser obtidas usando
momentos (por exemplo, tendncia, disperso, assimetria e curtose). O q-simo momento
de uma varivel aleatria BXII Z com parmetro de escala s e parmetros de forma c e k
E(Z
q
) = s
q
k B(k q c
1
; q c
1
+ 1) , q < k c (PARANABA, 2012), em que B(a, b) =
1
0
t
a1
(1 t)
b1
a dt a funo beta.
Da equao (4.11), pode-se escrever (para q < c k)
q
= E(X
q
) = k s
q
l=0
l
(l + 1) B
(
(l + 1)k q c
1
, q c
1
+ 1
)
. (4.14)
Grcos de assimetria e curtose para valores selecionados de a so apresentados na Figura
4.3. Estes grcos revelam um grande impacto de k, c e a na assimetria e curtose de X.
Os momentos centrais (
s
) e os cumulantes (
s
) de X podem ser determinados de (4.14)
como
s
=
k
k=0
(1)
k
(
s
k
)
k
1
sk
and
s
=
s1
k=1
(
s 1
k 1
)
sk
,
respectivamente, em que
1
=
1
. Ento,
2
=
2
2
1
,
3
=
3
3
1
+ 2
3
1
,
4
=
4
4
1
3
2
2
+ 12
2
1
6
4
1
, etc. A assimetria
1
=
3
/
3/2
2
e a curtose
2
=
4
/
2
2
podem ser calculadas utilizando os terceiro e quarto cumulantes padronizados.
Para modelos de tempo de vida, geralmente, existe interesse emcalcular o h-simo momento
incompleto de X dado por T
h
(y) =
y
0
x
h
f(x)dx. A quantidade T
h
(y) pode ser determinada
de (4.11) como
T
h
(y) =
l=0
y
0
x
h
g(x; s, (l + 1)k, c) dx.
Utilizando os resultados de Paranaba et al. (2013), tem-se
T
h
(y) = k s
h
l=0
l
B s
c
s
c
+y
c
((l + 1)k hc
1
, 1 + hc
1
), (4.15)
em que B
z
(a, b) =
z
0
t
a1
(1 t)
b1
dt a funo beta incompleta.
58
s = 5
0 2 4 6 8
0
2
0
4
0
6
0
8
0
1
0
0
a
A
s
s
i
m
e
t
r
i
a
k=0,5; c=0,5
k=1,5; c=1,0
k=1,0; c=2,0
k=0,5; c=3,0
s = 3
0 1 2 3 4 5 6
0
2
0
4
0
6
0
8
0
1
0
0
a
C
u
r
t
o
s
e
k=0,5; c=0,5
k=1,5; c=1,0
k=1,0; c=2,0
k=0,5; c=3,0
Figura 4.3 Assimetria e curtose da distribuio GBXII como funo de a para alguns valores
de k e c
Seja M
k
(t) a funo geradora da distribuio BXII(s, k, c). A funo geradora de momentos
59
(mgf) M(t) de X pode ser obtida de (4.11) como
M(t) =
l=0
l
M
(l+1)k
(t). (4.16)
Paranaba et al. (2013) providenciaram uma representao simples para M
k
(t) usando a
funo Meijer G denida por
G
m,n
p,q
(
x
a
1
, . . . , a
p
b
1
, . . . , b
q
)
=
1
2i
L
m
j=1
(b
j
+ t)
n
j=1
(1 a
j
t)
p
j=n+1
(a
j
+ t)
p
j=m+1
(1 b
j
t)
x
t
dt,
em que i =
l=0
l
I
(
s t,
m
(l + 1)k
1,
m
(l + 1)k
, (l + 1)k 1
)
. (4.18)
As equaes (4.14), (4.15) e (4.18) so os principais resultados desta seo.
4.4 Funo Quantlica
A funo quantlica da GBXII, para 0 < u < 1, Q(u) = F
1
(u), pode ser determinada como
Q(u) = s
[
(
exp
{
Q
1
[a, u (u)]
})
1/k
1
]
1/c
, (4.19)
em que Q
1
(a, u) a funo inversa de Q(a, x) =
x
w
a1
e
w
dw. Assim, segue imediata-
mente que a mediana M de X dada por
Q(u) = s
(
{
exp
[
Q
1
(
a,
/2
)]}
1/k
1
)
1/c
.
60
4.5 Desvios Mdios
Aqui, determinam-se as medidas: desvios mdios e curvas de Lorenz e Bonferroni. Quanticar
a disperso em uma populao pode ser medida, evidentemente, pelo conjunto de desvios da
mdia ou da mediana. Essas medidas so conhecidas como desvios mdios em torno da mdia
e da mediana denidos por
1
(X) = 2
1
F(
1
) 2T
1
(
1
) e
2
(X) =
1
2T
1
(M),
respectivamente, em que
1
= E(X), a mediana M de X determinada explicitamente de
(4.19) por M = Q(1/2), F(M) e F(
1
) so obtidos de (4.5) e T
1
(q) =
q
0
xf(x)dx o
primeiro momento incompleto de X dado por (4.15) com h = 1. De (4.11) tem-se
T
1
(q) = c k
l=0
(l + 1)
l
q
(
x
s
)
c
[
1 +
(
x
s
)
c
]
(l+1)k1
dx.
Fazendo u = (
x
s
)
c
, obtm-se
T
1
(q) = k s
l=0
(l + 1)
l
(q/s)
c
u
1/c
(1 + u)
(l+1)k1
du.
A integral que se segue (para q > 0 1 k > 0) calculada utilizando o Maple
J(q, r, k) =
q
u
r
(1 + u)
k
du
=
[
2
F
1
[(k, r + 1); (2 + r); q] q
r+1
(r + 1)
+
(k r 1) csc(r)
(k)(r)
]
,
em que
2
F
1
a funo hipergeomtrica denida por
2
F
1
(a, b; c; x) =
k=0
(a)
k
(b)
k
(c)
k
x
k
k!
.
Portanto,
T
1
(q) = k s
l=0
(l + 1)
l
J
(
(
q
s
)
c
,
1
c
, (l + 1)k + 1
)
(4.20)
e as medidas
1
(X) e
2
(X) so imediatamente determinadas de (4.20).
A quantidade T
1
(q) utilizada para fazer grcos das curvas de Lorenz e Bonferroni em
reas como economia, conabilidade, demograa, seguros e medicina. Para uma dada proba-
bilidade , elas so denidas por L() = T
1
(q)/
1
e B() = T
1
(q)/(
1
), respectivamente,
em que q = Q() calculada diretamente de (4.19). A Figura 4.4 mostra as curvas de Lorenz e
Bonferroni para valores selecionados dos parmetros. As curvas so crescentes com o aumento
dos valores de .
61
L()
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
L
(
)
a=0,5
a=1,5
a=2,0
a=5,0
B()
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
B
(
)
a=0,5
a=1,5
a=2,0
a=5,0
Figura 4.4 Curvas de Lorenz e Bonferroni para s = 2, k = 4 e c = 1
4.6 Conabilidade
No contexto de conabilidade, o modelo fora-tenso descreve o tempo de vida de um compo-
nente que tem uma fora aleatria X
1
e submetido a uma tenso aleatrio X
2
. O componente
62
falha no instante em que a tenso aplicada a ele excede a fora e o componente ir funcionar
satisfatoriamente quando X
1
> X
2
. Assim, R = Pr(X
2
< X
1
) a medida da conabili-
dade do componente. Possui muitas aplicaes, especialmente nos conceitos de engenharia. A
seguir, determina-se a conabilidade R =
0
f
1
(x) F
2
(x)dx quando X
1
e X
2
so independen-
tes com distribuies GBXII(a
1
, s, k
1
, c) e GBXII(a
2
, s, k
2
, c), respectivamente, com o mesmo
parmetro de forma c e mesmo parmetro de escala s.
A pdf de X
1
e a cdf de X
2
so obtidas das equaes (4.11) e (4.13) como
f
1
(x) =
l=0
l
(a
1
) g(x; s, (l + 1)k
1
, c)
e
F
2
(x) =
t=0
t
(a
2
) G(x; s, (t + 1)k
2
, c),
respectivamente, em que as quantidades
l
(a
1
) e v
t
(a
2
) so calculadas de (4.12). Portanto,
R =
l,t=0
l
(a
1
)
t
(a
2
) I(c, s, k
1
, k
2
, l, t),
em que
I(c, s, k
1
, k
2
, l, t) = k
1
(l + 1)
0
c x
c1
s
c
{
1
[
1 +
(
x
s
)
c
]
k
2
(t+1)
}
[
1 +
(
x
s
)
c
]
k
1
(l+1)1
dx.
Fazendo u = 1 + (x/s)
c
, tem-se
I(c, s, k
1
, k
2
, l, t) =
k
2
(t + 1)
k
1
(l + 1) + k
2
(t + 1)
,
e, ento, R pode ser calculada.
4.7 Estimao
Seja T
i
uma varivel aleatria com funo densidade (4.6) e = (a, s, k, c)
T
o vetor param-
trico. Os dados encontrados em estudos de anlise de sobrevivncia e em conabilidade so
frequentemente censurados. Um mecanismo de censura aleatria muito simples, e muitas vezes
realista, aquele em que se assume que cada indivduo i tem um tempo de vida til T
i
e um
tempo de censura C
i
, em que T
i
e C
i
so variveis aleatrias independentes. Suponha que os
dados consistem de n observaes independentes e X
i
= min(T
i
, C
i
) para i = 1, . . . , n. A dis-
tribuio de C
i
no depende de qualquer parmetro desconhecido de T
i
. Tcnicas paramtricas
para esses dados, normalmente, so baseadas em mtodos de estimao por verossimilhana e
teoria assinttica. O logaritmo da funo de verossimilhana com censura l() para os parme-
63
tros do modelo
() = r [log(c) + a log(k) c log(s)] n log[(a)] + (c 1)
iF
log(x
i
)
(k + 1)
iF
log (u
i
) + (a 1)
iF
log [log (u
i
)]
+
iC
log {(a) (a, k log [u
i
])}, (4.21)
emque u
i
= 1+(x
i
/s)
c
, r o nmero de falhas e F e C denotamo conjunto de observaes no-
censuradas e censuradas, respectivamente. As funes escore para os parmetros do modelo so
U
a
() = n(a) + r log(k) +
iF
log [log (u
i
)]
+
iC
log[log(u
i
)] Q(a, log[u
i
]) + G
3,0
2,3
(
log[u
i
]
1, 1
0, 0, a
)
Q(a, log[u
i
])
,
U
s
() =
r c
s
c (a 1)
s
iF
w
i
log(u
i
)
+
c (k 1)
s
iF
w
i
+
c
s
iC
[log(u
i
1)]
a1
u
i
Q(a, log[u
i
])
,
U
k
() =
a r
k
iF
log(u
i
),
e
U
c
() =
r
c
r log(s) +
iF
log(x
i
) (k + 1)
iF
v
i
u
i
+ (a 1)
iF
v
i
u
i
log(u
i
)
iC
v
i
[log(u
i
)]
a1
u
2
i
Q(a, log[u
i
])
,
em que u
i
= 1 + (x
i
/s)
c
, v
i
= (x
i
s
1
)
c
log(x
i
s
1
), w
i
= (u
i
1)/u
i
e (s) = d log (s)/ds
a funo digama.
O estimador de mxima verossimilhana (MLE)
de obtido pela soluo das equaes
no lineares U
a
() = 0, U
s
() = 0, U
k
() = 0 e U
c
() = 0. Essas equaes no podem ser
resolvidas analiticamente e requerem um programa estatstico com tcnicas numricas iterati-
vas. As avaliaes numricas foram implementadas utilizando o R verso 3.0.0 (pacote bbmle).
Para estimao intervalar e testes de hipteses para os parmetros do modelo, determina-se a
matriz de informao observada 4 4 pois sua esperana requer integrao numrica. A matriz
de informao observada J() = {J
pq
()}, em que p, q = a, s, c and k. Os elementos
J
pq
() so dados no Apndice APNDICE C - .
64
4.8 Aplicaes
Nesta seo, ajustam-se as distribuies GBXII, BXII, log-logstica (LL), Weibull exponencia-
lizada (EW) e beta Weibull (BW) a dois conjuntos de dados reais. A distribuio BW tem pdf
f(x; a, b, , ) = [/B(a, b)] x
1
exp(b x
)[1 exp(x
)]
a1
, para x > 0. O modelo
EW obtido fazendo a = 1. Para estimar os parmetros destes modelos especiais, adota-se o
mtodo de mxima verossimilhana com as avaliaes computacionais realizadas utilizando o
pacote bbmle do R verso 3.0.0.
4.8.1 Aplicao 1: Dados de quebra por tenso
Os dados no-censurados de Nichols e Padgett (2006) denotam a quebra por tenso de bras
de carbono (em GPa). A Tabela 4.1 lista os MLEs e correspondentes erros padro estimados
(SEs), os valores do critrio de informao de Akaike (AIC), do critrio de informao de
Akaike corrigido (CAIC) e do critrio bayesiano de Schwarzs (BIC) para os dados atuais. Os
trs critrios de informao auxiliam na classicao dos modelos. Os valores menores desses
critrios correspondem distribuio GBXII, que pode ser escolhido neste caso. Alm disso,
calculam-se as estatsticas de qualidade de ajuste de Cramr-von Mises (W
) e de Anderson-
Darling (A
e A
so descritas por Chen e Balakrishnan (1995). Quanto menor forem os valores dessas
estatsticas, melhor ser o ajuste. Os valores das estatsticas W
e A
e A
{
1
p G(x; )
1 (1 p)G(x; )
}
s
(1 )
s
1
. (5.3)
A funo densidade de probabilidade (pdf) correspondente a (5.3) ca reduzida a
f(x) =
s p g(x, )
[
1 (1 p)G(x; )
]
s1
[(1 )
s
1]
{
1 [1 p(1 )] G(x; )
}
s+1
, (5.4)
em que g(x; ) = dG(x; )/dx. A partir daqui, seja X MONB-G(s, p, , ) uma varivel
aleatria com pdf (5.4).
A funo razo de risco (hrf) de X dada por
(x) =
s p g(x, ) (x, )
(s+1)
[
1 p G(x, )
]
(x, )
[
1 p G(x, )
]
s+1
,
em que (x, ) =
{
1 G(x, ) [1 p (1 )]
}
.
A famlia MONB-G bem motivada para aplicaes em engenharia e na indstria. Con-
sidere que a falha de um dispositivo ocorre devido presena de um nmero desconhecido N
de defeitos iniciais do mesmo tipo, que podem ser identicados somente depois da falha e so
reparados perfeitamente. Seja X
i
o tempo para a falha do dispositivo devido ao i-simo defeito,
para i 1. Assumindo que os X
i
s so variveis aleatrias e independentes iid de N com dis-
tribuio MO-G, ento, o tempo para a primeira falha adequadamente modelado pela famlia
MONB-G. Para os estudos de conabilidade, a varivel aleatria X = Min{X
i
}
N
i=1
pode ser
usada em um sistema em srie com componentes idnticos frequentemente aplicados nas reas
de engenharia e industrial.
O objetivo deste trabalho obter algumas propriedades matemticas de (5.4) para qualquer
distribuio G base. Na Seo 5.2, apresentam-se alguns casos especiais da nova famlia. A
Seo 5.3 apresenta as expanses para a pdf e a cdf. Na Seo 5.4, determina-se a funo
73
quantlica (qf) de X. Expresses explcitas para os momentos ordinrios, funo geradora de
momentos (mgf), desvios mdios, entropia de Shannon, entropia de Rnyi e estatstica de ordem
so apresentadas nas Sees 5.5 5.8. A estimao dos parmetros do modelo, utilizando o
mtodo de mxima verossimilhana, descrita na Seo 5.9. Uma aplicao a dados reais
apresentada na Seo 5.10. Finalmente, algumas concluses so apresentadas na Seo 5.11.
5.2 Distribuies especiais MONB-G
A densidade da famlia MONB (5.4) permite maior exibilidade nas caudas da distribuio e
pode ser aplicada emdiversas reas. Anova famlia estende vrias distribuies bemconhecidas
na literatura. Assim, apresentam-se alguns de seus casos especiais. A funo densidade (5.4)
melhor empregada quando a cdf G(x; ) e a pdf g(x; ) tm expresses analticas simples.
5.2.1 Distribuio Marshall-Olkin binomial negativa gama (MONBGa)
A funo distribuio acumulada da gama (para x > 0) com parmetro de forma a > 0 e
parmetro de escala b > 0 dada por
G(x) =
(a, x/b)
(a)
,
em que (a) =
0
w
a1
e
w
dw e (a, x) =
x
0
w
a1
e
w
dw so as funes gama e gama
incompleta, respectivamente. A funo densidade de uma varivel aleatria X com distribuio
MONBGa reduz-se a
f(x; s, p, , a, b) =
s p x
a1
e
x/b
[
p +
(1p) (a,x/b)
(a)
]
s1
b
a
(a) [(1 )
s
1] {p (1 ) + [1 p (1 )
(a,x/b)
(a)
]}
s+1
.
Alguns grcos da funo densidade e da taxa de risco da MONBGa so apresentados na Figura
5.1.
5.2.2 Distribuio Marshall-Olkin binomial negativa Frchet (MONBFr)
Considere a distribuio Frchet (para x, a, b > 0) comcdf e pdf dadas por G(x) = exp[(b/x)
a
]
e g(x) = a b
a
x
a1
exp[(b/x)
a
], respectivamente.
A distribuio MONBFr, para x > 0, tem pdf dada por
f(x; s, p, , a, b) =
a s p b
a
x
a1
e
(b/x)
a
[p + (1 p) e
(b/x)
a
]
s1
[(1 )
s
1] {p (1 ) + [1 p (1 )] e
(b/x)
a
}
s+1
, (5.5)
em que a > 0 um parmetro de forma e b > 0 um parmetro de escala. Grcos de (5.5) e
da funo taxa de risco para valores selecionados dos parmetros so mostrados na Figura 5.2.
74
x
D
e
n
s
i
d
a
d
e
0 20 40 60 80 100
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
s= 5,0; p=5,0; = 0,5; a=10,0; b=5,0
s= 4,0; p=7,0; = 0,4; a= 4,0; b=10,0
s=10,0; p=0,4; = 0,1; a=20,0; b=2,0
s= 1,0; p=0,2; = 10
4
; a= 2,5; b=15,0
x
T
a
x
a
d
e
r
i
s
c
o
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
s=0,2; p=1,5; = 0,4; a=0,8; b=6,0
s=0,2; p=1,0; = 0,7; a=2,0; b=1,5
s=0,8; p=0,2; = 0,01; a=1,5; b=6,0
s=2,0; p=0,4; = 0,01; a=3,0; b=1,5
Figura 5.1 Densidade e taxa de risco da MONBGa para alguns valores dos parmetros
5.2.3 Distribuio Marshall-Olkin binomial negativa log-logstica (MONBLL)
A pdf e a cdf da distribuio log-logstica (LL) so (para x, a, b > 0)
g(x) = b a
b
x
b1
[
1 +
(
x
a
)
b
]
2
e G(x) = 1
[
1 +
(
x
a
)
b
]
1
.
75
x
D
e
n
s
i
d
a
d
e
0 4 8 12 16 20
0
.
0
0
.
1
0
.
2
s= 25; p=15; = 0,2; a=4,5; b=6,0
s= 2; p=10; = 0,01; a=2,0; b=2,0
s=0,6; p=4; = 0,8; a=1,5; b=4,0
s= 1; p=20; = 0,5; a=1,7; b=1,4
x
T
a
x
a
d
e
r
i
s
c
o
0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
1
.
2
s=0.4; p=5.0; = 0,9; a=0,8; b=2,0
s=0.2; p=1.0; = 0,7; a=1,0; b=3,5
s=0.8; p=0.2; = 0,01; a=1,5; b=6,0
s=3.0; p=4.0; = 0,1; a=3,0; b=1,0
Figura 5.2 Densidade e taxa de risco da MONBFr para alguns valores dos parmetros
Inserindo essas expresses em (5.4) tem-se a pdf da MONBLL (para x > 0)
f(x; s, p, , a, b) =
b s p (x/a)
b1
[p + (x/a)
b
]
s1
a [(1 )
s
1] [p (1 ) + (x/a)
b
]
s+1
.
A distribuio LL surge para s = 1, p = 0 e 0. Grcos da funo densidade e da taxa de
76
risco da MONBLL para alguns valores dos parmetros so apresentados na Figura 5.3.
x
D
e
n
s
i
d
a
d
e
0 1 2 3 4 5
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
s=0,2; p= 1,5; = 0,4; a=0,8; b= 2,0
s=1,0; p= 1,0; = 0,02; a=2,0; b= 5,0
s=0,8; p=20,0; = 0,9; a=3,0; b=20,0
s=0,8; p= 0,4; = 0,9; a=3,0; b=20,0
x
T
a
x
a
d
e
r
i
s
c
o
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
s= 2,0; p=10,0; = 0,01; a= 2,0; b= 2,0
s= 0,2; p= 2,0; = 0,1; a=10,0; b= 4,0
s= 5,0; p=40,0; = 0,7; a= 6,0; b= 5,0
s=0,01; p=10,0; = 0,4; a= 0,8; b= 1,5
Figura 5.3 Densidade e taxa de risco da MONBLL para alguns valores dos parmetros
77
5.2.4 Distribuio Marshall-Olkin binomial negativa Weibull (MONBW)
Se G(x) a cdf da Weibull com parmetro de escala a > 0 e parmetro de forma b > 0, tem-se
G(x) = 1 exp[(a x)
b
] e a pdf (para x > 0) da distribuio MONBW dada por
f(x; s, p, , a, b) =
b s p a
b
e
(a x)
b
[
1 (1 p) e
(a x)
b
]
s1
[(1 )
s
1]
{
1 [1 p (1 )] e
(a x)
b
}
s+1
.
A Figura 5.4 apresenta algumas possveis formas da funo densidade e da taxa de risco da
MONBW.
5.3 Expanses teis
Usando a equao (13) de Percontini, Cordeiro e Bourguignon (2013), expanses para a pdf
e cdf da classe MO dadas em Barreto-Souza, Lemonte e Cordeiro (2013) e uma equao para
uma srie de potncia elevada a um inteiro positivo de Gradshteyn e Ryzhik (2007, Seo
0.314), a pdf de X, para p (0, 1), pode ser expressa como uma combinao linear de funes
densidades de G-exponencializadas (abreviadamente exp-G)
f(x) =
j,m,t=0
j,m,t
h
j+m+t+1
(x; ), (5.6)
em que h
(x; ) = g(x; ) G
1
(x; ) denota a funo densidade da exp-G com parmetro
de potncia ,
j,m,t
=
l=m
(j + 1) (m + 1)
(j + m + t + 1)
w
k,j
v
l,m
c
j,t
,
w
k,j
=
k=j
(1)
j
s
k+1
(s + 1)
k
(j + 1) k! [(1 )
s
1]
(
k
j
)
,
v
l,m
=
l
m=0
(1)
lm
p (l + 1) (1 p)
l
l m + 1
(
l
m
)
,
c
j,t
= (t b
1
0
)
t
n=1
[n(j + 1) t] b
n
c
j,tn
, t 1, b
t
=
r=t
v
r,t
, c
j,0
= b
j
0
e (s)
k
= (s +
k)/(s) = s (s + 1) . . . (s + k 1) o smbolo de Pochhammer.
Para p > 1, f(x) em (5.4) pode ser expressa de modo semelhante como
f(x) =
j,r,t=0
j,r,t
h
j+r+t+1
(x; ), (5.7)
em que
j,r,t
=
(j + 1) (r + 1)
(r + j + t + 1)
w
k,j
r
d
j,t
,
r
= (1/p) [1 (1/p)]
r
, d
j,t
= (t
1
0
)
t
n=1
[n(j + 1) t]
n
d
j,tn
, t 1 e d
j,0
=
j
0
.
78
x
D
e
n
s
i
d
a
d
e
0 1 2 3
0
.
0
0
.
3
0
.
6
0
.
9
1
.
2
s=15,0; p= 0,2; = 0,3; a=0,2; b=2,0
s= 2,0; p= 3,0; = 0,8; a=0,4; b=1,4
s=10,0; p=10,0; = 0,01; a=1,0; b=2,0
s=10,0; p= 0,4; = 0,01; a=1,0; b=2,0
x
T
a
x
a
d
e
r
i
s
c
o
0 1 2 3
0
2
4
6s=15,0; p= 0,2; = 0,3; a=0,2; b=2,0
s= 2,0; p= 3,0; = 0,8; a=0,4; b=1,4
s=10,0; p=10,0; = 0,01; a=1,0; b=2,0
s=10,0; p= 0,4; = 0,01; a=1,0; b=2,0
(c) (d)
Figura 5.4 Densidade e taxa de risco da MONBW para alguns valores dos parmetros
Por integrao de (5.6) e de (5.7), pode-se expressar F(x) como
F(x) =
m,j,s=0
j,m,t
H
j+m+t+1
(x; ), para p (0, 1), (5.8)
79
e
F(x) =
j,r,t=0
j,r,t
H
j+r+t+1
(x; ), para p > 1, (5.9)
respectivamente. As equaes (5.6) e (5.7) revelam que algumas propriedades matemticas da
nova famlia podem ser obtidas utilizando as propriedades conhecidas das distribuies exp-G.
Algumas dessas propriedades sero apresentadas para a equao (5.7), mas resultados similares
pode ser obtidos para a equao (5.6).
5.4 Funo quantlica
A correspondente qf para (5.3) obtida diretamente da qf associada a G(x; ) por
Q(u) = F
1
(x) = G
1
(1 u
; ) , (5.10)
em que
u
=
1
[
u
(
1
)]
1/s
p + p
{
1
[
u
(
1
)]
1/s
},
p = 1 p e = (1 )
s
.
Quantis de interesse podem ser obtidos de (5.10) substituindo valores apropriados para u.
Em particular, a mediana de X obtida para u = 0, 5. A motivao para usar medidas baseadas
nos quantis a no-existncia da assimetria e da curtose para muitas distribuies generalizadas.
Neste caso, pode-se calcular a assimetria de Bowley que tem como base os quartis (KENNEY;
KEEPING, 1962)
B =
Q(3/4) 2Q(1/2) + Q(1/4)
Q(3/4) Q(1/4)
e a curtose de Moors (MOORS, 1988) que baseada nos octis
M =
Q(7/8) Q(5/8) + Q(3/8) Q(1/8)
Q(6/8) Q(2/8)
.
Grcos da assimetria e curtose da distribuio MONBW, para algumas escolhas de s, , a
e b, como funo de p so apresentados na Figura 5.5. Os grcos indicam que h uma grande
exibilidade das curvas de assimetria e curtose para essa distribuio.
5.5 Momentos
Uma primeira frmula para o q-simo momento de X, dada por
q
= E(X
q
), segue de (5.7)
como
q
=
j,r,t=0
j,r,t
E
(
Y
q
j+r+t+1
)
, (5.11)
80
=0,8 s=5,0
0 5 10 15 20 25 30
0
.
1
0
.
0
0
.
1
0
.
2
0
.
3
p
A
s
s
i
m
e
t
r
i
a
s=15,0
s=10,0
s= 2,0
s= 0,4
0 5 10 15 20 25 30
0
.
1
0
.
0
0
.
1
0
.
2
0
.
3
p
A
s
s
i
m
e
t
r
i
a
= 0,8
= 0,5
= 0,3
= 0,1
=0,8 s=1,5
0 5 10 15 20 25 30
1
.
1
1
.
2
1
.
3
1
.
4
1
.
5
1
.
6
p
C
u
r
t
o
s
e
s=10,0
s= 5,0
s= 2,0
s= 0,4
0 5 10 15 20 25 30
1
.
2
0
1
.
3
0
1
.
4
0
1
.
5
0
p
C
u
r
t
o
s
e
= 0,8
= 0,5
= 0,3
= 0,1
Figura 5.5 Grcos de assimetria e curtose da MONBW como funo de p para valores sele-
cionados de s e com a = 5, 0 e b = 2, 0
em que E (Y
q
) o q-simo momento de Y
q
pode ser derivada de (5.11) emtermos da qf da base Q
G
(x; ) =
G
1
(x; ). Obtm-se
q
=
j,r,t=0
j,r,t
q
(j, r, t), (5.12)
em que
q
(j, r, t) dado por
q
(j, r, t) = (j + r + t + 1)
1
0
Q
G
(u; )
q
u
j+r+t+1
du. (5.13)
Os momentos ordinrios de vrias distribuies MONB podem ser determinados direta-
mente das equaes (5.11) e (5.12). Para a distribuio Marshall-Olkin binomial negativa ex-
81
ponencial (MONBE) (com parmetro > 0), tem-se
q
= (1)
q
j,r,t=0
j,r,t
j,r,t,q
,
em que
j,r,t,q
= (j + r + t + 1)
q
z
q
B(j + r + t + 1, z j r t)
z=j+r+t+1
e B(, ) a
funo beta.
A mgf M(t) = E
(
e
t X
)
de X segue de (5.7) como
M(t) =
j,r,v=0
j,r,v
M
j+r+v+1
(t; ), (5.14)
em que M
(t; ) a mgf de Y
j,r,v=0
j,r,v
j,r,v
(t; ),
em que
j,r,v
(t; ) = (j + r + v + 1)
1
0
exp [t Q
G
(u; )] u
j+r+v
du. (5.15)
A mgf da distribuio MONBE dada por (para t < 1)
M(t) =
j,r,v=0
(j + r + v + 1) B(1 t, j + r + v + 1).
5.6 Desvios mdios
Os desvios mdios sobre a mdia (
1
) e sobre a mediana (
2
) de X podem ser expressos como
1
= E(|X
1
|) = 2
1
F(
1
) 2T(
1
) e
2
= E(|X M|) =
1
2T(M), (5.16)
respectivamente, em que
1
= E(X), M = Median(X) denota a mediana, F(
1
) segue
de (5.3) e T(z) =
j,r,t=0
j,t,r
T
j,r,t
(z), (5.17)
em que a integral T
j,r,t
(z) pode ser expressa em termos de Q(u) = G
1
(u) por
T
j,r,t
(z) = (j + r + t + 1)
G(z;)
0
Q
G
(u; ) u
j+r+t
du. (5.18)
Os desvios mdios de X podem ser calculados das equaes (5.16)-(5.18). Por exemplo, os
desvios mdios do modelo MONBE (com parmetro ) imediatamente calculado da funo
T
j,r,t
(z) =
(e
z
1)
j+r+t+1
e
(j+r+t+1)
(j + r + t + 1) (j + r + t + 2)
log
(
e
z
+ j + r + t + 1
)
.
82
Um representao alternativa para T(z) pode ser encontrada de (5.7) como
T(z) =
xf(x)dx =
j,r,t=0
j,r,t
J
j,r,t
(z), (5.19)
em que
J
j,r,t
(z) =
xh
j+r+t+1
(x; ) dx. (5.20)
A equao (5.20) representa a quantidade bsica para calcular os desvios mdios das distribui-
es exp-G. Portanto, os desvios mdios da MONB-G dependem somente dos desvios mdios
da distribuio exp-G.
Uma aplicao simples fornecida para a distribuio MONBW. A Weibull exponenciali-
zada com parmetro de potncia j
a b
a
x
a1
exp{(b x)
a
}[1 exp{(b x)
a
}]
j
1
e, ento,
J
j,r,t
(z) = (j + r + t + 1) a b
a
z
0
x
a
exp{(b x)
a
}[1 exp{(b x)
a
}]
j+r+t
dx
= (j + r + t + 1) a b
a
k=0
(1)
k
(
j + r + t
k
)
z
0
x
a
exp{(k + 1)(b x)
a
}dx.
Pode-se calcular a ltima integral usando a funo gama incompleta, para > 0, (, x) =
x
0
w
1
e
w
dw, e, ento,
J
j,r,t
(z) = (j + r + t + 1) a b
a
k=0
(1)
k
(
j+r+t
k
)
(k + 1)
1+a
1
(1 + a
1
, (k + 1)(z)
a
).
As equaes (5.17) e (5.19) so os principais resultados desta seo. Uma aplicao dessas
equaes pode ser a obteno das curvas de Bonferroni e de Lorenz denidas para uma dada
probabilidade p por B(p) = T(q)/(p
1
) e L(p) = T(q)/
1
, respectivamente, em que
1
=
E(X) e q = F
1
(p).
5.7 Entropias
A entropia de uma varivel aleatria X com funo densidade f(x) uma medida da vari-
ao da incerteza. A entropia de Shannon denida por E{log[f(X)]}. Suponha X
MONB-G(s, p, , ). Ento,
E{log[f(X)]} = log
[
s p
(1 )
s
1
]
E {log [g(X; )]}
+(s 1)E
(
log
{
1 [1 p (1 )] G(X; )
})
(s 1)E
{
log
[
1 (1 p) G(X; )
]}
. (5.21)
83
As trs esperanas em (5.21) podem ser expressas como
E {log [g(X; )]} =
log[g(x; )] f(x) dx =
j,r,t=0
j
j,r,t
I
j,r,t
,
E
(
log
{
1 [1 p ] G(X; )
})
=
j,r,t=0
j
j,r,t
(1 p ) (j
)
2
F
1
(1, 1; j
+ 2; 1 p ),
com p = 1 e
E
{
log
[
1 (1 p) G(X; )
]}
=
j,r,t=0
j
j,r,t
(1 p) (j
)
2
F
1
(1, 1; j
+ 2; 1 p).
Aqui, j
= j + r + t + 1, I
j,r,t
= I
j,r,t
(u) =
1
0
log {g [Q(u; )]} u
j+r+t
du, g [Q(u; )]
a funo densidade aplicada a quantlica e
p
F
q
a funo hipergeomtrica regularizada que
dada por
p
F
q
(a
1
, . . . , a
p
; b
1
, . . . , b
q
; z) =
p
F
q
(a; b; z)/[(b
1
) . . . (b
q
)]. Assim, segue a partir da
equao (5.21)
E{log[f(X)]} = log
[
s p
(1 )
s
1
]
+
j,r,t=0
j
j,r,t
(5.22)
{
I
j,r,t
(s 1) (1 p ) (j
)
2
F
1
(1, 1; j
+ 2; 1 p )
+ (s 1)(1 p) (j
)
2
F
1
(1, 1; j
+ 2; 1 p)
}
.
Outra medida de entropia popular a entropia de Rnyi dada por
J
R
(c) =
1
1 c
log
[
f
c
(x)dx
]
, c > 0, c = 1. (5.23)
A integral pode ser expressa como
f
c
(x) dx =
[
s p
(1 )
s
1
]
c
g(x, )
c
[
1 (1 p)G(x; )
]
c (s1)
{
1 [1 p(1 )] G(x; )
}
c (s+1)
dx,
expandindo os binmios e modicando a varivel
J
R
(c) =
1
1 c
log
{
[
s p
(1 )
s
1
]
c
i,j=0
i,j
J
i,j
}
, (5.24)
em que
i,j
=
i,j
(c) = (1)
i+j
[1p (1)]
i
(1p)
j
(
c (s+1)
i
) (
c (s1)
j
)
e J
i,j
= J
i,j
(c, u) =
1
0
g[Q(1 u; )]
c1
u
i+j
du. Para o modelo MONBW com parmetros a > 0 e b > 0, obtm-
se
J
R
(c) =
1
1 c
log
{
[
s p
(1 )
s
1
]
c
i,j,k=0
(c 1)
k
k!
i,j
T
i,j,k
}
,
em que T
i,j,k
= T
i,j,k
(c, a, b) = (1)
(1+) (i +j +1)
(+1)
(para b+a k +(a1)(c1) >
1) e = [a k + (a 1)(c 1)]/b. As equaes (5.22) e (5.24) so os principais resultados
desta seo.
84
5.8 Estatsticas de ordem
Estatsticas de ordem aparecem em diversas reas da estatstica terica e prtica. A funo
densidade f
i:n
(x) da i-sima estatstica de ordemX
i:n
, para i = 1, . . . , n, de variveis aleatrias
i.i.d., X
1
, . . . , X
n
, com qualquer distribuio MONB, simplesmente dada por
f
i:n
(x) =
n!
(i 1)!(n i)!
ni
j=0
(1)
j
(
n i
j
)
f(x) F(x)
j+i1
.
Percontini, Cordeiro e Bourguignon (2013) demonstram que
f
i:n
(x) =
r,k=0
ni
j=0
m
r,k,j
h
r+k+j+i
(x), (5.25)
em que
m
r,k,j
=
(1)
j
i (r + 1)
r,k
j+i1,k
(r + k + j + i)
(
n
i
)(
n i
j
)
.
Substituindo h
r+k+j+i
(x) pela densidade da MO-exponencializada com parmetro r + k +
j + i e expandindo os binmios, a densidade da i-sima estatstica de ordem da distribuio
MONB reduz-se a
f
i:n
(x) =
r,k,t=0
ni
j=0
t
l=0
r,k,j,i,t,l
h
r+k+j+i+l
(x; ), (5.26)
em que
r,k,j,i,t,l
=
(1)
l+t
p (1 p)
t
(r + k + j + i)
(r + k + j + i + l)
(
r + k + j + i + t
t
)
m
r,k,j
e h
(x, ) a pdf de Y
Exp-G(; ).
O m-simo momento da estatstica de ordem X
i:n
pode ser expresso como
E(X
m
i:n
) =
r,k,t=0
ni
j=0
t
l=0
r,k,j,i,t,l
m
(r, k, j, i, l), (5.27)
em que
m
(r, k, j, i, l) = (r +k +j +i +l)
1
0
Q
G
(u; )
m
u
r+k+j+i+l
du podem ser computados
numericamente.
A mgf de X
i:n
podem ser obtidas de (5.26) como
M
i:n
(t) =
r,k,v=0
ni
j=0
v
l=0
r,k,j,i,v,l
r,k,j,i,l
(t; ), (5.28)
em que
r,k,j,i,l
(t; ) = (r + k + j + i + l)
1
0
exp [t Q
G
(u; )] u
r+k+j+i+l1
du podem ser
computadas numericamente. As quantidades E(X
m
i:n
) e M
i:n
(t) para a distribuio MONBE
com parmetro > 0 (para t <
1
) seguem das equaes (5.27) e (5.28) como
E(X
m
i:n
) = m!
m
r,k,t,v=0
ni
j=0
t
l=0
r,k,j,t,l
(1)
m+v
(v + 1)
m+1
(
r + k + j + i
v
)
85
e
M
i:n
(t) =
r,k,v=0
ni
j=0
v
l=0
r,k,j,v,l
B(r + k + j + i + 1, 1 t),
respectivamente. Algumas propriedades matemticas das estatsticas de ordem da MONB in-
cluindo momentos, momentos fatoriais e inversos, mgf, desvios mdios e curvas de Bonferroni
e de Lorenz podem ser derivadas da equao (5.26) pelas conhecidas propriedades da distribui-
o Exp-G.
5.9 Estimao
Adota-se o mtodo de mxima verossimilhana para estimar os parmetros do modelo. O lo-
garitmo da funo de verossimilhana, (), de uma amostra x
1
, . . . , x
n
of X com pdf (5.4)
dado por
() = n
[
log(s) + log(p) + log() log{[(1 )
s
1]}
]
(5.29)
+
n
i=1
log [g(x
i
; )] (s + 1)
n
i=1
log
{
1 G(x
i
; )[1 p(1 )]
}
+ (s 1)
n
i=1
log
[
1 (1 p)G(x
i
; )
]
,
em que um vetor p 1 de parmetros desconhecidos da distribuio base G(x; ).
A expresso (5.29) pode ser maximizada diretamente usando o software R (pacote bbmle)
ou pela resoluo das equaes no-lineares de verossimilhana obtidas pela diferenciao de
(5.29). Os componentes do vetor escore U() so dados por
U
s
() = n
[
1
s
+
log(1 )
1 (1 )
s
]
i=1
log
{
1 G(x
i
; )[1 p(1 )]
}
+
n
i=1
log
[
1 (1 p)G(x
i
; )
]
,
U
p
() =
n
p
(s + 1)
n
i=1
(1 ) G(x
i
; )
1 G(x
i
; )[1 p (1 )]
+ (s 1)
n
i=1
G(x
i
; )
1 (1 p) G(x
i
; )
,
U
() =
n
ns
( 1) [(1 )
s
1]
+ (s + 1)
n
i=1
p G(x
i
; )
1 G(x
i
; )[1 p (1 )]
e
86
U
j
() =
n
i=1
g(x
i
; )/
j
g(x
i
; )
(s + 1)
n
i=1
[1 p(1 )] G(x
i
; )/
j
1 G(x
i
; )[1 p (1 )]
(s 1)
n
i=1
(1 p) G(x
i
; )/
j
1 (1 p) G(x
i
; )
,
para j = 1, . . . , p. Para estimao intervalar e testes de hipteses sobre os parmetros do
modelo, a matriz de informao observada requerida. Os (p + 3) (p + 3) elementos da
matriz de informao observada so dados no Apndice APNDICE D - .
Sob certas condies que so satisfeitas para os parmetros no interior do espao param-
trico, mas no sobre a fronteira, a distribuio normal multivariada N
p+3
(0, J(
)
1
), em que
J(
B(a/c, b)
e
(x)
[
1 e
(x)
]
a1
{
1
[
1 e
(x)
]
c
}
b1
,
87
e a distribuio BBXII (PARANABA et al., 2013) tem pdf (para x 0)
f(x; a, b, s, k, c) =
c k x
c1
s
c
B(a, b) [1 + (x/s)
c
]
k b1
{
1 [1 + (x/s)
c
]
k
}
a1
.
Na Tabela 5.2 so apresentadas as estimativas de mxima verossimilhana (MLEs) e os cor-
respondentes erros padro estimados (SEs), os valores das estatsticas critrio de informao de
Akaike (AIC) (AKAIKE, 1974), critrio de informao de Akaike corrigido (CAIC) (BOZDO-
GAN, 1987) e critrio bayesiano de Schwarzs (BIC) (SCHWARZ, 1978) para os dados atuais.
Os trs critrios de informao indicam uma possvel classicao para os modelos. O me-
nor valor desses critrios so para a distribuio MONBFr que pode ser escolhida como mais
adequada nesse caso.
Tabela 5.2 MLEs, correspondentes SEs (dados entre parnteses) e as estatsticas AIC, BIC e
CAIC para as resistncias medidas em GPA
Distribuio s p a b AIC CAIC BIC
MONBGa 12,3033 0,4627 0,0001 26,3423 0,1263 123,0602 124,1128 133,7758
(0,1761) (4,0827) (1,3355) (4,5385) (0,0276)
MONBFr 19,4494 21,9129 0,5387 3,9315 2,9039 121,9879 123,0405 132,7035
(16,1003) (28,2683) (0,4824) (2,2013) (0,9094)
MONBLL 7,8028 4,8313 0,0003 2,4950 8,6457 125,6897 126,7423 136,4054
(0,0350) (110,6903) (0,3259) (6,6226) (0,8903)
MONBW 3,9801 0,0282 0,0128 0,2163 8,3418 125,0002 126,0529 135,7159
(0,0039) (0,0633) (0,6311) (0,0324) (1,0050)
Distribuio a b c AIC CAIC BIC
McW 76,1084 1,6927 0,2581 1,2688 1,0471 122,6394 123,6920 133,3550
(0,0687) (3,4804) (0,0253) (0,2945) (0,6390)
Distribuio a b s k c AIC CAIC BIC
BBXII 27,5702 16,3410 1,5690 0,6566 1,9694 122,6825 123,7351 133,3982
(77,2675) (6,7441) (2,4389) (1,3294) (2,8207)
Alm disso, so calculadas as estatsticas de qualidade de ajuste de Cramr-von Mises (W
)
e de Anderson-Darling (A
e A
e A
para os cinco modelos ajustados so dados na Tabela 5.3. Com base nestes valores, o
modelo MONBFr ajusta-se aos dados melhor do que os outros quatro modelos e, ento, pode
ser escolhido como o melhor modelo.
Tabela 5.3 Estatsticas de qualidade de ajuste para os modelos ajustados
Modelo W
p-value A
(a + b)
(a)], J
ab
= n
(a + b), J
ac
= c
n
i=1
u
i
,
J
a
=
c
i=1
u
i
, J
a
=
c
i=1
z
i
u
i
, J
bb
= n[
(a + b)
(b)],
J
bc
=
n
i=1
[
u
i
t
i
1 t
i
]
, J
b
=
c
i=1
[
u
i
t
i
1 t
i
]
, J
b
=
c
i=1
[
z
i
u
i
t
i
1 t
i
]
,
J
cc
=
n
c
2
+ (b 1)
n
i=1
[
u
2
i
t
i
(1 t
i
)
2
]
,
J
c
=
a
i=1
u
i
(b 1)
i=1
[
u
i
t
i
(1 t
i
c u
i
)
(1 t
i
)
2
]
,
J
c
=
a
i=1
z
i
u
i
(b 1)
i=1
[
z
i
u
i
t
i
(1 t
i
c u
i
)
(1 t
i
)
2
]
,
J
=
ac
2
n
i=1
u
i
+
c(b 1)
2
n
i=1
[
u
i
t
i
(1 t
i
c u
i
)
(1 t
i
)
2
]
,
J
=
n
2
+
ac
2
n
i=1
[(1 z
i
) u
i
]
c(b 1)
2
n
i=1
{
u
i
t
i
[(1 z
i
)(1 t
i
) + c z
i
u
i
]
(1 t
i
)
2
}
e
J
=
n
2
2
2
n
i=1
z
i
+
ac
2
n
i=1
[z
i
(2 z
i
) u
i
]
c(b 1)
2
n
i=1
{
z
i
u
i
t
i
[(2 z
i
)(1 t
i
) + c z
i
u
i
]
(1 t
i
)
2
}
.
96
APNDICE B - Integral
Tem-se o seguinte resultado que vale para m e k inteiros positivos, > 1 e p > 0 (PRUDNI-
KOV; BRYCHKOV; MARICHEV, 1992, pag. 21)
I
(
p, ,
m
k
,
)
=
0
exp(px) x
(1 + x
m
k
)
dx
=
k
m
+
1
2
(2)
(m1)
2
()p
+1
G
k,k+m
k+m,k
(
m
m
p
m
(m, ), (k, + 1)
(k, 0)
)
, (1)
em que (k, a) =
a
k
,
a+1
k
, ,
a+k
k
e a funo Meijer G denida na Seo 4.3.
97
APNDICE C - Matriz de informao observada da distribuio GBXII
Os elementos da matriz de informao observada J() para os parmetros (a, s, k, c) da GBXII
so
J
aa
() = n
(a)
iC
G
3,0
2,3
(
log[u
i
]
1, 1
0, 0, a
)
2
2 Q(a, log[u
i
]) G
4,0
3,4
(
log[u
i
]
1, 1, 1
0, 0, 0, a
)
Q(a, log[u
i
])
2
,
J
as
() =
c
s
iF
[
u
i
1
u
i
log(u
i
)
]
c
s
iC
(u
i
1) G
3,0
2,3
(
log[u
i
]
a, a
a 1, a 1, 2a 1
)
u
2
i
Q(a, log[u
i
])
2
,
J
ak
() =
r
k
, J
ac
() =
iF
[
v
i
u
i
log(u
i
)
]
+
iC
v
i
G
3,0
2,3
(
log[u
i
]
a, a
a 1, a 1, 2a 1
)
u
2
i
Q(a, log[u
i
])
2
,
J
ss
() =
r c
s
2
+
c (k + 1)
s
2
iF
[
c +u
i
u
2
i
]
c (a 1)
s
2
iF
{
(u
i
1) [c(u
i
1) (u
i
+c) log(u
i
)]
u
2
i
log(u
i
)
2
}
c
s
2
iC
(u
i
1) log(u
i
)
a2
u
4
i
Q(a, log[u
i
])
2
{c (u
i
1) [Q(a, log[u
i
])u
i
(a 1 2 log[u
i
] +u
i
(c + 1) log[u
i
]) + log(u
i
)
a
]},
J
sk
() =
iF
u
i
1
u
i
,
J
sc
() =
r
s
(k + 1)
s
iC
{
(u
i
1)[u
i
+c log(u
i
1)]
u
2
i
}
+
(a 1)
s
iC
{
(u
i
1)[c v
i
log[u
i
](u
i
+c log[u
i
1])]
u
2
i
log(u
i
)
2
}
+
iF
(u
i
1) log(u
i
)
a2
s u
4
i
Q(a, log[u
i
])
2
{c v
i
log(u
i
)
a
+u
i
log(u
i
)[u
i
c(u
i
2) log(u
i
1)] c(a 1)v
i
Q(a, log[u
i
])},
98
J
kk
() =
r a
k
2
, J
kc
() =
iF
v
i
u
i
,
e
J
cc
() =
iC
v
2
i
(u
i
1)
c1
log[u
i
]
a2
u
4
i
Q(a, log[u
i
])
{u
i
Q(a, log[u
i
]) [u
i
log(u
i
) + (u
i
1)
a
(a 1 2 log[u
i
])] + (u
i
1) log[u
i
]
a
} ,
em que u
i
= 1 + (x
i
/s)
c
, v
i
= (x
i
/s)
c
log[(x
i
/s)
c
], (s) = d log (s)/ds a funo digama,
Q(a, x) =
x
t
a1
e
t
dt a funo gama incompleta e G
m,n
p,q
(|) a funo Meijer G denida
na Seo 4.3.
99
APNDICE D - Matriz de informao observada da famlia MONB-G
Os elementos da matriz de informao observada J() para os parmetros (s, p, , ) da distri-
buio MONB-G so
J
ss
=
n {s
2
(1 )
s
log(1 )
2
[(1 )
s
1]
2
}
s
2
[(1 )
s
1]
2
,
J
sp
=
n
i=1
G(x
i
; )
1 (1 p) G(x
i
; )
i=1
(1 ) G(x
i
; )
1 G(x
i
; ) [1 p(1 )]
,
J
s
= n
{
1 + (1 )
s
[s log(1 ) 1]
(1 ) [(1 )
s
1]
2
}
+
n
i=1
p G(x
i
; )
1 G(x
i
; ) [1 p(1 )]
,
J
s
j
=
n
i=1
(1 p) G(x
i
; )/
j
1 (1 p) G(x
i
; )
i=1
[1 p(1 )] G(x
i
; )/
j
1 G(x
i
; )[1 p(1 )]
,
J
pp
=
n
p
2
+ (s + 1)
n
i=1
(1 )
2
G(x
i
; )
2
{
1 G(x
i
; ) [1 p(1 )]
}
2
(s 1)
n
i=1
G(x
i
; )
2
[1 (1 p) G(x
i
; )]
2
,
J
p
=
n
i=1
G(x
i
; ) {2 p (1 ) G(x
i
; ) + G(x
i
; )}
{
p(1 ) G(x
i
; ) + G(x
i
; )
}
2
,
J
p
j
= (s + 1)
n
i=1
(1 ) G(x
i
; )/
j
{
p(1 ) G(x
i
; ) + G(x
i
; )
}
2
(s 1)
n
i=1
G(x
i
; )/
j
[p + (1 p) G(x
i
; )]
2
,
J
=
ns [(s + 1)(1 )
s
1]
(1 )
2
[1 (1 )
s
]
2
+ (s + 1)
n
i=1
p
2
G(x
i
; )
{
1 G(x
i
; )[1 p(1 )]
}
2
,
J
j
= (s + 1)
n
i=1
p G(x
i
; )/
j
{
p(1 ) G(x
i
; ) + G(x
i
; )
}
2
100
e
J
j
=
n
i=1
g(x
i
; ) g(x
i
; )/
j
[
2
g(x
i
; )/
j
]
2
g(x
i
; )
2
(s 1)
n
i=1
(1 p)
{
(1 p)
[
p G(x
i
; ) + G(x
i
; )
] }
.