Anda di halaman 1dari 101

Tese apresentada para obteno do ttulo de Doutora

em Cincias. rea de concentrao: Estatstica e


Experimentao Agronmica
Universidade de So Paulo
Escola Superior de Agricultura Luiz de Queiroz









Algumas novas distribuies: desenvolvimento e aplicaes










Edleide de Brito



















Piracicaba
2014


Orientadora:
Profa. Dra. CLARICE GARCIA BORGES DEMTRIO
Coorientador: Prof.Dr. JARBAS H ONORIO
Prof. Dr. GAUSS MOUTINHO CORDEIRO




Tese apresentada para obteno do ttulo de Doutora
em Cincias. rea de concentrao: Estatstica e
Experimentao Agronmica
Edleide de Brito
Bacharel em Estatstica











Algumas novas distribuies: desenvolvimento e aplicaes



































Piracicaba
2014


































Dados Internacionais de Catalogao na Publicao
DIVISO DE BIBLIOTECA - DIBD/ESALQ/USP


Brito, Edleide de
Algumas novas distribuies: desenvolvimento e aplicaes / Edleide de
Brito. - - Piracicaba, 2014.
100 p: il.
Tese (Doutorado) - - Escola Superior de Agricultura Luiz de Queiroz, 2014.

1. Distribuio Burr XII 2. Distribuio Gumbel 3. Distribuio Marshall-Olkin
4. Matriz de informao observada 5. Mxima verossimilhana I. Ttulo
CDD 519.532
B862a





Permitida a cpia total ou parcial deste documento, desde que citada a fonte -O autor

3
DEDICATRIA
minha mame Arcanja, aos meus irmos Elisngela e
Jorge, ao meu sobrinho Luis Philippe e ao meu amado
Angelo.
4
pular pagina
5
AGRADECIMENTOS
Agradeo primeiramente a Deus, por me fazer crer no Seu amor e na Sua justia e por ter
me guiado e encorajado na busca de mais um sonho.
Agradecimento especial a minha famlia que, mais uma vez, compreendeu a minha ausn-
cia. A minha mame Arcanja por ter me apoiado, incondicionalmente, desde o princpio desta
jornada e pelas oraes e incentivos constantes. Aos meus irmos Elisngela e Jorge Lus pelo
carinho, apoio e incentivo. Obrigada ao meu sobrinho Luis Philippe pelos momentos de carinho
e alegria. Obrigada famlia amada por compreender a minha necessidade de ir em busca deste
sonho.
Ao meu querido noivo Angelo, companheiro de vida, agradeo imensamente pelo amor,
carinho, pacincia e incentivo, por entender minhas prioridades e me apoiar sempre. Obrigada
meu Amor.
Maria Pereira de Jesus (in memorian), minha tia-av, lembrana sempre presente de ale-
grias e saudades eternas.
Ao Professor Gauss Cordeiro pela sabedoria, pelo exemplo, pela dedicao, pelo apoio
fundamental na minha vida acadmica e prossional. Agradeo pelos inmeros ensinamentos
e pela conana depositada em mim. Meu eterno carinho e gratido.
A minha orientadora Professora Clarice Demtrio pela orientao, conana, conselhos e
apoio em todas as situaes. Muito obrigada por tudo, seu apoio foi fundamental para concre-
tizar este sonho.
Aos Professores Audrey Cysneiros, Cristian Villegas e Taciana Villela Savian pelas valiosas
sugestes e contribuies durante o exame de qualicao.
Aos funcionrios do Departamento de Cincias Exatas da ESALQ/USP Eduardo Bonilha,
Jorge Wiendl e Mayara Segato. Agradecimento especial as secretrias Luciane Brajo e Solange
Sabadin por terem me ajudado, principalmente quando eu no estava em Piracicaba.
A todos os colegas do programa de ps-graduao do Departamento de Cincias Exatas da
ESALQ/USP, nomeadamente a Ana Patricia Bastos Peixoto, Elizabeth Mie Hashimoto, Mariana
Urbano, Renata Alcarde e Simone Sartrio.
Aos amigos que conquistei durante minha temporada na Universidade Federal de Pernam-
buco, nomeadamente, Ana Percontini, Frank Sinatra, Jymmy Barreto, Luz Milena, Manoel
Wallace, Poema Isis e Ronaldo Venncio: obrigada pelos momentos de descontrao e apren-
dizado.
6
Preciso agradecer especialmente a amiga/irm que ganhei na temporada recifense: Fernanda
Di Bastiani. Muito obrigada pelas palavras tranquilizadoras, pela companhia, por me compre-
ender e me ajudar em momentos cruciais. Friends forever!
A Universidade Federal da Bahia pelo apoio nanceiro e aos colegas do Departamento de
Estatstica pelo incentivo. Agradeo especialmente a amiga Giovana Oliveira pela sua contri-
buio como co-autora de dois dos artigos e por me tranquilizar quando o desespero aparecia.
A todos os professores que contriburam com a minha formao estatstica desde a gradua-
o na UFBA, passando pelo mestrado na UFRPE e chegando ao doutorado na ESALQ/USP.
Ao CNPq pela concesso de bolsa de estudos durante parte desta jornada.
A todos que, de forma direta ou indireta, contriburam para que este sonho fosse concreti-
zado. Foi uma jornada longa e cheia de contratempos, mas com a minha f em Deus e o apoio
da famlia, dos amigos e dos meu orientadores, consegui superar as adversidades. Obrigada a
todos!
7
Eis o amor de Deus: que guardemos seus mandamentos. E seus mandamentos no so
penosos, porque todo o que nasceu de Deus vence o mundo. E esta a vitria que vence o
mundo: a nossa f.
I So Joo, 5:3-4
8
pular pagina
9
SUMRIO
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 REVISO BIBLIOGRFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1 Anlise de sobrevivncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Distribuio Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.3 Distribuio Burr XII . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4 Classes de distribuies generalizadas . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.4.1 Classe de distribuies exponencializadas . . . . . . . . . . . . . . . . . . . . . . 21
2.4.2 Classe de distribuies Marshall-Olkin . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.3 Classe de distribuies gama . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4.4 Classe de distribuies McDonald . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.4.5 Classe de distribuies binomial negativa . . . . . . . . . . . . . . . . . . . . . . 24
2.5 Estimao e inferncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.1 Estimao por mxima verossimilhana . . . . . . . . . . . . . . . . . . . . . . . 24
2.5.2 Estatsticas AIC, BIC, CAIC, W

e A

. . . . . . . . . . . . . . . . . . . . . . . . 25
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3 O MODELO McDONALD GUMBEL . . . . . . . . . . . . . . . . . . . . . . . . . 31
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2 O Modelo McDonald Gumbel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3 Expanses teis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.4 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.5 Funo geradora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6 Funo quantlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.7 Desvios mdios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.8 Entropia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.9 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.10Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.10.1Aplicao 1: Dados de vazo mnima . . . . . . . . . . . . . . . . . . . . . . . . 45
3.10.2Aplicao 2: Dados de inundaes . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.11Consideraes nais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4 DISTRIBUIO GAMA BURR XII: TEORIA E PRTICA . . . . . . . . . . . . . 51
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
10
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.2 Expanses para a pdf e para a cdf . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
4.3 Momentos e Funo Geradora . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4 Funo Quantlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.5 Desvios Mdios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.6 Conabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4.7 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
4.8 Aplicaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.8.1 Aplicao 1: Dados de quebra por tenso . . . . . . . . . . . . . . . . . . . . . . 64
4.8.2 Aplicao 2: Dados de tempo de remisso . . . . . . . . . . . . . . . . . . . . . . 65
4.9 Concluses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
5 FAMLIA MARSHALL-OLKIN BINOMINAL NEGATIVA: TEORIA E APLICA-
O . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
Abstract . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Distribuies especiais MONB-G . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.2.1 Distribuio Marshall-Olkin binomial negativa gama (MONBGa) . . . . . . . . . 73
5.2.2 Distribuio Marshall-Olkin binomial negativa Frchet (MONBFr) . . . . . . . . 73
5.2.3 Distribuio Marshall-Olkin binomial negativa log-logstica (MONBLL) . . . . . 74
5.2.4 Distribuio Marshall-Olkin binomial negativa Weibull (MONBW) . . . . . . . . 77
5.3 Expanses teis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.4 Funo quantlica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.5 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.6 Desvios mdios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.7 Entropias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5.8 Estatsticas de ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
5.9 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
5.10Aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
5.11Consideraes nais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
Referncias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
6 CONSIDERAES FINAIS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.1 Concluso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Pesquisas futuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
APNDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
11
RESUMO
Algumas novas distribuies: desenvolvimento e aplicaes
Nos ltimos anos, diversos autores tm concentrado seus esforos na generalizao de dis-
tribuies de probabilidades obtendo, dessa forma, maior exibilidade e, consequentemente,
ganho na anlise de dados e na capacidade de incorporar um grande nmero de sub-modelos
nas distribuies generalizadas. Neste trabalho, sero apresentadas duas novas distribuies de
probabilidade: McGumbel e gama Burr XII; e uma nova famlia de distribuies de probabi-
lidade: Marshall-Olkin binomial negativa. Algumas propriedades das novas distribuies so
apresentadas e o mtodo de mxima verossimilhana foi utilizado para estimar os parmetros
dos modelos propostos.
Palavras-chave: Distribuio Burr XII; Distribuio Gumbel; Distribuio Marshall-Olkin; Ma-
triz de informao observada; Mxima verossimilhana
12
pular pagina
13
ABSTRACT
The new distributions: development and applications
In recent years, several authors have concentrated their efforts on the generalization of pro-
bability distributions obtained in this way more exibility and hence gain in data analysis and
the ability to incorporate a large number of sub-models in the generalized distributions. In this
work, two new probability distributions will be presented: MacDonald Gumbel and gamma
Burr XII; and a new family of probability distributions: negative binomial Marshall-Olkin.
Some properties of the new distributions are presented and the method of maximum likelihood
was used to estimate the parameters of the proposed models.
Keywords: Burr XII distribution; Gumbel distribution; Likelihood maximum; Marshall-Olkin
distribution; Observed information matrix
14
pular pagina
15
1 INTRODUO
Esta tese apresenta duas novas distribuies de probabilidade e uma nova classe de distribui-
es. Cada distribuio ou classe de distribuio apresentada na forma de artigo e, portanto,
cada captulo pode ser lido de forma independente.
Alguns tpicos recorrentes nos captulos posteriores so brevemente apresentados no Cap-
tulo 2.
O Captulo 3 apresenta a nova distribuio McDonald Gumbel com cinco parmetros que
uma extenso da distribuio Gumbel. As aplicaes realizadas neste artigo mostraram que
a nova distribuio pode ser utilizada para selecionar modelos que so casos especiais desta
(BRITO et al., 2014).
A distribuio gama Burr XII introduzida no Captulo 4. Nesta generalizao, adiciona-se
um parmetro extra distribuio Burr XII proposta por Zimmer, Keats e Wang (1998). A nova
distribuio tem suporte nos reais positivos e pode ser utilizada em anlise de sobrevivncia ou
conabilidade. As aplicaes foram realizadas com dados censurados e no-censurados. Vale
ressaltar, que as reas de sobrevivncia e conabilidade, geralmente, apresentam dados censura-
dos. A nova distribuio proposta obteve melhor desempenho do que distribuies conhecidas
na literatura, tais como, Weibull, exponencial e log-logstica (BRITO et al., 2014).
No Captulo 5, uma nova classe de distribuies proposta por Percontini, Cordeiro e Bour-
guignon (2013) utilizada para compor a classe de distribuies Marshall-Olkin binomial nega-
tiva. A aplicao a dados reais mostrou que a nova classe bastante competitiva com modelos
conhecidos e com o mesmo nmero de parmetros (BRITO et al., 2014).
Referncias
BRITO, E. de; PERCONTINI, A.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The
Marshall-Olkin negative binomial family: theory and application. Studia Scientiarum
Mathematicarum Hungarica, Budapest, 2014a. In press.
BRITO, E. de; SILVA, G. O.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The gamma Burr XII
distribution: Theory and practice. Journal of Data Science, Taipei, 2014b. In press.
BRITO, E. de; SILVA, G. O.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The McDonald
Gumbel model. Communications Statistics, Theory and Methods, New York, 2014c. In
press.
PERCONTINI, A.; CORDEIRO, G. M.; BOURGUIGNON, M. The G-negative binomial
family: general properties and applications. Advances and Applications in Statistics, India,
v. 35, p. 127 160, 2013.
16
ZIMMER, W. J.; KEATS, J. B.; WANG, F. K. The Burr XII distribution in reliability analysis.
Journal of Quality Technology, Milwaukee, v. 30, p. 386394, 1998.
17
2 REVISO BIBLIOGRFICA
Nesta seo, sero apresentadas algumas classes de distribuies, as distribuies Gumbel e
Burr XII, a famlia Marshall-Olkin, o mtodo de mxima verossimilhana e alguns critrios
para seleo de modelos. Estes tpicos esto relacionados com as novas distribuies e classes
de distribuies apresentadas nesta tese.
2.1 Anlise de sobrevivncia
Considere um conjunto de dados cuja varivel resposta o tempo at a ocorrncia de um evento
de interesse. Esse tempo denotado por tempo de sobrevivncia ou tempo de falha e o conjunto
de observaes por dados de sobrevivncia (SILVA, 2008).
Os dados de sobrevivncia possuem suporte nos reais positivos, portanto, no razovel as-
sumir que tem distribuio normal, e, geralmente, apresentam assimetria positiva. Alm disso,
para alguns elementos em estudo pode no ser conhecido o tempo de interesse exato, mas ape-
nas que ocorre direita ou esquerda de um certo valor e nesse caso diz-se que a observao
censurada. As censuras ocorrem pois nem sempre possvel esperar que o evento de interesse
ocorra para todos os elementos em teste. A rea da estatstica que analisa esse tipo de dados
denominada de anlise de sobrevivncia (na rea de sade) ou conabilidade (na pesquisa
industrial).
Os tipos de censura so: direita, se o tempo de ocorrncia do evento de interesse est
direita do tempo registrado, esquerda, se o tempo registrado maior que o tempo de falha, e
intervalar, que acontece quando se sabe somente que o evento de interesse ocorreu em um certo
intervalo de tempo. Nesta tese, ser utilizada a censura direita, a mais frequente nos dados de
sobrevivncia.
O tempo de sobrevivncia uma varivel aleatria no-negativa e, em geral, contnua. A
funo taxa de falha (hrf) utilizada para representar o comportamento da varivel tempo de
sobrevivncia. Esta funo tem forma constante, crescente, decrescente ou no-montona, por
exemplo forma de U ou unimodal. Analisando a forma da hrf pode-se denir o modelo proba-
bilstico para o tempo de sobrevivncia.
Diversas novas distribuies generalizadas foram propostas recentemente para analisar da-
dos que possuem taxa de falhas no-montonas, pois as distribuies usuais em anlise de
sobrevivncia possuem taxas de falhas montonas (exponencial, Weibull e gama).
Uma importante funo em anlise de sobrevivncia a funo de sobrevivncia (sf) que
dada por
S(x) = P(X > x) = 1 F(x),
em que F(x) a cdf de uma varivel aleatria no-negativa. A correspondente funo taxa de
18
falha ou de risco dada por
(x) =
f(x)
S(x)
,
em que f(x) = d F(x)/d x. A Figura 2.1 mostra algumas das possveis formas da funo taxa
de falha.

T
a
x
a

d
e

f
a
l
h
a
Decrescente
Crescente
Constante
Banheira
Figura 2.1 Algumas formas da funo taxa de falha
2.2 Distribuio Gumbel
A distribuio Gumbel ou distribuio do valor extremo possui uma grande variedade de apli-
caes que envolvem problemas de engenharia (anlise de inundaes, uxo de rede, conabili-
dade de software, velocidade de ventos, entre outros) e fenmenos naturais (chuvas, velocidade
de ventos e poluio do ar, por exemplo). Kotz e Nadarajah (2000) descrevem dezenas de apli-
caes, tais como, teste de vida acelerado, terremotos e emisses radioativas (para mencionar
apenas algumas).
Ao analisar dados de sobrevivncia, muitas vezes conveniente trabalhar com o logaritmo
dos dados observados. Assim, se os dados tm distribuio Weibull, a distribuio Gumbel
aparece naturalmente quando analisamos o logaritmo das observaes (COLOSIMO; GIOLO,
2006).
De forma geral, a previso probabilstica da ocorrncia de eventos extremos de vital im-
portncia para o planejamento das atividades sujeitas a seus efeitos adversos, e uma das formas
de analisar esses eventos utilizar a distribuio Gumbel.
19
Seja X uma varivel aleatria com distribuio Gumbel, X Gumbel(, ), sua funo
densidade de probabilidade (pdf) dada por
g(x) =
1

exp
{

(x )

exp
[

(x )

]}
(2.1)
e a funo distribuio acumulada (cdf) dada por
G(x) = exp
{
exp
[

(x )

]}
(2.2)
em que x IR, IR e > 0. A moda de X , a mediana ln(ln 2), a mdia
+ e a varincia

2
6

2
em que denota a constante de Euler ( 0, 5772). A distribuio
Gumbel com = 0 e = 1 denominada Gumbel padro. A Figura 2.2 apresenta algumas
possveis formas da fdp (2.1).
2.3 Distribuio Burr XII
O sistema Burr de distribuies foi denido por Burr (1942). A distribuio Burr XII (BXII)
com trs parmetros, considerada em Zimmer, Keats e Wang (1998), uma distribuio comu-
mente encontrada para analisar dados de sobrevivncia e para modelar fenmenos com funes
de risco montonas e unimodais.
Shao (2004) discutiu o mtodo de estimao por mxima verossimilhana para a distribuio
BXII com trs parmetros.
A pdf de uma varivel aleatria X com distribuio Burr XII, X BXII(s, k, c) dada por
g(x) = c k s
c
x
c1
[
1 +
(
x
s
)
c
]
k1
,
e cdf por
G(x) = 1
[
1 +
(
x
s
)
c
]
k
,
em que k > 0 e c > 0 so parmetros de forma e s > 0 um parmetro de escala. O momento
de ordem q de X dado por

q
= E(X
q
) = s
q
k B(k q c
1
, q c
1
+ 1), c k > q. Na Figura
2.3, tm-se algumas formas possveis para a densidade da Burr XII.
2.4 Classes de distribuies generalizadas
Nos ltimos anos, diversos autores tm estudado generalizaes de distribuies. O crescente
interesse em generalizar distribuies ocorreu, principalmente, pelo grande avano computa-
cional. Uma das razes para generalizar uma distribuio conhecida porque a sua forma
generalizada exibiliza a distribuio de tal forma que possa modelar mais satisfatoriamente a
assimetria emdados observados, pois grande parte das generalizaes, envolvema adio de um
ou mais parmetros de forma distribuio base. O precursor em generalizar distribuies con-
tnuas foi Amoroso (1925) (gama generalizada). Recentemente, diversas classe de distribuies
20
x
f
(
x
)
10 5 0 5 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
= 0
= 1.0 (Gumbel padro)
= 2.0
= 3.0
x
f
(
x
)
5 0 5 10 15 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
= 2.0 e
= 5.0 e
= 0.5 e
= 10 e

= 3.0
= 3.0
= 4.0
= 4.0
Figura 2.2 Funo densidade da distribuio Gumbel para alguns parmetros xos
21
x
f
(
x
)
0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
s=5; k=3; c=4
s=1,2; k=8; c=0,8
s=9; k=5; c=3
s=1,2; k=1,4; c=0,8
s=7; k=3; c=2
Figura 2.3 Funo densidade da distribuio Burr XII para alguns parmetros xos
foram propostas, entre elas, a beta-G por Eugene, Lee e Famoye (2002), a Kumaraswamy-G
por Cordeiro e Castro (2011) e a famlia T-X por Alzaatreh, Lee e Famoye (2013).
Algumas das recentes generalizaes utilizadas nesta tese sero apresentadas, brevemente,
a seguir.
2.4.1 Classe de distribuies exponencializadas
A classe de distribuies exponencializadas foi proposta, inicialmente, por Gompertz (1825).
As propriedades e os mtodos de estimao dos parmetros da classe exponencializada (EXP-
G) tm sido estudados por diversos autores, tais como, Mudholkar e Srivastava (1993) (Weibull
exponencializada), Nadarajah (2011) (exponencial exponencializada), Nadarajah (2005) (Pa-
reto exponencializada), entre outros.
Seja G(x) a cdf de uma distribuio base e > 0 um nmero real positivo. Ento, a cdf de
uma varivel X com distribuio EXP-G, X EXP-G(), dada por
F(x) = G(x)

. (2.3)
A pdf associada a (2.3) pode ser escrita como
f(x) = g(x) G(x)
1
, (2.4)
22
em que g(x) = dG(x)/dx a pdf da distribuio base.
A famlia EXP-G, tem como caso especial a distribuio base quando = 1. Diversas
outras formar de generalizar distribuies, utilizamresultados da EXP-G, pois muitas expanses
para as pdf e cdf das novas distribuies so combinaes lineares das pdf e cdf da EXP-G.
Neste trabalho, ser observada a aplicao deste resultado para encontrar diversas propriedades
matemticas das novas distribuies e famlia proposta.
2.4.2 Classe de distribuies Marshall-Olkin
Marshall e Olkin (1997) introduziram um mtodo interessante de adicionar um novo parmetro
a uma distribuio base para obter uma famlia ampla de distribuies. Entretanto, eles no
investigaram propriedades matemticas gerais dessa famlia. Propriedades, tais como, momen-
tos e expanses para a funo densidade, foram apresentadas por Barreto-Souza, Lemonte e
Cordeiro (2013).
Para a cdf G(x) de uma distribuio base, a funo de sobrevivncia (sf) dada por G(x) =
P(X > x) = 1 G(x). A sf da famlia Marshall-Olkin (MO) denida por
F(x) =
p G(x)
1 p G(x)
, (2.5)
em que x IR, p > 0 e p = 1 p. A cdf e a pdf associada a (2.5) so dadas, respectivamente,
por
F(x) =
G(x)
1 p G(x)
(2.6)
e
f(x) =
p g(x)
[1 p G(x)]
2
. (2.7)
Se p = 1, temos que F(x) = G(x). Uma medida de conabilidade importante a taxa de
risco de uma distribuio, (x) = f(x)/F(x). Nanda e Das (2012) interpretaram que Marshall
e Olkin (1997) chamaram p de parmetro de inclinao, pois para p 1 a taxa de risco da
famlia MO inferior taxa de risco da distribuio base e para 0 < p < 1 a taxa de risco da
MO superior a da distribuio base. Diversas distribuies conhecidas foram generalizadas
utilizando a proposta de Marshall e Olkin (1997). Por exemplo, as distribuies MO-Weibull
(MARSHALL; OLKIN, 1997) e MO-beta (JOSE; ANCY; RISTI

C, 2009).
2.4.3 Classe de distribuies gama
A classe de distribuies gama utilizada nesta tese foi proposta por Zografos e Balakrishnan
(2009). Para uma distribuio base com cdf G(x), eles deniram a distribuio gama-G com
cdf dada por
F(x) =
1
(a)
(a, log [1 G(x)]) =
1
(a)

log[1G(x)]
0
t
a1
e
t
dt
23
e pdf por
f(x) =
1
(a)
{log[1 G(x)]}
a1
g(x),
em que a > 0 o parmetro de forma que exibiliza a nova distribuio. A classe gama-G
inclui a distribuio base como caso especial quando a = 1.
Mais recentemente, Nadarajah, Cordeiro e Ortega (2014) estudaram diversas propriedades
matemticas da gama-G, tais como funo quantlica, momentos ordinrios e incompletos, fun-
o geradora de momentos, desvios mdios, curas de Bonferroni e Lorenz, distribuio assint-
tica de valores extremos, entropias de Shannon e Rnyi, conabilidade e algumas propriedades
das estatsticas de ordem. Para demonstrar a aplicabilidade da nova classe, eles utilizaram
dados de falha de componentes mecnicos e estimaram por mxima verossimilhana os par-
metros das distribuies gama log-normal, gama log-logstica e gama Weibull. Diversas novas
distribuies, utilizando a classe gama-G de Zografos e Balakrishnan (2009) foram propostas
recentemente, por exemplo, gama Weibull exponencializada (PINHO; CORDEIRO; NOBRE,
2012), Zografos-Balakrishnan log-Logstica (RAMOS et al., 2013).
2.4.4 Classe de distribuies McDonald
Para qualquer cdf base G(x), Alexander et al. (2012) deniram uma nova famlia de distri-
buies denominadas beta-gerada generalizada ou McDonald-G (McG). A cdf da McG dada
por
F(x) = I
G
c
(x)
(a, b) =
1
B(a, b)

G
c
(x)
0

a1
(1 )
b1
d,
em que I
y
(a, b) = B(a, b)
1

y
0
w
a1
(1 w)
b1
dw a funo razo beta incompleta. E a pdf
correspondente
f(x) =
c
B(a, b)
g(x)G
ac1
(x) [1 G
c
(x)]
b1
,
em que a, b, c > 0, g(x) = dG(x)/dx e B(a, b) =

1
0
t
a1
(1 t)
b1
dt a funo beta.
Os trs parmetros de forma a, b e c tm como funo introduzir assimetria e curtose na
nova distribuio e variar o peso das caldas (TAHIR; NADARAJAH, 2014). Cordeiro, Hashi-
moto e Ortega (2014) mencionaram que os parmetros a e b so parmetros de assimetria e
relativamente controlam o peso nas caudas, mas no no pico da distribuio, mas o parmetro c
controla o pico.
A classe de distribuies McG inclui como casos especiais a distribuio base quando a =
b = c = 1, a classe de distribuies exponencializadas para b = c = 1, a classe de distribuies
estendidas quando a = c = 1, a classe de distribuies beta para c = 1 e quando a = 1 tem-se
a classe de distribuies Kumaraswamy.
Alexander et al. (2012) estudaram diversas propriedades matemticas da McG e zeram
aplicaes mostrando a ecincia dos modelos McDonald Weibull e McDonald normal. Esta
24
uma classe de distribuies recente e que j gerou algumas novas distribuies, tais como:
a distribuio McDonald beta invertida (CORDEIRO; LEMONTE, 2012), a McDonald Burr
XII (GOMES; da-SILVA; CORDEIRO, 2013), a McDonald Weibull modicada (MEROVCI;
ELBATAL, 2013), entre outras.
2.4.5 Classe de distribuies binomial negativa
Novos modelos envolvendo a binomial negativa foram propostos recentemente e aplicados em
anlise de sobrevivncia, por exemplo as distribuies Lindley binomial negativa (ZAMANI;
ISMAIL, 2010) e exponencial binomial negativa (HAJEBI; REZAEI; NADARAJAH, 2013).
Percontini, Cordeiro e Bourguignon (2013) propuseram a famlia binomial negativa genera-
lizada (GNB). Eles encontraram diversas propriedades matemticas da nova famlia que possui
cdf
F(x) =
(1 )
s
{1 [1 G(x)]}
s
[(1 )
s
1]
,
em que s > 0, 0 < < 1, G(x) a cdf base e g(x) = dG(x)/dx. A respectiva pdf dada por
f(x) =
s
[(1 )
s
1]
g(x) {1 [1 G(x)]}
s1
.
Esta generalizao adiciona dois parmetros a distribuio base, proporcionando maior e-
xibilidade a nova distribuio gerada. A distribuio base um caso especial da GNB quando
s = 1 e 0. Percontini, Cordeiro e Bourguignon (2013) utilizaram a Frchet binomial
negativa para demonstrar a exibilidade da nova classe ao analisar dados reais.
2.5 Estimao e inferncia
Neste trabalho, a estimao dos parmetros das distribuies foi feita utilizando-se o mtodo de
mxima verossimilhana. Este mtodo baseado na funo de verossimilhana e fornece uma
abordagem para a obteno de estimativas pontuais e intervalares, alm da construo de testes
de hipteses.
2.5.1 Estimao por mxima verossimilhana
Seja X
1
, . . . , X
n
uma amostra aleatria de observaes no-censuradas de tamanho n, em que
cada X
i
, i = 1, . . . , n, possui distribuio funo densidade f(x; ).
A funo de verossimilhana para o vetor de parmetros expressa por
L() =
n

i=1
f(x
i
; ).
A funo de verossimilhana L() mostra que a contribuio de cada observao no-
censurada a sua funo de densidade, olhada como funo do vetor de parmetros . A
contribuio de cada observao censurada no , contudo, a sua funo de densidade (CO-
LOSIMO; GIOLO, 2006). As observaes censuradas somente nos informam que o tempo de
25
falha maior que o tempo de censura observado e, portanto, que a sua contribuio para L()
a sua funo de sobrevivncia S(x), olhada como funo do vetor de parmetros . Neste caso,
as observaes podem ser divididas em dois conjuntos: F denota o conjunto das observaes
no-censuradas e C denota o conjunto das observaes censuradas.
Considere que os tempos de sobrevivncia e de censura so independentes e que a censura
a direita e no informativa (sua distribuio no depende dos parmetros de interesse). Nesse
contexto, a funo de verossimilhana expressa por
L() =

iC
f(x
i
; )

iF
S(x
i
; ).
Os estimadores de mxima verossimilhana so os valores de que maximizam L()
ou equivalentemente o logaritmo de L(), isto , () = log[L()]. Eles so encontrados
resolvendo-se o sistema de equaes
U() =
L()

= 0. (2.8)
Como, geralmente, esse sistema no linear, torna-se necessrio usar um algoritmo de
otimizao. Por exemplo, um algoritmo Newton-Raphson ou quase Newton (NOCEDAL;
WRIGHT, 2006; PRESS et al., 1992). As estimativas dos parmetros das distribuies apre-
sentadas nesta tese foram obtidas pela maximizao numrica de (). O pacote bbmle do
software estatstico R (R Development Core Team, 2008) foi utilizado para obter as estimativas
de mxima verossimilhanas para os vetores de parmetros das distribuies apresentadas.
A escolha dos valores iniciais muito importante em todos os procedimentos iterativos para
a estimativa dos parmetros. Neste trabalho, utilizaram-se as estimativas de mxima verossimi-
lhana da distribuio base e o mtodo grco para obter os valores iniciais.
Se o tamanho da amostra grande e sob certas condies de regularidade para a funo de
verossimilhana, intervalos de conana e testes de hipteses podem ser obtidos usando o fato
de que a distribuio assinttica para os estimadores de mxima verossimilhana a distribuio
normal com mdia e matriz de covarincia dada pelo inverso da matriz de informao de
Fisher (SEN; SINGER, 1993).
2.5.2 Estatsticas AIC, BIC, CAIC, W

e A

Dentre os principais critrios de seleo de modelos utilizados em programas computacionais


esto o critrio de informao de Akaike - AIC (AKAIKE, 1974), o critrio de informao de
Akaike corrigido - CAIC (BOZDOGAN, 1987) e o critrio de informao de Schwarz - BIC
(SCHWARZ, 1978), que so baseados no valor do logaritmo da funo de verossimilhana do
modelo e dependem do nmero de observaes e do nmero de parmetros .
O AIC pode ser calculado como
AIC = 2 () + 2 p,
26
em que p o nmero de parmetros estimados do modelo. Observa-se que dentre todos os
possveis modelos considerados, aquele que possuir o menor valor de AIC ser considerado o
modelo mais adequado. O BIC pode ser expresso por
BIC = 2() + p log(n).
Uma caracterstica do critrio BIC penalizar os modelos com um maior nmero de par-
metros, caracterizando a seleo de modelos com nmero menor de parmetros. O modelo com
menor BIC deve ser o escolhido. Bozdogan (1987) props a seguinte correo para o AIC
CAIC = AIC +
2 p (p + 1)
n p 1
.
O AIC pode ter um desempenho ruim se existirem muitos parmetros em comparao com o
tamanho da amostra. Segundo Burnham e Anderson (2004), o CAIC deve ser utilizado quando
a razo
n
p
pequena (
n
p
< 40). A escolha do modelo igual a do critrio AIC.
Outros dois critrios utilizados para selecionar modelos so as modicaes das estatsticas
de Crmer-Von Mises (W

) e Anderson-Darling (A

) (CHEN; BALAKRISHNAN, 1995). Seja

uma estimativa de , ento


W

=
(
1 +
0, 5
n
)
n

j=1
[
u
j

(2 j 1)
2 n
]
2
+
1
2 n
e
A

=
(
1 +
0, 75
n
+
2, 25
n
2
)

{
n
1
n
n

j=1
[(2 j 1) log(u
j
) + (2 n + 1 2 j) log(1 u
j
)]
}
,
em que u
j
= ([y
j
y]/s
y
), y
j
=
1
(v
j
), v
j
= F
(
x
(j)
;

)
, () a funo acumulada
da normal padro e
1
() sua inversa. O modelo com menor valor das estatsticas ser
considerado o modelo mais adequado.
Referncias
AKAIKE, H. A new look at statistical model identication. IEEE Transactions on Automatic
Control, Boston, v.6, p. 716722, 1974.
ALEXANDER, C.; CORDEIRO, G. M.; ORTEGA, E. M. M.; SARABIA, J. M. Generalized
beta-generated distributions. Computational Statistics and Data Analysis, Amsterdan, v. 56,
p. 1880 1897, 2012.
ALZAATREH, A.; LEE, C.; FAMOYE, F. A new method for generating families of continuous
distributions. METRON, Milan, v. 71, p. 6379, 2013.
27
AMOROSO, L. Ricerche intorno alla curva dei redditi. Annali di Matematica Pura ed
Applicata, Heidelberg, v. 2, p. 123159, 1925.
Barreto-Souza, W.; LEMONTE, A. J.; CORDEIRO, G. M. General results for the Marshall and
Olkins family of distributions. Anais da Academia Brasileira de Cincias, Rio de Janeiro,
v. 85, p. 321, 2013.
BOZDOGAN, H. Model selection and Akaikes information criterion (AIC): The general
theory and its analytical extensions. Psychometrika, Williamsburg, v. 52, p. 345370, 1987.
BURNHAM, K. P.; ANDERSON, D. R. Multimodel inference understanding AIC and BIC in
model selection. Sociological Methods & Research, London, v. 33, p. 261304, 2004.
BURR, I. W. Cumulative frequency distribution. Annals of Mathematical Statistics, Chicago,
v. 13, p. 215232, 1942.
CHEN, G.; BALAKRISHNAN, N. A general purpose approximate goodness-of-t test.
Journal of Quality Technology, Milwaukee, v. 27, p. 154161, 1995.
COLOSIMO, E. A.; GIOLO, S. R. Anlise de Sobrevivncia Aplicada. So Paulo: Edgar
Blcher, 2006. 370p.
CORDEIRO, G. M.; CASTRO, M. A new family of generalized distributions. Journal of
Statistical Computation and Simulation, London, v. 81, p. 883898, 2011.
CORDEIRO, G. M.; HASHIMOTO, E. M.; ORTEGA, E. M. M. The McDonald Weibull
model. Statistics, New York, v.48, p. 256278, 2014.
CORDEIRO, G. M.; LEMONTE, A. J. The McDonald inverted beta distribution. Journal of
the Franklin Institute, Philadelphia, v. 349, p. 11741197, 2012.
EUGENE, N.; LEE, C.; FAMOYE, F. Beta-normal distribution and its applications.
Communications in Statistics - Theory and Methods, New York, v. 31, p. 497512, 2002.
GOMES, A. E.; SILVA, C. Q.; CORDEIRO, G. M. Two extended Burr models: Theory and
practice. Communications in Statistics-Theory and Methods, New York, 2013. Disponvel
em: <http://dx.doi.org/10.1080/03610926.2012.762402>. Acesso em: 23 maio 2014
GOMPERTZ, B. On the nature of the function expressive of the law of human mortality, and
on a new mode of determining the value of life contingencies. Philosophical Transactions of
the Royal Society of London, London, v. 115, p. 513583, 1825.
HAJEBI, M.; REZAEI, S.; NADARAJAH, S. An exponential-negative binomial distribution.
REVSTATStatistical Journal, Lisboa, v. 11, p. 191210, 2013.
28
JOSE, K. K.; ANCY, J.; RISTI

C, M. M. A Marshall-Olkin beta distribution and its application.


Journal of Probability and Statistical Science, Taipei, v. 7, p. 173186, 2009.
KOTZ, S.; NADARAJAH, S. Extreme Value Distributions: theory and Applications.
London: Imperial College Press, 2000. 196p.
MARSHALL, A. W.; OLKIN, I. A new method for adding a parameter to a family of
distributions with application to the exponential and Weibull families. Biometrika, London,
v. 84, p. 641652, 1997.
MEROVCI, F.; ELBATAL, I. The McDonald modied Weibull distribution: Properties and
applications. Ithaca, 2013. Disponvel em: <http://arxiv.org/pdf/1309.2961v1.pdf>. Acesso
em: 23 maio 2014.
MUDHOLKAR, G. S.; SRIVASTAVA, D. K. Exponentiated Weibull family for analyzing
bathtub failure-rate data. IEEE Transactions on Reliability, New York, v. 42, p. 299302,
1993.
NADARAJAH, S. Exponentiated Pareto distributions. Statistics, London, v. 39, p. 255260,
2005.
NADARAJAH, S. The exponentiated exponential distribution: a survey. AStA Advances in
Statistical Analysis, New York, v. 95, p. 219251, 2011.
NADARAJAH, S.; CORDEIRO, G. M.; ORTEGA, E. M. M. The Zografos-Balakrishnan-G
family of distributions: Mathematical properties and applications. Communications Statistics
- Theory and Methods, New York, 2014. In press.
NANDA, A. K.; DAS, S. Stochastic orders of the Marshall-Olkin extended distribution.
Statistics & Probability Letters, Amsterdam, v. 82, p. 295302, 2012.
NOCEDAL, J.; WRIGHT, S. J. Numerical optimization. New York: Springer, 2006. 664 p.
PERCONTINI, A.; CORDEIRO, G. M.; BOURGUIGNON, M. The G-negative binomial
family: general properties and applications. Advances and Applications in Statistics, India,
v. 35, p. 127 160, 2013.
PINHO, L. G. B.; CORDEIRO, G. M.; NOBRE, J. S. The gamma-exponentiated Weibull
distribution. Journal of Statistical Theory and Applications, Amsterdam, v. 11, p. 379395,
2012.
PRESS, W. H.; TEULOSKY, S. A.; VENTERLING, W. T.; FLANNERY, B. P. Numerical
recipes in C: the art of scientic computing. London: Prentice Hall, 1992. 630 p.
29
R DEVELOPMENT CORE TEAM. R: a language and environment for statistical
computing. Vienna, Austria: R Foundation for Statistical Computing, 2008. Disponvel em:
<http://www.R-project.org>. Acesso em: 23 maio 2014.
RAMOS, M. W. A.; CORDEIRO, G. M.; MARINHO, P. R. D.; DIAS, C. R. B.; HAMEDANI,
G. G. The Zografos-Balakrishnan log-logistic distribution: Properties and applications.
Journal of Statistical Theory and Applications, Amsterdam, v. 12, p. 225244, 2013.
SCHWARZ, G. Estimating the dimension of a model. Annals of Statistics, Cleveland, v. 6, p.
461464, 1978.
SEN, P. K.; SINGER, J. M. Large Sample Methods in Statistics: an Introduction with
Applications. New York: Chapman and Hall, 1993. 382 p.
SHAO, Q. Notes on maximum likelihood estimation for the three-parameter Burr XII
distribution. Computational Statistics and Data Analysis, Amsterdam, v. 45, p. 675687,
2004.
SILVA, G. O. Modelos de regresso quando a funo de taxa de falha no montona
e o modelo probabilstico beta Weibull modicada. 2008. 208 p. Tese (Doutorado em
Estatstica e Experimentao Agronmica) Escola Superior de Agricultura Luiz de
Queiroz, Universidade So Paulo, Piracicaba, 2008.
TAHIR, M.; NADARAJAH, S. Parameter induction in continuos univariate distributions-Part
I: Well-established G-classes. Communications Statistics - Theory and Methods, New York,
2014. In press.
ZAMANI, H.; ISMAIL, N. Negative binomial-Lindley distribution and its application. Journal
of Mathematics & Statistics, Adelaide, v. 6, p. 49, 2010.
ZIMMER, W. J.; KEATS, J. B.; WANG, F. K. The Burr XII distribution in reliability analysis.
Journal of Quality Technology, Milwaukee, v. 30, p. 386394, 1998.
ZOGRAFOS, K.; BALAKRISHNAN, N. On families of beta- and generalized gamma-
generated distributions and associated inference. Statistical Methodology, St. Louis, v. 6, p.
344362, 2009.
30
pular pagina
31
3 O MODELO MCDONALD GUMBEL
Resumo
Neste trabalho, proposto um novo modelo denominado distribuio McDonald Gumbel,
que possui a grande vantagemde se ajustar a dados reais assimtricos as quais distribuies exis-
tentes no se ajustam. Este novo modelo possui como casos especiais as distribuies Gumbel,
Gumbel exponencializada (PERSSON; RYDN, 2010), beta Gumbel (NADARAJAH; KOTZ,
2004), Kumaraswamy Gumbel, entre outras. Obtm-se os momentos ordinrios, as funes
quantlica e geradora de momentos e desvios mdios. O mtodo de mxima verossimilhana
foi utilizado para ajustar a distribuio proposta. A aplicabilidade do novo modelo ilustrada
com dois conjuntos de dados reais (BRITO et al., 2014).
Palavras-chaves: Distribuio Gumbel; Distribuio McDonald; Funo geradora de momen-
tos; Funo quantlica; Mxima verossimilhana
Abstract
We propose a new model called the McDonald Gumbel distribution, the major advantage
of which is its ability to t asymmetric real data that can not be properly adjusted by exis-
ting distributions. This model contains as special models the Gumbel, exponentiated Gum-
bel (PERSSON; RYDN, 2010), beta Gumbel (NADARAJAH; KOTZ, 2004), Kumaraswamy
Gumbel distributions, among others. We obtain the ordinary moments, quantile and generating
functions and mean deviations. The method of maximum likelihood is used to t the proposed
distribution. The applicability of the new model is illustrated by means of two real data sets
(BRITO et al., 2014).
Keywords: Gumbel distribution; Maximum likelihood; McDonald distribution; Moment gene-
rating function; Quantile function
3.1 Introduo
A literatura estatstica tem muitas obras com centenas de distribuies univariadas contnuas,
ver por exemplo, Johnson, Kotz e Balakrishnan (1995). A distribuio Gumbel, tambm co-
nhecida como a distribuio de valor extremo tipo I, amplamente utilizada na engenharia e
tem havido uma crescente necessidade em reas como anlise de inundao, rede de uxo, con-
abilidade de software, velocidade de vento, entre outros. Em hidrologia (WAYLEN; WOO,
1982), por exemplo, os estudos ecolgicos na agricultura para planejar as atividades scio-
econmicas e tecnolgicas usam a distribuio Gumbel. As previses meteorolgicas precisas
tm beneciado a agricultura pois a escolha do cultivar a ser desenvolvido sensvel s varia-
es climticas e s chuvas.
Neste artigo, apresenta-se um novo modelo chamado de distribuio McDonald Gumbel
(denotado, de forma abreviada, por McGu). Este modelo contm como casos especiais a
32
distribuio Gumbel e algumas outras distribuies. A distribuio McGu pode ser utilizada
para selecionar seus sub-modelos.
O artigo apresentado como segue. Na Seo 3.2 , introduz-se a distribuio McGu. A
Seo 3.3 fornece expanses teis para as funes de densidade e acumulada . Na Seo 3.4,
obtm-se uma expresso de forma fechada para os momentos. As sees 3.5 e 3.6 apresentam as
funes geradoras de momentos e quantlica, respectivamente. Os desvios mdios e as curvas
de Lorenz e Bonferroni so abordadas na Seo 3.7. A entropia de Rnyi apresentada na
Seo 3.8. Na Seo 3.9, estuda-se estimao por mxima verossimilhana para os parmetros
do modelo. Aplicaes utilizando dois conjuntos de dados reais so ilustradas na Seo 3.10.
A Seo 3.11 naliza com alguns comentrios.
3.2 O Modelo McDonald Gumbel
Alexander et al. (2012) deniram uma classe de distribuies generalizadas com funo densi-
dade de probabilidade (pdf) dada por
f(x) =
c
B(a, b)
g(x)G
ac1
(x) [1 G
c
(x)]
b1
, (3.1)
em que a, b, c > 0, g(x) = dG(x)/dx e B(a, b) =

1
0
t
a1
(1 t)
b1
dt a funo beta. A
famlia (3.1) denominada de classe de distribuies McDonald. A classe inclui como casos
especiais a famlia beta generalizada (EUGENE; LEE; FAMOYE, 2002) para c = 1 e a famlia
Kumaraswamy generalizada (CORDEIRO; CASTRO, 2011) para a = 1.
A funo distribuio acumulada (cdf) correspondente a (3.1)
F(x) = I
G
c
(x)
(a, b) =
1
B(a, b)

G
c
(x)
0

a1
(1 )
b1
d, (3.2)
em que I
y
(a, b) = B(a, b)
1

y
0
w
a1
(1 w)
b1
dw a funo razo beta incompleta.
A cdf (3.2) pode ser expressa em termos da funo hipergeomtrica como
F(x) =
G
ac
(x)
a B(a, b)
2
F
1
[a, 1 b; a + 1; G
c
(x)] , (3.3)
em que
2
F
1
(a, b; c; x) =
(c)
(a)(b)

j=0
(a + j)(b + j)
(c + j)
x
j
j!
.
As propriedades da cdf F(x) gerada de uma distribuio base G(x) em (3.3), podem, em
princpio, ser obtidas a partir das propriedades bem estabelecidas da funo hipergeomtrica.
Ver Seo 9.1 de Gradshteyn e Ryzhik (2007).
A cdf G(x) pode ser qualquer cdf de varivel contnua e F(x) a cdf da famlia McDonald
generalizada (Mc-G). Se X uma varivel aleatria com funo densidade (3.1), pode-se
33
escrever X Mc-G(a, b, c, ), em que o vetor de parmetros associado a G(x). Uma
grande vantagem dessa classe a sua capacidade de se ajustar a dados reais assimtricos a que
distribuies existentes no se ajustam.
Ao analisar os dados de tempo de vida, muitas vezes conveniente trabalhar com o loga-
ritmo dos tempos observados. Assim, se os dados seguem a distribuio Weibull, a distribuio
Gumbel aparece naturalmente na anlise do logaritmo destas observaes.
Dene-se a distribuio McGu, substituindo G(x) e g(x) em (3.1) como a cdf e pdf da
distribuio Gumbel
G(x) = exp
{
exp
[

(x )

]}
(3.4)
e
g(x) =
1

exp
{

(x )

exp
[

(x )

]}
, (3.5)
respectivamente, em que x, IR e > 0.
Ento, a pdf da McGu dada por
f(x) =
c
B(a, b)
exp
{

(x )

ac exp
[

(x )

]}

(
1 exp
{
c exp
[

(x )

]})
b1
, (3.6)
em que x IR, IR, > 0 e a > 0, b > 0 e c > 0. Deste ponto em diante,
X McGu(a, b, c, , ) indica uma varivel aleatria com funo de densidade (3.6). Algumas
das possveis formas de (3.6) para alguns valores selecionados dos parmetros so exibidos na
Figura 3.1.
A distribuio McGu contm como casos especiais as distribuies Gumbel (Gu) (JOHN-
SON; KOTZ; BALAKRISHNAN, 1995) (para a = b = c = 1), Gumbel exponencializada
(Exp-Gu) (PERSSON; RYDN, 2010) (para b = c = 1), beta Gumbel (BGu) (NADARAJAH;
KOTZ, 2004) para c = 1 e Kumaraswamy Gumbel (KwGu) (CORDEIRO; NADARAJAH;
ORTEGA, 2012) (para a = 1). A distribuio proposta tem dois importantes aspectos: envolve
mais parmetros do que o modelo Gumbel, proporcionando mais exibilidade e os parmetros
adicionais podem controlar a assimetria, os pesos nas caudas e a entropia no centro da distri-
buio gerada. A distribuio McGu um caso especial da famlia T-X (ALZAATREH; LEE;
FAMOYE, 2013), em que W(G(x)) a distribuio Exp-Gu e r(t) a fdp da distribuio beta.
A cdf associada a densidade (3.6) dada por
F(x) = I
exp
{
c exp
[

(x)

]}
(a, b) . (3.7)
A distribuio McGu facilmente simulada pela inverso da cdf (3.7) da seguinte maneira:
se V tem distribuio beta com parmetros a > 0 e b > 0,
X = log
[
c
1
log(V )
]
34
x
f
(
x
)
10 0 10 20
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
McGu(1,0; 1,0; 1,0; 0,0; 1,0)
Gumbel padro
McGu(0,5; 1,0; 1,0; 1,0; 2,0)
Gumbel exponencializada
McGu(1,0; 4,0; 1,0; 5,0; 10,0)
beta Gumbel
McGu(1,0; 5,0; 0,5; 6,0; 5,0)
Kumaraswamy Gumbel
x
f
(
x
)
150 50 0 50 100 150 200 250
0
.
0
0
0
0
.
0
0
4
0
.
0
0
8
0
.
0
1
2
0
.
0
1
6
McGu(0,1; 20,0; 6,0; 130,0; 50,0)

McGu(0,12; 15,0; 2,0; 100,0; 60,0)

McGu(0,3; 20,0; 6,0; 130,0; 50,0)

McGu(2,0; 3,0; 0,5; 100,0; 60,0)
Figura 3.1 Funo densidade da McGu para alguns valores dos parmetros
35
(para c > 0) tem distribuio McGu(a, b, c, , ). Grcos comparando as funes densidades
exatas da McGu e os histogramas de dois conjuntos de dados simulados comn = 200 repeties
para valores selecionados dos parmetros so mostrados na Figura 3.2. Estes grcos indicam
que os valores simulados so consistentes com a distribuio McGu.
A moda de uma distribuio de probabilidade contnua o valor x em que a pdf tem seu
valor mximo. A moda no necessariamente nica, uma vez que a pdf pode ter diversos
valores mximos. A moda de uma varivel aleatria da distribuio McGu pode ser obtida pela
maximizao do logaritmo da equao (3.6), isto
log[f(x)] = log(c)log()log[B(a, b)]
(x )

a c e

(x)

+(b1) log
[
1 e
c e

(x)

]
.
(3.8)
Ao derivar a equao (3.8) em relao a x e igualando a zero, a moda de uma varivel
aleatria da distribuio McGu pode ser obtida como soluo da equao

x
log[f(x)] =
1

+
a c

(x)

c (b 1) e

(x)

c e

(x)

[
1 e
c e

(x)

] = 0. (3.9)
A equao (3.9) no pode ser resolvida analiticamente. Entretanto, a moda pode ser calcu-
lada numericamente, utilizando um programa de anlise estatstica. Observe que se

2
x
2
log[f(x)] =
a c

2
e

(x)

c (b 1) e

(2 x)

{
c e

+ e
x

[
1 e
c e

(x)

]}

2
[
1 e
c e

(x)

]
2
,
menor do que zero, qualquer raiz x de (3.9) uma moda da varivel aleatria x.
3.3 Expanses teis
Algumas expanses para (3.1) e (3.2) podem ser encontradas utilizando o conceito de distri-
buies exponencializadas. Para uma cdf G(x) qualquer, dene-se uma varivel aleatria Y
com distribuio G-exponencializada (de forma abreviadaExp-G) com parmetro de potncia
> 0, diz-se Y Exp-G(, ), em que o vetor de parmetros de G, se a cdf e a pdf so
dadas por
H(y) = G

(y) e h(y) = g(y) G


1
(y),
respectivamente. As propriedades das distribuies exponencializadas tm sido estudadas por
diversos autores nos ltimos anos. Ver Mudholkar e Srivastava (1993), Gupta, Gupta e Gupta
(1998), Gupta e Kundu (2001) e Nadarajah e Gupta (2007) para distribuies Weibull expo-
nencializada, Pareto exponencializada, exponencial exponencializada e gama exponencializada,
respectivamente.
36
(a)
Valores simulados
D
e
n
s
i
d
a
d
e
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
(b)
Valores simulados
D
e
n
s
i
d
a
d
e
2 3 4 5 6
0
.
0
0
.
2
0
.
4
0
.
6
Figura 3.2 Grcos da funo densidade McGu para dois conjuntos de dados simulados: (a)
a = 1, 8; b = 0, 5; c = 3, 0; = 0; = 1, 0 e (b) a = 1, 0; b = 2, 0; c = 3, 0; =
2, 0; = 0, 8
37
Utilizando a combinao linear apresentada em Alexander et al. (2012), pode-se escrever
(3.1) como
f(x) =

k=0
w
k
h
(a+k)c
(x), (3.10)
em que h
(a+k)c
(x) denota a pdf da distribuio Exp-Gu(c(a + k), ) dada por
h
(a+k)c
(x) =
(a + k)c

exp
[

(x )

]
exp
{
(a + k)c exp
[

(x )

]}
com os coecientes w
k
dados por
w
k
=
(1)
k
(
b1
k
)
(a + k) B(a, b)
.
Claramente,

k=0
w
k
= 1. Assim, a funo densidade da Mc-Gu pode ser expressa como uma
mistura de funes densidades da Exp-Gu. Consequentemente, algumas de suas propriedades
matemticas podem ser obtidas das propriedades conhecidas da distribuio Exp-Gu. Se b um
inteiro positivo, o ndice k em (3.10) para em b 1. Por integrao de (3.10), obtm-se
F(x) =

k=0
w
k
H
(a+k)c
(x), (3.11)
em que H
(a+k)c
(x) a cdf da distribuio Exp-Gu(c(a + k), ). As equaes (3.10) e (3.11)
so muito apropriadas para obter algumas propriedades estruturais da distribuio McGu. Os
momentos ordinrios, centrais, incompletos e fatoriais e a funo geradora de momentos (mgf)
da distribuio McGu podem ser expressos como uma combinao linear destas quantidades
para a distribuio Exp-Gu. As expanses (3.10) e (3.11) so os principais resultados desta
seo.
3.4 Momentos
A necessidade e a importncia dos momentos em qualquer anlise estatstica especialmente
no trabalho aplicado bvia. Alguns dos mais importantes recursos e caractersticas de uma
distribuio podem ser estudados, usando-se os momentos (por exemplo tendncia, disperso,
assimetria e curtose). O r-simo momento de uma varivel aleatria Exp-Gu (NADARAJAH;
KOTZ, 2004) Z
a
com parmetros a, e
E(Z
r
a
) = a
n
r

j=0
(1)
j
(r + 1)
(r j + 1) j!
(

)
j
{
(

d
)
j
[
(a)
d
(d)
]
}

d=1
.
Da equao (3.10), obtm-se

r
= E(X
r
) =

k=0
w
k
E
[
Z
r
(a+k)c
]
,
38
e, ento,

r
= c
r
r

j=0

k=0
(1)
j+k
(a + b) (r + 1)
(

)
j
(a) (b k) (r j + 1) j! k!
{
(

d
)
j
[(a + k)c]
d
(d)
}

d=1
.(3.12)
Os quatro primeiros momentos ordinrios de X so dados por
E(X) =

k=0
w
k
[ + + (a + k)c],
E(X
2
) =

k=0
w
k
{
6
2
+ 12 +
2

2
+ 6
2

2
+ 12( + ) log[(a + k)c] + 6
2
log
2
[(a + k)c]
}
,
E(X
3
) =

k=0
w
k
2
{
2
3
+ 6
2
+ (
2
+ 6
2
)
2

2
+ 4(3) + 2
3
)

3
+
(
12
2
+ 6
2

2
6
3

2
)
log[(a + k)c]
+ 6
2
( ) log
2
[(a + k)c] 2
3
log
3
[(a + k)c]
}
e
E(X
4
) =

k=0
w
k
20
{
20
4
+ 80
3
40
3
(

2
+ 4(3) + 2
3
)
+ 20
2
(

2
+ 6
2
)
+
(
3
4
+ 20
4
+ 160(3) + 20
2

2
)

4
+ 20
4
(4 + 1) log
4
[(a + k)c]
+ 40
[(

2
+ 4(3) + 2
3
)

2
+ 6
2
)

2
+ 6
2
+ 2
3
]
log[(a + k)c]
+ 20
2
(

2
+ 6
2

2
12 + 6
2
)
log
2
[(a + k)c] 80
3
log
3
[(a + k)c]
}
,
em que denota a constante de Euler e (s) =

n=1
n
s
a funo zeta.
As medidas de varincia, assimetria e curtose podem ser calculadas utilizando as bem co-
nhecidas expresses. Grcos de assimetria e curtose para valores selecionados de a e b como
funo de c para = 100 e = 50 so apresentados na Figura 3.3. Para valores crescentes
do parmetro c, a assimetria aumenta e a curtose inicialmente decresce para um valor mnimo e
depois deste ponto aumenta.
Momentos incompletos so utilizados para medir desigualdades: por exemplo, curvas de
Lorenz e Bonferroni e ndices de Pietra e Gini. O primeiro momento incompleto da varivel
aleatria Z
a
com parmetros a, e ,

Z
a
(t) =

xh
a
(x) dx, dado por

Z
a
(t) = t exp
{
a exp
[

(t )

]}
+ E
i
{
exp
[

(x )

]}
, (3.13)
39
0.0 0.1 0.2 0.3 0.4 0.5 0.6

1
.
0

0
.
5
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
2
.
5
c
A
s
s
i
m
e
t
r
i
a
a=1.0; b=0.5
a=1,5; b=1,0
a=2,0; b=1,5
a=2,5; b=2,0
0.0 0.1 0.2 0.3 0.4 0.5
5
0
1
0
0
1
5
0
2
0
0
2
5
0
3
0
0
c
C
u
r
t
o
s
e
a=1,0; b=0,5
a=1,5; b=1,0
a=2,0; b=1,5
a=2,5; b=2,0
Figura 3.3 Assimetria e curtose da distribuio McGu como uma funo de c para alguns
valores de a e b com = 100 e = 50
40
em que E
i
=


x
x
1
e
x
dx a funo integral exponencial (para x > 0) e pode ser reescrita
como
E
i
= + log(x) +

k=1
x
k
k k!
.
Das equaes (3.10) e (3.13), obtm-se

X
(t) = t

k=0
w
k
[
exp
{
(a + k)c exp
[

(t )

]}
+ E
i
{
exp
[

(x )

]}]
.(3.14)
3.5 Funo geradora
A funo geradora de momentos (mgf) de uma varivel aleatria uma especicao alternativa
de sua distribuio de probabilidade. Diferenciando M
X
(t) em relao a t e fazendo t = 0
obtm-se o i-simo momento sobre zero.
Aps algumas manipulaes algbricas, pode-se escrever a mgf M(t) = E
(
e
t Z
)
da varivel
aleatria Z
a
, com parmetros a, e , como
M
a
(t) = e
t
a
t
(1 t). (3.15)
Ento, a mgf de X segue de (3.10) e de (3.15) como
M
X
(t) = E
(
e
t X
)
= e
t
(1 t)

k=0
w
k
[(a + k)c]
t
.
3.6 Funo quantlica
Funes quantlicas so utilizadas em grande escala na estatstica de modo geral e muitas vezes
para encontrar representaes em termos de tabelas de referncias para percentis. A funo
quantlica (qf) da distribuio McGu, Q(u) = F
1
(u), pode ser expressa em termos da qf da
distribuio beta. Encontrando a inversa de F(x) = I
(
exp
{
c exp
[

(x)

]})
(a, b) = u, obtm-se
x = Q(u) = log
{
c
1
log [Q
a,b
(u)]
}
, (3.16)
em que Q
a,b
(u) = I
1
u
(a, b) a qf da beta. A seguinte expanso para Q
a,b
(u) pode ser encon-
trada no website wolfram
1
Q
a,b
(u) =
4

i=1
A
i
[a B(a, b) u]
i/a
+ O(u
5/a
),
em que os coecientes so
A
1
= 1, A
2
=
b 1
a + 1
, A
3
=
(b 1)(a
2
+ 3ab a + 5b 4)
2(a + 1)
2
(a + 2)
1
http://functions.wolfram.com/06.23.06.0004.01 - Accessed 26/06/2013.
41
e
A
4
=
(b 1)[a
4
+ (6b 1)a
3
+ (b + 2)(8b 5)a
2
+ (33b
2
30b + 4)a + 6(31b 47) + 18]
3(a + 1)
3
(a + 2)(a + 3)
.
Para y (0, 1), tem-se log[k log(y)] =

j=1
k
j
j
[1 + log(y)]
j
. Utilizando a expanso
binomial, obtm-se
log[k log(y)] =

j=1
j

r=0
k
j
j
(
j
r
)
log(y)
r
. (3.17)
Usando as equaes 1.512 e 0.314 (para uma srie de potncia elevada a um inteiro positivo)
dada por Gradshteyn e Ryzhik (2007), pode-se reescrever (3.17) como
log[k log(y)] =

j=1
j

r=0

t=0
k
j
(
j
r
)
d
t
j
(y 1)
r+t
, (3.18)
em que d
0
= 1, d
m
=
1
m
m

t=1
[t (r + 1) m] a
t
d
mt
para m 1, r natural e a
t
=
(1)
t
t + 1
.
Uma segunda expresso para a qf de X segue de (3.18) como
Q(u) = +

j=1
j

r=0

t=0
(
j
r
)
j c
j
d
t
[Q
a,b
(u) 1]
r+t
.
3.7 Desvios mdios
Aqui, calculam-se as seguintes medidas: desvios mdios e curvas de Lorenz e Bonferroni. Uma
medida da disperso de uma populao dada pelo conjunto de desvios da mdia e da mediana
denidos por
1
(X) = 2

1
F(

1
) 2T
1
(

1
) e
2
(X) =

1
2T
1
(M), respectivamente, em
que

1
= E(X), a mediana M = Q(1/2) de X determinada de (3.16), F(M) e F(

1
) so
obtidos de (3.7) e T
1
(q) =

xf(x)dx o primeiro momento incompleto de X calculado de


(3.14) como
T
1
(q) =

k=0
w
k
(a + k) c


q
x exp
[

(x )

]
exp
{
exp
[

(x )

]}
(a+k) c
dx.
Fazendo t = exp
[

(x)

]
, obtm-se
T
1
(q) =

k=0
w
k
{ + + log[(a + k) c] + exp[(a + k) c v] log(v) (3.19)
exp(a v) + c [0, (a + k) v]} ,
em que v = e

, denota a constante de Euler e (a, z) =

z
e
t
t
a1
dt a funo gama
incompleta superior. A equao (3.19) o principal resultado desta seo a partir do qual
1
(X)
e
2
(X) so imediatamente determinados.
42
O primeiro momento incompleto T
1
(q) pode ser usado para obter as curvas de Lorenz e
Bonferroni que so ferramentas fundamentais para a anlise de dados em diversas reas como
economia, conabilidade, demograa, seguros e medicina. Para uma dada probabilidade , elas
so denidas por L() = T
1
(q)/

1
e B() = T
1
(q)/(

1
), respectivamente, em que q = Q()
obtida de (3.16). Em economia, se a proporo de unidades cuja renda menor ou igual a
q, L() d a proporo do volume total de renda acumulada com renda menor ou igual a q. De
modo similar, a curva de Bonferroni B() d a razo entre a renda mdia desse grupo e a renda
mdia da populao. A Figura 3.4 apresenta as curvas de Lorenz e Bonferroni para valores
selecionados dos parmetros.
3.8 Entropia
A entropia a medida da incerteza de uma varivel aleatria. Duas medidas de entropia muito
populares so as entropias de Rnyi e de Shannon (RNYI, 1961; SHANNON, 1951). A en-
tropia de Rnyi de uma varivel aleatria X com pdf f() denida como
I
R
() =
1
1
log
{
E[f(X)
1
]
}
=
1
1
log
[

(x) dx
]
,
para > 0 e = 1. A entropia de Rnyi importante em ecologia estatstica como n-
dice de diversidade. A entropia de Shannon de uma varivel aleatria X denida como
E{log[f(X)]}. Este o caso especial da entropia de Rnyi quando 1.
Da equao (3.10), pode-se escrever a entropia de Rnyi de X como
I
R
() =
1
1
log
[
(s)

s1
B(a, b)
s

k=0
(1)
k
(a s + k)
s
(
s b s
k
)
]
.
3.9 Estimao
Adota-se o mtodo de mxima verossimilhana para estimar os parmetros do modelo. O loga-
ritmo da funo de verossimilhana, (), de uma amostra aleatria x
1
, . . . , x
n
de X com pdf
(3.6) dada por
() = n log(c) n log() n log [B(a, b)]
n

i=1
(x
i
)

a c
n

i=1
exp
[

(x
i
)

]
+ (b 1)
n

i=1
log
(
1 exp
{
c exp
[

(x
i
)

]})
. (3.20)
O logaritmo da funo de verossimilhana pode ser maximizado diretamente utilizando o
software R (pacote bbmle) ou por soluo do sistema de equaes no-lineares obtido por
derivar (3.20) em relao aos parmetros do modelo. Esta funo requer valores iniciais e,
neste trabalho, foram utilizados as estimativas de mxima verossimilhana para os parmetros
43
(a)
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0

L
(

)
c=0,5
c=1,0
c=15,0
(b)
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0

B
(

)
c=0,5
c=1,0
c=15,0
Figura 3.4 (a) Curvas de Lorenz e (b) Bonferroni para a = 2, 0; b = 4, 0; = 10, 0 e = 2, 0
da distribuio Gumbel com a = b = c = 1. Os componentes do vetor escore U() so dados
44
por
U
a
() = n[(a + b) (a)] c
n

i=1
exp
[

(x
i
)

]
,
U
b
() = n[(a + b) (b)] +
n

i=1
log (1 exp {c exp [(x
i
)/]}),
U
c
() =
n
c
a
n

i=1
exp
[

(x
i
)

]
(b 1)
n

i=1
exp[(x
i
)/] exp (c exp [(x
i
)/])
1 exp {c exp [(x
i
)/]}
,
U

() =
n


ac

i=1
exp
(

x
i

)
+
c (b 1)

i=1
exp [(x
i
)/] exp {c exp [(x
i
)/]}
1 exp {c exp [(x
i
)/]}
e
U

() =
n

+
n

i=1
(x
i
)

2
{1 ac exp[(x
i
)/]}
+
c(b 1)

2
n

i=1
(x
i
) exp [(x
i
)/] exp {c exp [(x
i
)/]}
1 exp {c exp [(x
i
)/]}
,
em que (s) = d log (s)/ds a funo digama. Para estimao intervalar e testes de hip-
teses para os parmetros do modelo, a matriz de informao observada requerida. Os 5 5
elementos da matriz de informao observada J() so dados no Apndice APNDICE A - .
Sob certas condies de regularidade, a distribuio normal multivariada N
5
(
0, J(

)
1
)
,
emque J(

) a matriz de informao observada avaliada em

, pode ser utilizada para construir


intervalos de conana aproximados para os parmetros. Para comparar a distribuio McGu
com alguns de seus casos especiais, podem-se usar trs testes bem conhecidos: a razo de
verossimilhana (LR), estatstica de Wald e escore de Rao. Ao testar modelos encaixados, estas
estatsticas convergem para uma distribuio qui-quadrado com nmero de graus de liberdade
igual a diferena ente os nmeros de parmetros nos dois modelos.
3.10 Aplicaes
Nesta seo, apresentam-se duas aplicaes utilizando conjunto de dados reais para demons-
trar a exibilidade e aplicabilidade do modelo proposto sobre outros modelos paramtricos.
As avaliaes numricas requeridas foram implementadas usando a verso 3.0.0 do R (pacote
bbmle).
45
3.10.1 Aplicao 1: Dados de vazo mnima
Nesta aplicao, as descargas mnimas de sete dias consecutivos do Rio Cuiab, Cuiab, Mato
Grosso, Brazil, so analisadas. Estes dados foram analisados anteriormente por Cordeiro, Nada-
rajah e Ortega (2012). O estudo utiliza a srie de dados de 38 anos (Janeiro de 1962 a Outubro
de 1999) relatados como vazes mnimas pela estao hidrolgica n
o
66260001, instalada no
Rio Cuiab na cidade de Cuiab. Na Tabela 3.1, apresentado um resumo descritivo desses
dados. Os dados tm assimetria negativa e distribuio platicrtica.
Tabela 3.1 Estatsticas descritivas
Mdia Mediana Des. Pad. Varincia Assimetria Curtose Mn Mx
110, 20 115, 90 38, 38 1473, 13 0, 179 1, 149 43, 86 186, 40
Calculam-se as estimativas de mxima verossimilhana (MLEs) dos parmetros do modelo
e o critrio de informao de Akaike (AIC) para comparar as distribuies McGu, KwGu, Exp-
Gu e Gu. Os resultados so apresentados na Tabela 3.2. De acordo com o menor valor da
estatstica AIC, o modelo McGu poderia ser escolhido como o melhor modelo entre os modelos
ajustados. Alm disso, calculam-se as estatsticas de qualidade de ajuste Cramr-von Mises
(W

) e Anderson-Darling (A

), a m de vericar qual modelo se ajusta melhor aos dados. As


estatsticas W

e A

so descritas por Chen e Balakrishnan (1995). Em geral, quanto menor


os valores dessas estatsticas, melhor o ajuste aos dados. Os valores das estatsticas W

, A

e a estatstica de Kolmogorv-Smirnov (K-S) para os quatro modelos ajustados so dados na


Tabela 3.3. Com base nestes valores, o modelo McGu analisa os dados melhor que os outros
trs modelos.
Tabela 3.2 Estimativas dos parmetros para alguns modelos ajustados para os dados de vazo
mnima (os erros padro so dados em parnteses) e os valores da estatstica AIC
Modelo
MLEs
AIC
a b c
Gu - - - 91,003 35,962
392,867
(6,189) (4,434)
Exp-Gu 1,001 - - 90,979 35,971
394,867
(0,172) - - (0,005) (4,436)
KwGu - 20,068 4,052 90,906 111,885
391,883
- (33,720) (1,750) (0,066) (51,320)
McGu 0,112 22,723 6,544 133,103 55,699
391,065
(0,098) (30,870) (3,210) (0,290) (17,438)
Os parmetros adicionais da distribuio McGu so testados utilizando a estatstica LR. Os
valores da estatstica LR so listados na Tabela 3.4. A estatstica LR comparando a distribuio
McGu com a Gu e com a Exp-Gu tiveram os mesmos valores porque o parmetro extra estimado
para o modelo exp-Gu aproximadamente um. Neste caso, a distribuio Exp-Gu coincide com
46
Tabela 3.3 Estatsticas de qualidade de ajuste para os dados de vazo mnima
Modelo W

p-valor A

p-valor K-S p-valor


Gumbel 0,186 0,008 1,121 0,006 0,165 0,252
Exp-Gu 0,186 0,008 1,121 0,006 0,165 0,252
KwGu 0,104 0,098 0,645 0,093 0,138 0,464
McGu 0,073 0,257 0,468 0,250 0,131 0,530
a distribuio Gu. Portanto, para os dados de vazo mnima, rejeitam-se as trs hipteses nulas
com base nas estatsticas LR em favor da distribuio McGu.
Tabela 3.4 Testes LR para os dados de vazo mnima
Modelos Hipteses Estatstica LR p-valor
McGu vs Gu H
0
: a = b = c = 1 vs H
1
: H
0
falsa 7,802 0,0225
McGu vs Exp-Gu H
0
: b = c = 1 vs H
1
: H
0
falsa 7,802 0,0101
McGu vs KwGu H
0
: a = 1 vs H
1
: H
0
falsa 2,705 0,0582
O histograma dos dados com as densidades ajustadas da Gu, Exp-Gu, KwGu e McGu e o
grco dos quantis so apresentados na Figuras 3.5. Estes grcos indicam um razovel ajuste
da distribuio McGu. Com base nos testes e nos grcos, pode-se concluir que a distribuio
Mc-Gu o melhor modelo entre os ajustados a esses dados.
(a) (b)
Vazo
D
e
n
s
i
d
a
d
e
40 90 140 190
0
.
0
0
0
0
.
0
0
4
0
.
0
0
8
0
.
0
1
2
Gumbel
ExpGu
KwGu
McGu
50 100 150
5
0
1
0
0
1
5
0
Observado
A
j
u
s
t
a
d
o
Gumbel
ExpGu
KwGu
McGu
Figura 3.5 (a) Histograma com densidades ajustadas e (b) grco dos quantis para os dados
de vazo mnima
3.10.2 Aplicao 2: Dados de inundaes
Na segunda aplicao, os excessos de picos de cheias (em m
3
/s) do Rio Wheaton perto de
Carcross no Territrio de Yukon, Canad, so analisados. Considera-se o conjunto de dados
47
apresentados em Akinsete, Famoye e Lee (2008). Os dados consistem de 72 inundaes entre
os anos 1958 1984, arredondados para uma casa decimal. Na Tabela 3.5, apresenta-se um
resumo descritivo destes dados. Nota-se que a assimetria e a curtose so positivas.
Tabela 3.5 Estatsticas descritivas
Mdia Mediana Des. Pad. Varincia Assimetria Curtose Mn Mx
12, 20 9, 50 12, 30 151, 22 1, 44 2, 73 0, 10 64, 00
Tambm calculam-se os MLEs e a estatstica AIC para os parmetros das distribuies
ajustadas McGu, KwGu, Exp-Gu e Gu para estes dados. Os resultados so apresentados na
Tabela 3.6. De acordo com o menor valor da estatstica AIC, o modelo McGu poderia ser
escolhido como o melhor modelo entre os quatro modelos ajustados. Calculam-se as estatsticas
W

, A

e KS a m de vericar qual o modelo que melhor se ajusta a esses dados. Os valores


dessas estatsticas para os quatro modelos competitivos so dados na Tabela 3.7, vericando-se
que o modelo McGu se ajusta melhor aos dados do que os outros trs modelos.
Tabela 3.6 Estimativas dos parmetros para alguns modelos ajustados para os dados de inun-
daes (os erros padro so dados em parnteses) e os valores da estatstica AIC
Modelo
MLEs
AIC
a b c
Gu - - - 6,969 8,189
542,872
(1,009) (0,818)
Exp-Gu 0,979 - - 7,145 8,190
544,872
(0,055) - - (0,002) (0,819)
KwGu - 0,188 0,002 14,756 2,196
529,038
- (0,032) (0,001) (0,042) (0,269)
McGu 0,131 0,116 0,003 15,915 1,794
517,823
(0,042) (0,020) (<0,001) (0,010) (0,081)
Tabela 3.7 Estatsticas de bondade de ajuste para os dados de inundaes
Modeol W

p-valor A

p-valor K-S p-valor


Gumbel 0,275 <0,001 1,875 <0,001 0,158 0,054
Exp-Gu 0,275 <0,001 1,875 <0,001 0,158 0,054
KwGu 0,182 0,009 1,150 0,005 0,177 0,022
McGu 0,179 0,010 0,942 0,017 0,080 0,741
Os parmetros adicionais da distribuio McGu tambm so testados usando a estatstica
LR. Na Tabela 3.8, apresentam-se os resultados para esses dados. As estatsticas LR para com-
parar as distribuies McGu com a Gu e com a Exp-Gu produzem os mesmos valores porque o
parmetro extra do modelo Exp-Gu aproximadamente um. Portanto, para os dados de inun-
daes, rejeitamos a hiptese nula para os trs testes LR em favor da distribuio McGu. O
48
histograma dos dados com as densidades ajustadas da Gu, Exp-Gu, KwGu e McGu e o grco
dos quantis so apresentados na Figura 3.6 e indicam um bom ajuste da distribuio McGu.
Utilizando os testes e os grcos, podem-se dizer que a distribuio McGu o modelo mais
adequado entre os modelos utilizados para esses dados.
Tabela 3.8 Testes LR para os dados de inundaes
Modelos Hipteses Estatstica LR p-valor
McGu vs Gu H
0
: a = b = c = 1 vs H
1
: H
0
falsa 33,035 <0,0001
McGu vs Exp-Gu H
0
: b = c = 1 vs H
1
: H
0
falsa 33,035 <0,0001
McGu vs KwGu H
0
: a = 1 vs H
1
: H
0
falsa 12,615 0,0002
(c) (d)
Inundao
D
e
n
s
i
d
a
d
e
0 10 20 30 40 50 60 70
0
.
0
0
0
.
0
4
0
.
0
8
Gumbel
ExpGu
KwGu
McGu
0 20 40 60
0
2
0
4
0
6
0
Observado
A
j
u
s
t
a
d
o
Gumbel
ExpGu
KwGu
McGu
Figura 3.6 (c) Histograma com densidades ajustadas e (d) grco dos quantis para os dados
de inundaes
3.11 Consideraes nais
Neste artigo, foram estudadas as propriedades de uma generalizao da distribuio Gumbel,
denominada de distribuio McDonald Gumbel (McGu), que pode ser bastante exvel em an-
lises de dados reais contnuos em diversas reas de engenharia. Algumas de suas propriedades
estruturais foram obtidas incluindo os momentos e a funo geradora de momentos. O mtodo
de mxima verossimilhana foi proposto para estimar os parmetros. A matriz de informao
observada apresentada. Dois conjuntos de dados reais so utilizados para ilustrar a aplicao
da nova distribuio.
49
Referncias
AKINSETE, A.; FAMOYE, F.; LEE, C. The beta-Pareto distribution. Statistics: A Journal of
Theoretical and Applied Statistics, Berlin, v. 42, p. 547563, 2008.
ALEXANDER, C.; CORDEIRO, G. M.; ORTEGA, E. M. M.; SARABIA, J. M. Generalized
beta-generated distributions. Computational Statistics and Data Analysis, New York, v. 56,
p. 1880 1897, 2012.
ALZAATREH, A.; LEE, C.; FAMOYE, F. A new method for generating families of continuous
distributions. METRON, Milan, v. 71, p. 6379, 2013.
BRITO, E. de; SILVA, G. O.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The McDonald
Gumbel model. Communications Statistics - Theory and Methods, New York, 2014. In
press.
CHEN, G.; BALAKRISHNAN, N. A general purpose approximate goodness-of-t test.
Journal of Quality Technology, Milwaukee, v. 27, p. 154161, 1995.
CORDEIRO, G. M.; CASTRO, M. A new family of generalized distributions. Journal of
Statistical Computation and Simulation, New York, v. 81, p. 883898, 2011.
CORDEIRO, G. M.; NADARAJAH, S.; ORTEGA, E. M. M. The Kumaraswamy Gumbel
distribution. Statistical Methods and Aplications, Roma, v. 21, p. 139168, 2012.
EUGENE, N.; LEE, C.; FAMOYE, F. Beta-normal distribution and its applications.
Communications in Statistics - Theory and Methods, New York, v. 21, p. 497512, 2002.
GRADSHTEYN, I. S.; RYZHIK, I. M. Table of Integrals, Series and Products. 7th ed. San
Diego: Academic Press, 2007. 1162 p.
GUPTA, R. C.; GUPTA, P. L.; GUPTA, R. D. Modeling failure time data by Lehman
alternatives. Communications in Statistics - Theory and Methods, New York, v. 27, p.
887904, 1998.
GUPTA, R. D.; KUNDU, D. Exponentiated exponential family: An alternative to gamma and
Weibull distributions. Biometrical Journal, Berlin, v. 43, p. 117130, 2001.
JOHNSON, N. L.; KOTZ, S.; BALAKRISHNAN, N. Continuous Univariate Distributions.
2. ed. New York: John Wiley & Sons, 1995. 752 p.
MUDHOLKAR, G. S.; SRIVASTAVA, D. K. Exponentiated Weibull family for analyzing
bathtub failure-rate data. IEEE Transactions on Reliability, New York, v. 42, p. 299302,
1993.
50
NADARAJAH, S.; GUPTA, A. K. A generalized gamma distribution with application to
drought data. Mathematics and Computers in Simulation, Amsterdam, v. 74, p. 17, 2007.
NADARAJAH, S.; KOTZ, S. The beta Gumbel distribution. Mathematical Problems in
Engineering, Amsterdam, p. 323 332, 2004.
PERSSON, K.; RYDN, J. Exponentiated Gumbel distribution for estimation of return levels
of signicant wave height. Journal of Environmental Statistics, Los Angeles, v. 1, p. 112,
2010.
RNYI, A. On measures of entropy and information. In: BERKELEY SYMPOSIUM ON
MATHEMATICAL STATISTICS AND PROBABILITY, 4., 1961, Berkeley. Proceedings...
Berkeley: University of California Press, 1961. p. 547-561.
SHANNON, C. E. Prediction and entropy of printed english. The Bell System Technical
Journal, Short Hills, v. 30, p. 5064, 1951.
WAYLEN, P.; WOO, M.-K. Prediction of annual oods generated by mixed processes. Water
Resources Research, Washington, v. 18, p. 12831286, 1982.
51
4 DISTRIBUIO GAMA BURR XII: TEORIA E PRTICA
Resumo
Uma nova distribuio com quatro parmetros denominada gama Burr XII proposta. O
novo modelo possui como casos especiais alguns distribuies bem conhecidas e discutidas na
literatura, tais como as distribuies logstica e Burr XII, entre outras. Obtemos os momentos,
momentos incompletos, funes geradora e quantlica, desvios mdios, curvas de Bonferroni
e Lorenz e conabilidade. O mtodo de mxima verossimilhana utilizado para estimar os
parmetros do modelo. Determinamos a matriz de informao observada. Duas aplicaes
a dados reais demonstram que o novo modelo providencia melhor ajuste que as distribuies
Weibull exponencializada e beta Weibull (BRITO et al., 2014).
Palavras-chaves: Distribuio Burr XII; Distribuio gama-G; Matriz de informao obser-
vada; Mxima verossimilhana
Abstract
We propose a new four-parameter distribution called the gamma Burr XII distribution. The
new model contains as special cases some well-known distributions discussed in the literature
such as the logistic and Burr XII distributions, among several others. We obtain the moments,
incomplete moments, generating and quantile functions, mean deviations, Bonferroni and Lo-
renz curves and reliability. The method of maximum likelihood is used for estimating the model
parameters. We determine the observed information matrix. Two applications to real data de-
monstrate that the new model provides a better t than the exponentiated Weibull and beta
Weibull distributions (BRITO et al., 2014).
Keywords: Burr XII distribution; Gamma-G distribution; Maximum likelihood;
Observed information matrix
4.1 Introduo
Zimmer, Keats e Wang (1998) foram pioneiros em propor a distribuio Burr XII (BXII) com
trs parmetros com funo distribuio acumulada (cdf) e funo densidade de probabilidade
(pdf) (para x > 0) dadas por
G(x; s, k, c) = 1
[
1 +
(
x
s
)
c
]
k
(4.1)
e
g(x; s, k, c) = c k s
c
x
c1
[
1 +
(
x
s
)
c
]
k1
, (4.2)
respectivamente, em que k > 0 e c > 0 so parmetros de forma e s > 0 um parmetro de
escala. Se c > 1, a funo densidade unimodal com moda dada por x = s [(c1)/(ck+1)]
1/c
e tem forma de L se c = 1.
52
A distribuio BXII, tem como sub-modelos as distribuies logstica e Weibull e uma
distribuio muito popular para analisar dados de tempo de vida e fenmenos com taxa de falha
montona. Quando se modelam taxas de riscos montonas, a distribuio Weibull pode ser uma
escolha inicial devido a suas formas de densidades assimtricas positiva e negativa. No entanto,
ela no fornece um razovel ajuste paramtrico para taxas de falhas no-montonas, como a
forma de banheira ou unimodal, que so comuns em estudos biolgicos e de conabilidade. As
curvas em forma de banheira tm pores mdias quase planas e as densidades associadas tm
uma anti-moda positiva. As taxas de falhas unimodais podem ser observadas na evoluo de
uma doena cuja mortalidade atinge um pico, aps um certo perodo nito, e depois diminui,
gradualmente.
Devido s diferentes formas das distribuies de tempo de vida, diversos modelos tm sido
propostos nos ltimos anos. Assim, vrias generalizaes das clssicas distribuies foram
desenvolvidas. Uma delas consiste em incorporar uma distribuio a uma famlia maior por
meio da aplicao da transformada da probabilidade integral. Mais recentemente, Zografos e
Balakrishnan (2009) e Risti c e Balakrishnan (2012) propuseram uma famlia de distribuies
univariadas geradas por variveis aleatrias gama. Para uma qualquer cdf G(x) base, x R,
eles deniram a distribuio gama G com pdf f(x) e cdf F(x) dadas por
f
G
(x) =
1
(a)
{log[1 G(x)]}
a1
g(x) (4.3)
e
F
G
(x) =
(a, log [1 G(x)])
(a)
=
1
(a)

log[1G(x)]
0
t
a1
e
t
dt, (4.4)
respectivamente, parar a > 0, em que g(x) = dG(x)/dx, (a) =

0
t
a1
e
t
dt e (a, z) =

z
0
t
a1
e
t
dt denotam as funes gama e gama incompleta, respectivamente. Algumas de suas
propriedades matemticas foram estudadas por Nadarajah, Cordeiro e Ortega (2014).
Neste artigo, dene-se uma nova distribuio com quatro parmetros, a gama Burr XII (de
forma abreviada GBXII), pela insero de (4.1) na equao (4.4). A distribuio acumulada
da GBXII
F(x; ) =

(
a, k log
[
1 +
(
x
s
)
c
])
(a)
, (4.5)
enquanto sua pdf (para x > 0) pode ser expressa, das equaes (4.1), (4.2) e (4.3), como
f(x; ) =
c k
a
s
c
(a)
x
c1
[
1 +
(
x
s
)
c
]
k1
{
log
[
1 +
(
x
s
)
c
]}
a1
, (4.6)
em que = (a, s, k, c). A partir deste ponto, X GBXII(a, s, k, c) denota uma varivel
aleatria com funo densidade (4.6).
A motivao para introduzir a distribuio GBXII devido grande utilizao da distri-
buio BXII e o fato da generalizao atual proporcionar melhor ajuste a dados em situaes
mais complexas. A importncia de (4.6) que esta possui como casos especiais vrias distri-
buies bem conhecidas. Claramente, a distribuio BXII o modelo base para a = 1. Para
53
s = m
1
e k = 1, a GBXII reduz-se distribuio gama log-logstica (GLL). Para a = 1,
s = m
1
e k = 1, ela produz a distribuio log-logstica (LL), em que a funo de sobrevivn-
cia S(t; m, c) = [1 + (t m)
c
]
1
. Para c = 1 e a = c = 1, tem-se como casos especiais as
distribuies gama Pareto tipo II (GPaII) e Pareto tipo II (PaII), respectivamente. Se k ,
ela idntica distribuio gama Weibull (GW). Se k e adicionalmente a = 1, temos a
distribuio Weibull.
A distribuio GBXII no somente apropriada para modelar adequadamente taxas de fa-
lhas com forma unimodal, mas tambm adequada para testar o ajuste de seus sub-modelos,
tais como, as distribuies logstica e BXII. Algumas formas possveis da funo densidade
(4.6) para selecionados valores dos parmetros, incluindo distribuies bem conhecidas, so
apresentados na Figura 4.1.
A funo taxa de risco (hrf) da GBXII (para x > 0) dada por
(x; ) =
c k
a
s
c
x
c1
[
1 +
(
x
s
)
c
]
k1
{
log
[
1 +
(
x
s
)
c
]}
a1
(a)
(
a, k log
[
1 +
(
x
s
)
c
]) .
Algumas possveis curvas para taxas de risco da GBXII so mostradas na Figura 4.2 para
valores selecionados dos parmetros.
O artigo organizado como segue. Na Seo 4.2, encontram-se expanses para a pdf e a
cdf da distribuio GBXII. Demonstra-se que a funo densidade da GBXII pode ser expressa
como uma combinao linear de densidades BXII. Algumas propriedades matemticas de (4.6)
so apresentadas nas Sees 4.3 a 4.6. Na Seo 4.7, investiga-se estimao por mxima ve-
rossimilhana e determinam-se os elementos da matriz de informao observada. Na Seo
4.8, duas aplicaes para dados reais ilustram a potencialidade do novo modelo. A Seo 4.9
naliza o artigo com algumas concluses.
4.2 Expanses para a pdf e para a cdf
Algumas expanses para (4.5) e (4.6) podem ser encontradas, utilizando o conceito de distri-
buies exponencializadas. Para uma cdf G(x) base, dene-se uma varivel aleatria Y tendo
distribuio G exponencializada (exp-G) com parmetro de potncia > 0. Diz-se que
Y exp-G(, ), em que o vetor de parmetros de G, se suas cdf e pdf so dadas por
H(y) = G

(y) e h(y) = g(y) G


1
(y),
respectivamente. As propriedades das distribuies exponencializadas tm sido estudadas por
muitos autores recentemente. Ver, Mudholkar e Srivastava (1993) para Weibull exponenciali-
zada, Gupta, Gupta e Gupta (1998) para Pareto exponencializada, Gupta e Kundu (2001) para
exponencial exponencializada e Nadarajah e Gupta (2007) para gama exponencializada.
Para qualquer parmetro real a > 0, a frmula a seguir vlida (http:// functions.wolfram.com/
54
x
D
e
n
s
i
d
a
d
e
0 2 4
0
.
0
0
.
2
0
.
4
0
.
6
a = 2,0; s = 1,5; k = 2,0; c = 2,0
a = 1,0; s = 2,0; k = 2,0; c = 2,0
a = 2,0; s = 1,5; k = 2,0; c = 3,0
a = 3,0; s = 0,5; k = 1,0; c = 2,0
x
D
e
n
s
i
d
a
d
e
0 2 4 6 8
0
.
0
0
.
2
0
.
4
0
.
6
a = 0,7; s = 0,6; k = 0,3; c = 2,5
a = 1,0; s = 0,6; k = 0,5; c = 1,5
a = 5,0; s = 1,6; k = 2,5; c = 2,5
a = 15,0; s = 1,6; k = 2,5; c = 2,5
Figura 4.1 Funo densidade da GBXII para alguns valores dos parmetros
55
x
T
a
x
a

d
e

r
i
s
c
o
0 3 6 9 12 15
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
2
.
5
a = 1,0; s = 1,2; k = 1,4; c = 0,8
a = 1,0; s = 1,2; k = 1,4; c = 3,0
a = 1,0; s = 1,1; k = 1,4; c = 1,5
a = 1,0; s = 7,0; k = 1,4; c = 3,0
Figura 4.2 Funo taxa de risco da GBXII para alguns valores dos parmetros
ElementaryFunctions/ Log/ 06/ 01/ 04/ 03/)
{log [1 G(x)]}
a1
= (a 1)

i=0
(
i + 1 a
i
)
i

j=0
(1)
j+i
(
i
j
)
p
j,i
(a 1 j)
G(x)
a+i1
,
em que as constantes p
j,i
(para j 0) podem ser calculadas recursivamente por
p
j,i
= i
1
i

m=1
(1)
m
[m(j + 1) i]
m+ 1
p
j,im
para i = 1, 2, . . . e p
j,0
= 1.
Para uma parmetro real a > 0, dene-se
b
i
= b
i
(a) =
(
i + 1 a
i
)
(a + i)(a 1)
i

j=0
(1)
j+i
p
j,i
(a 1 j)
(
i
j
)
, (4.7)
e, ento, (4.3) pode ser expressa como
f(x) =

i=0
b
i
h
a+i
(x), (4.8)
56
em que h
a+i
(x) denota a funo densidade da exp-G(a + i). Ento, a equao (4.4) pode ser
expressa como
F(x) =

i=0
b
i
H
a+i
(x),
em que H
a+i
(x) denota a cdf de uma exp-G(a +i). Assim, vrias propriedades matemticas da
distribuio gama-G podem ser obtidas pelas propriedades j conhecidas da distribuio exp-G.
As propriedades da GBXII, tais como momentos e funo geradora, podem ser obtidas das
propriedades da distribuio Burr XII exponencializada (EBXII). A distribuio Kumaraswamy
Burr XII (KwBXII), recentemente estudada por Paranaba et al. (2013), tem como caso especial
a distribuio EBXII e, portanto, seus resultados podemser aplicadas para a distribuio GBXII.
A cdf e a pdf da distribuio EBXII (para z > 0) como parmetro de potncia a > 0 so
dadas, respectivamente, por
H
a
(z) =
{
1
[
1 +
(
z
s
)
c
]
k
}
a
e
h
a
(z) = a c k s
c
z
c1
[
1 +
(
z
s
)
c
]
k1
{
1
[
1 +
(
z
s
)
c
]
k
}
a1
. (4.9)
Seja Z EBXII(a, s, k, c) uma varivel aleatria com funo densidade (4.9). Utilizando
a expanso binomial (1 y)
a1
=

i=0
(1)
i
(
a1
i
)
y
i
para |y| < 1 e equaes (4.1) e (4.2), a
pdf (4.9) pode ser reescrita como
h
a
(z) =

l=0
(1)
l
a
(
a1
l
)
(l + 1)
g(z; s, (l + 1)k, c). (4.10)
Aqui, g(x; s, (l + 1)k, c) denota a funo densidade da BXII com parmetro de escala s e
parmetros de forma c e (l + 1)k. A equao (4.10) revela que a funo densidade da EBXII
uma combinao linear de densidades da BXII. Seja w
l
= (1)
l
a
(
a1
l
)
/(l + 1). Utilizando o
programa Mathematica, pode-se vericar que

l=0
w
l
= 1. Se a um inteiro, o ndice l para
em a 1. Integrando (4.10) tem-se
H
a
(z) =

l=0
w
l
G(z; s, (l + 1)k, c).
Combinando (4.8) e (4.10), a funo densidade de X torna-se
f(x) =

l=0

l
g(x; s, (l + 1)k, c), (4.11)
em que o coeciente
l
dado por

l
=
1
l + 1

i=0
b
i
(a + i)
(
a + i 1
l
)
, (4.12)
57
e b
i
dado por (4.7). Integrando (4.11) tem-se
F(x) =

l=0

l
G(x; s, (l + 1)k, c). (4.13)
As equaes (4.11) e (4.13) so os principais resultados desta seo. Assim, algumas pro-
priedades estruturais da GBXII podem ser obtidas das propriedades da BXII.
4.3 Momentos e Funo Geradora
Algumas das mais importantes caractersticas de uma distribuio podem ser obtidas usando
momentos (por exemplo, tendncia, disperso, assimetria e curtose). O q-simo momento
de uma varivel aleatria BXII Z com parmetro de escala s e parmetros de forma c e k
E(Z
q
) = s
q
k B(k q c
1
; q c
1
+ 1) , q < k c (PARANABA, 2012), em que B(a, b) =

1
0
t
a1
(1 t)
b1
a dt a funo beta.
Da equao (4.11), pode-se escrever (para q < c k)

q
= E(X
q
) = k s
q

l=0

l
(l + 1) B
(
(l + 1)k q c
1
, q c
1
+ 1
)
. (4.14)
Grcos de assimetria e curtose para valores selecionados de a so apresentados na Figura
4.3. Estes grcos revelam um grande impacto de k, c e a na assimetria e curtose de X.
Os momentos centrais (
s
) e os cumulantes (
s
) de X podem ser determinados de (4.14)
como

s
=
k

k=0
(1)
k
(
s
k
)

k
1

sk
and
s
=

s1

k=1
(
s 1
k 1
)

sk
,
respectivamente, em que
1
=

1
. Ento,
2
=

2

2
1
,
3
=

3
3

1
+ 2
3
1
,
4
=

4
4

1
3
2
2
+ 12

2
1
6
4
1
, etc. A assimetria
1
=
3
/
3/2
2
e a curtose
2
=
4
/
2
2
podem ser calculadas utilizando os terceiro e quarto cumulantes padronizados.
Para modelos de tempo de vida, geralmente, existe interesse emcalcular o h-simo momento
incompleto de X dado por T
h
(y) =

y
0
x
h
f(x)dx. A quantidade T
h
(y) pode ser determinada
de (4.11) como
T
h
(y) =

l=0

y
0
x
h
g(x; s, (l + 1)k, c) dx.
Utilizando os resultados de Paranaba et al. (2013), tem-se
T
h
(y) = k s
h

l=0

l
B s
c
s
c
+y
c
((l + 1)k hc
1
, 1 + hc
1
), (4.15)
em que B
z
(a, b) =

z
0
t
a1
(1 t)
b1
dt a funo beta incompleta.
58
s = 5
0 2 4 6 8
0
2
0
4
0
6
0
8
0
1
0
0
a
A
s
s
i
m
e
t
r
i
a
k=0,5; c=0,5
k=1,5; c=1,0
k=1,0; c=2,0
k=0,5; c=3,0
s = 3
0 1 2 3 4 5 6
0
2
0
4
0
6
0
8
0
1
0
0
a
C
u
r
t
o
s
e
k=0,5; c=0,5
k=1,5; c=1,0
k=1,0; c=2,0
k=0,5; c=3,0
Figura 4.3 Assimetria e curtose da distribuio GBXII como funo de a para alguns valores
de k e c
Seja M
k
(t) a funo geradora da distribuio BXII(s, k, c). A funo geradora de momentos
59
(mgf) M(t) de X pode ser obtida de (4.11) como
M(t) =

l=0

l
M
(l+1)k
(t). (4.16)
Paranaba et al. (2013) providenciaram uma representao simples para M
k
(t) usando a
funo Meijer G denida por
G
m,n
p,q
(
x

a
1
, . . . , a
p
b
1
, . . . , b
q
)
=
1
2i

L
m

j=1
(b
j
+ t)
n

j=1
(1 a
j
t)
p

j=n+1
(a
j
+ t)
p

j=m+1
(1 b
j
t)
x
t
dt,
em que i =

1 a unidade complexa e L denota a regio de integrao; ver Section 9.3


em Gradshteyn e Ryzhik (2007) para uma descrio desta regio. A funo Meijer G contm
como casos particulares diversas integrais com funes elementares e especiais (PRUDNIKOV;
BRYCHKOV; MARICHEV, 1986). Eles assumem que t < 0 e c = m/k, em que m e k so
inteiros positivos. Utilizando a integral (1) do Apndice APNDICE B - , tem-se
M
k
(t) = mI
(
s t,
m
k
1,
m
k
, k 1
)
. (4.17)
Esta condio no restritiva uma vez que qualquer nmero real positivo pode ser aproxi-
mado por um nmero racional. Por isso, para t < 0, a funo geradora de X segue de (4.16)
como
M(t) = m

l=0

l
I
(
s t,
m
(l + 1)k
1,
m
(l + 1)k
, (l + 1)k 1
)
. (4.18)
As equaes (4.14), (4.15) e (4.18) so os principais resultados desta seo.
4.4 Funo Quantlica
A funo quantlica da GBXII, para 0 < u < 1, Q(u) = F
1
(u), pode ser determinada como
Q(u) = s
[
(
exp
{
Q
1
[a, u (u)]
})
1/k
1
]
1/c
, (4.19)
em que Q
1
(a, u) a funo inversa de Q(a, x) =

x
w
a1
e
w
dw. Assim, segue imediata-
mente que a mediana M de X dada por
Q(u) = s
(
{
exp
[
Q
1
(
a,

/2
)]}
1/k
1
)
1/c
.
60
4.5 Desvios Mdios
Aqui, determinam-se as medidas: desvios mdios e curvas de Lorenz e Bonferroni. Quanticar
a disperso em uma populao pode ser medida, evidentemente, pelo conjunto de desvios da
mdia ou da mediana. Essas medidas so conhecidas como desvios mdios em torno da mdia
e da mediana denidos por

1
(X) = 2

1
F(

1
) 2T
1
(

1
) e
2
(X) =

1
2T
1
(M),
respectivamente, em que

1
= E(X), a mediana M de X determinada explicitamente de
(4.19) por M = Q(1/2), F(M) e F(

1
) so obtidos de (4.5) e T
1
(q) =

q
0
xf(x)dx o
primeiro momento incompleto de X dado por (4.15) com h = 1. De (4.11) tem-se
T
1
(q) = c k

l=0
(l + 1)
l


q
(
x
s
)
c
[
1 +
(
x
s
)
c
]
(l+1)k1
dx.
Fazendo u = (
x
s
)
c
, obtm-se
T
1
(q) = k s

l=0
(l + 1)
l


(q/s)
c
u
1/c
(1 + u)
(l+1)k1
du.
A integral que se segue (para q > 0 1 k > 0) calculada utilizando o Maple
J(q, r, k) =


q
u
r
(1 + u)
k
du
=
[
2
F
1
[(k, r + 1); (2 + r); q] q
r+1
(r + 1)
+
(k r 1) csc(r)
(k)(r)
]
,
em que
2
F
1
a funo hipergeomtrica denida por
2
F
1
(a, b; c; x) =

k=0
(a)
k
(b)
k
(c)
k
x
k
k!
.
Portanto,
T
1
(q) = k s

l=0
(l + 1)
l
J
(
(
q
s
)
c
,
1
c
, (l + 1)k + 1
)
(4.20)
e as medidas
1
(X) e
2
(X) so imediatamente determinadas de (4.20).
A quantidade T
1
(q) utilizada para fazer grcos das curvas de Lorenz e Bonferroni em
reas como economia, conabilidade, demograa, seguros e medicina. Para uma dada proba-
bilidade , elas so denidas por L() = T
1
(q)/

1
e B() = T
1
(q)/(

1
), respectivamente,
em que q = Q() calculada diretamente de (4.19). A Figura 4.4 mostra as curvas de Lorenz e
Bonferroni para valores selecionados dos parmetros. As curvas so crescentes com o aumento
dos valores de .
61
L()
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0

L
(

)
a=0,5
a=1,5
a=2,0
a=5,0
B()
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0

B
(

)
a=0,5
a=1,5
a=2,0
a=5,0
Figura 4.4 Curvas de Lorenz e Bonferroni para s = 2, k = 4 e c = 1
4.6 Conabilidade
No contexto de conabilidade, o modelo fora-tenso descreve o tempo de vida de um compo-
nente que tem uma fora aleatria X
1
e submetido a uma tenso aleatrio X
2
. O componente
62
falha no instante em que a tenso aplicada a ele excede a fora e o componente ir funcionar
satisfatoriamente quando X
1
> X
2
. Assim, R = Pr(X
2
< X
1
) a medida da conabili-
dade do componente. Possui muitas aplicaes, especialmente nos conceitos de engenharia. A
seguir, determina-se a conabilidade R =

0
f
1
(x) F
2
(x)dx quando X
1
e X
2
so independen-
tes com distribuies GBXII(a
1
, s, k
1
, c) e GBXII(a
2
, s, k
2
, c), respectivamente, com o mesmo
parmetro de forma c e mesmo parmetro de escala s.
A pdf de X
1
e a cdf de X
2
so obtidas das equaes (4.11) e (4.13) como
f
1
(x) =

l=0

l
(a
1
) g(x; s, (l + 1)k
1
, c)
e
F
2
(x) =

t=0

t
(a
2
) G(x; s, (t + 1)k
2
, c),
respectivamente, em que as quantidades
l
(a
1
) e v
t
(a
2
) so calculadas de (4.12). Portanto,
R =

l,t=0

l
(a
1
)
t
(a
2
) I(c, s, k
1
, k
2
, l, t),
em que
I(c, s, k
1
, k
2
, l, t) = k
1
(l + 1)


0
c x
c1
s
c
{
1
[
1 +
(
x
s
)
c
]
k
2
(t+1)
}
[
1 +
(
x
s
)
c
]
k
1
(l+1)1
dx.
Fazendo u = 1 + (x/s)
c
, tem-se
I(c, s, k
1
, k
2
, l, t) =
k
2
(t + 1)
k
1
(l + 1) + k
2
(t + 1)
,
e, ento, R pode ser calculada.
4.7 Estimao
Seja T
i
uma varivel aleatria com funo densidade (4.6) e = (a, s, k, c)
T
o vetor param-
trico. Os dados encontrados em estudos de anlise de sobrevivncia e em conabilidade so
frequentemente censurados. Um mecanismo de censura aleatria muito simples, e muitas vezes
realista, aquele em que se assume que cada indivduo i tem um tempo de vida til T
i
e um
tempo de censura C
i
, em que T
i
e C
i
so variveis aleatrias independentes. Suponha que os
dados consistem de n observaes independentes e X
i
= min(T
i
, C
i
) para i = 1, . . . , n. A dis-
tribuio de C
i
no depende de qualquer parmetro desconhecido de T
i
. Tcnicas paramtricas
para esses dados, normalmente, so baseadas em mtodos de estimao por verossimilhana e
teoria assinttica. O logaritmo da funo de verossimilhana com censura l() para os parme-
63
tros do modelo
() = r [log(c) + a log(k) c log(s)] n log[(a)] + (c 1)

iF
log(x
i
)
(k + 1)

iF
log (u
i
) + (a 1)

iF
log [log (u
i
)]
+

iC
log {(a) (a, k log [u
i
])}, (4.21)
emque u
i
= 1+(x
i
/s)
c
, r o nmero de falhas e F e C denotamo conjunto de observaes no-
censuradas e censuradas, respectivamente. As funes escore para os parmetros do modelo so
U
a
() = n(a) + r log(k) +

iF
log [log (u
i
)]
+

iC

log[log(u
i
)] Q(a, log[u
i
]) + G
3,0
2,3
(
log[u
i
]

1, 1
0, 0, a
)
Q(a, log[u
i
])

,
U
s
() =
r c
s

c (a 1)
s

iF
w
i
log(u
i
)
+
c (k 1)
s

iF
w
i
+
c
s

iC
[log(u
i
1)]
a1
u
i
Q(a, log[u
i
])
,
U
k
() =
a r
k

iF
log(u
i
),
e
U
c
() =
r
c
r log(s) +

iF
log(x
i
) (k + 1)

iF
v
i
u
i
+ (a 1)

iF
v
i
u
i
log(u
i
)

iC
v
i
[log(u
i
)]
a1
u
2
i
Q(a, log[u
i
])
,
em que u
i
= 1 + (x
i
/s)
c
, v
i
= (x
i
s
1
)
c
log(x
i
s
1
), w
i
= (u
i
1)/u
i
e (s) = d log (s)/ds
a funo digama.
O estimador de mxima verossimilhana (MLE)

de obtido pela soluo das equaes
no lineares U
a
() = 0, U
s
() = 0, U
k
() = 0 e U
c
() = 0. Essas equaes no podem ser
resolvidas analiticamente e requerem um programa estatstico com tcnicas numricas iterati-
vas. As avaliaes numricas foram implementadas utilizando o R verso 3.0.0 (pacote bbmle).
Para estimao intervalar e testes de hipteses para os parmetros do modelo, determina-se a
matriz de informao observada 4 4 pois sua esperana requer integrao numrica. A matriz
de informao observada J() = {J
pq
()}, em que p, q = a, s, c and k. Os elementos
J
pq
() so dados no Apndice APNDICE C - .
64
4.8 Aplicaes
Nesta seo, ajustam-se as distribuies GBXII, BXII, log-logstica (LL), Weibull exponencia-
lizada (EW) e beta Weibull (BW) a dois conjuntos de dados reais. A distribuio BW tem pdf
f(x; a, b, , ) = [/B(a, b)] x
1
exp(b x

)[1 exp(x

)]
a1
, para x > 0. O modelo
EW obtido fazendo a = 1. Para estimar os parmetros destes modelos especiais, adota-se o
mtodo de mxima verossimilhana com as avaliaes computacionais realizadas utilizando o
pacote bbmle do R verso 3.0.0.
4.8.1 Aplicao 1: Dados de quebra por tenso
Os dados no-censurados de Nichols e Padgett (2006) denotam a quebra por tenso de bras
de carbono (em GPa). A Tabela 4.1 lista os MLEs e correspondentes erros padro estimados
(SEs), os valores do critrio de informao de Akaike (AIC), do critrio de informao de
Akaike corrigido (CAIC) e do critrio bayesiano de Schwarzs (BIC) para os dados atuais. Os
trs critrios de informao auxiliam na classicao dos modelos. Os valores menores desses
critrios correspondem distribuio GBXII, que pode ser escolhido neste caso. Alm disso,
calculam-se as estatsticas de qualidade de ajuste de Cramr-von Mises (W

) e de Anderson-
Darling (A

) a m de vericar qual modelo ajusta melhor a esses dados. As estatsticas W

e A

so descritas por Chen e Balakrishnan (1995). Quanto menor forem os valores dessas
estatsticas, melhor ser o ajuste. Os valores das estatsticas W

e A

para os cinco modelos


ajustados so apresentados na Tabela 4.2. Com base nestes valores, o modelo GBXII ajusta-
se melhor a esses dados entre os modelos testados e, portanto, poderia ser escolhido como o
melhor modelo.
Tabela 4.1 MLEs, correspondentes SEs (dados entre parnteses) e as estatsticas AIC, BIC e
CAIC para a quebra por tenso em bras de carbono
Distribuio a s k c AIC CAIC BIC
BXII 1 18,4087 483,4027 3,4453 178,1370 178,5241 184,7060
- (3,0505) (0,0342) (0,3325)
GBXII 0,2190 3,4394 0,4522 12,9981 177,5644 178,2201 186,3230
(0,1105) (0,2216) (0,4182) (5,8771)
Distribuio s m
LL 2,7109 4,8958 187,2905 187,4810 191,6698
(0,1161) (0,5137)
Distribuio a b
EW 0,8004 1 3,9109 0,3095 177,8894 178,2765 184,4584
(0,3534) - (1,0688) (0,0331)
BW 0,7602 7,0203 4,0690 0,1860 179,8368 180,4925 188,5954
(0,3681) (0,0016) (1,2702) (0,0100)
O histograma dos dados e as curvas ajustadas das funes densidades da BXII, da LL e
da GBXII so apresentadas na Figura 4.5. De fato, pode-se concluir que a distribuio GBXII
65
Tabela 4.2 Estatsticas de qualidade de ajuste para a quebra por tenso em bras de carbono
Modelo W

BXII 0,0930 0,5261


GBXII 0,0344 0,2201
LL 0,2592 1,3924
EW 0,0858 0,5085
BW 0,0846 0,5041
fornece o melhor ajuste para estes dados.
Tenso
D
e
n
s
i
d
a
d
e
0 1 2 3 4 5
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
0
.
6
BXII
LL
GBXII
Figura 4.5 Histograma e funes densidades BXII, LL e GBXII ajustadas para os dados de
quebra por tenso em bras de carbono
4.8.2 Aplicao 2: Dados de tempo de remisso
Os dados censurados utilizados representam o tempo de remisso (em meses) de 137 pacientes
com cncer e so apresentados em Lee e Wang (2003, Ex. 9.3). A Tabela 4.3 lista os MLEs e
correspondentes erros padro estimados (SEs), os valores das estatsticas AIC, CAIC e BIC para
os modelos ajustados. Os trs critrios de informao auxiliam na classicao dos modelos. O
menos valor para dois destes critrios corresponde a distribuio GBXII.
Os valores das estatsticas W

e A

para os sete modelos ajustados so apresentados na


Tabela 4.4. Com base nesses valores, o modelo GBXII mostra um ajuste comparvel com o
66
Tabela 4.3 MLEs, correspondentes SEs (dados entre parnteses) e as estatsticas AIC, BIC e
CAIC para os tempos de remisso
Distribuio a s k c AIC CAIC BIC
BXII 1 7,6594 1,2166 1,6930 845,0593 845,2398 853,8193
- (2,8676) (0,4987) (0,2379)
GBXII 0,7949 11,0549 1,3903 1,6884 844,8096 845,1127 856,4896
(0,5623) (5,1636) (1,6043) (0,9278)
Distribuio s m
LL 6,4633 1,6900 843,7586 843,8481 849,5986
(0,5699) (0,1249)
Distribuio
Exponencial(E) 0,1000 847,4598 847,4894 850,3798
(0,0088)
Distribuio a b
W 1 1 1,0535 0,0981 848,8293 848,9189 854,6693
- - (0,0681) (0,0086)
EW 2,7569 1 0,6533 0,2774 844,4500 844,6305 853,2099
(1,2681) - (0,1396) (0,1603)
BW 2,6290 0,8095 0,6791 0,3256 846,4370 846,7400 858,1169
(1,5277) (1,3766) (0,2534) (0,4401)
ajuste do modelo BXII. O modelo GBXII pode ser escolhido como o melhor modelo entre os
ajustados.
Tabela 4.4 Estatsticas de qualidade de ajuste para os tempos de remisso
Modelo W

BXII 0,0235 0,1841


GBXII 0,0208 0,1299
LL 0,0381 0,2908
E 0,1221 0,7041
W 0,1358 0,7825
EW 0,0449 0,2839
BW 0,0447 0,2831
O histograma dos dados e as curvas ajustadas das funes densidades da BXII e GBXII so
apresentados na Figura 4.6. Conclui-se que a distribuio GBXII ajusta-se melhor a esses dados
do que a distribuio BXII.
4.9 Concluses
Dene-se e estuda-se um novo modelo de tempo de vida com quatro parmetros denominado
distribuio gama Burr XII (GBXII), que estende algumas distribuies de tempo de vida bem
conhecidas. A nova distribuio contm como modelos especiais as distribuies logstica, Burr
XII e Weibull, entre outras. Devido sua exibilidade emacomodar diferentes formas da funo
67
Tempo remisso
D
e
n
s
i
d
a
d
e
0 10 20 30 40 50 60 70 80
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
BXII
GBXII
Figura 4.6 Histograma e funes densidades BXII e GBXII ajustadas para os dados de tempos
de remisso
68
risco, o novo modelo uma importante distribuio para dados de tempo de vida. Apresenta-se
um tratamento matemtico da GBXII incluindo uma expanso til para a sua funo densidade.
So obtidas expresses de forma fechada para os momentos, momentos incompletos, funo
geradora e desvios mdios, de forma geral para qualquer valor dos parmetros. Em duas apli-
caes a dados reais, a nova distribuio ajustou-se melhor aos dados do que modelos de tempo
de vida conhecidos.
Referncias
BRITO, E. de; SILVA, G. O.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The gamma Burr XII
distribution: Theory and practice. Journal of Data Science, Taipei, 2014. In press.
CHEN, G.; BALAKRISHNAN, N. A general purpose approximate goodness-of-t test.
Journal of Quality Technology, Milwaukee, v. 27, p. 154161, 1995.
GRADSHTEYN, I. S.; RYZHIK, I. M. Table of Integrals, Series and Products. 7th ed. San
Diego: Academic Press, 2007. 1162 p.
GUPTA, R. C.; GUPTA, P. L.; GUPTA, R. D. Modeling failure time data by Lehman
alternatives. Communications in Statistics - Theory and Methods, New York, v. 27, p.
887904, 1998.
GUPTA, R. D.; KUNDU, D. Exponentiated exponential family: An alternative to gamma and
Weibull distributions. Biometrical Journal, Berlin, v. 43, p. 117130, 2001.
LEE, E. T.; WANG, J. Statistical Methods for Survival Data Analysis. 3rd ed. New Jersey:
Wiley, 2003. 513p.
MUDHOLKAR, G. S.; SRIVASTAVA, D. K. Exponentiated Weibull family for analyzing
bathtub failure-rate data. IEEE Transactions on Reliability, New York, v. 42, p. 299302,
1993.
NADARAJAH, S.; CORDEIRO, G. M.; ORTEGA, E. M. M. The Zografos-Balakrishnan-G
family of distributions: Mathematical properties and applications. Communications Statistics
- Theory and Methods, New York, 2014. In press.
NADARAJAH, S.; GUPTA, A. K. A generalized gamma distribution with application to
drought data. Mathematics and Computers in Simulation, Amsterdam, v. 74, p. 17, 2007.
NICHOLS, M. D.; PADGETT, W. J. A bootstrap control chart for Weibull percentiles. Quality
and Reliability Engineering International, Chichester, v. 22, p. 141151, 2006.
PARANABA, P. F. Caracterizao e extenses da distribuio Burr XII: propriedades e
aplicaes. 2012. 143 p. Tese (Doutorado em Estatstica e Experimentao Agronmica)
Escola Superior de Agricultura Luiz de Queiroz, Universidade So Paulo, Piracicaba, 2012.
69
PARANABA, P. F.; ORTEGA, E. M. M.; CORDEIRO, G. M.; de Pascoa, M. A. R. The
Kumaraswamy Burr XII distribution: theory and practice. Journal of Statistical Computation
and Simulation, New York, v. 83, p. 21172143, 2013.
PRUDNIKOV, A. P.; BRYCHKOV, Y. A.; MARICHEV, O. I. Integrals and Series. New York:
Gordon and Breach Science Publishers, 1986. 527 p.
______. Integrals and Series. New York: Gordon and Breach Science Publishers, 1992. 619
p.
RISTI

C, M. M.; BALAKRISHNAN, N. The gamma-exponentiated exponential distribution.


Journal of Statistical Computation and Simulation, New York, v. 82, p. 11911206, 2012.
ZIMMER, W. J.; KEATS, J. B.; WANG, F. K. The Burr XII distribution in reliability analysis.
Journal of Quality Technology, Milwaukee, v. 30, p. 386394, 1998.
ZOGRAFOS, K.; BALAKRISHNAN, N. On families of beta- and generalized gamma-
generated distributions and associated inference. Statistical Methodology, Amsterdan, v. 6, p.
344362, 2009.
70
pular pagina
71
5 FAMLIA MARSHALL-OLKIN BINOMIAL NEGATIVA:
TEORIA E APLICAO
Resumo
Estudam-se as propriedades matemticas gerais de um novo gerador de distribuies cont-
nuas com trs parmetros extras denominada famlia Marshall-Olkin binomial negativa. Apre-
sentam-se alguns modelos especiais. A funo densidade da nova famlia pode ser expressa
como uma combinao linear de densidades da distribuio base exponencializada. Expresses
explcitas para os momentos ordinrios e incompletos, para as funes quantlica e geradora,
para as curvas de Bonferroni e Lorenz, para as entropias de Shannon e Rnyi e estatsticas de or-
dem, para um modelo base qualquer, so determinadas. Discute-se a estimao dos parmetros
dos modelo por mxima verossimilhana e ilustra-se a importncia da nova famlia por meio de
uma aplicao a dados reais, em que um caso especial da famlia proporciona um melhor ajuste
do que outros modelos bem conhecidos com o mesmo nmero de parmetros (BRITO et al.,
2014).
Palavras-chaves: Desvio mdio; Distribuio Marshall-Olkin; Estimao; Funo geradora;
Momento
Abstract
We introduce and study general mathematical properties of a new generator of continuous
distributions with three extra parameters called the Marshall-Olkin negative binomial family.
We present some special models. The family density function can be expressed as a linear com-
bination of exponentiated densities based on the same baseline distribution. Explicit expressi-
ons for the ordinary and incomplete moments, quantile and generating functions, Bonferroni
and Lorenz curves, Shannon and Rnyi entropies and order statistics, which hold for any base-
line model, are determined. We discuss the estimation of the model parameters by maximum
likelihood and illustrate the importance of the family by means of an application to real data,
where one member of the family provides a better t than other well-known models with the
same number of parameters.
Keywords: Estimation; Generating function; Marshall-Olkin distribution;
Mean deviation; Moment
5.1 Introduo
Distribuies generalizadas tm sido amplamente estudadas em estatstica e diversos autores
desenvolveram diferentes classes de distribuies. Percontini, Cordeiro e Bourguignon (2013)
deniram uma classe de distribuies generalizadas com funo distribuio acumulada (cdf)
expressa como
F(x) =
(1 )
s
{1 [1 G(x)]}
s
[(1 )
s
1]
, (5.1)
72
em que s > 0, 0 < < 1, G(x) a cdf base e g(x) = dG(x)/dx. A classe de distribuies
(5.1) chamada de classe G-binomial negativa. Ela inclui como caso especial a distribuio G
quando s = 1 e 0.
Dene-se a famlia Marshall-Olkin binomial negativa (MONB) inserindo a cdf da distribui-
o Marshall-Olkin, dada por H
MO
(x), no lugar de G(x) na equao (5.1)
H
MO
(x) =
G(x; )
1 (1 p) G(x; )
, (5.2)
em que p > 0, G(x; ) = 1 G(x; ) e G(x; ) a cdf base, que depende de um vetor
de parmetros . A famlia (5.2) tem a propriedade que o mnimo da soma de variveis ale-
atrias geomtricas com distribuio na famlia tambm tem como distribuio essa famlia
(MARSHALL; OLKIN, 1997).
Assim, a cdf da MONB dada por
F(x) =
(1 )
s

{
1
p G(x; )
1 (1 p)G(x; )
}
s
(1 )
s
1
. (5.3)
A funo densidade de probabilidade (pdf) correspondente a (5.3) ca reduzida a
f(x) =
s p g(x, )
[
1 (1 p)G(x; )
]
s1
[(1 )
s
1]
{
1 [1 p(1 )] G(x; )
}
s+1
, (5.4)
em que g(x; ) = dG(x; )/dx. A partir daqui, seja X MONB-G(s, p, , ) uma varivel
aleatria com pdf (5.4).
A funo razo de risco (hrf) de X dada por
(x) =
s p g(x, ) (x, )
(s+1)
[
1 p G(x, )
]
(x, )
[
1 p G(x, )
]
s+1
,
em que (x, ) =
{
1 G(x, ) [1 p (1 )]
}
.
A famlia MONB-G bem motivada para aplicaes em engenharia e na indstria. Con-
sidere que a falha de um dispositivo ocorre devido presena de um nmero desconhecido N
de defeitos iniciais do mesmo tipo, que podem ser identicados somente depois da falha e so
reparados perfeitamente. Seja X
i
o tempo para a falha do dispositivo devido ao i-simo defeito,
para i 1. Assumindo que os X
i
s so variveis aleatrias e independentes iid de N com dis-
tribuio MO-G, ento, o tempo para a primeira falha adequadamente modelado pela famlia
MONB-G. Para os estudos de conabilidade, a varivel aleatria X = Min{X
i
}
N
i=1
pode ser
usada em um sistema em srie com componentes idnticos frequentemente aplicados nas reas
de engenharia e industrial.
O objetivo deste trabalho obter algumas propriedades matemticas de (5.4) para qualquer
distribuio G base. Na Seo 5.2, apresentam-se alguns casos especiais da nova famlia. A
Seo 5.3 apresenta as expanses para a pdf e a cdf. Na Seo 5.4, determina-se a funo
73
quantlica (qf) de X. Expresses explcitas para os momentos ordinrios, funo geradora de
momentos (mgf), desvios mdios, entropia de Shannon, entropia de Rnyi e estatstica de ordem
so apresentadas nas Sees 5.5 5.8. A estimao dos parmetros do modelo, utilizando o
mtodo de mxima verossimilhana, descrita na Seo 5.9. Uma aplicao a dados reais
apresentada na Seo 5.10. Finalmente, algumas concluses so apresentadas na Seo 5.11.
5.2 Distribuies especiais MONB-G
A densidade da famlia MONB (5.4) permite maior exibilidade nas caudas da distribuio e
pode ser aplicada emdiversas reas. Anova famlia estende vrias distribuies bemconhecidas
na literatura. Assim, apresentam-se alguns de seus casos especiais. A funo densidade (5.4)
melhor empregada quando a cdf G(x; ) e a pdf g(x; ) tm expresses analticas simples.
5.2.1 Distribuio Marshall-Olkin binomial negativa gama (MONBGa)
A funo distribuio acumulada da gama (para x > 0) com parmetro de forma a > 0 e
parmetro de escala b > 0 dada por
G(x) =
(a, x/b)
(a)
,
em que (a) =

0
w
a1
e
w
dw e (a, x) =

x
0
w
a1
e
w
dw so as funes gama e gama
incompleta, respectivamente. A funo densidade de uma varivel aleatria X com distribuio
MONBGa reduz-se a
f(x; s, p, , a, b) =
s p x
a1
e
x/b
[
p +
(1p) (a,x/b)
(a)
]
s1
b
a
(a) [(1 )
s
1] {p (1 ) + [1 p (1 )
(a,x/b)
(a)
]}
s+1
.
Alguns grcos da funo densidade e da taxa de risco da MONBGa so apresentados na Figura
5.1.
5.2.2 Distribuio Marshall-Olkin binomial negativa Frchet (MONBFr)
Considere a distribuio Frchet (para x, a, b > 0) comcdf e pdf dadas por G(x) = exp[(b/x)
a
]
e g(x) = a b
a
x
a1
exp[(b/x)
a
], respectivamente.
A distribuio MONBFr, para x > 0, tem pdf dada por
f(x; s, p, , a, b) =
a s p b
a
x
a1
e
(b/x)
a
[p + (1 p) e
(b/x)
a
]
s1
[(1 )
s
1] {p (1 ) + [1 p (1 )] e
(b/x)
a
}
s+1
, (5.5)
em que a > 0 um parmetro de forma e b > 0 um parmetro de escala. Grcos de (5.5) e
da funo taxa de risco para valores selecionados dos parmetros so mostrados na Figura 5.2.
74

x
D
e
n
s
i
d
a
d
e
0 20 40 60 80 100
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
s= 5,0; p=5,0; = 0,5; a=10,0; b=5,0
s= 4,0; p=7,0; = 0,4; a= 4,0; b=10,0
s=10,0; p=0,4; = 0,1; a=20,0; b=2,0
s= 1,0; p=0,2; = 10
4
; a= 2,5; b=15,0

x
T
a
x
a

d
e

r
i
s
c
o
0 2 4 6 8 10
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
s=0,2; p=1,5; = 0,4; a=0,8; b=6,0
s=0,2; p=1,0; = 0,7; a=2,0; b=1,5
s=0,8; p=0,2; = 0,01; a=1,5; b=6,0
s=2,0; p=0,4; = 0,01; a=3,0; b=1,5
Figura 5.1 Densidade e taxa de risco da MONBGa para alguns valores dos parmetros
5.2.3 Distribuio Marshall-Olkin binomial negativa log-logstica (MONBLL)
A pdf e a cdf da distribuio log-logstica (LL) so (para x, a, b > 0)
g(x) = b a
b
x
b1
[
1 +
(
x
a
)
b
]
2
e G(x) = 1
[
1 +
(
x
a
)
b
]
1
.
75

x
D
e
n
s
i
d
a
d
e
0 4 8 12 16 20
0
.
0
0
.
1
0
.
2
s= 25; p=15; = 0,2; a=4,5; b=6,0
s= 2; p=10; = 0,01; a=2,0; b=2,0
s=0,6; p=4; = 0,8; a=1,5; b=4,0
s= 1; p=20; = 0,5; a=1,7; b=1,4

x
T
a
x
a

d
e

r
i
s
c
o
0 2 4 6 8 10
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
1
.
0
1
.
2
s=0.4; p=5.0; = 0,9; a=0,8; b=2,0
s=0.2; p=1.0; = 0,7; a=1,0; b=3,5
s=0.8; p=0.2; = 0,01; a=1,5; b=6,0
s=3.0; p=4.0; = 0,1; a=3,0; b=1,0
Figura 5.2 Densidade e taxa de risco da MONBFr para alguns valores dos parmetros
Inserindo essas expresses em (5.4) tem-se a pdf da MONBLL (para x > 0)
f(x; s, p, , a, b) =
b s p (x/a)
b1
[p + (x/a)
b
]
s1
a [(1 )
s
1] [p (1 ) + (x/a)
b
]
s+1
.
A distribuio LL surge para s = 1, p = 0 e 0. Grcos da funo densidade e da taxa de
76
risco da MONBLL para alguns valores dos parmetros so apresentados na Figura 5.3.

x
D
e
n
s
i
d
a
d
e
0 1 2 3 4 5
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
s=0,2; p= 1,5; = 0,4; a=0,8; b= 2,0
s=1,0; p= 1,0; = 0,02; a=2,0; b= 5,0
s=0,8; p=20,0; = 0,9; a=3,0; b=20,0
s=0,8; p= 0,4; = 0,9; a=3,0; b=20,0

x
T
a
x
a

d
e

r
i
s
c
o
0 5 10 15 20 25
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
s= 2,0; p=10,0; = 0,01; a= 2,0; b= 2,0
s= 0,2; p= 2,0; = 0,1; a=10,0; b= 4,0
s= 5,0; p=40,0; = 0,7; a= 6,0; b= 5,0
s=0,01; p=10,0; = 0,4; a= 0,8; b= 1,5
Figura 5.3 Densidade e taxa de risco da MONBLL para alguns valores dos parmetros
77
5.2.4 Distribuio Marshall-Olkin binomial negativa Weibull (MONBW)
Se G(x) a cdf da Weibull com parmetro de escala a > 0 e parmetro de forma b > 0, tem-se
G(x) = 1 exp[(a x)
b
] e a pdf (para x > 0) da distribuio MONBW dada por
f(x; s, p, , a, b) =
b s p a
b
e
(a x)
b
[
1 (1 p) e
(a x)
b
]
s1
[(1 )
s
1]
{
1 [1 p (1 )] e
(a x)
b
}
s+1
.
A Figura 5.4 apresenta algumas possveis formas da funo densidade e da taxa de risco da
MONBW.
5.3 Expanses teis
Usando a equao (13) de Percontini, Cordeiro e Bourguignon (2013), expanses para a pdf
e cdf da classe MO dadas em Barreto-Souza, Lemonte e Cordeiro (2013) e uma equao para
uma srie de potncia elevada a um inteiro positivo de Gradshteyn e Ryzhik (2007, Seo
0.314), a pdf de X, para p (0, 1), pode ser expressa como uma combinao linear de funes
densidades de G-exponencializadas (abreviadamente exp-G)
f(x) =

j,m,t=0

j,m,t
h
j+m+t+1
(x; ), (5.6)
em que h

(x; ) = g(x; ) G
1
(x; ) denota a funo densidade da exp-G com parmetro
de potncia ,

j,m,t
=

l=m
(j + 1) (m + 1)
(j + m + t + 1)
w
k,j
v
l,m
c
j,t
,
w
k,j
=

k=j
(1)
j
s
k+1
(s + 1)
k
(j + 1) k! [(1 )
s
1]
(
k
j
)
,
v
l,m
=
l

m=0
(1)
lm
p (l + 1) (1 p)
l
l m + 1
(
l
m
)
,
c
j,t
= (t b
1
0
)

t
n=1
[n(j + 1) t] b
n
c
j,tn
, t 1, b
t
=

r=t
v
r,t
, c
j,0
= b
j
0
e (s)
k
= (s +
k)/(s) = s (s + 1) . . . (s + k 1) o smbolo de Pochhammer.
Para p > 1, f(x) em (5.4) pode ser expressa de modo semelhante como
f(x) =

j,r,t=0

j,r,t
h
j+r+t+1
(x; ), (5.7)
em que

j,r,t
=
(j + 1) (r + 1)
(r + j + t + 1)
w
k,j

r
d
j,t
,

r
= (1/p) [1 (1/p)]
r
, d
j,t
= (t
1
0
)

t
n=1
[n(j + 1) t]
n
d
j,tn
, t 1 e d
j,0
=
j
0
.
78

x
D
e
n
s
i
d
a
d
e
0 1 2 3
0
.
0
0
.
3
0
.
6
0
.
9
1
.
2
s=15,0; p= 0,2; = 0,3; a=0,2; b=2,0
s= 2,0; p= 3,0; = 0,8; a=0,4; b=1,4
s=10,0; p=10,0; = 0,01; a=1,0; b=2,0
s=10,0; p= 0,4; = 0,01; a=1,0; b=2,0

x
T
a
x
a

d
e

r
i
s
c
o
0 1 2 3
0
2
4
6s=15,0; p= 0,2; = 0,3; a=0,2; b=2,0
s= 2,0; p= 3,0; = 0,8; a=0,4; b=1,4
s=10,0; p=10,0; = 0,01; a=1,0; b=2,0
s=10,0; p= 0,4; = 0,01; a=1,0; b=2,0
(c) (d)
Figura 5.4 Densidade e taxa de risco da MONBW para alguns valores dos parmetros
Por integrao de (5.6) e de (5.7), pode-se expressar F(x) como
F(x) =

m,j,s=0

j,m,t
H
j+m+t+1
(x; ), para p (0, 1), (5.8)
79
e
F(x) =

j,r,t=0

j,r,t
H
j+r+t+1
(x; ), para p > 1, (5.9)
respectivamente. As equaes (5.6) e (5.7) revelam que algumas propriedades matemticas da
nova famlia podem ser obtidas utilizando as propriedades conhecidas das distribuies exp-G.
Algumas dessas propriedades sero apresentadas para a equao (5.7), mas resultados similares
pode ser obtidos para a equao (5.6).
5.4 Funo quantlica
A correspondente qf para (5.3) obtida diretamente da qf associada a G(x; ) por
Q(u) = F
1
(x) = G
1
(1 u

; ) , (5.10)
em que
u

=
1
[
u
(
1
)]
1/s
p + p
{
1
[
u
(
1
)]
1/s
},
p = 1 p e = (1 )
s
.
Quantis de interesse podem ser obtidos de (5.10) substituindo valores apropriados para u.
Em particular, a mediana de X obtida para u = 0, 5. A motivao para usar medidas baseadas
nos quantis a no-existncia da assimetria e da curtose para muitas distribuies generalizadas.
Neste caso, pode-se calcular a assimetria de Bowley que tem como base os quartis (KENNEY;
KEEPING, 1962)
B =
Q(3/4) 2Q(1/2) + Q(1/4)
Q(3/4) Q(1/4)
e a curtose de Moors (MOORS, 1988) que baseada nos octis
M =
Q(7/8) Q(5/8) + Q(3/8) Q(1/8)
Q(6/8) Q(2/8)
.
Grcos da assimetria e curtose da distribuio MONBW, para algumas escolhas de s, , a
e b, como funo de p so apresentados na Figura 5.5. Os grcos indicam que h uma grande
exibilidade das curvas de assimetria e curtose para essa distribuio.
5.5 Momentos
Uma primeira frmula para o q-simo momento de X, dada por

q
= E(X
q
), segue de (5.7)
como

q
=

j,r,t=0

j,r,t
E
(
Y
q
j+r+t+1
)
, (5.11)
80
=0,8 s=5,0
0 5 10 15 20 25 30

0
.
1
0
.
0
0
.
1
0
.
2
0
.
3
p
A
s
s
i
m
e
t
r
i
a
s=15,0
s=10,0
s= 2,0
s= 0,4
0 5 10 15 20 25 30

0
.
1
0
.
0
0
.
1
0
.
2
0
.
3
p
A
s
s
i
m
e
t
r
i
a
= 0,8
= 0,5
= 0,3
= 0,1
=0,8 s=1,5
0 5 10 15 20 25 30
1
.
1
1
.
2
1
.
3
1
.
4
1
.
5
1
.
6
p
C
u
r
t
o
s
e
s=10,0
s= 5,0
s= 2,0
s= 0,4
0 5 10 15 20 25 30
1
.
2
0
1
.
3
0
1
.
4
0
1
.
5
0
p
C
u
r
t
o
s
e
= 0,8
= 0,5
= 0,3
= 0,1
Figura 5.5 Grcos de assimetria e curtose da MONBW como funo de p para valores sele-
cionados de s e com a = 5, 0 e b = 2, 0
em que E (Y
q

) o q-simo momento de Y

Exp-G(; ). Expresses para os momentos


de diversas distribuies exponencializadas so dadas por Nadarajah e Kotz (2006), as quais
podem ser utilizadas para obter E(X
q
).
Uma segunda frmula para

q
pode ser derivada de (5.11) emtermos da qf da base Q
G
(x; ) =
G
1
(x; ). Obtm-se

q
=

j,r,t=0

j,r,t

q
(j, r, t), (5.12)
em que
q
(j, r, t) dado por

q
(j, r, t) = (j + r + t + 1)

1
0
Q
G
(u; )
q
u
j+r+t+1
du. (5.13)
Os momentos ordinrios de vrias distribuies MONB podem ser determinados direta-
mente das equaes (5.11) e (5.12). Para a distribuio Marshall-Olkin binomial negativa ex-
81
ponencial (MONBE) (com parmetro > 0), tem-se

q
= (1)
q

j,r,t=0

j,r,t

j,r,t,q
,
em que
j,r,t,q
= (j + r + t + 1)

q
z
q
B(j + r + t + 1, z j r t)

z=j+r+t+1
e B(, ) a
funo beta.
A mgf M(t) = E
(
e
t X
)
de X segue de (5.7) como
M(t) =

j,r,v=0

j,r,v
M
j+r+v+1
(t; ), (5.14)
em que M

(t; ) a mgf de Y

. Outra representao para M(t) obtida de (5.14) como


M(t) =

j,r,v=0

j,r,v

j,r,v
(t; ),
em que

j,r,v
(t; ) = (j + r + v + 1)

1
0
exp [t Q
G
(u; )] u
j+r+v
du. (5.15)
A mgf da distribuio MONBE dada por (para t < 1)
M(t) =

j,r,v=0
(j + r + v + 1) B(1 t, j + r + v + 1).
5.6 Desvios mdios
Os desvios mdios sobre a mdia (
1
) e sobre a mediana (
2
) de X podem ser expressos como

1
= E(|X

1
|) = 2

1
F(

1
) 2T(

1
) e
2
= E(|X M|) =

1
2T(M), (5.16)
respectivamente, em que

1
= E(X), M = Median(X) denota a mediana, F(

1
) segue
de (5.3) e T(z) =

xf(x)dx o primeiro momento incompleto de X. A mediana M


determinada explicitamente da qf (5.10) por M = Q(1/2).
Fazendo u = G(x) em (5.7) tem-se
T(z) =

j,r,t=0

j,t,r
T
j,r,t
(z), (5.17)
em que a integral T
j,r,t
(z) pode ser expressa em termos de Q(u) = G
1
(u) por
T
j,r,t
(z) = (j + r + t + 1)

G(z;)
0
Q
G
(u; ) u
j+r+t
du. (5.18)
Os desvios mdios de X podem ser calculados das equaes (5.16)-(5.18). Por exemplo, os
desvios mdios do modelo MONBE (com parmetro ) imediatamente calculado da funo
T
j,r,t
(z) =
(e
z

1)
j+r+t+1
e

(j+r+t+1)
(j + r + t + 1) (j + r + t + 2)
log
(
e
z

+ j + r + t + 1
)
.
82
Um representao alternativa para T(z) pode ser encontrada de (5.7) como
T(z) =

xf(x)dx =

j,r,t=0

j,r,t
J
j,r,t
(z), (5.19)
em que
J
j,r,t
(z) =

xh
j+r+t+1
(x; ) dx. (5.20)
A equao (5.20) representa a quantidade bsica para calcular os desvios mdios das distribui-
es exp-G. Portanto, os desvios mdios da MONB-G dependem somente dos desvios mdios
da distribuio exp-G.
Uma aplicao simples fornecida para a distribuio MONBW. A Weibull exponenciali-
zada com parmetro de potncia j

= j + r + t + 1 tem funo densidade (para x > 0) dada


por
h
j
(x) = j

a b
a
x
a1
exp{(b x)
a
}[1 exp{(b x)
a
}]
j

1
e, ento,
J
j,r,t
(z) = (j + r + t + 1) a b
a

z
0
x
a
exp{(b x)
a
}[1 exp{(b x)
a
}]
j+r+t
dx
= (j + r + t + 1) a b
a

k=0
(1)
k
(
j + r + t
k
)
z
0
x
a
exp{(k + 1)(b x)
a
}dx.
Pode-se calcular a ltima integral usando a funo gama incompleta, para > 0, (, x) =

x
0
w
1
e
w
dw, e, ento,
J
j,r,t
(z) = (j + r + t + 1) a b
a

k=0
(1)
k
(
j+r+t
k
)
(k + 1)
1+a
1
(1 + a
1
, (k + 1)(z)
a
).
As equaes (5.17) e (5.19) so os principais resultados desta seo. Uma aplicao dessas
equaes pode ser a obteno das curvas de Bonferroni e de Lorenz denidas para uma dada
probabilidade p por B(p) = T(q)/(p

1
) e L(p) = T(q)/

1
, respectivamente, em que

1
=
E(X) e q = F
1
(p).
5.7 Entropias
A entropia de uma varivel aleatria X com funo densidade f(x) uma medida da vari-
ao da incerteza. A entropia de Shannon denida por E{log[f(X)]}. Suponha X
MONB-G(s, p, , ). Ento,
E{log[f(X)]} = log
[
s p
(1 )
s
1
]
E {log [g(X; )]}
+(s 1)E
(
log
{
1 [1 p (1 )] G(X; )
})
(s 1)E
{
log
[
1 (1 p) G(X; )
]}
. (5.21)
83
As trs esperanas em (5.21) podem ser expressas como
E {log [g(X; )]} =

log[g(x; )] f(x) dx =

j,r,t=0
j

j,r,t
I
j,r,t
,
E
(
log
{
1 [1 p ] G(X; )
})
=

j,r,t=0
j

j,r,t
(1 p ) (j

)
2

F
1
(1, 1; j

+ 2; 1 p ),
com p = 1 e
E
{
log
[
1 (1 p) G(X; )
]}
=

j,r,t=0
j

j,r,t
(1 p) (j

)
2

F
1
(1, 1; j

+ 2; 1 p).
Aqui, j

= j + r + t + 1, I
j,r,t
= I
j,r,t
(u) =

1
0
log {g [Q(u; )]} u
j+r+t
du, g [Q(u; )]
a funo densidade aplicada a quantlica e
p

F
q
a funo hipergeomtrica regularizada que
dada por
p

F
q
(a
1
, . . . , a
p
; b
1
, . . . , b
q
; z) =
p
F
q
(a; b; z)/[(b
1
) . . . (b
q
)]. Assim, segue a partir da
equao (5.21)
E{log[f(X)]} = log
[
s p
(1 )
s
1
]
+

j,r,t=0
j

j,r,t
(5.22)

{
I
j,r,t
(s 1) (1 p ) (j

)
2

F
1
(1, 1; j

+ 2; 1 p )
+ (s 1)(1 p) (j

)
2

F
1
(1, 1; j

+ 2; 1 p)
}
.
Outra medida de entropia popular a entropia de Rnyi dada por
J
R
(c) =
1
1 c
log
[

f
c
(x)dx
]
, c > 0, c = 1. (5.23)
A integral pode ser expressa como

f
c
(x) dx =
[
s p
(1 )
s
1
]
c

g(x, )
c
[
1 (1 p)G(x; )
]
c (s1)
{
1 [1 p(1 )] G(x; )
}
c (s+1)
dx,
expandindo os binmios e modicando a varivel
J
R
(c) =
1
1 c
log
{
[
s p
(1 )
s
1
]
c

i,j=0

i,j
J
i,j
}
, (5.24)
em que
i,j
=
i,j
(c) = (1)
i+j
[1p (1)]
i
(1p)
j
(
c (s+1)
i
) (
c (s1)
j
)
e J
i,j
= J
i,j
(c, u) =

1
0
g[Q(1 u; )]
c1
u
i+j
du. Para o modelo MONBW com parmetros a > 0 e b > 0, obtm-
se
J
R
(c) =
1
1 c
log
{
[
s p
(1 )
s
1
]
c

i,j,k=0
(c 1)
k
k!

i,j
T
i,j,k
}
,
em que T
i,j,k
= T
i,j,k
(c, a, b) = (1)

(1+) (i +j +1)
(+1)
(para b+a k +(a1)(c1) >
1) e = [a k + (a 1)(c 1)]/b. As equaes (5.22) e (5.24) so os principais resultados
desta seo.
84
5.8 Estatsticas de ordem
Estatsticas de ordem aparecem em diversas reas da estatstica terica e prtica. A funo
densidade f
i:n
(x) da i-sima estatstica de ordemX
i:n
, para i = 1, . . . , n, de variveis aleatrias
i.i.d., X
1
, . . . , X
n
, com qualquer distribuio MONB, simplesmente dada por
f
i:n
(x) =
n!
(i 1)!(n i)!
ni

j=0
(1)
j
(
n i
j
)
f(x) F(x)
j+i1
.
Percontini, Cordeiro e Bourguignon (2013) demonstram que
f
i:n
(x) =

r,k=0
ni

j=0
m
r,k,j
h
r+k+j+i
(x), (5.25)
em que
m
r,k,j
=
(1)
j
i (r + 1)
r,k

j+i1,k
(r + k + j + i)
(
n
i
)(
n i
j
)
.
Substituindo h
r+k+j+i
(x) pela densidade da MO-exponencializada com parmetro r + k +
j + i e expandindo os binmios, a densidade da i-sima estatstica de ordem da distribuio
MONB reduz-se a
f
i:n
(x) =

r,k,t=0
ni

j=0
t

l=0

r,k,j,i,t,l
h
r+k+j+i+l
(x; ), (5.26)
em que

r,k,j,i,t,l
=
(1)
l+t
p (1 p)
t
(r + k + j + i)
(r + k + j + i + l)
(
r + k + j + i + t
t
)
m
r,k,j
e h

(x, ) a pdf de Y

Exp-G(; ).
O m-simo momento da estatstica de ordem X
i:n
pode ser expresso como
E(X
m
i:n
) =

r,k,t=0
ni

j=0
t

l=0

r,k,j,i,t,l

m
(r, k, j, i, l), (5.27)
em que
m
(r, k, j, i, l) = (r +k +j +i +l)

1
0
Q
G
(u; )
m
u
r+k+j+i+l
du podem ser computados
numericamente.
A mgf de X
i:n
podem ser obtidas de (5.26) como
M
i:n
(t) =

r,k,v=0
ni

j=0
v

l=0

r,k,j,i,v,l

r,k,j,i,l
(t; ), (5.28)
em que
r,k,j,i,l
(t; ) = (r + k + j + i + l)

1
0
exp [t Q
G
(u; )] u
r+k+j+i+l1
du podem ser
computadas numericamente. As quantidades E(X
m
i:n
) e M
i:n
(t) para a distribuio MONBE
com parmetro > 0 (para t <
1
) seguem das equaes (5.27) e (5.28) como
E(X
m
i:n
) = m!
m

r,k,t,v=0
ni

j=0
t

l=0

r,k,j,t,l
(1)
m+v
(v + 1)
m+1
(
r + k + j + i
v
)
85
e
M
i:n
(t) =

r,k,v=0
ni

j=0
v

l=0

r,k,j,v,l
B(r + k + j + i + 1, 1 t),
respectivamente. Algumas propriedades matemticas das estatsticas de ordem da MONB in-
cluindo momentos, momentos fatoriais e inversos, mgf, desvios mdios e curvas de Bonferroni
e de Lorenz podem ser derivadas da equao (5.26) pelas conhecidas propriedades da distribui-
o Exp-G.
5.9 Estimao
Adota-se o mtodo de mxima verossimilhana para estimar os parmetros do modelo. O lo-
garitmo da funo de verossimilhana, (), de uma amostra x
1
, . . . , x
n
of X com pdf (5.4)
dado por
() = n
[
log(s) + log(p) + log() log{[(1 )
s
1]}
]
(5.29)
+
n

i=1
log [g(x
i
; )] (s + 1)
n

i=1
log
{
1 G(x
i
; )[1 p(1 )]
}
+ (s 1)
n

i=1
log
[
1 (1 p)G(x
i
; )
]
,
em que um vetor p 1 de parmetros desconhecidos da distribuio base G(x; ).
A expresso (5.29) pode ser maximizada diretamente usando o software R (pacote bbmle)
ou pela resoluo das equaes no-lineares de verossimilhana obtidas pela diferenciao de
(5.29). Os componentes do vetor escore U() so dados por
U
s
() = n
[
1
s
+
log(1 )
1 (1 )
s
]

i=1
log
{
1 G(x
i
; )[1 p(1 )]
}
+
n

i=1
log
[
1 (1 p)G(x
i
; )
]
,
U
p
() =
n
p
(s + 1)
n

i=1
(1 ) G(x
i
; )
1 G(x
i
; )[1 p (1 )]
+ (s 1)
n

i=1
G(x
i
; )
1 (1 p) G(x
i
; )
,
U

() =
n


ns
( 1) [(1 )
s
1]
+ (s + 1)
n

i=1
p G(x
i
; )
1 G(x
i
; )[1 p (1 )]
e
86
U

j
() =
n

i=1
g(x
i
; )/
j
g(x
i
; )
(s + 1)
n

i=1
[1 p(1 )] G(x
i
; )/
j
1 G(x
i
; )[1 p (1 )]
(s 1)
n

i=1
(1 p) G(x
i
; )/
j
1 (1 p) G(x
i
; )
,
para j = 1, . . . , p. Para estimao intervalar e testes de hipteses sobre os parmetros do
modelo, a matriz de informao observada requerida. Os (p + 3) (p + 3) elementos da
matriz de informao observada so dados no Apndice APNDICE D - .
Sob certas condies que so satisfeitas para os parmetros no interior do espao param-
trico, mas no sobre a fronteira, a distribuio normal multivariada N
p+3
(0, J(

)
1
), em que
J(

) a matriz de informao observada avaliada em



, pode ser usada para construir interva-
los de conana aproximados para os parmetros individuais. Para comparar essa distribuio
com alguns modelos especiais, podem-se utilizar os trs bem-conhecidos testes: estatstica da
razo de verossimilhana (LR), estatstica de Wald e escore de Rao. Para testar modelos encai-
xados, estas estatsticas convergem para uma distribuio qui-quadrado com nmero de graus
de liberdade igual diferena entre o nmero de parmetros desconhecidos dos dois modelos
testados.
5.10 Aplicao
Apresenta-se, a seguir, a anlise de umconjunto de dados reais comns ilustrativos. Estes dados
de resistncia so originalmente descritos por Gupta e Kundu (2010). Os dados representam a
medida de resistncia em GPa para bras simples de carbono. Os dados so: 1,901; 2,132;
2,203; 2,228; 2,257; 2,350; 2,361; 2,396; 2,397; 2,445; 2,454; 2,474; 2,518; 2,522; 2,525;
2,532; 2,575; 2,614; 2,616; 2,618; 2,624; 2,659; 2,675; 2,738; 2,740; 2,856; 2,917; 2,928;
2,937; 2,937; 2,977; 2,996; 3,030; 3,125; 3,139; 3,145; 3,220; 3,223; 3,235; 3,243; 3,264;
3,272; 3,294; 3,332; 3,346; 3,377; 3,408; 3,435; 3,493; 3,501; 3,537; 3,554; 3,562; 3,628;
3,852; 3;871; 3,886; 3,971; 4,024; 4,027; 4,225; 4,395; 5,020. Na Tabela 5.1 apresentado
um resumo descritivo desses dados. Tm-se, possivelmente, dados provenientes de distribuio
leptocrtica e com assimetria positiva.
Tabela 5.1 Estatsticas descritivas
Mdia Mediana Desvio padro. Varincia Assimetria Curtose Min Mx
3, 059 2, 996 0, 621 0, 386 0, 648 0, 412 1, 901 5, 020
Foram ajustadas as distribuies MONBGa, MONBFr, MONBLL, MONBW, McDonald
Weibull (McW) e beta Burr XII (BBXII) a esses dados. A distribuio McW (CORDEIRO;
HASHIMOTO; ORTEGA, 2014) tem pdf (para x > 0)
f(x; a, b, c, , ) =
c

B(a/c, b)
e
(x)

[
1 e
(x)

]
a1
{
1
[
1 e
(x)

]
c
}
b1
,
87
e a distribuio BBXII (PARANABA et al., 2013) tem pdf (para x 0)
f(x; a, b, s, k, c) =
c k x
c1
s
c
B(a, b) [1 + (x/s)
c
]
k b1
{
1 [1 + (x/s)
c
]
k
}
a1
.
Na Tabela 5.2 so apresentadas as estimativas de mxima verossimilhana (MLEs) e os cor-
respondentes erros padro estimados (SEs), os valores das estatsticas critrio de informao de
Akaike (AIC) (AKAIKE, 1974), critrio de informao de Akaike corrigido (CAIC) (BOZDO-
GAN, 1987) e critrio bayesiano de Schwarzs (BIC) (SCHWARZ, 1978) para os dados atuais.
Os trs critrios de informao indicam uma possvel classicao para os modelos. O me-
nor valor desses critrios so para a distribuio MONBFr que pode ser escolhida como mais
adequada nesse caso.
Tabela 5.2 MLEs, correspondentes SEs (dados entre parnteses) e as estatsticas AIC, BIC e
CAIC para as resistncias medidas em GPA
Distribuio s p a b AIC CAIC BIC
MONBGa 12,3033 0,4627 0,0001 26,3423 0,1263 123,0602 124,1128 133,7758
(0,1761) (4,0827) (1,3355) (4,5385) (0,0276)
MONBFr 19,4494 21,9129 0,5387 3,9315 2,9039 121,9879 123,0405 132,7035
(16,1003) (28,2683) (0,4824) (2,2013) (0,9094)
MONBLL 7,8028 4,8313 0,0003 2,4950 8,6457 125,6897 126,7423 136,4054
(0,0350) (110,6903) (0,3259) (6,6226) (0,8903)
MONBW 3,9801 0,0282 0,0128 0,2163 8,3418 125,0002 126,0529 135,7159
(0,0039) (0,0633) (0,6311) (0,0324) (1,0050)
Distribuio a b c AIC CAIC BIC
McW 76,1084 1,6927 0,2581 1,2688 1,0471 122,6394 123,6920 133,3550
(0,0687) (3,4804) (0,0253) (0,2945) (0,6390)
Distribuio a b s k c AIC CAIC BIC
BBXII 27,5702 16,3410 1,5690 0,6566 1,9694 122,6825 123,7351 133,3982
(77,2675) (6,7441) (2,4389) (1,3294) (2,8207)
Alm disso, so calculadas as estatsticas de qualidade de ajuste de Cramr-von Mises (W

)
e de Anderson-Darling (A

) com a nalidade de vericar qual modelo se ajusta melhor a esses


dados. As estatsticas W

e A

so bem descritas por Chen e Balakrishnan (1995). Quanto


menor os valores destas estatsticas, melhor o ajuste aos dados. Os valores das estatsticas W

e A

para os cinco modelos ajustados so dados na Tabela 5.3. Com base nestes valores, o
modelo MONBFr ajusta-se aos dados melhor do que os outros quatro modelos e, ento, pode
ser escolhido como o melhor modelo.
Tabela 5.3 Estatsticas de qualidade de ajuste para os modelos ajustados
Modelo W

p-value A

MONBGa 0,0615 0,3616 0,3408 0,4961


MONBFr 0,0476 0,5465 0,2672 0,6873
MONBLL 0,0889 0,1590 0,5018 0,2066
MONBW 0,0768 0,2280 0,4512 0,2742
McW 0,0616 0,3609 0,3281 0,5176
BBXII 0,0613 0,3634 0,3287 0,5167
88
Estes modelos so no-encaixados e portanto podem ser testados utilizando a estatstica LR
para modelos no-encaixados (CAMERON; TRIVEDI, 1998, Seo 5.7.2). Os resultados so
apresentados na Tabela 5.4. Neste caso, para os dados de resistncia medida em GPa, rejeita-se
a hiptese nula para os quatro testes LR em favor da MONBFr.
Tabela 5.4 Testes LR
Modelos Estatstica T
LR,NN
p-valor
MONBFr vs MONBGa 25,0240 <0,0001
MONBFr vs MONBLL 15,3649 <0,0001
MONBFr vs MONBW 16,1274 <0,0001
MONBFr vs McW 24,2394 <0,0001
MONBFr vs BBXII 0,8203 0,2060
O histograma dos dados e o grco das funes densidades ajustadas, MONBFr, McW e
BBXII, so apresentados na Figura 5.6. Com base na gura e nos testes, conclui-se que o
modelo MONBFr ajusta-se melhor a esses dados.
x
D
e
n
s
i
d
a
d
e
2 3 4 5
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
MONBFr
McW
BBXII
2.0 2.5 3.0 3.5 4.0 4.5 5.0
2
.
0
3
.
0
4
.
0
5
.
0
MONBFr
Observado
A
j
u
s
t
a
d
o
2.0 2.5 3.0 3.5 4.0 4.5 5.0
2
.
0
3
.
0
4
.
0
5
.
0
McW
Observado
A
j
u
s
t
a
d
o
2.0 2.5 3.0 3.5 4.0 4.5 5.0
2
.
0
3
.
0
4
.
0
5
.
0
BBXII
Observado
A
j
u
s
t
a
d
o
Figura 5.6 Histograma e grco dos quantis para os modelos ajustados com base nas distri-
buies MONBFr, McW e BBXII aos dados de resistncia
89
5.11 Consideraes nais
Pela primeira vez, prope-se a famlia de distribuies Marshall-Olkin negativa binomial
(MONB). A famlia MONB estende vrias distribuies conhecidas, tais como as distribuies
normal, Weibull, gama, log-logstica e Gumbel. Na verdade, para cada distribuio G, pode-
se denir a correspondente distribuio MONB-G usando uma equao simples. Demonstra-
se que algumas propriedades matemticas da distribuio MONB-G podem ser prontamente
obtidas a partir das distribuies G-exponenciadas. As expresses explcitas para os momentos
ordinrios, funo geradora, entropias de Rnyi e Shannon e estatsticas de ordem so derivadas
para qualquer distribuio MONB-G. Discutem-se estimao por mxima verossimilhana e
inferncia sobre os parmetros do modelo. Um exemplo com dados reais ilustra a importncia
e potencialidade da nova famlia.
Referncias
AKAIKE, H. A new look at statistical model identication. IEEE Transactions on Automatic
Control, Boston, v.6, p. 716722, 1974.
Barreto-Souza, W.; LEMONTE, A. J.; CORDEIRO, G. M. General results for the Marshall and
Olkins family of distributions. Anais da Academia Brasileira de Cincias, Rio de Janeiro,
v. 85, p. 321, 2013.
BOZDOGAN, H. Model selection and Akaikes information criterion (AIC): The general
theory and its analytical extensions. Psychometrika, Williamsburg, v. 52, p. 345370, 1987.
BRITO, E. de; PERCONTINI, A.; CORDEIRO, G. M.; DEMTRIO, C. G. B. The
Marshall-Olkin negative binomial family: theory and application. Studia Scientiarum
Mathematicarum Hungarica, Budapest, 2014. In press.
CAMERON, A. C.; TRIVEDI, P. K. Regression analysis of count data. New York:
Cambridge University Press, 1998. 411 p.
CHEN, G.; BALAKRISHNAN, N. A general purpose approximate goodness-of-t test.
Journal of Quality Technology, Milwaukee, v. 27, p. 154161, 1995.
CORDEIRO, G. M.; HASHIMOTO, E. M.; ORTEGA, E. M. M. The McDonald Weibull
model. Statistics, New York v. 48, p. 256278, 2014.
GRADSHTEYN, I. S.; RYZHIK, I. M. Table of Integrals, Series and Products. 7th ed. San
Diego: Academic Press, 2007. 1162 p.
GUPTA, R. D.; KUNDU, D. Generalized logistic distributions. Journal of Applied Statistical
Science, New York, v. 18, p. 5166, 2010.
90
KENNEY, J. F.; KEEPING, E. S. Mathematics of Statistics, Part 1. 3rd. ed. New Jersey:
Literary Licensing, 1962. 472 p.
MARSHALL, A. W.; OLKIN, I. A new method for adding a parameter to a family of
distributions with application to the exponential and Weibull families. Biometrika, London,
v. 84, p. 641652, 1997.
MOORS, J. J. A. A quantile alternative for kurtosis. The Statistician, New Jersey, v. 37, p.
2532, 1988.
NADARAJAH, S.; KOTZ, S. The exponentiated type distributions. Acta Applicandae
Mathematicae, Dordrecht, v. 92, p. 97111, 2006.
PARANABA, P. F.; ORTEGA, E. M. M.; CORDEIRO, G. M.; de Pascoa, M. A. R. The
Kumaraswamy Burr XII distribution: theory and practice. Journal of Statistical Computation
and Simulation, New York, v. 83, p. 21172143, 2013.
PERCONTINI, A.; CORDEIRO, G. M.; BOURGUIGNON, M. The G-negative binomial
family: general properties and applications. Advances and Applications in Statistics, India,
v. 35, p. 127 160, 2013.
SCHWARZ, G. Estimating the dimension of a model. Annals of Statistics, Cleveland, v. 6, p.
461464, 1978.
91
6 CONSIDERAES FINAIS
6.1 Concluso
Neste trabalho, fez-se um tratamento matemtico para duas novas distribuies, a McDonald
Gumbel e a gama Burr XII, e para uma nova classe geradora de distribuies contnuas, a
Marshall-Olkin binomial negativa. Entre as propriedades apresentadas, podem-se destacar, a
funo densidade de probabilidade, a funo distribuio acumulada, a funo densidade das
estatsticas de ordem, a funo geradora de momentos, os desvios mdios, a entropia e as curvas
de Bonferroni e Lorenz. O processo de estimao para os parmetros dos novos modelos foi o
mtodo de mxima verossimilhana e obteve-se a matriz de informao observada.
Consideraram-se, tambm, alguns testes teis para comparar modelos, tais como o teste da
razo de verossimilhana e as estatsticas de Cramr-von Mises e de Anderson-Darling. Aplica-
es com dados reais foram realizadas para mostrar que as novas distribuies podem ser usadas
mais efetivamente para proporcionar um melhor ajuste do que outros modelos conhecidos na
literatura.
6.2 Pesquisas futuras
Dando continuidade a essas pesquisas, pretende-se apresentar modelos de regresso para as no-
vas distribuies e para a nova famlia, bem como introduzir anlise de diagnstico (inuncia
local e resduos) para os novos modelos de regresso.
92
pular pagina
93
APNDICES
94


95
APNDICE A - Matriz de informao observada da distribuio McGu
Os elementos da matriz de informao observada J() para os parmetros (a, b, c, , ) da
distribuio McGu envolve as seguintes quantidades:

() a derivada da funo digama,


z
i
= (x
i
)/, u
i
= e
z
i
e t
i
= e
c u
i
. Os elementos de J() so:
J
aa
= n[

(a + b)

(a)], J
ab
= n

(a + b), J
ac
= c
n

i=1
u
i
,
J
a
=
c

i=1
u
i
, J
a
=
c

i=1
z
i
u
i
, J
bb
= n[

(a + b)

(b)],
J
bc
=
n

i=1
[
u
i
t
i
1 t
i
]
, J
b
=
c

i=1
[
u
i
t
i
1 t
i
]
, J
b
=
c

i=1
[
z
i
u
i
t
i
1 t
i
]
,
J
cc
=
n
c
2
+ (b 1)
n

i=1
[
u
2
i
t
i
(1 t
i
)
2
]
,
J
c
=
a

i=1
u
i

(b 1)

i=1
[
u
i
t
i
(1 t
i
c u
i
)
(1 t
i
)
2
]
,
J
c
=
a

i=1
z
i
u
i

(b 1)

i=1
[
z
i
u
i
t
i
(1 t
i
c u
i
)
(1 t
i
)
2
]
,
J

=
ac

2
n

i=1
u
i
+
c(b 1)

2
n

i=1
[
u
i
t
i
(1 t
i
c u
i
)
(1 t
i
)
2
]
,
J

=
n

2
+
ac

2
n

i=1
[(1 z
i
) u
i
]
c(b 1)

2
n

i=1
{
u
i
t
i
[(1 z
i
)(1 t
i
) + c z
i
u
i
]
(1 t
i
)
2
}
e
J

=
n

2

2

2
n

i=1
z
i
+
ac

2
n

i=1
[z
i
(2 z
i
) u
i
]

c(b 1)

2
n

i=1
{
z
i
u
i
t
i
[(2 z
i
)(1 t
i
) + c z
i
u
i
]
(1 t
i
)
2
}
.
96
APNDICE B - Integral
Tem-se o seguinte resultado que vale para m e k inteiros positivos, > 1 e p > 0 (PRUDNI-
KOV; BRYCHKOV; MARICHEV, 1992, pag. 21)
I
(
p, ,
m
k
,
)
=


0
exp(px) x

(1 + x
m
k
)

dx
=
k

m
+
1
2
(2)
(m1)
2
()p
+1

G
k,k+m
k+m,k
(
m
m
p
m

(m, ), (k, + 1)
(k, 0)
)
, (1)
em que (k, a) =
a
k
,
a+1
k
, ,
a+k
k
e a funo Meijer G denida na Seo 4.3.
97
APNDICE C - Matriz de informao observada da distribuio GBXII
Os elementos da matriz de informao observada J() para os parmetros (a, s, k, c) da GBXII
so
J
aa
() = n

(a)

iC

G
3,0
2,3
(
log[u
i
]

1, 1
0, 0, a
)
2
2 Q(a, log[u
i
]) G
4,0
3,4
(
log[u
i
]

1, 1, 1
0, 0, 0, a
)
Q(a, log[u
i
])
2

,
J
as
() =
c
s

iF
[
u
i
1
u
i
log(u
i
)
]

c
s

iC

(u
i
1) G
3,0
2,3
(
log[u
i
]

a, a
a 1, a 1, 2a 1
)
u
2
i
Q(a, log[u
i
])
2

,
J
ak
() =
r
k
, J
ac
() =

iF
[
v
i
u
i
log(u
i
)
]
+

iC

v
i
G
3,0
2,3
(
log[u
i
]

a, a
a 1, a 1, 2a 1
)
u
2
i
Q(a, log[u
i
])
2

,
J
ss
() =
r c
s
2
+
c (k + 1)
s
2

iF
[
c +u
i
u
2
i
]

c (a 1)
s
2

iF
{
(u
i
1) [c(u
i
1) (u
i
+c) log(u
i
)]
u
2
i
log(u
i
)
2
}

c
s
2

iC
(u
i
1) log(u
i
)
a2
u
4
i
Q(a, log[u
i
])
2
{c (u
i
1) [Q(a, log[u
i
])u
i
(a 1 2 log[u
i
] +u
i
(c + 1) log[u
i
]) + log(u
i
)
a
]},
J
sk
() =

iF
u
i
1
u
i
,
J
sc
() =
r
s

(k + 1)
s

iC
{
(u
i
1)[u
i
+c log(u
i
1)]
u
2
i
}
+
(a 1)
s

iC
{
(u
i
1)[c v
i
log[u
i
](u
i
+c log[u
i
1])]
u
2
i
log(u
i
)
2
}
+

iF
(u
i
1) log(u
i
)
a2
s u
4
i
Q(a, log[u
i
])
2
{c v
i
log(u
i
)
a
+u
i
log(u
i
)[u
i
c(u
i
2) log(u
i
1)] c(a 1)v
i
Q(a, log[u
i
])},
98
J
kk
() =
r a
k
2
, J
kc
() =

iF
v
i
u
i
,
e
J
cc
() =

iC
v
2
i
(u
i
1)
c1
log[u
i
]
a2
u
4
i
Q(a, log[u
i
])
{u
i
Q(a, log[u
i
]) [u
i
log(u
i
) + (u
i
1)
a
(a 1 2 log[u
i
])] + (u
i
1) log[u
i
]
a
} ,
em que u
i
= 1 + (x
i
/s)
c
, v
i
= (x
i
/s)
c
log[(x
i
/s)
c
], (s) = d log (s)/ds a funo digama,
Q(a, x) =

x
t
a1
e
t
dt a funo gama incompleta e G
m,n
p,q
(|) a funo Meijer G denida
na Seo 4.3.
99
APNDICE D - Matriz de informao observada da famlia MONB-G
Os elementos da matriz de informao observada J() para os parmetros (s, p, , ) da distri-
buio MONB-G so
J
ss
=
n {s
2
(1 )
s
log(1 )
2
[(1 )
s
1]
2
}
s
2
[(1 )
s
1]
2
,
J
sp
=
n

i=1
G(x
i
; )
1 (1 p) G(x
i
; )

i=1
(1 ) G(x
i
; )
1 G(x
i
; ) [1 p(1 )]
,
J
s
= n
{
1 + (1 )
s
[s log(1 ) 1]
(1 ) [(1 )
s
1]
2
}
+
n

i=1
p G(x
i
; )
1 G(x
i
; ) [1 p(1 )]
,
J
s
j
=
n

i=1
(1 p) G(x
i
; )/
j
1 (1 p) G(x
i
; )

i=1
[1 p(1 )] G(x
i
; )/
j
1 G(x
i
; )[1 p(1 )]
,
J
pp
=
n
p
2
+ (s + 1)
n

i=1
(1 )
2
G(x
i
; )
2
{
1 G(x
i
; ) [1 p(1 )]
}
2
(s 1)
n

i=1
G(x
i
; )
2
[1 (1 p) G(x
i
; )]
2
,
J
p
=
n

i=1
G(x
i
; ) {2 p (1 ) G(x
i
; ) + G(x
i
; )}
{
p(1 ) G(x
i
; ) + G(x
i
; )
}
2
,
J
p
j
= (s + 1)
n

i=1
(1 ) G(x
i
; )/
j
{
p(1 ) G(x
i
; ) + G(x
i
; )
}
2
(s 1)
n

i=1
G(x
i
; )/
j
[p + (1 p) G(x
i
; )]
2
,
J

=
ns [(s + 1)(1 )
s
1]
(1 )
2
[1 (1 )
s
]
2
+ (s + 1)
n

i=1
p
2
G(x
i
; )
{
1 G(x
i
; )[1 p(1 )]
}
2
,
J

j
= (s + 1)
n

i=1
p G(x
i
; )/
j
{
p(1 ) G(x
i
; ) + G(x
i
; )
}
2
100
e
J

j
=
n

i=1
g(x
i
; ) g(x
i
; )/
j
[
2
g(x
i
; )/
j
]
2
g(x
i
; )
2
(s 1)
n

i=1
(1 p)
{
(1 p)
[
p G(x
i
; ) + G(x
i
; )
] }
.

Anda mungkin juga menyukai