Anda di halaman 1dari 16

Aplicao da distribuio Poisson zero truncada produtividade

Aplicao da distribuio Poisson zero


truncada produtividade de autores
Rubn Urbizagstegui Alvarado
Bibliotecrio. University of California, Riverside.
Riverside, CA 97521-5900. USA.
e-mail: rubur@ucracl.ucr.edu

Descreve a natureza da distribuio zero truncada de Poisson conforme


desenvolvida por Plackett. Apresenta as equaes especficas quando a
freqncia de zero observaes no esta presente na amostra coletada. Visto
que comum encontrar-se dados deste tipo no campo da bibliometria,
descreve-se passo a passo, a forma de aplicao do modelo aos dados
estudados por Gupta & Kumar sobre a produo dos autores no campo da
gentica populacional e publicados no peridico Evolution.

18

Palavras-chave
alavras-chave: Lei de Lotka; Distribuio Poisson zero truncado;
Produtividade de autores; Bibliometria; Gentica; Informetria; Cienciometria
Recebido em: 20.11.2003
Aceito em: 15.03.2004

Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

Introduo
Vem sendo usada uma srie de modelos para se estudar os fenmenos
sociais no campo da bibliometria. Os trs mais conhecidos e freqentemente
citados na literatura como leis, so: a Lei de Bradford, sobre a produtividade
de artigos por peridicos especializados; a Lei de Zipf, sobre a freqncia de
ocorrncias de palavras num texto; e a Lei de Lotka, sobre a produtividade
cientfica dos autores. A produtividade cientfica reflete-se freqentemente na
literatura na forma de artigos, patentes registradas, informes apresentados etc.
Grande nmero de acadmicos tem usado essas variveis para medir a
produtividade cientfica de indivduos, organizaes e companhias, em
diferentes situaes, assuntos e perodos. Um dos modelos usados para essa
avaliao, mas ainda pouco explorado, tem sido o da distribuio de Poisson.
Tal distribuio proporciona um bom modelo para dados que representam
o nmero de ocorrncias de um evento especfico numa determinada unidade
de tempo ou espao. Foi desenvolvida por Simen Denis Poisson, 1781-1840,
que a aplicou ao campo de eletrosttica e magnetismo. Este modelo tem sido
empregado para descrever a funo de probabilidades de eventos como:
- a demanda de produtos
- a demanda de servios
- o nmero de ligaes numa central telefnica
- o nmero de chegadas de nibus num terminal de passageiros
- o nmero de chegadas de avies num aeroporto
- o nmero de acidentes, por trabalhador, numa fbrica
- o nmero de pessoas, por residncia, que sofrem de enfermidades
contagiosas.
Estes exemplos tm duas coisas em comum: uma, as ocorrncias podem
ser descritas em termos de variveis discretas (tomam valores integrais de 0,
1, 2, 3, ., etc.), isto , no se pode falar em valores fracionados como dois e
meio, 3.75, etc., seno de valores inteiros; e outra, apresentarem uma taxa
que caracterize o sucesso do evento produzido (a taxa o nmero de
ocorrncias por intervalo de tempo ou de espao). Por exemplo, no se pode
dizer que um autor produziu um artigo e meio num perodo de 20 anos.
Visto que o modelo de Lotka no prediz a produo anual de artigos
cientficos, e que no leva em considerao os autores mais prolficos, Mantel
(1966) sugeriu o uso da distribuio de Poisson para estimar a probabilidade
de ocorrncia de um evento durante um perodo determinado. Aplicou o
modelo ao nmero de contribuies por autor, listados numa bibliografia
publicada pela Oficina Naval de Pesquisas em Engenharia Humana, do governo
americano, de 1959 a 1960, com 332 autores produzindo 2255 artigos. O
modelo descreveu com sucesso a distribuio de freqncias de autores e
publicaes, no perodo.
Igualmente, Huber (1998a) estudou uma amostra de 773 inventores
que trabalharam para uma companhia durante os anos de 1960 a 1995, os
quais tinham produzido seis patentes ou mais, num perodo de cinco anos ou
mais. Esses 773 inventores foram responsveis por 5254 patentes concedidas

19
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

20

nesses anos. Esta produo representava 58% do total de patentes registradas


pela companhia no perodo estudado. O autor observou que a maioria dos
inventores mostravam um padro de produtividade randmico que se ajustava
muito bem distribuio de Poisson. Nesse mesmo ano, Huber (1998b)
estudou a taxa de crescimento e decrscimo indicando aprendizagem,
envelhecimento, controle e ajuste aos objetivos da companhia. Desta vez, o
estudo esteve limitado a uma amostra de 162 inventores que tinham produzido
1975 patentes. Usando o teste do qui-quadrado, a distribuio das patentes
foi testada ao 0.10 nvel de significncia. Novamente, os dados se ajustaram
muito bem ao modelo de Poisson.
Tambm Gupta e Kumar (1998) estudaram 11 grupos de dados
procedentes do ncleo de peridicos representativos no campo da gentica
cobrindo o perodo de 1971 a 1980. Os autores observaram que a distribuio
zero truncada de Poisson ajustou-se somente a cinco dos 11 grupos estudados.
Gupta; Kumar e Rousseau (1998) usando uma bibliografia exaustiva sobre
gentica terica, publicada por J. Felsentein em 1981, cobrindo a literatura
sobre o assunto desde 1870 at 1980, identificaram um ncleo representativo
de 11 revistas. A seguir, contaram o nmero de autores de cada artigo publicado
em cada uma dessas revistas e estudaram a aplicabilidade da distribuio de
Lotka, a distribuio geomtrica e a distribuio truncada de Poisson. Os autores
verificaram que a distribuio de Lotka no foi apropriada para o estudo da
distribuio dos autores. No entanto, observaram que a distribuio geomtrica
e a distribuio zero truncada de Poisson mostraram-se como as mais adequadas
aos dados estudados.
Deve-se realar que a lei de Lotka tem sido testada em muitas
recopilaes de dados, mas o ajuste nem sempre tem sido apropriado. Este
ponto no tem sido o suficientemente destacado na bibliografia publicada, ainda
que as revises do estado-da-arte de Vlachy (1980) e Potter (1981) tenham
ajudado a reorientar o interesse dos pesquisadores para avaliar se outros tipos
de distribuies poderiam proporcionar um melhor ajuste dos dados
observados. Isso levou introduo, nas pesquisas bibliomtricas, de modelos
estatsticos usados nas cincias naturais, tais como a distribuio hiperblica, a
distribuio logartmica normal, a distribuio de Yule, a distribuio binomial, a
srie geomtrica, a srie logartmica, a distribuio de Weinbull e, finalmente,
a distribuio inversa generalizada de Gauss-Poisson.
importante assinalar que esses modelos estatsticos no tm sido
explorados na bibliometria latino-americana, embora estejam disponveis na
literatura publicada e sejam acessveis. Talvez isso ocorra em razo da falta de
familiaridade com os modelos estatsticos ou desconhecimento dos instrumentos
matemticos para testar os dados. sabido que desentranhar complicados
modelos estatsticos no o passatempo favorito de muitos pesquisadores.
Por essa razo, o objetivo deste trabalho proporcionar um guia para analisar
e testar a lei de Lotka sobre a produtividade cientfica dos autores, usando a
distribuio de Poisson. Considera-se que este guia necessrio para apoiar a
compreenso, adoo, aplicao e difuso deste modelo.

Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

Natureza da distribuio de Poisson


Na distribuio de Poisson a varivel discreta x pode tomar valores de
x = 0, 1, 2, .. n . Ento, a probabilidade de obter-se exatamente x ocorrncias
:

(x) =

para x = 0, 1, 2, .....

x!

(1)

onde:

tempo.

= mdia aritmtica de ocorrncias por intervalo de


e = 2.71828 (a base dos logaritmos naturais)
x = valores 0, 1, 2, . da varivel discreta x

Nesta equao x! representa o fatorial do valor de x = 0, 1, 2, 3, ..


Este fatorial calculado da seguinte maneira:
Para x = 0! = 1
Para x = 1! = 1 X 1 = 1
Para x = 2! = 2 X 1 = 2
Para x = 3! = 3 X 2 X 1 = 6
Para x = 4! = 4 X 3 X 2 X 1 = 24
Para x = 5! = 5 X 4 X 3 X 2 X 1 = 120
Para x = 6! = 6 X 5 X 4 X 3 X 2 X 1 = 720
Para x = 7! = 7 X 6 X 5 X 4 X 3 X 2 X 1 = 5040
Para x = 8! = 8 X 7 X 6 X 5 X 4 X 3 X 2 X 1 = 40320
Para x = 9! = 9 X 8 X 7 X 6 X 5 X 4 X 3 X 2 X 1 = 362880
Para x =10! = 10 X 9 X 8 X 7 X 6 X 5 X 4 X 3 X 2 X 1=
3628800
e assim sucessivamente.
Como se pode observar na equao (1) acima, a distribuio de Poisson
tem um nico parmetro desconhecido, simbolizado pela letra minscula grega
(mu). Ao se conhecer o valor de m pode-se calcular a probabilidade de toda
a distribuio de freqncias. O parmetro pode ser interpretado como a
mdia aritmtica de ocorrncias por intervalo de tempo ou espao, o qual
caracteriza o processo que gera a distribuio de Poisson.
No obstante, na maioria das observaes bibliomtricas, as contribuies
dos autores que no produzem um nico artigo ou trabalho escrito, ou seja,
quando x = 0, no so observados nem relatados nos trabalhos publicados.

21
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

Normalmente, ao se coletar os dados da produtividade cientfica no possvel


observar a produtividade dos autores, diga-se, os improdutivos. Isto , existem
situaes em que algumas freqncias no so verificadas, como no caso dos
autores com zero colaboraes num determinado perodo. Nessas situaes,
tem-se uma distribuio de Poisson zero truncada, que definida por,

Pr =

re

r!(1 e )

(r = 1, 2, 3...)

(2)

onde:
= mdia aritmtica de ocorrncias por intervalo de tempo.
e = 2.71828 (a base dos logaritmos naturais)
r = valores 0, 1, 2, . da varivel discreta r
Para resolver esta equao e calcular os valores esperados
ou tericos, Plackett (1953) desenvolveu um mtodo bastante
eficiente para estimar (Lambda).

22

Aplicao da distribuio de Poisson zero truncada


A expectativa do parmetro de Poisson quando os zero valores das
freqncias da distribuio no so observadas nas amostras coletadas, como
o caso da maioria das distribuies bibliomtricas, muito complexa. A soluo
adotada pelo mtodo da mxima probabilidade realmente problemtica j
que se faz necessrio resolver complicadas equaes no-lineares. As propostas
de soluo, para este caso, procedem de diferentes campos mas, basicamente,
da biologia. Vrios aspectos da expectativa dos parmetros que envolvem a
distribuio de Poisson zero truncada tem sido considerados por Tippett (1932),
Bliss (1948), David e Johnson (1952), Moore (1952), Rider (1953), Finney
(1955), Hartley (1958), Irwin (1959) e Cohen (1960), entre outros.
Um exemplo de aplicao da distribuio Poisson zero truncado, segue
o mtodo sugerido por Plackett (1953), e utiliza os dados proporcionados por
Gupta e Kumar (1998). Estes autores estudaram 11 revistas bsicas do campo
da gentica populacional e aplicaram as distribuies do quadrado inverso,
poder inverso generalizado, a distribuio binomial negativa, a distribuio
geomtrica, e a distribuio truncada de Poisson. Neste artigo, ser aplicada
somente a distribuio zero truncada de Poisson, usando o mtodo sugerido
por Plackett (1953). O processo explicado passo a passo, porm utilizando
somente os dados correspondentes ao peridico Evolution. Os dados
apresentados pelos pesquisadores e referentes produtividade dos autores
so mostrados na TAB. 1:
TABELA 1 - Nmero de contribuies por autor no peridico Evolution
Nmero de contribuies
Nmero de autores
r
Nr
1
56
2
7
3
3
6
1
TOTAL
67
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

Se se considerar esses dados como uma amostra de 67 autores, temse uma distribuio zero truncada, na qual a freqncia dos autores que no
produziram um nico artigo durante o perodo estudado esto ausentes, ou
seja, os autores no foram contabilizados, e so desconhecidos. Esta a forma
mais comum em que os dados se apresentam nas distribuies bibliomtricas
da produtividade dos autores, em qualquer campo do conhecimento. Ento, o
estimado que se busca :

* =

rN

r=2

(3)

1 Calcular * (Lambda) ou a media da distribuio de freqncias


Para calcular *, que representa a media da distribuio de freqncias,
necessrio primeiro organizar os dados, como na TAB. 2:
TABELA 2 - Clculo da media da distribuio das freqncias de *
N de cotribuies N de autores Total de artigos produzidos
r
Nr
rNr
1
56
56
2
7
14
3
3
9
6
1
6
Total
67
Se se considerar que um total de 85 artigos foram produzidos por 67
autores, quantos autores se estimariam que, no perodo estudado, produziriam
somente 1 artigo? E quantos 2, 3, 4, n artigos cada um? O modelo de
Poisson deve responder da forma mais exata possvel a estas perguntas.
a) A equao (3) indica um somatrio da multiplicao rNr, que vai
de r = 2 at o ltimo valor do total de artigos, ento, tomando os valores
apresentados na TAB. 2, tem-se que: 14 + 9 + 6 = 29 ou, alternativamente,
85 56 = 29.
b) Solucionando a equao (3) tem-se:

*=

r N
r =2

29
= 0.43284
67

2 Calcular os valores esperados

Com o valor de * = 0.43284 j conhecido, calcular os valores esperados


usando a equao (2)

23
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

Para r = 1 (o nmero dos autores que produziram 1 artigo)


0.432841 2.718 0.43284
P1 =
1!(1 2.718 043284 )
P1 =

0.43284 0.64869
0.28077898
=
= 0.799243236 67 = 53.6
1!(1 0.35131)
0.35131

Para r =2 (o nmero dos autores que produziram 2 artigos)


P2 =

0.43284 2 0.64869
0.187350466 0.64869
0.121532374
=
=
2 !(0.35131)
2 0.35131
0.70262

P2 = 0.172970273 67 = 11.6

Para r = 3 (o nmero dos autores que produziram 3 artigos)


P3 =

0.43284 3 0.64869
0.081092776 0.64869
0.052604073
=
=
3!(0.35131)
6 0.35131
2.10786

P3 = 0.024956151 67 = 1.7 e assim sucessivamente, para os valores de


r = 4, 5 e 6, ou seja, o nmero dos autores que produziram 4, 5 e 6 artigos.
3 Comparao dos valores observados e esperados
Com os valores esperados ou tericos calculados, elaborar uma tabela
especial de tal maneira que facilite a comparao entre os valores observados
e os valores esperados. Esta comparao mostrada na TAB. 3,
TABELA 3 - Comparao dos valores observados e esperados
No. de contribuies
r
1
2
3
4
5
6
Total

Freqncias
observadas
Nr
56
7
3
0
0
1
67

Freqncias
esperadas
rNr
53.6
11.6
1.7
1.7
0.02
0.001
67.121

24

Nesta tabela, observa-se quo prximos ou afastados esto ambos os


valores verificados e calculados. Quanto mais prximos estiverem os valores
esperados dos valores encontrados, maior ser a possibilidade de que os dados
se ajustem ao teste qui-quadrado. E, inversamente, quanto mais afastados
estiverem os valores esperados dos valores observados maior ser a
possibilidade de que os dados no se ajustem ao teste do qui-quadrado.
Observe tambm se os totais so os mesmos, quase os mesmos ou divergentes
para ambos valores verificados e calculados. Neste caso, as divergncias entre
ambas observaes so mnimas.
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

4 Estabelecer as hipteses e selecionar um nvel de significncia


(recomenda-se = .05)
O que se ir testar se a distribuio de Poisson zero truncada obtida
experimentalmente homognea ou no. Isto , a probabilidade de que um
elemento includo na amostra o mesmo (igualmente provvel) para todos os
elementos nessa mesma situao. Portanto, sero estabelecidas as hipteses
da seguinte forma:
Ho = a distribuio representa as contagens de r = 1, 2, 3 .....
Ha a distribuio no representa as contagens de r = 1, 2, 3 .....
5 Calcular o teste estatstico x2 (qui-quadrado), usando a seguinte
equao:

onde,
fo = valores das freqncias observadas
ft = valores das freqncias tericas, esperadas ou calculadas
Para facilitar o clculo do x2 (qui-quadrado), deve-se elaborar uma tabela
como a que se indica a seguir. No obstante, necessrio chamar a ateno
para o fato de que, quando se aplica o teste x2 , nenhuma das freqncias
observadas deve ser inferior a 5. Ao se encontrar freqncias menores do
que 5, ser necessrio reunir as freqncias adjacentes em grupos no inferiores
a 5, para que, dessa forma, o x2 no perca validez nem consistncia. Um
exemplo de clculo do x2 com agrupamento de freqncias adjacentes inferiores
a 5 so mostradas na TAB. 4 na qual as freqncias de 3 a 6 foram agrupadas
para produzir um caso extremo e especial de 4 freqncias observadas.
TABELA 4 - Clculo do x2 com agrupamento das freqncias observadas
inferiores a 5

fof

1
56
2
7
3-6 4

ft
53.6
11.6
1.921

2.4
-4.6
2.079

5.7600
0.2116
4.3222

0.1075
0.0182
2.2500
2
X = 2.3757

25
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

6 Especificar a regio de rejeio das hipteses ao nvel de significncia


de = .05
a) Determinar os graus de liberdade:
df = k h - 1 = 3 1 1 = 1
onde,
df = so os graus de liberdade
k = o nmero de pares de dados observados depois de agrupar os
valores inferiores a 5. Como se mostra na TAB. 4, ao se agrupar
as freqncias 3 a 6, o valor de k, neste caso, igual a 3.
h = o nmero de parmetros usados na soluo da equao (2).
Neste caso s um, o parmetro .
1 = o nmero de restries usadas para os clculos dos valores
esperados. Neste caso 1.
Quando se trata da distribuio de Poisson, o nmero de graus de
liberdade sempre ser igual ao nmero de casos menos 2, porque se emprega
a mdia e a freqncia total para estimar as freqncias esperadas.
b)
Usando o nvel de significncia de = .05 na Tabela do x2 de qualquer texto
estatstico (TAB. 1, em Anexo) encontrar a regio de rejeio.
Se o x2 > x2.05
rejeitar a hiptese nula (aceitar a Ha)
Se o x2 < x2.05 aceitar a
hiptese nula (rejeitar a Ha)
c) Usando a TAB. 1 dos valores
2
crticos do x .05 (Anexo 1) correspondentes a 1 grau de liberdade, encontra-se
um valor igual a 3.84146. Assim, a regio de rejeio da hiptese nula a
parte escurecida da FIG. 1 situada direita. A regio de aceitao a parte
esquerda dessa figura.
Ento,
0.10
0,90
0,80
0,70
0,60
0,50
0,40
0,30
0,20
0,10
0,00

Regio de rejeio
= 5%
Regio de aceitao

26

FIGURA1 Grfico das regies de aceitao e rejeio das hipteses.


Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

7 Interpretao
Como o x2 calculado (igual a 2.3757) menor que o valor crtico do
x (igual a 3.84146), aceita-se a hiptese nula, ao nvel de significncia de
0.05. Por isso, conclui-se que as propores so homogneas e procedem de
uma distribuio do tipo Poisson. Em outras palavras, esta distribuio dos
autores produtores de literatura sobre gentica populacional se ajusta
distribuio da produtividade dos autores quando se usa o modelo Poisson
zero truncado.
2
.05

8 Disperso dos valores observados e calculados


Conforme se mostra na FIG. 2, a aproximao ou afastamento entre
os valores observados e calculados podem ser melhor visualizados e
observados no traado da disperso dos dados de ambas as distribuies.
Reomenda-se incluir esta figura na redao do informe final.

65

55

No. de autores

45

35

25

15
esperado
5
observado
-5
1

No. de contribuies
FIGURA 2- Grfico de disperso das frequncias observadas e esperadas
Concluso
Utilizando-se o mtodo de estimao do parmetro proposto por
Plackett (1953), verificou-se que foi igual a 0.43284. Com este valor,
estimaram-se adequadamente as freqncias esperadas da produtividade dos
autores. O teste x2 (qui-quadrado) foi usado para avaliar o ajuste dos dados

27
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

observados e dos dados esperados. Ao 0.05 nvel de significncia, e com 1


grau de liberdade, observou-se que o valor crtico do x2 foi igual a 3.84146,
muito maior do que o valor do x2 calculado de 2.3757. Portanto, aceita-se a
hiptese nula e conclui-se que esta literatura ajusta-se muito bem lei de
Lotka, usando-se a distribuio de Poisson zero truncado.
A classe zero da distribuio truncada de Poisson

Como assinalado anteriormente, na maioria das observaes


bibliomtricas, a distribuio das contribuies dos autores que no produzem
um nico artigo ou trabalho escrito (quando x = 0) no observada nem
relatada nos trabalhos publicados. Para situaes deste tipo (quando se quer
conhecer quantos autores no publicaram um nico artigo), Dahiya e Gross
(1973) propem um mtodo de expectativa bastante adequado.
Se no designa o nmero de freqncias da classe zero que no foram
observadas na amostra, ento o total da amostra completa N = no + n.
representem os esperados da mxima probabilidade
Se se permitir que e
de e N respectivamente, ento esses valores so as solues de:

= X *

(1 e)

(1.2)

e
R

N =

xn
x =1

n
p

(1.3)

onde,

N ~ se
~
X si n 1
X* = n
0 se
si n = 0,

(1.4)

e,
R

~
X =

xn
x =1

representa a mdia da amostra completa de N

observaes.
Para facilitar a soluo da equao (1.2), Cohen (1960) proporciona uma
tabela especial, que est includa no Anexo 2. Uma vez que se tenha estimado
^
, usando a equao (1.3), pode-se estimar facilmente o valor de N. Em seguida,
calcula-se no usando a equao (1.5) abaixo
n q
no = N n =
(1.5)
p

28

onde,
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

q = e

p =

Clculo da classe zero da distribuio truncada de Poisson


Ser apresentado um exemplo do clculo das freqncias no
observadas da distribuio de Poisson, usando os dados de Gupta e Kumar
(1998) em que os autores fornecem os seguintes dados, correspondentes a
trabalhos publicados no peridico Evolution. Como se pode verificar na TAB.
5, os pesquisadores no oferecem o nmero dos autores que no produziram
um nico artigo, ou seja, aqueles que, teoricamente, tiveram zero artigos
publicados, no esto presentes na amostra coletada.
TABELA 5 - Nmero de contribuies por autor no peridico Evolution
N de contribuies
r
1
2
3
6
Total

N de autores
Nr
56
7
3
1
67

Total de artigos produzidos


rNr
56
14
9
6
85

1. Calcular

Para calcular o valor de

ser usado o mtodo sugerido por Cohen

(1960)
a) Calcular a mdia:

b) Estimar
usando a TAB. 2 (Anexo 2) e arredondando diretamente a duas
ou trs decimais, ou por interpolao linear:
Na TAB. 2, a mdia x = 1.2687, arredondados a duas decimais x =
1.27, corresponde a

= 0.4987, arredondados a trs decimais,

= 0.499.

2. Calcular N ~
usando a equao (1.3)

29
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

3. Calcular no usando a equao (1.5)


n q
no = N n =
p

(1.5)

a) Calcular q = e

q = e = 2.718 0.499 = 0.6072


b) Resolver a equao (1.5)
n o =

85 0.6072
51.6094
=
= 103.4256 103.0
0.499
0.499

Ento, pode-se afirmar que existiam 103 autores que, trabalhando


dentro do campo da gentica populacional, no perodo estudado por Gupta e
Kumar (1998), no submeteram avaliao um s artigo ao peridico Evolution.
Em outras palavras, no campo da gentica populacional existiam 103 autores
que, no perodo estudado por Gupta e Kumar (1998), no tiveram
produtividade de artigos. Portanto, a populao total de autores no campo da
gentica populacional, plausvel de submeterem artigos ao peridico Evolution
seria de
N = no + n
N = 103 + 67 = 170
Este valor de 170 autores perfeitamente coincidente com o valor
encontrado na soluo da equao (1.3).

Zero truncated Poisson distribution applicated to authors productivity


Describes the nature of the zero truncated Poisson distribution as
developed by Plackett with specific equations for cases when zero
observations are not present in the data collected. In the bibliometric
area it is very common to find data without zero frequency distributions, an
application process of this distribution model is described step-by-step. To
illustrate the application, process data collected and studied by Gupta and
Kumar on populational genetics literature, and published in the journal
Evolution, are replicated.

30

Key
-words
ey-words
-words: Lotkas law; Zero truncated Poisson distribution;
Authors
productivity; Bibliometrics; Genetics; Informetrics; Scientometrics

Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Rubn Urbizagstegui Alvarado

Referncias
BLISS, C. I. Estimation of the mean and its error from incomplete Poisson distributions.Connecticut
Agricultural Experiment Station Bulletin, 513, p.1-12, Jan. 1948.
COHEN, A. Clifford. Estimating the parameter in a conditional Poisson distribution.Biometrics, v. 16,
n. 2, p. 203-211, June 1960.
DAHIYA, Ram C.; GROSS, Alan J. Estimating the zero class from a truncated Poisson sample.
Journal of the American Statistical Association, v. 68, n. 343, p. 731-733, Sept. 1973.
DAVID, F. N.; JOHNSON, N. L. The truncated Poisson. Biometrics, 8(4):275-285, Dec.1952.
FINNEY, D. J.; VARLEY, G. C. An example of the truncated Poisson distribution. Biometrics, v. 11, n.
3, p. 387-394, Sept. 1955.
GUPTA, B. M.; KUMAR. Suresh. Scientific productivity in theoretical population genetics: a case
study in core journals. Library Science with a Sland to Documentation and Information Studies, v.
35, n. 2, p. 89-97, June 1998.
GUPTA, B. M.; KUMAR. Suresh; ROUSSEAU, R. Applicability of selectedprobability distributions to
the number of authors per article in theoretical population genetics: Scientometrics, v. 42, n.3, p.
325-334, 1998.
HARTLEY, H. O. Maximum likelihood estimation from incomplete data. Biometrics,v. 14, p.174-194,
1958.
HUBER, John C. Invention and inventivity as a special kind of creativity, with implications for general
creativity. Journal of Creative Behavior, v. 32, n.1, p.58-72,1998a.
HUBER, John C. Invention and inventivity is a random Poisson process: a potential guide to analysis
of general creativity. Creativity Research Journal, v. 11, n. 3, p. 231-241, 1998b.
IRWIN, J. O. On the estimation of the mean of a Poisson distribution from a sample with the zero
class missing. Biometrics, v. 15, n. 2, p. 324-326, June 1959.
KENDALL, M. G. Natural law in the social sciences. Journal of the Royal Statistical Society. Series
A, v. 124:1-19, 1961.
MANTELL, Leroy H. On laws of special abilities and the poduction of scientific literature. American
Documentation, v. 17, n.1, p. 8-16, Jan. 1966.
MOORE, Biometrika, v. 39, p. 247-251, 1952.
PLACKETT, R. L. The truncated Poisson distribution. Biometrics, v. 9, n. 4, p. 485-497, Dec. 1953.
POTTER, William Gray. Lotkas law revisited. Library Trends, v.30, n. 1, p. 21-39, Summer 1981.
RIDER, Paul R. Truncated Poisson distributions. Journal of the American Statistical Association, v.
48, n. 264, p. 826-830, Dec. 1953.
TIPPETT, L. H. C. A modified method of counting particles. Proceedings of the Royal Society, Series
A, v. 13, p. 434-446, Sept. 1932.
VLACH, Jan. Evaluating the distribution of individual performance. Scientia Yugoslavica, v. 6, n. ,
p. 267-275, 1980.

31
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Aplicao da distribuio Poisson zero truncada produtividade

Anexo I
TABELA 1: Valores crticos de x2

Graus de
liberdade

0,000039
0,010025
0,071722
0,206989
0,411742
0,675727
0,989256
1,344413
1,734933
2,155856
2,603222
3,073824
3,565035
4,074675
4,600916
5,142205
5,697217
6,264805
6,843971
7,433844
8,033653
8,642716
9,260425
9,886234
10,519650
11,160240
11,807590
12,461340
13,121150
13,786720
20,706540
27,990750
35,534490
43,275180
51,171930
59,196300
67,327560

32

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
50
60
70
80
90
100

Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

0,000157
0,020101
0,114832
0,297110
0,554298
0,872090
1,239042
1,646497
2,087901
2,558212
3,053484
3,570569
4,106915
4,660425
5,229349
5,812212
6,407760
7,014911
7,632730
8,260398
8,897198
9,542492
10,195720
10,856360
11,523980
12,198150
12,878500
13,564710
14,256450
14,953460
22,164260
29,706680
37,484850
45,441720
53,540080
61,754080
70,064890

0,000982
0,050636
0,215795
0,484419
0,831212
1,237344
1,689869
2,179731
2,700389
3,246973
3,815748
4,403789
5,008751
5,628726
6,262138
6,907664
7,564186
8,230746
8,906516
9,590777
10,282900
10,982320
11,688550
12,401150
13,119720
13,843900
14,573380
15,307860
16,047070
16,790770
24,433040
32,357360
40,481750
48,757560
57,153170
65,646620
74,221930

0,003932
0,102587
0,351846
0,710723
1,145476
1,635383
2,167350
2,732637
3,325113
3,940299
4,574813
5,226029
5,891864
6,570631
7,260944
7,961646
8,671760
9,390455
10,117013
10,850811
11,591305
12,338015
13,090514
13,848425
14,611408
15,379157
16,151396
16,927875
17,708366
18,492661
26,509303
34,764252
43,187958
51,739278
60,391478
69,126030
77,929465

0,015791
0,210721
0,584374
1,063623
1,610308
2,204131
2,833107
3,489539
4,168159
4,865182
5,577785
6,303796
7,041505
7,789534
8,546756
9,312236
10,085186
10,864936
11,650910
12,442609
13,239598
14,041493
14,847956
15,658684
16,473408
17,291885
18,113896
18,939242
19,767744
20,599235
29,050523
37,688648
46,458888
55,328940
64,277844
73,291090
82,358136

Rubn Urbizagstegui Alvarado

Anexo II
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
20
25
30
40
50
60
70
80
90
100

2,705543
4,605170
6,251389
7,779440
9,236357
10,644641
12,017037
13,361566
14,683657
15,987179
17,275009
18,549348
19,811929
21,064144
22,307130
28,411981
34,381587
40,256024
51,805057
63,167121
74,397006
85,527043
96,578204
107,565009
118,498004

3,841459
5,991465
7,814728
9,487729
11,070498
12,591587
14,067140
15,507313
16,918978
18,307038
19,675138
21,026070
22,362032
23,684791
24,995790
31,410433
37,652484
43,772972
55,758479
67,504807
79,081944
90,531225
101,879474
113,145270
124,342113

5,023886
7,377759
9,348404
11,143287
12,832502
14,449375
16,012764
17,534546
19,022768
20,483177
21,920049
23,336664
24,735605
26,118948
27,488393
34,169607
40,646469
46,979242
59,341707
71,420195
83,297675
95,023184
106,628568
118,135893
129,561197

6,634897
7,879439
9,210340
10,596635
11,344867
12,838156
13,276704
14,860259
15,086272
16,749602
16,811894
18,547584
18,475307
20,277740
20,090235
21,954955
21,665994
23,589351
23,209251
25,188180
24,724970
26,756849
26,216967
28,299519
27,688250
29,819471
29,141238
31,319350
30,577914
32,801321
37,566235
39,996846
44,314105
46,927890
50,892181
53,671962
63,690740
66,765962
76,153891
79,489978
88,379419
91,951698
100,425184 104,214899
112,328793 116,321057
124,116319 128,298944
135,806723 140,169489

Anexo III

33
Perspect. cienc. inf., Belo Horizonte, v. 9, n. 1, p. 18-33, jan./jun. 2004

Anda mungkin juga menyukai