Alexandre Luna
Breno Miranda
Plano de Vôo
1. Introdução
1. Revisão Histórica
2. Fundamentos: Conceitos , princípios e relações
2. Técnicas e Métodos
3. Ferramentas
4. Aplicação
5. Conclusão
6. Referências
Bibliometrics
INTRODUÇÃO
Revisão Histórica [1,3]
• Bibliometria = avaliar e medir instrumentos referentes à
conhecimento, livros, obras [5, 12].
• Termo usado pela primeira vez, por Paul Otlet, na obra
intitulada Traité de Documentatión, de 1934;
• 1948, Ranganathan, na Conferência dea Aslib em Leamington,
Spa, sugere que Bibliotecários devem desenvolver a
“bibliotecometria”, para auxílio à gestão das informações
disponíveis em uma biblioteca;
• 1969, Neelameghan (DRTC – Documentation, Research and
Training Centre) esboçou aplicabilidade da “bibliotecometria”;
• 1969, Alan Pritchard popularizou o termo, substituindo de vez
a “bibliografia estatística” ou a “bibliotecometria” por
“bibliometria”, como é conhecida atualmente;
Leis da Bibliometria [1,3]
• Lei de Lotka ou Lei do Quadrado Inverso (1926)
– Aponta para a medição da produtividade dos autores,
mediante um modelo de distribuição tamanho-freqüência dos
diversos autores, em um conjunto de documentos;
• Lei de Bradford ou Lei da Dispersão (1934)
– Mediante a medição da produtividade das revistas, permite
estabelecer o núcleo e as áreas de dispersão sobre um
determinado assunto em um mesmo conjunto de revistas.
• Lei de Zipf ou Lei do Mínimo Esforço (1949)
– Consiste em medir a freqüência do aparecimento das palavras
em vários textos, gerando uma lista ordenada de termos de
uma determinada disciplina ou assunto.
Bibliometrics
FUNDAMENTOS
O que é?
• A bibliometria é um campo da ciência da informação,
que infere sobre a produção bibliográfica de um
determinado autor, grupo de pesquisa, instituição,
localização geográfica (país), campo de pesquisa, ou área
do conhecimento, tentando assim medir a sua
produtividade e assim criar métodos de comparação
entre eles. Outra medida utilizada também pode ser o
número de citações que foram feitas do documento
original, o que demonstra mais sobre a qualidade do
documento em questão.
Variáveis Número de Fatores que Difere da cienciometria Número de páginas por site, no de
empréstimos diferenciam as no propósito das variáveis. links por site, no de links que
(circulação) e de subdisciplinas. Como Por Exemplo: medir a remetem a um mesmo site, no de
citações, os cientistas se recuperação, a relevância, sites recuperados
freqüência de comunicam a revocação
extensão de frases
Métodos Ranking, Análise de conjunto e Modelo vetor-espaço, Fator de Impacto da Web (FIW),
freqüência, de correspondência, modelos booleanos de densidade dos links, “sitações”,
distribuição co-ocorrência de recuperação, modelos estratégias de busca
termos, expressões, probabilísticos; linguagem
palavras-chave, etc. de processamento,
abordagens baseadas no
conhecimento, tesauros
A - Bibliometria
B - Cienciometria
C - Informetria
D - Webometria
Fonte: adaptado de VANTI (2002).
Bibliometria contemporânea [1]
• Principais Grupos-alvo:
– (i) Bibliometria para Bibliométricos (Metodologia): Este é o domínio
da pesquisa bibliométrica básica e é tradicionalmente financiada pela
habituais concessões.
• Pesquisa Metodológica é conduzida principalmente neste domínio.
– (ii) Bibliometria para as disciplinas científicas (Informação Científica):
Os pesquisadores em disciplinas científicas formam o maior, mas
também o mais diverso grupo de interesses em Bibliometria. Devido a
sua principal orientação científica, os seus interesses estão fortemente
relacionados com a sua especialidade de cada subgrupo.
• Este domínio pode ser considerada uma extensão da ciência da informação por
meio de suas métricas. Aqui vamos encontrar também fronteira comum com a
pesquisa quantitativa em recuperação de informações.
– (iii) Bibliometria para as políticas de Ciência e gestão (Políticas
Científicas): Este é o domínio de pesquisa de avaliação comparativa,
atualmente o mais importante tópico do campo.
• Neste grupo, as comparações entre as estruturas em seus diversos níveis
(institucional, regional, nacional, internacional, e das áreas de conhecimento) estão
em primeiro plano.
Bibliometria x Aplicação de Serviços e
Áreas afins [1]
TÉCNICAS E MÉTODOS
Grande
Modelo de Processo [1,4]
quantidade de
dados de difícil
análise
Identificação Análise dos
das Preparação dos Tratamento Resultados e
necessidades Dados Bibliométrico assimilação do
de informação conhecimento
Indicadores de
alto valor
agregado
1 3 6 10
2 4 7
5 8
11 9
h-index (6) [5,6]
• O índice h, ou h-index em inglês, é uma proposta para quantificar a
produtividade e o impacto de cientistas baseando-se nos seus artigos
(papers) mais citados.
• Em outras palavras, o índice h é o número de artigos com citações maiores
ou iguais a esse número.
– um pesquisador com h = 5 tem 5 artigos que receberam 5 ou mais citações; um
departamento com h = 45 tem 45 artigos com 45 ou mais citações; e assim por diante.
– Uma ilustração alternativa de como o índice h não funciona também pode ser útil: um
pesquisador que publicou 2 artigos, sendo um deles numa revista obscura que lhe
rendeu apenas 2 citações e o outro como primeiro autor numa revista de prestígio
recebendo incríveis 238 citações, terá um índice h = 1 pois ele não tem nem 2 artigos
com pelo menos 2 citações.
• O índice pode ser também aplicado para estimar a produtividade e
impacto de um grupo de cientistas, um departamento, um país, e assim
por diante.
– O índice h foi proposto em 2005 por Jorge E. Hirsch como uma ferramenta para
determinar a qualidade relativa dos trabalhos de físicos teóricos, no paper An index to
quantify an individual's scientific research output, arXiv:physics/0508025 v5 29 Sep
2005.
Contemporary h-index (8) [6]
• The Contemporary h-index was proposed by Antonis
Sidiropoulos, Dimitrios Katsaros, and Yannis Manolopoulos in
their paper Generalized h-index for disclosing latent facts in
citation networks, arXiv:cs.DL/0607066 v1 13 Jul 2006.
• Acrescenta uma ponderação na relação com a idade para
cada artigo citado, dando (por padrão, isso depende da
parametrização) menos peso a artigos mais velhos. A
ponderação é parametrizada; a aplicação Publish or Perish[5]
usa gama=4 e delta= 1.
– Isto significa que para um artigo publicado durante o ano corrente, as
suas citações possuem peso 4.
– Para um artigo publicado 4 anos atrás, suas citações possuem peso 1.
– Para um artigo publicado 6 anos atrás, a citações possuem peso 4/6, e
assim por diante.
• This metric is shown as hc-index.
g-index (7) [6]
• The g-index was proposed by Leo Egghe in his paper
Theory and practice of the g-index, Scientometrics,
Vol. 69, No 1 (2006), pp. 131-152. It is defined as
follows:
• [Given a set of articles] ranked in decreasing order of
the number of citations that they received, the g-
index is the (unique) largest number such that the
top g articles received (together) at least g2 citations.
• It aims to improve on the h-index by giving more
weight to highly-cited articles.
• This metric is shown as g-index in the output.
Individual h-index (2 variations) (9) [6]
• The Individual h-index was proposed by Pablo D. Batista, Monica G. Campiteli,
Osame Kinouchi, and Alexandre S. Martinez in their paper Is it possible to
compare researchers with different scientific interests?, Scientometrics, Vol 68,
No. 1 (2006), pp. 179-189.
• It divides the standard h-index by the average number of authors in the articles
that contribute to the h-index, in order to reduce the effects of co-authorship; the
resulting index is called hI.
• Publish or Perish also implements an alternative individual h-index, hI,norm, that
takes a different approach: instead of dividing the total h-index, it first normalizes
the number of citations for each paper by dividing the number of citations by the
number of authors for that paper, then calculates hI,norm as the h-index of the
normalized citation counts. This approach is much more fine-grained than Batista
et al.'s; we believe that it more accurately accounts for any co-authorship effects
that might be present and that it is a better approximation of the per-author
impact, which is what the original h-index set out to provide.
• These metrics are shown as hI-index (Batista et al.'s) and hI,norm (PoP's) in the
output.
Age-weighted citation rate (AWCR,
AWCRpA) and AW-index (10) [6]
• The age-weighted citation rate was inspired by Bihui Jin's note The AR-index:
complementing the h-index, ISSI Newsletter, 2007, 3(1), p. 6.
• The AWCR measures the number of citations to an entire body of work, adjusted
for the age of each individual paper. It is an age-weighted citation rate, where the
number of citations to a given paper is divided by the age of that paper. The AW-
index is defined as the square root of the AWCR to allow comparison with the h-
index; it approximates the h-index if the (average) citation rate remains more or
less constant over the years.
• The per-author age-weighted citation rate is similar to the plain AWCR, but is
normalized to the number of authors for each paper.
• These metrics are shown as AWCR, AWCRpA and AW-index in the output.
Bibliometrics
FERRAMENTAS
Principais Ferramentas
1. Bibliometrics ToolBox [1,7]: Criado por Terrence A. Brookes
para apoiar bibliometricians na preparação de estatísticas
de seu dados;
2. Dataview [1,10]: Software comercial, desenvolvido pelo
Centro de Recherche Retrospective de Marseille (CRRM) na
Faculté Saint Jérome, em Marselha (França).
3. BibExcel [1,9]: é uma ferramenta freeware desenvolvida por
Olle Persson, Inforsk, Univ Umeå (Suécia).
4. BibTechMon [1]: é um produto comercial desenvolvido em
Centros de Investigação austríaco Seibersdorf (Áustria).
5. Harzing’s Publish or Perish [6]: é um software que recupera
e analisa citações acadêmicas, usando o Google Acadêmico.
Harzing’s
Publish
or Perish
[6]
APLICAÇÃO
CASE STUDY ANALYSIS [11]
Fuel Cell Technology in the U.S. Automotive Industry
“America must have an energy policy that plans for the future, but meets the needs
of today. I believe we can develop our natural resources and protect our
environment" President George Bush
• Information from the Energy Information Administration, April 2004, points out that the
United States of America is the world's largest energy producer, consumer, and net
importer ranking eleventh worldwide in reserves of oil, sixth in natural gas, and first in coal.
Government reports showed how energy demand has continued growing rates since 1970’s.
However, non-renewable energy resources are worth and limited. Then, the efforts to reduce
the energy consumption levels and/or generate more energy alternatives to alleviate the
current situation must be a constant effort that should motivate academics, scientific,
managers and politicians at this time.
• Rueda, Chandiwalla, Said, Bassam and Alsudiri emphasized three main forces pushing people
to find energy alternative sources:
i) energy demand is growing;
ii) the limitation of the fossil fuel reserves; and
iii) the environmental problems, emissions, generated by current sources. The
following figures illustrate how each one is a problem in the US economy.
CONCLUSÃO E DISCUSSÕES
Conclusão e Discussões
1. Bibliometria deve ser encarada como:
1. Um campo de Pesquisa de grande importância e potencial, nas áreas de
Gestão do Conhecimento e Ciência da Informação, dentre outras áreas;
2. Um conjunto de técnicas e métodos essenciais para apoiar os processos de:
1. Direcionamento do processo de Revisão Bibliográfica sobre qualquer tema;
2. Acompanhamento do Impacto da Produção Científica de Pesquisadores, Grupos
de Pesquisa, Instituições e Países, em diversas áreas do Conhecimento;
3. Estudo de Indicadores de Produção Científica para apoiar o processo de decisão
de investimento de P&D, por Instituições de Fomento;
4. Destacar o desenvolvimento de um campo em uma área do conhecimento
específica;
5. Análise de Tendências de Pesquisas, identificando áreas emergentes da ciência e
mapeando ONDE e com que FREQUÊNCIA artigos específicos são publicados e
citados.
2. No caso de Estudos de Futuro:
1. Deve ser combinadas com outros Métodos e Técnicas [11];
2. O uso de Bibliometria se aplica mais adequadamente ao item 1.2.1;
3. Bem como à análise das tendências identificadas nos itens 1.2.2 a 1.2.5,
assim como aos impactos das mesmas sobre o estudo em questão.
Perguntas
Bibliometrics
REFERÊNCIAS
Referências Bibliográficas
1. GLÄNZEL, W. ; Bibliometrics as a Research Field, COURSE HANDOUTS, 2003;
2. ROUSSEAU, R.;Bibliometric and econometric indicators for the evaluation of scientific institutions, Ci.
Inf. vol.27 n.2 Brasília 1998;
3. VANTI, N.A.P., Da Bibliometria à Webometria: uma exploração conceitual dos mecanismos utilizados
para medir o registro da informação e a difusão do conhecimento, Ciência da Informação, Brasília, v. 31,
n. 2, p. 152-162, maio/ago. 2002;
4. PENTEADO FILHO, R. DE C. ; FARIA, L.I. L. DE ; VIEIRA, J. L. G. ; KURIHARA, M. H.; AVILA, A. F. D.;
QUONIAM, L.; Aplicação da Bibliometria na Construção de Indicadores sobre a Produção Científica da
Embrapa; Workshop Brasileiro de Inteligência Competitiva e Gestão do Conhecimento, 2002, São Paulo.
Anais.
5. Wikipedia: http://www.wikipedia.org/, acessado em 27/10/2008, 09:20h;
6. Harzing’s Publish or Perish: http://www.harzing.com/pop.htm, acessado em 28/10/2008, 10:54h;
7. The Bibliometrics Toolbox: http://projects.ischool.washington.edu/tabrooks/hyper/biblio.html,
acessado em 28/10/2008, 10:21h;
8. SITKIS -A software tool for bibliometric analysis: http://users.tkk.fi/~hschildt/sitkis/index.html, acessado
em 28/10/2008, 10:36h
9. BIBEXCEL, Toolbox for Bibliometricians: http://www.umu.se/inforsk/Bibexcel/, acessado em
28/10/2008, 10:51h;
10. Data View: http://www.slb.com/content/services/evaluation/software/dataview.asp, acessado em
02/11/208, 19:13h;
11. Daim, T. U. ; Rueda, G. R.; Martin, H. T.; Technology Forecasting Using Bibliometric Analysis and System
Dynamics; IEEE Xplore, 2004.
12. TORRINHA, F. Dicionário português-latino. Porto : Ed. Domingos, 1939. 1129 p.
13. LEEDS, S.; Data Mining: Beware of the shaft. Direct Marketing. 62(9), Jan, 2000,
ajhol@cin.ufpe.br
brenoafmiranda@gmail.com