Anda di halaman 1dari 18

ESTADISTICA ESPAOLA

Vol. 35, Nm. 132, 1993, pgs. 105 a 122

Anlisis de Citas en Revistas de Estadstica


K. FZ. AGIRRE
J. M. PIRIS (*)
F. TUSELL (1)
Departamento de Econometra y Estadstica
Facultad de CC.EE. y Empresariales
Universidad del Pais Vasco

RESUMEN
Se analiza una tabla de contingencia de doble entrada cuyas casiIlas ij representan el nmero de veces que la revista i cita a la revista
j. EI anlisis muestra una estructura interesante. EI anlisis de correspondencias es una herramienta ideal, porque tiene en cuenta el carcter no reflexivo de la relacin citando ser citado (esto es, el
hecho de que los valores ij y ji son en general bastante ^iiferentes).
Palabras clave: Anlisis de correspondencias, bibliomtrica.

Clasificacin AMS: 62-07, 62H 17.

1.

INTRODUCCION

La profusin de trabajos impresos en todas las reas del saber es un fenmeno


de nuestro tiempo, y la Estadstica no es una excepcin. En los ltimos quince
aos, un elevado nmero de nuevas revistas se ha sumado a las ms veteranas,
enriqueciendo as la escena estadistica. Ello confronta a 1os autores con una
mayor variedad de eleccin en la actualidad, cuando deciden a qu revista
(*) Fallecido.
(1) Estamos agradecidos a los asistentes a una de las sesiones del Fifth Internationa!
Symposium on Applied Stochastic Models and Data Analysis por su inters y sugerencias. Esta
versin se ha beneficiado adems de las crticas de dos evaluadores annimos, a los que querernos
expresar nuestra gratitud.

^T^^[^^ ;.

someter su trabajo para su posible publicacin. Factores a tener en cuenta en


esta eleccin son el prestigi de la revista, la agilidad, calidad y honestidad de!
proceso de evaluacin, y el tipo de lectores a los que se quiere Ilegar.
Por otra parte, los organismos pblicos y privados que distribuyen fondos para
la investigacin necesitan criterios para ciasificar las diferentes revistas, en orden
a valorar la relevancia y entidad de los trabajos que se publican.
La realizacin de encuestas a miembros de la profesin es una posible va a
seguir para efectuar una taxonoma de las diferentes revstas de una especialidad. Son, sin embargo, caras y difciles de realizar, especialmente cuando la
comunidad cientfica est dispersa por muchos pases. Una fuente de informacin
alternativa consiste en explotar la informacin que existe sobre citas cruzadas
entre las diferentes publicaciones, informacin que puede compilarse para un
buen nmero de revistas sin excesivo trabajo. Las Secciones que siguen muestran el resultado de un anlisis estadstico de datos de esta naturaleza. Adems
de su inters intrnseco, ilustran cmo el anlisis de correspondencias puede ser
una alternativa al anlisis cluster cuando las diferencias entre objetos no quedan
bien descritas por una rnatriz de distancias (o similaridades) simtrica.

2.

LOS DATOS

Las datos son nmero de citas en revistas de Estadstica (concepto este


interpretado ampliamente, lo que incluye, por ejemplo, al Journal of Econometrics), datos que han sido manualmente compilados a partir de informacin en
Garfield (1985).
Pueden ser descritos como una tabla tridimensional. En filas, tenemos I= 33
categoras, 32 de las cuales corresponden a revistas estadsticas mientras que
la 33 es un agregado de todas las dems publicaciones consideradas, estadisticas o no. En columnas tenemos J= 20 categoras, correspondiendo a revistas
escogidas entre las 32 anteriormente citadas, sobre la base de la informacin
disponible, sin que ello deba interpretarse como juicio implicito de ninguna especie. La tercera dirnensin es tiempo: tenemos una tabla para cada uno de los
aos entre 1976 y 1985, y otra para los aos anteriores a 197fi. EI conjunto de
datos completo es por tanto una tabla que Ilamaremos K,^T, cuyo elemento
genrico k;jt es el nmero de citas hechas de la revista j por la revista i durante
el perodo t.
No habra ningn problema, en principio, en realizar un anlisis convencional
(por ejemplo, mediante modelos logartmico-lineales) sobre la tabla tridimensional
descrita. No nos hzmos limitado a ello por varias razones. En primer lugar,
nuestro objetivo es puramente descriptivo. No nos aproximamos a los datos con
hiptesis en mente que deseemos contrastar: de hecho, las que acudiran de

101

Ar^At ^^^i^^ [^F ^;^^r,^^a E^ r^ F^E^^^^^^^ra^^ ^^F E^^^..,7^[^^^^^:.;r^r f^

inmediato (independencia, cuasi-independencia, homogeneidad marginal de subtablas), o no son de aplicacin a nuestros datos, o seran triviales. En segundo
lugar, algunos factores complicaran algo el anlisis {como es la presencia de
ceros estructurales correspondientes a algunas revistas que slo se publicaron
parte del perodo). En tercer lugar, y sobre todo, la tabla tridimensional K,^T est
muy vaca , con abundancia de ceros no estructurales.

Por todos estos motivos, hemos agregado K^^T a lo largo de la dimensin temporal
para producir una tabla K^^. Estamos considerando pues totales de citas intercambiadas entre las diferentes revistas para un perodo de ms de una dcada.
La lista de revistas consideradas se muestra en la Tabla 1. La Tabla K,^ se
muestra en el Apndice A(Tabla 5).
Una rpida ojeada a la Tabla 5 muestra una pauta evidente: la diagonal del
bloque 20 x 20 superior es prominente, mostrando una fuerte tendencia de los
artculos en una revista a citar artculos en la misma revista. Esto es algo que
cabra esperar, per^ el alcance de la endogamia que los datos ponen de
manifiesto es notable: en prcticamente todos los casos, el mayor nmero de
citas de una revista tiene como receptor a la rnisma revista.

TABLA 1
Relacin de revistas analizadas
Etiqueta

Revista

Etqueta

Revista

adap*
amst*
annp*
anns*
asrj*
bics*
bika*

Advances in Applied Probability


American Statistician
Annals of Probability
Annals of Stat.
Applied Statistics
Biametrics
Biometrika

psyk*
stat*
tech*
thpa*
csts
cstt
sana

Psychometrika.
The Statistician.
Technometrics.
T. of Prob. and its App.

csda*

Comp. Stat. and Data Anal.

sanb

insr*
jasa*
japr*
jman*
jrsa*
jrsb*

International Stat. Review


J. of the Amer. Stat. Assoc.
J. of Applied Probability
J. of Mult. Analysis
J. of the Royal Stat. Soc., Ser. A
J. of the Royal Stat. Soc., Ser. B

stme
cjst
jeco
splt
bioj
scaj

jscs*

J. of Stat. Comp. and Simul.

stop

jspi*

J. of Stat. and P/anning Infer.

jcla
oths

Comm. in Stat.: Simul.


Comm. in Stat.: Theory.
Sankhya, Series A.
Sankhya, Series B.
Statistics in Medicine.
Canadian J. of Stat.
J. of Econometrics.
Stat. and Prob. Letters.
Biometrical J.

Scandinavian J. of Stat.
Stochastic Processes.
J. of Classification.

Others.

* Las revistas con un asterisco entran en el anlisis como emisoras y receptoras de citas; las
dems, sla como emisoras de citas.

FIGURA 1
Proyeccin sobre XY ^matriz de datos brutos)
X^ Primer eje, Y ^ Segundo eje
A
J

adap
jca

o p^y l.

^ ('S1)^1
^ P S ^i' I

^ S'I`.^ I
o st^.t

^ ^3I('S

csdat, ^ o^ ^^'^^'
O

J R SA

o r^ths

o DIUj

^;^^.1 tt..15r1`
. . ^3
.I^
^^^. .T1^;C'If
^

o a^rnstJ rsl^^ .A

o t.^^cli
I N^ 1^

jsrs o csts
^S^
o
^ ^rYSr^,^tt
^ f'r^ s^r^h

o hi ka

ANNP
^
j^p^o o^r-JS^,^^
^.
0

splt

annp

^ ANNS
o anrls
_ _1
-.2

thpa

r
.(l
.k'

Por este motivo, hemos realizado un anlisis de correspondencias usando la


Tabla 5 tal y como ha sido reproducida, del que damos cuenta a continuacin, y
hemos considerado en la Seccin 5 el tratamiento que cabe dar a dicha diagonal.
^a tcnica empleada, el Anlisis de Correspondencias, se origin por el trabajo
del Prof. Benzecri y colaboradores. Un tratamiento extensivo puede verse en
Benzecri (1976); otras referencias son Greenacre (1984) y Cuadras (1981). Un

^.
.
.
^^^r^^I I`^^^^, I)E^ ^;I Tr^ ; E h^^ RE ^^^'^; ^.^:^^.^ ^^F E^^^^ i.^^^^^ ^^ ^

..

tipo de anlisis estrechamente relacionado es el que produce grficos denorninados biplots: vase por ejemplo Seber (1984). En ambos casos, el objetivo
consiste en proporcionar grficos bidimensionales de la nube multivariante de
puntos, en que tanto casos como variables (filas y columnas de la matriz de datos
anaiizada) se representan de manera simultnea.
EI Anlisis de Correspondencias est particularmente indicado en la descripcin de este conjunto de datos porque no requiere comenzar con una matriz de
proximidades cuadrada. Ello permite incluir revistas para las que no tenemos
datos como receptoras de citas, aunque s corno emisoras. Por otra parte, la
simetra tampoco es un requerimiento. Evidentemente, siempre podramos simetrizar cualquier matriz cuadrada. Pero condensar en un solo nmero !a distancia
entre dos revistas i y j violenta la naturaleza de los datos: citar y ser citado son
cosas bien diferentes, y hallar una sola medida de proximidad entre dos revistas
incorpora siempre una dosis de arbitrariedad. Ninguna nocin escalar de distancia o proximidad entre las revistas i y j puede incorporar toda la informacin
contenida en las casillas ij y ji de la Tabla K,^.

Por ello, en nuestro anlisis cada revista se representa dos veces en cada uno
de los grficos: las etiquetas en maysculas (y el smbolo en los grficos}
representan revistas como receptoras de citas. Las etiquetas en minsculas (y
el smbolo o en los grficos) representan revistas como emisoras de citas. La
gran distancia que en ocasiones separa a las dos etiquetas asociadas a una
misma revista es indicativa de la notable diferencia que existe entre la naturaleza
de las fuentes y la de los destinos de la investigacin en ella publicada. EI forzar
la simetra en la matriz de distancias original (y colapsar ambas etiquetas en una
sola) oscurecera por completo este hecho.

3.

ANALISIS DE LA MATRIZ DE DATOS BRUTA

Hemos hecho un anlisis de correspondencias convencional reteniendo tres


autovalores; el cuarto est enteramente inducido por la presencia de una sola
revista, Computatianal Statistics and Data Ana/ysis, cuyo diferente perfil fundamentalmente refleja el hecho de haberse publicado slo durante parte del perodo
de anlisis. Tanto csda como CSDA tienen una abrumadora contribucin a la
inercia proyectada en el cuarto eje.
Una repeticin del anlisis en que dicha revista fue excluida de la muestra
(aunque utlzada como variable ilustrativa) produjo una cada de la inercia total
de 1.129 a 1.051, con los primeros tres valores propios dando cuenta del 59,52
por 100 de la inercia total, como muestra la Tabla 2.

^,, 7 t^^;^^^^^ 1 ^^ ., E_ ^F^^,r^,;i

1 1O

TABLA 2
Inercia explicada por los primeros tres autovalores
(considerando autocitas
Autovalor

Valor

% inercia

% tra2a
acumulado

.3026
.1765

28,77
16, 78

28,77
45, 56

.1468

13,96

59,52

Las Figuras 1 y 2 son rnapas mostrando los planos generados por los primeros
tres ejes tomados por pares. La Figura 1 es particularmente interesante: el eje 1
parece ser una direccin en que las revistas especializadas en Probabilidad se
separan del resto. Vemos annp y ANNP as como el par thpa-THPA lejos del
principal agrupamiento de revistas estadsticas, en una posicin extrema, y con
abundancia de autocitas lo que resulta evidenciado por la proximidad relativa
de las dos etiquetas correspondientes a cada revista.
Tal como muestran sus coordenadas a lo largo del primer eje, tanto jman como
JIUTAN estn en una posicin interrnedia, lo mismo que sucede con los pares
japr-JAPR y adap-ADAP (en la figura, todos estos puntos quedaran fuera del
grfico con la escala empleada; han sido trados al borde derecho. Sus coordenadas aparecen en la Tabla 3).
Esto es algo bien de acuerdo con lo que cabra esperar, dado el uso intensivo de
Teora de la Probabilidad que tpicamente exhiben los artculos en dichas revistas.
La interpretacin del segundo eje no es ni mucho menas tan clara, aunque
parece tentador adscribir un sesgo algo ms terico a las revistas apareciendo
en la parte baja del grfico.

TA B LA 3

Coordenadas de los puntos traidos al margen (considerando autocitas)


Etiqueta

Eje 1

ADAP
JAPR
ANNP
JMAN
THPA
adap

1.32
1.48
1.48
.64
1.78
1.89

Eje 2

1.15
1.59
-.30
-.59
-1.35
1.91

Eje 3

Etiqueta

Eje 1

-.21
-.44
-.04
-.00
.75
-.66

annp
japr
jman
thpa
sana

2.19
2.33
1.00
2.75
.74

Eje 2

-.43
2.07
-. 75
-2.22
-1.03

Eje 3

-.14
-.66
-. 58
1.08
-.88

111

^^r^F,l. ^^-;1^^^ C^F ^^^rA`^ Ef^J ^F^v^^^,fAS [^E E< 1r^i.^^^^^t^(.^^,

EI eje 3(vase la Figura 2) parece medir en cierto modo el nfasis relativa


teora-aplicaciones. En el extremo inferior podemos ver ANNS rodeada de cierto
nmero de etiquetas en minscula (revistas que se citan ANNS), mostrando la
importancia de esta ltima como fuente de resultados en investigacin bsica.
Es interesante observar la posicin de oths, con cierto nmero de revistas de
Estadstica aplicada en sus inmediaciones; se dira que la transicin de metodologa estadstica a revistas de ndole no estadstica se hace a travs de revistas
camo JRSA, CSDA, BICS, TECH, BiKA, etc. De modo comprensible, las etiquetas en minscula de dichas revistas tienden a agruparse en fa parte baja del
grfico. En algunos casos, la distancia entre las dos etiquetas correspondientes
a una revista es grande, mostrando la diferencia entre sus fuentes y destinos de
citas. No parece in^ ustificado asignar a tales revistas un papel de gran alcance
en la diseminacn de metodologa estadstica.
FIGURA 2
Proyeccin sobre XY {matriz de datos brutos)
X= Primer eje, Y= Tercer eje
a_
psykPSYk

THPA
thpa

^ ^1,A^I,
o stat
MST
o a^l^ ^3 l C S

s t m c^ J^^, S A

c cl^ 0^
rS o ^^'1^^

o ^t hs

^ A^?JR
^ JASA.

o jcla . JMAN

AN NP^,

o as^ r^ rI' F; (:v I^


BI^i.A^ ^ J R,5^3

annp
^ ADA

^^c^^s^
.
csts ^ ^' ^NSI^
,

stop

^ o ^
r5tt
o jsc^ '^asa

JAP^

a ^alll
>; ^^ ^rs(^
.
0

splt

j Ill d.I1

^ .1SPI
o, ^ji
^p

^
- .5

sca j

o sana

ANNS anns

_ __
- .25

.0

.25

.50
.k

. 75

1.00

1.25

4.

LA VISION DEL REESCALADO MULTIDIMENSIONAL

A efectos comparativos, hemos hecho un anlisis mediante la tcnca de


reescalado mutidimensional. Para las treinta y tres revistas consideradas hemos
el nmero de veces que cada una cita a las veinte
uttiZado vente variables
para las que tenemos datos como receptoras de citas.
Cada revista viene pues representada por un punto en R20. La distancia
escogida en tal espacio es una de las opciones que ofrece el paquete SPSS para
datos que son frecuencias absolutas: la distanca denominada CHISQ [ver SPSS
^ 1985), p. 162], que pese a su nombre es ligerarnente diferente a la distancia x2
habitual en el anlisis de correspondencias.

FIGURA 3
Representacin bidimensional utilizando ALSCAL y la distancia CHISQ

^ . t^ ---^
p;^yk
'^^ths o

jcla

1. U -^

ad a^^

o bics
stop
^rsa
^)lU ^

}^"

o bika

o thpa

as j ro s an,
-,
cjst
scajo

jrsb o

-1.0 -^

O StcL^ StrC1E' O

^ecc^ 8
csts
insr

. t) -i

a^^ro
0

o sana
0

j in aii

o csda

o jscs

tec h

o jspi

aIYl s t

anns

-2.0 -j

-2.0

-1.0

.0
.k`

r
1.U

1
2.0

^^I^^^A.^ ^^?^^J ^,.iF^

^, I h'1.i^,. I^Y

r ^^ . ^^'"7 I t^L. e^^

EI programa utilizado (ALSCAL, en el paquete SPSS) busca una representacin en un espacio de dimensin rnenor {en nuestro caso, el plano R2) de tal
modo que se preserve la ordenacin entre las distancias [vase Davison ^1983)
para una descripcin del mtodo]. La medida de stress de Kruskal S^ [vase su
expresin en Davison {1983), p. 87, frmula ( 5.13)] es 0.194, un ajuste aceptable.
Tenemos ahora slo una etiqueta por revis#a. La representacin bidimensional
es no obstante reminscente de la obtenida en la Figura 1. La divergencia ms
notable es la posicin de oths, lejos en la esquina superior izquierda. Esta
peculiaridad es debida al hecho de que la distancia empleada no est normalizada, realzando las distancias correspondientes a revistas con un elevado nmero de citas (y oths, que es una categora incluyendo todas las revistas no
consideradas individualmente, es la entidad citante ms numerosa, como puede
verse en la Tabla 5).

5.

EL TRATAMIENTO DE L.A DIAGONAL PRINCIPAL

Es un hecho bien conocido que tanto el anlisis de correspondencias como el


reescalado multidimensional, al ser aplicados a una matriz de datos con una
diagonal principal prominente, tienden a proporcionar una configuracin plana
con forma de herradura. Es el Ilamado efecto Guttman; un ejemplo difano puede
verse en Cuadras (1981), pp. 337-339. Hill-Gauch (1980) explican las razones
por las que dicho efecto puede presentarse, y una posible solucin.
En nuestro ejemplo, tal efecto no parece constituir un problema. EI tratamiento
que se hace de la diagonal principal, no tiene pues por objetivo contrarrestar el
efecto Guttman, sino facilitar la disociacin de las dos etiquetas correspondientes
a cada revista, de manera que se pongan ms claramente de manifiesto sus
relaciones con las dems. Una analoga ilustrar esto. En el anlisis factorial, se
supone el modelo:
---^ __i
---> --^
(X-->= Af+u
_i
en que A es una matriz desconocida, f es el vector (inobservable) de factores
comunes, y u el de factores especficos, todos los cuales se suponen incorrelados. Entonces,
^= E [( X- ) ( X- )^]=AA^+D

en que D= E[ '] es diagonal.

[1 ]

T ^E)^^; i ^( .

G `->f'AF^^^'. il A

La factorizacin ^= A^' proporcionara una matriz A del mismo rango que ^,.
Un anlisis en componentes principales requiere emplear una matriz ^1 con
nmero de columnas iguai al rango sustancial de ^--es decir, al numero de
valores propios que totalizan una fraccin <csustancial de la traza de ^. .
EI anlisis factorial propone factorizar una matriz de covarianzas (o correlaciones} reducida, ^* = E- D, o aigo que pueda considerarse aproximacin razonable
de eila -de ordinario, una matriz que se obtiene por refinamiento progresivo de
una tosca aproximacin inicial. La idea que subyace es prescindir de ia parte
para lograr
la aportada por los factores especficos u
especfica de las X
una descripcin ms parsimoniosa de la parte debida a los factores comunes.
^a analoga con nuestro problema sugiere atenuar la diagonal principal de la
tabla de contingencia K,^, en un intento de lograr una me ^or representacin en
dos dimensiones de las relaciones entre revistas, a costa de prescindir la endogamia especfica de cada una de elias. En lo que sigue examinamos la forma
de atenuar dicha diagonaf y sus consecuencias.

5.1.

Modificaciones ad-hoc^3 de la diagonal principal

Como sealan de Leeuw-van der Heijden t 1988),


Ei Anlisis de Correspondencias ordinario no es apropiado para tablas cuadradas en que ia diagonal principal no est definida o no es de inters; por
ejemplo, matrices de transicin, tablas de importacin y exportacin, matrices de
confusin, y tablas de migracin.
Este sera nuestro caso (aunque la tabla analizada no sea cuadrada debido a
la inclusin de revistas adicionales como slo emisoras de citas), si estamos
interesados de modo primordial en la relacin de cada revista con ias dems.
Por otra parte, de Leeuw-van der Heijden (1988) examinan trabajo de otros
autores, observando que,
.., reemplazan la diagonal principal con valores escogidos en virtud de algn
argumento terico, o completan la diagonal principa! mediante reconstitucin
iterativa ,
En nuestro caso, la primera opcin no parece indicada. La analoga con el
anlisis factorial esbozada ms arriba, sugerira atenuar dicha diagonal por
reconstitucin iterativa. La solucin que hemos adoptado sigue esta va, y puede
considerarse una instancia de anlisis de correspondencias generalizado, que
describimos a continuacin.

ANAI ^`;^;7 [^E- (.^T^^^ EN F^E^,^^`^T^,^, [)E

5.2.

E>'A[)i>r^^.

115

Anlisis de correspondencias generalizado

AI describir los datos se ha indicado que cabra pensar en un anlisis haciendo


uso de la tcnica de ajuste de modelos logartmico-lineales. EI inters de cantrastar cualquiera de las hiptesis habituales (independencia, cuasi-simetra,
homogeneidad de mrgenes, etc.) es muy limitado, sin embargo, al no ser de
aplicacin dichas hiptesis o incumplirse de rnodo evidente, corno ya se ha
indicado.
Podemos, en cambio, utilizar un madelo logartmico-lneal para dar cuenta de
una parte de la variabilidad de los datos, efectuando luego un anlisis de correspondencias de los residuos. De hecho, puede cornprobarse [ver Gifi (1990),
p. 266 y ss., o van der Heijden-de Leeuw (1985) por ejemplo ^ que el anlisis de
correspondencias ordinario practica una descomposicin en valores singulares
de las desviaciones respecto a la hiptesis de independencia. Si K,^ es la matriz
de datos, con totales marginales k;, y k.^, E^^ es una matriz con elemento genrico
e;j = k;.k,^/k.., y D,, D^ son matrices diagonales con elementos genricos respectivos
k;., k.j en la diagonal principal, la descomposicin en valores singulares,
D^ ^^'2( K^^-E^^ ) D^ ^'2=U nV"

[2l

permite representar los puntos fila y columna de K,^ por las fiias, respectivamente,
de:
R = Di_''z U ^,,2
[3)
C = D^ ''2 V n'^

[4J

Una descomposicin como (2} no tiene por qu limitarse a las desviaciones de


los datos respecto a sus valores ajustados bajo la hiptesis de independencia
(valores en Ei^). Cabe imaginar una descomposicin semejante, ya propuesta por
Escofier (1983), que descomponga la diferencia entre los datos y sus valores
ajustados mediante un modelo logartmico-lneal
o inciuso la diferencia entre
los ajustes proporcionados por dos diferentes modelos logartimo-lneales .
Estaramos, en el primer caso, dando cuenta de una cierta estructura en los datos
mediante el modelo ajustad0, y visualizando mediante el anlisis de correspondencias de los residuos cualquiera otra estructura que subsistiera tras el ajuste.
En particular, esta tcnica permite el anlisis de correspondencias de tablas
incompletas [de Leeuw-van der Heijden (1988a)]. Comentarios y ejernplos sobre
el empleo conjunto de modelos logartmico-lneales y anlisis de correspondencias generalizado pueden verse en van der Heijden-Worsley (1988), Daudin-Trecourt (1980) y Caussinus-Falguerolles (1987).

5.3.

Anlisis de los residuos del modelo de cuasi-independencia

Se ha ajustado un modelo de cuasi-independencia a!a tabla K,^ excluyendo la


diagonal principal. EI valor del estadstico X2 de Pearson resultante es 11254.29,
con 588 grados de libertad, lo que evidencia un ajuste deficiente de dicho modelo.
Los residuos han sido objeto de un anlisis de correspondencias generalizado.
Los vaiores singulares no son cornparabtes en valor a los obtenidos en las
tablas anteriares. Es interesante notar que entre los dos primeros recogen cas
un 61 por 100 de la traza de la matriz A en (2), lo que muestra que la representacin plana proporcionada por el anlisis generalizado de correspondencias es
aceptabie.
Dicha representacin puede verse en la Figura 4. Es de destacar que la primera
dimensin (asociada al mayor valor singular) ha sido representada ahora en
ordenadas, y la segunda en abscisas, con objeto de obtener una representacin
plana ms asimilable a las anteriores. La grfica obtenida no se separa mucho
de la presentada en la Figura ^i. La dimensin presentada en ordenadas tiene su
signo cambiada (el signo es arbitrario, al estar los vectores propios indeterminados en una constante de escala).
AI margen de esto, recurren las mismas pautas que observamos en la
Figura 1, con las revistas de gran contendo en Teora de la Probabilidad
ocupando el margen derecho (algunas de ellas han sido tradas al borde), y
ANNS ocupando su caracterstica posicin extrema. Ntese sin embargo la
notable disociacin que se produce en la Figura 4 entre las dos etiquetas anns
y ANNS, que en la Figura 1 estaban canstreidas a ocupar posiciones prximas debido a la abundancia de citas endgamas. Lo propio ocurre con otras
revistas, corno psyk-PSYK. A destacar tambin la posicin ntidamente extrema de PSYK y BICS, probablemente reflejando, como ya se ha indicado, su
carcter de receptoras habituales de citas en revistas mdicas, de notable
peso en oths.

TABLA 4
Valores singulares en .^ (E,^ = modelo cuasi-independencia)
Valores

singulares
1
2
3

Valor

850.83
156.85
114.91

% traza

% traza

acumulado

51,47
9,48
6,95

51,47
60,95
67,90

A^^^^f^I

`^^^^t^^^, f-iF 1:^fA^^; Fr^^ f'E `^^+`-,r

FIGURA ^4
Proyeccin sobre XY (residuos modelo cuasi-independencia)
X= Segundo Eje, Y= Primer eje

u.:3o

ANNS

0.1.5-i
0

cst,t

^ ^1.^ <).

^ 1^18 xl^

J^^^^i ^ j';^)1

^ ^i.I1I15

ojrsh
^ lt
o`^

cjst
o ins4' i,^^^cs
0

jeco
o c^ ts

t)ICS
O 7(1,11^)

o salia

^^

'1^I^.^^^^.JSPX+ I 5J^
V

JS(:'^

(^'^.I)^^
^ .^
; A^,JI^

o csda

0.0 -^
. ,^ o a.rn s t

JASt

})ioj

JT:^^4^

p^Yk

ol)ika
^ c ^i.

JM^^N

o stat

o strne

f^NNI;
JA^'1
o jcla
AI^^1I>

5'^^q'1^
rI' 1 I'^

AMS'^

JiZS^

-0.15 -^

_--0.15

_B_ I^hs ^PSYK


0.0
.k"

T_
U.15

.
,Tl.(;1-, ^ Ir

1 i ^

6.

. F `^F^l^t^' ^l_^,

CONCLUSION

Hay otros instrumentos estadsticos que podran concebiblemente utiiizarse en


el anlisis de la relacin entre revistas: el anlisis de agrupamientos (cluster
analysis) es un candidato obvio. Nuestro propsito se limita a mostrar, utilizando
un conjunto de datas que nos parece de inters en s mismo, que la tcnica de
anlisis de correspandencias ofrece un instrurnento idneo en aquellos casos en
que, como ocurre en el considerado, la relacin entre las entidades consideradas
es inherentemente no reflexiva.
Mediante el desdoblarniento de etiquetas, el anlisis de correspondencias es
una posibilidad para describir datos en que esto ocurre, y suminstra grficos
simples de entender e interpretar; grficos suministranda una informacin til que
sera perdida si insistiramos en representar cada entidad (cada revista en
nuestro caso) con una sola etiqueta.
EI Anlisis de Correspondencias, tanto ordinario corno generalizado, se muestra un instrumento #il en el estudio de dato como los presentados. Los resultados
deben verse como compiementarios de los ofrecidos por otras tcnicas, como el
escalado multidimensional. La descripcin es potencialmente ms rica, por la
duplicidad de etiquetas, pero la interpretacin puede ser tarnbin delicada. En
particular, en un ejernplo como el presentado, la proximidad entre dos revistas
es indicativa de la sirnilaridad de los respectivos perfiles fila (o colUmna), similaridad que puede presentarse incluso cuando la relacin directa entre ellas (citas
emitidas o recibidas por una respecto a la otra) sea muy tenue. Esto puede o no
ser deseable, dependiendo de la finalidad del anlisis.
Con las limitaciones sealadas, la tcnica del anlisis de correspondencias
generalizado es una tcnica de gran utilidad, susceptible de desvelar interesante
informacin, como el ejemplo presentado pone de manifiesto.

11y

^,r^F^^ i^,i^-^ C^^^ ^;:i ^a., E r^^ ^^E ^ti^^^^^ r^,^ t:^r ^: ^;r^,e ^^^. i

APENDICE A
TABLA 5
Nmero de citas de cada fila a cada column^ (K,^)
ADAP

adap
amst
annp
anns
asjr
bics
bika
csda
insr
jasa

japr
jman
jrsa
jrsb
jscs
jspi
psyk
stat
tech
th pa
csts
cstt
saria
sanb
stme

AMST

ANNP

14

62
96
19
5

17
18

154
27

11
10
18
333
8
13
79
36
134

BICS

BIKA

9
43

10
52
9
17
16
8
24

17
35
194
58
1Q
36
76

12
22
10
122
43
83
214
19
66
117

ASJR

54

42

11

25

44
39
22
60
12

14
6
46 .

6
26

10
12

cjst
jeco
splt
bioj
scaj
sto p
jcla
oths

ANNS

20
15
16
108
33
15

18
11

14
15
21
10
24
22

26

14
114

26
17
45
43
34
26
25
48
7
52
166

15
40

32
29

28

8
8
66
11

48
34
45
35

3.086

6
1.947

10
14
17
7

26
15
5
6
14
275

51
395

453

24
40
6
36
14
6
456

11
7

426

CSDA

INSR

8
5
6
13
1

20
12
5
3
3
7

15

JASA

69
9
162
20
46
65
21
76
329
10
13
39
32
40
31
21
37
60
250
14
38
22

23
3

11

80
44
51
19

117

22
3.335

1
5

c `_^Tt.'^, ^1; ^^ .

1 ti^l.)

JAPR

adap
amst
annp
anns
asjr
bics
bika

JMAN

JRSA

76
27
13

16
23
12

JRSB

9
12
6
4$
31
28
87

csda
insr
jasa
japr
jman
jrsa
jrsb
jscs
jspi
psyk
stat
tech
thpa
csts
cstt
sana
sanb
stme
cjst
jeco
sp^t
bioj
sca j
stop
jcla
oths

^F^

JSCS

-,`r.

JSPI

8
145
7

24
27

38
34
6

9
5

19
7
6

9
2
4
2
2

3
3
4
4

TECH

9
22
25
11
11
28

16
6

9
38
22

3
15

36
56
18
20

3
29
35
160
6

10

17
18
37
6
11
141
187

12

11
9
6
9

164

THPA

8
3
3

14

26
347

50
80
16
11
16
89
27
48
9
8
37

STAT

4
5

PSYK

481

19
67
10
9
17
6
28
13
21
10
7
6
1.192

3
12

2
15

44
109

17

10
4
2
4
2

9
9

49

28
1.303

8
7
21
6
12

59

2
80

931

384

REFERENCIAS
BENZECRI, J. P. (1976). L'Analyse des Donnes. I. La Taxinomie. L'Analyse des
Dones. II. L'Analyse des Correspondances. Dunod, Pars.
CaussiNUS, H. y FALGUEROLLES, A. ^E (1987) Tableaux Carrs. Modelisaton et
Methodes Factorieiles . Revue de Statistique ^4pptique, 33, 35-52.

CuAORAS, C. M. (1981). Mtodos de Anlisis Multivariante. Eunibar, Barcelona.

i ^^^`^^^^ E ^^. .^^ ^^^, i

DAUDIN, J. J. y TRECOURT, P. (1980). Analyse Factorielle des Correspondances et


Modele Log-Lineaire: Comparaison des Deux Methodes sur un Exemple.
Revue de Statistique Applique, 28, 5-24.
DAVISON, M. L. (1983). Multidimensional Scaling. Wi1ey, New. York.
EscoFIER, B. (1983). Analyse de la difference entre deux mesures sur le produit
de deux mesures dfinies sur le produit de deux mrnes ensembles. Cahiers
de I'Ana/yse des Donnes, 3, 325-329.
GARFIELD

, E. (1985). Sci journal citatian reports.

GIFI, R. (1990). Nonlinear Multivariate Analysis . Wiley, Chichester, 1990.


GREENACRE, M. (1984). Theory and Applications of Correspondence Analysis.
Academic Press, New York, 1984.
VAN DER HEIJDEN, P. G. M. y DE LEEUW, J. (1985}. Correspondence Analysis used
complementary to Loglinear Analysis. Psychometrika, 50, 429-447.

, P. G. M. y DE LEEUw, J. (1988). Correspondence Analysis of


Incomplete Contingency Tables. Psychometrika, 53, 223-233.

VAN DER HEIJDEN

vAN DER HEIJDEN, P. G. M. y WORSLEY, K. J. (1988). Camment on Correspondence


Analysis used Complementary to Loglinear Analysis. Psychometrika, 53, 287291
HILL, M. O. (1974). Correspondence Analysis: A Neglected Multivariate Method.
Applied Statistics, 23, 340-354.
HILL, M. O. y GAUCH JR., H. G. (1980). Detrended Correspondence Analysis: An
Improved Ordination Technique. Vegetatio, 42, 47-58.
LEBART, L., MORINEAU, A. y WARWICH, K. (1984). Multivariate Descriptive Statistical
Analysis: Correspondence Analysis and related Techniques for large Matrices.
Wiley, New York.

SEBER, G. A. F. (1984). Multivariate Observations. Wiley, New York.


SPSS I nc. { 1985). S PSS Statistical Algorithms . Author, 1985.

SUMMARY
ANALYSIS OF CITES IN STATISTICAL JOURNALS
We analyze a two-way contingency table whose ij cell contains the
number of times that journal i cites journal j. The analysis shows an
interesting structure. Correspondence analysis in an ideal tool, becau-

^^_l^^^^^^^^;1 I^^. ; F ^

}n

se it takes into account the non-reflexive character of the citing


versus being cited relationship (i.e., the fact that cells ij and ji are in
general quite different}.

Key words: Correspondence analysis; bibliometrics.


AMS Classification: 62-07, 62H 17.

Anda mungkin juga menyukai