RESUMEN
Se analiza una tabla de contingencia de doble entrada cuyas casiIlas ij representan el nmero de veces que la revista i cita a la revista
j. EI anlisis muestra una estructura interesante. EI anlisis de correspondencias es una herramienta ideal, porque tiene en cuenta el carcter no reflexivo de la relacin citando ser citado (esto es, el
hecho de que los valores ij y ji son en general bastante ^iiferentes).
Palabras clave: Anlisis de correspondencias, bibliomtrica.
1.
INTRODUCCION
^T^^[^^ ;.
2.
LOS DATOS
101
inmediato (independencia, cuasi-independencia, homogeneidad marginal de subtablas), o no son de aplicacin a nuestros datos, o seran triviales. En segundo
lugar, algunos factores complicaran algo el anlisis {como es la presencia de
ceros estructurales correspondientes a algunas revistas que slo se publicaron
parte del perodo). En tercer lugar, y sobre todo, la tabla tridimensional K,^T est
muy vaca , con abundancia de ceros no estructurales.
Por todos estos motivos, hemos agregado K^^T a lo largo de la dimensin temporal
para producir una tabla K^^. Estamos considerando pues totales de citas intercambiadas entre las diferentes revistas para un perodo de ms de una dcada.
La lista de revistas consideradas se muestra en la Tabla 1. La Tabla K,^ se
muestra en el Apndice A(Tabla 5).
Una rpida ojeada a la Tabla 5 muestra una pauta evidente: la diagonal del
bloque 20 x 20 superior es prominente, mostrando una fuerte tendencia de los
artculos en una revista a citar artculos en la misma revista. Esto es algo que
cabra esperar, per^ el alcance de la endogamia que los datos ponen de
manifiesto es notable: en prcticamente todos los casos, el mayor nmero de
citas de una revista tiene como receptor a la rnisma revista.
TABLA 1
Relacin de revistas analizadas
Etiqueta
Revista
Etqueta
Revista
adap*
amst*
annp*
anns*
asrj*
bics*
bika*
psyk*
stat*
tech*
thpa*
csts
cstt
sana
Psychometrika.
The Statistician.
Technometrics.
T. of Prob. and its App.
csda*
sanb
insr*
jasa*
japr*
jman*
jrsa*
jrsb*
stme
cjst
jeco
splt
bioj
scaj
jscs*
stop
jspi*
jcla
oths
Scandinavian J. of Stat.
Stochastic Processes.
J. of Classification.
Others.
* Las revistas con un asterisco entran en el anlisis como emisoras y receptoras de citas; las
dems, sla como emisoras de citas.
FIGURA 1
Proyeccin sobre XY ^matriz de datos brutos)
X^ Primer eje, Y ^ Segundo eje
A
J
adap
jca
o p^y l.
^ ('S1)^1
^ P S ^i' I
^ S'I`.^ I
o st^.t
^ ^3I('S
csdat, ^ o^ ^^'^^'
O
J R SA
o r^ths
o DIUj
^;^^.1 tt..15r1`
. . ^3
.I^
^^^. .T1^;C'If
^
o a^rnstJ rsl^^ .A
o t.^^cli
I N^ 1^
jsrs o csts
^S^
o
^ ^rYSr^,^tt
^ f'r^ s^r^h
o hi ka
ANNP
^
j^p^o o^r-JS^,^^
^.
0
splt
annp
^ ANNS
o anrls
_ _1
-.2
thpa
r
.(l
.k'
^.
.
.
^^^r^^I I`^^^^, I)E^ ^;I Tr^ ; E h^^ RE ^^^'^; ^.^:^^.^ ^^F E^^^^ i.^^^^^ ^^ ^
..
tipo de anlisis estrechamente relacionado es el que produce grficos denorninados biplots: vase por ejemplo Seber (1984). En ambos casos, el objetivo
consiste en proporcionar grficos bidimensionales de la nube multivariante de
puntos, en que tanto casos como variables (filas y columnas de la matriz de datos
anaiizada) se representan de manera simultnea.
EI Anlisis de Correspondencias est particularmente indicado en la descripcin de este conjunto de datos porque no requiere comenzar con una matriz de
proximidades cuadrada. Ello permite incluir revistas para las que no tenemos
datos como receptoras de citas, aunque s corno emisoras. Por otra parte, la
simetra tampoco es un requerimiento. Evidentemente, siempre podramos simetrizar cualquier matriz cuadrada. Pero condensar en un solo nmero !a distancia
entre dos revistas i y j violenta la naturaleza de los datos: citar y ser citado son
cosas bien diferentes, y hallar una sola medida de proximidad entre dos revistas
incorpora siempre una dosis de arbitrariedad. Ninguna nocin escalar de distancia o proximidad entre las revistas i y j puede incorporar toda la informacin
contenida en las casillas ij y ji de la Tabla K,^.
Por ello, en nuestro anlisis cada revista se representa dos veces en cada uno
de los grficos: las etiquetas en maysculas (y el smbolo en los grficos}
representan revistas como receptoras de citas. Las etiquetas en minsculas (y
el smbolo o en los grficos) representan revistas como emisoras de citas. La
gran distancia que en ocasiones separa a las dos etiquetas asociadas a una
misma revista es indicativa de la notable diferencia que existe entre la naturaleza
de las fuentes y la de los destinos de la investigacin en ella publicada. EI forzar
la simetra en la matriz de distancias original (y colapsar ambas etiquetas en una
sola) oscurecera por completo este hecho.
3.
1 1O
TABLA 2
Inercia explicada por los primeros tres autovalores
(considerando autocitas
Autovalor
Valor
% inercia
% tra2a
acumulado
.3026
.1765
28,77
16, 78
28,77
45, 56
.1468
13,96
59,52
Las Figuras 1 y 2 son rnapas mostrando los planos generados por los primeros
tres ejes tomados por pares. La Figura 1 es particularmente interesante: el eje 1
parece ser una direccin en que las revistas especializadas en Probabilidad se
separan del resto. Vemos annp y ANNP as como el par thpa-THPA lejos del
principal agrupamiento de revistas estadsticas, en una posicin extrema, y con
abundancia de autocitas lo que resulta evidenciado por la proximidad relativa
de las dos etiquetas correspondientes a cada revista.
Tal como muestran sus coordenadas a lo largo del primer eje, tanto jman como
JIUTAN estn en una posicin interrnedia, lo mismo que sucede con los pares
japr-JAPR y adap-ADAP (en la figura, todos estos puntos quedaran fuera del
grfico con la escala empleada; han sido trados al borde derecho. Sus coordenadas aparecen en la Tabla 3).
Esto es algo bien de acuerdo con lo que cabra esperar, dado el uso intensivo de
Teora de la Probabilidad que tpicamente exhiben los artculos en dichas revistas.
La interpretacin del segundo eje no es ni mucho menas tan clara, aunque
parece tentador adscribir un sesgo algo ms terico a las revistas apareciendo
en la parte baja del grfico.
TA B LA 3
Eje 1
ADAP
JAPR
ANNP
JMAN
THPA
adap
1.32
1.48
1.48
.64
1.78
1.89
Eje 2
1.15
1.59
-.30
-.59
-1.35
1.91
Eje 3
Etiqueta
Eje 1
-.21
-.44
-.04
-.00
.75
-.66
annp
japr
jman
thpa
sana
2.19
2.33
1.00
2.75
.74
Eje 2
-.43
2.07
-. 75
-2.22
-1.03
Eje 3
-.14
-.66
-. 58
1.08
-.88
111
THPA
thpa
^ ^1,A^I,
o stat
MST
o a^l^ ^3 l C S
s t m c^ J^^, S A
c cl^ 0^
rS o ^^'1^^
o ^t hs
^ A^?JR
^ JASA.
o jcla . JMAN
AN NP^,
annp
^ ADA
^^c^^s^
.
csts ^ ^' ^NSI^
,
stop
^ o ^
r5tt
o jsc^ '^asa
JAP^
a ^alll
>; ^^ ^rs(^
.
0
splt
j Ill d.I1
^ .1SPI
o, ^ji
^p
^
- .5
sca j
o sana
ANNS anns
_ __
- .25
.0
.25
.50
.k
. 75
1.00
1.25
4.
FIGURA 3
Representacin bidimensional utilizando ALSCAL y la distancia CHISQ
^ . t^ ---^
p;^yk
'^^ths o
jcla
1. U -^
ad a^^
o bics
stop
^rsa
^)lU ^
}^"
o bika
o thpa
as j ro s an,
-,
cjst
scajo
jrsb o
-1.0 -^
O StcL^ StrC1E' O
^ecc^ 8
csts
insr
. t) -i
a^^ro
0
o sana
0
j in aii
o csda
o jscs
tec h
o jspi
aIYl s t
anns
-2.0 -j
-2.0
-1.0
.0
.k`
r
1.U
1
2.0
^, I h'1.i^,. I^Y
EI programa utilizado (ALSCAL, en el paquete SPSS) busca una representacin en un espacio de dimensin rnenor {en nuestro caso, el plano R2) de tal
modo que se preserve la ordenacin entre las distancias [vase Davison ^1983)
para una descripcin del mtodo]. La medida de stress de Kruskal S^ [vase su
expresin en Davison {1983), p. 87, frmula ( 5.13)] es 0.194, un ajuste aceptable.
Tenemos ahora slo una etiqueta por revis#a. La representacin bidimensional
es no obstante reminscente de la obtenida en la Figura 1. La divergencia ms
notable es la posicin de oths, lejos en la esquina superior izquierda. Esta
peculiaridad es debida al hecho de que la distancia empleada no est normalizada, realzando las distancias correspondientes a revistas con un elevado nmero de citas (y oths, que es una categora incluyendo todas las revistas no
consideradas individualmente, es la entidad citante ms numerosa, como puede
verse en la Tabla 5).
5.
[1 ]
T ^E)^^; i ^( .
G `->f'AF^^^'. il A
La factorizacin ^= A^' proporcionara una matriz A del mismo rango que ^,.
Un anlisis en componentes principales requiere emplear una matriz ^1 con
nmero de columnas iguai al rango sustancial de ^--es decir, al numero de
valores propios que totalizan una fraccin <csustancial de la traza de ^. .
EI anlisis factorial propone factorizar una matriz de covarianzas (o correlaciones} reducida, ^* = E- D, o aigo que pueda considerarse aproximacin razonable
de eila -de ordinario, una matriz que se obtiene por refinamiento progresivo de
una tosca aproximacin inicial. La idea que subyace es prescindir de ia parte
para lograr
la aportada por los factores especficos u
especfica de las X
una descripcin ms parsimoniosa de la parte debida a los factores comunes.
^a analoga con nuestro problema sugiere atenuar la diagonal principal de la
tabla de contingencia K,^, en un intento de lograr una me ^or representacin en
dos dimensiones de las relaciones entre revistas, a costa de prescindir la endogamia especfica de cada una de elias. En lo que sigue examinamos la forma
de atenuar dicha diagonaf y sus consecuencias.
5.1.
5.2.
E>'A[)i>r^^.
115
[2l
permite representar los puntos fila y columna de K,^ por las fiias, respectivamente,
de:
R = Di_''z U ^,,2
[3)
C = D^ ''2 V n'^
[4J
5.3.
TABLA 4
Valores singulares en .^ (E,^ = modelo cuasi-independencia)
Valores
singulares
1
2
3
Valor
850.83
156.85
114.91
% traza
% traza
acumulado
51,47
9,48
6,95
51,47
60,95
67,90
A^^^^f^I
FIGURA ^4
Proyeccin sobre XY (residuos modelo cuasi-independencia)
X= Segundo Eje, Y= Primer eje
u.:3o
ANNS
0.1.5-i
0
cst,t
^ ^1.^ <).
^ 1^18 xl^
J^^^^i ^ j';^)1
^ ^i.I1I15
ojrsh
^ lt
o`^
cjst
o ins4' i,^^^cs
0
jeco
o c^ ts
t)ICS
O 7(1,11^)
o salia
^^
'1^I^.^^^^.JSPX+ I 5J^
V
JS(:'^
(^'^.I)^^
^ .^
; A^,JI^
o csda
0.0 -^
. ,^ o a.rn s t
JASt
})ioj
JT:^^4^
p^Yk
ol)ika
^ c ^i.
JM^^N
o stat
o strne
f^NNI;
JA^'1
o jcla
AI^^1I>
5'^^q'1^
rI' 1 I'^
AMS'^
JiZS^
-0.15 -^
_--0.15
T_
U.15
.
,Tl.(;1-, ^ Ir
1 i ^
6.
. F `^F^l^t^' ^l_^,
CONCLUSION
11y
^,r^F^^ i^,i^-^ C^^^ ^;:i ^a., E r^^ ^^E ^ti^^^^^ r^,^ t:^r ^: ^;r^,e ^^^. i
APENDICE A
TABLA 5
Nmero de citas de cada fila a cada column^ (K,^)
ADAP
adap
amst
annp
anns
asjr
bics
bika
csda
insr
jasa
japr
jman
jrsa
jrsb
jscs
jspi
psyk
stat
tech
th pa
csts
cstt
saria
sanb
stme
AMST
ANNP
14
62
96
19
5
17
18
154
27
11
10
18
333
8
13
79
36
134
BICS
BIKA
9
43
10
52
9
17
16
8
24
17
35
194
58
1Q
36
76
12
22
10
122
43
83
214
19
66
117
ASJR
54
42
11
25
44
39
22
60
12
14
6
46 .
6
26
10
12
cjst
jeco
splt
bioj
scaj
sto p
jcla
oths
ANNS
20
15
16
108
33
15
18
11
14
15
21
10
24
22
26
14
114
26
17
45
43
34
26
25
48
7
52
166
15
40
32
29
28
8
8
66
11
48
34
45
35
3.086
6
1.947
10
14
17
7
26
15
5
6
14
275
51
395
453
24
40
6
36
14
6
456
11
7
426
CSDA
INSR
8
5
6
13
1
20
12
5
3
3
7
15
JASA
69
9
162
20
46
65
21
76
329
10
13
39
32
40
31
21
37
60
250
14
38
22
23
3
11
80
44
51
19
117
22
3.335
1
5
c `_^Tt.'^, ^1; ^^ .
1 ti^l.)
JAPR
adap
amst
annp
anns
asjr
bics
bika
JMAN
JRSA
76
27
13
16
23
12
JRSB
9
12
6
4$
31
28
87
csda
insr
jasa
japr
jman
jrsa
jrsb
jscs
jspi
psyk
stat
tech
thpa
csts
cstt
sana
sanb
stme
cjst
jeco
sp^t
bioj
sca j
stop
jcla
oths
^F^
JSCS
-,`r.
JSPI
8
145
7
24
27
38
34
6
9
5
19
7
6
9
2
4
2
2
3
3
4
4
TECH
9
22
25
11
11
28
16
6
9
38
22
3
15
36
56
18
20
3
29
35
160
6
10
17
18
37
6
11
141
187
12
11
9
6
9
164
THPA
8
3
3
14
26
347
50
80
16
11
16
89
27
48
9
8
37
STAT
4
5
PSYK
481
19
67
10
9
17
6
28
13
21
10
7
6
1.192
3
12
2
15
44
109
17
10
4
2
4
2
9
9
49
28
1.303
8
7
21
6
12
59
2
80
931
384
REFERENCIAS
BENZECRI, J. P. (1976). L'Analyse des Donnes. I. La Taxinomie. L'Analyse des
Dones. II. L'Analyse des Correspondances. Dunod, Pars.
CaussiNUS, H. y FALGUEROLLES, A. ^E (1987) Tableaux Carrs. Modelisaton et
Methodes Factorieiles . Revue de Statistique ^4pptique, 33, 35-52.
SUMMARY
ANALYSIS OF CITES IN STATISTICAL JOURNALS
We analyze a two-way contingency table whose ij cell contains the
number of times that journal i cites journal j. The analysis shows an
interesting structure. Correspondence analysis in an ideal tool, becau-
^^_l^^^^^^^^;1 I^^. ; F ^
}n