Anda di halaman 1dari 107

Fernando Fraenza

Filosofía
natural
de la
imagen

Editorial Brujas
Córdoba
1
Primera edición, 2016

©Editorial Brujas
Pasaje España 1486, Nueva Córdoba,
5000, Córdoba, Argentina
publicaciones@editorialbrujas.com.ar

Título:
Filosofía natural de la imagen
Autor:
Fernando Fraenza

104 p., 23 x 15 cm. | isbn XX-XXXXX

1. Imagen. 2. Semiótica 3. Percepción

CDD 152

Ninguna parte de esta publicación, incluido el diseño de tapa,


puede ser reproducida, almacenada o transmitida por ningún
medio, ya sea electrónico, químico, mecánico, óptico, de
grabación o por fotocopia sin autorización previa.

Diseño de la cubierta e interior: Atelier Fernando Fraenza

Queda hecho el depósito que marca la ley 11.723

2
Índice

Prólogo [5]

0. Introducción [7]
0.1. Para un estudio naturalizado de la imagen [7]
0.2. El plan de este libro [11]

1. Necesidad biológica vs accidente histórico [13]


1.1. Platón y Orwell [13]
1.2. Idealizaciones necesarias [19]

2. Facultad de ver [21]


2.1. Cálculo visual [21]
2.2. Representando lo que vemos, antes que el lenguaje [26]
2.3. Visión y lenguaje. Identificación visual y categorización [31]

3. Dibujos [53]
3.1. Lo que aparece y lo que es, en el dibujo [53]
3.2. Realidad plana de la imagen [57]
3.3. Sistemas de dibujo [59]
3.4. Sistemas de denotación [66]

4. A pesar de todo, son continuidades [75]


4.1. Platonismo contra panofkismo [75]
4.2. Representaciones no-verbales fuera del cuerpo [78]
4.3. Invenciones [88]

Referencias & bibliografía [95]

3
4
Prólogo

E
ste libro se originó en un trabajo realizado para
el 10mo Congreso de la Asociación Internacional de
Semiótica Visual (aisv) realizado en Buenos Aires, a
mediados de 2012. Dicho trabajo se titulaba “La tensión entre
ver algo y decir qué es. Otra vez el dilema analógico-digital”1
y defendía –en aquel entonces y en aquel contexto- un punto
de vista francamente minoritario y nada estimado acerca
del funcionamiento semiótico de las imágenes. No obstante,
nuestros puntos de vista no estaban demasiado alejados de
los que sostenía –de manera un tanto solitaria- Jean-Marie
Klinkenberg, por entonces presidente de la aisv, quién continúa
el proyecto del Groupe mu, especialmente en aquello que se
refiere a no desdeñar el conocimiento del canal sensorial,
inclusive a nivel fisiológico y computacional, hasta tanto la
semiótica misma no haya alcanzado un desarrollo tal que
incorpore entre sus propias categorías y puntos de vista las
sujeciones y restricciones originadas mismamente entre los
órganos de los sentidos y la mente.

Mi propósito al escribir este libro ha sido poner a disposición


de los investigadores, profesionales y estudiantes provenientes
de muy distintas disciplinas un material básico que les permita
comprender rigurosamente pero sin problemas una perspectiva
naturalizada del funcionamento de las imágenes visuales
(sobre todo, estáticas). Para cumplir con este cometido, tuve
que introducir las nociones básicas de una semiótica de las
imágenes de forma tal que fueran accesibles a numerosos no
1 Por Fernando Fraenza & Alejandra Perié.

5
especialistas o especialistas en otras áreas del conocimiento,
también interesados por las imágenes. Tuve que hacer
el esfuerzo de exponer ciertos conocimientos de ciencia
natural y de reformular proverbiales debates filosóficos de
modo tal que fueran atendibles -siquiera- por quienes están
aparentemente interesados tan sólo por aquello que denominan
machaconamente “lo social”.

Estoy de acuerdo con que no debemos ignorar la dotación


biológica al momento de pensar nuestra percepción, inclusive,
al momento de pensar la influencia de ésta en la selección
-sin lugar a dudas- histórica y cultural de las maneras de
representar el mundo visible a través de las imágenes. Este libro
aborda el estudio de la imagen visual desde una perspectiva
interdisciplinaria que opera en la zona de intersección de la
semiótica, la filosofía, la psicología, la fisiología, la inteligencia
artificial y las neurociencias en general. Procuramos reconstruir
una descripción convincente pero no demasiado sistemática
–y en estilo más bien informal- de los enfoques naturalizados
de la imagen en cuanto signo, que incluye tanto la referencia
al soporte biológico, al cómputo funcional, como a las
representaciones mentales. No se trata de un texto enciclopédico
sino de un compendio de secciones y argumentos breves y
concisos, en los que se resaltan las cuestiones generales de una
filosofía natural de las imágenes en desmedro de las particulares.
El libro está escrito con gran entusiasmo y deferencia por los
aportes que han hecho las teorías de la representación mental y
los procesos computacionales al conocimiento de la mente, de la
inteligencia y del origen de la semiosis.

Estoy muy agradecido con quienes han hecho posible este


trabajo, acompañándome en los intereses convocados en este
libro; especialmente con mis dilectos estudiantes de Semiótica
del Diseño de 2016, de la Universidad Blas Pascal (Córdoba,
Argentina) y con los equipos de las Cátedras de Visión y de
Problemática general del arte del Departamento de Artes Visuales
de la Universidad Nacional de Córdoba, Argentina.

6
0
Introducción

0.1. Para un estudio naturalizado de la imagen

E
n este libro, y mediante el modelo o infograma que
presentamos y desarrollamos a lo largo del mismo,
pretendemos formular argumentos convincentes en
contra del convencionalismo hegemónico que domina, desde
hace algún tiempo, toda teoría acerca de las imágenes o de su
funcionamiento, inclusive denotacional primario. Queremos,
por lo menos, destacar aquellos puntos en los que el culturalismo
o sociosemiotismo dominante, que sostiene alegremente
que todos los significados y lecturas están construidos de
manera casi arbitraria, se encuentra cada vez más reñido con
la tentativa científica de definir la mente como un sistema
informático natural, destinado -desde el nacimiento- a
entender primariamente las imágenes de cierto modo y no
de otro cualquiera. Reconsideraremos aquí el problema del
funcionamiento de las imágenes en una región aún muy
poco explorada de los estudios semióticos, la zona próxima al
denominado umbral inferior de la disciplina (cfr. Eco, 1968,
Int.2.ii. [pp.26 y ss.] ó 1975, 0.7. [pp.40 y ss.]; Groupe mu,
1992: i., ii. y iii.). Nos referiremos a motivos que no provienen
del cuerpo central del conocimiento semiótico ni de su
margen superior (sociosemiótico), sino que son introducidos
desde abajo, fundamentalmente a partir de otras disciplinas
que constituyen una suerte de contexto naturalizado de los
estudios semióticos. Reconsideraremos en este volumen la
hipótesis respecto de cómo la experiencia semiósica nos dice
que tenemos la impresión de concebir imágenes mentales (i)
7
y que, además, interpretamos pública e intersubjetivamente
numerosos fenómenos a través de representaciones visuales
(ii). Por lo cual, postulamos aquí la existencia y el desempeño
de este componente «icónico» o representacional espacial
(y toposensible) del conocimiento con el mismo título
que la existencia de tipos cognitivos visuales (o modelos de
reconocimiento visual, modelos de visión avanzada o modelos
3-D, TTCC ó TTVV; según los diversos autores), para dar razón
de lo que el sentido común nos propone. Dicho de manera llana
y simplificada: creemos que existen entre la actividad mental y la
semiosis, representaciones perceptivas avanzadas que consisten
en modelos bi y tridimensionales de cómo son o cómo se
percibirían en diversas circunstancias las cosas particulares, las
cosas de una categoría o las cosas que nos imaginamos podrían
existir así como las cosas que proyectamos. Tales modelos
constituyen sistemas de instrucciones diversos de las categorías
–propiamente dichas- o los contenidos verbales. Nuestra
hipótesis principal es –inspirados en aquel Umberto Eco de
Kant y el ornitorrinco (1997)- que podemos conocer los TTCC
–simplemente- porque tenemos un control intersubjetivo de lo
que constituye su output y disponemos de los instrumentos para
hablar de este output.

Hablamos, como cometido de este libro, de aportar


conocimiento sobre el problema de la interpretación de las
imágenes en esta región disciplinar o interdisciplinar que –como
decimos- tenazmente se mantiene aún muy poco explorada,
en el ya mencionado linde inferior de la disciplina semiótica.
A esto, hemos de añadir que es bien sabido que existe una
dificultad histórica en la elaboración y el progreso de una
teoría unificada de la imagen; y que, sin embargo, existen
suficientes elementos para intentar producir y aplicar un modelo
teórico del funcionamiento de este tipo de signos (textos o
discursos); elementos que no habrían de tomarse –necesaria ni
principalmente- del cuerpo central del conocimiento semiótico,
sino que han de ser reunidos desde los márgenes disciplinares,
fundamentalmente de disciplinas que, (i) como la sociología, la

8
teoría de la acción, la teoría de las ideologías, la sociolingüística o
las teorías de análisis del discurso, constituyen el borde superior
(cultural); o que, (ii) como la psicología (fundamentalmente la
investigación en sensación y percepción), la neurociencia o las
ciencias cognitivas delimitan el borde inferior (natural) de los
estudios semióticos. En sentido lato, ha habido ya numerosas y
variadas teorías sobre la interpretación de la imagen pictórica
(o de la imagen visual en la comunicación masiva); pero,
habremos de insistir en que tal investigación ha sido dirigida
casi exclusivamente hacia cuestiones de interés sociosemiótico,
quedando un tanto relegada toda investigación en torno a una
gramática básica cercana a los dispositivos perceptivos.

En efecto, próximos a dicho límite inferior se suscitan aquellas


cuestiones que -aún cuando se trate de asuntos estrechamente
vinculados a la ciencia natural- se formulan en torno a ciertos
procesos en los que no es posible reconocer una clara relación
diádica, donde se hace más difícil -o al menos, menos relevante-
reconstruir una mera secuencia causal que reconstruir un
proceso triádico tal como el que se describe en la semiótica
de Charles S. Peirce, y en el que se dan –por lo tanto- las
condiciones minimales de la interpretación (cfr. Eco, 1968:
Int.2.II., [p.26]; y también, 1990: 4.1., [pp.239-253]).

En vista de que la semiótica obtiene muchos de sus instrumentos de


disciplinas clasificables más allá (por debajo) de dicho umbral inferior,
resulta que no se puede excluir este último del discurso semiótico
sin que se produzcan a consecuencia de ello, vacíos embarazosos en
toda la teoría. Mas que nada, lo que habrá que hacer es descubrir tales
fenómenos y determinar el punto crítico en que fenómenos semióticos
revisten la forma de algo que todavía no era semiótico, con lo que
revelan una especie de ‘eslabón perdido’ entre el universo de las señales
y el de los signos. (Eco, 1975: 0.7.3., [p.56])

Un punto de vista semiótico, suele decirse (Eco, op.cits.; Groupe


mu, op.cit.; Greimás et alt., 1979: [p.49], s.v. Canal y p.412, s.v.
Tipología; Verón, 1973), ha de dar por supuesto todo aquello
relativo al canal sensorial por el cual transita la información
recibida, ocupándose, fundamentalmente de la forma-red

9
(Hjelmslev, 1943) en la cual la segmentación convencional
da lugar a códigos que regulan la significación de dicha
información. Dicho de otra manera, no habría lugar en la ciencia
semiótica para la descripción de los canales o de las condiciones
que éstos imponen a los signos. A pesar de lo dicho –un punto
de mira francamente mayoritario-, hemos optado para este libro
por un fundamento opuesto, según el cual sostenemos como
necesaria la investigación destinada a cubrir los vacíos existentes
entre la percepción de una imagen visual, digamos una pintura,
una fotografía, una radiografía, etc., y la significación cultural de
la misma (su sentido). Suponemos que aquellas investigaciones
en torno a los signos no-verbales (y específicamente a los
visuales) que excluyen el canal como problema, dan cuenta de
una genealogía disciplinar fundada en los estudios del lenguaje
verbal (lingüística y sociolingüística), los que, debido a su
muy temprano desarrollo, han visto integrarse a su cuerpo de
conocimiento numerosas referencias fisiológicas y psicológicas
de diversa índole, las que hoy no pueden ser sino consideradas
como ya supuestas y aproblemáticas. Así, por ejemplo, el
carácter lineal del significante lingüístico, acaso el postulado
más elemental de la ciencia del lenguaje (Saussure, 1916) forma
parte de esta ciencia con independencia de toda exposición
respecto de las bases biológicas o psicológicas de la percepción
temporal. Afortunadamente, la mencionada exclusión ha de
entenderse, más que como una suerte de patrullaje disciplinar,
como una mera falta de interés por los puntos de contacto entre
el significado de las imágenes, por una parte, y el reconocimiento
primario que perceptivamente hacemos de ellas, por la otra. Es
más, existen ya en la propia teoría semiótica, algunos puntos
de intercambio con enfoques más naturalizados respecto de
los temas que nos interesan. Un ejemplo de esto lo tenemos
en algunas líneas de desarrollo del pensamiento semiótico de
Umberto Eco (1968, B.; 1975, 3.; 1984 1. y 2.; 1985a, 1985b,
1990, 1992 y, sobre todo, 1997), las que seguiremos en sus
consecuencias relativas a una teoría de la percepción y de la
significación perceptiva, explicables en términos de la teoría de
la visión por cálculo de representaciones (Marr, 1981; Marr &

10
Poggio, 1977; Marr & Nishihara, 1978; Marr & Vaina 1982;) y
de la hipótesis acerca de las imágenes mentales (Paivio, 1971;
Kosslyn, 1980). En esta línea de trabajo, observaremos que
-tal como lo sostiene el Groupe mu, en su Tratado del signo
visual (op.cit.)- una descripción semiótica debe evitar el estudio
fisiológico del canal puesto en consideración, pero esto debe
suceder “…desde el momento en que ella haya integrado ya, en
su análisis de las formas, los caracteres que sean consecuencia de
las sujeciones del canal.” (II., [p.52]) Condición que, demás está
decirlo, no ha sido conseguida aún en el campo de los estudios
de la imagen o de los sistemas de representación efectivamente
puestos a funcionar en la pintura moderna occidental.

0.1. El plan de este libro

En nuestro primer capítulo intentamos especular acerca de


un marco teórico que sopese –en lo que tiene que ver con
el funcionamiento más básico de las imágenes visuales- la
necesidad biológica frente al accidente histórico, sin decantarse
total y apresuradamente por éste último, como lo hacen las
teorías de la imagen hoy hegemónicas. Lo hacemos imaginando
un proyecto equivalente a la gramática universal (GU) que
orienta como horizonte el trabajo de Noam Chomsky respecto
del problema de Platón, el que –a su vez- obtuvo buena parte
de su inspiración de los estudios sobre el procesamiento
visual y la modularidad de la mente, de David Marr y de
Jerry Fodor, respectivamente. El segundo capítulo es el lugar
donde recordamos y nos ponemos de acuerdo sobre algunos
puntos ineludibles de las teorías actuales sobre la visión de los
mamíferos superiores, necesarios para iniciar toda comprensión
del funcionamiento primario de las imágenes. Allí conjeturamos
respecto de las representaciones centrales de la mente y
nos preguntamos por la posibilidad de que éstas no queden
reducidas o limitadas a formatos puramente algebraicos o

11
lingüísticos. La pregunta es: ¿Existe algún tipo de representación
pre-conceptual –del orden de lo que Charles Peirce denominó
iconismo primario- en el cual se inicie el proceso mismamente
semiótico (triádico y justificado en su abstracción), dejando
atrás la pura materialidad de las relaciones estímulo respuesta?
El tercer capítulo sirve para aclararnos sobre el funcionamiento
denotacional o primario tanto de las imágenes “artesanales”,
entre las que encontramos las diversas clases de dibujo, como
de las imágenes “mecánicas”, grupo al cual pertenecen las
fotografías, tomografías, radiografías, etc. A partir de toda esta
referencia, en el último capítulo, el cuarto, formulamos nuestra
tesis respecto la crucial dependencia que las imágenes, aún
siendo -legítimamente- signos o textos, mantienen respecto del
continuum real, en el proceso que Umberto Eco denomina de la
referencia o de la institucionalización de códigos a partir de una
conexión con el real (1975, 3.).

12
1
Necesidad biológica vs
accidente histórico

1.1. Platón & Orwell

E
n el intento por precisar la fuente motivadora de todo
interés en los estudios del lenguaje, Noam Chomsky
recurre -regularmente (por ejemplo 1975: I.; o también,
1985)- a la tradicional afirmación según la cual el lenguaje
es el espejo de la mente. Con ello, sostiene la posibilidad
de que los estudios del lenguaje, determinando aquellos
principios abstractos que rigen su estructura y uso, impulsen
el descubrimiento de aquellos “...principios que son universales
por necesidad biológica y no por mero accidente histórico, y que
se derivan de las características mentales de la especie.” (1985,
[p.12]). De modo equivalente, a lo largo de nuestro trabajo
venimos a sostener que el interés por el estudio de los diversos
sistemas que regulan la producción semiótica de las imágenes
visuales (y específicamente pictóricas) implica una potencia
homóloga en cuanto a la indagación y la explicación de los
fenómenos que se presentan en áreas próximas al umbral inferior
de la semiótica. Una lengua humana -como el español- o un
sistema de representación visual -como la perspectiva cónica-
son sistemas notablemente complejos; al grado en que el hecho
de llegar a re-conocer sus estructuras implicaría un triunfo
intelectual fuera de lo común para toda criatura u organismo
que esté específicamente facultado2 desde un punto de vista
biológico o psicofísico para realizar la proeza de conocer tal
2 La palabra que usa Chomsky es “destinado” (ibíd. [p.12]).

13
sistema. Normalmente un niño adquiere el conocimiento de
una lengua -y, por tanto la capacidad para hacer uso de su
estructura de reglas y principios para articular signos- después
de haber oído e interactuado con otros durante un período
de tiempo verdaderamente corto, y además lo hace sin haber
estado sometido a un adiestramiento específico (1975, [p.12]).
Según Chomsky, estas últimas consideraciones no pueden
menos que contribuir a esclarecer uno de los más importantes e
interesantes sentidos de la expresión “ser el espejo de la mente”.
A saber: para la mente conciente (sic.) que intenta reconstruir
lo que un niño logra intuitivamente (sic.); es decir, para aquella
mente que no está especialmente diseñada para tal propósito, tal
reconstrucción debe plantearse como un objetivo remoto y muy
difícil de alcanzar.

Al estudiar las propiedades de las lenguas naturales, su estructura,


organización y uso, podemos tener la esperanza de alcanzar
cierta comprensión respecto de las características específicas de la
inteligencia humana. Podemos aprender algo, acerca de la naturaleza
humana (...) Además, no es poco razonable suponer que el estudio de
este logro especial del hombre, la capacidad para hablar y comprender
el lenguaje humano, puede servir de modelo para explorar otra áreas
de la competencia y la acción propias del hombre... (Chomsky, 1975,
[p.12])

Es ampliamente sabido que Noam Chomsky propone que buena


parte de los problemas científicos relativos al conocimiento
humano aceptan ser clasificados detrás de la doble necesidad de
explicar (i) cómo conocemos tanto si, evidentemente, partimos
de una experiencia pobre y limitada, y –a la vez- (ii) cómo
conocemos tan poco si consideramos que la evidencia de la
realidad es inmensamente amplia (1975 y 1985). Denomina
estos problemas –respectivamente- como de Platón y de Orwell;
y encausa ambas discusiones hacia los dos dominios científicos
en los que luego desarrolla sus investigaciones. Si consideramos
–en primer lugar- aquella dimensión del conocimiento en
que se hace evidente una disparidad entre comprensión rica
y experiencia mundana pobre, la prescripción será: indagar a
partir del supuesto hipotético de una dotación biológica por

14
descubrir. Por el contrario, la razón por la cual acerca de ciertos
asuntos conocemos y comprendemos tan poco se explica por la
mediación de un bloqueo institucional de la captación de datos
obvios, o poco menos, del mundo. Así pues, todo consiste –vistas
las cosas de este modo- en determinar el equipo provisto por
la evolución natural (abordando el problema de Platón), por
una parte; y en comprender los mecanismos ingenieriles de la
sociedad del consentimiento, por otra.

En ciertos planos y en determinadas actividades de nuestro


entendimiento, nuestro conocimiento tiene un alcance
desproporcionadamente amplio:

Aunque nuestros sistemas cognitivos seguramente reflejan en cierta


medida nuestra experiencia, una atenta especificación, por una parte,
de las propiedades de esos sistemas y, por otra, de la experiencia que de
alguna forma ha conducido a su formación muestra que está separado
por un hiato considerable, en realidad un abismo. (Chomsky, 1985,
[p.9])

¿Cómo es que esto sucede? Siguiendo a Aristóteles deberíamos


sostener que el mundo está estructurado de tal modo que
la mente humana –en virtud de supuestos metafísicos- es
capaz de captar esa estructura que asciende de lo particular
a los universales. Pero si atendemos a Chomsky (y a Platón),
deberemos trasladar “…el peso principal de la explicación del
mundo a la estructura de la mente” (op.cit., 1., [p.13]). Lo que
llegamos a conocer (o creer) depende de experiencias cuya
especificidad es precisamente evocar algún segmento del sistema
cognitivo innato, latente en la mente (ibíd.).3 Precisamente el
problema de Platón obliga a dar cuenta de la organización y
naturaleza del sistema cognitivo desarrollado en el sujeto, que
resulta de un limitado contacto con el objeto.

Los sistemas cognitivos son el resultado de la interacción de la


experiencia y del método que emplea el organismo para construir
y tratar con ella, que incluye mecanismos analíticos y condiciones

3 Dicho de otro modo: sabemos tanto debido a que ya lo sabíamos. Así, nuestra
comprensión de ciertos aspectos del mundo es específica y grandemente articulada, aún
cuando la experiencia disponible es breve, particular e inestable.

15
intrínsecas de maduración y desarrollo cognitivo. Así pues, el
problema consiste en determinar la dotación genética que permite
salvar el hiato entre la experiencia y el conocimiento conseguido, o
los sistemas cognitivos alcanzados, prescindiendo de las exigencias
de fronteras en el conocimiento y generalizando a otros sistemas que
implican, creencias, comprensión, interpretación, y puede que otras
cosas. (op.cit., [p.10])

El estudio del lenguaje es una de las formas adecuadas de


enfrentar este problema de Platón pues –afirma Chomsky- éste
es una auténtica propiedad de nuestra especie biológica, la que
determina –en buena parte- la comprensión y pensamiento
humanos. Los datos del lenguaje son accesibles y generalizables
en función del descubrimiento de la lengua como facultad
biológica, como componente innato de la mente-cerebro (ibíd.;
también Fodor, 1975 y 1983). La investigación del módulo
lingüístico, es decir, el descubrimiento de la realización a nivel
mente-cerebro del sistema de conocimiento del lenguaje promete
avances importantes en la solución del problema de Platón.
Luego…

…podemos preguntarnos si esos principios se pueden aplicar a otros


casos, o, si no, si un enfoque que posee un cierto grado de éxito en la
explicación en el caso del lenguaje humano puede servir por lo menos,
como modelo sugerente en investigaciones similares en otros dominios
cognitivos. Mi idea es que los principios no se pueden generalizar, que,
en aspectos decisivos son específicos de la facultad lingüística, pero
que ciertamente el enfoque puede resultar sugerente en otros campos,
tanto en sus logros como en sus evidentes limitaciones. (ibíd.)

Por lo tanto…

Al estudiar las propiedades de las lenguas naturales (…) podemos


tener la esperanza de alcanzar cierta comprensión respecto de las
características específicas de la inteligencia humana. Podemos
aprender algo acerca de la naturaleza humana (…) Además, no es poco
razonable suponer que el estudio de este logro especial del hombre, la
capacidad para hablar y comprender el lenguaje humano, puede servir
de modelo para explorar otras áreas de la competencia y la acción del
hombre. (Chomsky, 1975, [p.12])

De hecho, numerosos trabajos realizados en los últimos años,

16
en la investigación de las estructuras del reconocimiento visual
–desde la exploración de la arquitectura del neocórtex visual
en los sesenta (Hubel, 1963; Hubel & Wiesel, 1962, 1977) hasta
la mencionada Teoría del cálculo por representaciones- han
demostrado la plausibilidad de los lineamientos generales para
abordar una gramática de la visión de manera tal que explique
el modo en que el hombre (y otros animales superiores) son
capaces de leer en las imágenes retinianas (cuya dimensión
real efectiva es 2) las características tridimensionales (o
multidimensionales) de los objetos, y son –inclusive- capaces
de predecir sus estados futuros inmediatos. En este sentido,
podemos hablar de una cierta equivalencia entre dicha gramática
visual y el lenguaje humano [su gramática visual (GU), a lo
Chomsky], al menos en cuanto a su participación coordinada en
la evolución natural de la especie.

El mencionado punto de mira ha quedado históricamente


relegado en lo que refiere a la consideración y el estudio de la
evolución de los esquemas comportamentales y de las estructuras
cognoscitivas de los organismos superiores. Asuntos de los que
se supone que la propia textualidad es el factor determinante (cfr.
supra.). Por tanto: “...se acepta que las estructuras mentales que se
desarrollan a lo largo del tiempo son arbitrarias y accidentales; [y
que] no existe una naturaleza humana fuera de la que evoluciona
como proceso histórico específico” (Chomsky, 1975: I., [p.16]).
Pero -frente a lo dado por aceptado, sostiene Chomsky- “…
personalmente rechazo (...) el extraño aunque influyente punto de
vista que afirma que los ‘estados internos’ no deberían considerarse
en el estudio del comportamiento” (ibíd.; y también cfr.1985: 2.2.
y 2.3., en cuanto a los conceptos de lengua exteriorizada y lengua
interiorizada). Aún en el marco de un predominio hermenéutico
hegemónico en los estudios del lenguaje y de la imagen (por
ejemplo en materia de sociolingüística o de iconología), los
sistemas cognoscitivos “...demuestran ser tan maravillosos e
intrincados como las estructuras físicas que se desarrollan en la
vida del organismo.” (Chomsky, 1975: 1., [p.17])

Al día de hoy, han sido reunidas suficientes pruebas de la


17
imposibilidad de naturalizar (al menos completamente) el tipo
de estudio al que nos referimos, fundamentalmente en cuanto a
la multiplicidad y variabilidad de lenguas así como la equivalente
variabilidad de sistemas de representación y reconocimiento
visual, la que es afirmada a través de notables trabajos sobre la
dimensión cultural del sentido de la imagen (Gombrich, 1960;
Eco, 1968: B., pp.187-275; Angenot, 1985; etc.). A pesar de ello,
Chomsky afirma un nivel de previsibilidad de las lenguas: “…
aunque se sepa aún muy poco sobre los universales lingüísticos”
(1975, [p.17]) –sostiene-, la variedad posible de lenguas es
significativamente reducida. Lo mismo podría decirse de los
sistemas de representación y reconocimiento visual. ¿Cuánto
pueden alejarse de una base biológica indispensable? El conjunto
de individuos que comparte un mismo sistema de representación
icónico (o icónico-indicial) ha aprehendido una rica y
compleja estructura para usar con éxito tal sistema; y lo han
hecho, aparentemente sub-determinados por una experiencia
fragmentaria, a la vez que determinados por un conjunto de
principios que es propiedad de la especie. Así como operan
restricciones poderosas que limitan la variedad de lenguas
(Chomsky, op.cits.), deberían existir –esta es nuestra hipótesis
más general- ciertas restricciones básicas que justifiquen la
exigencia intelectual de determinar la dotación biológica que
hace posible la producción y recepción de imágenes visuales4 en
tanto que subconjunto de un conjunto idealmente predecible.
Brevemente: la hipótesis que postula el innatismo de las
facultades del lenguaje sostiene que en este aspecto, una facultad
de la mente desempeña dos funciones básicas: 1. Proporciona
un sistema sensorial (para captación y análisis preliminar de los
datos lingüísticos) y 2. Proporciona un esquema que determina
cierta clase posible de gramática. Así pues, la lenguas que forman
parte de lo dicho, lo hacen porque son aquellas que pueden
aprenderse de manera normal (Chomsky, 1975, [p.19]). A estas
dos mismas funciones básicas (o a sus equivalentes) debería
servir –en caso de existir- la organización estructural previa del
funcionamiento de un módulo visual (Fodor).

4 Textos entre icónico e indiciales (cfr. Fraenza, 1995).

18
1.2. Idealizaciones necesarias

En el campo lingüístico, la denominada gramática generativa


representó -a la vez que un reencuentro con las ciencias del
entendimiento- un desplazamiento importante del objeto en el
enfoque de los problemas del lenguaje. Un desplazamiento que
va desde la conducta hacia los estados de la mente/cerebro que
forman parte de ésta; de modo que las condiciones generales
de nuestro enfoque ya podrían verse esbozadas en la mismas
tres preguntas iniciales que formula Noam Chomsky cuando
intenta dar cuenta de esta modificación substancial en el modo
de abordar el problema del conocimiento del lenguaje (1985: 1.,
[p.17]):

(i) ¿Qué es lo que constituye el conocimiento del lenguaje?

(ii) ¿Cómo se adquiere el conocimiento del lenguaje?

(iii) ¿Cómo se utiliza el conocimiento del lenguaje?

No serán las respuestas directas a tales preguntas, ni el abordaje


preciso con el que Noam Chomsky aprende sobre el problema
de Platón en el conocimiento del lenguaje, lo que nos interese
en nuestra investigación; sino que trabajaremos sobre aquellos
aspectos del problema mencionado que afectan también a la
producción e interpretación de imágenes en el marco de los
diversos sistemas de representación visual.

Chomsky sostiene que, por lo general, la ciencia lingüística


se ha concentrado, entre todos los aspectos del lenguaje, en
la evaluación y observación de comunidades lingüísticas
idealizadas y consistentes en su práctica del lenguaje; es decir,
de grupos de individuos como no existen en el mundo real.
Las interacciones efectivas del sistema de la lengua se dan
entre individuos que hablan, que interpretan y que poseen
representaciones internas así como capacidades abductivas
muy variables. En este sentido y de modo equiparable a
muchas abstracciones del pasado de la investigación lingüística

19
(especialmente de la estructuralista), el propio Chomsky
prescribe una suerte de disimulo metodológico de estos hechos:

Seguramente existe una cierta propiedad de la mente P que permite


a una persona adquirir una lengua bajo las condiciones de una
experiencia pura y uniforme, y P funciona seguramente bajo las
condiciones reales de adquisición de la lengua. Por eso, sería absurdo
negar estos supuestos, ya que equivaldría a sostener que la lengua
solo se puede aprender en condiciones de diversidad y experiencias
inconsistentes, lo cual es absurdo; o que existe la propiedad P, una
capacidad para aprender la lengua en el caso puro y uniforme,
pero que el aprendizaje real de la lengua no entraña esa capacidad.
(Chomsky, op.cit.: [p.32])

Finalmente, lo que sostiene Chomsky es que de existir esta


propiedad P, de la mente y que permite a un individuo adquirir
una lengua a partir de una experiencia pura y uniforme; esta
misma propiedad, funcionaría también bajo las condiciones
reales históricas de variabilidad en la adquisición del lenguaje.

Esta no es la única idealización aceptada en la teoría de


Chomsky. También acepta que -y esto nos interesa para nuestro
propio enfoque- la propiedad P es común a toda la especie
humana. Aún cuando se podría tener presupuestos de identidad
más débiles, mantiene que la variación puede ignorarse sin
consecuencias graves en el intento por construir una teoría
gramática universal (GU) cuyo objeto sea la propia facultad
lingüística como componente particular de la mente humana
(cfr. op.cit., [p.16], y también [p.33]).

20
2
Facultad de ver

2.1. Cálculo visual

E
xpliquemos brevemente, algunos elementos de la
comprensión actual de la visión humana. En primer lugar,
digamos que los científicos cognitivos están convencidos
de que la visión de los mamíferos superiores consiste en un
proceso de etapas sucesivas, y no en un acto simultáneo como
se creyó durante largo tiempo, bajo la influencia de Max
Wertheimer y sus secuaces. Nuestra dotación biológica para
ver está preparada para procesar la información visual a través
de una secuencia de representaciones, que van desde las más
inútiles (iniciales),5 hasta las que representan las propiedades
constantes de la forma de los objetos de la escena, es decir,
las propiedades que estamos obligados a conocer para poder
movernos entre ellos y manipularlos con provecho. El fundador
del enfoque actual de la visión, David Marr (Marr & Nishihara,
1978 y Marr, 1982), sostenía (como Artistóteles de Estagira) que
el propósito de la visión humana es construir descripciones de
la configuración y la disposición espacial estables de las cosas a
partir de las imágenes retinianas.

Entiéndase, la comprensión visual debe alimentarse de un


producto retiniano variable y continuamente cambiante,6 como
base de para unas postreras representaciones de la constancia
perceptiva de los atributos más o menos permanentes de
5 Inútiles pues contienen la información caótica e inconstante que ofrecen los
ojos en movimiento respecto de un mundo también en movimiento.
6 Cada vez que nos movemos, o movemos los ojos, o cambia la escena.

21
la escena. Cabe decir que, para el organismo que ve, es útil
producir modelos mentales (representaciones) que contengan las
propiedades distales (reales, independientes del punto de vista y
de las condiciones de iluminación) de la escena. Es útil saber y
recordar cómo es la configuración tridimensional permanente de
las cosas que vemos y manipulamos. Pero estas representaciones
de la geometría permanente 3-D de los objetos que -finalmente-
almacenamos en la memoria a largo plazo y que nos sirven
para reconocerlos en cualquier circunstancia de posición o
iluminación, no pueden formarse directa o suavemente a partir
de la información proximal, es decir, a partir de las imágenes
retinianas (las que son las primeras respuestas fisiológicas)
que, como es bien sabido, luego de Alfred Yarbus, son fugaces,7
borrosas,8 temblorosas, caóticas;9 careciendo en sí mismas de
toda posible utilidad para la acción por parte del organismo que
ve. Debido a esto, nuestra visión, por medio de una secuencia de
representaciones, consigue –en un tiempo más o menos corto-
hacer los cómputos necesarios para transformar la estimulación
proximal de entrada en representaciones de salida (un output)
que contienen información distal de la forma permanente del
objeto. La disposición general de los niveles de representación en
la percepción y comprensión visual se esboza en los diagramas
que mostramos (Figuras 2.A. y 2.B.).

El nivel derivado más directamente de la imagen retiniana es el


llamado esbozo primitivo 2-D. Su principio de formación básico
es la detección de discontinuidades de intensidad de la imagen
retiniana, para establecer límites o bordes visuales relevantes, en
determinada posición y orientación x e y del campo visual (2-D).
Por contener información todavía irrelevante para un organismo
al que le interesa la forma y la posición 3-D de los objetos de la
escena, el esbozo 2-D permanece aislado (encapsulado respecto)
de las representaciones conscientes (no lo vemos).
7 Porque los ojos no cesan de moverse balísticamente de un lado a otro del
campo visual, produciendo decenas o cientos de fijaciones por segundo.
8 Porque la resolución de la retina sólo capta detalles en su zona
central, próxima a la fóvea.
9 Desordenadas respecto de todo patrón de sentido más o menos inmediato.

22
Figura 2.A.

Aunque no es necesario que entremos aquí en demasiados


detalles, digamos que, aún siendo el esbozo 2-D una
representación plana, contendría cierto tipo de información
que hace posible derivar10 el siguiente nivel de representación
visual, el esbozo quasi-tridimensional 2½-D. Este nuevo nivel
representa lo que creemos estar viendo en acto: un modelo
del campo visual en el que la profundidad y la orientación de
las superficies se representan en cada punto x e y. Este es el
nivel de procesamiento que se impone a nivel consciente pues,
vemos (o creemos que vemos) entidades unitarias discontinuas
(cosas, bultos), envueltas o formadas por superficies orientadas
y curvadas en el espacio, situadas a diversas profundidades
respecto del punto de vista del observador. Luego: ¿Cuál es
la salida (el output) del proceso de la visión? El modelo 3-D,
que representa la estructura tridimensional de los objetos,
independientemente de la posición del observador.

10 Aprovechando también el sombreado y la estereoscopía (disparidad retiniana


entre un ojo y otro).

23
Figura 2.B.

Este producto de salida del módulo visual, que explicita no


cómo se ve, o como aparece, sino cómo es cada objeto, ya
no se impone a la consciencia sino que se almacena en la
memoria a largo plazo y es evocable (imaginable) a voluntad.
Una característica importante de la visión de los mamíferos
superiores es –como ya hemos anticipado- su modularidad
(Chomsky, 1985 y Fodor, 1983). Dicho de otra manera, el
encapsulamiento cognitivo de sus primeras etapas: formaciones
retinianas, esbozo 2-D y parte de la formación del esbozo 2½-D.
Etapas en las cuales la información sube (bottom up) desde las
superficies sensibles en dirección hacia las funciones superiores;
quedando impermeabilizadas las representaciones iniciales
respecto de la información que desciende (top down), es decir,
impermeabilizadas respecto de nuestros saberes individuales
y sociales. No vemos ni somos conscientes de las formaciones
retinianas y el esbozo 2-D, pues contienen información
irrelevante que ensombrecería y saturaría la información que
es útil para el observador. Entiéndase que, como veníamos

24
sugiriendo arriba, que las viejas artes del dibujo y la pintura
deben su gran dificultad y mérito al hecho de que veamos
conscientemente escenas profundas y superficies en 2½-D. Dicho
de otro modo, que veamos conscientemente algo muy distinto
de lo que debemos dibujar y pintar. Los métodos fiables para
superar dicho impedimento natural consisten en reconstruir
ortopédicamente el esbozo bidimensional que no vemos (por
estar cognitivamente encapsulado), pero que contiene la
información necesaria para dibujar y pintar. Expliquemos esto
último: La imagen de una pintura ha de entenderse como una
porción (tronco-piramidal) de un mundo en tres dimensiones
cuya existencia depende básicamente de la visión quasi-
tridimensional, en profundidad, de un observador (monocular).
Por lo tanto, las imágenes pintadas sólo permiten percibir una
realidad 2½-D y 3-D si su superficie ha sido cuidadosamente
construida, exigiendo dicha construcción imitar lo mejor
posible ciertos caracteres de la visión natural, cuya enumeración
potencial –para una escena dada- es tan abundante y atiborrada
que vuelve sino inservible, por lo menos improcedente, todo
intento de edificación deductiva, en el sentido en que se presenta
en el muy conocido Libro Primero del tratado albertiano Della
Pittura (1436), al que neciamente los historiadores del arte suelen
atribuir –in toto- el sistema de dibujo aplicado al conjunto de la
histotia de la pintura de caballete en el mundo occidental. Una
construcción analítica no es de gran ayuda práctica para pintar
–por ejemplo- la apariencia de curvaturas complejas, pliegues
o brillos. Motivo por el cual, León Battista Alberti propuso,
en otro lugar, efectivamente, utilizar el velo o la cuadrícula
transparente para imitar -de la visión natural- tan sólo el esbozo
de 2-D. Como éste no es visible ni consciente, Alberti prescribe
la manera de imaginarlo artificialmente, a partir de la escena real
misma, sirviéndose de un recurso pantográfico y mecánico como
lo es el velo. Siendo así, la pintura, una estructura estimular
sucedánea del esbozo 2-D, a partir de la cual, la visión natural o
ya cultural, prosigue su trabajo.

25
2.2. Representando lo que vemos, antes que el lenguaje

Al término de un primer encuentro visual11 con un objeto


existente y visible cualquiera (de la más diversa escala,
complejidad y extrañeza), el sujeto que ve ha elaborado ya lo que
normalmente se menciona como el tipo cognitivo (TC) o tipo
de reconocimiento visual (Groupe mu, 1987, iii.2.2.) de dicho
objeto. Hablamos de una suerte de esquema morfológico no muy
distinto de lo que en la teoría más actual de la visión humana se
conoce como modelo 3-D (Marr & Nishihara, y Marr, op.cits),
sobre cuya base habría de establecerse la constancia de los actos
perceptivos. Según este TC –en su aspecto visual- el sujeto es
capaz de reconocer visualmente otros ejemplares de la misma
clase o el mismo objeto en otra circunstancia, prescindiendo de
todo tipo de variaciones de iluminación y de puntos de mira.
Ahora bien, cabe aclarar -con cierto énfasis- que un tipo o
modelo como el que mencionamos tiene nada o casi nada que
ver con la vieja idea de “esencia” del realismo aristotélico y tal
vez sea –por el contrario- producto de la concatenación de unos
pocos rasgos superficiales, tales como los que se requieren para
el reconocimiento exitoso y la manipulación útil del objeto en
su encuentro. Dicho tipo posee la forma de una regla o de un
procedimiento para constituir una imagen o representación,
inclusive gestual, del objeto en cuestión, además de permitir
el reconocimiento. Sostener que los conceptos de «bailarina»
o «carruaje» son mucho más ricos –inclusive en propiedades
visibles- que sus respectivos TTCC visuales, adquiridos en la
recurrencia visual directa o mediada por la imagen (pictórica,
fotográfica, técnica, esquemática, etc.) con especímenes
concretos de dichas clases, no tiene importancia pues, esos
someros TTCC permiten decir que sabemos lo que es una
bailarina y lo que es un carruaje pues, podemos -simplemente-
reconocer tales dispositivos. Podemos, sobre la base de lo que de
hecho sabemos, no sólo reconocer estas entidades sino, además,
asignarles un nombre como primer acto social, a través del cual,
una comunidad es capaz de reconocer individuos variados como
11 Esta misma consideración podría hacerse para con los otros aductos o
canales sensoriales o bien, para con todos en conjunto.

26
sucesos de un mismo tipo. En este sentido un TC (inclusive
espacial, visual o táctil) no es puramente privado sino que
llamaría al establecimiento de una zona de consenso social.

En algún momento, una comunidad procede a interpretaciones


colectivas de lo que significa la palabra que nombra el tipo,
es decir, asociando un contenido a la expresión lingüística.
El acuerdo se dispone inicialmente como un intercambio
desordenado de experiencias en una suerte de interpretación
que ya es pública, en una serie controlable de interpretantes que
normalmente se denomina contenido nuclear (CN).12 Luego, el
conocimiento complejo de un objeto (digamos, la competencia
ampliada respecto a bailarina o carruaje) comprende además
aspectos y nociones no indispensables para su reconocimiento
perceptivo y se menciona a este conocimiento: contenido molar
(CM).

Figura 2.C.

12 Ambas expresiones TC y CN no son la misma cosa, el primero es un


fenómeno de semiosis perceptiva (privada), mientras que el segundo es un fenómeno
de acuerdo comunicativo (público). Así, el TC no es visto sino por la mente que lo
ha concebido y es postulable sobre la base de los fenómenos de reconocimiento,
identificación y –desde luego- referencia exitosa. El CN, en cambio, es la manera en que
se intenta intersubjetivamente aclarar y compartir qué rasgos forman un determinado TC.

27
Todo dibujo de un objeto o escena visible existente se compone
de elementos que se ven y de elementos que se saben o se sabe que
se ven, predominando uno u otro grupo según el mencionado
dibujo sea del natural o «de memoria». Para este último caso,
siguiendo la Figura 2.C., tenemos que, a partir del mundo visible,
o bien de una estructura de estímulos visuales procedentes del
mundo, o mejor de cómo ésta afecta a las superficies sensibles
del cuerpo (la retina), obtenemos un modelo perceptivo en tanto
representación más bien densa de una experiencia determinada;
asignando al objeto percibido las propiedades x1, x2... xn. Luego,
por un proceso de abstracción, el modelo perceptivo da origen
a un TC ó modelo semántico que conserva tan sólo algunas de
las propiedades (inclusive no verbalizables) de la representación
densa. Así, podemos expresar este modelo semántico mediante
artificios expresivos, es decir, podemos dibujar13 lo que sabemos
de ese modelo semántico que, almacenado en la memoria a
largo plazo no difiere de lo que hasta aquí habíamos llamado
tipo cognitivo (TC) visual. Como sostiene Eco (1975, 3.), por
si acaso las marcas no fuesen toposensibles,14 bastaría con una
correlación planteada arbitrariamente. Pero puesto que estamos
ante un caso de toposensibilidad, la correlación motivada deberá
seguir reglas de transformación basadas en la semejanza.

Repasemos el proceso: una estructura estimular afecta a


las superficies sensibles de los diversos aductos del cuerpo.
Tomando como punto de partida estructuras de estímulos
proximales, inestables, múltiples y fugaces, calculamos un
modelo perceptivo estable y constante como representación
-todavía densa y particular Aunque estable e independiente
del punto de mira así como dispuesta respecto de su propio
sistema de coordenadas- de un objeto, escena o experiencia
determinada. Entre las imágenes superficiales retinianas y el
modelo perceptivo estable, es decir el modelo 3-D de un objeto

13 En el gráfico de la Figura 2.C., dicho dibujo aparece bajo el rótulo:


transformación (término que suele utilizar Umberto Eco), dibujo de memoria.
14 Toposensibles son aquellos contenidos (semióticos o mentales) de la
representación sensorial (en este caso, visual) que no son verbalizables, que no son
traductibles a la palabra.

28
o escena particular, se extiende el procedimiento de cálculo
mediado por representaciones tales como el esbozo primario y
el esbozo 2½-D. Respetando luego las reglas que rigen cualquier
clase de proceso de abstracción, uno o más modelos perceptivos,
se transforman en lo que Eco (1975, 3.) llamó modelo semántico
que ya es tipo y no espécimen,15 y que conserva sólo algunas de
las propiedades comunes, diagnósticas, generales o meramente
frecuentes. Finalmente, empleamos ese modelo semántico
esquemático tanto para reconocer –mediante una prueba de
conformidad- objetos o escenas, además de crear imágenes de
cómo recordamos que se ven las cosas. Esta transformación,
entre modelos perceptivos (particulares) y modelos semánticos
(de clase), corresponde perfectamente al mecanismo que
Umberto Eco ha observado como transformación con un
alcance propiamente semiótico: la correspondencia biunívoca de
puntos en el espacio, conservando algunas de sus propiedades
geométricas. Cabe recordar que Eco, en su Tratado de semiótica
general (ibíd.), no dice en ningún momento que dicho modelo
semántico no es verbal, pero lo deja entender así y –más
adelante-, en Kant y el ornitorrinco (1997, 2.) confirma dicha
intuición.

Figura 2.D.
15 Esto es importante para dar cuenta del inicio de la semiosis en una instancia
del proceso de percepción del mundo que es anterior al concepto tomado en un sentido
lingüístico. Debemos tener siempre presente que la relación semiótica es siempre
entre tipos (de significantes y de significados) y no entre especímenes concretos. Un
espécimen expresivo concreto significa lo que significa porque pertenece a un tipo o
clase abstracta que –según el sistema semiótico del caso- está correlacionada no con un
acontecimiento particular sino con un contenido también abstracto.

29
En cambio, para producir un dibujo del natural16 es necesario
un tipo de procedimiento diverso, a veces denominado
invención moderada, por el cual, como sostiene Eco, se proyecta
directamente desde una representación perceptiva (2-D, 2½-D ó
3-D; es decir, en cualquiera de las etapas del procesamiento de la
información visual, entre las representaciones bidimensionales
e inestables de las retinas y las representaciones mentales
tridimensionales de la forma constante del objeto visto) a un
continuum expresivo según lo muestra la Figura 2.D. Ese es
el caso, como decimos, del dibujo del natural, a partir de un
modelo particular de escena u objeto. Leer o interpretar tal
dibujo, por parte de un lector-observador, implica retroceder
para inferir y extrapolar las reglas de semejanza indicadas y
reconstruidas por el percepto originario. De otro modo: una de
las reglas más exitosas para la enseñanza del dibujo del natural
ha consistido (desconocemos su vigencia actual) en dibujar lo
que se ve tratándose de olvidar qué entidad se está dibujando y
lo que se sabe de ella. Esta regla prescribe proyectar a partir no
de la idea que ya tenemos acerca de la realidad morfológica de lo
que dibujamos (modelo almacenado en la memoria a largo plazo
en tanto TC) sino a partir de su representación perceptiva en
la memoria de trabajo a corto plazo, co-presente con el mismo
objeto, tratando inclusive, de proyectar los datos no tanto del
modelo 3-D sino de las representaciones precedentes, centradas
en el observador, cuyas dimensiones son 2 (para disponer los
bordes) y 2½ (para indicar la profundidad y orientación de las
superficies), aún cuando el acceso a éstas, por estar encapsuladas
o ser modulares (Fodor) requiere un esfuerzo extra, que no es
otra disposición distinta de la mencionada regular y toscamente
como entrenamiento en el dibujo.

Los diversos sistemas de dibujo –y sus correlatos pictóricos,


los cuadros (o tableaux)- pueden contribuir a proporcionar
descripciones del mundo ya bien centradas en el observador o
bien, centradas en el propio objeto. Recordemos que la noción de
“sistema de dibujo”, formulada y sostenida por John Willats (1990
16 En el gráfico de la Figura 2.D., dicho dibujo aparece bajo el rótulo:
transformación, dibujo del natural.

30
y 1997) implica la clase de estructura que en una imagen da
cuenta de la relación espacial entre objetos. Así, algunos sistemas
de dibujo tales como, por ejemplo, el que regula la perspectiva,
muestran la disposición de las aristas y demás elementos «tal
como» aparecen en nuestras representaciones iniciales 2 y
2½-D (con ejes de coordenadas centrados en el observador),
mientras que otros sistemas de dibujo, como las proyecciones
cilíndricas, describen la dirección de las aristas en relación al
espacio «real» (aún en un mundo posible), independientemente
(en lo posible) de un punto de vista concreto, aproximándose
al ideal de las representaciones 3-D del procesamiento de la
información visual. No obstante, muy pocas imágenes, si las
hay, ofrecen representaciones del mundo puramente centradas
en el observador o en el propio objeto. Es decir, algunas
imágenes no son del todo «naturales» o «icónicas», ya sea en el
sentido fuerte de reproducir los contornos de las proyecciones
retinianas de los objetos y la escena, o en el sentido atenuado
de derivar de alguna representación perceptiva de 2-D ó 2½-D.
Pero tampoco tenemos –y esta es nuestra hipótesis- imágenes
completamente convencionales, ya que todo sistema de dibujo
–en alguna medida- está derivado de las leyes de formación de
alguna de las representaciones internas que dan lugar al cálculo
y procesamiento de la información visual. Otra vez estamos
en el punto de partida: las imágenes son, en parte artificiales o
culturales y, en parte tomadas de la propia naturaleza.

2.3. Visión y lenguaje. Identificación visual y categorización

Llegados a este punto, debemos admitir que el formato de


salida del modulo visual, es decir, el modelo 3-d, tal como
lo concibieron Marr & Nishihara, está involucrado en una
de las discusiones más fecundas de la filosofía occidental, el
consuetudinario problema de los universales. Sin que este sea
el lugar más adecuado para abordar dicha cuestión, hemos

31
de aclararnos algo más al respecto. La evolución biológica
ha dotado al nivel 3-d del procesamiento de la información
visual de la capacidad de codificar variaciones en la forma entre
individuos de un tipo común. Entiéndase, el procesamiento
visual es capaz de codificar una representación a largo plazo
de cómo son los sacacorchos o los hipopótamos. Aceptando
una gama de tamaños permisibles, tanto globales como
constituyente por constituyente, y especificando las gamas de
proporciones de tamaño entre las partes, se puede llegar a una
codificación geométricamente parametrizada que puede hacerse
corresponder con una clase de objetos presentados con mayor
variabilidad que la de un ejemplar concreto.17

Lo que decimos, contradice la extendida hipótesis según la


cual el sujeto almacena una imagen mental de un ejemplo
estereotípico de una categoría dada. Tal como tradicionalmente
se la ha prefigurado, esta imagen mental sería la de un ejemplar
concreto, vale decir, un conjunto de rasgos relativamente menos
flexible, que se emparejaría con los ejemplos putativos por
medio de un proceso computacional aún inespecificado, basado
–tal vez- en la analogía, es decir, en el viejo y problemático
juicio de similitud o semejanza (entre la imagen y la cosa).
En comparación, el modelo 3-d formulado por David Marr y
homologado a la perspectiva semiótica por Umberto Eco (1997)
y por nosotros mismos (1995), es descomposicional y jerárquico
(Figuras 2.E. y 2.F.), y por tanto capaz –en sí mismo- de un
tipo de genericidad que debería haber sido objeto de mayor
atención por parte de psicólogos, psicolingüistas y semióticos
(todos ellos, muy interesados por ese secreto arte [Kant] de la
abstracción, al que han buscado puramente en el territorio del
lenguaje). El poder de representar o codificar clases le viene dado
al modelo 3-d por no ser de todo inflexible como el estereotipo,
ya que la descomposición recursiva de un objeto en partes
puede especificar –ya hablando en términos computacionales-
proporciones y variaciones en lugar de un valor único fijo para el
tamaño, la forma y la disposición de las partes.
17 Cuya percepción varía ya, en sí misma, en función de la posición, la postura,
la iluminación, etc.

32
Figura 2.E.

Todo esto, recordando permanentemente que la representación


mediada por el modelo 3-d no es una representación arbitraria,
sino que está justificada y desarrollada sobre la base de su
adecuación general para las tareas visuales de reconocimiento de
la envolvente tridimensional visible de los objetos del entorno.

33
Figura 2.F.

¿Qué estructura u organización tiene el estímulo luminoso una


vez que ha sido remitido por las superficies de una escena? Este
problema ha sido formulado desde hace siglos en óptica y puede
resolverse del mismo modo que pueden resolverse los conjuntos
de ecuaciones. Pero la problemática de la visión, en este sentido,
es lo contrario a la óptica. La visión tiene que establecer qué
clase de objetos (estímulos distales) causaron los patrones de luz
proyectados en la retina (estímulos proximales). Y este problema
no está, jamás, bien formulado. Entiéndase, es imposible de
resolver, porque hay demasiadas incógnitas, demasiadas maneras
diferentes en que puede haberse creado el patrón de luz, a partir
de una realidad física tridimensional iluminada. Cuando la
mente resuelve una tarea colosal, es porque debe tener algún
recurso crítico. Como ya lo hemos sugerido, ese recurso es el
conocimiento. Pero el conocimiento, no debemos pasarlo por
alto, viene dado en dos variedades principales, y no en una; que
se utilizan de dos maneras fundamentales, no sólo de arriba
hacia abajo, sino también, de abajo hacia arriba. El primer tipo
de conocimiento es el que se incrementa a lo largo de la vida del
individuo en sociedad. Se tiene experiencia con las lechugas, las

34
fiestas y los tenedores, por tanto, se aprende sobre sus apariencias
y sobre sus funciones, y así se puede utilizar este conocimiento
explícito, al que la introspección permite acceder, recordando
cómo lucen los objetos y las escenas, para elaborar y reconocer
su la identidad o pertenencia a clase. De hecho, no siempre
se es consciente de dicho conocimiento, ni de la naturaleza
de dicho conocimiento.18 El otro tipo de conocimiento, cuyo
procesamiento hemos tratado aclarar, surge de la evolución y
su pericia está grabada en los procesos del sistema nervioso (la
solución al problema de Platón, cfr. supra.). Este conocimiento
no es explícito y está encapsulado en las computaciones de los
módulos de nivel inferior. Tales módulos nunca descubren a la
introspección su modo de operar, ni están demasiado afectados
por el control consciente.

Esta inmediatez de la percepción ha llevado a legiones de


estudiosos, desde psicólogos hasta sociolingüistas, a poner
en duda nuestra hipótesis actual de cómo la mente construye
los modelos mentales tridimensionales, y de cómo se usa el
conocimiento propio para hacer inferencias inconscientes que
permitan reconocer los objetos y saber dónde están. El enfoque
que intentamos comprender, no obstante, tiene la enorme
ventaja de haberse examinado en el marco computacional,
siendo posible equipar a diversas máquinas con habilidades en
bruto del tipo de las de nuestra visión.

La distinción entre los dos tipos de conocimiento puede marcar


el límite –como dijimos- entre la percepción pura y la cognición.
O mejor dicho, mover el límite, quitándolo del lugar en el que lo
ubican sociólogos y semióticos. Marr trazó esta frontera entre
el esbozo cuasi-tridimensional y el modelo tridimensional.
Los datos neuropsicológicos sugieren que la frontera podría
imponerse entre el modelo tridimensional y la identificación
de los objetos y sus funciones. Bien podría ser que no haya un
límite claramente definido, pero tenemos ahora, en claro, dos
cosas. La primera, que cuando vemos el mundo, la información
18 Y en esto, nos aproximamos al viejo problema sociolingüístico y teórico
crítico de la ideología o falsa conciencia.

35
sobre las profundidades relativas de las superficies (el esbozo 2½-
d) no puede recuperarse sin el uso de restricciones innatas. La
segunda, que la identificación de los objetos no puede producirse
sin el uso de los dos recursos cognitivos que acabamos de
diferenciar. La acumulación de este conocimiento depende en
parte del aprendizaje y de la habilidad para recordar lo que se ha
aprendido.

La intuición –aún oscura- de una cierta equivalencia o


paralelismo en la organización de las estructuras de información
visuales y lingüísticas nos conduce a buscar también
equivalencias en la organización general de su procesamiento.
Debido a que el contenido de la información es muy diferente en
las dos facultades, no deberíamos probablemente –por lo menos
en esta instancia- esperar similitudes de mucho detalle, pero vale
la pena ahora pensar algunas similitudes o vínculos entre las
estructuras visuales y conceptuales, a los fines obtener una idea
más articulada, para la visión, de la interacción de sus distintos
niveles de representación (Figura 2.G.).

Figura 2.G.

Este diagrama muestra las relaciones entre los niveles de


representación en la percepción visual y en la comprensión
visual (es adaptación de Eco, 1975, 3.6.7. [p.354] y Jackendoff,
op.cit. [p.221]). Las flechas negras, representan un conjunto de
reglas de correspondencia entre pares de niveles; las que son
dobles indican que se emplean hacia abajo (para rememorar

36
y para dibujar de memoria) y hacia arriba (para percibir y
para dibujar del natural). Cada uno de estos conjuntos de
reglas puede descomponerse aún más en elementos separados
lógicamente, como sugerimos cuando mencionamos módulos
paralelos para la construcción del modelo 2½-d. Nos
ocuparemos luego, con cierto detalle de la conexión entre lo
que vemos y la estructura conceptual propiamente lingüística,
es decir, lo que hablamos. La organización que mostramos en
el diagrama tiene, como ya hemos visto, serias consecuencias
respecto de la dirección del flujo de información que tiene
lugar en el curso del procesamiento. Es posible, dividir las
funciones del procesamiento visual en procesadores autónomos,
mencionémoslos:

Procesadores de abajo/arriba

a. Grabado de la luz, en la retina

b. Proyección de la información retiniana, al formato de esbozo primitivo

c. Proyección de la información del esbozo primitivo disponible, al


formato 2½-d

d. Proyección, de la información 2½-d disponible, al formato 3-d

e. Proyección de la información 3-d disponible, al formato conceptual

Procesadores de arriba/abajo

f. Proyección de la información conceptual disponible, al formato 3-d

g. Proyección de la información 3-d disponible, al formato 2½-d

Procesadores de integración
h. Integración de la información nueva perteneciente al esbozo primitivo
en un esbozo primitivo unificado

i. Integración de la información nueva perteneciente al esbozo 2½-d en un


esbozo 2½-d unificado

j. Integración de la información 3-d nueva en un modelo 3-d unificado

37
k. Integración de la información conceptual nueva en una estructura
conceptual unificada

Los procesadores de integración son componentes ineludibles


pues permiten que los diferentes procesadores aporten
información a un solo nivel de representación. Por ejemplo,
la información del esbozo primitivo se traduce al formato del
esbozo 2½-d a través de varios procesadores autónomos que
se ocupan de la estereoscopía, las gradaciones de textura, la
estructura extraída del movimiento, etcétera. El procesador de
integración para el nivel 2½-d (i.) es encargado de reunir toda
esta información heterogénea en una sola estructura. Además,
durante la imaginación visual (consciente), es decir, cuando
recordamos como luce un determinado objeto o escena, este
mismo componente recibe información en formato 2½-d que ha
sido traducida a partir de la estructura 2½-d por el componente
(g.).

Una bi-direccionalidad parecida se presenta en el nivel del


modelo 3-d. En la percepción visual la información se traduce
a este nivel por medio del componente (d.) y es integrada por
el componente (j.). Si uno desea hablar sobre lo que ve, esta
información 3-d puede pasarse a la estructura conceptual a
través del componente (e.) y a partir de ahí a la facultad del
lenguaje. Por otra parte, cuando uno produce imágenes visuales
como respuesta a instrucciones orales (por ejemplo al leer un
cuento), la información conceptual derivada de la facultad del
lenguaje es traducida al formato 3-d por el componente (f.) y
se mantiene e integrada mediante (j.). Dicho brevemente, a los
procesadores de integración les da lo mismo de dónde obtienen
información, siempre y cuando esté organizada en el formato
correcto; toman cualquier cosa que les viene y hacen de ella una
representación tan coherente como son capaces.

En la visión, la información de arriba abajo a partir del nivel


3-d, traducida por el procesador (g.), puede tener un rol de
importancia en la formación del modelo 2½-d. El procesador de
integración 2½-d puede combinar estos datos con la información

38
que proviene del esbozo primitivo. De forma similar, la
información conceptual puede tener una función de arriba abajo
en la formación del modelo 3-d, a través del procesador (f.). Esta
información podría inclusive descender al esbozo 2½-d a través
del procesador (g.).

En general se admite con gran facilidad y beneplácito cultural


que existen ciertos efectos top-down en la percepción visual.
La clásica afirmación: “lo que vemos está afectado por lo que
sabemos acerca del mundo y lo que esperamos ver” o “vemos lo que
conocemos.” (Gastón Breyer) En este libro, como sabemos, estos
efectos descendientes no han sido nuestro problema principal.
Cuando se critica la idea de procesamiento de la información
visual, se la critica por consistir en un enfoque estrictamente
de abajo-arriba para la percepción visual, excluyendo (o poco
menos) los procesos de arriba-abajo. O sea, los que acabamos
de calibrar y situar en sus restricciones, en nuestro diagrama de
relaciones entre los distintos niveles de representación visual.
Entendemos que Marr y su equipo trataron de establecer cuánta
información puede derivarse mediante procesos de abajo-arriba
antes de tener que apelar a la información de arriba-abajo. Marr
reconoce claramente la necesidad de la información de arriba-
abajo, por eso hemos dicho que en el modelo 2½-d termina la
percepción pura. Ahora bien, esto no significa que no exista,
aún más arriba en el procesamiento, más allá del modelo 3-D
de un ejemplar concreto percibido (modelo perceptivo), otra
representación, también 3-d (modelo semántico [Eco, 1975]; TC
[Eco, 1997]), que también sea espacial, cuyos datos aún no sean
del todo representables (o modelizables, a lo Roland Barthes)
por el lenguaje; y que en dicha representación se produzca ya un
cierto proceso de abstracción o generalización, autónomo respecto
de la palabra. Más abajo, nuestro enfoque se atiene al punto de
vista de Marr: en el curso del procesamiento, la información de
nivel alto puede descender al esbozo 2½-d e integrarse allí, pero
no desciende más.

Todo esto lleva a Ray Jackendoff, preocupado por la consciencia


computacional humana, hacia una posición sobre la memoria
39
visual a corto plazo (mvcp) según la cual debería consistir
en un dispositivo que crea y mantiene diversos niveles de
representación visualmente relevante -por lo menos el esbozo
2½-d, el modelo 3-d y la estructura conceptual-. La mvcp puede
activarse mediante el aducto a partir de los niveles inferiores
en el caso de la percepción, o mediante el aducto conceptual
en el caso de la imaginación; cualquiera que sea el origen de la
activación, se crea un conjunto de niveles completo. Además,
estos niveles quedan registrados unos con otros, tal como
lo indicaría la estabilidad perceptiva del mundo frente a los
constantes movimientos del cuerpo y del ojo. Estos últimos,
tienen el efecto de acarrear todo el escenario captado, a lo largo
y a lo ancho de la retina. Sin embargo en el esbozo primitivo y
también en el modelo 2½-d no tenemos que volver a identificar
los objetos después de cada salto de la mirada. Esto es posible,
en cuanto a computación, porque las instrucciones que dirigen
los movimientos del ojo son correlativas con el registro entre
el esbozo 2½-d y el modelo 3-d, de manera que la traducción
del ojo esta acompañada de una alteración compensatoria de la
función de registro. Sin el mutuo registro, perceptivo y motor,
todo tendría que computarse otra vez. En la instancia de la
imaginación tenemos un argumento más directo en favor de
este registro. Durante la rotación en profundidad de un sólido,
por ejemplo, los muy conocidos conjuntos de bloques de Roger
Shepard (Figura 2.H.), desaparecen algunas caras de los bloques
y aparecen otras. Si la rotación se llevara a cabo en el esbozo
2½-d solamente, no tendríamos un origen plausible para las
caras nuevas que se van viendo.

Figura 2.H.

40
Sólo manteniendo el esbozo 2½-d en registro con un modelo
3-d completo pueden estar disponibles de forma inmediata, para
la imaginación visual, las caras nuevas que se ven. Finalmente,
podemos decir que, la descripción de la capacidad visual en
términos de niveles de representación ha conducido a un punto
de vista que sugiere que hay un sistema bi-direccional, altamente
modular e interactivo, que da cabida inclusive –para quién
esté interesado en preguntarse por ellas- a ciertas limitaciones
de procesamiento empíricamente, social, o históricamente
determinadas.

Antes de concluir esta sección y volver a las imágenes fuera


del cuerpo, debemos recordar que uno de los problemas
fundamentales a que se enfrenta toda teoría del lenguaje
natural es el formulado en el título mismo de un muy conocido
e influyente artículo de John Macnamara (1978): “¿Cómo
hablamos de lo que vemos” Para atacar este problema, debemos
encontrar un punto de conexión entre la teoría del lenguaje y
la teoría de la visión. Siguiendo a David Marr, hemos hablado
hasta ahora del modelo 3-d sobre todo cuanto producto final
del procesamiento visual y motor del reconocimiento visual
del aspecto visual de un objeto, sin decir nada respecto de su
conexión con la estructura conceptual y de ahí con el lenguaje.

Esta conexión lenguaje-visión debería especificarse mediante


un conjunto de reglas de correspondencia entre uno o más
niveles visuales y uno o más niveles lingüísticos. Idealmente, las
dos facultades deberían entrar en relación a través de aquellas
representaciones cuyas unidades entran en una correspondencia
más estrecha. En este sentido, los niveles más apropiados para
el enlace parecen ser la estructura conceptual y el modelo 3-d
(de clase, el TC). En el enlace de estos niveles, nuestro primer
principio de correspondencia puede relacionar, por tanto, los
constituyentes 3-d que codifican objetos con los constituyentes
conceptuales que codifican objetos; no hay otra pareja de niveles
respecto de la cual se pueda enunciar esta relación esencial.

Otra correspondencia importante que puede establecerse

41
inmediatamente es la que ofrece la codificación de la relación
conceptual parte-todo o posesión inalienable. Esta relación
ha sido siempre esencial en la semántica lingüística: la teoría
jerárquica de Marr del modelo 3-d permite que la manifestemos
explícitamente en términos espaciales. Básicamente, para
los objetos físicos x e y, x es una parte de y se obtiene en
estructura conceptual sólo si el modelo 3-d que corresponde a x
es una configuración que aparece a partir del modelo jerárquico
3-d que corresponde a y.

Una tercera correspondencia básica surge en las funciones que


Marr considera centrales en el modelo 3-d: la identificación
de objetos particulares (eso que tengo delante es una entidad
conocida, pongamos, mi gata) y la categorización de objetos (eso
que tengo delante es de un tipo conocido, pongamos, un gato
doméstico).

Para avanzar en el asunto, deberíamos decir algo respecto del


posible papel de conjunto que puede tener el modelo 3-d en la
mente computacional, consignando brevemente algunos otros
usos que podría adquirir. Y esto, en el sentido en que Jackendoff
(op.cit., 12.1.) asignaría un rol importante al modelo 3-d de la
visión, en la medida en que sería capaz de articular información
diversa, proveniente de otros aductos diferentes del visual.

Es posible identificar las envolventes tridimensionales de los


objetos no sólo mirándolos, sino también palpándolos -la
llamada percepción táctil-. Esto indica que las nociones del
modelo 3-d de un objeto físico, las comparten las modalidades
visual y táctil. Sin embargo, la vía táctil al modelo 3-d es
informacionalmente distinta de la vía visual. No hace uso de
nada parecido a un esbozo 2-d, que codifica segmentos de
límites locales en el campo retiniano. Si la percepción táctil
incluye alguna representación de las superficies tocables, este
modelo debe adaptarse a la forma y la movilidad de la mano y no
al ojo. Así pues, los esbozos primitivo y 2½-d, que se encargan
de recuperar información sobre la forma a partir de la imagen
retiniana, son específicos del sistema visual y no son parte del

42
sistema táctil. Los niveles táctiles correspondientes tendrán que
ocuparse de recuperar información sobre la forma a partir de
los sensores de tacto y de presión de la piel. A pesar de todo
ello, casi con seguridad, a través de reglas de correspondencia
específicas de cada facultad, ambos sistemas convergen en una
representación común de la forma, el modelo 3-d, que nos
permite identificar el mismo objeto tanto con la vista como con
el tacto.

Si, como se dice frecuentemente, el uso más importante de


la información derivada del sistema visual es ayudarnos a
encontrar el camino en el mundo. Desde un punto de vista
evolutivo este uso debe ser anterior a la conexión lingüística,
puesto que lo comparte el hombre con otros organismos no
lingüísticos. El alcance del modelo 3-d incluye no sólo objetos
individuales, sino la disposición espacial del entorno percibido.
Es inevitable pensar que el modelo 3-d puede ser utilizado como
nivel de aducto para la capacidad de acción física, en general. Este
nivel codifica lo que hay en el entorno para que el organismo
se aproxime o para que lo evite, según le convenga. Entre los
objetos del entorno figura, por supuesto, el propio cuerpo de
uno. Para calcular qué hacer con el propio cuerpo a fin de actuar
en el entorno, hay que tener información sobre la disposición
espacial y el movimiento de los propios miembros y un sentido
de la posición global en que se está con respecto a los otros
objetos del entorno. De este objeto particular, disponemos un
conjunto privilegiado de indicios sensoriales que no existen
para otros objetos del entorno. Los indicios de tacto y presión
de la piel aportan datos sobre la dirección y la magnitud de
las fuerzas que afectan al cuerpo (incluidas la gravedad y la
aceleración); los canales semicirculares de los oídos aportan
datos sobre la rotación de la cabeza en varias direcciones; los
sensores de los músculos y articulaciones aportan información
sobre la posición de los miembros. Además, se cuenta con
indicios visuales a partir de la observación de las partes visibles
del cuerpo. Se aplica aquí, lo que ya dijimos arriba: para que
haya datos de orígenes diversos que se afecten unos a otros, debe

43
haber un formato común al que se traduzcan todas las fuentes de
información. El nivel de integración apropiado para el sentido
de la posición parecería –según Jackendoff y sus seguidores-
que es el modelo 3-d, cuyos elementos primitivos de tamaño,
forma y posición relativa de las partes son adecuados para esa
función. Así, es posible entrever que hay una serie completa de
proyecciones que llevan desde las diversas fuentes sensoriales al
modelo 3-d del propio cuerpo, lo que constituiría una parte de
este nivel de representación especializada en cuanto al origen de
su información, pero sin peculiaridad alguna en su estructura
formal como tal.19

La hipótesis global que surge de estas consideraciones es que el


modelo 3-d es, junto con la estructura conceptual, uno de los
lenguajes de interfaz fundamentales de la mente computacional
en su conjunto. Es una representación apta para todas las tareas
que implican cognición espacial, y el lenguaje, el tacto, la acción,
y los sentidos del cuerpo pueden todos tanto alimentarla,
como hacer uso de ella. No es necesario que todos los aspectos
del modelo 3-d estén igualmente disponibles para todas las
capacidades con las que intercambia información. Por ejemplo,
la información de color se introduce en el modelo 3-d a través
del sistema visual, y es accesible para la estructura conceptual.
Sin embargo, no tiene ningún papel en los sistemas táctil o de
acción; sus reglas de correspondencia son completamente mudas
a la hora de traducir la información sobre el color. Lo mismo
sucede al revés, hay información espacial aportada por el tacto
(temperatura, peso, etc.) de la cual no la visión no dispone.
Algunos autores sugieren no usar -directamente- el modelo 3-d
de Marr para la cognición espacial general, reservando dicho
modelo tan sólo para la cognición visual e introduciendo un
tipo de representación amodal independiente para el espacio,
en general, alimentada por el modelo 3-d y por otras facultades
sensoriales.

19 Según Jackendoff, también el eco y el sonar de murciélagos y delfines serían


conducido hacia el modelo 3-d.

44
Adviértase, sin embargo, -sostiene Jackendoff- que esto no modificaría
en nada la hipótesis global de que hay un nivel de representación
espacial con una función central dentro de la cognición; sólo añadiría
una estación de paso más en el sistema visual. (op.cit. 10.2. [p.231])

David Marr diseñó el modelo 3-d para codificar la información


de la memoria a largo plazo que se tiene y utiliza tanto
para la identificación de objetos particulares o bien para su
categorización, como parte de una clase. Luego, ¿Cómo se
distingue la memoria a largo plazo para una entidad conocida de
la que corresponde a una clase conocida? La estructura formal
aún no la hemos distinguido -ambas serían modelos 3-d, de clase
y de espécimen, ¿dónde está la diferencia? Es habitual sostener
que los recuerdos de especímenes y los de tipos de especímenes
se distinguen por su vaguedad o genericidad, siendo las
entidades individuales mucho más densas y específicas. Idea que
se ajusta mejor a la lógica que a la actividad perceptiva producto
de la selección natural. Numerosos argumentos nos convencen
de es muy difícil establecer rasgos puramente geométricos del
modelo 3-d que nos sirvan para distinguir las representaciones
de individuos de las representaciones de tipos. Por lo tanto, lo
que hace falta para distinguir estas dos clases de representaciones
es de hecho una etiqueta o rasgo binario [ tipo / muestra ], tal
vez, localizado en la estructura conceptual, esto es, una forma de
representación algebraica. Sólo una estructura algebraica puede
proporcionar esta oposición bivalente.

Lo que afirma Jackendoff, es que la memoria visual no sólo


contendría representaciones 3-d, sino también pares de
representaciones: un modelo 3-d de cómo es la cosa y una
estructura conceptual que etiqueta la representación visual,
especificando si se toma ésta como representación de una
ocurrencia particular o de un tipo general. Las formas visuales
dadas por la percepción se ligan automática y causalmente
(indicialmente) al rasgo [ muestra ] en la estructura conceptual;
es decir, lo que uno ve directamente se compone de entidades
particulares. Por otra parte, lo que uno aprende y almacena en la
memoria puede enlazarse tanto con una [ muestra ] (si se está

45
recordando una entidad) como en un [ tipo ] (si ha aprendido
una categoría). Pensemos entonces la relación existente entre
la entidad que se percibe (un modelo) y la entidad o categoría
de entidades recordada (otro modelo). Los dos modelos 3-d,
el que sube (y que ha sido inferido a partir de un estímulo
proximal múltiple, cambiante, en acto) y el que baja (producto
de la experiencia pasada), deben yuxtaponerse y compararse,
y el resultado del proceso de correspondencia, de la prueba de
conformidad (Groupe mu) entre ambas debe quedar registrado.
Pero el resultado de la prueba de conformidad (“si, es una pera”)
no puede representarse visualmente; es básicamente de la forma
“correspondencia aceptable” vs “correspondencia fallida”. Puede,
no obstante, codificarse en estructura conceptual como relación
algebraica entre dos conceptos [ muestra ]: “Es un ejemplar
de la clase pera.” Según Jackendoff, la única diferencia entre
la identificación y la categorización reside, pues, en el nivel
conceptual. Anteriormente a dicha etiqueta binaria, tenemos
lo mismo cuando identificamos y cuando reconocemos: la
comparación de estructuras derivadas de la visión en acto y de la
memoria.

¿Qué sucede cuando vemos y hablamos no ya de objetos físicos


sino de acciones? Pregunta que se remonta por lo menos a los
empiristas británicos de los siglos xvii y xviii. La representación
visual de la acción de trotar, por ejemplo, requiere de una
entidad que avance saltando, con apoyo alterno, es decir,
un bípedo o un cuadrúpedo que pueda hacerlo. ¿Cuál es la
diferencia entre una representación de trotar y otra de un caballo,
o un humano? La distinción que se, requiere, aparentemente, no
está presente en la representación geométrica. Sin embargo, sí
estaría disponible en una estructura conceptual, donde rasgos
algebraicos distinguen categorías ontológicas tales como objetos,
lugares, trayectos, acciones, eventos, sonidos, modos, cantidades
y números. En este caso, vinculando el modelo 3-d móvil de
un bípedo o un cuadrúpedo en movimiento con un concepto
de [ tipo de acción ] y no con uno de [ tipo de objeto ], ya
podemos saber el hecho de que es el movimiento (o la forma

46
invariante de ese movimiento) de aquello que se mueve y no su
forma invariante lo que se toma por información significativa del
modelo 3-d.

Así como el sistema visual hace uso del nivel de la estructura


conceptual para codificar el recuerdo a largo plazo de
especímenes y tipos; el lenguaje hace uso del modelo 3-d
para codificar distinciones entre significados de palabra. Lo
que apuntala nuestra idea de que la estructura conceptual y
el modelo 3D actúan como compañeros en la representación
central.

En primer lugar, hay distinciones de significado entre palabras


que parecen expresarse de forma más natural en términos
de estructura espacial 3-d que en términos de estructura
conceptual. El más claro y comentado ejemplo es la distinción
entre patos, gansos y cisnes. En la estructura conceptual es
bastante natural hacer una taxonomía de estos tipos, de forma
que sean distintos uno de otro, pero formen juntos uno de los
tipos principales de aves acuáticas, subtipo a su vez de las aves.
Pero ¿cómo se expresan las diferencias entre estos tipos? A
todas luces, una de las diferencias más notables por la que una
entidad se clasifica normalmente en una de estas categorías
o en otra consiste en cómo son los patos, gansos y cisnes, sus
tamaños relativos y las proporciones y formas de sus partes
respectivas. La idea de que estas diferencias se representen
en la estructura conceptual a través de rasgos como [ cuello
alto ] es implausible, porque estos rasgos parecen bastante ad
hoc. Sin embargos, estas han sido las clases de rasgos a que los
semantistas descriptivos han tenido que recurrir, a falta de algo
mejor. No obstante, las descripciones de tamaño, proporciones
y aspecto de las partes, siendo nociones puramente geométricas,
se expresan en el modelo 3-d, el que debe contar con ellas para
llevar a cabo el reconocimiento del objeto. Esto indica que la
estructura conceptual puede despojarse de un gran número de
rasgos descriptivos ad hoc codificando esta información en el
formato del modelo 3-d, donde no es ad hoc en absoluto, sino
precisamente aquello para lo que este nivel de representación
47
está diseñado. Jackendoff sostiene que la representación de una
palabra en la memoria a largo plazo no tiene por qué ser sólo un
trío de estructura fonológica, sintáctica y conceptual, sino que
puede contener también una estructura de modelo 3-d parcial.
Una palabra que denota un objeto físico supone en parte saber
cómo es ese objeto. Esto sucede no sólo con los sustantivos,
verbos como caminar, correr, trotar y saltar, se diferencian unos
de otros de forma muy parecida a como lo hacen pato, ganso y
cisne. La tozuda idea de buscar un conjunto de rasgos algebraicos
binarios que los distingan es un disparate. En cambio, dado que
puede codificar acciones, el modelo 3-d puede proporcionar de
forma natural las distinciones pertinentes en el modo de moverse
y la velocidad en que lo hace.

Podemos reconocer un objeto como asiento inclusive cuando


éste tenga un aspecto que no se parezca a ningún otro asiento
de los que se haya tenido experiencia anteriormente. Nos
vemos obligados a concluir que un artefacto cualquiera puede
ser identificado como un miembro de una clase, no por algún
aspecto intrínseco de su envolvente tridimensional, sino porque
su configuración, sus dimensiones y otras propiedades visibles,
sean las que sean, se perciben como apropiadas para una
determinada función. Hablamos de definiciones funcionales, que
distinguen objetos que pueden usarse en determinada manera.
Por ejemplo, un componente importante del concepto de asiento
es que es algo para sentarse. ¿Cómo puede codificarse esto?
Sentarse es una acción natural, especificable mediante un [ tipo
de acción ] asociado a un modelo 3-d de cómo se representa
el sentarse. Asiento, por su parte, puede especificarse como
un elemento auxiliar de la acción: es la superficie sobre la cual
va a ponerse el sujeto que actúa. En cuanto a modelo 3-d su
apariencia puede especificarse muy ascéticamente dando sólo
su tamaño aproximado y la superficie horizontal crucial con la
que entra en contacto la figura. Es posible ver las posibilidades
inherentes al artefacto. Es una asiento porque tiene un tablero
a una altura del piso proporcional a las piernas promedio.
Es normal dar definiciones funcionales enlazando un objeto

48
particular de una descripción de acción 3-d con un [ tipo de
objeto ] de la estructura conceptual. El modelo tridimensional
codifica lo que se hace con el objeto, más lo suficiente de la
apariencia para mostrar cómo se hace.

Teniendo en cuenta los enlaces de los modelos 3-d con la


estructura conceptual, se podría complementar y dar una cierta
base empírica a los sistemas puramente algebraicos, a los que
se ha encomendado en gran medida a la semántica, y a la vez,
comenzar a comprender cómo el lenguaje toma contacto con el
mundo tal como se percibe.

Ya hemos avanzado en nuestro examen de los niveles de


representación visual. Antes de pasar a la cuestión del dibujo,
sería apropiado reunir los resultados de este examen y extraer
algunas conclusiones generales sobre la participación del aducto
visual y de sus productos en una mente computacional. Nos
ocuparemos tanto de la teoría de la estructura como de la teoría
del procesamiento, por ese orden. En particular, el punto de vista
sobre el procesamiento desarrollado aquí se asemeja bastante
al de Jerry Fodor en La modularidad de la mente (Fodor, 1983).
Los detalles del presente análisis permiten, sin embargo, diversos
perfeccionamientos y revisiones de la tesis de la modularidad de
Fodor; se mencionarán éstos hacia el final del capítulo.

Ray Jackendoff diseña el diagrama que mostramos con el fin


de integrar y resumir en un modelo simplificado los niveles de
representación de los diversos canales de la percepción en su
conjunto (Figura 2.I.). Cada uno de los niveles de cada una de las
secuencias se caracteriza por un conjunto de reglas de formación
que enumera sus primitivos y principios de combinación. Los
niveles están ligados por reglas de correspondencia o, como
hemos dicho, de formación de estructuras de representación, que
permiten la transformación de una forma de información a otra.
Estas reglas de correspondencia se simbolizan en el diagrama
mediante flechas; y la dirección de cada flecha significa la
dirección en que debe transformarse la información en el curso
del procesamiento.

49
Figura 2.I.

Comentemos ahora el diagrama de Jackendoff (1987, 12.1.


[p.287]), revisando principalmente lo que toca a la visión, eso si,
enmarcándolo en su relación a los demás procesadores. Tal como
sugiere el autor del diagrama, para hacerlo, hemos distinguir una
comprensión amplia de lo que se entiende por facultad de una
comprensión más restringida. En un sentido amplio, decimos
que una facultad comprende todos los niveles de representación
y todas las reglas de correspondencia que pueden invocarse
mientras se está produciendo el procesamiento de la información
por obra de esa facultad. La misma facultad comprendida de
una manera restringida incluye solamente aquellos niveles
de representación y aquellas reglas de correspondencia que
pertenecen a ella exclusivamente.

En el diagrama se observa la facultad del lenguaje, que


interpretada en un sentido amplio, establece relaciones con el

50
aducto visual. De tal modo que comprende el aducto auditivo,
el educto motor vocal, la estructura fonológica, la estructura
sintáctica, la estructura conceptual (lingüística) y, ampliamente
y como hemos establecido arriba, el nivel del modelo 3-d, que
comparte con la visión. Forman parte de esta facultad, también
las reglas de transformación que se proyectan entre estos niveles.
En ambos extremos de esta cadena los niveles se comparten, no
sólo con la visión, en el extremo central o del procesamiento
superior, donde representaciones tales como la estructura
conceptual y el modelo 3-d son accesibles desde muchas
modalidades, no perteneciendo exclusivamente al lenguaje o a la
visión. En el extremo periférico, obsérvese, que, tanto el educto
motor como el aducto auditivo están compartidos también con
otras facultades.20 Localicemos además, también en el diagrama,
el nivel de representación del cuerpo, que participa en la
percepción de la posición del propio cuerpo en el espacio y en la
formación de patrones de acción.21

Repasemos ahora una presentación amplia de la facultad visual,


que comprende, como sabemos, el aducto retiniano, el esbozo
primitivo en 2-d, el modelo 2½-d, el modelo 3-d y, como hemos
especulado recientemente, también la estructura conceptual.
Incluye además, las reglas de correspondencia que se proyectan
entre estos niveles. El modelo 3-d y la estructura conceptual
son compartidas con el lenguaje y con las facultades del tacto
y la acción. Todo esto significa que estos niveles centrales
de representación, el modelo 3-d y la estructura conceptual,
están sujetos a diversos principios de proyección de intranivel.
En la estructura conceptual son las reglas de inferencia
(proposicionales, del razonamiento a través del juicio), que
20 Comparte la facultad musical, así como el reconocimiento de la voz y
la audición de fines generales. El educto motor, que va al tracto vocal, también es
alimentado por representaciones de acción de fines más generales que controlan las
acciones de soplar, respirar, tragar, etc. Una comprensión restringida de la facultad del
lenguaje incluye poco más que las estructuras fonológica y sintáctica.
21 Incluye, como es de imaginar para el caso del lenguaje de signos manuales
para sordomudos, una regla de correspondencia que enlaza la estructura conceptual
y la estructura fonológica (línea de puntos), eludiendo la sintaxis, ya que sería la
categorización del aducto visual y no la del auditivo la que alimenta la computación de la
estructura fonológica.

51
permiten la creación de estructuras conceptuales nuevas sobre
la base de las que las anteceden. En el modelo 3-d, los principios
con función paralela incluirían –puede pensarse- las reglas de
transformación espacial tales como las rotaciones, los zooms y
los cambios de perspectiva descritos en la bibliografía sobre las
imágenes mentales. Como sostienen Roger Shepard, Stephen
Kosslyn y otros, también tales transformaciones participan en
la creación de anticipaciones de cambios en las configuraciones
espaciales de los objetos externos o del mismo organismo que
observa.

52
3
Dibujos

3.1. Lo que aparece y lo que es, en el dibujo

A
partir del siglo xv existen –en el marco de la cultura
europea- dibujantes que hacen su trabajo de una manera
que corresponde, más o menos, a lo que hoy entendemos
–y acabamos de decir- es el dibujo del natural. Algunos de ellos,
como Leonardo da Vinci o Albrecht Dürer, que pertenecen a
las primeras generaciones de dibujantes modernos, se ayudaron
de una máquina de dibujar (Figura 3.A.) tal como la imagina
Leonardo da Vinci, en su Trattato della pittura de 1680, al
mencionar y formular el problema de los contornos, los que
aparecen como “…una superficie que no es, ni parte del cuerpo, ni
parte del aire, sino un medio interpuesto entre el aire y el cuerpo.”
Siguiendo este principio pinta el sfumato de tal manera que
dificulta en extremo la localización objetiva del borde de los
objetos representados en la superficie de la pintura. No obstante,
el problema de determinar de qué están hechos –y dónde están-
los contornos que vemos, dibujamos y pintamos persistía. En
ese mismo libro, diseña la máquina y prescribe un método para
resolver mecánicamente (siguiendo el principio de la cuadrícula
de Alberti) la copia de la naturaleza destinada a ser pintada.

Leonardo recomendaba tomar un cristal grande y colocarlo


entre los ojos y el objeto, para alejarse luego, dos tercios de brazo,
inmovilizar la cabeza, cerrar un ojo y dibujar con un pincel
sobre el vidrio. Dice claramente: “…dibuja el árbol sobre el cristal,
siguiendo el contorno que tienes delante de los ojos.” (s.clxiv)

53
Figura 3.A.

Es cierto que, luego, el maestro Da Vinci aconsejará cómo


colorear la pintura, pero llegando apenas hasta el dibujo trazado
a pincel, éste ya representa el árbol, sin color, ni sombras,
incluso sin que las configuraciones poligonales encerradas
por los contornos estén “llenas”. En este sentido, se dice
normalmente que en el dibujo de contorno, es claro que no hay
correspondencia, punto por punto, entre el modelo y su imagen.
Sin embargo, como sostiene Francois Molnar (1976), en un
artículo sobre este tema que ha sido particularmente influyente
en la comunidad artística,22 los contornos por sí solos contienen
gran parte de la información de una escena vista, los niños de
dieciocho meses son ya capaces de reconocer un objeto familiar
dibujado en contorno. Así pues, ¿qué es el contorno que, como
dice Leonardo, no pertenece ni al cuerpo ni al aire? Alberti, unas
décadas antes que Leonardo, había destacado la importancia
de éstos, pues dibujar, es –antes que nada- trazar contornos.
Con todo, observa Alberti, como parte de una discusión que
pone de manifiesto su importancia sosteniéndose varios siglos,
el contorno no ha de ser demasiado visible, porque en tal caso
ya no representaría los bordes de las superficies visibles, sino
más bien pequeñas fisuras o áreas. Otras escuelas participan de
esta discusión negando la potencialidad pictórica del contorno,
llegando incluso a poner en duda su existencia física en la
naturaleza. Podemos decir que el contorno es una línea. Pero,

22 Francois Molnar fue un artista especializado en neurofisiología de la visión y


la imagen, miembro del Groupe de Recherche d’Art Visuel.

54
¿existen líneas físicas en la naturaleza de los objetos distales que
observamos? Con seguridad, no. Superando esta larga discusión
relativa a la existencia física del contorno, hemos dicho que esas
líneas existen en el procesamiento visual humano, como pasos de
cero.23 Y no meramente como idea abstracta o hábito cultural,
sino como realidad percibida.

Lo cierto es que estas máquinas –que permiten disponer con


precisión los contornos- fueron de uso corriente entre los artistas
y dibujantes hacia el siglo xvii. 24 Durante el siglo xviii, las
máquinas de dibujar se perfeccionaron al concentrarse la luz de
la escena en una cámara oscura mediante una lente, y, en el siglo
xix, se encontró el vehículo químico para congelar esa luz en
película, culminando la evolución cuasi natural de la máquina de
dibujar en la fotografía. Las imágenes que capturan las máquinas
de dibujar o las cámaras fotográficas son indicios obligatorios de
la perspectiva natural. En función de no pocas razones, relativas
a lo que acabamos de decir, a lo largo de varios siglos, a lo largo
de la modernidad, la perspectiva se consideró garantía tanto de
semejanza (verosimilitud) como de veracidad. Una perspectiva
dibujada con ajuste máximo a una máquina que proporcione un
visión monocular estática ideal, exhibida en la posición adecuada
debería aparecérsele a un observador como la misma escena o
como los mismos objetos dispuestos en el lugar e iluminados
donde y como aparecen representados. Para producir este efecto,
es necesario que los haces de luz procedentes de las distintas
partes de la imagen incidan en el ojo del espectador con la
misma estructura estimular (estímulo proximal) correspondiente
a los objetos reales vistos en el lugar adecuado. Dicho de otro
modo, que la estructura luminosa que articula información
procedente de las distintas partes de la imagen incida en el ojo

23 Los pasos de cero resultan de la doble derivación (o diferenciación) de las


funciones de luminosidad de las escenas vistas. Cálculo que, según se ha investigado,
realizan las retinas y el neocórtex, como resultado matemático del fenómeno fisiológico
denominado inhibición lateral (cfr. Marr, 1982 y Groupe mu, 1992, iv.5.2.1., [p.147]).
La primera derivada representa con “picos” las aceleraciones y desaceleraciones de la
función originaria. La segunda derivada representa con cruces de cero los picos.
24 Dürer describió e ilustró varias clases de máquina de dibujar, y da Vinci
realizó en uno de sus códices un dibujo de un hombre que utiliza una.

55
en las mismas condiciones de dirección, intensidad y color que
los rayos que proceden de las partes correspondientes del real
visible.

Si creemos sin reservas lo que acabamos de decir, aceptamos


entonces la base óptica de la perspectiva como garantía de
veracidad, tal como sugiere la moderna costumbre. Todo lo que
se necesitaría para producir una imagen veraz es un maestro
del dibujo del natural, una máquina de dibujar o, más fácil
aún, una cámara. A pesar de ello, los dibujos del natural en
un grado máximo de perfección (mimética monocular) o las
fotografías nos proporcionan tan sólo un tipo de verdad: la
verosimilitud de las apariencias. Pero también –como sugerimos
arriba- es posible asociar las imágenes a otro tipo de verdad,
tal vez no tan importante para los artistas, pero indispensables
para los ingenieros, los torneros, los arquitectos, etc. Se trata
de una verdad acerca de las formas de los objetos tal como
son realmente, independientemente del punto de vista y las
circunstancias variables de observación. Esta es la verdad que
–si bien errónea, fantasiosa y perezosamente- perseguían los
post-impresionistas (como Paul Cézanne) y los cubistas (como
Georges Braque). Las imágenes verdaderas en este último
sentido se aproximan estructural y funcionalmente a la clase
de descripción de un objeto a la que llegamos en nuestra mente
después de que el sistema visual ha procesado e integrado las
sensaciones inmediatas y transitorias que constituyen es estímulo
proximal retiniano. Como ya hemos visto a lo largo de este
libro, David Marr, investigó este output o producto final o meta
del proceso visual, lo llamó el modelo 3-d, considerándolo,
inclusive, un tipo de representación canónica, es decir, que
avanza en el proceso de categorización del mundo (abstracción),
adelantándose a la propia categorización lingüística. El intento
de representar esta clase de imágenes canónicas más reales que
la verdad aparente de la proyección monocular, junto a otros
factores de orden socio-histórico, impulsó a ciertas corrientes de
artistas comprometidos -o algo así- con la realidad, a abandonar
(las apariencias de la) la perspectiva.

56
En la práctica, estas distintas clases de verdad, se verifican
tanto en las representaciones mentales como en las imágenes
que producimos fuera de nuestro cuerpo, mediante distintas
clases de estructura formal. Las dos principales, según lo ha
propuesto John Willats (1997), son el ya mencionado sistema
de dibujo, que, como la perspectiva o la proyección ortogonal,
da cuenta -decimos- de la relación espacial entre objetos, y el
sistema de denotación, que indica cómo se relacionan entre sí
las distintas marcas que hay en la superficie plana de la imagen,
y como se relacionan luego con ciertos objetos del mundo real,
en una designación previa e independiente de la interpretación
conceptual, en la que predominan los procesos abajo-arriba. A
continuación, aclaremos por qué hablamos de “superficie plana
de la imagen” y pasemos luego a describir estos dos sistemas que,
aún relacionados con la visión, y más aún, siendo esa relación la
que ahora queremos enfocar, no son perceptivos sino semióticos.
No tienen tanto que ver con la información que llega sino más
con la información que sale de los seres humanos en cuanto
sistemas de acción.

3.2. Realidad plana de la imagen

Acabamos de decir que imágenes planas tales como algunos


dibujos, o las fotografías, permiten reconocer en ellas la
disposición espacial de una estructura estimulante, semejante
a la que nos haría percibir una escena real profunda. Dicho de
otro modo, percibimos simultáneamente esta imagen como un
fragmento de superficie plana y como un fragmento de espacio
cuasi-tridimensional. Como un plano real manchado de color y,
a la vez, como una escena virtual en un mundo posible. Como
una distribución x, y de marcas visibles, las que, a la medida en
que se ajustan en su estructura estimular, al estímulo proximal
que proviene de determinada escena real, van viéndose cada
vez menos como asunto de superficie y cada vez más como

57
contenido de profundidad. Este fenómeno, de orden semiótico y
psicológico, es a lo que suele llamarse doble realidad perceptiva de
las imágenes (Aumont, 1990, iii.2.1. [pp.65 y ss.]).

Estas dos realidades de las imágenes no son de la misma


naturaleza en absoluto, porque que la imagen en cuanto
porción de superficie plana es un objeto real que puede tocarse,
desplazarse y verse en situaciones que modifican, aumentando
y transparentando, su presencia en cuanto objeto. Mientras que
la imagen como porción del mundo cuasi-tridimensional existe
finalmente por obra del sistema de procesamiento visual que
restituye esa profundidad. Es de máxima importancia –indica
Jacques Aumont- no olvidar nunca el calificativo “perceptiva”
aplicado a la doble realidad de las imágenes, “…sin lo cual
esta expresión apenas tiene ya sentido.” (sic. ibid.) Digamos
a continuación, algo de la información asociada a estas dos
realidades.

Información sobre la realidad 2-d de las imágenes. Para un ojo


ideal, solitario y fijo, hay tres fuentes potenciales de información
sobre el plano mismo de la imagen: el marco y el soporte de
esta imagen; la superficie informada de la imagen misma; y los
defectos de la representación analógica, o sea, la imprecisión o
el desfasaje entre imagen artificial y estímulo proximal real (al
que sustituiría). Estos últimos diferencian y hacen visible -como
objeto concreto- a la superficie de la imagen. Porque nuestra
visión es binocular y móvil, la información a la que accedemos
sobre lo plano de la imagen, normalmente es tan abundante que
es imposible ser completamente engañado. Ya sea porque los
movimientos oculares revelan en el interior de la imagen una
ausencia total de cambios perspectivos; o bien, porque no hay
disparidad registrable entre las dos imágenes retinianas. Por todo
esto, las imágenes aparecen necesaria e inevitablemente planas.

Información sobre la realidad 2½-d de las imágenes.


Contrariamente a la información bidimensional, siempre
presente por defecto, las imágenes sólo permiten percibir
una realidad cuasi-tridimensional virtual si ésta –es decir, su

58
distribución x, y- ha sido cuidadosa y exitosamente construida.
Para lograr esto es obligatorio imitar lo mejor posible las
características de la visión natural que venimos revisando a lo
largo de este libro, y que los maestros e inventores de la imagen
vienen consiguiendo –en la práctica- en los últimos siglos. Para
lograr esto la superficie dibujada y pintada, o grabada, debe
reproducir en la retina, inclusive en el tiempo en que ésta salta
de un lado a otro escrutando los puntos de máximo interés de la
proyección de la escena, unas discontinuidades de luminancia y
de color iguales o comparables a las que produce una escena real,
no pintada ni fotografiada.

3.3. Sistemas de dibujo

Las imágenes pueden basarse en una serie de sistemas de dibujo


distintos o en una combinación de sistemas. A continuación,
mencionaremos unos ejemplos escogidos sin demasiada
rigurosidad historiográfica entre varios períodos y culturas.
La selección tiene la única finalidad de ilustrar algunos de los
sistemas disponibles.

Figura 3.B.

59
La imagen muestra cuatro vistas del Mercury Comet, dibujadas
por Charlie Allen, correspondientes –centralmente- a lo que
se entiende por perspectiva (Figura 3.B.). Los conjuntos de
líneas de profundidad perpendiculares que intersectan el
cuadro y son paralelas entre sí, convergen en un único punto, el
punto de mira, situado en la línea del horizonte (Figura 3.C.).
Las imágenes de esta clase producen una impresión óptica
monocular veraz del grado de inclinación de estas aristas y de
la proyección de su longitud tal como se aparecen dentro del
campo visual.

Figura 3.C.

Se ha discutido largamente respecto de la perspectiva, si es un


invento cultural o si corresponde al descubrimiento de una
función natural, si es sólo uno de tantos sistemas (culturales
posibles) o si –efectivamente- es el único o es uno de los mejores
en proporcionar una representación verdadera del mundo. No es
lugar éste el lugar para desviarnos e internarnos en la encendida
controversia desarrollada -antes y después de Erwin Panofsky
(1928)- sobre la naturaleza simbólica, convencional o ideológica
de la perspectiva lineal. Tampoco cabe tratar aquí la convivencia

60
de esa perspectiva respecto de otras formas de representación en
perspectiva practicadas en el pasado o bien referirnos a la mayor
o menor naturalidad (o sea, realismo bruto) de la perspectiva.
Sin embargo corresponde aquí admitir que esa controversia –
formulada en los términos en que fue planteada- ya cumplió su
tiempo. Los argumentos utilizados en esta suerte de disputa no
pueden ayudarnos hoy a encontrar respuestas convincentes a
las preguntas otrora formuladas. “Entre las temáticas discutidas
entonces, -sostiene Tomás Maldonado (1992)- la del realismo es
quizá la menos actual.” En el desarrollo de nuestro enfoque nos
ha cabido estar del todo de acuerdo con Tomás Maldonado –
uno de los principales animadores del debate durante los años
setenta- en que hoy ya no es objeto de discusión establecer si
el espacio pictórico construido con ayuda de la perspectiva
lineal corresponde o no al espacio real. En la actualidad nadie
se atrevería a sostener una tesis de este tipo. Ahora mantenemos
un cierto acuerdo respecto de que la perspectiva lineal, lo
mismo que cualquier otro dispositivo apto para reproducir
ilusoriamente el espacio en un plano, tiene una naturaleza en
buena medida convencional (pero no arbitraria). No obstante,
esto no impide que la representación en perspectiva haya sido
“un paso revolucionario (por decir poco) en la historia de las
técnicas tendientes a suministrar una representación cada vez
más verosímil de la realidad.” (ibíd.) Hemos de admitir que hay
malentendidos de fondo sobre la naturaleza de la “codificación
cultural de la perspectiva”. Es inaceptable –tal como pretendemos
sostenerlo en este libro- atribuir a esa codificación convencional
un valor absoluto. El problema de la correspondencia entre el
sistema de dibujo en perspectiva y la realidad no es una cuestión
que deba resolverse en el plano geométrico, sino que debe
hacérselo en el plano práctico y operativo. No importa saber
si –efectiva y naturalmente- hay una correspondencia biunívoca
total entre una representación en perspectiva y la realidad que
ella representa. Más razonable y menos ambicioso es tratar
de establecer –ceteris paribus- si la imagen en perspectiva
funciona (o no) como representación plausible, no de una
realidad genérica, sino antes bien de nuestras representaciones

61
perceptivas (2-D ó 2½-D) de la realidad. En otras palabras: si
esa imagen es o no utilizable –con éxito- en nuestra relación
operativa con el mundo. Hablamos del valor cognoscitivo de una
cierta clase de representaciones ilusorias de la realidad.

Figura 3.D.

La imagen de la Figura 3.D. es una representación técnica,


en proyección oblicua isométrica de un módulo de vivienda
industrializada imaginado y proyectado por Norman Foster,
Lord of Thames, hacia fines de los años setenta (Figura 3.D.).
En este sistema, las ortogonales son paralelas –en el plano
de la imagen- en lugar de convergentes, como sucede en la
perspectiva. Las imágenes dibujadas con este sistema, aún
siendo menos verosímiles o menos ajustada su apariencia a la
visión monocular, tienen sobre las perspectivas la ventaja de
que pueden prolongarse en cualquier dirección sin distorsiones,
mientras que las imágenes en perspectiva sólo pueden mostrar
un campo visual limitado. Para mejor, en las proyecciones

62
oblicuas las aristas de profundidad, así como las aristas en las
otras dos direcciones (frontales) representan longitudes reales.

Figura 3.E.

La Figura 3.E. muestra dos ilustraciones en proyección ortogonal


que presentan, cada una de ellas, sólo una cara del objeto,
siempre con su forma real; proyectada para un punto de mira
situado infinitamente lejos, desde donde se ve el objeto en un
ángulo determinado por la misma geometría del objeto. En
estos casos el objeto es atravesado por la visual principal en su
eje (real de la rueda) y en su diámetro (real de la rueda). A veces
esta forma real se corresponde con una vista hipotética, no de
un artefacto existente pero sí de uno que podría existir. Como en
el dibujo de Richard Rogers, Baron of Riverside, de su proyecto
para la estación del Metro en el aeropuerto de Capodichino
(Napoli).

Se trata de un corte del edificio imaginado, y, en este caso, la idea


de vista superficial carece de importancia, ya que la intención del
arquitecto no es ofrecer una vista de cómo quedaría el edificio
sin fachada, sino mostrar la configuración de las distintas
estancias y sus partes y sus conexiones (Figura 3.F.).

63
Figura 3.F.

Ninguna imagen sobre una superficie bidimensional puede


mostrarnos toda la verdad sobre un objeto tridimensional. En
lugar de eso, las imágenes en perspectiva son útiles para mostrar
la apariencia de los objetos desde un punto de vista en concreto,
mientras que las imágenes en estos otros sistemas denominados
proyecciones (cilíndricas o paralelas) representan las longitudes
reales de las aristas y en algunos casos las configuraciones reales
de algunas de sus superficies. Tomando como base la teoría
de David Marr, insistamos en lo que sugerimos arriba (supra.
2.2.): que las imágenes en perspectiva intentan proporcionar
una descripción del mundo centrada en el observador (2-D),
mientras que las imágenes en los demás sistemas tienen como
proyecto proporcionar descripciones centradas en los objetos (3-
D), no para saber o apreciar como lucen éstos, sino para saber
cómo son sus dimensiones y proporciones en sí mismas. Las
primeras, recuperan (registran) o -inclusive- anticipan (como
va a verse o cómo se vería) la experiencia espacial a través de la
visión. Las segundas, describen lo necesario para manipular o
construir. Tomás Maldonado seleccionó como ejemplo de lo que

64
estamos diciendo acerca de los sistemas de dibujo, un conjunto
de imágenes que ilustraban las diversas posiciones en el trazado
de una curva o función en la que se relacionaban –con cierto
grado de inversión- la aptitud de una secuencia de distintos
sistemas de dibujo para comprender la experiencia espacial
visual, con la aptitud para representar con utilidad las medidas
reales (Maldonado, 1974) (Figuras 3.G. y 3.H.). La secuencia
estaba ordenada según el sistema de dibujo proporcione una
descripción del mundo centrada en el propio objeto (más
fragmentaria y simétrica) o en el observador (más integral y
orgánica): proyección ortogonal; proyección oblicua caballera;
proyección oblicua isométrica; proyección oblicua dimétrica;
proyección oblicua trimétrica; perspectiva cónica.

Figura 3.G.

65
Figura 3.H.

3.4. Sistemas de denotación

Según John Willats, las imágenes también pueden describirse de


otro modo, según la relación variable existente entre las distintas
marcas que hay en la superficie de la imagen y los elementos del
mundo real que estas marcas denotan. Particularmente, entre
las marcas superficiales de la imagen (puntos, líneas, cambios
de reflectancia, posiciones y orientaciones relativas, etc.) y los
elementos atómicos (más que moleculares) del mundo real, es
decir, aquellos que pueden ser comprendidos a través de las
representaciones provistas por el módulo visual, mejor que en
las descripciones lingüísticas (como las interpretaciones de las
uniones en forma de L, Y, etc.). Las cuatro o cinco imágenes
anteriores están basada en un sistema en el que las líneas
representan cantos; cantos como los de cilindros y paralelepípe-
dos, que poseen una existencia independiente del punto de mira
particular, o de las condiciones lumínicas circunstanciales.

Frente al caso de esta fotografía de David Hubel y Torsten


Wiesel en su laboratorio (Figura 3.I.), también nos sentiríamos
inclinados a decir que la imagen muestra los bordes y los cantos
innumerables objetos que aparecen en la escena.

66
Figura 3.I.

Pero, si vemos la imagen con lupa, apreciamos que estos rasgos


sólo están representados indirectamente. Lo que representan
las marcas existentes en imágenes de este tipo es la distribución
de luces al incidir en la superficie sensible del dispositivo
fotográfico. Las marcas (puntos pequeños del proceso analógico
o digital, no interesa) denotan los puntos de llegada o de impacto
de finos haces de luz tal como los capta la cámara, o tal como
los captaría la retina del observador en su lugar. Los cantos y los
bordes (tangentes a las visuales) no aparecen representados en sí
mismos como tales (como sucedería en el esbozo 2-d interno), el
sistema visual tiene que interpretar las variaciones de intensidad
lumínica que presenta la imagen para extraer de ella elementos
como esos bordes específicos en su geometría, del mismo modo
que cuando interpreta la disposición de la luz de una escena real
luego de impresionar la retina.

Frente al caso de esta imagen de un A340 (Figura 3.J.), otra vez


nos sentiríamos inclinados a decir que la imagen muestra los
bordes de los planos aerodinámicos del aeroplano, inclusive el
borde visible, tangente a la curvatura de su fuselaje.

67
Figura 3.J.

Pero, si también vemos esta imagen con lupa, apreciamos que


estos rasgos están representados aún más indirectamente. Lo
que representan las marcas existentes en imágenes de este tipo
la distribución de tintas en un dibujo anterior, originalmente
trazado con líneas de diverso espesor y llenadas sus áreas
poligonales con diversos grises. Aquí, las marcas (puntos
pequeños) denotan las líneas que denotan –a su vez- los bordes
tal como los habría representado el esbozo 2-d del dibujante
y del espectador en su lugar. Los cantos y bordes aparecen
representados como alineamientos de puntos impresos que
van cambiando con cierta continuidad de diámetro. El cerebro
tiene que interpretar las variaciones de intensidad lumínica
remitida por la superficie de la imagen (debido a las diferencias
de tinta o luz) para extraer de ella límites que representan
bordes y cantos, del mismo modo en que son representados
por la visión inicial, si esta disposición de la luz de la escena
real, en un mundo posible, impresionara la retina.El módulo
visual humano es suficientemente eficiente a la hora de inferir
(inconscientemente y al margen de todo juicio) elementos tales
como los contornos, a partir de las variaciones de intensidad
de la luz que impresiona la retina. Si para algo sirven estos
últimos ejemplos, es para advertir que los contornos no se
detectan simple y solamente con captar los cambios más
bruscos de la intensidad de la luz reflejada por las superficies.

68
Figura 3.K.

La imagen que muestra un camión mezclador de cemento junto


a un grupo de operarios participando en la colada de hormigón
(Figura 3.K.), no ha sido resuelta meramente marcando los
lugares en donde –por cualquier razón- se producen cambios
bruscos de la intensidad de la luz. Con ese método, como lo
vimos a la hora de presentar las hipótesis sobre la formación del
modelo 2½-d, se registrarían algunos contornos, pero la mayor
parte de las líneas marcaría los contornos de zonas de sombra
o de mayor iluminación, y es evidente que el resultado no sería
un dibujo comparable al que vemos. En este dibujo, las líneas
denotan formas delgadas de manera monolineal (la estructura
del retrovisor y el mástil de la banderilla), cantos (los de las
partes de la carrocería, los de la geometría de las hendiduras
de las cubiertas de goma), contornos o bordes tangentes a las
superficies curvas (los de las mangueras, del tambor mezclador,
los cuerpos, el casco de seguridad, los guijarros de la pasta, etc.).
En este caso no denotan, pero podrían hacerlo, los cambios
de reflectancia o de iluminación en una misma superficie.

69
Dicho de otro modo, estas líneas no representan los límites
de las zonas sombreadas (propias o de la sombra arrojada),
ni zonas graduadas de tonalidad o de luz remitida, aunque
sin lugar a dudas, si este fue un dibujo realizado del natural,
estaban presentes en el campo visual del dibujante. O estaban
presentes en la fotografía, si el dibujo la toma -empíricamente-
como base. La destreza y el mérito del dibujante procede del
ejercicio de una capacidad de selección bien fundamentada. Del
ejercicio de ser capaz de ver, imaginar, o prefigurar, elementos
de las representaciones mentales más tempranas, antes de que
la representación de las superficies en 2½-d ocupe o sature,
obligadamente, nuestra consciencia del espacio que nos rodea.
Por algún motivo, más vinculado al arte oculto de la imaginería
mental que a la cultura, los seres humanos están predispuestos a
aceptar algunos sistemas de denotación, y no otros, como base
de dibujos convincentes o realistas, aunque la relación entre
las marcas y la intensidad de la luz real de la escena no sea una
transducción directa. Otros, mas allá de la cuestión cultural,
no los aceptamos ni los aceptaríamos, al menos a la larga, bajo
una selección –finalmente natural- basada en su rendimiento
adaptativo.

Hemos comparado dos sistemas de denotación, uno en el que


las marcas representan mecánica y exhaustivamente las distintas
intensidades x, y del panorama visual y otro en el que las marcas
representan selectivamente elementos permanentes de la escena,
entre ellos, aristas reales y relevantes. De un modo equivalente a
lo que indicamos para los sistemas de dibujo, también podemos
distinguir los sistemas de denotación por el hecho de que
proporcionen una descripción transitoria y más circunstancial,
centrada en la sensación del espectador; o una descripción más
permanente centrada en las propiedades objeto.

Algunos dirán, sobre todo entre aquellos que gustan de


encontrar semejanzas y correlaciones, que muy a menudo
encontraremos unidos ciertos tipos de sistemas de dibujo y
ciertos tipos de sistemas de denotación. Esto efectivamente
sucede, por ejemplo, con la foto y el dibujo técnico, cada uno
70
por su lado. En la foto, el sistema de dibujo, que es la perspectiva
piramidal, está ópticamente centrado en el espectador, y a su
vez, las marcas, que representan la intensidad de la luz tal como
la superficie sensible, también constituyen una descripción
centrada en el observador. En el dibujo técnico, por el contrario,
los sistemas de dibujo forman parte de descripciones centradas
en el objeto, y también las marcas. Quienes se apegan a esto
se preguntan: ¿Para qué distinguir entonces entre sistemas de
dibujo y de denotación? Si lo que interesa al final, es establecer
si los distintos tipos o especímenes de imágenes proporcionan
visiones del mundo más o menos centradas ya en el espectador
o bien, en el objeto. Formulación que tiene implicaciones
semióticas y psicológicas de cierta importancia.

Según intentamos explicar el proceso de la información visual,


las descripciones centradas en el observador que dispone la
retina sufren una serie de transformaciones, a lo largo de una
serie de etapas distintas, hasta producir descripciones centradas
en el objeto que les sirven a los sujetos para entender con cierto
éxito las formas permanentes de los objetos y escenas, de manera
que puedan reconocerlos si los ven en otra circunstancia,
desde otro punto de mira o bajo una iluminación diferente. Las
características de diseño computacional de estas fases o etapas,
según lo consideró inclusive el propio Marr, son ciertamente
equivalentes a las que encontramos en los diversos sistemas de
dibujo y de denotación que constituyen la base de las imágenes.
¿No podría ser esta la clave de una nueva clase de teoría
«natural» de la imagen? Esta es la tesis formulada por John
Willats en su gran obra Art and Representation (1997), libro que
constituye el más justo sucedáneo del célebre y poderoso Art and
Illusion (1960) de Ernst Gombrich.

Las fotografías y las pinturas hiperrealistas (que representan,


por ejemplo la falta de enfoque producida por una limitada
profundidad de campo)25 equivaldrían, pues, a la información

25 Y en esto se diferencian estos pintores de otros realistas (a secas), tempra-


no-modernos como Holbein el Joven o Michelangelo Merisi da Caravaggio, o del siglo
veinte, como Philip Pearlstein o René Magritte.

71
que transduce la retina del mismo panorama visual. Los dibujos
lineales, del natural, serían equivalentes a la información
disponible etapas más avanzadas del proceso visual, tal vez
un esbozo primario completo o un modelo 2½-d. El dibujo
técnico o el dibujo de memoria se corresponderían, en materia
del tipo de datos que contienen, a una representación 3-d. “Así
tendríamos una teoría de la imagen simple y económica: los
distintos tipos de imagen equivalen, básicamente, a las distintas
etapas del proceso visual.” (Willats, 1990)

A pesar de esto que acabamos de decir, conviene mantener


en vigencia la posibilidad de analizar sistemas de dibujo y de
denotación por separado. Tenemos también abundantes casos en
los que sistemas de dibujo y denotación no están tan claramente
correlacionados. Willats menciona al respecto un dibujo
preparatorio de Canaletto, en el sistema de dibujo está centrado
con gran maestría en el observador, pero cuyas las marcas
(monolíneas selectivas) representan contornos que forman parte
de una descripción centrada en el objeto.

Un conocimiento articulado y múltiple del procesamiento


visual nos ha permitido pensar las imágenes en relación con
dos sistemas formales diferentes: los sistemas de dibujo, que
dicen dónde van o cómo se distribuyen en el plano las marcas
de la imagen, y los sistemas de denotación, que dicen lo que
representan las marcas de la imagen, sobre todo, a nivel local,
en una geometría –como la de los cuellos del ganso y el cisne
(de John Macnamara)- en la que es poco económico describirlas
de manera algebraica o verbal. A la vez, también aprendimos
que ambos sistemas pueden contribuir a dar una descripción
del mundo centrada en el observador o centrada en el objeto.
Sistemas de dibujo como, por ejemplo, la perspectiva muestran
la disposición de los contornos u otros elementos tal como
aparecen en nuestro campo visual (centrados en el observador),
mientras que algunos sistemas de dibujo describen la dirección
de los bordes o cantos en el espacio real, independientemente
de cualquier punto de vista particular concreto (centrados en
el objeto). Entre los sistemas de denotación, algunas opciones,
72
como las pinturas de Johannes Vermeer o Camille Corot,
muestran el mapa de los rayos de luz tal como nos llegan a
los ojos (centrados en el espectador); otras opciones, como
las que emplean los dibujantes técnicos, usan líneas para
representar rasgos objetivos, como cantos y esquinas (centrados
en el objeto). Pocas imágenes ofrecen representaciones del
mundo puramente centradas en el espectador o en el objeto.
La mayor parte de las imágenes se encuentran parcialmente en
una posición o en otra. Las hay en las que, la posición de los
marcadores superficiales viene determinada por un sistema de
dibujo centrado en el espectador como la perspectiva, mientras
que las marcas, en sí mismas denotan rasgos objetivos reales.
Por el contrario, habría otras imágenes en las que el sistema
de dibujo describe la situación de los elementos según algún
marco de referencia objetivo, mientras que las marcas describen
efectos transitorios como reflejos de luz y sombras. Por lo tanto,
estamos ahora en condiciones, y no antes, de saber que algunas
imágenes no son completamente naturales o icónicas (en el
sentido de una de las más agudas discusiones, ya histórica,
al interior del campo semiótico), ya sea en el sentido más
elemental y fuerte de reproducir mecánicamente los contornos
de la luz que incide en la retina, o en el sentido más complejo,
más atenuado y menos revisado (por los especialistas en la
imagen) de derivar información más o menos directamente de
alguna representación interna que forma parte de la secuencia
del sistema visual. Tales imágenes tampoco serían, como se
acostumbra a decir, puramente convencionales, ya que o bien el
sistema de dibujo o bien el de denotación ha sido condicionado
por las reglas de la óptica o del cómputo visual.

Figura 3.L.

73
No tendríamos, en función de lo dicho, una sola clase de verdad
en las imágenes. Muestran aspectos distintos del mundo según el
sistema que las informe. A lo largo de la historia, los productores
de imágenes, en las bellas artes, en la ciencia o en la ingeniería,
intentaron producir representaciones lo más fieles y exitosas
posible dentro del marco de limitaciones de los sistemas de
dibujo y de denotación que tenían a su alcance. En este sentido,
hemos de admitirlo, los resultados variaron de una cultura a
otra, de una formación discursiva a otra. Los distintos sistemas,
en parte, como las especies, evolucionaron por separado. Luego,
mediante la interacción cultural más o menos violenta, pudieron
mezclarse o integrarse para ser seleccionados casi naturalmente,
otra vez, en función de su rendimiento práctico adaptativo.
Nuestras imágenes, en algún sentido, hacen el camino inverso
de la visión, dibujamos y representamos a través de imágenes no
sólo lo que vemos sino lo que sabemos y creemos. Sin embargo,
como hemos señalado arriba, tampoco tenemos –y esta es
nuestra hipótesis- imágenes completamente convencionales, ya
que todo sistema de dibujo –en alguna medida- está derivado de
las leyes de formación de alguna de las representaciones internas
que dan lugar al cálculo y procesamiento de la información
visual. Otra vez estamos en el punto de partida: las imágenes son,
en parte artificiales o culturales y, en parte tomadas de la propia
naturaleza, pero no sólo de la naturaleza que vemos, sino de la
parte de la naturaleza que ve.

74
4
A pesar de todo, son continuidades

4.1. Platonismo contra panofkismo

D
urante el prolongado dominio de la pintura
occidental, la experiencia de mirar parecía sugerir
que era factible, de modo directo y sin mediación,
representar la realidad. Si así fueran las cosas, podríamos
mirar una imagen fija monocular piramidal cualquiera y
pensar: ése es el aspecto propio de tal o cual objeto capturado
por el dispositivo. Sin embargo, sabemos que la crítica a la
representación insiste, desde hace tiempo, en que toda referencia
a la realidad está contenida en condiciones de sentido cultural
e históricamente predeterminadas. Lo que habría que conocer
–entonces, por el contrario- son las condiciones sociales que
han permitido modos de representación divergentes que
varían de cultura a cultura. Los proyectos humanos impulsan
la creación de sustitutos o representaciones, pero la elección de
estos sustitutos estaba determinada –desde Balzac, Gombrich o
Goodman- por sistemas locales y no ya por la semejanza natural.
Las imágenes, según esta creencia, no se fundamentarían en la
motivación analógica, funcionando básicamente –a pesar de
su segmentación irresoluta- como sustitutos aceptados dentro
de un sistema de signos convencionales. Bajo la influencia del
estructuralismo y el posestructuralismo, el problema quedó
-en este sentido- aparentemente resuelto, a pesar de que las
imágenes se diferencien de los otros sistemas de signos, porque
son -ineludiblemente- continuidades, en el aspecto en que cada
marca es interdependiente, no operando ya a través de una
combinación de marcadores discretos tal como el lenguaje.
75
76
Figura 4.A.

77
Con el tiempo, la pregunta por las oposiciones natural-
convencional y analógico-digital, aún sin una resolución
convincente, fue dada por superada en muy diversos
escenarios, entre ellos, el de la semiótica de Buenos Aires,
donde lisa y llanamente todo efecto realista de las imágenes
debía comprenderse como visibilidad histórica. Para muchos
de nuestros autores contemporáneos, formados con parejas
referencias intelectuales de Barthes, Foucault, Derrida o Bryson,
la «imitación de la naturaleza» -la base de la tradición de la
imagen occidental- había sido un enmascaramiento sistemático
que exigía tan sólo su deconstrucción crítica. Este desplazamiento
típico provocado por las disputas semióticas sobre la
representación aplazó prolongadamente las consideraciones
acerca del funcionamiento semiótico más primario de las
imágenes. La infografía que ahora mostraremos y luego
examinaremos en esta última sección (Figura 4.A.) participa de
un argumento en contrario, señalando –por lo menos- el lugar en
el cual el sociosemiotismo, que sostiene que todos los significados
y lecturas están construidos cuasi-arbitrariamente, se encuentra
cada vez más reñido con la tentativa científica de definir la
mente como un sistema informático natural, destinado -desde
el nacimiento- a entender primariamente las imágenes de cierto
modo y no de otro.

4.2. Acerca de representaciones no-verbales fuera del cuerpo

Un espécimen expresivo (un significante)26 simbólico, producido


26 El término “espécimen expresivo” es utilizado por Umberto Eco y refiere
-básicamente- a una ocurrencia concreta de una substancia de la expresión en el sentido
que le da Hjelmslev a dicha noción en sus Prolegómenos a un teoría del lenguaje
(1943). Es decir, refiere –en términos ya dejados de lado en semiótica general- a la
instanciación misma de un significante (ahora en el sentido saussuriano del término).
Según Hjelmslev, recordemos, tiene una función semiótica (un signo) cuando un
código o sistema asocia los elementos de una red de configuraciones significantes a
los elementos de otra red de ideas o contenidos significados. El primer elemento es
expresión del segundo; y el segundo, contenido del primero. Por lo tanto, una función
semiótica es un correlación convencional de uno o más elementos de un plano de
la expresión y de un plano del contenido, tal como aparece en el esquema: E r C. El
lingüista danés, distingue además las articulaciones internas (los estratos) de cada
plano, y denomina substancias (ii) a las selecciones concretas, y formas o redes (iii),

78
por simple reproducción de tipos convencionales preexistentes (por
ratio facilis)27 –tal como las palabras, las banderillas de los prácticos
portuarios o la conjunción de luces y posiciones del semáforo- se
reconoce identificando -primero- los rasgos del tipo expresivo;
y -luego- correlacionándolo según un hábito o convención
con un contenido (o significado) determinado, perteneciente
a un sistema ya segmentado. En un aspecto equivalente, un
espécimen expresivo involucrado en el reconocimiento de un
índice (por ejemplo, de un picor o un sarpullido con tales o
cuales características) es comprensible a causa de una serie de
experiencias anteriores que han conseguido poner en correlación
(habitual y por qué no convencional)28 una unidad de contenido
con una unidad de expresión. En estos dos casos se reconoce algún
tipo de correspondencia entre signo tipo (type) y signo espécimen
(token) a causa -precisamente- de la preexistencia de signos tipo
como productos (ya) culturales, aunque más no sea, débilmente
recortados como meros tipos del contenido. El tipo, tanto de
la expresión como del contenido, se analiza en sus marcas y se
transforma o aplica para producir o instanciar especímenes.
a los sistemas o clasificaciones de posiciones opcionales (paradigma), en virtud de los
cuales las selecciones mismas asumen valores posicionales y oposicionales. Además, las
formas-redes y las substancias del contenido y de la expresión estarían precedidas por
una materia de la expresión y una del contenido (i). La primera es el continuum amorfo
de posibilidades físicas del que se extraen los elementos para usar como artificios
expresivos (por ejemplo: en el diseño, la posibilidad de emitir colores, los cuales se
seleccionan de los diagramas o de los sólidos cromáticos); la segunda es el continuum
indiferenciado de posibilidades físicas, comportamientos y pensamientos. Por lo tanto,
el esquema anterior se completaría del siguiente modo: m| se|fe r fc|sc |m. Tanto en el
plano del contenido como en el de la expresión, la materia todavía no es semiótica, es
un elemento aún amorfo que precede a toda segmentación, la que –como lo sostenía
Saussure (1916)- es el origen de toda semiosis. Pero, a decir verdad, tanto el lenguaje
como los demás sistemas de signos están en movimiento (aparecen y permanecen
en cambio), por lo tanto, se pueden dar casos de sistemas semióticos –tal cual las
imágenes- en los cuales la forma-red no está lo suficientemente establecida o definida,
como para segmentar claramente el continuum, siendo del todo útil para expresar lo
que se quiere o debe expresar. En este punto interviene, la creación, aparición o –como
veremos al avanzar este capítulo- la invención de una nueva pertinencia o de una nueva
partición de la materia de la expresión o del contenido, que renueva o acomoda los
códigos (las formas-redes) existentes y los hace más apropiados para un nuevo fin o una
nueva situación.
27 Una ratio facilis corresponde al uso de un sistema semiótico muy
institucionalizado y prescriptivo que funciona sobre la base de una creatividad
combinatoria que utiliza unidades preexistentes codificadas, claramente segmentadas o
articuladas.
28 Como en la semiología médica.

79
Figura 4.B.

80
Por el contrario, si consideramos la significación por ratio
difficilis, tal como se da en las imágenes, por ejemplo en un
pictograma o en un dibujo de memoria de un objeto de una
clase determinada (oveja, abeja, saltamontes, mono, cigarra,
etc.)29 tenemos un sinnúmero de dificultades pues, para esta
ratio el tipo es tan sólo una unidad de contenido (un semema)
y no un tipo expresivo preexistente. Sus propiedades no son
sino marcas semánticas que, en principio, no están relacionadas
con significantes discretos ni con continuum material alguno.
Vale decir, sucede lo que en un dibujo de memoria de un objeto
conocido, porque éste transforma (respetando un régimen de
semejanza habitual) una representación o modelo semántico
(cfr.[7] tanto en Figura 4.B. como en 4.A.)30 en un espécimen
expresivo (cfr.[8] ibíd.). Esto se produce según ciertas reglas de
semejanza (en parte y sólo en parte institucionalizadas) y no
según una correlación arbitraria (inmotivada) con un conjunto
de unidades expresivas de un lenguaje (como ocurre, por
ejemplo, en el dominio verbal).

En este aspecto, podemos preguntarnos qué significa transformar


las propiedades pertinentes de un saltamontes para producir
-o bien para reconocer- la imagen fotográfica o pictórica de un
individuo particular de esta especie. Hemos de saber –antes que
nada- que la cuestión está formulada de modo incorrecto en
función de un prejuicio referencial pues, la foto o la pintura no
poseería ya algunas de las propiedades del saltamontes mismo
(cfr.[1] en Figura 4.A. y Figura 4.C.), sino las propiedades de esa
suerte de unidad cultural (abstracta y convencional, cfr.[7] ibíd.)
que reúne el conjunto de marcas visibles que permiten reconocer
un saltamontes (conjunto que constituye una suerte de TC, tipo
de reconocimiento visual o modelo semántico).

29 Como es el caso de las imágenes que mostramos para ilustrar la infografía,


dibujadas por el ilustrador Charley Harper (n.1922-m.2007).
30 Las Figuras 4.B. (...) 4.n. son ampliaciones locales de la infografía que
presentamos completa en la Figura 4.A.

81
Figura 4.C.

82
Para el ciudadano corriente, la representación semántica (cfr.
[7]) de un saltamontes no consta sino de unas pocas marcas
entre las siguientes: articulado en su cuerpo y extremidades,
dividido en tres partes (cabeza, tórax y abdomen), el tórax
está dividido también en partes, saliendo de cada una de ellas
un par de patas (tres pares en total) que, como en los demás
insectos, están formadas por tres partes (fémur, tibia y tarso).
Las patas posteriores, más gruesas y fuertes, lo empujan a dar
grandes saltos; en cambio, los dos pares de patas restantes son
más finas. Suelen ser verdes o pardos, a veces amarillos o negros.
Transformar dichas marcas (abstractas, representadas mental y
socialmente) en otro (o en un) material significa simplemente
construir de forma manual artesanal interpretantes perspectivos
bidimensionales de los semas citados (o dibujos de memoria).
Luego, para el caso de la fotografía (cfr.[2] en Figura 4.A. y en
Figura 4.C.), implicaría proyectar mecánicamente interpretantes
perspectivos bidimensionales de dichos semas así como de
otras características particulares del objeto particular o de su
clase. (cfr.[1]) Una vez hecho esto, el espécimen es visible y es
reconocible como adecuado al tipo: luce como debe lucir la
imagen pictórica o fotográfica de un saltamontes.

Observamos en nuestra infografía (y también en el diagrama


de la Figura 4.D.) el proceso que se inicia en el objeto-escena
(cfr.[1]) y en la percepción del mismo, transformándose en TC
ó modelo semántico (que lo es de reconocimiento, cfr.[7]) y a
partir de éste, produciéndolo o reproduciéndolo en un soporte
material, dando lugar al espécimen expresivo regido por ratio
difficilis (cfr.[8]; [2] ó [3]), como lo sería –además del dibujo de
memoria (cfr.[8])- el caso de dibujar del natural (cfr.[3]) una
escena u objeto desconocido, o desconocido en algún aspecto
(como siempre sucede). Las imágenes de los pictogramas
señaléticos (estilizaciones [8]) representan –en virtud de leyes
de transcripción gráfica que codifican la transformación por
semejanza- agua,31 en estados, montos y situaciones diversas.32
31 Unidad ya experimentada (individual y colectivamente) y registrable según un
código cultural de reconocimiento perceptivo (Eco, 1968, B.). Ya nombrada e interpretada
por cadenas de unidades expresivas articuladas y claramente convencionales, correlacionadas
arbitrariamente, productos de la segmentación del continuum por cada lengua: “agua”;
“water”; “H2O”; “Sustancia cuyas moléculas están formadas por la combinación de un
átomo de oxígeno y dos de hidrógeno, líquida, inodora, insípida e incolora, etc..”
32 En este caso, en los juegos olímpicos de Montreal (1976), según pictogramas
rediseñados por Georges Huel y Pierre-Yves Pelletier, sobre un diseño previo (ya
generalizado) de Otl Aicher (München, 1972)

83
Figura 4.D.

Por el contrario, los estudios sobre el aspecto visible del agua


llevados a cabo por Leonardo o cualquier otro dibujante del
natural (cfr.[3]), son –casi por el contrario- productos de
la proyección casi directa que parte de las representaciones
perceptivas aún no reconocidas como correspondiente a
entidades conocidas.
84
En los casos de ratio difficilis nos encontramos ante tipos
de contenido principalmente constituidos por marcas no
verbalizables (Eco, 1975, 1997; Groupe mu, 1992). Es decir,
configuraciones espaciales, en términos de Eco, toposensibles
que, constituyen -en sí mismas- las representaciones abstractas
del modelo semántico (cfr.[7]) del que hablamos (generales,
presentes como memoria a largo plazo de las propiedades que
constituyen las clases y no ya los especímenes). Y con esto,
tenemos que la capacidad de abstracción no quedaría limitada
ya a las representaciones verbales. En la experiencia corriente
no podemos describir verbalmente la disposición espacial de
los elementos de una imagen (que nos propongamos reconocer
o trazar) de un objeto. Por lo tanto, aún siendo una unidad
cultural pensable, la disposición espacial de los elementos
que constituyen la forma tridimensional visible de un objeto
representable no pueden describirse verbalmente.

Dicho aspecto tridimensional sensible de un objeto o escena es


contenido y es proporcionado por el aducto visual en esa suerte
de representación espacial tridimensional, denominada modelo
3-d, que aparece ya en la Figura 4.E. (cfr.[6]), haciendo lugar al
procesamiento bottom-up (modular, en el sentido fodoriano del
término) de la información visual. Decir que las disposiciones
espaciales de los componentes de una forma tridimensional
conocida- son pensables (con cierta abstracción) aún en sus
aspectos no verbalizables depende en alguna medida del estatuto
de lo que Eco denomina modelo semántico (1975) o tipo cognitivo
(1997) y de su desempeño en la ratio difficilis.

Tenemos que, a partir de una estructura estimular del mundo


[1], o bien de cómo ésta afecta a las superficies sensibles del
cuerpo, obtenemos –sostiene Eco- un modelo perceptivo [6]
en tanto representación más bien densa de una experiencia
determinada; asignando al objeto percibido las propiedades
x1, x2... xn. Por un proceso de abstracción, el modelo perceptivo
da origen a un modelo semántico [7] que conserva tan sólo
algunas de las propiedades (inclusive no verbalizables) de la
representación densa.
85
Figura 4.E.

86
Luego, podemos expresar este modelo semántico (en tanto
contenido no verbal) mediante artificios expresivos [8]. “Si las
marcas no fuesen toposensibles, bastaría con una correlación
planteada arbitrariamente.” (Eco, 1975.) Puesto que estamos ante
un caso de toposensibilidad, la correlación motivada deberá
seguir reglas de transformación –no arbitrarias- basadas en la
semejanza, correlación que representamos horizontalmente en
nuestra infografía, como a todas las demás transformaciones
que constituyen lo que toscamente se solía tener por simples
relaciones de motivación.

Aclarémoslo: una estructura estimular [1] afecta a las superficies


sensibles de los diversos aductos del cuerpo, entre ellos, el
visual (ocasionando exiguas imágenes retinianas en cada ojo).
Tomando como punto de partida estructuras de estímulos
proximales, inestables, múltiples y fugaces, calculamos (mediante
un proceso encapsulado [Fodor, 1983]) un modelo perceptivo [6]
o un tipo cognitivo [7] estable y constante como representación
-todavía densa aunque no necesariamente particular- de un
objeto, escena o experiencia determinada. Para el caso del
aducto visual, estas representaciones son independientes del
punto de mira y dispuestas respecto de sus propios sistemas
de coordenadas. Si consideramos este aducto por separado,
tendremos que, entre las imágenes superficiales retinianas y el
modelo perceptivo estable, es decir el modelo 3-d de un objeto
o escena particular [6], se extiende el procedimiento de cálculo
mediado por representaciones tales como el esbozo primario
2-d y el modelo 2½-d , procedimiento que hemos registrado
en nuestra infografía. Respetando luego las reglas que rigen
cualquier clase de proceso de abstracción, uno o más modelos
perceptivos (particulares) [6], se transforman en un modelo
semántico [7] que ya es tipo y no espécimen (es forma y no
substancia en el sentido de Hjelmslev, 1943),33 y que conserva
sólo algunas de las propiedades comunes, diagnósticas o
meramente frecuentes, jamás esenciales.

33 Inclusive de Saussure, en el Cours de linguistique générale.

87
4.3. Invenciones

Otro asunto de importancia –y que nos concierne en relación


a nuestro enfoque- es el problema que tenemos cuando hay
que determinar cómo transformar en un continuum expresivo
las propiedades de algo que, a causa de su extrañeza o de su
complejidad estructural, no es conocido todavía culturalmente.
No sería el caso, como lo dice Eco, de un “hombre con siete
piernas y diez ojos”, porque en esos casos no se hace otra cosa
que inferir la naturaleza de elementos desconocidos por la
adición de elementos conocidos. Se trata de comprender cómo
es que se puede representar visualmente (y reconocer) el aspecto
reiteradamente novedoso del conjunto de estímulos proximales
provocados inclusive por un objeto o estímulo distal ya conocido
(Eco, 1975, 3.6.7.). Vale decir, interesa saber cómo se puede
representar visualmente (y reconocer) una liebre particular
captada desde un punto de vista (casi siempre) novedoso o
cómo se puede representar una charca teniendo en cuenta
tanto el grado de convencionalidad ínfimo alcanzado por el
tipo de contenido que constituyen esa montaña o ese hombre
(tal vez desconocidos) en esa circunstancia e instante y desde
ese punto de mira (casi siempre) inexperimentado, así como
la complejidad toposensible que esto implica al observarse
más detalles y situaciones espaciales particulares de lo que las
palabras generales de las proposiciones descriptivas pueden
llegar a dar cuenta. Umberto Eco denomina invención (cfr.[2] y
[3]) a este modo de producción en que el sujeto o mecanismo
productor de una función semiótica escoge un continuum
material aún no segmentado convencionalmente (cfr.[1]), y
propone una nueva manera de configurarlo “…para transformar
dentro de él los elementos propios de un tipo de contenido.” (ibíd.)
Esto significa –como se muestra en la infografía y en los últimos
diagramas- tomar para producir un espécimen expresivo
(por ejemplo una imagen, cfr.[2] y [3]) un continuum aún no
segmentado y transformar o aplicar en él las propiedades de
un tipo de contenido, aún cuando este último tipo aún no esté
formado.

88
Figura 4.F.

Entiéndase, el modelo perceptivo [6] del sujeto que producirá


el signo se considera como si fuera un modelo semántico
codificado [7] y sus marcas perceptivas (aún no semánticas) se
transforman en una materia todavía informe basándose en las
reglas de semejanza ya aceptadas. Así, en el dibujo del natural
[3], como el que traza Albrecht Dürer de una liebre, el modelo es
perceptivo [6] y no semántico [7] porque la escena u objeto [1],
ya sea en su conjunto (lo que sucede a veces) o en sus detalles
y particularidades situacionales (lo que sucede siempre) no ha
sido reconocido como espécimen particular de un tipo ya dado.
Luego, sus marcas no son aún semánticas sino, modularmente
perceptivas (son producto de transacciones físicas
perceptivamente relevantes, es el output del análisis preceptivo).
Sabemos cómo son pero no qué son (toposensibilidad). Son estas
marcas las que se transcriben o traducen según un código de
transcripción gráfica que hipotéticamente se cree adecuado para
el caso.

Antes del empleo de la fotografía, la observación telescópica


de los planetas y planetoides, en la modernidad temprana,

89
dio lugar a dibujos excelentes [3] que llegaron a ser medios de
conocimiento34 y motivos de formación de modelos semánticos
[7] de los objetos celestes observados. Las marcas visuales que
constituyeron los modelos perceptivos [6] fueron transformadas
en marcas visibles del espécimen expresivo que motivaron luego,
marcas propiamente semánticas de un modelo semántico menos
denso (¿y predicable?) de lo visto [7]. Como decimos, a partir
del siglo xvii, numerosos astrónomos han pasado largas horas
junto a su telescopio soportando el cansancio y el frío del alba.
Cada noche, durante horas, la humedad combinada con otros
fenómenos principalmente atmosféricos agitaba y distorsionaba
la estructura estimular originada en el estímulo distal. En
escasísimos pero muy esperados momentos, los estímulos
(vehiculizados por el telescopio) coincidieron en una suerte de
destello instantáneo de los rasgos visibles (aunque todavía no
identificables) del objeto que se observaba (a veces por primera
vez). De ahí en adelante, lo importante era recordar lo que se
había tenido la fortuna de ver [6], pero aún, no de reconocer o
identificar. Las anotaciones sobre papel (invenciones moderadas
[3]) debían ser cuidadosas tanto en el registro detallado y
preciso como en la estricta exclusión de las ideas preconcebidas
respecto de lo que podía llegar a ser lo que se estaba observando.
Inclusive algunos astrónomos desarrollaron la habilidad de mirar
por el ocular y dibujar sobre el papel con cada uno de los ojos
simultáneamente; convirtiéndose así en una suerte de pantógrafo
humano, o mejor, inhumano (Barthes).

Hacia mediados del siglo xvii, astrónomos como Christoph


Scheiner o Galileo Galilei habían quedado perplejos al observar
sus propias anotaciones gráficas [3] respecto del planeta Saturno.
En función de los defectos propios de aquellos telescopios
primitivos y de que los objetos brillantes parecen ser redondos
cuando se los ve borrosos, estos astrónomos habían trazado un
espécimen expresivo [3] a partir de marcas visibles, transcriptas
–a su vez- de marcas perceptivas [6], y ahora puestas en
comparación con la experiencia habitual del mundo. No quedaba

34 La conexión aquí está representada con líneas de trazos.

90
otra que abducir un modelo semántico [7] correspondiente
a «un planeta con asas» o «un planeta flanqueado en sus
proximidades por dos grandes esferas».

Figura 4.G.

Estos astrónomos presupusieron reglas de correlación aún


cuando en este caso, el funtivo del contenido, la idea de cómo
es Saturno, todavía no existía. Cuarenta años más tarde, con
instrumentos ópticos de mayor precisión, Christiaan Huygens
resolvió el acertijo que había dejado tan desconcertado a Galileo,
exponiendo en 1659, en su libro Systema Saturnium, que esos
aparentes esferoides que acompañaban a Saturno en los dibujos
de observación telescópica, si se interpretan bien, sobre todo a la

91
luz de la comparación entre otros dibujos secuenciales obtenidos
a lo largo de suficiente tiempo, no son otra cosa que un anillo
plano que rodea al planeta.

A veces el destinatario, frente a la mayor de las sorpresas, se


niega o no puede colaborar y así, la convención no se establece
o se establece débilmente, como sucedió con la creencia en que
Saturno está rodeado de enormes y próximos satélites. En ese
caso, el emisor (si lo hubiere) o la naturaleza pueden ayudar al
destinatario y el texto no puede ser puramente el resultado de
simple invención, sino que debe (y esto ocurre frecuentemente)
ofrecer otras claves tales como la estilización de alguno de sus
aspectos. La convención se establece exclusivamente en virtud de
la acción combinada de varios elementos en un juego recíproco
de ajustes. La interpretación de manchas como esferoides es
producto de estilizaciones que probablemente arrancan en la
consideración (a nivel tanto de expresión como de contenido)
de las observaciones (y los dibujos y esquemas precedentes) de
los satélites jovianos, así como de las consideraciones acerca del
movimiento de la Tierra, de la Luna y del sistema planetario
en general. Cuando el proceso es culminado con éxito, se
establece un nuevo plano del contenido (Hjelmslev) entre un
modelo perceptivo que ya sólo es el recuerdo del emisor (por
ejemplo: del observador-dibujante) y una expresión físicamente
aprehensible (por ejemplo: el dibujo del natural). Lo que era
continuum en bruto organizado por la percepción del astrónomo
se va convirtiendo poco a poco en organización y comprensión
convencional del mundo. Una función semiótica surge (o se
cristaliza) a partir del trabajo de exploración y de los intentos de
institución de códigos, y, al establecerse, genera hábitos, sistemas
de expectativas, es decir, en primer lugar estilos y luego, tal vez,
unidades combinatorias de un código.

¿Qué lugar ocupan y cómo se configuran, si existen, en nuestra


“caja negra” estos tipos cognitivos o de reconocimiento visual
(Groupe mu, 1992 [7]) que empleamos cuando percibimos
o reconocemos algo? Hemos de suponer que, si hay actos de
referencia exitosa, es porque, tanto al reconocer por segunda vez
92
algo percibido previamente, como al decidir que tal o cual objeto
pueden satisfacer el requisito de ser una montaña o una pierna,
se cotejan ocurrencias [6] con un tipo (o modelo [7]). Como
ya anticipáramos en nuestra introducción (supra.), nuestro
desempeño semiótico mundano nos produce la impresión
de que concebimos representaciones topológicas y métricas
mentales de la forma espacial de los objetos y, sobre todo, que
nosotros interpretamos intersubjetivamente muchos términos
a través de representaciones visuales o perceptivas. Por lo cual,
también el componente métrico o toposensible del conocimiento
debe postularse junto a la existencia de los mencionados tipos
o representaciones semánticas, para dar razón de lo que la
experiencia nos propone.

93
94
Referencias & bibliografía

angenot, Marc
(1985) Critique de la raison sémiotique. Fragment avec pin up.
(Montréal: Presses de l’Université de Montréal).

aumont, Jacques
(1991) L’Image (Paris: Nathan). Traducción castellana de Antonio
López Ruiz (Barcelona: Paidós, 1992).

barlow, Horace B., Miranda Weston-Smith, M. & Colin


Blakemore
(1990) Images and Understanding, (Cambridge, Cambridge
University Press). Traducción castellana de Jordi Ainau, Imagen y
conocimiento, cómo vemos y cómo lo interpretamos (Barcelona:
Crítica, 1994).

calabrese, Omar
(1985) Il linguaggio dell’arte (Milano: Bompiani). Traducción
castellana de Rosa Premat, El lenguaje del arte (Barcelona:
Paidós, 1986).

chomsky, Noam
(1975) Reflections on Language (New York: Pantheon Books).
Traducción castellana de Ernesto de la Peña, Reflexiones acerca
del lenguaje. Adquisición de las estructuras cognoscitivas (Madrid:
Ed. Trillas, 1981).
(1985) Knowledge of Language; Its Nature, Origins, and Use (New
York: Praeger Publishers). Traducción castellana de E. Bustos
Guadaño, El conocimiento del lenguaje. Su naturaleza, origen y
uso (Madrid: Alianza, 1989).

95
eco, Umberto
(1968) La struttura assente (Milano: Bompiani). Traducción
de Francesc Serra Cantarell, La estructura ausente (Barcelona:
Lumen, 1972).
(1975) Trattato di semiótica generale (Milano: Bompiani)
Traducción castellana de C.Manzano. Tratado de semiótica
general (Barcelona: Lumen, 1977)
(1979) Lector in fabula (Milano, Bompiani). Traducción
castellana de Ricardo Pochtar, Lector in fabula (Barcelona:
Lumen, 1981).
(1984) Semiotica e filosofia del linguaggio (Torino: Einaudi).
Traducción castellana de Rosa Premat, Semiótica y filosofía del
lenguaje (Barcelona, Lumen, 1990).
(1985) Sugli specchi e altri saggi (Milano: Bompiani). Traducción
castellana de Cárdenas Moyano, Sobre los espejos y otros ensayos
(Buenos Aires: Lumen, 1992).
(1990) I limiti dell’interpretazione (Milano: Bompiani).
Traducción de Helena Lozano, Los límites de la interpretación
(Barcelona: Lumen, 1992).
(1997) Kant e l´ornitorinco (Milano: RCS Libri). Traducción
castellana de Helena Lozano, Kant y el ornitorrinco (Barcelona:
Lumen, 1999).

fodor, Jerry
(1975) The language of thought (New York: Harper&Row.Inc.)
Traducción de J.Fernández Zulaica, El lenguaje del pensamiento
(Madrid: Alianza, 1984).
(1983) The modularity of mind, (Boston: mit Press). Traducción
de Manel Igoa, La modularidad de la mente, (Madrid: Morata,
1986).
(1987) Psychosemantics (Boston: mit Press) Traducción de
O.Gonzalez Castán, Psicosemántica, (Madrid: Technos, 1987).

fodor, Jerry A. & Zenon W. Pylyshyn


(1981) “Some reflections on Gibson’s ecological approach”, en
Cognition, 9, pp.139-96

96
fraenza, Fernando
(1995) Semejanza e imagen. La indexicalidad como factor de
reconocimiento primario del texto icónico, tesis de Maestría en
Diseño, Universidad del Bío-Bío, Santiago de Chile. Además,
editado parcialmente por la DGP de la Universidad Nacional de
Córdoba.

gombrich, Ernst H.
(1960) Art and Illusion. A Study in the Psychology of Pictorial
Representation (Oxford: Phaidon). Traducción castellana, Arte e
ilusión. Estudio sobre la psicología de la representación pictórica
(Barcelona: G.Gili, 1979)

gregory, Richard
(1970) “The Grammar of Vision”, en The Listener, Feb 19, 1970.

greimas, Algirdas J.& Joseph Courtés


(1979) Semiotique, Dictionnaire raisoné de la theorie du
langage, (Paris: Hachette). Traducción de E. Ballón Aguirre y
H.Campodónico Carrión, Semiótica. Diccionario razonado de la
teoría del lenguaje (Madrid: Gredos, 1982)

groupe mu
(1992) Traitè du signe visuel. Pur une rhetorique de l’image (Paris:
Du Seuil). Traducción castellana de M. Talens Carmona, Tratado
del signo visual. Para una retórica de la imagen (Madrid: Cátedra,
1993).

hoffman, Donald D.
(1998) Visual Intelligence (NewYork: Norton & Co.). Traducción
castellana de Daniel Menezo: Inteligencia Visual. Cómo creamos
lo que vemos (Barcelona: Paidós, 2000).

hjemslev, Louis
(1943) Omkring sprogteoriens grundlaeggelse (Kobenhaus:
Universitet). Traducción castellana de J.L. Diaz de Llano
Prolegómenos a una teoría del lenguaje (Madrid: Gredos, 1984).
97
hubel, David
(1963) “The Visual Cortex of the Brain” Scientific American, Nov.
1963, Vol. 209, Nr.5, pp.54-63. Traducción castellana “El cortex
visual del cerebro”, en Anatomía fisiológica (Barcelona: Labor,
1974) pp.337-345.

hubel, David & Thorsten Wiesel


(1963) “Receptive fields, binocular interction and functional
architecture in the cat’s visual cortex” en Journal of Physiology,
London, 1962, 160, pp.106-154.
(1962) “Receptive Fields, Binocular Interaction and Functional
Architecture in the Cat’s Visual Cortex”, en Journal of Physiology,
(1962), 160, pp.106-154
(1976) “Functional architecture of area 17 in normal and
monocularly deprived macaque monkeys” en Cold Spring Harb
Symp Quant Biol, 1976 40: pp.581-589
(1977) “Functional Architecture of Macaque Monkey Visual
Cortex” en Proceedings of the Royal Society of London, Series B,
Biological Sciences, Vol. 198, No.1130 (May 19, 1977), pp.1-59
(1979) “Brain Mechanisms of Vision”, en Scientific American,
Volume 241, Number 3, Sept. 1979, p.150. También en The Brain,
Scientific American (New York: 1979). Traducción castellana “Los
mecanismos cerebrales de la visión”, en El cerebro (Barcelona
Labor, 1980) pp.114-128.

jackendoff, Ray
(1987) Consciousness a Computational Mind (Cambridge: mit
Press). Traducción castellana de Ana Ardid, La conciencia y la
mente computacional (Barcelona: Visor, 1998).

johnson-laird, Philip Nicholas


(1988) The Computer and the Mind: An introduction to Cognitive
Science (Cambridge: Harvard University Press). Traducción
castellana de Alfonso Medina, El Ordenador y la Mente:
introducción a la ciencias cognitivas. Monografía. (Madrid: Paidós
Ibérica, 1990).

98
kosslyn, Stephen M. & J. Pomerantz
(1977) “Imagery, propositions and the form of internal
representations” En Cognitive Psychology, 9:52-76..

macnamara, John
(1978) “How do we talk about what we see” (Montreal: McGill
University)

maldonado, Tomás
(1974) “Appunti sulla iconicità”, en Maldonado, (1974a), pp.
254-297 y también en Augusto Ponzio (editor) La semiotica in
Italia, (Bari: Dedalo, 1976), pp.374-382. Traducción castellana,
“Apuntes sobre la iconicidad”, en Maldonado, (1974a), [pp. 229-
264].
(1974a) Avanguardia e razionalità: articoli, saggi, pamphlets
1946-1974, (Torino: Einaudi), Traducción castellana de Eduardo
Subirats, Vanguardia y racionalidad (Barcelona: G.Gili, 1974).

marr, David
(1982) Vision-A computational Investigation in to the Human
Representation and Processing of Visual Information (Oxford
/ New York: Freeman & Co.). Traducción De T. Amo
Martín,Visión; Una investigación basada en el cálculo acerca de
la representación y el procesamiento humano de la información
visual, (Madrid: Alianza, 1985).

marr, David. & Ellen C. Hildreth


(1980). “Theory of edge detection”, en Proceedings of the Royal
Society of London, Series B, 207, pp.187-217.

marr, David & H. Keith Nishihara


(1978)“Representation and recognition of the spatial
organization of three-dimensional shapes”, en Proceedings of the
Royal Society of London, B, 200., pp.269-294.

99
marr, David & Lucia Vaina
(1982) “Representation and recognition of the movements of
shapes”, en Proceedings of the Royal Society of London, B, 214.,
pp.501-524.

molnar, Francois
(1976) “Quelques aspects psychobiologiques de l’image”, Revue
d’esthétique, 1. Traducción castellana de Miguel López y Atocha,
“Algunos aspectos psicobiológicos de la imagen”, en La práctica
de la pintura (Barcelona: G.Gilli, 1983).

munar, Enric, Jaume Rossellò & Antonio Sánchez [coords.]


(1999), Atención y Percepción (Madrid: Alianza).

noton, David & Lawrence Starck


(1971) “Scanpaths in Eye Movements during Pattern Perception”,
en Science, 22 enero 1971, Vol. 171, no.3968, pp.308-311.
(1971) “Eye movements and visual perception”, en Scientific
American, 1971, 224, (6), pp. 33-43.

paivio, Allan
(1971). Imagery and verbal processes (New York: Holt, Rinehart
and Winston).

palmer, Stephen
(1975) “Visual Perception and Knowledge. Notes on a Model
of Sensory cognitive Interaction”, Norman & Rumelhart, 1975,
pp.279-307.
(1977) “Hierarchical Structure in Perceptual Representations”, en
Cognitive Psychology, 9., 1977, pp.441-474.
(1980) “Whats Makes Triangles Point: Local and Global Effects
in Configurations of Ambiguous Triangles”, en Cognitive
Psychology, 12., 1980, pp.279-307.
(1999) Vision Science, photons To Phenomenology, (Boston:
mitPress).

100
pierantoni, Ruggero
(1979), L’occhio e l’idea. Fisiologia e storia della visione,
Boringhieri, Milano Traducción castellana de Rosa Premat, El
ojo y la idea. Fisiología e historia de la visión (Barcelona: Paidós,
1984).

shepard, Roger N. & Lynn A. Cooper (1982) Mental images an


their transformations (Cambridge, mit Press).

shepard, Roger N. & Jacqueline Metzler (1971) “Mental


Rotation of Three-Dimensional Objects”, Science, New Series,
Vol. 171, No. 3972 (Feb. 19, 1971), pp. 701-703.

shepard, Roger N. & , L. A. Cooper (1982). Mental Images and


Their Transformations (Cambridge, mit Press).

saussure, Ferdinand de
(1916) Cours de linguistique general (Genève: Atar). Traducción
castellana de Amado Alonso, Curso de lingüística general
(Buenos Aires: Losada, 1946).

verón, Eliseo
(1973) “Pour une sémiologie des opérations translinguistiques”,
en Versus 4, 1973, Bologna. Traducción castellana “Para una
semiología de las operaciones translingüísticas”, en revista
Lenguajes n1/42, 1974, NuevaVisión, Buenos Aires, pp.11-36.

willats, John
(1991). “The draughtsman’s contract: creating an image”. En
Barlow, H., C. Blakemore, & M. Weston-Smith (eds.), Images and
Understanding (pp.235-254).
(1997) Art and Representation: New Principles in the Analysis of
Pictures (Princeton: Princeton University Press).

101
102
Índice de nombres

Aicher, Otl 83
Alberti, Leon Battista 25, 54
Allen Charlie 60
Angenot, Marc 18
Aristóteles 15, 21
Aumont, Jacques 58

Balzac, Honoré 75
Barthes, Roland 39, 78, 90
Braque, George 56
Bryson, Norman 78
Breyer, Gastón 39

Caravaggio, Michelangelo 71
Cézanne, Paul 56
Chomsky, Noam 11, 13-20, 24
Corot, Camille 73

Da Vinci, Leonardo 53-54


Derrida, Jacques 78
Dürer, Albrecht 53, 88

Eco, Umberto 7-10, 28-30, 32, 36, 39, 78, 83, 85-88

Fodor, Jerry 11, 16, 18, 24, 30, 49, 87


Foster, Norman, Lord of Thames 62
Foucault, Michel 78

103
Galilei, Galileo 90-91
Gombrich, Ernst 18, 71, 75
Goodman, Nelson 75
Greimás, Algirdas Julien 9
Groupe Mu 5, 7, 26, 46, 55, 85, 92

Harper, Charley 81
Hjelmslev, Lois 10, 78, 87, 92
Holbein, Hans, El Joven 71
Hubel, David 17, 66
Huel, Georges 83
Huygens, Christiaan 91

Jackendoff, Ray 36, 39, 44-45, 48-50

Kant, Immanuel 32
Klinkenbreg, Jean Marie 5
Kosslyn, Stephen 11, 52

Macnamara, John 41, 72


Magritte, René 71
Maldonado, Tomás 61, 64-65
Marr, David 10, 21, 26-27, 32, 35, 41-42, 44-45, 55-56, 64, 71
Molnar, Francois 54

Nishihara, H. Keith 11, 21, 26-27

Orwell, George 13-14

Panofsky, Erwin 60
Paivio, Alan 11
Pearlstein, Philip 71
Peirce, Charles S 9, 12,
Pelletier, Pierre-Yves 83
Platón 13-15, 35
Poggio, Tomasso 11

104
Rogers, Richard, Baron of Riverside 63

Saussure, Ferdinand 10
Scheiner, Cristoph 90
Shepard, Roger 40, 52

Vaina, Lucia 11
Vermeer, Johannes 73
Verón, Eliseo 9

Wertheimer, Max 21
Wiesel, Torsten 17, 66
Willats, John 30, 57, 66, 71-72

Yarbus, Alfred 22

Fernando Fraenza | 2017 | fraenza@gmail.com

105
106
Este libro se terminó de imprimir,
en Editorial Brujas, Córdoba,
Argentina, en enero de 2017

107

Anda mungkin juga menyukai