La récognition aspectuelle de Lopes dans Understanding
Pictures
Anaïs Lambolez
Panneau des lions
(détail), grotte Chauvet, Ardèche.
Le compatibilisme affirmé par la
théorie de la récognition aspectuelle de Lopes se retrouve principalement dans une
analyse qui s’ancre à la fois dans une pensée cognitiviste de la perception et
dans l’intérêt pour une théorie de la référence basée sur un système
informationnel. Il montre que ces deux pôles ont un rôle à jouer dans notre
expérience des images et de notre compréhension de leur contenu, proposant
ainsi une alternative prometteuse.
La question de la référence
Le thème de la référence apparaît dans Understanding Pictures, suite à l’examen
de la théorie waltonienne face à
une théorie symbolique des images. Il en ressort que les images, contra Walton, sont dénotatives dans des
systèmes symboliques et que la fonction de substitut qu’il accorde aux images
ne justifie pas que toutes les images soient fictionnelles, ni qu’elles se
réduisent à cette seule fonction. Pour Lopes, dénotation picturale et
perceptualisme ne sont pas incompatibles.
Lopes entreprend alors d’examiner les
principales théories de la référence linguistique exposées par Frege, Kripke, ou encore Kaplan, afin de voir si l’on peut en tirer une piste pour expliquer
la référence iconique. Le premier propose une théorie descriptive de la référence
des noms propres : la signification d’un nom propre est constituée d’une
(unique) description finie et il réfère à l’individu en vertu de cette
définition. Si on l’applique au cas pictural, une image réfère à tout ce dont
sa « description iconique » (la liste des propriétés de l’objet
dépeint) nous informe. Ainsi : « une image dépeint (réfère
singulièrement à) un objet si et seulement si, pour une description ф, c’est
une image-ф, et que cet objet est uniquement ф ».
Seulement, elle pose le problème de la
vérité présupposée de la description donnée, que contredisent les images
métaphoriquement vraies mais littéralement fausses, et plus généralement les
images qui déforment d’une façon ou d’une autre leur sujet. De plus, elles ne
réfèrent pas toutes à un unique référent singulier. Elle peut par exemple
représenter une espèce, comme l’image d’un aigle accolée à sa définition dans
un dictionnaire. Seules les images « dont la fonction spécifique est de
véhiculer une information vraie sur le monde » (comme les cartes ou les photographies d’identité) sont
concernées par cette théorie. Par conséquent, elle est inadaptée à la
dépiction : elle viole la contrainte de diversité et il n’est pas
nécessaire qu’une image doive référer de cette façon.
S’opposant à la théorie frégéenne,
Kripke développe quant à lui une théorie génétique : la référence d’un nom
propre n’est pas fonction de sa signification mais de son histoire de
production et de son utilisation. Un mot reçoit sa référence lors d’un
« adoubement », un « baptême », créant une « chaîne de
communication » entre les utilisateurs, de sorte que « le nom passe
de maillon en maillon », permettant ainsi de référer correctement avec ce
mot sans ne rien connaître à son sujet, comme cela peut être le cas lorsqu’on
se trouve « au bout de la chaîne de communication ». Si on considère que la référence picturale fonctionne de la
même façon, la version kripkéenne semble insuffisante à expliquer comment une
image dénote. L’exemple du dessinateur échouant à dépeindre la Dame de Fer montre que même lorsque la genèse de l’image joue un rôle
dans la référence picturale, elle ne suffit pas à l’expliquer : il lui
manque la prise en compte des propriétés visuelles du contenu iconique. Lopes
en conclut donc que :
Ni
la théorie de la référence descriptive, ni la théorie de la référence picturale
génétique ne sont adéquates. D’un côté, les images peuvent échouer à représenter
leur sujet, donc leur contenu n’a pas besoin de correspondre à ce qu’il dénote.
D’un autre côté, les images doivent représenter leur sujet comme ayant
certaines propriétés [...].
La théorie de Kaplan montre une volonté
de prendre en compte ces deux aspects (genèse et contenu de l’image) que semble
impliquer la référence picturale. Pour ce faire, il fait la distinction entre
le « contenu descriptif » et le « caractère génétique »
d’une image. Le premier comprend les propriétés que l’image nous révèle à
propos de son référent ; le second renvoie à la genèse de l’image,
laquelle est indépendante du « contenu descriptif ». Mais pour Lopes,
le fait que les deux éléments de la théorie de Kaplan soient indépendants l’un
de l’autre montre ici aussi une insuffisance à expliquer la spécificité de la
référence picturale. Si on imagine à nouveau un dessinateur incompétent à faire
le portrait de la reine Victoria, et que ce portrait est non seulement un échec
du fait qu’il ne dépeint pas la reine Victoria, mais plus surprenant, qu’il en
résulte que l’image dépeint Divine, un travesti célèbre, alors, selon la
théorie hybride de Kaplan, l’image représente la reine Victoria de par
l’histoire de la production de l’image et du contenu iconique auquel elle est
liée, bien qu’on ne puisse pas identifier l’image comme étant une image de la
reine Victoria. La conséquence fâcheuse est que cette théorie ne rend pas
compte de la différence entre une image-Divine de la reine et une image-de-la reine-Victoria : ce que l’image
dénote et ce qu’elle représente ne coïncident pas. Pour Lopes, il faut un lien
plus fort entre contenu et genèse iconiques, de sorte que « des
différences d’origines génèrent des différences de contenu, et que le contenu
révèle ses origines ».
Puisque même l’alternative de Kaplan est
inadéquate à rendre compte de la référence picturale, Lopes se tourne alors
vers la théorie d’Evans, qu’il comprend de la façon suivante. Dans The Varieties of
Reference, Evans propose une théorie hybride de la référence basée sur un
système d’information. Pour lui, les expressions démonstratives du type
« ceci est x » sont
identifiées lorsque l’agent localise dans sa pensée l’objet de la référence sur
la base de ce qu’Evans appelle un « système d’information ».
Considérant les êtres humains comme des « cueilleurs, des collectionneurs
et des transmetteurs d’informations », lesquelles sont appréhendées, véhiculées, et stockées grâce
aux capacités humaines de la perception, la communication, et de la
mémoire, sa théorie promet de lier convenablement la référence picturale au
contenu et à la perception de l’image.
Les « états informationnels »
(information states) en jeu dans le
processus d’identification sont définis d’une manière spécifique : ils se
placent à un niveau infra-doxastique, reposant principalement sur des processus
neuronaux et des mécanismes psychologiques (comme les processus perceptuels et
mémoriels), ils sont par ailleurs indépendants des croyances, – puisque ces dernières, comme les
concepts ou les désirs, ne les altèrent pas (les illusions de Ponzo, Fick, et
Müller-Lyer fonctionnent même lorsqu’on sait que les deux lignes sont de
longueurs égales) – et
non-conceptuels (il n’est pas nécessaire pour l’agent de posséder les concepts
des propriétés d’un tel contenu informationnel pour qu’il reçoive
l’information). Les jugements basés sur les états informationnels sont
conceptuels, mais ils reposent sur des états non-conceptuels. Ainsi, dans le
processus d’identification, l’agent passe d’un état informationnel (non-conceptuel,
conscient ou inconscient) à un autre type d’état cognitif (conceptuel).
Si l’état informationnel est définit
comme un état mental qui transmet et stocke de l’information, comment
identifions-nous, via un « système d’information », la source même de
cette information ? Evans propose deux cas : soit l’identification de
la source se fait de manière causale, soit en identifiant le contenu, lorsque
l’information possède suffisamment de propriétés en corrélation avec sa source.
Deux modes d’identification du contenu sont alors distingués : le premier,
décrit comme le plus familier, est descriptif ; le second est à base
récognitionnelle. C’est donc vers ce dernier mode que se tournera Lopes.
Ce qui l’intéresse dans les modes
d’identification à base informationnelle tient au fait qu’ils « rendent
disponibles certaines manières de penser aux objets, et par conséquent d’y
référer ». Après avoir expliqué les deux contraintes qu’impliquent les
pensées ou les jugements (niveau conceptuel) issus des états informationnels
(non-conceptuel) que sont la « contrainte de Russel » (principe
d’individuation) et la « contrainte de généralité », – c’est-à-dire,
« la capacité à penser aux choses de différentes manières [qui] est
intégrante de la possession des concepts de ces choses », « être
capable de nourrir l’idée que « a
est F » requiert un concept de F qui permet de comprendre les pensées
« b est F », « c est F », et ainsi de suite » – Lopes
confirme son choix, la théorie de la référence d’Evans prend suffisamment
en compte l’apport perceptif et la chaîne de causalité qui relie l’information
jusqu’à l’identification de sa source :
D’après ce modèle, les images font
partie d’un système d’information, les images individuelles véhiculent des
informations perceptuelles à propos de leur sujet. Une image représente un
objet seulement s’il véhicule une information sur lui sur la base de ce qui
peut être identifié. Pour comprendre des images, les spectateurs doivent
employer un mode d’identification (ou des modes) spécifiquement pictural,
lequel distingue, sur la base de leur contenu, les sources d’une image. Cette
proposition supporte les marques d’une théorie hybride. Un objet ou une sorte
d’objet est un sujet de l’image seulement si l’on s’en sert comme la source de
l’information que contient l’image. Mais le contenu de l’image joue un rôle
inéliminable lorsqu’il représente son sujet, puisque c’est sur la base de son
contenu que nous identifions ses sujets.
Reste à savoir
quelle(s) sorte(s) d’informations transportent les images et quel(s) mode(s) de
l’identification perceptuelle les spectateurs utilisent en identifiant le sujet
de l’image. C’est donc vers la spécificité du contenu pictural qu’il nous faut
nous tourner à présent.
Sélectivité du contenu pictural
La théorie de la récognition d’aspect de
Lopes se développe autour de deux thèses fondamentales. La première concerne le
contenu pictural, lequel attribue au monde certaines propriétés. Contre ce
qu’il appelle « le mythe de la spécificité », c’est-à-dire l’enclin
qu’ont certaines théories à se concentrer sur le caractère spécifique ou
déterminé du médium iconique (notamment l’analogicité distinctive des systèmes
iconiques ou des informations qu’elles véhiculent défendue respectivement par
Goodman et Dretske), Lopes propose de poursuivre l’idée de Gombrich, selon laquelle les images sont nécessairement sélectives
dans leur manière de représenter leurs depictum ;
la sélectivité des images constitue le caractère distinctif du contenu
pictural. La seconde, qui découle de la première, développe l’idée que la sélectivité
iconique nous montre la structure aspectuelle des images, et que celle-ci
permet de distinguer les systèmes picturaux entre eux, relativement aux aspects
qu’elles présentent, et des autres systèmes représentationnels.
Comme tout système représentationnel,
les images s’engagent différemment dans leur façon de représenter leur sujet,
mais rares sont les cas où le contenu représentationnel s’engage vis-à-vis de toutes les
propriétés de l’objet représenté. Ainsi elles peuvent s’engager ou non à
représenter telle ou telle propriété de l’objet :
Une
représentation (de toute sorte) est « engagée » vis-à-vis de la
propriété F pourvu qu’elle représente
son sujet soit comme étant F soit
comme étant non-F. Si elle ne
s’engage pas au sujet de la F-itude
[de son sujet], elle est « implicitement désengagée » vis-à-vis de F. Enfin, une représentation est
« explicitement désengagée » vis-à-vis de F quand elle représente son sujet comme ayant telle propriété (ou
telles propriétés) qui l’empêche d’être engagée vis-à-vis de F.
Ainsi, une image, comme une description,
peuvent s’engager à représenter, par exemple, les zébrures d’un zèbre. La
première en les dépeignant, la deuxième en les décrivant, ou du moins en les
mentionnant. Mais elles peuvent aussi se désengagées vis-à-vis des zébrures,
soit implicitement, c’est-à-dire en omettant de traiter cette propriété du
zèbre, soit explicitement, par un procédé qui empêche un engagement vis-à-vis
des zébrures. Seulement, seules les images peuvent se désengager explicitement
vis-à-vis d’une propriété de la manière dont elles le font. Une image peut se
désengager explicitement vis-à-vis des zébrures en dépeignant le zèbre prenant
un bain de boue ou vis-à-vis de la « chauvitude » d’un personnage en
lui faisant porter un chapeau. A contrario, une description ne peut se
désengager explicitement de cette façon, parce que décrire quelque chose comme
ayant telle propriété ne pose aucune limitation quant aux autres propriétés que
la description peut attribuer ou non à cette chose.
La sélectivité, comprise en termes
d’engagement vis-à-vis d’une ou de plusieurs propriétés, s’applique à toutes
les représentations, mais celle attribuée aux images est spécifique. Les images
nous montrent un aspect du monde, ou
plutôt, elles nous montrent la fabrication
d’un aspect du monde, c’est-à-dire le « schéma de saillance
visuelle » que crée l’ensemble des engagements et des désengagements
représentationnels. Les images se différencient entre elles selon les aspects
qu’elles présentent. Ainsi, « deux images présentent différents
« aspects » d’un objet si et seulement s’il y a au moins une
propriété vis-à-vis de laquelle l’une est engagée et l’autre non, ou bien [si]
l’une est explicitement désengagée et l’autre est implicitement
désengagée ».
Cependant, même si les désengagements
explicites peuvent présupposer un certain point de vue, les aspects présentés
ne reflètent pas nécessairement l’adoption d’un unique point de vue semblable à
celui qui pourrait être expérimenté en perception directe. Les images n’imitent
pas forcément les expériences visuelles ordinaires, elles peuvent combiner
plusieurs points de vue, comme c’est le cas des images cubistes, ou plus généralement
adopter des engagements et désengagements qui ne correspondent à aucune
expérience visuelle ordinaire. Les aspects ne sont pas purement spatiaux,
ceux-ci peuvent aussi concerner la couleur, ou encore la texture de l’image (un
tableau adoptant la technique de la perspective atmosphérique s’engagera d’une
façon particulière vis-à-vis des couleurs, graduellement de plus en plus
claires et estompées afin de rendre un certain effet de profondeur, au risque
de modifier les couleurs actuelles des objets). Plus que d’imiter simplement
les expériences visuelles ordinaires, les images présentent des aspects qui élargissent nos expériences visuelles.
Du fait que toutes les images
(figuratives) possèdent des propriétés spatiales (du moment qu’une image
représente au moins une chose se détachant d’un arrière plan, l’organisation de
ses aspects est forcément spatiale, du moins partiellement), on peut dire
qu’elles sont « aspectuellement structurées », que leur contenu présente un aspect « spatialement
unifié » de leurs sujets. La spécificité des propriétés spatiales engendre
nécessairement certain(s) point(s) de vue, et par conséquent le contenu iconique ne peut inclure toutes les propriétés spatiales de
l’objet représenté.
Lopes remarque que dans les théories
« standards » de la dépiction (perceptualisme et conventionnalisme),
les images sont individuées selon des caractéristiques invariantes
(ressemblance, analogicité). Or, ces théories isolent à chaque fois certaines
catégories d’images. Pour Lopes, les systèmes iconiques se distinguent entre
eux et des autres modes représentationnels en ce que les images sont
aspectuellement structurées et présentent différents types d’engagements :
[...]
si deux images sont engagées et désengagées vis-à-vis des mêmes types de
propriétés, alors elles appartiennent au même système, et les images
appartiennent à des systèmes différents seulement si elles sont engagées et désengagées
vis-à-vis de types de propriétés différents.
Par exemple, les images appartenant au
système albertien privilégient des engagements et des désengagements relatifs à
un point de vue unique, capturent l’aspect « optique » des objets
représentés. Les caricatures s’engagent à représenter exagérément les
propriétés de leurs sujets, en sacrifiant nécessairement les règles de proportionnalité.
La diversité picturale s’explique par les différentes façons dont les images
sélectionnent des aspects du monde, et ce sont les choix de types de propriétés
représentées qui déterminent des différences entre les systèmes picturaux.
Si les choix d’aspects visuellement
saillants constituent structurellement les contenus iconiques, et si ceux-ci
dérivent des aspects visuels que l’on notifie habituellement en perception
directe, alors l’identification des contenus iconiques repose sur les mêmes
mécanismes récognitionnels que l’expérience visuelle ordinaire.
Ce qui en découle n’est pas seulement
qu’une représentation picturale convoque des capacités récognitionnelles pour
les objets, les sortes d’objets, et des propriétés. Plutôt, la capacité à
reconnaître les sujets d’une image est une extension du dynamisme de la
récognition. Les images sont des prothèses visuelles ; elles élargissent
le système informationnel en collectant, en stockant et en transmettant une
information visuelle à propos de leurs sujets de façons qui dépendent mais
aussi qui augmentent notre capacité à identifier des choses par leur apparence.
[...] Néanmoins, ce serait une erreur de supposer que la récognition picturale
est identique à la récognition visuelle ordinaire. A la différence de la
récognition ordinaire, la récognition picturale opère à deux niveaux. Une image
est avant tout une surface plane couverte de marques, de couleurs, et de
textures [...] et représentent des scènes et des objets comme ayant certaines
propriétés. [...] A ce niveau, la récognition picturale peut être dite
« récognition de contenu », puisqu’elle consiste à la reconnaissance
de marques caractéristiques qui fabriquent un aspect de son sujet. A un second
niveau, les observateurs reconnaissent les contenus de l’image comme étant ses
sujets. Une
image-d’un-homme-faisant-le-V-de-la-victoire-avec-un-nez-busqué-et-des-bajoues-tombantes
est reconnue comme un aspect de Nixon – c’est la « recognition de
sujet ».
Fig. 1 et 2, Collossus by Richard Willson in the Sunday Times,
1985, and Charles Griffin in the Daily Mirror, 1990.
Ce passage est significatif en nous
montrant comment une théorie peut à la fois traiter de la perception d’une
image jusqu’à l’identification de son contenu. La dépiction implique clairement
des processus récognitionnels. Regarder une image, c’est convoquer des
capacités récognitionnelles déjà en gestation. La récognition picturale et la
récognition ordinaire partagent en effet un certain dynamisme : malgré les
déformations et les altérations (temporelles, physiques, etc.) que subissent
l’apparence des objets, la récognition corrige ces informations et maintient la
réussite de leur identification. Par conséquent, d’une certaine façon, la
récognition picturale est un cas extrême du dynamisme de la vision représentationnelle ordinaire, puisque les
aspects picturaux déforment souvent d’une manière ou d’une autre leurs sujets.
Ce dynamisme explique directement la générativité naturelle, c’est la capacité
d’adaptation et de correction de la récognition qui nous permet d’identifier un
sujet, de reconnaître une même chose sous différents aspects. Nos deux caricatures (fig. 1 et 2) présentent leur sujet
sous deux aspects très différents, leur contenu informationnel engendre des
interprétations différentes, pourtant nous sommes capables de les comprendre
comme étant des caricatures de la même personne. La vision représentationnelle
est donc une modalité de la vision ordinaire (c’est en sens qu’elle est
transparente), sans pour autant y être réductible, et ayant le pouvoir
d’élargir notre perception du monde.
La double dimension de la dépiction, le
fait qu’elle soit une surface (son contenu formel) et qu’elle implique l’indentification de son contenu
représentationnel, renvoie finalement à deux types de récognition. La première,
la récognition dite de contenu, renvoie à la perception des aspects formels de
la composition de l’image, autrement dit, à l’état informationnel qui prépare à
la reconnaissance de l’aspect sous lequel est présenté l’objet. La seconde, la
récognition de sujet, désigne la récognition en jeu dans le travail de
référence. Mais il ne s’agit pas d’affirmer que ces deux formes de récognition
sont strictement distinctes l’une de l’autre, mais plutôt que « la
recognition de contenu peut être informée simultanément par la récognition de
sujet ». De même que dans l’explication d’Evans, l’identification du
contenu pictural se fait à un niveau non-conceptuel (conscient ou inconscient),
et déclenche une capacité récognitionnelle essentiellement dynamique et
générative qui permet d’attribuer un contenu par voie de référence. Il est à
noter ici que même si Lopes précise la possibilité d’autres modes
d’identifications, toutes les identifications sont basiquement
récognitionnelles.
C’est bien la récognition qui est au cœur
de la représentation picturale. Ni les conventions, ni même les intentions de
l’artiste n’interviennent pertinemment dans la compréhension picturale. Les
conventions sont éliminées du fait de la nature aspectuelle des contenus
iconiques, et les intentions, bien qu’elles soient signifiantes pour saisir la
signification communicative de l’artiste, ne sont pas indispensables à la
compréhension de l’image.
Ainsi, la théorie de la récognition
aspectuelle ainsi dessinée semble satisfaire au moins les trois contraintes. La
contrainte de la diversité ne peut être vraiment satisfaite, puisque
l’explication s’est limitée intentionnellement aux images figuratives. Mais si
on considère que les images abstraites convoquent elles-aussi certaines
capacités cognitives et permettent une compréhension basée sur les informations
que nous livre sa surface, elles pourraient délimiter une classe spécifique et
parasite des systèmes picturaux, qui ne feraient référence à rien, sinon aux états
psychologiques, aux expériences subjectives de l’artiste. Une explication des
systèmes abstraits peut sans doute trouver des avantages dans une telle
théorie. Mis à part le cas complexe des images abstraites, la théorie avancée
par Lopes satisfait cette première contrainte par la structure aspectuelle des
contenus iconiques dont l’identification est garantie par le dynamisme de la
vision représentationnelle. La diversité se retrouve également dans la contrainte de
compétence. La générativité permet l’acquisition de capacités récognitionnelles
relatives à chaque système, pouvant déborder sur d’autres systèmes. La
compétence picturale s’explique par la générativité et le transfert, nous
permettant d’identifier toute sorte d’objets, y compris ceux que nous n’avons
jamais rencontré. La contrainte de la twofoldness
se retrouve quant à elle dans les deux sortes de récognition intimement liées
dans l’interprétation d’une image. Quant à la contrainte de la ressemblance,
elle est finalement traitée par la récognition comme étant relative aux
structures aspectuelles des différents systèmes iconiques, et résulte de la
compréhension iconique.
Ibid., p. 107 : ‘On this model, pictures are part of an information
system, individual pictures conveying perceptual information from their
subjects. A picture represent an object only if it conveys information from it
on the basis of which it can be identified. To understand pictures, viewers
must employ a specifically pictorial mode (or modes) of identification which
single out, on the basis of their content, the picture’s sources. This proposal
bears the marks of a hybrid theory. An object or kind of object is a picture’s subject
only if it served as the source of the information contained in the picture.
But a picture’s content plays an ineliminable role in its representing its
subject, for it is on the basis of its content that what we identify its subject.’