Un modèle hébbien de production de la parole (1999)

16 août 2022 19h41

« Thought as word dynamics », un commentaire de Paul Jorion sur « Words in the brain’s language » par Friedemann Pulvermüller

Behavioral and Brain Sciences, Volume 22, Issue 2, April 1999, pp. 253 – 279

DOI: https://doi.org/10.1017/S0140525X9900182X

Sommaire :

Un modèle hébbien de production de la parole ouvre un certain nombre de voies. Un schéma interlinguistique de relations fonctionnelles (inspiré d’Aristote) évite les distractions liées aux distinctions des « parties du discours », tout en comblant le fossé entre les mots de « contenu » et de « structure ». Un modèle de gradient identifie les dynamiques émotionnelles et rationnelles et montre la production de la parole comme un processus où l’insatisfaction du locuteur est minimisée.

La pensée comme dynamique de mots

L’article de Pulvermüller montre la puissance d’une approche hébbienne de la dynamique des mots. Premièrement, il rend compte de manière associationniste de la génération de phrases, où l’histoire antérieure d’un sujet parlant fournit le modèle pour les connexions ultérieures entre les concepts. Deuxièmement, grâce au mécanisme d’activation pondérée, une lumière originale est apportée sur la notion de signification. En effet, contrairement à la vision classique où la signification globale d’une phrase résulte d’un traitement sériel des mots qui la composent, dans le cadre hébbien, la signification d’une phrase est un ensemble global tridimensionnel de significations atomiques entremêlées fournies par les mots (le concept rappelle la notion scolastique de complexe significabile où les mots combinés évoquent un « état de choses » – voir Jorion 1997b). Une telle approche est proche de ce que la sémantique de langues comme le chinois impose au linguiste et souligne combien nos réflexions présentes dérivent souvent de la familiarité avec une seule langue indo-européenne.

Pulvermüller renoue avec l’approche « subsumptive » (voir Hogan 1998) du langage d’Aristote. Chez le philosophe grec, par étapes de signification sémantique croissante, les concepts sont d’abord associés par paires (pour constituer des propositions atomiques, puis moléculaires), sont ensuite composés en raisonnements (de nature syllogistique), et enfin concaténés en discours à part entière (voir Jorion 1996). Dans l’approche d’Aristote, notre distinction moderne des « parties du discours » est superficielle et sans conséquence fonctionnelle.

La dichotomie élémentaire de Pulvermüller entre « concret » et « abstrait » peut être utilement comblée en distinguant un ensemble de relations fonctionnelles ayant une validité interlinguistique. Celles-ci couvrent, premièrement, les relations entre les mots et le monde empirique, deuxièmement, entre les mots eux-mêmes, et troisièmement, entre l’univers des mots et la personne du sujet parlant. Voici un bref exposé de ces fonctions aristotéliciennes :

1) le monstratif, comme dans » ceci… « , » je… » (les shifters de Jakobson), établissant une relation directe entre les mots et les choses du monde empirique,

2) l’anaphorique, reliant un ou plusieurs mots à un ou plusieurs autres, préalablement énoncés : « lequel… », « comme mentionné précédemment… », « machin-chose », etc,

3) les catégorèmes, c’est-à-dire les collectifs universels, « mammifères », « personnes d’humeur aimable », qui abstraient des collections du monde empirique en concepts,

4) les déterminants (nos adjectifs, verbes, adverbes) – englobant les « modificateurs » chinois (« blanc », « à Santa Monica ») et les marqueurs d’appartenance (« le X du bateau », « elle »), restreignant les universels à une ou plusieurs instances spécifiques,

5) les syncatégorèmes : il s’agit de la copule, des connecteurs associatifs et des quantificateurs de la proposition atomique du logicien (« … sont… », « certains… ») ou des modulateurs de compatibilité (« malgré », « pendant ce temps, dans la forêt… »),

6) les marqueurs de continuité (« quelque temps avant », « alors »), une fonction distincte qui tente de saisir notre intuition maladroite du temps,

7) les surligneurs, utilisés pour souligner les parties de notre discours (« clairement », « Vous voyez ce que je veux dire ? », « un fameux… », « un sacré… »,

8) les marqueurs d’adhésion (« Je suis certain que… », « Je ne peux pas imaginer que… »), permettant au locuteur de spécifier un degré d’engagement personnel dans ses propres énoncés (allant de la citation sans engagement, « Quelqu’un m’a parlé de Jésus », à l’affirmation d’identification, « Je crois en Jésus ») (voir à ce sujet Jorion 1990 : chapitre 21 ; également Jorion 1996).

En plus de la logique « corrélationnelle » hébbienne qui régit les connexions entre les mots de contenu, Pulvermüller suggère la présence d’un second mécanisme neuronal (3.3.1), qui dissocie cette fois les mots de structure de la potentialité de la co-occurrence répétée. Ensemble, ces deux mécanismes constituent l’infrastructure requise pour l’approche fonctionnelle décrite ci-dessus.

Il est intéressant de noter que la perspective hébbienne réalise en soi une synthèse entre les dynamiques rationnelles et émotionnelles habituellement considérées comme des principes divergents de la génération du discours. J’ai montré (Jorion 1994) qu’un sujet, son histoire stockée en mémoire et un environnement constituent ensemble un espace unique de possibilités où le comportement vise constamment à minimiser un niveau d’insatisfaction. Un cadre pour le comportement est ainsi fourni, remplaçant les causes finales ( objectifs) par des causes efficientes dans un modèle de gradient où les intentions (et les soucis) constituent des puits potentiels. Le modèle du gradient s’applique à la parole comme à tout type de comportement. En effet, un mot est une trace mnésique comme celle potentiellement générée par tout percept ; il est associé – dans chacune de ses utilisations possibles – à une valeur d’affect. La dynamique émotionnelle de la production de la parole suit un gradient menant à la satisfaction du locuteur. Des circonstances extérieures – comme les paroles d’un interlocuteur dans une situation de dialogue où plusieurs dynamiques interagissent – ou intérieures – comme ses propres humeurs et sentiments – alimentent un tel processus continu que seule la mort peut interrompre (Jorion 1997a).

Ainsi se trouve justifiée une ligne d’approche esquissée par les positivistes allemands et les pragmatistes américains : la rationalité s’est développée pour l’espèce comme un moyen adaptatif de se sauvegarder, et l’exercice individuel de la rationalité contribue à soulager le stress émotionnel. Avec ANELLA (Associative Network with Emergent Logical and Learning Abilities), j’ai tenté de montrer comment l’énonciation de phrases matérialise, par nécessité, un mode de raisonnement grossièrement syllogistique, tout en procurant un apaisement au locuteur (Jorion 1989).

Références :

Hogan, James P. (1997) Mind Matters. Exploring the World of Artificial Intelligence, New York : Del Rey (Ballantine),

Jorion, Paul, (1989) An alternative neural network representation for conceptual knowledge, Paper presented at the British TELECOM, CONNEX Conference, Martlesham Heath, January 1990, 23 pp

Jorion, Paul (1990) Principes des systèmes intelligents, Collection « Sciences cognitives », Paris: Masson

Jorion, Paul (1994), L’intelligence artificielle au confluent des neurosciences et de l’informatique, Lekton, vol IV, 1994, N°2 : 85-114

Jorion, Paul (1996) La linguistique d’Aristote, in V. Rialle & D. Fisette (eds.), Penser l’esprit: Des sciences de la cognition à une philosophie cognitive, Grenoble : Presses Universitaires de Grenoble : 261-287

Jorion, Paul (1997a) Ce qui fait encore cruellement défaut à l’Intelligence artificielle, Informations In Cognito, No 7 : 1-4

Jorion, Paul (1997b) Jean Pouillon et le mystère de la chambre chinoise, L’Homme, 143 : 91-99

Intelligence Artificielle, Linguistique

Aristote, intelligence artificielle, linguistique

8 réponses à “Un modèle hébbien de production de la parole (1999)”

Khanard

16 août 2022 22h34

bonsoir à toutes et tous,
depuis que j’ai lu « principes de systèmes intelligents » il y a une question qui me taraude : quid des langues asiatiques (chinois,..etc) qui sont ce qu’on appelle en occident des sinogrammes et qui n’ont pas de conjugaison où la place des mots est importante.
il existe bien sûr les transcriptions mais est ce exploitable?

billet très intéressant.
merci

Répondre
kikou

17 août 2022 12h51

OK.

Mais du coup – si « la rationalité s’est [effectivement ] développée pour l’espèce comme un moyen adaptatif de se sauvegarder, et si l’exercice individuel de la rationalité contribue [ainsi] à soulager le stress émotionnel », Annela ne peut-elle formuler que des énoncés, et jamais de discours, Annela n’étant pas susceptible d’avoir une quelconque forme de « stress émotionnel », ce dernier étant toujours associé, en dernière alternative, à la présence d’un « instinct » de survie caractéristique des étants biologiques ?

Ou bien l’expérience Annela n’avait t-elle pour objectif que d’identifier un certain nombres de traits ou de dimensions intrinsèques au langage, (onto?)logiquement nécessaires, purement fonctionnels, et indépendant du mode d’existence des étants biologiques?

Au fond, Annela est il une entreprise de simulation de l’activité de production de discours, ou bien un dispositif expérimental destiné à valider une hypothèse déterminée relative à la structuration du langage humain ?
Répondre les 2 impliquerait sans doute de définir et de distinguer plus précisément les concepts de production d’énoncés (intelligibles) et de production d’une parole.

Répondre
1. Paul Jorion
  
  17 août 2022 20h54
  
  Il y a malentendu : le propre d’ANELLA est que les phrases sont produites en parcourant selon un dynamique d’affect un réseau mnésique qui s’est construit historiquement par un apprentissage progressif. ANELLA ne produit pas des « énoncés » comme le font les prétendues IA dont parle la presse qui ne font que reproduire des enchaînements probables trouvés dans d’immenses corpus.
  
  Ce « stress émotionnel » est l’ingrédient natif de la constitution de la mémoire d’ANELLA et le principe selon lequel elle choisit de dire ce qu’elle dit.
  
  Répondre
Khanard

17 août 2022 22h06

il y a une chose que j’ai du mal à comprendre est la suivante : comment un système d’apprentissage peut il traiter cette phrase « ce livre ouvert » et celle-ci » on lit en lui à livre ouvert ». Ou bien encore « je suis français et parle français » ?
Ne part on pas d’analogies ?

Répondre
Skinner

17 août 2022 23h05

Allez jeter un œil du côté du béhaviorisme et à « Verbal béhavior » de BF Skinner 😏. https://fr.m.wikipedia.org/wiki/Verbal_Behavior

Répondre
1. Paul Jorion
  
  18 août 2022 10h24
  
  Ma conférence « Les robots appellent ‘capteurs’ leur inconscient », le 23 novembre 2019 :
  
  Comment peut-on présenter quand même tout cela dans un modèle de type matérialiste et, là, j’ai vérifié, c’était quelque chose que je croyais savoir mais j’ai voulu vérifier. Quel est, quand on parle de behaviorisme et de [Burrhus Frederic] Skinner, l’inventeur du behaviorisme, quel est l’auteur le plus cité par Skinner ? C’est Sigmund Freud. Et j’avais entendu ça quelque part mais j’en ai la vérification … on trouve ça sur Wikipédia. Effectivement, entre un modèle de type purement pavlovien comme le modèle skinnérien, si on intègre l’imaginaire et le symbolique, je crois qu’il y a moyen effectivement d’avoir un modèle de type purement pavlovien. Et c’est ça que j’avais implémenté, comme on dit, dans la machine. C’est-à-dire qu’à partir du fait que si vous mettez une dynamique d’affect au centre, il n’y a aucune difficulté à connecter ça à la chaîne symbolique – ce sont les mots que vous inscrivez dans une base de données dans la machine – et que le sujet apparaisse effectivement comme quelque chose d’induit par la chaîne signifiante mais avec le filtre de sa dynamique, de sa dynamique d’affect.
  
  Répondre
kikou

18 août 2022 14h09

Merci pour votre réponse.

Ceci étant, je ne comprends pas bien, alors, ce qui justifie vraiment le choix de l’expression « stress émotionnel » pour décrire cet ingrédient « natif » de la constitution de la mémoire d’ANELLA.
Même questionnement pour le choix de l’expression « dynamique d’affects ».
Là où il n’y a pas de vie, parler d’ »émotions » ou d’ »affects » semble quand même très proche d’ un abus de langage.
Même en réduisant la « vie », dans le sens minimaliste, à une expérience d »’auto affection de la chair » (ce qui permet d’éviter la plupart des discussions oiseuses sur le statut ontologique d’une « conscience de soi »), il demeure un abîme entre cela et un « inconscient de capteurs ».

Est ce semblable à une IA de type alpha zéro, dans lequel l’énoncé des règles fait office de prescription des conditions de défaite à éviter?
Si oui, quelles sont les règles constitutives de la « dynamique d’affects » d’ANELLA?
Pour un organisme vivant, je suppose que c’est quelque que chose du type « être compris »/ »correctement interprété » ou « ne pas l’être » (ce qui équivaut souvent de fait à un risque mortel tant la coopération est importante pour la survie).
Mais je ne vois pas comment une fonction du type « être compris » peut-être codée/implémentée, le but du jeu « être compris » impliquant tout un arrière plan d’attentes et de validations possibles « dans le monde lui-même », en dehors du langage (par exemple « passe moi le sel »). Contrairement à ce qui se produit dans un jeu, où les anticipations et les résultats se matérialisent sur un même plan, extra-mondain, qui est « le jeu » lui même (par exemple : « Fou f4 »).

Je vais essayer de trouver l’ouvrage. « Principe… ». Ce sera surement bcp plus clair pour moi.

Répondre
1. Paul Jorion
  
  19 août 2022 9h31
  
  Lisez Principes des systèmes intelligents (1989 ; réédité 2012), la réponse à toutes vos questions s’y trouve.
  
  Répondre

Laisser un commentaire Annuler la réponse

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur la façon dont les données de vos commentaires sont traitées.

Contact

Contactez Paul Jorion

Tweets by PaulJorion

Blog de Paul Jorion