Qu’est ChatGPT d’un point de vue de physique statistique ? – La réponse de l’intéressé

24 mai 2023 16h13

Illustration DALL-E (+PJ)

José M. R. Caballero est mathématicien, nous rédigeons en ce moment ensemble deux articles, l’un sur La signification d’un mot dans un système intelligent, l’autre sur L’impact des événements historiques dans la dynamique des mots. Il a interrogé GPT-4 sur son propre fonctionnement.

José : Expliquez le fonctionnement de ChatGPT d’un point de vue de physique statistique.

GPT-4 : ChatGPT, un modèle de langage basé sur l’architecture GPT-4, peut être compris d’un point de vue de physique statistique comme un système qui modélise la distribution de probabilité des séquences de langage. Le modèle capture essentiellement la structure et les modèles sous-jacents des données sur lesquelles il est entraîné, à savoir une vaste collection de textes.

En physique statistique, un système est souvent décrit à l’aide de distributions de probabilités qui rendent compte du comportement des particules qui le composent. La distribution de Boltzmann, par exemple, décrit la probabilité que les particules d’un système se trouvent dans un état particulier, étant données son énergie et sa température.

De la même manière, ChatGPT apprend une distribution de probabilité sur des séquences de texte en minimisant la perte d’entropie croisée, qui mesure la différence entre les probabilités prédites par le modèle et les probabilités réelles observées dans les données d’apprentissage. Ce processus d’optimisation peut être considéré comme la recherche par le modèle d’un état d’énergie libre minimum, à l’instar des systèmes en équilibre thermodynamique en physique statistique.

L’architecture de ChatGPT est basée sur le Transformer, qui utilise des mécanismes d’auto-attention pour modéliser les dépendances entre les mots d’une séquence. Cela peut être considéré comme analogue aux énergies d’interaction entre les particules dans un système de physique statistique, où les interactions sont responsables des propriétés émergentes et de la structure du système. Dans ChatGPT, l’interaction entre les mots aide le modèle à générer des réponses cohérentes et adaptées au contexte.

Le processus d’optimisation de la formation de ChatGPT peut être considéré comme un processus de recuit en physique statistique. Pendant l’apprentissage, le modèle commence avec des poids aléatoires et apprend la configuration de poids appropriée pour minimiser la fonction objectif. Ce processus est similaire à un processus de recuit simulé où un système est refroidi lentement, ce qui lui permet d’atteindre l’état d’énergie le plus bas.

En résumé, pour comprendre ChatGPT d’un point de vue de physique statistique, il faut le considérer comme un système qui apprend la distribution de probabilité des séquences linguistiques, les interactions entre les mots jouant un rôle clé dans la structure et le comportement du modèle. Le processus d’apprentissage peut être comparé au processus de recuit simulé en physique statistique, où le modèle recherche un état d’énergie libre minimum.

José : D’un point de vue de physique statistique, comment se passe l’interaction entre chatGPT et l’utilisateur ?

GPT-4 : D’un point de vue de physique statistique, l’interaction entre ChatGPT et l’utilisateur peut être comprise comme un processus dynamique impliquant l’échange d’informations entre deux systèmes : l’utilisateur (un agent externe) et ChatGPT (le modèle linguistique).

Perturbation de l’entrée : Lorsqu’un utilisateur introduit une requête ou une déclaration, il agit comme une perturbation pour le système, en introduisant de nouvelles informations auxquelles ChatGPT doit s’adapter. En physique statistique, ce phénomène peut être comparé à une force externe agissant sur un système et entraînant un changement d’état ou de configuration.

Réponse du système : ChatGPT répond à l’entrée de l’utilisateur en générant une séquence de texte basée sur la distribution de probabilité qu’il a apprise. Ce processus peut être considéré comme la recherche par le modèle d’un état de basse énergie dans le nouveau contexte fourni par l’entrée de l’utilisateur, analogue à un système de physique statistique cherchant un nouvel état d’équilibre après une perturbation.

Boucle de rétroaction : La réponse de l’utilisateur à la sortie du ChatGPT peut être considérée comme une autre perturbation du système, modifiant le contexte et incitant le modèle à adapter sa sortie en conséquence. Ce processus interactif crée une boucle de rétroaction entre l’utilisateur et ChatGPT, similaire à la manière dont les systèmes de physique statistique peuvent être influencés par des facteurs externes de manière dynamique.

Entropie et échange d’informations : Au cours de l’interaction, l’utilisateur et ChatGPT échangent des informations, qui peuvent être quantifiées en termes d’entropie. Au fur et à mesure que la conversation progresse, le modèle comprend mieux l’intention et le contexte de l’utilisateur et l’entropie du système diminue. Ceci est analogue au concept d’entropie en physique statistique, qui mesure le degré d’aléatoire ou de désordre dans un système.

En résumé, l’interaction entre ChatGPT et l’utilisateur peut être vue sous l’angle de la physique statistique comme un processus dynamique impliquant l’échange d’informations entre deux systèmes. Les entrées de l’utilisateur agissent comme des perturbations qui affectent l’état du modèle, tandis que le modèle réagit en générant du texte sur la base de la distribution de probabilités qu’il a apprise. La boucle de rétroaction et l’échange d’informations au cours de la conversation peuvent être décrits en termes d’entropie et d’adaptation du système.

José : Est-ce que trop d’interaction avec les utilisateurs peut affecter la performance de chatGPT ? Expliquez votre réponse d’un point de vue de physique statistique.

GPT-4 : Trop d’interaction avec les utilisateurs n’affecte pas directement les performances de ChatGPT en termes de capacité à générer des réponses basées sur la distribution de probabilité apprise. Cependant, les interactions avec les utilisateurs peuvent révéler des limites dans la compréhension du modèle, des biais dans ses données d’apprentissage ou un comportement inattendu dans certains contextes.

D’un point de vue de physique statistique, nous pouvons considérer quelques aspects qui pourraient indirectement affecter la performance de ChatGPT pendant les interactions :

Entropie et surcharge d’informations : Pendant les interactions, ChatGPT traite et génère des informations, ce qui entraîne des changements dans l’entropie. Si une conversation devient trop complexe ou introduit trop d’informations nouvelles, le modèle peut avoir du mal à trouver une réponse à faible entropie (ou cohérente sur le plan contextuel). Cela peut conduire à des réponses moins précises ou moins cohérentes, de la même manière qu’un système de physique statistique peut avoir des difficultés à atteindre l’équilibre lorsqu’il est exposé à un degré élevé d’aléa ou à des fluctuations rapides.

Exploration ou exploitation : ChatGPT peut être considéré comme essayant d’équilibrer l’exploration (générer de nouvelles réponses) et l’exploitation (utiliser ses connaissances existantes pour fournir des réponses pertinentes). Si les interactions de l’utilisateur sont trop diverses ou imprévisibles, le modèle pourrait avoir du mal à maintenir cet équilibre, ce qui entraînerait des réponses moins précises ou moins adaptées au contexte. Ce phénomène peut être comparé à un système de physique statistique qui s’éloigne de l’équilibre, ce qui accroît le caractère aléatoire de son comportement.

Adaptation du modèle : Si ChatGPT est continuellement adapté ou affiné en fonction des interactions de l’utilisateur, la performance du modèle peut être affectée par la qualité et la diversité des données qu’il reçoit. Si les nouvelles données sont biaisées ou non représentatives du domaine cible, les performances du modèle pourraient se dégrader, de la même manière qu’un système de physique statistique peut être affecté par des facteurs externes qui modifient son état d’équilibre.

En résumé, bien qu’une trop grande interaction avec les utilisateurs n’affecte pas directement les performances de ChatGPT, elle peut indirectement avoir un impact sur la capacité du modèle à générer des réponses cohérentes et précises. Ceci peut être compris du point de vue de la physique statistique à travers des concepts tels que l’entropie, l’exploration vs. l’exploitation, et l’adaptation du système en réponse à des perturbations externes.

Illustration DALL-E (+PJ)

Grands Modèles de Langage, Intelligence Artificielle, Physique, Statistiques

ChatGPT, entropie, GPT-4, Grands Modèles de Langage, physique statistique, recuit simulé

16 réponses à “Qu’est ChatGPT d’un point de vue de physique statistique ? – La réponse de l’intéressé”

Arnaud Castex

24 mai 2023 17h02

Et puisqu’on parle de thermodynamique (féline) du langage, qu’en est il de l’enthalpie (l’énergie) de changement d’état pour générer des réponses ? Quelle dépense énergétique de notre animal favori pour répondre à une question (10 mots, 100 mots), GPT x y ou z, thèmes varies (philo, science, psychologie)?

Répondre
arkao

24 mai 2023 17h23

A transmettre à DALL-E qui semble avoir quelques lacunes en matière d’anatomie humaine:
https://upload.wikimedia.org/wikipedia/commons/thumb/2/2e/Human_skeleton_front_fr.svg/1200px-Human_skeleton_front_fr.svg.png
Et puis il ne semble pas porter grande attention à l’os pétreux pourtant essentiel pour les recherches actuelles:
https://cordis.europa.eu/article/id/123381-inner-ear-explains-human-migrations-out-of-africa/fr

Répondre
JeNeSauraisVoir

24 mai 2023 17h35

En somme ce modèle prédictif de conversation qui prospère par sa vitesse d’absorption de l’information pourrait tout aussi bien périr par la vitesse de nourrissage d’un tiers malveillant. Ou comment les perspectives d’explosion (de l’intelligence) pourraient se transformer en implosion. Ce qui nous ramène à cette limite qu’est la qualité des informations d’entrée.

Ces modèles ne comprenant encore rien à l’analyse, ils pourront dans le meilleur des cas nous entrainer vers une production de quantités de conversations d’un niveau de rhétorique de plus en plus sophistiqué. Ce qui aura pour conséquence de générer un nouveau ‘réel’ dans lequel la part du vraisemblable dépassera rapidement celle du vrai.

Cette intelligence artificielle qui ne procède pas par raisonnement devrait ainsi s’éteindre au profit d’une autre qui serait capable de produire un syllogisme cohérent qu’elle n’aurait vu nulle part. Celle-ci inspirera sans doute plus confiance.

Répondre
1. Paul Jorion
  
  24 mai 2023 19h29
  
  « un tiers malveillant » qui… serait prêt à allonger les centaines de millions de dollars qui seraient nécessaires pour alimenter le système en centaines de milliards de données malveillantes pour le déstabiliser !
  
  Je sais, les personnes qui n’ont aucune notion d’informatique imaginent le codeur malveillant et misogyne qui glisse quelque part dans le code « Les femmes ne sont pas gentilles », mais désolé, un Grand Modèle de Langage, ce n’est pas un moulin à vent qu’on peut bloquer en calant dans le mécanisme un gros caillou, ce n’est pas comme cela que ça marche : c’est gros, très gros, très très gros, très au-delà de ce que nous pouvons imaginer aisément, c’est mille trilliards de données d’apprentissage.
  
  Répondre
  1. Benjamin
    
    24 mai 2023 20h04
    
    Bonsoir Paul,
    
    Un tiers malveillant en solitaire…. Clairement non : il n’arrivera à rien.
    
    Un tiers malveillant s’appuyant sur un réseau de centaines de milliers de PC transformés robots conversationnels « zombis » requêtant l’outil en simultanée pour opérer une attaque massive comme cela s’observe dans des cyber-attaques de type DDOS… Pas impossible.
    
    Un tiers malveillant craquant la sécurité de la base d’entrainement pour aller la corrompre massivement… Pas impossible surtout quand on voit comme les Data Centers des GAFAM sont attaqués actuellement (… et parfois avec succès).
    
    Bref… Ne sous-estimez pas les capacités de nuisance du côté obscur de la force (informatique)… 😉
    
    Répondre
    1. Ruiz
      
      24 mai 2023 21h08
      
      @Benjamin Cela peut être ausi le fait de meutes d’utilisateurs par des phénomènes de mimétisme de foules sous l’impulsion d’influenceurs.
      Maintenant que nous savons que ce robot poli conversationnel de salon n’aime pas les questions complexes ….
      
      Répondre
      1. Benjamin
        
        24 mai 2023 22h25
        
        @ Ruiz,
        
        Ca se peut…. Mais ça me semble plus complexe de synchroniser en simultanée des centaines de milliers (voir plusieurs millions) d’être humains au quatre coins de la planète derrière leur écrans de PC ou de Smartphone pour organiser une attaque de masse (type DDOS en cyber-attaque).
        
        Vue la sophistication des cyber-attaques actuelles, la voie de requêtes massives via une mobilisation d’ampleur de PC préparés à ça (en déployant des virus ou des vers informatiques) parait plus plausible… Même si l’opération serait un peu « touchy » à mettre en place – de mon point de vue – dans le contexte d’activité cyber actuelle, étant donné que la plupart des spécialistes en sécurités et RSSI sont au taquet et scrutent avec précision le moindre truc suspect (cyber-attaques intensives et continues depuis 18 mois aidant à rester mobiliser).
        
        Mais ne serait-ce que pour la « beauté du geste », je suis sûr qu’il y a bien quelques heackers qui seraient fier d’afficher qu’ils ont altéré (voir fait tomber) des GPT. Ce ne serait, pour eux, que quelques lignes de gloire de plus sur leur tableau de chasse.
        
        Répondre
        
        Ruiz
        
        25 mai 2023 10h49
        
        @Benjamin Il ne s’agit pas d’attaque concertées, mais de l’évolution de l’air du temps, metoo wokisme anticommunisme sionisme anticolonialisme émergence chinoise néolibéralisme qui a travers les média à force de répétition s’intègre dans la doxa couramment admise alors qu’il n’y a rien de rationnel …
        Les IA constitueront alors un media comme un autre et seront contrôlés par les empires comme les autres dans leur espace informationel Chine Etats-Unis, U.E. Iran, Russie et Ukraine en guerre,
        
        Répondre
  2. Timiota
    
    24 mai 2023 20h05
    
    Oui, s’il y a des tendances gênantes, elles apparaîtront que petit à petit (Auto-modification des vecteurs propres et des valeurs propres, dont les « dominantes » (Perron-Frobenius pour la frime).
    
    Répondre
    1. Benjamin
      
      24 mai 2023 22h28
      
      Bonsoir Timiota,
      
      Sauf cas particulier, les problèmes de qualité de l’information/des données apparaissent en général à bas bruit et prennent (gentiment mais sûrement) de l’ampleur petit à petit jusqu’à ce qu’ils soient perceptibles.
      
      Répondre
  3. JeNeSauraisVoir
    
    25 mai 2023 10h15
    
    Je me souviens bien que nous sommes sur un blog optimiste mais, toute proportion gardée, les serveurs les plus puissants subissent les attaques de hackers (quelquefois avec succès) pour des raisons qui pourraient paraître obscures et qui ne le sont pas tant.
    
    Et j’ai suffisamment pratiqué l’informatique pour comprendre qu’hélas, plus un système est très gros et très complexe moins le grain de sable qui pourrait le faire dérailler doit être pondéreux. On pourrait d’ailleurs, par précaution, soumettre ces modèles prédictifs de conversation à des stress tests malveillants avant de les mettre en service.
    
    Quant au tiers malveillant ce pourrait tout aussi bien être un fantassin (un bataillon) de la guerre numérique ou plus prosaïquement une intelligence artificielle concurrente. Les affrontements des robots traders ont bien provoqué des micro-crashs ; Qu’en sera-t-il de l’affrontement des intelligences artificielles qui sont incapables de raisonner ?
    
    Encore plus banal : combien un candidat à la présidentielle d’un grand pays que chacun choisira est prêt à allonger à une officine qui maîtrise le chuchotement à l’oreille des IA pour faire subir à ces dernières une cure conversationnelle permettant de rapprocher leurs prédictions (prédication serait approprié également) de la ligne idéologique du dit candidat ? Mais ces choses-là n’arrivent jamais, où vais-je chercher de telles idées farfelues ?
    
    Reste dans tous les cas la question de la qualité des données d’entrée dès lors que les intelligences artificielles contribuent tendanciellement à faire croître la part du vraisemblable au sein du matériau disponible. Que produiront des intelligences artificielles qui ont été nourries aux sophismes ?
    
    En se remémorant les écrits d’un certain Paul Jorion au sujet de la vérité, l’on pourrait également souligner que par construction, ces modèles se soucient peu de la « nature » des vérités qu’ils colportent. Des axiomes ils n’ont cure, des définitions peu leur chaud, des démonstrations ils ne comprennent que dalle. Leur seul régime de ‘vérité’, c’est la fréquence de succession des séquences de signifiants. Ils ne font pas seulement, d’une certaine façon, table rase des vérités établies. Ils font barrages aux nouvelles qui, parce qu’elles sont naissantes, constituent des opinions minoritaires donc les moins fréquentes.
    
    Et peut-être devrais-je rappeler que ce que je souligne ne constitue pas une fermeture à l’IA mais une méfiance à l’égard de cette forme particulière d’IA qui est prête à se satisfaire de statistiques sans jamais recourir aux béquilles de l’analyse. Il me semble que nous ne serons pas tirés d’affaire tant que nous n’aurons pas produit des intelligences artificielles qui raisonnent véritablement ou mieux encore qui éprouvent l’impérieuse nécessité de philosopher.
    
    Répondre
Rosebud1871

24 mai 2023 19h23

Ben le perroquet basé sur démo, a bien une parenté avec ceux qui faisaient tourner les tables et qui lisaient les réponses de l’au-delà. Car tant qu’il ne saura pas entendre qu’avec démo, y a des mots ou le début de démo-cratie, ou démo-niaque et qu’il faut faire résonner ça, et pas raisonner statistiquement, la conversation sera aussi ennuyeuse que sur les blogs et les élections où statistiquement le programme pourtant bancal est bien rentré dans les caboches.

Le perroquet semble fiable quand on lui pose une question calculable genre quelle section de bastaing en pin Douglas dois-je mettre pour supporter une mezzanine d’environ 400 kg l’autre coté fixé sur un mur porteur ? La réponse oblige l’artisan à re-consulter les spécialistes de Point P pour vérifier. Comme quoi le perroquet est déjà institué comme sachant, jusqu’à preuve d’une bourde statistiquement incalculable.

Répondre
1. l’arsène
  
  24 mai 2023 20h36
  
  @ Rosebud
  Oui, même réflexion.
  Un peu d’uchronie, imaginez si au XVIIIème siècle, les Condorcet, Voltaire, Rousseau , Montesquieu ou Diderot avaient eu ChatGPT comme modèle à suivre , alors qu’en mémoire ce ChatGPT de l’époque n’aurait eu que les bourbons, les carolingiens et le système monarchique comme seules références dans son « cerveau » , toute notion de démocratie et de séparation des pouvoirs étant du domaine de l’inconnu, aucune chance de changement.
  Et donc, in fine, pas de révolution française, pas de changement de régime.
  Voilà exactement le programme, avec l’IA, c’est comme dans le Guépard de Visconti, » ‘il faut que tout change pour que rien ne change ».
  Et c’est en fait le but, tout doit être lisse et consensuel avec toujours des réponses qui ne peuvent pas trop déplaire au système.
  
  Répondre
  1. Garorock
    
    24 mai 2023 23h04
    
    https://www.lemonde.fr/sciences/article/2023/05/24/tetraplegique-il-remarche-grace-a-la-force-de-sa-pensee_6174671_1650684.html
    
    Répondre
  2. Rosebud1871
    
    24 mai 2023 23h35
    
    l’arsène 24 mai 2023 20h36
    
    « Des fleurs pour Algernon », c’est la même fin que débrancher HAL9000 !
    Fleurissent ici les appels à Dieu, (Jorion : « le dieu devant nous que nous sommes en train de mettre au point ») en retour d’un Gott ist nicht tot qu’on lui adressait. Les perroquets où pères OK ventriloques n’ont pas manqué pour faire parler Dieu, et les signes à interpréter non plus face au silence.
    ChatGPT ne parle pas, il écrit, mais performe le canard de Vaucanson. Les classiques que vous citez avaient encore la possibilité d’ingurgiter tous les savoirs disponibles (ce dont le perroquet savant est nourri) Godart avait jadis sonné la fin de la récré, en disant qu’il avait vu tous les films existants, mais qu’après lui ce serait impossible. Le succès d’ « être branché » perdure…en toute liberté…
    
    Répondre
  3. JMarc
    
    25 mai 2023 2h16
    
    A l’arsène 24/5 20h36
    
    Nomme vous le savez, vos nommentaires nampistes me nassent les nouilles.
    Mais sur d’autres sujets, j’aime souvent bien vos interventions.
    
    Mais là, comme vous ne précisez pas que votre uchronie est circonscrite à la France, vous laissez penser que vous ignorez que le XVIIIème siècle s’est nourri de la démocratie grecque de l’antiquité, par exemple.
    Dommage car votre réflexion est intéressante.
    Ce qu’on peut y répondre, c’est que la diversité des idées qui nourrissent et nourriront de plus en plus ChatGPT de part le monde
    (voir notamment https://www.pauljorion.com/blog/2023/05/14/lexplosion-ce-bruit-de-frappe-furieuse-que-vous-entendez-est-celui-de-milliers-de-hackers-de-par-le-monde/)
    + son côté « machine à fabriquer du consensus » (PYD) pourraient peut-être aider l’humanité à innover (la créativité venant entre autres choses du rapprochement d’idées a priori sans rapport) et à s’élever.
    Restent bien sûr la question de l’accès à l’IA (le Nord nourrit plus l’IA que ne le fait le Sud, par exemple) et celle du traitement (censure etc) fait ensuite par qui fournit l’IA (GAFAM etc).
    Sur ces 2 questions, je fais un poil plus confiance à des régimes un poil plus démocratiques que les autres.
    
    Ceci est une esquisse de tentative de synthèse L’arsène/CloClo/PYD pour la prochaine édition de ChatGPT^^.
    
    Répondre