Ouvert aux commentaires.
Des chercheurs de UCLA viennent de publier* leur travail sur un dispositif étonnant, capable de reconnaître des objets de façon intelligente, par des moyens purement optiques.
Ces chercheurs ont fabriqué, par impression 3D, des réseaux de diffraction qui peuvent diriger la lumière émanant d’une scène quelconque vers un détecteur unique quand un objet d’une catégorie particulière est reconnu, intelligemment, et directement, par les réseaux de diffraction.
On remplace ainsi les millions de neurones formels informatiques habituellement requis pour ce genre de tâche, par des interférences lumineuses, qui réalisent les mêmes sortes de calculs. L’apprentissage est encodé dans la structure même des réseaux.
Pour l’instant, on utilise de la lumière à grande longueur d’onde (lumière térahertz), pour pouvoir la manipuler avec des réseaux macroscopiques faciles à imprimer en 3D, mais le principe est applicable à toute longueur d’onde, et surtout, on peut produire ces réseaux très facilement par pressage comme pour les disques vinyle, à des prix dérisoires.
Ceci aura certainement des répercussions technologiques et sociétales majeures. On peut s’attendre à voir bientôt des caméras de « vision intelligente » se répandre absolument partout en remplaçant éventuellement tous ceux dont le travail consistait, peu ou prou, à « voir intelligemment ». Un marqueur de plus pour une question souvent débattue sur ce blog…
Au-delà de l’intérêt technologique et sociétal, ce dispositif interpelle parce qu’il met en évidence que l’intelligence n’est pas une propriété des réseaux de neurones biologiques, ni des réseaux de transistors imitant les neurones, ni en fait de la matière sous quelque aspect que ce soit. Je suggère ici que c’est une propriété relationnelle et émergente de l’information elle-même, lorsqu’elle est suffisamment massive.
Dans cet exemple, on a d’un côté un réseau de diffraction où de l’information est massivement encodée, et de l’autre, une scène complexe, et la simple mise en relation des deux suffit à produire un fait d’intelligence.
Evitons d’emblée les problèmes de définition, et les distinctions, peu opérationnelles dans mon propos, entre l’intelligence vraie ou fausse, forte ou faible. J’appelle ici intelligence (faible donc) la capacité à distinguer des catégories abstraites dans des données concrètes, et je considère, à la suite de Paul Jorion (Principes des systèmes intelligents 1989), qu’elle devient forte lorsqu’elle s’intègre dans un sujet doté d’affects, comme par exemple, pour tous les êtres vivants issus de l’évolution, l’affect fondamental qui pousse à vouloir survivre (au moins tant que l’on n’a pas transmis ses gènes à la génération suivante).
Cette idée que l’intelligence est une propriété de l’information, et pas d’un matériel quelconque, était déjà implicite dans la communication de Naftali Tishby, « Information Theory of Deep Learning », à laquelle Paul Jorion a consacré un billet le 24 décembre 2017.
Tishby élucidait la formation de concepts ou de catégories, par des mécanismes de compression / généralisation de grandes quantités d’information, au sein d’un réseau de neurones formels profond.
Ce qui m’a frappé particulièrement dans ce magnifique travail, c’est qu’il n’était jamais question d’une matérialité quelconque. Le réseau profond considéré était un graphe pur, abstrait, autrement dit, de l’information. Naftali Tishby a montré que, mis en relation avec une autre très grande quantité d’information (les données analysées), le réseau peut produire une nouvelle information pertinente (la pertinence est bien sûr, elle aussi, une propriété relative), par itérations, compressions, reconfigurations relatives du signal et du bruit (toujours de l’information, et toujours de la relativité).
Vu de l’extérieur, et globalement, force est de constater que le résultat, intelligent, est l’expression de la confrontation d’une information massive avec une autre information massive, et rien d’autre. Peu importe le support. En revanche, le caractère massif est essentiel. Notre cerveau, par exemple, est le support d’une quantité colossale d’information, qu’il s’agisse de la mémoire accumulée, ou de la connectivité extraordinairement complexe. Pendant des décades, les réseaux de neurones formels n’ont rien produit de très remarquable, parce qu’ils n’étaient pas profonds, c’est-à-dire massifs.
Le dispositif optique de l’UCLA, qui reconnaît des catégories dans une scène est, dans cet ordre d’idées, très démonstratif. Il n’y a pas d’analogie directe avec des neurones, ce qui facilite la bascule intellectuelle nécessaire pour admettre le fait : ce n’est pas du matériel qui est en cause. Le matériel n’intervient que comme support. Ce qui est en cause, c’est de l’information en masse, en relation avec de l’information en masse.
Qu’est-ce que de l’information « en masse » ? Comment caractériser la propriété de « massivité » de l’information ?
De fait, cette propriété est intrinsèquement relative, comme le sont par exemple la vitesse ou l’échelle en physique. Une information n’est massive, ou complexe, que par rapport à une autre information (cf. complexité de Kolmogorov). Dans tout dispositif intelligent, il y aurait une propriété de relativité, à comprendre, entre les masses d’information confrontées et l’intelligence produite.
En réfléchissant à l’information, nous voyons partout de la relativité. Toute information est intrinsèquement relative, et ne se réalise que dans une relation. En dernière analyse, ce qui entre en relation est de l’information aussi, « supportée » physiquement, plus ou moins « complexe », plus ou moins « propre » (relation signal/bruit, dégradation entropique), etc.
A mon humble avis, ce qui serait fécond, ce serait d’unifier conceptuellement Relativité et Information. Je vois que la physique contemporaine s’y emploie de différentes façons, mais j’ai l’intuition que l’on pourrait aussi former, en partant de cette unification conceptuelle, une théorie générale de l’émergence, et implicitement, une théorie générale de l’intelligence, artificielle ou naturelle.
Inutile de préciser que, pour un tel programme, je me sens relativement (bien que naturellement) stupide ! 😉
Référence : UCLA engineers develop artificial intelligence device that identifies objects at the speed of light, Matthew Chin, le 2 août 2018
Laisser un commentaire