L’intelligence artificielle et l’essor de l’informatique optique
Minformations modernes La technologie (IL) repose sur la division du travail. Les photons transportent des données dans le monde entier et les électrons les traitent. Mais, avant les fibres optiques, les électrons faisaient les deux et certaines personnes espèrent compléter la transition en faisant en sorte que les photons traitent les données tout en les transportant.
Votre navigateur ne supporte pas le
Gagnez du temps en écoutant nos articles audio pendant que vous effectuez plusieurs tâches
Contrairement aux électrons, les photons (qui sont électriquement neutres) peuvent se croiser sans interagir, de sorte que les fibres de verre peuvent gérer de nombreux signaux simultanés d’une manière que les fils de cuivre ne peuvent pas. Un ordinateur optique pourrait également effectuer de nombreux calculs en même temps. L’utilisation de photons réduit également la consommation d’énergie. La résistance électrique génère de la chaleur, ce qui gaspille de l’énergie. Le passage des photons à travers les milieux transparents est sans résistance.
Pour que l’informatique optique se produise, cependant, l’architecture bien établie du traitement électronique numérique devrait être remplacée par des composants optiques équivalents. Ou peut être pas. Certaines personnes travaillent sur une nouvelle architecture optique qui utilise l’informatique analogique plutôt que numérique (c’est-à-dire qu’elle encode les données sous forme de signal continu plutôt que sous forme de bits discrets). À l’heure actuelle, cette architecture est la mieux adaptée à la résolution d’une classe particulière de problèmes, ceux d’une branche des mathématiques appelée algèbre linéaire. Mais c’est un marché potentiellement énorme, car l’algèbre linéaire est fondamentale, entre autres, pour les réseaux de neurones artificiels, et ceux-ci, à leur tour, sont fondamentaux pour l’apprentissage automatique et donc l’intelligence artificielle (IA).
La puissance de la matrice
L’algèbre linéaire manipule des matrices. Ce sont des grilles de nombres (représentant des coefficients d’équations simultanées) qui peuvent s’additionner et se multiplier un peu comme des nombres individuels. Parmi les choses qui peuvent être décrites par des matrices figurent les équations régissant le comportement du rayonnement électromagnétique (comme la lumière) qui ont été découvertes au 19e siècle par James Clerk Maxwell. Les lumières sous-jacentes à la nature maxwellienne facilitent, à l’aide de dispositifs de modulation appropriés, le codage des données matricielles en faisceaux lumineux, puis la manipulation de ces données.
Les réseaux de neurones artificiels sont des programmes qui représentent des couches de nœuds, dont les connexions représentent des nombres dans des matrices. Les valeurs de ceux-ci changent en réponse aux signaux entrants d’une manière qui entraîne une multiplication matricielle. Les résultats sont transmis à la couche suivante pour un autre cycle de traitement, et ainsi de suite, jusqu’à ce qu’ils arrivent à une couche de sortie finale, qui les synthétise en une réponse. Le résultat est de permettre à un réseau de reconnaître et d’apprendre des modèles dans les données d’entrée.
L’idée de rendre les réseaux de neurones optiques n’est pas nouvelle. Cela remonte aux années 1990. Mais ce n’est que maintenant que la technologie pour le rendre commercialement viable a vu le jour. L’une des personnes qui a observé cette transition est Demetri Psaltis, ingénieur électricien alors au California Institute of Technology (Caltech) et maintenant à l’Ecole polytechnique fédérale de Lausanne. Il a été parmi les premiers à utiliser les réseaux de neurones optiques pour la reconnaissance faciale.
Les réseaux de neurones de la jeunesse du Dr Psaltiss étaient superficiels. Ils n’avaient qu’une ou deux couches et quelques milliers de nœuds. De nos jours, les réseaux dits d’apprentissage en profondeur peuvent avoir plus de 100 couches et des milliards de nœuds. Pendant ce temps, les investissements de l’industrie des télécoms de la part de IL qui acheminent les données à travers toutes ces fibres optiques ont permis de fabriquer et de contrôler des systèmes optiques beaucoup plus complexes que ceux du passé.
C’est la poussée technologique. L’attraction financière découle de la réduction du coût de la grande quantité d’électricité consommée par les réseaux modernes à mesure qu’ils et les quantités de données qu’ils gèrent deviennent de plus en plus grandes.
La plupart des efforts pour construire des réseaux de neurones optiques n’ont pas entièrement abandonné les électrons, ils conservent pragmatiquement l’électronique le cas échéant. Par exemple, Lightmatter et Lightelligence, deux entreprises de Boston, Massachusetts, construisent des modulateurs hybrides qui multiplient les matrices ensemble en manipulant un signal codé optiquement en fonction de nombres renvoyés électroniquement. Cela permet de bénéficier du parallélisme pour l’entrée optique (qui peut être 100 fois supérieure à ce que l’électronique permettrait) tout en utilisant un kit plus conventionnel comme ce que Nicholas Harris, fondateur de Lightmatters, décrit comme le maître des marionnettes.
Les modulateurs eux-mêmes sont en silicium. Bien que ce ne soit pas le meilleur matériau absolu pour la modulation de la lumière, c’est de loin le mieux développé pour l’électronique. L’utilisation du silicium permet de fabriquer des puces hybrides avec des équipements conçus pour les conventionnels, voire de lui offrir une nouvelle vie. Car, comme l’observe Maurice Steinman, vice-président de l’ingénierie chez Lightelligence, bien que l’augmentation des performances de l’électronique depuis des décennies ralentisse, ce n’était que le début de la mise à l’échelle générationnelle de l’optique.
Point zéro
Ryan Hamerly et son équipe du Massachusetts Institute of Technology (l’organisation à partir de laquelle Lightelligence et Lightmatter sont issus) cherchent à exploiter la faible consommation d’énergie des dispositifs optiques hybrides pour les haut-parleurs intelligents, les drones légers et même les voitures autonomes. Un haut-parleur intelligent n’a pas les côtelettes informatiques et énergétiques pour exécuter des programmes d’apprentissage en profondeur par lui-même. Il envoie donc une version numérisée de ce qu’il a entendu sur Internet à un serveur distant qui en fait le traitement. Le serveur renvoie alors la réponse.
Tout cela prend du temps, cependant, et n’est pas sûr. Une puce optique placée dans un tel haut-parleur pourrait effectuer l’algèbre linéaire nécessaire sur-le-champ, avec une faible consommation d’énergie et sans avoir à transférer des données potentiellement sensibles ailleurs.
D’autres chercheurs, dont Ugur Tegin, de Caltech, estiment que le véritable avantage de l’informatique optique est sa capacité à gérer de grands ensembles de données. À l’heure actuelle, par exemple, les systèmes de reconnaissance d’images sont entraînés sur des images à faible résolution, car les versions haute résolution sont trop volumineuses pour qu’ils puissent les gérer efficacement, voire pas du tout. Tant qu’il y a un composant électronique dans le processus, la bande passante est limitée. La réponse du Dr Tegins est de renoncer complètement à l’électronique et d’utiliser une machine entièrement optique.
Cela s’est cependant avéré délicat car ce qui permet aux réseaux de neurones d’apprendre assez bien n’importe quel modèle qui leur est lancé est l’utilisation, en plus de tout le traitement linéaire, d’une fonction non linéaire dans chacun de leurs nœuds. Utiliser uniquement des fonctions linéaires signifierait que seuls des modèles linéaires pourraient être appris.
Heureusement, bien que la lumière se comporte principalement de manière linéaire, il existe une exception. Ceci, explique le Dr Tegin, se produit lorsqu’une impulsion extrêmement courte et intense de celle-ci est projetée à travers une fibre dite multimode, qui exploite plusieurs propriétés de la lumière pour améliorer sa capacité à transporter des signaux parallèles. Dans ces circonstances, le passage des impulsions modifie les propriétés du matériau lui-même, modifiant le comportement de la lumière passante de manière non linéaire.
Le Dr Tegin a exploité cette fonctionnalité dans ce qui est, sauf sa couche de sortie finale, un réseau tout optique. Il le décrit dans un article publié l’an dernier dans Science computationnelle de la nature. Il est capable de conserver toute l’information sous forme optique jusqu’à son arrivée à la dernière couche, celle où émerge la réponse. Ce n’est qu’alors qu’il est converti sous forme électronique, pour être traité par le réseau électronique plus simple et plus petit qui constitue cette couche.
Pendant ce temps, à l’Université de Californie à Los Angeles, Aydogan Ozcan adopte une autre approche du traitement matriciel tout optique. Dans un article publié dans Science en 2018, lui et ses collaborateurs décrivent comment créer des dispositifs optiques qui le font sans impliquer du tout d’électrons.
La magie réside ici dans l’utilisation de fines feuilles de verre spécialement fabriquées, chacune de la taille d’un timbre-poste, posées les unes sur les autres en piles analogues aux couches d’un réseau neuronal artificiel. Ensemble, ces feuilles diffractent la lumière entrante de la même manière qu’un tel réseau neuronal traiterait une image numérique.
Dans ce cas, l’optique fonctionne passivement, comme l’objectif d’un appareil photo, plutôt que de recevoir une rétroaction active. Le Dr Ozcan dit que cela offre des avantages en matière de sécurité. Le système ne capture jamais d’images ou n’envoie les données brutes que le résultat déduit. Il y a un compromis, cependant. Comme les feuilles ne peuvent pas être reconfigurées, elles doivent, si l’algorithme d’inférence change, être remplacées.
Reste à savoir jusqu’où ira l’informatique optique de ce type. Mais IA basé sur l’apprentissage en profondeur se développe rapidement, comme le brouhaha récent à propos de ChatGoogle Tag, un programme qui peut produire une prose passable (et même de la poésie) avec seulement un peu d’incitation, montre. Le matériel qui peut accélérer encore plus ce développement est donc susceptible de trouver la faveur. Ainsi, après des décennies de marasme, l’avenir de l’informatique optique s’annonce plutôt radieux.
Curieux du monde? Pour profiter de notre couverture scientifique époustouflante, inscrivez-vous à Simply Science, notre newsletter hebdomadaire réservée aux abonnés.