La Chine développe une nouvelle puce basée sur la lumière qui pourrait alimenter l’intelligence artificielle générale – où l’IA est plus intelligente que les humains
Des scientifiques chinois ont conçu une minuscule puce modulaire alimentée par la lumière plutôt que par l’électricité – et ils souhaitent l’utiliser pour former et exécuter un futur modèle d’intelligence artificielle générale (AGI).
Le nouveau chiplet, appelé « Taichi », n’est qu’une petite pièce d’un puzzle plus large formé de nombreux chiplets individuels (y compris des modules Taichi) qui, ensemble, pourraient former un système informatique sophistiqué et puissant. S’il était suffisamment étendu, ce système serait suffisamment puissant pour former et gérer une AGI à l’avenir, affirment les scientifiques dans leur article publié le 11 avril dans la revue Science.
L’AGI est une hypothétique forme avancée d’intelligence artificielle (IA) qui serait, en théorie, tout aussi intelligente que les humains en termes de capacités de raisonnement cognitif. L’AGI pourrait être appliquée à de nombreuses disciplines, alors que les systèmes d’IA actuels ne peuvent être appliqués que de manière très étroite.
Certains experts estiment que de tels systèmes ne seront pas disponibles avant de nombreuses années, le goulot d’étranglement de la puissance de calcul étant un obstacle majeur, tandis que d’autres pensent que nous construirons un agent AGI dès 2027.
Ces dernières années, les scientifiques ont commencé à atteindre les limites des composants électroniques conventionnels, en particulier compte tenu de la croissance de l’IA et de la quantité d’énergie nécessaire pour entretenir ces systèmes de plus en plus exigeants.
En rapport: Une puce informatique alimentée par la lumière peut former l’IA beaucoup plus rapidement que les composants alimentés par l’électricité
Les unités de traitement graphique (GPU) sont devenues des composants clés dans la formation des systèmes d’IA, car elles sont plus efficaces pour effectuer des calculs parallèles que les unités centrales de traitement (CPU). Mais les niveaux de consommation d’énergie requis deviennent insoutenables à mesure que les systèmes deviennent plus grands, affirment les scientifiques.
Les composants basés sur la lumière pourraient constituer un moyen de surmonter les limites de l’électronique conventionnelle, notamment les problèmes d’efficacité énergétique.
À la recherche de la lumière pour une IA surhumaine
Les scientifiques ont déjà présenté la conception d’un nouveau type de puce photonique en février, qui utilise des photons, ou des particules de lumière, au lieu d’électrons pour faire fonctionner des transistors – de minuscules interrupteurs électriques qui s’allument ou s’éteignent lorsqu’une tension est appliquée. De manière générale, plus une puce possède de transistors, plus elle dispose de puissance de calcul et plus elle a besoin de puissance pour fonctionner. Les puces basées sur la lumière consomment beaucoup moins d’énergie et peuvent effectuer des calculs beaucoup plus rapidement que les puces traditionnelles, car elles peuvent effectuer des calculs en parallèle.
Les architectures actuelles de puces photoniques pour les modèles d’IA se composent de centaines ou de milliers de paramètres ou de variables d’entraînement. Cela les rend suffisamment puissants pour les tâches de base telles que la reconnaissance de formes, mais les grands modèles de langage (LLM) comme ChatGPT sont formés à l’aide de milliards, voire de milliards de paramètres.
Un agent AGI nécessiterait probablement des ordres de grandeur supérieurs, dans le cadre d’un réseau plus large d’architectures d’IA. Aujourd’hui, les plans pour construire un système AGI n’existent pas.
Dans la nouvelle étude, les scientifiques ont conçu Taichi pour qu’il fonctionne de la même manière que les autres puces basées sur la lumière, mais il peut être bien mieux adapté que les conceptions concurrentes, ont-ils déclaré dans leur article. En effet, elle combine plusieurs avantages des puces photoniques existantes, notamment « la diffraction et l’interférence optiques », qui sont des moyens de manipuler la lumière dans le composant.
Pour tester la conception, les chercheurs ont assemblé plusieurs chipsets Taichi et comparé leur architecture avec d’autres puces basées sur la lumière dans des domaines clés.
Leur architecture a atteint une échelle de réseau de 13,96 millions de neurones artificiels – contre 1,47 million dans la deuxième plus grande conception concurrente – avec une mesure d’efficacité énergétique de 160,82 billions d’opérations par watt (TOPS/W). Le deuxième meilleur résultat souligné dans leur article provient de recherche publiée en 2022, dans lequel une puce photonique a atteint 2,9 TOPS/W. De nombreuses unités de traitement neuronal (NPU) et autres puces conventionnelles atteignent bien en dessous de 10 TOPS/W.
Les chercheurs ont également affirmé que leur architecture basée sur Taichi est deux fois plus puissante que les autres systèmes photoniques, mais ils ne les ont pas directement cités. Pendant ce temps, lors des tests, ils ont utilisé le réseau distribué Taichi pour effectuer des tâches telles que la catégorisation et la classification des images, ainsi que la génération de contenu d’image, à titre de preuve de concept plutôt que pour évaluer les performances.
« Taichi indique le grand potentiel de l’informatique photonique sur puce pour traiter une variété de tâches complexes avec de grands modèles de réseau, ce qui permet des applications réelles de l’informatique optique », ont déclaré les scientifiques. « Nous prévoyons que Taichi accélérera le développement de solutions optiques plus puissantes en tant que support essentiel du modèle de base et d’une nouvelle ère d’AGI. »