Apprentissage en profondeur avec la lumière

Demandez à un appareil domestique intelligent les prévisions météo, et il faut plusieurs secondes pour que l’appareil réponde. L’une des raisons de cette latence est que les appareils connectés n’ont pas assez de mémoire ou de puissance pour stocker et exécuter les énormes modèles d’apprentissage automatique nécessaires pour que l’appareil comprenne ce qu’un utilisateur lui demande. Le modèle est stocké dans un centre de données qui peut se trouver à des centaines de kilomètres, où la réponse est calculée et envoyée à l’appareil.

Des chercheurs du MIT ont créé une nouvelle méthode pour calculer directement sur ces appareils, ce qui réduit considérablement cette latence. Leur technique déplace les étapes gourmandes en mémoire de l’exécution d’un modèle d’apprentissage automatique vers un serveur central où les composants du modèle sont encodés sur des ondes lumineuses.

Les ondes sont transmises à un appareil connecté à l’aide de la fibre optique, ce qui permet d’envoyer des tonnes de données à la vitesse de l’éclair à travers un réseau. Le récepteur utilise alors un dispositif optique simple qui effectue rapidement des calculs à partir des parties d’un modèle portées par ces ondes lumineuses.

Cette technique conduit à plus de cent fois l’amélioration de l’efficacité énergétique par rapport à d’autres méthodes. Cela pourrait également améliorer la sécurité, car les données d’un utilisateur n’ont pas besoin d’être transférées vers un emplacement central pour le calcul.

Cette méthode pourrait permettre à une voiture autonome de prendre des décisions en temps réel tout en n’utilisant qu’un infime pourcentage de l’énergie actuellement requise par les ordinateurs gourmands en énergie. Cela pourrait également permettre à un utilisateur d’avoir une conversation sans latence avec son appareil domestique intelligent, être utilisé pour le traitement vidéo en direct sur des réseaux cellulaires, ou même permettre une classification d’images à grande vitesse sur un vaisseau spatial à des millions de kilomètres de la Terre.

Chaque fois que vous voulez exécuter un réseau de neurones, vous devez exécuter le programme, et la vitesse à laquelle vous pouvez exécuter le programme dépend de la vitesse à laquelle vous pouvez diriger le programme depuis la mémoire. Notre tuyau est massif, il correspond à l’envoi d’un long métrage complet sur Internet toutes les millisecondes environ. C’est à quelle vitesse les données arrivent dans notre système. Et il peut calculer aussi vite que cela, explique l’auteur principal Dirk Englund, professeur agrégé au Département de génie électrique et d’informatique (EECS) et membre du Laboratoire de recherche en électronique du MIT.

Rejoindre Englund sur le papier est l’auteur principal et étudiant diplômé EECS Alexander Sludds; Saumil Bandyopadhyay, étudiant diplômé de l’EECS, le chercheur scientifique Ryan Hamerly, ainsi que d’autres personnes du MIT, du MIT Lincoln Laboratory et de Nokia Corporation. La recherche est publiée aujourd’hui dans La science.

Alléger la charge

Les réseaux de neurones sont des modèles d’apprentissage automatique qui utilisent des couches de nœuds connectés, ou neurones, pour reconnaître des modèles dans des ensembles de données et effectuer des tâches, comme la classification d’images ou la reconnaissance de la parole. Mais ces modèles peuvent contenir des milliards de paramètres de poids, qui sont des valeurs numériques qui transforment les données d’entrée au fur et à mesure de leur traitement. Ces poids doivent être stockés en mémoire. Dans le même temps, le processus de transformation des données implique des milliards de calculs algébriques, dont l’exécution nécessite une grande puissance.

Le processus de récupération des données (les poids du réseau de neurones, dans ce cas) de la mémoire et de leur déplacement vers les parties d’un ordinateur qui effectuent le calcul réel est l’un des principaux facteurs limitant la vitesse et l’efficacité énergétique, explique Sludds.

Donc, notre pensée était, pourquoi ne pas prendre tout ce lourd processus de récupération de milliards de poids de la mémoire, éloignez-le de l’appareil de périphérie et placez-le quelque part où nous avons un accès abondant à la puissance et à la mémoire, ce qui nous donne la capacité de récupérer ces poids rapidement? il dit.

L’architecture de réseau neuronal qu’ils ont développée, Netcast, consiste à stocker des poids dans un serveur central qui est connecté à un nouveau matériel appelé émetteur-récepteur intelligent. Cet émetteur-récepteur intelligent, une puce de la taille d’un pouce qui peut recevoir et transmettre des données, utilise une technologie connue sous le nom de photonique au silicium pour extraire des billions de poids de la mémoire chaque seconde.

Il reçoit des poids sous forme de signaux électriques et les imprime sur des ondes lumineuses. Étant donné que les données de poids sont codées sous forme de bits (1 et 0), l’émetteur-récepteur les convertit en commutant des lasers ; un laser est activé pour un 1 et désactivé pour un 0. Il combine ces ondes lumineuses, puis les transfère périodiquement via un réseau de fibres optiques afin qu’un périphérique client n’ait pas besoin d’interroger le serveur pour les recevoir.

L’optique est géniale car il existe de nombreuses façons de transporter des données dans l’optique. Par exemple, vous pouvez mettre des données sur différentes couleurs de lumière, ce qui permet un débit de données beaucoup plus élevé et une plus grande bande passante qu’avec l’électronique, explique Bandyopadhyay.

Billions par seconde

Une fois que les ondes lumineuses arrivent sur l’appareil client, un simple composant optique connu sous le nom de modulateur Mach-Zehnder à large bande les utilise pour effectuer un calcul analogique ultra-rapide. Cela implique de coder les données d’entrée de l’appareil, telles que les informations du capteur, sur les poids. Ensuite, il envoie chaque longueur d’onde individuelle à un récepteur qui détecte la lumière et mesure le résultat du calcul.

Les chercheurs ont trouvé un moyen d’utiliser ce modulateur pour effectuer des billions de multiplications par seconde, ce qui augmente considérablement la vitesse de calcul sur l’appareil tout en n’utilisant qu’une infime quantité d’énergie.

Afin de rendre quelque chose plus rapide, vous devez le rendre plus économe en énergie. Mais il y a un compromis. Nous avons construit un système qui peut fonctionner avec environ un milliwatt de puissance tout en effectuant des trillions de multiplications par seconde. En termes de vitesse et d’efficacité énergétique, c’est un gain de plusieurs ordres de grandeur, dit Sludds.

Ils ont testé cette architecture en envoyant des poids sur une fibre de 86 kilomètres qui relie leur laboratoire au MIT Lincoln Laboratory. Netcast a activé l’apprentissage automatique avec une grande précision de 98,7 % pour la classification des images et de 98,8 % pour la reconnaissance des chiffres à des vitesses rapides.

Nous avons dû faire quelques étalonnages, mais j’ai été surpris par le peu de travail que nous avions à faire pour obtenir une telle précision dès le départ. Nous avons pu obtenir une précision commercialement pertinente, ajoute Hamerly.

À l’avenir, les chercheurs souhaitent itérer sur la puce d’émetteur-récepteur intelligent pour obtenir des performances encore meilleures. Ils souhaitent également miniaturiser le récepteur, qui a actuellement la taille d’une boîte à chaussures, jusqu’à la taille d’une seule puce afin qu’il puisse s’adapter à un appareil intelligent comme un téléphone portable.

L’utilisation de la photonique et de la lumière comme plate-forme informatique est un domaine de recherche vraiment passionnant avec des implications potentiellement énormes sur la vitesse et l’efficacité de notre paysage des technologies de l’information, déclare Euan Allen, chercheur à la Royal Academy of Engineering de l’Université de Bath, qui était pas impliqué dans ce travail. Les travaux de Sludds et al. est une étape passionnante vers des implémentations réelles de tels dispositifs, introduisant un nouveau schéma pratique de calcul de pointe tout en explorant certaines des limitations fondamentales du calcul à des niveaux de lumière très faibles (photon unique).

La recherche est financée, en partie, par NTT Research, la National Science Foundation, le Air Force Office of Scientific Research, le Air Force Research Laboratory et le Army Research Office.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite