L’IA utilise le sommeil artificiel pour apprendre une nouvelle tâche sans oublier la dernière
De nombreuses IA ne peuvent devenir bonnes que dans une tâche, oubliant tout ce qu’elles savent si elles en apprennent une autre. Une forme de sommeil artificiel pourrait aider à empêcher que cela ne se produise
Technologie
10 novembre 2022
Les IA peuvent aussi avoir besoin de dormir Shutterstock/Photo au sol
L’intelligence artificielle peut apprendre et se souvenir comment effectuer plusieurs tâches en imitant la façon dont le sommeil nous aide à cimenter ce que nous avons appris pendant les heures de veille.
Il y a une énorme tendance maintenant à apporter des idées des neurosciences et de la biologie pour améliorer l’apprentissage automatique existant et le sommeil en fait partie, déclare Maxim Bazhenov de l’Université de Californie à San Diego.
De nombreuses IA ne peuvent maîtriser qu’un ensemble de tâches bien définies, elles ne peuvent pas acquérir de connaissances supplémentaires par la suite sans perdre tout ce qu’elles avaient appris précédemment. Le problème se pose si vous souhaitez développer des systèmes capables d’un soi-disant apprentissage tout au long de la vie, déclare Pavel Sanda de l’Académie tchèque des sciences en République tchèque. L’apprentissage tout au long de la vie est la façon dont les humains accumulent des connaissances pour s’adapter et résoudre les défis futurs.
Bazhenov, Sanda et leurs collègues ont formé un réseau de neurones à pointes, une grille connectée de neurones artificiels ressemblant à la structure du cerveau humain pour apprendre deux tâches différentes sans écraser les connexions apprises de la première tâche. Ils y sont parvenus en entrecoupant des périodes d’entraînement ciblées avec des périodes de sommeil.
Les chercheurs ont simulé le sommeil dans le réseau neuronal en activant les neurones artificiels du réseau selon un schéma bruyant. Ils se sont également assurés que le bruit inspiré du sommeil correspondait à peu près au schéma de déclenchement des neurones pendant les séances d’entraînement, un moyen de rejouer et de renforcer les connexions apprises des deux tâches.
L’équipe a d’abord essayé d’entraîner le réseau de neurones sur la première tâche, suivie de la deuxième tâche, puis enfin d’ajouter une période de sommeil à la fin. Mais ils se sont vite rendu compte que cette séquence effaçait encore les connexions de réseau de neurones apprises lors de la première tâche.
Au lieu de cela, des expériences de suivi ont montré qu’il était important d’avoir des sessions d’entraînement et de sommeil alternant rapidement pendant que l’IA apprenait la deuxième tâche, explique Erik Delanois de l’Université de Californie à San Diego. Cela a aidé à consolider les connexions de la première tâche qui auraient autrement été oubliées.
Des expériences ont montré comment un réseau de neurones à pointes formé de cette manière pouvait permettre à un agent d’IA d’apprendre deux modèles de recherche de nourriture différents en recherchant des particules de nourriture simulées tout en évitant les particules toxiques.
L’objectif de l’IA d’apprentissage tout au long de la vie est d’avoir la capacité de combiner différentes expériences de manière intelligente et d’appliquer cet apprentissage à de nouvelles situations, tout comme les animaux et les humains, explique Hava Siegelmann de l’Université du Massachusetts à Amherst.
Les réseaux de neurones à pointes, avec leur conception complexe d’inspiration biologique, ne se sont pas encore avérés pratiques pour une utilisation généralisée car il est difficile de les former, explique Siegelmann. Les prochaines grandes étapes pour montrer l’utilité de ces méthodes nécessiteraient des démonstrations avec des tâches plus complexes sur les réseaux de neurones artificiels couramment utilisés par les entreprises technologiques.
L’un des avantages des réseaux de neurones à pointes est qu’ils sont plus économes en énergie que les autres réseaux de neurones. Je pense qu’au cours de la prochaine décennie, il y aura une sorte de grande impulsion pour une transition vers une technologie de réseau plus pointue, déclare Ryan Golden de l’Université de Californie à San Diego. Il est bon de comprendre ces choses dès le début.
Référence de la revue : Biologie computationnelle PLOSDOI : 10.1371/journal.pcbi.1010628
Article modifié le 14 novembre 2022
Nous avons mis à jour la citation de Hava Siegelmann pour clarifier qu’elle parlait en général plutôt que spécifiquement du nouveau travail
En savoir plus sur ces sujets :