L’IA de jeu DeepMinds a battu un record vieux de 50 ans en informatique

C’est un résultat vraiment étonnant, déclare François Le Gall, mathématicien à l’université de Nagoya au Japon, qui n’a pas participé aux travaux. La multiplication matricielle est utilisée partout en ingénierie, dit-il. Tout ce que vous voulez résoudre numériquement, vous utilisez généralement des matrices.

Malgré l’ubiquité des calculs, il n’est toujours pas bien compris. Une matrice est simplement une grille de nombres, représentant tout ce que vous voulez. Multiplier deux matrices ensemble implique généralement de multiplier les lignes de l’une avec les colonnes de l’autre. La technique de base pour résoudre le problème est enseignée au lycée. C’est comme l’ABC de l’informatique, déclare Pushmeet Kohli, responsable de l’équipe DeepMinds AI for Science.

Mais les choses se compliquent lorsque vous essayez de trouver une méthode plus rapide. Personne ne connaît le meilleur algorithme pour le résoudre, dit Le Gall. C’est l’un des plus gros problèmes ouverts en informatique.

En effet, il existe plus de façons de multiplier deux matrices ensemble qu’il n’y a d’atomes dans l’univers (10 à la puissance 33, pour certains des cas examinés par les chercheurs). Le nombre d’actions possibles est quasiment infini, précise Thomas Hubert, ingénieur chez DeepMind.

L’astuce consistait à transformer le problème en une sorte de jeu de société en trois dimensions, appelé TensorGame. Le plateau représente le problème de multiplication à résoudre, et chaque mouvement représente la prochaine étape dans la résolution de ce problème. La série de coups effectués dans un jeu représente donc un algorithme.

Les chercheurs ont formé une nouvelle version d’AlphaZero, appelée AlphaTensor, pour jouer à ce jeu. Au lieu d’apprendre la meilleure série de mouvements à effectuer au Go ou aux échecs, AlphaTensor a appris la meilleure série d’étapes à effectuer lors de la multiplication de matrices. Il a été récompensé pour avoir remporté la partie en aussi peu de coups que possible.

Nous avons transformé cela en un jeu, notre type de framework préféré, explique Hubert, qui était l’un des principaux chercheurs d’AlphaZero.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite