La percée de l’IA signifie que le meilleur pilote Gran Turismo au monde n’est pas humain
Sony Gran Turismo est l’une des plus grandes séries de jeux de course de tous les temps, ayant vendu plus de 80 millions d’exemplaires dans le monde. Mais aucun de ces millions de joueurs n’est le plus rapide.
Dans une nouvelle percée, une équipe dirigée par Sony AI, la division de recherche sur l’intelligence artificielle (IA) de la société, a développé un joueur entièrement artificiel alimenté par l’apprentissage automatique, capable non seulement d’apprendre et de maîtriser le jeu, mais aussi de surpasser les meilleurs joueurs humains du monde.
L’agent de l’IA, appelé Gran Turismo Sophy, a utilisé l’apprentissage par renforcement profond pour pratiquer le jeu (le Gran Turismo Sport édition), contrôlant jusqu’à 20 voitures à la fois pour accélérer la collecte de données et affiner sa propre amélioration.
Après seulement quelques heures à apprendre à contrôler la physique du jeu et à maîtriser à la fois la vitesse et le freinage pour rester sur la bonne voie, l’IA était plus rapide que 95 % des joueurs humains dans un ensemble de données de référence.
Pour ne pas être en reste avec ces 5% embêtants, GT Sophy a doublé.
« Il s’est entraîné pendant encore neuf jours ou plus, accumulant plus de 45 000 heures de conduite en réduisant des dixièmes de secondes, jusqu’à ce que ses temps au tour cessent de s’améliorer », explique l’équipe dans un nouveau document de recherche décrivant le projet.
« Avec cette procédure d’entraînement, GT Sophy a réalisé des performances de contre-la-montre surhumaines sur les trois pistes avec un temps au tour moyen à peu près égal au meilleur temps au tour humain enregistré. »
C’est loin d’être la première fois que nous voyons l’IA apprendre à surpasser les joueurs humains. Au fil des ans, les conquêtes se sont accumulées, divers agents cherchant à vaincre les simples mortels dans toutes sortes de jeux.
Atari, échecs, Starcraftle poker et le go ont peut-être tous été conçus par des mains humaines, mais les mains humaines ne sont plus les meilleures pour les jouer.
Bien sûr, ces jeux sont tous soit des jeux orientés stratégie, soit relativement simplistes en termes de gameplay (dans le cas des jeux Atari). Gran Turismo salué par ses fans non seulement comme un jeu vidéo, mais aussi comme un simulateur de conduite réaliste est un autre type de bête.
« De nombreuses applications potentielles de l’intelligence artificielle impliquent de prendre des décisions en temps réel dans des systèmes physiques tout en interagissant avec des humains », écrivent les chercheurs dans leur étude.
« La course automobile représente un exemple extrême de ces conditions ; les conducteurs doivent exécuter des manœuvres tactiques complexes pour dépasser ou bloquer leurs adversaires tout en conduisant leurs véhicules à leurs limites de traction. »
Cependant, pour les tests de GT Sophy, le défi ne consistait pas seulement à maîtriser les tactiques et la traction du jeu. L’IA devait également exceller dans l’étiquette de course en apprenant à surpasser ses adversaires dans le respect des principes de l’esprit sportif, en respectant les lignes de conduite des autres voitures et en évitant les collisions responsables.
En fin de compte, rien de tout cela ne s’est avéré être un problème. Dans une série d’événements de course organisés en 2021, l’IA a affronté certains des meilleurs au monde Gran Turismo joueurs, dont un triple champion, Takuma Miyazono.
Lors d’un concours en juillet, l’IA a battu les joueurs humains dans les contre-la-montre, mais n’a pas été victorieuse dans les courses en tête-à-tête. Après quelques optimisations par les chercheurs, l’agent a appris à améliorer encore ses performances et a facilement remporté un match revanche en octobre.
Malgré toutes les réalisations, les inventeurs de GT Sophy reconnaissent qu’il existe de nombreux domaines où l’IA pourrait encore s’améliorer, notamment en termes de prise de décision stratégique.
Même ainsi, dans l’un des jeux de course les plus avancés jamais sortis, c’est déjà un meilleur pilote que le meilleur d’entre nous.
Ce que cela signifie pour l’avenir reste inconnu, mais il est très possible qu’un jour des systèmes comme celui-ci puissent être utilisés pour contrôler des véhicules du monde réel avec une meilleure maniabilité que les conducteurs humains experts. Dans le monde virtuel, c’est déjà là.
« La course automobile simulée est un domaine qui nécessite un contrôle continu en temps réel dans un environnement à la physique complexe et très réaliste », concluent les chercheurs.
« Le succès de GT Sophy dans cet environnement montre, pour la première fois, qu’il est possible de former des agents IA qui sont meilleurs que les meilleurs coureurs humains sur une gamme de types de voitures et de pistes. »
Les découvertes sont rapportées dans Nature.