Les victoires de l’IA dans Go Inspire Better Human Game Playing

En 2016, un ordinateur nommé AlphaGo a fait la une des journaux pour avoir vaincu le champion du monde de l’époque, Lee Sedol, à l’ancien et populaire jeu de stratégie Go. L’intelligence artificielle « surhumaine », développée par Google DeepMind, n’a perdu qu’une seule des cinq manches contre Sedol, générant des comparaisons avec la défaite aux échecs de Garry Kasparov en 1997 contre Deep Blue d’IBM. Le go, qui implique que les joueurs s’affrontent en déplaçant des pièces noires et blanches appelées pierres dans le but d’occuper un territoire sur le plateau de jeu, était considéré comme un défi plus insoluble pour un adversaire mécanique que les échecs.

La victoire d’AlphaGo a suscité beaucoup d’angoisse quant à la menace de l’IA pour l’ingéniosité et les moyens de subsistance humains, un peu comme ce qui se passe actuellement avec ChatGPT et ses proches. Lors d’une conférence de presse en 2016 après la perte, cependant, un Sedol modéré a offert un commentaire avec un noyau de positivité. « Son style était différent, et c’était une expérience tellement inhabituelle qu’il m’a fallu du temps pour m’adapter », a-t-il déclaré. « AlphaGo m’a fait réaliser que je dois étudier le Go davantage. »

Publicité

À l’époque, le champion d’Europe de go Fan Hui, qui avait également perdu une manche privée de cinq matchs contre AlphaGo des mois plus tôt, a déclaré Filaire que les matchs lui ont fait voir le jeu « complètement différemment ». Cela a tellement amélioré son jeu que son classement mondial a « monté en flèche », selon Filaire.

Le suivi formel du processus désordonné de la prise de décision humaine peut être difficile. Mais un record de plusieurs décennies de mouvements de joueurs professionnels de Go a donné aux chercheurs un moyen d’évaluer la réponse stratégique humaine à une provocation de l’IA. Une nouvelle étude confirme maintenant que les améliorations de Fan Hui après avoir relevé le défi AlphaGo n’étaient pas seulement un coup de chance. En 2017, après cette humble victoire de l’IA en 2016, les joueurs humains de Go ont eu accès à des données détaillant les mouvements effectués par le système d’IA et, d’une manière très humaine, ont développé de nouvelles stratégies qui ont conduit à des décisions de meilleure qualité dans leur jeu. Une confirmation des changements dans le jeu humain apparaît dans les conclusions publiées le 13 mars dans le Actes de l’Académie nationale des sciences des États-Unis.

« Il est étonnant de voir que les joueurs humains se sont adaptés si rapidement pour intégrer ces nouvelles découvertes dans leur propre jeu », déclare David Silver, chercheur principal chez DeepMind et chef du projet AlphaGo, qui n’a pas participé à la nouvelle étude. « Ces résultats suggèrent que les humains s’adapteront et s’appuieront sur ces découvertes pour augmenter massivement leur potentiel. »

Publicité

Pour déterminer si l’avènement de l’IA surhumaine a poussé les humains à générer de nouvelles stratégies de jeu, Minkyu Shin, professeur adjoint au département de marketing de la City University de Hong Kong, et ses collègues ont utilisé une base de données de 5,8 millions de mouvements enregistrés lors de jeux de De 1950 à 2021. Ce record, conservé sur le site Web Games of Go on Download, reflète chaque mouvement des jeux de Go joués dans les tournois dès le 19e siècle. Les chercheurs ont commencé à analyser les jeux à partir de 1950, car c’est l’année où les règles de Go modernes ont été établies.

Afin de commencer à parcourir le record massif de 5,8 millions de mouvements de jeu, l’équipe a d’abord créé un moyen d’évaluer la qualité de la prise de décision pour chaque mouvement. Pour développer cet indice, les chercheurs ont utilisé un autre système d’IA, KataGo, pour comparer les taux de réussite de chaque décision humaine à ceux des décisions de l’IA. Cette vaste analyse impliquait de simuler 10 000 façons dont le jeu pourrait se dérouler après chacune des 5,8 millions de décisions humaines.

Avec une cote de qualité pour chacune des décisions humaines en cours, les chercheurs ont ensuite développé un moyen de déterminer exactement quand une décision humaine pendant un jeu était nouvelle, ce qui signifie qu’elle n’avait pas été enregistrée auparavant dans l’histoire du jeu. Les joueurs d’échecs utilisent depuis longtemps une approche similaire pour déterminer quand une nouvelle stratégie dans le jeu émerge.

Publicité

Dans l’analyse de la nouveauté du jeu de Go, les chercheurs ont cartographié jusqu’à 60 mouvements pour chaque jeu et ont marqué quand un nouveau mouvement a été introduit. S’il émergeait, disons, au 9e coup dans un jeu mais pas avant le 15e coup dans un autre, alors le premier jeu aurait un indice de nouveauté plus élevé que le second. Shin et ses collègues ont découvert qu’après 2017, la plupart des mouvements que l’équipe définissait comme un roman se produisaient au 35e mouvement.

Les chercheurs ont ensuite examiné si le timing des nouveaux mouvements dans le jeu était suivi d’une qualité accrue des décisions – si de tels mouvements amélioraient réellement l’avantage d’un joueur sur le plateau et la probabilité d’une victoire. Ils voulaient surtout voir ce qui, le cas échéant, était arrivé à la qualité des décisions après qu’AlphaGo ait battu son challenger humain Sedol en 2016 et une autre série de challengers humains en 2017.

L’équipe a découvert qu’avant que l’IA ne batte les champions humains de Go, le niveau de qualité de la décision humaine est resté assez uniforme pendant 66 ans. Après cette période fatidique de 2016-2017, les scores de qualité des décisions ont commencé à grimper. Les humains faisaient de meilleurs choix de jeu – peut-être pas assez pour battre systématiquement les IA surhumaines, mais toujours mieux.

Publicité

Les scores de nouveauté ont également augmenté après 2016-2017 grâce aux humains introduisant de nouveaux mouvements dans les jeux plus tôt au cours de la séquence de jeu. Et dans leur évaluation du lien entre les nouveaux mouvements et les décisions de meilleure qualité, Shin et ses collègues ont découvert qu’avant qu’AlphaGo ne réussisse contre les joueurs humains, les nouveaux mouvements des humains contribuaient moins à des décisions de bonne qualité, en moyenne, que les mouvements non nouveaux. Après ces victoires historiques de l’IA, les nouveaux mouvements introduits par les humains dans les jeux ont contribué plus en moyenne que les mouvements déjà connus à de meilleurs scores de qualité de décision.

Une explication possible de ces améliorations est que les humains mémorisaient de nouvelles séquences de jeu de mouvements. Dans l’étude, Shin et ses collègues ont également évalué dans quelle mesure la mémorisation pouvait expliquer la qualité des décisions. Les chercheurs ont découvert que la mémorisation n’expliquerait pas complètement les améliorations de la qualité des décisions et qu’il était « peu probable » qu’elle sous-tende la nouveauté accrue observée après 2016-2017.

Murat Kantarcioglu, professeur d’informatique à l’Université du Texas à Dallas, affirme que ces résultats, combinés aux travaux que lui et d’autres ont effectués, montrent que « de toute évidence, l’IA peut aider à améliorer la prise de décision humaine ». Kantarcioglu, qui n’a pas participé à l’étude actuelle, affirme que la capacité de l’IA à traiter de « vastes espaces de recherche », tels que tous les mouvements possibles dans un jeu complexe tel que Go, signifie que l’IA peut « trouver de nouvelles solutions et approches aux problèmes ». .” Par exemple, une IA qui signale l’imagerie médicale comme évocatrice d’un cancer pourrait amener un clinicien à regarder de plus près qu’auparavant. « Cela fera à son tour de la personne un meilleur médecin et évitera de telles erreurs à l’avenir », dit-il.

Publicité

Un hic – comme le monde le voit en ce moment avec ChatGPT – est la question de rendre l’IA plus fiable, ajoute Kantarcioglu. « Je crois que c’est le principal défi », dit-il.

Dans cette nouvelle phase de préoccupations concernant ChatGPT et d’autres IA, les résultats offrent « une perspective pleine d’espoir » sur le potentiel de l’IA à être un allié plutôt qu’un « ennemi potentiel dans notre cheminement vers le progrès et l’amélioration », Shin et ses co-auteurs écrit dans un e-mail à Scientifique Américain.

« Mes co-auteurs et moi menons actuellement des expériences de laboratoire en ligne pour explorer comment les humains peuvent améliorer leurs invites et obtenir de meilleurs résultats avec ces programmes », déclare Shin. « Plutôt que de considérer l’IA comme une menace pour l’intelligence humaine, nous devrions l’adopter comme un outil précieux qui peut améliorer nos capacités. »

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite