L’IA générative concevra elle-même de nouveaux médicaments dans un avenir proche
Diogo Rau, directeur de l’information et du numérique d’Eli Lilly, a récemment participé à certaines expériences au sein du bureau, mais pas au travail de recherche sur les médicaments typique auquel on pourrait s’attendre dans le laboratoire de bricolage d’une grande société pharmaceutique.
Lilly utilise l’IA générative pour rechercher des millions de molécules. L’IA étant capable d’évoluer à une vitesse de découverte qui peut générer en cinq minutes autant de molécules que Lilly pourrait en synthétiser en une année entière dans des laboratoires humides traditionnels, il est logique de tester les limites de l’intelligence artificielle en médecine. Mais il n’y a aucun moyen de savoir si l’abondance de conceptions générées par l’IA fonctionnera dans le monde réel, et c’est un sujet sur lequel les dirigeants d’entreprise sceptiques voulaient en savoir plus.
Les principales conceptions biologiques générées par l’IA, des molécules que Rau a décrites comme ayant des « structures d’apparence étrange » qui ne pouvaient pas être comparées à grand-chose dans la base de données moléculaire existante de l’entreprise, mais qui ressemblaient à des candidats médicaments potentiellement puissants, ont été confiées aux chercheurs scientifiques de Lilly. Les dirigeants, dont Rau, s’attendaient à ce que les scientifiques rejettent les résultats de l’IA.
« Ils ne peuvent pas être aussi bons ? » il se souvenait avoir réfléchi avant de présenter les résultats de l’IA.
Les scientifiques étaient censés signaler tout ce qui n’allait pas dans les conceptions générées par l’IA, mais ce qu’ils ont proposé en réponse a été une surprise pour les dirigeants de Lilly : « ‘C’est intéressant ; nous n’avions pas pensé à concevoir une molécule de cette façon' », se souvient Rau. », ont-ils déclaré en racontant cette histoire, jusqu’alors inédite, aux participants au Sommet du Conseil exécutif technologique de CNBC en novembre dernier.
« C’était une révélation pour moi », a déclaré Rau. « Nous parlons toujours de former les machines, mais un autre art est celui où les machines produisent des idées basées sur un ensemble de données que les humains n’auraient pas pu voir ou visualiser. Cela stimule encore plus de créativité en ouvrant des voies de développement médical que les humains pourraient je n’aurais pas exploré autrement. »
Selon des dirigeants travaillant à l’intersection de l’IA et des soins de santé, le domaine est sur une trajectoire qui verra dans un avenir proche des médicaments entièrement générés par l’IA ; selon certains, d’ici quelques années tout au plus, cela deviendra une norme en matière de découverte de médicaments. L’IA générative accélère rapidement son applicabilité au développement et à la découverte de nouveaux médicaments, dans une démarche qui remodèlera non seulement l’industrie pharmaceutique, mais aussi les idées de base intégrées à la méthode scientifique depuis des siècles.
Quand DeepMind de Google a brisé le moule des protéines
Le moment où cette trajectoire est devenue claire pour la première fois, c’était des années avant que ChatGPT ne perce dans la conscience publique. C’était « le moment AlphaFold » en 2021, selon Kimberly Powell, vice-présidente des soins de santé chez Nvidia, lorsque l’unité DeepMind AI de Google, devenue célèbre pour avoir montré à quel point la pensée créative de l’IA pouvait être différente de celle des humains dans le jeu de stratégie chinois de Go a été le pionnier de l’application des grands modèles de langage d’IA à la biologie. « AlphaFold a été ce moment charnière où nous avons pu entraîner ces modèles de transformateurs avec de très grands ensembles de données et passer de la séquence d’acides aminés à une structure protéique, qui est au cœur du développement et de la conception de médicaments », a déclaré Powell.
Les progrès liés à l’IA ont lieu dans un domaine de la biologie qui est de plus en plus numérisé à ce que Powell décrit comme « des échelles et des résolutions sans précédent ».
Il s’agit d’une révolution médicale qui comprend la génomique spatiale analysant des millions de cellules dans les tissus, en 3D, et la création de modèles d’IA qui bénéficient spécifiquement d’un catalogue de produits chimiques déjà sous forme numérique qui permet désormais aux modèles de transformateurs génératifs d’IA de fonctionner. eux. « Cette formation peut être réalisée en utilisant un apprentissage non supervisé et auto-supervisé, et elle peut être réalisée non seulement rapidement mais aussi de manière imaginative : l’IA peut ‘penser’ à des modèles de médicaments qu’un humain ne pourrait pas imaginer », a déclaré Powell.
Une analogie pour comprendre le développement des médicaments contre l’IA peut être trouvée dans les mécanismes de ChatGPT. « Il a essentiellement été formé sur chaque livre, chaque page Web, chaque document PDF, et il a encodé la connaissance du monde de telle manière que vous pouvez lui poser des questions et générer des réponses », a déclaré Powell.
La version GPT de la découverte de médicaments
La découverte de médicaments est un processus consistant à observer des interactions et des changements dans le comportement biologique, mais ce qui prendrait des mois, voire des années, en laboratoire, peut être représenté dans des modèles informatiques simulant le comportement biologique traditionnel. « Et lorsque vous pouvez simuler leur comportement, vous pouvez prédire comment les choses pourraient fonctionner ensemble et interagir », a-t-elle déclaré. « Nous avons désormais cette capacité de représenter le monde de la biologie et de la chimie des médicaments parce que nous disposons de superordinateurs IA utilisant l’IA et une méthode de type GPT, et avec toutes les données de biologie numérique, nous pouvons représenter le monde des médicaments dans un ordinateur pour le toute première fois. »
Il s’agit d’un changement radical par rapport à la méthode empirique classique qui a dominé le siècle dernier dans la découverte de médicaments : une expérimentation approfondie, une collecte ultérieure de données, une analyse des données à un niveau humain, suivie d’un autre processus de conception basé sur ces résultats. Expérimentation dans les murs d’une entreprise suivie de plusieurs points de décision qui, espèrent les scientifiques et les dirigeants, aboutiront à des essais cliniques réussis. « C’est un processus très artisanal », a déclaré Powell. En conséquence, il s’agit d’un processus de découverte de médicaments qui connaît un taux d’échec de 90 %.
Les partisans de l’IA pensent que cela permettra de gagner du temps et d’améliorer les taux de réussite, en transformant le processus classique en une ingénierie plus systématique et reproductible, permettant aux chercheurs en médicaments de s’appuyer sur un taux de réussite plus élevé. Citant les résultats d’études récentes publiées dans Nature, Powell a noté qu’Amgen a découvert qu’un processus de découverte de médicaments qui aurait pu prendre des années peut être réduit à quelques mois grâce à l’IA. Plus important encore, étant donné le coût du développement de médicaments, qui peut varier de 30 à 300 millions de dollars par essai, le taux de réussite a bondi lorsque l’IA a été introduite très tôt dans le processus. Après un processus de développement traditionnel de deux ans, la probabilité de succès était de 50/50. À la fin du processus plus rapide augmenté par l’IA, le taux de réussite est passé à 90 %, a déclaré Powell.
« Nous prévoyons que les progrès dans la découverte de médicaments devraient s’accélérer considérablement », a déclaré Powell. Certains des défauts constatés de l’IA générative, sa propension à « halluciner » par exemple, pourraient s’avérer puissants dans la découverte de médicaments. « Au cours des dernières décennies, nous avons en quelque sorte regardé les mêmes cibles, mais et si nous pouvions utiliser l’approche générative pour ouvrir de nouvelles cibles ? » elle a ajouté.
De nouvelles drogues « hallucinantes »
La découverte de protéines en est un exemple. L’évolution biologique fonctionne en identifiant une protéine qui fonctionne bien, puis la nature continue son chemin. Il ne teste pas toutes les autres protéines qui peuvent également fonctionner, ou mieux fonctionner. L’IA, en revanche, peut commencer son travail avec des protéines inexistantes au sein de modèles, une approche qui serait intenable dans un modèle empirique classique. En chiffres, l’IA a un ensemble de découvertes bien plus importantes à explorer. Avec un nombre potentiel de protéines qui pourraient agir comme une thérapie essentiellement infinie, Powell a déclaré que 10 à la puissance 160, ou dix avec cent soixante zéros, la limite actuelle de travail avec les protéines que la nature a donnée à l’humanité est explosée. « Vous pouvez utiliser ces modèles pour halluciner des protéines qui pourraient avoir toutes les fonctions et caractéristiques dont nous avons besoin. Cela peut aller là où un esprit humain ne le ferait pas, mais un ordinateur le peut », a déclaré Powell.
L’Université du Texas à Austin a récemment acheté l’un des plus grands clusters informatiques NVIDIA pour son nouveau Center for Generative AI.
« Tout comme ChatGPT est capable d’apprendre à partir de chaînes de lettres, les produits chimiques peuvent être représentés sous forme de chaînes, et nous pouvons en tirer des leçons », a déclaré Andy Ellington, professeur de biosciences moléculaires. L’IA apprend à distinguer les drogues des non-drogues et à créer de nouvelles drogues, de la même manière que ChatGPT peut créer des phrases, a déclaré Ellington. « Comme ces progrès sont associés aux efforts continus visant à prédire les structures des protéines, il devrait bientôt être possible d’identifier des composés de type médicament pouvant être adaptés à des cibles clés », a-t-il déclaré.
Daniel Diaz, chercheur postdoctoral en informatique qui dirige le groupe sur les protéines profondes à l’Institut des fondations de l’apprentissage automatique de l’UT, a déclaré que la plupart des travaux actuels d’IA sur les médicaments sont centrés sur la découverte de petites molécules, mais il pense que l’impact le plus important résidera dans le développement de de nouveaux produits biologiques (médicaments à base de protéines), pour lesquels il voit déjà comment l’IA peut accélérer le processus de recherche des meilleures conceptions.
Un groupe de l’UT Austin mène actuellement des expérimentations animales sur un produit thérapeutique contre le cancer du sein, une version modifiée d’une protéine humaine qui dégrade un métabolite clé dont dépend le cancer du sein, essentiellement pour l’affamer. Traditionnellement, lorsque les scientifiques ont besoin d’une protéine à des fins thérapeutiques, ils recherchent plusieurs caractéristiques, notamment des protéines stables qui ne se désagrègent pas facilement. Cela nécessite que les scientifiques introduisent le génie génétique pour modifier une protéine, un processus fastidieux en laboratoire pour cartographier la structure et identifier, parmi toutes les modifications génétiques possibles, les meilleures options.
Désormais, les modèles d’IA aident à affiner les possibilités, de sorte que les scientifiques connaissent plus rapidement les modifications optimales à essayer. Dans l’expérience citée par Diaz, l’utilisation d’une version améliorée par l’IA et plus stable a entraîné une multiplication par sept du rendement de la protéine, de sorte que les chercheurs se retrouvent avec plus de protéines à tester, à utiliser, etc. « Les résultats semblent très prometteurs. , » il a dit. Et comme il s’agit d’une protéine d’origine humaine, les risques que les patients deviennent allergiques au médicament et que les réactions allergiques aux médicaments à base de protéines constituent un gros problème sont minimisés.
La récente publication par Nvidia de ce qu’elle appelle des « microservices » pour les soins de santé basés sur l’IA, y compris pour la découverte de médicaments, un élément de ses ambitions agressives en matière d’adoption de l’IA dans le secteur de la santé, permet aux chercheurs de rechercher des milliards de composés médicamenteux et de prédire les structures des protéines. La société de conception de logiciels informatiques Cadence intègre Nvidia AI dans une plate-forme de conception moléculaire qui permet aux chercheurs de générer, rechercher et modéliser des bibliothèques de données contenant des centaines de milliards de composés. Il offre également des capacités de recherche liées au modèle protéique AlphaFold-2 de DeepMind.
« AlphaFold est difficile à utiliser pour un biologiste, c’est pourquoi nous l’avons simplifié », a déclaré Powell. « Vous pouvez accéder à une page Web et saisir une séquence d’acides aminés et la structure réelle apparaît. Si vous deviez faire cela avec un instrument, l’instrument vous coûterait 5 millions de dollars, et vous en auriez besoin de trois. [full-time equivalent workers] ETP à gérer, et vous pourriez obtenir la structure en un an. Nous avons rendu cela instantané dans une page Web », a déclaré Powell.
En fin de compte, les médicaments conçus par l’IA connaîtront un succès ou un échec en fonction de la dernière étape traditionnelle du développement de médicaments : la performance dans les essais sur l’homme.
« Vous devez toujours générer des preuves au sol », a déclaré Powell.
Elle a comparé le niveau de progrès actuel à la formation sur les voitures autonomes, où des données sont constamment collectées pour renforcer et réaméliorer les modèles. « La même chose se produit dans la découverte de médicaments », a-t-elle déclaré. « Vous pouvez utiliser ces méthodes pour explorer un nouvel espace… l’affiner, l’affiner… faire des expérimentations plus intelligentes, prendre ces données expérimentales et les réinjecter dans les modèles, et la boucle tourne. »
Mais l’espace biologique au sein du domaine plus large des modèles d’IA est encore restreint en comparaison. L’industrie de l’IA est de l’ordre d’un billion de modèles ou plus dans les domaines du traitement multimodal et du langage naturel. En comparaison, les modèles biologiques se comptent par dizaines de milliards.
« Nous n’en sommes qu’au début de la manche », a déclaré Powell. « Un mot moyen compte moins de dix lettres. Un génome compte 3 milliards de lettres. »