Atteindre QbD avec l’apprentissage automatique
Les régulateurs privilégient les processus conçus en tenant compte de la qualité des médicaments. Le défi est qu’à mesure que les méthodes de production deviennent plus complexes, les techniques de modélisation établies ont du mal à faire face.
C’est ce qu’affirme Ian Walsh, PhD, chercheur à l’institut de technologie de bioprocédés A*STAR à Singapour, qui s’est penché sur l’évolution des défis de la qualité par la conception (QbD) dans une étude publiée plus tôt cette année.
Il y a une grande complexité dans les données omiques que nous pouvons dériver des milieux de culture cellulaire, des propriétés physiochimiques du bioprocessus et d’autres lectures de bioréacteur qui peuvent être dérivées d’une caractérisation améliorée, explique-t-il. Ce que nous voyons maintenant, c’est le nombre de CPP [critical process parameters] augmentent au-delà du petit nombre de variables qui étaient utilisées dans l’industrie il y a encore quelques années. Qui sait combien il y aura de CPP dans cinq ans.
Apprentissage automatique
Pour faire face à l’augmentation du RPC, l’industrie a besoin d’une alternative aux techniques d’analyse de données multivariées, dit Walsh, citant l’apprentissage automatique (ML) comme solution potentielle.
Les techniques MVDA peuvent modéliser mathématiquement les relations entre les CPP d’entrée et les variables de sortie telles que le titre, la croissance cellulaire et les attributs de qualité critiques. Les méthodes MVDA sont populaires en raison de leur simplicité et de leur facilité d’utilisation, poursuit-il. Cependant, à mesure que le nombre de CPP augmente avec l’augmentation du nombre de capteurs, l’augmentation de la qualité des capteurs et des analyses plus rapides et plus profondes des milieux de culture cellulaire, les relations qui existent entre les CPP et les variables de sortie du bioprocédé seront probablement non linéaires et nécessiteront des algorithmes de modélisation plus sophistiqués. comme l’apprentissage automatique.
Un algorithme ML peut automatiquement construire un modèle d’un problème du monde réel sans être explicitement programmé. Il y parvient en examinant des échantillons de données et en s’optimisant de manière à pouvoir prédire les résultats face à de nouvelles données.
Et la capacité de prédire les résultats est là où la biopharmacie peut bénéficier, selon Walsh, qui ajoute que le ML peut souvent faire mieux que les humains dans cette tâche particulière, par exemple, prédire si un bioprocédé produit un médicament de qualité inférieure aux normes.
Codage facile, les exigences en matière de données le sont moins
Et il y a de bonnes nouvelles pour les entreprises intéressées par l’utilisation du ML pour modéliser les processus. Une grande partie du code nécessaire pour construire les modèles a déjà été écrite, souligne Walsh.
La création et la formation de l’algorithme ML est la partie la plus facile, il existe de nombreuses bibliothèques open source disponibles pour le faire, dit-il. La partie la plus difficile consiste à développer un ensemble de données vaste et diversifié avec des données de processus de haute qualité. Cependant, avec de nouveaux capteurs tels que Raman, des flux de travail LC-MS à haut débit, le développement d’analyses en temps réel et la capacité de caractériser en profondeur les omiques, nous pouvons dériver ces données pour la modélisation et/ou les processus de formation.
À l’heure actuelle, les algorithmes ML sont spécifiques au processus. Cependant, si l’industrie est disposée à investir dans l’expertise et à collaborer, elle peut être en mesure de créer des modèles utiles à plusieurs parties, note Walsh.
Le Saint Graal serait des algorithmes ML qui ont un pouvoir prédictif général, ce qui signifie que l’algorithme pourrait être utilisé dans différentes usines sans le recycler. Ce serait un défi, mais possible, dit-il GEN.
Il n’est pas clair si les fabricants de médicaments travailleraient ensemble sur le développement du ML, car les données sont extrêmement précieuses pour chaque entreprise. Cependant, les avantages d’une telle collaboration ont déjà été démontrés ailleurs.
Dans d’autres domaines biologiques, des algorithmes intéressants ont été développés car toutes les données étaient partagées, explique-t-il. Par exemple, les données sur les protéines disponibles dans la banque de données sur les protéines et UNIProt ont conduit à des algorithmes ML intéressants tels que alphafold développé par Googles deepmind.