Le nouveau modèle d’IA de DeepMinds aide à déchiffrer, dater et localiser les inscriptions anciennes
Les techniques d’apprentissage automatique fournissent de nouveaux outils qui pourraient aider les archéologues à comprendre le passé, en particulier lorsqu’il s’agit de déchiffrer des textes anciens. Le dernier exemple en date est un modèle d’IA créé par la filiale d’Alphabet DeepMind qui aide non seulement à restaurer le texte manquant dans les inscriptions grecques anciennes, mais propose également des suggestions sur le moment où le texte a été écrit (sur une période de 30 ans) et ses origines géographiques possibles.
Les inscriptions sont vraiment importantes car elles sont des sources directes de preuves… écrites directement par les anciens eux-mêmes, a déclaré Thea Sommerschield, historienne et experte en apprentissage automatique qui a aidé à créer le modèle, lors d’un point de presse.
En raison de leur âge, ces textes sont souvent endommagés, faisant de la restauration un défi enrichissant. Et parce qu’ils sont souvent inscrits sur des matériaux inorganiques comme la pierre ou le métal, cela signifie que des méthodes comme la datation au radiocarbone ne peuvent pas être utilisées pour savoir quand ils ont été écrits. Pour résoudre ces tâches, les épigraphes recherchent des parallèles textuels et contextuels dans des inscriptions similaires, a déclaré Sommerschield, qui a codirigé les travaux aux côtés du chercheur de DeepMind Yannis Assael. Cependant, il est vraiment difficile pour un humain d’exploiter toutes les données pertinentes existantes et de découvrir les modèles sous-jacents.
C’est là que l’apprentissage automatique peut aider.
Le nouveau logiciel, nommé Ithaca, est formé sur un ensemble de données de quelque 78 608 inscriptions grecques anciennes, chacune étant étiquetée avec des métadonnées décrivant où et quand elle a été écrite (au mieux des connaissances des historiens). Comme tous les systèmes d’apprentissage automatique, Ithaca recherche des modèles dans ces informations, les code dans des modèles mathématiques complexes et utilise ces inférences pour suggérer du texte, des dates et des origines.
Dans un article publié dans Nature qui décrit Ithaca, les scientifiques qui ont créé le modèle disent qu’il est précis à 62 % lors de la restauration de lettres dans des textes endommagés. Il peut attribuer les origines géographiques d’une inscription à l’une des 84 régions du monde antique avec une précision de 71% et peut dater un texte à moins de 30 ans en moyenne de son année d’écriture connue.
Ce sont des statistiques prometteuses, mais il est important de se rappeler qu’Ithaca n’est pas capable de fonctionner indépendamment de l’expertise humaine. Ses suggestions sont finalement basées sur des données collectées par des méthodes archéologiques traditionnelles, et ses créateurs le positionnent simplement comme un autre outil dans un ensemble plus large de méthodes médico-légales, plutôt que comme un historien de l’IA entièrement automatisé. Ithaca a été conçu comme un outil complémentaire pour aider les historiens, a déclaré Sommerschield.

Eleanor Dickey, professeur de lettres classiques à l’Université de Reading, spécialisée dans les sociolinguistes grecs et latins anciens, a déclaré Le bord qu’Ithaque était un développement passionnant qui pourrait améliorer notre connaissance du monde antique. Mais, elle a ajouté qu’une précision de 62% pour la restauration du texte perdu n’était pas très rassurante lorsque les gens s’y fient, ils devront garder à l’esprit que c’est faux environ un tiers du temps et qu’elle n’était pas sûre de la façon dont le logiciel s’adapterait dans les méthodologies académiques existantes.
Par exemple, DeepMind a mis en évidence des tests qui ont montré que le modèle a aidé à améliorer la précision des historiens en restaurant le texte manquant dans les inscriptions anciennes de 25 % à 72 %. Mais Dickey note que les personnes testées étaient des étudiants, et non des épigraphes professionnels. Elle dit que les modèles d’IA peuvent être largement accessibles, mais cela ne signifie pas qu’ils peuvent ou doivent remplacer le petit groupe d’universitaires spécialisés qui déchiffrent les textes.
Il n’est pas encore clair dans quelle mesure l’utilisation de cet outil par des éditeurs véritablement qualifiés entraînerait une amélioration des éditions généralement disponibles, mais il sera intéressant de le savoir, a déclaré Dickey. Elle a ajouté qu’elle cherchait à essayer le modèle Ithaca par elle-même. Le logiciel, ainsi que son code open-source, est disponible en ligne pour que quiconque puisse le tester.
Ithaca et son prédécesseur (nommé Pythia et sorti en 2019) ont déjà été utilisés pour aider les récents débats archéologiques, notamment en aidant à dater les inscriptions découvertes dans l’Acropole d’Athènes. Cependant, le véritable potentiel du logiciel n’a pas encore été vu.
Sommerschield souligne que la véritable valeur d’Ithaca réside peut-être dans sa flexibilité. Bien qu’il ait été formé sur des inscriptions grecques anciennes, il pourrait être facilement configuré pour fonctionner avec d’autres scripts anciens. L’architecture d’Ithacas le rend vraiment applicable à n’importe quelle langue ancienne, pas seulement au latin, mais au maya, cunéiforme ; vraiment n’importe quel support écrit papyrus, manuscrits, dit-elle. Il y a beaucoup d’opportunités.