L’apprentissage automatique peut-il traduire des textes égyptiens anciens ?

je sont depuis longtemps intrigués par l’archéogaming, une discipline universitaire qui explore la fusion d’objets, de méthodes et de personnages archéologiques dans des jeux vidéo. J’ai donc été ravi lorsque la société de jeux vidéo Ubisoft a sorti Assassin’s Creed : Origines, situé en Egypte sous le règne de Cléopâtre. Les concepteurs ont collaboré avec des égyptologues pour s’assurer que tout, de l’architecture aux hiéroglyphes, crée un monde précis et immersif. De manière inattendue, ce partenariat a inspiré un spin-off d’apprentissage automatique qui a changé le cours de mon début de carrière.

OEn travaillant avec des égyptologues, les développeurs du jeu ont appris que la traduction et l’interprétation d’anciens textes hiéroglyphiques prennent du temps et que le processus a peu changé au cours du siècle dernier. Ainsi, Ubisoft a décidé de redonner à la communauté universitaire en développant l’Initiative Hiéroglyphes.

Je projet vise à aider les chercheurs à décoder les hiéroglyphes égyptiens à l’aide de l’apprentissage automatique, un type d’intelligence artificielle qui permet aux programmes informatiques de mieux faire des prédictions par l’expérience.

Jes développeurs se sont associés à un éventail d’érudits en égyptologie, y compris des membres du Centre australien d’égyptologie de l’Université Macquarie, où j’étais étudiant en maîtrise à la recherche d’un sujet de thèse. C’était comme un signe. L’Initiative Hiéroglyphes a été pour moi l’occasion de redonner à la communauté universitaire en aidant au développement d’un programme informatique qui pourrait profiter aux égyptologues. J’ai pu explorer comment l’apprentissage automatique pourrait transformer la recherche et l’éducation archéologiques, et même comment le public interagit avec l’égyptologie.

JLa question était : L’Initiative Hiéroglyphes a-t-elle tenu ses promesses ? Je me suis donné pour mission de le découvrir.

Les difficultés du déchiffrement des hiéroglyphes

déchiffrer les textes égyptiens anciens a défié les chercheurs pendant des siècles. Les anciens Égyptiens utilisaient régulièrement plus de 700 hiéroglyphes, écrivaient leurs textes dans différentes directions et évitaient les voyelles, la ponctuation et l’espace entre les mots. De nombreux premiers chercheurs ont supposé à tort que les hiéroglyphes étaient purement des symboles; en fait, ils peuvent représenter des objets, des idées ou des groupes sonores.

Dans une scène d'un jeu vidéo, une personne portant un bouclier circulaire sur le dos escalade une pyramide dorée brillante au-dessus de plaines couvertes d'arbres, de montagnes et d'un soleil jaune vif au loin.

Les créateurs de Assassin’s Creed : Origines consulté des égyptologues pour donner vie à Cléopâtre en Égypte. Ubisoft

u cours de l’époque médiévale, les érudits arabes et égyptiens ont conservé une certaine connaissance du système hiéroglyphique, et les chercheurs européens ont ensuite été informés par leurs efforts. Mais les érudits occidentaux n’ont connu une percée majeure qu’en 1822, lorsque Jean-François Champollion a déchiffré le code en analysant l’inscription multilingue sur la pierre de Rosette.

UNu début, les traducteurs utilisaient du papier et un crayon pour dessiner ou tracer des inscriptions sur les murs des tombes. Puis, dans les années 1890, la photographie grand format a révolutionné le domaine, permettant aux chercheurs de capturer plus précisément les détails des inscriptions et des reliefs.

Ja Hieroglyphics Initiative tente de faire progresser ces techniques en appliquant l’apprentissage automatique pour capturer et préserver ces données. En 2020, Google Arts and Culture, qui avait repris le projet, a sorti le programme en anglais et en arabe, en le renommant Fabricius.

tuGrâce à ce programme open source, les chercheurs peuvent télécharger une photo de texte telle qu’une inscription sur le mur d’une tombe, créer une couche de fac-similé de l’image et zoomer sur une section spécifique. Ils peuvent également utiliser la fonction de dessin et d’effacement pour retoucher des parties des hiéroglyphes qui pourraient être endommagées par des fissures dans la paroi rocheuse.

JEnsuite, ils peuvent séquencer les hiéroglyphes et le programme peut aider à identifier chaque signe hiéroglyphique à l’aide de la liste des signes Gardiners, qui regroupe les signes en catégories telles que les oiseaux, les reptiles ou les parties du corps humain. Sur la base de la séquence et des hiéroglyphes identifiés, le programme peut alors proposer des traductions possibles.

Une vidéo montre comment Fabricius peut nettoyer les hiéroglyphes, comme ces signes de la biographie de Saroy. Bree Kelly/Université Macquarie

JLe processus n’est pas aussi simple ou automatique que, par exemple, l’option appareil photo de Google Translate, qui traduit le texte à partir d’images. Il serait impossible pour une machine, à elle seule, d’incorporer pleinement toutes les nuances de la grammaire et de l’orthographe égyptiennes anciennes avec suffisamment de précision pour identifier les séquences hiéroglyphiques et suggérer des traductions. En effet, les signes hiéroglyphiques peuvent avoir plusieurs significations, leur orthographe varie sur des milliers d’années et différents scribes et artistes avaient des idiosyncrasies stylistiques.

Jsa traduction des moyens est complexe et implique un degré élevé d’interprétation. Cependant, Fabricius pourrait potentiellement aider les égyptologues à démarrer un peu plus loin dans le processus analytique qu’ils ne le font lors de la traduction manuelle. Et bien que Fabricius ait été initialement conçu pour les universitaires, il est devenu accessible au public, dans le but de rendre l’écriture égyptienne ancienne plus accessible aux non-spécialistes curieux.

En savoir plus sur l’apprentissage automatique : Et si les machines pouvaient apprendre comme les enfants ?

UNDans le cadre de mes recherches, j’ai créé des instructions étape par étape pour l’utilisation de Fabricius et publié des articles qui donnent aux non-experts un contexte sur l’histoire du décodage des hiéroglyphes et sur la manière dont les égyptologues implémentent diverses technologies numériques dans leurs recherches.

FPar exemple, l’égyptologue de l’Université Macquarie, Linda Evans, examine l’imagerie animale dans l’art égyptien ancien pour mieux comprendre l’histoire environnementale de la région et la relation entre les humains et les autres animaux. Elle a analysé des peintures murales égyptiennes antiques à l’aide de DStretch, un plug-in qui intensifie et sature les couleurs d’une photographie numérique, permettant aux chercheurs de voir des détails fanés invisibles à l’œil. Grâce à cette technique, Evans a pu réinterpréter plusieurs peintures de tombes.

Je travail d’Evans et d’autres indique que les égyptologues sont intéressés à s’engager dans de nouvelles technologies innovantes et pourraient potentiellement bénéficier de collaborations avec des entreprises telles que Google et Ubisoft si des projets comme Fabricius s’avèrent fructueux.

Une image modifiée numériquement sur un mur de tombe révèle deux cochons entourés de taches vert vif et violet clair.

À l’aide d’un logiciel appelé DStretch, l’égyptologue Linda Evans a pu voir des images auparavant invisibles sur le mur d’une tombe. Linda Evans

les machines peuvent-elles aider à traduire les hiéroglyphes ?

JPour déterminer si Fabricius atteint ses objectifs, j’ai lancé une étude de cas, demandant à huit volontaires de différents niveaux d’expertise de tester le programme. Les participants venaient d’Australie, d’Égypte et des Pays-Bas et allaient d’étudiants en égyptologie à des universitaires de carrière. Chaque participant a reçu deux textes égyptiens anciens à traduire, l’un en utilisant leur méthode de traduction habituelle, l’autre en utilisant Fabricius.

jeAu départ, ils étaient optimistes mais aussi légèrement sceptiques quant aux objectifs ambitieux du programme. La traduction implique généralement de trouver les sons de signes particuliers dans des listes, de rechercher des mots dans des dictionnaires et des bases de données en ligne, d’utiliser des grammaires pour créer de bonnes traductions et de comparer des traductions de textes similaires dans divers ouvrages savants, analogiques et numériques. Ce processus complexe est souvent effectué sur papier et peut nécessiter plusieurs tentatives de griffonnage, d’effacement et de biffage de symboles.

So, l’idée que ce processus laborieux en plusieurs étapes puisse être simplifié à l’aide de la technologie d’apprentissage automatique et complété sur une seule page informatique a intrigué les participants.

HCependant, mon étude a montré que Fabricius n’était pas aussi immédiatement utile qu’on l’espérait initialement. Le programme accusait un retard important et ses fonctions n’étaient pas toujours évidentes pour les utilisateurs. Cela signifiait que je devais guider chaque participant tout au long du processus pour les aider à produire une traduction en temps opportun. Plus important encore, les modèles d’apprentissage automatique utilisés par Fabricius pour suggérer des signes à partir de photos tracées n’ont atteint qu’un taux de précision de 27 %.

JCela dit, le fait que le programme puisse reconnaître et ordonner les signes hiéroglyphiques pourrait en faire un outil utile, même si les taux de reconnaissance ne sont pas très élevés. De plus, l’apprentissage automatique permet aux programmes de s’améliorer à mesure qu’ils reçoivent de plus en plus de données. Google Translate, qui est alimenté par un système d’apprentissage automatique, est devenu de plus en plus précis au fil des ans, et il fonctionne mieux dans les langues dans lesquelles il reçoit plus de formation, comme l’espagnol et l’allemand.

Le glamour de l’apprentissage automatique pourrait devoir être mis de côté au profit de Fabricius aspects pragmatiques.

So, à mesure que les chercheurs créent des données de formation bien formées, une version ultérieure de Fabricius pourrait être formée sur un ensemble de données beaucoup plus volumineux. De cette manière, il pourrait améliorer sa précision dans l’identification des hiéroglyphes au fil du temps et aider les chercheurs à préparer des éditions de textes égyptiens à utiliser dans un contexte numérique, augmentant massivement la quantité de données textuelles à leur disposition pour la recherche textuelle et linguistique.

jeBref, Fabricius offre une opportunité de révolutionner la méthode d’enregistrement et de recherche des données textuelles de l’Égypte ancienne. Cependant, jusqu’à ce que le programme évolue à un point où il puisse identifier avec précision au moins 99 % des signes, il est peu probable qu’il puisse devenir un outil qui complète les procédures manuelles d’analyse textuelle. En outre, il ne pourrait être utilisé comme outil de traduction précis que si le module d’apprentissage automatique pouvait être formé non seulement avec des signes individuels (son objectif actuel), mais également avec des phrases et des textes plus longs intégrant la grammaire et la syntaxe.

jeDans l’intervalle, le glamour et la mystique de l’apprentissage automatique pourraient devoir être mis de côté au profit des aspects plus utiles et pragmatiques de la conception de Fabricius, tels que la capacité de marquer et de séquencer rapidement tous les hiéroglyphes dans un texte. Cette procédure à elle seule aiderait à numériser les textes hiéroglyphiques égyptiens anciens à un rythme beaucoup plus rapide, leur permettant d’être facilement partagés, analysés et téléchargés dans des bases de données en ligne. De telles bases de données pourraient potentiellement créer des informations de formation pour de futures applications d’apprentissage automatique.

jeDans les salles de classe, Fabricius pourrait générer un nouveau mode d’apprentissage pour les étudiants en égyptologie, encourageant les générations émergentes à développer des compétences susceptibles d’améliorer la manière dont les données hiéroglyphiques sont intégrées dans un monde de plus en plus technologique.

ODans l’ensemble, Fabricius représente une bonne première étape dans la construction d’un programme capable de détecter et de classer automatiquement les hiéroglyphes. Il doit être recyclé sur un ensemble de données plus grand et meilleur avant de pouvoir être utilisé dans un contexte de recherche. Cependant, le programme est prometteur en tant que plate-forme permettant aux égyptologues, aux étudiants et aux profanes de s’engager dans des textes anciens et d’expérimenter la traduction hiéroglyphique. De plus, cela pourrait inspirer plus de gens à s’impliquer dans des projets qui combinent l’archéologie, la technologie et les jeux vidéo, comme cela a été le cas pour moi.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite