Un outil d’IA développé par DeepMind peut aider les historiens à restaurer les textes grecs anciens avec une précision de 72 % et à dater les inscriptions à moins de 30 ans de leur âge réel
Humains 9 mars 2022
La bibliothèque de Celsus dans l’ancienne ville d’Ephèse, Turquie
Voyages Mazur/Shutterstock
Un algorithme d’intelligence artificielle développé dans le cadre d’une collaboration entre des historiens et la société britannique d’intelligence artificielle DeepMind peut aider à restaurer des textes grecs anciens avec une précision de 72 %.
L’IA peut également prédire où dans le monde méditerranéen antique les textes ont été écrits à l’origine avec une précision de plus de 70 % et les dater à quelques décennies de leur date de création convenue. Tout cela marque une amélioration par rapport à une version antérieure de l’IA qui ne pouvait restaurer que des textes anciens.
« Les inscriptions témoignent de la pensée, de la langue, de la société et de l’histoire des civilisations passées », explique Thea Sommerschield de l’Université Ca’ Foscari de Venise en Italie. « Mais la plupart des inscriptions survivantes ont été endommagées au cours des siècles, de sorte que leurs textes sont maintenant fragmentaires ou illisibles. Ils peuvent également avoir été déplacés ou victimes de la traite loin de leur lieu d’origine.
Rejoignez-nous pour un festival époustouflant d’idées et d’expériences. Nouveau scientifique en direct devient hybride, avec un événement en direct à Manchester, au Royaume-Uni, dont vous pouvez également profiter dans le confort de votre foyer, du 12 au 14 mars 2022. En savoir plus.
Lors de la récupération de textes anciens, les historiens sont généralement intéressés à atteindre trois objectifs principaux : restaurer le texte et déterminer exactement quand et où il a été écrit. Pour ce faire, ils recherchent des traits et des motifs distinctifs dans le style d’écriture et les comparent à ceux de textes anciens déjà retrouvés et datés.
« Cependant, il est vraiment difficile pour un humain d’exploiter toutes les données pertinentes existantes et de découvrir à chaque fois des modèles sous-jacents », déclare Sommerschield.
Sommerschield et ses collègues ont travaillé avec des chercheurs de DeepMind pour que l’IA d’apprentissage automatique – appelée Ithaca d’après une île grecque célèbre pour être la patrie de la figure légendaire Ulysse – effectue les trois tâches.
Pour former Ithaque, l’équipe a utilisé environ 60 000 textes grecs anciens de l’autre côté de la Méditerranée qui sont déjà bien étudiés et connus pour avoir été écrits entre 700 avant JC et 500 après JC. L’équipe a masqué certains des caractères dans les textes, puis a comparé les prédictions d’Ithaca. pour ce texte « manquant » avec les inscriptions réelles.
Ensuite, l’équipe a utilisé un ensemble de données de près de 8000 inscriptions – encore une fois, déjà bien étudiées et comprises – pour tester la performance d’Ithaque seule, ou en combinaison avec deux historiens anciens. À elle seule, Ithaque pouvait restaurer des textes avec une précision de 62 %, tandis que les historiens anciens restaient à eux seuls des textes avec une précision d’environ 25 %.
Cependant, les reconstructions les plus précises impliquaient Ithaque et des historiens travaillant ensemble. Lorsque les historiens ont pris les 20 reconstructions les plus probables d’Ithaca pour un texte donné et les ont utilisées pour informer leur propre travail, ils ont pu restaurer le texte avec une précision encore plus grande qu’Ithaca seul.
« Lorsque les historiens ont utilisé Ithaca, leur performance sur la tâche de restauration de texte a en fait triplé, à 72 % », explique Sommerschield.
Ithaca pouvait également prédire où en Méditerranée un texte était écrit 71% du temps et elle pouvait dater les textes à moins de 30 ans de leur véritable date de création, comme précédemment établi par les historiens.
« Il est clair que le travail des auteurs est important et novateur. La méthode « Historien ancien et Ithaque » produit des améliorations étonnamment significatives des résultats par rapport aux méthodes traditionnelles exclusivement humaines », déclare Tom Elliott de l’Université de New York. Cependant, des tests supplémentaires avec plus d’historiens sont nécessaires et les gens auront besoin d’une formation et d’un soutien technique pour utiliser l’outil, ajoute-t-il.
L’équipe affirme que les commentaires des historiens ont jusqu’à présent été positifs.
« Nous espérons que la façon dont nous l’avons conçu sera facile à utiliser pour un historien ancien, car il n’aura qu’à taper le texte [to an online interface] et ils obtiendront ensuite toutes ces visualisations qu’ils pourront utiliser », déclare Yannis Assael de DeepMind au Royaume-Uni et auteur de l’étude.
La conception d’Ithaca devrait également la rendre facilement applicable à n’importe quelle langue ancienne et à n’importe quel support écrit, dit Sommerschield.
Référence de la revue : NatureDOI : https://doi.org/10.1038/s41586-022-04448-z
En savoir plus sur ces sujets :
.