Avis | L’IA appartient aussi au passé

Les milliardaires vendent des actions Nvidia et achètent…

Nous n’avons pas besoin d’imaginer un monde dans lequel les deepfakes peuvent imiter de manière si crédible les voix des politiciens qu’ils peuvent être utilisés pour déclencher des scandales susceptibles d’influencer les élections. C’est déjà là. Heureusement, il existe de nombreuses raisons d’être optimiste quant à la capacité de la société à identifier les faux médias et à maintenir une compréhension commune de l’actualité.

Même si nous avons des raisons de croire que l’avenir sera sûr, nous craignons que le passé ne le soit pas.

L’histoire peut être un outil puissant de manipulation et de malversation. La même IA générative qui peut simuler les événements actuels peut également simuler les événements passés. Même si les nouveaux contenus peuvent être sécurisés grâce à des systèmes intégrés, il existe un monde de contenus qui n’ont pas été filigranés, ce qui se fait en ajoutant des informations imperceptibles à un fichier numérique afin que sa provenance puisse être retracée. Une fois que le filigrane lors de la création se généralise et que les gens s’habituent à se méfier du contenu qui n’est pas filigrané, tout ce qui a été produit avant ce moment peut être beaucoup plus facilement remis en question.

Et cela créera un trésor d’opportunités pour étayer les fausses affirmations avec des documents générés, depuis des photos plaçant des personnages historiques dans des situations compromettantes, jusqu’à la modification d’histoires individuelles dans des journaux historiques, jusqu’au changement de noms sur des titres de propriété. Bien que toutes ces techniques aient déjà été utilisées, il est beaucoup plus difficile de les contrer lorsque le coût de création de contrefaçons presque parfaites a été radicalement réduit.

Cette prévision est basée sur l’histoire. Il existe de nombreux exemples de la manière dont les pouvoirs économiques et politiques ont manipulé les archives historiques à leurs propres fins. Staline a purgé de l’histoire ses camarades déloyaux en les exécutant puis en modifiant les enregistrements photographiques pour donner l’impression qu’ils n’avaient jamais existé. La Slovénie, lorsqu’elle est devenue un pays indépendant en 1992, a effacé plus de 18 000 personnes du registre des résidents, principalement des membres de la minorité rom et d’autres ethnies non slovènes. Dans de nombreux cas, le gouvernement a détruit leurs dossiers physiques, entraînant la perte de leur logement, de leur pension et de leur accès à d’autres services, selon un rapport de 2003 du Commissaire aux droits de l’homme du Conseil de l’Europe.

Les faux documents sont un élément clé de nombreux efforts visant à réécrire les archives historiques. Les tristement célèbres Protocoles des Sages de Sion, publiés pour la première fois dans un journal russe en 1903, prétendaient être des procès-verbaux d’une conspiration juive visant à contrôler le monde. Discrédités pour la première fois en août 1921 comme un faux plagié à partir de plusieurs sources indépendantes, les Protocoles figuraient en bonne place dans la propagande nazie et ont longtemps été utilisés pour justifier la violence antisémite, y compris une citation dans l’article 32 du pacte fondateur du Hamas de 1988.

En 1924, la lettre de Zinoviev, considérée comme un communiqué secret du chef de l’Internationale communiste à Moscou au Parti communiste de Grande-Bretagne visant à mobiliser un soutien en faveur de la normalisation des relations avec l’Union soviétique, fut publiée par le Daily Mail quatre jours avant une réunion générale. élection. Le scandale qui en a résulté pourrait avoir coûté les élections aux travaillistes. L’origine des lettres n’a jamais été prouvée, mais son authenticité a été remise en question à l’époque et une enquête officielle menée dans les années 1990 a conclu qu’il s’agissait très probablement de l’œuvre des Russes blancs, une faction politique conservatrice dirigée à l’époque par des migrants russes opposés au régime communiste. gouvernement.

Des décennies plus tard, l’opération Infektion, une campagne de désinformation soviétique, a utilisé de faux documents pour propager l’idée que les États-Unis avaient inventé le VIH, le virus qui cause le sida, comme arme biologique. Et en 2004, CBS News a retiré un article controversé parce qu’il ne pouvait pas authentifier les documents, qui ont ensuite été discrédités comme faux, qui remettaient en question le service antérieur de George W. Bush, alors président, dans la Garde nationale aérienne du Texas. À mesure qu’il devient plus facile de générer de la désinformation historique et que le volume des contrefaçons numériques explose, l’occasion se présentera de remodeler l’histoire ou du moins de remettre en question notre compréhension actuelle de celle-ci.

Les perspectives d’acteurs politiques utilisant l’IA générative pour remodeler efficacement l’histoire, sans parler des fraudeurs créant de faux documents juridiques et enregistrements de transactions, sont effrayantes. Heureusement, une voie à suivre a été tracée par les mêmes entreprises qui ont créé ce risque.

En indexant une grande partie des médias numériques mondiaux pour former leurs modèles, les sociétés d’IA ont effectivement créé des systèmes et des bases de données qui contiendront bientôt le contenu enregistré numériquement de l’ensemble de l’humanité ou du moins une approximation significative de celui-ci. Ils pourraient commencer dès aujourd’hui à enregistrer des versions filigranées de ces documents primaires, qui comprennent des archives de journaux et un large éventail d’autres sources, afin que les contrefaçons ultérieures soient instantanément détectables.

Un tel travail se heurte à certains obstacles. Les efforts des bibliothèques numériques de Google pour numériser des millions de livres de bibliothèques mondiales et les rendre facilement accessibles en ligne se sont heurtés aux limites de la propriété intellectuelle, rendant les archives historiques inutilisables dans leur objectif prévu, qui est de rendre ces textes consultables par toute personne disposant d’une connexion Internet. Ces mêmes problèmes de propriété intellectuelle amènent les créateurs et les entreprises à s’inquiéter à la fois des données de formation fournies à l’IA générative et de leurs implications lorsqu’elles sont utilisées pour générer du contenu.

Compte tenu de cette histoire chargée, y compris l’échec de l’investissement de Google dans son projet de bibliothèques numériques, qui intensifiera et financera un effort massif similaire qui créerait des versions immuables de données historiques ? Le gouvernement et l’industrie sont fortement incités à le faire, et bon nombre des problèmes de propriété intellectuelle liés à la fourniture d’archives en ligne consultables ne s’appliquent pas à la création de versions filigranées et horodatées de documents, car ces versions n’ont pas besoin d’être rendues publiques pour servir leurs objectifs. but. On peut comparer un document revendiqué aux archives enregistrées en utilisant une transformation mathématique du document connue sous le nom de hachage, la même technique que le Forum Internet mondial de lutte contre le terrorisme utilise pour aider les entreprises à filtrer les contenus terroristes connus.

En plus de créer un bien public important et de protéger les citoyens contre les dangers posés par la manipulation des récits historiques, la création d’enregistrements vérifiés de documents historiques peut être précieuse pour les grandes entreprises d’IA. De nouvelles recherches suggèrent que lorsque les modèles d’IA sont entraînés sur des données générées par l’IA, leurs performances se dégradent rapidement. Il peut donc être crucial de séparer ce qui fait réellement partie des archives historiques des faits nouvellement créés.

Préserver le passé signifie également préserver les données de formation, les outils associés qui y fonctionnent et même l’environnement dans lequel les outils ont été exécutés. Vint Cerf, l’un des premiers pionniers d’Internet, a appelé ce type d’enregistrement vélin numérique, et nous en avons besoin pour sécuriser l’environnement informationnel.

Un tel vélin sera un outil puissant. Il peut aider les entreprises à créer de meilleurs modèles en leur permettant d’analyser les données à inclure pour obtenir le meilleur contenu et aider les régulateurs à auditer les biais et le contenu préjudiciable dans les modèles. Les géants de la technologie mènent déjà des efforts similaires pour enregistrer le nouveau contenu créé par leurs modèles, en partie parce qu’ils doivent former leurs modèles sur du texte généré par l’homme et que les données produites après l’adoption de grands modèles de langage peuvent être entachées de contenu généré.

Le moment est venu de prolonger cet effort également dans le temps, avant que notre politique ne soit elle aussi gravement déformée par l’histoire générée.

Jacob N. Shapiro est professeur de politique et d’affaires internationales à l’Université de Princeton et directeur général du projet d’études empiriques sur les conflits. Chris Mattmann est professeur de recherche adjoint à l’Université de Californie du Sud et directeur de son groupe de recherche d’informations et de science des données.

Le Times s’engage à publier une diversité de lettres Pour l’éditeur. Nous aimerions savoir ce que vous pensez de ceci ou de l’un de nos articles. Voilà quelque conseils. Et voici notre email : lettres@nytimes.com.

Suivez la section Opinion du New York Times sur Facebook, Instagram, TIC Tac, X et Sujets.

www.actusduweb.com

Suivez Actusduweb sur Google News

Similaire