Le sombre secret derrière ces jolies images d’animaux générées par l’IA

Ce n’est un secret pour personne que de grands modèles, tels que DALL-E 2 et Imagen, formés sur un grand nombre de documents et d’images tirés du Web, absorbent les pires aspects de ces données ainsi que les meilleurs. OpenAI et Google le reconnaissent explicitement.

Faites défiler le site Web d’Imagen, passez le fruit du dragon portant une ceinture de karaté et le petit cactus portant un chapeau et des lunettes de soleil jusqu’à la section sur l’impact sociétal et vous obtenez ceci : alors qu’un sous-ensemble de nos données d’entraînement a été filtré pour supprimer le bruit et le contenu indésirable, comme les contenus pornographiques. images et un langage toxique, nous avons également utilisé [the] Ensemble de données LAION-400M connu pour contenir un large éventail de contenus inappropriés, notamment des images pornographiques, des insultes racistes et des stéréotypes sociaux nuisibles. Imagen s’appuie sur des encodeurs de texte entraînés sur des données non curées à l’échelle du Web, et hérite ainsi des préjugés sociaux et des limites des grands modèles de langage. En tant que tel, il existe un risque qu’Imagen ait encodé des stéréotypes et des représentations nuisibles, ce qui guide notre décision de ne pas publier Imagen pour un usage public sans autres garanties en place.

C’est le même genre de reconnaissance qu’OpenAI a faite lorsqu’elle a révélé GPT-3 en 2019 : les modèles formés sur Internet ont des biais à l’échelle d’Internet. Et comme Mike Cook, qui étudie la créativité de l’IA à l’Université Queen Mary de Londres, l’a souligné, c’est dans les déclarations d’éthique qui accompagnaient le grand modèle de langage de Google PaLM et OpenAIs DALL-E 2. En bref, ces entreprises savent que leurs modèles sont capables de produire un contenu affreux, et ils ne savent pas comment résoudre ce problème.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite