Ces artistes ont découvert que leur travail était utilisé pour former l’IA. Maintenant ils sont furieux | CNN Affaires



CNN

Erin Hanson a passé des années à développer la palette de couleurs vibrantes et les gros coups de pinceau qui définissent les peintures à l’huile vives pour lesquelles elle est connue. Mais lors d’une récente interview avec elle, j’ai montré à Hanson mes tentatives pour recréer son style en quelques frappes.

À l’aide de Stable Diffusion, un outil de génération d’images AI open source populaire et accessible au public, j’avais branché une série d’invites pour créer des images dans le style de certaines de ses peintures de coquelicots de Californie sur une falaise océanique et un champ de lupin.

Celui-ci avec les fleurs violettes et le coucher de soleil, a-t-elle dit via Zoom, regardant l’une de mes tentatives, ressemble définitivement à l’un de mes tableaux, vous savez ?

Avec les conseils de Hanson, j’ai ensuite adapté une autre invite détaillée : peinture à l’huile de lumière cristalline, dans le style d’Erin Hanson, lumière et ombres, arbres rétro-éclairés, contours forts, vitrail, impressionniste moderne, primé, tendance sur ArtStation, vif, haute définition, haute résolution. J’ai envoyé l’invite à Stable Diffusion ; en quelques secondes, il a produit trois images.

Oh, wow, a-t-elle dit alors que nous examinions les résultats, soulignant à quel point les arbres d’une image ressemblaient à ceux de sa peinture Crystalline Maples de 2021. Je mettrais ça sur mon mur, ajouta-t-elle bientôt.

Une image créée par Rachel Metz de CNN avec la contribution de l'artiste Erin Hanson, à l'aide de la plateforme d'intelligence artificielle Stable Diffusion.  Il ressemble au travail de Hanson, notamment par ses couleurs et ses coups de pinceau simulés.

Hanson, qui est basé à McMinnville, Oregon, est l’un des nombreux artistes professionnels dont le travail a été inclus dans l’ensemble de données utilisé pour former Stable Diffusion, qui a été publié en août par Stability AI, basé à Londres. C’est l’un des nombreux artistes interviewés par CNN Business qui étaient mécontents d’apprendre que des photos de leur travail étaient utilisées sans que quelqu’un les en informe, demande leur consentement ou paie pour leur utilisation.

Autrefois disponibles uniquement pour un groupe restreint d’initiés de la technologie, les systèmes d’IA texte-image deviennent de plus en plus populaires et puissants. Ces systèmes incluent Stable Diffusion, d’une société qui a récemment levé plus de 100 millions de dollars de financement, et DALL-E, d’une société qui a levé 1 milliard de dollars à ce jour.

Ces outils, qui offrent généralement des crédits gratuits avant la facturation, peuvent créer toutes sortes d’images avec seulement quelques mots, y compris celles qui évoquent clairement les œuvres de très nombreux artistes (si elles ne sont pas apparemment créées par le même artiste). Les utilisateurs peuvent invoquer ces artistes avec des mots tels que dans le style de ou par avec un nom spécifique. Et les utilisations actuelles de ces outils peuvent aller de l’amusement personnel à des cas plus commerciaux.

En quelques mois à peine, des millions de personnes ont afflué vers des systèmes d’IA texte-image et ils sont déjà utilisés pour créer des films expérimentaux, des couvertures de magazines et des images pour illustrer des reportages. Une image générée avec un système d’IA appelé Midjourney a récemment remporté un concours d’art à la Colorado State Fair et a provoqué un tollé parmi les artistes.

Mais alors que des artistes comme Hanson ont découvert que leur travail est utilisé pour former l’IA, cela soulève une préoccupation encore plus fondamentale : que leur propre art soit effectivement utilisé pour former un programme informatique qui pourrait un jour réduire leurs moyens de subsistance. Toute personne qui génère des images avec des systèmes tels que Stable Diffusion ou DALL-E peut ensuite les vendre (les conditions spécifiques concernant le droit d’auteur et la propriété de ces images varient).

Je ne veux pas du tout participer à la machine qui va déprécier ce que je fais », a déclaré Daniel Danger, un illustrateur et graveur qui a appris qu’un certain nombre de ses œuvres étaient utilisées pour former Stable Diffusion.

Les machines sont loin d’être magiques. Pour qu’un de ces systèmes puisse ingérer vos mots et cracher une image, il doit être formé sur des montagnes de données, qui peuvent inclure des milliards d’images extraites d’Internet, associées à des descriptions écrites.

Certains services, y compris le système OpenAIs DALL-E, ne divulguent pas les ensembles de données derrière leurs systèmes d’IA. Mais avec Stable Diffusion, Stability AI est clair sur ses origines. Son ensemble de données de base a été formé sur des paires d’images et de textes qui ont été sélectionnées pour leur apparence à partir d’un cache encore plus massif d’images et de textes provenant d’Internet. Le plein format L’ensemble de données, connu sous le nom de LAION-5B, a été créé par l’association allemande d’IA à but non lucratif LAION, qui signifie réseau ouvert d’intelligence artificielle à grande échelle.

Cette pratique consistant à récupérer des images ou d’autres contenus sur Internet pour la formation d’ensembles de données n’est pas nouvelle et relève traditionnellement de ce que l’on appelle l’utilisation équitable, le principe juridique de la loi américaine sur le droit d’auteur qui autorise l’utilisation d’œuvres protégées par le droit d’auteur dans certaines situations. C’est parce que ces images, dont beaucoup peuvent être protégées par le droit d’auteur, sont utilisées d’une manière très différente, par exemple pour entraîner un ordinateur à identifier les chats.

Mais les ensembles de données deviennent de plus en plus volumineux et forment des systèmes d’intelligence artificielle de plus en plus puissants, y compris, récemment, ces systèmes génératifs que tout le monde peut utiliser pour créer des images remarquables en un instant.

Une pièce de l'illustrateur Daniel Danger qui a été incluse dans les données de formation derrière le générateur d'images Stable Diffusion AI.

Quelques outils permettent à quiconque de rechercher dans l’ensemble de données LAION-5B, et un nombre croissant d’artistes professionnels découvrent que leur travail en fait partie. L’un de ces outils de recherche, construit par l’écrivain et technologue Andy Baio et le programmeur Simon Willison, se démarque. Bien qu’il ne puisse être utilisé que pour rechercher une petite fraction des données d’entraînement de Stable Diffusions (plus de 12 millions d’images), ses créateurs ont analysé l’imagerie artistique qu’il contient et ont déterminé que, parmi les 25 meilleurs artistes dont le travail était représenté, Hanson était l’un des seulement trois qui sont encore en vie. Ils ont trouvé 3 854 images de son art incluses dans leur petit échantillon.

Le fondateur et PDG de Stability AI, Emad Mostaque, a déclaré à CNN Business par e-mail que l’art est une infime partie des données de formation LAION derrière Stable Diffusion. L’art représente beaucoup moins de 0,1% de l’ensemble de données et n’est créé que lorsqu’il est délibérément appelé par l’utilisateur, a-t-il déclaré.

Mais c’est un mince confort pour certains artistes.

Danger, dont les illustrations comprennent des affiches pour des groupes comme Phish et Primus, est l’un des nombreux artistes professionnels qui ont déclaré à CNN Business qu’ils craignaient que les générateurs d’images d’IA ne menacent leurs moyens de subsistance.

Il craint que les images que les gens produisent avec les générateurs d’images IA ne remplacent une partie de son travail plus utilitaire, qui comprend des médias comme des couvertures de livres et des illustrations d’articles publiés en ligne.

Pourquoi allons-nous payer 1 000 $ à un artiste alors que nous pouvons en avoir 1 000 [images] choisir gratuitement? Il a demandé. Les gens sont bon marché.

Tara McPherson, une artiste basée à Pittsburgh dont le travail est présenté sur des jouets, des vêtements et dans des films tels que Juno, lauréat d’un Oscar, s’inquiète également de la possibilité de perdre certains travaux au profit de l’IA. Elle se sent déçue et exploitée pour avoir inclus son travail dans l’ensemble de données derrière Stable Diffusion à son insu, a-t-elle déclaré.

À quel point cela va-t-il être facile ? À quel point cet art va-t-il devenir élégant ?, a-t-elle demandé. En ce moment, c’est parfois un peu bancal, mais cela ne fait que commencer.

Bien que les préoccupations soient réelles, le recours n’est pas clair. Même si les images générées par l’IA ont un impact généralisé, par exemple en modifiant les modèles commerciaux, cela ne signifie pas nécessairement qu’elles violent les droits d’auteur des artistes, selon Zahr Said, professeur de droit à l’Université de Washington. Et il serait prohibitif d’octroyer une licence à chaque image d’un ensemble de données avant de l’utiliser, a-t-elle déclaré.

Vous pouvez réellement ressentir de la sympathie pour les communautés artistiques et vouloir les soutenir et aussi être comme, il n’y a aucun moyen, a-t-elle déclaré. Si nous faisions cela, cela reviendrait essentiellement à dire que l’apprentissage automatique est impossible.

McPherson et Danger ont réfléchi à la possibilité de mettre des filigranes sur leur travail lors de sa publication en ligne pour protéger les images (ou du moins les rendre moins attrayantes). Mais McPherson a déclaré que lorsqu’elle a vu des amis artistes mettre des filigranes sur leurs images en ligne, cela ruine l’art et la joie des gens qui le regardent et y trouvent l’inspiration.

S’il le pouvait, Danger a déclaré qu’il supprimerait ses images des ensembles de données utilisés pour entraîner les systèmes d’IA. Mais supprimer les images d’un travail d’artiste d’un ensemble de données n’empêcherait pas Stable Diffusion de générer des images dans le style de cet artiste.

Pour commencer, le modèle d’IA a déjà été formé. Mais aussi, comme l’a dit Mostaque, des styles artistiques spécifiques pouvaient toujours être invoqués par les utilisateurs grâce au modèle CLIP d’OpenAIs, qui a été utilisé pour entraîner Stable Diffusion à comprendre les liens entre les mots et les images.

Christoph Schuhmann, l’un des fondateurs de LAION, a déclaré par e-mail que son groupe pense que l’activation réelle de l’activation et de la désactivation des ensembles de données ne fonctionnera que si toutes les parties des modèles d’IA, dont il peut y en avoir beaucoup, respectent ces choix.

Une approche unilatérale du traitement du consentement ne suffira pas dans le monde de l’IA ; nous avons besoin d’un système interprofessionnel pour gérer cela, a-t-il déclaré.

Les partenaires Mathew Dryhurst et Holly Herndon, des artistes berlinois qui expérimentent l’IA dans leur travail collaboratif, s’efforcent de relever ces défis. Avec deux autres collaborateurs, ils ont lancé Spawning, créant des outils pour les artistes qui, espèrent-ils, leur permettront de mieux comprendre et contrôler la façon dont leur art en ligne est utilisé dans les ensembles de données.

En septembre, Spawning a publié un moteur de recherche qui peut parcourir l’ensemble de données LAION-5B, haveibeentrained.com, et dans les semaines à venir, il a l’intention d’offrir aux gens un moyen de se retirer ou d’accéder aux ensembles de données utilisés pour la formation. Au cours du dernier mois environ, a déclaré Dryhurst, il a rencontré des organisations formant de grands modèles d’IA. Il veut les amener à accepter que si Spawning rassemble des listes d’œuvres d’artistes qui ne veulent pas être inclus, ils honoreront ces demandes.

Dryhurst a déclaré que l’objectif de Spawnings est de préciser que la collecte de données consensuelle profite à tout le monde. Et Mostaque convient que les gens devraient pouvoir se retirer. Il a déclaré à CNN Business que Stability AI travaille avec de nombreux groupes sur les moyens de permettre à la communauté un meilleur contrôle du contenu de la base de données à l’avenir. Dans un Fil Twitter en septembre, il a déclaré que Stability était prêt à contribuer aux moyens permettant aux gens de se retirer des ensembles de données, par exemple en soutenant le travail de Herndon sur ce sujet avec de nombreux autres projets à venir.

Tara Mc Pherson

Personnellement, je comprends les émotions qui entourent cela alors que les systèmes deviennent suffisamment intelligents pour comprendre les styles, a-t-il déclaré dans un e-mail à CNN Business.

Schuhmann a déclaré que LAION travaille également avec divers groupes pour déterminer comment permettre aux gens d’inclure ou de ne pas inclure leurs images dans la formation de modèles d’IA texte-image. Nous prenons très au sérieux les sentiments et les préoccupations des artistes, a déclaré Schuhmann.

Hanson, pour sa part, n’a aucun problème à ce que son art soit utilisé pour former l’IA, mais elle veut être payée. Si des images sont vendues qui ont été réalisées avec les systèmes d’IA formés sur leur travail, les artistes doivent être indemnisés, a-t-elle déclaré, même si ce sont des fractions de centimes.

Cela pourrait être à l’horizon. Mostaque a déclaré que Stability AI étudie la manière dont les créatifs peuvent être récompensés pour leur travail, d’autant plus que Stability AI elle-même publie des modèles d’IA, plutôt que d’utiliser ceux construits par d’autres. La société annoncera bientôt un plan pour obtenir les commentaires de la communauté sur les moyens pratiques de le faire, a-t-il déclaré.

Théoriquement, je pourrais éventuellement devoir de l’argent à Hanson. J’ai exécuté cette même invite de lumière cristalline sur Stable Diffusion plusieurs fois depuis que nous l’avons conçue, tellement en fait que mon ordinateur portable est jonché d’arbres de différentes teintes, des arcs-en-ciel de lumière du soleil brillant à travers leurs branches sur le sol en dessous. C’est presque comme avoir ma propre galerie Hanson sur mesure.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite