Elon Musk menace de poursuivre Microsoft pour avoir utilisé les données de Twitter pour son IA

Les milliardaires vendent des actions Nvidia et achètent…

Pavlo Gonchar | Fusée lumineuse | Getty Images

Le PDG de Twitter, Elon Musk, a menacé mercredi de poursuivre Microsoft en justice, accusant le géant du logiciel d’utiliser illégalement les données de la société de médias sociaux pour former son modèle d’intelligence artificielle.

La menace de Musk par tweet est intervenue après que Mashable et d’autres publications ont annoncé que Microsoft supprimerait Twitter de sa plate-forme publicitaire, qui permet aux acheteurs de publicités de gérer tous leurs comptes de médias sociaux en un seul endroit.

« Ils se sont entraînés illégalement en utilisant les données de Twitter », a tweeté Musk. « L’heure du procès. »

Musk, qui est également PDG de Tesla et SpaceX, tweete souvent sur des plans qui ne se concrétisent jamais, et aucune poursuite ne semble avoir été déposée. La ligne de presse de Twitter n’a pas répondu de manière significative à une demande de commentaire, et un représentant de Microsoft a refusé de commenter.

La menace de Musk est la dernière indication que la propriété des données devient rapidement un champ de bataille difficile dans la ruée vers l’IA générative. Les grandes entreprises technologiques s’efforcent de développer des modèles d’IA de pointe comme le GPT d’OpenAI, et les propriétaires de données cherchent à les arrêter ou à facturer l’utilisation de leur contenu.

Microsoft développe ses propres soi-disant grands modèles de langage (LLM) et vend l’accès aux modèles d’OpenAI. Microsoft a investi 10 milliards de dollars dans OpenAI l’année dernière dans le cadre d’un accord inhabituellement structuré. Musk était co-fondateur d’OpenAI avant de quitter son conseil d’administration en 2018 et s’est récemment plaint du passage de l’entreprise d’un modèle à but non lucratif à une entreprise très précieuse influencée par Microsoft.

Les LLM comme GPT nécessitent des téraoctets de données pour la formation, dont une grande partie provient de sites Web tels que Reddit, StackOverflow et Twitter. Les données d’entraînement des réseaux sociaux sont précieuses car elles capturent des conversations informelles en va-et-vient.

Alors que ces nouveaux modèles d’IA passent des laboratoires de recherche et des universités au monde de l’entreprise, les propriétaires des données commencent à faire des demandes.

Par exemple, Reddit a déclaré plus tôt cette semaine qu’il facturerait aux entreprises l’accès à son interface de programmation utilisée pour alimenter les conversations entre Redditors dans un logiciel de formation à l’IA. Universal Music Group a également déclaré cette semaine qu’une telle formation de la musique d’artistes représenterait « à la fois une violation de nos accords et une violation du droit d’auteur » en réponse à une vidéo virale d’une chanson qui prétendait utiliser l’IA pour imiter le rappeur Drake.

Et la base de données de photos Getty Images poursuit Stable Diffusion, alléguant que la société a copié son contenu pour former son générateur d’images AI.

Musk a déclaré en décembre que Twitter « suspendrait » l’accès d’OpenAI à sa base de données. Il a également annoncé son intention de créer son propre grand modèle de langage dans l’une de ses sociétés appelée TruthGPT.

MONTRE: Elon Musk voulait prendre en charge OpenAI en 2018

www.actusduweb.com

Suivez Actusduweb sur Google News

Similaire