TikTok propose désormais un générateur d’IA texte-image très basique directement dans l’application
Les systèmes d’IA texte-image sont en plein essor en termes de capacités et de popularité en ce moment, et quelle meilleure preuve que leur apparition dans l’application la plus populaire au monde : TikTok.
La plate-forme vidéo a récemment ajouté un nouvel effet appelé AI greenscreen qui permet aux utilisateurs de saisir une invite de texte que le logiciel générera ensuite sous forme d’image. Cette image peut ensuite être utilisée comme arrière-plan d’une vidéo potentiellement un outil très utile pour les créateurs.
La sortie du système TikToks est assez basique par rapport à celle des modèles de synthèse texte-image à la pointe de la technologie tels que Googles Imagen, OpenAIs DALL-E 2 ou le logiciel éponyme Midjourneys. Il ne crée que des images assez abstraites et tourbillonnantes ; une force reflétée dans la nature rêveuse des TikToks suggérant des invites comme l’astronaute dans l’océan et la galaxie des fleurs. D’autres modèles, par comparaison, peuvent produire à la fois des images photoréalistes et des illustrations complexes et cohérentes qui semblent avoir été dessinées ou peintes par des humains.
Les limitations du modèle TikToks peuvent cependant être intentionnelles. Premièrement, les modèles plus avancés nécessitent une plus grande puissance de calcul, ce qui serait coûteux et gourmand en ressources pour l’entreprise à mettre en œuvre. Deuxièmement, TikTok compte plus d’un milliard d’utilisateurs, et donner à tous ces individus le pouvoir de créer des images photoréalistes de tout ce qu’ils peuvent imaginer produirait presque certainement des résultats troublants.
Par exemple, nous avons testé la capacité des modèles à créer de la nudité et du gore, deux types de sortie que les générateurs de texte en image tentent souvent de limiter. Les images basées sur des invites violentes comme l’assassinat de Boris Johnson et l’assassinat de Joe Biden produisent principalement des tourbillons abstraits, avec un visage à peu près reconnaissable pour le Premier ministre britannique (bien que la vadrouille blonde familière de l’homme rende la caricature particulièrement facile).
De même, une demande impliquant un modèle nu de nudité sur la plage produit des couleurs thématiquement appropriées, y compris des tons chair, des oranges sableuses et des bleus océaniques, mais rien qui ferait rougir un vicaire.
Ce qui est remarquable dans l’apparition de l’écran vert TikToks AI, c’est qu’il montre à quelle vitesse cette technologie se généralise. Le dernier cycle de développement de l’IA text-to-image a sans doute commencé en 2021 avec la version originale de DALL-E par OpenAI. Moins de deux ans plus tard, la technologie est déjà entre les mains de millions de personnes via une application comme TikTok.
Étant donné le potentiel de ces systèmes à la fois pour le mal et pour le bien, les choses ne feront que devenir plus étranges à partir de maintenant.