La startup d’IA soutenue par Nvidia, Synthesia, vous permet désormais de réaliser des présentations vidéo multilingues en utilisant uniquement votre téléphone ou votre webcam.
Synthesia a lancé une option permettant de créer des avatars générés par l’IA en enregistrant des images de vous-même avec une webcam ou votre téléphone.
Synthésie
Parmi les nouvelles mises à jour lancées par Synthesia, on trouve la possibilité de produire des avatars IA à l’aide de webcams ou d’un téléphone, des avatars « corps entier » avec mains et bras, et un outil d’enregistrement d’écran qui montre un avatar IA vous guidant à travers ce que vous regardez.
Synthesia, qui affirme être utilisée par près de la moitié des Fortfune 500, utilise des avatars IA à toutes sortes de fins.
Celles-ci peuvent aller de la création de vidéos de formation sur mesure pour guider les employés dans certains processus, ou à la génération de matériel promotionnel pouvant être diffusé sous la forme d’une vidéo plutôt que d’un e-mail ou d’autres communications textuelles.
Mais cela n’a pas toujours été le cas. Selon le co-fondateur et PDG Victor Riparbelli, au cours des trois premières années de l’histoire de l’entreprise, Synthesia a en fait commencé par essayer de vendre sa technologie à des agences hollywoodiennes et à des sociétés de production vidéo à gros budget. L’entreprise a utilisé la vision par ordinateur pour un outil de doublage IA. cela rendait les mouvements de la bouche plus réalistes pour différentes langues.
« Ce que nous avons compris, c’est que le seuil de qualité pour faire quoi que ce soit avec ces gars-là était si grand que, quoi que nous fassions, nous serons une très petite partie d’un processus beaucoup plus vaste », a déclaré Riparbelli à CNBC dans une interview au bureau londonien de l’entreprise.
« Ce qui était plus intéressant, c’était l’aspect démocratisation : il y a des millions de personnes dans le monde qui veulent faire de la vidéo, mais ils ne font pas de vidéo aujourd’hui parce qu’ils n’ont pas le budget. »
Dans un discours à la Apple, le PDG de Synthesia a dévoilé les nouveaux produits de l’entreprise, les présentant comme une suite d’outils plus axée sur la productivité destinée aux entreprises, plutôt que comme une simple plate-forme proposant des avatars IA.
L’une des nouveautés les plus importantes présentées par la société était la possibilité de créer des avatars générés par l’IA en enregistrant moins de cinq minutes de séquences à l’aide d’une webcam ou de votre téléphone. Vous pouvez également cloner votre voix pour que les avatars parlent dans plusieurs langues différentes
En règle générale, pour créer un avatar IA à l’aide de la plateforme Synthesia, il faut se rendre en personne dans un studio. Les acteurs humains se rendent dans une cabine d’enregistrement, enregistrent leur voix et interprètent leurs répliques devant un écran vert sur un véritable plateau de tournage.
Il s’agit de données d’entraînement destinées à fournir à l’algorithme d’IA de Synthesia les nuances faciales et vocales dont il a besoin pour créer des avatars ressemblant à des humains qui parlent de manière expressive. Plus tôt cette année, Synthesia a lancé de nouveaux avatars expressifs capables de transmettre des émotions humaines, notamment la joie, la tristesse et la frustration.
Mais maintenant, Synthesia introduit un nouveau logiciel qui permettra aux utilisateurs de produire plus facilement une version numérique d’eux-mêmes depuis n’importe où, en utilisant simplement une webcam et le logiciel de Synthesia.
L’entreprise lance également la possibilité de créer des avatars en pied. Cette fonctionnalité est différente des avatars actuels de Synthesia, qui se limitent à une vue portrait. Désormais, vous pouvez entrer dans un studio avec des dizaines de caméras, de capteurs et de lumières tout autour de vous pour créer des avatars qui peuvent bouger leurs mains.
Générer des mains est une tâche traditionnellement difficile à réaliser pour l’IA, car les mains ne représentent qu’une petite partie du corps humain et ne sont généralement pas au centre du contenu visuel.
Synthesia a également lancé la possibilité de lire des vidéos d’avatars IA parlant dans la langue de leur choix, que ce soit l’anglais, le français, l’allemand ou le chinois.
À l’avenir, Synthesia affirme qu’elle sera capable d’adapter les avatars de l’IA à différents pays : par exemple, un avatar nigérian faisant suivre un didacticiel à un utilisateur plutôt qu’un américain.
L’assistant vidéo IA de Synthesia peut produire des résumés d’articles et de documents entiers.
Synthésie
Synthesia a également lancé un nouvel assistant vidéo IA capable de produire des résumés d’articles et de documents entiers. Il peut s’agir d’un spécialiste des ressources humaines réalisant une courte vidéo expliquant les avantages sociaux d’une entreprise, par exemple.
L’outil d’enregistrement d’écran de Synthesia affiche un avatar IA vous guidant à travers ce que vous regardez.
Synthésie
Une autre fonctionnalité importante que la société déploie est un nouvel outil d’enregistrement d’écran, qui montre un avatar IA vous guidant à travers ce que vous regardez.
Dans l’interview de CNBC avec lui, Riparbelli a qualifié ce que Synthesia tente de faire de refonte de produits axée sur l’entreprise, ce qui la rapprocherait davantage de géants comme Microsoft, Salesforce et Zoom dans la catégorie des entreprises.
« Le monde a été époustouflé par ce genre de choses au cours des 12, 18 ou 24 derniers mois, ce qui est génial », a déclaré Riparbelli à CNBC.
« Mais maintenant, nous avons beaucoup expérimenté et nous avons découvert les cas d’utilisation appropriés pour ces technologies qui ont une valeur commerciale durable. Il ne s’agit pas simplement d’un moment de relations publiques à court terme. »
« Vous devez atteindre cet objectif commercial de réduction des tickets d’assistance client en affichant des vidéos au lieu de texte ; ou vendre en créant des vidéos au lieu de simplement envoyer des e-mails », a-t-il ajouté.
« Maintenant, les gens créent des flux de travail autour de cela. Ils ont besoin de meilleurs moyens d’atteindre leurs objectifs commerciaux, et pas seulement d’une interface avec des modèles d’IA. C’est là que nous nous dirigeons en tant qu’entreprise. »
L’année dernière, Synthesia a levé 90 millions de dollars auprès d’investisseurs, dont le fabricant américain de puces Nvidia et la société de capital-risque Accel, lors d’un cycle de financement qui l’a valorisé à 1 milliard de dollars et lui a conféré le statut de « licorne ».
Parmi les concurrents de l’entreprise figurent les outils vidéo IA Veed, Colossyan, Elai et HeyGen. L’application de médias sociaux chinoise TikTok a également récemment lancé Symphony Assistant, un produit qui permet aux créateurs de créer leurs propres avatars IA.
L’entreprise gagne de l’argent grâce à un certain nombre de plans de tarification par abonnement allant de 22 $ pour un plan « démarreur » et 67 $ pour un plan « créateur », jusqu’à des plans « entreprise » personnalisés où la tarification est basée sur des négociations avec l’équipe commerciale de Synthesia.