The Finals d’Embark Studios utilise l’IA de synthèse vocale pour les voix dans le jeu
Joueurs du prochain jeu de tir multijoueur Les finales a fait une découverte inhabituelle lors d’une version bêta ouverte du jeu ce week-end : que toutes les lignes vocales du jeu ont été produites à l’aide de la technologie d’IA générative.
L’utilisation par le studio de la technologie d’IA générative a été confirmée lorsque le doubleur Gianni Matragrano a déterré une vieille conversation en podcast avec Andreas Almstrm, ingénieur du son d’Embark Studios. Au cours de l’interview, il a révélé que l’IA était utilisée pour presque tout, des commentaires dans le jeu aux aboiements vocaux des personnages des joueurs.
L’utilisation de l’IA dans les jeux est devenue particulièrement controversée, notamment en ce qui concerne les performances vocales. Au moment de la rédaction de cet article, les membres de la SAG-AFTRA négocient avec les développeurs de jeux sur de meilleurs salaires et des protections contre l’IA, dans un contexte d’inquiétudes croissantes concernant les acteurs contraints de renoncer à leurs droits de voix.
Il s’agit notamment du premier exemple réel de développeurs de jeux utilisant des voix d’IA au lieu d’interprètes humains, et ce dans une quasi-totalité. De plus, Almstrm n’a pas divulgué lequel Un outil d’IA a été utilisé : certains développeurs ont déjà été accusés d’utiliser du matériel protégé par le droit d’auteur pour former leur technologie.
Il a estimé que la synthèse vocale de l’IA était « enfin extrêmement puissante » et méritait d’être utilisée, car elle « nous amène suffisamment loin en termes de qualité ». [It also] nous permet d’être extrêmement réactifs aux nouvelles idées et de garder les choses vraiment, vraiment fraîches. »
Dans d’autres cas, comme des grognements d’effort, les membres du personnel d’Embark sont intervenus, car l’IA « ne peut pas encore vraiment effectuer ce genre de tâches ». Et à ceux qui pensent que les voix de l’IA semblent… étranges, Almstrm a défendu ce choix, affirmant qu’elles « se marient toujours assez bien avec l’esthétique du jeu télévisé virtuel ».
La technologie de l’IA générative n’est pas chaleureusement accueillie par tous les développeurs
Plus tôt dans la journée, le gouvernement américain a dévoilé un décret sur l’IA et des garanties pour cette technologie. Embark est basé en Suède, mais ce décret vise à créer un ensemble plus large de normes que le monde pourra utiliser en matière d’IA.
Les développeurs qui ont utilisé la technologie (ou qui ont exprimé leur intérêt) ont suscité de vives critiques de la part de leurs pairs et des joueurs. Ses effets sur l’industrie du jeu se sont certainement fait sentir tout au long de l’année, et dans l’utilisation de l’IA à des fins Les finales, Embark s’est fixé un objectif important sur ce qui sera son premier titre.
Mise à jour: S’adressant à des médias tels qu’IGN, un représentant d’Embark a expliqué comment le studio a utilisé des performances de synthèse vocale (TTS) à la fois humaines et IA pour Les finales. La voix utilisée dépend du contexte, ont-ils déclaré, et les voix humaines sont un mélange de personnel d’Embark et d’acteurs professionnels.
TTS a permis à l’équipe « d’avoir une voix sur mesure là où nous n’aurions pas pu le faire autrement », ont-ils poursuivi, « en raison de la rapidité de mise en œuvre. Dans les cas où nous utilisons TTS dans le jeu, il est toujours basé sur de vraies voix. »
Pour les acteurs humains, le représentant d’Embark a reconnu qu’ils « laissent la chimie des personnages et les conflits façonner le résultat », [which] est quelque chose qui ajoute de la profondeur à nos mondes de jeu, une technologie qui ne peut pas être imitée. »
S’ils ont rapidement assuré que créer des jeux sans acteurs humains « n’est pas un objectif final », ils ont noté que TTS « a introduit de nouvelles façons de travailler ensemble ».
Donc je suppose que la finale se déroulera avec des voix IA… ? pic.twitter.com/PIAbR43ZrT
Gianni Matragrano (@GetGianni) 28 octobre 2023