Microsoft Teams utilise désormais l’IA pour améliorer l’écho, les interruptions et l’acoustique
Microsoft a passé les deux dernières années à ajouter de nouvelles fonctionnalités de productivité flashy à Teams, et maintenant la société révise le fonctionnement des fondamentaux grâce à l’IA. Nous avons tous passé un appel où quelqu’un a une mauvaise acoustique de la pièce, ce qui rend difficile de l’entendre, ou vu deux personnes essayer de parler en même temps, créant un moment gênant de non, vous allez de l’avant. Les nouvelles améliorations de la qualité vocale basées sur l’IA de Microsoft devraient améliorer ou même éliminer ces désagréments quotidiens.
Microsoft utilise maintenant des modèles d’apprentissage automatique pour améliorer l’acoustique de la pièce afin que vous n’ayez plus l’impression que vous vous cachez dans une grotte. Alors que nous avons fait de notre mieux avec le traitement du signal numérique pour faire un très bon travail dans Teams, nous avons maintenant commencé à utiliser l’apprentissage automatique pour la première fois pour créer une annulation d’écho où vous pouvez vraiment réduire l’écho de tous les différents appareils, explique Robert Aichner , responsable principal du programme de conversation intelligente et cloud de communication chez Microsoft, dans une interview avec Le bord.
Microsoft teste cela depuis des mois, mesurant ses modèles dans le monde réel pour s’assurer que les utilisateurs de Teams remarquent la réduction de l’écho et l’amélioration de la qualité des appels. Le fabricant de logiciels a utilisé 30 000 heures de parole pour aider à former ses modèles et a capturé des milliers d’appareils grâce à l’externalisation ouverte où les utilisateurs de Teams sont payés pour enregistrer leur voix et lire l’audio à partir de leur appareil.
Nous simulons également environ 100 000 pièces différentes… l’acoustique de la pièce joue un grand rôle dans l’annulation de l’écho, dit Aichner. Le résultat est une grande amélioration de la qualité audio des appels et une élimination de l’écho qui permet également à plusieurs personnes de parler en même temps. Vous pouvez voir toutes les améliorations en action dans la vidéo ci-dessus.
Si Teams détecte que le son rebondit ou résonne dans une pièce, ce qui entraîne un son peu profond, le modèle convertira également l’audio capturé et le traitera pour donner l’impression que les participants de Teams parlent dans un microphone à courte portée au lieu d’un désordre d’écho.
La partie la plus impressionnante est la possibilité pour les gens de s’interrompre lors d’appels Teams maintenant, sans le chevauchement gênant où vous ne pouvez pas entendre l’autre personne à cause de l’écho. Microsoft expédie désormais tout ce travail dans Teams, parallèlement aux améliorations apportées précédemment à la suppression du bruit basée sur l’IA. Tout le traitement est effectué localement sur les appareils clients, au lieu du cloud.
Nous avons dit que nous voulions le faire sur le client, car le cloud reste cher si vous souhaitez traiter chaque appel dans le cloud… et nous devons évidemment répercuter ce coût sur le client, explique Aichner. Cela signifierait potentiellement restreindre ces améliorations importantes de Teams aux clients payants, et la route sur l’appareil signifie que des fonctionnalités telles que la suppression du bruit sont disponibles sur 90% des appareils utilisant Teams.
Toutes ces nouvelles améliorations de Microsoft Teams sont désormais en ligne, ainsi que certaines optimisations d’écran en temps réel pour le texte dans les vidéos et des améliorations basées sur l’IA pour les contraintes de bande passante lors des appels vidéo ou de partage d’écran.