Pour gérer vos consentements :

Contact Center AI : Google muscle la reconnaissance vocale

Google a mis à niveau et enrichi sa suite de solutions de reconnaissance vocale basées sur l’intelligence artificielle pour centres d’appels.

L’ensemble est regroupé au sein du portefeuille Contact Center AI depuis l’été 2018.

Le service est orienté développeurs et chatbots. Les améliorations et mises à jour annoncées concernent les technologies socles de l’offre.

Ainsi, Dialogflow, la plateforme de développement d’interfaces conversationnelles de Google, inclut désormais la fonctionnalité Auto Speech Adaptation (en version bêta).

Celle-ci peut être activée par le développeur dans la console Dialogflow.

Avec elle, les agents virtuels devraient pouvoir « comprendre rapidement ce dont les clients ont besoin », y compris dans des environnements bruyants, a indiqué Google dans un billet de blog. La fonctionnalité améliorerait la précision de ces bots de plus « de 40% ».

SpeechContext

D’autres amélorations, toutes en version bêta, concernent Cloud Speech-to-Text, l’API de Google qui permet aux développeurs de convertir du son en texte en exploitant des modèles de réseaux de neurones. La solution intègre dorénavant un modèle de base de reconnaissance vocale amélioré pour les solutions de serveur vocal interactif (Interactive Voice Response – IVR) et les agents virtuels « phone-based ».

Renforcer la reconnaissance vocale dans les centres de contact pour une expérience client améliorée.

La solution inclut également une fonction étendue de streaming (Endless streaming). « Jusqu’à présent, Cloud Speech-to-Text prenait en charge la diffusion audio uniquement par sessions d’une minute. Ce qui posait problème pour les transcriptions de longue durée comme les réunions, la vidéo en direct et les appels téléphoniques. » C’est la raison pour laquelle cette durée « a été portée à 5 minutes », a souligné Google.

Par ailleurs, le support natif du format de fichier MP3 est activé dans Cloud Speech-to-Text.

Enfin, pour Dialogflow et Cloud Speech-to-Text, des mises à jour des paramètres de SpeechContext de Google sont proposés. Avec elles, les développeurs doivent pouvoir compléter leurs applications d’informations contextuelles supplémentaires permettant d’améliorer la précision de la transcription. Et, par extension, l’expérience client.

(crédit photo © Shutterstock)

Recent Posts

L’app MFA Authy mise à mal par une API non sécurisée

Une API sans authentification a permis à des tiers de valider les numéros de téléphone…

2 heures ago

Les logiciels libres entrés au SILL au deuxième trimestre 2024

D'AgentJ à YesWiki, voici les dernières entrées au SILL (Socle interministériel de logiciels libres).

17 heures ago

WSL2 fait le grand saut vers Linux 6.6

En parallèle de diverses expérimentations, Microsoft livre une première version de WSL2 basée sur Linux…

22 heures ago

Google pétri d’incertitudes sur l’empreinte environnementale de l’IA

Le dernier rapport environnemental de Google comporte peu d'indicateurs spécifiques à l'IA. Quelles perspectives l'entreprise…

24 heures ago

Optimisation du processus commercial : la clé de la croissance pour les TPE/PME ?

Booster les performances des forces de vente en fondant les processus commerciaux sur ce que…

1 jour ago

Red Hat France : la problématique VMware plus concrète que les LLM

Respectivement DG et CTO de Red Hat France, Rémy Mandon et David Szegedi évoquent le…

2 jours ago