La reconnaissance vocale de Microsoft fait jeu égal avec les humains
Microsoft est fier d'annoncer sur son blog que sa technologie de reconnaissance vocale est maintenant aussi efficace qu'un humain. Le taux d'erreurs de transcription est passé de 6,3 % à 5,9 % en un mois, permettant ainsi à la solution de reconnaissance vocale de l'éditeur de passer devant toutes les autres offres du marché, pour se hisser au niveau des meilleures transcriptions manuelles d'une conversation.
« Cela rendra Cortana plus puissant, ce qui permettra l'émergence d'un assistant vraiment intelligent », se réjouit Harry Shum, vice-président Artificial Intelligence and Research group chez Microsoft.
Intelligence artificielle et réseau de neurones sont au coeur de l'offre de Microsoft, qui n'a pas été ici refondue par les chercheurs, mais tout simplement optimisée pour réduire le taux d'erreurs. L'objectif est maintenant de dépasser le taux moyen d'erreurs d'une transcription manuelle. Mais aussi de proposer une meilleure qualité de reconnaissance vocale dans des environnements bruyants.
Prochaine étape : comprendre
Cortana devra également être capable de saisir plus finement le sens des phrases. Si une transcription manuelle est parfois source d'erreurs, le sens est en général préservé, alors même qu'un ordinateur aura tendance à buter sur certains mots isolés.
« La prochaine frontière est de passer de la reconnaissance à la compréhension », confirme Geoffrey Zweig, responsable du groupe de recherche Speech & Dialog chez Microsoft.
À lire aussi :
Quelles nouvelles fonctionnalités pour Windows 10 Redstone 2 ?
Windows 10 Anniversary : Cortana impossible à débrancher
Hello Cortana Bots ! le futur de Windows selon Microsoft
Crédit photo : © Egor Tetiushev - Shutterstock
Sur le même thème
Voir tous les articles Open source