IBM : des API Watson pour éviter la panne des sens
A l'occasion de son événement Interconnect qui s'est tenu la semaine dernière à Las Vegas, IBM a annoncé ou confirmé la disponibilité de plusieurs API Watson, accessibles aux développeurs. Elles visent à mieux comprendre le sens des interactions humaines.
Comme nous l'avons évoqué à plusieurs reprises (ici ou là, par exemple), IBM investit fortement sur sa technologie d'intelligence artificielle Watson. Cette technologie d'aide à la décision permet d'interroger en langage naturel des bases d'informations structurées ou des documents non structurés. Baptisée informatique cognitive, Watson repose sur du code et des algorithmes, rendus accessibles via des API. En effet, la programmation moderne reposera (c'est déjà en partie le cas) sur un assemblage de codes prêts à l'emploi (les API), réutilisables et maintenus par leurs auteurs respectifs.
IBM propose donc plusieurs fonctions de Watson sous forme d'API, accessibles à travers son PaaS Bluemix. Ces fonctions sont gratuites pendant la phase de bêta. Ces API reçoivent l'information à analyser et renvoient le résultat au format Json ou XML selon les besoins, avec présentation hiérarchique des résultats.
Quand l'émotion nait de l'intelligence artificielle
« Toutes ces API cognitives offrent aux développeurs la possibilité d'intégrer à leurs applications plusieurs dimensions sensorielles humaines pour plus de perspicacité », assure Rob High, directeur technique et vice-président de Watson chez IBM.
Comme nous l'expliquions en juillet dernier, l'API Tone Analyser analyse le sens de n'importe quel texte afin de détecter les émotions (négativité, joie, colère), la prédisposition sociale (ouvert, agréable, consciencieux) et le style d'écriture (analytique, confiant, timide). Les améliorations annoncées apportent de nouvelles émotions détectées comme la joie, le dégoût, la peur ou la tristesse, mais aussi des dispositions sociales comme le caractère extraverti. Désormais, Tone Analyser analyse des phrases entières, en anglais uniquement (pour le moment).
En mars dernier IBM a racheté AlchemyAPI, spécialiste du Deep Learning (voir notre article). Désormais, le groupe d'API issu de l'acquisition est enrichi de l'API Watson Emotion Analysis. Cette dernière utilise des algorithmes de Natural Language Processing (processus de langage naturel) pour analyser des fichiers textes jusqu'à 50 Ko afin d'y détecter les principales émotions : joie, peur, tristesse, dégoût ou colère. Bien utile pour analyser des messages, des blogs, des textes de réseaux sociaux, ou même des messages avant de leur envoi. Séduisant pour le marketing par exemple.
Parce que la communication peut aussi être non verbale, la reconnaissance visuelle apporte son lot d'informations. L'API Visual Recognition (reconnaissance visuelle) vise à reconnaître des formes ou des concepts dans des images ou des vidéos. Et renvoie un résultat sur la base de ce qu'elle a détecté. Désormais, l'utilisateur peut l'entraîner à reconnaître des formes afin de les détecter dans des images ou vidéos, en plus des formes par défaut. Ainsi, chaque développeur peut personnaliser la reconnaissance visuelle selon ses besoins, ses concepts ou idées à reconnaître. Cela peut s'avérer utile également dans le cadre de classements ou catégorisations automatisées d'images ou de vidéos.
Watson rend les robots vocaux moins 'froids'
Outre ces trois annonces, IBM annonce aussi l'intégration des émotions dans son API Text-to-Speech (synthèse vocale ou Watson TTS). De quoi rendre les interactions vocales plus "humaines" en véhiculant des émotions après analyse du texte à énoncer. Une voie pour infléchir l'intonation de la voix selon le contexte lié à l'analyse des mots et des phrases.
La prise en compte des émotions dans des échanges informatisés peut indéniablement apporter un plus. Cependant, la limite de l'anglais reste un handicap. En effet, même s'ils écrivent en anglais, les interlocuteurs ne s'exprimant pas dans leur langue naturelle risquent de fausser les résultats. D'autant plus que dans de nombreuses situations, ils se contentent de copier/coller du Google Translator.
Lire aussi : Gemini 2.0 : où, quand et pour qui ?
A lire aussi :
Watson IoT : IBM choisit Munich comme siège mondial
Watson : le bon docteur qui va soigner IBM France ?
Crédit photo : JuliusKielaitis / Shutterstock.com
Sur le même thème
Voir tous les articles Data & IA