Verity extrait 'données et concepts' de l'entreprise
Publié par La rédaction le - mis à jour à
Gérer le capital intellectuel de l'entreprise en automatisant l'extraction de l'information? Une jeune société apporte sa contribution avec Extractor 1.0, une solution d'ICM
Encore un sigle! L'
ICM ? C'est l'Intelligent Capital Management, la gestion du capital intellectuel de l'entreprise, généralement dispersé dans ses supports d'information. Cette dispersion rend délicate, voire difficile, l'exploitation de ce contenu non structuré. L'éditeur Verity propose des solutions de recherche, de classification et de recommandation, qui accompagnent l'entreprise dans cette démarche. Son offre avec Extractor 1.0 constitue une brique logicielle qui complète les solutions de cet éditeur: identification et extraction des « concepts, données ou entités dispersés sur les supports numériques de l'entreprise« . Son intégration améliore les performances, la pertinence et la valeur ajoutée des systèmes de gestion du capital intellectuel. « Verity Extractor a été conçu dès le départ pour s'interfacer avec nos technologies de recherche, classification et recommandation. Chaque élément est optimisé pour travailler harmonieusement avec les autres modules, pour améliorer les performances, la pertinence et la valeur des systèmes de gestion du capital intellectuel», confirme Anthony J. Bettencourt, président et CEO de Verity. Pertinence des recherches améliorée Le système combine des recherches simples et des recherches en texte intégral, en utilisant les données extraites pour améliorer la pertinence de la recherche. La pertinence des recherches en texte intégral est accrue grâce à une analyse du sens des mots. Par exemple, on peut identifier des entités trouvées dans des contenus non structurés, tels des systèmes de messageries médicales sécurisées (noms de médecins, d'hôpitaux, de contrats d'assurance, de dossiers médicaux et dates). Tous sont étiquetés afin que, lorsqu'une personne du service administratif recherche une ordonnance de médecin à fournir à un patient, seul le dossier de cette personne lui soit retourné, sans inclure les documents ayant trait à un médecin portant le même nom que le patient, ou à un patient portant le même nom que le médecin. Localiser des informations sur des sites de e-commerce Verity Extractor intègre 'Parametric Selection', un outil très utile pour localiser des informations sur des sites de e-commerce et dans le cas d'entreprises bénéficiant de critères de sélection déterminés par des valeurs. Cependant, ce type de navigation nécessite une information structurée, typiquement en provenance d'une base de données ou d'un document XML. La solution ajoute une structure aux sources d'information qui ne possédaient ni titre ni méta données, pour utiliser au mieux les avantages de la fonctionnalité 'Parametric Solution'. Ceci permet d'accroître la pertinence des recherches et prolonge la disponibilité des nouveaux contenus non structurés. Il s'agit donc d'un outil puissant pour augmenter l'exactitude de la classification automatique et faciliter le déploiement des taxinomies. En utilisant les données en plus des mots et des phrases, les algorithmes générés par le système sont capables de faire correspondre les documents aux catégories. Les données identifiées peuvent aussi permettre aux taxinomies multi dimensionnelles de Verity (multiples taxinomies simultanées) de localiser l'intersection de l'information. Trouver les relations entre les entités se fait très rapidement et très précisément surtout dans les domaines de l'assurance, de la gestion des risques ou de la lutte contre le terrorisme. Rendre le contenu exploitable La capacité de Verity Extractor à ajouter de la structure à du contenu non-structuré permet à celui-ci d'être archivé et géré par les bases de données. Cela donne d'autant plus de valeur au contenu, permettant d'être réutilisé par d'autres applications d'entreprise, telles que le planning des ressources, la gestion de la relation client, les ressources humaines, business intelligence et autres systèmes nécessitant évaluation et traitement. Les entités d'information les plus courantes sont livrées prêtes à l'emploi. Elles comprennent : des noms de sociétés commerciales, de personnes, de lieux, des adresses postales et Internet, numéros de téléphone, dates, heures, nombres, prix et monnaies, des mesures métriques, numéros de sécurité sociale, des fonctions et des vacances. En plus des entités fournies, cet extracteur permet de construire et de déployer ses propres entités pour répondre à des besoins spécifiques tels que le nombre de pièces produites dans le département fabrication, le classement des achats et des ventes pour des applications de recherche et, enfin, les noms des organisations potentielles terroristes et les systèmes de sécurité, défense et renseignement. Intégration avec la recherche de K2 Enterprise Un aspect important de l'intégration de Verity Extractor avec les technologies de recommandation, classification et de recherche de Verity est son évolutivité au sein de l'architecture de Verity K2. Cela permet aux entreprises de rationaliser les investissements en logiciels face à l'augmentation des contenus, l'évolution des environnements et des besoins des organisations. Pour une implémentation rapide, le produit supporte C et Java.