Le projet GramLab vient de faire son entrée sur SourceForge (et sur le web). Financé par le Feder (Fonds Européen de Développement Économique), il permettra de créer des outils de traitement du langage open source, couvrant un large ensemble de domaines.
Un outil très flexible
GramLab est conçu dès la base pour s’adapter à des besoins très variés. Il pourra ainsi être utilisé au sein d’outils de correction orthographique, d’indexation sémantique dans une base documentaire, d’extraction automatique d’informations, de reconnaissance de termes, etc. Il est conçu pour les langues anglaise et française.
Ce projet est porté par quatre éditeurs de logiciels (Actimos, Lingway, Kwaga et Qwam Content Intelligence) et le LIGM (Laboratoire d’Informatique Gaspard-Monge) qui œuvre au sein de l’Université Paris-Est Marne-La-Vallée.
Une première application pratique
L’équipe de GramLab fournit d’ores et déjà un premier exemple d’utilisation de sa technologie, qui prend la forme d’un annotateur compatible avec le standard Apache IUMA. CityAnnotator permet de repérer les noms des communes françaises au sein d’un ensemble de pages HTML.
Cet outil pourra par la suite être modifié pour reconnaitre d’autres séries de termes ou pour utiliser une grammaire différente (basée ou non sur celle de CityAnnotator).
Une mise à jour de l'EDR Crowdstrike Falcon a planté une multitude de serveurs et…
Un modèle GPT-4o mini rejoint le catalogue d'OpenAI. De la conception à l'évaluation, il a…
La Cour des comptes appelle à formaliser et à professionnaliser certains aspects du RIE, tout…
La Cour des comptes attire l'attention sur le risque d'affaiblissement d'Etalab, privé, ces dernières années,…
Missions historiques de la Dinum, l'ouverture des données publiques et la promotion des logiciels libres…
Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de…