Xerox PARC fait techno commune avec Powerset, futur concurrent de Google
Le projet de moteur de recherche en langage naturel de Powerset Inc., attendu pour la fin 2007, reprend à son profit 30 années de recherches du Palo Alto Reseach Center (PARC) de Xerox.
Le moteur de Powerset embarque en particulier la technologie de langage naturel que le PARC développe depuis 2005, et qui a été présenté quelques semaines avant la création de la start-up, et qui a été intégrée dans la technologie du projet dans les semaines qui ont suivi.
Les rapports entre les deux firmes sont donc particulièrement proches, surtout que le directeur technologique et scientifique de Powerset, Ron Kaplan, n'est autre qu'un des acteurs du projet langage naturel du PARC.
Outre l'accord de licence passé entre Xerox et Powerset, le moteur de recherche en démarrage est autorisé à accéder aux brevets du PARC. En contre-partie, des 'royalties' seront reversées au centre de recherche.
A la différence des moteurs de recherche de Google, Yahoo ou Microsoft MSN qui dépendent de la bonne saisie de mots clés, le moteur de Powerset accepte les requêtes des internautes dans leur langage quotidien. Une démarche où le New York Times voit une 'chance de rivaliser avec Googie'.
Une question comme 'Qui est le personnage-clé, fondateur de la royauté belge ?' sur un moteur classique risque de disperser les recherches sur des termes non essentiels (qui, est, personnage, clé.), d'où une moindre pertinence de la requête. Mais, pour autant, quel 'plus' apporte une requête en langage naturel?
« Permettre aux ordinateurs d'extraire l'essentiel et les relations dans le texte est un problème incroyablement difficile« , affirme Barney Pell, le fondateur et patron de Powerset.
Et d'affirmer que les recherches du PARC ont récemment créé des ruptures technologiques qui vont permettre à Powerset de proposer une très grande qualité de traitement du langage naturel.
Pour autant, celui qui détrônera Google n'est certainement pas encore né. Et d'autres projets, comme Hakia ou Brainboost explorent eux aussi la recherche en langage naturel, sans oublier AskJeeves, Gimpsy, Albert, Coesvista, Netfind Server. (ou encore Accona ou le projet Quaero/Exalead)
Grâce à des technologies qui pourraient révolutionner notre façon de communiquer avec les environnements numériques, mais qui pour l'instant, et depuis 30 ans, vu la lenteur des progrès accomplis sur ce sujet des plus complexes, sont surtout des objets d'expérimentation, loin encore de quitter les laboratoires.
Sur le même thème
Voir tous les articles Business