World Intellectual Property Organization

CLIR à l’assaut de la Tour de Babel

babel_tower

La recherche par mots clés dans les descriptions et revendications de brevets écrits en chinois, coréen, russe ou portugais devient possible dans PATENTSCOPE sans connaissance de ces langues.
 
En juin 2010, l’OMPI lançait la version bêta de son extension CLIR – Cross-lingual Information Retrieval – pour PATENTSCOPE : un outil de recherche d’informations multilingue innovant en 5 langues (allemand, anglais, espagnol, français et japonais) permettant d’ élargir les recherches en matière de brevet.
 
Moins d’une année après le lancement de cet outil, le chinois, coréen, russe et portugais viennent d’être ajoutés. Le coréen, le russe et le portugais sont encore à un stade expérimental en raison de la complexité de la langue coréenne et d’un corpus d’entraînement de taille restreinte pour les  langues portugaise et russe.
 
Les améliorations suivantes ont également été apportées: 
  • Meilleures propositions de synonymes en japonais en mode supervisé.
  • Couverture linguistique de l’allemand étendue en utilisant la collection de brevets publiée par l’Office Européen des Brevets (OEB).
Afin d’améliorer la couverture des dictionnaires, l’OMPI recherche des corpus bilingues dans les paires de langues suivantes : anglais-portugais, anglais-espagnol et anglais-russe. Sont notamment recherchés tous titres, abrégés, articles scientifiques et brevets parallèles dans ces combinaisons bilingues, ce qui permettrait d’améliorer considérablement l’ outil CLIR depuis et vers ces langues.
 
Votre avis et suggestions pour améliorer l’outil sont les bienvenus

Explorez l'OMPI