Avec 10 langues de référence, la base de données terminologique de l’OMPI booste ses performances

20 août 2019

La base de données terminologique gratuite de l’OMPI, WIPO Pearl, contient près de 180 000 termes dans 10 langues et dispose désormais d’une interface optimisée pour les appareils mobiles. Une nouvelle présentation permet aux utilisateurs de visualiser des cartes conceptuelles innovantes et des nuages de concepts fondés sur l’intelligence artificielle directement dans la liste de résultats de la recherche par terme et en mode plein écran, permettant de clarifier les relations entre les termes scientifiques et techniques pour les innovateurs.

Au sujet de WIPO Pearl

Le portail WIPO Pearl a été lancé en 2014 pour favoriser une utilisation exacte et uniforme des termes scientifiques et techniques dans les 10 langues de publication du Traité de coopération en matière de brevets (PCT), le système international des brevets administré par l’OMPI, facilitant la recherche et le partage de connaissances scientifiques et techniques dans différentes langues.

Les termes scientifiques et techniques peuvent être recherchés dans 45 combinaisons de langues différentes, permettant d’effectuer des recherches entre les langues européennes et asiatiques et entre l’une de ces langues et l’arabe. C’est ce qui rend WIPO Pearl unique dans l’offre actuelle de ressources linguistiques disponibles gratuitement sur le Web.

WIPO Pearl est alimenté par des linguistes et des terminologues expérimentés de l’OMPI qui valident les termes en leur attribuant une note de fiabilité. Les données sont de qualité car chaque terme est généré par une personne et validé par au moins un deuxième linguiste, parfois également un expert du domaine technique, avant d’être publié.

Les termes proviennent actuellement de demandes internationales de brevet déposées par l’intermédiaire du système du PCT de l’OMPI et concernent 29 domaines couvrant toutes les branches de la science et de la technologie, ainsi que, récemment, des domaines de pointe tels que les interfaces conversationnelles (chatbots), l’informatique quantique, la chimie verte, la robotique médicale et la lutte biologique. Les termes sont accompagnés d’une étiquette d’usage indiquant à l’utilisateur si le terme est recommandé, obsolète ou normalisé. Des contextes riches sont fournis pour chaque terme afin d’en illustrer le sens et l’utilisation. Ils sont extraits de sources faisant autorité qui sont aussi référencées. De plus, une URL unique pouvant être partagée est désormais associée à la fiche terminologique complète qui contient toutes les informations sur le concept et les termes.

Des partenaires dans le monde entier

En outre, un réseau croissant de partenaires du monde entier, incluant notamment des universités et des organismes publics, contribue désormais à enrichir WIPO Pearl avec de nouveaux concepts grâce à des contributions d’étudiants et de terminologues, tandis que des experts des institutions partenaires vérifient l’exactitude des termes dans leur domaine de spécialisation et attribuent une note de fiabilité à chaque terme.

Cartes conceptuelles

WIPO Pearl propose des cartes conceptuelles inédites qui permettent à l’utilisateur de parcourir les connaissances propres à un domaine en examinant les relations entre les concepts. Ces relations ont fait l’objet de recherches et ont été saisies manuellement par des terminologues pour mettre en évidence les concepts de portée plus large ou plus étroite. Actuellement, plus de 18 000 concepts (soit 85% de ceux contenus dans la base de données) sont reliés à d’autres concepts et figurent dans les cartes conceptuelles.

Les utilisateurs ont également la possibilité d’utiliser les informations contenues dans des sous-ensembles de cartes conceptuelles, appelés “Chemins conceptuels”, pour effectuer des recherches par combinaison de mots-clés dans PATENTSCOPE, la base de données de brevet de l’OMPI. Cette fonction regroupe les concepts, synonymes, abréviations et variantes orthographiques qui s’y rapportent, facilitant ainsi la recherche de documents de brevet très ciblés. Il est également possible de parcourir PATENTSCOPE et d’extraire les documents de brevet pertinents depuis la liste des résultats en effectuant une recherche traditionnelle par terme dans l’interface de recherche linguistique.

WIPO Pearl et l’intelligence artificielle

En plus de fournir des cartes conceptuelles réalisées et validées par l’homme, WIPO Pearl utilise l’intelligence artificielle pour créer ce que l’on appelle des nuages conceptuels. Un algorithme d’apprentissage profond accessible librement a été entraîné sur l’ensemble des données relatives aux termes, aux contextes et aux relations conceptuelles saisies manuellement afin de suggérer de nouveaux groupes de relations entre les concepts. Ceux-ci peuvent ensuite être affichés sous la forme de nuages de concepts dans les cartes conceptuelles. WIPO Pearl est la première base de données terminologique à mettre en œuvre une telle innovation.

Le portail WIPO Pearl est également intégré à WIPO Translate, le moteur de traduction automatique mis au point en interne par l’OMPI et doté d’une technologie innovante de traduction automatique neuronale, afin de proposer à l’utilisateur des suggestions traduites par ordinateur lorsqu’un terme n’est pas disponible dans l’une des langues cibles. Si un concept n’apparaît pas encore dans la base de données terminologique, la requête est redirigée vers PATENTSCOPE CLIR.

Nouvelles fonctions

Depuis mai 2019, WIPO Pearl bénéficie d’une nouvelle présentation et d’une convivialité améliorée et dispose d’une interface mobile. En outre, depuis l’ajout récent de l’arabe, l’interface utilisateur est désormais disponible dans les 10 langues de publication du PCT, ce qui permet aux utilisateurs d’effectuer des recherches dans leur langue préférée. Parmi les améliorations futures de WIPO Pearl figurent la mise au point d’interfaces permettant d’accéder à l’ensemble de données à partir d’autres applications et une application mobile intégrant toutes les fonctions. En temps voulu, WIPO Pearl inclura également des collections d’autres secteurs de l’OMPI, comme les marques et les dessins et modèles industriels, ainsi que la terminologie tirée d’autres traités administrés par l’OMPI, ce qui en fera une source de référence complète pour la terminologie multilingue en matière de propriété intellectuelle.