PATENTSCOPE
Formats des données
Tous les documents publiés via le service de recherche PATENTSCOPE sont disponibles en format PDF ou sous forme de fichiers ZIP (contenant les données bibliographiques en format XML et les images des pages complètes en format TIFF). Les demandes internationales de brevets publiées sont également disponibles sous format XML et HTML (y inclus le texte de la description et des revendications en format texte susceptible de recherche – OCR), outre les formats PDF et fichiers ZIP. Finalement, les listages de séquences et les longs documents sont disponibles sous fichiers ZIP.
Texte complet des demandes internationales PCT – veuillez noter que les textes des descriptions et des revendications des demandes internationales publiées via le service de recherche PATENTSCOPE résultent de procédures automatiques d'océrisation (OCR). Ils contiennent de ce fait des inexactitudes vis à vis des documents originaux et n'ont pas de valeur légale. Ces textes alimentent le moteur de recherche du Service de recherche PATENTSCOPE et sont gracieusement mis à la disposition du public par le Bureau International, principalement sous la forme de pages en HTML dans les onglets "Description" et "Revendications" de chaque dossier.
En conséquence, uniquement les versions PDF des demandes internationales, contenant les pages numérisées fidèles aux dépôts, doivent être utilisées à des fins juridiques.
Pour information, les procédures automatiques d'OCR mises en oeuvre par le PCT atteignent généralement pour les sections de descriptions et de revendications des demandes internationales une précision moyenne largement supérieure à 98.5% (ce qui représente un grand maximum de 40 inexactitudes par page de 3000 caractères). Toutefois, cette précision moyenne peut chuter de façon significative pour un petit pourcentage des demandes publiées chaque semaine. Ce phénomène s'explique soit par la piètre qualité des originaux papier des documents, soit par la mise en page compliquée des documents, ou bien l'utilisation dans ces documents de polices de caractères insolites et de mots ne figurant pas dans les dictionnaires (cela concerne le plus souvent les demandes internationales dans les domaines de la chimie et de la pharmacie utilisant des polices de caractères de taille trop petite).