Colecciones nacionales - Sintaxis de la consulta |
TérminosLas consultas se separan en términos y operadores. Existen dos tipos de términos: Términos simples y frases. Un término simple es una palabra, por ejemplo, “car” o “motor”. Una frase es un grupo de palabras entre comillas, por ejemplo "electric car". Pueden combinarse varios términos y operadores booleanos para formular una consulta más compleja (véase más abajo). Nota:Si se ha escogido la opción de idioma inglés, el analizador de términos y frases en la secuencia de consulta será el stemming en inglés. Por ejemplo, el término "electrical" se reducirá a "electric", "electricity" y así sucesivamente. Por lo tanto, es importante escoger un idioma en la interfaz inicial. |
StemmingInglés:Aplicación estándar en Lucene delalgoritmo de stemming de Porter, un proceso de normalización que elimina el sufijo común de las palabras. Ejemplo en inglés:"riding", "rides", "horses" ==> "ride", "ride", "horse". Otros idiomas:También se utilizan algoritmos de stemming para el español, el alemán, el francés y el ruso. Para más información, véase el sitio Web de Snowball |
CamposPuede buscarse cualquier campo insertando el nombre del campo seguido por el signo dos puntos ":" o "/" y a continuación el término buscado. Ejemplos: |
|
EN_TI:("wind turbine" AND electric) solar |
Puesto que EN_ALL es el campo previsto por defecto, no es necesario el indicador de campo. Nota: El campo es válido únicamente para el término que le sigue directamente, es decir que la consulta EN_TI:("wind turbine" AND electric) solar encontrará únicamente "wind turbine" AND electric en el campo correspondiente a título. Encontrará "solar" en el campo previsto por defecto (en este caso, el campo EN_ALL). Nota:El separador entre el nombre del campo y su valor puede ser ":" o "/". |
Búsquedas de comodínSe puede realizar búsquedas de comodín de un único carácter y de caracteres múltiples.Para realizar una búsqueda de comodín de un único carácter debe utilizarse el signo "?". Para realizar una búsqueda de comodín de caracteres múltiples debe utilizarse el signo "*". En las búsquedas de comodín de un único carácter se buscarán términos que coincidan con términos con el carácter único sustituido. Por ejemplo, la búsqueda de "text" o "test" se realizará de la manera siguiente: |
| te?t |
Cuando se utiliza una búsqueda de comodín de caracteres múltiples se buscan 0 o más caracteres. Por ejemplo, la búsqueda de “electric”, “electrical” o “electricity”, se realizará de la manera siguiente: |
| electric* |
Las búsquedas de comodín de carácter múltiple también pueden utilizarse dentro de un término. |
| elec*ty |
Nota:Todas las búsquedas de comodín se ejecutan en campos sin stemming: EN_TI_S/mot* se convierte a EN_TI/mot* Nota:PhraseQuery mantiene la opción de stemming si no se encuentra comodines: EN_TI/" electric motor" hay stemming, mientras que EN_TI_S/"electric mot*" se convierte a EN_TI/"electric mot*" Nota:Hay que utilizar los campos ALLNUM si se realizan búsquedas mediante códigos de identificación como PCT/US/2009/0*; de no ser así, si se utiliza el campo EN_ALL, previsto por defecto, la búsqueda se formulará de la manera siguiente: (PCT US/2009/0*) |
| ALLNUMM:PCT/US/2009/0* |
Nota:Los signos * y ? no deberán utilizarse como primer carácter de una búsqueda. |
Búsquedas de proximidad Permite encontrar palabras que se encuentran a una distancia determinada entre las palabras. Para realizar una búsqueda de proximidad, debe utilizarse la tilde, "~", al final de la frase. Por ejemplo, la búsqueda de las palabras "electric" y "car" a 10 palabras de distancia en un documento, se realizará de la manera siguiente: |
| "electric car"~10 |
Nota:También puede utilizarse la sintaxis: |
| electric NEAR car |
que, de hecho, se traduce a "electric car"~5 |
Búsqueda simple por fechas Se admiten las búsquedas simples por año, mes o día. Por ejemplo: |
| DP:01.02.2000 |
| DP:20000201 |
| DP:02.2000 |
| DP:200002 |
| DP:2000 |
Búsquedas por intervalo y fechasLas búsquedas por intervalo permiten recuperar documentos cuyos campos tienen un valor inferior y superior limitado que se especifica en la búsqueda por intervalo. En las búsquedas por intervalo, el límite inferior y superior pueden incluirse o excluirse. El ordenamiento se basa en un criterio lexicográfico. |
| DP:[01.01.2000 TO 01.01.2001] |
Por medio de este tipo de búsqueda se buscan documentos para los cuales el campo correspondiente a la fecha de publicación tiene valores que oscilan entre 01.01.2000 y 01.01.2001, inclusive. Nótese que las búsquedas por intervalo no se limitan a los campos correspondientes a la fecha. También pueden realizarse búsquedas de este tipo con campos que no sean fechas: |
| --> IN:{Smith TO Terence} |
Por medio de este tipo de búsqueda se encontrarán todos los documentos cuyos inventores tengan apellidos que se encuentren entre Smith y Terence, excluyendo esos apellidos. Si se quiere incluir los límites en la búsqueda, deberán utilizarse corchetes. Si se quiere excluir los límites, se utilizarán llaves. Nota:Para los intervalos de fechas también puede utilizarse la sintaxis: |
| DP:01.01.2000->01.01.2001 |
Búsquedas de campo vacío Para realizar una búsqueda de campo vacío/no vacío debe utilizarse Field_Name:[* TO *] Por ejemplo, la búsqueda de todos los documentos en los que figure el título en ruso, se realizará de la manera siguiente: |
| RU_TI:[* TO *] |
Búsqueda aproximadaLa búsqueda aproximada se basa en la distancia de Levenshtein, o algoritmo de distancia de edición. Para realizar una búsqueda aproximada debe utilizarse la tilde, "~" al final de un término. Por ejemplo, por la búsqueda de un término de grafía similar a "roam" se utilizará la búsqueda aproximada: |
| roam~ |
Por medio de esta búsqueda se encontrarán términos como “foam” o “roams”. Un parámetro puede especificar la similitud que se desea. El valor correspondiente se sitúa entre 0 y 1; cuanto más cercano a 1 sea el valor, mayor será el grado de similitud de los términos encontrados. Por ejemplo: |
| roam~0.8 |
Operadores booleanosLos operadores booleanos permiten que los términos sean combinados por operadores lógicos. Se admiten los siguientes operadores booleanos: AND, "+", OR, NOT, ANDNOT y "-". El operador AND es el operador de conjunción previsto por defecto. Es decir que si no se indica un operador booleano entre dos términos, por defecto se utiliza el operador AND. La búsqueda de documentos que contienen "electric car" y "solar" se realizará de la manera siguiente: |
| "electric car" solar |
AgrupamientoDeben utilizarse paréntesis para agrupar cláusulas con el fin de crear subconsultas. Esto puede ser muy útil si se desea controlar la lógica booleana de una consulta. La búsqueda de uno de los siguientes términos, "solar" o "wind" y "turbine" se realizará de la manera siguiente: |
| (wind OR solar) AND turbine |
Agrupamiento de campos Deben utilizarse paréntesis para agrupar múltiples cláusulas en un único campo. |
| EN_TI:(+battery +"electric car") |
ID,AN,WO,PN,ALLNUM, Sintaxis de la búsquedaWO:YYYYNNNNNN, YYYY/NNNNNN, YY/NNNNNN, YYNNNNNN, YYYY/..NNNN, YY/..NNNN,YYYY..NNNN, YY..NNNN, YYYY, NNNNNN, ..NNNN (...NNN significa que se han eliminado todos los 0 iniciales) Puede añadirse WO/ delante de cualquiera de ellos y puede utilizarse el comodín (*), de la manera siguiente: |
| WO:WO/1994* |
| WO:WO/1994/12* |
| WO:WO/12* |
| WO:12* |
AN:CCYYYYNNNNNN, CC/YYYY/NNNNNN, CC/YY/NNNNNN, CCYYNNNNNN, CC/YYYY/..NNNN, CC/YY/..NNNN,CCYYYY..NNNN, CCYY..NNNN, YYYY, NNNNNN, ..NNNN (...NNN significa que se han eliminado todos los 0 iniciales) Puede añadirse PCT/ delante de cualquiera de ellos |
Número de publicación nacional (PN:)República de Corea: el formato PN es :102001NNNNNNN 100NNNNNN. Puede buscarse NNNNNNN, NNNNNNN, ..NNNNNNN, KR/NNNNNNN, KR/..NNNNN Sudáfrica: el formato PN es :YYYY/NNNNN. Puede buscarse YYYY/NNNNN,YYYYNNNNN, ZA/YYYY/NNNNN, ZA/YYYYNNNNN, YYYY, NNNNN Viet Nam: el formato PN es :NNNN o NNNNN. Puede buscarse NNNNN, VN/NNNN, VN/..NN, ..NN Cuba: el formato PN es : NNNNN. Puede buscarse NNNNN, CU/NNNN, CU/..NN,..NN ARIPO: el formato PN es : AP/P/YYYY/NNNNNN o 'AP N{1,4}'. Puede buscarse NNNNNN, ..NN, AP/YYYY/NNNNNN, AP/..NN, YYYY, YYYY/..NN Singapur: el formato PN es : NNNNN o NNNNNN. Puede buscarse NNNNN, SG/NNNNN Israel: el formato PN es : NNNNN o NNNNNN. Puede buscarse NNNNN, IL/NNNNN México: el formato PN es : CC/a/YYYY/NNNNNN. Puede buscarse NNNNNN, ..NN, MX/YYYY/NNNNNN, MX/..NN, YYYY, YYYY/..NN |
| PN:0001 |
| PN:(0001 VN) |
| PN:(1 VN) |
| PN:(VN/0001) |
| PN:(VN/1) |
Recursos externos |
| Sintaxis Lucene |
| Sintaxis PATENTSCOPE |