| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Incluir los números cuando un campo se indiza por técnica 4 u 8

Page history last edited by Guilda Ascencio 13 years, 5 months ago

Archivo ISISAC.TAB: Tabla de caracteres alfabéticos

 

En los procesos de generación de claves para consultas a la base de datos, existe una técnica de indización que permite realizar búsquedas utilizando cualquier palabra contenida en un campo. Esta técnica de indización extráe cada una de las palabras del campo y las envía a la lista invertida como claves independientes.

 

Para ejecutar este proceso CDS/Isis analiza cada caracter del campo cuya indización se solicita para extraer las palabras, y considera palabras aquellas secuencias de caracteres que están formadas por los caracteres incluídos en la tabla ISISAC.TAB. De tal forma que si un caracter es omitido de isiacc.tab CDS/Isis lo considera como un caracter no alfabético y corta la cadena que está analizando al considerar que llegó al fin de una palabra.

 

La tabla isisac.tab tiene el siguiente contenido:

 

048 049 050 051 052 053 054 055 056 057 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080 081 082 083 084 085 086
087 088 089 090 097 098 099 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 192 193
194 195 196 197 199 200 201 202 203 204 205 206 207 209 210 211 212 213 214 216 217 218 219 220 221 224 225 226 227 228 229 231
232 233 234 235 236 237 238 239 241 242 243 244 245 246 248 249 250 251 252 253 255

 

Cualquier código ANSI que se omita en esta tabla será considerado como no alfabético. En esta tabla en particular hemos incluído los números del 0 al 9 (códigos 048 al 057) porque es de nuestro interés indizar como palabras aquellos casos de títulos u otras frases que contengan valores numéricos como fechas y otras referencias. Si desea incluir otros símbolos en la indización por técnica 4 u 8, solo tiene que conseguir su código ANSI e insertarlo en el lugar correspondiente a su secuencia

 

Para que en los procesos de indización de la información se aplique correctamente la tabla que permite incluir los números cuando se crea o actualiza el archivo invertido, haga lo siguiente:

 

  1. Verifique si en la carpeta de las bases de datos existe un archivo isisac.tab; en la carpeta bases/dblil/data existe uno con el nombre ansiac.tab. Si lo encuentra cópielo en la raiz de la carpeta bases y renombrelo como isisac.tab
  2. Si no existe,  abra el block de notas o cualquier otro editor de texto (txt) y copie la tabla isisac.tab que se incluye en esta página. Guardela en la raíz de la carpeta bases como un archivo txt nombrado isisac.tab. Deben quedar las mismas 4 líneas que se muestran en el ejemplo porque de otra forma se generará un error en el proceso de indización.
  3. A continuación, modifique el archivo .par (carpeta bases/par) de la base de datos correspondiente y agregue la siguiente línea:

isisac.tab=%path_database%isisac.tab

 

De esta forma, cuando el proceso de ingreso o modificación de registros vaya a actualizar la lista invertida, utilizará el archivo isisac.tab para determinar los caracteres a ser considerados como alfabéticos, incluyendo, en consecuencia, los números.

 

Nota importante:

  •  Cuando indize un campo por técnica 4 u 8 recuerde siempre incluir los comandos MPU y MPL como parte del formato de extracción.

     Ejemplo, MPU, V10, MPL.

  • Si está indizando un campo repetible por técnica 4 u 8 debe incluir un separador entre las ocurrencias para evitar que la última palabra de la ocurrencia actual se junte con la primera palabra de la próxima ocurrencia.

     Ejemplo, mpu,v10+|  |, mpl

                             mpu (v10/) mpl

 

 

Comments (0)

You don't have permission to comment on this page.