| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Convertir la ñ y los caracteres acentuados, a mayúsculas no acentuadas

Page history last edited by Guilda Ascencio 13 years, 4 months ago

 

Una de las características del proceso de búsqueda de información en las estructuras CDS/Isis es la transparencia a la presencia de caracteres acentuados, mayúsculas o minúsculas en las expresiones de búsquedas: CDS/Isis ubicará la información sin importar si el acento está mal colocado o si las palabras claves se escribieron en mayúscula o minúscula. Para lograr este objetivo, las claves en el archivo invertido se almacenan en mayúsculas y todas las expresiones de búsqueda son convertidas automáticamente a mayúsculas. Esta conversión de minúsculas a mayúsculas se ejecuta con el auxilio de una tabla denominada isisuc.tab (uc = upper case = mayúsculas). Por lo tanto, cuando se lee una expresión de búsqueda cada caracter es ubicado en la tabla Isisuc.tab y sustituído por el valor equivalente colocado en esa tabla.

 

Esta tabla consta de 256 caracteres, y cada caracter representa un Código Ansi.

 

Consideremos por ejemplo el caracter ñ en la representación ANSI, cuyo código interno es 241, o sea, la letra ń ocupa la posición 241 en la tabla de caracteres ANSI. Entonces, en el archivo isisuc.tab la letra ñ ocupará la posición 241. Por lo tanto, si queremos que al convertir a mayúsculas la letra ñ se transforme en N, en la posición 241 de la tabla tenemos que colocar el código 209.

 

Tabla isisuc.tab

000 001 002 003 004 005 006 007 008 009 010 011 012 013 014 015 016 017 018 019 020 021 022 023 024 025 026 027 028 028 030 031
032 033 034 035 036 037 038 039 040 041 042 043 044 045 046 047 048 049 050 051 052 053 054 055 056 057 058 059 060 061 062 063
064 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080 081 082 083 084 085 086 087 088 089 090 091 092 093 094 095
096 065 066 067 068 069 070 071 072 073 074 075 076 077 078 079 080 081 082 083 084 085 086 087 088 089 090 123 124 125 126 127
128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159
160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191
065 065 065 065 065 065 065 199 069 069 069 069 073 073 073 073 208 209 079 079 079 079 079 215 216 085 085 085 085 089 222 223
065 065 065 065 065 065 065 199 069 069 069 069 073 073 073 073 079 209 079 079 079 079 079 247 248 085 085 085 085 089 254 089

 

Note que la tabla isisuc.tab tiene 8 filas y 32 columnas de 3 números cada columna. Este formato debe conservarse ya que de otra forma se generaria un error en la actualización de la lista invertida.

 

El archivo isisuc.tab se utiliza para convertir el contenido de los campos de una base de datos a su equivalente en mayúsculas. Se aplica cada vez que se invocan los comandos MPU, MHU, MDU y es de vital importancia en el proceso de indización y recuperación de información.

 

 

 

Comments (0)

You don't have permission to comment on this page.