| 
  • If you are citizen of an European Union member nation, you may not use this service unless you are at least 16 years old.

  • You already know Dokkio is an AI-powered assistant to organize & manage your digital files & messages. Very soon, Dokkio will support Outlook as well as One Drive. Check it out today!

View
 

Estructura de los archivos invertidos

Page history last edited by Guilda Ascencio 13 years, 3 months ago Saved with comment

 

Listas Invertidas

 

Los archivos de datos (mst y xrf) solo permiten la recuperación de registros en forma secuencial por número MFN. Como se requieren otras formas de acceso la información, por ejemplo, autores, países, materias, etc., es necesario contar con una estructura adicional que permita, dada una palabra clave o una fórmula de búsqueda, ubicar los registros que contienen los términos solicitados. Esta estructura es lo que bajo Cds/isis se denomina Listas Invertidas.

 

El archivo invertido de las estructuras CDS/Isis está formado en realidad por 6 archivos físicos, cinco de los cuales contienen los términos de búsqueda del diccionario (organizados como un árbol B*) y el sexto contiene la lista de apuntadores asociadas a cada término. A fin de optimizar el almacenamiento en disco, se mantienen dos árboles B* por separado: uno para los términos de hasta 10 caracteres (almacenados en los archivos .N=01 y .L01) y otro para los términos de más de 10 caracteres (almacenados en los archivos .N02 y .L02). El archivo .CNT contiene campos de control para ambos árboles B*). En cada archivo del árbol B* el archivo .N0x contiene los nodos del árbol y el archivo .L0x contiene las hojas. Los registros de las hojas apuntan al lugar donde se encuentran los apuntadores que contienen la información para localizar los registros (postings) en la base de datos. Este archivo se identifica con la extensión .IFP .

 

La relación entre estos archivos puede representarse de la siguiente manera:

 

 

Use el enlace ejemplos de organización y actualización de listas invertidas obtener más información sobre este tópico.

 

El proceso de actualización de las listas invertidas se realiza a través de un archivo llamado Tabla de extracción de campos (FST) donde se coloca la forma como se va a extraer la información de la base de datos para construir los índices

Comments (0)

You don't have permission to comment on this page.