Son lenguajes documentales que organizan de forma semántica un determinado campo del conocimiento, facilitando el control de contenido gracias al listado de términos que se pueden utilizar para la indización y la recuperación, y las relaciones entre dichos términos.
La norma ISO 2788/TC46 «Principes directeurs pour létablissement et le devellopement de thesaurus monolingues«, define los tesauros según su función y su estructura:
- Por su función. Como un instrumento de control terminológico utilizado para trasponer a un lenguaje más estricto el idioma natural empleado en los documentos y por los indizadores
- Por su estructura. Es un vocabulario controlado y dinámico de términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento.
Como subraya Silvia Arano,
Los tesauros son el tipo de lenguaje documental que se asocia en mayor grado con la recuperación de la información. Son reconocidos como las herramientas documentales que logran una mayor precisión en la recuperación, debido al auxilio de su estructuración conceptual y el control terminológico que realizan.
Composición de un tesauro
Un tesauro se compone de unidades lexicales (descriptores, no descriptores y palabras herramienta).
Los descriptores son palabras o términos admitidos para la indización y búsqueda. Para evitar ambiguedad, un descriptor representa un solo concepto y un concepto puede ser designado por un solo descriptor. Los descriptores pueden ser simples (formados por una palabra) o compuestos (de dos o más palabras).
Los no descriptores son palabras incluidas en el tesauro, que no pueden ser utilizadas para la indización y la recuperación, pero cada uno de ellos emite a uno o más términos admitidos. La utilización de no descriptores facilita tanto la descripción como la búsqueda, permitiendo dar una mejor idea del significado de cada término y traducir los términos del lenguaje natural al documental. Entre los no descriptores están sinónimos (palabras con significado igual que el del descriptor correspondiente) y quasi-sinónimos (palabras que pueden tener significado distinto, pero se trata como sinónimos en el tesauro; por ejemplo, los términos con significados que se solapan, los términos cuyo alcance se incluye en el de otro término, o los contrarios).
Estructura de un tesauro
La estructura de un tesauro se basa en relaciones semánticas entre los términos. Las relaciones pueden ser de tres tipos: jerárquicas, de equivalencia y asociativas.
Las relaciones de equivalencia se establecen entre los descriptores y los no descriptores. En el tesuaro, se las indica utilizando las referencias USE/UP. Un término no descriptor se conecta normalmente al descriptor correspondiente mediante la referencia USE. La referencia correspondiente en la dirección opuesta es UP (» utilizado por «).
Ejemplo:
medievo USE edad media
edad media UP medievo
Las relaciones jerárquicas se establecen entre los descriptores del tesauro que deben pertenecer a la misma clase y que presentan distintos niveles de superordinación y subordinación. Existen cuatro subtipos de relaciones jerárquicas: género-especie (clase o categoría / miembros o especies), todo-parte, enumerativas (categoría general / caso individual), y polijerárquicas (conceptos que se insertan en más de una cadena jerárquica). La relación se expresa mediante la notación:
TG (Término genérico) o BT (Broad term)
TE (Término específico) o NT (Narrow Term)
Ejemplo:
TG arquitectura religiosa
TE iglesias
TE monasterios
Las relaciones asociativas son relaciones simétricas entre dos descriptores. La notación utilizada es:
TR (Término relacionado) o RT (Related term)
Ejemplo:
baquetón TR bocel
Además de las relaciones, a los descriptores del tesauro pueden acompañar notas de alcance (NA) que ayudan a mejor entendimiento de los términos utilizados. Pueden ser definiciones u otras notas explicativas donde se acota el significado o alcance conceptual que es representado por un término en particular.
Ejemplo:
bocel NA moldura convexa lisa de sección semicircular