3 ARCHIVOS

blog del Taller de Empleo Conservación y Archivo del Patrimonio Fotográfico

Archive for the ‘tesauros’ Category

Metodología para la elaboración de tesauros

Posted by reihino en abril 25, 2008

En un primer lugar se debe plantear la necesidad de creación de un tesauro que recoja de forma específica y sistemática los términos relativos al área de conocimiento que lo demande. Por otra parte, se debe tener en cuenta, que la elaboración de un Tesauro es una operación intelectual que debe ser coordinada por un documentalista especialista en el tema tratado, participando en su elaboración expertos en las diferentes material, que deben establecer en unos casos las diferentes relaciones entre términos, y en otros dar el visto bueno a lo anteriormente organizado. La automatización a la hora de elaborar un tesauro sólo puede aportar una ayuda para las tareas de carácter más rutinario y repetitivo. La elaboración de tesauros requiere un periodo de tiempo bastante amplío.

Fases de la elaboración:
1) Selección de fuentes
En la elaboración de Tesauros existen dos métodos que se utilizan de forma conjunta, existiendo siempre una normalización, aunque sea mínima con preferencia por la forma singular, masculino, forma sustantiva, escritura directa. El método inductivo, parte de cierto número de términos de los dominios considerados a través de enciclopedia, diccionarios técnicos, índices bibliográficos, otros tesauros. El método deductivo, utiliza vocabulario procedente de los documentos, por indización libre de cierto número de documentos, mediante el recuento de la frecuencia de aparición.
2) Extracción de términos
Una vez que se han seleccionado las fuentes se procede a la extracción sistemática de los términos aparecidos en ellas. Obtenido este vocabulario se procede a la su reducción eliminando los términos no significativos.
3) Normalización de términos.
En cuanto a la normalización en lo que se refiere a forma gramatical, género y número de los términos, deberán seguirse las especificaciones contempladas en las normas, como puede ser la norma de la UNE 50106:1990 sobre “ Directrices para el establecimiento y desarrollo de tesauros monolingües”.
4) Determinación de grandes áreas y distribución de términos
Paralelamente a la extracción de términos es necesario pensar en la estructura jerárquica básica del tesauro, determinando las grandes áreas temáticas o familias semánticas en que más tarde se distribuirán los términos. A partir de ese momento trabajar individualmente con cada familia para establecer las relaciones semánticas.
5) Establecimiento de relaciones de equivalencia
Una vez realizada la agrupación de los términos por áreas temáticas, el paso siguiente debe ser identificar los términos de igual significación o significación muy próxima dentro de las mismas. Tras detectar las equivalencias semánticas deberemos proceder a elegir uno de los términos como representativo del concepto, adjudicándole la categoría de descriptor o termino principal. El término o términos equivalentes deben ser remitidos al principal.
6) Establecimiento de la estructura jerárquica
Elegidos los descriptores se comenzara a construir la jerarquía con los mismos. Progresivamente se irán estableciendo los diferentes niveles jerárquicos hasta crear una estructura piramidal donde quedaran situados todos los términos principales ocupando el nivel que les corresponda según el grado de especificidad-generalidad de sus significados en relación con el resto.
7) Establecimiento de relaciones asociativas y notas de aplicación
Tras crear la estructura jerárquica, se debe establecer las relaciones de asociación entre términos que, aun no manteniendo una vinculación jerárquica directa, tuvieran sin embargo una relación de vecindad semántica. Finalmente, deben elaborarse las notas de aplicación, que introducirán ciertas aclaraciones sobre el sentido de alguno de los términos.
8 ) Informatización
Una vez, que hemos establecido todas conexiones entre los términos, es necesario informatizar el resultado, para ello se utilizara un programa de creación de tesauros.
9) Revisión y edición definitiva
Una vez editados es necesario comprobar que se adecuan bien al tema desarrollado siendo útiles para la indización de documentos.
10) Mantenimiento y actualización
Con el paso del tiempo y de su uso, se hace necesario incluir nuevo términos en el tesauro con el fin de mantenerlo actualizado y operativo.

Posted in lenguajes documentales, tesauros | 2 Comments »

lenguajes documentales (II) – los tesauros

Posted by agnieszka en marzo 18, 2008

Son lenguajes documentales que organizan de forma semántica un determinado campo del conocimiento, facilitando el control de contenido gracias al listado de términos que se pueden utilizar para la indización y la recuperación, y las relaciones entre dichos términos.

La norma ISO 2788/TC46 Principes directeurs pour létablissement et le devellopement de thesaurus monolingues“, define los tesauros según su función y su estructura:

  • Por su función. Como un instrumento de control terminológico utilizado para trasponer a un lenguaje más estricto el idioma natural empleado en los documentos y por los indizadores
  • Por su estructura. Es un vocabulario controlado y dinámico de términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento.

Como subraya Silvia Arano,

Los tesauros son el tipo de lenguaje documental que se asocia en mayor grado con la recuperación de la información. Son reconocidos como las herramientas documentales que logran una mayor precisión en la recuperación, debido al auxilio de su estructuración conceptual y el control terminológico que realizan.

Composición de un tesauro

Un tesauro se compone de unidades lexicales (descriptores, no descriptores y palabras herramienta).

Los descriptores son palabras o términos admitidos para la indización y búsqueda. Para evitar ambiguedad, un descriptor representa un solo concepto y un concepto puede ser designado por un solo descriptor. Los descriptores pueden ser simples (formados por una palabra) o compuestos (de dos o más palabras).

Los no descriptores son palabras incluidas en el tesauro, que no pueden ser utilizadas para la indización y la recuperación, pero cada uno de ellos emite a uno o más términos admitidos. La utilización de no descriptores facilita tanto la descripción como la búsqueda, permitiendo dar una mejor idea del significado de cada término y traducir los términos del lenguaje natural al documental. Entre los no descriptores están sinónimos (palabras con significado igual que el del descriptor correspondiente) y quasi-sinónimos (palabras que pueden tener significado distinto, pero se trata como sinónimos en el tesauro; por ejemplo, los términos con significados que se solapan, los términos cuyo alcance se incluye en el de otro término, o los contrarios).

Estructura de un tesauro

La estructura de un tesauro se basa en relaciones semánticas entre los términos. Las relaciones pueden ser de tres tipos: jerárquicas, de equivalencia y asociativas.

Las relaciones de equivalencia se establecen entre los descriptores y los no descriptores. En el tesuaro, se las indica utilizando las referencias USE/UP. Un término no descriptor se conecta normalmente al descriptor correspondiente mediante la referencia USE. La referencia correspondiente en la dirección opuesta es UP (” utilizado por “).

Ejemplo:
medievo USE edad media
edad media UP medievo

Las relaciones jerárquicas se establecen entre los descriptores del tesauro que deben pertenecer a la misma clase y que presentan distintos niveles de superordinación y subordinación. Existen cuatro subtipos de relaciones jerárquicas: género-especie (clase o categoría / miembros o especies), todo-parte, enumerativas (categoría general / caso individual), y polijerárquicas (conceptos que se insertan en más de una cadena jerárquica). La relación se expresa mediante la notación:

TG (Término genérico) o BT (Broad term)

TE (Término específico) o NT (Narrow Term)

Ejemplo:
TG arquitectura religiosa
TE iglesias
TE monasterios

Las relaciones asociativas son relaciones simétricas entre dos descriptores. La notación utilizada es:

TR (Término relacionado) o RT (Related term)

Ejemplo:
baquetón TR bocel

Además de las relaciones, a los descriptores del tesauro pueden acompañar notas de alcance (NA) que ayudan a mejor entendimiento de los términos utilizados. Pueden ser definiciones u otras notas explicativas donde se acota el significado o alcance conceptual que es representado por un término en particular.

Ejemplo:
bocel NA moldura convexa lisa de sección semicircular

Posted in lenguajes documentales, tesauros | Leave a Comment »